Babeslea:

Eusko Jaurlaritza

Web-corpusen Ataria

Hitz-konbinazioak - Laguntza

Hitz-konbinazioen kontsulta-interfazearen egitura

Hau da kontsulta-interfazearen bilaketa-atala:


1. irudia. Hitz-konbinazioen kontsulta-interfazea

Bilaketa-atalean eskaintzen diren aukerak:

  • 1. lema eta 2. lema laukien bidez, bilatu nahi den konbinazioaren bi osagaiak zehatz daitezke, edo, lauki bakarra betez, bi osagaietako bat, lehena zein bigarrena
  • Konbinazioak laukiko balioetako bat aukeratuz, konbinazio-mota jakin bateko agerraldiak bila daitezke, edo, hutsik utzita, hiru motetako konbinazioak
  • Ordenatu honen arabera laukiak aukera ematen digu bilaketaren emaitza den konbinazio-zerrenda irizpide batzuen arabera ordenatzeko. Balio lehenetsia t neurria izeneko neurri estatistikoa da. Sarreran adierazi dugunez, hori da erauzketa-sistemaren ebaluazioan doitasun onena lortu duena. Horrez gain eskaintzen diren beste neurri estatistikoak: maiztasuna, LLR (egiantz-arrazoiaren logaritmoa, log-likelihood ratio), PMI (elkarrekiko informazio puntuala, punctual mutual information), horren aldaera den PMI3, χ2 (khi karratua, chi-square) eta Fisherren test zehatza (Fisher's exact test). Bigramak alfabetikoki ordenatzeko aukera ere badago.
  • Zein neurri erakutsi atalean, emaitzetan bistaratu nahi ditugun neurri estatistikoak aukera ditzakegu. t neurria da sistemaren aukera lehenetsia. Bestetik, beti bistaratzen dira bigramaren maiztasuna (f), 1. osagaiaren maiztasuna (f1) eta 2. osagaiaren maiztasuna (f2).

Bilaketa-atalaren behealdean, emaitzak bistaratzen dira. Konbinazio-mota bakoitzeko taula bat antolatzen da. Taularen lehen zutabean, aurkitutako konbinazioen zerrenda dago. Horren eskuinean, informazio estatistikoa, eta, azkenik, corpuseko adibide bat. Konbinazioaren agerraldi guztiak ikusteko, aski da konbinazioaren gainean, edo, bestela, eskuinean dagoen aukeran, klik egitea.


2. irudia. Hitz-konbinazioen emaitza-interfazea