Babeslea:

Eusko Jaurlaritza

Web-corpusen Ataria

Corpus elebakarra - Laguntza

Corpus elebakarraren kontsulta-adibideak

Corpus elebakarrean dagoen informazioa ikusteko eta aztertzeko aukera ematen du kontsulta-sistemak. Hainbat aukera eskaintzen ditu kontsulta-sistemak. Hona adibide batzuk:

 • mendi hitzaren agerraldiak ikustea, testuan ondoan duen hitzaren arabera ordenatuta

 • garbi-z hasten diren lemak (bakunak zein hitz anitzekoak) ikustea (garbi, garbitu, garbitzaile, garbialdi, garbi-ikuzi, etab.), bakoitzaren maiztasunarekin eta agerraldiekin batera, horiek dokumentuaren, lemaren, kategoriaren, formaren, ondoko edo aurreko testuinguruaren eta dokumentuaren ezaugarri batzuen arabera ordenatuta eta multzokatuta ageri direla

 • argi hitzaren kategoriaren araberako erabilera-datuak ikustea (izena, adjektiboa, adberbioa)

 • eguraldi hitzaren ondorengo adjektiboak zein diren eta bakoitza zenbat aldiz erabili den ikustea (eguraldi on, eguraldi eder, eguraldi gaizto, eguraldi heze, etab.)

 • baita... ere hitz anitzeko unitatearen agerraldiak bistaratzea

Horrelako eta bestelako hainbat bilaketa egiteko aukera ematen du kontsulta-sistemak. Honen guztiaren helburua da erabiltzaileari erabilera errealaren testigantzak eta datuak ematea.

Corpus elebakarraren kontsulta-interfazearen egitura

Corpus elebakarra kontsultatzeko sistemak bi bilaketa-mota ditu: bilaketa arrunta eta bilaketa aurreratua. Bilaketa arrunta egiteko tresna hauxe da:


1. irudia. Bilaketa arruntaren bilaketa-atala

 • Zer: lema edo forma eska daiteke.

 • Konp.: lema edo forma hori osorik, hasieran nahiz bukaeran duten hitzen agerpenak eska litezke.

 • Bilatu: lauki horretan idazten da bilatu nahi dena (lema edo forma osoa, hasiera edo amaiera).

 • Kategoria: nahi izanez gero, kategoria gramatikala muga daiteke.

 • Ordenatu honen arabera: emaitzak agertzeko era aukera daiteke hor: dokumentuen arabera, kategorien arabera, etab.

Adibidea:

 • Zer: Lema

 • Konp.: Da

 • Bilatu: helmuga

 • Kategoria: -

 • Ordenatu honen arabera: Dokumentua

Emaitzei dagokionean, bi emaitza-mota daude:

 • Bilaketa-atalean zehaztu diren baldintzak betetzen dituzten lemen, formen, lema/kategoria konbinazioen eta abarren zerrenda eta kopuruak (maiztasun-taula eta -grafikoa)

 • Bilaketa-atalean zehaztu diren baldintzak betetzen dituzten lemen edo formen agerraldiak, KWIC edo 'konkordantzia' eran emanak; horien agerraldietan klik eginez, agerraldiaren erreferentzia (obra, egilea eta abar) eta testuinguru zabalagoa eskaintzen da aparteko leiho batean

Aurreko adibideari dagozkion emaitzak horrela agertzen dira:


2. irudia. Bilaketa arruntaren emaitza-atala

Bilaketa aurreratuak aukera gehiago ematen ditu. Bilaketa aurreratuak egiteko tresna hauxe da:


3. irudia. Bilaketa aurreratuaren bilaketa-atala

Bilaketa arruntaren aukerez gain beste hauek ere eskaintzen ditu bilaketa-mota honek:

 • Hitz batek baino gehiagok osatzen duten segida. Adibidez: zer dela eta. Kasu honetan zer, dela, eta formak bilatu nahi ditugu, ordena horretan eta tartean beste hitzik ez dela. Hortaz horrela egingo dugu kontsulta:

 • 4. irudia. zer dela eta bilaketa

  dela forma zer formaren ondoren eta distantzia 1 dela agertzea nahi dugulako eta ondoren 1eko distantzian eta forma. Emaitzak horrela agertuko dira:


  5. irudia. zer dela eta bilaketaren emaitza

 • Emaitza-mota bat aukeratzea. Aukera lehenetsiaz gain, bi emaitza moten artean zein nahi dugun aukeratu daiteke (ikus gorago). Maiztasun-taula eta -grafikoen kasuan, zein nahi ditugun ere zehatz dezakegu.

Lematizazio eta anotazio automatikoak

Testu-hitz bakoitzari lema eta kategoria automatikoki atxikitzen zaizkio. Horrela, kirten, kirtenak, kirtenean, kirtenaren ... formei sistemak automatikoki kirten lema atxikitzen die eta kategoria izena.


6. irudia. kirtenean hitzaren analisia