Babeslea:

Eusko Jaurlaritza

Web-corpusen Ataria

Corpus elebakarra - Laguntza

Corpus elebakarraren kontsulta-adibideak

Corpus elebakarrean dagoen informazioa ikusteko eta aztertzeko aukera ematen du kontsulta-sistemak. Hainbat aukera eskaintzen ditu kontsulta-sistemak. Hona adibide batzuk:

  • mendi hitzaren agerraldiak ikustea, testuan ondoan duen hitzaren arabera ordenatuta

  • garbi-z hasten diren lemak (bakunak zein hitz anitzekoak) ikustea (garbi, garbitu, garbitzaile, garbialdi, garbi-ikuzi, etab.), bakoitzaren maiztasunarekin eta agerraldiekin batera, horiek dokumentuaren, lemaren, kategoriaren, formaren, ondoko edo aurreko testuinguruaren eta dokumentuaren ezaugarri batzuen arabera ordenatuta eta multzokatuta ageri direla

  • argi hitzaren kategoriaren araberako erabilera-datuak ikustea (izena, adjektiboa, adberbioa)

  • eguraldi hitzaren ondorengo adjektiboak zein diren eta bakoitza zenbat aldiz erabili den ikustea (eguraldi on, eguraldi eder, eguraldi gaizto, eguraldi heze, etab.)

  • baita... ere hitz anitzeko unitatearen agerraldiak bistaratzea

Horrelako eta bestelako hainbat bilaketa egiteko aukera ematen du kontsulta-sistemak. Honen guztiaren helburua da erabiltzaileari erabilera errealaren testigantzak eta datuak ematea.

Corpus elebakarraren kontsulta-interfazearen egitura

Corpus elebakarra kontsultatzeko sistemak bi bilaketa-mota ditu: bilaketa arrunta eta bilaketa aurreratua. Bilaketa arrunta egiteko tresna hauxe da:


1. irudia. Bilaketa arruntaren bilaketa-atala

  • Zer: lema edo forma eska daiteke.

  • Konp.: lema edo forma hori osorik, hasieran nahiz bukaeran duten hitzen agerpenak eska litezke.

  • Bilatu: lauki horretan idazten da bilatu nahi dena (lema edo forma osoa, hasiera edo amaiera).

  • Kategoria: nahi izanez gero, kategoria gramatikala muga daiteke.

  • Ordenatu honen arabera: emaitzak agertzeko era aukera daiteke hor: dokumentuen arabera, kategorien arabera, etab.

Adibidea:

  • Zer: Lema

  • Konp.: Da

  • Bilatu: helmuga

  • Kategoria: -

  • Ordenatu honen arabera: Dokumentua

Emaitzei dagokionean, bi emaitza-mota daude:

  • Bilaketa-atalean zehaztu diren baldintzak betetzen dituzten lemen, formen, lema/kategoria konbinazioen eta abarren zerrenda eta kopuruak (maiztasun-taula eta -grafikoa)

  • Bilaketa-atalean zehaztu diren baldintzak betetzen dituzten lemen edo formen agerraldiak, KWIC edo 'konkordantzia' eran emanak; horien agerraldietan klik eginez, agerraldiaren erreferentzia (obra, egilea eta abar) eta testuinguru zabalagoa eskaintzen da aparteko leiho batean

Aurreko adibideari dagozkion emaitzak horrela agertzen dira:


2. irudia. Bilaketa arruntaren emaitza-atala

Bilaketa aurreratuak aukera gehiago ematen ditu. Bilaketa aurreratuak egiteko tresna hauxe da:


3. irudia. Bilaketa aurreratuaren bilaketa-atala

Bilaketa arruntaren aukerez gain beste hauek ere eskaintzen ditu bilaketa-mota honek:

  • Hitz batek baino gehiagok osatzen duten segida. Adibidez: zer dela eta. Kasu honetan zer, dela, eta formak bilatu nahi ditugu, ordena horretan eta tartean beste hitzik ez dela. Hortaz horrela egingo dugu kontsulta:

  • 4. irudia. zer dela eta bilaketa

    dela forma zer formaren ondoren eta distantzia 1 dela agertzea nahi dugulako eta ondoren 1eko distantzian eta forma. Emaitzak horrela agertuko dira:


    5. irudia. zer dela eta bilaketaren emaitza

  • Emaitza-mota bat aukeratzea. Aukera lehenetsiaz gain, bi emaitza moten artean zein nahi dugun aukeratu daiteke (ikus gorago). Maiztasun-taula eta -grafikoen kasuan, zein nahi ditugun ere zehatz dezakegu.

Lematizazio eta anotazio automatikoak

Testu-hitz bakoitzari lema eta kategoria automatikoki atxikitzen zaizkio. Horrela, kirten, kirtenak, kirtenean, kirtenaren ... formei sistemak automatikoki kirten lema atxikitzen die eta kategoria izena.


6. irudia. kirtenean hitzaren analisia