Babeslea:

Eusko Jaurlaritza

Web-corpusen Ataria

Corpus paraleloa - Laguntza

Corpus paraleloaren kontsulta-interfazearen egitura

Corpus paraleloa kontsultatzeko sistemak hainbat bilaketa-aukera eskaintzen ditu. Bilaketak egiteko tresna hauxe da:


1. irudia. Bilaketa-atala

Corpus paraleloa kontsultatzeko bi lerro ditugu, eta bakoitzean hitz bat sartzeko aukera dugu. Hizkuntza bakarreko bilaketa egiteko, nahikoa dugu lehen lerroa erabiltzea:

  • Hizkuntza: menu hedagarrian kontsultatu nahi dugun hitza zer hizkuntzatan dagoen adieraziko dugu.

  • Zer bilatu: lema edo forma eska daiteke.

  • Aukerak: Da / Hasi / Bukatu. Lehen aukera erabiliko dugu bilaketa zehatz bat egin nahi dugunean, hau da, Bilatu laukian sartzen dugunaren berdina den lema edo forma bilatu nahi dugunean. 'Hasi' eta 'Bukatu' aukeren bidez, halako karaktere-segidaz hasten edo amaitzen diren lemak edo formak bila daitezke.

  • Hitza: lauki horretan idazten da bilatu nahi dena (lema edo forma osoa, halako karaktere-segidaz hasten edo amaitzen den lema edo forma).

  • Kategoria: nahi izanez gero, kategoria gramatikala muga daiteke.

  • Ordenatu honen arabera: emaitzak agertzeko era aukera daiteke hor: maiztasunaren arabera, edo domeinuaren arabera

Adibidea:

  • Hizkuntza: euskara

  • Zer bilatu: lema

  • Aukerak: da

  • Hitza: oker

  • Kategoria: iz.

  • Ordenatu honen arabera: maiztasuna

Adibide honi dagozkion emaitzak 2. irudian ikus daitezke:


2. irudia. Hizkuntza bakarreko bilaketa baten emaitzaren adibidea

Emaitzen ezaugarriak ondokoak dira:

  • Emaitzak bi zutabeko formatuan bistaratzen dira. Hasierako lerroan adierazten da zenbat segmentu edo itzulpen-unitate topatu diren eta zenbat domeinu ezberdini dagozkien.

  • Maiztasunaren arabera ordenatu baditugu emaitzak, topatutako emaitza bakoitzeko segmentua zein domeinuri dagokion eta zer maiztasunarekin topatu den ikusiko dugu lehenbizi, eta ondoren itzulpen-unitatea bera. Ezkerreko zutabean euskarazko esaldia agertuko da, eskuinekoan, berriz, gaztelaniazkoa. Kontsultan bilatutako hitzak beltzez agertuko dira dagokion hizkuntzako esaldietan.

  • Domeinuaren arabera ordenatu baditugu emaitzak, domeinu bakoitzeko (emaitza gehien duten domeinuak gorago agertuko dira) domeinuaren izena eta bertan, osotara, zenbat itzulpen-unitate topatu diren agertuko da. Horren azpian itzulpen-unitateak agertuko dira, eta bakoitzaren maiztasuna parentesi artean erakusten da. Lehen bezala, ezker-eskuin euskara-gaztelania hizkuntza-bikotea agertuko da, eta bilaketetako hitzak beltzez.

  • Azkenik, hizkuntza bakoitzeko zutabearen eskuinaldean, esaldi bakoitzeko, iturriak izeneko esteka aurki dezakegu. Sagua estekaren gainean jarriz gero, esaldi hori topatu dugun dokumentuen zerrenda agertuko zaigu. Printzipioz, hizkuntza batean eta bestean posizio berean agertzen diren dokumentuen estekak elkarren itzulpenak dira. Hala ere, gerta liteke itzulpen-unitatea topatu zenetik esteka horietan dauden dokumentuak aldatu izana, eta, beraz, ezin dugu % 100ean bermatu dokumentuetako edukiak paraleloa izaten jarraituko duenik. Gehienez ere 10 dokumentu erakusten dira; gehiago dauden kasuetan osotara zenbat diren adierazten da.

Bilaketa-tresnaren bigarren lerroa erabiliz, bigarren hitz bat bila dezakegu. Kasu horretan, bi aukera sortzen dira, aukeratu dugun hizkuntzen arabera:

  1. Bi koadroetan sartutako hitzak hizkuntza berekoak badira, bi hitz horiek dituzten segmentuak bilatuko dira.

  2. Adibidea:


    3. irudia. Hizkuntza bereko bi elementuko bilaketa-adibidea

    Adibide honi dagozkion emaitzak 4. irudian ikus daitezke:


    4. irudia. Hizkuntza bereko bi elementuko bilaketa-adibidearen emaitza

  3. Bi koadroetan sartutako hitzak hizkuntza ezberdinekoak badira, bi hitzak (bakoitza dagokion hizkuntzako esaldian) dituzten segmentuak itzuliko dira.

  4. Adibidea:


    5. irudia. Hizkuntza ezberdinetako bi elementuko bilaketa-adibidea

    Adibide honi dagozkion emaitzak 6. irudian ikus daitezke:


    6. irudia. Hizkuntza ezberdinetako bi elementuko bilaketa-adibidearen emaitza

Lematizazioa eta anotazio automatikoak

Testu-hitz bakoitzari lema eta kategoria automatikoki atxikitzen zaizkio. Horrela, kirten, kirtenak, kirtenean, kirtenaren ... formei sistemak automatikoki kirten lema eta izena kategoria atxikitzen die.


7. irudia. kirtenean hitzaren analisia