Antaŭeniras la skanado de Literatura Foiro

HeKo 891 7-B, 23 okt 25

Ricevinte komence de la jaro 2025 la tutan kolekton de Literatura Foiro, Ivan García, respondeculo de la retejo Bitarkivo, ĵus komunikis al ties vicĉefradaktoro ke probable jam dum la ĉi-jara novembro ĉiu numero de LF estos elskanita kaj gardata en interreta arkivo. La celo de Bitarkivo, laŭ priskribo en la retejo mem, estas “gardi la Esperantan kulturon por ĉiam”. La retejo jam sukcese arkivis cent ok periodaĵojn kaj indeksis la enhavon de 9.696 numeroj, antaŭvide al la onta arkivado de libroj, podkastoj kaj ceteraj dokumentoj.

La skanado de LF celas ankaŭ alion, nome la riĉigon de esperantlingvaj korpusoj. La plej grandaj publike alireblaj estas Tekstaro, prizorgata de Bertilo Wennergren, kaj Corpus Eye, de Eckhard Bick. Tekstaro enhavas pli ol du milionojn da vortoj kaj celas kovri la periodon de 1887 ĝis nun. Kvankam tiu amplekso povas soni impona, ĝi estas tamen sufiĉe modesta kompare al tiu de la korpusoj uzataj por prestiĝaj vortaroj kiel Oxford English Dictionary, kiu superas du miliardojn da vortoj, dum tiu de Duden Wörterbuch atingas ses miliardojn. Tiurilate en 2024 Kooperativo de Literatura Foiro interkonsentis kun akademiano Jesper Lykke Jacobsen pri la disponigo de kvindek kvin jarkolektoj de LF antaŭvide al la venontaj oficialaj aldonoj al la Universala Vortaro. Laŭ komuniko de Jacobsen, li jam kolektis 14.000 numerojn de revuoj kaj gazetoj, kaj centojn da libroj, kio ekvivalentas al ĉirkaŭ ducent milionoj da vortoj – 10.000% de la enhavo de Tekstaro.

Ni estas ankoraŭ for de la ciferoj de grandaj nacilingvaj korpusoj, sed per la grava laboro de Ivan García ni povos aldoni tricent kvardek gazetajn numerojn al la impona projekto.

— Alessio Giordano

Aldonu komenton

Via plena nomo aŭ "Anonima". Fikciaj formoj kaŭzos rifuzon de la komento.
Se vi havas la Esperantan civitanecon, vi rajtas indiki ĝin antaŭ la persona nomo per "c-ano".
Ĉiu komento estos traktata de la redakcio antaŭ la publikigo por garantii aŭtorecon kaj eviti spamaĵojn.
Respondecas pri la komento nur la indikita aŭtoro.
Principe komentoj pli longaj ol la koncerna HeKomuniko estos rifuzitaj.
Afiŝante komenton vi akceptas nian politikon pri privateco.
Dizajno de MTT · Programo de Tramontána · Funkcio de Drupal
Copyright Kopirajto © 2006–2025 Esperanta Civito · Ĉiuj rajtoj rezervitaj.