Baliabideak eta tresnak
Zientzia eta Teknologiaren Corpusa
Zientzia eta teknologia alorreko euskararen erabilera ikertzeko baliabidea izatea du helburu nagusia.
- 1990-2002 bitartean argitaratutako zientzia eta teknologiaren alorreko obrak hartu dira kontuan corpusa elikatzeko
- Guztira: 8,5 milioi hitz
- Automatikoki landuak eta gero eskuz berrikusiak eta zuzenduak: 1,9 milioi hitz
- Corpus sailkatua da, eremuaren (jakintza-alorraren) eta generoaren (testu-motaren) arabera
- Corpus etiketatua da, bai testuaren egiturari eta formatuari dagokionez, bai linguistikoki
- Corpusa kontsultatzeko interfaze ahaltsua du, era askotako bilaketa bakunak eta konplexuak egiteko aukera du
- Elhuyar Fundazioko I+G taldeak eta EHUko Informatika Fakultateko IXA Taldeak garatu dute
- LREC 2006n eta Corpus Linguistics 2007n aurkeztua
- Corpusa gizarteratzeko hiru modalitate antolatu ditugu
- Ikerkuntzarako hitzarmen bidezko dohaintza
- Ustiapen komertzialerako lizentzia bidezko banaketa