Helburu nagusia testu-bilduma eleaniztunak kontsultatzeko bilaketa-sistema bat garatzea da, eszenatokia zientzia eta teknologia alorreko bildumak webean izanik.
Horretarako, dokumentuak modelizatzeko zenbait adierazpide eredu eta ranking-teknikak probatu eta inplementatuko dira. Honez gain, galderarako adierazpide ereduak hizkuntza guztientzako normalizatzeko teknikak probatu eta inplementatuko dira. Itzulpenak hiztegietan oinarritutako tekniken bidez burutuko dira. Itzulpen prozesu mota honetan sortzen diren arazoak, anbiguotasuna eta hiztegien estaldura, konpontzeko teknika desberdinak inplementatu eta probatuko dira. Bilduma desberdinetatik lortutako ranking desberdinen nahasketa egokia egiteko modua ere ikertu eta inplementatuko da.
Hizkuntza arteko dokumentuen berreskurapen automatikoan dokumentu-bilduma eleaniztun erraldoiak kontsulta daitezke sarrerako galdera hizkuntza bakarrean idatziz. Dena dela, bai sarrerako galderaren egitura baita emaitzen aurkezpena ere era askotakoak izan daitezke.
Sarrerako kontsulta adibidez, hitz-gako multzo batetik hizkuntza naturalean idatzitako galdera batera izan daiteke. Bestalde, emaitzen aurkezpen-formatuak zerikusi handia dauka emaitzak lortzeko algoritmo-motarekin, hau da, emaitzak hautatu eta ordenatzeko moduarekin. Proiektu honetan bilaketa-terminoen multzoetan oinarritutako kontsultak eta eredu estatistikoetan oinarritutako ranking algoritmoak eskainiko dituen sistema bat garatzea proposatzen da.
Copyright © 2007 Elhuyar Fundazioa | Lege-oharra | Web-mapa | Erabiltzaile-kopurua: 856789
Diseinua: Blanco