Hoppa yfir valmynd
29. apríl 2002 Innviðaráðuneytið

Úthlutun á styrkjum til tungutækniverkefna

Menntamálaráðuneytið veitir 51,6 milljónum króna til tungutækniverkefna



Fréttatilkynning frá menntamálaráðuneytinu 17. apríl 2002

Menntamálaráðuneytið hefur úthlutað styrkjum úr tungutæknisjóði sem komið var á fót til að efla íslenska tungu í upplýsingasamfélagi. Samtals voru veittir átta styrkir að fjárhæð 36,6 milljónir króna. Síðar verður 10 milljónum varið til þróunar talmálsgrunna og 5 milljónum til að semja orðalista sem auðveldar þýðingu hugbúnaðar. Lista yfir styrkþega og verkefni er að finna á vefnum www.tungutaekni.is.

Einkum voru nú veittir styrkir til þróunar á texta- og talmálsgrunnum sem eiga að vera öllum opnir og nýtast til að búa til tungutækniverkfæri á íslensku. Styrkir voru einnig veittir til hagnýtra tungutækniverkefna.

Hæstu styrkirnir eru að upphæð 10 milljónir króna hvor. Friðrik Skúlason ehf. fær styrk til þess að þróa hugbúnað til að greina beygingar orða og búa til forrit sem leiðréttir ýmiss konar málfræðivillur. Orðabók Háskólans og Edda hf. - miðlun og útgáfa fá styrk til að búa til gagnagrunn um beygingar íslenskra orða en slíkur grunnur er undirstaða margs konar tungutækniverkefna.

Tungutækni hefur ekki náð mikilli fótfestu hér á landi en margir þekkja þó tölvuorðabækur, forrit sem leiðrétta stafsetningu og talgervla. Slíkur hugbúnaður er til á íslensku í einfaldri útgáfu og er ljóst að til að íslenskan verði lifandi tungumál í heimi tækninnar þarf að vinna mikið starf á næstu árum.

Ör þróun í tungutækni hefur gert mögulegt að tölvur lesi texta, þýði hann vélrænt á önnur tungumál og skynji og tali tungumál. Hugbúnaður af þessu tagi hefur verið þróaður fyrir enskt málsamfélag en öflugt átak þarf til að íslenskan verði með í þessari þróun.


Á árunum 1999 og 2000 veitti Alþingi samtals 104 milljónum króna til átaks í tungutækni. Verkefnisstjórn á vegum menntamálaráðuneytisins hefur yfirumsjón með framkvæmd tungutækniverkefnisins og gerir tillögur um ráðstöfun fjár. Þeir styrkir sem nú eru veittir eru fyrst og fremst til verkefna sem skapa grundvöll fyrir frekari þróun á sviði tungutækni. Þann grundvöll hefur vantað hér á landi og er þess vænst að styrkveitingarnar efli hann og verði til þess að auðvelda fyrirtækjum að þróa ýmiss konar verkfæri fyrir íslenska tungu.

Tungutækni snýst um að gera fólki kleift að hafa samskipti við vélar með því að nota venjulegt tungumál. Hún vinnur að því að tölvan þekki talað og ritað mál, geti talað við fólk og þýtt yfir á önnur tungumál. Í þekkingarþjóðfélagi framtíðarinnar verður hægt að nálgast upplýsingar og þjónustu með því að tala við tölvur og tæki. Tungutækni mun liggja til grundvallar þeim samskiptum sem menn hafa við hin margvíslegu tæki í umhverfi sínu eins og heimilistæki, skrifstofutæki, símann, bílinn, leikföng o.s.frv. Þá skiptir höfuðmáli að slík samskipti geti farið fram á íslensku.

Tungutækni byggir á málvísindum, tölvutækni og tölvuverkfræði. Hún styðst einnig við sálfræði, skynjunarfræði og hljóðfræði, eins og hvernig fólk skilur tal og myndar hljóð og orð. Að auki nýtir tungutækni gervigreind, t.d. þegar greint er á milli orðalags með mismunandi merkingu. Háskóli Íslands hefur skipulagt framhaldsnám í tungutækni með þverfaglegum áherslum þar sem stuðst er við þekkingu í íslensku og tölvunarfræði. Þar verður ennfremur unnið að rannsóknum í tungutækni.


w w w . t u n g u t a e k n i . i s
Vefur menntamálaráðuneytisins um tungutækni veitir upplýsingar um stöðu tungutækni á Íslandi. Þar er að finna upplýsingar um þau verkefni sem verið er að vinna að og miða að því að íslenska verði áfram lifandi tungumál í upplýsinga- og þekkingarsamfélagi 21. aldarinnar. Hægt er að senda ábendingar og fyrirspurnir á netfangið [email protected]



Verkefni styrkt af Tungutæknisjóði í apríl 2002 Verkefni Umsækjandi Upphæð
styrks í þús. kr.
Beygingargreinikerfi - Málfræðigreinikerfi - MálfræðiPúki Friðrik Skúlason 10.000
Beygingarlýsing íslensks nútímamáls Orðabók Háskólans / Edda 10.000
Reglusafn fyrir markara sem greinir íslenskan texta Orðabók Háskólans / Edda / Málgreiningarhópurinn 6.000
Talkennsl og texti í tal Nýherji 5.000
Hagnýt nýting tungutækni í símtölvunarlausnum Grunnur 2.500
Íslensk textasöfn Landsbókasafn Íslands / Háskólabókasafn 1.600
Endurbætt tillögugerðarforrit Púkans Friðrik Skúlason 1.000
Endurbætt orðskiptiforrit Púkans Friðrik Skúlason 500

Samtals til verkefna sem sótt er um styrk til: 36.600

Til þróunar talmálsgrunna verði varið 10 milljónum króna. 10.000
Til gerðar samræmds orðalista sem nýtist við þýðingar á viðmótum hugbúnaðar verði varið 5 milljónum króna. Sá listi mun nýtast aðilum sem vinna að þýðingum hugbúnaðar. 5.000

Samtals til verkefna er sækja um styrki og vegna þróunar talmálsgrunna og orðalista 51.600


Beygingakerfi - Málfræðigreinikerfi - Málfræðipúki
Umsækjandi: Friðrik Skúlason ehf
Sótt er um styrk til að þróa:
1. Beygingagreinikerfi sem geti skilað upplýsingum um beygingu íslenskra orða.
2. Málfræðigreinikerfi sem greinir setningar vélrænt og segir til um byggingu setningar og eiginleika einstakra hluta hennar.
3. Málfræðipúka sem leiðréttir íslenskar setningar á grundvelli beygingar- og setningafræði. Málfræðipúkinn nýtir sér því kerfi 1 og 2 og er notendaforrit.
Verkefnin verða styrkt um 10 milljónir króna.


Beygingarlýsing íslensks nútímamáls
Umsækjendur: Orðabók Háskólans og Edda hf. – miðlun og útgáfa
Markmið verkefnisins er að koma upp beygingarlýsingu íslensks máls á tölvutæku formi. Að verkefninu loknu verður til tölvutæk beygingarlýsing sem yrði aðgengileg til nota í önnur tungutækniverkefni.
Verkefnið verður styrkt um 10 milljónir króna.


Reglusafn fyrir markara
Umsækjendur: Orðabók Háskólans og Málgreiningarhópurinn
Markmið verkefnisins er að búa til reglusafn fyrir markara sem geti merkt orð í íslenskum texta á kerfisbundinn hátt (orðflokk, beygingu o. s.frv.). Slíkt er forsenda fyrir uppbyggingu ýmiss konar málgrunna.
Verkefnið verður styrkt um 6 milljónir króna.


Talkennsl og texti í tal
Umsækjandi: Nýherji hf
Lýsing á verkefni
Markmið verkefnisins er að hefja þróun íslenskrar útgáfu af WebSphere Voice Server frá IBM þannig að hægt verði að nota þann hugbúnað til að bjóða upp á talviðmót á íslensku. Í fyrsta áfanga verður um að ræða stakorðaskilning á takmörkuðu orðamengi og vörpun texta í tal, auk þess að áætlanir er lúta að því að íslenska IBM raddtæknina til fulls verða þróaðar.
Verkefnið verður styrkt um 5 milljónir króna.


Hagnýt nýting tungutækni í símtölvunarlausnum
Umsækjandi: Grunnur-Gagnalausnir ehf
Markmið verkefnisins er að hagnýta tungutæknilausnir, sem þróaðar eru annars staðar, með því að tengja þær við símtölvunarlausnir fyrirtækisins. Fyrirtækið er áhugasamast um taleiningar, sem hægt er að nýta beint við lausnir sem fyrirtækið hefur þróað, svo sem Tímon, Boða og Uppara.
Verkefnið verður styrkt um 2,5 milljónir króna.


Íslensk textasöfn
Umsækjandi: Landsbókasafn Íslands – Háskólabókasafn
Markmið umsækjanda er að framleiða og gera aðgengileg textasöfn til afnota fyrir alla sem vinna að verkefnum á sviði tungutækni. Í verkefninu felst tvennt. Annars vegar að koma upp hugbúnaði til að leiðrétta texta frá ýmsum tímum og hins vegar að hanna aðferðir til að gera textaleit nákvæmari og markvissari.
Verkefnið verður styrkt um 1,6 milljónir króna.


Endurbætt tillögugerðarforrit Púkans
Umsækjandi: Friðrik Skúlason ehf
Markmið verkefnisins er að fækka bulltillögum sem ritvilluvörn Púkans kemur með þegar hann er að reyna að finna rétt orð fyrir rangt stafsett orð. Bullorð eru þau orð sem Púkinn býr sjálfur til úr samsetningu orða í orðasafninu og eru jafnframt lík upphaflega orðinu útlitslega. Einnig á að kenna Púkanum að þekkja algengar villur í stafsetningu.
Verkefnið verður styrkt um 1 milljón króna.


Endurbætt orðskiptiforrit Púkans
Umsækjandi: Friðrik Skúlason ehf
Orðskiptiforrit Púkans getur skipt löngum orðum á milli lína. Sótt er um styrk til að endurbæta orðskiptiforritið þannig að það geri færri villur í orðskiptingu. Púkinn getur t.d. núna ekki skipt þeim orðum sem eru geymd í heilu lagi í orðasafninu. Sem dæmi um aðrar villur er þegar Púkinn kemur með tillögur að tveimur mögulegum skiptingum og önnur er mjög langsótt.
Verkefnið verður styrkt um 0,5 milljónir króna.





Menntamálaráðuneytið, 17. apríl 2002

Efnisorð

Hafa samband

Ábending / fyrirspurn
Ruslvörn
Vinsamlegast svaraðu í tölustöfum