Nýr íslenskur þulur að koma á markað
Eftir Eirík Rögnvaldsson, Háskóla Íslands, Björn Kristinsson, Hexsoftware og Sæmund E. Þorsteinsson, Símanum
Um þessar mundir er vinnu við nýjan íslenskan þul að ljúka. Þulur (talgervill) er búnaður sem les upp (rafrænan) texta með sem eðlilegustum framburði. Slíkur búnaður hefur verið til fyrir íslensku síðan um 1990 og hefur gagnast blindum og sjónskertum mjög vel. En á undanförnum árum hefur tækni á þessu sviði fleygt fram og nýi þulurinn mun því standa þeim gamla langtum framar, bæði í framburði einstakra málhljóða og ekki síður í eðlilegu íslensku tónfalli.
Þulurinn er samstarfsverkefni Símans, Hex hugbúnaðar og Málvísindastofnunar Háskóla Íslands og kostaður að talsverðu leyti af tungutækniáætlun menntamálaráðuneytisins. Notuð er tækni frá fyrirtækinu Nuance (áður ScanSoft) sem er leiðandi á þessu sviði í heiminum. Aðstandendur þularins hafa góða reynslu af samstarfi við fyrirtækið síðan það vann með þeim að gerð íslensks talgreinis fyrir tveimur árum (Hjal-verkefnið). Þjálfun þularins fór fram í starfsstöð fyrirtækisins í Belgíu. Björn Kristinsson, MA í tungutækni og starfsmaður Hex, dvaldist þar um nokkurra mánaða skeið og vann að verkinu með sérfræðingum Nuance.
Ragnheiður Elín Clausen lagði þulnum til rödd. Tekinn var upp lestur hennar á miklum fjölda fjölbreyttra íslenskra setninga sem eru valdar þannig að í þeim komi fyrir mörg dæmi um öll hljóð og hljóðasambönd málsins, svo og öll algengustu orð og orðasambönd. Einnig þarf mismunandi tónfall að koma fram. Þessar hljóðskrár eru síðan greindar í einingar með sérstakri tækni og komið fyrir í gagnasafni þularins.

Þegar þulurinn les texta leitar hann alltaf í gagnasafni sínu að lengstu tiltæku samsvörun við þann texta sem lesa skal. Eigi hann t.d. að lesa „gott veður“ er ekki ótrúlegt að það samband sé að finna í heilu lagi í gagnasafninu, vegna þess hversu algengt það er, og þá er það að sjálfsögðu notað sem heild. Þurfi hins vegar að lesa sjaldgæfara samband eins og „gott áramótaveður“ er ekki líklegt að það sé til sem heild, en þá er steypt saman „gott“ úr öðru sambandi (t.d. „gott kvöld“) og „áramótaveður“ ef það er til í gangasafninu. Sé „áramótaveður“ hins vegar ekki til sem heild er hægt að búa orðið til úr einstökum orðhlutum sem teknir eru úr öðrum orðum, eða jafnvel einstökum málhljóðum. Eftir því sem meira þarf að klippa saman hljóð og orðhluta á þennan hátt eykst þó alltaf hættan á hnökrum á framburði, og þess vegna skiptir miklu máli að gagnasafnið sem byggt er á sé stórt og vel valið.
Nýtist almenningi í daglegu lífi
Eins og áður segir hefur sá þulur sem til hefur verið fram að þessu einkum nýst blindum og sjónskertum. Nýi þulurinn mun að sjálfsögðu koma þessum hópum að gagni, en honum er þó ekki síður ætlað að nýtast öllum almenningi á ýmsum sviðum daglegs lífs. Gera má ráð fyrir að hann verði notaður í ýmiss konar þjónustuverum, bankalínum, pöntunarsímum o.þ.h. Með tilkomu hágæða þular og talgreinis opnast nýir möguleikar á margs konar öruggri og skjótvirkri þjónustu við almenning, sem jafnframt getur leitt til verulegs sparnaðar hjá þeim fyrirtækjum og stofnunum sem taka þennan búnað í notkun.
Á myndinni er sýnt kerfi sem þarf til að veita þjónustu sem byggist á notkun þular og talgreinis. Sá sem óskar þjónustu hringir í kerfið, þulurinn svarar, segir deili á þjónustunni og spyr hvers óskað er. Maðurinn svarar því, talgreinirinn skynjar svarið og sendir tölvunni (viðmælanda) upplýsingar um það sem óskað er eftir. Jafnframt heldur tölvan uppi samræðum við hringjandann gegnum þulinn og veitir honum þá þjónustu sem um var beðið. Þulurinn og talgreinirinn gefa kost á því að gera margs konar þjónustu sjálfvirka sem hingað til hefur krafist mannafla. Hér eru áskorun og tækifæri fyrir hugbúnaðarsmiði að nýta sér þessa tækni til að búa til hugbúnaðarkerfi sem byggjast á tungutækninni. Hægt er að hlusta á taldæmi frá þulnum með því að fara á slóðina http://talgervill.hexia.net.

