NEREGYS IR VISUOMENĖ

Alvydas VALENTA

"LIEPA" LIETUVIŠKAI


Pradėsime nuo to, kuo baigėme pasakojimą apie UAB "Algoritmų sistemos" sukurtą lietuvių kalbos sintezatorių. Projekto "Liepa" mūsų akiratyje iki šiol tarsi ir nebuvo. Gal kai kas apie jį žinojo ar bent buvo girdėjęs, bet daugelis nei žinojo, nei girdėjo. Priežasčių, matyt, buvo keletas. Pirmiausia, net visažinis internetas paieškos sistemoje "Google" surinkus žodžius "lietuvių kalbos sintezė" "ar "lietuvių kalbos sintezatorius" konkrečios ir tikslios informacijos dominančia tema pateikia gana šykščiai. Ir tą pačią reikia rankiotis po trupinį, dažnai per antraeilius dalykus brautis kaip per tropikų džiungles. Antra, akliesiems rūpimi kalbos sintezės reikalai rimčiau pajudėjo tik praėjusių metų antrąjį pusmetį LASS respublikiniame centre pradėjus dirbti informacinių technologijų specialistui Arvydui Juchnai. Tolimesni svarstymai šia tema nuvestų gerokai į lankas, tačiau tiek projektas "Liepa", tiek ir kai kurie kiti Lietuvoje vykstantys procesai akivaizdžiai liudija viena: patys turime ieškoti, domėtis, dalyvauti - niekas nieko neatneš, nepadovanos, kaip tokiais atvejais paprastai sakoma, traukinys važiuos ir nuvažiuos. Traukinys, vardu "Liepa", tikriausiai irgi būtų nuvažiavęs, bet, atrodo, į paskutinį vagoną dar suspėjome. 

Projektą "Liepa" - tai lietuvių šneka valdomos paslaugos - vykdo Vilniaus universiteto matematikos ir informatikos institutas bei filologijos fakultetas ir partneriai. Projekto tikslas - sukurti priemones, atveriančias galimybes dirbti, bendrauti su kompiuteriais ir sumaniais daiktais šnekantis lietuvių kalba. Kaip teigia jo vadovas profesorius Laimutis Telksnys, ateinantis dešimtmetis bus toks dešimtmetis, kai su kompiuteriais ir su kitais įvairiais prietaisais bendrausime balsu. Pasaulyje šia kryptimi daug dirbama, kuriamos naujos technologijos, programinė įranga. Lietuvių kalba dėl daugybės savo galūnių, priesagų, išvestinių formų bendrauti su kompiuteriu nėra paranki. Prof. Telksnys pateikia tokį pavyzdį: "Anglų kalboje žodis "write" (rašyti) turi šešias formas, lietuvių kalboje tas pats žodis - daugiau nei 1200 formų. Norint, kad kompiuteris suprastų ir bendrautų lietuviškai, reikia, kad visas žodžio formas jis sugebėtų atpažinti. Ne mažiau sunkumų sukelia ir lietuvių kalbos sintaksė: vokiečių, anglų kalbose sakinio tvarka griežta - veiksnys, tarinys, papildinys ir pan. Lietuvių kalbos sakinyje - žodžių tvarka lanksti ir laisva. Reikia išmokyti kompiuterį ją atpažinti, šnekos sraute išskirti reikalingus elementus. 

Nors esama tokių sunkumų, darbai vyksta jau beveik metai. Vilniaus universiteto mokslininkams pavyko sukurti programinę įrangą, įgalinančią kompiuterį su jo "šeimininku" bendrauti lietuviškai. Numatoma sukurti 11 atskirų produktų. Šiame rašinyje paminėsime tik, mūsų galva, įdomesnius. 

Naršytuvas - paslauga, leidžianti naršyti internete duodant kompiuteriui nurodymus balsu. 

Pažintuvas - paslauga, leidžianti moksleiviams kalbantis su kompiuteriu ugdyti ląstelės pažinimo įgūdžius. 

Valdytuvas - paslauga, leidžianti kompiuterį valdyti ištisine šneka. 

Ieškotuvas - paslauga, leidžianti ugdyti moksleivių (taip pat ir suaugusiųjų) sugebėjimus šneka ieškoti UNESCO kultūros paveldo išteklių pasaulyje. 

Pagalbininkas - paslauga, padedanti įvairias negalias turintiems žmonėms, šnekantis su kompiuteriu, plėtoti socialinius gebėjimus, savitvarką, savitarną, informacinių technologijų naudojimo įgūdžius (pastaba: tai ne balso sintezė, kuri reikalinga akliesiems ir apie kurią dar kalbėsime). 

Elektroninio teksto skaitytuvas - paslauga, skaitanti elektroninį tekstą balsu. 

Kai kuriuos iš minėtų produktų "Liepos" mokslininkai jau yra sukūrę, kitus - dar kuria. Užbėgdami šiek tiek į priekį pasakysime, kad projektas vyks iki 2015 metų rugpjūčio. Iki to laiko turi būti įvykdytos ir užbaigtos visos jo veiklos. Taigi iki ateinančių metų vidurio su kompiuteriu jau galėsime bendrauti lietuviškai. Kaip visa tai atrodys tikrovėje, kol kas pasakyti nelengva. Prof. L. Telksnys pripažino, kad visų mūsų tariamų sakinių ar žodžių kompiuteris tikrai nesupras. Labai tikėtina, kad bus sudarytas kelių šimtų komandų žodynėlis, kurį prietaisas bus pajėgus suprasti ir tomis komandomis su juo bendrausime. Visai kaip koks superprotingas šuniukas! Tik joks šuniukas neatsakinėja į klausimus, o prietaisai tai jau gali daryti. Negavę atsakymo į rūpimą klausimą, turėsime jį formuluoti iš naujo, taip, kad kompiuteris suprastų ir galėtų į jį atsakyti. 

O dabar apie tai, kas labiausiai rūpi mums. Štai ką kalba A. Juchna: "Kalbos sintezės sąvoka labai plati, o šios sintezės pritaikymas gali taip pat būti labai įvairus. Tai "Liepos" žmonės ir daro - kompiuterio valdymas balsu, įvairūs ieškotuvai, naršytuvai, informaciją pateikiantys irgi balsu, bet daugelis tų dalykų netinka konkrečiam kasdieniniam neregio darbui. Mums reikia ekrano skaitymo programos, galinčios perskaityti ekrano turinį gražia kokybiška lietuvių kalba. Perskaityti bet kada ir bet kur: prisijungus prie interneto, sėdint miške ant kelmo... Pats tuo metu nedirbau LASS respublikiniame centre, bet, manau, kad skirtingas sąvokų vartojimas iš dalies galbūt ir lėmė tam tikrą mūsų ir lietuvių kalbos sintezės kūrėjų nesusikalbėjimą. Mes turėjome galvoje viena, jie - šiek tiek ką kita." 

A. Juchnai antrina ir Informacinės visuomenės plėtros komiteto informacinių išteklių skyriaus vedėjas Kęstutis Andrijauskas: "Kalbos sintezė - tai vienas iš darbo etapų - tam tikro kalbos variklio sukūrimas. Atskiras klausimas - kur ir kaip jį pritaikyti. Ačiū Lietuvos aklųjų ir silpnaregių sąjungai (LASS), ir Lietuvos aklųjų bibliotekai (LAB), laiku iškėlusiai klausimą, kad yra poreikis šitą kalbos sintezės variklį pritaikyti neregių poreikiams. Tai yra pirmasis konkretaus pritaikymo atvejis - aiški vartotojų grupė, kuri pasakė: "Taip, mums reikia lietuvių kalbos sintezės!" 

Praėjusių metų antrąjį pusmetį ir šių metų pradžioje tiek LASS, tiek LAB ryšiai su "Liepos" projekto specialistais tapo ne tik intensyvesni, bet ir gerokai konkretesni. LASS kreipėsi į Informacinės visuomenės plėtros komitetą prašydama rasti galimybių, kad projekto metu būtų sukurta ir akliesiems reikalinga kalbos sintezės programinė įranga. Su šiuo komitetu prasidėjo diskusijos ir derybos. Dabar jau istorija, kiek kartų buvo susitikta, diskutuota, aptarinėtos įvairios galimybės. Tačiau, kaip sako A. Juchna, "pagaliau išeiname į finišo tiesiąją!" Vasario viduryje Neįgaliųjų reikalų departamente vyko susitikimas, kuriame buvo aptarti lietuviškos sintezės klausimai. Susitikime visos suinteresuotos šalys galutinai sutarė, kad prie projekto "Liepa" vietos atsiras ir neregiams. Sutarta, kad jau kovą VU pradės dirbti komanda, sukursianti lietuvių šnekos sintezatorių. Neregiams reikalingai balso sintezei bus panaudoti du balsai: moteriškas ir vyriškas. 

Moteriškas balsas, jau dabar aišku, bus diktorės Reginos Jokubauskaitės, o vyrišką balsą galėsime rinktis iš dviejų balsų: aktoriaus Vlado Bagdono ir LRT žurnalisto Edvardo Kubiliaus. 

Nesigilindami į techninę reikalo pusę, atkreipsime dėmesį tik į tai, kad naujieji lietuviški balsai bus pritaikyti platformai SAPI5. Kompiuterių specialistai ir labiau patyrę vartotojai visas panašiai skambančias "platformas" jau turbūt seniai yra išnarstę po kaulelį arba nesunkiai gali tai padaryti. Mažiau patyrusiems pasakysime, kad tiek ankstesnė SAPI4, tiek SAPI5 yra tam tikra sąsaja, jungianti taikomąją programą su kalbos programa. Tačiau SAPI5 yra universalesnė. Todėl su ja susietus lietuviškus balsus bus galima naudoti ne tik su "Jaws", bet ir su kitomis ekrano skaitymo programomis: "Supernova", "NVDA", "Balobolka". Beje, pastarosios dvi yra atviro kodo programos ir platinamos nemokamai. SAPI5 palaiko ir kai kurie MP3 grotuvai, todėl galima tikėtis, kad netrukus lietuviškai prabils ir jie. 

Jeigu iš tikrųjų "Liepos" projekto metu bus sukurtas kokybiškas lietuvių kalbos sintezatorius, ne vienam skaitytojui gali kilti klausimas: kaip tada vertinti UAB "Algoritmų sistemos" sukurtą sintezatorių? Kokia turėtų būti mūsų pačių nuostata abiejų šių produktų atžvilgiu? Į pirmąjį klausimą K. Andrijauskas atsako taip: "Verslo įmonė per pastaruosius metus ar pusantrų sukūrė tam tikrą produktą. LR Vyriausybės Lietuvių kalbos taikymo informacinėse technologijose programa parengta dar 2007 metais. 2009 m. ji atnaujinta: numatyti prioritetai, veiklos kryptys, kur valstybė buvo numačiusi skirti lėšų. Viena šių krypčių - balso atpažinimo, balso sintezės programos. Privačios kompanijos pačios gali pasirinkti sprendimus ir jų įgyvendinimo būdus. "Algoritmų sistemos" savo produktą mato labiau ne kaip tam tikrą programinę įrangą, bet kaip paslaugą - tai didieji informaciniai portalai ir pan. Tai būtų tam tikra paslauga: žmogus atsiunčia tekstinę bylą, gauna įskaitytą balsu - už tai kažkas sumoka. Tiek "Liepos", tiek ir kitų ES struktūrinių fondų ir valstybės finansuojamų projektų esminis skirtumas ir pagrindinė sąlyga ta, kad produktas būtų nemokamas ir laisvai prieinamas visiems vartotojams. Vadinasi, mūsų aptariamu atveju "Liepos" sukurtas produktas galės būti laisvai naudojamas tiek kliento kompiuteryje, tiek teikiant kurios nors rūšies paslaugas." 

Į antrąjį klausimą - apie mūsų pačių nuostatą abiejų sintezatorių atžvilgiu - atsakymą turėsime rasti patys. "Algoritmų sistemos" savo sintezatorių jau praktiškai sukūrė, "Liepos" atstovai - dar tik kuria. Kol kas net nėra ką ir su kuo lyginti ar diskutuoti, kuris produktas yra geresnis. "Liepos" variantas mums būtų palankesnis: vyksta ES ir Vyriausybės finansuojamas projektas, jo metu bus sukurti du aklųjų reikmėms pritaikyti lietuviški balsai - mums tai nieko nekainuos! Kas gali būti paprasčiau? Tačiau kažin ar į "Algoritmų sistemų" lietuvišką balso sintezę turėtume lengvai numoti ranka? Ta sintezė jau sukurta, balsai kokybiški, papildomų darbų kaina, jeigu žiūrėsime ne iš privataus žmogaus, bet iš organizacijos pozicijų, irgi nėra labai didelė. Tiesa, patys sintezatoriaus kūrėjai, turbūt vadovaudamiesi komerciniais sumetimais, iki šiol neįvardija, kokia. Bet reikalo esmės pastaroji aplinkybė, tikėkimės, pernelyg nekeičia. Taigi bent aš po metų savo kompiuteryje norėčiau turėti abu šiuos sintezatorius. Jeigu atsiras ir daugiau šito norinčių - ar tikrai mūsų norai tokie neproporcingai dideli ir neįgyvendinami? 


[Komentarai] | [Turinys] | [Mūsų tinklapis]