Skaitmeninis asistentas

Autoriaus nuotraukaUgnė Žilytė, [email protected]

Teksto ir vaizdo atpažinimo programėlės

 

Parašas po straipsniuKuriama vis daugiau įvairių mobiliųjų programėlių, ne išimtis ir neregiams skirtos teksto ir vaizdo atpažinimo programėlės. Neseniai Andžejus Ravanas "Mūsų žodyje" rašė apie pastarąsias, naudojamas "iOS" operacinėje sistemoje. Apžvelgsiu kelias kitas, kurias galima rasti "Google Play" parduotuvėje, siūlančioje programėles, žaidimus ir kitus elektroninius produktus "Android" išmaniesiems įrenginiams. 

Programėlė "Eye-D Pro". Ji kainuoja maždaug 8 eurus. Ši programėlė turi kelias funkcijas: atpažįsta tekstą, objektus, parodo artimiausius viešuosius objektus pagal buvimo vietą bei atidarinėja PDF failus. Už papildomą mokestį siūlo spalvų atpažintuvą, geresnį teksto atpažinimą su OCR (optiniu teksto atpažinimo įrankiu) ir PDF skaitytuvą. Norint atpažinti tekstą arba objektą, reikia jį nufotografuoti paspaudžiant tam tikrus mygtukus. Ši programėlė veikia anglų kalba. Nusipirkus OCR teksto atpažinimo funkciją, galima gauti neblogų teksto atpažinimo rezultatų, ši funkcija kainuoja 32 eurus. Daugiau funkcijų pirkti nerekomenduoju, nes yra kitų programėlių, kurios geriau jas vykdo, bet smalsuoliai turėtų išbandyti viską. Objekto atpažinimo funkcijos pavyzdys būtų toks: nufotografavau knygą ir gavau rezultatą: 1. šriftas, 2. knyga, 3. popierius, 4. leidinys. "Eye-D Pro" gan gerai atpažįsta kai kurias augalų rūšis ir detaliai nusako nufotografuotą objektą. Jei nufotografuosite veidą, programa jums išvardys matomas veido dalis. Aš šią programėlę naudoju gan retai, nes nepatogu fotografuoti tekstą, daug geresnį rezultatą gaunu tiesiai per kamerą jį nuskaitydama su kitomis programėlėmis. Kiti likimo broliai sakė, kad, rodydama viešuosius objektus aplink mane, programėlė daug objektų neparodo, vietoj esamų penkių viešojo transporto stotelių išvardija tik tris ir pan. Šiuo metu programėlė turi naują funkciją, pavadinimu "Covid-19". Paspaudę ant šios funkcijos, pamatysite visas su virusu susijusias naujienas, bet kadangi "Eye-D Pro" nepalaiko lietuvių kalbos, lietuviškai galėsite paskaityti tik naujienų antraštes. 

"Seeing Asistent Home Light". Ši programėlė yra nemokama. Ji turi tokias funkcijas, kaip brūkšninių kodų ir NFC "artimo lauko") skaitytuvas, šviesos detektorius, teksto atpažintuvas ir padidinimo stiklas. Brūkšninių kodų su ja dažniausiai nenuskaitinėju, nes juos nuskaičius programėlė atidaro "Google" paieškos sistemą ir rodo joje rastus rezultatus. Pasitaiko, kad nusiskenavusi, pavyzdžiui, saldainių kodą, randu pavadinimą estų kalba, kuris man jokios informacijos neduoda. Žinoma, galėčiau jį išsiversti su "Google Translate", bet tai atima daug laiko. Šioje programėlėje man patinka šviesos detektorius, su juo galiu pasitikrinti, ar svečiai nepaliko įjungtos šviesos. Įjungus šią programėlės funkciją, telefonas pradeda skleisti cypimo garsą: einu per butą ir spaudinėju jungiklius. Jei paspaudus jungiklį garsas telefone žemėja, reiškia, kad šviesą išjungiau, jei aukštėja, vadinasi, šviesą įjungiau. Skleisdamas garsą veikia ir teksto atpažintuvas. Kamera tiesiogiai aptinka tekstą ir ekrano skaitymo programa pradeda jį skaityti - ši funkcija man patinka, nes teksto nereikia fotografuoti. Tam yra atskiras mygtukas. Vieniems patogiau tekstą fotografuoti, kitiems labiau patinka jį skaityti tiesiogiai. Be to, pasitaiko skirtingų pakuočių, kur vienais atvejais daugiau informacijos sužinau nufotografavusi tekstą, o kitais - nusiskaičiusi tiesiogiai. 

"Speak". Ši programėlė yra nemokama. Ji turi teksto, objektų, spalvų atpažinimo ir brūkšninių kodų skaitytuvo funkcijas. Teksto atpažinimui galima naudoti du būdus: nufotografuoti tekstą arba bandyti jį nusiskenuoti su programėlėje esančiu skeneriu. Skenuodami tekstą gauname nurodymus anglų kalba, kur turime kreipti telefoną, kairiau ar dešiniau. Įsiinstaliavus į telefoną "MacroDroid" plėtinį, galima naudoti ir "Google Lens" funkciją. Ši funkcija suteikia galimybę gauti nuorodas iš "Google" apie nufotografuotą objektą, pavyzdžiui, kuriose parduotuvėse galima jį nusipirkti. Spalvų atpažintuvas šioje programėlėje nėra vertas pirmos vietos, tikrai yra geresnių variantų, nes ši programėlė, kaip ir dauguma kitų, gaudo spalvas iš visos aplinkos. Kai kurie "Speak" naudotojai šiuo metu susiduria su problema, kad uždarius programėlę, ji vis tiek lieka veikianti, įjungta ir labai greit iškrauna telefono bateriją. 

Objektų atpažinimui galima naudoti dar vieną programėlę - "Supersense". Ji yra pranašesnė už kitas tuo, kad nereikia fotografuoti objektų, užtenka telefoną kraipyti į šalis ir kamera iškart juos fiksuoja. Taip pat galime nusistatyti, kokio objekto namuose ieškome, pavyzdžiui, arbatinuko, ir sukiodami telefoną, kai būna aptinkamas ieškomas objektas, išgirstame jo pavadinimą - taip sužinome, kuria kryptimi turime eiti, kad jį rastume. Manau, kad ši funkcija gali praversti viešbučiuose arba pas ką nors svečiuose. Tačiau šios programėlės teksto atpažinimo funkcija kol kas yra labai nekokybiška. 

"TapTapSee". Ši programėlė yra panaši į "Supersense", skirtumas tik tas, kad čia, kaip ir daugumoje programėlių, reikia fotografuoti objektus, tačiau ji geriau nei kitos atpažįsta vaisius ir turi labai gerą spalvų atpažintuvą. Nufotografavus objektą, "TapTapSee" iškart pasako, kokios spalvos ir koks yra daiktas. Man ji labiausiai padeda derinant aprangos elementus bei rūšiuojant skalbinius. 

"Sullivan+" taip pat nemokama programėlė. Ji turi teksto, objektų, spalvų, šviesos, asmenų atpažinimo ir PDF failų atidarymo funkcijas. Visos funkcijos veikia panašiai kaip kitose programėlėse, visos yra naudotinos. Trumpai apibūdinsiu tik asmenų atpažinimo funkciją "face recognition"), kurios nėra kitose aprašytose programėlėse. Asmenų atpažinimo funkcija - tokia funkcija, kuri apibūdina žmogų. Reikia jį nufotografuoti ir gauname informaciją apie jo amžių ir išvaizdą, veido išraišką. Nereikia įsižeisti, jei ši programėlė kartais jus pajaunins arba pasendins. 

"LetSee" - tai programėlė, turinti tris funkcijas: ji atpažįsta pinigus, pakišus juos po telefono kamera; su šia programėle galima užregistruoti įvairias korteles, pavyzdžiui, neįgalumo ar skaitytojo pažymėjimą, įvairias nuolaidų korteles ir t. t. Galima nemokamai užregistruoti penkias korteles, o sumokėjus tam tikrą mokestį - iki dvidešimt kortelių. Trečia šios programėlės funkcija yra šviesos detektorius. Apibendrinant, pinigus ši programėlė atpažįsta gan gerai, užregistruoti korteles irgi yra patogu, nes pakišę kortelę po kamera sužinosime, kokią kortelę rankose turime, ir šviesos detektorius taip pat veikia visai gerai. 

Atėjo laikas aprašyti mano labiausiai naudojamą programėlę "Envision AI". Šią programėlę reikia prenumeruoti, galima mokėti mėnesines įmokas po 2 eurus, metines įmokas po 20 eurų arba nusipirkti visam laikui už šimtą eurų. "Envision AI" labiausiai man patinka dėl teksto atpažinimo kokybės. Yra dvi teksto atpažinimo galimybės: tekstą galima fotografuoti arba laikyti nukreipus kamerą į jį paspaudus mygtuką "Start constantly Reading" laukti, kol kamera užfiksuos tekstą, tuomet ekrano skaitymo programa automatiškai pradės skaityti aptiktą tekstą. Dažniausiai su šia funkcija skaitau užrašus ant įvairių produktų arba ant įvairių kortelių. Ši programėlė dar turi aplinkos, spalvų atpažinimo bei brūkšninių kodų nuskaitymo funkcijas, tačiau jos nėra kokybiškos, labai lėtai gaudomos pasikeitusios spalvos, aplinka atpažįstama iš dalies, o kodų man iš viso nepavyksta nusiskaityti. Bet užrašus nuskaito labai gerai, todėl kodų nuskaitymo funkcija net nėra reikalinga. Pastebėjau, kad ši programėlė geriau veikia, jei telefono kalba yra ne lietuvių, o didesnę populiacijos dalį apimanti kalba, pavyzdžiui, anglų ar vokiečių. 

Nors programėlių yra itin daug ir, tikėtina, dar ne visas jas aprašiau, tačiau užtenka turėti svarbiausias - "Envision AI" teksto atpažinimui, "TapTapSee" spalvų bei objektų atpažinimui, "Seeing Asistent Home Light" šviesos aptikimo funkcijai ir "LetSee" pinigų atpažinimui, ir kitų programėlių neprireiks. Tik reikėtų pripažinti, kad kol kas teksto atpažinimo programėlės labiausiai naudotinos nuskaitant kokius nors užrašus nuo įvairių pakuočių ir kortelių. O norėdami skaityti rimtus dokumentus ir knygas vis dar turime naudoti skenerį, jungiamą prie kompiuterio, arba įvairias skaitymo mašinas, tokias kaip "KOBA Vision EasyReader". 

 

Nuotrauka: Telefone turint kelias teksto ir vaizdo atpažinimo programėles, galima efektyviai panaudoti skirtingas jų funkcijas / asociatyvi www.pexels.com nuotr. 

Išmaniojo telefono nuotrauka. Joje vaizduojamas dešinėje ištiestoje žmogaus rankoje laikomas telefonas. Nuotraukoje matoma rankos dalis - nuo dilbio iki pirštų galų, ant riešo žmogus segi šviesų laikrodį. Delne esančiame išmaniajame telefone įjungta fotokamera. Telefono ekrane matomas daugiabučių kvartalo vaizdas iš aukštai, greičiausiai stovint priešais esančio daugiabučio balkone. Vaizdas antrame nuotraukos plane - susiliejęs, ryškus tik matomas per telefono ekraną. 


[Komentarai] | [Turinys] | [Mūsų tinklapis]

 

Spaudos, radijo ir televizijos rėmimo fondo logotipas