Skaitmeninis asistentas

Autoriaus nuotraukaEglė Jarmolavičiūtė

Dirbtinis intelektas – mūsų ateities akys


 

Tikėtina, kad kažkada mokslininkai atras būdą, kaip iš kamieninių ląstelių išauginti kokį nors neveikiantį organą, deja, tai užtruks 10–20 metų mažiausiai, bet juk gyventi reikia dabar. Aš mėgstu sakyti, kad išmanusis telefonas atstoja man akis, mat jį turėdama galiu savarankiškai ne tik tvarkytis buityje, bet ir rasti man reikiamus objektus mieste, ir tai tik maža dalis galimybių, kurias suteikia išmanusis telefonas. Jau kurį laiką netyla kalbos apie dirbtinį intelektą. Galbūt esate girdėję apie „Chat GPT“, čia galite užduoti klausimus dirbtiniam intelektui (toliau – DI), prašyti jo išspręsti galvosūkius, padiskutuoti, paprašyti parašyti kam nors laišką nurodyta tema ir panašiai. Šiame straipsnyje norėčiau detaliau pristatyti dar kitą DI galimybę – analizuoti nuotrauka ir jas aprašyti. 

Parašas po straipsniu

Aš dar prisimenu tuos laikus, kai nuotrauka neregiui buvo absoliučiai nepasiekiamas informacijos šaltinis. Jau kone dešimtmetį specialiomis programėlėmis galime gauti abstrakčius nuotraukų aprašymus. DI padeda gauti labai konkrečius nuotraukų aprašymus. Kad pajustumėte skirtumą, štai, pavyzdžiui, ką DI sako apie nuotrauką, kurioje nufotografuota papūga, tupinti ant virtuvinio vežimėlio krašto: „Nuotraukoje matosi Afrikos pilkoji papūga, kuri tupi ant šviesiai žalio vežimėlio krašto. Papūga yra pilkos spalvos su baltu veidu ir raudonomis uodegos plunksnomis. Ji žiūri tiesiai į kamerą. Ant vežimėlio yra mažas baltas indelis, kuriame yra sėklų, aplinkui taip pat yra išbarstytų sėklų. Šalia vežimėlio yra nedidelis medis, kuris yra ant rato platformos. Fone matosi langas ir sidabrinis oro sterilizatorius. Grindys atrodo šviesaus medžio spalvos.“ O štai kaip tą pačią nuotrauką aprašo įprastai naudojama programėlė nuotraukoms atpažinti: „Pilka papūga tupi ant metalinio stovo priešais langą.“ 

Prieš kurį laiką programėlė „Be My Eyes“, kuri labiau žinoma norint gauti pagalbos iš matančių savanorių, pradėjo diegti funkciją „Be My AI“. „AI“ yra angliško žodžio „Artificial intelligence“, lietuviškai „dirbtinis intelektas“, trumpinys. Ši funkcija dar nėra viešai prieinama, bet užsiregistravus galima gauti išankstinę teisę ją išbandyti. Deja, jos laukti tenka gana ilgai. Aš laukiau apie keturis ar penkis mėnesius. Oficialią versiją, tai yra, prieinamą visiems, kūrėjai žada išleisti šių metų pabaigoje, tada ir grįšiu su nauju straipsniu, kuriame paaiškinsiu, kaip ją įsidiegti ir kaip naudoti. Esu įsitikinusi, kad ši DI nuotraukų atpažinimo funkcija palengvintų ne vieno neregio gyvenimą. Toliau papasakosiu, ką man pavyko atrasti, išbandant DI. 

 

Išbandymas ne žaidimui, o pagalbai 

 

Pradėjau nuo paprastų dalykų: pasičiupau pirmą pasitaikiusią pakuotę, ją nufotografavau ir sužinojau, kas tai, iš ko padaryta, be to, gavau detaliai aprašytą mane supančią aplinką. Tai mane gerąja prasme šokiravo, ir taip praleidau visą dieną bandydama šią funkciją įvairiose situacijose. 

Asmeniškai man gana didelė problema sužinoti, drabužiai švarūs ar ne. Pasitaiko, kad, atrodo, tik šiandien apsirengiau, o jau sugebėjau kažkur išsiterlioti arba dėmės tiesiog neišsiskalbė. Pateikus nuotrauką „Be My AI“ jis pasakys, ar drabužiai švarūs. Taip pat galima susirašinėti su „AI“ ir klausti papildomų klausimų, pavyzdžiui, kur tiksliau yra dėmės, taip pat, kokių spalvų drabužiai, ar jie tarpusavyje dera. 

Kojinių išsirūšiavimas – taip pat nemenkas iššūkis. Vieni perka daug vienodos spalvos kojinių, kiti suveria jas ant specialių segtukų, kad skalbiant nesusimaišytų. Kiti, pavyzdžiui, aš, nešioja skirtingas kojines. Dabar užteks parodyti kojines DI ir jis pasakys, ar jos yra vienodos, ar ne. 

DI taip pat galima prašyti ir patarimų. Aš išsidėliojau dvejas kelnes ir dvejus marškinius. DI nusiųsta nuotrauka buvo aprašyta taip: „Nuotraukoje matyti kambarys su medinėmis grindimis ir lova, kurios rėmas taip pat medinis. Ant lovos yra keletas drabužių. Kairėje pusėje yra juodos snieglentės kelnės su balta etikete šalia juosmens ir reguliuojamais dirželiais apačioje. Šalia jų yra tamsiai pilkos džinsinės kelnės dryžuotu raštu. Dešinėje pusėje ant lovos yra dveji pilki marškiniai; vieni iš jų turi logotipą kairėje krūtinės pusėje. Už drabužių yra rožinė su baltomis gėlėmis antklodė. Kambarys atrodo paprastas ir tvarkingas.“ Paklausiau, ką DI man pasiūlytų rengtis einant į darbą, ir gavau štai tokį atsakymą: „Jei jūsų darbo vieta reikalauja šiek tiek oficialesnio aprangos kodo, tai geriau pasirinkti tamsiai pilkas džinsines kelnes, nes jos atrodo tvarkingesnės nei snieglentės kelnės. Tarp dviejų pilkų marškinių, galite pasirinkti tą, kuris neturi logotipo, nes tai gali atrodyti šiek tiek profesionaliau. Tačiau, jei jūsų darbo vietoje nėra griežto aprangos kodo, galite pasirinkti bet kuriuos marškinius, kurie jums labiau patinka.“ 

Toliau išbandžiau DI galimybes aiškinantis, kas parašyta ant maisto produktų pakuočių. Taip, mes jas galime perskaityti jau seniai, bet dirbtinis intelektas padės sutaupyti laiko, norint sužinoti, tarkime, produkto sudėtį. Tereikia nusiuntus pakuotės nuotrauką DI paklausti, kokia produkto sudėtis. Jei ji bus aiškiai matoma, DI paskaitys tik produkto sudėtį. Jei nuotraukoje jos nebus užfiksuota – paprašys nufotografuoti dar kartą. Be abejo, nematant tai gali būti kiek sudėtinga. 

Kitas kasdienybėje mane dominantis dalykas – prietaisų su liečiamaisiais ekranais valdymas. Visai nematant valdyti juos gana keblu, labai užsispyrus gal ir būtų įmanoma, bet jei yra mygtukinių arba išmaniųjų alternatyvų – tikrai neverta. Išbandžiau šią DI funkciją fotografuodama savo orkaitės ekraną. Rezultatus gavau labiausiai aiškius, kokius tik galėjau gauti. DI galima paklausti, ar nuotraukoje matomas koks nors konkretus užrašas. Jei matomas, DI nupasakos, kur jį rasti. Jei yra apčiuopiamų elementų, pavyzdžiui, mano orkaitė turi apvalų reguliatorių, tai DI pasirinks jį kaip atskaitos tašką ir pasakys, kad tas konkretus užrašas yra kairėje arba dešinėje pusėje nuo reguliatoriaus. Taip pat galima paklausti, ar užrašas labiau viršuje, ar apačioje. Tiems, kas turi regėjimo likutį, galima parodyti pirštu į užrašą, kurio negalite perskaityti, ir paklausti, kas parašyta ten, kur rodo pirštas. Vadovaujantis DI nurodymais man pavyko orkaitėje rasti norimą programą. Tiesa, pagrindinis minusas yra laikas. Tai užtrunka tikrai ilgai, bet bėdai nutikus – įmanoma. 

Iš smalsumo pabandžiau nusiųsti rankomis lipdytų molinių skulptūrėlių nuotrauką. Jas dirbtinis intelektas taip pat puikiai aprašė, nors kai kurios iš jų buvo visiškai netradicinės, pavyzdžiui, indas, kurio viename gale yra paukščio galva, kitame ąselė. Štai kaip dirbtinis intelektas aprašė šį molio dirbinį: „Nuotraukoje matyti paukščio forma suformuota molio skulptūra, kuri atrodo kaip puodelis ar mažas ąsotis. Paukščio kūnas yra talpyklos dalis, o uodega lenkiasi į viršų ir formuoja rankeną. Paukščio kūnas puošiamas molio dalelėmis, primenančiomis plunksnas. Skulptūra padėta ant dviejų apvalių plokščių baltų pagrindų. Fone matosi lentyna ir dar viena pilkšva skulptūra, kuri atrodo kaip batai. Paukščio skulptūros spalva yra natūralus molio bežas.“ 

Daugelis iš mūsų tikriausiai neįsivaizduojame gyvenimo be interneto ir apsipirkimo jame. Bėda ta, kad, atrodo, prekybininkai vis mažiau dėmesio skiria tekstiniams prekių aprašymams, dėl to nematant būna keblu išsirinkti norimą prekę. Išbandžiau šią funkciją susiradusi ankstesnius savo užsakymus, kai gavau ne visai tokią prekę, kokios tikėjausi. Tai buvo replės, skirtos vielai arba ploniems laidams karpyti, dėl to jos turi nusmailintą galą, o aš norėjau replių, kad būtų galima suspaudus atsukti varžtą. Tiesą pasakius, nežinau, ar aš būčiau supratusi iš DI aprašymo, kad šios replės man netinka, nes aš jau žinau, kaip jos atrodo, todėl sunku įvertinti. Bandžiau jam rodyti įvairių įrankių, skirtų dirbti su moliu, nuotraukas, bet vėlgi, sunku pasakyti, ar teisingai supratau aprašymą, kai nesu to daikto rankoje turėjusi. Visgi DI taip pat galima klausti ne tik, kaip daiktas atrodo, bet ir kaip jį naudoti, ar patogu naudoti nematant, nors tai gana subjektyvu. Bet geriausią rezultatą man pavyko išgauti, kai norėjau nusipirkti ilgintuvą, skirtą naudoti lauko sąlygomis. Man buvo svarbu, ar rozetės užsidengia dangteliais, ar ne. Šito, aišku, aprašyme paminėta nebuvo, bet DI patvirtino, kad taip, rozetės užsidengia dangteliais. 

Mieste dažniausiai aš patiriu du iššūkius: jei su navigacine programėle nueinu į kokią nors vietą, kur daug durų, dar reikia sužinoti, kurios iš šių durų man reikalingos. Čia DI padėjo puikiai, tiesa, tai gali padaryti ir bet kokia kita programėlė, perskaitanti įvairius užrašus. Kita bėda – viešasis transportas, kaip sužinoti autobuso ar troleibuso numerį? Deja, nors šią situaciją DI padeda išspręsti, bet per vėlai. Taip, jis pasako nufotografuotos transporto priemonės numerį, bet kol gauname atsakymą praeina nuo pusės minutės iki minutės, per tiek laiko transporto priemonė nuvažiuoja. Bandžiau fotografuoti, kai transporto priemonė dar gana toli nuo stotelės, bet tokiu atveju ne visada perskaito numerį, ir vis tiek tai trunka per ilgai realiuoju laiku. 

Aš kartais mėgstu „pasimalti“ prekybos centruose. Dažniausiai einu ten, kur daugiau mažiau žinau, kaip ką rasti, bet pasitaiko ir kad tenka eiti į nepažįstamą vietą. Bandžiau išsiaiškinti, kaip DI man papasakos, kokia tai parduotuvė. Rasti ir perskaityti užrašą tikrai ne visada pavyks, labiausiai čia gelbėja tai, kad jis pasako, kokius daiktus mato parduotuvėje. Kartais pavyksta nufotografuoti ir jos pavadinimą. Ši funkcija padės, jei šiaip sumanysite nueiti į prekybos centrą praleisti laisvalaikio ir norėsite išsiaiškinti, ką galima rasti aplinkui, o einant su konkrečiu tikslu užtruks pernelyg ilgai. 

Ir taip, pagrindinis šios DI funkcijos minusas yra laikas, per kurį gauname informaciją. Ji visiškai netinka norint ją gauti labai greitai, pavyzdžiui, autobuso ar troleibuso numerį. Kitais atvejais galima ir palaukti, bet kol kas pats atpažinimas tikrai trunka gana ilgai ir daugeliu atvejų galbūt paprasčiau paklausti matančio žmogaus. Bet reikia nepamiršti, kad ši DI funkcija kol kas net nėra oficialiai prieinama, ji bus tobulinama ir galbūt ateityje sulauksime, kad DI iš karto analizuotų vaizdą iš kameros ir jį balsu perteiktų, o mes balsu galėtume paklausti papildomų klausimų. 

 

Nuotrauka. Skaitykite nuotraukų su papūga (kairėje) ir molio dirbiniu (dešinėje) DI pateiktus aprašymus straipsnyje / asmeninio archyvo nuotr. 

Palyginkite: mūsų garsinio vaizdavimo specialistės Urtės minėtų nuotraukų aprašas. Patalpoje priešais langą ant metalinio vežimėlio rankenos tupi galvą nuleidusi Afrikos pilkoji papūga (Žako). Atrodo, kad ji žiūri į lesalo pilną plastikinį indelį su rankena, iš kurio ant vežimėlio paviršiaus pabirusios kelios granulės. Paukščio plunksnos, snapas ir kojos tamsoki, o akis bei šnerves supa šviesi oda. Už vežimėlio stovi pašiukšlinta medinė pakyla su aukštu, apgenėtu, maždaug 20 cm skersmens medžio kamienu be žievės, prie kurio vertikaliai pritvirtinta ilga stambi nulupta šaka ir horizontaliai driekiasi kelios smulkesnės šakelės. Kiek tolėliau nuo šios laktos ant šviesių medinių grindų stovi nešvarokas, maždaug 50 cm aukščio prietaisas, panašus į ventiliatorių ar oro sterilizatorių. Pro langą matyti šviesaus pastato kampas. 

Lentynoje ant apvalaus pagrindo stovi tokio pat aukščio molinis rankų darbo puodelis, kurio dešinėje pusėje – kreivoka rankenėlė, o kairėje – paukščio galva su lenktu snapu ir apvalia akimi be vyzdžio. Dalį puodelio šono dengia prilipdyti įvairaus dydžio ir formos molio gabaliukai, imituojantys plunksnas. Žaismingasis puodelis yra platus, nelygių kraštų, jo paviršiuje matyti molio įskilimų ir įbrėžimų. Nuotraukos kairėje giliau ant lentynos stovi molinis aukštakulnis batelis nelygiu paviršiumi. 


[Komentarai] | [Turinys] | [Mūsų tinklapis]

 

Spaudos, radio ir televizijos rėmimo fondas remia rubriką