Kas teadsite, et tehnoloogiagigant Google ja Oxfordi ülikool on välja töötanud uue tehisintellekti (AI) süsteemi? Jah, lühidalt, see on tuntud kui WLAS, see on süsteem, mida saab hõlpsasti tõlgendada pärast redigeerimata videoklipist lugemist.
Teadlased Google'i arendatud tehisintellektist DeepMind Oxfordi ülikool on huulte lugemise süsteem, mis ületab võimaliku analüüsi ja tõlgenduse inimesed.
Seetõttu on Google'i Briti osakond hakanud BBC sadade tundide kaupa telesisu kasutama lihtsalt tarkvara DeepMind huulte lugemiseks.
Meeskond koolitas tehisintellekti enam kui 5000 tunni videoga, mis sisaldas 110 000 erinevat fraasi ja 17 500 erinevat sõna. Eesmärk oli parandada inimkeele mõistmist heliga või ilma.
Tulemused andsid täpsuse 46,8 protsenti, see protsent võib esmapilgul tunduda madal, kuid siiski ületab 12,4 protsenti, mis suudaks saavutada huulelugemisele spetsialiseerumise sama indiviidi all professionaalne.
Katse põhines Oxfordi ülikooli uurimisel, tarkvara nimega LipNet, mis oskas huuli lugeda väga täpselt (90% sõnu), kuid analüüsis ainult 57 erinevat sõna.
Teadlaste sõnul on nende vaatamise, kuulamise, osalemise ja õigekirja (WLAS) süsteem märkimisväärselt ületanud kõigi selle valdkonna varasemate teoste transkriptsioonivõime. Even, Watch, Listen, Attend ja Spell (WLAS) süsteem on juba analüüsinud enam kui 118 tuhat erinevat fraasi ja 17 500 unikaalset sõna ning selle eesmärkide hulka kuulub süsteemide arendamine.
Seega võib seda tüüpi süsteemidel olla mitmesuguseid rakendusi, mis aitavad kuulmispuudega inimestel hõlpsasti lihtsalt öeldud sõnu lugeda. Pealegi võiks seda huulelugemissüsteemi kasutada ka selleks, et võimaldada kasutajatel lihtsalt visuaalselt suhelda selliste virtuaalsete assistentidega nagu Siri ja Cortana.