Știm cu toții că există numeroase dispozitive prezente care pot păstra momente pe cameră, dar ce s-ar întâmpla dacă ar putea surprinde situații care urmau să se întâmple? Da, cercetătorii creează un sistem care generează videoclipuri despre viitor.
Există numeroase dispozitive prezente care pot păstra momente pe cameră, dar ce s-ar întâmpla dacă ar putea surprinde situații care urmau să se întâmple?
Cercetătorii de la MIT CSAIL au dezvoltat un algoritm pentru învățarea profundă, care poate crea videoclipuri care arată „ceea ce vă așteptați să se întâmple în viitor”. Mai detaliat, este un sistem care prezice viitorul. Este un algoritm de inteligență artificială, dintr-o imagine poate crea un videoclip cu viitorul lor imediat.
Ideea este că computerul este capabil, după ce a fost antrenat, să știe ce se va întâmpla imediat după ce a văzut o scenă, chiar dacă ar trebui să fie ceva relativ logic, să presupunem că va cădea un vas, un tren a sosit la gară, un val care vine pe plajă, etc.
Cercetătorii au instruit sistemul de inteligență artificială cu 2 milioane de videoclipuri, inclusiv mai mult de un an de înregistrare, astfel încât computerul a fost suficient de inteligent pentru a ști ce se întâmplă de obicei după o întâmplare scenă. Vor să folosească acest sistem pentru a îmbunătăți tacticile de securitate și pentru a le aplica în sistemul de mașini autonome, deoarece va fi mai ușor să se prevadă accidentele.
Echipa cercetătorilor spune că „versiunile viitoare ar putea fi folosite pentru orice, de la tactici de securitate îmbunătățite și mașini mai sigure cu conducere automată. Potrivit doctorandului CSAIL și prim autor Carl Vondrick, algoritmul poate ajuta, de asemenea, mașinile să recunoască activitățile oamenilor fără adnotări umane scumpe ”.
Primul autor Carl Vondrick a spus că „Aceste videoclipuri ne arată ce cred calculatoarele care se pot întâmpla într-o scenă. Dacă poți prezice viitorul, trebuie să fi înțeles ceva despre prezent ”.
Această lucrare se concentrează de fapt pe prelucrarea întregii scene simultan, algoritmul generând până la 32 de cadre de la zero pe secundă.
„Construirea unei scene cadru cu cadru este ca un joc mare de„ Telefon ”, ceea ce înseamnă că mesajul se destramă în timp ce parcurgi întreaga cameră. În schimb, încercând să prezicem simultan toate cadrele, este ca și cum ai vorbi simultan cu toată lumea din cameră ”, a spus Carl Vondrick. În timp, generatorul învață să-l înșele pe discriminator.
Cu toate acestea, lucrarea va fi prezentată la Conferința privind sistemele de procesare a informațiilor neuronale [NIPS], care se va desfășura săptămâna viitoare la Barcelona.