YouTube, populiari vaizdo transliacijos svetainė, planuoja integruoti a naujas AI varomas įrankis kad bus lengviau kūrėjai gali dubliuoti savo vaizdo įrašus keliomis kalbomis ir padėti jiems pasiekti platesnę tarptautinę auditoriją.
Paskelbta „VidCon 2023“ Anaheime, Kalifornijoje, ketvirtadienį, YouTube atskleidė, kad taip integruojantis su„Aloud“ – dirbtinio intelekto varoma dubliavimo paslauga, sukurta 120 srityje, „Google“ vidinis eksperimentinių produktų inkubatorius.
Anksčiau vaizdo įrašų kūrėjai turėjo tiesiogiai bendradarbiauti su trečiųjų šalių dubliavimo paslaugų teikėjais, kad sukurtų savo garso takelius, kurie buvo arba per sunkūs, arba per brangūs. Naujoji dirbtinio intelekto pagrindu sukurta dubliavimo paslauga leis jiems įgarsinti savo vaizdo įrašus be papildomų mokesčių, todėl vaizdo įrašų dubliavimas bus paprastas ir ekonomiškas daugeliui vaizdo įrašų kūrėjų.
„Aloud“ padeda kūrėjams transkribuoti, išversti ir pasakoti vaizdo įrašus. Tai leidžia jiems „greitai ir lengvai kopijuoti savo vaizdo įrašus į kelias kalbas ir atrakinti žinias, kurios šiandien gali būti įstrigusios vienoje kalboje“, – sakoma pranešime. „Aloud“ svetainė.
Prieš dubliuojant vaizdo įrašą kita kalba, šis įrankis pirmiausia perrašo vaizdo įrašą, o tada leidžia kūrėjui peržiūrėti ir redaguoti transkripciją. Vėliau įrankis pagaliau išverčia ir sugeneruoja vaizdo įrašą pasirinkta kalba, prieš jį paskelbdamas kūrėjui.
Peržiūrėkite toliau pateiktą vaizdo įrašą, kurį bendrina „Google Aloud“ komanda, paaiškinantį įrankio veikimą:
Garsiai gali būti labai naudinga vaizdo įrašų kūrėjams, kalbantiems ribotomis kalbomis, nes šis įrankis jiems leis pridėti kelių kalbų dublių į jų vaizdo įrašus.
Interviu su The Verge, Amjad Hanif, „YouTube“ kūrėjų produktų viceprezidentas, sakė, kad vaizdo įrašų bendrinimo platforma jau išbando įrankį su „šimtais“ kūrėjų.
Artimiausiomis dienomis Hanifas pridūrė, kad „YouTube“ „dirba tam, kad išversti garso takeliai skambėtų taip kūrėjo balsas su daugiau išraiškos ir lūpų sinchronizavimo. Pranešama, kad bendrovė planuoja pridėti šias funkcijas 2024 metais.
„Aloud“ šiuo metu turi prieigą prie kelių kalbų. Šiuo metu įrankis palaiko tik anglų, ispanų ir portugalų kalbas, o netrukus pasirodys daugiau kalbų.