YouTube zaoferuje dubbing. Chce wykorzystać do tego sztuczną inteligencję

YouTube ma nowy pomysł na wykorzystanie sztucznej inteligencji. Wystarczy, że raz nagramy film, a ten zostanie automatycznie przetłumaczony i zdubbingowany w obcym języku – dzięki temu będzie miał potencjał, by dotrzeć do szerszego grona odbiorców.

Automatycznie generowane napisy sprawiły, że zagraniczne filmy na YouTube stały się bardziej dostępne. Dziś też możemy liczyć na tłumaczenie tytułów. Teraz jednak możemy mówić o olbrzymim kroku naprzód, a chodzi o dubbing generowany automatycznie – z wykorzystaniem sztucznej inteligencji.

Aloud, czyli automatyczny dubbing w YouTube

Aloud – tak nazywa się funkcja, która ma sprawić, że bariera językowa w serwisie YouTube przestanie istnieć. W pierwszym kroku narzędzie dokona automatycznej transkrypcji wideo. Tak wygenerowany tekst będzie wysyłany do autora filmu, który może go po prostu zatwierdzić lub poprawić. Następnie tekst ten będzie mógł zostać przetłumaczony na inne języki i na tej podstawie automatycznie zostanie wygenerowany dubbing.

Gdy dubbing zostanie dodany do filmu, użytkownicy będą mogli wybierać, czy chcą odtworzyć materiał z oryginalną ścieżką dźwiękową czy też tą wygenerowaną przez sztuczną inteligencję. Tak jak w przypadku innych ustawień, odpowiedni przełącznik znajdziemy pod ikoną koła zębatego.

Premiera to tylko początek. Plany są ambitne

Aktualnie funkcja Aloud jest testowana z udziałem “setek twórców” i już wkrótce ma zostać udostępniona publicznie. Na samym początku nowa funkcja będzie dostępna tylko w trzech językach: angielskim, hiszpańskim i portugalskim. Cytowana przez serwis XDA-developers firma Google zapewnia jednak, że lista ta będzie sukcesywnie wydłużana i to już w “niedalekiej przyszłości”.

Jednakże dodanie kolejnych języków stanowi tylko niewielką część tego, co w kontekście Aloud planuje firma Google. Mówi się między innymi o zaawansowanym upodabnianiu sztucznie generowanej ścieżki dźwiękowej do głosu oryginalnego twórcy. Co więcej, algorytmy sztucznej inteligencji mają też ingerować w samo wideo, aby synchronizować ruch ust z dźwiękiem. Na to jednak poczekamy co najmniej do przyszłego roku.

Podziel się postem :)

Najnowsze:

Bezpieczeństwo

Powstanie Centrum Cyberbezpieczeństwa NASK. Ujawniono szczegóły

Powstanie Centrum Cyberbezpieczeństwa NASK, które będzie skupiać specjalistyczne centra, ośrodki i laboratoria, by wzmocnić krajowy system cyberbezpieczeństwa. Ma też wesprzeć działający już CSIRT NASK. Projekt zaplanowano do końca 2029 roku, jego wartość to 310 mln złotych.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *