YouTube zaoferuje dubbing. Chce wykorzystać do tego sztuczną inteligencję

YouTube ma nowy pomysł na wykorzystanie sztucznej inteligencji. Wystarczy, że raz nagramy film, a ten zostanie automatycznie przetłumaczony i zdubbingowany w obcym języku – dzięki temu będzie miał potencjał, by dotrzeć do szerszego grona odbiorców.

Automatycznie generowane napisy sprawiły, że zagraniczne filmy na YouTube stały się bardziej dostępne. Dziś też możemy liczyć na tłumaczenie tytułów. Teraz jednak możemy mówić o olbrzymim kroku naprzód, a chodzi o dubbing generowany automatycznie – z wykorzystaniem sztucznej inteligencji.

Aloud, czyli automatyczny dubbing w YouTube

Aloud – tak nazywa się funkcja, która ma sprawić, że bariera językowa w serwisie YouTube przestanie istnieć. W pierwszym kroku narzędzie dokona automatycznej transkrypcji wideo. Tak wygenerowany tekst będzie wysyłany do autora filmu, który może go po prostu zatwierdzić lub poprawić. Następnie tekst ten będzie mógł zostać przetłumaczony na inne języki i na tej podstawie automatycznie zostanie wygenerowany dubbing.

Gdy dubbing zostanie dodany do filmu, użytkownicy będą mogli wybierać, czy chcą odtworzyć materiał z oryginalną ścieżką dźwiękową czy też tą wygenerowaną przez sztuczną inteligencję. Tak jak w przypadku innych ustawień, odpowiedni przełącznik znajdziemy pod ikoną koła zębatego.

Premiera to tylko początek. Plany są ambitne

Aktualnie funkcja Aloud jest testowana z udziałem “setek twórców” i już wkrótce ma zostać udostępniona publicznie. Na samym początku nowa funkcja będzie dostępna tylko w trzech językach: angielskim, hiszpańskim i portugalskim. Cytowana przez serwis XDA-developers firma Google zapewnia jednak, że lista ta będzie sukcesywnie wydłużana i to już w “niedalekiej przyszłości”.

Jednakże dodanie kolejnych języków stanowi tylko niewielką część tego, co w kontekście Aloud planuje firma Google. Mówi się między innymi o zaawansowanym upodabnianiu sztucznie generowanej ścieżki dźwiękowej do głosu oryginalnego twórcy. Co więcej, algorytmy sztucznej inteligencji mają też ingerować w samo wideo, aby synchronizować ruch ust z dźwiękiem. Na to jednak poczekamy co najmniej do przyszłego roku.

Podziel się postem :)

Najnowsze:

Oprogramowanie

Nowości w Bardzie – Gemini Pro i generowanie obrazów

Z początkiem lutego Google zapowiedziało kolejne nowości w Bard AI. Narzędzie zyskało dostęp do Gemini Pro w języku polskim (i wielu innych), więc teraz zaawansowany model sztucznej inteligencji może się wykazać także „po naszemu”. A to nie wszystko, bo kolejnym ulepszeniem jest silnik Imagen 2, odpowiedzialny za generatywne tworzenie grafiki.

Sprzęt

Standard Wi-Fi 7 oficjalnie zatwierdzony

Wi-Fi 7 to najnowszy standard łączności bezprzewodowej, który został oficjalnie zatwierdzony i jest gotowy do wdrożenia. Oficjalna specyfikacja tego standardu została ogłoszona na targach CES 2024, co oznacza, że producenci urządzeń mogą teraz rozpocząć proces certyfikacji swoich produktów.

Linux

Linux Kernel 6.7: Nowa Era Innowacji

Linux Kernel 6.7 został oficjalnie wydany, wprowadzając szereg nowych funkcji i ulepszeń. Ten najnowszy stabilny kernel Linuxa z pewnością zasługuje na uwagę.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *