FapsParty
VoicePower
VoicePower

boosty


Прогресс озвучки от Яндекса на примере Vsauce (май 2025)

Прогресс озвучки от Яндекса на примере Vsauce (май 2025)

Прогресс озвучки от Яндекса на примере Vsauce (май 2025)

В сентябре 2021го я поинтересовался нововведением от Яндекса с закадровой озвучкой с английского на русский (и выразил своё отношение (https://vk.com/wall-60480847_10532) к данной функции на примере вступления видео Майкла из Vsauce "Do chairs exist?".
Мой первый пост:
Вот и нашёлся повод заценить автоматический перевод и закадровую озвучку от Яндекса. На всякий случай обозначу, что я считаю это важным и полезным инструментом в рамках идеи ускорения обмена идеями и знаниями. Инструментом, снимающим языковые барьеры в режиме онлайн. И хотя сейчас очевидно, что даже несмотря на огромный труд множества специалистов мощной корпорации, располагающей практически безграничными ресурсами, результат ещё далек от ожидаемого всеми идеала "здесь и сейчас", но со временем все встанет на свои места. Уже сейчас этот инструмент должен удовлетворительно справляться с обучающим\образовательным контентом, в котором превалирует формализованная речь, не изобилующая художественностью. С развлекательным контентом придётся подождать. А пока что можно и покекать. Но по-доброму, потому что Vsauce в этом плане - задачка не из лёгких.
ПС в блоге Яндекса было сказано, что мужчин будет озвучивать мужской голос, а женщин - женский. Автоматом. Кнопки выбора голоса вручную не нашёл. Так что в этот раз Майкл поговорит голосом Алисы, а если точнее, Татьяны Шитовой. Английские субтитры не автоматические.
14 сен 2021
Сегодня май 2025го. Прошло немало времени по меркам "ИИ-революции": сменилось несколько поколений различных моделей, люди уже в повседневности используют "ИИ-помощников", в том числе и на мобильных устройствах. И я снова решил поинтересоваться, а как там дела с развитием темы перевода и озвучки нейронками.
Теперь Яндекс предлагает варианты: "Обычные голоса. Быстрая и качественная озвучка" и "Живые голоса" за 3 минуты работы нейронки получаем "максимальное сходство, будто все знают русский" (заявление самого Яндекса, если что, прямо в пункте выбора опции). Что ж, последнее интригует больше всего. Поэтому сразу выбираю этот вариант. И снова предоставляю вам тот же фрагмент, что и осенью 2021го. Чтобы мы могли буквально по репликам отследить прогресс в качестве подготовки текста перевода и аудиального исполнения нейронками. В свежем видео английские субтитры сгенерировал сам я.браузер, поэтому есть там перл, как например, "eb sauce", но в остальном, вроде вполне корректно по англосабам.
Каков итог? Почти за 4 года прогресс, безусловно, есть, но всё ещё не поднимается язык назвать это "будто все знают русский". Да, именно текст перевода стал получше, чем был в 21м году. Да, в этот раз голос, и правда, мужской, а не женский, как в 21м. Но я бы не сказал, что он прям похож на голос Майкла. И потом, есть слишком сильное затихание озвучки в конце фраз, как будто у нейронки "не хватило дыхалки". Странно выглядит. Усложняет восприятие слушателя. Ну и амьерыканскый акцент в озвучке на русском забавит. Не знаю, насколько это задумка разработчиков или косяк работы нейронки.
Я этим занимаюсь, не чтобы поржать (хотя если есть над чем, то почему бы и не поржать) или как-то нивелировать достижения людей, а чтобы посмотреть на развитие полезной технологии.
А как вам прогресс? Как часто используете фичу? Насколько удовлетворяет ваши высокие требования? Конечно, у всех разный уровень владения английским и русским, поэтому и оценки будут сильно разниться. Но даже с учётом этого момента всегда есть некое "общее место" в оценке таких явлений, независимо от. Поэтому послушал бы ваше мнение.
Ну а моё мнение не сильно-то изменилось с 2021го. Думаю, устроим следующий спонтанный контроль прогресса в этой сфере годика через 2-3. Встречаемся на том же месте.


More Creators