MForum.ru
23.01.2023,
МТС сообщает о смелом решении озвучить до 10 тысяч произведений с помощью искусственного интеллекта MTS AI. Аудиокниги в рамках этого проекта будут доступны пользователям книжного сервиса "Строки". Будет задействована собственная разработка для распознавания и синтеза речи Audiogram. В этом продукте объединены возможности использования нейронных сетей, технологии ML обработки естественного языка (NLP).
Аудиопроизведения будут сформированы в формате EPUB - формат популярный в области цифровых книг, а вот для сохранения звука его использовали не так часто.
Картинка нарисована с использованием нейросети DALL.E 2 и сервиса Nightcafe.
Надеюсь платформа МТС озвучивает тексты лучше, чем эта платформа рисует картинки.
“В перспективе использование технологий синтеза речи позволит издательствам и электронным библиотекам существенного сократить время на подготовку аудиоверсии книги и снизить затраты на производство аудиоконтента. Команде MTS AI удалось добиться того, чтобы на подготовку первоначальной версии аудиокниг уходило 30-60 минут, тогда как студийная запись живым голосом занимает кратно больше времени, до нескольких дней с учетом технической обработки и монтажа”, - Дмитрий Буланцев, технический директор MTS AI.
“Формат аудиопотребления книжного контента очень удобен и становится все более популярным. При этом огромный объем книг - более 90% - не озвучены, их трансформация в аудиоформат традиционным способом заняла бы годы. Технологии искусственного интеллекта позволяют существенно ускорить, упростить и удешевить этот процесс. И значит огромное число произведений - как литературных, так и нонфикшн станут доступным в удобном аудиоформате,” - комментирует Евгения Рыкалова, руководитель книжного сервиса "Строки" от МТС.
МТС обещает, что платформа не только синтезирует речь, но также правильно расставляет ударения и паузы, воспроизводит побудительные и вопросительные интонации. Вместе с тем, я не думаю, что даже лучшие алгоритмы уже сегодня способны убить такой жанр как озвучивание книг. Оплачиваемые заказы на этом рынке получить будет сложнее, но работы мастеров этого жанра будут продолжать пользоваться спросом.
В МТС ожидают, что платформу Audiogram можно будет задействовать не только для озвучки книг, но также в образовании, для подготовки аудиолекций, для озвучивания видео, статей, создания материалов для людей с ограниченными возможностями, например, по зрению.
UPD: Послушал примеры работы Audiogram. Выглядит приемлемо, если почему-то предпочтительнее аудиформат. Но вряд ли поклонники тех или иных чтецов будут готовы перейти на такую озвучку. С другой стороны, встречаются и чтецы, которые читают не лучше или хуже (особенно беда с ударениями, а иногда и интонациями). К сожалению, примеры в целом не очень наглядные, например, непонятно, будет ли какая-то раскладка по голосам, когда идет речь о диалогах, например.
Чего точно не хотелось бы, так это того, чтобы дети в большом объеме сталкивались с такими вариантами озвучки, т.к. "чужинка" в озвучке присутствует. И лучше бы детям давать слушать тексты в исполнении профессиональных чтецов или лучших из любителей, а не в исполнении ИИ. По крайней мере, пока что.
Сэмплы доступны в Telegram:
https://t.me/c/1172581942/2238
https://t.me/c/1172581942/2239
--
За новостями телекома и IT удобно следить в телеграм-канале abloud62. Региональные новости и анонсы пресс-релизов вы найдете в канале abloudRealTime, также подключайтесь к каналу Бойко про телеком ВКонтакте
теги: МТС AI ИИ
Публикации по теме:
21.12. [Новости компаний] Медийные платформы операторов: Книжная платформа "Строки" выпустит сериалы в формате книг / MForum.ru
14.12. [Новости компаний] AR/VR: МТС проведет AR-показ коллекций российских дизайнеров в Москве и Санкт-Петербурге / MForum.ru
01.12. [Новости компаний] Маркетинг: МТС и московская подземка "оживят" карты Тройка технологией AR / MForum.ru
19.01. [Новости компаний] AR / VR / MForum.ru
01.10. [Новости компаний] Искусственный интеллект / MForum.ru
22.01. [Новинки] Слухи: Apple iPhone SE 4 получит Dynamic Island / MForum.ru
21.01. [Новинки] Слухи: Samsung Galaxy S26 Ultra может получить 200 Мп сенсор / MForum.ru
21.01. [Новинки] Слухи: Google Pixel 10a работает над оптимизацией стоимости Google Pixel 10a / MForum.ru
21.01. [Новинки] Слухи: iQOO Neo10R для индийского рынка представят в феврале / MForum.ru
20.01. [Новинки] Слухи: Раскрыты европейские цены смартфонов Samsung Galaxy S25 / MForum.ru
17.01. [Новинки] Слухи: Realme P3 будет доступен в трех комбинациях памяти и трех цветах / MForum.ru
17.01. [Новинки] Слухи: Раскрыты подробности о чипсетах будущих планшетов Samsung / MForum.ru
16.01. [Новинки] Слухи: Раскрыта толщина складного смартфона Oppo Find N5 / MForum.ru
16.01. [Новинки] Анонсы: Складной смартфон Nubia Flip 2 с 6,9-дюймовым дисплеем появился в Японии / MForum.ru
15.01. [Новинки] Анонсы: Motorola представила Moto G Power 2025 и Moto G 2025 / MForum.ru
15.01. [Новинки] Слухи: Realme работает над 4G-версией Realme 14x / MForum.ru
14.01. [Новинки] Анонсы: Huawei Band 9 представлен официально / MForum.ru
14.01. [Новинки] Слухи: Redmi Turbo 4 Pro будет основан на Snapdragon 8s Elite / MFiorum.ru
13.01. [Новинки] Слухи: В сети появились рендеры смартфонов семейства Samsung Galaxy S25 / MForum.ru
13.01. [Новинки] Анонсы: Представлен бюджетный планшет Lenovo Tab / MForum.ru
10.01. [Новинки] Анонсы: TCL представила технологию Nxtpaper 4.0 в новом планшете Nxtpaper 11 Plus / MForum.ru
10.01. [Новинки] Анонсы: Realme 14 Pro+ анонсирован в Китае / MForum.ru
09.01. [Новинки] Слухи: Раскрыты подробности о Samsung Galaxy S25 Ultra / MForum.ru
09.01. [Новинки] Слухи: Раскрыты подробности об экране и чипсете Redmi K80 Ultra / MForum.ru
09.01. [Новинки] Анонсы: Lenovo Legion Tab (2025) получил Snapdragon 8 Gen 3 и цену в $500 / MForum.ru