Система автоматического субтитрирования видеофайлов

Основное содержимое статьи

Д. М. Коробкин

Аннотация

В данной работе содержится описание процесса автоматического субтитрирования (распознавания звуковой составляющей) видеофайлов в процессе телепроизводства ГТРК «ВолгоградТРВ». Значимость работы заключается в программно реализованных алгоритмах извлечения аудиодорожки из видеофайла, распознавания речи в аудиофайле, коррекции распознанного текста, добавления субтитров в видеофайл. Разработанный программный модуль автоматического субтитрирования видеофайлов использует технологии: модель распознавания русского языка Golos («Sber»), медиасервер с открытым исходным кодом Emby.

Скачивания

Данные скачивания пока недоступны.

Информация о статье

Как цитировать
[1]
Коробкин, Д.М. 2022. Система автоматического субтитрирования видеофайлов. Системный анализ в науке и образовании. 2 (окт. 2022), 23–27.
Раздел
Статьи

Библиографические ссылки

Денисенко А. Golos – самый большой русскоязычный речевой датасет, размеченный вручную // Хабр : [сайт]. Habr, 2006–2022. Дата публикации: 27.05.2021. URL: https://habr.com/ru/company/sberdevices/blog/559496/.

Emby - The open media solution : [сайт]. Emby LLC, 2022. URL: https://emby.media/.

ffmpeg Documentation. URL: https://ffmpeg.org/ffmpeg.html.