Система автоматического субтитрирования видеофайлов
Основное содержимое статьи
Аннотация
В данной работе содержится описание процесса автоматического субтитрирования (распознавания звуковой составляющей) видеофайлов в процессе телепроизводства ГТРК «ВолгоградТРВ». Значимость работы заключается в программно реализованных алгоритмах извлечения аудиодорожки из видеофайла, распознавания речи в аудиофайле, коррекции распознанного текста, добавления субтитров в видеофайл. Разработанный программный модуль автоматического субтитрирования видеофайлов использует технологии: модель распознавания русского языка Golos («Sber»), медиасервер с открытым исходным кодом Emby.
Скачивания
Информация о статье
Библиографические ссылки
Денисенко А. Golos – самый большой русскоязычный речевой датасет, размеченный вручную // Хабр : [сайт]. Habr, 2006–2022. Дата публикации: 27.05.2021. URL: https://habr.com/ru/company/sberdevices/blog/559496/.
Emby - The open media solution : [сайт]. Emby LLC, 2022. URL: https://emby.media/.
ffmpeg Documentation. URL: https://ffmpeg.org/ffmpeg.html.