Система автоматического субтитрирования видеофайлов

Основное содержимое статьи

Д. М. Коробкин

Аннотация

В данной работе содержится описание процесса автоматического субтитрирования (распознавания звуковой составляющей) видеофайлов в процессе телепроизводства ГТРК «ВолгоградТРВ». Значимость работы заключается в программно реализованных алгоритмах извлечения аудиодорожки из видеофайла, распознавания речи в аудиофайле, коррекции распознанного текста, добавления субтитров в видеофайл. Разработанный программный модуль автоматического субтитрирования видеофайлов использует технологии: модель распознавания русского языка Golos («Sber»), медиасервер с открытым исходным кодом Emby.

Скачивания

Данные скачивания пока недоступны.

Информация о статье

Как цитировать
1.
Коробкин ДМ. Система автоматического субтитрирования видеофайлов. Системный анализ в науке и образовании [Интернет]. 18 октябрь 2022 г. [цитируется по 20 апрель 2024 г.];(2):23-7. доступно на: https://sanse.ru/index.php/sanse/article/view/532
Раздел
Статьи

Библиографические ссылки

Денисенко А. Golos – самый большой русскоязычный речевой датасет, размеченный вручную // Хабр : [сайт]. Habr, 2006–2022. Дата публикации: 27.05.2021. URL: https://habr.com/ru/company/sberdevices/blog/559496/.

Emby - The open media solution : [сайт]. Emby LLC, 2022. URL: https://emby.media/.

ffmpeg Documentation. URL: https://ffmpeg.org/ffmpeg.html.