Конвертер субтитров в текст
Извлеките простой текст из файлов субтитров SRT и WebVTT, удалив все временные метки, номера последовательности и метаданные форматирования.
Ввод
Вывод
Документация
Что такое файлы субтитров?
Файлы субтитров — это текстовые документы, которые связывают диалоги или закадровый текст с информацией о времени, чтобы видеоплеер мог отображать каждую строку в нужный момент. Два наиболее распространённых формата — это SRT (SubRip Text) и WebVTT (Web Video Text Tracks). Оба формата кодируют каждый субтитр как нумерованный блок, содержащий время начала, время окончания и одну или несколько строк текста — а также дополнительные встроенные теги форматирования, такие как <b>, <i> или коды цветов.
Когда вам нужен чистый диалог без метаданных времени — для создания транскрипта, передачи текста в инструмент перевода, обучения языковой модели или просто чтения сценария — файлы субтитров становятся громоздкими. Каждый блок содержит временные метки, номера последовательности и HTML-подобные теги, которые загромождают фактическое содержимое.
Описание инструмента
Этот инструмент удаляет все данные о времени, номера последовательности и встроенные теги форматирования из файлов субтитров SRT и WebVTT, оставляя только чистый текст диалога. Загрузите файл субтитров или вставьте его содержимое напрямую, и инструмент выведет простой текстовый транскрипт, который вы можете скопировать или скачать.
Примеры
Входные данные (SRT):
1
00:00:01,000 --> 00:00:03,500
Hello, <b>world</b>!
2
00:00:05,000 --> 00:00:08,000
This is a subtitle file.Выходные данные:
Hello, world!
This is a subtitle file.Возможности
- Поддержка SRT и VTT: Корректно парсит оба формата SubRip (
.srt) и WebVTT (.vtt) - Удаление встроенных тегов: Удаляет все теги форматирования в стиле HTML (
<b>,<i>,<c.color>, теги временных меток) из текста блоков - Удаление дублирующихся строк: Опциональный флажок для удаления повторяющихся строк — полезно для субтитров, которые повторяют строки в перекрывающихся блоках
- Загрузка файла или вставка текста: Загрузите файл субтитров напрямую или вставьте исходный текст субтитров в редактор
- Скачивание как .txt: Сохраните очищенный транскрипт как простой текстовый файл одним щелчком
Поддерживаемые форматы
- SRT (
.srt) — SubRip Text, наиболее распространённый формат субтитров - WebVTT (
.vtt) — Web Video Text Tracks, стандарт для видео HTML5
Советы
- Включите Удалить дублирующиеся строки при преобразовании субтитров из видео, где одна и та же строка появляется в нескольких последовательных блоках (распространено в караоке или SDH субтитрах).
- Выходные данные сохраняют одну строку на блок субтитров. Если вам нужен транскрипт как один абзац, вставьте выходные данные в любой текстовый редактор и используйте поиск и замену, чтобы заменить разрывы строк на пробелы.