Что такое файлы субтитров?

Файлы субтитров — это текстовые документы, которые связывают диалоги или закадровый текст с информацией о времени, чтобы видеоплеер мог отображать каждую строку в нужный момент. Два наиболее распространённых формата — это SRT (SubRip Text) и WebVTT (Web Video Text Tracks). Оба формата кодируют каждый субтитр как нумерованный блок, содержащий время начала, время окончания и одну или несколько строк текста — а также дополнительные встроенные теги форматирования, такие как <b>, <i> или коды цветов.

Когда вам нужен чистый диалог без метаданных времени — для создания транскрипта, передачи текста в инструмент перевода, обучения языковой модели или просто чтения сценария — файлы субтитров становятся громоздкими. Каждый блок содержит временные метки, номера последовательности и HTML-подобные теги, которые загромождают фактическое содержимое.

Описание инструмента

Этот инструмент удаляет все данные о времени, номера последовательности и встроенные теги форматирования из файлов субтитров SRT и WebVTT, оставляя только чистый текст диалога. Загрузите файл субтитров или вставьте его содержимое напрямую, и инструмент выведет простой текстовый транскрипт, который вы можете скопировать или скачать.

Примеры

Входные данные (SRT):

1
00:00:01,000 --> 00:00:03,500
Hello, <b>world</b>!

2
00:00:05,000 --> 00:00:08,000
This is a subtitle file.

Выходные данные:

Hello, world!
This is a subtitle file.

Возможности

  • Поддержка SRT и VTT: Корректно парсит оба формата SubRip (.srt) и WebVTT (.vtt)
  • Удаление встроенных тегов: Удаляет все теги форматирования в стиле HTML (<b>, <i>, <c.color>, теги временных меток) из текста блоков
  • Удаление дублирующихся строк: Опциональный флажок для удаления повторяющихся строк — полезно для субтитров, которые повторяют строки в перекрывающихся блоках
  • Загрузка файла или вставка текста: Загрузите файл субтитров напрямую или вставьте исходный текст субтитров в редактор
  • Скачивание как .txt: Сохраните очищенный транскрипт как простой текстовый файл одним щелчком

Поддерживаемые форматы

  • SRT (.srt) — SubRip Text, наиболее распространённый формат субтитров
  • WebVTT (.vtt) — Web Video Text Tracks, стандарт для видео HTML5

Советы

  • Включите Удалить дублирующиеся строки при преобразовании субтитров из видео, где одна и та же строка появляется в нескольких последовательных блоках (распространено в караоке или SDH субтитрах).
  • Выходные данные сохраняют одну строку на блок субтитров. Если вам нужен транскрипт как один абзац, вставьте выходные данные в любой текстовый редактор и используйте поиск и замену, чтобы заменить разрывы строк на пробелы.