字幕ファイルとは?

字幕ファイルは、ビデオプレーヤーが各行を正確なタイミングで表示できるように、セリフまたはナレーションにタイミング情報を付与したテキストドキュメントです。最も一般的な2つの形式は、SRT(SubRip Text)とWebVTT(Web Video Text Tracks)です。どちらの形式も、各字幕を開始時刻、終了時刻、1行以上のテキストを含むナンバリングされたキューとしてエンコードします。また、<b><i>、またはカラーコードなどのオプションのインラインフォーマットタグも含まれます。

タイムスタンプメタデータなしの生のセリフが必要な場合(トランスクリプト作成、テキストを翻訳ツールに入力、言語モデルの学習、またはスクリプトの読み込みなど)、字幕ファイルは扱いにくくなります。すべてのキューにはタイムスタンプ、シーケンス番号、HTMLのようなタグが含まれており、実際のコンテンツが見づらくなります。

ツール説明

このツールは、SRTおよびWebVTT字幕ファイルからすべてのタイミングデータ、シーケンス番号、インラインフォーマットタグを削除し、クリーンなセリフテキストのみを残します。字幕ファイルをアップロードするか、その内容を直接貼り付けると、ツールはコピーまたはダウンロードできるプレーンテキストトランスクリプトを出力します。

入力(SRT):

1
00:00:01,000 --> 00:00:03,500
Hello, <b>world</b>!

2
00:00:05,000 --> 00:00:08,000
This is a subtitle file.

出力:

Hello, world!
This is a subtitle file.

機能

  • SRTおよびVTTサポート: SubRip(.srt)およびWebVTT(.vtt)形式の両方を正しく解析します
  • インラインタグ削除: キューテキストからすべてのHTMLスタイルのフォーマットタグ(<b><i><c.color>、タイムスタンプタグ)を削除します
  • 重複行削除: 繰り返される行を重複排除するオプションチェックボックス — 重複するキューにわたって行が繰り返される字幕に便利です
  • ファイルアップロードまたは貼り付け: 字幕ファイルを直接アップロードするか、生の字幕テキストをエディタに貼り付けます
  • .txtでダウンロード: クリーンなトランスクリプトをプレーンテキストファイルとして1クリックで保存します

サポートされている形式

  • SRT(.srt)— SubRip Text、最も一般的な字幕形式
  • WebVTT(.vtt)— Web Video Text Tracks、HTML5ビデオの標準

ヒント

  • ビデオから字幕を変換する場合、同じ行が複数の連続したキューに表示される場合(カラオケまたはSDH字幕で一般的)は、重複行を削除を有効にします。
  • 出力は字幕キューごとに1行を保持します。トランスクリプトを単一の段落として必要な場合は、出力をテキストエディタに貼り付けて、検索と置換を使用して改行をスペースに置き換えます。