Qu'est-ce que les fichiers de sous-titres ?

Les fichiers de sous-titres sont des documents texte qui associent le dialogue ou la narration à des informations de synchronisation afin qu'un lecteur vidéo puisse afficher chaque ligne au bon moment. Les deux formats les plus courants sont SRT (SubRip Text) et WebVTT (Web Video Text Tracks). Les deux formats codent chaque sous-titre sous la forme d'un indice numéroté contenant une heure de début, une heure de fin et une ou plusieurs lignes de texte — ainsi que des balises de formatage en ligne optionnelles comme <b>, <i> ou des codes de couleur.

Lorsque vous avez besoin du dialogue brut sans métadonnées de synchronisation — pour créer une transcription, alimenter un texte dans un outil de traduction, entraîner un modèle de langage ou simplement parcourir un script — les fichiers de sous-titres deviennent encombrants. Chaque indice inclut des horodatages, des numéros de séquence et des balises de type HTML qui encombrent le contenu réel.

Description de l'outil

Cet outil supprime toutes les données de synchronisation, les numéros de séquence et les balises de formatage en ligne des fichiers de sous-titres SRT et WebVTT, ne laissant que le dialogue propre. Téléchargez un fichier de sous-titres ou collez son contenu directement, et l'outil génère une transcription en texte brut que vous pouvez copier ou télécharger.

Exemples

Entrée (SRT) :

1
00:00:01,000 --> 00:00:03,500
Hello, <b>world</b>!

2
00:00:05,000 --> 00:00:08,000
This is a subtitle file.

Sortie :

Hello, world!
This is a subtitle file.

Fonctionnalités

  • Support SRT et VTT : analyse correctement les formats SubRip (.srt) et WebVTT (.vtt)
  • Suppression des balises en ligne : supprime toutes les balises de formatage de type HTML (<b>, <i>, <c.color>, balises d'horodatage) du texte de l'indice
  • Suppression des lignes en double : case à cocher optionnelle pour dédupliquer les lignes répétées — utile pour les sous-titres qui répètent des lignes sur plusieurs indices qui se chevauchent
  • Téléchargement de fichier ou collage : téléchargez un fichier de sous-titres directement ou collez le texte de sous-titre brut dans l'éditeur
  • Télécharger en tant que .txt : enregistrez la transcription nettoyée en tant que fichier texte brut en un clic

Formats pris en charge

  • SRT (.srt) — SubRip Text, le format de sous-titre le plus courant
  • WebVTT (.vtt) — Web Video Text Tracks, la norme pour la vidéo HTML5

Conseils

  • Activez Supprimer les lignes en double lors de la conversion de sous-titres à partir de vidéos où la même ligne apparaît dans plusieurs indices consécutifs (courant dans les sous-titres karaoké ou SDH).
  • La sortie préserve une ligne par indice de sous-titre. Si vous avez besoin de la transcription sous la forme d'un seul paragraphe, collez la sortie dans n'importe quel éditeur de texte et utilisez la fonction rechercher-remplacer pour remplacer les sauts de ligne par des espaces.