Undertextkonverterare till text
Extrahera vanlig text från SRT- och WebVTT-undertextfiler genom att ta bort alla tidsstämplar, sekvensnummer och formateringsmetadata.
Inmatning
Utdata
Readme
Vad är undertextfiler?
Undertextfiler är textdokument som kopplar dialog eller berättarröst till tidsinformation så att en videospelare kan visa varje rad vid rätt tidpunkt. De två vanligaste formaten är SRT (SubRip Text) och WebVTT (Web Video Text Tracks). Båda formaten kodar varje undertext som en numrerad cue som innehåller en starttid, en sluttid och en eller flera textrader — tillsammans med valfria inline-formateringstaggar som <b>, <i> eller färgkoder.
När du behöver den rena dialogen utan tidsinformation — för att skapa en transkription, mata text till ett översättningsverktyg, träna en språkmodell eller helt enkelt läsa igenom ett manus — blir undertextfiler opraktiska. Varje cue innehåller tidsstämplar, sekvensnummer och HTML-liknande taggar som skymmer det faktiska innehållet.
Verktygsbeskrivning
Det här verktyget tar bort all tidsinformation, sekvensnummer och inline-formateringstaggar från SRT- och WebVTT-undertextfiler, vilket lämnar endast den rena dialogen. Ladda upp en undertextfil eller klistra in dess innehål direkt, och verktyget matar ut en vanlig texttranskription som du kan kopiera eller ladda ned.
Exempel
Inmatning (SRT):
1
00:00:01,000 --> 00:00:03,500
Hello, <b>world</b>!
2
00:00:05,000 --> 00:00:08,000
This is a subtitle file.Utmatning:
Hello, world!
This is a subtitle file.Funktioner
- SRT- och VTT-stöd: Tolkar både SubRip (
.srt) och WebVTT (.vtt) format korrekt - Borttagning av inline-taggar: Tar bort alla HTML-liknande formateringstaggar (
<b>,<i>,<c.color>, tidsstämpeltaggar) från cue-text - Borttagning av duplicerade rader: Valfri kryssruta för att ta bort duplicerade rader — användbar för undertexter som upprepar rader över överlappande cues
- Filöverföring eller inklistring: Ladda upp en undertextfil direkt eller klistra in den rå undertexten i redigeraren
- Ladda ned som .txt: Spara den rensade transkriptionen som en vanlig textfil med ett klick
Stödda format
- SRT (
.srt) — SubRip Text, det vanligaste undertextformatet - WebVTT (
.vtt) — Web Video Text Tracks, standarden för HTML5-video
Tips
- Aktivera Ta bort duplicerade rader när du konverterar undertexter från videor där samma rad visas i flera på varandra följande cues (vanligt i karaoke- eller SDH-undertexter).
- Utmatningen bevarar en rad per undertextcue. Om du behöver transkriptionen som ett enda stycke klistrar du in utmatningen i valfri textredigerare och använder sök-och-ersätt för att byta radbrytningar mot mellanslag.