Interpunktion-medvetna uppdelningar
Prioriterar meningsgränser och valfria kommatecken så att ledtrådar läses naturligt på skärmen.
Skapa rena undertexter från tidsstämplar på ordnivå med professionella segmenteringskontroller, exportera sedan polerade SRT eller VTT direkt.
eller klicka för att bläddra från din enhet
[
{"text":"Hello","start":0.12,"end":0.44},
{"text":"everyone,","start":0.44,"end":0.93},
{"text":"welcome.","start":0.93,"end":1.40}
]
// Also supported:
// {"words":[{"word":"Hello","start":120,"end":440}]}
// {"results":{"channels":[{"alternatives":[{"words":[...]}]}]}}
Klistra in tidsstämpel JSON för att validera den före generering. Validatorflaggor saknas start/end fält efter ordindex.
Stöder vanliga ordmatriser från AssemblyAI, utdata i Whisper-stil och kapslade ordobjekt.
Justera radlängd, kölängd, läshastighet, skiljetecken och kögap för att matcha leveransstilen.
Generation körs i webbläsaren. Din uppladdade tidsstämpelfil skickas inte till externa konverterings-API:er.
Prioriterar meningsgränser och valfria kommatecken så att ledtrådar läses naturligt på skärmen.
Tillämpar minsta och maximala cue-varaktighet med konfigurerbara cue-gap för att förhindra kollisioner och blixtar.
Generera rena SRT eller VTT från samma tidsstämpelkälla utan att formatera om manuellt.
Ladda upp JSON där varje ord inkluderar start- och sluttid. Verktyget känner automatiskt av sekunder eller millisekunder.
[{"text":"Hello","start":0.12,"end":0.44}] eller [{"word":"Hi","start":120,"end":360}].
Fynd kapslade words matriser inuti kanaler, alternativ, segment eller resultatobjekt.
Förstår numeriska sekunder, numeriska millisekunder och liknande strängar 00:00:12.340 eller 120ms.
En tidsstämpel på ordnivå länkar varje token till start- och sluttid. Detta är vanligt i Whisper och moderna STT-pipelines.
Varje undertextsignal är byggd från exakt token-timing, inte gissad fras-timing.
Stöder Whisper-stil words matriser och kapslade ASR-utdata från vanliga tal-till-text-leverantörer.
Använd den inbyggda validatorn för att fånga upp saknade timingvärden innan du genererar SRT/VTT-filer.
Rekommenderat lägsta schema för robust undertextgenerering:
[{"text":"Hello","start":0.12,"end":0.44}] var start och end är antingen sekunder eller millisekunder.
word, start_time, end_time, duration, och kapslade words matriser.
Generera undertextfiler redo för redigerare, sociala klipp och långa videor i SRT eller VTT.
Varje ord bör ha text plus tidsfält. Vanliga nycklar är text eller word, med start och end.
Ja. Verktyget stöder direkta ordmatriser och kapslade utdata som inkluderar timing per ord från Whisper och vanliga STT-leverantörer.
Ja. Ställ in "Lines per cue" till 1 och generatorn kommer att hålla varje cue på en enda rad.
Ja. Cue start och slut härleds från ord timings, sedan förfinas med din min/max varaktighet och gap inställningar.
Du kan exportera de genererade undertexterna som SRT eller VTT.