Gegenereerde ondertitels in ScreenKite zijn op woordniveau. In plaats van één lang ondertitelblok te maken voor een volledige zin of clip, maakt ScreenKite één ondertitelcue per gesproken woord. Dit geeft de editor de timinggegevens die nodig zijn voor korte, Screen Studio-achtige ondertitelonthullingen en nauwkeurige agentworkflows.
Voordat je ondertitels genereert
Open Settings -> Transcription en configureer het tabblad Word-Level:
- Kies Automatic voor de normale setup. ScreenKite gebruikt ElevenLabs wanneer een API-key is geconfigureerd, en valt anders terug op een gedownload WhisperKit-model.
- Kies ElevenLabs wanneer je gehoste Scribe-woordtimings wilt gebruiken.
- Kies Local wanneer je WhisperKit-woordtijdstempels op het apparaat zelf wilt genereren met een gedownload model.
OpenAI, Groq en Azure OpenAI worden niet gebruikt voor de timing van gegenereerde ondertitels. Ze kunnen nog steeds worden geconfigureerd onder Text & Export voor AI-opschoning, proeflezen of expliciete transcriptie-exportworkflows.
ElevenLabs-sleutelvalidatie
Na het invoeren van een API-key onder ElevenLabs, klik je op Test Key om deze te verifiëren. Het resultaat verschijnt inline naast de knop:
| Label | Oorzaak |
|---|---|
| Valid for Speech to Text | De sleutel is geaccepteerd en heeft de vereiste scope. |
| Invalid API key | HTTP 401 — de sleutel is ongeldig, ingetrokken of behoort tot een andere werkruimte. |
| Key needs ElevenLabs Speech to Text permission | HTTP 403 — de sleutel bestaat maar mist de vereiste scope. Open het ElevenLabs-dashboard en werk de scopes van je API-key bij met Speech to Text-toegang. |
| Oranje waarschuwing (bijv. "ElevenLabs rate limit reached. Try again later.") | HTTP 429 — je hebt de ElevenLabs-tarieflimiet (rate limit) bereikt. Wacht een moment en probeer het opnieuw. |
De tarieflimiet en andere tijdelijke meldingen kunnen over meerdere regels lopen — het label klapt verticaal uit om de volledige tekst te tonen.
Ondertitels genereren
- Open een
.skbundle-project in de Projecteditor. - Zorg ervoor dat het project microfoon-, vervangende of hoofdaudio bevat.
- Gebruik de actie voor het genereren van ondertitels in de editor of vraag een agent om ondertitels te genereren.
- ScreenKite transcribeert de audio met de geconfigureerde provider op woordniveau.
- ScreenKite importeert een SRT waarbij elke cue overeenkomt met één gesproken woord.
Het resultaat is een ondertitelspoor dat bestaat uit korte, op het woord getimede clips in plaats van blokken ter grootte van een zin. Als de provider geen spraak retourneert, meldt ScreenKite dat er geen spraak is gedetecteerd. Als de provider alleen zinssegmenten retourneert zonder woordtijdstempels, stopt het genereren van ondertitels in plaats van dat er bij benadering lange ondertitels worden gemaakt.
Agentworkflow
Agents gebruiken hetzelfde ondertitelpad op woordniveau als de app. Een prompt kan zo direct zijn als:
codex "Open ~/Desktop/Recording.skbundle and generate word-level captions from the microphone track"
Voor transcriptiesneden, het opschonen van opvulwoorden of B-roll-planning kan de agent dezelfde woordtijdstempels hergebruiken, zodat sneden en visuele beats uitgelijnd blijven met de spraak.
Om het genereren van ondertitels te starten zonder terminal, gebruik je de ingebouwde AI Chat Assistant — deze heeft toegang tot dezelfde ondertiteltools en vereist alleen een tekstprompt in het chatpaneel.
Gedrag op de tijdlijn
Gegenereerde ondertitels verschijnen op een Captions-spoor op de tijdlijn. Omdat elk woord zijn eigen cue heeft, kun je de timing tot op woordniveau inspecteren en bewerken.
Zie Timeline Tracks voor de basis van spoor-navigatie, en Agentic Video Editing voor workflows voor transcriptiegestuurd bewerken.