Forensische audio-transcriptie — Nederlandse dialecten
● In productieEen transcriptiedienst voor forensisch audio-materiaal waar Nederlandse dialect- en accentherkenning cruciaal is. De pipeline draait volledig air-gapped op één GPU-server en verwerkt opnames in batch.
De interessante keuze zat in het model. Whisper large-v3 heeft op papier een lagere WER dan large-v2, maar op regionale Nederlandse audio presteerde v2 consistent beter. We hebben v2 vervolgens verder fine-tuned op een Nederlands spraakcorpus — dat bracht de WER op forensisch materiaal nog eens aanzienlijk naar beneden.
Een dashboard laat operators de wachtrij, voortgang en eventuele fouten zien.