He estado jugando con Whisper de OpenAI https://openai.com/blog/whisper/ gracias al cuaderno de Google Colab que DotCSV puso a disposición en este video de YouTube: https://www.youtube.com/watch?v= JuMEmF-2FsA&list=PL0z-YLwhf5znzg3ZzzugEsxlmVKWC5bf-
He hecho una transcripción de una entrevista en video en español y el resultado ha sido, digamos, bastante bueno. Tiene muchos errores y necesita mucha limpieza, pero tener una herramienta así es muy, muy prometedor.
Compruébalo aquí: https://umerez.eu/2023/01/04/justicia-en-la.html