Reconnaissance vocale et transcription avec Whisper
Bonjour,
Il y a quelques semaines <mailto:lnpcrd@gmail.com> nous faisait
connaître le projet Whisper.cpp pour réaliser de la reconnaissance
vocale vers texte :
https://github.com/ggml-org/whisper.cpp
)Je suppose que le projet dessus correspond à du binaire (codage en c++).
Une version Python fonctionne bien en passant un fichier audio mais même
en mode turbo il est illusoire de faire une transcription en temps réel :
https://www.abonnel.fr/journal_geek/2023/20230126-whisper-retranscription-et-traduction
On trouve une version Python pour faire de la transcription "temps réel"
pâr exemple ici :
https://www.tecmint.com/whisper-ai-audio-transcription-on-linux/
Je rencontre des erreurs.
Notalmment je me demande comment spécifier mon microphone USB qui selon,
est le device "hw:0,0" "hw:1,0" ou "hw:2,0"...
Avez-vous réussi de votre côté ?
Le sujet est passionnant, à fortiori pour moi puisque étant déficient
visuel je fais quelques développements pour cette communauté.*
Cordialement
--
Pierre Estrem
Reply to: