[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Reconnaissance vocale et transcription avec Whisper



Bonjour,

Il y a quelques semaines <mailto:lnpcrd@gmail.com> nous faisait connaître le projet Whisper.cpp pour réaliser de la reconnaissance vocale vers texte :
https://github.com/ggml-org/whisper.cpp
)Je suppose que le projet dessus correspond à du binaire (codage en c++).

Une version Python fonctionne bien en passant un fichier audio mais même en mode turbo il est illusoire de faire une transcription en temps réel :
https://www.abonnel.fr/journal_geek/2023/20230126-whisper-retranscription-et-traduction

On trouve une version Python pour faire de la transcription "temps réel" pâr exemple ici :
https://www.tecmint.com/whisper-ai-audio-transcription-on-linux/
Je rencontre des erreurs.
Notalmment je me demande comment spécifier mon microphone USB qui selon, est le device "hw:0,0" "hw:1,0" ou "hw:2,0"...
Avez-vous réussi de votre côté ?

Le sujet est passionnant, à fortiori pour moi puisque étant déficient visuel je fais quelques développements pour cette communauté.*

Cordialement
--
Pierre Estrem


Reply to: