Re: GPU recommandé pour transcription à la volée

To: debian-user-french@lists.debian.org
Subject: Re: GPU recommandé pour transcription à la volée
From: didier gaumet <didier.gaumet@gmail.com>
Date: Wed, 30 Jul 2025 15:02:27 +0200
Message-id: <[🔎] 106d553$9fq$1@ciao.gmane.io>
In-reply-to: <[🔎] 9e243224f7ce8e2bfeb0ffc5cc5c01c61d8d6c11.camel@starynkevitch.net>
References: <fb74e49f-5282-4183-b857-153d32e14b19@infinityyyy.com> <[🔎] 9e243224f7ce8e2bfeb0ffc5cc5c01c61d8d6c11.camel@starynkevitch.net>

Le 30/07/2025 à 09:21, Basile Starynkevitch a écrit :

On Sun, 2025-06-29 at 23:43 +0200, Pierre Estrem wrote:

Bonjour,

Je continue à explorer la reteranscription textuelle depuis une dictée
vocale et autant que possible sans retardement...

[...]

J'ignore si un co-processeur vectoriel spécialisé est véritablement nécessaire
pour un tel logiciel de transcription automatique vocale.  Puisque un signal
sonore (perceptible par un humain)  c'est 44KHz d'échantillonnage (sur un CD
Audio) avec 16 bits par échantillon.  Avec l'âge on entend moins bien mais un
humain même âgé comprend la parole.

16 bits à 44,1kHz (historiquement pour le CD audio commercialisé en1982) est un format d'échantillonnage non-compressé pour la musique.Pour de la parole, en fait les besoins sont encore plus faibles, surtoutavec les codecs modernes.

J'imagine que des techniques dites de réseaux de neurones artificiels sont
pertinents. Une bibliothèque libre en C++ comme https://www.mlpack.org/ ou
comme https://gudhi.inria.fr/index.html (cette dernière étant française) sont
alors utiles, et ne requierent pas de matériel spécialisé.

Mon point de vue est que techniquement c'est accessible par n'importe quel
processeur x86-64 actuel.

[...]

comme Pierre souhaitait une solution avec un temps de latencesupportable en interaction courante (et vraisemblablement une continuitéd'utilisation même en cas de coupure réseau) ça pourrait remettre encause le bien-fondé d'un fonctionnement distribué (fonctionnement duréseau dégradé ou insuffisamment rapide en temps normal), je suppose.

Donc comme apparemment avec une solution locale purement CPU les besoinsde calculs pour la transcription (pas la lecture) audio vers texte sontsuffisants pour créer une latence parfois gênante, ce qui pourraitjustifier l'emploi d'un GPU...

tout ça vu de ma fenêtre avec le coefficient d'erreur qui s'y rapporte,hein, je peux me tromper, je n'ai jamais été confronté à cetteproblématique :-)

Reply to:

References:
- Re: GPU recommandé pour transcription à la volée
  - From: Basile Starynkevitch <basile@starynkevitch.net>

Prev by Date: Re: GPU recommandé pour transcription à la volée
Next by Date: Gros watchpoint dans GDB 16.3
Previous by thread: Re: GPU recommandé pour transcription à la volée
Next by thread: Gros watchpoint dans GDB 16.3
Index(es):
- Date
- Thread