[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: traductor de voz a escritura!



El Viernes, 16 de Junio de 2006 01:06, consultores1 escribió:
> Hola
>
> Estoy iniciando un pequeno proyecto y me gustaria hacerlo en Debian.
> El asunto es: 1 microfono direccionable inalambrico de alta fidelidad
> que reciba la voz, en una reunion por ejemplo ; la mande a una laptop
> viejita y la muestre en pantalla como texto; se requiere que funcione en
> varios idiomas.
>

Olvidate de usar un portatil viejito. Sobretodo si quieres que soporte 
varios idiomas a la vez. (De hecho no se si existe algun programa que sea 
capaz de discernir que idioma usa el interlocutor para cambiar el 
diccionario). 


> Es un proyecto para sordos y se realizara como ayuda comunitaria.
> Actualmente, una persona esta a la par del sordo y escribe lo que
> escucha, lo que inmediatamente sirve para saber de que se trata. La otra
> forma es que se usa un microfono directo al aparato en la oreja del
> susodicho, pero esta forma tiene el inconveniente de que hay que pasarse
> el microfono y cuando la cosa se calienta, se olvidan de pasarlo!
>
> Por supuesto que ya aparecieron los lagartos proponiendo
> ViaVoz+Ws+maquinas de $2,500.00: pero me gustaria intentar con Debian y
> por eso les pregunto.
>

Creo que comercialmente disponibles el dragon naturally speaking y el 
viavoice son los dos sistemas de reconocimiento de habla mas avanzados. 
Ninguno de ellos dispnibles en debian. Ambos tienen algo que necesitaras: 
Diccionarios especificos.

En linux tienes sphinx, un buen "motor". No es en si un sistema de 
reconocimiento de habla completo, pero con sphinx3 (por que sphinx4 
necesita java y eso significa mas consumo de recursos) y un vocabulario 
podrias tener el sistema funcionando (el ejecutable para convertir en 
texto lo que llegue por el microfono ya viene de serie).

Tu problema sera el vocabulario (los modelos lexicos y acusticos del 
castellano me imagino que estaran disponibles en alguna parte). Pero un 
vocabulario minimamente extenso (5000-20000 palabras) con palabras 
especificas como las que se usan en las conversaciones en las que piensas 
usarlo, va a ser mas complicado, y seguramente tendreis que crearlo.

Lo del microfono es otro problema. Quieras o no, va a entrar mucho ruido, 
sobretodo si se entra en una discusion acalorada, y eso es matador en los 
sistemas de reconocimiento de habla. El microfono (y la tarjeta de audio) 
son _muy_ importantes. Un sistema ideal usaria un microfono por persona. 
Estilo el parlamento, cuando alguien va a hablar, pulsa su microfono. El 
sistema usa la entrada del resto de microfonos para cancelar el ruido y 
las conversaciones paralelas que puedan producirse. Pero supondre que esto 
es inviable.

> Como no tenemos nada claro, cualquier idea o sugerencia nos vendria muy
> bien.
>

Pasate por la web del proyecto sphinx
http://cmusphinx.sourceforge.net/html/cmusphinx.php

mirate la informacion del tutorial y el resources to buils a system. Mirate 
tambienel manual. Con esto tienes todo lo necesario para montarte tu 
sistema. pero si estas vago...

Tienes perlbox voice http://www.perlbox.org/ que usa sphinx2 para el 
reconocimiento del habla. (aparte de tener otras utilidades) no lo he 
probado.

Ya te aviso que de todas formas vas a tener que entrenarlo mucho.  (y 
entrenarlo es bastante costoso), por que la mayoria de modelos y 
diccionarios que he encontrado son para el ingles.

Saludos
Aritz Beraza [Rei]
-- 
Aritz Beraza Garayalde [Rei]   [http://www.ayanami.es] 
- No enviarás correos en HTML a La Lista.
- No harás top-posting, responderás siempre debajo del mail original.
- No harás Fwd, a La Lista, siempre reply.

Attachment: pgpsznrtz7yV3.pgp
Description: PGP signature


Reply to: