[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: traductor de voz a escritura!



El Viernes, 16 de Junio de 2006 3:22 AM, Aritz Beraza Garayalde [Rei] 
escribió:
> El Viernes, 16 de Junio de 2006 01:06, consultores1 escribió:
> > Hola
> >
> > Estoy iniciando un pequeno proyecto y me gustaria hacerlo en Debian.
> > El asunto es: 1 microfono direccionable inalambrico de alta fidelidad
> > que reciba la voz, en una reunion por ejemplo ; la mande a una laptop
> > viejita y la muestre en pantalla como texto; se requiere que funcione en
> > varios idiomas.
>
> Olvidate de usar un portatil viejito. Sobretodo si quieres que soporte
> varios idiomas a la vez. (De hecho no se si existe algun programa que sea
> capaz de discernir que idioma usa el interlocutor para cambiar el
> diccionario).
>
> > Es un proyecto para sordos y se realizara como ayuda comunitaria.
> > Actualmente, una persona esta a la par del sordo y escribe lo que
> > escucha, lo que inmediatamente sirve para saber de que se trata. La otra
> > forma es que se usa un microfono directo al aparato en la oreja del
> > susodicho, pero esta forma tiene el inconveniente de que hay que pasarse
> > el microfono y cuando la cosa se calienta, se olvidan de pasarlo!
> >
> > Por supuesto que ya aparecieron los lagartos proponiendo
> > ViaVoz+Ws+maquinas de $2,500.00: pero me gustaria intentar con Debian y
> > por eso les pregunto.
>
> Creo que comercialmente disponibles el dragon naturally speaking y el
> viavoice son los dos sistemas de reconocimiento de habla mas avanzados.
> Ninguno de ellos dispnibles en debian. Ambos tienen algo que necesitaras:
> Diccionarios especificos.
>
> En linux tienes sphinx, un buen "motor". No es en si un sistema de
> reconocimiento de habla completo, pero con sphinx3 (por que sphinx4
> necesita java y eso significa mas consumo de recursos) y un vocabulario
> podrias tener el sistema funcionando (el ejecutable para convertir en
> texto lo que llegue por el microfono ya viene de serie).
>
> Tu problema sera el vocabulario (los modelos lexicos y acusticos del
> castellano me imagino que estaran disponibles en alguna parte). Pero un
> vocabulario minimamente extenso (5000-20000 palabras) con palabras
> especificas como las que se usan en las conversaciones en las que piensas
> usarlo, va a ser mas complicado, y seguramente tendreis que crearlo.
>
> Lo del microfono es otro problema. Quieras o no, va a entrar mucho ruido,
> sobretodo si se entra en una discusion acalorada, y eso es matador en los
> sistemas de reconocimiento de habla. El microfono (y la tarjeta de audio)
> son _muy_ importantes. Un sistema ideal usaria un microfono por persona.
> Estilo el parlamento, cuando alguien va a hablar, pulsa su microfono. El
> sistema usa la entrada del resto de microfonos para cancelar el ruido y
> las conversaciones paralelas que puedan producirse. Pero supondre que esto
> es inviable.
>
> > Como no tenemos nada claro, cualquier idea o sugerencia nos vendria muy
> > bien.
>
> Pasate por la web del proyecto sphinx
> http://cmusphinx.sourceforge.net/html/cmusphinx.php
>
> mirate la informacion del tutorial y el resources to buils a system. Mirate
> tambienel manual. Con esto tienes todo lo necesario para montarte tu
> sistema. pero si estas vago...
>
> Tienes perlbox voice http://www.perlbox.org/ que usa sphinx2 para el
> reconocimiento del habla. (aparte de tener otras utilidades) no lo he
> probado.
>
> Ya te aviso que de todas formas vas a tener que entrenarlo mucho.  (y
> entrenarlo es bastante costoso), por que la mayoria de modelos y
> diccionarios que he encontrado son para el ingles.
>
> Saludos
> Aritz Beraza [Rei]

Infinitas gracias Aritz, por responder, segun lo que dices, se puede realizar, 
luego te cuento.

hasta pronto.



Reply to: