[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: traductor de voz a escritura!



El Viernes, 16 de Junio de 2006 9:48 AM, consultores1 escribió:
> El Viernes, 16 de Junio de 2006 3:22 AM, Aritz Beraza Garayalde [Rei]
>
> escribió:
> > El Viernes, 16 de Junio de 2006 01:06, consultores1 escribió:
> > > Hola
> > >
> > > Estoy iniciando un pequeno proyecto y me gustaria hacerlo en Debian.
> > > El asunto es: 1 microfono direccionable inalambrico de alta fidelidad
> > > que reciba la voz, en una reunion por ejemplo ; la mande a una laptop
> > > viejita y la muestre en pantalla como texto; se requiere que funcione
> > > en varios idiomas.
> >
> > Olvidate de usar un portatil viejito. Sobretodo si quieres que soporte
> > varios idiomas a la vez. (De hecho no se si existe algun programa que sea
> > capaz de discernir que idioma usa el interlocutor para cambiar el
> > diccionario).
> >
> > > Es un proyecto para sordos y se realizara como ayuda comunitaria.
> > > Actualmente, una persona esta a la par del sordo y escribe lo que
> > > escucha, lo que inmediatamente sirve para saber de que se trata. La
> > > otra forma es que se usa un microfono directo al aparato en la oreja
> > > del susodicho, pero esta forma tiene el inconveniente de que hay que
> > > pasarse el microfono y cuando la cosa se calienta, se olvidan de
> > > pasarlo!
> > >
> > > Por supuesto que ya aparecieron los lagartos proponiendo
> > > ViaVoz+Ws+maquinas de $2,500.00: pero me gustaria intentar con Debian y
> > > por eso les pregunto.
> >
> > Creo que comercialmente disponibles el dragon naturally speaking y el
> > viavoice son los dos sistemas de reconocimiento de habla mas avanzados.
> > Ninguno de ellos dispnibles en debian. Ambos tienen algo que necesitaras:
> > Diccionarios especificos.
> >
> > En linux tienes sphinx, un buen "motor". No es en si un sistema de
> > reconocimiento de habla completo, pero con sphinx3 (por que sphinx4
> > necesita java y eso significa mas consumo de recursos) y un vocabulario
> > podrias tener el sistema funcionando (el ejecutable para convertir en
> > texto lo que llegue por el microfono ya viene de serie).
> >
> > Tu problema sera el vocabulario (los modelos lexicos y acusticos del
> > castellano me imagino que estaran disponibles en alguna parte). Pero un
> > vocabulario minimamente extenso (5000-20000 palabras) con palabras
> > especificas como las que se usan en las conversaciones en las que piensas
> > usarlo, va a ser mas complicado, y seguramente tendreis que crearlo.
> >
> > Lo del microfono es otro problema. Quieras o no, va a entrar mucho ruido,
> > sobretodo si se entra en una discusion acalorada, y eso es matador en los
> > sistemas de reconocimiento de habla. El microfono (y la tarjeta de audio)
> > son _muy_ importantes. Un sistema ideal usaria un microfono por persona.
> > Estilo el parlamento, cuando alguien va a hablar, pulsa su microfono. El
> > sistema usa la entrada del resto de microfonos para cancelar el ruido y
> > las conversaciones paralelas que puedan producirse. Pero supondre que
> > esto es inviable.
> >
> > > Como no tenemos nada claro, cualquier idea o sugerencia nos vendria muy
> > > bien.
> >
> > Pasate por la web del proyecto sphinx
> > http://cmusphinx.sourceforge.net/html/cmusphinx.php
> >
> > mirate la informacion del tutorial y el resources to buils a system.
> > Mirate tambienel manual. Con esto tienes todo lo necesario para montarte
> > tu sistema. pero si estas vago...
> >
> > Tienes perlbox voice http://www.perlbox.org/ que usa sphinx2 para el
> > reconocimiento del habla. (aparte de tener otras utilidades) no lo he
> > probado.
> >
> > Ya te aviso que de todas formas vas a tener que entrenarlo mucho.  (y
> > entrenarlo es bastante costoso), por que la mayoria de modelos y
> > diccionarios que he encontrado son para el ingles.
> >
> > Saludos
> > Aritz Beraza [Rei]
>
> Infinitas gracias Aritz, por responder, segun lo que dices, se puede
> realizar, luego te cuento.
>
> hasta pronto.

Hola Aritz y a todos.

He investigado un poco y solamente he encontrado trabajos muy buenos basados 
en la informacion que me distes, orientados a convertir texto a voz. (KMouth, 
KSayit, Kttsmgr y otros) Agrego, que los programas citados estan en Etch.

Me llama la atencion que no encuentro nada terminado para convertir voz a 
texto! Sabe alguien, cual podria ser la dificultad?

Yo no se mucho de esto, pero segun veo, seria de grabar la voz y convertirla 
en texto.  Gracias anticipadas, se agradece cualquier informacion.
 



Reply to: