El Viernes, 16 de Junio de 2006 01:06, consultores1 escribió: > Hola > > Estoy iniciando un pequeno proyecto y me gustaria hacerlo en Debian. > El asunto es: 1 microfono direccionable inalambrico de alta fidelidad > que reciba la voz, en una reunion por ejemplo ; la mande a una laptop > viejita y la muestre en pantalla como texto; se requiere que funcione en > varios idiomas. > Olvidate de usar un portatil viejito. Sobretodo si quieres que soporte varios idiomas a la vez. (De hecho no se si existe algun programa que sea capaz de discernir que idioma usa el interlocutor para cambiar el diccionario). > Es un proyecto para sordos y se realizara como ayuda comunitaria. > Actualmente, una persona esta a la par del sordo y escribe lo que > escucha, lo que inmediatamente sirve para saber de que se trata. La otra > forma es que se usa un microfono directo al aparato en la oreja del > susodicho, pero esta forma tiene el inconveniente de que hay que pasarse > el microfono y cuando la cosa se calienta, se olvidan de pasarlo! > > Por supuesto que ya aparecieron los lagartos proponiendo > ViaVoz+Ws+maquinas de $2,500.00: pero me gustaria intentar con Debian y > por eso les pregunto. > Creo que comercialmente disponibles el dragon naturally speaking y el viavoice son los dos sistemas de reconocimiento de habla mas avanzados. Ninguno de ellos dispnibles en debian. Ambos tienen algo que necesitaras: Diccionarios especificos. En linux tienes sphinx, un buen "motor". No es en si un sistema de reconocimiento de habla completo, pero con sphinx3 (por que sphinx4 necesita java y eso significa mas consumo de recursos) y un vocabulario podrias tener el sistema funcionando (el ejecutable para convertir en texto lo que llegue por el microfono ya viene de serie). Tu problema sera el vocabulario (los modelos lexicos y acusticos del castellano me imagino que estaran disponibles en alguna parte). Pero un vocabulario minimamente extenso (5000-20000 palabras) con palabras especificas como las que se usan en las conversaciones en las que piensas usarlo, va a ser mas complicado, y seguramente tendreis que crearlo. Lo del microfono es otro problema. Quieras o no, va a entrar mucho ruido, sobretodo si se entra en una discusion acalorada, y eso es matador en los sistemas de reconocimiento de habla. El microfono (y la tarjeta de audio) son _muy_ importantes. Un sistema ideal usaria un microfono por persona. Estilo el parlamento, cuando alguien va a hablar, pulsa su microfono. El sistema usa la entrada del resto de microfonos para cancelar el ruido y las conversaciones paralelas que puedan producirse. Pero supondre que esto es inviable. > Como no tenemos nada claro, cualquier idea o sugerencia nos vendria muy > bien. > Pasate por la web del proyecto sphinx http://cmusphinx.sourceforge.net/html/cmusphinx.php mirate la informacion del tutorial y el resources to buils a system. Mirate tambienel manual. Con esto tienes todo lo necesario para montarte tu sistema. pero si estas vago... Tienes perlbox voice http://www.perlbox.org/ que usa sphinx2 para el reconocimiento del habla. (aparte de tener otras utilidades) no lo he probado. Ya te aviso que de todas formas vas a tener que entrenarlo mucho. (y entrenarlo es bastante costoso), por que la mayoria de modelos y diccionarios que he encontrado son para el ingles. Saludos Aritz Beraza [Rei] -- Aritz Beraza Garayalde [Rei] [http://www.ayanami.es] - No enviarás correos en HTML a La Lista. - No harás top-posting, responderás siempre debajo del mail original. - No harás Fwd, a La Lista, siempre reply.
Attachment:
pgpsznrtz7yV3.pgp
Description: PGP signature