Re: Spracherkennung für Linux
Hallo memala!
^^^^^^
memala@gmx.net schrieb am Freitag, 25. Oktober 2002:
Ein Realname wäre nett...
> ich suche ein Programm zur Spracherkennung (ich spreche einen Text und
> Linux soll den Text erkennen und es in ein Textverarbeitungs Programm
> einfügen ).
Die meisten mir bekannten Programme gehen noch den "umgekehrten" Weg
Text-to-Speech (TTS) (sh. unten).
Ich meine mich aber auch noch an einen Diskussionsbeitrag von Roland
Rosenfeld <roland@spinnaker.de> im Usenet vor etwa 3-4 Jahren erinnern
zu können, der die Thematik der Umwandlung von *akustischen*
Textbeiträgen auf einem Anrufbeantworter unter Linux - via mbrola und
einigen anderen Paketen - in Emails an den Empfänger der
(Sprach-)Nachricht zum Gegenstand hatte. Inwiefern Rolands damalige
grobe "verbale" Vorstellungen nun zum Erfolg geführt haben, entzieht
sich meiner Kenntnis. Vielleicht liest er als "bekennender Debianer" (tm)
ja hier auch (noch) mit und gibt dazu ein Statement ab.
> Für Windows gab es mal so ein Programm mit dem Namen "Dragen Dictate"
> . Das suchen bei Google hat nur ein Kostenpflichtiges Programm von
> IBM geliefert.
>
> Kennt Ihr vielleicht so ein Programm oder könnt Ihr mich auf eine URL
> verweisen wo ich was finde ?
Hier habe ich sowas (noch) nicht implementiert, aber vielleicht
schaust Du Dich mal im Web ein wenig um und suchst nach den Begriffen:
hadifix (Sprachsynthesesystem, das an der Uni Bonn entwickelt wurde)
http://www.ikp.uni-bonn.de/~tpo/Hadifix.html
ftp://asl1.ikp.uni-bonn.de/pub/vm4l/tpwolf95.ps.gz
txt2pho (Wandlung des ASCII-Textes in eine Lautschrift)
mbrola (Synthesizer, der phonetische Daten in Audiostrom wandelt),
http://tcts.fpms.ac.be/synthesis/mbrola.html
siehe auch die Dokumentationen unter:
http://bogmog.sourceforge.net/document_show.php3?doc_id=3
"German Text to Speech with mbrola"
und
http://www.unix-ag.uni-kl.de/~linux/linuxtag99/linux_fuer_blinde/
"Linux für Blinde" mit einer Vorstellung des Forschungsprojekts
'Aranea'
Emacspeak vermag in Zusammenarbeit mit mbrola eine
Sprachausgabefunktion für den Editor Emacs bereitzustellen.
rsynth (Der Klassiker zur Spracherzeugung)
http://packages.debian.org/stable/sound/rsynth.html
festival (Multilinguelles Sprachsynthese-System, das an
'The Centre for Speech Technology Research der
Universität von Edinburgh entwickelt wurde)
http://www.cstr.ed.ac.uk/projects/festival/
Bell-Labs TTS http://www.bell-labs.com/project/tts/
Siehe auch Demonstrationen deutschsprachiger Text-to-Speech (TTS)
Systeme unter:
http://www.kgw.tu-berlin.de/~felixbur/ttsDemos_ger.html
Diese Thematik wurde übrigens auch in einem Beitrag von Michael Renner
<michael.renner@gmx.de> in der Ausgabe 05/2000 des Linux-Magazins, der
noch auf der Website des Verlags einsehbar sein dürfte, behandelt.
Viel Erfolg bei der Umsetzung und vielleicht berichtest Du mal hier
in der Liste über Deine Erfahrungen.
Grüße - Wilhelm
--
(°> Wilhelm Wienemann <Wilhelm.Wienemann@t-online.de> -°) -°)
//\ Grüße vom NiederRhein, der Region mit R(h)einKultur /\\ /\\
V_/_ _\_V _\_V
Reply to: