Hallo Mitübersetzer, der Editor vim bietet eine Überprüfung der Rechtschreibung an. Mir sind dabei in letzter Zeit viele Fehler durch gerutscht. Dabei waren es hauptsächlich Worte wie "standardmäßig", die mit »ß« geschrieben werden, die die Korrektur aber auch in der falschen Schreibweise mit »ss« nicht moniert hat. Standardmäßig wird für deutsche Texte in UTF-8-Kodierung die Datei »~/.vim/spell/de.utf-8.spl« verwendet. Ist sie nicht vorhanden, bietet vim an, sie von der folgenden Adresse zu laden. https://ftp.nluug.nl/pub/vim/runtime/spell/de.utf-8.spl Mit diesem Wörterbuch werden aber die »ss« akzeptiert. Nun kann man im vim auch Wörterbücher von hunspell importieren. Die bestehen aus zwei Komponenten. In einer »*.dic«-Datei sind in Klartext zeilenweise Worte sowie Attribute gelistet. Die Worte sind quasi der Stamm und die Attribute beschreiben erlaubte Varianten. Diese Varianten sind in der dazugehörigen »*.aff«-Datei angegeben und beschreiben beispielsweise, wie die Mehrzahl konstruiert ist. Damit wird, zumindest für hunspell, aus einem gültigen Wortstamm ein gültiger Wortbaum. Unter vim kann man mit dem Befehl mkspell aus den Dateien für hunspell ein für vim passendes Wörterbuch erzeugen. Zumindest bei mir sind Wörterbücher unter »/usr/share/hunspell« zu finden. Wozu also woanders suchen? Darin sind allerdings einige Worte doppelt, die man eliminieren muss. Ansonsten funktioniert mkspell nicht. Worauf ich allerdings nicht gefasst war: in dem Wörterbuch findet man »Uhrlaub«, »Uhroma« und »Uhrwald«. Das ist mit natürlich nicht sofort aufgefallen. Daraufhin habe ich mich auf die Suche nach alternativen Quellen gemacht. Letztendlich habe ich die Dateien »de_DE.dic« und »de_DE.aff« von https://github.com/elastic/hunspell/tree/master/dicts geladen. In denen habe ich keine doppelten Worte festgestellt. Die Erzeugung von »de.utf-8.spl« hat problemlos funktioniert. Lange Rede - kurzer Sinn: Bei Wörterbüchern muss man auf alles gefasst sein. Das sind nun etwas mehr Zeilen geworden als erst gedacht. Vielleicht ist der Erfahrungsbericht zumindest amüsant, vielleicht sogar hilfreich :-). Ich hoffe für mich, dass meine Beiträge dadurch qualitativ weniger schlecht werden. Das war ja das eigentliche Ziel der Übung. Viele Grüße, Christoph -- Ist die Katze gesund schmeckt sie dem Hund.
Attachment:
signature.asc
Description: PGP signature