[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

vim und Rechtschreibung



Hallo Mitübersetzer,
der Editor vim bietet eine Überprüfung der Rechtschreibung an.
Mir sind dabei in letzter Zeit viele Fehler durch gerutscht.
Dabei waren es hauptsächlich Worte wie "standardmäßig", die
mit »ß« geschrieben werden, die die Korrektur aber auch in der
falschen Schreibweise mit »ss« nicht moniert hat.

Standardmäßig wird für deutsche Texte in UTF-8-Kodierung
die Datei »~/.vim/spell/de.utf-8.spl« verwendet. Ist sie nicht
vorhanden, bietet vim an, sie von der folgenden Adresse zu laden.
https://ftp.nluug.nl/pub/vim/runtime/spell/de.utf-8.spl
Mit diesem Wörterbuch werden aber die »ss« akzeptiert.

Nun kann man im vim auch Wörterbücher von hunspell importieren.
Die bestehen aus zwei Komponenten. In einer »*.dic«-Datei sind
in Klartext zeilenweise Worte sowie Attribute gelistet. Die Worte sind
quasi der Stamm und die Attribute beschreiben erlaubte Varianten.
Diese Varianten sind in der dazugehörigen »*.aff«-Datei angegeben und
beschreiben beispielsweise, wie die Mehrzahl konstruiert ist. Damit
wird, zumindest für hunspell, aus einem gültigen Wortstamm ein gültiger
Wortbaum.

Unter vim kann man mit dem Befehl mkspell aus den Dateien für hunspell
ein für vim passendes Wörterbuch erzeugen.

Zumindest bei mir sind Wörterbücher unter »/usr/share/hunspell« zu finden.  
Wozu also woanders suchen?
Darin sind allerdings einige Worte doppelt, die man eliminieren muss.
Ansonsten funktioniert mkspell nicht. Worauf ich allerdings nicht
gefasst war: in dem Wörterbuch findet man »Uhrlaub«, »Uhroma« und »Uhrwald«.
Das ist mit natürlich nicht sofort aufgefallen.

Daraufhin habe ich mich auf die Suche nach alternativen Quellen gemacht.
Letztendlich habe ich die Dateien »de_DE.dic« und »de_DE.aff« von
https://github.com/elastic/hunspell/tree/master/dicts
geladen. In denen habe ich keine doppelten Worte festgestellt. Die
Erzeugung von »de.utf-8.spl« hat problemlos funktioniert.

Lange Rede - kurzer Sinn:
Bei Wörterbüchern muss man auf alles gefasst sein. Das sind nun etwas
mehr Zeilen geworden als erst gedacht. Vielleicht ist der
Erfahrungsbericht zumindest amüsant, vielleicht sogar hilfreich :-).

Ich hoffe für mich, dass meine Beiträge dadurch qualitativ weniger
schlecht werden. Das war ja das eigentliche Ziel der Übung.

Viele Grüße,
Christoph
-- 
Ist die Katze gesund
schmeckt sie dem Hund.

Attachment: signature.asc
Description: PGP signature


Reply to: