[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: perl Regexp für printable Unicode Characters



Hallo Marc,

31.10.2024 18:56:07 Marc Haber <mh+debian-user-german@zugschlus.de>:

[..]
> Dazu brauche ich einen Regulären Ausdruck für alle sinnvollen Zeichen,
> die in einem Unix-Pfad auftauchen können. Ich weiß, dass formal alles
> außer \0x0 auftauchen darf, aber Steuerzeichen, Unprintables und
> Invisibles möchte ich doch gerne ausschließen.
>
> Die Testsuite von adduser testen wir zum Beispiel die Erzeugung von
> /home/ÿar und /home/ʙɄȘ˳, und ich möchte gerne eine _positive_ Character
> Class verwenden. Ja, auch Emojis in Usernamen sollten funktionieren.
>
> Aktuell verwende ich
>
> qr/[-_\.+!\$%&()\]\[;0-9a-zA-Z\/{}>*'@]*/
>
> Aber das reicht offensichtlich nicht.
>
> Wie drücke ich das in perl aus? Wie eklig wird das?

Ein erster (defensiver) Stupser:
====
use v5.14;
# ...
qr/[\w\d\.+!\$%&()\]\[;\/{}>*'@_-]+/aai;
====

da fehlt ggfs. noch was ;) RTFM: 'perldoc perlre', Abschnitt "Modifiers",
(bes. "Character set modifiers"), Abschnitt
"Regular Expressions" (bes. "Escape sequences"
und "Character Classes and other Special Escapes")
sowie 'perldoc perlrecharclass'.

HTH,
-dnh


Reply to: