Bug#214107: locales: en_US.UTF-8 treats [ as a space char

To: Colin Watson <cjwatson@debian.org>, 214107@bugs.debian.org
Cc: GOTO Masanori <gotom@debian.or.jp>, Petter Reinholdtsen <pere@hungry.com>
Subject: Bug#214107: locales: en_US.UTF-8 treats [ as a space char
From: GOTO Masanori <gotom@debian.or.jp>
Date: Tue, 04 Nov 2003 13:06:42 +0900
Message-id: <[🔎] 80ptg893ql.wl@oris.opensource.jp>
Reply-to: GOTO Masanori <gotom@debian.or.jp>, 214107@bugs.debian.org
In-reply-to: <[🔎] 20031103172412.GE8331@riva.ucam.org>
References: <[🔎] E1AFtz1-0001z0-00@saruman.uio.no> <[🔎] 80vfq18n6e.wl@oris.opensource.jp> <[🔎] 20031103172412.GE8331@riva.ucam.org>

At Mon, 3 Nov 2003 17:24:12 +0000,
Colin Watson wrote:
> On Tue, Nov 04, 2003 at 12:52:09AM +0900, GOTO Masanori wrote:
> > With 2.3.2.ds1-9,
> > 
> > 	$ echo '[' | LANG=C egrep '[[:space:]]+$'
> > 	$ echo '[' | LANG=C egrep '^[^[:space:]]+$'
> > 	[
> > 
> > Why don't you use [[:space:]] instead of ^[^[, or am I missing?
> 
> '^[^[:space:]]+$' breaks down to:
> 
>   ^                start of line
>   [^[:space:]]+    one or more non-whitespace characters
>   $                end of line
> 
> '[^[:space:]]' is the opposite of '[[:space:]]'.

Ah!  Thanks, Colin.
It seems UTF-8 regex is broken.

Regards,
-- gotom

Reply to:

References:
- Bug#214107: locales: en_US.UTF-8 treats [ as a space char
  - From: Petter Reinholdtsen <pere@hungry.com>
- Bug#214107: locales: en_US.UTF-8 treats [ as a space char
  - From: GOTO Masanori <gotom@debian.or.jp>
- Bug#214107: locales: en_US.UTF-8 treats [ as a space char
  - From: Colin Watson <cjwatson@debian.org>

Prev by Date: Bug#217889: libc6-dev should conflict with old versions of binutils
Next by Date: cvs commit to glibc-package/debian by gotom
Previous by thread: Bug#214107: locales: en_US.UTF-8 treats [ as a space char
Next by thread: glibc 2.3.2.ds1-8 in sid?? (not experimental)
Index(es):
- Date
- Thread