[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Content-Type-Header



Hallo!

On 03 Aug 2004 at 09:54 +0200, Patrick Schoenfeld wrote:

> Elmar W. Tischhauser wrote:

> >>Content-Type: text/plain; charset="iso-8859-15:iso-8859-1"

> > Zustimmung, auch wenn das natürlich rein syntaktisch in Ordnung ist.

> nicht ganz - denn wenn ich RFC2045 und 2046 richtig interpretiere
> kann der Mailer nur den gesamten Headervalue quoten, sprich:
> Content-Type: "text/plain; charset=iso-8859-15:iso-8859-1"

Sicher? Im Anhang von RFC 2045, "Collected Grammar", sehe ich Folgendes:

,-----
|  content := "Content-Type" ":" type "/" subtype
|             *(";" parameter)
|  type := discrete-type / composite-type
|  discrete-type := "text" / "image" / "audio" / "video" /
|                   "application" / extension-token
|  subtype := extension-token / iana-token
~

Wenn man sich streng nach dieser Grammatik richtet (und nach dem
Kommentar in RFC 2822, wonach ein "quoted-string" als Atom zu behandeln
ist), wäre eine gemeinsame Quotierung des Content-Types mit allen
Parametern sogar unzulässig. Zudem ...

~ 
|  parameter := attribute "=" value
|  attribute := token
|  value := token / quoted-string
|  token := 1*<any (US-ASCII) CHAR except SPACE, CTLs,
|              or tspecials>
|  tspecials :=  "(" / ")" / "<" / ">" / "@" /
|                "," / ";" / ":" / "\" / <">
|                "/" / "[" / "]" / "?" / "="
|                ; Must be in quoted-string,
|                ; to use within parameter values
|
`-----

... ist hier nur für die "value"-Felder ist ein gequoteter String
explizit vorgesehen. Folglich müssen - meinem Verständnis nach - jene
Parameter entweder gar nicht oder aber einzeln gequotet werden.

> > Aus semantischer Sicht ist allerdings die Angabe mehrerer durch
> > Doppelpunkt getrennter Zeichensätze nicht durch die MIME-RFCs (2045 ff.)
> > gedeckt und sogar vollkommen unsinnig, da ein Text-MIME-Part stets genau
> > in einem Zeichensatz kodiert sein muss.

> Jein. Ich denke der Sinn, der sich hier in der Praxis eingebürgert hat
> (schau dich mal in der Mailingliste um wieviele zwei durch : getrennte
> Charsets angegeben haben) soll sein, dass eine Fallback-Lösung vorhanden
> ist.

Ehrlich gemeinte Frage: Wo ist das standardisiert? Welcher MUA/NUA
wertet das in diesem Sinne aus? Die Angabe mehrerer durch Doppelpunkte
getrennter Zeichensätze habe ich in meinem Archiv dieser ML (von 2002-05
bis heute) nur sehr selten gefunden, und dann war meist (wenn nicht
immer) ein falsch konfigurierter Mutt daran schuld, dessen $send_charset
nicht gestimmt hat oder falsch quotiert war.

Gruß,
Elmar

-- 
[ GnuPG: D8A88C0D / 2407 063C 1C92 90E9 4766 B170 5E95 0D7F D8A8 8C0D ]
·······································································
  An apple a day makes 365 apples a year.

Attachment: pgpGkzueOPuVM.pgp
Description: PGP signature


Reply to: