[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Keine Umlaute



On 16.06.06 22:07:09, Thomas Halinka wrote:
> Andreas Pakulat schrieb:
> xxxx@yyyyy:~$ file -i heise.rdf
> heise.rdf:
> xxxx@yyyyy:~$

Hmm, ja hier genauso :-(

> xxxx@yyyyy:~$ head -1 heise.rdf
> <?xml version="1.0" encoding="utf-8"?>
> xxxx@yyyy:~$

Das stimmt allerdings. Vllt. macht die Funktion die fuer dich das rss
abholt und parst da noch was. Du koenntest mal mit nem Hexeditor in die
HTML-Datei die du am Client bekommst (mit wget
http://deinserver/deinphp.php holen) reinschauen. Wenn dort an Stellen
wo ein Umlaut steht 2 Bytes zu sehen sind ist die HTML-Datei UTF-8
kodiert, wenn nicht ist sie latin1/9 (also iso-8859-1 oder -15) kodiert.

> Jedoch tuts im FF nur wenn ich ich als Zeichen ISO-8859-1(5)

Dann ist stark anzunehmen dass das fetch_rss eine Umkodierung vornimmt.

> Ich sagt doch, unter den Seiteneigenschaften. Sorry, aber wenn du als
> 
> >Webserver-Betreiber nicht mal so grundlegende Dinge weisst bin ich auch
> >zu faul extra FF zu starten.
> >
> >  
> Ich bin kein Webseitenbetreiber sondern will einfach n Apache auf einer 
> Maschine zum Laufen kriegen :-)

Lies nochmal, es geht um Webserver Betreiber und so einer bist du sobald
du eine Website online stellst. Insbesondere wenn du Admin auf dem
Rechner bist. Da muss man halt etwas Zeit investieren und sich in die
Dinge einarbeiten, sonst kommt am Ende nur Muell raus. Oder noch
schlimmer ein Server der von jedermann als Spam-Schleuder oder fuer
Angiffe auf wichtigere Server benutzt werden kann.

> >>>Genau das letztere. Das was du betreibst erhoeht nicht nur den Traffic von 
> >>>murphy, sondern bedeutet auch mehr Arbeit fuer die Leute die dir antworten. 
> >>>Und wenn das beim naechsten Mal immernoch nicht besser ist,werde ich mir den 
> >>>Aufwand nicht mehr antun.
> >>>Andreas
> Werd mich in Zulunft kürzer fassen.

Ja sieht schon viel besser aus. Nimms mir nicht uebel aber den ganzen
Kram immer wegzuloeschen faellt mir halt doch ziemlich auf die Nerven...

> Also wenn ich unter Windows auf die Kiste browse habe ich das gleiche 
> Problem/Phänomen erst wenn ich im FF auf ISO stelle wird's sauber 
> dargestellt?!

Was meinen Verdacht erhaertet dass dein Apache im HTTP-Header
"Content-Type" angibt der Inhalt ist UTF-8 kodiert. Das hat naemlich
Vorrang vor saemtlichen Angaben aus der gelieferten Datei selbst.
Deswegen sollst du ja im Firefox mal die Eigenschaften der dargestellten
Seite oeffnen und schauen was fuer ein Content-Type ausgeliefert wird
(alternativ mit wget http://.... arbeiten, da sieht man das direkt)

> Von dem her glaube ich wäre eine ISO-8859-15-Umgebung am 
> geschicktesten?

Eigentlich ist UTF-8 am geschicktesten, weil damit saemtliche
Umkodierungsprobleme fuer mehrsprachige Seiten abgehackt sind.
Allerdings ist es halt wichtig, dass die ausgelieferten Webseiten auch
so kodiert sind wie der Apache es behauptet. Dafuer gibts ne
entsprechende Einstellung beim Apache, irgendwas mit Default-Charset
oder so...

> Oder etwa nicht - versteh ich grad was falsch?
> Wie sollte ich das am "schlauesten" anstellen - gleich aus dem System 
> entfernen? Brauch ich an sich nicht unbedingt, oder?!

Was entfernen? Den Apache? Ja am besten ist das ;-)

Wie gesagt wichtig ist das der Apache nciht behauptet die Seite haette
ne andere Kodierung als sie tatsaechlich hat.

Prinzipiell kann auch PHP den HTTP-Header veraendern, wenn das fetch_rss
das macht wuerde ich aber mal bei den Entwicklern reklamieren.

Andreas

-- 
Today is National Existential Ennui Awareness Day.



Reply to: