[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: HTML-Content-Filter/Changer



Til Schubbe schrieb:
> 
> * Am 18.02. meinte Florian Ernst:
> > On Sat, Feb 18, 2012 at 12:50:35PM +0100, Til Schubbe wrote:
> 
> > > Ich will nicht, daß ein URL, den ich aufrufe, umgeleitet/verändert
> > > wird. Sondern es sollen, schon bevor eine HTML-Seite angezeigt wird,
> > > in den Links, die dieser HTML-Code enthält, Veränderungen
> > > vorgenommen werden.
> > > [...]
> 
> > Nun fallen mir nur noch Greasemonkey-style user scripts ein, die aber
> > eine Einrichtung in jedem einzelnen verwendeten Browser bedürfen.
> 
Das aendert am Inhalt der Datei ja ueberhaupt nichts, eher im 
Gegenteil, letztlich glaubt nur der Browser dann das in "der Datei" 
was anderes steht. 
Manchmal ist es aber trotzdem einfacher Webseiten ueber Greasemonkey 
zu aendern als ueber einen filternden Proxy weil Greasemonkey eben 
direkt im Browser laeuft und Skripte versteht bzw. sich eben in die 
Scriptingengine einklinkt.

> Ich hab mal für url_rewrite_program ein Perl-Skript geschrieben, das
> die angeforderte Seite selber runterläd, die Links darin ändert, die
> Seite in einer Datei unter Apaches ServerRoot lokal ablegt und einen
> Link zurückliefert, der auf localhost/... auf diese Datei zeigt. Die
> Datei wird auch korrekt erzeugt, aber im Browser wird sie als
> Plain-Text/Source angezeigt. Habe es mit 2 verschiedenen Web-Seiten
> versucht.
> 
Es mag Spezialsituationen geben wo das sinnvoll ist ;)

> Woran kann es liegen, daß die Seite dann nicht mehr als HTML
> interpretiert wird?
> 
Falsche/keine Dateiendung?
Welche Dateiendungen der Apache als HTML interpretiert so das dann 
im header eben text/html gesendet wird kann man ja konfigurieren.

> Werde ich mir mal ansehen.
> 
Mit Privoxy ist das was Du willst grundsaetzlich kein Problem.
Auch wenn man etwas Einarbeitungszeit braucht bis man mit Privoxy
gut klar kommt (zumindest wenn man eigene Regeln nutzen will), 
ich moechte den nicht mehr missen.

Manchmal blocke ich aber mittlerweile doch Sachen ueber Adblock 
in Kombination mit dem Element-Hiding-Helper weil es teilweise echt 
schwer zu analysieren ist wo ein Block auf einer Webseite denn nun 
herkommt bzw. wie man den nun eindeutig mittels einer (RegExp)-Regel
eingeordnet kriegt. Das kann aber auch an mir liegen ;-)

Z.B. die plista-Werbung in den Artikelempfehlungen habe ich nicht 
ueber Privoxy geblocked gekriegt:
http://www.mopo.de/nachrichten/bernhard-nocht-strasse-st--pauli--streit-um-haus-abriss-,5067140,11657568.html

Das ist schon ein guter Trick die Artikelempfehlungen ueber die selben 
Server wie die Werbung, alles in einem, auszuliefern.
Wobei das ja eigentlich naheliegend ist, ueberraschend dass es so lange 
gedauert hat bis das mal ein Werbedienstleister so geloest hat.
Mit Adblock kriegt man die aber trotzdem ausgeblendet (das ist ja in den 
Easylist-Germany-Regeln auch sowieso schon mit drin), von daher haetten 
die sich das auch schenken koennen ;-)
Schade das es so etwas wie den Element-Hiding-Helper nicht fuer Privoxy 
gibt (Ja, das duerfte auch ziemlich kompliziert sein so etwas da rein 
zu kriegen).

Und wech,
Manne


Reply to: