[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Echtzeit-Logfileanalyse



On Sunday 18 February 2007 17:28, Moritz Lenz wrote:
> Hallo,
>
> Andre Bischof wrote:
> > Moritz Lenz wrote:
> >> Hallo,
> >>[...]
>
> Ja. Das schickt Tracking-Cookies an die Clients, und loggt sie mit. Ein
> typischer Ausschnitt sieht dann so aus:
>
> e181075087.adsl.alicedsl.de.1167553435430610 GET /style_nr.css HTTP/1.1
> [31/Dec/
> 2006:09:23:55 +0100]
> e181075087.adsl.alicedsl.de.1167553435430610 GET /de/yasss HTTP/1.1
> [31/Dec/2006
>
> :09:23:55 +0100]
>
> e181075087.adsl.alicedsl.de.1167553435430610 GET /images/logo06.png
> HTTP/1.1 [31
> /Dec/2006:09:23:55 +0100]
>
> Hinter dem Hostname ist also ein eindeutige Nummer, die es erlaubt,
> einzelne Sessions ganz gut verfolgen...
>
Genau das macht WUMprep auch, nur ohne Cookies, sondern nach einer 
Heuristik (30 Min. in Folge von einer IP sind eine Session)

> >>> Außerdem will ich nichts was ständig mitläuft, da Echtzeitanalyse
> >>> wohl je nach Traffic und Loggröße sehr viel Ressourcen verbrauchen
> >>> kann, und es wäre schön wenn es sich selbst aktualisiert oder man
> >>> z.B. Filter setzen kann, um nur bestimmte User zu betrachten.
> >>
> >> Wie stellst du dir denn die Auswahl dieser User vor?
> >
> > Wie gesagt als Zugriffe der gleichen IP-Adresse, am besten in
> > Verknüpfung mit User-Agent/Browserkennung.
>
> Soweit hab ich dich schon noch verstanden. Aber die Frage ist doch: Nach
> _welchem_ Besucher soll gefiltert werden? woher soll das Programm das
> wissen? Oder wie stellst du dir das vor, dass du dem Programm das sagst?
> Oder soll es nach Besucher aufgeschlüsselt für _jeden_ Besucher einen
> Clickstream anzeigen?
>
> [...]
>
Ebend. Ich würde das mit Echtzeit vielleicht doch lieber vergessen (der 
Betreff sagt es eigentlich schon, aber der Hinweis auf die 
Resourcenfresserei ließ mich  wieder davon abkommen). Im Web Mining geht 
man davon aus, dass das Userverhalten vom Sitedesign bestimmt wird. 
Solange sich das nicht ändert, kannst du auch ein 3 Monate altes Log 
verwenden, oder z.B. nur ein paar Tage (bei Sites mit Wahnsinnstraffic)

Oder du weißt schon genau, welche IP das ist, z.B. weil du einen Angriff 
oder sowas vermutest. Dann würde ich Echtzeit verstehen, aber da nimmt man 
wohl andre Tools.
Für sowas wie Siteoptimierung, für die man i.d.R. Userpfade analysiert, 
ist Echtzeit belanglos.

> > Vielleicht sollte ich mal nicht über google sondern über sourceforge
> > suchen?
>
> Ich empfehle eher die Suche von freshmeat.net, die finde ich sehr viel
> angenehmer.
>
Die müssten aber beide gutes Google-Ranking haben
Grüße,
Gebhard
-- 
Don't you feel more like you do now than you did when you came in?



Reply to: