Gebhard Dettmar wrote: ...
Genau das macht WUMprep auch, nur ohne Cookies, sondern nach einer Heuristik (30 Min. in Folge von einer IP sind eine Session)e181075087.adsl.alicedsl.de.1167553435430610 GET /images/logo06.png HTTP/1.1 [31 /Dec/2006:09:23:55 +0100] Hinter dem Hostname ist also ein eindeutige Nummer, die es erlaubt, einzelne Sessions ganz gut verfolgen...
Die Heuristik finde ich zu einfach, wegen der Proxyproblematik, IDs oder zumindest Useragent o.ä. finde ich da als Erweiterung des IP-Kriteriums notwendig.
...
Ebend. Ich würde das mit Echtzeit vielleicht doch lieber vergessen (der Betreff sagt es eigentlich schon, aber der Hinweis auf die Resourcenfresserei ließ mich wieder davon abkommen). Im Web Mining geht man davon aus, dass das Userverhalten vom Sitedesign bestimmt wird. Solange sich das nicht ändert, kannst du auch ein 3 Monate altes Log verwenden, oder z.B. nur ein paar Tage (bei Sites mit Wahnsinnstraffic)Soweit hab ich dich schon noch verstanden. Aber die Frage ist doch: Nach _welchem_ Besucher soll gefiltert werden? woher soll das Programm das wissen? Oder wie stellst du dir das vor, dass du dem Programm das sagst? Oder soll es nach Besucher aufgeschlüsselt für _jeden_ Besucher einen Clickstream anzeigen? [...]
Richtig, aber mir geht es hier nicht um eine Analyse der häufigsten Klickpfade o.ä., das ist klar, da reichen historische Daten. Mir geht es u.a., wenn ich ehrlich bin, auch um Befriedigung meiner Neugierde, einfach mal meinen Besuchern ein bißchen über die Schulter schauen zu können oder am Beispiel von googlebot mal zu gucken, wie die eigentlich meine Site harvesten (o' grausliges Denglisch ;-)
Oder du weißt schon genau, welche IP das ist, z.B. weil du einen Angriff oder sowas vermutest. Dann würde ich Echtzeit verstehen, aber da nimmt man wohl andre Tools. Für sowas wie Siteoptimierung, für die man i.d.R. Userpfade analysiert, ist Echtzeit belanglos.
ja, s.o.
Vielleicht sollte ich mal nicht über google sondern über sourceforge suchen?Ich empfehle eher die Suche von freshmeat.net, die finde ich sehr viel angenehmer.Die müssten aber beide gutes Google-Ranking haben
Mir ging es darum die möglichen Treffer zu begrenzen, über Google kriege ich halt auch viel was bei _meiner_ Anfrage belanglos ist.
Andre -- Personal weblog and more: http://bischof.homelinux.net "Das Schwein trägt seinen Namen nicht umsonst" - Stilblüten aus Kinderaufsätzen: (Naturwissenschaft und Mathematik) Ein Kreis ist ein rundes Quadrat.