Autor: Mario Dobnig go4xml.com
Auswerten von Logdateien
In Logdateien wird so ziemlich alles, was mit einer Anfrage
zusammenhängt aufgezeichnet. Zur strukturierteren
Speicherung stehen dazu unterschiedliche Logzeileneinträge
zur Verfügung. Die einzelnen Log-Zeilentypen wollen wir uns
nun etwas genauer ansehen.
Access-Log
ppp170.eunet.de - - [11/JAN/2000:10:27:45
+0200] "GET /books/index.html HTTP/1.0" 200 6649
So oder so ähnlich würde eine Zeile in einer Logdatei
aussehen. Was auf den ersten Blick vielleicht etwas
verwirrend aussieht, ist auf den zweiten recht leicht zu
entschlüsseln. Um erhlich zu sein, sieht sich eigentlich
niemand seine Logadateien durch. Man verwendet dazuSoftware, die diese etwas abstrakten Daten in ansehnlichereStatistiken umwandelt. Was bedeuten nun diese Einträge?Am Beginn steht wer eigentlich zugegriffen hat. Diemeisten Besucher erhalten nämlich beim Einwählen ins Netzeine (dynamische) Session Nummer. Genau diese scheint dannauch am Beginn des Logdateieintrages auf. ppp170.eunet.debedeutet, daß der Besucher über eunet.de und mit der Session Nummer ppp170
ins Internet eingewählt hat.
Als nächstes sehen wir wann sich denn unser imaginärer
Besucher die Seite angesehen hat. Er hat am 11. Jänner 2000
um 10:27 und 45 Sekunden vormittags und zwar plus 2 Stunden
gerechnet gegenüber GMT (Greenwich Meridian Time) aus Sicht
der Systemzeit des Server-Rechners unsere Seite betrachtet.
Weiters wurde die Datei /books/index.html
angefordert. Da diese Logdatei vom Server www.Go4XML.com
stammt wurde nur der Pfad der Datei relativ zum
Ausgangsverzeichnis angezeigt. Die Zeile könnte aber auch
so aussehen: https://www.Go4XML.com/books/index.html.
GET bedeutet übrigens, daß die
Datei vom Server angefordert wurde. Schließlich sehen wir
noch, daß bei der Übertragung das HTTP
Protokoll 1.0 verwendet wurde.
Jetzt sind nur noch zwei Zahlen am Ende der Zeile. Diesen
wollen wir nun auf den Grund gehen. 200
sagt, daß die Anfrage und Übertragung ok war. Sollte an
dieser Stelle etwa 4xx, 5xx
stehen, ist ein Fehler aufgetreten.
Die letzte Zahl zeigt uns noch wie groß die Datenmenge,
die übertragen wurde, war. In unserem Beispiel waren es 6649
Bytes.
Referrer-Log
https://de.search.yahoo.com/search/de?p=%2BHTML%2BKurs&y=y&e=2025001370&r=Computer
und Internet -> /xml/index.html
Diese Zeile beschreibt ganz einfach woher der Besucher
kam und wohin er ging. In unserem Beispiel suchte er im
Webverzeichnis Yahoo nacht den Begriffen "HTML"
und "Kurs".
Agent-Log
<unknown>@123.43.40.35 ->
www.Go4XML.com (<noauth>) [23/NOV/1999:09:02:32]
"Mozilla/4.5[de] (Win95;I)"
In diesem Fall interessiert uns eigentlich nur der letzte
Teil. Mozilla bedeutet, daß jemand mit dem Netscape
Navigator auf eine unserer Seiten zugegriffen hat (MSIE wäre
der Internet Explorer). Dabei hat er die Version 4.5 des
Navigators, MS Windows 95 als Betriebssystem verwendet. de
ist die ISO Länderkennung für Deutschland und I
die Versionskennung des Betriebssystems.
Fehler-Log
[Fri OCT 2 10:01:21 1999] https: access to
/local/http/go4xml/./www.Go4XML.com/htdocs/xml/index.html
failed for 98ac7188.ipt.aol.com, reason: file does not exist
Im ersten Teil des Fehler Logs sehen wir Datum und Zeit
des Zugriffs. Im letzten Teil der Zeile wird uns der Grund (reason:)
gezeigt: file does not exist. Die
angeforderte Datei existiert auf dem Server nicht. Passiert
soetwas öfter, kannst Du davon ausgehen, daö sich in
Deiner Navigation irgendwo ein toter Link befindet.
Tucows,
Shareware zur Logfile-Analyse
WebSuccess,
das Profi-Tool
Webtrends,
noch ein Profi-Tool, diesmal aus den USA
|