Bei Webalizer handelt es sich um eine Web-Analytics-Software, welche kostenlos zum Download angeboten wird. Die Software arbeitet mit Logdatei-Analyse und steht unter dem Einfluss der General Public License (GPL). Was es mit dem Tool auf sich hat und wie es bedient wird, wollen wir in diesem Ratgeber beschreiben.
Das Projekt wurde bereits im Jahr 1997 von Bradford L. Barrett ins Leben gerufen. Die mit dem Tool erzeugten Statistiken weisen eine Vielzahl an Informationen auf. Darunter:
Besuche
Anfragen
Länder der Besucher
Verweise
Menge der ausgelieferten Daten
Die Statistiken aus dem Webalizer können in Textform oder grafisch betrachtet werden. Die Darstellung lässt sich mit individuellen Zeitskalen umsetzen:
Stunden
Tage
Monate
Jahre
Durch die Zusammenfassung und Gruppierung aufgezeichneter Daten wird eine Protokolldateianalyse erstellt. Dabei wird der Fokus auf folgende Parameter gelegt:
Was ist eine URL?
Die Abkürzung steht für “Uniform Resource Locator” und bezeichnet die Daten im Browser, welche vom zugreifenden Nutzer angefordert werden.
Was ist ein Hit?
Der durch den Nutzer initiierte HTTP-Zugriff wird als Hit, beziehungsweise als Zugriff bezeichnet. HTTP-Zugriffe können dabei auch anfallen, wenn kein Inhalt vorhanden ist. Dennoch werden diese Zugriffe mitgezählt. So werden beispielsweise sechs Bilder vom Server gezählt, auch wenn eines der Bilder welche der Nutzer mittels Webbrowser angefordert hat, fehlt und insgesamt nur fünf Bilder zu sehen sind. Es werden trotzdem sechs Zugriffe, also sechs Hits gezählt. Und von diesen Hits werden fünf als erfolgreich und einer als fehlgeschlagen aufgezeichnet.
Referrer-Spam: Auswertung in Webalizer
Das Programm agiert standardmäßig dahingehend, zwei verschiedene Auswertungen zu liefern. Das betrifft den Jahresüberblick und die Monatsauswertung, welche deutlich detaillierter aufgebaut ist. Im Jahresüberblick findet ihr wichtige Informationen über die Anzahl der einzelnen Seitenzugriffe. Außerdem erhaltet ihr Aufschluss über Datei- und Seitenaufrufe, zugreifende Rechner, sowie deren Anzahl der Zugriffe, sprich deren Besuche. Des Weiteren erhaltet ihr einen täglichen Durchschnitt all dieser Werte, welcher monatlich ausgegeben wird. Diese Auswertung beinhaltet zusätzlich eine Jahreszusammenfassung in graphischer Darstellung. Jede einzelne Monatsauswertung bekommt in der Darstellung ihre eigene HTML-Seite. Und mit diesen Seiten habt ihr dann eine Übersicht der erwähnten Werte.
Die Zusammenfassungen im Überblick
Das ist aber noch längst nicht alles, da ihr weitere Zusammenfassungen erhaltet. Dazu zählt die tägliche Zusammenfassung der oben beschriebenen Werte, welche für jeden einzelnen Tag des Monats erstellt wird. Doch es geht noch detaillierter: Mit der stundenweisen Zusammenfassung, welche sich auf jede einzelne Stunde des Tages bezieht. Es folgt eine URL-Übersicht der abgerufenen Seiten. Und auch die IP-Adressen der zugreifenden Rechner werden in einer Übersicht dargestellt.
Zudem ist eine Auflistung der Anfangs- und Ausstiegs-URLs mit von der Partie. Hinzukommt eine Referrer-Übersicht, die Auflistung verwendeter Suchbegriffe, eine Übersicht aller verwendeten Webbrowser, sowie die Liste aller Länder, aus denen der Webseitenzugriff erfolgte. Wem das nicht genügt, der hat die Möglichkeit den Webalizer so zu konfigurieren, dass CSV Dateien erzeugt werden, welche durch Kommata getrennt sind und alle für den Bericht verwendeten Dateien in Textform darstellen. Dies hat den Vorteil, dass die Informationen zur weiteren Auswertung in Tabellenkalkulationsprogrammen eingelesen werden können.
Webalizer gilt als waschechter Klassiker unter den Analyse-Tools und ist deshalb fester Bestandteil der meisten Hosting-Pakete. Selbst wenn ihr bis dato andere Counter wie zum Beispiel Google Analytics genutzt habt, solltet ihr ruhig mal reinschauen, um zu sehen wie sich alles entwickelt. Und zwar aus Sicht des Servers. Es gibt zahlreiche wichtige Aspekte, welche sich ausschließlich mit einem Logfile-Analyzer erfassen lassen.
Der Hit beschreibt dabei nichts anderes als eine Zeile im Logfile. Und das bedeutet Folgendes: Du öffnest eine Seite in deinem Browser, beziehungsweise forderst diese von einem Server an. Dieser ist nun ambitioniert, eine Zeile in das Logfile zu schreiben, um dabei festzustellen dass er noch Bilder, ein paar Style-Sheets und andere Bestandteile braucht, um die Seite zu vervollständigen. Deshalb schickt euer Browser zusätzliche Anfragen an den Server, welcher weitere Zeilen in das Logfile einträgt. Und das bedeutet, dass eine Seite ohne Bilder oder Ähnlichem einen Hit erzeugen kann. Es können aber auch Hunderte sein.
Und das wiederum bedeutet, dass die Hit-Anzahl so gut wie nichts aussagt. Die meisten Anfragen basieren darauf, dass dem anfragenden Teilnehmer etwas zurückgeschickt wird. Dabei kann es sich um eine HTML-Seite, eine Grafik oder andere Inhalte handeln. Das Ergebnis wird als Datei gewertet, weshalb die Gesamtanzahl der Dateien nach oben gezählt wird. Wirft man einen Blick auf das Verhältnis von Hits zu Files (Zugriffe zu Dateien), liegt dieses bei 10 / 9. Hin und wieder gibt es aber auch Anfragen, welche lediglich eine Antwort erfordern. Zum Beispiel in Bezug auf das Änderungsdatum. Solche Anfragen werden nicht als Dateien gezählt. Die Anzahl richtet sich grundsätzlich nach dem Aufbau eurer Seiten. Im Gegensatz zu Dateien, enthalten Seiten (Pages) HTML und somit kein CSS, keine Bilder und so weiter.
Wichtig: Hier kommt es ganz darauf an, welche Extensions ihr in eurer Webalizer Konfiguration angegeben habt. Wenn du beispielsweise Besitzer von aspx-Seiten bist, aspx jedoch nicht als Seite definiert wurde, werden diese auch nicht als Seiten gezählt. Eure Seiten werden somit nur als Dateien gezählt. Und das merkt ihr daran, dass die Seiten nicht unter ” Entry/Exit-Pages” vorkommen. Das führt dazu, dass eure Statistiken nicht mehr stimmen und zu niedrige Werte in puncto Visits und Pages angezeigt werden. Richtig interessant wird das Verhältnis Pages/Visits im Webalizer. Hier sollte der Wert 25/1 und 5/1 liegen.
Die Faustregel lautet: Je mehr, desto besser für dich. Bekommst du einen Wert von 1/1 zu angezeigt, bedeutet das, dass die Besucher nur durch Zufall über deine Seite gestolpert sind und diese gleich wieder verlassen haben. Ziemlich gut liegst du mit einem Wert von 10 Pages pro Visit. Handelt es sich um Seiten mit Frames, solltet ihr unbedingt berücksichtigen, dass sowohl jeder einzelne Frame, als auch das gesamte Frame-Set eine Seite ist. Bei vier Frames befinden sich auf der Startseite also insgesamt fünf Page-Impressions.
Wann ist ein Visit ein Visit?
Sobald ein Nutzer mit zugewiesener IP eine Seite anfordert, beginnt Webalizer damit die Zeit zu berechnen, welche seit dem letzten Aufruf vergangen ist. Handelt es sich um eine größere Zeitspanne als die 30 Minuten, welche als visit-timeout konfiguriert wurden, wird die Anfrage als neuer Visit vermerkt. Dasselbe gilt für Besucher, welche noch nie eine Anfrage gestellt haben. Die Zahl der Visits wird bei beiden Varianten hochgezählt. Dennoch ist es mit keiner Logfile-Analyse und somit auch nicht mit dem Webalizer möglich, die exakte Besucheranzahl zu bestimmen. Programme wie der Webalizer schätzen die Besucherzahlen.
Und dabei agiert jedes Programm auf unterschiedliche Weise, wenn es um die “Schätzung” geht. So lassen sich als Beispiel deutliche Unterschiede zwischen Webalizer und AWStats aufzeigen. Webalizer zählt die Suchmaschinen-Bots zu den Visits, was AWStats jedoch nicht tut. Schafft es die Webseite auf einen PageRank von 5, kannst du davon ausgehen, dass diese fast täglich gespidert wird. Und das kann schon ganz schön auftragend wirken, wenn deine Seite ein ganz spezielles Thema umfasst und deshalb nicht viele Besucher vorzuweisen hat. Als bestes Beispiel kann hier wohl die Suchmaschinen-Optimierung angeführt werden.
Umso wichtiger ist es, dass ihr die vom Webalizer ausgespuckten Zahlen nicht allzu ernst nehmt. Denn schließlich gibt es noch zahlreiche weitere Faktoren, welche eine potentielle Störung verursachen können. Achtet deshalb beim Auswerten der Webalizer Informationen primär auf den zeitlichen Verlauf.
Was hat es mit den Sites und Kbytes auf sich?
Bei den Sites handelt es sich um nichts anderes als die Anzahl der verschiedenen IP-Adressen, welche von Webalizer im Analysezeitraum ausgewertet wurden. Zwar hat dies nicht unmittelbar etwas mit den Visits zu tun, jedoch gibt das Verhältnis zu den Visits Aufschluss darüber, wie es um das Innen- und besonders um das Außenleben der Webseite bestellt ist. Die Kilobyte-Menge ist dazu gedacht, den Umfang der Daten in Kilobyte anzuzeigen. Dabei handelt es sich um die Daten, welche im Analysezeitraum vom Server gesendet wurden. Da es sich dabei um sehr ungenaue Angaben handelt, ist die Zahl eher uninteressant. Interessanter wird es dagegen mit dem zeitlichen Verlauf, welcher sich beispielsweise auf die Pages beziehen kann.
Webalizer oder AWStats: Der direkte Vergleich
Viele Menschen stellen sich zurecht die Frage, was besser ist: Webalizer oder AWStats. Grund genug, um beide Counter gegeneinander antreten zu lassen und diese auf den Prüfstand zu stellen. Beginnen wir zunächst mit den Gemeinsamkeiten der beiden Programme:
Grundsätzlich lässt sich sagen, dass beide Tools ihre Stärken mit sich bringen. Und gemeinsam gelten diese als ein starkes Team, wenn es um den Einstieg in die kostenlose SEO-Analyse, das Besuchertracking und die User-Experience-Optimization geht. Ihr solltet immer im Hinterkopf behalten, dass alle Tracking- und Statisktiktools nicht zu 100 Prozent genau arbeiten. Dies liegt an den bestehenden Limitierungen in Bezug auf den HTML-Code. So kann es beispielsweise passieren, dass Bots welche eure Webseite besuchen, die Statistik verfälschen, da diese als “echte” Besucher gewertet werden.
Wenn ihr den Webalizer jedoch parallel zu AWStats nutzt, bildet ihr die perfekte Basis, um einen guten Mittelwert zu kalkulieren. Dieser dient als Richtwert, falls ihr weitere Planungen an eurer Webumgebung angehen wollt. Hier solltet ihr euch folgende Fragen beantworten können: Hat sich das Verhalten der Nutzer seit dem Seitenumbau geändert? Ist aktuell mehr Traffic zu verzeichnen, als es heute vor einem Jahr der Fall war? Solltet Ihr Unterschiede in den Ergebnissen von Webalizer und AWStats erkennen, handelt es sich dabei nicht um einen Fehler, da beide Tools unterschiedliche Methoden anwenden, um Besucher und Seitenaufrufe zu erfassen. Ein “falsch” gibt es demnach nicht.
Was sind die Unterschiede zwischen Webalizer und AWStats?
Gleich zu Beginn können wir verraten, dass das in Perl programmierte Tool AWStats mehr Funktionen vorzuweisen, als sein Konkurrent. Dies liegt daran, dass sich das Programm nicht nur an Server Logdateien bedient, sondern zusätzlich auf FTP und Mail Logs zugreift, um diese mit in die Statistikgenerierung einzubeziehen. Außerdem ist AWStats in der Lage detaillierte Informationen hervorzubringen. Das betrifft zum Beispiel den Java Support, Bildschirmgrößen oder Statistiken über Datenkompression. AWStats punktet außerdem mit der Option, das Programm direkt von der Bash, also der Kommandozentrale oder von einem CGI Skript zu starten, sofern es von einem vServer aus betrieben wird.
Und auch die Konfigurationsdatei gestaltet sich als leicht zu verstehen, weshalb ihr eure Anpassungen im Handumdrehen und ohne viel Übung vornehmen könnt. Hier solltet ihr nur darauf achten, dass das Programm nach den entsprechenden Änderungen an der Datei, über ein separates CGI Skript neu gestartet wird. Zusätzlich wird ein beschreibbarer Ordner mit dem Namen CGI-Bin vorausgesetzt. Achtet darauf, dass sich dieser Ordner von der httpd.conf Datei (Apache) aus beschreiben lässt. AWStats überzeugt auch in puncto Benutzerfreundlichkeit. Das Tool lässt sich einfach starten und ebenso leicht konfigurieren. Für das Exportieren steht das XML-Format zur Verfügung.
Weniger Funktionen bei mehr Komfort
Webalizer wurde dagegen in C programmiert. Das Programm kann lediglich die Daten aus den Server Weblogs auswerten. Weiterführende Analysen wie diese bei AWStats zu finden sind, sucht man im Webalizer vergeblich. Dennoch hat das Tool seine Vorzüge, welche sich vor allem dann bemerkbar machen, wenn Serveradministratoren installieren und anpassen wollen. Beides gestaltet sich als kinderleicht. Es ist vom Hersteller vorgesehen, dass sich das Programm direkt unter dem Apache Root Verzeichnis installiert. Die Konfigurationsdatei befindet sich standardmäßig im /etc/ Ordner. Hier müsst ihr die Pfadanpassung zu den Logdaten selbst vornehmen.
Sobald dies geschehen ist, kann der Webalizer auch schon eingesetzt werden. Ihr könnt das Programm direkt von der Kommandozentrale aus, aufrufen. In Webalizer habt ihr eine Übersichtsseite, welche alle relevanten Daten des laufendes Jahres, monatlich anzeigt. Und jede einzelne Monatsseite ermöglicht euch detaillierte Informationen über Traffic, Besucher & Co. Der Webalizer besticht durch seine Übersichtlichkeit und lässt sich mittels Konfigurationsdatei optimal an die eigenen Bedürfnisse anpassen. Die Informationen werden dabei im Balken- und Tortendiagrammen dargestellt.
Die optimale Analyse: Doppelt hält besser
Wie aus dem Vergleich eindeutig hervorgeht, bieten beide Tools ihre Vorzüge. Der Webalizer setzt dabei auf einfache Statistiken, welche in Form von Balken oder Torten dargestellt werden. Sein Konkurrent punktet derweil mit umfangreicheren Informationen. Für welches Programm ihr euch letztendlich entscheidet, hängt von eurem persönlichen Geschmack ab. Eventuell kann hier auch die Bedienerfreundlichkeit ein entscheidendes Auswahlkriterium sein.
Wir wollen dennoch erneut darauf aufmerksam machen, dass es sinnvoll ist, beide Tools parallel laufen zu lassen. Allein die Tatsache, dass beide Programme unterschiedlich berechnen, lässt darauf schließen, dass der Duo-Einsatz Sinn machen kann, wenn es darum geht, einen optimalen Mittelwert zu bekommen.
Wo gibt es webalizer?
In allen Webhoster Tarifen steht webalizer kostenlos zur Verfügung.