Ich bin Neugierig. Es liegt wohl in der Natur des Menschen wenn man Selbstbestätigung sucht. Neben der Auswertung der Lesezugriffe auf die Artikel interessiert mich deswegen auch, wieviele Leser mein Blog für so interessant halten, dass sie es in einem RSS Reader aufnehmen.
Da ich die Blog Software (Serendipity) selbst betreibe und keinen Feed Management Service wie Feedburner für die Verwaltung von RSS und Atom Abonomenten verwende muss ich mir selbst helfen. In meinen Fall höchst ineffiziente Unix Befehle.
Ich begnüge mich mit dem einfachen Ansatz: innerhalb eines Tages sind alle Zugriffe von der selben IP auf den selben XML Feed ein Subscriber. Das ist nicht ganz exakt, da unter Umständen mehrere Leser hinter einer IP sitzen oder aber einzelne Leser zwei oder mehr IP-Addressen am Tag haben.
Ich habs mir mal einfach gemacht und gehe davon aus, dass die beiden Trends sich gegenseitig aufheben. Wichtig ist nur, dass man nicht mehr als einen Tag betrachtet. Daneben gibt es noch Subscriber die ich so nicht erwische, weil die etwa Bloglines oder vergleichbares nutzen. Dies bekomme ich dann über die Referer mit.
Folgender Befehl sucht alle Zugriffe auf RSS und Atom Files zusammen, und gibt davon die IP Addresse, das Datum und die zugegriffene Addresse aus. Ich gehe hier von Apache Logfiles aus, die bei einer S9Y Installation mit folgendem Format geschrieben werden:
Folgender Befehl:
Erzeugt daraus Zeilen der Art:
Da ich die Blog Software (Serendipity) selbst betreibe und keinen Feed Management Service wie Feedburner für die Verwaltung von RSS und Atom Abonomenten verwende muss ich mir selbst helfen. In meinen Fall höchst ineffiziente Unix Befehle.
Ich begnüge mich mit dem einfachen Ansatz: innerhalb eines Tages sind alle Zugriffe von der selben IP auf den selben XML Feed ein Subscriber. Das ist nicht ganz exakt, da unter Umständen mehrere Leser hinter einer IP sitzen oder aber einzelne Leser zwei oder mehr IP-Addressen am Tag haben.
Ich habs mir mal einfach gemacht und gehe davon aus, dass die beiden Trends sich gegenseitig aufheben. Wichtig ist nur, dass man nicht mehr als einen Tag betrachtet. Daneben gibt es noch Subscriber die ich so nicht erwische, weil die etwa Bloglines oder vergleichbares nutzen. Dies bekomme ich dann über die Referer mit.
Folgender Befehl sucht alle Zugriffe auf RSS und Atom Files zusammen, und gibt davon die IP Addresse, das Datum und die zugegriffene Addresse aus. Ich gehe hier von Apache Logfiles aus, die bei einer S9Y Installation mit folgendem Format geschrieben werden:
84.163.26.152 - - [11/Sep/2005:03:38:23 +0200] "GET /rss.php?version=2.0 HTTP/1.1" 200 45677 "-" "Mozilla/5.0 (Sage)"Folgender Befehl:
# egrep '(GET /feeds|GET /rss.php)' /var/log/httpd/itblog.eckenfels.net-access_log | awk -F'[ :]' '{print $1" "$4" "$10}' | sort | uniq -c > /tmp/blog.logErzeugt daraus Zeilen der Art:
10 84.163.26.152 [11/Sep/2005 /rss.php?version=2.0
Damit erhalte ich dann eine Zeile pro IP und Tag und Feed. In der ersten Spalte zusätzlich die Anzahl der gleichartigen Zugriffe innerhalb des jeweiligen Tages (im Beispiel sind es 10). Ich entferne daraus alle Zeilen bei der nur ein Zugriff von einer IP pro Tag erfolgte (das sind vermutlich Bots und RSS Scans):
Und dann kann man das ganze nach Tagen analysieren. Auch dies geht noch mit Umsortierung und Spalten-Auswahl mittels awk, ich habe es mir jedoch einfach gemacht. (Nicht immer sind Algorithmen mit quadratischer Laufzeit schlecht, besonders dann nicht wenn der Entwickler mehr Zeit braucht als das Programm.)
Damit komme ich bei mir auf 40-60 Subscriber pro Tag. Eventuell kann man das ganze noch in schicke Trend Grafiken verpacken. Mit ein wenig Perl und assoziativen Arrays sollte das einfacher sein als mit Shell Scripten. Weitere Auswertungen sind z.B. die Überwachung von RSS-Readern die es mit dem Polling übertreiben. Meine Top-3 Poller Gestern:
# egrep -v "^ +1 " /tmp/blog.log > /tmp/blog-filtered.log
# wc -l /tmp/blog.log /tmp/blog-filtered.log
9348 /tmp/blog.log
5879 /tmp/blog-filtered.logUnd dann kann man das ganze nach Tagen analysieren. Auch dies geht noch mit Umsortierung und Spalten-Auswahl mittels awk, ich habe es mir jedoch einfach gemacht. (Nicht immer sind Algorithmen mit quadratischer Laufzeit schlecht, besonders dann nicht wenn der Entwickler mehr Zeit braucht als das Programm.)
# for i in 01 02 03 04 05 06 07 08 09 10;
> do echo $i/Sep `grep $i/Sep/2005 /tmp/blog-filtered.log | wc -l`;
> done
01/Sep 61
02/Sep 40
03/Sep 52
04/Sep 38
05/Sep 50
06/Sep 38
07/Sep 40
08/Sep 43
09/Sep 39
10/Sep 43Damit komme ich bei mir auf 40-60 Subscriber pro Tag. Eventuell kann man das ganze noch in schicke Trend Grafiken verpacken. Mit ein wenig Perl und assoziativen Arrays sollte das einfacher sein als mit Shell Scripten. Weitere Auswertungen sind z.B. die Überwachung von RSS-Readern die es mit dem Polling übertreiben. Meine Top-3 Poller Gestern:
grep 10/Sep /tmp/blog-filtered.log | sort -n | tail -3
20 64.78.155.100 [10/Sep/2005 /feeds/index.rss2
24 81.169.156.174 [10/Sep/2005 /rss.php?version=2.0
39 84.163.189.82 [10/Sep/2005 /rss.php?version=1.0Trackbacks
Trackback für spezifische URI dieses Eintrags
Keine Trackbacks
Kommentare
Ansicht der Kommentare:
(Linear | Verschachtelt)
Ich für meinen Teil sitze hinter Bloglines und Services wie dieser dürften im Idealfall einmal pollen und die Daten dann an x User verteilen.
Du kommst also mit deiner Berechnung an einen Wert, den du als untere Schranke deiner Abonnenten bezeichnen kannst. Wegen dynamischer IPs beim erneuten Login (ISDN-User oder so) dürfte das zwar auch noch ein bisschen verzerrt sein, aber ich schätze mal, das mittelt sich heraus.
Allerdings sagt mir Bloglines dass es nur 5 Subscriptions für das IT-Blog gibt.
Gibts noch weitere Aggregatoren die relevant sind und bei denen ich die Info abfragen kann?
Gruss
Bernd
Layout by Ricky Wilson | Serendipity Template by Carl Galloway | Login
Impressum
Bernd Eckenfels
Mörscher Str. 8
76185 Karlsruhe
bernd-08(a)eckenfels.net
Read More
Suche
Kategorien
Verlinkung
- Apache[206]
- Sage[217]
- Bloglines[226]
- Feedburner[295]
- Mozilla[244]
- Serendipity[215]
Umfrage
Inhouse Coding?
Archive
Archive
Kommentare
Hans Dampf zu Bewerbung
2008-11-16 11:41
Ich finde es schon sehr anmaßend au
f derartige Anschreiben "negativ" z
u reagieren (und diese zu verspotte
n). Ansch [...]
2008-11-16 11:41
Bernd Eckenfels zu Bewerbung
2008-11-12 20:58
ROTFL - ja auf die Idee diese Blind
bewertungen abzusagen bin ich noch
garnicht gekommen .) Ist das jetzt
unhöflich [...]
2008-11-12 20:58
Dana Stoll zu Bewerbung
2008-11-12 13:39
Anbei ein Antwortschreiben, ebenfal
ls um einige Gedanken ergänzt.
S
ehr geehrter Herr Bewerber,
viel
en Dank f [...]
2008-11-12 13:39
Balu zu Gmail Features
2008-11-11 09:33
Schade, ich mag das Interface von G
Mail, aber ich brauche diese Filter
, um Catchall-Konten zu sortieren..
.
Ich [...]
2008-11-11 09:33
Bernd Eckenfels zu Gmail Features
2008-11-11 02:37
Ich glaube nen, nur From/To/Subject
, body und hasAttachment.
2008-11-11 02:37
Balu zu Gmail Features
2008-11-11 01:12
Kann man inzwischen nach beliebigen
Header-Feldern filtern?
Also z.
B. nach X-Original-To: oder sowas?
2008-11-11 01:12
TK zu Gmail Features
2008-11-09 18:34
LoL hätte nicht gedacht das die den
schwachsinn wirklich einführen. Au
ßerdem könnte ein Betrunkener das F
eature au [...]
2008-11-09 18:34
Bernd Eckenfels zu Gmail Features
2008-11-07 03:00
Ja ich benutz das eigentlich nur in
Englisch. Die Features waren mir n
ur bisher nicht aufgefallen .)
2008-11-07 03:00
Rico zu Gmail Features
2008-11-05 16:58
Tip: GMail auf Englisch umstellen,
dann hast du die neuen Features sch
on Monate vorher.
2008-11-05 16:58
Hardware-Blogger zu Firmenstrukturen
2008-11-03 21:44
Sehr lustig das Bild aber leider wi
rklichkeit in vielen Unternehmen...
2008-11-03 21:44
Blog abonnieren
Blogsphere
Letzten Monat...
Fr, 17.10.2008Java 6u10 ist da (und 6u7 für Itanium)
Fr, 17.10.2008Java 6u10 ist da (und 6u7 für Itanium)
Do, 16.10.2008Gillmor und der Open Source Markt
Mo, 13.10.2008Microsoft Entwicklungen
Mi, 08.10.2008Hyper-V Server
Fr, 17.10.2008Java 6u10 ist da (und 6u7 für Itanium)
Do, 16.10.2008Gillmor und der Open Source Markt
Mo, 13.10.2008Microsoft Entwicklungen
Mi, 08.10.2008Hyper-V Server
Top Referers
www.google.de (24)
search.live.com (4)
bernd.eckenfels.net (2)
ralfeisend.blog.de (2)
www.google.ch (2)
blog.micha.de (1)
de.ask.com (1)
www.google.at (1)
search.live.com (4)
bernd.eckenfels.net (2)
ralfeisend.blog.de (2)
www.google.ch (2)
blog.micha.de (1)
de.ask.com (1)
www.google.at (1)
