Der Google Scraper
Kommt Zeit, kommt Rat. Auf meine Frage nach einer sinnvollen Google Analytics Export Möglichkeit für größere Keywort-Mengen kam u.a. als Antwort ein Vorschlag von Christian Bürger, man könne ja die Inhalte mit einem Script abgreifen. Ok, sicher eine Möglichkeit, nur sitzt man an so einem Script genau so lange (wenn nicht länger) als es dauern würde, die ganzen Inhalte zu Fuß via Analytics zu exportieren. Es sei denn …
… es findet sich ein Freiwilliger, der einem ein solches Script schreibt und zur Verfügung stellt. Und genau das hat Christian sich auch gedacht – und gehandelt. Auf seiner Website findet ihr jetzt ein Scraping Script inklusive Anleitung, dass es möglich macht, automatisiert Tausende von Keywörtern aus der Analytics Datenbank heraus zu kitzeln. Schaut’s euch an. Geprüft habe ich das Script noch nicht, wäre aber durchaus an entsprechenden Rückmeldungen eurerseits interessiert. Die Sache entbehrt nicht einer gewissen Komik. Die Datenkrake Google wird von einer kleinen Datenkrake abgesaugt :)





Dezember 7th, 2008 at 00:37
Unbedingt ist zu beachten dieses und ähnliche tools nur von Dynamischen IP Adressen gestartet werden sollten…
Dezember 7th, 2008 at 22:20
Ts.
Gerald M., wann Du immer so in Blogs liest :-)
Gruß an beide Geralds,
Jan
Dezember 9th, 2008 at 10:37
Oh klasse – sogar in Ruby geschrieben :)
Danke sagt der olli
Dezember 9th, 2008 at 11:29
Vielen Dank für den Hinweis, Gerald.
Hoffe, dass es einigen behilflich ist :-)
Dezember 10th, 2008 at 10:16
Hmm wo ist mein Trackback?
Dezember 18th, 2008 at 00:42
Dann hier mal meine Rückmeldung. Ich habs getestet und bin begeistert.
Und dann auch noch in der Lieblings-Sprache – perfekt ;-) ?
Vielleicht könnte man noch erwähnen, dass sich die benötigten Libs mittels folgender Befehle installieren lassen:
gem install hpricot
gem install googlebase
gem install unicode
gem install htmlentities
Wem die Wahrung
“warning: peer certificate won’t be verified in this SSL session”
nervt, findet hier die Lösung
http://github.com/jnunemaker/googlebase/wikis/stop-warning-peer-certificate-wont-be-verified-in-this-ssl-session
Die Googlebase Lib kannte ich auch noch nicht, seeehr nettes Teil.
Vielen Dank für den Post, auch an Christan, dass er den Code veröffentlicht hat.
Januar 4th, 2009 at 22:33
[...] (via Gerald vom S-O-S SEO Blog) [...]