<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress/2.3.3" -->
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	>
<channel>
	<title>Kommentare zu: Schneller als der Bot erlaubt</title>
	<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/</link>
	<description>Das Suchmaschinen Optimierung Seo Blog</description>
	<pubDate>Sat, 30 Aug 2008 16:33:15 +0000</pubDate>
	<generator>http://wordpress.org/?v=2.3.3</generator>
		<item>
		<title>Von: WordPress Plugin: schnapp Dir den Bot ! - Bandscheiben-Blog</title>
		<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-149955</link>
		<dc:creator>WordPress Plugin: schnapp Dir den Bot ! - Bandscheiben-Blog</dc:creator>
		<pubDate>Wed, 27 Feb 2008 14:50:29 +0000</pubDate>
		<guid>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-149955</guid>
		<description>[...] dem Plugin k&#246;nnt Ihr dann Gerald&#8217;s Relativit&#228;tstheorie falsifizieren [...]</description>
		<content:encoded><![CDATA[<p>[&#8230;] dem Plugin k&#246;nnt Ihr dann Gerald&#8217;s Relativit&#228;tstheorie falsifizieren [&#8230;]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Erzeugen von Duplicate Content - SEO Blog</title>
		<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-116269</link>
		<dc:creator>Erzeugen von Duplicate Content - SEO Blog</dc:creator>
		<pubDate>Mon, 25 Jun 2007 18:48:51 +0000</pubDate>
		<guid>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-116269</guid>
		<description>[...] Zum Abschluss m&#246;chte ich euch eine weitere Strategie zur Vermeidung von Duplicate Content nicht verheimlichen, welche Gerald in seinem Blog aufgestellt hat. Etwas radikal in der Umsetzung aber f&#252;r SEO&#8217;s absolut lesenswert [...]</description>
		<content:encoded><![CDATA[<p>[&#8230;] Zum Abschluss m&#246;chte ich euch eine weitere Strategie zur Vermeidung von Duplicate Content nicht verheimlichen, welche Gerald in seinem Blog aufgestellt hat. Etwas radikal in der Umsetzung aber f&#252;r SEO&#8217;s absolut lesenswert [&#8230;]</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: gsyi</title>
		<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-100613</link>
		<dc:creator>gsyi</dc:creator>
		<pubDate>Tue, 12 Jun 2007 14:39:47 +0000</pubDate>
		<guid>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-100613</guid>
		<description>Haha, wirklich geiler Artikel!
Allerdings muss man dazusagen, dass die meisten Splogs keine eigenst&#228;ndige Bots, sondern einfach RSS Feed Scrapers haben. Daher ist es egal, wie schnell sich eine Seite &#228;ndert ;-)  Aber der Text ist wirklich nett geschrieben! :-)</description>
		<content:encoded><![CDATA[<p>Haha, wirklich geiler Artikel!<br />
Allerdings muss man dazusagen, dass die meisten Splogs keine eigenst&#228;ndige Bots, sondern einfach RSS Feed Scrapers haben. Daher ist es egal, wie schnell sich eine Seite &#228;ndert ;-)  Aber der Text ist wirklich nett geschrieben! :-)</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: reinhard</title>
		<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-100102</link>
		<dc:creator>reinhard</dc:creator>
		<pubDate>Mon, 11 Jun 2007 19:54:56 +0000</pubDate>
		<guid>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-100102</guid>
		<description>Uui uiu, mit welch wissenschaftlichen knoff hoff ihr da an die Sache geht ... man k&#252;mmet sich richtig klein vor .. Fuzzi Logi: dabei habe habe ich mich so gefreut es nie wieder nach mathe zu h&#246;ren</description>
		<content:encoded><![CDATA[<p>Uui uiu, mit welch wissenschaftlichen knoff hoff ihr da an die Sache geht &#8230; man k&#252;mmet sich richtig klein vor .. Fuzzi Logi: dabei habe habe ich mich so gefreut es nie wieder nach mathe zu h&#246;ren</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Gerald</title>
		<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99774</link>
		<dc:creator>Gerald</dc:creator>
		<pubDate>Mon, 11 Jun 2007 10:10:43 +0000</pubDate>
		<guid>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99774</guid>
		<description>christian, du hast vollkommen recht. insbesondere der hinweis auf schr&#246;dingers katze erinnert mich daran, dass ich noch eine quantentheoretische erweiterung meiner speziellen relativistischen theorie nachliefern sollte. gerade die quantelung des contents in verbindung mit dem spin der durchs web geschickten elektronen birgt manch seltsame &#252;berraschung f&#252;r den forschenden seologen. neue begriffswelten kommen ins spiel, so wird die keyworddichte von der teilchendichte abgel&#246;st und die zugeh&#246;rigen text elemente gehen im zug der string theorie in dimensionen &#252;ber, die noch nie zuvor ein mensch gesehen hat.

olaf, danke f&#252;r die erkl&#228;rungen. genau solche kommentare erhoffe ich mir immer ;-)</description>
		<content:encoded><![CDATA[<p>christian, du hast vollkommen recht. insbesondere der hinweis auf schr&#246;dingers katze erinnert mich daran, dass ich noch eine quantentheoretische erweiterung meiner speziellen relativistischen theorie nachliefern sollte. gerade die quantelung des contents in verbindung mit dem spin der durchs web geschickten elektronen birgt manch seltsame &#252;berraschung f&#252;r den forschenden seologen. neue begriffswelten kommen ins spiel, so wird die keyworddichte von der teilchendichte abgel&#246;st und die zugeh&#246;rigen text elemente gehen im zug der string theorie in dimensionen &#252;ber, die noch nie zuvor ein mensch gesehen hat.</p>
<p>olaf, danke f&#252;r die erkl&#228;rungen. genau solche kommentare erhoffe ich mir immer ;-)</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Olaf</title>
		<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99772</link>
		<dc:creator>Olaf</dc:creator>
		<pubDate>Mon, 11 Jun 2007 10:05:58 +0000</pubDate>
		<guid>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99772</guid>
		<description>Also so einfach ist das mit dem double content nicht. Wir entwickeln und betreiben Suchmaschinen f&#252;r Firmen und kennen das Thema des double Content nur zugut. Es gibt verschiedene Strategien, doppelten Content zu erkennen. U.a. redurziert man den Inhalt nur auf den Text, d.h. alles was Javascript, Styling o.&#228;. ist bleibt eh erstmal au&#223;en vor. Dann kann man zus&#228;tzlich noch versuchen, alle Links inkl. deren Anchor-Texten auch gleich mit rauszufiltern - damit kann man Missbrauch von anderen Seiten f&#252;r Keyword-Text sehr sch&#246;n umgehen.

Schlie&#223;lich muss man per Fuzzy ein gewissen Unsch&#228;rfe beim Vergleichen nutzen. Diese Unsch&#228;rfe sollte entsprechend der Dokumentgr&#246;&#223;e angepasst sein - ein nur pauschal 10% Unsch&#228;rfe reicht nicht aus. Hier die richtigen Werte zu finden ist halt Erfahrung. Ich kann nur sagen, dass wir ziemlich zuverl&#228;ssig doppelte Seiten mit &#252;blichen Abweichungen (man denke an Produktseiten, die sich nur durch exakte Firmennamen und -adressen unterscheiden) erkennen.

Und solch eine Erkennung dauert - abh&#228;ngig vom Index auch nicht so lange - man kann da mit unscharfen Hashes arbeiten.

Au&#223;erdem hat der Vorschlag mit dem schneller als der Bot sein noch einen gr&#252;ndlichen Nachteil - man weiss n&#228;mlich nicht, wo der Bot zuerst wieder lang kommt. Eventuell auf der Seite wo man es nicht m&#246;chte - das ist n&#228;mlich das wirkliche Google-Duplicate-Content-Problem.</description>
		<content:encoded><![CDATA[<p>Also so einfach ist das mit dem double content nicht. Wir entwickeln und betreiben Suchmaschinen f&#252;r Firmen und kennen das Thema des double Content nur zugut. Es gibt verschiedene Strategien, doppelten Content zu erkennen. U.a. redurziert man den Inhalt nur auf den Text, d.h. alles was Javascript, Styling o.&#228;. ist bleibt eh erstmal au&#223;en vor. Dann kann man zus&#228;tzlich noch versuchen, alle Links inkl. deren Anchor-Texten auch gleich mit rauszufiltern - damit kann man Missbrauch von anderen Seiten f&#252;r Keyword-Text sehr sch&#246;n umgehen.</p>
<p>Schlie&#223;lich muss man per Fuzzy ein gewissen Unsch&#228;rfe beim Vergleichen nutzen. Diese Unsch&#228;rfe sollte entsprechend der Dokumentgr&#246;&#223;e angepasst sein - ein nur pauschal 10% Unsch&#228;rfe reicht nicht aus. Hier die richtigen Werte zu finden ist halt Erfahrung. Ich kann nur sagen, dass wir ziemlich zuverl&#228;ssig doppelte Seiten mit &#252;blichen Abweichungen (man denke an Produktseiten, die sich nur durch exakte Firmennamen und -adressen unterscheiden) erkennen.</p>
<p>Und solch eine Erkennung dauert - abh&#228;ngig vom Index auch nicht so lange - man kann da mit unscharfen Hashes arbeiten.</p>
<p>Au&#223;erdem hat der Vorschlag mit dem schneller als der Bot sein noch einen gr&#252;ndlichen Nachteil - man weiss n&#228;mlich nicht, wo der Bot zuerst wieder lang kommt. Eventuell auf der Seite wo man es nicht m&#246;chte - das ist n&#228;mlich das wirkliche Google-Duplicate-Content-Problem.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Christian</title>
		<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99748</link>
		<dc:creator>Christian</dc:creator>
		<pubDate>Mon, 11 Jun 2007 08:27:18 +0000</pubDate>
		<guid>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99748</guid>
		<description>Nette Analyse. Allerdings vergisst du in deiner Berechnung den Dopplereffekt.  

Und ob Content als "duplicate" l&#228;uft, wei&#223; wohl bis die Kiste ge&#246;ffnet wird auch nur die Katze... &#228;hm...der Content selbst. :-)</description>
		<content:encoded><![CDATA[<p>Nette Analyse. Allerdings vergisst du in deiner Berechnung den Dopplereffekt.  </p>
<p>Und ob Content als &#8220;duplicate&#8221; l&#228;uft, wei&#223; wohl bis die Kiste ge&#246;ffnet wird auch nur die Katze&#8230; &#228;hm&#8230;der Content selbst. :-)</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Gerald</title>
		<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99603</link>
		<dc:creator>Gerald</dc:creator>
		<pubDate>Mon, 11 Jun 2007 02:35:28 +0000</pubDate>
		<guid>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99603</guid>
		<description>@henning - wenn google auf 90% gleichheit checken wollte, dann w&#252;rden die mit dem rechnen nie fertig werden. abgesehen davon w&#228;re es schon schwer genug &#252;berhaupt 90% &#252;bereinstimmung zu definieren. und es d&#252;rfte auch keinen sinn machen.

schon die suche und erkennung nahezu identischer seiten &#252;berfordert google ja oft genug, wie man an den ganzen &#252;blen proxy-klau konstrukten sehen kann.

@walid - wer weiss schon, wie gut google inhalte von navigation, werbung und anderen elementen unterscheiden kann. aber es k&#246;nnte durchaus sinn machen die eigenen inhalte auch nachtr&#228;glich zu ver&#228;ndern, um 1-1 klone zu unterlaufen.</description>
		<content:encoded><![CDATA[<p>@henning - wenn google auf 90% gleichheit checken wollte, dann w&#252;rden die mit dem rechnen nie fertig werden. abgesehen davon w&#228;re es schon schwer genug &#252;berhaupt 90% &#252;bereinstimmung zu definieren. und es d&#252;rfte auch keinen sinn machen.</p>
<p>schon die suche und erkennung nahezu identischer seiten &#252;berfordert google ja oft genug, wie man an den ganzen &#252;blen proxy-klau konstrukten sehen kann.</p>
<p>@walid - wer weiss schon, wie gut google inhalte von navigation, werbung und anderen elementen unterscheiden kann. aber es k&#246;nnte durchaus sinn machen die eigenen inhalte auch nachtr&#228;glich zu ver&#228;ndern, um 1-1 klone zu unterlaufen.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Walid</title>
		<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99031</link>
		<dc:creator>Walid</dc:creator>
		<pubDate>Sun, 10 Jun 2007 06:54:31 +0000</pubDate>
		<guid>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99031</guid>
		<description>Geht es um die Struktur oder dem reinen Content, z.B. einen Artikel? Dieser &#228;ndert sich bei Content-Klau bekanntlich nicht. Obwohl, Textgeneratoren mit Thesaurus erfreuen sich bei den einfallslosen Zeitgenossen h&#246;chster Beliebtheit. W&#252;rde mich nicht wundern wenn Google in seinem Algo ebenfalls einen Synonyme-Erkennungs-und-Auswertungs-Skript einbaut. 
Ich sehe ein Licht!

Sch&#246;ne Gr&#252;&#223;e aus T&#252;bingen</description>
		<content:encoded><![CDATA[<p>Geht es um die Struktur oder dem reinen Content, z.B. einen Artikel? Dieser &#228;ndert sich bei Content-Klau bekanntlich nicht. Obwohl, Textgeneratoren mit Thesaurus erfreuen sich bei den einfallslosen Zeitgenossen h&#246;chster Beliebtheit. W&#252;rde mich nicht wundern wenn Google in seinem Algo ebenfalls einen Synonyme-Erkennungs-und-Auswertungs-Skript einbaut.<br />
Ich sehe ein Licht!</p>
<p>Sch&#246;ne Gr&#252;&#223;e aus T&#252;bingen</p>
]]></content:encoded>
	</item>
	<item>
		<title>Von: Strategie zur Vermeidung von Duplicate Content : SEO &#38; SMO</title>
		<link>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99026</link>
		<dc:creator>Strategie zur Vermeidung von Duplicate Content : SEO &#38; SMO</dc:creator>
		<pubDate>Sun, 10 Jun 2007 06:33:48 +0000</pubDate>
		<guid>http://www.suchmaschinen-optimierung-seo.info/sosblog/2007/06/09/schneller-als-der-bot-erlaubt/#comment-99026</guid>
		<description>[...] Gerald hat auf seinem Blog eine hervorragende Idee zur Vermeidung von Duplicate Content und somit auch eine optimale Strategie gegen den Content-Klau publiziert - f&#252;r Hardcore-SEOs und solche die es werden wollen eine absolute Pflichtlekt&#252;re!   Unter Vernachl&#228;ssigung der Lorentz-Kontraktion ist es mir aufgrund meiner relativistischen &#220;berlegungen gelungen, eine Strategie zur Vermeidung von Duplicate Content in Weblogs zu entwickeln! Die Vorgehensweise ist ganz einfach, man muss nur schneller sein als der Bot, d.h. man muss schneller den Content &#228;ndern als der Bot die Seiten ziehen kann.  Mr Wong del.icio.us Digg Web News Yigg  SEOigg it! [...]</description>
		<content:encoded><![CDATA[<p>[&#8230;] Gerald hat auf seinem Blog eine hervorragende Idee zur Vermeidung von Duplicate Content und somit auch eine optimale Strategie gegen den Content-Klau publiziert - f&#252;r Hardcore-SEOs und solche die es werden wollen eine absolute Pflichtlekt&#252;re!   Unter Vernachl&#228;ssigung der Lorentz-Kontraktion ist es mir aufgrund meiner relativistischen &#220;berlegungen gelungen, eine Strategie zur Vermeidung von Duplicate Content in Weblogs zu entwickeln! Die Vorgehensweise ist ganz einfach, man muss nur schneller sein als der Bot, d.h. man muss schneller den Content &#228;ndern als der Bot die Seiten ziehen kann.  Mr Wong del.icio.us Digg Web News Yigg  SEOigg it! [&#8230;]</p>
]]></content:encoded>
	</item>
</channel>
</rss>
