Eine inkonsistente Gestaltung der Webadressen (also des URL-Layouts) kann dazu führen, dass die Suchmaschine doppelte Inhalte findet, obwohl jedes Dokument in vorliegender Form nur ein einziges Mal existiert. Dieser sogenannte Duplicate Content (doppelter Inhalt) wurde in der Vergangenheit häufig dafür verantwortlich gemacht, wenn das Ranking von Websites einbrach. Grund genug für Webmaster, unfreiwilligen Duplicate Content zu vermeiden.
Schauen wir uns einmal die folgenden Beispieladressen an:
http://www.seo-usability.de/start.php?se=532424876367
http://www.seo-usability.de/start.php?se=39485602
Würden Sie hinter diesen beiden Adressen unterschiedliche oder identische Seiten erwarten? Beides wäre denkbar: Bei dem Parameter „se“ könnte es sich um eine Session-ID handeln, die zum Tracking des Nutzers eingesetzt wird. Da diese in der Regel bei jedem Besuch neu vergeben wird, ändert sich diese und damit auch die URL ständig. Der Parameter könnte aber auch völlig anders verwendet werden und als Kennziffer zur Spezifizierung von Seiteninhalten dienen. In einem solchen Fall würden die beiden Adressen unterschiedliche Seiten aufrufen. Sehr komplex kann es werden, wenn beide Aspekte miteinander vermischt werden.
Für eine Suchmaschine können Parameter zu größeren Problemen führen. Selbst für einen Menschen ist nicht immer auf die Schnelle zu erkennen, ob es sich bei einem der Parameter um eine Session-ID handelt, oder nicht So könnte es durchaus vorkommen, dass ein und dieselbe Seite mehrmals indexiert wird, weil der Robot unterschiedliche URLs erkennt und damit von einem neuen Dokument ausgeht.
Parameter führen also dann zu Duplicate Content, wenn sich diese von Aufruf zu Aufruf ändern. Sie müssen für Ihre Website nicht zwingend auf alle Parameter verzichten, aber in jedem Fall dafür sorgen, dass die Adressen konstant bleiben.
Reduzieren Sie die Anzahl der Parameter dabei aber auf ein Minimum. Dadurch verringern Sie das Risiko, dass ein Dokument über unterschiedliche Parameter-Konstellationen erreichbar ist.
Die folgenden Adressen rufen das gleiche Dokument auf, können aber als unterschiedliche Adressen interpretiert werden und damit auch wieder doppelten Content generieren:
http://www.seo-usability.de/start.php?a=1&b=2
http://www.seo-usability.de/start.php?b=2&a=1
Ganzen Artikel lesen...
Das beschriebene Problem betrifft vor allem solche Systeme, die ihre Inhalte dynamisch zusammensetzen,wie beispielsweise Content-Management-Systeme (CMS). Jede Anfrage läuft über eine zentrale Steuerdatei (Dispatcher), die sich um die Zusammenstellung der Ausgabe kümmert. Wie im Beispiel von eben beschrieben, werden konkrete Seiten in einem solchen Fall über Parameter spezifiziert. Um der Parameter-Problematik von Vornherein aus dem Weg zu gehen, besteht bei vielen CMS die Möglichkeit, die URL umzuschreiben. Aus einem http://www.seo-usability.de/index.php?id=2387 wird dann beispielsweise ein http://www.seo-usability.de/2387. Bei solchen parameterlosen Adressen spricht man auch von selbstsprechenden URLs.
Umstellung des URL-Layouts
Sollten Sie Ihr System nachrüsten wollen, so müssen Sie zunächst bestimmen, welchem Format der Aufbau der URL folgen soll. Anschließend müssen Sie die Links aller HTML-Dokumente in selbstsprechende Adressen umschreiben.
Damit der Server dieses neue Format auch versteht, muss dieser entsprechend vorbereitet werden. Für den Apache-Server steht mit dem Rewrite-Modul eine elegante Möglichkeit zur Verfügung, selbstsprechende URLs bei einem Seitenaufruf automatisch in die Ursprungsform zurückzuwandeln. Dies ist erforderlich, damit das System auch weiterhin funktioniert.
Bevor Sie hier aktiv Hand anlegen, sollten Sie prüfen, ob Ihr CMS nicht von Haus aus eine entsprechende Option für suchmaschinenfreundliche URLs mitbringt. Für die bekannten Open-Source-CMS stehen ausreichend Lösungen zur Verfügung.
In jedem Fall sollten Sie aber vor einer solchen Umstellung untersuchen, ob es mit dem bisherigen Layout wirklich Probleme gab und ob eine Änderung zu einer Besserung führt. Rein technisch gesehen handelt es sich bei einer solchen Umstellung um einen Umzug aller Dokumente an eine neue Adresse. Mit welchen Problemen dies verbunden ist und wie man diesen günstiger Weise begegnet, werden wir im Abschnitt „Server“ besprechen.
Probleme mit doppeltem Content können in den Google Webmaster-Tools auch an einer niedrigen Crawling-Geschwindigkeit festgestellt werden. Manchmal lässt sich eine Mehrfachindexierung eines Dokumentes auch im Index über eine konkrete Suche feststellen. Möglich ist aber auch, dass Sie bei der Prüfung aller indexierten Seiten Ihrer Domain (site-Operator) auf eine ungewöhnlich hohe Anzahl stoßen, was ebenfalls auf eine fehlerhafte Indexierung hinweisen kann.
Google empfiehlt übrigens, auf eine Umschreibung zu verzichten. Dies rührt mit Sicherheit auch daher, dass durch falsche Konfiguration der Umschreibung mehr Probleme entstehen können, als verhindert werden. Offenbar scheint es, dass man die eben beschriebenen Probleme in Griff hat. Für die Praxis ist allerdings eine saubere Umschreibung auf selbstsprechende Adressen nach wie vor zu empfehlen.

Steven Broschart
Lernen Sie die ganze Vielfalt vom Franzis Buch- und Softwareverlag kennen