Technical SEO

XML Sitemap erstellen — was Google wirklich braucht

Eine XML Sitemap ist kein Ranking-Signal — aber sie ist das direkteste Mittel, um Google mitzuteilen, welche Seiten einer Website indexiert werden sollen. Wer die Sitemap falsch befüllt, verschwendet Crawling-Budget und signalisiert Suchmaschinen ungewollt, dass auch schwache oder doppelte Inhalte relevant sind. Dieser Artikel erklärt, was in eine XML Sitemap gehört, was definitiv nicht hineingehört, wie die technische Umsetzung aussieht und wie die Einreichung in der Google Search Console korrekt erfolgt.
6 Min Lesezeit ·
Inhaltsverzeichnis
  1. Was eine XML Sitemap ist — und was sie nicht ist
  2. Welche URLs in die XML Sitemap gehören — und welche nicht
  3. Technische Struktur einer XML Sitemap
  4. XML Sitemaps für mehrsprachige Websites
  5. Sitemap in der Google Search Console einreichen
  6. Häufige Fehler bei XML Sitemaps — und wie man sie vermeidet
  7. XML Sitemap und Crawling-Budget — der Zusammenhang
  8. Tools zur XML Sitemap-Erstellung

Was eine XML Sitemap ist — und was sie nicht ist

Eine XML Sitemap ist eine strukturierte Datei, die Suchmaschinen-Crawlern eine Liste der URLs einer Website bereitstellt. Sie ist kein Ranking-Faktor im direkten Sinne, aber sie beeinflusst, welche Seiten Google überhaupt findet und wie effizient das Crawling abläuft. Google selbst beschreibt Sitemaps in der Search Central-Dokumentation als besonders hilfreich für große Websites, neue Websites ohne starkes internes Verlinkungsnetz und Seiten mit Rich-Media-Inhalten.

Was eine XML Sitemap nicht leistet: Sie garantiert keine Indexierung. Google entscheidet selbst, ob eine URL indexiert wird — die Sitemap ist eine Empfehlung, kein Befehl. Wer das missversteht und schwache Seiten in die Sitemap aufnimmt, riskiert, dass Google diese Seiten crawlt, aber trotzdem nicht indexiert — und dabei Crawling-Budget verbraucht, das für wichtige Seiten fehlt.

Der Unterschied zur robots.txt ist grundlegend: Die robots.txt sagt Crawlern, was sie nicht besuchen sollen. Die XML Sitemap sagt, was sie besuchen sollen. Beide Dateien ergänzen sich, ersetzen sich aber nicht gegenseitig.

Welche URLs in die XML Sitemap gehören — und welche nicht

Die häufigste Fehlerquelle bei XML Sitemaps ist eine zu großzügige URL-Auswahl. Die Grundregel lautet: In die Sitemap gehören ausschließlich URLs, die indexiert werden sollen und indexiert werden können.

URLs, die in die Sitemap gehören

  • Alle kanonischen, indexierbaren Seiten mit eigenständigem Inhalt
  • Produktseiten, Kategorieseiten, Blogartikel, Landingpages
  • Seiten mit hreflang-Varianten (alle Sprachversionen)
  • Seiten, die intern verlinkt sind und Traffic-Potenzial haben

URLs, die nicht in die Sitemap gehören

  • Seiten mit noindex-Direktive — das ist ein direkter Widerspruch
  • Weiterleitungen (301, 302) — nur die Ziel-URL gehört rein
  • Duplicate-Content-URLs ohne Canonical auf sich selbst
  • Utility-Seiten wie Login, Warenkorb, Suchergebnisseiten
  • URLs mit Parametern, die keinen eigenständigen Inhalt erzeugen
  • Seiten mit dünnem Inhalt, die bewusst nicht indexiert werden sollen

Ein häufiger Fehler in CMS-Systemen wie WordPress: Plugins wie Yoast oder Rank Math generieren automatisch Sitemaps, die Tag-Seiten, Autoren-Archive und Anhang-Seiten einschließen. Diese sollten gezielt ausgeschlossen werden. Wer Canonical Tags korrekt setzt, sollte sicherstellen, dass nur die kanonische URL in der Sitemap erscheint — nicht die Duplikate.

Technische Struktur einer XML Sitemap

Das Format einer XML Sitemap ist durch das Sitemaps-Protokoll (sitemaps.org) standardisiert. Eine valide Sitemap sieht so aus:

<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
  <url>
    <loc>https://example.com/leistungen/</loc>
    <lastmod>2024-11-01</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.8</priority>
  </url>
</urlset>

Wichtige Hinweise zur technischen Umsetzung:

  • loc: Die vollständige, kanonische URL inklusive Protokoll (https). Keine relativen Pfade.
  • lastmod: Das Datum der letzten inhaltlichen Änderung im ISO-8601-Format (YYYY-MM-DD). Nur angeben, wenn der Wert korrekt ist — falsche lastmod-Werte untergraben das Vertrauen von Google in die Sitemap.
  • changefreq und priority: Google ignoriert diese Felder laut eigener Aussage weitgehend. Sie können weggelassen werden.
  • Maximale Größe pro Sitemap-Datei: 50.000 URLs oder 50 MB unkomprimiert.

Sitemap-Index-Datei für große Websites

Websites mit mehr als 50.000 URLs oder mehreren Inhaltsbereichen nutzen eine Sitemap-Index-Datei, die auf einzelne Sitemaps verweist:

<?xml version='1.0' encoding='UTF-8'?>
<sitemapindex xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
  <sitemap>
    <loc>https://example.com/sitemap-seiten.xml</loc>
  </sitemap>
  <sitemap>
    <loc>https://example.com/sitemap-blog.xml</loc>
  </sitemap>
</sitemapindex>

Diese Struktur erlaubt es, Sitemaps nach Inhaltstypen zu segmentieren — praktisch für die Analyse in der Search Console, weil Crawling-Daten pro Sitemap-Datei ausgewertet werden können.

XML Sitemaps für mehrsprachige Websites

Wer eine Website für den DACH-Markt mit separaten Sprachversionen betreibt, muss hreflang-Annotationen entweder im HTML-Head, im HTTP-Header oder in der XML Sitemap hinterlegen. Die Sitemap-Methode ist technisch valide und oft einfacher zu pflegen als HTML-Implementierungen. Wie das für DE, AT und CH korrekt umgesetzt wird, erklärt der Artikel zu Hreflang Tags für den DACH-Raum im Detail.

Grundprinzip: Jede URL-Gruppe muss vollständig sein — jede Sprachvariante verweist auf alle anderen Varianten, inklusive sich selbst.

Sitemap in der Google Search Console einreichen

Eine Sitemap, die nur auf dem Server liegt, aber nicht aktiv eingereicht wurde, wird von Google irgendwann gefunden — aber nicht zuverlässig und nicht sofort. Die Einreichung über die Google Search Console ist der direkte Weg.

  1. In der Search Console die Property aufrufen
  2. Im linken Menü unter „Indexierung" → „Sitemaps" navigieren
  3. Die vollständige URL der Sitemap eingeben (z.B. https://example.com/sitemap.xml)
  4. Auf „Senden" klicken

Zusätzlich sollte die Sitemap-URL in der robots.txt hinterlegt sein:

Sitemap: https://example.com/sitemap.xml

Das ermöglicht anderen Crawlern (Bing, DuckDuckGo) die automatische Erkennung ohne manuelle Einreichung.

Häufige Fehler bei XML Sitemaps — und wie man sie vermeidet

Die Google Search Console zeigt unter „Sitemaps" direkt an, ob Fehler vorliegen. Die häufigsten Probleme in der Praxis:

noindex-URLs in der Sitemap

Wenn eine URL in der Sitemap steht, aber einen noindex-Meta-Tag trägt, sendet das widersprüchliche Signale. Google wird die Seite crawlen (wegen der Sitemap), aber nicht indexieren (wegen noindex) — und dabei Crawling-Budget verbrauchen. Regelmäßige Audits mit Tools wie Screaming Frog oder Ahrefs decken solche Inkonsistenzen auf.

Weiterleitungen in der Sitemap

Sitemaps sollten ausschließlich finale Ziel-URLs enthalten. Wenn eine URL in der Sitemap auf eine andere URL weiterleitet, folgt Google zwar der Weiterleitung — aber es ist ein unnötiger Umweg. Nach URL-Umstrukturierungen oder Domain-Migrationen müssen Sitemaps aktualisiert werden.

Veraltete oder gefälschte lastmod-Werte

Manche CMS-Plugins setzen das aktuelle Datum als lastmod, auch wenn sich der Inhalt nicht geändert hat. Google erkennt dieses Muster und ignoriert lastmod-Werte, denen es nicht vertraut. Nur echte Änderungsdaten angeben oder das Feld weglassen.

JavaScript-generierte URLs fehlen in der Sitemap

Websites, die stark auf JavaScript-Rendering setzen, haben oft das Problem, dass dynamisch geladene URLs nicht in der Sitemap erscheinen. Wer wissen möchte, wo Crawler bei JavaScript-lastigen Seiten an Grenzen stoßen, findet eine detaillierte Analyse im Artikel zu JavaScript SEO.

XML Sitemap und Crawling-Budget — der Zusammenhang

Crawling-Budget ist die Anzahl der Seiten, die Googlebot innerhalb eines bestimmten Zeitraums crawlt. Für kleine Websites mit wenigen hundert Seiten ist das kein relevantes Thema. Für große E-Commerce-Websites, Portale oder Websites mit tausenden von Seiten ist es entscheidend.

Eine saubere XML Sitemap, die nur hochwertige, indexierbare URLs enthält, hilft Google, das Crawling-Budget effizient einzusetzen. In Kombination mit einer durchdachten Internal Linking Strategie — die wichtige Seiten stärker verlinkt — entsteht ein kohärentes Signal darüber, welche Inhalte Priorität haben.

Wer die technische Grundlage weiter festigen möchte, findet im übergeordneten Technical SEO Pillar-Artikel eine vollständige Checkliste aller relevanten Maßnahmen — von HTTPS über Core Web Vitals bis zur Sitemap-Konfiguration.

Tools zur XML Sitemap-Erstellung

Für die meisten Websites ist keine manuelle Erstellung notwendig. Bewährte Optionen:

  • Yoast SEO / Rank Math (WordPress): Automatische Sitemap-Generierung mit Konfigurationsoptionen für Ausschlüsse
  • Screaming Frog SEO Spider: Crawlt die Website und exportiert eine valide Sitemap — nützlich für Audits und nicht-CMS-Websites
  • Google Search Console: Zeigt nach Einreichung, wie viele URLs entdeckt und indexiert wurden
  • xml-sitemaps.com: Einfaches Online-Tool für kleinere Websites ohne CMS

Nach der Erstellung empfiehlt sich eine Validierung mit dem Sitemap Validator von xml-sitemaps.com oder direkt über die Search Console, die Fehler im Format und in der URL-Struktur meldet.

Häufige Fragen

Muss jede Website eine XML Sitemap haben? +
Technisch nein — Google findet Seiten auch über interne Links. Praktisch empfohlen für alle Websites mit mehr als 20–30 Seiten, neue Websites ohne externe Verlinkung und Websites mit häufig wechselnden Inhalten. Eine korrekte XML Sitemap beschleunigt die Indexierung und gibt Google ein klares Signal, welche URLs relevant sind.
Was passiert, wenn eine noindex-Seite in der Sitemap steht? +
Google crawlt die Seite (weil die Sitemap sie empfiehlt), indexiert sie aber nicht (wegen noindex). Das Ergebnis: verschwendetes Crawling-Budget und widersprüchliche Signale. Alle URLs in der Sitemap sollten indexierbar sein — also weder noindex noch durch robots.txt geblockt.
Wie oft sollte eine XML Sitemap aktualisiert werden? +
Die Sitemap sollte immer den aktuellen Stand der Website widerspiegeln. Bei CMS-Systemen mit automatischer Sitemap-Generierung (Yoast, Rank Math) geschieht das automatisch. Bei manuell gepflegten Sitemaps: nach jeder URL-Änderung, nach neuen Inhalten und nach dem Entfernen von Seiten aktualisieren und erneut in der Search Console einreichen.
Wie viele URLs darf eine XML Sitemap enthalten? +
Eine einzelne Sitemap-Datei darf maximal 50.000 URLs enthalten und darf 50 MB unkomprimiert nicht überschreiten. Websites mit mehr URLs nutzen eine Sitemap-Index-Datei, die auf mehrere einzelne Sitemaps verweist. Diese Struktur ermöglicht auch eine sinnvolle Segmentierung nach Inhaltstypen.

Du hast den Artikel gelesen.
Jetzt umsetzen?

Wir analysieren in 5 Minuten wo deine Website strukturell unsichtbar ist — kostenlos, ohne Verkaufsdruck.

Kostenlose Analyse starten