Von Christian Wilms · 8. Juni 2026 · Werkstatt

Wird Ihr Shop von ChatGPT gefunden? In 10 Minuten selbst prüfen

Machen Sie ein kurzes Experiment: Fragen Sie ChatGPT nach Ihrem wichtigsten Produkt, etwa “Welcher Shop verkauft robuste Werkbänke für die Garage mit Lieferung nach Österreich?”. Wenn die Antwort drei Wettbewerber nennt und Ihr Shop fehlt, haben Sie ein Sichtbarkeitsproblem, das in keinem Google-Ranking-Report auftaucht. Die gute Nachricht: Ob KI-Systeme Ihren Shop überhaupt besuchen, steht schwarz auf weiß in Ihren Server-Logs. Sie brauchen dafür kein Tool und kein Abo. Zehn Minuten und ein Terminal reichen.

Warum das überhaupt zählt

Produktrecherche verlagert sich zum Teil von der Suchmaschine in den Chat. ChatGPT, Perplexity und Gemini beantworten Fragen wie “beste Werkbank bis 300 Euro” nicht mit zehn Links, sondern mit einer fertigen Empfehlung samt Quellen. Dazu kommen Einkaufsagenten: Systeme, die im Auftrag des Nutzers Produktseiten abrufen, Preise vergleichen und Verfügbarkeiten prüfen, bevor der Mensch überhaupt einen Browser öffnet.

Die Mechanik dahinter ist nüchtern. Eine KI kann nur Shops empfehlen, deren Seiten sie gelesen hat. Das passiert auf zwei Wegen: vorab über Crawler, die einen Suchindex oder Trainingsdaten aufbauen, und live im Moment der Frage, wenn das System gezielt einzelne Seiten abruft. Beide Wege hinterlassen Spuren in Ihren Access-Logs. Genau dort schauen wir jetzt rein.

Schritt 1: Server-Logs nach KI-Bots durchsuchen

Jeder Webserver schreibt ein Access-Log. Bei Apache liegt es typischerweise unter /var/log/apache2/, bei nginx unter /var/log/nginx/. Auf Shared Hosting finden Sie die Logfiles meist im Kundenmenü zum Download, oft unter “Statistiken” oder “Logfiles”. Laden Sie die Datei der letzten Woche herunter und greppen Sie nach den bekannten KI-User-Agents:

grep -iE 'gptbot|oai-searchbot|chatgpt-user|claudebot|claude-user|perplexitybot|perplexity-user' access.log \
  | awk -F'"' '{print $6}' \
  | sort | uniq -c | sort -rn

# Beispiel-Ausgabe (Zahlen fiktiv):
#  412 Mozilla/5.0 ... (compatible; GPTBot/1.2; +https://openai.com/gptbot)
#   88 ... (compatible; OAI-SearchBot/1.0; +https://openai.com/searchbot)
#   17 ... (compatible; ChatGPT-User/1.0; +https://openai.com/bot)

Der awk-Teil zieht aus dem üblichen Combined-Log-Format das User-Agent-Feld heraus, der Rest zählt die Treffer pro Bot.

Was die einzelnen Bots bedeuten

  • GPTBot sammelt Trainingsdaten für die Modelle von OpenAI.
  • OAI-SearchBot baut den Suchindex der ChatGPT-Suche auf. Treffer hier heißen: Ihr Shop ist Kandidat für Quellenangaben.
  • ChatGPT-User ruft Seiten live ab, wenn ein Nutzer gerade eine Frage stellt. Das sind die spannendsten Zeilen im Log, denn hinter jedem Abruf steckt ein echter Mensch mitten in einer Recherche.
  • PerplexityBot und Perplexity-User sind die Entsprechungen bei Perplexity, ClaudeBot und Claude-User die von Anthropic.
  • Google-Extended werden Sie im Log vergeblich suchen: Das ist kein eigener Crawler, sondern nur ein Steuer-Token für die robots.txt. Gecrawlt wird weiterhin vom normalen Googlebot, das Token regelt lediglich, ob Google die Inhalte für seine KI-Modelle verwenden darf.

Null Treffer über mehrere Wochen sind ebenfalls ein Befund: Entweder ist Ihre Domain für die Systeme schlicht noch nicht relevant genug, oder Sie blockieren die Bots, ohne es zu wissen. Letzteres habe ich in Audits schon oft genug gesehen, um zuerst danach zu schauen.

Schritt 2: robots.txt und Bot-Schutz prüfen

Öffnen Sie https://ihr-shop.de/robots.txt im Browser und suchen Sie nach den Bot-Namen aus Schritt 1. Manche SEO- und Security-Plugins setzen Sperren für KI-Crawler als Standardeinstellung, gern unter wohlklingenden Labels wie “Content-Schutz”. Bei einem mittelständischen Händler mit rund 1.800 Produkten habe ich genau das erlebt: Ein Plugin-Update hatte GPTBot und PerplexityBot still ausgesperrt, monatelang, und niemand hatte es bemerkt.

Eine bewusste Konfiguration kann so aussehen:

# Live-Abrufe und Suchindex: erlaubt
User-agent: OAI-SearchBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: PerplexityBot
Allow: /

# Training: bewusste Entscheidung des Betreibers
User-agent: GPTBot
Allow: /

User-agent: Google-Extended
Allow: /

Ob Sie Trainings-Crawler wie GPTBot zulassen, ist eine legitime Abwägung. Für einen Shop spricht viel dafür: Was im Index und im Modell steckt, kann empfohlen werden. Die Live-Abruf-Bots zu sperren ist dagegen fast immer ein Eigentor, denn dann schlägt die Empfehlung genau im Moment der Kundenfrage fehl.

Zweite Falle: Der Bot-Schutz von CDNs und Web-Firewalls überstimmt jede robots.txt. Im Browser sieht alles normal aus, Bots bekommen aber einen 403 oder eine Challenge-Seite. Testen lässt sich das mit einem simulierten Bot-Abruf: curl -s -o /dev/null -w "%{http_code}" -A "Mozilla/5.0 (compatible; GPTBot/1.2)" https://ihr-shop.de/. Kommt hier keine 200 zurück, hilft die schönste robots.txt nichts.

Schritt 3: Sind Ihre Produktdaten maschinenlesbar?

Dass ein Bot vorbeikommt, heißt noch nicht, dass er etwas Brauchbares vorfindet. Einkaufsagenten und Antwortmaschinen arbeiten am liebsten mit strukturierten Daten nach Schema.org. Für Shops zählt vor allem der Typ Product mit Preis, Währung, Verfügbarkeit, SKU oder GTIN und idealerweise Bewertungen.

Der Schnelltest: Öffnen Sie den Quelltext einer Produktseite (Strg+U) und suchen Sie nach application/ld+json. Dort sollte ein Block mit “@type”: “Product” stehen, inklusive offers, price, priceCurrency und availability. Wer es genauer wissen will, prüft die URL mit validator.schema.org.

Die häufigste Falle dabei: Viele Shop-Themes rendern Preis und Verfügbarkeit erst per JavaScript im Browser nach. Ein Bot, der das rohe HTML abholt, sieht dann eine Produktseite ohne Preis. Der Gegencheck dauert eine Zeile: curl -s https://ihr-shop.de/produkt-x/ | grep -c 'ld+json'. Steht da eine 0, existieren Ihre strukturierten Daten für Maschinen schlicht nicht, egal was der Browser anzeigt. Auch eine gepflegte GTIN ist mehr als Kosmetik: Über sie ordnen Agenten Ihr Angebot demselben Produkt zu, das sie gerade bei anderen Händlern vergleichen.

Drei Sofortmaßnahmen

1. Bot-Zugriff bewusst regeln statt dem Plugin-Default vertrauen

Gehen Sie robots.txt, Security-Plugins und CDN-Einstellungen einmal komplett durch. Live-Abruf-Bots wie ChatGPT-User, OAI-SearchBot und Perplexity-User sollten durchkommen und eine 200 erhalten. Bei Trainings-Crawlern entscheiden Sie selbst, aber entscheiden Sie aktiv und dokumentieren Sie die Entscheidung.

2. Product-Schema vervollständigen, serverseitig

Preis, Währung, Verfügbarkeit, GTIN und Bewertungen gehören als JSON-LD ins ausgelieferte HTML, nicht erst ins JavaScript-Rendering. Das ist in den meisten Shopsystemen Konfigurationsarbeit oder ein kleines Template-Update, kein Großprojekt.

3. Antwortfähige Inhalte schaffen

KI-Systeme zitieren Seiten, die Fragen präzise beantworten. Klare Absätze zu Lieferzeit, Rückgabe, Kompatibilität und Einsatzzweck, als normaler Text auf Produkt- und Kategorieseiten, schlagen jede Marketing-Floskel. Schreiben Sie die Fakten so auf, dass man sie wörtlich als Antwort übernehmen könnte.

Fazit: Erst messen, dann optimieren

Sie müssen nicht raten, ob Ihr Shop für KI-Systeme existiert. Greppen Sie heute die Logs der letzten Woche, prüfen Sie robots.txt samt Bot-Schutz und werfen Sie einen Blick in den Quelltext einer Produktseite. Notieren Sie die Trefferzahlen pro Bot und wiederholen Sie die Auswertung monatlich. Steigende Abrufe von ChatGPT-User und OAI-SearchBot sind das ehrlichste Signal, dass Ihr Shop im neuen Einstiegskanal stattfindet. Bleiben die Zahlen auf null, wissen Sie jetzt, an welcher der drei Stellschrauben Sie zuerst drehen müssen.