Direkte Antwort: Das Auslesen der Google-Funktion „Nutzer fragen auch“ (PAA) ist eine dynamische SERP-Box, die erweiterbare Frage-Antwort-Paare zu einer Suchanfrage anzeigt und JavaScript-Rendering, HTML-Parsing und strukturierte Datenextraktion erfordert. Crawlbase Crawling API (Eine Web-Crawling-Lösung, die Headless-Browsing, Proxy-Rotation und Anti-Bot-Logik übernimmt), mit der Sie zuverlässig PAA-Fragen, Antworten und verschachtelte Erweiterungen sammeln und anschließend sauberes JSON für SEO-Analysen, die Ermittlung von Content-Gaps und das Topic-Clustering über verschiedene Märkte hinweg ausgeben können.

Die „Nutzer fragen auch“-Box (People Also Ask, PAA) von Google erscheint bei etwa 40 bis 45 Prozent der Google-Suchanfragen und ist damit eine der beständigsten Quellen für die Nutzerabsicht außerhalb der organischen Suchergebnisse.

Für SEO-Experten sind PAA-Daten besonders wertvoll, da sie Folgendes aufdecken:

  • Die tatsächliche Nutzerabsicht hinter einem Keyword
  • Inhaltslücken, die Wettbewerber nicht geschlossen haben
  • FAQ und Möglichkeiten zur Themenclusterung
  • Ausgewählte Snippet-Ziele

Diese Anleitung beschreibt, wie man Google People Also Ask programmatisch ausliest. Crawlbase Crawling APISie extrahieren Fragen, Antworten und verschachtelte Erweiterungen und verwenden diese Daten dann für die Inhaltslückenanalyse, die Erstellung von FAQs und die Themengruppierung über verschiedene Märkte hinweg.

Der vollständige Quellcode ist verfügbar in der ScraperHub-Repository.

Definition

PAA-Erweiterungsbaum: Wenn ein Nutzer auf eine Frage klickt, lädt Google 2–4 weitere, thematisch verwandte Fragen. Dadurch entsteht eine kaskadierende Struktur. Die meisten Web-Scraping-Systeme erfassen jedoch nur die ersten 3–4 sichtbaren Elemente und verpassen alles, was darüber hinausgeht.

Wie kann man Google-Daten scrapen? Nutzer fragen auch

Im Prinzip erfordert das Scraping von PAA das Rendern der Seite, nicht nur das Anfordern der Seite.

Eine einfache HTTP-Anfrage reicht nicht aus, da PAA-Inhalte erst nach der Initialisierung der Seite geladen und bei Interaktion dynamisch aktualisiert werden.

Um es zuverlässig zu extrahieren:

  1. Sende eine Google-Such-URL mit den Parametern gl und hl an eine Rendering-API.
  2. Warten Sie auf die JavaScript-Ausführung, typischerweise etwa 2000 ms.
  3. Parsen Sie das zurückgegebene HTML mithilfe von Fallback-Selektoren.
  4. Strukturieren Sie die Ausgabe in JSON.

Wenn Sie den Rendering-Schritt überspringen, ist der PAA-Abschnitt entweder unvollständig oder fehlt vollständig.

Was extrahiert werden soll: Googles PAA-Datenstruktur

Sobald Sie das gerenderte HTML haben, besteht der nächste Schritt darin, die Daten so zu strukturieren, dass sie tatsächlich nutzbar sind.

Ein vollständiger PAA-Datensatz sieht typischerweise so aus:

1
2
3
4
5
6
{
"Frage": "...",
"Antwort": "...",
"source_url": "...",
"Kinder": []
}

Jedes Feld dient einem bestimmten Zweck:

  • Frage: Erweiterung der Keyword-Abdeckung und Themenfindung
  • Antwort: Hilft bei der Optimierung von Featured Snippets.
  • source_url: Unterstützt die Wettbewerbsanalyse
  • Kinder: erfasst tiefere Ebenen des Expansionsbaums

Man kann es sich auch so vorstellen, dass jede Frage zu einem Knotenpunkt wird und jede Erweiterung weitere Knotenpunkte darunter hinzufügt.

Die meisten Web-Scraper stoppen bei der ersten Ebene. Dadurch bleibt ein großer Teil der verfügbaren Daten unberührt.

Warum verwenden Crawlbase für Googles PAA-Extraktion

An diesem Punkt liegt die größte Herausforderung nicht im Parsen selbst, sondern darin, zuverlässigen, vollständig gerenderten HTML-Code von Google zu erhalten.

Crawlbase vereinfacht den gesamten Prozess. Anstatt Headless-Browser, Proxys und Wiederholungslogik zu verwalten, arbeiten Sie mit einem einzigen API-Endpunkt, der diese Ebenen für Sie übernimmt.

Das Crawling API verwendet eine Basis-URL:

1
https://api.crawlbase.com

Sie benötigen lediglich zwei Parameter:

  • token
  • url

Für die Google-Suchergebnisse sollten Sie Ihre JavaScript-Token Fügen Sie außerdem page_wait hinzu, damit der PAA-Abschnitt Zeit zum Laden hat. Für Stabilität wird ein Timeout von mindestens 90 Sekunden empfohlen.

Hier ist eine Beispielanfrage:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
importieren Zugriffe

# Ersetzen Sie durch Ihre Crawlbase JS-Token
Token = "IHR_JS_TOKEN"

URL = "https://www.google.com/search?q=web+scraping&gl=us&hl=en"

Parameter = {
"Zeichen": Token,
"URL": URL,
"Seite_warten": 2000
}

Antwort = Anfragen.get("https://api.crawlbase.com/", params=params, timeout=90)
html = response.text

Diese einzelne Anfrage liefert bereits vollständig gerendertes HTML inklusive des PAA-Abschnitts. Anschließend können Sie die Antwort direkt an Ihren Parser weiterleiten.

Dies ersetzt einen kompletten Stack, der andernfalls Browserautomatisierungstools, Proxy-Rotationssysteme und benutzerdefinierte Anti-Blockierungsbehandlung umfassen würde. Diese Einfachheit ermöglicht es, die PAA-Extraktion über einige wenige Abfragen hinaus skalierbar zu gestalten.

Wie führt man einen vollständigen Google PAA-Scraper aus?

Nachdem die einzelnen Bausteine ​​nun feststehen, ist der schnellste Weg zum Einstieg nicht, alles manuell zu erstellen, sondern eine fertige Implementierung zu verwenden.

Das ScraperHub-Repository enthält bereits eine funktionierende Pipeline zum Abrufen, Parsen und Exportieren von PAA-Daten. Sie können diese klonen und innerhalb weniger Minuten lokal ausführen.

Schritt 1: Klonen Sie den Scraper

Gehe zum Repository: ScraperHub/How-to-scrape-google-PAA

Klonen Sie es:

1
2
git klonen https://github.com/ScraperHub/how-to-scrape-google-people-also-ask.git
cd Wie man Google-Nutzerdaten ausliest

Schritt 2: Verstehen Sie die Funktionsweise des Schabers

Vor der Ausführung ist es hilfreich zu wissen, wie die einzelnen Teile zusammenpassen.

  • main.py Erstellt die Such-URL, führt die Pipeline aus und schreibt JSON.
  • config.py Verwaltet Tokens, Wiederholungsversuche und Timeouts
  • fetcher.py bearbeitet Anfragen an Crawlbase
  • parser.py extrahiert PAA-Daten mithilfe von Fallback-Selektoren

Jede Datei erfüllt eine bestimmte Aufgabe. Zusammen bilden sie eine vollständige Scraping-Pipeline.

Schritt 3: Umgebung einrichten

Stellen Sie sicher, dass die neueste Python-Version Nach der Installation richten Sie Ihre Umgebung ein:

1
2
3
4
python3 -m venv .venv
Quelle .venv/bin/activate # Windows: .venv\Scripts\activate

pip install -r Anforderungen.txt

Setze deine Crawlbase Token:

1
2
exportieren CRAWLBASE_TOKEN=Ihr_normales_Token
exportieren CRAWLBASE_JS_TOKEN=Ihr_JS-Token

Das JavaScript-Token or Browseraktivierter API-Schlüssel ist für die Google-Suchergebnisse erforderlich.

Schritt 4: Führen Sie den Scraper aus.

1
python main.py "Wie kann man Google scrapen?"

Dies führt den gesamten Ablauf aus:

  • Erstellt die Google-SERP-URL
  • Ruft gerendertes HTML ab
  • Parsen von PAA-Fragen und -Antworten
  • Ausgabe: strukturiertes JSON

Schritt 5: Passe deine Läufe an

Sie können die Parameter direkt über die Befehlszeilenschnittstelle anpassen.

Land ändern:

1
python main.py "Inhaltslückenanalyse" --country uk -o paa_uk.json

Renderzeit anpassen:

1
python main.py "Best Practices für Web Scraping" --page-wait 3000

Wenn die Ergebnisse unvollständig erscheinen, erhöhen page_wait (Wert in Millisekunden) ist üblicherweise der erste Fixpunkt.

Schritt 6: Testen Sie den Scraper

Führen Sie die Testsuite:

1
python3 run_tests.py

Oder, falls Sie pytest verwenden:

1
python3 -m pytest tests/ -v

Diese Tests verwenden gespeicherten HTML-Code der Google-Suchergebnisseite (SERP), um zu überprüfen, ob Ihr Parser Fragen, Antworten und Quell-URLs weiterhin korrekt extrahiert. So lassen sich schnell Fehler erkennen, die auftreten, wenn Google die Seitenstruktur ändert, bevor umfangreiche Scraping-Aufträge ausgeführt werden.

Erfassung verschachtelter Erweiterungen in Google PAA

Bis hierhin extrahieren Sie die ersten PAA-Fragen. Das allein liefert Ihnen bereits einen nützlichen Datensatz, der jedoch noch unvollständig ist, da der eigentliche Nutzen erst durch die tiefergehende Analyse des Erweiterungsbaums entsteht.

Wenn Sie eine PAA-Frage erweitern, lädt Google dynamisch weitere verwandte Fragen. Jede dieser Fragen kann weitere Erweiterungen auslösen, wodurch eine mehrschichtige Struktur von Suchanfragen entsteht.

Um dieses Verhalten zu erfassen, verwenden Sie die css_click_selector Parameter in der Crawling APIDies ermöglicht es Ihnen, Klicks auf PAA-Elemente zu simulieren, sodass die zusätzlichen Fragen vor dem Parsen geladen werden.

Der Ablauf funktioniert folgendermaßen:

  • Erstellen Sie die SERP-URL mit Ihren Abfrage- und Geoparametern.
  • Rufen Sie den gerenderten HTML-Code mithilfe der Crawling API
  • Analysiere den anfänglichen PAA-Satz
  • Trigger-Erweiterungen verwenden css_click_selector
  • Das aktualisierte DOM erneut abrufen oder neu analysieren.
  • Gib den vollständigen Datensatz aus

Jede Erweiterung fügt Ihren Daten eine weitere Ebene hinzu. In der Praxis kann eine einzelne Abfrage von 3 bis 4 sichtbaren Fragen auf 12 bis 20 Gesamtfragen nach einigen Erweiterungsebenen anwachsen.

Dieser Schritt ist aus Implementierungssicht optional, aber hier liegt der größte Teil des fehlenden Werts.

Wie vergleicht man Google PAA in verschiedenen Ländern?

Die Ergebnisse der PAA sind nicht einheitlich. Sie variieren je nach Ort und Sprache.

Um sie zu vergleichen, führen Sie dieselbe Abfrage mit unterschiedlichen GL-Werten aus:

1
2
3
4
5
Abfragen = [
build_serp_url("beste Laufschuhe", "uns"),
build_serp_url("beste Laufschuhe", "Vereinigtes Königreich"),
build_serp_url("beste Laufschuhe", "de")
]

Vergleichen Sie:

  • Einzigartige Fragen
  • Überschneidende Themen
  • Unterschiede in den Antworten

Dies ist besonders nützlich bei der Expansion in neue Regionen oder bei der Lokalisierung von Inhalten.

Wann sollte man die Enterprise Crawler?

Die Standard Crawling API Es eignet sich gut für kleine Datenmengen, bei denen die Ergebnisse sofort abgerufen werden. Sobald die Anzahl der Abfragen jedoch auf Tausende oder gar Millionen ansteigt, wird die Verwaltung schwieriger.

Das Enterprise Crawler ist für diesen Umfang ausgelegt. Es läuft asynchron, sodass Sie URLs in großen Mengen übertragen und die Ergebnisse später über einen Webhook empfangen können.

Sie müssen Ihren Scraper nicht neu schreiben. Aktualisieren Sie einfach die Anfrage in fetcher.py:

1
2
params["Rückruf"] = richtig
params["Raupen"] = "MyPAACrawler"

Um Ergebnisse zu erhalten, benötigen Sie einen Webhook.

Sie können entweder die Crawlbase Cloud Storage für eine schnelle Einrichtung oder erstellen Sie Ihren eigenen Endpunkt, wenn Sie die volle Kontrolle wünschen.

Wenn Sie selbst einen solchen Server entwickeln, muss er lediglich POST-Anfragen akzeptieren, öffentlich zugänglich sein und schnell eine 200- bis 204-Antwort zurückgeben. Für lokale Tests eignen sich Tools wie beispielsweise Ngrok gut arbeiten.

Verwenden Sie es, wenn Sie große Datensätze erstellen oder wiederkehrende Aufgaben ausführen. Überprüfen Sie die Crawler Dokumentation um mehr zu erfahren.

Anwendungsbeispiele für Google PAA-Daten in der Praxis

PAA-Daten sind direkt in Produktionsabläufen nutzbar, da sie widerspiegeln, wie Benutzer ihre Fragen tatsächlich formulieren.

Sie können es verwenden, um:

  • FAQ-Bereiche erstellen basierend auf tatsächlichen Anfragen anstatt darauf, zu raten, was Nutzer fragen
  • Identifizieren Sie inhaltliche Lücken indem Sie Fragen aufdecken, die Ihre Konkurrenten noch nicht beantwortet haben.
  • Themencluster erstellen indem verwandte Fragen in unterstützenden Artikeln zusammengefasst werden
  • Verbesserung der Ausrichtung von Featured Snippets indem Sie Ihre Antworten an der Art und Weise ausrichten, wie Google bereits Antworten strukturiert.

Der Wert dieser Methode liegt darin, dass sie das Rätselraten bei der Contentplanung beseitigt. Man arbeitet mit Fragen, die bereits in der Suche auftauchen, und nicht mit Annahmen.

Ein SaaS-Team, das sich beispielsweise auf Web-Scraping-Tools spezialisiert hat, könnte aus einer einzigen Abfrage 15 bis 20 Fragen zum Thema Public Accountability (PAA) extrahieren. Anstatt diese als Rohdaten zu behandeln, kann jede Frage in einen eigenen FAQ-Bereich, einen zugehörigen Blogbeitrag oder sogar einen Unterabschnitt innerhalb eines umfassenderen Leitfadens umgewandelt werden.

Im Laufe der Zeit bilden diese Fragen auf natürliche Weise einen Inhaltscluster rund um das Hauptthema, wodurch es einfacher wird, den Bereich umfassend abzudecken und sowohl um Rankings als auch um Featured Snippets zu konkurrieren.

Fazit

PAA ist einer der am meisten unterschätzten Datensätze in der Suche. Wer nur die anfänglichen Fragen erfasst, verpasst die meisten verfügbaren Erkenntnisse.

Mit Crawlbase Mit der ScraperHub-Implementierung können Sie den gesamten Expansionsbaum extrahieren, ihn in nutzbare Daten strukturieren und ihn über verschiedene Märkte skalieren, ohne Browser, Proxys oder Infrastruktur verwalten zu müssen.

Probieren Sie es jetzt selbst aus! ein ... Erstellen Crawlbase Konto Nutzen Sie die 1,000 kostenlosen Anfragen, um den Scraper mit Ihren eigenen Suchanfragen auszuführen. So sehen Sie schnell, wie viele zusätzliche Daten Sie mit einer einzigen Suche gewinnen können.

Häufige Fragen zum Großhandel mit Lebensmitteln und Getränken

Was ist die Rubrik „Nutzer fragen auch“?

Eine PAA-Box ist ein Feature der Google-Suchergebnisseite (SERP), das 3–4 ausklappbare Frage-Antwort-Paare zur Suchanfrage anzeigt. Sie erscheint bei etwa 43 % der Suchanfragen und öffnet sich dynamisch beim Anklicken.

Das Auslesen öffentlich zugänglicher Suchergebnisse bewegt sich in einer rechtlichen Grauzone. Wir empfehlen, die Nutzungsbedingungen von Google zu lesen, bevor Sie ausgelesene Daten in einer Anwendung verwenden. Crawlbase stellt die Werkzeuge zum Durchsuchen und Extrahieren öffentlich zugänglicher Daten bereit, aber die Art und Weise, wie diese Daten verwendet werden, liegt letztendlich in Ihrer Verantwortung.

Wie viele PAA-Fragen kann eine Abfrage zurückgeben?

Die erste PAA-Box enthält 3–4 Fragen. Jede Erweiterung fügt 2–4 weitere hinzu. Ein dreistufiger Erweiterungsbaum liefert typischerweise 12–20 Fragen pro Anfrage.

Warum variiert PAA je nach Standort?

Google personalisiert die Suchergebnisse basierend auf den Länder- und Spracheinstellungen des Nutzers. Dieselbe Suchanfrage liefert in den USA und Großbritannien oft unterschiedliche Ergebnisse, da sich Nutzerverhalten, Sprachmuster und verfügbare Inhalte je nach Markt unterscheiden.

Was passiert, wenn Google seine HTML-Selektoren ändert?

Ihr Parser wird stillschweigend leere Ergebnisse zurückgeben. Verwenden Sie gestaffelte Fallback-Selektoren, protokollieren Sie, welcher Selektor bei jedem Durchlauf ausgelöst wird, und richten Sie eine Überwachungsbenachrichtigung ein, falls die Anzahl der Ergebnisse einen Schwellenwert unterschreitet.

Wie häufig aktualisiert Google die PAA für ein bestimmtes Keyword?

PAA-Sets sind für Informationsanfragen relativ stabil (Wochen bis Monate), können sich aber bei Trend- oder Nachrichten-nahen Themen innerhalb von Stunden ändern. Für Monitoring-Anwendungsfälle ist ein wöchentlicher Crawling-Zyklus für die meisten Evergreen-Keywords ausreichend.