# Webhook-Empfang

Nachdem Sie die von Ihrem Erkundungsroboter gesendeten Daten erhalten haben, müssen Sie einen Endpunkt für den Webhook auf Ihrem Server festlegen.

Ihr Webhook von Ihrem Server...

  • Die Veröffentlichung erfolgt über die Crawlbase-Server
  • Bitte geben Sie den Betrag ein, den Sie erhalten möchten. POST Einspruch einlegen und innerhalb von 200 ms antworten
  • Reagieren Sie innerhalb von 200 ms mit einem Statuscode 200, 201 or 204 ohne Inhalt

Die Art und Weise, wie Daten bereitgestellt werden, hängt vom Format ab, das Sie in der URL-Adresse mit dem Parameterformat angegeben haben. &format=html (Qu est la valeur par défaut) ou &format=json.

Der Motor Crawler Überqueren Sie die Strecke bis zu Ihrem Abseilpunkt POST Methode mit gzip Kompression.

Hinweis: Stellen Sie sicher, dass Ihr Abseilen jederzeit verfügbar ist. Weil wir Bücher für Ihr Abseilen haben und Ihr Server nicht daran gehindert wurde, eine russische Antwort zu erhalten, haben wir die Seite noch einmal durchforstet und dann haben wir das Buch zurückbehalten. Diese Versuche wurden aufgrund der Anforderungen der Russen berücksichtigt, sie wurden nicht hergestellt.

Hinweis: Wenn Sie die Webhooks Zapier verwenden, lesen Sie weiter Crawler Ich schicke Ihnen keine komprimierten Données. Die Hooks von Zapier funktionieren nicht mit der Gzip-Komprimierung.

# Beispiele für Anfragen

Sie finden hier Beispiele, die Sie bei Crawlbase erhalten möchten Crawler auf Ihrem Server-Webhook.

# Format HTML

Cela se produira lorsque you appellerez l'API avec le &format=html.

Headers:
  "Content-Type" => "text/plain"
  "Content-Encoding" => "gzip"
  "Original-Status" => 200
  "PC-Status" => 200
  "rid" => "The RID you received in the push call"
  "url" => "The URL which was crawled"

Body:
  The HTML of the page

# JSON formatieren

Cela se produira lorsque you appellerez l'API avec le &format=json.

Headers:
  "Content-Type" => "gzip/json"
  "Content-Encoding" => "gzip"

Body:
{
  pc_status: 200,
  original_status: 200,
  rid: "The RID you received in the push call",
  url: "The URL which was crawled",
  body: "The HTML of the page"
}

Bewahre den Geist, der pc_status et original_status Doivent être verifiziert. Sie können sich mit diesem Thema auskennen [hi]/fr/crawling-api/response/#pc-status) und Sie finden hier sind.

# Integrationstest

Bei der Erstellung Ihres Webhooks kann es hilfreich sein, die genaue Antwort auf eine bestimmte URL zu erhalten.

Um die Tests zu erleichtern, können Sie Crawlbase Storage für Ihre Erkundungsroboter bis zum Ende des Tests konfigurieren. Vous pouvez Sie sind hier (unser neues Fenster) (öffnet neues Fenster).

# Überwachungsbot

Le Crawler Überwachen Sie die URL Ihres Webhooks, um Ihren Status zu ermitteln. Wenn der Webhook nicht verfügbar ist, dann Crawler Wird automatisch abgerufen und wiedergegeben, wenn Ihr Webhook im Neubetrieb ist.

Unser Überwachungsroboter sendet weiterhin Anfragen an Ihren Webhook-Endpunkt. Vergewissern Sie sich, dass Sie diese Anfragen nicht beachten 200 Staatskodex.

  • Die Überwachungsforderungen werden in Form einer POST-Anfrage mit einem Korps-JSON vorgelegt, damit Sie sie mit den Appellen ohne Überwachung erhalten.
  • Die Überwachungsanforderungen sind vierzig Jahre lang mit dem Agenten verbunden Crawlbase Monitoring Bot 1.0 Ich hoffe, Sie können es einfacher machen, das Gesetz zu ignorieren 200.

# Schützen Sie Ihren Webhook

Wenn Sie einen alternativen Endpunkt verwenden yourdomain.com/2340JOiow43djoqe21rjosi Es ist wahrscheinlich, dass Sie es herausgefunden haben, aber in allen Fällen können Sie den Endpunkt des Webhooks mit den folgenden Methoden (oder den Pluspunkten aller Kombinationen) schützen:

  • Der Gesandte ist [auf Ihre Anfrage persönlich eingestellt]/fr/crawler/pushing/#sending-additional-data) mit einem einzigen Kommentar, den Sie noch nicht überprüft haben, ob er in Ihrem Webhook existiert.
  • Verwenden Sie einen URL-Parameter in Ihrer URL und überprüfen Sie dessen Existenz auf der Anforderung des Webhooks, wie zum Beispiel: yourdomain.com/2340JOiow43djoqe21rjosi?token=1234
  • Akzeptor-Einzigartigkeit POST Anfragen.
  • Überprüfen Sie, ob bestimmte Personen anwesend sind (z. B.). Pc-Status, Original-Status, ridUsw).

Wir empfehlen Ihnen nicht, die Liste der IP-Adressen nicht zu löschen, da unsere Erkundungsroboter möglicherweise Operationen mit mehreren unterschiedlichen IP-Adressen durchführen und die IP-Adressen ohne vorherige Benachrichtigung ändern können.