# Webhook-Empfang
Nachdem Sie die von Ihrem Erkundungsroboter gesendeten Daten erhalten haben, müssen Sie einen Endpunkt für den Webhook auf Ihrem Server festlegen.
Ihr Webhook von Ihrem Server...
- Die Veröffentlichung erfolgt über die Crawlbase-Server
- Bitte geben Sie den Betrag ein, den Sie erhalten möchten.
POST
Einspruch einlegen und innerhalb von 200 ms antworten - Reagieren Sie innerhalb von 200 ms mit einem Statuscode
200
,201
or204
ohne Inhalt
Die Art und Weise, wie Daten bereitgestellt werden, hängt vom Format ab, das Sie in der URL-Adresse mit dem Parameterformat angegeben haben. &format=html
(Qu est la valeur par défaut) ou &format=json
.
Der Motor Crawler Überqueren Sie die Strecke bis zu Ihrem Abseilpunkt POST
Methode mit gzip
Kompression.
Hinweis: Stellen Sie sicher, dass Ihr Abseilen jederzeit verfügbar ist. Weil wir Bücher für Ihr Abseilen haben und Ihr Server nicht daran gehindert wurde, eine russische Antwort zu erhalten, haben wir die Seite noch einmal durchforstet und dann haben wir das Buch zurückbehalten. Diese Versuche wurden aufgrund der Anforderungen der Russen berücksichtigt, sie wurden nicht hergestellt.
Hinweis: Wenn Sie die Webhooks Zapier verwenden, lesen Sie weiter Crawler Ich schicke Ihnen keine komprimierten Données. Die Hooks von Zapier funktionieren nicht mit der Gzip-Komprimierung.
# Beispiele für Anfragen
Sie finden hier Beispiele, die Sie bei Crawlbase erhalten möchten Crawler auf Ihrem Server-Webhook.
# Format HTML
Cela se produira lorsque you appellerez l'API avec le &format=html
.
Headers:
"Content-Type" => "text/plain"
"Content-Encoding" => "gzip"
"Original-Status" => 200
"PC-Status" => 200
"rid" => "The RID you received in the push call"
"url" => "The URL which was crawled"
Body:
The HTML of the page
# JSON formatieren
Cela se produira lorsque you appellerez l'API avec le &format=json
.
Headers:
"Content-Type" => "gzip/json"
"Content-Encoding" => "gzip"
Body:
{
pc_status: 200,
original_status: 200,
rid: "The RID you received in the push call",
url: "The URL which was crawled",
body: "The HTML of the page"
}
Bewahre den Geist, der pc_status
et original_status
Doivent être verifiziert. Sie können sich mit diesem Thema auskennen [hi]/fr/crawling-api/response/#pc-status) und Sie finden hier sind.
# Integrationstest
Bei der Erstellung Ihres Webhooks kann es hilfreich sein, die genaue Antwort auf eine bestimmte URL zu erhalten.
Um die Tests zu erleichtern, können Sie Crawlbase Storage für Ihre Erkundungsroboter bis zum Ende des Tests konfigurieren. Vous pouvez Sie sind hier (unser neues Fenster) (öffnet neues Fenster).
# Überwachungsbot
Le Crawler Überwachen Sie die URL Ihres Webhooks, um Ihren Status zu ermitteln. Wenn der Webhook nicht verfügbar ist, dann Crawler Wird automatisch abgerufen und wiedergegeben, wenn Ihr Webhook im Neubetrieb ist.
Unser Überwachungsroboter sendet weiterhin Anfragen an Ihren Webhook-Endpunkt. Vergewissern Sie sich, dass Sie diese Anfragen nicht beachten 200
Staatskodex.
- Die Überwachungsforderungen werden in Form einer POST-Anfrage mit einem Korps-JSON vorgelegt, damit Sie sie mit den Appellen ohne Überwachung erhalten.
- Die Überwachungsanforderungen sind vierzig Jahre lang mit dem Agenten verbunden
Crawlbase Monitoring Bot 1.0
Ich hoffe, Sie können es einfacher machen, das Gesetz zu ignorieren200
.
# Schützen Sie Ihren Webhook
Wenn Sie einen alternativen Endpunkt verwenden yourdomain.com/2340JOiow43djoqe21rjosi
Es ist wahrscheinlich, dass Sie es herausgefunden haben, aber in allen Fällen können Sie den Endpunkt des Webhooks mit den folgenden Methoden (oder den Pluspunkten aller Kombinationen) schützen:
- Der Gesandte ist [auf Ihre Anfrage persönlich eingestellt]/fr/crawler/pushing/#sending-additional-data) mit einem einzigen Kommentar, den Sie noch nicht überprüft haben, ob er in Ihrem Webhook existiert.
- Verwenden Sie einen URL-Parameter in Ihrer URL und überprüfen Sie dessen Existenz auf der Anforderung des Webhooks, wie zum Beispiel:
yourdomain.com/2340JOiow43djoqe21rjosi?token=1234
- Akzeptor-Einzigartigkeit
POST
Anfragen. - Überprüfen Sie, ob bestimmte Personen anwesend sind (z. B.).
Pc-Status
,Original-Status
,rid
Usw).
Wir empfehlen Ihnen nicht, die Liste der IP-Adressen nicht zu löschen, da unsere Erkundungsroboter möglicherweise Operationen mit mehreren unterschiedlichen IP-Adressen durchführen und die IP-Adressen ohne vorherige Benachrichtigung ändern können.