# Antworten

Lorsque vous faites une requeste à Crawlbase Sie erhalten eine Antwort.

Bei dieser Antwort handelt es sich um ein JSON-Objekt oder einen HTML-Code für die Seite mit der Option, die Sie mit der Option ausgewählt haben das Format Parameter (der Standardwert ist HTML).

# HTML-Antwort

Wenn Sie das HTML-Antwortformat ausgewählt haben (dies ist der Wert der Standardeinstellung), erhalten Sie das HTML-Format für die Seite als Antwort.

La Antwortparameter sera ajouté aux en-têtes de réponse.

GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=html'
Response:
  Headers:
    url: https://github.com/crawlbase?tab=repositories
    original_status: 200
    pc_status: 200
    'X-Domain-Complexity': standard

  Body:
    <!doctype html><html class="a-no-js" data-19ax5a9jf="dingo"><!-- sp:feature:head-start -->
    <head><script>var aPageStart = (new Date()).getTime();</script><meta charset="utf-8">
    ... (all the html of the page)

# JSON-Antwort

Wenn Sie das JSON-Antwortformat ausgewählt haben, erhalten Sie ein JSON-Objekt, das Sie analysieren möchten.

Dieses Objekt enthält alle Informationen, die Sie nicht benötigen. Lire Antwortparameter für alle Informationen.

GET 'https://api.crawlbase.com/?token=_USER_TOKEN_&url=https%3A%2F%2Fgithub.com%2Fcrawlbase%3Ftab%3Drepositories&format=json'
Response:
{
  "original_status": "200",
  "pc_status": 200,
  "url": "https://github.com/crawlbase?tab=repositories",
  "domain_complexity": "standard",
  "body": "\u003C!doctype html\u003E\u003Chtml class=\"a-no-js\" data-19ax5a9jf\n... (all the html of the page)"
}

# Headers

Wie Sie in den folgenden Beispielen sehen, ist die Antwort, JSON oder HTML-Datei Parameter für JSONoder Kopfzeilen für HTML, das ist es, was Sie wissen können, was mit der Nachfrage nicht mehr möglich ist.

# URL

Die Ursprungs-URL wurde auf Anfrage oder die Weiterleitungs-URL gesendet Crawlbase folgt nicht.

# ursprünglicher_status

Die Antwort unseres Staates (Crawlbase) Empfangen Sie die auf Anfrage gesendete URL zur Erkundung.

Es kann sein, dass der gültige http-Code nicht importiert wird.

Bewahre den Geist, der Crawlbase Es gibt keine Tatsache, dass die Anforderungen nicht erfüllt sind original_status Erfolgreich (200, 201, 204), dauerhafte Weiterleitung (301), vorübergehende Weiterleitung (302), wenn die Weiterleitung auf die Weiterleitung des Inhalts folgt, nicht gefunden (410, 404). Et quand pc_status est 200. Alles andere original_status Die gültigen Codes dürfen nicht in Kraft treten.

# pc_status

La Crawlbase (pc) Der Staatscode kann nicht gleich dem Staatscode sein, und es handelt sich um einen endlich gültigen Code.
Beispielsweise kann eine Website heruntergeladen werden original_status 200 mit einem Captcha, in diesem Fall, pc_status Aura 503 Antworten.

Dieser Code ist nicht standardmäßig wie 601, 999 usw. Er wird von der internen Ingenieursausrüstung verwendet und ist nur für Sie bestimmt, damit Sie die Probleme lösen können, wenn Sie den Support kontaktieren.

Beachten Sie, dass dass die Forderungen erfüllt sind Crawlbase wer endlich eine Rechnung hat pc_status Der Code (nicht mehr als 200) wurde nicht hergestellt.

# X-Domain-Komplexität

Der Grad der Komplexität weist darauf hin, wie schwierig es ist, eine eigene Domäne zu erkunden oder zu kratzen, und berücksichtigt auch die benötigten Ressourcen und die damit verbundenen Preise:

  • standard – Einfache Domänen mit Explorer oder Scraper, mit minimalen Schutzmaßnahmen. Diese Domains werden allgemein zu höheren Tarifen angeboten.
  • moderate – Domänen verfügen über einen Anti-Bot-Schutz, der eine spezielle Verwaltung erfordert. Diese Domänen verfügen über ein allgemeines Zwischentarifniveau und ihre Eigenschaft ist ein Pluspunkt für den Umgang mit Ressourcen.
  • complex – Domänen von fortgeschrittenen Schutzsystemen, schwierig zu entdecken oder zu extrahieren. Es sind fortgeschrittene Techniken und spezielle Ressourcen erforderlich, die sich auf dem höheren Tarifniveau widerspiegeln.

Wenn Sie die Komplexität der verschiedenen Bereiche kennen, können Sie die Möglichkeiten und Aspekte Ihrer Erkundungstechniken abschätzen. Um spezifische Tarifinformationen auf der Grundlage der Komplexität der Domänen zu erhalten, wenden Sie sich bitte an Ihr Abonnement oder wenden Sie sich über die Website an unser kommerzielles Unternehmen Kontakt.

# Körper

Dieser Parameter ist nicht in JSON verfügbar das Format, de html format Es war das Corps de la réponse elle-même.

Der Inhalt dieser Seite Crawlbase Finden Sie es in der Suite der Erkundung durch einen auf Anfrage gesendeten URL-Proxy.