Instagram, eine der beliebtesten Social-Media-Plattformen, ist zu einer festen Größe für Privatpersonen und Unternehmen geworden. Das soziale Netzwerk bietet mehrere wichtige Tools für Organisationen, die für ihr Publikum immersive Erlebnisse visualisieren und schaffen möchten.
Mit über 2 Milliarden Konten liefern diese Zielgruppen Unternehmen wertvolle Informationen, die von Nutzen sein könnten. Aufgrund der Struktur und Datenschutzrichtlinien der Plattform kann das Sammeln von Informationen von Instagram jedoch eine Herausforderung sein.
Crawlbase Crawling API ist eine fertige Lösung zum Scrapen von Instagram-Daten, ohne rechtliche oder datenschutzrechtliche Probleme zu haben. In diesem Artikel erfahren Sie, wie Sie Instagram-Daten mit Python nahtlos scrapen können, mit unserem Crawling API.

Table of Contents:

Warum ist Instagram Scraper nützlich?

Instagramist mit seinen Milliarden aktiver Nutzer nicht nur eine Plattform zum Teilen von Momenten und Geschichten – es ist ein riesiges Archiv mit aufschlussreichen Daten. Unternehmen, Forscher und Einzelpersonen, die diese Datenquelle nutzen, profitieren von zahlreichen Vorteilen. Hier sind die wichtigsten Gründe, warum Instagram-Datenscraping in verschiedenen Branchen ein unverzichtbares Tool ist.

  1. Marktforschung: Es ermöglicht Unternehmen, Einblicke in die Vorlieben, Verhaltensweisen und Interessen ihrer Zielgruppe zu gewinnen, einschließlich ihrer Instagram Anhänger. Unternehmen können Markttrends und Kundenstimmungen besser verstehen, indem sie Daten aus Instagram-Profilen, Posts und Kommentaren extrahieren. Wenn Sie dabei sind, ein neues logo Maker oder an einer neuen Version arbeiten, beispielsweise können Sie Instagram-Analysen interpretieren und sie entsprechend den Daten zur Benutzerinteraktion gestalten. Letzteres kann Ihnen dabei helfen, ein reaktionsschnelleres und benutzerfreundlicheres Gerät zu erstellen.
  2. Wettbewerbsanalyse: Durch Instagram Scraping können Sie die Aktivitäten Ihrer Konkurrenten anhand ihrer Profile und Post-Analysen kennenlernen. Das Studium dieser Informationen wird Ihnen helfen, Erkenntnisse darüber zu gewinnen, was Sie in Ihre Strategie einbeziehen sollten.
  3. Influencer-Marketing: Sie können auch erfahren, wie Ihre Kollegen Influencer-Marketing angehen. Sie können auch Instagram-Influencer-Profile durchsehen, um ihr Engagement und ihre Relevanz in Ihrer Branche zu erfahren, bevor Sie sie einstellen.
  4. Inhaltsstrategie: Das Lernen neuer Taktiken von Ihren Mitbewerbern könnte Ihnen helfen, Ihre Content-Strategie zu verbessern. Sie können Inspiration durch Content-Ideen, verbessern Sie das Post-Engagement und helfen Sie Ihrem Team, Ihre Inhalte an die Vorlieben Ihres Publikums anzupassen.
  5. Social Media Analytics: Durch das Scraping von Instagram-Daten erhalten Einzelpersonen und Unternehmen einen umfassenden Überblick über ihre Social-Media-Performance. Kennzahlen wie Follower-Wachstum, Post-Reichweite und Engagement-Raten können verfolgt und analysiert werden, um Social-Media-Strategien zu optimieren.
  6. Benutzerengagement: Sie können die Macht der Instagram-Benutzer nutzen, um mehr über ihre Vorlieben, Interessen und ihr Verhalten zu erfahren. Durch das Scraping von Benutzeraktivitäten wie Kommentaren und Likes können Sie diese Kennzahlen ermitteln.
  7. Lead-Generierung: SEO-Vermarkter sind sich der Bedeutung der Lead-Generierung über soziale Medien bewusst. Durch das Scraping von Instagram-Daten können Sie Informationen über Ihre idealen Kunden auf der Plattform gewinnen.
  8. Inhaltspersonalisierung: Nachdem Sie diese Einblicke gewonnen haben, können Sie Ihre Inhalte an die speziellen Bedürfnisse Ihrer Kunden anpassen. Dies könnte sie letztendlich Ihrer Marke näherbringen und sie zu Kunden machen.
  9. Trend analysen: Soziale Plattformen leben und atmen Viralität und Trends. Sie können Instagram-Daten durchsuchen, um Daten zu Trends zu extrahieren, die für Ihr Geschäftswachstum von Vorteil sein können.
  10. Wissenschaftliche Forschung: Daten sind für die Forschung relevant und Instagram hat jede Menge davon. Das Scraping der Plattform kann Forschern die benötigten Informationen für ihre Hypothesen und Experimente liefern.
Instagram Daten Scraping verwendet

Scrapen Sie Instagram mit Crawlbase Crawling API

Schritt 1: Registrieren Sie sich Crawlbase und erhalten Sie Ihr privates Token. Sie können dieses Token erhalten, indem Sie auf die Kontodokumentation Abschnitt in Ihrem Crawlbase-Konto.

Schritt 2: Installieren Sie die Crawlbase Python-Bibliothek. Um sie zu installieren, folgen Sie bitte diesen Schritten:

  • Überprüfen Sie zunächst, ob Python auf Ihrem System installiert ist. Wenn es nicht installiert ist, können Sie es von der offiziellen Python-Website.
  • Sobald Python installiert ist, öffnen Sie Ihre Eingabeaufforderung oder Ihr Terminal.
  • Um die Crawlbase Python-Bibliothek zu installieren, verwenden Sie pip (Python-Paketinstallationsprogramm), indem Sie den folgenden Befehl ausführen:

pip install crawlbase

  • Warten Sie, bis Pip die Bibliothek heruntergeladen und installiert hat. Es werden auch alle erforderlichen Abhängigkeiten installiert.

Schritt 3: Wählen Sie die Instagram-Profilseite aus, die Sie scrapen möchten. In diesem Zusammenhang haben wir uns für die Apple Instagram-Profilseite. Die Auswahl einer solchen Profilseite ist wichtig, da sie eine große Bandbreite an Inhaltselementen bietet und zeigt, wie anpassungsfähig und vielseitig der Scraping-Prozess sein kann.

Apple Instagram-Profilseite

Schritt 4: Erstellen Sie eine Python-Datei mit dem Namen instagram-page-scraper.py Verwenden Sie den folgenden Befehl:

touch instagram-page-scraper.py

Dieser Befehl erstellt eine leere Python-Skriptdatei mit dem Namen instagram-page-scraper.py in Ihrem aktuellen Verzeichnis. Sie können diese Datei dann öffnen und bearbeiten, um Ihren Python-Code zum Scraping von Instagram-Seiten zu schreiben.

Schritt 5: Konfigurieren der Crawlbase Crawling API indem Sie die erforderlichen Parameter und Endpunkte angeben, damit die API ordnungsgemäß funktioniert. Kopieren Sie das bereitgestellte Skript in das instagram-page-scraper.py Datei, die Sie in Schritt 4 erstellt haben. Um das folgende Skript auszuführen, verwenden Sie diesen Befehl python instagram-page-scraper.py im Terminal:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
für Crawlbase importieren CrawlingAPI

# Legen Sie Ihr Crawlbase-Token fest
crawlbase_token = 'IHR_CRAWLBASE_TOKEN'

# URL der zu scrapenden Instagram-Seite
instagram_page_url = „https://www.instagram.com/apple/“

# Erstellen Sie eine Crawlbase API-Instanz mit Ihrem Token
api = CrawlingAPI({ 'Zeichen': crawlbase_token })

versuchen: # Senden Sie eine GET-Anfrage, um die URL zu crawlen
Antwort = api.get(Instagram-Seiten-URL)

# Überprüfen Sie, ob der Antwortstatuscode 200 (OK) ist.
if 'Statuscode' in Antwort:
if Antwort['Statuscode'] == 200:
# Drucken Sie den Antworttext
drucken(Antwort['Körper'])
sonst:
drucken(f"Anforderung fehlgeschlagen mit Statuscode: {Antwort['Statuscode']}")
sonst:
drucken(„Die Antwort enthält keinen Statuscode.“)

ausgeschlossen Exception as e: # Behandeln Sie alle Ausnahmen oder Fehler
drucken(f"Ein Fehler ist aufgetreten: {str(e)}")

Das obige Skript zeigt, wie man Crawlbases Crawling API zum Zugreifen auf und Extrahieren von Daten von einer Instagram-Seite. Dies wird erreicht, indem das API-Token eingerichtet, die Ziel-URL definiert und eine GET-Anfrage initiiert wird. Wenn Sie diesen Code ausführen, erhalten Sie den Roh-HTML-Inhalt der angegebenen Instagram-Seite, der in der Konsole angezeigt wird, wie unten dargestellt:

HTML-Antwort des Apple Instagram-Profils

Scrapen Sie Instagram-Daten mit Crawlbase

Im vorherigen Beispiel haben wir untersucht, wie wir die grundlegende Struktur einer Instagram-Seite abrufen können, die uns im Wesentlichen das HTML der Seite liefert. Es gibt jedoch Fälle, in denen wir diese Rohdaten nicht benötigen. Stattdessen liegt unser Interesse darin, bestimmte und wichtige Informationen aus der Seite zu extrahieren. Glücklicherweise bietet Crawlbase Crawling API ist ausgestattet mit eingebautem Instagram-Schaber bezeichnet als "Instagram-Beitrag", "Instagram-Profil" und "Instagram-Hashtag". Diese Scraper sollen uns bei der Extraktion wertvoller Inhalte unterstützen, und wir werden jeden einzelnen von ihnen besprechen.

Crawlbase“Instagram-Beitrag„ Schaber

Um diese Funktion zu aktivieren, wenn Sie den Crawling API In Python ist es wichtig, einen „Scraper“-Parameter mit dem Wert einzuschließen "Instagram-Beitrag" in Ihrem Code. Dieser Parameter erleichtert die Extraktion relevanter Seiteninhalte im JSON-Format. Die Änderungen werden an der vorhandenen Datei vorgenommen. „instagram-page-scraper.py“Schauen wir uns zum besseren Verständnis das folgende Beispiel an:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
für Crawlbase importieren CrawlingAPI

# Legen Sie Ihr Crawlbase-Token fest
crawlbase_token = 'IHR_CRAWLBASE_TOKEN'

# URL des zu scrapenden Instagram-Posts
instagram_post_url = „https://www.instagram.com/p/B5LQhLiFFCX“

# Optionen für Crawling API
Optionen = {
'Schaber': „Instagram-Beitrag“,
}

# Erstellen Sie eine Crawlbase API-Instanz mit Ihrem Token
api = CrawlingAPI({ 'Zeichen': crawlbase_token })

versuchen: # Senden Sie eine GET-Anfrage, um die URL mit Optionen zu crawlen
Antwort = api.get(instagram_post_url, Optionen=Optionen)

# Überprüfen Sie, ob der Antwortstatuscode 200 (OK) ist.
if Antwort.get('Statuscode', 0) == 200:
# Analysieren Sie die JSON-Antwort und drucken Sie sie aus
Antwort_Body_Json = Antwort.get('Körper', {})
drucken(Antworttext_json)
sonst:
drucken(f"Anforderung fehlgeschlagen mit Statuscode: {Antwort.get('Statuscode', 0)}")

ausgeschlossen Exception as e: # Behandeln Sie alle Ausnahmen oder Fehler
drucken(f"API-Anforderungsfehler: {str(e)}")

Der obige Python-Code verwendet Crawlbases Crawling API um Daten von einer bestimmten Instagram-Postseite zu extrahieren. Zunächst wird die Ziel-URL der Instagram-Postseite definiert und die Scraping-Optionen mit dem 'Instagram-Beitrag' Scraper. Anschließend wird eine GET-Anfrage initiiert, um auf die URL zuzugreifen. Nach Erhalt einer erfolgreichen Antwort mit einem Statuscode von 200 analysiert der Code die abgerufenen Daten und zeigt sie im JSON-Format auf der Konsole an.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
{
"gepostet von": {
"Kontoname": "Apfel",
"KontoBenutzername": "Apfel",
"KontoLink": „https://www.instagram.com/apple/“
},
"Poststandort": {
"Standortname": „Cheonan, Korea“,
"Verknüpfung": „https://www.instagram.com/explore/locations/236722267/cheonan-korea/“
},
"Untertitel": {
"text": „Die Natur kann ein Designer sein.“ #Landschaftsfotografie #ShotoniPhone von Chang D. @hello*dongwon“,
"Tags": [
{
"Hashtag": "#Landschaftsfotografie",
"Verknüpfung": „https://www.instagram.com/explore/tags/landscapephotography/“
},
{
"Hashtag": „#ShotoniPhone“,
"Verknüpfung": „https://www.instagram.com/explore/tags/shotoniphone/“
},
{
"KontoBenutzername": „@hallo_dongwon“,
"Verknüpfung": „https://www.instagram.com/hello_dongwon/“
}
]
},
"Medien": {
"Bilder": [
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/p1080x1080/74483667_176621576856831_5638323409997236915_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&;_nc_cat=103&_nc_ohc=oIc2iP5MKD0AX9Jxs0r&oh=728c8878e963134633bf7f58f95fb5c5&oe=5F0CA467"
],
"Videos": []
},
„getaggteKonten“: [],
"Gefällt mirAnzahl": 373174,
"Anzahl der Aufrufe": 0,
"Datum/Uhrzeit": "2019-11-22T17:21:42.000Z",
"AntwortenAnzahl": 12,
"Antworten": [
{
"KontoBenutzername": "lixiao927",
"KontoLink": „https://www.instagram.com/lixiao927/“,
"text": "Der Weg zum Meer",
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-03-26T05:48:15.000Z"
},
{
"KontoBenutzername": "tanmoy8440",
"KontoLink": „https://www.instagram.com/tanmoy8440/“,
"text": "Schönes Bild",
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-04-03T19:42:18.000Z"
},
{
"KontoBenutzername": "lexikarongkong",
"KontoLink": „https://www.instagram.com/lexikarongkong/“,
"text": „Wie die Kamera des Samsung Galaxy S20 Ultra“,
"Gefällt mirAnzahl": 1,
"Datum/Uhrzeit": "2020-04-04T13:37:39.000Z"
},
{
"KontoBenutzername": "naisouza",
"KontoLink": „https://www.instagram.com/naisouzas/“,
"text": "Schau dir ein Gemälde an",
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-04-07T01:37:57.000Z"
},
{
"KontoBenutzername": "hj_od597",
"KontoLink": „https://www.instagram.com/hj_od597/“,
"text": „@juhee__15,
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-04-09T00:12:15.000Z"
},
{
"KontoBenutzername": "jbskiee378",
"KontoLink": „https://www.instagram.com/jbskiee378/“,
"text": „Können Sie mir bitte ein iPhone X geben, @apple, warum sind Ihre Produkte so teuer, können Sie auf Ihren Preis vielleicht Studentenrabatte geben???????????“,
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-04-13T07:19:55.000Z"
},
{
"KontoBenutzername": "reroalanazi",
"KontoLink": „https://www.instagram.com/reroalanazi/“,
"text": „Tolles Bild, aber wenn es mit dem Objektiv des #Samsung #Galaxy S20 Ultra aufgenommen worden wäre, wäre es noch schöner. ♥️“,
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-04-19T20:18:42.000Z"
},
{
"KontoBenutzername": "mario_shutter1",
"KontoLink": „https://www.instagram.com/mario_shutter1/“,
"text": „Ein Designer“,
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-04-27T13:08:27.000Z"
},
{
"KontoBenutzername": "Dostmealone",
"KontoLink": „https://www.instagram.com/dostmealone/“,
"text": „🤮“,
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-05-03T13:23:31.000Z"
},
{
"KontoBenutzername": "excellsior_x",
"KontoLink": „https://www.instagram.com/excellsior_x/“,
"text": „@apple28k*“,
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-05-07T04:59:11.000Z"
},
{
"KontoBenutzername": "annapaulaaah",
"KontoLink": „https://www.instagram.com/annapaulaaah/“,
"text": „Ich suche nach einem iPhone“,
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-05-11T19:45:36.000Z"
},
{
"KontoBenutzername": "arieneisa0810",
"KontoLink": „https://www.instagram.com/arieneisa0810/“,
"text": "😍",
"Gefällt mirAnzahl": 0,
"Datum/Uhrzeit": "2020-05-29T02:20:19.000Z"
}
]
}

Crawlbase“Instagram-Profil„ Schaber

In diesem Beispiel konzentrieren wir uns auf das Extrahieren von Daten aus einer Instagram-Profilseite, insbesondere der URL https://www.instagram.com/apple/. Crawlbases Crawling API enthält einen speziellen Scraper, der auf Instagram-Profilseiten zugeschnitten ist und die Extraktion wichtiger Informationen aus diesen Seiten vereinfacht. Dazu müssen Sie die "Schaber" Parameter im bereitgestellten Python-Code, und ändern Sie ihn von "Instagram-Beitrag" zu "Instagram-Profil"Nachfolgend finden Sie ein Beispiel, das diese Änderung verdeutlicht und Ihnen hilft, den Vorgang leichter zu verstehen:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
für Crawlbase importieren CrawlingAPI

# Legen Sie Ihr Crawlbase-Token fest
crawlbase_token = 'IHR_CRAWLBASE_TOKEN'

# URL des zu scrapenden Instagram-Profils
instagram_profile_url = „https://www.instagram.com/apple/“

# Optionen für Crawling API
Optionen = {
'Schaber': 'Instagram-Profil',
}

# Erstellen Sie eine Crawlbase API-Instanz mit Ihrem Token
api = CrawlingAPI({ 'Zeichen': crawlbase_token })

versuchen: # Senden Sie eine GET-Anfrage, um die URL mit Optionen zu crawlen
Antwort = api.get(instagram_profile_url, Optionen=Optionen)

# Überprüfen Sie, ob der Antwortstatuscode 200 (OK) ist.
if Antwort.get('Statuscode', 0) == 200:
# Analysieren Sie die JSON-Antwort und drucken Sie sie aus
Antwort_Body_Json = Antwort.get('Körper', {})
drucken(Antworttext_json)
sonst:
drucken(f"Anforderung fehlgeschlagen mit Statuscode: {Antwort.get('Statuscode', 0)}")

ausgeschlossen Exception as e: # Behandeln Sie alle Ausnahmen oder Fehler
drucken(f"API-Anforderungsfehler: {str(e)}")

JSON-Antwort:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
{
"Nutzername": "Apfel",
"verifiziert": was immer dies auch sein sollte.,
"BeiträgeAnzahl": {
"Wert": "645",
"text": "645"
},
"FollowerAnzahl": {
"Wert": "23,226,349",
"text": "23.2m"
},
"folgendeAnzahl": {
"Wert": "6",
"text": "6"
},
"Bild": "https://scontent-ams4-1.cdninstagram.com/v/t51.2885-19/s150x150/20635165_1942203892713915_5464937638928580608_a.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_ohc=lcE_RCkZ_V0AX88YnQ-&oh=61a7f414a083262a6a3a267c72712d7e&oe=5ECF0664",
"Name": "Apfel",
"bio": {
"text": „Jeder hat eine Geschichte zu erzählen. Taggen Sie #ShotoniPhone, um teilzunehmen.“,
"Tags": [
{
"Hashtag": „#ShotoniPhone“,
"Verknüpfung": „https://www.instagram.com/explore/tags/shotoniphone/“
}
]
},
"openStories": [
{
"Bild": "https://scontent-amt2-1.cdninstagram.com/v/t51.12442-15/e35/c45.528.1152.1152a/s150x150/89355871_2612402225710092_3475237627656449116_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=100&_nc_ohc=l-ZJug3llnAAX81ac9M&oh=560c36b6bd08b2836271e77daca9c136&oe=5EA5EB70",
"text": „Profilbild von Hermitage 🎨“
},
{
"Bild": "https://scontent-ams4-1.cdninstagram.com/v/t51.12442-15/e35/c30.352.768.768a/s150x150/82179545_827696967671926_8787817111555610935_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=_wHOpjhVeXkAX_hEKdc&oh=b7d8db9aed851dbfccd9df4f49f94780&oe=5EA65BC6",
"text": „Profilbild von 🐌💗“
},
{
"Bild": "https://scontent-ams4-1.cdninstagram.com/v/t51.12442-15/e15/c26.306.667.667a/s150x150/76876296_2550913171857183_128215401869222325_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=103&_nc_ohc=Rpbq12v0NKcAX-RpFK-&oh=c33a7715317b3e7ad3ccc683c12d6446&oe=5EA6766A",
"text": „Profilbild von 💧+💡“
},
{
"Bild": "https://scontent-ams4-1.cdninstagram.com/v/t51.12442-15/e35/c37.435.949.949a/s150x150/75580662_537509090168097_4020885592126699575_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=109&_nc_ohc=qzEjW6UBISoAX_I7gQz&oh=ac6278fe93277ccac21b5f46f1f55f9b&oe=5EA66382",
"text": „Profilbild des Jahresrückblicks“
},
{
"Bild": "https://scontent-ams4-1.cdninstagram.com/v/t51.12442-15/e35/c30.352.768.768a/s150x150/72484738_746166185869011_2854931396367331804_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=103&_nc_ohc=TkYeayoAfVwAX-_p9vt&oh=506ceaad1801cdd780f074a534f5560e&oe=5EA5FCC9",
"text": „Profilbild von Amazigh Art“
},
{
"Bild": "https://scontent-ams4-1.cdninstagram.com/v/t51.12442-15/e35/c30.352.768.768a/s150x150/75629745_203840840646467_1028107524492424399_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=111&_nc_ohc=FCGYL9q0NS4AX-pABQZ&oh=db4c4c5a46d7b1e44465ef13b970d15b&oe=5EA66374",
"text": „Profilbild vom Tschadsee“
},
{
"Bild": "https://scontent-amt2-1.cdninstagram.com/v/t51.12442-15/e35/c30.352.768.768a/s150x150/72598591_490861721522737_1631333478359405579_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=101&_nc_ohc=UEDftmksjuoAX_okqKB&oh=bca099e93450243a43e3b9e1856d836e&oe=5EA67DFC",
"text": „Profilbild von Gaucha 🐎“
},
{
"Bild": "https://scontent-amt2-1.cdninstagram.com/v/t51.12442-15/e35/c30.352.768.768a/s150x150/71320503_574809409935193_1862692088555636172_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=101&_nc_ohc=sRSAfRJT6q4AX8j8Arp&oh=424876dcdbbbb191bfb57966a48f8df7&oe=5EA65EF7",
"text": „Profilbild von Berlin ☮️“
},
{
"Bild": "https://scontent-amt2-1.cdninstagram.com/v/t51.12442-15/e35/c30.352.768.768a/s150x150/75252641_2469511756436035_2732997290614957157_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=107&_nc_ohc=8SXHPxPVpuQAX-eWZwL&oh=26050310662d1f6e15512dd61715dda0&oe=5EA63130",
"text": „⚾️‘s Profilbild“
},
{
"Bild": "https://scontent-amt2-1.cdninstagram.com/v/t51.12442-15/e35/c30.352.768.768a/s150x150/73398050_101756347887937_5197053380786476217_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=101&_nc_ohc=VahfCymvDKcAX-tDviP&oh=3477c066aa1c552cc4e7476fe9951379&oe=5EA6877D",
"text": „Profilbild von Indian Relay“
},
{
"Bild": "https://scontent-amt2-1.cdninstagram.com/v/t51.12442-15/e35/c30.352.768.768a/s150x150/69275532_179485926551741_6507592363859849347_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=105&_nc_ohc=Bh4voI0AYSsAX-MaenG&oh=d7e3b1e081ec88b66cb1599177bc6521&oe=5EA66F18",
"text": „Profilbild von Biosphere2 🌎“
},
{
"Bild": "https://scontent-ams4-1.cdninstagram.com/v/t51.12442-15/e35/c33.340.768.768a/s150x150/69193245_541142776629778_1447685455316918382_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=110&_nc_ohc=tHA-uBL1TvcAX8i5m9F&oh=f80230be3683aa57e81262c442824574&oe=5EA5EC74",
"text": „Bonneville🧂🚘s Profilbild“
}
],
„Beiträge“: [
{
"Verknüpfung": „https://www.instagram.com/p/B_XxvQvlsGe/“,
"Bild": "https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/sh0.08/e35/c0.180.1440.1440a/s640x640/94347557_2642896465946523_7616332183822673338_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=KxQBdzP0DyYAX_9c81u&oh=97e0116f3109fce547a15a11ddab0447&oe=5ECD0478",
"Bilddaten": „Foto von Apple am 24. April 2020. Bild kann enthalten: eine oder mehrere Personen, Himmel, Wolken und im Freien“,
"Bilder": [
"https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/e35/c0.180.1440.1440a/s150x150/94347557_2642896465946523_7616332183822673338_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=KxQBdzP0DyYAX_9c81u&oh=6e49d368b2c316cc27ed9c6495e13c9c&oe=5ECF6548",
"150w,https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/e35/c0.180.1440.1440a/s240x240/94347557_2642896465946523_7616332183822673338_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=KxQBdzP0DyYAX_9c81u&oh=1f51010c75b41d12b9944b60a125381b&oe=5ECEEFC2",
"240w,https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/e35/c0.180.1440.1440a/s320x320/94347557_2642896465946523_7616332183822673338_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=KxQBdzP0DyYAX_9c81u&oh=1da35bddf453501e9aa6f119ea9cc3d6&oe=5ECC7740",
"320w,https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/e35/c0.180.1440.1440a/s480x480/94347557_2642896465946523_7616332183822673338_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=KxQBdzP0DyYAX_9c81u&oh=c6f96946ec16399ff05aa66a51c5b251&oe=5ECB92F9",
"480w,https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/sh0.08/e35/c0.180.1440.1440a/s640x640/94347557_2642896465946523_7616332183822673338_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=KxQBdzP0DyYAX_9c81u&oh=97e0116f3109fce547a15a11ddab0447&oe=5ECD0478",
"640w"
]
},
{
"Verknüpfung": „https://www.instagram.com/p/B9mQWorlh5K/“,
"Bild": "https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/sh0.08/e35/c0.180.1440.1440a/s640x640/89475596_1075731759466811_2351671729121046109_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=2ufLVB-w6AoAX_VsRyx&oh=1b3f702494fa1d0abba71b08d3231ccf&oe=5ECEDFB2",
"Bilddaten": „Foto von Apple am 11. März 2020. Bild kann enthalten: Wolkenkratzer, Himmel und im Freien“,
"Bilder": [
"https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/e35/c0.180.1440.1440a/s150x150/89475596_1075731759466811_2351671729121046109_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=2ufLVB-w6AoAX_VsRyx&oh=eb7bcb99461044d704f7065a6e9f5ae8&oe=5ECF5A02",
"150w,https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/e35/c0.180.1440.1440a/s240x240/89475596_1075731759466811_2351671729121046109_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=2ufLVB-w6AoAX_VsRyx&oh=fa08a359404e0caf766fe658d957d2d6&oe=5ECC7D08",
"240w,https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/e35/c0.180.1440.1440a/s320x320/89475596_1075731759466811_2351671729121046109_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=2ufLVB-w6AoAX_VsRyx&oh=2e648fff1129f47877163b9d462c9ce9&oe=5ECDEF7A",
"320w,https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/e35/c0.180.1440.1440a/s480x480/89475596_1075731759466811_2351671729121046109_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=2ufLVB-w6AoAX_VsRyx&oh=4cb6dee670cc0064a0812fc5760bab35&oe=5ECE2BBF",
"480w,https://scontent-ams4-1.cdninstagram.com/v/t51.2885-15/sh0.08/e35/c0.180.1440.1440a/s640x640/89475596_1075731759466811_2351671729121046109_n.jpg?_nc_ht=scontent-ams4-1.cdninstagram.com&_nc_cat=1&_nc_ohc=2ufLVB-w6AoAX_VsRyx&oh=1b3f702494fa1d0abba71b08d3231ccf&oe=5ECEDFB2",
"640w"
]
},
{
"Verknüpfung": „https://www.instagram.com/p/B9ex0TSlMCg/“,
"Bild": "https://scontent-amt2-1.cdninstagram.com/v/t51.2885-15/sh0.08/e35/c0.342.1236.1236a/s640x640/87611430_2959850554038353_1847999869221037422_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=105&_nc_ohc=LjsOfeejEHIAX8Gb2aj&oh=3880da040bc6b01f0e6598babf173f66&oe=5EA62785",
"Bilddaten": „Im Auftrag von Apple. Die Fotografin Petecia Le Fawnhawk @Lefawnhawk ist dafür bekannt, beeindruckende surrealistische Landschaften durch eine Mischung aus Bildhauerei und Bearbeitungstechniken zu schaffen. Sehen Sie sich das Video an, um mehr über Petecias kreative Verbindung zur Wüste zu erfahren und wie sie die Perspektive nutzt, um ihr Gespür für den Platz in der Welt zu erkunden. #IWD #ShotoniPhone 11 Pro.“,
"Bilder": [
"https://scontent-amt2-1.cdninstagram.com/v/t51.2885-15/e35/p150x150/87611430_2959850554038353_1847999869221037422_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=105&_nc_ohc=LjsOfeejEHIAX8Gb2aj&oh=9e479bd5dec698a155ef65696b19bf4f&oe=5EA65AC4",
"150w,https://scontent-amt2-1.cdninstagram.com/v/t51.2885-15/e35/p240x240/87611430_2959850554038353_1847999869221037422_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=105&_nc_ohc=LjsOfeejEHIAX8Gb2aj&oh=25e819e0e6cc83696fb7a2231d543c5f&oe=5EA60F06",
"240w,https://scontent-amt2-1.cdninstagram.com/v/t51.2885-15/e35/p320x320/87611430_2959850554038353_1847999869221037422_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=105&_nc_ohc=LjsOfeejEHIAX8Gb2aj&oh=6bacf87f04dddb72c4be45fd286a4fdf&oe=5EA5EDFC",
"320w,https://scontent-amt2-1.cdninstagram.com/v/t51.2885-15/e35/p480x480/87611430_2959850554038353_1847999869221037422_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=105&_nc_ohc=LjsOfeejEHIAX8Gb2aj&oh=7f7822d462f1d8057f55db0f1c4d8413&oe=5EA671FD",
"480w,https://scontent-amt2-1.cdninstagram.com/v/t51.2885-15/sh0.08/e35/p640x640/87611430_2959850554038353_1847999869221037422_n.jpg?_nc_ht=scontent-amt2-1.cdninstagram.com&_nc_cat=105&_nc_ohc=LjsOfeejEHIAX8Gb2aj&oh=c44e200acc057978a7e8b7f9d69951cd&oe=5EA676C7",
"640w"
]
}
],
"igtv": [
{
"Verknüpfung": „https://www.instagram.com/tv/B9ex0TSlMCg/“,
"Bild": "https://scontent-hel2-1.cdninstagram.com/v/t51.2885-15/e35/p1080x1080/87611430_2959850554038353_1847999869221037422_n.jpg?_nc_ht=scontent-hel2-1.cdninstagram.com&_nc_cat=105&_nc_ohc=LjsOfeejEHIAX_EkiaS&oh=2c50756e50e4fe2bb4f226d8843b0e64&oe=5EA68E44",
"Untertitel": „Perspektivenwechsel“,
"Dauer": "1: 44"
},
{
"Verknüpfung": „https://www.instagram.com/tv/B84GQDlF_w8/“,
"Bild": "https://scontent-hel2-1.cdninstagram.com/v/t51.2885-15/e35/85025635_192470508692931_652833229817579830_n.jpg?_nc_ht=scontent-hel2-1.cdninstagram.com&_nc_cat=1&_nc_ohc=REfGNQCCkWUAX-VM8Cr&oh=7ccf83c46324e3da814da68a83445345&oe=5EA66F02",
"Untertitel": "Tal des Feuers",
"Dauer": "1: 47"
}
]
}

Crawlbase“Instagram-Hashtag„ Schaber

In diesem Beispiel ist es unser Ziel, Daten aus einer Instagram-Hashtag-Seite zu extrahieren, und zwar aus der URL https://www.instagram.com/explore/tags/love/. Crawlbases Crawling API bietet einen speziellen Scraper für Instagram-Hashtag-Seiten, der das Sammeln wichtiger Informationen von diesen Seiten erleichtert. Um dies zu erreichen, sollten Sie die "Schaber" Parameter im bereitgestellten Python-Code, indem Sie seinen Wert auf "Instagram-Hashtag"Nachfolgend sehen Sie ein Beispiel, das diese Änderung veranschaulicht und den Vorgang verständlicher macht:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
für Crawlbase importieren CrawlingAPI

# Legen Sie Ihr Crawlbase-Token fest
crawlbase_token = 'IHR_CRAWLBASE_TOKEN'

# URL der zu scrapenden Instagram-Hashtag-Seite
instagram_hashtag_url = „https://www.instagram.com/explore/tags/love/“

# Optionen für Crawling API
Optionen = {
'Schaber': „Instagram-Hashtag“,
}

# Erstellen Sie eine Crawlbase API-Instanz mit Ihrem Token
api = CrawlingAPI({ 'Zeichen': crawlbase_token })

versuchen: # Senden Sie eine GET-Anfrage, um die URL mit Optionen zu crawlen
Antwort = api.get(instagram_hashtag_url, Optionen=Optionen)

# Überprüfen Sie, ob der Antwortstatuscode 200 (OK) ist.
if Antwort.get('Statuscode', 0) == 200:
# Analysieren Sie die JSON-Antwort und drucken Sie sie aus
Antwort_Body_Json = Antwort.get('Körper', {})
drucken(Antworttext_json)
sonst:
drucken(f"Anforderung fehlgeschlagen mit Statuscode: {Antwort.get('Statuscode', 0)}")

ausgeschlossen Exception as e: # Behandeln Sie alle Ausnahmen oder Fehler
drucken(f"API-Anforderungsfehler: {str(e)}")

JSON-Antwort:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
{
"Hashtag": "#Liebe",
"BeiträgeAnzahl": 1922533116,
"Bild": "https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/s150x150/120246611_370598574112098_9059520366968441717_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=106&_nc_ohc=R-6kKmhfuBMAX83OgWd&_nc_tp=15&oh=153a7cc8b65ebe5e6e9e61d983bc56af&oe=5F9D1E75",
"openStories": [
{
"Bild": "https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/s150x150/120246611_370598574112098_9059520366968441717_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=106&_nc_ohc=R-6kKmhfuBMAX83OgWd&_nc_tp=15&oh=153a7cc8b65ebe5e6e9e61d983bc56af&oe=5F9D1E75",
"text": ""
}
],
„Beiträge“: [
{
"Verknüpfung": „https://www.instagram.com/p/CFr2LTkDGAL“,
"Ich würde": 2408256697191391000,
"Kurzwahl": „CFr2LTkDGAL“,
"Bild": "https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/p1080x1080/120203930_765572937337282_8075299313306189359_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=kL7cL2KiBN4AX_NYjVH&_nc_tp=19&oh=90b2d2e4132aeae51b365fc19aed877b&oe=5F9C1051",
"Untertitel": "Ernsthaft.\nDessous @incantoofficial 👙\n-\n-\n-\n#fitness #gym #workout #fit #fitnessmotivation #motivation #bodybuilding #training #health #love #lifestyle #fitfam #instagood #sport #healthylifestyle #healthy #crossfit #gymlife #personaltrainer #follow #exercise #instagram #like #muscle #weightloss #life #fitnessmodel #gymmotivation #fashion #bhfyp",
"Bilddaten": „Foto geteilt von ALICEORR Ù am 28. September 2020 mit dem Tag @incantoofficial. Bild kann enthalten: 1 Person, Nahaufnahme.“,
"Bilder": [
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/c0.156.1440.1440a/s150x150/120203930_765572937337282_8075299313306189359_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=kL7cL2KiBN4AX_NYjVH&_nc_tp=16&oh=2cc026bc4c80afa790da8963a4e5d29c&oe=5F99BF4B",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/c0.156.1440.1440a/s240x240/120203930_765572937337282_8075299313306189359_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=kL7cL2KiBN4AX_NYjVH&_nc_tp=16&oh=f0190a3d7886bf26d8cf364d08205cfc&oe=5F9CDC4D",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/c0.156.1440.1440a/s320x320/120203930_765572937337282_8075299313306189359_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=kL7cL2KiBN4AX_NYjVH&_nc_tp=16&oh=9aedc25e6054c9a0e70cbb1f1f7b81fe&oe=5F9B8FB3",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/c0.156.1440.1440a/s480x480/120203930_765572937337282_8075299313306189359_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=kL7cL2KiBN4AX_NYjVH&_nc_tp=16&oh=6b20088f6ba92cc64ae94b4d231aa125&oe=5F9BB5F6",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/sh0.08/e35/c0.156.1440.1440a/s640x640/120203930_765572937337282_8075299313306189359_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=kL7cL2KiBN4AX_NYjVH&oh=78dff09d1276b9a5ab713b2fdea342ca&oe=5F9D6B7B"
],
"Kommentaranzahl": 20,
"Gefällt mirAnzahl": 633,
"Vorschauanzahl": 633,
"Eigentümer": {
"Ich würde": "263510071"
},
"aufgenommen bei": "2020-09-28T15:23:11.000+00:00",
"istVideo": falsch
},
{
"Verknüpfung": „https://www.instagram.com/p/CBkWvL5BYhz“,
"Ich würde": 2334090506491234300,
"Kurzwahl": „CBkWvL5BYhz“,
"Bild": "https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/104132652_564752484400882_961350199636081290_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=WHvCFqed1wgAX-Mzb7F&_nc_tp=18&oh=81fb128b21e96e4ef4214e1afe60c395&oe=5F9BC995",
"Untertitel": „𝐉𝐮𝐬𝐭 𝐚𝐭𝐢𝐫𝐞𝐝 𝐬𝐨𝐮𝐥𝐢𝐥𝐞 𝐬𝐢𝐦𝐞 𝐏𝐜𝐭𝐢𝐯𝐞 𝐭𝐡𝐢𝐧𝐤𝐢𝐧𝐠! 🐾🔥\n.\n.\n#captionplus #reisen #natur #draußen #fotografie #fotodestages #winter #landschaft #trekking #berge #camping #liebe #wald #naturliebhaber #wunderschön #sonnenuntergang #sonne #abenteuer #naturfotografie #himmel #erkunden # #draußen #wandern #Schnee #Berg #Fernweh #Meer",
"Bilddaten": „Foto von 𝐏𝐎𝐎𝐇𝐑𝐀𝐕𝐕 𝐍𝐄𝐆𝐈 🦄 in BRUH. Bild könnte enthalten: 1 Person, Nahaufnahme.“,
"Bilder": [
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/s150x150/104132652_564752484400882_961350199636081290_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=WHvCFqed1wgAX-Mzb7F&_nc_tp=15&oh=8bedd624b0de89f73545d637d0d1a1c1&oe=5F9D27D7",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/s240x240/104132652_564752484400882_961350199636081290_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=WHvCFqed1wgAX-Mzb7F&_nc_tp=15&oh=b794838e9b4fe5ea80a4064c16bd68ad&oe=5F99C21D",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/s320x320/104132652_564752484400882_961350199636081290_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=WHvCFqed1wgAX-Mzb7F&_nc_tp=15&oh=dd30cd55554d1ccd748fcdce7798aaec&oe=5F9AC027",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/s480x480/104132652_564752484400882_961350199636081290_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=WHvCFqed1wgAX-Mzb7F&_nc_tp=15&oh=b1a857e926e5954c3499ea11ff05e4fc&oe=5F9CE07D",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/sh0.08/e35/s640x640/104132652_564752484400882_961350199636081290_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=110&_nc_ohc=WHvCFqed1wgAX-Mzb7F&oh=664518fb766b403dc6730286ab4d9045&oe=5F9CE5F2"
],
"Kommentaranzahl": 22,
"Gefällt mirAnzahl": 301,
"Vorschauanzahl": 301,
"Eigentümer": {
"Ich würde": "8305592364"
},
"aufgenommen bei": "2020-06-18T07:28:12.000+00:00",
"istVideo": falsch
},
{
"Verknüpfung": „https://www.instagram.com/p/Bi-gtzJlA6N“,
"Ich würde": 1783006387271634700,
"Kurzwahl": „Bi-gtzJlA6N“,
"Bild": "https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/31890427_1239149812887528_4372281762504507392_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=100&_nc_ohc=aySdF8l2m1EAX-8cHl_&_nc_tp=18&oh=bf38e0776301d7ce67a38d3d34629b6b&oe=5F99F9D4",
"Untertitel": „Die Erde ist unser Rasen. \nBestes Yoga-Hilfsmittel 💯\nDhurvaYoga.com“,
"Bilddaten": „Foto von Dhurva Yoga® im Hard Rock Hotel San Diego mit @hardrocksd, @fitathletic, @partynakedsd, @pointlomasportsclub, @supersofie86, @floatpoolclub und @sunburnpool. Bild kann enthalten: 2 Personen.“,
"Bilder": [
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/c215.0.650.650a/s150x150/31890427_1239149812887528_4372281762504507392_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=100&_nc_ohc=aySdF8l2m1EAX-8cHl_&_nc_tp=16&oh=8c13d5e2d2fa44b74c2a86a7b00f3c49&oe=5F9A0FC8",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/c215.0.650.650a/s240x240/31890427_1239149812887528_4372281762504507392_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=100&_nc_ohc=aySdF8l2m1EAX-8cHl_&_nc_tp=16&oh=85007b413309462dfbf2072c7c489ed4&oe=5F9AB3C2",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/c215.0.650.650a/s320x320/31890427_1239149812887528_4372281762504507392_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=100&_nc_ohc=aySdF8l2m1EAX-8cHl_&_nc_tp=16&oh=34cf919addc6189a51a6d0540d1675fc&oe=5F9A6640",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/e35/c215.0.650.650a/s480x480/31890427_1239149812887528_4372281762504507392_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=100&_nc_ohc=aySdF8l2m1EAX-8cHl_&_nc_tp=16&oh=d44bac8fc2936b387c2fce9639345c8d&oe=5F9C7379",
"https://instagram.fccu1-1.fna.fbcdn.net/v/t51.2885-15/sh0.08/e35/c215.0.650.650a/s640x640/31890427_1239149812887528_4372281762504507392_n.jpg?_nc_ht=instagram.fccu1-1.fna.fbcdn.net&_nc_cat=100&_nc_ohc=aySdF8l2m1EAX-8cHl_&oh=de802bc56258d23ba321200bdd1a91fa&oe=5F9AFB01"
],
"Kommentaranzahl": 8,
"Gefällt mirAnzahl": 178,
"Vorschauanzahl": 178,
"Eigentümer": {
"Ich würde": "21731675"
},
"aufgenommen bei": "2018-05-19T23:02:26.000+00:00",
"istVideo": falsch
}
]
}

So überwinden Sie die Herausforderungen beim Scraping von Instagram

In der Welt des Web Scraping haben Plattformen wie Instagram Anti-Scraping-Maßnahmen implementiert, um Benutzerdaten zu schützen und die Integrität ihres Dienstes aufrechtzuerhalten. Instagrams riesige Benutzerbasis und die Fülle an Daten, die es speichert, machen es zu einem attraktiven Ziel für Web Scraper. Aufgrund dieser Schutzmechanismen ist das Scraping von Daten von Instagram jedoch mit Herausforderungen verbunden.

Instagrams Anti-Scraping-Mechanismen

  1. Ratenbegrenzung: Instagram verwendet Ratenbegrenzungen, um Benutzeranfragen innerhalb eines bestimmten Zeitrahmens zu beschränken. Wenn Sie diese Grenzen überschreiten, kann Instagram Ihren Zugriff vorübergehend blockieren oder Ihr Konto oder Ihre IP-Adresse dauerhaft sperren.
  2. CAPTCHA: Wie die meisten namhaften Websites und Apps verwendet Instagram eine CAPTCHA-Funktion, um zu überprüfen, ob ein Benutzer ein Mensch ist. Diese Überprüfung kann beim Anmelden oder Durchsuchen der Anwendung an verschiedenen Kontaktpunkten erfolgen.
  3. Dynamischer Inhalt: Instagram verfügt über eine dynamische Seitenstruktur, die häufig aktualisiert wird, was das Scraping problematisch macht.
  4. Sitzungscookies: Der Social-Media-Riese verwendet Cookies, um die Benutzeraktivität zu verfolgen und Änderungen im Verhaltensmuster zu überwachen. Die Plattform gibt regelmäßig Warnmeldungen aus, wenn sich das Browserverhalten plötzlich ändert.
  5. User-Agent-Prüfungen: Instagram kann die vom Scraper in den HTTP-Headern gesendete User-Agent-Zeichenfolge genau prüfen. Ungewöhnliche oder verdächtige User-Agent-Zeichenfolgen können zur Erkennung führen.

Strategien zur Vermeidung der Erkennung beim Scraping von Instagram

Instagram hat zu Recht hochrangige Sicherheitsmaßnahmen ergriffen, um die Plattform vor Sicherheitsbedrohungen zu schützen. Diese Maßnahmen können jedoch für Web Scraper zu einem Debakel werden. Hier sind einige Möglichkeiten, um zu vermeiden, dass Sie beim Scraping von Daten auf Instagram blockiert werden:

  1. Proxys verwenden: Sie können einen Scraper einsetzen mit rotierende IP-Adressen und Proxy-Server, um nicht entdeckt zu werden. Anstatt eine einzelne IP-Adresse zu verwenden, verteilen diese Proxys die Anfragen auf mehrere IPs, um die Wahrscheinlichkeit einer Ratenbegrenzung oder einer Blockierung der IP zu verringern.
  2. Benutzeragenten randomisieren: Sie können eine User-Agent-Zeichenfolge nach dem Zufallsprinzip auswählen, um verschiedene Benutzer zu imitieren und so die Wahrscheinlichkeit zu verringern, dass Instagram Ihre Aktivität erkennt.
  3. Sitzungsverwaltung: Stellen Sie sicher, dass Sie einen Web Scraper auswählen, der eine konsistente Benutzersitzung aufrechterhält, da dies zu Blockierungen durch Instagram führt.
  4. Anforderungshäufigkeit begrenzen: Sie müssen zwischen Ihren Anfragen Intervalle einplanen, um das natürliche Surfverhalten nachzuahmen und zu vermeiden, dass Sie als automatisierter Bot gekennzeichnet werden.
  5. Simulation des Benutzerverhaltens: Replizieren Sie typisches Benutzerverhalten, indem Sie durch Seiten scrollen, auf Beiträge klicken und mit der Site wie ein menschlicher Benutzer interagieren.
  6. Vermeiden Sie Stoßzeiten: Scraping außerhalb der Spitzenzeiten verringert die Wahrscheinlichkeit, auf Ratenbegrenzungen oder CAPTCHAs zu stoßen, da die Server von Instagram weniger überlastet sind.
  7. Respektieren Sie Robots.txt: Überprüfen Sie die robots.txt-Datei von Instagram, in der die Scraping-Richtlinien aufgeführt sind. Die Einhaltung dieser Richtlinien vermeidet Scraping-Probleme und gewährleistet ethische Scraping-Praktiken.
  8. Verwenden Sie Headless-Browser: Headless-Browser wie Selenium können JavaScript rendern und ein authentischeres Surferlebnis bieten, wodurch die Wahrscheinlichkeit einer Erkennung verringert wird.

Diese Strategien können zwar Ihre Chancen erhöhen, nicht entdeckt zu werden, es ist jedoch wichtig zu betonen, dass das Scraping von Instagram-Daten immer ethisch und in Übereinstimmung mit den Nutzungsbedingungen und gesetzlichen Bestimmungen von Instagram erfolgen sollte. Verantwortungsvolle Scraping-Praktiken tragen zu einer positiven Online-Präsenz bei und mindern rechtliche Risiken.

Verwenden Sie Crawlbase, um Instagram-Daten effizient zu scrapen

Instagram bleibt eine der besten Quellen für die Datenerfassung, da es verschiedene Arten von Zielgruppen zur Auswahl hat. Sie benötigen jedoch einen zuverlässigen Web Scraper, der von den zahlreichen Sicherheitsmaßnahmen der Plattform nicht erkannt wird. Crawlbase Crawling API durchsucht mobile Apps wie Instagram auf intelligente Weise und beseitigt alle Arten von Hindernissen. Sie können sich auf den reibungslosen Ablauf und die Kontrolle verlassen, um Ihre Geschäftsdaten optimal zu nutzen.
Darüber hinaus müssen Sie sich keine Gedanken über rechtliche oder datenschutzrechtliche Fragen machen, da unsere API bereits verschiedene Vorschriften einhält. Sie müssen sich lediglich anmelden und können nahtlos mit dem Scraping beginnen.

Häufig gestellte Fragen (FAQ)

Was ist Instagram Scraper?

Ein Instagram Scraper ist ein Softwaretool oder Programm, das Daten von der Instagram-Plattform extrahiert. Es automatisiert das Sammeln von Informationen aus Instagram-Profilen, Posts, Kommentaren und anderen öffentlichen Inhalten. Instagram-Schaber Verwenden Sie Web-Scraping-Techniken, um auf Daten wie Bilder, Text, Benutzerprofile, Hashtags und Engagement-Metriken zuzugreifen und diese abzurufen.

Das Scraping von Instagram ist legal, solange Sie keine Urheberrechte und Datenschutzgesetze verletzen. Das bedeutet, dass Sie das Scraping von geistigem Eigentum oder privaten Informationen vermeiden sollten. Das Scraping ist nur für öffentlich zugängliche Daten zulässig, wie etwa Bilder, Kommentare und Kennzahlen wie die Anzahl der Likes und Follower. Es ist jedoch wichtig, beim Scraping das Sammeln persönlicher Informationen, wie etwa Kontaktdaten, zu vermeiden.

Beim Scraping von Instagram gibt es ethische Bedenken hinsichtlich der Zustimmung des Benutzers, der Datennutzung und der Einhaltung der Nutzungsbedingungen von Instagram. Der Respekt vor der Privatsphäre der Benutzer, die Einholung der Zustimmung bei der Erfassung personenbezogener Daten und der Einsatz verantwortungsvoller Scraping-Praktiken sind von entscheidender Bedeutung.

Rechtlich gesehen kann Scraping Urheberrechte verletzen, gegen Datenschutzgesetze verstoßen und gegen die Nutzungsbedingungen von Instagram verstoßen, was möglicherweise zu rechtlichen Schritten oder zur Sperrung des Kontos führen kann. Um diese Probleme zu bewältigen, müssen die Praktiker Transparenz, verantwortungsvollen Umgang mit Daten und die Einhaltung relevanter Gesetze und Vorschriften priorisieren und gleichzeitig die ethischen Auswirkungen ihres Handelns anerkennen.

Welche Arten von Daten können von Instagram gescrapt werden?

Von Instagram können zahlreiche Daten extrahiert werden, darunter:

  1. Benutzerprofil: Informationen über Benutzer, wie etwa Benutzername, Biografie, Anzahl der Follower und Beiträge.
  2. Beiträge: Text, Bilder und Videos aus Benutzerbeiträgen, einschließlich Bildunterschriften, Hashtags und Engagement-Metriken (Likes, Kommentare, Shares).
  3. Kommentare: Zu Beiträgen abgegebene Kommentare, einschließlich Benutzername, Text und Zeitstempel des Kommentators.
  4. Vorlieben und Abneigungen: Daten zur Anzahl der Likes und Dislikes (sofern öffentlich) zu Posts und Videos.
  5. Follower und Follower: Listen von Benutzern, die einem bestimmten Konto folgen, und denjenigen, denen das Konto folgt.
  6. Hashtags: Informationen zu den in den Beiträgen verwendeten Hashtags, einschließlich der Häufigkeit ihrer Verwendung.
  7. Standortdaten: Mit Posts verknüpfte geografische Informationen, beispielsweise der Ort, an dem ein Foto aufgenommen wurde.
  8. Benutzergeschichten: In der Story-Funktion geteilte Inhalte, darunter Bilder und Videos.
  9. Profilanalyse: Engagement-Daten, wie etwa die Anzahl der Likes, Kommentare und Follower-Wachstumstrends im Zeitverlauf.
  10. Öffentlich verfügbare Kontaktinformationen: Kontaktdaten, die Benutzer öffentlich gemacht haben, wie etwa E-Mail-Adressen oder Website-Links.

Es ist wichtig zu beachten, dass einige dieser Daten zwar öffentlich zugänglich sind, das Scraping jedoch immer unter Einhaltung der Servicebedingungen und gesetzlichen Bestimmungen von Instagram erfolgen sollte und die Privatsphäre der Benutzer sowie ethische Aspekte gewahrt bleiben müssen.

Was sind einige praktische Anwendungsfälle für gescrapte Instagram-Daten?

Scraped Instagram-Daten können in einer Vielzahl praktischer Anwendungsfälle eingesetzt werden und liefern wertvolle Erkenntnisse und Informationen für verschiedene Zwecke. Einige praktische Anwendungsfälle für Scraped Instagram-Daten sind:

  1. Social Media Marketing: Analysieren Sie das Engagement der Benutzer, beliebte Hashtags und Inhaltstrends, um Ihre Social-Media-Marketingstrategien zu optimieren.
  2. Influencer-Marketing: Identifizieren Sie potenzielle Influencer, verfolgen Sie ihre Engagement-Raten und beurteilen Sie ihre Eignung für eine Zusammenarbeit.
  3. Wettbewerbsanalyse: Überwachen Sie die Social-Media-Aktivitäten, die Content-Performance und das Follower-Wachstum Ihrer Wettbewerber, um sich einen Wettbewerbsvorteil zu verschaffen.
  4. Marktforschung: Sammeln von Daten zu Kundenpräferenzen, Meinungen und Trends in Bezug auf bestimmte Produkte oder Dienstleistungen.
  5. Trend analysen: Identifizierung neuer Trends, viraler Inhalte und beliebter Themen in bestimmten Nischen oder Branchen.