Was ist Data Scraping – und warum ist es so gefährlich?

Was ist Data Scraping – und warum ist es so gefährlich?

 

Data Scraping – die Beliebtheit im Internet steigt.
Doch was verbirgt sich hinter diesem Begriff und wie schützt man sich davor?

 

Worum handelt es sich bei „Data Scraping“?

 

Data Scraping (deutsch, wortwörtlich: Daten kratzen)
Es handelt sich hierbei um die Übertragung von Informationen von einer Webseite in eine Datenbank.
Das Scraping tritt bereits dann auf, wenn eine E-Mail-Adresse von einer Webseite in eine Kontaktliste kopiert wird.

In Unternehmen mit „Big Data“ geschieht das Scraping natürlich nicht manuell – Software oder Bots werden stattdessen zu diesem Zweck eingesetzt. Doch handelt es sich bei Daten nicht immer nur um lesbare Daten wie Namen oder Telefonnummern.

 

Was passiert mit den Daten?

 

Umstrukturierte Daten können in Datenbanken eingegeben und anschließend analysiert werden.
Sprich: Data Scraping bietet Unternehmen und weiteren die Möglichkeiten der Datenanalyse.

Es lässt sich sogar beispielsweise ableiten, an welchem genauen Punkt der Online-Kaufvorgang abgebrochen wird.
Auch ist einsehbar, welche Inhalte einer Webseite besonderes Interesse wecken.

Data Scraping erlaubt, sofern der User
a) über die Nutzung seiner Daten informiert wird,
UND b) der Nutzung der eigenen Daten zustimmt.

Doch kann die Technologie leider ebenso für illegale Zwecke genutzt werden, um an die persönlichen Daten von beliebigen Nutzern zu gelangen.

 

Nutzung durch Hacker und wie schützt man sich?

 

Hacker nutzen beispielsweise die Seiten von Social-Media-Plattformen, um an persönliche Daten zu gelangen.
Entweder werden die Scraper selbst auf die Webseite geschickt oder es wird stattdessen die komplette Datenbank gehackt.
Cyberkriminelle können mit jenen Daten verschiedenste Angriffe starten.

So können die Hacker auch Phishing-Attacken starten, sofern sie an E-Mail-Adressen gelangen.
Ebenfalls ist es möglich, dass sie an die Passwörter herankommen.
In der Theorie können die Datenbanken sogar im Dark Web zum Verkauf angeboten werden.

Ein Schutz gegen das unerwünschte Scraping ist leider nur in bedingtem Rahmen möglich.
Eine vollständige Sicherheit gibt es natürlich in keinem Fall.
Eine Möglichkeit besteht darin, die Online-Aktivitäten zu beobachten und zu verfolgen.

Ein Portal lässt sich so einrichten, dass die Anzahl der Aktivitäten einer bestimmten IP-Adresse in einem gewissen Zeitrahmen begrenzt ist. Diese Möglichkeit erschwert es den Hackern sehr, an Informationen zu gelangen und das Interesse schwindet umso schneller an den Daten, es wird aufgegeben.

Kommentar verfassen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.