Vissza

Webscraping python segítségével

  Bence Baranyás

  2017.05.24. 13:28

 

 

Számos módszer van az interneten elérhető adatok leszedésére. A legjobb módszer valószínűleg az API-k használata. Szinte mindegyik nagyobb weboldal, mint például a Twitter, Facebook, Google, StackOverflow  kínál API-t ahhoz, hogy strukturált módon hozzáférhessünk adataikhoz. Ha az API-n keresztül megkaphatjuk azt, amire szükségünk van, ezt részesítsük előnyben a web scraping helyett. Viszont nem minden webhely ad API-t. Néhányan azért nem, mert nem szeretnék, hogy mások megszerezzék a hatalmas adathalmazaikat, míg mások technikai ismeretek hiányában nem adnak API-t.

Mi is az a Web Scraping?

A Web Scraping egy olyan technika, melynek segítségével adatokat gyűjthetünk weboldalakról. Ez a technika elsősorban strukturálatlan adatok valamilyen adatbázisba vagy táblázatba történő betöltésére összpontosít. Ebben a blogban a Python adta lehetőségeket szeretném ismertetni egy példán keresztül.

IPython notebook közvetlen linkje

Amennyiben pedig továbblépnél és szeretnéd ezekből a lehetőségekből a mindennapi munkában minél többet hasznosítani, keress fel minket az elérhetőségeink valamelyikén.


   

Megjegyzések
Még nincsenek hozzászólások. Légy első!

Blog kategória

Címkefelhő

Bloggerek

György Retek
Bejegyzések: 5
Csillagok: 7
Dátum: 2017.09.30.
Mihály Kávási
Bejegyzések: 7
Csillagok: 4
Dátum: 2017.09.04.
Kata Rozmis
Bejegyzések: 9
Csillagok: 9
Dátum: 2017.07.18.
Zsolt Hajnalka
Bejegyzések: 2
Csillagok: 0
Dátum: 2017.06.01.
Bence Baranyás
Bejegyzések: 1
Csillagok: 1
Dátum: 2017.05.24.

Kapcsolat