Vissza

Webscraping python segítségével

  Bence Baranyás

  2017.05.24. 13:28

 

 

Számos módszer van az interneten elérhető adatok leszedésére. A legjobb módszer valószínűleg az API-k használata. Szinte mindegyik nagyobb weboldal, mint például a Twitter, Facebook, Google, StackOverflow  kínál API-t ahhoz, hogy strukturált módon hozzáférhessünk adataikhoz. Ha az API-n keresztül megkaphatjuk azt, amire szükségünk van, ezt részesítsük előnyben a web scraping helyett. Viszont nem minden webhely ad API-t. Néhányan azért nem, mert nem szeretnék, hogy mások megszerezzék a hatalmas adathalmazaikat, míg mások technikai ismeretek hiányában nem adnak API-t.

Mi is az a Web Scraping?

A Web Scraping egy olyan technika, melynek segítségével adatokat gyűjthetünk weboldalakról. Ez a technika elsősorban strukturálatlan adatok valamilyen adatbázisba vagy táblázatba történő betöltésére összpontosít. Ebben a blogban a Python adta lehetőségeket szeretném ismertetni egy példán keresztül.

IPython notebook közvetlen linkje

Amennyiben pedig továbblépnél és szeretnéd ezekből a lehetőségekből a mindennapi munkában minél többet hasznosítani, keress fel minket az elérhetőségeink valamelyikén.


   

Megjegyzések
Még nincsenek hozzászólások. Légy első!

Blog kategória

Címkefelhő

Legutóbbi bloggerek

Bálint Mészáros
Bejegyzések: 1
Csillagok: 0
Dátum: 2019.06.11.
Adrienn Keszőcze
Bejegyzések: 1
Csillagok: 0
Dátum: 2019.05.28.
György Retek
Bejegyzések: 11
Csillagok: 19
Dátum: 2019.05.14.
Kálmán Bohus
Bejegyzések: 3
Csillagok: 0
Dátum: 2019.04.29.
Tamás Molnár
Bejegyzések: 7
Csillagok: 11
Dátum: 2019.03.18.

Kapcsolat