Vissza

A Talend, mint ETL-eszköz

  Bence Baranyás

  2018.03.20. 16:05

A Talend egy nyílt forráskódú szoftverintegrációs platform, amely adatintegrációs és adatkezelési megoldásokat kínál. 2005 óta létezik a piacon. Ez a platform különböző integrációs szoftvereket és szolgáltatásokat nyújt nagy mennyiségű adat kezelésére a felhőben, továbbá adatintegráció, adatkezelés, adatminőség, adatelőkészítés témakörében. A fejlesztő cég központja Redwood Cityben található, Kaliforniában.

Támogatja az ETL megoldásokat. Széles körben használják a különböző rendszerek közötti integrációra, ETL folyamatokhoz és adat migráláshoz.

De hogy mi is pontosan az ETL? Extract (kinyerés), Transform (átalakítás), és Load (betöltés). Az adatok kinyerése nagyvállalati környezetben általában valamilyen relációs adatbázisból történik. A kinyert adatok ezután átalakításon mennek keresztül, mely során strukturált formára kell hozni őket. Az utolsó lépésben pedig a cél adattárházba való betöltés következik.

A Talend által kínált különböző termékek:

Architektúra:

  • Szerver oldal:
    • TAC (Talend Administration Center):
      Egy weboldal alapú alkalmazás, mely központosítja a Talend Open Studo menedzselését és adminisztrációját. A projektek és a folyamatok egy távoli tárolóban vannak központosítva, amely lehetővé teszi az erőforrások megosztását és a projektek konfigurálását. Emellett tudjuk ütemezni a job-ok futását is. A központosítás azért is jó, mert az egymástól távol lévő kollégák is tudják ugyanazokat a job-okat futtani és módosítani.
    • CommandLine:
      A CommandLine egy GUI nélküli Talend Studio. Ugyanazokat az alapvető funkciókat nyújtja – a Studióra később még visszatérünk.
    • Job Server:
      Olyan virtuális gép, ami futtatja a tulajdonképpeni job-ot.

 

  • Kliens oldal:
    • Talend Open Studio:
      A Talend Open Studio felhasználóbarát felületet biztosít, amely lehetővé teszi a Talendben végrehajtott folyamatok definícióját és konfigurációját tartalmazó metaadat-tárolók elérését. A komponensek alapvetően Java nyelven vannak írva így, ha valaki ért a Javahoz, könnyedén fejleszthet egyedi komponenseket. A beépített komponensek széles köre miatt egyedi komponensek fejlesztésére főleg nagyvállalati környezetben lehet szükség.

 

Talend Open Studio GUI bemutatása:

  1. Repository
    A repository összegyűjti az összes technikai elemet, melyek vagy az üzleti modellek leírására, vagy a Talenden belüli munkák megtervezésére szolgálnak.
  2. Tervező ablak
    Erre az ablakra, áttekinthető grafikus felületre rakhatjuk, és itt kapcsolhatjuk össze a különböző komponenseket. Az adatáramlás folyamatát tervezhetjük meg. Szükség esetén a Talend által generált Java forráskódot is megnézhetjük.
  3. Paletta
    Itt találhatjuk meg a különböző komponenseket, melyekkel többféle adatbázishoz tudunk kapcsolódni, vagy fájlból tudunk olvasni.
  4. Konfigurációs ablak:
    A konfigurációs ablakon paraméterezhetjük fel az egyes komponenseket.

A Talend átfogó megoldás, ami különböző szoftverházak által fejlesztett, eltérő megoldások széles köréhez tud kapcsolódni, és lehetőséget nyújt ETL-folyamatok professzionális tervezésére és végrehajtására, valamint az ETL-folyamatokat szervező nagyobb csapatok együttműködésére.


   

Megjegyzések
Még nincsenek hozzászólások. Légy első!

Blog kategória

Címkefelhő

Legutóbbi bloggerek

Tamás Molnár
Bejegyzések: 8
Csillagok: 11
Dátum: 2019.07.16.
Tibor Sánta
Bejegyzések: 5
Csillagok: 2
Dátum: 2019.06.27.
Bálint Mészáros
Bejegyzések: 1
Csillagok: 0
Dátum: 2019.06.11.
Adrienn Keszőcze
Bejegyzések: 1
Csillagok: 0
Dátum: 2019.05.28.
Bernadett Bertalanné Szemes
Bejegyzések: 1
Csillagok: 0
Dátum: 2019.05.27.

Kapcsolat