Loading Tečajevi

Apache Spark - napredno korištenje

  18.04.2017. - 19.04.2017.
Trajanje tečaja :  2 Dana
Tečaj je namijenjen polaznicima koji žele naučiti naprednije stvari u Spark okruženju, primjerice što je Spark Streaming.

Apache Spark je framework za brzu obradu velike količine podataka koji se može koristiti generalno za sve vrste obrade podataka. Apache Spark je jako popularan sustav koji se uvelike koristi za naprednu analitiku, data science, modernu BigData arhitekturu kao i kompleksna batch (ETL) procesiranja te za obradu u realnom vremenu. Spark sadrži nekoliko ključnih komponenti kako što su: Spark SQL za strukturiranje podataka, Sprak Streaming za obradu velike količine podataka u realnom vremenu, Spark MLib za strojno učenje, Spark GraphX za graph procesiranje te SparkR za statističku obradu podataka korištenjem R jezika. Spark se može pokretati samostalno, na YARN (Hadoop) clusteru ili u Mesos okruženju, dakle može se pokretati u bilo kojem okruženju. Spark je polyglot framework što znači da maksimalno apstrahira njegovu primjenu pa tako razvojnom okruženju nameće korištenje programskog jezika (Python, Java, Scala, R) koji najbolje odgovara unutar organizacije ili vrsti posla. Svi primjeri u ovoj edukaciji bit će primarno obrađeni u Pythonu, ali primijenit će se i drugi programski jezici npr. Scala. Radit će se u samostalnom i cluster okruženju ovisno o zadatku koji će polaznici odrađivati.

Ova edukacija namijenjena je Data Science inženjerima i poslovnim analitičarima.

Napredno korištenje

Tečaj je namijenjen polaznicima koji žele naučiti naprednije stvari u Spark okruženju, primjerice što je Spark Streaming. Polaznici će dobiti sve potrebne informacije o tome kako uspostaviti streaming proces za obradu podataka u realnom vremenu. Upoznat će i MLib library za strojno učenje (machine learning) gdje će izgraditi model za strojno učenje te će im biti pokazan i proces treniranja modela. Primjenom GraphX library za obradu i procesiranje graf baza podataka kroz nekoliko primjera pokazat ćemo kako se on može uspješno koristiti u praksi.

Preduvjeti

Preduvjeti: Osnovno poznavanje Python programskog jezika, poznavanje OO programiranja, napredno poznavanje SQL jezika.

Za sve upite vezane uz tečaj slobodno nam se obratite putem e-mail adrese learn@croz.net.

Ostali termini tečaja:

Prijavi se na ovaj tečaj