Apache Spark tečajevi u Learn@CROZ edukacijskom centru

Ako se želite upustiti u Spark avanturu predlažemo vam naše Spark tečajeve.
Objavljeno 11.01.2017.

Osnovna vodilja ili cilj prilikom razvoja Apache Sparka bila je da se stvori jedna unificirana i polivalentna platforma za obradu (procesiranje) velike količine podataka kako za batch procesiranje tako i za procesiranje u realnom vremenu. Spark korisnici mogu biti poslovni analitičari koji znaju SQL jednako kao i developeri koji koriste jezike kao što su Python, Java, Scala ili R. Sustav se može pokretati u samostalnom okruženju te u clusteriranim okruženjima Hadoop YARN ili MESOS. Osim toga, sadrži komponente kao što su GraphX za procesiranje grafa ili MLib apstrakcije za potrebe strojnog učenja. Dakle, uz nabrojene funkcionalnosti Apache Spark je sustav koji je:

  • vrlo brzi query engine koji se vrti nad MapReduce frameworkom
  • dizajniran s ciljem da se može pokretati bilo gdje (samostalno ili  clusteri). Sadrži vlastiti cluster manager!
  • polivalentan jer omogućuje korištenje više programskih jezika Java, Python, Scala, R…

Kako započeti sa Sparkom?

Apache Spark zahvaljujući svojoj polivalentnosti i unificiranosti može se koristiti u različite svrhe te različitim okruženjima. Ako ste analitičar koji zna samo SQL a ima problema s velikom količinom podataka, Spark je svakako dobro rješenje za vas jer omogućuje da korištenjem SQL-a, jezika kojeg poznajete, vrlo brzo prijeđete na procesiranje u gotovo stvarnom vremenu. Ako radite u Data Science okruženju Spark vam također može pomoći, tj. reducirati za čak 80% vrijeme koje vam je potrebno za pripremu podataka.

Nadamo se da ste iz ovih par crtica dobili odgovor što je Spark zašto se koristi te da će vas dodatno inspirirati da ga isprobate u vašem okruženju i s vašim podacima. Ako se želite upustiti u Spark avanturu predlažemo vam naše Spark tečajeve:

  • Uvod u Apache Spark – detaljno upoznavanje sa Spark Core i Spark SQL konceptima na interaktivan način pišući kod i čitajući API doc, nasuprot statičnog PPT-a.
  • Apache Spark – napredno korištenje – Ako imate osnovno iskustvo sa Sparkom ovaj tečaj će vas dati uvid u Spark Streming, MLib za strojno učenje te korištenje GraphX API-ja.

Za sve upite vezane uz tečaj slobodno nam se obratite putem e-mail adrese learn@croz.net. Ponudu svih tečajeva koji se održavaju u Learn@CROZ edukacijskom centru možete pogledati ovdje.

Tagovi:
Povratak