Apache Spark oktatóanyag
Az Apache Spark oktatóprogramja a Spark alapvető és haladó fogalmait tartalmazza. Spark oktatóanyagunk kezdőknek és profiknak készült.
A Spark egy egységes analitikai motor nagyméretű adatfeldolgozáshoz, beleértve a beépített SQL-modulokat, streaminget, gépi tanulást és grafikonfeldolgozást.
A Spark oktatóanyagunk tartalmazza az Apache Spark összes témáját a Spark bevezetésével, a Spark telepítését, a Spark architektúráját, a Spark összetevőit, az RDD-t, a Spark valós idejű példáit és így tovább.
Mi az a Spark?
Az Apache Spark egy nyílt forráskódú fürt-számítási keretrendszer. Elsődleges célja a valós idejű generált adatok kezelése.
A Spark a Hadoop MapReduce tetejére épült. Memóriában való futtatásra optimalizálták, míg az olyan alternatív megközelítések, mint a Hadoop MapReduce, adatokat írnak a számítógép merevlemezére és onnan. Tehát a Spark sokkal gyorsabban dolgozza fel az adatokat, mint más alternatívák.
Az Apache Spark története
A Sparkot Matei Zaharia kezdeményezte 2009-ben az UC Berkeley AMPLab-nál. 2010-ben nyílt forráskódú, BSD licenc alatt.
2013-ban a projektet az Apache Software Foundation vásárolta meg. 2014-ben a Spark felső szintű Apache projektként jelent meg.
Az Apache Spark jellemzői
A Spark használata
Előfeltétel
A Spark megtanulása előtt rendelkeznie kell a Hadoop alapismereteivel.
Közönség
Spark oktatóanyagunk a kezdőknek és a profiknak készült.
Problémák
Biztosítjuk, hogy ezzel a Spark-oktatóanyaggal nem talál problémát. Ha azonban bármilyen hiba van, kérjük, írja be a problémát a kapcsolatfelvételi űrlapon.