Apache Spark is an open-source distributed general-purpose cluster-computing framework. Spark provides an interface for programming entire clusters with implicit data parallelism and fault tolerance. Originally developed at the University of California, Berkeley's AMPLab, the Spark codebase was later donated to the Apache Software Foundation, which has maintained it since.
Apache Spark has its architectural foundation in the resilient distributed dataset (RDD), a read-only multiset of data items distributed over a cluster of machines, that is maintained in a fault-tolerant way.[2] The Dataframe API was released as an abstraction on top of the RDD, followed by the Dataset API. In Spark 1.x, the RDD was the primary application programming interface (API), but as of Spark 2.x use of the Dataset API is encouraged[3] even though the RDD API is not deprecated.[4][5] The RDD technology still underlies the Dataset API.[6][7]
Quelle: Wikipedia
Übersetzen Sie aus dem Niederländischen mit Google Translat
Das OEM Office Elearning Menu bietet Apache Spark E-Learning-Schulungen und Online-Kurse an, um Sie auch online auf die entsprechende Zertifizierung vorzubereiten. Die Lehrer sind nicht nur zertifiziert, sondern verfügen auch über langjährige praktische Erfahrung. Dies gibt Ihnen das gleiche Wissen und die gleiche Erfahrung wie beim klassischen Training. Zusätzlich bieten wir je nach Kurs Prüfungsquiz (falls verfügbar), Online-Mentor (falls verfügbar) per Chat oder E-Mail, MeasureUp-Prüfungssimulation (falls verfügbar (manchmal gegen Gebühr)), Live Labs (falls verfügbar (gegen Gebühr)) an. und Tipps und Tricks.