Apache Spark og Scala kursus - Klasseundervisning

14.500,00 DKK

  • 24 hours
Live Virtuelt Klasselokale
Internt / I virksomheden
Næste hold:May 11, 2026
+ 14 dage tilbage

Lås op for det fulde potentiale i big data ved at mestre Apache Spark med Scala – en af de mest kraftfulde kombinationer inden for moderne data engineering. Dette praktiske kursus er designet til at hjælpe dig med at behandle, analysere og udlede indsigt fra enorme datamængder ved hjælp af Sparks lynhurtige in‑memory-beregningskraft. Du lærer at opbygge skalerbare datapipelines, udføre realtidsanalyse og implementere machine learning‑modeller – samtidig med at du udvikler stærke programmeringsfærdigheder i Scala.

Nøglefunktioner

Sprog

Kursusmateriale på engelsk

Niveau

Begynder- til mellemniveau

24 timers instruktørledet, praktisk træning

50+ timers anbefalet studietid

3 virkelige projekter til praktisk anvendelse

Over 70 timers quizzer, opgaver og øvelsesmateriale

Praktiske laboratorier med virkelige datasæt

Dækning af Spark-økosystemets værktøjer som Spark SQL, MLlib og Streaming

Praktisk erfaring med Scala-programmering

Ekspertvejledning og støtte gennem hele kurset

Bed om bekræftelse af datoen!

Certifikat for gennemført program medfølger

Hero

Læringsudbytte

Når du har gennemført dette program, vil du være i stand til at:

Grundlæggende Big Data

Opnå en solid forståelse af big data‑begreber, centrale komponenter og frameworks, herunder Hadoop‑arkitektur og dens driftsmåder.

Introduktion til Scala

Lær det grundlæggende i Scala-programmering, herunder den centrale syntaks og de begreber, der kræves for at arbejde med Apache Spark.

Introduktion til Spark

Forstå de grundlæggende principper i Apache Spark, og hvordan man bygger og kører Spark-applikationer.

Spark-rammeværk og -implementering

Udforsk Spark‑frameworket i dybden, herunder dets arkitektur og forskellige implementeringsmetoder.

Spark-datastrukturer

Arbejd med Sparks interne datastrukturer såsom RDD’er, og brug API’er og Scala-funktioner til at oprette og transformere data.

Spark-økosystem

Få praktisk erfaring med centrale komponenter i Spark-økosystemet, herunder Spark SQL, Streaming, MLlib, GraphX og mere.

Hero

Kursusforløb

  1. Introduktion til Big Data, Hadoop og Spark

    Lektion 1

    • Big data-koncepter og virkelige anvendelsestilfælde
    • Hadoop-økosystemet og HDFS
    • Klyngearkitektur og YARN
    • Batch- kontra realtidsbehandling
    • Introduktion til Spark og dets fordele
  2. Introduktion til Scala

    Lektion 2

    • Grundlæggende Scala og REPL
    • Variabler, kontrolstrukturer og funktioner
    • Samlinger (Array, Map, Lister, Tupler)
    • Scala i big data-økosystemer
  3. Objektorienteret og funktionel programmering i Scala

    Lektion 3

    • Klasser, objekter og pakker
    • Egenskaber og arv
    • Funktionelle programmeringskoncepter
    • Højereordensfunktioner og fejlhåndtering
  4. Scala-kollektion-API'er

    Lektion 4

    • Samlingstyper og hierarkier
    • Ydelsesmæssige egenskaber
    • Java-interoperabilitet
    • Brug af implicits i Scala
  5. Introduktion til Spark og RDD'er

    Lektion 5

    • Spark-arkitektur og opsætning
    • Spark-applikationer og Spark-shell
    • RDD (Resilient Distributed Datasets)
    • Datatransformationer og handlinger
    • Caching og persistens
    • Indlæsning og lagring af data
  6. Spark SQL og databehandling

    Lektion 6

    • Spark SQL-arkitektur
    • DataFrames og datasæt
    • Arbejde med JSON og Parquet
    • Brugerdefinerede funktioner (UDF'er)
    • Integration med Hive
  7. Maskinlæring med Spark MLlib

    Lektion 7

    • Introduktion til maskinlæringskoncepter
    • MLlib-funktioner og -værktøjer
    • Superviserede og ikke-superviserede algoritmer
    • Lineær regression, beslutningstræer, tilfældige skove
    • Klyngedannelsesteknikker
  8. Streaming med Kafka og Flume

    Lektion 8

    • Begreber inden for realtidsdatabehandling
    • Kafka-arkitektur og klyngeopsætning
    • Dataindsamlings- og streaming-pipelines
Apache Spark og Scala-kursus

Hvem bør tilmelde sig dette program?

Forudsætninger

  • Grundlæggende forståelse af SQL og databaser
  • Kendskab til programmering (Python, Java eller Scala anbefales)
  • Grundlæggende kendskab til Linux/Unix (hjælpsomt, men ikke obligatorisk)
  • Kendskab til Hadoop‑koncepter er en fordel, men ikke et krav



Datascientists og dataingeniører

Dataanalytikere og BI-fagfolk

Softwareudviklere og -arkitekter

Forskningsprofessionelle, der arbejder med data

Start kurset nu

Udtalelser

Licensering og akkreditering

Kurset udbydes i henhold til Partnerprogramaftalen og overholder kravene i Licensaftalen.

Lighedspolitik

Kandidater opfordres til at kontakte AVC for vejledning og støtte gennem hele processen med tilpasning af arbejdsforhold.

Ofte stillede spørgsmål

Contact background

Har du brug for virksomhedsløsninger eller LMS-integration?

Fandt du ikke kurset eller programmet, der ville være til gavn for din virksomhed? Har du brug for LMS-integration? Skriv til os, vi løser alt!