Data Science med Python certificering - eLearning
3.900,00 DKK
- 50 hours
Kurset Python for Data Science dækker de grundlæggende programmeringskoncepter med Python og forklarer dataanalyse, maskinlæring, datavisualisering, webskrabning og behandling af naturligt sprog. Du vil opnå en omfattende forståelse af de forskellige pakker og biblioteker, der er nødvendige for at udføre aspekter af dataanalyse.
Vigtige funktioner
Sprog
Kurset og materialet er på engelsk
Niveau
Begynder - mellemniveau
Adgang
1 års adgang til den selvstyrende e-læringsplatform 24/7
6 timers videomateriale
med 40 timers anbefalet studietid & øvelser
Praksisser
Virtuelle laboratorier, Testsimulation, Afsluttende projekter
Ingen eksamen
Ingen eksamen for kurset, men studerende vil få et bevis for gennemført uddannelse
Bonus gratis kursus!
Statistiske grundbegreber for data science

Læringsresultater
Ved afslutningen af dette e-læringskursus i Data Science med Python vil du være i stand til at:
Opnå en dybdegående forståelse af data science-processer, datahåndtering, dataudforskning, datavisualisering, hypoteseopbygning og -testning.
Installer det nødvendige Python-miljø og andre hjælpeværktøjer og biblioteker.
Forstå de væsentlige koncepter inden for Python-programmering, såsom datatyper, tupler, lister, grundlæggende operatorer og funktioner.
Udfør højniveau matematisk databehandling ved brug af NumPy-pakken og dens omfattende bibliotek af matematiske funktioner.
Udfør højniveau matematisk databehandling ved brug af NumPy-pakken og dens omfattende bibliotek af matematiske funktioner.
Udfør videnskabelig og teknisk databehandling ved hjælp af SciPy-pakken og dens underpakker, såsom Integrate, Optimise, Statistics, IO og Weave.
Udfør dataanalyse og manipulation ved brug af datastrukturer og værktøjer tilvejebragt i Pandas-pakken.
Opnå ekspertise i maskinlæring ved brug af Scikit-Learn-pakken
Forstå overvågede og uovervågede læringsmodeller såsom lineær regression, logistisk regression, klyngedannelse, dimensionsreduktion, K-NN og pipeline.
Brug Scikit-Learn-pakken til behandling af naturligt sprog.
Brug matplotlib-biblioteket i Python til datavisualisering
Udtræk værdifulde data fra hjemmesider ved at udføre web scraping ved brug af Python
Integrer Python med Hadoop og MapReduce
Kursusindhold

Introduktion til datalogi
Lektion 01
- Data Science og dens anvendelser
- Data Science-processen: Del 1
- Data Science-processen: Del 2
Grundlæggende om Python-programmering
Lektion 02
- Opsætning af Jupyter Notebook
- Python-funktioner
- Python-typer og sekvenser
- Dybgående dyk i Python-strenge
- Python Demo: Læsning og skrivning af csv-filer
- Dato og tid i Python
- Objekter i Python-kort
- Lambda og listeforståelse
- Hvorfor Python til dataanalyse?
- Python-pakker til dataanalyse
- StatsModels-pakken
- Scipy-pakken
NumPy
Lektion 03
- Grundlæggende om NumPy
- Array-former og akser i NumPy: Del A
- NumPy Array-former og akser: Del B
- Aritmetiske operationer
- Betinget logik
- Almindelige matematiske og statistiske funktioner i Numpy
- Indeksering og opdeling
- Filhåndtering
Lineær algebra
Lektion 03
- Introduktion til lineær algebra
- Skalarer og vektorer
- Skalarprodukt af to vektorer
- Lineær uafhængighed af vektorer
- Normen af en vektor
- Matrixoperationer
- Rang af en matrix
- Determinant af en matrix og identitetsmatrix eller -operator
- Invers af en matrix og egenværdier og egenvektorer
- Calculus i Lineær Algebra
Statistiske Grundlæggende
Lektion 05
- Statistikkens betydning i forhold til datalogi
- Almindelige statistiske termer
- Statistiktyper
- Datakategorisering og typer
- Måleniveauer
- Foranstaltninger for central tendens
- Spredningsmål
- Tilfældige variable
- Sæt
- Mål for form (Skævhed & Kurtosis)
- Kovarians og korrelation
Sandsynlighedsfordeling
Lektion 06
- Sandsynlighed, dens betydning, og sandsynlighedsfordeling
- Sandsynlighedsfordeling: Binomialfordeling
- Sandsynlighedsfordeling: Poissonfordeling
- Sandsynlighedsfordeling: Normalfordeling
- Sandsynlighedsfordeling: Bernoulli-fordeling
- Sandsynlighedstæthedsfunktion og massefunktion
- Kumulativ fordelingsfunktion
- Centrallimitteoremet
- Estimationsteori
Avanceret statistik
Lektion 07
- Distribution
- Kurtosis, skævhed og Students t-fordeling
- Hypotesetestning og mekanisme
- Hypotesetestresultater: Type I og II fejl
- Nulhypotese og alternativ hypotese
- Konfidensintervaller
- Fejlmargener
- Sammenligning og kontrast mellem T-test og Z-test
- Bayes' teorem
- Chi-i-anden-fordeling
- Chi-i-anden-test og tilpasningsgodhed
- Analyse af varians eller ANOVA
- ANOVA-terminologier
- Opdeling af varians ved hjælp af Python
- F - fordeling ved brug af Python
- F - Test
Pandas
Lektion 08
- Pandas-serier
- Forespørgsel på en serie
- Pandas Dataframes
- Pandas Panel
- Almindelige funktioner i Pandas
- Pandas funktioner til datastatistik, vinduesfunktion
- Pandas-funktioner Data og Tidsdelta
- Kategoriske data
- Arbejde med tekstdata
- Iteration
- Sortering
- Plotning med Pandas
Dataanalyse
Lektion 09
- Forståelse af data
- Typer af data: Strukturerede, Ustrukturerede, Rodet osv
- Arbejde med data Valg af passende værktøjer, Dataindsamling, Datahåndtering
- Import og eksport af data i Python
- Regulære udtryk i Python
- Manipulering af tekst med regulære udtryk
- Adgang til databaser i Python
Data Wrangling
Lektion 10
- Pandorable eller Idiomatisk Pandas-kode
- Indlæser indeksering og genindeksering
- Fusionering
- Hukommelsesoptimering i Python
- Dataforbehandling: Indlæsning af data og fjernelse af nullværdier
- Dataforbehandling Udfyldning af tomme værdier
- Dataopdeling, formatering og normalisering
- Standardisering af dataopdeling
- Beskrivelse af data
Data Visualisering
Lektion 11
- Principper for informationsvisualisering
- Visualisering af data ved hjælp af pivottabeller
- Data Visualiseringsbiblioteker i Python Matplotlib
- Graftyper
- Data Visualiseringsbiblioteker i Python: Seaborn, Plotly, Bokeh
- Brug af Matplotlib til at tegne grafer
- Plotning af 3D-grafer for flere kolonner ved brug af Matplotlib
- Brug af Matplotlib sammen med andre Python-pakker
- Brug af Seaborn til at tegne grafer
- Plotning af 3D-grafer for flere kolonner ved brug af Seaborn
- Introduktion til Plotly og Bokeh
Statistiske grundbegreber for data science
Bonus gratis kursus!
- Introduktion til statistik
- Forståelse af data
- Beskrivende statistik
- Datavisualisering
- Sandsynlighed
- Sandsynlighedsfordelinger
- Stikprøver og stikprøveteknikker
- Inferentiel statistik
- Anvendelse af inferentiel statistik
- Relation mellem variabler
- Anvendelse af statistik i erhvervslivet
- Assisteret praksis
Kursusprojekt
Kurset omfatter også virkelige, branchebaserede projekter. En vellykket evaluering af et af følgende projekter er en del af adgangskriterierne:
Projekt 1: Analyse af detailsalg til strategisk planlægning
Undersøg salgsdata fra en detailvirksomhed inden for beklædning for at hjælpe ledelsen med at udforme effektive strategier for salgsvækst og forretningsudvidelse.
Projekt 2: Evaluering af effektiviteten af marketingkampagner
Foretag en eksplorativ dataanalyse og hypotesetest for at identificere nøglefaktorer, der påvirker kunderekruttering og kampagnens succes.
Projekt 3: Visuel udforskning af ejendomsdata
Brug forskellige visualiseringsteknikker til at analysere et ejendomsdatasæt og udtrække meningsfulde indsigter.
Projekt 4: Undersøgelse af boligmarkedspriser
Undersøg boligmarkedsdata for at afdække tendenser i ejendomspriser, forstå drivkræfterne bag prisfastsættelsen og vurdere, hvordan forskellige boligegenskaber påvirker værdien.
Projekt 5: Analyse af kundernes adfærdsmønstre
Anvend sandsynlighedsfordelinger til at undersøge kundernes adfærd og evaluere butikkernes performance ved hjælp af et tilpasset datasæt.

Hvem bør tilmelde sig dette program?
Dette kursus er ideelt for personer, der er interesserede i at forfølge en karriere inden for datalogi, maskinlæring eller kunstig intelligens, og som ønsker at forbedre deres Python-programmerings- og dataanalysefærdigheder.
Aspirerende dataloger
Dataanalytikere
Softwareingeniører eller programmører
Forskere og akademikere
Maskinlæringsentusiaster
Studerende og dimittender
Forudsætninger
Studerende skal have en bachelorgrad eller et gymnasieeksamensbevis. Derudover anbefales en nysgerrighed for dataanalyse og et ønske om at udforske anvendelser af Python inden for data videnskab. Det anbefales også at have:
- Basic Python Programming Knowledge: Familiarity with basic Python programming concepts such as variables, loops, functions, and control flow.
- Grundlæggende forståelse af statistik: En grundlæggende forståelse af statistik, herunder begreber som gennemsnit, median, standardafvigelse, sandsynlighed og korrelation.
- Matematik: Grundlæggende matematiske færdigheder, især inden for områder som algebra og lineær algebra, vil være nyttige, især når man arbejder med maskinlæringsalgoritmer eller modeller.
Ofte stillede spørgsmål

Har du brug for virksomhedsløsninger eller LMS-integration?
Fandt du ikke kurset eller programmet, der ville være til gavn for din virksomhed? Har du brug for LMS-integration? Skriv til os, vi løser alt!