Data Science med Python certificering - eLearning

3.900,00 DKK

  • 50 hours
eLearning

Kurset Python for Data Science dækker de grundlæggende programmeringskoncepter med Python og forklarer dataanalyse, maskinlæring, datavisualisering, webskrabning og behandling af naturligt sprog. Du vil opnå en omfattende forståelse af de forskellige pakker og biblioteker, der er nødvendige for at udføre aspekter af dataanalyse.

Vigtige funktioner

Sprog

Kurset og materialet er på engelsk

Niveau

Begynder - mellemniveau

Adgang

1 års adgang til den selvstyrende e-læringsplatform 24/7

6 timers videomateriale

med 40 timers anbefalet studietid & øvelser

Praksisser

Virtuelle laboratorier, Testsimulation, Afsluttende projekter

Ingen eksamen

Ingen eksamen for kurset, men studerende vil få et bevis for gennemført uddannelse

Bonus gratis kursus!

Statistiske grundbegreber for data science

Hero

Læringsresultater

Ved afslutningen af dette e-læringskursus i Data Science med Python vil du være i stand til at:

Opnå en dybdegående forståelse af data science-processer, datahåndtering, dataudforskning, datavisualisering, hypoteseopbygning og -testning.

Installer det nødvendige Python-miljø og andre hjælpeværktøjer og biblioteker.

Forstå de væsentlige koncepter inden for Python-programmering, såsom datatyper, tupler, lister, grundlæggende operatorer og funktioner.

Udfør højniveau matematisk databehandling ved brug af NumPy-pakken og dens omfattende bibliotek af matematiske funktioner.

Udfør højniveau matematisk databehandling ved brug af NumPy-pakken og dens omfattende bibliotek af matematiske funktioner.

Udfør videnskabelig og teknisk databehandling ved hjælp af SciPy-pakken og dens underpakker, såsom Integrate, Optimise, Statistics, IO og Weave.

Udfør dataanalyse og manipulation ved brug af datastrukturer og værktøjer tilvejebragt i Pandas-pakken.

Opnå ekspertise i maskinlæring ved brug af Scikit-Learn-pakken

Forstå overvågede og uovervågede læringsmodeller såsom lineær regression, logistisk regression, klyngedannelse, dimensionsreduktion, K-NN og pipeline.

Brug Scikit-Learn-pakken til behandling af naturligt sprog.

Brug matplotlib-biblioteket i Python til datavisualisering

Udtræk værdifulde data fra hjemmesider ved at udføre web scraping ved brug af Python

Integrer Python med Hadoop og MapReduce

Kursusindhold

Hero
  1. Introduktion til datalogi

    Lektion 01

    • Data Science og dens anvendelser
    • Data Science-processen: Del 1
    • Data Science-processen: Del 2
  2. Grundlæggende om Python-programmering

    Lektion 02

    • Opsætning af Jupyter Notebook
    • Python-funktioner
    • Python-typer og sekvenser
    • Dybgående dyk i Python-strenge
    • Python Demo: Læsning og skrivning af csv-filer
    • Dato og tid i Python
    • Objekter i Python-kort
    • Lambda og listeforståelse
    • Hvorfor Python til dataanalyse?
    • Python-pakker til dataanalyse
    • StatsModels-pakken
    • Scipy-pakken
  3. NumPy

    Lektion 03

    • Grundlæggende om NumPy
    • Array-former og akser i NumPy: Del A
    • NumPy Array-former og akser: Del B
    • Aritmetiske operationer
    • Betinget logik
    • Almindelige matematiske og statistiske funktioner i Numpy
    • Indeksering og opdeling
    • Filhåndtering
  4. Lineær algebra

    Lektion 03

    • Introduktion til lineær algebra
    • Skalarer og vektorer
    • Skalarprodukt af to vektorer
    • Lineær uafhængighed af vektorer
    • Normen af en vektor
    • Matrixoperationer
    • Rang af en matrix
    • Determinant af en matrix og identitetsmatrix eller -operator
    • Invers af en matrix og egenværdier og egenvektorer
    • Calculus i Lineær Algebra
  5. Statistiske Grundlæggende

    Lektion 05

    • Statistikkens betydning i forhold til datalogi
    • Almindelige statistiske termer
    • Statistiktyper
    • Datakategorisering og typer
    • Måleniveauer
    • Foranstaltninger for central tendens
    • Spredningsmål
    • Tilfældige variable
    • Sæt
    • Mål for form (Skævhed & Kurtosis)
    • Kovarians og korrelation
  6. Sandsynlighedsfordeling

    Lektion 06

    • Sandsynlighed, dens betydning, og sandsynlighedsfordeling
    • Sandsynlighedsfordeling: Binomialfordeling
    • Sandsynlighedsfordeling: Poissonfordeling
    • Sandsynlighedsfordeling: Normalfordeling
    • Sandsynlighedsfordeling: Bernoulli-fordeling
    • Sandsynlighedstæthedsfunktion og massefunktion
    • Kumulativ fordelingsfunktion
    • Centrallimitteoremet
    • Estimationsteori
  7. Avanceret statistik

    Lektion 07

    • Distribution
    • Kurtosis, skævhed og Students t-fordeling
    • Hypotesetestning og mekanisme
    • Hypotesetestresultater: Type I og II fejl
    • Nulhypotese og alternativ hypotese
    • Konfidensintervaller
    • Fejlmargener
    • Sammenligning og kontrast mellem T-test og Z-test
    • Bayes' teorem
    • Chi-i-anden-fordeling
    • Chi-i-anden-test og tilpasningsgodhed
    • Analyse af varians eller ANOVA
    • ANOVA-terminologier
    • Opdeling af varians ved hjælp af Python
    • F - fordeling ved brug af Python
    • F - Test
  8. Pandas

    Lektion 08

    • Pandas-serier
    • Forespørgsel på en serie
    • Pandas Dataframes
    • Pandas Panel
    • Almindelige funktioner i Pandas
    • Pandas funktioner til datastatistik, vinduesfunktion
    • Pandas-funktioner Data og Tidsdelta
    • Kategoriske data
    • Arbejde med tekstdata
    • Iteration
    • Sortering
    • Plotning med Pandas
  9. Dataanalyse

    Lektion 09

    • Forståelse af data
    • Typer af data: Strukturerede, Ustrukturerede, Rodet osv
    • Arbejde med data Valg af passende værktøjer, Dataindsamling, Datahåndtering
    • Import og eksport af data i Python
    • Regulære udtryk i Python
    • Manipulering af tekst med regulære udtryk
    • Adgang til databaser i Python
  10. Data Wrangling

    Lektion 10

    • Pandorable eller Idiomatisk Pandas-kode
    • Indlæser indeksering og genindeksering
    • Fusionering
    • Hukommelsesoptimering i Python
    • Dataforbehandling: Indlæsning af data og fjernelse af nullværdier
    • Dataforbehandling Udfyldning af tomme værdier
    • Dataopdeling, formatering og normalisering
    • Standardisering af dataopdeling
    • Beskrivelse af data
  11. Data Visualisering

    Lektion 11

    • Principper for informationsvisualisering
    • Visualisering af data ved hjælp af pivottabeller
    • Data Visualiseringsbiblioteker i Python Matplotlib
    • Graftyper
    • Data Visualiseringsbiblioteker i Python: Seaborn, Plotly, Bokeh
    • Brug af Matplotlib til at tegne grafer
    • Plotning af 3D-grafer for flere kolonner ved brug af Matplotlib
    • Brug af Matplotlib sammen med andre Python-pakker
    • Brug af Seaborn til at tegne grafer
    • Plotning af 3D-grafer for flere kolonner ved brug af Seaborn
    • Introduktion til Plotly og Bokeh
  12. Statistiske grundbegreber for data science

    Bonus gratis kursus!

    • Introduktion til statistik
    • Forståelse af data
    • Beskrivende statistik
    • Datavisualisering
    • Sandsynlighed
    • Sandsynlighedsfordelinger
    • Stikprøver og stikprøveteknikker
    • Inferentiel statistik
    • Anvendelse af inferentiel statistik
    • Relation mellem variabler
    • Anvendelse af statistik i erhvervslivet
    • Assisteret praksis

Kursusprojekt

Kurset omfatter også virkelige, branchebaserede projekter. En vellykket evaluering af et af følgende projekter er en del af adgangskriterierne:

Projekt 1: Analyse af detailsalg til strategisk planlægning

Undersøg salgsdata fra en detailvirksomhed inden for beklædning for at hjælpe ledelsen med at udforme effektive strategier for salgsvækst og forretningsudvidelse.

Projekt 2: Evaluering af effektiviteten af marketingkampagner

Foretag en eksplorativ dataanalyse og hypotesetest for at identificere nøglefaktorer, der påvirker kunderekruttering og kampagnens succes.

Projekt 3: Visuel udforskning af ejendomsdata

Brug forskellige visualiseringsteknikker til at analysere et ejendomsdatasæt og udtrække meningsfulde indsigter.

Projekt 4: Undersøgelse af boligmarkedspriser

Undersøg boligmarkedsdata for at afdække tendenser i ejendomspriser, forstå drivkræfterne bag prisfastsættelsen og vurdere, hvordan forskellige boligegenskaber påvirker værdien.

Projekt 5: Analyse af kundernes adfærdsmønstre

Anvend sandsynlighedsfordelinger til at undersøge kundernes adfærd og evaluere butikkernes performance ved hjælp af et tilpasset datasæt.

data scientist med python

Hvem bør tilmelde sig dette program?

Dette kursus er ideelt for personer, der er interesserede i at forfølge en karriere inden for datalogi, maskinlæring eller kunstig intelligens, og som ønsker at forbedre deres Python-programmerings- og dataanalysefærdigheder.

Aspirerende dataloger

Dataanalytikere

Softwareingeniører eller programmører

Forskere og akademikere

Maskinlæringsentusiaster

Studerende og dimittender

Start kursus nu

Forudsætninger

Studerende skal have en bachelorgrad eller et gymnasieeksamensbevis. Derudover anbefales en nysgerrighed for dataanalyse og et ønske om at udforske anvendelser af Python inden for data videnskab. Det anbefales også at have:

  • Basic Python Programming Knowledge: Familiarity with basic Python programming concepts such as variables, loops, functions, and control flow.
  • Grundlæggende forståelse af statistik: En grundlæggende forståelse af statistik, herunder begreber som gennemsnit, median, standardafvigelse, sandsynlighed og korrelation.
  • Matematik: Grundlæggende matematiske færdigheder, især inden for områder som algebra og lineær algebra, vil være nyttige, især når man arbejder med maskinlæringsalgoritmer eller modeller.

Ofte stillede spørgsmål

Har du brug for virksomhedsløsninger eller LMS-integration?

Fandt du ikke kurset eller programmet, der ville være til gavn for din virksomhed? Har du brug for LMS-integration? Skriv til os, vi løser alt!