Sådan laver du en karriere i Data Science - karrierevej for håbefulde data scientists

  • Datavidenskab
  • Karrierevej
  • Certificeringer
  • Published by: André Hammer on nov 15, 2022
En gruppe mennesker, der diskuterer spændende it-emner

Næsten alt, hvad vi gør i vores hverdag, er et resultat af data, i den ene eller den anden form. Indtil 2003 var der kun fem milliarder gigabyte data på internettet. Men noget ændrede sig i 2011, mængden af data, der nogensinde havde eksisteret, blev skabt på kun to dage. Fra 2013 blev dette volumen produceret en gang hvert 10. minut. Som et resultat bør det ikke komme som en overraskelse, at oprettelsen af 90 % af alle data fandt sted i løbet af det foregående årti.

Data er nyttigt, det ved vi, men før ideen om 'big data' kom, var det for det meste blevet ignoreret. I henhold til en definition fra Gartner, "Big Data er informationsaktiver med høj volumen, høj hastighed eller stor variation, der kræver nye former for behandling for at muliggøre forbedret beslutningstagning, opdagelse af indsigt og procesoptimering."

For at sige det enkelt er big data en samling af meget store datasæt, som ikke kan behandles med normale computermetoder. Dette udtryk refererer ikke kun til dataene, men også til de forskellige rammer, værktøjer og metoder, der bruges til at arbejde med dem. Brancheaktører er nødt til at finde andre måder at håndtere data på på grund af teknologiske fremskridt, fremkomsten af nye måder at kommunikere på, såsom sociale netværk og udgivelsen af nye, mere kraftfulde enheder.

Anvendelse af datavidenskab

McKinsey sagde, at big data-initiativer i det amerikanske sundhedssystem "kunne spare $300 milliarder til $450 milliarder i sundhedsomkostninger, eller 12 til 17 procent af de $2,6 billioner basislinjer i amerikanske sundhedsomkostninger." På den anden side menes det, at dårlige data koster USA omkring 3,1 billioner dollars om året.

Big Data er ubrugelig uden færdighederne hos fagfolk, der ved, hvordan man omsætter banebrydende teknologi til indsigt, der kan bruges. I dag lukker flere og flere organisationer big data ind og bruger deres magt. Dette gør en dataforsker, der ved, hvordan man får brugbar indsigt ud af gigabyte af data, ekstremt værdifuld. Så hvis Data Science er den vej, du har valgt, er du sandsynligvis på en lukrativ vej.

—----------------------------------------------------- -------------------------------------------------- ----

Så hvad gør en dataforsker?

Datavidenskabsteams er normalt små og arbejder med flere forretningsproblemer. Data scientists forventes ofte at være uafhængige lige fra dag ét.

I henhold til bogen Doing Data Science:I en bredere forstand er en dataforsker en person, der forstår at drage konklusioner og drage slutninger fra store mængder data ved at bruge en kombination af menneskelig intuition og metoder og værktøjer til statistik og maskinlæring. De brugte mange timer på at indsamle, rense og gnaske data, fordi data er aldrig rene. Denne proces kræver tålmodighed, statistik og software engineering færdigheder. Det er de samme færdigheder, som er nødvendige for at forstå skævheder i dataene og til at fejlsøge kode, der logger output. Efter at dataene er organiseret, spiller undersøgende dataanalyse (som kombinerer visualisering og datasans) en kritisk rolle. De vil opdage mønstre, konstruere modeller og udvikle algoritmer, hvoraf nogle vil blive brugt til at få indsigt i, hvordan produktet bliver brugt og dets generelle sundhed, mens andre vil blive brugt som prototyper, inden de integreres i det endelige produkt. En dataforsker spiller en nøglerolle i datadrevet beslutningstagning samt eksperimentdesign. Selvom deres kolleger ikke er dataeksperter, vil de sørge for at kommunikere implikationerne af data gennem visuelle og tydelige sprog.

En dataforskers specifikke opgaver omfatter:

  • Identificering af dataanalyseproblemer, der kan give organisationen de højeste muligheder
  • Samling af store sæt strukturerede og ustrukturerede data fra forskellige kilder
  • Bestemmelse af nøjagtige og korrekte datasæt og variabler
  • Rensning og validering af dataene for at sikre fuldstændighed, nøjagtighed og ensartethed
  • Analyse af data for at genkende mønstre og tendenser
  • Udvikling og anvendelse af algoritmer til datamining
  • Fortolkning af dataene for at finde løsninger og muligheder
  • Formidling af resultater til interessenter

Her er en sjov kendsgerning: Netflix er stærkt afhængig af datavidenskab for at opbygge shows, som deres publikum helt sikkert vil kunne lide! Følgende er nogle af de måder, som firmaet måler brugerengagement og fastholdelse på:

  • Hvornår sætter seerne optagelsen på pause, spole den tilbage eller fremskynde den
  • Hvornår ser seerne typisk materiale, både i løbet af ugen og i weekenden, og på hvilket tidspunkt på dagen?
  • Hvornår og hvorfor holder de op med at forbruge materiale?
  • Den måde, hvorpå seerne gennemser og navigerer på siden

Netflix er i øjeblikket tilgængeligt på mere end 120 millioner forskellige enheder over hele verden. Netflix anvender banebrydende datavidenskabelige målinger for at lette behandlingen af al denne information. Dette gør det i stand til at give sine forbrugere bedre forslag til film og shows, samt at producere bedre indhold specifikt til disse mennesker. Datavidenskab og big data blev brugt under produktionen af den anmelderroste serie House of Cards. Netflix indsamlede oplysninger om sine brugere fra tv-showet The West Wing, som er en anden dramaserie. De tog hensyn til både de punkter, hvor seerne holdt op med at se showet, samt de punkter, hvor de holdt op med at spole frem. Netflix var i stand til at udvikle et program, som de mente var perfekt engagerende ved at analysere disse data.

—----------------------------------------------------- -------------------------------------------------- -

Hvad skal der til for at være en god dataforsker?

For at forstå, om du har det, der skal til for at være en god dataforsker, skal du stille dig selv følgende spørgsmål:

  • Har jeg en grad i statistik, datalogi, matematik, ledelsesinformationssystemer eller marketing? Hvis ikke, planlægger jeg at få en?
  • Har jeg erhvervserfaring inden for nogen af de ovennævnte discipliner?
  • Er jeg interesseret i dataindsamling og analyse?
  • Skal jeg sætte pris på individuelt arbejde og problemløsning?
  • Har jeg gode verbale og visuelle kommunikationsevner?
  • Vil jeg udvide mine kompetencer og påtage mig nye udfordringer?

Hvis du sagde "ja" til et af disse spørgsmål, kan du være en god kandidat til en dataforsker.

For at være dataforsker skal du kende matematik eller statistik. Det er også vigtigt at være naturligt nysgerrig og at kunne tænke kreativt og kritisk. For at få mest muligt ud af dataene skal du være god til at sætte tingene sammen og gerne finde svar på spørgsmål, der ikke er stillet endnu.

Ifølge KDnuggets er 88 % af dataforskerne har mindst en kandidatgrad, og 46% har ph.d.'er.

Du skal også vide, hvordan du programmerer, så du kan komme med de modeller og algoritmer, du har brug for til at mine store datalagre. Python og R er to af de bedste programmeringsmiljøer til datavidenskab.

Ud over dette vil det være en fordel, hvis du har et godt øje for forretningsstrategi. Hvis du ikke er i stand til at udtænke dine egne metoder og opbygge din egen infrastruktur for at skære og skære de data, der vil føre dig til nye opdagelser og nye visioner for fremtiden, er det muligt, at du ikke får succes med dine bestræbelser. Selvom du samarbejder med andre dataspecialister eller endda med et tværfagligt team af fagfolk, er dette en vigtig færdighed. Du skal også være i stand til at kommunikere komplekse ideer til dine ikke-tekniske interessenter på en måde, de let kan forstå. Softwareværktøjer til datavidenskab kan hjælpe dig med at visualisere dine resultater, men du har også brug for verbale kommunikationsevner for at fortælle historien klart.

—----------------------------------------------------- -------------------------------------------------- ----

En trin-for-trin guide til at blive dataforsker, for begyndere

Her er en enkel guide, som du kan følge trin for trin for at begynde din rejse som dataforsker:

Trin 1: Bliv fortrolig med programmeringssprog

Det er vigtigt at friske op på relevante programmeringssprog som Python, R, SQL og SAS, selvom du har en bachelorgrad inden for området, da denne grad måske bare giver dig et teoretisk greb om emnet. Når det kommer til at håndtere enorme datasæt, er det de sprog, der er absolut nødvendige.

Trin 2: Bliv certificeret

Kompetence- og værktøjsspecifikke certificeringer er en fantastisk måde at vise din viden og ekspertise om dine færdigheder. Certificeringer gør dit CV mere værdifuldt, lærer dig vigtige færdigheder i løbet af korte perioder og giver dig også selvtillid til at påtage dig mere. Power BI-certificering er fantastisk til at begynde med. Lær om de forskellige metoder og bedste praksis, der er i overensstemmelse med forretningsmæssige og tekniske krav til modellering, visualisering og analyse af data med Power BI. Hos Readynez tror vi på, at certificering er vejen til at lukke videnskløften. Derfor har vi en bred samling af kurser klar til dig!

Trin 3: Vær praktikant

Den bedste metode til at få foden indenfor hos organisationer, der rekrutterer data scientists er at få noget erfaring inden for området gennem et praktikophold. Se efter beskæftigelsesmuligheder med titler som "dataanalytiker", "business intelligence analytiker", "statistiker" eller "dataingeniør" for eksempel. Praktikophold er en glimrende mulighed for at tilegne sig praktisk erfaring inden for det område, man selv vælger, og for at få en bedre forståelse af de pligter og ansvar, der er forbundet med den stilling, man søger.

Trin 4: Få et startjob

Når du har afsluttet dit praktikophold, har du mulighed for at blive hos det samme firma (hvis de søger at besætte åbne job) eller begynde din søgning efter entry-level arbejde som dataforsker, dataanalytiker eller dataingeniør . Fra det udsigtspunkt kan du fremme din karriere ved at få erfaring og bevæge dig op ad stigen, samtidig med at du udvider din viden og dine evner.

Trin 5 er at opgradere dine færdigheder. Nedenfor er en liste over færdigheder, som du bør arbejde på for at fremme din karriere som dataforsker.

—----------------------------------------------------- -------------------------------------------------- ----

Hvilke færdigheder skal du arbejde med for at være en god dataforsker?

For at forfølge en karriere som dataforsker vil det gavne dig at erhverve ekspertise inden for følgende områder:

1) At få ekspertise i databaser er det første trin i lagring og analyse af data med programmer som Oracle, Database, MySQL, Microsoft SQL Server og Teradata. Denne ekspertise er nødvendig.

2) At mestre statistik, sandsynlighed og kvantitativ analyse bør være dit andet mål. Studieområdet kendt som statistik fokuserer på skabelse og undersøgelse af teknikker til indsamling, undersøgelse, fortolkning og præsentation af empiriske data. Sandsynlighed kan ses som et mål for, hvor sandsynligt det er, at en bestemt hændelse finder sted.

3) Analyse i matematik refererer til studiet af grænser og de ideer, der er forbundet med dem, herunder differentiering, integration, måling, uendelige rækker og analytiske funktioner.

4) Beherskelse af mindst ét programmeringssprog er påkrævet. Når du laver analyser på data, er programmeringsværktøjer såsom R, Python og SAS af yderste vigtighed.

5) Datastrid: At lære at rense, manipulere og organisere data er en del af en påkrævet færdighed, som kaldes "datastrid". R, Python, Flume og Scoop er alle velkendte og udbredte værktøjer til datastrid.

6) Forstå Big Data-værktøjer såsom Apache Spark, Hadoop, Talend og Tableau, som bruges til at håndtere store og komplekse data, som ikke kan håndteres ved hjælp af traditionel databehandlingssoftware.

7) Datavisualisering at kunne forestille sig resultater. Integrering af forskellige datasæt og fremstilling af en grafisk repræsentation af resultaterne ved brug af forskellige typer diagrammer, diagrammer og grafer omtales som "datavisualisering."

—----------------------------------------------------- -------------------------------------------------- ----

Afslutningsvis

Enhver virksomhed, der er i stand til at gøre effektiv brug af de data, de indsamler, kan drage fordel af brugen af dataforskere. Datavidenskab er til gavn for enhver organisation, uanset hvilken sektor den opererer i, fordi den kan levere statistik og indsigt på tværs af processer, hjælpe med rekruttering af nye medarbejdere og hjælpe seniormedarbejdere med at træffe bedre informerede beslutninger.

Når du har gennemført de fleste af de trin, der er nævnt i denne artikel, vil du have en række karrieremuligheder tilgængelige. Bliv certificeret inden for en række datavidenskabelige områder med Readynez for at begynde din rejse!

En gruppe mennesker diskuterer de seneste Microsoft Azure-nyheder

Unlimited Microsoft Training

ubegrænset adgang til ALLE de LIVE instruktørledede Microsoft kurser du ønsker - til en pris mindre end prisen for ét kursus.

  • 60+ LIVE instruktørledede kurser
  • Money-back Garanti
  • Adgang til 50+ erfarne instruktører
  • Uddannet 50,000+ IT Pro's

Kurv

{{item.CourseTitle}}

Pris: {{item.ItemPriceExVatFormatted}} {{item.Currency}}