Der Beruf des Data Scientists: Aufgaben und Voraussetzungen
Inhalt
Was macht den Beruf eines Data Scientist aus?
Ein Data Scientist ist ein/e DatenexpertIn, der/ die Erkenntnisse aus großen Datensätzen extrapoliert, um Unternehmen bei der Lösung komplexer Probleme zu helfen. Dazu kombinieren Data Scientists Informatik, Mathematik, Statistik und Modellierungen mit einem ausgeprägten Verständnis für ihr Geschäft und ihre Branche, um neue Geschäftschancen und Strategien zu erschließen.
Sobald sie die Daten in Form gebracht haben, ist ein entscheidender Teil der Arbeit von Data Scientists die explorative Datenanalyse und Visualisierung. Sie finden Muster, erstellen Modelle und Algorithmen. Sie können Experimente entwerfen und sind ein unternehmenswichtiger Teil der datengesteuerten Entscheidungsfindung. Data Scientists kommunizieren mit Teammitgliedern, Ingenieuren und der Geschäftsleitung in klarer Sprache und mit Hilfe von Datenvisualisierungen, so dass ihre Kollegen, auch wenn sie selbst nicht in die Datengrundlage eingetaucht sind, die Auswirkungen auf ihr Unternehmen verstehen.
Data Scientists sind also (wie ihren „engen Verwandten“ Data Engineers) sehr wichtige und nachgefragte Mitarbeiter in (Tech-) Unternehmen. Welche konkreten Aufgaben und Voraussetzungen sie zu erfüllen haben, wird in diesem Artikel beleuchtet.
Aufgaben von Data Scientists
Wie wir bereits gelernt haben, ist es der Job von Data Scientists, Daten auf wertvolle Erkenntnisse hin zu untersuchen. Dabei fallen typischerweise folgende konkreten Aufgaben an:
- Identifizierung datenanalytischer Probleme, die die größten Chancen für das Unternehmen bieten
- Bestimmen der richtigen Datensätze und Variablen, welche die Chancen als Potentiale in sich tragen
- Sammeln großer Mengen an strukturierten und unstrukturierten Daten aus unterschiedlichen Quellen
- Bereinigung und Validierung der Daten, um Genauigkeit, Vollständigkeit und Einheitlichkeit sicherzustellen
- Entwickeln und Anwenden von Modellen und Algorithmen zur Auswertung der Big-Data-Speicher
- Analysieren der Daten, um Muster und Trends zu erkennen
- Interpretieren der Daten, um Lösungen und Möglichkeiten zu entdecken
- Kommunikation der Ergebnisse an Stakeholder durch Visualisierung und andere Mittel
Die Rolle und damit die Aufgaben Data Scientists wird selbst für traditionelle Unternehmen, die früher nicht viel in Technologiepositionen investiert haben, immer wichtiger. Big Data verändert die Art und Weise, wie Unternehmen der alten Schule ihre Geschäfte führen und ihr Marketing managen, und der Data Scientist steht im Mittelpunkt dieser Transformation.
Dank einer Vielzahl neuer Software-Lösungen für das gesamte Spektrum der Unternehmensführung, von Marketing über HR bis hin zu Finanzen und F&E, war es noch nie so einfach, auf Big Data zuzugreifen und sie zu entschlüsseln. Data Scientists spielen hier die „Gatekeeper“-Rolle, die zwischen den Daten und zukunftsorientierten Unternehmensentscheidungen stehen.
Voraussetzungen für Data Scientists
Data Scientists sind oft ExpertInnen für Technologien wie Hadoop, Pig, Python und Java. Da sie dazu neigen, sich auf eine enge Nische der Datenwissenschaft zu spezialisieren, arbeiten Data Scientists oft in Teams innerhalb eines Unternehmens.
Es ist nicht ungewöhnlich, dass ein/e Data Scientist-KandidatIn einen Doktortitel hat. Darüber hinaus wird von ihnen erwartet, dass sie fachliche Fähigkeiten wie Kommunikation, Führung, Zusammenarbeit, Kreativität, Disziplin und eine treibende Leidenschaft für die Wahrheit in den Informationen verkörpern.
Data Scientists können echte Change-Maker innerhalb einer Organisation sein, indem sie Einblicke bieten, die den Weg des Unternehmens in Richtung seiner ultimativen Geschäftsziele erhellen können. Data Scientists sind unerlässlich, um sowohl Führungskräfte als auch Entwickler bei der Entwicklung besserer Produkte und Paradigmen zu unterstützen. Und da ihre Rolle in großen Unternehmen immer wichtiger wird, sind sie zunehmend Mangelware.
In Jobanzeigen zu Data Science-Rollen findet man typischerweise folgende Voraussetzungen:
- Starke Problemlösungsfähigkeiten mit Schwerpunkt auf der Produktentwicklung.
- Erfahrung im Umgang mit statistischen Computersprachen (R, Python, SLQ, etc.), um Daten zu manipulieren und Erkenntnisse aus großen Datensätzen zu ziehen sowie in der Erstellung von Datenarchitekturen.
- Kenntnisse verschiedener Techniken des maschinellen Lernens (Clustering, Entscheidungsbaum-Lernen, künstliche neuronale Netze, usw.) und deren Vor- und Nachteile in der Praxis: Regression, Simulation, Szenarioanalyse, Modellierung, Clustering, Entscheidungsbäume, neuronale Netze, etc.
- Kenntnisse fortgeschrittener statistischer Techniken und Konzepte (Regression, Eigenschaften von Verteilungen, statistische Tests und deren korrekte Anwendung usw.) und Erfahrung mit Anwendungen.
- Programmierkenntnisse und Erfahrung mit mehreren Sprachen: C, C++, Java, JavaScript, etc.
- Kenntnisse und Erfahrung in statistischen und Data-Mining-Techniken: GLM/Regression, Random Forest, Boosting, Trees, Text Mining, Social Network Analysis, etc.
- Erfahrung im Umgang mit Webservices: Redshift, S3, Spark, DigitalOcean, etc.
- Erfahrung in der Analyse von Daten von Drittanbietern: Google Analytics, Site Catalyst, Coremetrics, Adwords, Crimson Hexagon, Facebook Insights, etc.
- Erfahrung mit verteilten Daten/Computing-Tools: Map/Reduce, Hadoop, Hive, Spark, Gurobi, MySQL, usw.
- Erfahrung in der Visualisierung/Präsentation von Daten für Stakeholder mit: Periscope, Business Objects, D3, ggplot, etc.
Wie du siehst, benötigen Data Scientists ausgeprägte Kenntnisse in Mathe oder Statistik. Eine natürliche Neugierde ist ebenfalls wichtig, ebenso wie kreatives und kritisches Denken. Was kann man mit all den Daten machen? Welche unentdeckten Möglichkeiten liegen darin verborgen? Man muss ein Händchen dafür haben, die Punkte zu verbinden und den Wunsch haben, Antworten auf Fragen zu finden, die noch nicht gestellt wurden, wenn man das volle Potenzial der Daten ausschöpfen will. Einen tollen Start in die Welt der Data Science ermöglicht die WBS CODING SCHOOL aus Berlin mit ihrem 15-wöchigen Data Science Bootcamp auf Englisch.
Wenn du folgende sechs Fragen mit „ja“ beantwortest, wirst du wahrscheinlich eine Menge Freude als Data Scientist haben:
- Hast du einen Abschluss in Mathematik, Statistik, Informatik, Management-Informationssystemen oder Marketing?
- Verfügst du über (umfangreiche) Berufserfahrung in einem dieser Bereiche?
- Hast du Interesse an der Erfassung und Analyse von Daten?
- Hast du Spaß an individueller Arbeit und Problemlösung?
- Kannst du sowohl verbal als auch visuell gut kommunizieren?
- Willst du deine Fähigkeiten erweitern und dich neuen Herausforderungen stellen?
Fazit
Data Scientists müssen nicht nur die Daten achten und wissen, was sie bedeuten, sondern auch dahinterliegende Probleme verstehen und wissen, wie man Algorithmen auf diese Probleme anwendet, und die Technik verstehen, um Lösungen zu finden. Durch die Kombination von Fähigkeiten in den Bereichen Statistik, Informatik und Analytik extrahiert der Data Scientist eine Bedeutung aus den Daten, die es Unternehmen ermöglicht, versteckte Umsatzströme und geschäftliche Effizienz zu realisieren.
Ein typischer Tag für einen Data Scientist besteht darin, Daten aus verschiedenen Quellen zu extrahieren, sie durch eine Analyseplattform laufen zu lassen und dann Visualisierungen der Daten zu erstellen. Anschließend verbringt er bzw. Stunden damit, die Daten zu sichten und aus verschiedenen Blickwinkeln zu analysieren, um nach Trends zu suchen, die Probleme oder Chancen aufdecken. Alle Erkenntnisse werden dann an die Geschäfts- und Technologieverantwortlichen mit Empfehlungen zur Anpassung bestehender Geschäftsstrategien weitergegeben.
Data Scientists sind sehr gefragt und werden es zukünftig bleiben – laut stellenanzeigen.de verdienen sie in Deutschland durchschnittlich 62.544€ pro Jahr. Auch auf juucy suchen hunderte Unternehmen nach Data Scientists. Lasse dich über deinem Wunschgehalt abwerben 💸💸