Data Scientist: Was ein Data Scientist alles aus Daten liest

Ordnung im Chaos erkennen, Signale aus dem Rauschen filtern, den Weg zu umwälzenden Entscheidungen bereiten: So lassen sich die Aufgaben beschreiben, die industrielle Datenanalysten/Data Scientists zu bewältigen haben. Die Messlatte liegt hoch, gilt es doch, unterschiedlichste Anforderungen zu erfüllen.

Mit dem Blick fürs Große

Von Dirk Bongardt

„The Sexiest Job of the 21st Century“ – mit diesem Attribut zeichnete der Harvard Business Review im Jahr 2012 den Job des Data Scientist aus. Neun Jahre später hat diese Zuschreibung nichts von ihrem Wahrheitsgehalt eingebüßt. Im Gegenteil: Nach einer Prognose des Technologieberaters IDC soll die jährlich generierte digitale Datenmenge bis zum Jahr 2025 auf 175 Zettabyte (= 175 × 10²¹ Byte) anwachsen. Es ist die Aufgabe von Data Scientists, die Nadeln in diesem exponentiell wachsenden Heuhaufen aufzuspüren.

Wobei „Nadeln“ ein falsches Bild vermitteln: Für Unternehmen, Staaten, die Gesellschaft als Ganzes könnten in diesem Heuhaufen wahre Schätze schlummern: Versicherungen nutzen Big Data, um individuelle Risikoprofile zu erstellen und entsprechende Absicherungen zu für beide Seiten fairen Tarifen zu entwickeln. Pharmaunternehmen fokussieren die Entwicklung neuer Wirkstoffe und Therapien auf die künftig relevanten medizinischen Herausforderungen. Produzierende Unternehmen entscheiden auf Basis riesiger Datenmengen über geeignete Standorte für neue Produktionsstätten oder die Schließung künftig nicht mehr rentabler Zweige.

Erst die Analyse macht Daten wertvoll

Für solche und ähnliche Entscheidungen legen Datenanalysten die Grundlage. Ihre Aufgabe ist es, Struktur in die riesigen Mengen unstrukturierter Rohdaten zu bringen, diese zu analysieren und daraus belastbare Aussagen abzuleiten. Schon zu Anfang dieses Prozesses kommt den Data Scientists eine große Verantwortung zu. Sie müssen die relevanten von den irrelevanten Daten trennen und damit letztlich entscheiden, bei welchen es sich um Einflussgrößen handelt und welche lediglich Rauschen im Datenäther darstellen. Treffen sie an dieser Stelle eine falsche Wahl, resultieren daraus falsche Entscheidungen. Hätten zum Beispiel Hersteller klassischer Fotoapparate die Entwicklungen auf dem Handymarkt zu Beginn des einundzwanzigsten Jahrhunderts nicht völlig aus der Rechnung genommen, wäre ihnen mancher herbe Rückschlag erspart geblieben.

Sind die relevanten von den irrelevanten Daten getrennt und in eine verwertbare Struktur gebracht, gilt es, die verbleibenden Daten zu analysieren. Industrielle Datenanalysten müssen zudem Fertigungsprozesse ebenso verstehen wie die dazugehörigen IT-Systeme. Ein weiterer Schwerpunkt liegt auf der Ursachenanalyse. Dazu müssen die Datenspezialisten komplexe Zusammenhänge schnell durchschauen, um daraus operativ umsetzbare, prozessorientierte Lösungen abzuleiten. Die Disziplin, die hier über die klassische Business Intelligence hinausgeht, nennt sich Advanced Analytics mit der zielführenden Unterdisziplin Predictive Analytics. Grob vereinfacht geht es dabei darum, aus in den Daten gefundenen Mustern in der Vergangenheit Prognosen für die Zukunft herzuleiten. Auf Basis dieser Prognosen – kombiniert mit seinen betriebswirtschaftlichen Kenntnissen – spricht der Data Scientist dann Empfehlungen aus.

ITuK2.2021.ID01 01.jpeg
Datenanalysten spielen zunehmend für Großunternehmen eine wichtige Rolle. (Bild: Statista)

Datenquellen finden sich überall

Aus den genannten Beispielen wird deutlich, wie breit das Spektrum der zu verarbeitenden Daten ist. Sensoren messen inzwischen vom Luftdruck von Autoreifen über den Schallpegel an Arbeitsplätzen bis zum CO₂-Ausstoß von Laserdruckern alle Arten von technisch erfassbaren Daten, die genauso Berücksichtigung finden wie die monetär messbaren Informationen, die aus Buchhaltung, Kostenrechnung und Controlling stammen, oder das Kauf- und Verkauf-Verhalten von Anlegern an den Finanzplätzen der ganzen Welt.

Maschinelles Lernen ist auf dem Gebiet der Datenwissenschaft und -analyse nicht mehr wegzudenken. Algorithmen „trainieren“ mithilfe von Datensätzen, um neue Dinge zu lernen. Aufgabe von Datenanalysten ist es, die Qualität dieser Datensätze sicherzustellen, denn Fehler, Ausreißer und methodische Unsauberkeiten bei der Erhebung oder Filterung der Daten führen zu schlechten bis unbrauchbaren Trainingsergebnissen. Deshalb setzen Data Scientists und Datenanalysten auf Technologien, Methoden und Fähigkeiten, die eng mit dem maschinellen Lernen verknüpft sind, etwa Software wie Matlab oder universelle Programmiersprachen wie Python, aber auch statistische Programmiersprachen wie R.

ITuK 2-2022-Gesamt.jpg

Schwarz auf Weiß
Dieser Beitrag ist zuerst in unserer Magazin­reihe „IT & Karriere“ erschienen. Einen Über­blick mit freien Down­load-Links zu sämt­lichen Einzel­heften be­kommen Sie online im Presse­zentrum des MittelstandsWiki.

Wer sich für den Beruf des Data Scientist entscheidet, wird sich zwar spätestens im Laufe seiner Berufstätigkeit spezialisieren (müssen), aber auch langfristig darf man dabei nicht das Große und Ganze aus dem Blick verlieren. Deshalb sind neben den analytisch-mathematischen auch technische und betriebswirtschaftliche Kenntnisse für die Bewältigung der Aufgaben unabdingbar.

Ausbildung an und nach der Uni

Grundlegend für eine erfolgreiche Arbeit in diesem Berufszweig sind also Kenntnisse der Informatik, der Mathematik im Allgemeinen und der Stochastik im Besonderen, ebenso wie ein eingehendes Verständnis betriebswirtschaftlicher Abläufe. Wer den Beruf des Data Scientist oder Data Analyst anstrebt und sein Studium noch vor sich hat, sollte sich zunächst die entsprechenden Studiengänge genauer ansehen: Inzwischen bieten bereits über 20 Universitäten und Hochschulen in Deutschland und Österreich Data-Science-Studiengänge an. Dabei handelt es sich mehrheitlich um Masterstudiengänge.

Die Anforderungen, die Unternehmen an künftige Mitarbeiter stellen, variieren hingegen deutlich. Chancen haben Bewerber deshalb auch, wenn sie nicht gleich einen solchen speziellen Studiengang absolviert haben. Die Jobplattform Joblift hat 2018 untersucht, worauf Unternehmen Wert legen, die auf der Suche nach Data Scientists sind: So wird in 93 % der Stellenanzeigen ein abgeschlossenes Studium als Voraussetzung genannt, in 69 % ist ausdrücklich ein Master-Abschluss gefragt. Aber: Nur in vier von zehn Fällen muss es ein Studium der Informatik sein. Mathematik- und Statistikabsolventen sind immerhin noch halb so häufig gefragt, knapp gefolgt von Wirtschaftswissenschaftlern. Physiker und Absolventen der Ingenieurwissenschaften, speziell Wirtschaftsingenieure, haben ebenfalls gute Aussichten. Unter den betrieblichen Ausbildungsberufen eignet sich vor allem der mathematisch-technische Softwareentwickler als Basis für den Job.

Auch Weiterbildungsangebote qualifizieren zum Data Scientist: Die Fraunhofer-Gesellschaft beispielsweise bietet Schulungen, Kurse und Weiterbildungen an, mit deren Hilfe die Teilnehmer einzelne der benötigten Fähigkeiten erlangen oder vertiefen können. Auch im Rahmen eines Trainee-Programms können sich Bewerber mit Vorkenntnissen die nötigen Skills aneignen. Um den Bedarf an Big-Data-Spezialisten zu decken, bieten viele Unternehmen mittlerweile solche Fortbildungsprogramme an.

Gefragte Hard und Soft Skills

Die richtigen Studiengänge oder Weiterbildungen absolviert zu haben, ist nur eine Voraussetzung, um als Data Analyst oder Data Scientist arbeiten zu können. Beinahe noch wichtiger ist es, die speziell benötigten Fähigkeiten und Kenntnisse mitzubringen. Auch dazu bietet die oben erwähnte Studie Informationen: Zu den Hard Skills gehören Kenntnisse der Programmiersprachen SQL, R, Python, Java und/oder Spark (hier aufgeführt in absteigender Rangfolge), außerdem Kenntnisse auf dem Gebiet der künstlichen Intelligenz, insbesondere in den Teildisziplinen Machine Learning und Deep Learning. Oft gefragt sind darüber hinaus auch – wenig überraschend – Kenntnisse auf dem Gebiet der Datenvisualisierung und der Cloud-Technologie.

Neben diesen „harten“ Anforderungen nennen die Unternehmen auch in rund jeder zweiten Stellenanzeige Kommunikationsstärke als Voraussetzung – sogar noch minimal häufiger als „analytische Fähigkeiten“. Gefragt ist also jemand, der Big Data nicht nur untersuchen und interpretieren kann, sondern auch ausgesprochen stark darin ist, die Resultate daraus zu kommunizieren. Das Bild vom still vor sich hin forschenden Eigenbrötler greift hier ebensowenig wie das vom IT-Nerd, der mit unverständlichem Computerjargon um sich wirft. Unternehmen stützen weitreichende Entscheidungen auf die Arbeit der Datenanalysten und Data Scientists, weshalb die Fähigkeit zu präziser Kommunikation unerlässlich ist.

Gute Aussichten für Datenbezwinger

Die Nachfrage nach Data Analysts und Data Scientists ist weitaus höher als das Angebot: Bewerber, die die gefragten Qualifikationen mitbringen, haben daher beste Chancen, schnell einen passenden Arbeitgeber zu finden. Allerdings sind die regionalen Unterschiede nicht zu übersehen. Wo sich in anderen IT-Bereichen immer öfter auch die Wege ins Hinterland auftun, da konzentriert sich der Bedarf an Data Scientists in den Ballungszentren. Nach einer Auswertung der Meta-Jobbörse Jobted wird in fast zwei Dritteln aller Stellenanzeigen nach Mitarbeitern für die Standorte München, Berlin, Hamburg, Frankfurt, Düsseldorf und Stuttgart gesucht – an den bedeutendsten Industriestandorten und Finanzplätzen eben.

Gehälter variieren abhängig von der Berufserfahrung, der Branche und der Spezialisierung deutlich, aber wiederum auch abhängig vom Standort. Nach einer Auswertung von gehalt.de liegt die Einkommensspanne für Data Analysts in Deutschland zwischen 51.450 Euro und 69.842 Euro pro Jahr, wobei Unternehmen in Hessen im Schnitt die höchsten, Unternehmen in Mecklenburg-Vorpommern im Schnitt die niedrigsten Gehälter zahlen. Außerdem steigt das mittlere Gehalt sowohl abhängig von der Berufserfahrung als auch von der Unternehmensgröße. So zahlen Unternehmen mit mehr als 20.000 Mitarbeitern ihren Datenanalysten durchschnittliche Jahresgehälter von 79.160 Euro.

Ich behalte den Überblick

Berufseinsteiger sollten sich über eines klar sein: Die Anforderungen an Data Analysts und Data Scientists variieren von Unternehmen zu Unternehmen. Ähnlich wie bei vielen der neuen Berufe verwenden Unternehmen oft unterschiedliche Begriffe, um dieselben Aufgabengebiete zu beschreiben. Wer als Data Analyst oder Data Scientist arbeiten will, sollte sich deshalb auch Stellenangebote genauer ansehen, in denen Unternehmen nach einem „Business Analyst“, einem „Informatik Engineer“ oder einem „Data Engineer“ suchen. Spätestens im Vorstellungsgespräch sollte sich dann klären lassen, ob die Vorstellungen des potenziellen Arbeitgebers zu denen des Bewerbers passen.

Dirk Bongardt-Quadrat.jpg

Dirk Bongardt hat vor Beginn seiner journalistischen Laufbahn zehn Jahre Erfahrung in verschiedenen Funktionen in Vertriebsabteilungen industrieller und mittelständischer Unternehmen gesammelt. Seit 2000 arbeitet er als freier Autor. Sein thematischer Schwerpunkt liegt auf praxisnahen Informationen rund um Gegenwarts- und Zukunftstechnologien, vorwiegend in den Bereichen Mobile und IT.


Dirk Bongardt, Tel.: 05262-6400216, mail@dirk-bongardt.de, netknowhow.de

Nützliche Links