Data Scientist – Ein Beruf der Zukunft?
Data Scientist ist zu einem geläufigen Schlagwort in den Medien, der Literatur, aber auch auf dem Arbeitsmarkt geworden. Viele Unternehmen bedienen sich des Stichwortes bei ihrer Suche nach Fachkräften und Spezialisten. Was genau bedeutet aber Data Science? Es gibt viele Konzepte und Definitionen, aber welche sind richtig und welche sind falsch? Welche Kompetenzen kennzeichnen einen echten Data Scientist? Welche Schritte sollten man gehen, um selbst ein Spezialist auf dem Gebiet zu werden?
Data Science umfasst alle Maßnahmen im Zusammenhang mit der Verarbeitung von statistischen Daten. Die Entstehung von Data Science ist nicht – wie es allgemein angenommen wird – das Ergebnis neuer Geschäftsanforderungen, sondern ist ein Resultat des Technologiefortschritts. Die Nachfrage nach Informationen existierte schon immer. Doch erst jetzt haben wir die Möglichkeiten, so viele Daten zu sammeln, dass wir durch ihre Verarbeitung neue Dimensionen der Informationsqualität erreichen. Der Bedarf an statistischer Datenverarbeitung entstand mit der Entwicklung analytischer Methoden, dem Fortschritt in der Informatik und dem Wachstum der verfügbaren Datensätze. Die Verbreitung von Informationstools in den Bereichen Wirtschaft, Verwaltung, Forschung usw. führte zu der Entstehung riesiger Datenbanken. Zur gleichen Zeit wurden Algorithmen entwickelt und die Rechenleistung gesteigert. Dadurch konnten Operationen und Analysen von massiven Datenmengen durchgeführt werden, was vorher unmöglich war. Die Verwendung dieser Tools, insbesondere in der Geschäftspraxis, ist kein einfaches Thema und Bedarf weitere neue Tools. Data Science ist eine Wissenschaft der Schaffung von Methoden und statistischer Werkzeuge zur Datenanalyse, sowie ihre Verwendung in der Praxis, insbesondere der praktischen Anwendung durch Unternehmen, die an einer effizienten Nutzung der verfügbaren Daten interessiert sind.
Data Science, Big Data und ihre Unterschiede
Die Aufgaben des Data Science-Berufes werden oft mit den Pflichten von Big Data-Analysten verwechselt. In der Tat sind sich diese Berufe ähnlich und viele der Big Data gängigen Tools werden von Data Scientisten verwendet, aber es gibt dennoch erhebliche Unterschiede zwischen den Berufsfeldern. Big Data bedient sich Maßnahmen und Tools zur Analyse große Mengen an unstrukturierten, vielfältigen und schnell eingehenden Daten. Für ihre Verarbeitung müssen spezielle Tools verwendet werden, da traditionelle statistische Software nicht mit unstrukturierten Informationen umgehen können. Ein Data Science-Spezialist hat wiederrum umfangreichere Aufgaben. Er muss die Daten nicht nur beschaffen, verarbeiten und visualisieren, sondern auch ein System für ihre Speicherung und Analyse vorzubereiten, damit das Endprodukt die gewünschten Informationen vorbringt. Big Data umfasst einen klar definierten Bereich der Datenverarbeitung, während sich Data Science mit der Erstellung und Implementierung eines Systems sowohl zur Erhebung, als auch zur Verarbeitung der Informationen (einschließlich der im Rahmen von Big Data implementierten Verfahren) beschäftigt. Die Aufgabe eines Data Scientisten ist es, durch Analyse Geschäftsprobleme definieren und entsprechend leistungsstarke und umsetzbare Maßnahmen zur ihrer Lösung einzuleiten. Data Science beinhaltet eine Palette an analytischen Methoden zur Verarbeitung von Informationen. Im Geschäftsbusiness wurden statistischen Daten bisher hauptsächlich nur visualisiert. Das Parade-Beispiel ist OLAP, das im klassischen Business Intelligence verwendet wird. Bei Big Data visualisiert Daten, deren Quellen schwer zu handhabenden sind. Data Science gibt einen umfassenden Überblick über den Ist-Zustand (von der Definierung bis zur Analyse) und definiert die Maßnahmen entsprechend den Bedürfnissen. Hier liegt der Schwerpunkt auf dem maschinellen Lernen. Die Notwendigkeit eines solchen breitumfassenden Problemansatzes macht den beschriebenen Beruf ganz individuell. Ein Data Scientist, der ein Problem zu lösen hat, muss ein analytisches Datenmodell anwenden, das aus mehreren Quellen unstrukturierten Informationen ziehen kann. Kenntnis von Datenanalyseverfahren sind hier unumgänglich, um für diese Aufgaben eine Maschine zu erschaffen. Alle Elemente der erstellten Lösung müssen miteinander interagieren. Daher kann ein Data Scienctist kürzesten folgendermaßen definiert werden: „Ein Architekt, der Lösungen für die Datenanalyse mithilfe von Technologien und Methoden schafft.“
Wie wird man zum “Data Scientist“?
Wie kann man als Data Scientist durchstarten? Jemand, der diesen Berufsweg gehen möchte, braucht eine Reihe an Eigenschaften und Qualitäten. Unter den Soft Skills sind vorrangig das leichte Verständnis für Wirtschaftsbedürfnisse wichtig und die Strukturierung und Gliederung der eigenen Gedanken und Visionen, die der Fachmann dem Empfänger mitteilen kann ohne dass der Empfänger den gesamten Prozess verstehen muss. Bei der Lösungserstellung muss ein Data Scientist sicher sein, dass seine Lösung die Probleme und Bedürfnisse des Klienten/Kunden abdeckt und ihm dabei helfen diese Tools zu nutzen. Neugierig sein und über den Tellerrand zu gucken ist ebenfalls sehr hilfreich, um erfolgreich in dem Beruf zu sein. Kenntnisse in Mathematik, Statistik und Programmierung verstehen sich fast von selbst.
Die wichtigsten Merkmale sind jedoch die Beharrlichkeit und Zielstrebigkeit nach der richtigen Lösung und eine Leidenschaft für Analysen. Man kann nicht alle Algorithmen und analytische Methoden kennen, aber man sollte bereit sein stets nach neuen und neueren Möglichkeiten zur optimalsten Problemlösung zu suchen. Kenntnisse in der Mathematik und der mathematischen Modellierung können sich als nützlich erweisen, wenn in manchen Bereichen bestimmte Tools eingesetzt werden. Zum Beispiel basieren Rechengeräte im Finanzwesen auf komplexen Differentialgleichungen. Ein genaues Rezept mit vorgeschriebenen Fähigkeiten gibt es nicht, entscheidend ist letztendlich, wie die bestehenden Kenntnisse in der Praxis umgesetzt werden und wie viel Kreativität und Entschlossenheit mitgebracht werden, um recht spezielle Probleme lösen zu können.
Wie sieht der Arbeitsalltag von einem Data Scientist aus?
Ein Data Data Scientist kennt sich super mit Analysen aus, denn das ist sein Arbeitsfeld. Ziemlich oft haben sie eine akademische Ausbildung hinter sich. Denn die Arbeit in der Forschung bereitet einen darauf vor, analytische zu denken, komplexe System verstehen zu lernen und den aktuellen Forschungsstand auf dem Gebiet des „Machine learnings“ und Datenverarbeitung zu verfolgen. Wenn man sich die führenden Fachkräfte in diesem Bereich anguckt, so haben sie meist eine mehrjährige akademische Forschungslaufbahn in den Bereichen des Machine Learnings, Physik, Mathematik, Computer Science und Robotik gemeinsam. In all diesen Gebiet basiert die Arbeit im Endeffekt auf Datenanalysen.
Üblicherweise waren und sind Data Scientists Forscher im Bereich des maschinellen Lernens und Methoden der Datenverarbeitung. Der Bereich verlässt die reinen universitären Einrichtungen und gewinnt immer mehr an Gewichtung in der Wirtschaft. Data Scientisten werden verstärkt von Unternehmen angeworben und Analysten, die mit den Methoden des Machine Learnings vertraut sind, haben einen entscheidenden Vorteil. Sie können wir Statistiker denken und kennen bereits die wichtigsten und gängigsten Tools des Data Science.
Der Arbeitsalltag eines Data Scientist ist alles andere als monoton. Er schafft neue Analysestandarts und bewältigt neue Herausforderungen. Dabei wird ein breites Spektrum an Tools genutzt, die nicht nur zur Datenanalyse, sondern auch zur Programmierung eingesetzt werden.
Autor des Artikels is Przemysław Popielarski, SAP BI Consultant bei Apollogic.
- On 19/01/2017
0 Comments