Die Datenmenge, die aus unterschiedlichen Quellen kommt, steigt derzeit blitzschnell an. Viele Unternehmen sind nicht imstande Lösungen für ihre Verarbeitung zu finden. Sie verfügen nicht über das Wissen, wie die gewonnenen Informationen am effektivsten verarbeitet und verständlich der Führungsabteilung dargestellt werden können.
Ein ähnliches Problem hatte auch das Pharmaunternehmen. Es hatte Schwierigkeiten mit den Unmengen an Daten und deren Verarbeitung, die zu viel Zeit in Anspruch genommen hat. Deshalb entschieden sich die Führungspositionen die Informationen aus den einzelnen Datenbanken in ein Data Lake zu übertragen. Dies sollte mithilfe von Apache Hadoop geschehen. Die Lösung beschleunigt erheblich die Datenverarbeitung, die so wichtig ist für die globale Verkaufsstrategie des Unternehmens.