Obecnie ilość danych pozyskiwanych z różnych źródeł rośnie w błyskawicznym tempie. Wiele z przedsiębiorstw nie jest w stanie nadążyć za rozwiązaniami niezbędnymi do ich przetwarzania. Firmy nie dysponują wiedzą dotyczącą tego, jak najefektywniej wykorzystać pozyskane informacje, a co za tym idzie – przedstawić je w sposób zrozumiały dla osób zarządzających.
Podobny problem wystąpił również w analizowanych przedsiębiorstwie z branży farmaceutycznej. Trudności z ogromną ilością danych, których przetworzenie zajmowało coraz więcej czasu, jak również ich objętość, przekonały zarządzających do podjęcia wysiłku i przeniesienia informacji z wielu rozdrobnionych baz do jednego Data Lake. Miało ono działać przy pomocy środowiska Apache Hadoop. Rozwiązanie to miało znacząco przyspieszyć procesowanie danych, które w dalszej kolejności posłużyły do ustalenia globalnej strategii sprzedaży.