Analiza Big Data z wykorzystaniem SAP HANA
Big Data to popularny termin, który odnosi się do dużych, zarówno ustrukturyzowanych jak i nieustrukturyzowanych zbiorów danych. Obecnie żyjemy w epoce Big Data – danych, które gromadzone są zewsząd, począwszy od sieci społecznościowych, czujników w punktach handlowych, komercyjnych transakcji i narzędzi komunikacji. Zdumiewające statystyki pokazują, iż aktualnie 90% światowych danych zebranych zostało w przeciągu ostatnich 2 lat.
Choć może się wydawać, iż termin Big Data odwołuje się wyłącznie do zbiorów danych, posiada również szersze znaczenie. Pojęcie określa bowiem wszelkie technologie nowej generacji, zaprojektowane by wydobyć ekonomiczną wartość z bardzo dużej ilości różnorodnych danych. Ta definicja obejmuje zatem sprzęt komputerowy, oprogramowanie i usługi, które pozwalają na integrację, organizację, analizę i prezentację danych. Danych, które charakteryzowane są za pośrednictwem terminu 3V: volume – ilość, velocity – prędkość oraz variety – różnorodność. Różnorodność w analizowanym pojęciu Big Data to atrybut krytyczny. Połączenie danych z różnych źródeł, posiadających odrębne formaty jest kryterium głównym, determinującym czy dana aplikacja może być określana jako Big Data.
W powyższym kontekście SAP oferuje szereg technologii, które odpowiadają przypadkom użycia i wymaganiom Big Data.
Platforma SAP HANA pozwala na natychmiastową analizę dużych ilości ustrukturyzowanych danych i wbudowanie analityki w postaci aplikacji operacyjnych. Dane operacyjne są przechowywane w pamięci i dostępne do przeprowadzenia natychmiastowych analiz.
Rozwiązanie SAP w zakresie zarządzania informacją w przedsiębiorstwie umożliwia administrowanie Big Data, które pochodzą z różnych źródeł. Usługa zarządzania danymi SAP dostarcza również rozwiązanie ETL, które pozwala na zarządzanie jakością danych i procesowanie informacji tekstowych dla ustrukturyzowanych i nieustrukturyzowanych danych przechowywanych w bazach, hurtowaniach danych lub rozproszonych systemach plików, takich jak Hadoop.
Nowe rozwiązania, takie jak Analiza Predykcyjna SAP i SAP Lumira, umożliwiają użytkownikom szybkie i efektywne przetwarzanie danych. Analiza Predykcyjna SAP to analiza statystyczna, a także rozwiązanie zapewniające eksplorację danych. Narzędzie pozwala na budowanie modeli predykcyjnych, których celem jest odkrycie ukrytych powiązań i relacji między danymi, na podstawie których użytkownik może wykonać prognozy dotyczące przyszłych zdarzeń. To intuicyjne, wykorzystujące model drag & drop, oparte na otwartym kodzie rozwiązanie, na tyle rozbudowane, by umożliwiać przeprowadzenie wnikliwych analiz przy użyciu Big Data. Przy całej swej złożoności, jest to również bardzo proste narzędzie, dzięki któremu analitycy biznesowi będą w stanie przeprowadzać analizy predykcyjne z wykorzystaniem zakładowych danych, pochodzących z programu Excel.
Zamiast instalowania osobnej aplikacji do analizy, analitycy skorzystać mogą z Biblioteki Analiz Predykcyjnych, komponentu SAP HANA, który jest biblioteką wewnątrz-bazowych algorytmów analizy predykcyjnej w SAP HANA. Biblioteka definiuje funkcje, które mogą być wywoływane z poziomu procedur skryptu SQL w celu zastosowania klasycznych i uniwersalnych algorytmów, wykorzystywanych w analizach predykcyjnych.
Analiza predykcyjna może być z łatwością zdefiniowana jako analiza ilościowa, która wspiera wykonywanie prognoz. Prognoz dotyczących m.in. sprzedaży produktów, przychodów i kosztów, zatrudnienia, kluczowych wskaźników wydajności, rotacji klientów, zdolności kredytowej, cross- i up-sellingu, efektywności kampanii marketingowych, odchyleń i nieprawidłowości, a także ewentualnych nadużyć. Jest to stosunkowo nowe pojęcie, jednak oparte o dobrze znaną dziedzinę, która czerpie z takich dyscyplin naukowych jak: analiza statystyczna czy badania operacyjne. Do niedawna pojęcie było utożsamiane jedynie z eksplorowaniem danych. Kluczowym zadaniem analizy predykcyjnej jest jednak przede wszystkim znalezienie relacji między znanymi a przewidywanymi zmiennymi, w oparciu o dokonane zdarzenia. Znalezione relacje są następnie wykorzystywane do przewidywania przyszłych efektów.
- On 07/11/2014
0 Comments