Analityka biznesowa w Twojej firmie – praktyczny przewodnik

Ostatnia aktualizacja:    Autor: Leszek Słonczyński

Zarówno sama firma jak i jej otoczenie nieustannie produkują dane, które (choć najczęściej ignorowane) mogą być wartościowe dla firmy. Dane, które jeśli wykorzystane właściwie, pomogą nam podjąć decyzje, lepiej zrozumieć klientów, konkurencję, znaleźć lepsze ścieżki do osiągnięcia naszych celów. Analityka biznesowa zajmuje się przekuwaniem strumieni danych w wartościowe obserwacje, prognozy i rekomendacje.

Artykuł ten wprowadzi Cię w zagadnienia analityki biznesowej, pozwoli Ci zrozumieć jak jest stosowana, da Ci podstawy do praktycznego jej zastosowania w Twojej firmie.

Zaczynajmy!

Spis treści

Analityka biznesowa - podstawowe zagadnienia

Rozdział 1

Analityka biznesowa – podstawowe pojęcia

Aby umożliwić Ci łatwą orientację w tematyce analityki biznesowej zaczniemy od krótkiego wprowadzenia w podstawowe pojęcia związane z tematem analityki w biznesie. Krótkie definicje pozwolą Ci szybko zorientować się co oznaczają najmodniejsze hasła w dzisiejszej analityce biznesowej. Zrozumienie kluczowych pojęć takich jak ‘machine learning’ czy ‘big data’ pozwoli nie tylko przejść płynniej przez ten artykuł, ale również znacznie ułatwi czytanie jakichkolwiek opracowań w tym temacie.

Analityka biznesowa (ang. business analytics) zajmuje się analizą danych do późniejszego wykorzystania w firmie. Dotyczy zbioru metod pozwalających na przeglądanie i badanie danych, dociekanie ich znaczenia, odnajdowanie zależności etc. Dobrze prowadzona analityka biznesowa przekształca zbiory danych w łatwe do zinterpretowania obserwacje, sygnalizuje zależności o których nie mamy pojęcia, odkrywa przyczyny zdarzeń i prognozuje skutki naszych działań. Wykorzystana do maksimum potrafi nawet zarekomendować nam co powinniśmy robić by szybciej osiągnąć nasze cele.

Inteligencja biznesowa (ang. business intelligence) – za Wikipedią inteligencja biznesowa składa się ze strategii i technologii używanych przez firmy do analizy informacji biznesowej na podstawie danych dostępnych w firmie.

Uwaga: pojęcia inteligencji i analityki biznesowej są na tyle sobie bliskie, że każde opracowanie w tym temacie prezentuje własną opinię na to czy i czym się różnią. Niektóre traktują pojęcia zamiennie, inne mówią o analityce biznesowej jako podzbiorze inteligencji biznesowej, jeszcze inne o tym, że inteligencja biznesowa opisuje co się zdarzyło, a analityka biznesowa odpowiada dlaczego. Z praktycznego punktu widzenia granice tych pojęć nie mają znaczenia – mamy dane, które niosą w sobie wartość dla firmy – w tym artykule zajmiemy się sposobami wykorzystania tej wartości bez wnikania w to do której z dziedzin i według kogo należą.

Eksploracja danych

Eksploaracja danych (ang. data mining) – proces przetwarzania zebranych danych w wartościową dla firmy informację. Polega na poszukiwaniu regularności w dużych zbiorach danych, opiera się w dużym stopniu na statystyce i jej metodach.

Systemy uczące się

Uczenie maszynowe (ang. machine learning) – dziedzina wiedzy związana z zastosowaniem ogólnych algorytmów i metod statystycznych, do umożliwienia komputerom wykonywania zadań do których nie zostały specjalnie zaprogramowane. Systemy uczące się to inna nazwa dla tej samej dziedziny.

big data

Big Data – termin odnoszący się do dużych i zróżnicowanych zbiorów danych. W praktyce oznacza wszystkie dostępne dla nas dane bez względu na ich format. Z jednej strony wielkość jak i różnorodność formatów utrudnia ‘wydobywanie’ wartościowej informacji z takiego zbioru danych. Z drugiej strony fakt, że badamy wszystkie dostępne dane sprawia, że możemy odkryć informacje, które są widoczne jedynie gdy badamy dane z wielu źródeł.

W związku ze zwiększaniem się znaczenia analizy danych i pojawieniem się nowych dziedzin wiedzy takich jak ‘eksploracja danych’ i ‘uczenie maszynowe’ ich grupę w całości zaczęto nazywać nauką o danych (ang. data science), a osoby zajmujące się ich badaniem naukowcami zajmującymi się danymi (ang. data scientists).

Zadania analityki biznesowej

Rozdział 2

Zadania analityki biznesowej

Analitykę biznesową dzieli się na cztery etapy:

  1. opisywanie tego co dzieje się w biznesie (odpowiada na pytania: co? kto? kiedy? gdzie? ile?)
  2. umożliwienie weryfikacji hipotez, które formułujemy o naszym biznesie (dlaczego? co zależy od tego?)
  3. prognozowanie co i w jakim stopniu się wydarzy w przyszłości (co się stanie? kiedy osiągniemy poziom X?)
  4. rekomendowanie usprawnień (co możemy zrobić by szybciej dotrzeć do celu?)

Każdy kolejny etap wykorzystuje informacje zebrane na wcześniejszych etapach.

Analityka opisowa

Pierwszy poziom

Opisywanie rzeczywistości – analityka opisowa

Głównym zadaniem analityki opisowej jest uporządkowanie danych dostępnych w firmie przeprowadzane po to, byśmy mogli lepiej zobaczyć wszystko co się w firmie dzieje.

Przykład

Wyobraźmy sobie, że chcemy w naszej firmie przeprowadzić kampanię marketingową. Aby zapewnić możliwie jak największą skuteczność takiej akcji możemy przeprowadzić analizę danych naszych dotychczasowych klientów i dzięki niej lepiej zrozumieć na przykład przedział wiekowy, albo sytuację finansową osób, które decydują się na zakup naszych produktów. Na bazie tych informacji tak dobierzemy medium i formę naszych reklam by dotarła do jak największej osób pasujących do tak nakreślonego profilu.

Opis

Analityka opisowa zajmuje się ustaleniem charakteru zbiorów danych – jakie wartości występują częściej, jakie rzadziej, jakie podzbiory naturalnie się wyróżniają, gdzie występują jakieś anomalie. Wykorzystujemy do tego metody statystyczne i modele matematyczne.

Rezultatem tego etapu analityki biznesowej są tzw. raporty zarządcze (ang. manager dashboard) – zawierające zarówno aktualne wartości różnego rodzaju wskaźników (zobacz również artykuł o wskaźnikach KPI) jak i wykresy obrazujące ich trendy. To między innymi właśnie z tych raportów korzystają menedżerowie w zarządzaniu firmą (podejmują decyzje w oparciu o te dane).

Analityka diagnostyczna

Drugi poziom

Poszukiwanie przyczyn i zależności – analityka diagnostyczna

Analityka diagnostyczna zajmuje się poszukiwaniem przyczyn dla tego co się wydarzyło.

Przykład

Wyobraźmy sobie, że chcemy sprawdzić jak stały kontakt naszego sprzedawcy z klientem już po zakupie, wpływa na późniejszą szansę, że klient coś u nas jeszcze zamówi.

W tym celu dzielimy naszych wszystkich klientów na dwie grupy:

  • ‘klienci porzucani’ – tacy, z którymi kontakt już po zakupie był inicjowany wyłącznie z ich strony
  • ‘klienci podtrzymywani’ – tacy, z którymi nasi sprzedawcy kontaktowali się po zakupie

Analizując średni procent ponownych zamówień klientów z obu grup – możemy zbadać czy istnieje istotna statystycznie różnica w ich zachowania i na tej bazie oszacować jak podtrzymywanie kontaktu wpływa na ten współczynnik.

Opis

Analityka diagnostyczna zaczyna tam gdzie kończy analityka opisowa – bierze zebrane dane i stara się na ich podstawie sformułować wnioski o przyczynach i skutkach różnych działań, wzajemnych relacji między różnymi parametrami procesów.

Może być zarówno ręcznie sterowana: formułujemy hipotezę i metodami statystycznymi weryfikujemy jej prawdziwość lub fałszywość (jak w przykładzie powyżej)

jak i w pełni automatyczna: maszynowe uczenie się (ang. machine learning) wykryje relacje między różnymi danymi z których możemy sobie nawet nie zdawać sprawy.

Analityka prognostyczna

Trzeci poziom

Prognozowanie – analityka predykcyjna

Analityka predykcyjna koncentruje się na wykorzystaniu zebranych informacji do przewidywania przyszłych zdarzeń. Powstałe w ten sposób prognozy możemy wykorzystać do lepszego planowania i koordynacji działań.

Przykład

Posłużmy się przykładem sklepu. Jednym z istotnych a jednocześnie trudnych aspektów prowadzenia sklepu jest takie poprawne go zaopatrzenie – brak produktów, które klient chciałby kupić to utrata zysku, a towar, który się nie sprzeda to dla nas strata. Posiłkując się danymi sprzedaży z poprzednich sezonów, możemy zbudować prognozę sprzedaży poszczególnych towarów w sezonie nadchodzącym. Prognoza taka będzie opatrzona poziomem pewności – co oznacza, że nie będzie stuprocentowa, ale możemy za pomocą narzędzi statystycznych wymodelować sobie zapotrzebowanie na produkty z poziomem pewności powiedzmy 95% czy nawet 99%. Na podstawie takiej prognozy możemy zaopatrzyć nasz sklep tak, by klient w zdecydowanej większości sytuacji znajdował to czego szuka, a jednocześnie nasz magazyn nie pękał w szwach i na koniec sezonu wiele w nim nie zostało. Spełniając te dwa warunki maksymalizujemy zyski ze sprzedaży, a jednocześnie tracimy minimum na tym co się nie sprzedało.

Opis

Zadanie prognozowania bazuje na obserwacjach zdobytych w trakcie analityki opisującej. Znając charakter danych historycznych możemy w przybliżeniu określić jakie wartości osiągniemy w przyszłości. Znając przebieg dotychczasowego trendu możemy pokusić się o jego ‘przedłużenie’ w przyszłość i w ten sposób oszacować najbardziej prawdopodobny rozwój sytuacji. Analiza prognostyczna daje nam obraz tego co prawdopodobnie się wydarzy.

Analityka doradcza

Czwarty poziom

Podpowiadanie rozwiązań – analityka doradcza

Analityka doradcza wykorzystuje zebrane dane i wytwarza rekomendacje co można by zrobić by poprawić osiągane wyniki.

Przykład

Wyobraźmy sobie sytuację w której prowadzimy biznes online i chcemy zmniejszyć liczbę rezygnujących z naszej usługi klientów. Na bazie analizy naszych danych o klientach budujemy zestaw cech opisujących klienta. Może tam być wiek, stopień zamożności, jak długo korzysta z naszej usługi, jak często z niej korzysta, jaki jest koszt usługi i tak dalej. Następnie analizujemy, które z tych cech wykazują zależność czy klient z nami zostaje czy odchodzi i określamy stopień tej zależności. Powiedzmy, że jedną z najsilniejszych przesłanek czy klient pozostanie naszym klientem jest czas, który średnio spędza korzystając z naszego serwisu. Analityka jako rezultat wygeneruje rekomendację: skupić się na działaniach prowadzących do zwiększenia czasu, który użytkownik spędzi w serwisie. Niby oczywiste, ale jeżeli weźmiemy pod uwagę, że takich cech, które mogą mieć znaczenie jest kilkadziesiąt, wskazanie tej najważniejszej okazuje się bardzo wartościowe.

Opis

Analityka generująca rekomendacje to najbardziej zaawansowana część analityki. Bazuje na wynikach zarówno analityki opisującej jak i prognostycznej i na ich podstawie generuje rekomendacje. Bada które parametry mają znaczenie dla wyników, przeprowadza symulacje by określić jak zmiany tych parametrów mogą wpłynąć na wyniki i podpowiada nam te działania, które dają pożądane rezultaty wraz z dokładnym opisem czego możemy się spodziewać.

Sposoby wizualizacji danych

Rozdział 3

Sposoby wizualizacji danych

Wizualizacja danych to ich graficzna prezentacja. Polega na takim pokazaniu danych by obserwator mógł zobaczyć zachodzące w nich zależności, regularności, anomalie i tak dalej.

Typy danych do wizualizacji

Dane opisujące przynależność do kategorii lub grupy – przykłady: rzeczowniki jako kategoria wyrazów, tak/nie to kategorie odpowiedzi na pytanie Dane takie nazywane są danymi kategorycznymi.

Dane opisujące wartość numeryczną – wiek, cena, ocena i tak dalej. Wartości numeryczne mogą się zmieniać w sposób dyskretny lub ciągły.

Techniki wizualizacji w zależności od typu informacji

wykres liniowy

Zmiany pojedynczej wartości – wykres liniowy

Wykres liniowy to wizualny sposób przedstawienia zmian wartości za pomocą łamanej linii. Ten typ wykresu posiada prostą formę i jest łatwy w interpretacji. Idealnie nadaje się do reprezentacji tzw. szeregu czasowego – wartości zmieniającej się w czasie.

wykres słupkowy

Porównanie różnych wartości – wykres słupkowy

Jeśli chodzi o porównanie wartości kilku grup lub kategorii najlepszy jest wykres słupkowy – wykres w którym wartość kategorii decyduje o wysokości jej słupka. Aby dodatkowo zwiększyć jego przejrzystość możemy ułożyć kategorie według wartości, oraz odpowiednio pokolorować słupki.

wykres kołowy

Pokazanie wartości jako części większej całości – wykres kołowy

W przypadku gdy od porównania kategorii istotniejsze jest to jaką część całości stanowi kategoria idealny jest wykres kołowy – koło podzielone na wycinki, których obszary procentowo odpowiadają rzeczywistemu udziałowi kategorii w całości.

histogram

Reprezentacja częstości występowania wartości – histogram

Histogram to wykres słupkowy, który nie pokazuje wartości, tylko częstość ich występowania. Wysokość słupka reprezentuje ilość elementów znajdujących się w danej kategorii. Pozwala zorientować się jak rozkładają się wartości przez całe spektrum kategorii.

wykres punktowy

Pokazanie zależności pomiędzy dwoma cechami elementów – wykres punktowy

Wykres punktowy to wykres w którym punkty reprezentują wartości dwóch różnych cech tego samego elementu (np. wzrost na osi poziomej i wagę na osi pionowej). Pozwalają nam zrozumieć formę zależności pomiędzy tymi cechami, jeżeli takowa istnieje.

Kartogram

Wizualizacja danych w kontekście geograficznym – kartogram

Kartogram pokazuje relacje przestrzenne w danych poprzez wskazanie ich wartości na mapie geograficznej. Wartości mogą być pokazane zarówno w odniesieniu do poszczególnych punktów na mapie jak i całych obszarów geograficznych.

Testowanie hipotez

Rozdział 4

Testowanie hipotez

Jednym z najistotniejszych zastosowań analityki diagnostycznej jest testowanie hipotez.

Proces przebiega w następujący sposób:

  1. Formułujemy hipotezę.
  2. Określamy, które z danych, które posiadamy lub możemy zebrać, mogą być przesłankami potwierdzającymi lub zaprzeczającymi hipotezie.
  3. (Nie wchodząc za głęboko w matematykę) wykorzystując istniejące metody statystyczne szacujemy na podstawie tych przesłanek czy nasza hipoteza jest prawdziwa czy fałszywa (z określonym poziomem pewności – prawdopodobieństwem że nasza wynik jest zgodny z rzeczywistością).
  4. Jeżeli poziom pewności jest wystarczający akceptujemy wynik naszej analizy.
Eksploracja danych

Rozdział 5

Eksploracja danych (data mining)

Eksploracja danych polega na analizie dostępnych danych by odnaleźć w nich powtarzające się wzorce.

Eksploracja danych ma sześć podstawowych zadań:

  1. Wykrywanie zależności pomiędzy zmiennymi w danych.
  2. Grupowanie danych – analizowanie danych i definiowanie grup na podstawienia wzajemnego podobieństwa danych
  3. Klasyfikacja – przyporządkowywanie danych do wcześniej ustalonych kategorii
  4. Streszczanie danych – tworzenie reprezentacji danych (za pomocą wizualizacji lub raportu)
  5. Wykrywanie anomalii – wykrywanie zmian, odchyleń, danych niepasujących do wzorca
  6. Regresja – poszukiwanie wzoru oddającego relację zależnych od siebie zmiennych
Uczenie maszynowe, systemy samouczące się

Rozdział 6

Uczenie maszynowe (machine learning)

Uczenie maszynowe szuka odpowiedzi na to jak sprawić by komputer był w stanie sam znaleźć nie tylko rozwiązanie problemu, ale sam sposób jego rozwiązywania.

Aby zrozumieć różnicę zróbmy krok do tyłu: w przypadku konwencjonalnego programu tworzymy go na podstawie problemu, który próbujemy rozwiązać. Nie tylko rozumiemy problem, ale dokładnie znamy zasadę jak problem rozwiązać, jakich danych się spodziewać i co z nimi zrobić by uzyskać rozwiązanie. Wyrażając taką zasadę w języku programowania uzyskujemy program, który możemy potem uruchamiać by wyliczyć rozwiązanie dla nowych danych.

W przypadku dużych zbiorów danych sytuacja jest postawiona na głowie – w danych kryją się zależności, które są wynikami działania jakichś zasad zachodzących w świecie rzeczywistym, ale my tych zasad ani nie znamy, ani nie wiemy gdzie się w tych danych ukrywają. Uczenie maszynowe zajmuje się projektowaniem takich algorytmów, które analizując podobieństwa w danych wykryją zależności i ‘nauczą się’ ich natury – będą w stanie odpowiedzieć jaki byłby wynik dla innych danych wejściowych. Niekiedy będą w stanie podać nam zasadę, a niekiedy wyłącznie wynik problemu dla określonych danych.

Podsumowanie

Analityka biznesowa wykorzystuje dostępne dane, by:

  • pokazać nam obiektywną rzeczywistość
  • pomóc nam sprawdzić lub odnaleźć relacje pomiędzy różnymi zdarzeniami
  • prognozować przyszłe wyniki
  • podpowiadać usprawnienia i optymalne rozwiązania

*Ikonki Eucalyp, photo3idea_studio, Icongeek26, Smartline, fjstudio, Freepik, Nhor Phai, phatplus (flaticon)