Samouczenie się maszyn (ML) to podzbiór zagadnień należących do dziedziny sztucznej inteligencji (AI), których celem jest budowanie systemów uczących się — lub zwiększających wydajność — na podstawie przetwarzanych danych. Sztuczna inteligencja to szerokie pojęcie, które odnosi się do systemów lub maszyn naśladujących ludzką inteligencję. Samouczenie się maszyn i sztuczną inteligencję często omawia się razem, a terminów tych niekiedy używa się zamiennie, choć nie znaczą one tego samego. Ważnym rozróżnieniem jest to, że chociaż całość zagadnień samouczenia się maszyn należy do sztucznej inteligencji, to sztuczna inteligencja nie ogranicza się tylko do samouczenia się maszyn.
Obecnie samouczenie się maszyn można spotkać na każdym kroku. Kiedy wchodzimy w interakcje z bankami, robimy zakupy w internecie czy korzystamy z mediów społecznościowych, mamy do czynienia z algorytmami samouczenia się, których celem jest pozostawienie w nas poczucia efektywności, płynności i bezpieczeństwa. Samouczenie się maszyn wraz z technologiami towarzyszącymi szybko się rozwija, a my dopiero zaczynamy rozpoznawać jego możliwości.
Algorytmy to silniki stymulujące samouczenie się maszyn. Ogólnie rzecz biorąc, obecnie stosuje się dwa główne typy algorytmów samouczenia się maszyn: uczenie nadzorowane i uczenie nienadzorowane. Różnica między nimi polega na zastosowanej metodzie uczenia się na podstawie danych w celu generowania prognoz.
Nadzorowane samouczenie się maszyn | Algorytmy nadzorowanego samouczenia się maszyn są najpowszechniejsze. W tym modelu analityk danych działa jako przewodnik i uczy algorytm, jakie wnioski powinien wyciągać. Tak jak dziecko uczy się rozpoznawać owoce przez ich zapamiętywanie w książce obrazkowej, w nadzorowanym uczeniu się algorytm jest trenowany przez zestaw danych, które mają już etykiety i predefiniowany wynik. Do przykładów nadzorowanego samouczenia się maszyn należą algorytmy regresji liniowej i logistycznej, klasyfikacji wieloklasowej oraz maszyn wektorów nośnych. |
Nienadzorowane samouczenie się maszyn | Nienadzorowane samouczenie się maszyn wykorzystuje bardziej niezależne podejście. Komputer uczy się identyfikować złożone procesy i wzorce bez człowieka udzielającego ścisłych, stałych wskazówek. Samouczenie się maszyn bez nadzoru obejmuje trening oparty na danych, które nie mają etykiet ani konkretnego, zdefiniowanego wyniku. Aby kontynuować przywołaną wcześniej analogię do nauczania w dzieciństwie, nienadzorowane samouczenie się maszyn odpowiada sytuacji, kiedy dziecko uczy się rozpoznawać owoce, obserwując kolory i wzorce, zamiast zapamiętywać ich nazwy z pomocą nauczyciela. Dziecko będzie szukać podobieństw między obrazami i rozdzielać je na grupy, przypisując każdej grupie własną, nową etykietę. Przykłady algorytmów nienadzorowanego samouczenia się maszyn obejmują analizę skupień metodą k-średnich, analizę głównych składowych i analizę składowych niezależnych oraz reguły asocjacyjne. |
Wybór podejścia | Które podejście najlepiej odpowiada potrzebom? Wybór nadzorowanego lub nienadzorowanego algorytmu samouczenia się maszyn zależy zwykle od czynników związanych ze strukturą i objętością danych oraz z przypadkiem użycia, do którego ma zostać zastosowany algorytm. Samouczenie się maszyn rozwinęło się w wielu branżach, wspierając różne cele biznesowe i przypadki użycia, w tym:
|
Gdy programiści zaczynają korzystać z samouczenia się maszyn, polegają na swojej wiedzy z zakresu statystyki, prawdopodobieństwa i rachunku różniczkowo-całkowego, aby z powodzeniem tworzyć modele, które uczą się w miarę upływu czasu. Jeśli programista ma duże umiejętności w tych dziedzinach, nie powinien mieć problemu z opanowaniem narzędzi, których wielu innych programistów używa do trenowania nowoczesnych algorytmów samouczenia się maszyn. Programiści mogą również decydować o tym, czy ich algorytmy będą nadzorowane czy nienadzorowane. Programista może podjąć decyzje i skonfigurować model na wczesnym etapie projektu, a następnie pozwolić mu się uczyć bez większego zaangażowania z jego strony.
Granica między programistą a badaczem danych jest często niewyraźna. Programiści czasami syntetyzują dane z modelu samouczenia się maszyn, a badacze danych uczestniczą w tworzeniu rozwiązań dla użytkownika końcowego. Współpraca między tymi dwiema dyscyplinami może sprawić, że projekty samouczenia się maszyn będą bardziej wartościowe i użyteczne.
Modelowanie wartości cyklu życia klienta stanowi podstawę działania firm z branży handlu elektronicznego, ale ma również zastosowanie w wielu innych branżach. W tym modelu organizacje wykorzystują algorytmy samouczenia się maszyn do identyfikacji, poznania i zatrzymywania najcenniejszych klientów. Te modele wartości oceniają ogromne ilości danych klientów w celu określenia największych płatników, najbardziej lojalnych zwolenników marki lub kombinacji tych dwóch atrybutów.
Modele wartości cyklu życia klienta są szczególnie skuteczne przy prognozowaniu przyszłych przychodów, które indywidualny klient przyniesie firmie w danym okresie. Na podstawie tych informacji organizacja może skupić działania marketingowe na zachęcaniu klientów o wysokiej wartości do częstszego kontaktu z marką. Modele wartości cyklu życia klienta pomagają również przedsiębiorstwom ukierunkować nakłady na pozyskanie klientów, którzy wykazują podobieństwo do bieżących klientów o wysokiej wartości, czyli zapewniających wysokie przychody.
Pozyskiwanie nowych klientów jest bardziej czasochłonne i kosztowne niż utrzymanie wysokiego poziomu zadowolenia i lojalności obecnych klientów. Modelowanie odpływu klientów pomaga organizacjom identyfikować klientów, którzy mogą przestać angażować się w biznes — a także znaleźć przyczyny.
Efektywny model odpływu wykorzystuje algorytmy samouczenia się maszyn do generowania wniosków dotyczących zagadnień: od szacunków ryzyka odpływu po czynniki odpływu uszeregowane według ważności. Wyniki te są kluczem do opracowania strategii utrzymania klientów w formie algorytmicznej.
Uzyskanie głębszego wglądu w przyczyny odpływu klientów pomaga firmom zoptymalizować oferty rabatowe, kampanie e-mailingowe i inne ukierunkowane inicjatywy marketingowe, dzięki którym klienci o wysokiej wartości życiowej będą kontynuować zakupy — i wracać po więcej.
Konsumenci mają do wyboru więcej opcji niż kiedykolwiek wcześniej i mogą natychmiast porównać ceny, korzystając z wielu kanałów. Dynamiczne ustalanie cen, znane także jako ustalanie cen według popytu, umożliwia firmom dotrzymywanie tempa zwiększonej dynamice rynku. Ten mechanizm pozwala organizacjom elastycznie kształtować ceny towarów na podstawie różnych czynników, w tym poziomu zainteresowania klienta docelowego, popytu w momencie zakupu i tego, czy klient zareagował na kampanię marketingową.
Ten poziom adaptacyjności biznesowej wymaga solidnej strategii samouczenia się maszyn oraz ogromnej ilości danych na temat kształtowania się skłonności różnych klientów do płacenia za towar lub usługi w różnych sytuacjach. Chociaż modele dynamicznego ustalania cen mogą być skomplikowane, firmy takie jak linie lotnicze i dostawcy innych usług przewozów wspólnych z powodzeniem wdrażają strategie dynamicznej optymalizacji cen, aby do maksimum zwiększyć uzyskiwane przychody.
Udany marketing od zawsze polega na oferowaniu odpowiedniego produktu odpowiedniej osobie w odpowiednim czasie. Jeszcze do niedawna marketingowcy byli skazani na własną intuicję w kwestii segmentacji klientów, czyli ich podziału na grupy pod kątem ukierunkowanych kampanii.
Obecnie mechanizmy samouczenia się maszyn pozwalają analitykom danych wykorzystywać algorytmy klastrowania i klasyfikacji do grupowania klientów w typy osobowe na podstawie konkretnych cech zmiennych. Te typy osobowe uwzględniają różnice między klientami w wielu wymiarach, takich jak demografia, zachowania związane z przeglądaniem oraz preferencje. Połączenie tych cech z wzorcami zachowań zakupowych umożliwia firmom zorientowanym na dane wprowadzanie bardzo spersonalizowanych kampanii marketingowych, które skuteczniej zwiększają sprzedaż niż kampanie uogólnione.
Wraz ze wzrostem ilości danych dostępnych dla firm oraz stopnia wyrafinowania algorytmów rosną także możliwości personalizacji, a firmy zbliżają się do sytuacji idealnej, kiedy to segment rynku obejmuje jednego, konkretnego klienta.
Samouczenie się maszyn ma wiele możliwych zastosowań poza sprzedażą detaliczną, usługami finansowymi i handlem elektronicznym. Ma także olbrzymi potencjał w zastosowaniach naukowych, ochronie zdrowia, budownictwie i energetyce. W klasyfikacji obrazów wykorzystuje się na przykład algorytmy samouczenia się maszyn w celu przypisania dowolnemu obrazowi wejściowemu etykiety z ustalonego zestawu kategorii. Można to wykorzystać do modelowania planów konstrukcyjnych 3D na podstawie projektów 2D, usprawnienia tagowania zdjęć w mediach społecznościowych, stawiania diagnoz medycznych i wielu innych zadań.
Do klasyfikacji obrazów często stosuje się metody uczenia głębokiego, np. sieci neuronowe, ponieważ pozwalają najskuteczniej identyfikować odpowiednie cechy obrazu mimo występowania potencjalnych czynników zakłócających. W metodach tych można na przykład uwzględniać zmiany perspektywy, oświetlenia, skali lub stopnia zakłóceń obrazu i neutralizować te problemy, aby uzyskać najtrafniejsze wnioski o wysokiej jakości.
Silniki rekomendacji mają kluczowe znaczenie w sprzedaży wiązanej i sprzedaży dodatkowej oraz zapewniają lepszą obsługę klientów.
Netflix szacuje wartość silnika rekomendacji generującego propozycje treści na 1 mld USD rocznie, a Amazon twierdzi, że jego system zwiększa roczną sprzedaż o 20–35 procent.
Silniki rekomendacji wykorzystują algorytmy samouczenia się maszyn do przesiewania dużych ilości danych w celu przewidzenia prawdopodobieństwa zakupu produktu lub materiału, a następnie prezentuje użytkownikowi zindywidualizowane sugestie. Rezultatem jest bardziej spersonalizowana i trafna obsługa, która stymuluje zaangażowanie klientów i ogranicza ich odpływ.
Samouczenie się maszyn stanowi ważny element wielu kluczowych zastosowań biznesowych. Ale w jaki sposób zapewnia przewagę konkurencyjną? Do najbardziej fascynujących właściwości samouczenia się maszyn należy zdolność do automatyzacji i przyspieszania procesów decyzyjnych oraz skracanie czasu oczekiwania na efekty. Podstawą jest zdobycie lepszego wglądu biznesowego oraz wzmocnienie pracy zespołowej.
„Tradycyjna obserwacja jest taka, że ludzie nie są w stanie ze sobą współpracować” — mówi Rich Clayton, wiceprezes ds. strategii produktowej w Oracle Analytics. „Dodanie samouczenia się maszyn do Oracle Analytics Cloud pomaga w końcu ludziom organizować swoją pracę oraz budować, trenować i wdrażać te modele danych. To narzędzie pracy zespołowej, którego wartość polega na przyspieszeniu procesu i umożliwieniu współpracy różnych działów firmy, czego efektami są wyższa jakość i lepsze modele do wdrażania”.
Przykładowo do rutynowych obowiązków typowego działu finansów należy cykliczny proces analizy wariancji — porównywanie faktycznych wyników z prognozami. To zastosowanie o niskich walorach poznawczych, do którego z powodzeniem można zastosować samouczenie się maszyn.
„Dzięki wprowadzeniu samouczenia się maszyn dział finansów może działać szybciej i sprawniej, podejmując pracę na etapie, na którym zostawi ją maszyna” — powiedział Rich Clayton.
Kolejną fascynującą cechą samouczenia się maszyn są możliwości prognostyczne. W przeszłości decyzje biznesowe opierano najczęściej na wynikach historycznych. Dzisiaj samouczenie się maszyn wykorzystuje zaawansowaną analizę do prognozowania tego, co się stanie. Organizacje mogą podejmować wybiegające w przyszłość, proaktywne decyzje zamiast polegać na danych z przeszłości.
Konserwacja predykcyjna może na przykład umożliwić producentom, zakładom energetycznym i innym branżom przejęcie inicjatywy oraz zagwarantowanie niezawodności i optymalizacji prowadzonej działalności. Na polu naftowym, na którym pracują setki wiertnic, modele samouczenia się maszyn mogą wykrywać urządzenia zagrożone awarią w niedalekiej przyszłości, a następnie z wyprzedzeniem powiadamiać zespoły konserwacyjne. Takie podejście nie tylko maksymalizuje produktywność, ale także zwiększa wydajność oraz wydłuża czas działania i okres eksploatacji aktywów. Może również zminimalizować ryzyko dla pracowników, ograniczać odpowiedzialność odszkodowawczą i poprawiać zgodność z przepisami.
Korzyści z konserwacji predykcyjnej obejmują także obszary kontroli zapasów i zarządzanie nimi. Wdrożenie konserwacji predykcyjnej pomaga przedsiębiorstwom nie tylko unikać nieplanowanych przestojów sprzętu, ale także dokładniej przewidywać zapotrzebowanie na części zamienne i naprawy, a przez to znacznie obniżyć nakłady inwestycyjne i koszty operacyjne.
Samouczenie się maszyn ma ogromny potencjał — może pomóc przedsiębiorstwom czerpać korzyści biznesowe z bogatych zasobów dostępnych obecnie danych. Nieefektywna organizacja pracy może jednak uniemożliwiać firmom osiągnięcie maksymalnych korzyści z samouczenia się maszyn.
Aby odnieść sukces na poziomie przedsiębiorstwa, samouczenie się maszyn musi być częścią kompleksowej platformy, która pomoże organizacjom uprościć operacje i wdrożyć modele w dużej skali. Odpowiednie rozwiązanie umożliwi organizacjom centralizację wszystkich prac związanych z analityką danych na platformie do pracy zespołowej oraz ułatwi korzystanie z narzędzi, frameworków i infrastruktury open source oraz zarządzanie nimi.