Funkcje HeatWave

HeatWave

HeatWave to zdolny do przetwarzania ogromnych ilości danych w równoległych procesach, hybrydowy, kolumnowy silnik przetwarzania danych. Korzysta przy tym z najnowocześniejszych algorytmów rozproszonego przetwarzania zapytań, które zapewniają bardzo wysoką wydajność.

Usługa opracowana z myślą o wydajności i skalowalności

HeatWave masowo dzieli dane na klastry węzłów, które mogą być obsługiwane równolegle. Zapewnia to doskonałą skalowalność międzywęzłową. Każdy węzeł w klastrze i każdy rdzeń w węźle może równolegle przetwarzać dane w partycjach. Dostępny w usłudze HeatWave inteligentny planista zapytań nakłada obliczenia na zadania związane z komunikacją sieciową, aby osiągnąć bardzo wysoką skalowalność na tysiącach rdzeni.

Optymalizacja pod kątem chmury i danych w magazynie obiektów

Przetwarzanie zapytań w usłudze HeatWave zostało zoptymalizowane pod kątem standardowych serwerów w chmurze. Rozmiary partycji zostały zoptymalizowane tak, aby pasowały do pamięci podręcznej podstawowych wariantów. Nakładanie na siebie obliczeń i zadań komunikacyjnych jest zoptymalizowane pod kątem dostępnej przepustowości sieci. Różne podstawowe operacje przetwarzania analitycznego wykorzystują instrukcje sprzętowe oferowane przez podstawowe maszyny wirtualne. Usługa HeatWave została zaprojektowana jako skalowalny silnik przetwarzania danych, zoptymalizowany pod kątem wykonywania zapytań dotyczących danych w magazynie obiektów.


HeatWave GenAI

Oracle HeatWave GenAI zapewnia zintegrowaną, zautomatyzowaną i bezpieczną generatywną sztuczną inteligencję z dużymi modelami językowymi (LLM) w bazie danych; zautomatyzowany magazyn danych wektorowych w bazie danych; skalowane rozszerzająco przetwarzanie wektorowe oraz możliwość prowadzenia kontekstowych konwersacji w języku naturalnym. W rezultacie można korzystać z generatywnej sztucznej inteligencji bez konieczności posiadania specjalistycznej wiedzy z zakresu sztucznej inteligencji, przenoszenia danych lub ponoszenia dodatkowych kosztów.

Modele LLM w bazie danych

Wbudowanych funkcji LLM można używać we wszystkich regionach Oracle Cloud Infrastructure (OCI), OCI Dedicated Region, Oracle Alloy, Amazon Web Services (AWS) i Microsoft Azure, uzyskując spójne wyniki i przewidywalną wydajność we wszystkich wdrożeniach. Aby obniżyć koszty infrastruktury, można wyeliminować konieczność przydzielania zasobów procesorom GPU.

Zintegrowane z usługami OCI Generative AI i Amazon Bedrock

Uzyskuj dostęp do wstępnie przeszkolonych modeli podstawowych z Cohere i Meta za pośrednictwem usługi OCI Generative AI, gdy używasz HeatWave GenAI w OCI i za pośrednictwem Amazon Bedrock podczas korzystania z HeatWave GenAI w AWS.

Magazyn danych wektorowych w bazie danych

Wykonuj generowanie odpowiedzi opartych na pobraniu odpowiednich danych (RAG) w ramach LLM i własnych dokumentów w różnych formatach przechowywanych w HeatWave Vector Store, aby uzyskać dokładniejsze i trafniejsze kontekstowo odpowiedzi — bez konieczności przenoszenia danych do osobnej wektorowej bazy danych.

Automatyczne generowanie wektorów

Dzięki zautomatyzowanemu kanałowi przepływu danych można znaleźć i pobrać zastrzeżone dokumenty z magazynu danych wektorowych HeatWave, co ułatwia pracę programistów i analityków nieposiadających specjalistycznej wiedzy z zakresu sztucznej inteligencji.

Skalowane rozszerzająco przetwarzanie wektorowe

Przetwarzanie wektorowe odbywa się równolegle na maksymalnie 512 węzłach klastra HeatWave i jest wykonywane z prędkością odpowiadającą przepustowości pamięci, co przyspiesza generowanie wyników przy zmniejszonym prawdopodobieństwie utraty dokładności.

Czat HeatWave

Prowadź kontekstowe konwersacje w oparciu o niestrukturyzowane dokumenty przechowywane w magazynie obiektów, używając języka naturalnego. Dostęp do zintegrowanej wyszukiwarki Lakehouse Navigator ułatwia modelom LLM przeszukiwanie określonych zestawów danych, przyczyniając się do obniżenia kosztów przy jednoczesnym szybszym uzyskiwaniu trafniejszych wyników.

Więcej informacji na temat HeatWave GenAI


HeatWave MySQL

HeatWave MySQL to w pełni zarządzana usługa bazy danych i jedyna usługa chmurowa zbudowana na bazie MySQL Enterprise Edition, z zaawansowanymi funkcjami zabezpieczeń do szyfrowania, maskowania danych, uwierzytelniania i zapory sieciowej bazy danych. HeatWave zwiększa wydajność zapytań MySQL o rząd wielkości i umożliwia uzyskanie analiz danych transakcyjnych w czasie rzeczywistym w katalogu MySQL - bez złożoności, opóźnień, zagrożeń oraz kosztów duplikacji wyodrębniania, przekształcania i ładowania (ETL) do osobnej bazy danych analitycznych.

Analiza w czasie rzeczywistym bez ETL

Zapytania są przetwarzane na podstawie najbardziej aktualnych danych, ponieważ aktualizacje z transakcji są automatycznie replikowane w czasie rzeczywistym do klastra analitycznego HeatWave. Nie ma potrzeby zatem indeksowania danych przed uruchomieniem obsługi zapytania. Możesz wyeliminować złożony, czasochłonny i kosztowny proces ETL oraz integrację z oddzielną bazą danych do analizy.

Więcej informacji na temat HeatWave MySQL


HeatWave Lakehouse

HeatWave Lakehouse umożliwia kierowanie zapytań do pół petabajta danych w obiektowej pamięci masowej - w różnych formatach plików, takich jak CSV, Parquet, Avro, JSON, a także eksportowanie plików z innych baz danych. Przetwarzanie zapytań jest wykonywane w całości przy użyciu aparatu HeatWave, dzięki czemu klienci mogą, oprócz przetwarzania obciążeń roboczych zgodnych z MySQL, przetwarzać również obciążenia inne niż MySQL.

Szybka analiza danych w repozytorium lakehouse i samouczenie się maszyn na bazie wszystkich danych

Zapytania do repozytorium (przy użyciu standardowych poleceń SQL) mogą dotyczyć danych w różnych formatach w obiektowej pamięci masowej, danych transakcyjnych w bazach danych MySQL lub kombinacji obu tych modeli. Obsługa zapytań w obiektowej pamięci masowej jest tak szybka, jak obsługa zapytań w bazach danych, co potwierdzają wyniki testu porównawczego 10 TB TPC-H.

Dzięki narzędziu HeatWave AutoML klienci mogą korzystać z danych w obiektowej pamięci masowej, bazie danych lub obu tych miejscach, aby automatycznie tworzyć, trenować, wdrażać i objaśniać modele samouczenia się maszyn bez potrzeby przenoszenia danych do oddzielnej usługi samouczenia się maszyn w chmurze.

Skalowalna w poziomie architektura na potrzeby zarządzania danymi i przetwarzania zapytań

Wielokrotnie partycjonowana architektura HeatWave umożliwia skalowanie w poziomie architektury dla HeatWave Lakehouse. Operacje z zakresu przetwarzania zapytań i zarządzania danymi, takie jak ładowanie i ponowne ładowanie danych, skalują się wraz z rozmiarem danych. Za pomocą HeatWave Lakehouse klienci mogą tworzyć zapytania dotyczące nawet pół petabajta danych w obiektowej pamięci masowej bez konieczności kopiowania ich do bazy danych MySQL. Klaster HeatWave może być rozszerzony do nawet do 512 węzłów.

Większa wydajność i oszczędność czasu dzięki automatyzacji opartej na samouczeniu się maszyn

Funkcje HeatWave Autopilot, takie jak automatyczne przydzielanie zasobów, automatyczne doskonalenie planu zapytań i automatyczne ładowanie równoległe, zostały ulepszone pod kątem HeatWave Lakehouse, aby jeszcze bardziej zmniejszyć obciążenie administracyjne bazy danych i poprawić wydajność. Nowe funkcje HeatWave Autopilot są również dostępne dla HeatWave Lakehouse.

  • Funkcja automatycznego rozpoznawania schematów automatycznie mapuje dane pliku do odpowiedniej definicji schematu dla wszystkich obsługiwanych typów plików, w tym dla plików CSV. W rezultacie klienci nie muszą ręcznie definiować i aktualizować mapowania schematów plików, oszczędzając czas i nakłady pracy.
  • Funkcja adaptacyjnego próbkowania danych inteligentnie pobiera próbki plików w obiektowej pamięci masowej w celu uzyskania informacji służących narzędziu HeatWave Autopilot do przewidywania automatyzacji. Dzięki tej funkcji HeatWave Autopilot może skanować dane i tworzyć odpowiednie prognozy (rozpoznanie schematów w przypadku plików o pojemności 400 TB nie trwa dłużej niż minutę).
  • Funkcja adaptacyjnego przepływu danych pozwala repozytorium HeatWave Lakehouse dynamicznie dostosowywać się do wydajności bazowego magazynu obiektów w dowolnym regionie, aby zwiększyć ogólną wydajność, stosunek ceny do wydajności i dostępność.

Więcej informacji na temat HeatWave Lakehouse


HeatWave AutoML

Narzędzie HeatWave AutoML zapewnia bez dodatkowych kosztów wszystko, co jest potrzebne użytkownikom do tworzenia, trenowania i objaśniania modeli samouczenia się maszyn w usłudze HeathWave.

Brak konieczności stosowania osobnej usługi samouczenia się maszyn

Dzięki oferowanej przez usługę HeatWave funkcji samouczenia się maszyn w bazie danych klienci nie muszą przenosić danych do oddzielnej takiej funkcji. Mogą bowiem z łatwością i bezpiecznie stosować szkolenia, wnioskowanie i wyjaśnianie związane z samouczeniem się maszyn w odniesieniu do danych przechowywanych zarówno w bazie MySQL, jak i w magazynie obiektów HeatWave Lakehouse. W rezultacie mogą przyspieszyć realizację inicjatyw w zakresie samouczenia się maszyn, zwiększyć bezpieczeństwo i obniżyć koszty.

Automatyzacja cyklu życia uczenia maszynowego pozwala oszczędzić czas i nakład pracy

Narzędzie HeatWave AutoML automatyzuje proces samouczenia się maszyn, w tym dobór algorytmów, inteligentne próbkowanie danych do trenowania modeli, dobór cech i optymalizację hiperparametrów, aby zaoszczędzić analitykom i badaczom danych znaczną ilość czasu i nakładu pracy. Aspekty tego procesu można dostosować do własnych potrzeb, np. dobór algorytmów, dobór cech i optymalizację hiperparametrów. HeatWave AutoML obsługuje wykrywanie anomalii, prognozowanie, klasyfikację, regresję i zadania systemu rekomendacji, w tym zadania dotyczące kolumn tekstowych. Użytkownicy mogą przekazywać informacje zwrotne na temat wyników nienadzorowanego wykrywania anomalii i wykorzystywać te oznaczone dane w celu usprawnienia kolejnych prognoz.

System spersonalizowanych rekomendacji

Na podstawie zarówno niejawnych informacji zwrotnych (wcześniejsze zakupy, zachowanie podczas przeglądania itp.), jak i jawnych informacji zwrotnych (oceny, polubienia itp.), system rekomendacji narzędzia HeatWave AutoML może generować spersonalizowane rekomendacje. Analitycy mogą na przykład przewidywać przedmioty, które polubi dany użytkownik, użytkowników, którzy polubią określony przedmiot, oraz oceny, jakie uzyskają przedmioty. Na podstawie profilu użytkownika mogą również uzyskać listę podobnych użytkowników, a na podstawie profilu określonego przedmiotu — listę podobnych przedmiotów.

Interaktywna konsola HeatWave AutoML

Interaktywna konsola umożliwia analitykom biznesowym tworzenie, szkolenie, uruchamianie i objaśnianie modeli samouczenia się maszyn przy użyciu wizualnego interfejsu i bez używania poleceń SQL ani programowania. Konsola ułatwia także badanie scenariuszy warunkowych w celu oceny założeń biznesowych (przykładowy problem: Jak o 30% większe inwestycje w płatną reklamę w mediach społecznościowych wpłyną na przychody i zyski?).

Zrozumiałe modele samouczenia się maszyn

Wszystkie modele wytrenowane przez narzędzie HeatWave AutoML są zrozumiałe. HeatWave AutoML przedstawia prognozy z objaśnieniem wyników, co pomaga odbiorcom w zapewnieniu zgodności z przepisami, uczciwości, powtarzalności, przyczynowości i zaufania.

Modelowanie wątków i wykrywanie odchyleń danych

Modelowanie wątków pomaga użytkownikom odkrywać spostrzeżenia w dużych zbiorach danych tekstowych, pomagając im zrozumieć kluczowe motywy w dokumentach, na przykład w celu ukończenia analizy nastrojów na podstawie danych w mediach społecznościowych. Wykrywanie odchyleń danych pomaga analitykom określić, kiedy ponownie przeszkolić modele, wykrywając różnice między danymi używanymi do szkolenia a nowymi przychodzącymi danymi.

Wykorzystanie istniejących umiejętności

Programiści i analitycy danych mogą tworzyć modele samouczenia się maszyn za pomocą znanych poleceń SQL i nie muszą uczyć się w tym celu żadnych nowych narzędzi ani języków. Ponadto narzędzie HeatWave AutoML jest zintegrowane z popularnymi notatnikami, takimi jak Jupyter i Apache Zeppelin.


HeatWave Autopilot

HeatWave Autopilot oferuje opartą na uczeniu maszynowym automatyzację rozpoznającą obciążenia robocze. Ponadto umożliwia poprawę wydajności i skalowalności bez konieczności posiadania specjalistycznej wiedzy w zakresie dostrajania baz danych, zwiększa produktywność programistów i administratorów baz danych oraz pomaga wyeliminować błędy ludzkie. HeatWave Autopilot automatyzuje wiele najważniejszych i niejednokrotnie trudnych aspektów związanych z zapewnieniem bardzo dużej wydajności obsługi zapytań na dużą skalę, takich jak przydzielanie zasobów, ładowanie danych, wykonywanie zapytań i obsługa awarii. HeatWave Autopilot jest dostępne bez dodatkowych opłat dla użytkowników usługi HeatWave MySQL.

HeatWave Autopilot zapewnia liczne funkcje zarówno w przypadku HeatWave, jak i OLTP, takie jak:

  • Funkcja automatycznego udostępniania umożliwia przewidywanie liczby węzłów HeatWave wymaganych do uruchomienia zadania przetwarzania w ramach adaptacyjnego próbkowania danych tabeli, dla których są wymagane analizy. Oznacza to, że programiści i administratorzy baz danych nie muszą już ręcznie szacować optymalnego rozmiaru klastra.
  • Funkcja automatycznego łączenia wątków sprawia, że usługa bazodanowa przetwarza więcej transakcji dla danej konfiguracji sprzętowej, zapewniając wyższą przepustowość dla obciążeń OLTP i zapobiegając jej spadkowi przy wysokich poziomach transakcji i współbieżności.
  • Funkcja automatycznego przewidywania wariantów stale monitoruje obciążenie robocze OLTP, w tym przepustowość i skuteczność użycia pamięci podręcznej (buffer pool hit rate), aby rekomendować odpowiedni wariant obliczeniowy w danym momencie. Pozwala to uzyskać klientom najkorzystniejszy stosunek ceny do wydajności.
  • Funkcja automatycznego kodowania określa optymalną reprezentację kolumn ładowanych do usługi HeatWave przy uwzględnieniu zapytań. Taka optymalna reprezentacja zapewnia najlepszą wydajność przetwarzania zapytań i minimalizuje rozmiar klastra w celu minimalizacji kosztów.
  • Funkcja automatycznego doskonalenia planu zapytań uczy się różnych statystyk dotyczących zapytań, aby na tej podstawie poprawić plan obsługi przyszłych zapytań. Poprawia to wydajność systemu w miarę uruchamiania kolejnych zapytań.
  • Funkcja adaptacyjnej optymalizacji zapytań dostosowuje na bazie różnych statystyk struktury danych i zasoby systemowe po rozpoczęciu wykonywania zapytań. Polega to na niezależnej optymalizacji wykonywania zapytań dla każdego węzła na podstawie rzeczywistej dystrybucji danych w czasie wykonywania zapytania. W rezultacie wydajność obsługi zapytań ad hoc może wzrosnąć nawet o 25%.
  • Funkcja automatycznego pozycjonowania danych przewiduje kolumnę, w której tabele powinny być partycjonowane w pamięci, aby uzyskać najlepszą wydajność dla zapytań. Ponadto przewiduje oczekiwany wzrost wydajności obsługi zapytań w kontekście nowo rekomendowanej kolumny. Minimalizuje to przenoszenie danych między węzłami z powodu nieoptymalnych wyborów ewentualnie dokonywanych przez operatorów podczas ręcznego wybierania kolumny.
  • Funkcja automatycznej kompresji określa optymalny algorytm kompresji dla każdej kolumny, aby poprawić wydajność ładowania i przetwarzania zapytań dzięki szybszej kompresji i dekompresji danych. Dzięki zmniejszeniu zużycia pamięci klienci mogą obniżyć koszty nawet o 25%.
  • Indeksowanie automatycznie określa indeksy, które klienci powinni tworzyć lub usuwać ze swoich tabel w celu optymalizacji przepustowości OLTP, wykorzystując uczenie maszynowe do przewidywania na podstawie indywidualnych zadań przetwarzania aplikacji. Pomaga to klientom wyeliminować czasochłonne zadania związane z tworzeniem optymalnych indeksów dla zadań przetwarzania OLTP i utrzymywaniem ich w miarę rozwoju zadań przetwarzania.

Elastyczność w czasie rzeczywistym

Dzięki elastyczności w czasie rzeczywistym można zwiększać lub zmniejszać rozmiar klastra HeatWave o dowolną liczbę węzłów bez przestojów lub czasu przeznaczonego tylko na odczyt.

Niezmiennie wysoka wydajność, nawet w godzinach szczytu, i niższe koszty bez przestojów

Operacja zmiany rozmiaru trwa zaledwie kilka minut, podczas których usługa HeatWave pozostaje w trybie online i jest dostępna dla wszystkich operacji. Po zmianie rozmiaru dane są pobierane z obiektowej pamięci masowej i automatycznie równoważone między wszystkimi dostępnymi węzłami klastra, a potem stają się natychmiast dostępne dla zapytań. W rezultacie zachowana jest niezmiennie wysoka wydajność, nawet w godzinach szczytu, i spadają koszty dzięki zmniejszaniu w miarę potrzeb klastra HeatWave bez przestojów lub czasu przeznaczonego tylko na odczyt.

Dzięki wydajnemu ponownemu ładowaniu danych z obiektowej pamięci masowej można również wstrzymać, a potem wznowić działanie klastra HeatWave w celu obniżenia kosztów.

Brak instancji z nadmiernie przydzielonymi zasobami

Klienci mogą zwiększać lub zmniejszać swój klaster HeatWave do dowolnej liczby węzłów. W ten sposób nie muszą korzystać z kosztownych instancji z nadmiernie przydzielonymi zasobami, które są wymuszane w ramach sztywnych rozmiarów oferowanych przez innych dostawców baz danych w chmurze. W przypadku usługi HeatWave płaci się tylko za te zasoby, z których się korzysta.


Dostępność w chmurach publicznych i w Twoim centrum danych

Usługę HeatWave można wdrożyć w OCI, AWS lub Azure. Można replikować dane z lokalnych aplikacji OLTP do HeatWave, aby uzyskać analizy w czasie zbliżonym do rzeczywistego i przetwarzać dane wektorowe w chmurze. Z usługi HeatWave można również korzystać w swoim centrum danych w ramach dedykowanego regionu OCI.

HeatWave w AWS zapewnia natywne środowisko dla klientów AWS. Konsola, płaszczyzna sterująca i płaszczyzna danych rezydują w AWS.