Oracle HeatWave GenAI oferă AI generativă integrată, automatizată și securizată cu modele lingvistice mari (LLM) în bază de date; un depozit vectorial automatizat, în bază de date; procesare vectorială la scară largă; și capacitatea de a purta conversații contextuale în limbaj natural – permițându-vă să profitați de AI generativă fără expertiză AI, fără deplasarea datelor sau costuri suplimentare.
Principalele funcții ale HeatWave GenAI includ
Versiunile cuantizate ale următoarelor LLM-uri din baza de date sunt disponibile în prezent în HeatWave:
Puteți crea un depozit vectorial pentru conținutul nestructurat al întreprinderii cu o singură comandă SQL. Toate etapele de creare a unui depozit vectorial și a îmbinărilor vectoriale sunt automatizate și executate în interiorul bazei de date, inclusiv descoperirea documentelor în depozitul de obiecte, analizarea lor, generarea îmbinărilor într-un mod extrem de paralel și optimizat și introducerea lor în depozitul vectorial, făcând HeatWave Vector Store eficient și ușor de utilizat.
HeatWave rulează pe hardware de larg consum. LLM-urile în baza de date nu rulează pe GPU-uri; acestea rulează pe CPU-uri. Ca urmare, puteți reduce costurile fără să vă faceți griji cu privire la disponibilitatea LLM-urilor în diferite centre de date.
La utilizarea LLM-urilor în baza de date și a unui magazin vectorial în baza de date, datele nu părăsesc baza de date, contribuind astfel la creșterea securității datelor.
Da, HeatWave GenAI este disponibil nativ pe AWS, împreună cu alte capabilități HeatWave, inclusiv HeatWave MySQL, HeatWave Lakehouse, HeatWave AutoML și HeatWave Autopilot.
Da, încorporările pot fi generate pentru date text în 27 de limbi.
Prompturile pot fi emise în limba engleză. Prompturile emise în alte limbi, cum ar fi spaniolă sau germană, pot fi traduse în limba engleză.
Nu, căutarea vectorială se efectuează în clusterul HeatWave.
HeatWave rulează pe un nod MySQL. Recomandăm un nod MySQL cu o configurație MySQL.32, plus noduri HeatWave folosind configurația HeatWave.512GB pentru un mediu de producție. Pentru dezvoltare/testare, poate fi utilizată o configurație MySQL mai mică. Puteți analiza configurațiile MySQL acceptate aici. Pentru HeatWave GenAI, configurația HeatWave.32GB nu este acceptată.
Formatele acceptate sunt PDF, text, PowerPoint, Word și HTML.
Pentru utilizarea HeatWave GenAI nu există costuri suplimentare față de costul clusterului HeatWave. Puteți invoca LLM-uri în baza de date și modele de încorporare furnizate cu HeatWave GenAI fără costuri suplimentare. De asemenea, puteți invoca LLM-uri externe disponibile prin OCI Generative AI pe OCI și Amazon Bedrock pe AWS și veți fi apoi taxat pentru aceste servicii.
Nu, LLM-urile sunt modele preinstruite. Datele dvs. nu sunt utilizate pentru instruirea LLM-urilor.
Nu, LLM-urile din baza de date furnizate cu HeatWave nu pot fi ajustate.
Nu, nu vă puteți aduce propriile LLM-uri sau modele de încorporare. Cu toate acestea, puteți invoca LLM-urile externe sau modelele de încorporare disponibile prin intermediul OCI Generative AI atunci când executați HeatWave GenAI pe OCI și prin Amazon Bedrock atunci când executați HeatWave GenAI pe AWS.
Pe baza testelor noastre, rezultatele sunt comparabile cu LLM-urile necuantizate pentru cazurile de utilizare care se bazează pe HeatWave Vector Store. Puteți testa cu ușurință modelele pentru a evalua performanța și calitatea rezultatelor.
Trebuie să generați încorporările o singură dată deoarece acestea vor fi stocate în HeatWave Vector Store. Modificările aduse documentelor nestructurate din stocarea obiectelor vor declanșa automat actualizări ale încorporărilor vectoriale asociate.
Da, recunoașterea optică a caracterelor permite HeatWave Vector Store să convertească conținutul scanat salvat ca imagine în date text care pot fi analizate, de exemplu, pentru a efectua căutări de similitudine.