Comunicado à imprensa

A Oracle anuncia os primeiros LLMs em banco de dados do setor e armazenamento automatizado de vetores em banco de dados com o HeatWave GenAI

Os clientes agora podem criar aplicações de IA generativa sem experiência em IA, sem movimentar dados e sem custo adicional

O HeatWave GenAI é 30 vezes mais rápido que o Snowflake, 18 vezes mais rápido que o Google BigQuery e 15 vezes mais rápido que Databricks para processamento de vetores

Austin, Texas, EUA —26 de Junho de 2024
Gen AI HeatWave

A Oracle anunciou hoje a disponibilidade geral do HeatWave GenAI, que inclui os primeiros grandes modelos de linguagem (LLMs) em banco de dados do setor, um armazenamento de vetores automatizado em banco de dados, processamento de vetores em escala e a capacidade de ter conversas contextuais em linguagem natural informadas por conteúdo não estruturado. Esses novos recursos permitem que os clientes tragam o poder da IA generativa para seus dados corporativos-, sem exigir experiência em IA ou ter que mover dados para um banco de dados vetorial separado. O HeatWave GenAI está disponível imediatamente em todas as regiões da Oracle Cloud, na Oracle Cloud Infrastructure (OCI) Dedicated Region e em todas as nuvens, sem custo extra para os clientes do HeatWave.

Com o HeatWave GenAI, os desenvolvedores podem criar um armazenamento de vetores para conteúdo corporativo não estruturado com um único comando SQL, usando modelos incorporados. Os usuários podem executar pesquisas de linguagem natural em uma única etapa usando LLMs no banco de dados ou externos. Os dados não saem do banco de dados e, devido à escala e ao desempenho extremos do HeatWave, não há necessidade de provisionar GPUs. Como resultado, os desenvolvedores podem diminuir a complexidade das aplicações, aumentar o desempenho, melhorar a segurança dos dados e reduzir custos.

"O impressionante ritmo de inovação do HeatWave continua com a adição do HeatWave GenAI aos recursos incorporados existentes do HeatWave: HeatWave Lakehouse, HeatWave Autopilot, HeatWave AutoML e HeatWave MySQL", comentou Edward Screven, Arquiteto-chefe Corporativo da Oracle. "Os aprimoramentos de IA integrados e automatizados de hoje permitem que os desenvolvedores criem aplicações de IA generativa mais rapidamente, sem exigir experiência em IA ou mover dados. Os usuários agora têm uma maneira intuitiva de interagir com seus dados corporativos e obter rapidamente as respostas que precisam para seus negócios."

"O HeatWave GenAI torna extremamente fácil fazer uso da IA generativa", disse Vijay Sundhar, CEO da SmarterD. "O suporte para LLMs em banco de dados e a criação de vetores no banco de dados leva a uma redução significativa na complexidade das aplicações, uma latência de inferência previsível e, acima de tudo, não gera custo adicional para usar os LLMs ou criar as incorporações. Essa é verdadeiramente a democratização da IA generativa e acreditamos que resultará na construção de aplicações mais ricas com o HeatWave GenAI, bem como ganhos significativos de produtividade para nossos clientes."

Os novos recursos automatizados e integrados de IA generativa incluem:

  • LLMs em banco de dados simplificam o desenvolvimento de aplicações de IA generativa a um custo menor. Os clientes podem se beneficiar da IA generativa sem a complexidade da seleção e da integração de LLMs externos e sem se preocupar com a disponibilidade de modelos em vários data centers de provedores de nuvem. Os LLMs em banco de dados permitem que os clientes pesquisem dados, gerem ou resumam conteúdo e executem a geração aumentada por recuperação (RAG) com o HeatWave Vector Store. Além disso, eles podem combinar a IA generativa com outros recursos incorporados do HeatWave, como AutoML, para criar aplicações mais ricas. O HeatWave GenAI também está integrado ao serviço OCI Generative AI para acessar modelos básicos pré-treinados dos principais provedores de LLMs.
  • O armazenamento automatizado de vetores em banco de dados permite que os clientes usem IA generativa com seus documentos corporativos sem mover dados para um banco de dados vetorizado separado e sem experiência em IA. Todas as etapas para criar armazenamento e incorporações de vetores são automatizadas e executadas dentro do banco de dados, incluindo a descoberta de documentos no armazenamento de objetos, analisando-os, gerando incorporações de maneira altamente paralela e otimizada e inserindo-as no armazenamento de vetores, tornando o HeatWave Vector Store mais eficiente e fácil de usar. Usar um armazenamento de vetores para RAG ajuda a resolver o desafio da "alucinação" dos LLMs, pois os modelos podem pesquisar dados proprietários com contexto apropriado para fornecer respostas mais precisas e relevantes.
  • A escalabilidade de processamento de vetores oferece resultados de pesquisa semântica muito rápidos sem perda de precisão. O HeatWave oferece suporte a um novo tipo de dados VECTOR nativo e uma implementação otimizada da função de distância, permitindo que os clientes executem consultas semânticas com SQL padrão. A representação colunar híbrida in-memory e a arquitetura de escalabilidade do HeatWave permitem que o processamento de vetores seja executado em largura de banda próxima da memória e paralelize em até 512 nós do HeatWave. Como resultado, os clientes têm suas perguntas respondidas rapidamente. Os usuários também podem combinar a pesquisa semântica com outros operadores SQL para, por exemplo, unir várias tabelas com documentos diferentes e executar pesquisas de similaridade em todos os documentos.
  • HeatWave Chat é um plug-in de Visual Code para Shell MySQL que fornece uma interface gráfica para o HeatWave GenAI e permite que os desenvolvedores façam perguntas em linguagem natural ou SQL. O Lakehouse Navigator integrado permite que os usuários selecionem arquivos do armazenamento de objetos e criem um armazenamento de vetores. Os usuários podem pesquisar em todo o banco de dados ou restringir a pesquisa a uma pasta. O HeatWave mantém o contexto com o histórico de perguntas feitas, citações dos documentos de origem e o prompt para o LLM. Isso facilita uma conversa contextual e permite que os usuários verifiquem a origem das respostas geradas pelo LLM. Esse contexto é mantido no HeatWave e está disponível para qualquer aplicação que use o utilize.

Benchmarks de criação de armazenamento e processamento de vetores

A criação de um armazenamento de vetores para documentos nos formatos PDF, PPT, WORD e HTML é até 23 vezes mais rápida com o HeatWave GenAI e representa 1/4 do custo de usar a Base de Conhecimento para o Amazon Bedrock.

Como demonstrado por um benchmark de terceiros usando uma variedade de consultas de pesquisas de similaridade em tabelas que variam de 1,6GB a 300 GB em tamanho, o HeatWave GenAI é 30 vezes mais rápido que o Snowflake e custa 25% menos, 15 vezes mais rápido que o Databricks a um custo 85% menor e 18 vezes mais rápido que o Google BigQuery custando 60% menos.

Um benchmark separado revela que os índices vetoriais no Amazon Aurora PostgreSQL com pgvector têm um alto grau de imprecisão e podem produzir resultados incorretos. Em contraste, o processamento de pesquisa de similaridade do HeatWave sempre fornece resultados precisos, tem tempo de resposta previsível, é executado quase na velocidade da memória e é até 10 a 80 vezes mais rápido do que o Aurora usando o mesmo número de núcleos.

"Estamos entusiasmados em continuar nossa forte colaboração com a Oracle para fornecer o poder e a produtividade da IA com o HeatWave GenAI para cargas de trabalho e conjuntos de dados críticos", comentou Dan McNamara, Vice-presidente Sênior e Gerente Geral da Unidade de Negócios de Servidores da AMD. "O trabalho conjunto de engenharia realizado pela AMD e pela Oracle está permitindo que os desenvolvedores projetem soluções inovadoras de IA corporativa, aproveitando o HeatWave GenAI com a densidade principal e o excelente desempenho de preço dos processadores AMD EPYC."

Comentário adicional do cliente e analista sobre o HeatWave GenAI

"Usamos bastante o HeatWave AutoML no banco de dados para fazer várias recomendações aos nossos clientes", disse Safarath Shafi, CEO da EatEasy. "O suporte do HeatWave para LLMs no banco de dados e o armazenamento de vetores no banco de dados é diferenciado e a capacidade de integrar IA generativa ao AutoML fornece mais diferenciação para o HeatWave no setor, permitindo oferecer novos tipos de recursos aos nossos clientes. A sinergia com o AutoML também melhora o desempenho e a qualidade dos resultados do LLM."

"LLMs do HeatWave no banco de dados, armazenamento de vetores no banco de dados, expansão do processamento de vetores in-memory e HeatWave Chat são recursos muito diferenciados da Oracle que democratizam a IA generativa e a tornam muito simples, segura e barata de usar", disse Eric Aguilar, fundador da Aiwifi. "O uso do HeatWave e do AutoML para nossas necessidades empresariais já transformou nossos negócios de várias maneiras e a introdução dessa inovação da Oracle provavelmente estimulará o crescimento de uma nova classe de aplicações em que os clientes estão procurando maneiras de aproveitar a IA generativa em seu conteúdo corporativo."

"A inovação em engenharia do HeatWave continua a oferecer a visão de um banco de dados em nuvem universal", citou Holger Mueller, Vice-presidente e Analista Principal da Constellation Research. "O mais recente é a IA generativa feita no 'estilo HeatWave', que inclui a integração de um armazenamento de vetores automatizado no banco de dados e LLMs no banco de dados diretamente no núcleo do HeatWave. Isso permite que os desenvolvedores criem novas classes de aplicações à medida que combinam elementos do HeatWave. Por exemplo, eles podem combinar o HeatWave AutoML e o HeatWave GenAI em uma aplicação de detecção de fraudes que não apenas detecta transações suspeitas, mas também fornece uma explicação compreensível. Tudo isso é executado no banco de dados, portanto, não há necessidade de mover dados para bancos vetoriais externos, mantendo os dados mais seguros. Ele também torna o HeatWave GenAI altamente eficiente a uma fração do custo, conforme demonstrado em benchmarks da concorrência."

HeatWave

O HeatWave é o único serviço de nuvem que fornece IA generativa automatizada e integrada e machine learning em uma oferta para transações e análises em escala de lakehouse. Um componente essencial da estratégia de nuvem distribuída da Oracle, o HeatWave está disponível nativamente na OCI e na Amazon Web Services, no Microsoft Azure por meio do Oracle Interconnect for Azure e nos data centers dos clientes com a OCI Dedicated Region e o OCI Alloy.

Recursos adicionais

Informações para Contato

Acacia Krebs

Oracle PR
+1.406.550.2724

Sobre a Oracle

A Oracle oferece suítes integradas de aplicativos, além de uma estrutura segura e autônoma na Oracle Cloud. Para obter mais informações sobre a Oracle (NYSE: ORCL), acesse www.oracle.com.

Marcas registradas

Oracle, Java, MySQL e NetSuite são marcas registradas da Oracle Corporation. NetSuite foi a primeira empresa de nuvem, inaugurando a nova era da computação em nuvem.

Oracle Chatbot
Disconnected