공식 발표

오라클, 히트웨이브 생성형AI 발표 업계 최초로 인-데이터베이스 LLM 및 자동화된 벡터 저장소 지원

AI 전문가가 아니어도 데이터 이동이나 추가 비용 없이 생성형 AI 애플리케이션 구축 가능

벡터 처리 속도 스노우플레이크 대비 30배, 구글 빅쿼리 대비 18배, 데이터브릭스 대비 15배 빨라

대한민국—2024년 7월 2일
Gen AI

오라클이 업계 최초 인-데이터베이스(in-database) 거대언어모델(LLM), 자동화된 인-데이터베이스 벡터 저장소, 확장 벡터 처리 및 비정형 콘텐츠 기반의 맥락화 된 자연어 대화 기능을 제공하는 히트웨이브 생성형AI(HeatWave GenAI)를 발표했다. 히트웨이브 생성형 AI는 AI 전문가가 아니더라도 별도 벡터 데이터베이스로의 데이터 이동 없이 생성형 AI의 효과를 엔터프라이즈 데이터에 구현할 수 있도록 지원한다. 히트웨이브 생성형AI는 히트웨이브 고객이라면 OCI 리전과 OCI 전용 리전(OCI Dedicated Region) 및 여타 주요 클라우드 서비스 전반에서 추가 비용 없이 즉시 이용 가능하다.

히트웨이브 생성형AI는 개발자가 내장형 임베딩 모델을 사용해 단일 SQL 명령어로 기업의 비정형 콘텐츠를 위한 벡터 저장소를 생성할 수 있게 해 준다. 사용자는 인-데이터베이스 LLM, 혹은 외부 LLM을 사용해 단일 동작으로 자연어 검색을 수행할 수 있다. 데이터는 데이터베이스 내에서 안전하게 유지되며, 히트웨이브의 뛰어난 확장성과 성능 덕분에 GPU를 프로비저닝할 필요도 없다. 개발자들은 결과적으로 애플리케이션의 복잡성을 최소화하는 동시에 성능 및 데이터 보안을 강화하고, 비용을 절감할 수 있다.

에드워드 스크리븐(Edward Screven) 오라클 최고기업아키텍트는 “히트웨이브 생성형AI는 히트웨이브 레이크하우스 (HeatWave Lakehouse), 히트웨이브 오토파일럿(HeatWave Autopilot), 히트웨이브 오토ML (HeatWave AutoML), 히트웨이브 마이SQL(HeatWave MySQL) 등 기존 내장형 히트웨이브 기술군에 새롭게 추가됐다. 이로써 히트웨이브 기술의 혁신은 놀라운 속도로 이어지고 있다.”며, “오늘날의 통합 및 자동화된 AI 기능은 개발자가 데이터를 이전하거나 AI 전문성을 확보하지 않고도 풍부한 생성형 AI 애플리케이션을 더욱 빠르게 구축할 수 있게 해 준다. 히트웨이브 사용자들은 이제 직관적인 방식으로 기업 데이터를 활용하여 비즈니스에 필요한 정확한 답변을 신속하게 얻을 수 있다.”고 말했다.

스마터D(SmarterD)의 비제이 선다(Vijay Sundhar) 최고경영자는 “히트웨이브 생성형AI 덕분에 생성형 AI의 활용이 엄청나게 쉬워졌다.”라면서 “인-데이터베이스 LLM 과 인-데이터베이스 벡터 생성 기능 덕분에 애플리케이션 복잡성이 크게 줄었고, 추론(inference) 작업 시 지연은 예측 범위내로 관리가 가능하며, 무엇보다 LLM을 활용하고 임베딩을 생성하는 데 추가 비용이 들지 않는다. 오라클이 생성형 AI의 대중화를 진정으로 이루었다고 생각한다. 앞으로 히트웨이브 생성형AI는 보다 풍성한 애플리케이션 구축 및 고객의 생산성 향상에 큰 도움이 될 것이다.”라고 말했다.

새롭게 소개된 자동화 및 내장형 생성형 AI 기능은 아래와 같다.

  • 인-데이터베이스 LLM은 생성형 AI 애플리케이션의 개발을 간소화하고, 개발 비용을 절감한다. 고객은 외부 LLM 선정 및 통합의 복잡성 없이도 생성형 AI의 이점을 누릴 수 있고, 다양한 클라우드 제공업체 데이터센터의 LLM 가용성에 대해 걱정할 필요도 없다. 인-데이터베이스 LLM은 고객이 히트웨이브 벡터 저장소(HeatWave Vector Store)를 활용해 데이터 검색, 콘텐츠 생성 및 요약, 검색증강생성(RAG) 등을 수행할 수 있게 해 준다. 또한 고객은 오토ML과 같은 기타 내장형 히트웨이브 기능을 생성형 AI와 결합해 보다 풍성한 애플리케이션을 구축할 수 있다. 히트웨이브 생성형AI는 OCI 생성형 AI 서비스(OCI Generative AI Service)에도 통합되어 있으므로, 고객은 최고의 LLM 제공업체들이 제공하는 사전 훈련된 기본 모델을 활용할 수 있다.
  • 자동화된 인-데이터베이스 벡터 저장소는 고객이 데이터를 별도의 벡터 데이터베이스로 이동하거나, AI 전문성을 갖추지 않고도 생성형 AI를 자사의 비즈니스 문서와 함께 사용할 수 있도록 지원한다. 객체 저장소에서의 문서 검색, 파싱(parsing), 고도로 병렬화 되고 최적화된 임베딩 생성, 벡터 저장소에 대한 임베딩 삽입 등 벡터 저장소 및 벡터 임베딩 생성을 위한 모든 과정이 자동화되어 있으며, 데이터베이스 내에서 수행되므로 히트웨이브 벡터 저장소의 효율성과 쉬운 활용을 보장한다. RAG용 벡터 저장소는 이 모델들이 보다 정확하고 유관한 답변 제공을 위해 적절한 맥락을 바탕으로 전문 데이터를 검색할 수 있도록 하여 LLM의 환각 문제 해결에도 도움을 준다.
  • 확장 벡터 처리는 일정한 정확도를 유지하면서 신속한 의미 검색 결과를 제공한다. 히트웨이브는 새로운 네이티브 벡터 데이터 유형 및 거리 함수의 최적화된 구현을 지원하여 고객이 표준 SQL을 통해 의미 쿼리를 수행할 수 있도록 한다. 인-메모리 하이브리드 열 형식 표현 및 히트웨이브의 확장 아키텍처는 벡터 처리가 니어 메모리 대역폭에서 실행되고, 최대 512 히트웨이브 노드에서 병렬화 될 수 있게 한다. 그 결과 고객의 질문에 대한 답을 신속히 제공할 수 있게 된다. 또한 사용자는 의미 검색과 기타 SQL 연산자를 결합하여 여러 테이블을 다양한 문서로 조인하고, 모든 문서 전반에서 유사성 검색을 수행할 수 있다.
  • 히트웨이브 챗(HeatWave Chat)은 마이SQL 쉘(MySQL Shell)용 비주얼 코드 플러그인으로 히트웨이브 생성형AI를 위한 그래픽 인터페이스를 제공하며, 개발자들이 자연어 또는 SQL로 질문을 할 수 있게 지원한다. 이 통합 레이크하우스 네비게이터(Lakehouse Navigator)는 사용자가 객체 스토리지로부터 파일을 선택하고 벡터 저장소를 생성할 수 있도록 지원한다. 사용자는 데이터베이스 전반에서 검색을 수행하거나, 검색 영역을 폴더로 제한할 수도 있다. 히트웨이브는 질문 내역, 소스 문서 인용 및 LLM 프롬프트를 바탕으로 컨텍스트를 유지 관리한다. 이는 상황별 대화를 용이하게 하고, 사용자가 LLM이 생성한 답변의 출처를 검증할 수 있게 해 준다. 컨텍스트는 히트웨이브에서 유지 관리되며, 히트웨이브를 사용하는 모든 애플리케이션에서 사용 가능하다.

벡터 저장소 생성 및 벡터 처리 벤치마크

히트웨이브 생성형AI는 아마존 베드록(Amazon Bedrock)의 지식 기반을 사용할 때보다 PDF, PPT, WORD, HTML 형식 문서용 벡터 저장소 생성 속도는 23배 빠르며, 비용은 1/4 수준으로 저렴하다.

1.6GB에서 300GB 크기의 테이블에서 다양한 유사성 검색 쿼리를 사용해 이루어진 서드파티 벤치마크를 통해 입증된 바와 같이, 히트웨이브 생성형AI는 스노우플레이크 대비 30배 빠른 속도와 25% 저렴한 비용, 데이터브릭스 대비 15배 빠른 속도와 85% 저렴한 비용, 구글 빅쿼리 대비 18배 빠른 속도와 60% 저렴한 비용을 자랑한다.

별도의 벤치마크에 따르면, pg벡터(pgvector)를 사용하는 아마존 오로라 포스트그레SQL (Amazon Aurora PostgreSQL)의 벡터 인덱스는 정확도가 떨어져 오답을 산출할 가능성이 있는 것으로 나타났다. 반면 히트웨이브의 유사성 검색 처리는 항상 정확한 결과를 제공하고, 예측 범위 내의 응답 시간을 보장했으며, 유사한 메모리 속도로 수행되어 동일한 수의 코어를 사용하는 오로라(Aurora) 대비 10배-80배 빠른 속도를 제공한다.

AMD의 댄 맥나마라(Dan McNamara) 수석 부사장 겸 총괄 관리자는 “오라클과의 강력한 협업을 바탕으로 히트웨이브 생성형AI를 통해 핵심 엔터프라이즈 워크로드 및 데이터 세트에 AI의 파워와 생산성을 계속 제공할 수 있어 기쁘다.”라면서 “AMD와 오라클이 공동으로 수행하는 엔지니어링 작업은 개발자들이 AMD EPYC 프로세스의 코어 밀도와 탁월한 가격 대비 성능을 기반으로 하는 히트웨이브 생성형AI를 사용해 혁신적인 AI 솔루션을 설계할 수 있게 지원한다.”라고 설명했다.

히트웨이브 생성형AI에 대한 고객 및 전문가 의견

잇이지(EatEasy)의 사파라스 샤피(Safarath Shafi) 최고경영자는 “잇이지는 고객에게 다양한 추천 메뉴를 제공하기 위해 인-데이터베이스 히트웨이브 오토ML을 자주 활용한다.”라면서 “히트웨이브는 인-데이터베이스 LLM과 인-데이터베이스 벡터 저장소를 지원하여 이 제품을 차별화하며, 생성형 AI와 오토ML의 통합 역량은 업계에서 히트웨이브의 출중함을 한층 더 부각시킨다. 히트웨이브를 활용하여 고객에게 새로운 가능성을 제공할 수 있게 되었다. 오토ML과의 시너지 역시 LLM 결과의 성능과 품질을 높여 준다.”라고 덧붙였다.

에이아이와이파이(Aiwifi)의 창업자인 에릭 아길라(Eric Aguilar)는 “히트웨이브 인-데이터베이스 벡터 저장소, 확장 인-메모리 벡터 처리 및 히트웨이브 챗은 오라클이 제공하는 대단히 차별화된 기능들이다. 오라클은 이 기술을 대단히 간편하고, 안전하고, 저렴하게 사용할 수 있게 해 생성형 AI에 대한 접근성을 높여 주었다.”라며, “히트웨이브와 오토ML을 기업의 요구 사항에 맞춰 사용하면서 여러 방면으로 비즈니스를 개선할 수 있었다. 오라클이 제공하는 이와 같은 혁신 기능은 놀라운 수준의 애플리케이션 성장을 가속화할 것이다. 고객은 이를 통해 자사의 엔터프라이즈 콘텐츠에 생성형 AI를 활용할 방안을 모색하게 될 것이다.”라고 말했다.

컨스텔레이션 리서치(Constellation Research)의 홀거 뮐러(Holger Mueller) 부사장 겸 수석 분석가는 “히트웨이브의 엔지니어링 혁신은 범용 클라우드 데이터베이스의 비전을 지속적으로 실현하고 있다.”며 “최신 버전은 자동화된 데이터베이스 내 벡터 스토어와 데이터베이스 내 LLM을 히트웨이브 코어에 직접 통합하는 등 '히트웨이브 방식'으로 구현된 생성형AI이다. 이를 통해 개발자는 히트웨이브 요소를 결합하여 새로운 클래스의 애플리케이션을 만들 수 있다. 예를 들어, 의심스러운 거래를 탐지할 뿐만 아니라 이해하기 쉬운 설명까지 제공하는 사기 탐지 애플리케이션에 히트웨이브 오토ML과 히트웨이브 생성형AI를 결합할 수 있다. 이 모든 것이 데이터베이스 내에서 실행되기 때문에 데이터를 외부 벡터 데이터베이스로 옮길 필요가 없어 데이터를 더욱 안전하게 보호할 수 있다. 또한 경쟁사 벤치마크에서 입증된 바와 같이 적은 비용으로 뛰어난 성능을 발휘한다.”라고 설명했다.

히트웨이브 소개

히트웨이브는 트랜잭션 및 레이크하우스 규모 분석을 위해 자동화 및 통합된 생성형 AI와 머신러닝을 하나의 제품을 통해 제공하는 유일한 클라우드 서비스다. 오라클 분산형 클라우드 전략의 핵심 구성 요소인 히트웨이브는 OCI와 아마존웹서비스에서 네이티브 방식으로 활용할 수 있으며, 마이크로소프트 애저(Microsoft Azure)에서는 애저용 오라클 인터커넥트(Oracle Interconnect for Azure)를 통해, 고객의 데이터 센터에서는 OCI 전용 리전 및 OCI 알로이(OCI Alloy)를 통해 사용할 수 있다.

추가 자료

문의처

백영훈 상무

한국오라클

오주연 실장 / 유지우 대리

한국오라클 홍보 담당 이오스커뮤니케이션스

오라클 소개

오라클은 완전한 통합 애플리케이션 제품군과 보안 역량, 자율운영 기술 기반의 오라클 클라우드 인프라스트럭처를 제공한다. 오라클(NYSE: ORCL)에 관한 자세한 정보는 oracle.com 에서 확인 가능하다.

상표

Oracle, Java, MySQL및 NetSuite는 Oracle Corporation의 등록된 상표이다. NetSuite는 클라우드 컴퓨팅의 새로운 시대를 개척한 최초의 클라우드 회사다.