Jeffrey Erickson | Content Strategist | 2024년 4월 2일
사람의 추론은 증거와 사고에 기반해 결론을 내리는 능력을 의미합니다. 인공지능의 추론은 선별된 데이터 세트를 사용한 고도의 훈련을 거친 AI가 과거에 접한 적이 없는 데이터를 바탕으로 사고하고 결론을 도출하는 능력을 의미합니다.
AI 추론을 이해하는 것은 인공지능의 작동 원리를 이해하기 위한 중요한 단계입니다. 본 문서에서는 AI 시스템이 추론을 통해 결론을 도출하는 단계, 관련 도전 과제, 사용 사례, 미래 전망 등을 살펴봅니다.
AI 추론은 선별된 데이터 세트에서 특정한 패턴을 포착하는 훈련을 거친 AI 모델이 과거 접한 적이 없는 데이터로부터도 해당 패턴을 인식하는 능력입니다. 추론이 가능해진 AI 모델은 인간의 사고 과정을 모방한 방식으로 사고하고 예측할 수 있습니다.
AI 모델은 특정한 작업을 수행하기 위해 신경망(인간의 뇌처럼 구조화된 언어 모델)에서 훈련된 의사 결정 알고리즘으로 구성되어 있습니다. 간단한 예시를 들어 보겠습니다. 데이터 과학자가 AI 모델에 수천 대에서 수백만 대에 달하는 자동차들의 이미지와 그 제조사 및 모델에 대한 정보가 함께 표시된 데이터 세트를 보여줍니다. 잠시 후 알고리즘은 훈련용 데이터 세트에서 자동차를 정확하게 식별해내기 시작합니다. AI 추론은 AI 모델에 무작위 데이터 세트를 보여주고, 해당 AI 모델이 허용 가능한 정확도로 자동차의 제조업체 및 모델을 알아내거나 추론하는 능력을 지칭하는 것입니다. 이러한 방식으로 학습된 AI 모델은 국경 교차로나 교량 톨게이트를 지나는 자동차들의 번호판과 제조사를 즉각적으로 매칭시키는 작업에 사용될 수 있습니다. 또한 유사한 프로세스를 통해 보건의료, 금융, 리테일 등의 다른 여러 분야에서도 정교한 사고 및 예측을 통한 AI 추론 결과물을 도출할 수 있습니다.
핵심 요점
AI 추론은 AI 모델의 수명 주기 가운데 AI 훈련 단계 다음으로 이어지는 단계입니다. AI 모델 훈련은 머신러닝(ML) 알고리즘이 숙제를 하는 것이고, AI 추론은 시험에서 높은 점수를 받는 것이라고 생각하면 좋습니다.
AI 훈련을 위해서는 모델이 특정 주제에 대해 학습할 수 있도록 엄선된 대규모 데이터 세트를 모델에 제시해야 합니다. 훈련 데이터의 역할은 모델이 특정 작업을 수행하도록 가르치는 것이고, 사용할 수 있는 데이터 세트의 종류는 다양합니다. 예를 들어 고양이 또는 다리의 이미지, 고객 서비스 통화 녹음, 의료 영상 등을 사용할 수 있습니다. AI 모델은 라이브 데이터를 분석하고, 패턴을 인식하고, 주어진 데이터 세트를 토대로 다음에 일어날 일에 대해 정확하게 예측할 수 있습니다.
예를 들어 대규모 언어 모델(LLM)은 다음에 나올 단어를 추론해 놀라울 정도로 정확하고 유동적인 문장과 단락을 생성할 수 있습니다.
AI 추론이 중요한 이유는 훈련된 AI 모델이 새로운 데이터를 분석하고 인사이트를 생성하는 방식이기 때문입니다. AI가 실시간으로 예측하거나 작업을 해결할 수 있는 능력을 갖추지 못한다면 교육, 엔지니어링, 의학적 발견, 우주 탐사 등 새로운 분야로 그 역할을 확장하고, 더 많은 산업별 사용 사례에 적용하는 데 어려움을 겪게 될 것입니다.
추론은 모든 AI 프로그램의 핵심입니다. 데이터 세트에서 패턴을 인식하고 정확한 결론 및 예측을 추론해 내는 능력은 AI 모델이 제공할 수 있는 핵심 가치입니다. 즉, 엑스레이를 몇 초 만에 정확하게 판독하거나 수천 또는 수백만 건의 신용카드 거래 중에서 사기 거래를 찾아낼 수 있는 AI 모델에는 충분히 투자할 만한 가치가 있습니다.
대규모 거래의 사기 여부를 가려내기 위한 시스템과 같이 매우 정확한 결정을 거의 실시간으로 내릴 수 있는 AI 시스템이 필요한 상황인가요? 아니면 기계가 고장나기 전 미리 유지보수를 요청하는 센서처럼 과거의 데이터를 기반으로 미래를 예측할 수 있는 AI를 찾고 있나요? AI 추론의 다양한 유형을 이해하면 진행하고자 하는 프로젝트에 가장 적합한 모델을 찾을 수 있습니다.
딥 러닝 훈련과 AI 추론은 AI 모델을 활용해 유용한 결과물을 도출하기 위한 프로세스의 두 가지 구성요소입니다. 딥 러닝 훈련이 먼저 진행됩니다. 이는 AI 모델이 인간의 뇌와 유사한 방식으로 데이터를 처리하도록 훈련하는 방법입니다. 모델은 딥 러닝 훈련을 거치며 데이터로부터 더 깊은 수준의 정보를 인식할 수 있는 능력을 갖추게 됩니다. 예를 들어, 이미지의 모양을 인식하는 것으로부터 한 걸음 더 나아가 이미지로부터 특정한 테마 또는 활동을 인식할 수 있게 됩니다. AI 추론은 훈련을 마친 AI 모델에게 새로운 데이터를 입력하고 특정한 요소를 인식하도록 요청했을 때 모델이 수행하는 작업을 의미합니다.
AI 추론으로 특정 사용 사례에 부합하는 가치를 창출하기 위해서는 많은 프로세스를 필수적으로 따라야 하고, 기술 아키텍처, 모델 복잡성, 데이터 등과 관련된 많은 결정을 반드시 수행해야 합니다.
AI 추론은 대규모 데이터 세트를 사용한 AI 모델 훈련 과정을 연속적으로 수행하는 컴퓨팅 집약적 프로세스의 결과물입니다. 이를 위해서는 여러 데이터 소스를 통합하고, AI 모델의 효율적 실행을 위한 아키텍처를 확보해야 합니다. AI 추론 프로세스를 지원하는 주요 기술은 다음과 같습니다.
AI 모델을 설계 또는 선택한 뒤 훈련하는 것은 시작에 불과합니다. 추론을 수행하기 위해 AI 모델을 배포하는 과정에는 다양한 어려움이 뒤따릅니다. 모델에 양질의 데이터를 제공하는 것, 향후 모델의 결과물을 설명하는 것 등이 그 예입니다. AI 추론 배포와 관련해 유념해야 하는 도전 과제는 다음과 같습니다.
사용 가능한 데이터를 기반으로 결론을 도출하거나 예측을 수행하는 추론 능력을 갖춘 AI 모델은 갈수록 다양한 작업을 수행하고 있습니다. ChatGPT와 같이 널리 사용되는 대규모 언어 모델은 추론을 사용해 단어와 문장을 선택하고 놀라운 언어적 정확도를 선보입니다. 또한 AI는 추론을 사용해 언어적 프롬프트를 기반으로 어떤 그래픽 아트 또는 동영상을 생성할지 판단합니다.
AI 추론은 산업 시스템의 훈련 과정에서도 중요한 부분으로 자리잡고 있습니다. 예를 들어, 빠르게 진행되는 제조 라인에서의 육안 검사에 AI를 사용하면 인간 검사자는 AI가 식별한 결함 또는 이상 징후에만 집중하며 검사 비용을 절감하고 품질 관리를 개선할 수 있습니다. 로봇이 생산 라인에서 인간과 함께 작업하는 산업 시스템에서는 로봇이 물체를 감지하고 세밀한 동작을 수행하는 데 필요한 인식, 예측, 계획 과정에 AI 추론을 사용합니다.
AI 추론이 많이 사용되는 또다른 분야는 로봇 훈련으로서, 완벽한 무인 자동차를 개발하기 위한 그간의 연구 과정을 통해 잘 알려진 방식입니다. Waymo, Tesla, Cruz 등의 기업이 여러 해 동안 진행해 온 훈련을 통해 알 수 있듯이, 로봇 훈련은 신경망이 도로 규칙의 예외를 인식하고 적절하게 반응하는 법을 배우는 과정에서 많은 시행착오를 거칩니다.
또한 AI 추론은 연구자 및 의사에게도 도움을 주고 있습니다. AI 모델은 훈련을 통해 방대한 양의 화학 또는 역학 데이터를 검색해 치료법을 찾아내고, 의료 영상에서 미세한 단서를 읽어내 질병 진단을 지원합니다.
다음 단계의 AI 추론은 대규모 클라우드 또는 데이터센터 환경에서 벗어나 로컬 컴퓨터 및 기기에서도 수행 가능해질 것입니다. 딥 러닝 아키텍처를 사용하는 AI 시스템의 초기 훈련은 앞으로도 대규모 데이터 센터에서 진행되겠지만, 새로운 세대의 기술과 하드웨어는 데이터가 생성되는 곳과 더 가까운 소규모 기기를 사용한 '라스트 마일' AI 추론을 가능케 만들고 있습니다.
결과적으로 추가적인 커스터마이징 및 제어가 가능해질 것입니다. 기기 및 로봇의 사물 감지, 얼굴 및 행동 인식, 예측 기반 의사 결정 능력 등이 향상될 것입니다. 이는 곧 범용 로봇의 기반이 될 수 있습니다. 혁신적인 기업들은 향후 수 년 간 이러한 '에지에서의 추론' 기술을 새로운 시장 및 산업별 다양한 기기에 적용해 나갈 것입니다.
Oracle은 AI 모델의 대규모 훈련 및 배포를 지원하는 전문 서비스 및 컴퓨팅 파워를 제공합니다. 특히 Oracle Cloud Infrastructure(OCI)는 기업인, IT 팀, 데이터 과학자가 협업을 통해 다양한 산업별 AI 추론을 수행할 수 있는 플랫폼입니다.
Oracle의 완전 관리형 AI 플랫폼에서는 Python 및 선호하는 오픈 소스 도구를 사용해 머신러닝 모델을 구축, 훈련, 배포, 모니터링할 수 있습니다. 기업은 차세대 JupyterLab 기반 환경에서 NVIDIA GPU 및 분산 훈련을 활용한 실험, 모델 개발, 훈련 규모 확장 등을 수행할 수 있습니다. 또한 Oracle 고객은 Cohere의 최첨단 LLM에 기반한 생성형 AI 모델에도 간단히 액세스할 수 있습니다.
OCI 고객은 자동화된 파이프라인, 모델 배포, 모델 모니터링 등의 머신러닝 운영 기능을 활용해 모델을 운영 환경으로 전환하고 유지 관리할 수 있습니다. 또한 OCI는 모델 훈련 및 배포 서비스 뿐만 아니라 내장형 ML 모델 및 AI 서비스가 탑재된 다양한 SaaS 애플리케이션을 제공합니다.
Oracle의 AI 모델은 상호 작용시 추론 과정을 표시할 수 있습니다. 추론 과정 표시는 이상 징후 감지, 이미지 인식, AI 생성 텍스트, 또는 그 외의 거의 모든 AI 결과물이 지원하는 요소입니다. 이는 기술적으로 복잡하고, 많은 리소스가 필요한 모델 구축, 훈련, 최적화, 배포라는 긴 프로세스의 결과물로서 인간과 AI 간의 상호 작용의 기반이 되어 줍니다.
조직별 학습을 시작하기 전에 AI 우수 센터를 구축하면 성공 가능성이 높아집니다. 이 e-book에는 그에 대한 이유와, CoE를 효과적으로 구축하기 위한 팁이 담겨 있습니다.
AI 추론의 예시로는 어떤 것들이 있나요?
AI 추론의 좋은 예시로는 금융 거래에서 이상 징후를 감지하고, 맥락을 기반으로 사기 유형을 파악하는 AI 모델을 들 수 있습니다. AI 모델은 파악한 내용을 바탕으로 카드 회사 및 계좌 소유자에게 경고를 발송합니다.
AI 훈련 및 추론이란 무엇인가요?
훈련은 AI 모델이 선별된 데이터 세트로부터 패턴을 파악하고 이해하는 법을 학습하는 단계입니다. 추론은 AI 모델이 선별된 데이터 세트 외부의 데이터로부터 동일한 패턴을 찾아낸 뒤 그에 기반한 예측을 수행할 수 있는 단계입니다.
머신러닝 분야에서의 추론은 무엇을 의미하나요?
추론이란 특정 머신러닝 알고리즘 또는 여러 알고리즘의 집합이 선별된 데이터 세트로부터 패턴을 인식하는 방법을 학습하고, 새로운 데이터로부터도 동일한 패턴을 찾아내는 능력을 의미합니다.
딥 러닝 분야에서의 추론은 무엇을 의미하나요?
딥 러닝은 인간의 두뇌를 모방한 신경망을 사용해 머신러닝 알고리즘을 훈련하는 작업입니다. 딥 러닝을 마친 AI는 자연어 생성을 비롯한 다양한 분야에서 미세하고 추상적인 개념을 인식하고 추론하는 것과 같은 능력을 갖출 수 있습니다.
AI 추론을 에지 기기에서 사용할 수 있나요?
그간의 AI 추론 훈련은 데이터 집약적이고 많은 컴퓨팅 파워를 사용하는 프로세스였습니다. 그러나 AI 추론에 대한 이해도가 높아짐에 따라 대규모 데이터 센터에서 멀리 떨어진 에지에 위치한 저성능 기기로도 AI 추론을 수행할 수 있게 되었습니다. AI 추론이 가능한 에지 기기는 이미지 인식, 음성 인식 등의 기능을 현장 작업에 활용하는 데 도움을 줍니다.
AI 추론과 기존 통계 모델의 차이점은 무엇인가요?
기존의 통계 모델은 단순히 데이터 세트 내 변수 간의 관계를 추론하도록 설계되었습니다. AI 추론은 한 걸음 더 나아가 데이터에 기반한 가장 정확한 예측을 수행할 수 있도록 설계되었습니다.
하이퍼파라미터는 AI 추론 성능에 어떤 영향을 미치나요?
AI 모델을 구축하는 과정에서 데이터 과학자가 매개변수를 수동으로 할당하는 경우가 있습니다. AI 모델의 표준 매개변수와 달리, 이러한 하이퍼파라미터는 모델이 데이터 세트로부터 추론하는 내용에 따라 결정되지 않습니다. 하이퍼파라미터는 AI의 추론 및 예측 성능을 향상시키기 위해 필요할 때마다 조정할 수 있는 이정표와도 같습니다.
기업은 AI 추론 모델의 정확성과 신뢰성을 어떻게 보장할 수 있나요?
정확성과 신뢰성을 보장하기 위한 핵심 요소 중 하나는 추론의 결과물이 누구를 위한 것이고, 어떤 문제를 해결하기 위한 것인지 사전에 명확히 파악하는 것입니다. 원하는 결과물을 구체적이고 측정 가능하도록 만들어야 합니다. 그를 통해 관련 벤치마크를 설정하고 추론 과정에서 시스템 성능을 지속적으로 측정할 수 있습니다.