Analytics Platform Capabilities Explorer

데이터 준비

준비 및 보강 기능을 활용하여 비즈니스 사용자가 소스 시스템으로부터 수집한 미가공 데이터 세트를 분석 스토리를 지원할 수 있는 데이터로 변환할 수 있습니다.

데이터 준비 및 보강

소스 시스템의 데이터에는 비즈니스 분석을 위한 처리가 되어있지 않은 경우가 많습니다. 비즈니스 사용자는 자사의 데이터 집합을 변환하고 보강하여 데이터 보고 관련 니즈에 부합하는 모든 계산, 차원 및 기타 관련 데이터를 생성해야 합니다. 이 프로세스는 비즈니스 사용자가 데이터 분석을 시작하기 전 반드시 수행해야 하는, 데이터 준비의 라스트 마일(last mile)입니다. 사용자들은 일반적으로 데이터 내보내기를 통해 라스트 마일 프로세스를 시작하고, 스프레드시트를 사용하여 마무리짓습니다. 그러나 스프레드시트는 안전하지 않으며 인적 오류 발생 가능성이 높은 방식입니다. 그러므로 사용자는 필요한 모든 라스트 마일 데이터 준비 및 보강 작업을 수행할 수 있는 안전한 단일 플랫폼을 사용해야 합니다. 해당 플랫폼은 추적 및 스케줄링 기능을 제공하고, 특정 작업자에 대한 의존, 또는 체계적인 관리가 이루어지지 않는 임의의 스프레드시트 기반 프로세스를 대체할 수 있습니다.

자동화된 데이터 프로파일링 및 추천

Quality Insights 기능은 파일에서 데이터를 가져오는 경우에도, 기존 소스에 연결하는 경우에도 일괄적으로 분석용 데이터 준비를 가속화시켜 줍니다. Quality Insights는 Oracle Analytics의 시맨틱 프로파일러 기능을 사용하여 데이터의 품질을 시각적으로 표현함으로써 문제를 신속히 파악할 수 있도록 지원합니다. null 값, 데이터 유형 불일치, 시맨틱 유형 분류에 기반한 관련 지표들이 사용됩니다. 각 데이터 열에는 표시된 데이터의 분포를 보여주는 맥락 기반 시각 자료가 함께 표시됩니다. 인라인 편집 기능을 통해 발생한 문제를 신속하게 해결하고, 열 이름을 직접 변경하고, 스크롤 가능한 미니맵을 통해 긴 목록을 간편하게 탐색할 수 있습니다.

그림 1: Quality Insights 기능의 시각적 개요

내장된 데이터 흐름

Oracle Analytics는 별도의 프로그래밍을 거칠 필요 없이 데이터세트를 분석에 필요한 정보로 변환할 수 있는 데이터 흐름 작성 기능을 기본 제공합니다. 클라우드, 온프레미스, 개인 추출 데이터 등 다양한 데이터 소스를 단일 주제 영역에 모두 연결할 수 있습니다. 머신러닝 모델의 학습 및 실행을 포함한 다양한 데이터 변환 기능을 통해 데이터를 강화합니다. 변환 완료된 데이터는 Oracle Analytics 스토리지, 연결된 RDBMS, Oracle Essbase 등에 저장 가능합니다. 데이터 흐름의 구축 및 테스트가 완료되면 다른 사용자와 공유할 수도 있고, 정기적인 실행 일정을 수립할 수도 있습니다.

그림 2: 데이터 흐름 구축하기
그림 3: Data Set Editor에서 Regex 사용하기(2:48)

커스텀 계산 및 정규표현식

데이터세트에 새로운 열을 추가하여 계산을 생성할 수 있습니다. 비즈니스 사용자는 간단한 끌어다 놓기 기능과 Excel과 유사한 공식을 사용하여 필요한 모든 메트릭이 포함된 정교한 데이터세트를 작성할 수 있습니다. 보다 복잡한 변환을 위한 커스텀 로직이 필요한 경우 Oracle Analytics 사용자는 데이터 준비 편집기 또는 데이터세트 편집기를 사용하여 열 텍스트의 패턴을 일치시킴으로써 정규표현식(Regex)의 모든 잠재력을 활용할 수 있습니다.