Barry Mostert | Director sénior de marketing de productos, Oracle Analytics | 31 de enero de 2023
La analítica y el aprendizaje automático (ML) han existido durante décadas, pero el uso de este último fue limitado debido a los desafíos asociados con él. El aprendizaje automático era intensivo en procesadores y requería habilidades y herramientas especializadas que no estaban ampliamente disponibles. Sin embargo, la llegada de la computación en la nube hizo que fuera más barato y más fácil para muchas más organizaciones acceder a la escala de potencia informática necesaria para ejecutar el aprendizaje automático. Y las potentes capacidades de procesamiento de nuestros teléfonos inteligentes y computadoras portátiles permitieron a casi cualquier persona acceder y utilizar la analítica con aprendizaje automático y tomar decisiones mejor informadas y basadas en datos.
La analítica es el proceso de descubrimiento, interpretación y comunicación de patrones importantes en los datos. La analítica ayuda a generar insights significativos a partir de una variedad de orígenes de datos. El análisis empresarial se centra en el uso de insights derivados de los datos para tomar decisiones más informadas que conduzcan a un aumento de las ventas, una reducción de la rotación del personal, rutas de entrega optimizadas y otras mejoras empresariales que ayuden a las organizaciones a tener éxito.
El aprendizaje automático es una aplicación de la inteligencia artificial (IA) que permite a las computadoras aprender y mejorar automáticamente mediante la experiencia sin ser programadas explícitamente. El aprendizaje automático depende de que las personas desarrollen modelos que accedan a los datos y los utilicen para aprender por sí mismas y luego hagan inferencias, recomendaciones y predicciones. El proceso de entrenamiento de estos modelos comienza con la alimentación de volúmenes enormes de observaciones o datos históricos, lo que crea la necesidad de recursos informáticos con procesadores para uso intensivo. A continuación, se aplican modelos entrenados a nuevos conjuntos de datos para descubrir y presentar insights basados en datos.
El aprendizaje automático para analítica es el proceso de usar algoritmos de aprendizaje automático para ayudar al proceso analítico de evaluación de datos y detección de información, con el propósito de tomar decisiones que mejoren los resultados empresariales.
El aprendizaje automático en analítica ayuda a los analistas de dos maneras:
La analítica sin aprendizaje automático depende de los analistas humanos para llevar a cabo los análisis, encontrar información y hacer recomendaciones basadas en sus interpretaciones. Los resultados dependen en gran medida de las experiencias y opiniones profesionales del analista.
El uso del aprendizaje automático con analítica mejora el proceso de análisis de dos formas principales:
El uso de ML en analítica no es un requisito y solo se debe utilizar cuando corresponda. Un correcto mejoramiento de la analítica con el aprendizaje automático mejora los procesos de decisión existentes. Por ejemplo, cuando se trabaja con un nuevo conjunto de datos, el aprendizaje automático se puede utilizar para analizar automáticamente los datos y proporcionar información derivada de los datos como narrativas y visualizaciones textuales.
Las buenas plataformas de analítica proporcionan capacidades de aprendizaje automático para todos los niveles de usuarios, desde usuarios avanzados que conocen los algoritmos utilizados comúnmente y cómo ajustarlos, hasta personas que desean una experiencia simple y sin código para aplicar el aprendizaje automático a sus conjuntos de datos.
Los usuarios con poca o ninguna experiencia en aprendizaje automático pueden agregar cálculos avanzados, como previsiones (análisis predictivo), clusters, líneas de referencia y líneas de tendencia, a sus proyectos de visualización con un solo clic. Este método utiliza algoritmos genéricos y es útil para resaltar posibles anomalías en los datos que pueden requerir más investigación.
El siguiente ejemplo es un gráfico sencillo que muestra los ingresos a lo largo del tiempo con el pronóstico generado automáticamente sombreado en gris. La supervisión de los ingresos futuros previstos es fácil, y el patrón futuro previsto en este caso se alinea con las expectativas; no se observan anomalías.
Roles típicos que utilizan análisis avanzados:
usuarios profesionales sin experiencia en codificación
Es posible que los analistas empresariales no sepan por dónde empezar al crear nuevas historias visuales con datos desconocidos. Este escenario significa que el analista vuelve a su experiencia profesional para guiar el proceso de construcción de sus análisis. Sin embargo, este enfoque puede introducir sesgos humanos y llevar a resultados inexactos. Un mejor enfoque es permitir que el aprendizaje automático evalúe primero todos los datos y luego resalte los hallazgos visualmente con narrativas descriptivas. Luego, el analista inicia sus trabajo en función de lo que los datos le están diciendo.
En el siguiente ejemplo, se analiza un nuevo conjunto de datos mediante la capacidad de aprendizaje automático incorporada, los insights automáticos, que encontraron varios patrones y tendencias en los datos que el analista puede no haber considerado nunca. Con un solo clic, se agregan las conclusiones al canvas del libro de trabajo. Esto respalda un enfoque basado en análisis para la narración de historias de datos y presenta información que, de otro modo, podría haberse perdido.
Roles típicos que utilizan insights automatizados:
usuarios profesionales, científicos de datos ciudadanos
Los usuarios que están familiarizados con los diferentes tipos de algoritmos de aprendizaje automático y sus datos pueden utilizar flujos de datos de tipo clic y arrastrar para crear, ajustar, probar y publicar modelos de aprendizaje automático personalizados para impulsar sus análisis predictivos, sin tener que codificar. Estos modelos de aprendizaje automático diseñados específicamente crean predicciones más precisas para un caso de uso específico que sus homólogos genéricos.
El primer paso es entrenar y probar el modelo de aprendizaje automático. Para ello, el usuario conecta un origen de datos histórico con resultados conocidos, elige el algoritmo de aprendizaje automático adecuado y define los parámetros para este caso de uso concreto. El modelo se prueba con nuevos datos para determinar la precisión. Si las predicciones del modelo son aceptables, el modelo se puede publicar a una audiencia más amplia. Los modelos publicados pueden ser ejecutados por cualquier usuario en nuevos juegos de datos. Este método de creación y prueba centralizada garantiza que las personas con la formación y experiencia adecuadas estén creando modelos de confianza. También proporciona un fácil acceso para la mayoría de los usuarios al eliminar la dependencia de TI para ejecutar los modelos en su nombre.
Roles típicos que entrenan modelos de aprendizaje automático sin código:
científicos de datos ciudadanos y usuarios avanzados
Hay muchos tipos diferentes de aprendizaje automático, por lo que es imposible que las plataformas de análisis incluyan todo. En su lugar, las plataformas de analítica extensibles permiten la integración con otros servicios de IA, lo que amplía las ofertas de aprendizaje automático disponibles para los usuarios. Es posible que los usuarios de la plataforma de analítica ni siquiera se den cuenta de que están utilizando un servicio independiente que proporciona esa funcionalidad.
Por ejemplo, si la clasificación de imágenes aún no está integrada en la plataforma de analítica, se puede integrar en las soluciones de análisis para que los usuarios puedan proporcionar nuevos juegos de datos, hacer que el servicio ampliado los procese y, a continuación, que los resultados se presenten en su panel de control. En el ejemplo se muestran las imágenes que ha clasificado Oracle Cloud Infrastructure (OCI) Vision con los resultados que se presentan a continuación en Oracle Analytics Cloud.
Roles típicos que integran servicios de ciencia de datos:
científicos de datos, científicos de datos ciudadanos, especialistas en aplicaciones de TI
Las aplicaciones de analítica se construyen para funciones empresariales, como Oracle Analytics for HCM o Analytics for ERP. Estas aplicaciones utilizan los métodos de aprendizaje automático descritos anteriormente, pero proporcionan modelos de ML predefinidos para casos de uso específicos. Por ejemplo, una aplicación de análisis de ERP podría proporcionar aprendizaje automático listo para usar en la predicción de pagos a tiempo o la detección de anomalías en los gastos, mientras que una aplicación de analítica de HCM podría proporcionar modelos, como la predicción de la rotación de empleados.
Roles de usuario típicos:
usuarios de negocio departamentales, analistas de negocio
El aprendizaje automático integrado en la analítica es una potente capacidad para aumentar el proceso de análisis que evolucionó rápidamente con la computación en la nube. Puede proporcionar análisis predictivos e identificar patrones, tendencias y correlaciones en datos que de otro modo pasarían desapercibidos. Los modelos de aprendizaje automático también ayudan a reducir el sesgo no deseado y permiten a las partes interesadas tomar decisiones mejores y más informadas. Las buenas plataformas de análisis proporcionan capacidades de aprendizaje automático para todos los niveles de usuarios, lo que facilita el uso del aprendizaje automático en sus análisis, independientemente de su capacidad técnica.
Con las plataformas de analítica modernas, comenzar tu viaje con el aprendizaje automático es más fácil de lo que podrías pensar. El aprendizaje automático no reemplaza tus procesos de análisis actuales, sino que los mejora, recomendando nuevas opciones que pueden conducir a mejores decisiones empresariales.