El aprendizaje exhaustivo es un subgrupo del aprendizaje automático (machine learning, ML), donde las redes neuronales artificiales (algoritmos modelados para funcionar como el cerebro humano) aprenden de grandes cantidades de datos.
El aprendizaje profundo se basa en capas de las redes neuronales, que son algoritmos vagamente modelados de la forma en que funciona el cerebro humano. El entrenamiento con grandes cantidades de datos es lo que configura las neuronas en la red neuronal. El resultado es un modelo de aprendizaje profundo que, una vez entrenado, procesa nuevos datos. Los modelos de aprendizaje exhaustivo recogen información de varios orígenes de datos y analizan esos datos en tiempo real, sin necesidad de intervención humana. En el aprendizaje profundo, las unidades de procesamiento gráfico (graphics processing units, GPU) están optimizadas para entrenar modelos, ya que pueden procesar varios cálculos a la vez.
El aprendizaje profundo es lo que impulsa muchas tecnologías de inteligencia artificial (IA) que pueden mejorar la automatización y las tareas analíticas. La mayoría de las personas se encuentran con el aprendizaje profundo todos los días cuando navegan por Internet o utilizan sus teléfonos móviles. Entre otras innumerables aplicaciones, el aprendizaje profundo se utiliza para generar subtítulos para videos de YouTube, reconocer el habla en teléfonos y altavoces inteligentes, proporcionar el reconocimiento facial para las fotografías y habilitar vehículos autónomos. Ya que los científicos de datos y los investigadores afrontan proyectos de aprendizaje profundo cada vez más complejos (aprovechando los marcos del aprendizaje profundo) este tipo de inteligencia artificial se convertirá en una parte más importante de nuestra vida diaria.
En términos sencillos, el aprendizaje profundo es un nombre para las redes neuronales con muchas capas.
Para comprender los datos observacionales, como fotos o audio, las redes neuronales transfieren datos a través de capas de nodos interconectadas. Cuando la información pasa a través de una capa, cada nodo de esa capa realiza operaciones sencillas en los datos y transfiere los resultados a otros nodos de forma selectiva. Cada capa posterior se centra en una función de un nivel superior a la anterior hasta que la red crea la salida.
Entre la capa de entrada y la capa de salida hay capas ocultas. Aquí es donde se distinguen las redes neuronales y el aprendizaje profundo: una red neuronal básica puede tener una o dos capas ocultas, mientras que una red de aprendizaje profundo puede tener decenas o incluso cientos de capas. El aumento del número de capas y nodos diferentes puede aumentar la precisión de una red. Sin embargo, más capas también pueden significar que un modelo necesitará más parámetros y recursos de cálculo.
El aprendizaje profundo clasifica la información a través de capas de redes neuronales, que tienen un conjunto de entradas que reciben datos en bruto. Por ejemplo, si una red neuronal está entrenada con imágenes de aves, puede usarse para reconocer imágenes de aves. Con más capas se obtienen resultados más precisos, tales como distinguir un cuervo común de uno americano en comparación con distinguir un cuervo de una gallina. Las redes neuronales profundas, que están detrás de los algoritmos de aprendizaje profundo, tienen varias capas ocultas entre los nodos de entrada y salida, lo que significa que son capaces clasificar datos más complejos. Un algoritmo de aprendizaje profundo debe ser entrenado con grandes conjuntos de datos, y cuanto más datos reciba, más preciso será; tendrá que recibir miles de imágenes de aves antes de poder clasificar imágenes de aves nuevas con precisión.
Cuando se trata de las redes neuronales, entrenar el modelo de aprendizaje profundo exige muchos recursos. Aquí es cuando la red neuronal ingiere entradas, que se procesan en capas ocultas usando pesos (parámetros que representan la resistencia de la conexión entre las entradas) que se ajustan durante el entrenamiento y, entonces, el modelo da como resultado una predicción. Las ponderaciones se ajustan en función de los insumos de entrenamiento para mejorar las predicciones. Los modelos de aprendizaje profundo dedican mucho tiempo a entrenar grandes cantidades de datos, por lo que los recursos informáticos de alto rendimiento son muy importantes.
Las GPU se optimizan para los cálculos de datos y están diseñadas para un rendimiento rápido de los cálculos matriciales a gran escala. Las GPU se adaptan mejor a la ejecución en paralelo del aprendizaje automático (machine learning, ML) a gran escala y los problemas de aprendizaje profundo. De esta manera, las aplicaciones de ML que realizan un gran número de cálculos con grandes cantidades de datos estructurados o no estructurados (como imágenes, texto y video) ofrecen un buen rendimiento.
Uno de los principales beneficios del aprendizaje profundo es que sus redes neuronales se utilizan para revelar estadísticas y relaciones ocultas a partir de datos que anteriormente no eran visibles. Con modelos de aprendizaje automático más robustos que pueden analizar datos grandes y complejos, las empresas pueden mejorar la detección de fraudes, la gestión de la cadena de suministro y la ciberseguridad mediante el uso de lo siguiente:
Los algoritmos de aprendizaje profundo pueden entrenarse para examinar datos de texto mediante el análisis de publicaciones en medios sociales, noticias y encuestas para brindar estadísticas valiosas de negocios y clientes.
El aprendizaje profundo requiere datos etiquetados para el entrenamiento. Una vez entrenado, puede etiquetar nuevos datos e identificar distintos tipos de datos por sí mismo.
Un algoritmo de aprendizaje profundo puede ahorrar tiempo porque no necesita que los humanos extraigan funciones de los datos en bruto manualmente.
Cuando un algoritmo de aprendizaje profundo se entrena correctamente, puede realizar miles de tareas una y otra vez, más rápido que los humanos.
Las redes neuronales utilizadas en el aprendizaje profundo tienen la capacidad de adaptarse a muchos tipos de datos y aplicaciones diferentes. Además, un modelo de aprendizaje profundo puede adaptarse si se lo vuelve a entrenar con datos nuevos.
La IA, el aprendizaje automático y el aprendizaje profundo están relacionados, pero tienen distintas funciones:
La inteligencia artificial permite a las computadoras, las máquinas o los robots imitar las capacidades de un ser humano, como la toma de decisiones, el reconocimiento de objetos, la solución de problemas y la comprensión del lenguaje.
El aprendizaje automático es un subgrupo de la IA que se centra en la creación de aplicaciones que puedan aprender de los datos para mejorar su precisión a lo largo del tiempo, sin intervención humana. Los algoritmos de aprendizaje automático se pueden entrenar para encontrar patrones que permitan tomar mejores decisiones y predicciones, pero esto suele requerir la intervención humana.
El aprendizaje profundo es un subgrupo del aprendizaje automático que permite que las computadoras resuelvan problemas más complejos. Los modelos de aprendizaje profundo también pueden crear nuevas funciones por sí solos.
El aprendizaje profundo se puede utilizar para analizar un gran número de imágenes, lo que puede ayudar a las redes sociales a obtener más información sobre sus usuarios. Esto mejora anuncios específicos y permite ofrecer sugerencias de usuarios a seguir.
Las redes neuronales en el aprendizaje profundo se pueden utilizar para predecir valores de acciones y desarrollar estrategias comerciales, pero también pueden detectar amenazas de seguridad y brindar protección contra el fraude.
El aprendizaje profundo puede desempeñar un papel fundamental en el campo de la salud mediante el análisis de tendencias y comportamientos para predecir enfermedades en los pacientes. Los profesionales de atención sanitaria también pueden emplear algoritmos de aprendizaje profundo para decidir las pruebas y tratamientos óptimos para sus pacientes.
El aprendizaje profundo puede detectar amenazas avanzadas mejor que las soluciones de malware tradicionales al reconocer actividades nuevas y sospechosas en lugar de responder a una base de datos de amenazas conocidas.
Los asistentes digitales representan algunos de los ejemplos más comunes del aprendizaje profundo. Con la ayuda del procesamiento de lenguaje natural (natural language processing, NLP), Siri, Cortana, Google y Alexa pueden responder a preguntas y adaptarse a los hábitos de los usuarios.
Si bien se están descubriendo nuevos usos para el aprendizaje profundo, sigue siendo un campo en evolución con ciertas limitaciones:
Para obtener respuestas más detalladas y abstractas, el aprendizaje profundo requiere entrenar grandes cantidades de datos. Al igual que un cerebro humano, un algoritmo de aprendizaje profundo necesita ejemplos para poder aprender de los errores y mejorar su resultado.
Las máquinas siguen aprendiendo de formas muy estrechas, lo que puede causar errores. Las redes de aprendizaje profundo necesitan datos para resolver un problema específico. Si se le pide que realice una tarea fuera de ese ámbito, es probable que falle.
Aunque se desplazan por millones de puntos de datos para encontrar patrones, puede ser difícil comprender cómo una red neuronal encuentra su solución. Esta falta de transparencia en la forma en que procesan los datos dificulta la identificación de sesgos no deseados y la explicación de predicciones.
A pesar de estos obstáculos, los científicos de datos están cada vez más cerca de la creación de modelos de aprendizaje profundo altamente precisos que puedan aprender sin supervisión, lo que hará que el aprendizaje profundo sea más rápido y menos laborioso.
Debido a la explosión de los datos empresariales, los científicos de datos necesitan contar con la capacidad de explorar y crear modelos de aprendizaje profundo con rapidez y con una mayor flexibilidad que la ofrecida por el hardware de TI local tradicional.
Oracle Cloud Infrastructure (OCI) ofrece los recursos informáticos de mejor precio y rendimiento para cargas de trabajo de uso intensivo de datos, un almacenamiento rápido en la nube y redes de baja latencia y alto rendimiento con acceso remoto directo a memoria (remote direct memory access, RDMA) de 100 Gbps. Oracle Cloud también proporciona instancias informáticas de GPU para el aprendizaje profundo, las imágenes fáciles de implementar y la flexibilidad de ejecutar una estación de trabajo con una sola GPU o un cluster de muchas formas de GPU.
Para crear, entrenar e implementar modelos de aprendizaje automático en una infraestructura en la nube de alto rendimiento, pruebe Oracle Cloud Infrastructure Data Science. Los científicos de datos pueden crear y entrenar modelos de aprendizaje profundo en mucho menos tiempo usando GPU NVIDIA en sesiones de notebook. También pueden elegir la cantidad de recursos informáticos y de almacenamiento que necesitan para abordar proyectos de cualquier tamaño sin preocuparse por el aprovisionamiento o el mantenimiento de la infraestructura. Además, OCI Data Science acelera la creación de modelos al simplificar las tareas de ciencia de datos, como el acceso a los datos, la selección de algoritmos y la explicación de los modelos.