Deep learning est un sous-ensemble du machine learning (ML), où les réseaux neuronaux artificiels - des algorithmes conçus pour fonctionner comme le cerveau humain - apprennent à partir de grandes quantités de données.
Le deep learning est alimenté par des couches de réseaux neuronaux, qui sont des algorithmes vaguement modelés sur le fonctionnement du cerveau humain. L'entraînement avec de grandes quantités de données permet de configurer les neurones du réseau neuronal. Le résultat est un modèle de deep learning qui, une fois entraîné, traite de nouvelles données. Les modèles de deep learning recueillent des informations provenant de plusieurs sources de données et analysent ces données en temps réel, sans intervention humaine. Dans le cadre du deep learning, les processeurs graphiques (GPU) sont optimisés pour la formation de modèles, car ils peuvent traiter plusieurs calculs simultanément.
Le deep learning est le moteur de nombreuses technologies d'intelligence artificielle (IA) qui peuvent améliorer l'automatisation et les tâches analytiques. La plupart des gens sont confrontés au deep learning tous les jours lorsqu'ils naviguent sur Internet ou utilisent leur téléphone portable. Parmi d'innombrables autres applications, le deep learning permet de générer des légendes pour les vidéos YouTube, d'effectuer une reconnaissance vocale sur les téléphones et les enceintes intelligentes, d'obtenir une reconnaissance faciale des photos et d'activer les automobiles autonomes. Et à mesure que les data scientists et les chercheurs s'attaquent à des projets de deep learning de plus en plus complexes - en exploitant les cadres de deep learning - ce type d'intelligence artificielle ne fera que prendre une place plus importante dans notre vie quotidienne.
En termes simples, le deep learning est un nom pour les réseaux neuronaux comportant de nombreuses couches.
Pour donner un sens à des données d'observation, telles que des photos ou des enregistrements audio, les réseaux neuronaux font passer les données par des couches de nœuds interconnectés. Lorsque les informations passent par une couche, chaque nœud de cette couche effectue des opérations simples sur les données et transmet sélectivement les résultats aux autres nœuds. Chaque couche suivante se concentre sur une caractéristique de plus haut niveau que la précédente, jusqu'à ce que le réseau crée le résultat suivant.
Entre la couche d'entrée et la couche de sortie se trouvent des couches cachées. C'est là qu'intervient la distinction entre les réseaux neuronaux et le deep learning : un réseau neuronal de base peut avoir une ou deux couches cachées, tandis qu'un réseau de deep learning peut avoir des dizaines, voire des centaines, de couches. L'augmentation du nombre de couches et de nœuds différents peut améliorer la précision d'un réseau. Toutefois, un plus grand nombre de couches peut également signifier qu'un modèle nécessitera davantage de paramètres et de ressources informatiques.
Le deep Learning classe les informations par le biais de couches de réseaux neuronaux, qui possèdent un ensemble d'entrées qui reçoivent des données brutes. Par exemple, si un réseau neuronal est formé avec des images d'oiseaux, il peut être utilisé pour reconnaître des images d'oiseaux. Un plus grand nombre de couches permet d'obtenir des résultats plus précis, par exemple en distinguant un corbeau d'un poulet. Les réseaux neuronaux profonds, qui sont à l'origine des algorithmes de deep learning, possèdent plusieurs couches cachées entre les nœuds d'entrée et de sortie, ce qui signifie qu'ils sont capables d'effectuer des classifications de données plus complexes. Un algorithme de deep learning doit être entraîné avec de grands ensembles de données, et plus il reçoit de données, plus il sera précis ; il faudra lui fournir des milliers de photos d'oiseaux avant qu'il soit capable de classer avec précision de nouvelles photos d'oiseaux.
Lorsqu'il s'agit de réseaux neuronaux, la formation du modèle de deep learning est très gourmande en ressources. Le réseau neuronal reçoit des entrées, qui sont traitées dans des couches cachées à l'aide de pondérations (paramètres représentant la force de la connexion entre les entrées) ajustées pendant la formation, et le modèle émet ensuite une prédiction. Les pondérations sont ajustées sur la base des données de formation afin de faire de meilleures prédictions. Les modèles de deep learning consacrent beaucoup de temps à l'apprentissage de grandes quantités de données, d'où l'importance d'une informatique performante.
Les GPU sont optimisés pour les calculs de données et sont conçus pour accélérer les calculs matriciels à grande échelle. Les GPU sont les mieux adaptés à l'exécution parallèle pour les problèmes de machine learning (ML) et de deep learning à grande échelle. Par conséquent, les applications de ML qui effectuent un grand nombre de calculs sur de grandes quantités de données structurées ou non structurées - telles que des images, du texte et des vidéos - bénéficient de bonnes performances.
L'un des principaux avantages du deep learning est que ses réseaux neuronaux sont utilisés pour révéler des informations et des relations cachées dans des données qui n'étaient pas visibles auparavant. Grâce à des modèles de machine learning plus robustes, capables d'analyser des données volumineuses et complexes, les entreprises peuvent améliorer la détection des fraudes, la gestion de la supply chain et la cybersécurité :
Les algorithmes de deep learning peuvent être entraînés à examiner les données textuelles en analysant les messages des médias sociaux, les nouvelles et les enquêtes pour fournir de précieuses informations sur les entreprises et les clients.
Le deep learning nécessite des données étiquetées pour la formation. Une fois formé, il peut étiqueter de nouvelles données et identifier lui-même différents types de données.
Un algorithme de deep learning peut faire gagner du temps car il ne nécessite pas que les humains extraient manuellement des caractéristiques à partir de données brutes.
Lorsqu'un algorithme de deep learning est correctement formé, il peut effectuer des milliers de tâches, encore et encore, plus rapidement que les humains.
Les réseaux neuronaux utilisés dans le deep learning peuvent être appliqués à de nombreux types de données et d'applications. En outre, un modèle de deep learning peut s'adapter en le réentraînant avec de nouvelles données.
L'IA, le machine learning et le deep learning sont tous liés, mais ils ont des caractéristiques distinctes :
L'intelligence artificielle permet aux ordinateurs, aux machines ou aux robots d'imiter les capacités d'un être humain, telles que la prise de décisions, la reconnaissance d'objets, la résolution de problèmes et la compréhension du langage.
Le machine learning est un sous-ensemble de l'IA centré sur la création d'applications capables d'apprendre à partir de données pour améliorer leur précision au fil du temps, sans intervention humaine. Les algorithmes de machine learning peuvent être entraînés à trouver des modèles pour prendre de meilleures décisions et faire de meilleures prédictions, mais cela nécessite généralement une intervention humaine.
Le deep learning est un sous-ensemble de machine learning qui permet aux ordinateurs de résoudre des problèmes plus complexes. Les modèles de deep learning sont également capables de créer de nouvelles fonctionnalités par eux-mêmes.
Le deep learning peut être utilisé pour analyser un grand nombre d'images, ce qui peut aider les réseaux sociaux à en savoir plus sur leurs utilisateurs. Cela améliore les annonces ciblées et les suggestions de suivi.
Les réseaux neuronaux de deep learning peuvent être utilisés pour prédire la valeur des actions et élaborer des stratégies commerciales, et peuvent également repérer les menaces pour la sécurité et se protéger contre la fraude.
Le deep learning peut jouer un rôle central dans le domaine des soins de santé en analysant les tendances et les comportements pour prédire les maladies chez les patients. Les professionnels de la santé peuvent également utiliser des algorithmes de deep learning pour décider des tests et des traitements optimaux pour leurs patients.
Le deep learning peut détecter les menaces avancées mieux que les solutions traditionnelles de lutte contre les logiciels malveillants en reconnaissant de nouvelles activités suspectes plutôt que de répondre à une base de données de menaces connues.
Les assistants digitaux représentent certains des exemples les plus courants de deep learning. Grâce au traitement du langage naturel (NLP), Siri, Cortana, Google et Alexa peuvent répondre aux questions et s'adapter aux habitudes des utilisateurs.
Bien que l'on découvre de nouvelles utilisations du deep learning, il s'agit encore d'un domaine en évolution qui présente certaines limites :
Afin d'obtenir des réponses plus perspicaces et plus abstraites, le deep learning nécessite de grandes quantités de données sur lesquelles s'entraîner. Comme le cerveau humain, un algorithme de deep learning a besoin d'exemples pour pouvoir apprendre de ses erreurs et améliorer ses résultats.
Les machines apprennent encore de manière très étroite, ce qui peut conduire à des erreurs. Les réseaux de deep learning ont besoin de données pour résoudre un problème spécifique. Si on leur demande d'effectuer une tâche en dehors de ce cadre, ils échoueront très probablement.
Alors qu'il passe au crible des millions de points de données pour trouver des modèles, il peut être difficile de comprendre comment un réseau neuronal parvient à sa solution. Ce manque de transparence sur la manière dont ils traitent les données rend difficile l'identification des biais indésirables et l'explication des prédictions.
Malgré ces obstacles, les spécialistes des données se rapprochent de plus en plus de la création de modèles de deep learning très précis, capables d'apprendre sans supervision, ce qui rendra le deep learning plus rapide et moins laborieux.
Avec l'explosion des données d'entreprise, les data scientists doivent être en mesure d'explorer et de construire des modèles de deep learning rapidement et avec plus de flexibilité que ce que le matériel informatique traditionnel sur site peut fournir.
Oracle Cloud Infrastructure (OCI) offre le meilleur rapport prix/performance en matière de calcul pour les charges de travail gourmandes en données, de stockage cloud rapide et de mise en réseau à faible latence et à haut débit avec RDMA à 100 Gbps. OCI fournit également des instances de calcul GPU pour le deep learning, des images faciles à déployer et la possibilité de faire fonctionner une station de travail à GPU unique ou un cluster de formes multi-GPU.
Pour construire, former et déployer des modèles de machine learning sur une infrastructure cloud haute performance, essayez Oracle Cloud Infrastructure Data Science. Les data scientists peuvent créer et entraîner des modèles de deep learning en beaucoup moins de temps grâce aux GPU NVIDIA dans les ordinateurs portables. Ils peuvent également sélectionner la quantité de ressources de calcul et de stockage dont ils ont besoin pour s'attaquer à des projets de toute taille sans se soucier de l'approvisionnement ou de la maintenance de l'infrastructure. En outre, OCI Data Science accélère la création de modèles en rationalisant les tâches de data science, telles que l'accès aux données, la sélection des algorithmes et l'explication des modèles.