Jeff Erickson | Responsable de la stratégie de contenu sur les technologies | 17 septembre 2024
La plupart d'entre nous interagissent régulièrement avec des analyses en temps réel, même si nous n'en sommes pas conscients. Ce type d'analyse fonctionne en arrière-plan pour aider à choisir l'itinéraire d'un livreur de colis, à rechercher des indices de fraude sur les achats par carte de crédit et à aider les services publics à garder les lumières allumées grâce à une maintenance proactive des équipements de production d'électricité.
Bien que toutes les entreprises n'aient pas besoin de réagir aux données en quelques millisecondes, l'analyse en temps réel continue de s'améliorer, ce qui rend la technologie et les avantages commerciaux qu'elle apporte possibles pour de nombreuses autres entreprises. Cela change notre façon de penser en matière d'analyse. Au lieu de simplement regarder ce qui s'est passé et comment améliorer la prochaine fois, l'analyse en temps réel est un outil de décision opérationnelle instantanée.
L'analyse en temps réel traite les données au moment où elles sont générées, que ce soit par un clic sur un site Web, un commentaire sur les réseaux sociaux, une transaction ou un capteur, et les transfère dans un système pour les exploiter immédiatement. L'analyse en temps réel de certains processus métier est réalisée en quelques millisecondes pour extraire des données de plusieurs sources et les transmettre à un système où elles sont organisées et analysées, puis traitées par un système automatisé ou communiquées à des personnes sous forme de graphiques, de texte ou de voix. C'est ainsi que les vendeurs de billets ajustent les prix en fonction de la demande, que les compagnies aériennes actualisent le statut des vols ou que les banques envoient une alerte immédiatement lorsqu'une transaction paraît suspecte à son algorithme d'intelligence artificielle.
Les systèmes d'analyse de données en temps réel peuvent s'appuyer sur des sources de données structurées et non structurées. Les données structurées sont fournies dans des formats prévisibles et cohérents à partir de sources telles que les applications métier. Les données non structurées, parfois appelées big data, nécessitent un traitement supplémentaire et proviennent de sources qui incluent des sites de réseaux sociaux, des documents texte et des vidéos. Les systèmes d'analyse de données peuvent combiner ces deux types de sources de données pour une analyse plus riche, puis présenter les résultats de manière à ce que les gens puissent facilement exploiter.
Les technologies permettant l'analyse en temps réel incluent les bases de données et les data lakes, les algorithmes de machine learning (ML), les outils d'intégration de données, les langages de programmation, les blocs-notes de data science et divers projets open source. Associés au machine learning, les systèmes d'analyse en temps réel peuvent faire plus qu'aider à la prise de décision en ce moment. Ils peuvent également rechercher des tendances, des goulets d'étranglement ou des opportunités commerciales cachées dans les données opérationnelles.
Points à retenir
L'analyse en temps réel est une forme d'analyse des données. Elle gagne en popularité auprès des entreprises numériques. Il s'agit d'une extension de l'analyse de données traditionnelle qui utilise bon nombre des mêmes compétences. L'analyse traditionnelle, souvent appelée analyse par lots, est un processus plus lent dans lequel de grandes quantités de données stockées sont préparées, puis envoyées à une plateforme d'analyse pour générer des graphiques ou des graphiques dans un tableau de bord. Le processus peut prendre des heures, des jours, des semaines voire des mois. Les données sont utilisées pour dépeindre une situation passée. Cette approche est et restera essentielle pour guider la prise de décisions.
Contrairement aux analyses de données traditionnelles, les analyses en temps réel se concentrent sur la situation actuelle. Au lieu de stocker des données et de les déplacer périodiquement dans un système d'analyse à l'aide d'un processus technique complexe appelé extraction, transformation et chargement (ETL), les analyses en temps réel transmettent immédiatement les données au système pour analyse et action, souvent quelques millisecondes après leur création. On peut facilement comprendre pourquoi on parle parfois d'analyse en continu.
De nombreuses entreprises passent du traitement par lots au traitement en temps réel, et des architectures orientées requêtes aux architectures orientées événements qui permettent une plus grande automatisation.
De nombreuses architectures de gestion des données peuvent prendre en charge les analyses en temps réel, mais celles qui gagnent en popularité en raison de leur simplicité sont appelées analyses dans la base de données. Cela permet aux analystes d'exécuter des analyses où les données sont stockées plutôt que d'effectuer l'étape supplémentaire et chronophage d'ETL des jeux de données vers une base de données d'analyse distincte. Des analystes de Forrester ont qualifié ce modèle d'analyse dans la base de données de plateforme « translytique », un mot-valise renvoyant aux fonctions transactionnelles et analytiques, et il peut faciliter le maintien de l'intégrité des données et l'analyse à grande échelle.
Dans les magasins de retail qui prédisent la demande, les agences de marketing qui accélèrent les décisions de ciblage en millisecondes et de nombreuses autres organisations, les personnes trouvent que les informations instantanées des analyses en temps réel sont un outil précieux pour prendre des décisions ou automatiser les actions.
L'analyse en temps réel apporte aux entreprises les informations dont elles ont besoin pour agir à la volée, qu'il s'agisse de modifier les itinéraires de conduite, de réagir à un problème de fabrication, de modifier une campagne marketing ou de mettre à jour un partenaire de la supply chain.
Les informations en temps réel sur la commande ou la demande de service d'un client offrent une expérience client plus fluide et plus personnalisée.
Les entreprises peuvent actualiser leurs prix, leurs offres ou la disponibilité de leurs produits en temps réel pour améliorer leur efficacité et leurs revenus.
Les analyses en temps réel peuvent aider les professionnels du marketing à identifier les tendances au fur et à mesure de leur développement. En utilisant des analyses combinant divers facteurs tels que les ventes et le sentiment des médias sociaux, la technologie peut ajuster les messages ou même suggérer des changements de produit pour capitaliser sur la tendance avant la concurrence.
La création de l'infrastructure de données intégrée et évolutive nécessaire à l'analyse en temps réel demande généralement une planification, une expertise et des fonds. L'un des principaux facteurs à l'origine de nombreux défis liés à l'analyse en temps réel est l'assemblage d'une architecture suffisamment puissante et efficace pour permettre la collecte, l'intégration et l'analyse des données en temps réel. Cependant, des architectures complexes peuvent entraîner des temps d'arrêt, constituer un casse-tête pour les ingénieurs et, si le service n'est pas fiable, réduire l'adoption. Vous trouverez ci-dessous trois étapes pour surmonter plus facilement ces difficultés.
L'un des premiers défis de la mise en œuvre de l'analyse en temps réel est la comptabilisation de toutes les sources de données impliquées. Par exemple, une application de retail extrait des données des fournisseurs de produits et les transmet aux logiciels de comptabilité financière et aux applications de service client. Les bonnes sources pour une initiative d'analyse en temps réel peuvent se trouver à l'intérieur ou à l'extérieur de l'entreprise et inclure des données structurées ou non structurées. Les équipes informatiques peuvent utiliser de nombreux outils pour localiser et cataloguer les sources de données.
Une fois les sources de données identifiées, elles doivent être intégrées dans un flux de données qui peut être utilisé par le système d'analyse. Cette étape nécessite souvent une plateforme d'intégration qui fournit les API et les connecteurs prédéfinis nécessaires pour assimiler les données de plusieurs sources.
Étant donné que les analyses en temps réel s'appuient sur des sources de données qui changent en fonction de l'activité de l'entreprise, les volumes de données peuvent être imprévisibles. Les ressources de calcul affectées aux analyses en temps réel doivent être provisionnées pour le plus grand cas d'utilisation possible ou construites sur un service cloud capable d'évoluer pour répondre à l'évolution des besoins.
Les données structurées et non structurées peuvent être utilisées dans un système d'analyse en temps réel. En fait, la combinaison des deux à des fins d'analyse, afin de dresser rapidement un tableau plus clair pour l'entreprise, est ce qui rend de nombreux systèmes en temps réel si précieux. Ces deux types de données sont différents de la façon dont leur nom implique : les données structurées sont fournies dans des formats cohérents et prévisibles à partir de sources telles que les applications métier, ce qui facilite leur insertion dans une base de données relationnelle. Les données non structurées ne se présentent pas dans un formatage prévisible ; elles sont extraites de sources telles que les flux de médias sociaux, les formulaires de commentaires client, les documents texte ou les vidéos, puis formatées pour être utilisées dans le système d'analyse en temps réel.
Type de données | Définition | Différence clé | Exemple |
---|---|---|---|
Données structurées | Données organisées dans un format clairement défini | Faciles à trier, suivre, classer et mettre dans une base de données relationnelle | Résultats des ventes, réponses aux enquêtes, adresses des clients ou historique d'achats |
Des données non structurées | Données qui ne suivent pas un format prédéterminé | Difficiles à intégrer dans une base de données relationnelle | E-mail, messages sur les réseaux sociaux, audio, vidéos |
Un processus d'analyse de données en temps réel s'appuiera sur la qualité des pratiques globales de gestion des données d'une organisation. Les logiciels de gestion des données d'entreprise doivent inclure la possibilité d'évoluer rapidement, d'intégrer des données provenant de nombreuses sources, de garantir la qualité des données et une gouvernance forte, et, bien sûr, de donner la priorité à la sécurité des données. Vous trouverez ci-dessous les bonnes pratiques à prendre en compte.
Posez-vous d'abord la question suivante : à qui s'adresse ce moteur d'analyse en temps réel ? Il est peu probable qu'il s'applique à l'ensemble de l'entreprise, vous devez donc évaluer s'il sera utilisé par l'ensemble d'un service ou simplement sélectionner des utilisateurs. Avoir un ensemble d'objectifs précis et ciblés facilitera cette évaluation. En triant cela, vous obtiendrez les sources de données internes et externes à votre entreprise dont vous aurez besoin. Vous devriez aussi vous poser une autre question : auriez-vous des objectifs plus ambitieux si vous aviez plus de données ou de meilleures données ?
Limitez au minimum le nombre de fois où les données doivent être déplacées ou passer par un processus ETL. Les processus ETL peuvent créer une latence et augmenter les risques de sécurité et de conformité des données lorsque les données se déplacent entre les banques de données. Une tendance actuelle est d'utiliser l'analyse dans la base de données, où le traitement des données est effectué dans une base de données transactionnelle pour éviter de déplacer des jeux de données volumineux vers une base de données d'analyse distincte.
Même une entreprise de taille moyenne utilise en moyenne 20 produits SaaS payants, selon une enquête récente. Ajoutez cela aux logiciels on-premises et à d'autres sources de données tierces ou non structurées, et vous avez beaucoup de choix. Identifiez ceux qui s'avéreront utiles pour l'analyse en temps réel.
Différents modèles de machine learning révèlent différents types d'informations en fonction de leur apparence des données. Les modèles peuvent être entraînés pour des tâches de régression ou de classification, la détection d'anomalies ou à d'autres fins. Au-delà de l'obtention d'informations en temps réel, le machine learning peut aider à détecter les tendances, à prendre des décisions plus rapidement et à automatiser les actions ou les recommandations.
Les bons outils de traitement des données peuvent vous aider à créer un système d'analyse en temps réel. Si vous utilisez des processus ETL, vous aurez besoin d'outils pour extraire des données, nettoyer et transformer les jeux de données et les faire circuler dans les systèmes appropriés.
Il existe deux façons d'envisager la surveillance des performances de vos analyses en temps réel. L'une est purement humaine. Vous établissez des relations avec des personnes dans l'entreprise qui peuvent rendre compte de la façon dont il fonctionne sur le terrain. L'atelier fonctionne-t-il mieux ou les clients obtiennent-ils les informations automatisées dont ils ont besoin ? La deuxième façon est de surveiller vos processus de données pour identifier les tendances négatives et les goulets d'étranglement et être en mesure de réagir.
Un système d'analyse en temps réel peut avoir de nombreuses sources de données et dépendances. Lorsqu'un changement dans l'environnement commercial apporte un changement à l'une de ces entrées, assurez-vous que votre système d'analyse en temps réel et les collaborateurs qui l'utilisent ont un moyen de noter le problème et un processus pour le résoudre.
Au Brésil, Tetris.co montre comment une entreprise peut bénéficier d'un accès direct aux analyses en temps réel pour les décideurs. L'entreprise rassemble des données provenant de plusieurs sources multimédias dans une base de données MySQL et utilise des analyses en temps réel pour comprendre comment les investissements publicitaires fonctionnent. L'entreprise a atteint la vitesse dont son logiciel a besoin en passant à HeatWave MySQL, où elle pouvait exécuter des transactions et des workloads d'analyse en temps réel directement à partir d'une base de données MySQL, éliminant ainsi le besoin de déplacer et d'intégrer des données à une base de données d'analyse distincte. Le système haute performance a aidé les analystes de première ligne à comprendre les tendances plus rapidement et à améliorer les résultats marketing en transférant les investissements hors des plateformes publicitaires sous-performantes et vers des canaux plus performants.
De nombreuses compétences et outils peuvent aider à créer un système d'analyse en temps réel qui produit des résultats pour votre entreprise. Il s'agit notamment des outils de modélisation des données, de qualité des données et de visualisation des données. Un bon point de départ est de considérer vos compétences et logiciels actuels. Par exemple, une entreprise qui utilise MySQL pour les transactions peut simplement opter pour une version cloud qui offre des analyses dans la base de données et un machine learning dans la base de données, éliminant ainsi le besoin de données ETL pour séparer les systèmes d'analyse et de machine learning.
Si votre entreprise a besoin des avantages de l'analyse en temps réel, HeatWave MySQL offre une solution puissante. HeatWave MySQL est un service de base de données entièrement géré, optimisé par l'accélérateur de requêtes en mémoire HeatWave intégré. Il fournit des analyses en temps réel sans la complexité, la latence, les risques et le coût de la duplication ETL.
Avec HeatWave MySQL, vous pouvez accéder à une gamme de fonctionnalités HeatWave intégrées pour l'analyse, le machine learning et l'IA générative. HeatWave Lakehouse vous permet d'interroger jusqu'à un demi-pétaoctet de données dans la banque d'objets dans divers formats de fichier, tels que CSV, Parquet, Avro, JSON et les exports à partir d'autres bases de données, et éventuellement de les combiner avec des données dans MySQL. HeatWave AutoML et HeatWave GenAI offrent les avantages du machine learning intégré et automatisé et de l'IA générative, sans ETL dans les services cloud.
Quel serait un exemple d'analyse en temps réel ?
Il existe de nombreux exemples d'analyses en temps réel pour les entreprises. Une entreprise, FANCOMI, vise à devenir le plus grand réseau publicitaire de marketing de performance au monde qui permet aux annonceurs de payer lorsqu'ils atteignent les résultats marketing souhaités et pas de la manière traditionnelle, lorsque du placement des annonces. Elle utilise des analyses en temps réel pour surveiller et mesurer l'impact de 20 000 publicités destinées à 2,6 millions d'agences et de sites Web de médias 24 heures par jour.
Pourquoi les entreprises ont-elles besoin d'analyses en temps réel ?
Les systèmes numériques, y compris les capteurs d'Internet des objets, les sites et applications de médias sociaux et le retail en ligne, associés à des systèmes en coulisses tels que CRM, ERP et la gestion du capital humain (HCM), génèrent des données en quantités sans précédent. Les entreprises qui peuvent rapidement comprendre ce déluge de données opérationnelles pour voir les changements dans leurs activités et réagir avec les bonnes décisions vont battre la concurrence.
Comment l'analyse en temps réel améliore-t-elle la prise de décision ?
L'analyse en temps réel traite les données dès leur création, quand elles sont les plus pertinentes. Les entreprises qui n'utilisent pas l'analyse en temps réel peuvent prendre des décisions importantes en fonction de données déjà obsolètes au moment où elles sont analysées.
Découvrez comment tirer parti de l'IA générative, créer des modèles de machine learning, interroger des données dans le stockage d'objets ou explorer d'autres sujets d'intérêt HeatWave.