11 défis communs des start-ups d'IA et comment les relever

Jeffrey Erickson | Responsable de la stratégie du contenu | 12 janvier 2024

Lorsque OpenAI a publié ChatGPT, son grand modèle de langage (LLM), auprès du public en novembre 2022, il a rassemblé 100 millions d'utilisateurs en seulement deux mois. Cela a facilement fait de ChatGPT l'une des applications grand public à la croissance la plus rapide de tous les temps.

Les investisseurs en ont pris note.

Dès lors, les membres des 50 principales entreprises d'IA de Forbes ont conjointement collecté plus de 27,2 milliards de dollars. Certaines de ces entreprises ont moins d'un an et emploient moins de 20 personnes. Pour les start-ups d'IA innovantes, l'argent coule à flot.

L'argent récolté ne garantit pas le succès. Les start-ups d'IA relèvent des défis uniques qui exigent plus que le cran habituel, le timing du marché ou la gestion de la croissance. Former les LLM que les services d'alimentation tels que ChatGPT ou le générateur d'images IA de Midjourney est l'une des tâches les plus intensives en calcul que l'humanité ait conçues. Les entreprises d'investissement affirment que la majeure partie du capital que les startups d'IA collectent va directement aux ressources informatiques.

Par ailleurs, les start-ups d'IA sont responsables de la sécurité et de la confidentialité des informations sensibles qui se cachent dans les montagnes de données d'entraînement ingérées par leurs modèles, même si elles se démènent pour rivaliser avec les géants en place qui s'activent également rapidement pour gagner des parts de marché.

Le fondateur de Microsoft, Bill Gates, considère que l'IA représente le développement le plus important en informatique depuis l'interface utilisateur graphique, qui a lancé le Macintosh d'Apple ainsi que tous les systèmes d'exploitation et applications populaires depuis. Il est donc compréhensible que les entrepreneurs veulent une part du gâteau. Examinons les facteurs dont les start-ups d'IA devraient être conscientes lorsqu'elles entrent dans la mêlée.

Qu'est-ce qu'une start-up d'IA ?

Les start-ups d'IA générative se présentent sous trois formes : celles qui créent des plateformes de LLM, telles que OpenAI ou Cohere, celles qui offrent de nouveaux outils pour créer et former des LLM, telles que MosaicML, et enfin celles qui prennent des LLM open source et les entraînent à résoudre des problèmes commerciaux spécifiques comme par exemple, Tome, qui utilise l'IA pour améliorer ses présentations commerciales.

Toutes les start-ups dans le domaine de l'IA travaillent dans le sillage d'entreprises telles que ChatGPT, Google, etc. qui ont utilisé de puissantes architectures informatiques appelées réseaux neuronaux et algorithmes de machine learning pour créer des interfaces de langage naturel conviviales capables de générer du texte, du contenu visuel et du code informatique de type humain et d'effectuer de nombreuses autres tâches.

Points à retenir

  • Bien que les plateformes d'IA soient utilisées depuis de nombreuses années, la publication populaire de LLM à usage public en 2022 a conduit à un flot de nouvelles start-ups.
  • Les investisseurs trouvent, vérifient et financent ces start-ups à un rythme effréné.
  • Les start-ups de l'IA évoluent dans un paysage mouvant, marqué par des préoccupations en matière de protection de la vie privée et de réglementation, par la concurrence sur les capacités de calcul ainsi que les menaces des entreprises existantes.

11 défis pour les start-ups de l'IA

Qu'il s'agisse de jeunes entreprises prodiges bien financées ou de jeunes pousses en plein essor, ces start-ups sont confrontées à des obstacles propres aux fournisseurs de services basés sur l'IA. Les 11 défis énumérés ci-dessous donnent une bonne idée des obstacles possibles qui attendent.

1. Sécurité et confidentialité

Les start-ups d'IA assument des responsabilités de sécurité et de confidentialité qui vont au-delà des efforts standard de protection des données d'entreprise. De nombreuses mesures de sécurité seront familières, telles que l'utilisation d'un modèle zero-trust et la surveillance des réseaux à la recherche d'activités malveillantes qui déclenchent des réponses et des alertes automatisées. Mais il y a aussi de nouveaux défis. Par exemple, les modèles d'IA pourraient potentiellement divulguer certaines informations sur les données utilisées pour les entraîner. Ces jeux de données peuvent représenter des centaines de gigaoctets, voire des téraoctets, de taille extraite d'une gamme de sources. Ils peuvent contenir des données sensibles, y compris des noms, des adresses et d'autres informations personnellement identifiables. Un modèle entraîné à l'aide de ces données peut-il refléter des détails privés dans ses résultats ?

Il est important que les start-ups sachent quelles données se trouvent dans leur entraînement et qu'elles aient un plan pour minimiser les risques liés aux informations sensibles ou réglementées. Ces entreprises doivent convaincre les investisseurs que ces préoccupations sont couvertes et qu'elles ont un plan de réponse aux communications au cas où quelque chose tournerait mal.

2. Volume de données

Les entreprises d'IA entraînent et déploient de grands modèles de langage (LLM) avec des jeux de données étendus et des milliards de paramètres pour toutes sortes de cas d'utilisation, y compris le traitement du langage naturel (NLP) et la création d'images. Ils développent également des modèles d'IA pour la vision par ordinateur, la prévision et la prédiction, la détection d'anomalies et bien plus encore. Les LLM en particulier nécessitent des volumes de données incroyablement importants pour produire des résultats précis et cohérents.

Si vous êtes une start-up d'IA, la gestion des données est au cœur de votre entreprise.

Cependant, l'un des principaux défis consiste à trouver les bons jeux de données pour vos besoins de entraînement de l'IA et à les télécharger dans un data warehouse ou un data lakehouse massif. Ensuite, les données doivent circuler en toute sécurité via les réseaux neuronaux et les algorithmes de machine learning à l'aide de superclusters de serveurs d'unités de traitement graphique (GPU), si vous pouvez les trouver.

Grandes puces

Un GPU est une puce contenant beaucoup plus de cœurs qu'une unité centrale de traitement (CPU). Cette conception, telle qu'illustrée dans CUDA de Nvidia, courte pour l'architecture unifiée des périphériques de calcul, optimise le parallélisme massif requis pour des tâches telles que l'entraînement de l'IA.

3. Capacité informatique

Un postulat que nous voyons encore et encore dans les émissions de télévision, les films ou dans les médias populaires est que l'IA va détruire le monde. Contre-argument : « Où l'IA maléfique obtiendra-t-elle les GPU ? »

Pour exécuter les réseaux neuronaux sur lesquels les modèles d'IA sont construits, les GPU divisent le travail de calcul. Le système exécute ensuite des requêtes via un groupe de GPU en parallèle. Cela élimine la charge du processeur de l'ordinateur et permet au réseau d'effectuer des calculs complexes très rapidement. L'entraînement et l'exécution de modèles d'IA nécessitent tellement de puissance de calcul que les fabricants de puces et les fournisseurs cloud du monde entier ont du mal à répondre à la demande. Sachez que vous devrez peut-être faire la queue pour acheter des puces ou convaincre un fournisseur de cloud que votre démarrage de l'IA est digne de ces précieux GPU.

4. Personnalisation

On peut affirmer que la plupart des start-ups d'IA construiront leurs entreprises autour d'un LLM développé par une autre entreprise parce que, dans la plupart des cas, la personnalisation d'un modèle d'IA à partir d'OpenAI ou Cohere est plus efficace que la conception, la construction et l'entraînement à partir de zéro.

Il existe deux approches courantes de personnalisation d'un LLM pour un secteur d'activité ou un cas d'utilisation particulier : le réglage fin et la génération augmentée de récupération (RAG). Vous affinez les résultats d'un système d'IA en l'entraînant sur de grandes quantités de données spécifiques à votre activité et en demandant à l'IA de donner à ces informations plus de poids dans ses réponses. L'autre option, la RAG, consiste à intégrer des documents très pertinents dans une base de données que l'IA utilisera pour donner du contexte aux invites écrites ou verbales qu'elle reçoit. Avec la RAG, ces documents permettent à l'IA d'ajouter des détails techniques pertinents dans ses résultats, et même de citer où elle a obtenu les informations. Par exemple, une start-up du secteur de la santé peut intégrer des documents ou des articles qui aident son LLM à mieux comprendre l'intention des invites des professionnels de la santé, puis à proposer un langage lié à leurs spécialisations.

Chaque méthode présente des avantages et des inconvénients en termes de vitesse, de qualité et de coût. L'approche de la personnalisation de LLM est une décision importante pour toute start-up d'IA qui espère fournir un service propre à un secteur ou à un cas d'utilisation.

5. Coûts du cloud

Pour les entreprises en mode de démarrage rapide, il est difficile de dire non à l'infrastructure cloud prête à l'emploi. Tous les fournisseurs cloud à très grande échelle offrent ce dont vous avez besoin pour entraîner ou personnaliser des grands modèles de langage, y compris des clusters d'instances de calcul connectées par un réseau à bande passante élevée et un système de fichiers hautes performances. De plus, ces services étant basés sur la consommation, ils sont souvent moins coûteux et généralement beaucoup plus rapides que la configuration d'une infrastructure on-premises.

Comme ces systèmes sont basés sur la consommation, la vitesse et l'efficacité doivent être comparées aux coûts. Une start-up d'IA peut réduire ses dépenses en exécutant un LLM qui fait ce qu'elle doit faire avec les algorithmes les moins complexes et le moins de données possible. Une fois le calcul du budget effectué, choisissez une infrastructure cloud pour gérer efficacement votre modèle. Par exemple, l'exécution sur des serveurs bare metal évite la surcharge des instances virtualisées et offre de meilleures performances. Cela devient encore plus important en ce qui concerne les workloads en cluster communes aux LLM.

Souvenez-vous, plus votre travail est rapide, moins vous payez.

6. Efficacité

Cela peut prendre beaucoup d'heures d'énergie gigawatt pour former un LLM. Pour référence, un gigawatt pourrait alimenter jusqu'à 874 000 maisons pendant un an, selon l'entreprise d'investissement The Carbon Collective. Une start-up qui cherche à obtenir des fonds de capital-risque pour fournir des services basés sur le LLM doit prouver qu'elle utilise son argent à bon escient. Par exemple, toutes les tâches d'IA n'ont pas besoin du même niveau de sophistication du modèle ou de puissance de calcul. Un éventail croissant de LLM d'entreprises telles que OpenAI, Cohere, Anthropic, ou autres offrent différentes variantes et tailles. Soyez prêt à expliquer pourquoi votre choix correspond à vos besoins et à votre budget.

Une fois que vous avez choisi votre modèle et vos jeux de données, sélectionnez soigneusement une infrastructure avec un traitement parallèle efficace et un redimensionnement dynamique pour éviter de payer pour les ressources de calcul que vous n'utilisez pas. Soyez prêt à montrer aux investisseurs que vos choix établissent un équilibre entre la performance et le prix.

7. Evolution

Il existe trois techniques principales de mise à l'échelle des LLM pour augmenter la qualité et/ou la vitesse des résultats du LLM : augmenter la quantité de données d'entraînement, utiliser un modèle plus grand et plus complexe ou ajouter de la capacité de calcul.

Un modèle plus grand augmente le nombre de couches et de paramètres dans l'architecture du réseau neuronal, ce qui lui permet d'apprendre et de représenter des modèles complexes dans les données. En conséquence, votre LLM proposera des réponses plus détaillées et nuancées. En ajoutant plus de gigaoctets de données d'entraînement, votre démarrage d'IA peut offrir des réponses plus précises ou complètes. Dans les deux cas, vous devrez également augmenter les ressources de calcul coûteuses pour maintenir les performances du modèle.

8. Qualité des données

Ce n'est pas un défi spécifique à l'intelligence artificielle. Les analystes commerciaux transforment la qualité des données qu'ils utilisent depuis des décennies. Les start-ups d'IA doivent puiser dans l'expertise des data scientists et des experts en la matière pour supprimer les informations redondantes, le contenu non pertinent et d'autres « bruits » des jeux de données utilisés pour entraîner des algorithmes et alimenter les LLM.

« Garbage in, garbage out » est un adage qui devrait résonner avec les start-ups d'IA.

9. KPI et mesures

Il est important que les start-ups d'IA établissent des mesures quantitatives et qualitatives pour réussir. Les mesures quantitatives comprennent le ROI sur les investissements technologiques et les indicateurs clés de performance techniques (KPI), tels que l'erreur quadratique moyenne (MSE), qui identifie les résultats aberrants.

Au-delà de cela, une start-up d'IA devrait être en mesure de mesurer les résultats qualitatifs, tels que la performance d'un modèle d'IA sur des données nouvelles ou non vues précédemment, la pertinence des résultats pour le public cible et l'exhaustivité des résultats dans le contexte du domaine discuté.

10. Financement

Il existe une gamme d'approches pour financer une start-up d'IA. Vous pouvez suivre l'exemple des LLM tels que Midjourney et Surge AI qui ont augmenté leur base de clients progressivement sans utiliser d'argent d'investissement. Si votre start-up d'IA ne peut pas attendre la croissance de pépinière, il existe des business angels, des accélérateurs et des incubateurs qui recherchent tous des fondateurs d'IA avec des esprits aiguisés et de bonnes idées. L'avantage des incubateurs et accélérateurs est qu'ils apportent des relations, un accès aux opportunités de marché, des conseils commerciaux et même des plateformes technologiques pour créer un service d'IA.

11. Ventes et marketing

Les plateformes de vente et de marketing de pointe utilisent l'IA à chaque étape du parcours client, et toute start-up d'IA cherchant à augmenter sa part de marché voudra utiliser l'IA pour l'aider. Comment ? L'IA peut utiliser des données détaillées, y compris des données de géolocalisation en temps réel pour la cartographie et le suivi des mouvements, afin de créer des offres de produits ou de services personnalisées pour les clients potentiels. Les assistants d'IA peuvent ensuite générer des opportunités de vente incitative et croisée ou inciter les acheteurs à effectuer des transactions une fois que les articles sont dans leur panier. Ces tactiques sont prouvées pour augmenter les taux de conversion et plaire aux investisseurs désireux d'investir dans une start-up pour augmenter leurs ventes.

Les services basés sur l'IA après la vente peuvent gérer les requêtes, comprendre le contexte et proposer des suggestions, tout en partageant des détails concrets sur la planification ou les délais de livraison et en posant des questions plus complexes aux agents humains. Le fait de voir comment ces services soutenus par l'IA fonctionnent peut vous aider à évaluer les offres de votre propre start-up d'IA.

Développez vos activités avec Oracle

Si vous créez une entreprise basée sur l'IA, envisagez Oracle Cloud Infrastructure (OCI), qui fournit une infrastructure robuste pour entraîner et servir des modèles à grande échelle. Grâce à son partenariat avec NVIDIA, Oracle peut fournir à ses clients des superclusters alimentés par les derniers GPU et connectés avec un réseau RDMA sur Ethernet convergé (RoCE) à très faible latence. Cette architecture fournit une méthode haute performance et rentable pour l'entraînement de modèles d'IA générative à grande échelle. De nombreuses start-ups dans le domaine de l'IA, dont Adept et MosaicML, créent leurs produits directement sur OCI.

Oracle facilite la prise en main des services OCI, notamment de certains services cloud Always Free. Les start-ups peuvent apprendre grâce à des modèles d'environnement restreint de développement ou des déploiements packagés de logiciels populaires, tels que le déploiement d'un cluster Kubernetes.

Pour aider les start-ups à décider, Oracle fournit des outils exploratoires, notamment des calculateurs de coûts, des évaluations d'analystes tiers et des comparaisons détaillées entre OCI et d'autres plateformes cloud.

L'intelligence artificielle est dans nos vies depuis plus d'une décennie et travaille dans l'ombre. Elle guette la fraude parmi des millions de transactions bancaires, intervient pour gérer les interactions de service client de première ligne et prend des décisions ultra-rapides pour accélérer la logistique d'expédition du jour au lendemain. Maintenant, avec la dernière génération de LLM, les capacités subtiles, puissantes et extraordinaires de l'IA obtiennent l'interface utilisateur qu'elles méritent : le mot naturel parlé ou écrit.

En conséquence, les LLM ont capturé l'imagination populaire avec la création d'images, le texte écrit et la traduction, et même la génération de code. Bien que les défis abondent, le moment est venu pour les start-ups d'IA de trouver des investisseurs, de servir de nouveaux clients et d'évoluer comme en 1999.

La création d'un centre d'excellence en matière d'IA avant le début de l'entraînement spécifique à l'organisation augmente les chances de réussite. Notre e-book explique pourquoi et propose des conseils pour créer un centre d'excellence (CDE) efficace.

FAQ sur l'IA et les start-ups

Quels sont les défis courants des start-ups d'IA ?

Les start-ups d'IA ont du mal à choisir le bon LLM à entraîner, à trouver les bonnes données d'entraînement et à assembler l'immense puissance de calcul nécessaire pour prendre en charge leurs réseaux neuronaux. Il existe également des problèmes de confidentialité et de sécurité des données, et de réglementation changeante à gérer.

Quels types de services les start-ups d'IA offrent-elles ?

Les start-ups de l'IA apparaissent dans tous les secteurs d'activité, y compris ceux de la santé, la fabrication ou la défense nationale. Certaines start-ups proposent des produits aux consommateurs tandis que d'autres créent des outils utilisés par d'autres entreprises d'IA pour construire et former leurs modèles.

Comment les start-ups d'IA trouvent-elles des financements ?

Les start-ups à la recherche d'investisseurs peuvent faire une recherche rapide de business angels, à l'affût des opportunités. Les autres options sont les incubateurs technologiques ou accélérateurs, qui peuvent fournir des conseils et une assistance technologique aux fondateurs de start-ups.