Transcription et synthèse vocale

OCI Speech est un service d'IA qui transcrit la parole en texte et synthétise la parole en texte. Obtenez des transcriptions précises, normalisées et horodatées, ainsi qu'une voix synchronisée via la console OCI, les blocs-notes OCI Data Science et les API REST, ainsi que les CLI ou SDK.

Fonctionnalités d'OCI Speech

Audio prédéfini et modèles linguistiques

OCI Speech utilise la reconnaissance automatique de la parole (un processus de deep learning) pour proposer une transcription précise des conversations naturelles. Lancez-vous facilement grâce à des modèles audio et linguistiques prédéfinis ne nécessitant pas une expérience en data science.

Analyse des données présentes dans des fichiers audio et vidéo

Recherchez, indexez et déchiffrez les données que recèlent vos fichiers audio. Convertissez des conversations audios enregistrées en données textuelles afin de les analyser à l'aide de services d'IA. Par exemple, vous pouvez utiliser OCI Language pour extraire les sentiments ou les fonctionnalités de détection d'anomalies d'OCI Speech afin d'identifier les risques d'attrition des clients.

Transcription en temps réel

Désormais disponible de manière limitée, la fonction de transcription en temps réel d'OCI Speech vous permet d'envoyer des flux audio et de recevoir des transcriptions précises en quelques secondes.

Texte neuronal au discours (TTS)

Désormais disponible de manière limitée, la fonctionnalité de synthèse vocale d'OCI Speech permet aux développeurs de générer une voix semblable à celles d'un humain à partir d'un texte dans toutes les applications. Cette fonctionnalité rend possibles les conversations avec les clients, les traductions à l'oral et une meilleure accessibilité. Faites votre choix parmi une variété de voix pour améliorer les interactions.

Prise en charge multilingue native

Les modèles OCI Speech ASR prennent en charge l'anglais, l'espagnol, le portugais, l'allemand, le français, l'italien et l'hindi, ce qui vous permet de retranscrire vos fichiers audio dans votre langue préférée. En outre, OCI Speech prend également en charge le modèle OpenAI Whisper, qui peut traiter plus de 57 langues. En savoir plus sur OCI et le modèle Whisper.

Diarisation pour une meilleure lisibilité et compréhension

OCI Speech prend en charge la diarisation pour organiser, analyser et extraire des informations pertinentes à partir de plusieurs intervenants.


Service de transcription intégré

Ne dépendez plus d'offres de transcription tierces et renforcez le contrôle sur vos données grâce à une conformité et une sécurité d'un bout à l'autre.

Faciles à intégrer

OCI Speech est un service polyvalent qui peut être appelé via des API REST, différents kits SDK et l'interface de ligne de commande Oracle CLI. Les développeurs peuvent facilement déployer un service vocal évolutif sans avoir nécessairement être experts en data science ou en machine learning.

Conçu spécialement pour la sécurité et la confidentialité

Oracle Cloud Infrastructure Speech protège la confidentialité de vos clients. Les modèles prédéfinis de reconnaissance vocale automatique transcrivent vos contenus mais ne stockent aucune donnée pour l'entraînement, le débogage ou d'autres fins.


Service de transcription intégré

OCI Speech utilise des modèles et une architecture propriétaires qui permettent une conversion rapide de la parole en texte.

Note de confiance par mot

Nous avons ajouté une note de confiance par mot afin de pouvoir identifier les mots qui ont potentiellement été mal retranscrits. Utilisez la note de confiance par mot pour déterminer où se concentrer lors de la création d'une application.

Filtres de grossièretés

Nous avons ajouté un filtre de mots prédéfinis grâce à une liste de grossièretés. Vous pouvez soit masquer, supprimer ou étiqueter les grossièretés.


Notre fonction de reconnaissance vocale en temps réel permet de s'assurer que votre discours est correctement transcrit au fur et à mesure que vous parlez naturellement, ce qui permet une communication fluide et ininterrompue.
Michael Zhang, Responsable de produit principal senior chez Oracle

Cas d'usage pour OCI Speech

Recherche de contenu multimédia numérique et sous-titrage

Fournissez automatiquement des sous-titres dans le workflow sur la plateforme OCI pour tout le contenu créé et géré par les services de médias numériques. Indexez votre contenu en utilisant OCI Speech pour effectuer facilement des recherches dans votre contenu.

Analyses des commentaires clients et des appels

Transcrivez les appels des clients pour faciliter la recherche et l'extraction d'informations. Utilisez OCI Language pour détecter les sentiments et vous aider à identifier l'attrition de clients et les opportunités de formation du personnel.

Dictée médicale

La transcription en temps réel permet aux médecins et aux infirmières de saisir les notes des patients lorsqu'ils sont en déplacement, ce qui contribue à accroître l'efficacité et à améliorer les soins et les résultats.

Amélioration de l'accessibilité

La synthèse vocale neuronale fournit une voix semblable à l'humain avec des intonations, offrant plus d'options pour les fonctionnalités d'accessibilité.

Ressources relatives à OCI Speech

Lancez-vous avec OCI Speech


Oracle Cloud Free Tier

Créez, testez et déployez vos applications sur Oracle Cloud, gratuitement.