OCI Speech est un service d'IA qui transcrit la parole en texte et synthétise la parole en texte. Obtenez des transcriptions précises, normalisées et horodatées, ainsi qu'une voix synchronisée via la console OCI, les blocs-notes OCI Data Science et les API REST, ainsi que les CLI ou SDK.
Les fonctionnalités de synthèse vocale et de transcription en temps réel sont désormais disponibles de manière limitée. Découvrez comment créer une voix synthétisée à partir de texte et recevoir une transcription précise instantanément.
Découvrez comment les composants d'un système standard interagissent pour permettre à OCI Speech de transcrire le langage naturel.
Créez, testez et déployez gratuitement des applications sur Oracle Cloud avec un crédit cloud de 300 dollars.
OCI Speech utilise la reconnaissance automatique de la parole (un processus de deep learning) pour proposer une transcription précise des conversations naturelles. Lancez-vous facilement grâce à des modèles audio et linguistiques prédéfinis ne nécessitant pas une expérience en data science.
Recherchez, indexez et déchiffrez les données que recèlent vos fichiers audio. Convertissez des conversations audios enregistrées en données textuelles afin de les analyser à l'aide de services d'IA. Par exemple, vous pouvez utiliser OCI Language pour extraire les sentiments ou les fonctionnalités de détection d'anomalies d'OCI Speech afin d'identifier les risques d'attrition des clients.
Désormais disponible de manière limitée, la fonction de transcription en temps réel d'OCI Speech vous permet d'envoyer des flux audio et de recevoir des transcriptions précises en quelques secondes.
Désormais disponible de manière limitée, la fonctionnalité de synthèse vocale d'OCI Speech permet aux développeurs de générer une voix semblable à celles d'un humain à partir d'un texte dans toutes les applications. Cette fonctionnalité rend possibles les conversations avec les clients, les traductions à l'oral et une meilleure accessibilité. Faites votre choix parmi une variété de voix pour améliorer les interactions.
Les modèles OCI Speech ASR prennent en charge l'anglais, l'espagnol, le portugais, l'allemand, le français, l'italien et l'hindi, ce qui vous permet de retranscrire vos fichiers audio dans votre langue préférée. En outre, OCI Speech prend également en charge le modèle OpenAI Whisper, qui peut traiter plus de 57 langues. En savoir plus sur OCI et le modèle Whisper.
OCI Speech prend en charge la diarisation pour organiser, analyser et extraire des informations pertinentes à partir de plusieurs intervenants.
Ne dépendez plus d'offres de transcription tierces et renforcez le contrôle sur vos données grâce à une conformité et une sécurité d'un bout à l'autre.
OCI Speech est un service polyvalent qui peut être appelé via des API REST, différents kits SDK et l'interface de ligne de commande Oracle CLI. Les développeurs peuvent facilement déployer un service vocal évolutif sans avoir nécessairement être experts en data science ou en machine learning.
Oracle Cloud Infrastructure Speech protège la confidentialité de vos clients. Les modèles prédéfinis de reconnaissance vocale automatique transcrivent vos contenus mais ne stockent aucune donnée pour l'entraînement, le débogage ou d'autres fins.
OCI Speech utilise des modèles et une architecture propriétaires qui permettent une conversion rapide de la parole en texte.
Nous avons ajouté une note de confiance par mot afin de pouvoir identifier les mots qui ont potentiellement été mal retranscrits. Utilisez la note de confiance par mot pour déterminer où se concentrer lors de la création d'une application.
Nous avons ajouté un filtre de mots prédéfinis grâce à une liste de grossièretés. Vous pouvez soit masquer, supprimer ou étiqueter les grossièretés.
Notre fonction de reconnaissance vocale en temps réel permet de s'assurer que votre discours est correctement transcrit au fur et à mesure que vous parlez naturellement, ce qui permet une communication fluide et ininterrompue.
Fournissez automatiquement des sous-titres dans le workflow sur la plateforme OCI pour tout le contenu créé et géré par les services de médias numériques. Indexez votre contenu en utilisant OCI Speech pour effectuer facilement des recherches dans votre contenu.
Transcrivez les appels des clients pour faciliter la recherche et l'extraction d'informations. Utilisez OCI Language pour détecter les sentiments et vous aider à identifier l'attrition de clients et les opportunités de formation du personnel.
La transcription en temps réel permet aux médecins et aux infirmières de saisir les notes des patients lorsqu'ils sont en déplacement, ce qui contribue à accroître l'efficacité et à améliorer les soins et les résultats.
La synthèse vocale neuronale fournit une voix semblable à l'humain avec des intonations, offrant plus d'options pour les fonctionnalités d'accessibilité.
Créez, testez et déployez vos applications sur Oracle Cloud, gratuitement.