Menú Comunicarse con nosotros Iniciar sesión en Oracle Cloud

Texto a texto (STT) y texto a voz (TTS)

OCI Speech es un servicio de IA que transcribe voz a texto y sintetiza voz a partir de texto. Obtén transcripciones precisas, normalizadas por texto y con registro de hora y voz sintetizada a través de la consola de OCI, los blocs de notas de OCI Data Science y las API de REST, así como CLI o SDK.

Conversa con un experto

Acelera tu viaje de IA con expertos de Oracle
Lleva tus iniciativas de IA al siguiente nivel con el taller Explore AI de Oracle. En este taller tendrás la oportunidad de interactuar directamente con expertos de Oracle AI, explorar las mejores prácticas de IA y obtener los insights que necesitas para acelerar la innovación de IA en tu organización.

Solicita un taller en IA
Texto a voz y transcripción en tiempo real
Las funciones de texto a voz y transcripción en tiempo real tienen ahora una disponibilidad limitada. Descubre cómo crear voz sintetizada a partir de un texto y recibir una transcripción precisa al instante.

Lee la publicación del blog
Mira cómo funciona
Descubre cómo interactúan los componentes de un sistema típico para permitir que OCI Speech transcriba el lenguaje natural.

Mira la arquitectura de referencia
Prueba OCI Speech de forma gratuita
Crea, prueba e implementa aplicaciones en Oracle Cloud de forma gratuita con un crédito en la nube de 300 dólares.

Prueba Oracle Cloud (modo gratuito)

Características de OCI Speech

Modelos de lenguaje y acústicos predefinidos

OCI Speech utiliza el reconocimiento automático de voz, un proceso de aprendizaje profundo, para obtener una transcripción precisa de las conversaciones naturales. Empieza utilizando modelos acústicos y lingüísticos predefinidos que no requieren experiencia previa en ciencia de datos.

Analiza datos de archivos de audio y video

Busca, indexa y descifra los datos escondidos en tus archivos de audio. Convierte conversaciones grabadas en audio a datos textuales para su análisis por medio de servicios de IA. Por ejemplo, utiliza OCI Language para recuperar la percepción y las capacidades de detección de anomalías de OCI Speech para identificar oportunidades de pérdida de clientes.

Transcripción en tiempo real

La función de transcripción en tiempo real de OCI Speech te permite enviar transmisiones de audio y recibir transcripciones precisas en segundos.

Conversión neuronal de texto a voz (TTS)

Ahora en disponibilidad limitada, la función de texto a voz de OCI Speech te permite sintetizar voz similar a la humana a partir de texto en todas las aplicaciones. Esta función permite conversaciones con clientes, traducciones de voz en varios idiomas y una mejor accesibilidad. Elige entre una variedad de voces para mejorar las interacciones.

Asistencia nativa con diversos idiomas

Los modelos OCI Speech ASR son copatibles con inglés, español, portugués, alemán, francés, italiano e hindi, lo que te permite transcribir tus archivos de audio en el idioma que prefieras. Además, OCI Speech también admite el modelo OpenAI Whisper, que proporciona más de 57 idiomas compatibles listos para usar. Obtén más información sobre OCI y el modelo Whisper.

Diarización para una mayor legibilidad y comprensión

OCI Speech admite la diarización para organizar, analizar y extraer información significativa de varios oradores.

Servicio de transcripción integrado

No dependas de soluciones de transcripción de terceros y logra un mayor control de los datos con cumplimiento normativo y seguridad integrales.

Fáciles de integrar

OCI Speech es un servicio versátil al que se puede llamar mediante API de REST, diferentes SDK y Oracle CLI. Los desarrolladores pueden desplegar fácilmente un servicio de voz escalable sin tener experiencia en ciencia de datos o aprendizaje automático.

Diseño centrado en la seguridad y la privacidad

Oracle Cloud Infrastructure Speech protege la privacidad de nuestros clientes. Una serie de modelos de reconocimiento automático del habla predefinidos transcriben tu contenido, pero no almacenan datos con fines de formación o de depuración de errores.

Servicio de transcripción integrado

OCI Speech utiliza modelos y arquitectura propios que permiten una rápida conversión de voz a texto.

Puntuación de confianza por palabra

Hemos agregado una puntuación de confianza por palabra para que identifiques palabras que podrían haberse transcrito incorrectamente. Utiliza la puntuación de confianza de palabras para determinar en qué aspectos debes centrarte a la hora de desarrollar una aplicación.

Filtros de lenguaje obsceno

Hemos agregado filtros de palabras predefinidos que utilizan una lista organizada de palabras obscenas. Puedes ocultar, eliminar o etiquetar las palabras obscenas.

Nuestra función de reconocimiento de voz en tiempo real ayuda a garantizar que su voz se transcriba con precisión mientras hablas de forma natural, lo que permite una comunicación fluida e ininterrumpida.

Michael Zhang, director principal sénior de productos de Oracle

Lee la publicación del blog

Casos de uso de OCI Speech

Búsqueda de contenido de medios digitales y subtítulos

Proporciona automáticamente subtítulos integrados al flujo de trabajo en OCI Platform para todo el contenido creado y revisado por los servicios de medios digitales. Indexa el contenido con OCI Speech para facilitar la búsqueda en todo tu contenido.

Análisis de llamadas y comentarios de clientes

Transcribe las llamadas de los clientes para buscar y recuperar la información de forma sencilla. Utiliza OCI Language para detectar opiniones y ayudar a identificar las oportunidades de captación de clientes y formación del personal.

Dictado médico

La transcripción en tiempo real permite a los médicos y enfermeras capturar las notas del paciente sobre la marcha, lo que ayuda a aumentar la eficiencia y mejorar la atención y los resultados.

Mejor accesibilidad

La conversión neuronal de texto a voz proporciona una voz de alta precisión, similar a la humana con entonaciones, proporcionando más opciones para las funciones de accesibilidad.

Recursos de OCI Speech

Documentación
- Documentación de OCI Speech
- Arquitectura de referencia de OCI Speech
Productos relacionados
- OCI Language
  Capacidades de inteligencia artificial y aprendizaje automático para detectar idiomas y proporcionar análisis de sentimientos en tu texto no estructurado.
- Oracle Digital Assistant
  Construye interfaces conversacionales para tus aplicaciones.

Conoce OCI Speech

Oracle Cloud (modo gratuito)

Crea, comprueba e implementa aplicaciones en Oracle Cloud de forma gratuita.

Prueba Oracle Cloud (modo gratuito)