Konuşmadan metne (STT) ve metinden konuşmaya (TTS)

OCI Speech hem konuşmayı metne aktaran hem de konuşmayı metinden sentezleyen bir yapay zeka hizmetidir. OCI Console, OCI Data Science not defterleri ve REST API'lerin yanı sıra CLI'ler veya SDK'lar aracılığıyla doğru, metin normalleştirilmiş, zaman damgalı transkripsiyonlar ve senkronize ses elde edin.

OCI Speech özellikleri

Önceden oluşturulmuş ses ve dil modelleri

OCI Speech, doğal konuşmalardan doğru transkripsiyonlar elde etmek için bir derin öğrenme işlemi olan otomatik konuşma algılama yöntemini kullanır. Mevcut veri bilimi deneyimi gerektirmeyen önceden oluşturulmuş akustik ve dil modelleriyle kolayca başlayın.

Ses ve video dosyalarından veri analiz edin

Ses dosyalarınızda gömülü durumdaki verileri arayın, dizinleyin ve deşifre edin. Kaydedilen sesli konuşmaları, yapay zeka hizmetleriyle analiz etmek için metin verilerine dönüştürün. Örneğin, duyguyu almak için OCI Language'ı ve müşteri kaybı olasılığını belirlemek için OCI Speech'in anormallik algılama özelliklerini kullanın.

Gerçek zamanlı transkripsiyon

Sınırlı kullanılabilirlikte olan OCI Speech'in gerçek zamanlı transkripsiyon özelliği, saniyeler içinde ses akışları gönderip doğru transkripsiyonları almanıza olanak tanır.

Nöral metin okuma (TTS)

Artık sınırlı erişilebilirlikte OCI Speech'teki metinden konuşmaya özelliği, uygulamalar genelinde metinden insan benzeri konuşmaları sentezlemenizi sağlar. Bu özellik müşteri konuşmalarını, çok dilli sesli çevirileri ve gelişmiş erişilebilirliği sağlar. Etkileşimleri geliştirmek için çeşitli sesler arasından seçim yapın.

Yerel çoklu dil desteği

OCI Speech ASR modelleri İngilizce, İspanyolca, Portekizce, Almanca, Fransızca, İtalyanca ve Hintçe dillerini destekler ve tercih ettiğiniz dilde ses dosyalarınızın transkripsiyonunu almanıza olanak tanır. Ayrıca OCI Speech, kullanıma hazır 57'den fazla desteklenen dil sağlayan OpenAI Whisper modelini de destekler. OCI ve Whisper modeli hakkında daha fazla bilgi edinin.

Daha fazla okunabilirlik ve anlayış için parçalara ayırma

OCI Speech, birden fazla konuşmacıdan anlamlı bilgiler düzenlemek, analiz etmek ve ayıklamak için parçalara ayırmayı destekler.


Entegre transkripsiyon hizmeti

Üçüncü taraf transkripsiyon ürünlerine bağımlılığınızı ortadan kaldırın. Uçtan uca güvenlik ve yasalarla uyumluluk ile verileriniz üzerinde daha fazla kontrole sahip olun.

Kolay entegrasyon

OCI Speech REST API'ler, farklı SDK'ler ve Oracle CLI ile çağrılabilen çok yönlü bir hizmettir. Geliştiriciler, veri bilimi veya makine öğrenimi uzmanlığı olmadan, ölçeklenebilir bir konuşma hizmetini kolayca konuşlandırabilir.

Güvenlik ve gizlilik için amaca özel oluşturuldu

Oracle Cloud Infrastructure Speech, müşterilerimizin gizliliğini korur. Önceden oluşturulmuş otomatik konuşma tanıma modelleri içeriğinizin transkripsiyonunu yapar ancak eğitim, hata ayıklama veya diğer amaçlarla hiçbir veriyi depolamaz.


Entegre transkripsiyon hizmeti

OCI Speech, konuşmayı hızla metne dönüştürmeyi sağlayan özel bir mimari ve modeller kullanır.

Her sözcük için güvenilirlik puanı

Yanlış yazılmış olabilecek sözcükleri belirlemenize yardımcı olması için sözcük düzeyinde bir güven puanı ekledik. Uygulama oluştururken hangi noktalara odaklanacağınıza karar vermek için sözcük güvenilirlik puanından yararlanın.

Küfür filtreleri

Bir küfür listesi kullanarak önceden oluşturulmuş sözcük filtresi ekledik. Küfürleri maskeleyebilir, kaldırabilir ya da etiketleyebilirsiniz.


27 Nisan 2022

Noktalama, Kapalı Altyazılar ve 8kHz modelleri artık OCI Speech için kullanılabilir.

Guy Michaeli, Kıdemli Baş Ürün Yöneticisi

Bugün, Speech hizmeti için hiçbir ek ücret ödemeye gerek olmayan üç yeni özelliği duyurmaktan mutluluk duyuyoruz: 8 kHz ses dosyaları için yerel destek, SRT'de çıktı desteği (kapalı altyazı dosyası biçimi) ve nihai metnin otomatik noktalanması. Bu yeni özellikler artık OCI'nin tüm ticari bölgelerinde mevcuttur ve müşterilerimiz için yüksek kaliteli, uygun maliyetli transkripsiyon sağlama taahhüdümüzün bir parçasıdır.

Makalenin tamamını okuyun

OCI Speech kullanım senaryoları

  • Müşteri geri bildirim analitikleri

  • Dijital Medya içeriği arama ve altyazılar

    Dijital medya hizmeti tarafından yaratılan ve seçilen tüm içerikler için OCI platformunun iş akışı içinde altyazıları otomatik olarak sağlayın. İçeriğinizde kolayca arama yapmak için OCI Speech'i kullanarak içeriğinizi dizinleyin.

  • Çağrı merkezleri, çağrı analitiği

    OCI Speech, bilgilerin kolayca aranabilmesi ve alınabilmesi için müşteri aramalarının transkripsiyonunu yapabilir. OCI Language ve Anomaly Detection'ı birlikte kullanarak duyguları tespit edin, müşteri kaybını ve personel eğitim fırsatlarını belirleyin.

OCI Speech kaynakları

OCI Speech kullanmaya başlayın


Oracle Cloud Free Tier

Uygulama yazılımlarını Oracle Cloud'da ücretsiz olarak oluşturun, test edin ve dağıtın.