OCI Speech hem konuşmayı metne aktaran hem de konuşmayı metinden sentezleyen bir yapay zeka hizmetidir. OCI Console, OCI Data Science not defterleri ve REST API'lerin yanı sıra CLI'ler veya SDK'lar aracılığıyla doğru, metin normalleştirilmiş, zaman damgalı transkripsiyonlar ve senkronize ses elde edin.
Metinden konuşmaya ve gerçek zamanlı transkripsiyon özellikleri artık sınırlı erişilebilirliğe sahip. Metne dayalı olarak sentetik ses oluşturmayı ve anında doğru transkripsiyonu elde etmeyi keşfedin.
Tipik bir sistemde bulunan bileşenlerin OCI Speech'in doğal dil transkripsiyonuna olanak tanımak için nasıl etkileşim kurduğunu öğrenin.
300 ABD doları değerinde bulut kredisi ile uygulamaları Oracle Cloud üzerinde ücretsiz olarak oluşturun, test edin ve dağıtın.
OCI Speech, doğal konuşmalardan doğru transkripsiyonlar elde etmek için bir derin öğrenme işlemi olan otomatik konuşma algılama yöntemini kullanır. Mevcut veri bilimi deneyimi gerektirmeyen önceden oluşturulmuş akustik ve dil modelleriyle kolayca başlayın.
Ses dosyalarınızda gömülü durumdaki verileri arayın, dizinleyin ve deşifre edin. Kaydedilen sesli konuşmaları, yapay zeka hizmetleriyle analiz etmek için metin verilerine dönüştürün. Örneğin, duyguyu almak için OCI Language'ı ve müşteri kaybı olasılığını belirlemek için OCI Speech'in anormallik algılama özelliklerini kullanın.
Sınırlı kullanılabilirlikte olan OCI Speech'in gerçek zamanlı transkripsiyon özelliği, saniyeler içinde ses akışları gönderip doğru transkripsiyonları almanıza olanak tanır.
Artık sınırlı erişilebilirlikte OCI Speech'teki metinden konuşmaya özelliği, uygulamalar genelinde metinden insan benzeri konuşmaları sentezlemenizi sağlar. Bu özellik müşteri konuşmalarını, çok dilli sesli çevirileri ve gelişmiş erişilebilirliği sağlar. Etkileşimleri geliştirmek için çeşitli sesler arasından seçim yapın.
OCI Speech ASR modelleri İngilizce, İspanyolca, Portekizce, Almanca, Fransızca, İtalyanca ve Hintçe dillerini destekler ve tercih ettiğiniz dilde ses dosyalarınızın transkripsiyonunu almanıza olanak tanır. Ayrıca OCI Speech, kullanıma hazır 57'den fazla desteklenen dil sağlayan OpenAI Whisper modelini de destekler. OCI ve Whisper modeli hakkında daha fazla bilgi edinin.
OCI Speech, birden fazla konuşmacıdan anlamlı bilgiler düzenlemek, analiz etmek ve ayıklamak için parçalara ayırmayı destekler.
Üçüncü taraf transkripsiyon ürünlerine bağımlılığınızı ortadan kaldırın. Uçtan uca güvenlik ve yasalarla uyumluluk ile verileriniz üzerinde daha fazla kontrole sahip olun.
OCI Speech REST API'ler, farklı SDK'ler ve Oracle CLI ile çağrılabilen çok yönlü bir hizmettir. Geliştiriciler, veri bilimi veya makine öğrenimi uzmanlığı olmadan, ölçeklenebilir bir konuşma hizmetini kolayca konuşlandırabilir.
Oracle Cloud Infrastructure Speech, müşterilerimizin gizliliğini korur. Önceden oluşturulmuş otomatik konuşma tanıma modelleri içeriğinizin transkripsiyonunu yapar ancak eğitim, hata ayıklama veya diğer amaçlarla hiçbir veriyi depolamaz.
OCI Speech, konuşmayı hızla metne dönüştürmeyi sağlayan özel bir mimari ve modeller kullanır.
Yanlış yazılmış olabilecek sözcükleri belirlemenize yardımcı olması için sözcük düzeyinde bir güven puanı ekledik. Uygulama oluştururken hangi noktalara odaklanacağınıza karar vermek için sözcük güvenilirlik puanından yararlanın.
Bir küfür listesi kullanarak önceden oluşturulmuş sözcük filtresi ekledik. Küfürleri maskeleyebilir, kaldırabilir ya da etiketleyebilirsiniz.
Guy Michaeli, Kıdemli Baş Ürün Yöneticisi
Bugün, Speech hizmeti için hiçbir ek ücret ödemeye gerek olmayan üç yeni özelliği duyurmaktan mutluluk duyuyoruz: 8 kHz ses dosyaları için yerel destek, SRT'de çıktı desteği (kapalı altyazı dosyası biçimi) ve nihai metnin otomatik noktalanması. Bu yeni özellikler artık OCI'nin tüm ticari bölgelerinde mevcuttur ve müşterilerimiz için yüksek kaliteli, uygun maliyetli transkripsiyon sağlama taahhüdümüzün bir parçasıdır.
Makalenin tamamını okuyunDijital medya hizmeti tarafından yaratılan ve seçilen tüm içerikler için OCI platformunun iş akışı içinde altyazıları otomatik olarak sağlayın. İçeriğinizde kolayca arama yapmak için OCI Speech'i kullanarak içeriğinizi dizinleyin.
OCI Speech, bilgilerin kolayca aranabilmesi ve alınabilmesi için müşteri aramalarının transkripsiyonunu yapabilir. OCI Language ve Anomaly Detection'ı birlikte kullanarak duyguları tespit edin, müşteri kaybını ve personel eğitim fırsatlarını belirleyin.
Uygulama yazılımlarını Oracle Cloud'da ücretsiz olarak oluşturun, test edin ve dağıtın.