تحويل الحديث إلى نص (STT) والنص إلى حديث (TTS)

OCI Speech هي خدمة ذكاء اصطناعي تقوم بنسخ الحديث إلى نص وصياغة الحديث من النص. احصل على نسخ دقيقة ومطبعة زمنيًا وصوت مجمع عبر وحدة تحكم OCI ودفاتر ملاحظات علوم بيانات OCI وواجهات برمجة تطبيقات REST، بالإضافة إلى واجهات سطر الأوامر أو مجموعات تطوير البرامج.

ميزات OCI Speech

نماذج صوتية ولغوية سابقة الإنشاء

يستخدم OCI Speech التعرف التلقائي على الكلام، وهي عملية تعلم عميق، لاشتقاق نسخ دقيق من المحادثات الطبيعية. ابدأ الآن بسهولة باستخدام النماذج الصوتية واللغة السابقة الإنشاء التي لا تتطلب تجربة علوم البيانات الحالية.

تحليل البيانات من ملفات الصوت والفيديو

بيانات البحث والفهرسة والبيانات التي تتعلق بفك التشفير في الملفات الصوتية لديك. تحويل المحادثات الصوتية المسجلة إلى بيانات نصية لتحليلها باستخدام خدمات الذكاء الاصطناعي. على سبيل المثال، استخدم لغة OCI لاسترداد التوجه وإمكانات اكتشاف حالات الشذوذ في OCI Speech لتحديد فرص فقدان العميل.

النسخ في الوقت الحقيقي

الآن في ظل توفر محدود، تتيح لك ميزة النسخ في الوقت الحقيقي لتقنية OCI Speech إرسال تدفقات صوتية وتلقي نسخ دقيق في ثوانٍ.

تحويل النص العصبي إلى كلام (TTS)

الآن، في ظل توفر محدود، تتيح ميزة تحويل النص إلى حديث في OCI Speech للمطورين صياغة الحديث المماثل للبشر من النص عبر التطبيقات. تتيح هذه الميزة محادثات العملاء والترجمات الصوتية متعددة اللغات وتحسين إمكانية الوصول. اختر من بين مجموعة متنوعة من الأصوات لتعزيز التفاعلات.

الدعم المحلي المتعدد اللغات

تدعم نماذج OCI Speech ASR الإنجليزية والإسبانية والبرتغالية والألمانية والفرنسية والإيطالية والهندية، ما يتيح لك نقل ملفاتك الصوتية بلغتك المفضلة. بالإضافة إلى ذلك، تدعم OCI Speech أيضًا نموذج OpenAI Whisper، الذي يوفر أكثر من 57 لغة مدعومة جاهزة. اكتشف المزيد عن OCI ونموذج Whisper‏.

تقسيم المقاطع الصوتية من أجل زيادة إمكانية القراءة والفهم

يدعم OCI Speech تقسيم المقاطع الصوتية لتنظيم وتحليل واستخراج معلومات ذات معنى من متحدثين متعددين.


خدمة نقل مدمجة

تخلص من الاعتماد على عروض تدوينات الأطراف الثالثة، وتمتع بمزيد من التحكم في بياناتك من خلال الأمان والتوافق الشاملين.

سهولة الدمج

تعد خدمة OCI Speech متعددة الاستخدامات يمكن استدعاؤها عبر واجهات برمجة تطبيقات REST ومختلف وحدات SDK وOracle CLI. يمكن للمطورين نشر خدمة النطق القابلة للتوسع بسهولة من دون الحصول على علوم البيانات أو خبرة التعلم الآلي.

يكمن الهدف من ذلك في تحقيق الأمن والخصوصية

تحمي Oracle Cloud Infrastructure Speech خصوصية عملائنا. تقوم نماذج التعرف التلقائي على الكلام المدمجة مسبقًا بنسخ المحتوى الخاص بك، ولكن لا تخزن أي بيانات للتدريب أو تصحيح الأخطاء أو لأغراض أخرى.


خدمة نقل مدمجة

تستخدم OCI Speech نماذج وبنية خاصة تتيح التحويل السريع للتحدث إلى نص.

درجة الثقة لكل كلمة

لقد أضفنا درجة ثقة على مستوى الكلمات لمساعدتك على تحديد الكلمات التي ربما تم نسخها بشكل غير صحيح. استخدم مجموع نقاط ثقة الكلمة لتحديد مكان التركيز عند إنشاء تطبيق.

عوامل تصفية الألفاظ النابية

قمنا بإضافة تصفية الكلمات التي تم إنشاؤها مسبقًا باستخدام قائمة مُنسقة من الفرص. يمكنك إخفاء الألفاظ النابية أو إزالتها أو وضع علامة عليها.


27 أبريل 2022

تتوفر الآن علامات الترقيم ونماذج التسميات التوضيحية المغلقة و8 كيلوهرتز لخطاب OCI.

قاي ميكيلي، مدير منتجات أول

اليوم، يسعدنا الإعلان عن ثلاث قدرات جديدة لخدمة الكلام دون أي تكلفة إضافية: الدعم الأصلي لملفات الصوت 8kHz، ودعم الإخراج في SRT (تنسيق ملف تعليق مغلق)، والترقيم التلقائي لنص الإخراج. تتوفر هذه الإمكانات الجديدة الآن في جميع المناطق التجارية لـ OCI وهي جزء من التزامنا بتوفير نسخ نقدي عالي الجودة وبأسعار معقولة لعملائنا.

قراءة المقال كاملًا

حالات استخدام OCI Speech

البحث عن محتوى الوسائط الرقمية والتسميات التوضيحية المغلقة

توفير النصوص المكتوبة لتدفق العمل تلقائيًا على منصة OCI لجميع المحتوى الذي تم إنشاؤه وتنسيقه من خلال خدمات الوسائط الرقمية. قم بفهرسة المحتوى باستخدام speech OCI للبحث السهل عبر المحتوى لديك.

تعليقات العميل وتحليلات المكالمات

نسخ الحديث عن مكالمات العملاء لتسهيل البحث عن المعلومات واسترجاعها. استخدم لغة OCI لاكتشاف الميول والمساعدة على تحديد فرص تدريب العملاء والموظفين.

الإملاء الطبي

يتيح النسخ في الوقت الفعلي للأطباء والممرضات تسجيل ملاحظات المرضى أثناء التنقل، ما يساعد على تعزيز الكفاءة وتحسين الرعاية والنتائج.

تحسين إمكانية الوصول

يوفر النص العصبي إلى الحديث صوتًا عالي الدقة مماثلاً لصوت الإنسان مع التعابير، ما يوفر المزيد من الخيارات لميزات إمكانية الوصول.

<!-- <section class="rc24 rc24v0 cpad rw-neutral-10bg"> <div class="rc24w1 cwidth"> <iframe data-src="/cloud/costestimator/#/load&tag=aispeech" class="f24 f24v0" scrolling="no"></iframe> </div> </section> -->

موارد OCI Speech

بدء استخدام OCI Speech


مستوى Oracle Cloud المجاني (Free Tier)

استمتع بإنشاء التطبيقات واختبارها ونشرها على Oracle Cloud مجانًا.