بسم الله الرحمـن الرحيم

31

description

بسم الله الرحمـن الرحيم. 428 عال (تعريب الحاسبات) عنوان البحث ( تحويل النصوص العربية إلى صوت ) أ سماء المجموعة: منصور العثمان ياسر النخلي ماجد الشمري. مقدمة. ما هو برنامج تحويل النص إلى صوت؟ - PowerPoint PPT Presentation

Transcript of بسم الله الرحمـن الرحيم

Page 1: بسم الله الرحمـن الرحيم
Page 2: بسم الله الرحمـن الرحيم

بسم الله الرحمـن الرحيم

عال )تعريب الحاسبات(428عنوان البحث

) تحويل النصوص العربية إلى صوت (

أسماء المجموعة:منصور العثمانياسر النخليماجد الشمري

Page 3: بسم الله الرحمـن الرحيم

مقدمة

ما هو برنامج تحويل النصإلى صوت؟

-Text-To"تحويل النص إلى صوت Speech ويمكن اختصارها إلى

TTS هو برنامج حاسوبي يقوم بقراءة النص و من ثم نطق

النص بصوت مرتفع ، سواء تم إدخال النص من المستخدم

مباشرة أو عن طريق تمرير ملف نصي سبق كتابته باستخدام

برامج الكتابة النصية المختلفة."

Page 4: بسم الله الرحمـن الرحيم

TTSتاريخ برامج التحويل

1 -Apple : أول النظم التي تدعم OكانتTTS و م باستخدام برنامج 1984ذلك في سنة

MacInTalk و تم تطويرها بإضافة عينات صوتية أكثر جودة و حاليا تم االعتماد على

Mac في أنظمة تشغيل VoiceOverبرنامج OS X.

2 -Microsoft : طريق برامج Oكانت بدايتها عن( Oالثالث OالطرفAdd-On و كان ذلك لنظام )

و من إصدار Win 98 و Win 95التشغيل Win2000 Oأصبح ال TTS.النظام Oجزء من

Page 5: بسم الله الرحمـن الرحيم

؟TTSمن يستخدم برامج :من يعاني من مشكلة القراءة

.المكفوفين )1.الذين يعانون من ضعف النظر )2

.)Dyslexia( من يعاني من اضطراب القراءة )3.األميين )4

:من يستخدمها للتسهيل في العمل سماع الملف أثناء االنشغال بأمور أخرى مثل: )1

.)القيادة , العمل اليدوي .... الخ(.للذين ترهقهم القراءة لفترة طويلة )2

Page 6: بسم الله الرحمـن الرحيم

؟TTSمن يستخدم برامج

:من يستخدمونها تجاريا( بعض الشركات تستخدم هذه البرامج 1

للرد اآللي )هاتف خدمة العمالـء(.

( استخدام بعض الشركات لهذه البرامج 2 من شركة Kindleلتطوير أجهزتها )جهاز

Amazon.)

Page 7: بسم الله الرحمـن الرحيم

TTSأبرز المشاكل و الصعوبات التي ظهرت لدى

حروف تنطق وال تكتب و حروف 1(تكتب وال تنطق.

عالمات الضبط بالشكل.2(قراءة األرقام.3(االختصارات.4(النطق الصحيح للكلمة 5(

Pronunciation.

Page 8: بسم الله الرحمـن الرحيم

المراحل التي تمر بها عملية تحويل النصوص إلى صوت

واألدوات المستخدمة.

المرحلة األولى : تحليل النص

المرحلة الثانية: توليد الكالم

Page 9: بسم الله الرحمـن الرحيم

المرحلة األولى: تحليل النص

:Text Normalization- تطبيع النص 1

تقسيم الجملة إلى عدة كلمات معمراعاة الفارق الزمني.

.تفسير األرقام أو الرموز .عزل الكلمات ضمن النص.معالجة عالمات الترقيم مراعاة ما إذا كان هناك الم شمسية أو

شدة أو مد ... إلخ.

Page 10: بسم الله الرحمـن الرحيم

المرحلة األولى: تحليل النص2 إزالة الغموض الكتابي - Homograph

Disambiguation:

.إعراب الكلمة بشكل صحيح

:Word Pronunciation- نطق الكلمة 3

انتاج سلسلة من المقاطع الصوتية )الترميزات (.phonemesالصوتية

Page 11: بسم الله الرحمـن الرحيم

المرحلة األولى: تحليل النص4 العروض - Prosody: العروض هو عبارة عن تحديد حدة وسرعة "

وحجم الصوت الذي يستخدم لنطق المقاطع " الصوتية والكلمات والجمل

. البحث عن عالمات الترقيم.تركيب وترتيب هذه المعلومات مع بعضها.توليد النص الكلي الناتج النهائي: قائمة من الترميزات الصوتية مع

الحدة والسرعة والحجم لكل مقطع.

Page 12: بسم الله الرحمـن الرحيم

المرحلة الثانية: توليد الكالم 1 تشغيل الصوت - play Audio :

:طريقة تسجيل الترميزات الصوتيةالمشكلة:

حدة وسرعة الصوت عند نهاية الكلمة تختلف عنها في حال ورود الفونيم في بداية الكلمة.

التقليل من الخلل عن طريق دمج حواف الحل: المقطعين.

Page 13: بسم الله الرحمـن الرحيم

المرحلة الثانية: توليد الكالم

:المشكلة الصوت المنطوق لكل فونيم

)ترميز صوتي( يتأثر بشكل واضح بالترميزات الصوتية المحيطة به.

:الحل تسجيل جميع المقاطع الصوتية

الممكنة لكل ترميز

Page 14: بسم الله الرحمـن الرحيم

المرحلة الثانية: توليد الكالم

2 توليد الصوت - Generating the Voice:

قراءة مقاطع نصية تحتوي على جميعاالحتماالت الممكنة للفونيمات.

تمرـير النص الناتج إلى برنامج يتعرف علىالصوت.

.تخزين المقاطع الصوتية في قاعدة البيانات

Page 15: بسم الله الرحمـن الرحيم

المرحلة الثانية: توليد الكالم3 تحضير التسجيالت الصوتية - Preparing of the

Record:

أ - تسجيل جميع المقاطع الممكنة في الـلغة العربية. مقطع 2000تحتاج إلى تسجيل ما يفوق على من عيوبها:

صوتي لتغطية اللغة .من مميزاتها أنها ذات نتائج دقيقة

ب - تسجيل الحرف والحركة بشكل منفصل ملف صوتي31تسجيل فصل الحركات عن األحرفمن عيوبها: أنها تفتقرإلى الدقة

Page 16: بسم الله الرحمـن الرحيم

المرحلة الثانية: توليد الكالم

ج – تسجيل كل حرف مع جميعالحركات الممكنة.

ملف صوتي.115تسجيل

Page 17: بسم الله الرحمـن الرحيم

المرحلة الثانية: توليد الكالم

Generating - توليد الترميز الصوتي للنص المنطوق 4 graphemes:

الجدول التالي يوضح الطريقة التي تستخدم في الترميز

Page 18: بسم الله الرحمـن الرحيم

المرحلة الثانية: توليد الكالم

:مثال + أ 1*االلف تمثل ب 1*الفتحه تمثل بالرقم 1_1*تصبح النتيجة

O1 الفتحة ب O2 والضمة ب Oوالسكون 3والكسرة ب O4ب

Page 19: بسم الله الرحمـن الرحيم

قواعد النطق في اللغة العربية

-الالم القمرية والالم الشمسية :1اذا تليت بأحد الحروف -الالم القمرية: 1.1

االربعة عشر المجموعه في )ابلغ حجك وخف عقيمه(.

اذا تليت بأحد الحروف -الالم الشمسية: 2.2 االربعة عشر وهي )ط، ث، ص، ر، ت، ض،

ذ، ن، د، س، ظ، ز، ش، ل).

Page 20: بسم الله الرحمـن الرحيم

قواعد النطق في اللغة العربية

في حالة ورود التنوين على أحد التنوين: -2الحروف ـغير المعتله يمكن تقسيمها

كالتالي: : يستبدل التنوين بضمة يليها تنوين الضم

نون ساكنة.)بيت كبير( تصبح )بيتن كبير (. :يستبدل التنوين بفتحة يليها تنوين الفتح

نون ساكنة. : يستبدل التنوين بكسر يليها تنوين الكسر

نون ساكنة.في حال ورود التنوين على االلف مالحظة:

نقوم بحذف األلف والنون ونستبدلهما بنون ساكنة مثل )سالما( تصبح )سالمن(

Page 21: بسم الله الرحمـن الرحيم

قواعد النطق في اللغة العربية

يمكن حذف حرف المد اذا -حروف المد : 3تاله في الكلمة التالية حرف ساكن عند الوقف

عليه مثل )في البيت ( تصبح )فلبيت(. أيضا يمكن حذف المد اذا تاله في الكلمة تنوين

ساكن مثل )فتى ( لتصبح )فتن(.

تقرأ هاء إذا تم الوقف عليها عند -تاء التأنيث: 4النطق . وتنطق تاء اذا تم وصلها في النطق.

Page 22: بسم الله الرحمـن الرحيم

قواعد النطق في اللغة العربية

-فك المد والتضعيف :5- الشدة في اللغة الغربية توضح بأنه يجب 5.1

لفظ الحرف مرتين .فيتم استبدال الشدة بحرف ساكن من نفس الحرف ويحافظ

الحرف الذي عليه حركت الشده على حركتة. مثل ” السالم ” تصبح ” السسالم“.

- المد يفك الى عناصره المفردة أي همزة 5.2“مع ألف مدية . مثل ” آمين ” تصبح ”أامين

Page 23: بسم الله الرحمـن الرحيم

استحصال الرموز Tokenization

خطوات استحصال الرموز:-مسح كامل النص وتحديد الكلمات.1-وضع فواصل بين الكلمات وتحديد حركة كل 2

حرف .-يوضع سكون للحرف الذي اليملك حركة.3

5 و 2يمكن تطبيق القواعد السابقه رقم على هذه الطريقة.

Page 24: بسم الله الرحمـن الرحيم

Graphemeتوليد الترميز الصوتي

تحديد مواضع احرف المد عن طريقمسح مخرجات الخطوة االولى .

4 و 3 و1تطبيق القواعد. يتم تعيين مواضع الوقف بين الكلمات

ليتم توليد الترميز الصوتي ) أسماء الملفات الصوتية ( لكل حرف سيتم

نطقه.

Page 25: بسم الله الرحمـن الرحيم

أهم أشهر البرامج في مجال تحويل الصوت.

:البرنامج العربيلألسف الشديد اليوجد برنامج عربي كامل للتحويل ولكن يوجد

هناك طرق يمكن اتباعها لكي نطوع البرامج االجنبية لتلبي احتياجاتنا . ويمكن استخدام البرامج التاليه لكي تساعدنا في

Euler + MBROLAعملية التحويل وهي وخطوات تشغيل اللغة العربيه في هذا البرنامج هي كالتالي:

-تحميل المكتبة الصوتية الخاصه في اللـغة العربيه من خالل 1الرابط التالي

http://tcts.fpms.ac.be/synthesis/mbrola/dba/ar1/ar1-981103.zip

Page 26: بسم الله الرحمـن الرحيم

أهم وأشهر برنامج تحويل النص الى صوت

باالضافة الى تحميل المكتبة االخرى من الرابط التاليhttp://

tcts.fpms.ac.be/synthesis/mbrola/dba/ar2/ar2-001015.zip

من MBROLA Toolsبعد ذلك يجب تحميل برنامج الرابط التالي

http://tcts.fpms.ac.be/synthesis/mbrola/mbrolatools.html

بعد التثبيت يتم اضافة قواعد البيانات للمكتبتين الصوتيتين من خالل الضغط على اضافة قاعدة

MBOROLAالموجود في

Page 27: بسم الله الرحمـن الرحيم

أهم وأشهر برنامج تحويل النص الى صوت

بعد االنتهاء من تثبيت المكتبتين يمكن االن فتح البرنامجEuler v2.0 ومن ثم كتابة النص الذي تريده والصوره.التاليه توضح الشكل العام للبرنامج بعد تثبيت المكتبات

الصوتية المكتبة اختيار يمكن هنا

تريد الذي النص كتابة يمكن هنا

النص قراءة يمكن هنا من

Page 28: بسم الله الرحمـن الرحيم

أهم أشهر البرامج في مجال .تحويل الصوت

البرنامج االنجليزي: لتحويل النص Text Speakerبرنامج

االنجليزي إلى صوت اإلصدار الثالثة ويمكن تحميل نسخه منه عن طريق

http://www.brothersoft.com/text-speaker-173158.html

واجهة البرنامج :

Page 29: بسم الله الرحمـن الرحيم

أهم أشهر البرامج في مجال .تحويل الصوت

Page 30: بسم الله الرحمـن الرحيم

أهم أشهر البرامج في مجال .تحويل الصوت

أهم مايميز البرنامج :-.استخدامه سهل و بسيط يمكن تغيير الصوت من بين الجنسين و-

تعديل سرعة القراءة و قوة الصوت و حدته. بإمكان البرنامج فتح ملفات بصيغ-

(.pdf , .txt , .doc , .docx , .html و )القراءة منها مباشرتا.

يمكن حفظ الصوت إما بصيغة-MP3 أو WAV

Page 31: بسم الله الرحمـن الرحيم

الخالصة من خالل هذا البحث يتضح لنا بعض األمور الجديدة

التي قد تساعد المستخدمين بشكل عام و المبرمجين بشكل خاص على كيفية عمل برامج

التحويل النص إلى صوت و يمكن أيضا االستفادة من هذه المعلومات لعمل برنامج يقوم بتحويل الصوت إلى نص )عملية عكسية تقريبا(. و من

خالل التطور المستمر لهذه البرامج يمكن أن نرى في المستقبل برامج تقارب الواقع إلى حد كبير

في نطق و قراءة النص بدون المشاكل التي ذكرناها سابقا.

ولألسف لم نجد برامج تدعم اللغة العربية ذاتجودة عالية يمكن استخدامها لألعمال اليومية بمستوى البرامج التي تدعم اللغة االنجليزية و نتمنى من الشركات العربية تطوير مثل هذه

البرامج للحفاظ على الطابع العربي في مجال الحاسب و التطور التقني.