PISIT' S THAI NATURAL LANGUAGE PROCESSING LABORATORY
This lab is formed since August 26, 1998
e-mail: pisitp@yahoo.com
For C7 members, please check this C7 address list.
KEYWORDS
Thai Natural Language Processing Lab., words
segmentation, dictionaries, algorithms, Thai text-to-speech.
การใช้คอมพิวเตอร์อ่านคำภาษาไทย
Thai Text-To-Speech
โดย
ดร. อำไพ พรประเสริฐสกุล
เกรียงชัย จันทร์แสนวิไล
พิสิทธิ์ พรมจันทร์
ภาคิน จิรจินดา
Abstract
Prototype ของ Thai Text-To-speech (TTTS) ที่พัฒณาขึ้นนี้จะอ่านข้อความเป็นประโยคภาษาไทยที่บันทึกอยู่ในคอมพิวเตอร์และอ่านออกเสียงเป็นภาษาไทยที่มีความเป็นธรรมชาติในระดับที่พอรับได้ (Acceptable Naturalness) Prototype ของระบบนี้มีส่วนประกอบ 3 ส่วนคือ 1) Text Analysis ซึ่งจะวิเคราะห์คำ ตัดคำ (Word Separation) และทำการวิเคราะห์ไวยากรณ์แบบ Surface Syntactic Analysis 2) Acoustic Word Inventory ซึ่งเป็นฐานข้อมูลเสียงของคำทั้งหมดที่ใช้ในการทดลอง เสียงของแต่ละคำมีการปรับเปลี่ยน Pitch, Amplitude, Duration รวมทั้ผ่าน Eq
ualization เพื่อตัดเสียงสูงและต่ำออกจากหน่วยเสียง (Phoneme) และส่วนที่ 3) คือ Speech Synthesis โดยใช้โมดูล Word Concatenation จะให้ความเป็นธรรมชาติในระดับหนึ่งเนื่องจากแต่ละคำจะมีการปรับแต่งเสียง คือ Pitch, Amplitude และ Duration อยู่ในตัวแล้ว และใช้ Intelligence จากการวิเคราะห์ไวยากาณ์ของประโยคมาช่วยการกำหนดวรรคตอน (Pause) และการเน้นคำ (Stress) เพื่อให้เกิดความเป็นธรรมชาติในระดับประโยค ขณะนี้ยังอยู่ระหว่างการพัฒนา Prototype และทดสอบผลของการสังเคราะห์เสียงของ Thai Text-To-Speech นี้
เสนอ
สำนักงานคณะกรรมการวิจัยแห่งชาติ
พฤษภาคม 2542
This page hosted by
Get your own Free Home Page