PISIT' S THAI NATURAL LANGUAGE PROCESSING LABORATORY
This lab is formed since August 26, 1998
e-mail: pisitp@yahoo.com
For C7 members, please check this C7 address list.
KEYWORDS
Thai Natural Language Processing Lab., words
segmentation, dictionaries, algorithms, Thai text-to-speech.
คอมพิวเตอร์พูดได้
โดย
พิสิทธิ์ พรมจันทร์
นักวิเคราะห์ระบบ 3 บริษัทเทเลคอมเอเซียคอร์ป จำกัด (มหาชน)
กล่าวนำ
มนุษย์มีความพยายามที่จะสร้างเครื่องจักรที่สามารถพูดได้มานานหลายทศวรรตทีเดียว ในปี คศ. 1939 ห้องวิจัยเบลแลปผู้มีชื่อเสียงในวงการโทรศัพท์ ได้แสดงผลงานการคิดค้นเครื่องสังเคราะห์เสียงพูดด้วยระบบอิเล็คทรอนิคส์ครั้งแรก โดยให้ชื่ออุปกรณ์นี้ว่า "วูเดอร์" (The Voder) ซึ่งพัฒนาโดย ดูเลย์ (H.W. Dudley) ในงานแสดงสินค้าเวิร์ลแฟร์ของปีนั้น หนังสือพิมพ์นิวยอร์คไทม์ได้อธิบายการทำงานของเครื่องนี้ว่า "พระเจ้าช่วย มันพูดได้" ระบบอะนาลอกเก่า ๆ ตัวนี้คือใบเบิกทางของการทำงานที่เกี่ยวกับการสังเคราะห์เสียงพูดของเบลแลปในยุกต์ต่อ ๆ
มา เช่น งานของคุเกอร์ (Cecil Coker) ในปี 1960 และ โอลีฟ (Joe Olive) ในปี 1970 และอีกหนึ่งความทรงจำที่มีชื่อเสียงของเบลแลปสำหรับงานวิจัยทางด้านนี้คือตัวอย่างที่สร้างโดยเคลลี (John L. Kelly) ในปี 1962 โดยใช้เครื่องคอมพิวเตอร์ไอบีเอ็ม 704 เครื่องสังเคราะห์เสียงของเคลลีได้สร้างเพลง "จักรยานที่ถูกสร้างเพื่อสองคน" ดนตรีประกอบโดยแมททิว (Max Mathews) ในเวลาต่อมาคลาร์ก (Arthur C. Clarke) ได้มาเยี่ยมเพอร์ซี เพื่อนและผู้ร่วมงานในเบลแลปที่เมอรรีฮิลล์ ได้เห็นการแสดงที่น่าทึ่งนี้ จึงได้ใช้ประกอบฉากนวนิยายและหนังเรื่อง "
2001: A Space Odyssey," ในปัจจุบันนี้เครื่องจักรพูดได้เริ่มเป็นส่วนหนึ่งของสังคมมนุษย์มากขึ้น
เทคโนโลยีการประมวลผลเสียงพูด
เทคโนโลยีในด้านนี้สามารถแบ่งออกเป็นสามแบบใหญ่ ๆ คือเทคโนโลยีการบันทึกเสียงพูด (Stored speech) เทคโนโลยีการสังเคราะเสียงพูดจากข้อความ (Text-to-speech) และ เทคโนโลยีการรู้จำเสียงพูด (Speech recognition) แบบแรกเป็นการบันทึกคำ ประโยค หรือ วลี ไว้ในคอมพิวเตอร์แล้วเรียกกลับมาใช้เมื่อต้องการ ตัวอย่างการใช้งานระบบนี้เช่น เครื่องตอบรับโทรศัพท์อัตโนมัติ โอเปอเรเตอร์อัตโนมัติ เป็นต้น แบบที่สองเป็นระบบที่เครื่องคอมพิวเตอร์ สามารถสังเคราะห์เสียงพูด ออกมาได้จากข้อความที่ป้อนเข้าไป โดยจะประกอบไปด้วย ส่วนวิเคระห์ข้อความ (
text analysis) ทำการแยกคำ หาตำแหน่งจบประโยค ตรวจสอบกฎเกณท์ทางภาษาเบื้องต้น ขยายคำย่อ ตัวเลข และสัญลักษณ์ต่าง ๆ เป็นคำ แล้วนำไปผ่านส่วนสังเคราะห์เสียงพูดโดยอาศัยพจนานุกรม โดยจะบันทึกหน่วยเสียงย่อย ๆ เอาไว้ ส่วนประสมเสียงสำหรับคำเฉพาะหรือคำอื่น ๆ ที่ไม่ปรากฎในพจนานุกรม และส่วนปรับแต่งเสียงอื่น ๆ เพื่อเพิ่มความเป็นธรรมชาติ เช่น การออกเสียงสูงต่ำ ความเร็ว ช้า ความดัง เบา เป็นต้น ระบบนี้จะมีประโยชน์สำหรับการช่วยอ่านหนังสือ บทความ หรือ แม้แต่จดหมายอิเล็คทรอนิคส์ สำหรับแบบที่สามเป็นเทคโนโลยีที่เครื่องคอมพิวเตอร์สา
มารถรับรู้และตอบสนองคำสั่งที่เป็นเสียงพูดของมนุษย์ได้ เทคโนโลยีแบบนี้จะใช้เทคนิคขั้นสูงทางด้านปัญญาประดิษฐ์หรือโครงข่ายประสาทเทียม (Neural network) มาช่วย ซึ่งจะสามารถทำให้มนุษย์และเครื่องคอมพิวเตอร์สามารถโต้ตอบกันโดยใช้เสียงพูดได้อย่างสมบูรณ์
คอมพิวเตอร์พูดได้ในปัจจุบัน
เทคโนโลยีคอมพิวเตอร์พูดได้นี้มีบทบาทที่เป็นประโยชน์กับมนุษย์ในหลายทาง เช่นการเชี่อมโยงระบบคอมพิวเตอร์เข้ากับระบบโทรคมนาคมที่เรียกว่า ซีทีไอ (Computer Telephony Integration - CTI) ระบบสื่อประสม (Multi Media) การให้บริการข้อมูลข่าวสารบนอินเตอร์เน็ตและอื่น ๆ อีกมากมาย เทคโนโลยีคอมพิวเตอร์ในปัจจุบันได้ถูกพัฒณาให้สามารถพูดได้อย่างเป็นธรรมชาติในระดับหนึ่งแล้วและสามารถพูดได้หลายภาษาเช่นภาษาอังกฤษ ภาษาฝรั่งเศส ภาษาสเปน ภาษาจีนแมนดาริน เป็นต้น เราสามารถทดลองเทคโนโลยีนี้ได้ที่เวปไซท์ www.bell-labs.com/project/tts ขอ
งเบลแลปส์ หรือที่ http://innovate.bt.com/showcase/laureate/index.htm ของบริทีสเทเลคอม เป็นต้น ซึ่งทาง บรีทีสเทเลคอมให้ชื่อเจ้าเครื่องคอมพิวเตอร์พูดได้นี้ว่า ลอเรียท (Laureate) สำหรับภาษาไทยนั้น นักวิจัยของไทยกำลังค้นคว้าพัฒนาเครื่องคอมพิวเตอร์ที่สามารถพูดภาษาไทยได้ อย่างขะมักเขม้น ท่านสามารถติดตามผลงานทางด้านนี้ได้จากห้องวิจัย PsTNLP ที่เวปไซท์ www.geocities.com/ResearchTriangle/Thinktank/5593/
สรุป
ในอนาคตอันไม่ไกลคอมพิวเตอร์ส่วนบุคคลทุกเครื่องที่วางขายในท้องตลาดจะมีความสามารถพื้นฐานเพิ่มขึ้นอีกหนึ่งประการนั่นคือสามารถพูด อ่านหนังสือ บทความ หรือ จดหมายอิเล็คทรอนิคส์ได้ ซึ่งจะช่วยให้มนุษย์มีความสะดวกสบายเพิ่มขึ้นในการที่จะรับรู้ เรียนรู้ และวิเคราะห์ข้อมูลข่าวสารที่เพิ่มขึ้นอย่างมากมายและรวดเร็ว นอกจากนี้เทคโนโลยีคอมพิวเตอร์พูดได้จะช่วยให้การติดต่อสื่อสารของมนุษย์กับมนุษย์หรือมนุษย์กับเครื่องคอมพิวเตอร์ก้าวหน้าไปอีกระดับหนึ่ง
This page hosted by
Get your own Free Home Page