PISIT' S THAI NATURAL LANGUAGE PROCESSING LABORATORY
This lab is formed since August 26, 1998
e-mail: pisitp@yahoo.com
For C7 members, please check this C7 address list.

KEYWORDS
Thai Natural Language Processing Lab., words segmentation, dictionaries, algorithms, Thai text-to-speech.
เพิ่มระดับความเป็นมนุษย์ให้เครื่องคอมพิวเตอร์
พิสิทธิ์ พรมจันทร์
นักวิเคราะห์ระบบ
บริษัท เทเลคอมเอเซีย คอร์ปอเรชั่น จำกัด (มหาชน)

กล่าวนำ
กว่าครึ่งศตรรษนับตั้งแต่มนุษย์ประดิษฐ์เครื่องคอมพิวเตอร์เครื่องแรกออกมาใช้งาน เราก็เริ่มเก็บข้อมูลต่าง ๆ นา ๆ ลงไป ไม่ว่าจะเป็นข้อมูลดิบสำหรับการทดลองทางวิทยาศาสตร์ รายงานการค้นคว้าวิจัย ฐานข้อมูลลูกค้า ข่าวประจำวันล่าสุด ผลการแข่งขันกีฬา รายงานสภาพ อากาศ ราคาเสนอขายหุ้น โฆษณาสินค้า ตารางการบิน รายการภาพยนต์ของโรงภาพยนต์ใกล้ บ้าน กฎหมายต่าง ๆ เป็นต้น จนกระทั่งเครือข่ายอินเตอร์เน็ตปรากฏออกมาในราวปี ค.ศ. 1969 โดยเฉพาะอย่างยิ่งเมื่อ นายทิม เบอร์เนอร์ ลี คิดค้นโปรโตคอลการสื่อสารสำหรับเครือ ข่ายใยแมงมุม (World-Wide-Web) ขึ้นมาในปี คศ. 1989 ข้อมูลต่าง ๆ ที่เราต่างเก็บรวบรวม กันไว้ ได้ไหลเชื่อมโยงเข้าด้วยกันเปรียบประดุจกระแสเลือดไหลหล่อเลี้ยงตามจุดต่าง ๆ ของ เซลสมองกลายมาเป็นคลังความรู้ที่ใหญ่โตมหาศาล ตราบจนถึงทุกวันนี้มนุษย์เราใช้ความรู้จาก แหล่งความรู้ที่ยิ่งใหญ่นี้น้อยมากเนื่องจากข้อจำกัดในการสื่อสารระหว่างมนุษย์กับเครื่อง คอมพิวเตอร์ กล่าวคือในการที่จะได้มาของข้อมูลมนุษย์จะต้องพิมพ์คำสั่งลงบนแป้นพิมพ์และ อ่านผลการสืบค้นข้อมูลจากหน้าจอคอมพิวเตอร์เท่านั้น มีกลุ่มนักวิทยาศาสตร์ที่ห้องวิจัยระบบ ภาษาพูด (SLS: SPOKEN LANGUAGE SYSTEM LABORATORY) ของสถาบันเทคโนโลยีเอ็มไอที (www.sls.lcs.mit.edu) ได้พยายามทำลายข้อจำกัดเหล่านี้ออกไป

เพิ่มความสามารถในการพูดและฟังให้กับคอมพิวเตอร์
นักวิทยาศาสตร์กลุ่มนี้ได้ประดิษฐ์เครื่องคอมพิวเตอร์ที่สามารถฟังและโต้ตอบกับมนุษย์ ได้ทางสายโทรศัพท์โดยให้ชื่อว่าจูปีเตอร์ เจ้าเครื่องนี้มีความสามารถในการทำนายสภาพอากาศ ของมลรัฐต่าง ๆ ทั่วอเมริกาและอีกหลายเมืองของโลก ผู้ใช้งานอาจป้อนคำถามหลังจากหมุน โทรศัพท์ไปหาเจ้าจูปีเตอร์จากสนามบินว่า ผมอยากทราบผลการทำนายสภาพภูมิอากาศของ เมืองลอนดอนประเทศอังกฤษ จูปีเตอร์จะตอบกลับมาเป็นดังเช่น ในเมืองลอนดอนประเทศ อังกฤษ ในวันพฤหัสบดีมีเมฆเป็นบางส่วนอุณหภูมิสูงสุด 82 ต่ำสุด 63 และจะถามกลับมาว่า ต้องการทราบอะไรเพิ่มเติมหรือไม่ ซึ่งเราอาจถามต่อว่าคิดเป็นกี่องศาเซลเซียสล่ะ จูปีเตอร์จะ ตอบมาว่า สูงสุด 28 และต่ำสุด 17 นี่เป็นตัวอย่างที่น่าสนใจมากทีเดียวสำหรับอนาคตของ เครื่องคอมพิวเตอร์ และการสื่อสารโทรคมนาคม

เทคโนโลยีที่อยู่เบื้องหลัง
จูปีเตอร์ไม่ได้ใช้เทคโนโลยีที่ซับซ้อนมากมายแต่อย่างไร เทคโนโลยีทางด้านการ ประมวลผลภาษาพูด กล่าวคือการู้จำเสียงพูด (speech recognition) การสังเคราะห์เสียงพูด จากข้อมูลที่เก็บอยู่ในเครื่องคอมพิวเตอร์ (speech synthesis) เทคโนโลยีการสืบค้นข้อมูล (information retrieval) เทคโนโลยีการเชื่อมต่อระหว่างคอมพิวเตอร์และโทรศัพท์ (computer telephony integration) ประกอบกับฐานข้อมูลทางด้านการพยากรณ์อากาศของประเทศต่าง ๆ ที่มีอยู่ทั่วไปตามแม่ข่ายใยแมงมุมในอินเตอร์เน็ต ถูกผสมผสานขึ้นมาเป็นจูปีเตอร์ คอมพิวเตอร์ ที่มีระดับความเป็นมนุษย์สูงกว่าคอมพิวเตอร์ทั่ว ๆ ไป อย่างไรก็ตามเทคโนโลยีดังกล่าวไม่ใช่ เทคโนโลยีที่สมบูรณ์พร้อมร้อยเปอร์เซ็นต์ ความถูกต้องของการรู้จำเสียงพูด ความเฉลียวฉลาด ในการวิเคราะห์หลักภาษา ความรวดเร็วในการสืบค้นข้อมูล และความเป็นธรรมชาติของการ สังเคราะห์เสียงของเครื่องคอมพิวเตอร์ยังเป็นประเด็นที่สามารถวิจัยและพัฒนาต่อเนื่องให้ดีขึ้น ได้อีกมาก

ประยุกต์ใช้กับภาษาไทย
ฐานข้อมูลภาษาไทยในบ้านเรามีมากมายพอสมควรในอินเตอร์เน็ตเช่นกัน ยกตัวอย่าง เช่นประมวลกฎหมาย พระราชบัญญัติต่าง ๆ ซึ่งเป็นหน้าที่ของคนไทยทุกคนที่จะต้องทราบ มี ให้บริการที่แม่ข่ายใยแมงมุมของสำนักงานคณะกรรมการกฤษฎีกา (www.krisdika.go.th) เป็นต้นการที่เราจะใช้เวลาหลายชั่วโมง หรืออาจจะหลายวันหน้าจอคอมพิวเตอร์เพื่อศึกษาข้อ มูลเหล่านี้คงเป็นงานที่ไม่น่าสนุกเท่าที่ควร อีกทั้งการเข้าถึงอินเตอร์เน็ตในบ้านเรายังจำกัดอยู่ที่ บางกลุ่มเท่านั้น ลองคิดอีกแง่หนึ่งถ้าเราสามารถหมุนโทรศัพท์ไปหาเครื่องคอมพิวเตอร์ที่ สามารถอ่านข้อมูลเหล่านี้หรือข้อมูลอื่น ๆ ในอินเตอร์เน็ตให้เราฟังตลอดวันตราบที่เราต้องการ ก็จะทำให้เราสามารถรับรู้ข่าวสารได้อย่างทัดเทียมโดยไม่มีฐานะทางสังคมหรือความแตกต่างใด ๆ แม้กระทั่งความทุพลภาพมาเป็นเครื่องกีดขวาง อีกทั้งเป็นหนทางที่เราจะใช้แหล่งข้อมูลขนาด มหาศาลที่กล่าวมาข้างต้นให้เป็นประโยชน์มากขึ้น มีคนไทยที่พยายามสร้างต้นแบบของเครื่อง คอมพิวเตอร์ที่มีความสามารถดังกล่าวนี้ ท่านสามารถหารายละเอียดเพื่อการทดลองใช้ ได้ที่แม่ ข่ายใยแมงมุม www.come.to/pstnlp

สรุป
วิธีการหนึ่งที่สามารถเพิ่มระดับความเป็นมนุษย์ของเครื่องคอมพิวเตอร์ก็คือการเพิ่ม ความสามารถในการประมวลผลเสียงพูด (speech processing) กล่าวคือเพิ่มความสามารถฟัง รับรู้ภาษาพูด (speech recognition) และความสามารถในการสังเคราะห์เสียงพูด (speech synthesis) ให้กับเครื่องคอมพิวเตอร์นั่นเอง เทคโนโลยีนี้จะเป็นประโยชน์ในการลดข้อจำกัดของ การสื่อสารระหว่างมนุษย์กับเครื่องคอมพิวเตอร์ และทำลายกำแพงขวางกั้นโอกาสหรือข้อจำกัด ทางกายภาพต่าง ๆ สำหรับการเรียนรู้ และการสื่อสารโทรคมนาคมระหว่างมนุษย์กับมนุษย์ ด้วยกันเอง


1