PISIT' S THAI NATURAL LANGUAGE PROCESSING LABORATORY
This lab is formed since August 26, 1998
e-mail: pisitp@yahoo.com
For C7 members, please check this C7 address list.
KEYWORDS
Thai Natural Language Processing Lab., words
segmentation, dictionaries, algorithms, Thai text-to-speech.
เพิ่มระดับความเป็นมนุษย์ให้เครื่องคอมพิวเตอร์
พิสิทธิ์ พรมจันทร์
นักวิเคราะห์ระบบ
บริษัท เทเลคอมเอเซีย คอร์ปอเรชั่น จำกัด (มหาชน)
กล่าวนำ
กว่าครึ่งศตรรษนับตั้งแต่มนุษย์ประดิษฐ์เครื่องคอมพิวเตอร์เครื่องแรกออกมาใช้งาน
เราก็เริ่มเก็บข้อมูลต่าง ๆ นา ๆ ลงไป ไม่ว่าจะเป็นข้อมูลดิบสำหรับการทดลองทางวิทยาศาสตร์
รายงานการค้นคว้าวิจัย ฐานข้อมูลลูกค้า ข่าวประจำวันล่าสุด ผลการแข่งขันกีฬา รายงานสภาพ
อากาศ ราคาเสนอขายหุ้น โฆษณาสินค้า ตารางการบิน รายการภาพยนต์ของโรงภาพยนต์ใกล้
บ้าน กฎหมายต่าง ๆ เป็นต้น จนกระทั่งเครือข่ายอินเตอร์เน็ตปรากฏออกมาในราวปี ค.ศ.
1969 โดยเฉพาะอย่างยิ่งเมื่อ นายทิม เบอร์เนอร์ ลี คิดค้นโปรโตคอลการสื่อสารสำหรับเครือ
ข่ายใยแมงมุม (World-Wide-Web) ขึ้นมาในปี คศ. 1989 ข้อมูลต่าง ๆ ที่เราต่างเก็บรวบรวม
กันไว้ ได้ไหลเชื่อมโยงเข้าด้วยกันเปรียบประดุจกระแสเลือดไหลหล่อเลี้ยงตามจุดต่าง ๆ ของ
เซลสมองกลายมาเป็นคลังความรู้ที่ใหญ่โตมหาศาล ตราบจนถึงทุกวันนี้มนุษย์เราใช้ความรู้จาก
แหล่งความรู้ที่ยิ่งใหญ่นี้น้อยมากเนื่องจากข้อจำกัดในการสื่อสารระหว่างมนุษย์กับเครื่อง
คอมพิวเตอร์ กล่าวคือในการที่จะได้มาของข้อมูลมนุษย์จะต้องพิมพ์คำสั่งลงบนแป้นพิมพ์และ
อ่านผลการสืบค้นข้อมูลจากหน้าจอคอมพิวเตอร์เท่านั้น มีกลุ่มนักวิทยาศาสตร์ที่ห้องวิจัยระบบ
ภาษาพูด (SLS: SPOKEN LANGUAGE SYSTEM LABORATORY) ของสถาบันเทคโนโลยีเอ็มไอที
(www.sls.lcs.mit.edu) ได้พยายามทำลายข้อจำกัดเหล่านี้ออกไป
เพิ่มความสามารถในการพูดและฟังให้กับคอมพิวเตอร์
นักวิทยาศาสตร์กลุ่มนี้ได้ประดิษฐ์เครื่องคอมพิวเตอร์ที่สามารถฟังและโต้ตอบกับมนุษย์
ได้ทางสายโทรศัพท์โดยให้ชื่อว่าจูปีเตอร์ เจ้าเครื่องนี้มีความสามารถในการทำนายสภาพอากาศ
ของมลรัฐต่าง ๆ ทั่วอเมริกาและอีกหลายเมืองของโลก ผู้ใช้งานอาจป้อนคำถามหลังจากหมุน
โทรศัพท์ไปหาเจ้าจูปีเตอร์จากสนามบินว่า ผมอยากทราบผลการทำนายสภาพภูมิอากาศของ
เมืองลอนดอนประเทศอังกฤษ จูปีเตอร์จะตอบกลับมาเป็นดังเช่น ในเมืองลอนดอนประเทศ
อังกฤษ ในวันพฤหัสบดีมีเมฆเป็นบางส่วนอุณหภูมิสูงสุด 82 ต่ำสุด 63 และจะถามกลับมาว่า
ต้องการทราบอะไรเพิ่มเติมหรือไม่ ซึ่งเราอาจถามต่อว่าคิดเป็นกี่องศาเซลเซียสล่ะ จูปีเตอร์จะ
ตอบมาว่า สูงสุด 28 และต่ำสุด 17 นี่เป็นตัวอย่างที่น่าสนใจมากทีเดียวสำหรับอนาคตของ
เครื่องคอมพิวเตอร์ และการสื่อสารโทรคมนาคม
เทคโนโลยีที่อยู่เบื้องหลัง
จูปีเตอร์ไม่ได้ใช้เทคโนโลยีที่ซับซ้อนมากมายแต่อย่างไร เทคโนโลยีทางด้านการ
ประมวลผลภาษาพูด กล่าวคือการู้จำเสียงพูด (speech recognition) การสังเคราะห์เสียงพูด
จากข้อมูลที่เก็บอยู่ในเครื่องคอมพิวเตอร์ (speech synthesis) เทคโนโลยีการสืบค้นข้อมูล
(information retrieval) เทคโนโลยีการเชื่อมต่อระหว่างคอมพิวเตอร์และโทรศัพท์ (computer
telephony integration) ประกอบกับฐานข้อมูลทางด้านการพยากรณ์อากาศของประเทศต่าง ๆ
ที่มีอยู่ทั่วไปตามแม่ข่ายใยแมงมุมในอินเตอร์เน็ต ถูกผสมผสานขึ้นมาเป็นจูปีเตอร์ คอมพิวเตอร์
ที่มีระดับความเป็นมนุษย์สูงกว่าคอมพิวเตอร์ทั่ว ๆ ไป อย่างไรก็ตามเทคโนโลยีดังกล่าวไม่ใช่
เทคโนโลยีที่สมบูรณ์พร้อมร้อยเปอร์เซ็นต์ ความถูกต้องของการรู้จำเสียงพูด ความเฉลียวฉลาด
ในการวิเคราะห์หลักภาษา ความรวดเร็วในการสืบค้นข้อมูล และความเป็นธรรมชาติของการ
สังเคราะห์เสียงของเครื่องคอมพิวเตอร์ยังเป็นประเด็นที่สามารถวิจัยและพัฒนาต่อเนื่องให้ดีขึ้น
ได้อีกมาก
ประยุกต์ใช้กับภาษาไทย
ฐานข้อมูลภาษาไทยในบ้านเรามีมากมายพอสมควรในอินเตอร์เน็ตเช่นกัน ยกตัวอย่าง
เช่นประมวลกฎหมาย พระราชบัญญัติต่าง ๆ ซึ่งเป็นหน้าที่ของคนไทยทุกคนที่จะต้องทราบ มี
ให้บริการที่แม่ข่ายใยแมงมุมของสำนักงานคณะกรรมการกฤษฎีกา (www.krisdika.go.th)
เป็นต้นการที่เราจะใช้เวลาหลายชั่วโมง หรืออาจจะหลายวันหน้าจอคอมพิวเตอร์เพื่อศึกษาข้อ
มูลเหล่านี้คงเป็นงานที่ไม่น่าสนุกเท่าที่ควร อีกทั้งการเข้าถึงอินเตอร์เน็ตในบ้านเรายังจำกัดอยู่ที่
บางกลุ่มเท่านั้น ลองคิดอีกแง่หนึ่งถ้าเราสามารถหมุนโทรศัพท์ไปหาเครื่องคอมพิวเตอร์ที่
สามารถอ่านข้อมูลเหล่านี้หรือข้อมูลอื่น ๆ ในอินเตอร์เน็ตให้เราฟังตลอดวันตราบที่เราต้องการ
ก็จะทำให้เราสามารถรับรู้ข่าวสารได้อย่างทัดเทียมโดยไม่มีฐานะทางสังคมหรือความแตกต่างใด
ๆ แม้กระทั่งความทุพลภาพมาเป็นเครื่องกีดขวาง อีกทั้งเป็นหนทางที่เราจะใช้แหล่งข้อมูลขนาด
มหาศาลที่กล่าวมาข้างต้นให้เป็นประโยชน์มากขึ้น มีคนไทยที่พยายามสร้างต้นแบบของเครื่อง
คอมพิวเตอร์ที่มีความสามารถดังกล่าวนี้ ท่านสามารถหารายละเอียดเพื่อการทดลองใช้ ได้ที่แม่
ข่ายใยแมงมุม www.come.to/pstnlp
สรุป
วิธีการหนึ่งที่สามารถเพิ่มระดับความเป็นมนุษย์ของเครื่องคอมพิวเตอร์ก็คือการเพิ่ม
ความสามารถในการประมวลผลเสียงพูด (speech processing) กล่าวคือเพิ่มความสามารถฟัง
รับรู้ภาษาพูด (speech recognition) และความสามารถในการสังเคราะห์เสียงพูด (speech
synthesis) ให้กับเครื่องคอมพิวเตอร์นั่นเอง เทคโนโลยีนี้จะเป็นประโยชน์ในการลดข้อจำกัดของ
การสื่อสารระหว่างมนุษย์กับเครื่องคอมพิวเตอร์ และทำลายกำแพงขวางกั้นโอกาสหรือข้อจำกัด
ทางกายภาพต่าง ๆ สำหรับการเรียนรู้ และการสื่อสารโทรคมนาคมระหว่างมนุษย์กับมนุษย์
ด้วยกันเอง