PISIT' S THAI NATURAL LANGUAGE PROCESSING LABORATORY
This lab is formed since August 26, 1998
e-mail: pisitp@yahoo.com
For C7 members, please check this C7 address list.

KEYWORDS
Thai Natural Language Processing Lab., words segmentation, dictionaries, algorithms, Thai text-to-speech.
ฐานข้อมูลออนไลน์ที่ใหญ่ที่สุดในโลก

พิสิทธิ์ พรมจันทร์
pisitp@yahoo.com

กล่าวนำ
ระบบจัดการฐานข้อมูลคือกลไกหลักของการจัดการและวิเคราะห์ข้อมูลสำหรับธุรกิจ เมื่อมีข้อมูลที่เพิ่มขึ้นอย่างมากมายในเวลาอันรวดเร็ว ความต้องการระบบจัดการฐานข้อมูลที่ทรงประสิทธิภาพก็เพิ่มมากขึ้น เราจึงเห็นการแข่งขันกันพัฒนาระบบนี้อย่างต่อเนื่องของบริษัทผู้ผลิตอย่าง ไอบีเอ็ม ออราเคิล อินฟอร์มิกซ์ ไซเบส ไมโครซอฟท์ และ อื่น ๆ นอกจากจะพัฒนาระบบการจัดการฐานข้อมูลที่ทรงพลังของแต่ละรายแล้ว กลยุทธกลเม็ดของแต่ละรายในการที่จะผลักดันให้ผู้ใช้งานหรือลูกค้ายอมรับผลิตภัณท์ของตนก็เป็นสิ่งที่น่าสนใจติดตาม

ไมโครซอฟท์ บริษัทยักษ์ใหญ่ได้สร้างประวัติศาสตร์หน้าใหม่ของวงการระบบจัดการฐานข้อมูล โดยการสร้างระบบฐานข้อมูลออนไลน์ที่ใหญ่ที่สุดในโลกขึ้นมาโดยให้ชื่อว่า เทร์ร่าเซิฟท์เวอร์ (TerraServer) ซึ่งจัดเก็บข้อมูลภาพถ่ายดาวเทียมของสถานที่ต่าง ๆ ทั่วโลก ให้ผู้ใช้งานสามารถเลือกเข้าไปดูได้โดยตรงอย่างสะดวกสบายเพียงแค่เมาส์คลิก หรือค้นหาโดยใช้ชื่อสถานที่ ฐานข้อมูลนี้มีขนาด 1.01 เทราไบท์ หรือ1,010 กิกาไบท์ ขนาดของภาพที่คลี่คืนจากการบีบอัดข้อมูลแล้ว 3.5 เทราไบท์ ฐานข้อมูลมีจำนวน 173.6 ล้านแถว (rows) แต่ละแถวเก็บตำแหน่งพิกัดบนโลกที่ทำเครื่องหมายเอาไว้

เทคโนโลยีที่อยู่เบื้องหลัง
เทร์ราเซอฟท์เวอร์ใช้เทคโนโลยีซึ่งมีอยู่ในปัจจุบันจากไมโครซอฟท์ คอมแพค เลกาโตและ สตอเรจเทค (Microsoft, Compaq, Legato, and StorageTek) ซึ่งประกอบไปด้วย ไมโครซอฟท์เอสคิวแอลเซอฟท์เวอร์ 7.0 (Microsoft SQL Server 7.0 Enterprise Edition) เก็บภาพถ่ายทางอากาศ และภาพถ่ายดาวเทียมโดยใช้เครื่อง ดิจิตอลอัลฟาเซอฟท์เวอร์ 8400 จากคอมแพค ผนวกกับเทคโนโลยีสตอเรจเวิร์ก (StorageWorks) ของคอมเพค ใช้ระบบจัดการวินโดว์เน็นที (Microsoft Windows NT Server/ Enterprise Edition) เทคโนโลยีจัดเก็บเทปอัตโนมัติจากสตอเรจเทค (StaorageTek Automated Tape Libraries) เทคโนโลยีเน็ตเวอร์กเกอร์ของเลกาโต (Legato Networker) และเทคโนโลยีไซท์เซอฟท์เวอร์ของไมโครซอฟท์ (Microsoft Site Server Commerece Edition) ใช้เทคโนโลยีการจัดการข้อมูลแผนที่ภูมิศาสตร์ (GIS) ไมโครซอฟท์กล่าวไว้ว่าถ้าพิมพ์ข้อมูลออกมาจะได้ 2,000 เล่ม โดยแต่ละเล่มประกอปด้วย 500 หน้า

แหล่งที่มาของข้อมูล
ข้อมูลที่จัดเก็บอยู่ในเทร์ราเซอฟเวอร์ได้มาจากสองแหล่งด้วยกันคือ หน่วยงานสำรวจทางภูมิศาสตร์ของอเมริกา (United States Geological Survey (USGS)) ซึ่งให้บริการภาพถ่ายทางอาศ และสปิน-2 (SPIN-II) ให้บริการภาพถ่ายดาวเทียมความละเอียดสูงซึ่งเป็นความร่วมมือกันระหว่างรัสเซียและอเมริกาในการให้บริการภาพถ่ายดาวเทียมจากดาวเทียมแผนที่ของรัสเซียหลายดวง

ประโยชน์ที่ผู้ใช้งานจะได้รับ
ฐานข้อมูลเทร์ราเซอฟท์เวอร์ให้บริการตลอดเจ็ดวันยี่สิบสี่ชั่วโมงบนอินเตอร์เน็ต ผู้ใช้งานสามารถเข้าถึงฐานข้อมูลนี้ได้จากทุกมุมโลก ที่เว็บไซด์ www.terraserver.microsoft.com ซึ่งผู้ใช้งานจะสามารถเลือกดูตำแหน่งใด ๆ ก็ได้ที่มีจุดสีเขียวหมายเอาไว้ นอกจากนี้ยังมีการรวบรวมจุดที่เป็นที่นิยมเช่น ทำเนียบขาว เซ็นทรัลพาร์ค ดิสนีย์เวิอร์ล สะพานโกลเดนเกตท์ แกรนด์แคนยอน เมืองเวนิชประเทศอิตาลี เป็นต้น ให้เรียกดูได้โดยเร็ว รวมไปถึงการส่งอีเมล์ไปแนะนำจุดที่เห็นว่าเป็นที่นิยมก็สามารถทำได้ จากการทดลองใช้จะพบว่าจุดพิกัดที่กำหนดไว้แถบ ๆ อเมริกาและยุโรปจะมีเป็นจำนวนมาก ขณะที่ในย่านเอเซียยังมีไม่มากนัก นอกจากนี้ยังได้เตรียมเครืองมือไว้สำหรับการค้นหาจุดพิกัดที่ต้องการบนโลกไว้คอยอำนวยความสะดวกแก่ผู้ใช้งานโดยใช้วิธีการค้นหาจากชื่อสภานที่ที่ต้องการ ข้อมูลที่อยู่ในเทร์ราเซอฟท์เวอร์อาจเป็นประโยชน์ได้ในหลาย ๆ วงการ เช่นนักพัฒนาอสังหาริมทรัพย์สามารถเข้าใจความหนาแน่นรอบ ๆ โครงการได้ดียิ่งขึ้น นักสิ่งแวดล้อมสามารถวัดผลกระทบของการวางแผนทรัพยากรณ์ธรรมชาติ หน่วยงานของรัฐสามารถเฝ้าติดตามการละเมิดมลพิษของบริษัทเอกชน เด็ก ๆ สามารถใช้ข้อมูลสำหรับทำการบ้านเกี่ยวกับประเทศเพื่อนบ้าน เป็นต้น

สรุป
ความคิดริเริ่มของไมโครซอฟท์ครั้งนี้คาดว่าจะเกิดผลกระทบโดยตรงต่อคนจำนวนมากเช่น ผู้ใช้งานระบบจัดการฐานข้อมูลเกิดมีความมั่นใจในผลิตภัณท์ของไมโครซอฟท์สำหรับการจัดการข้อมูลขององค์กรณ์ที่มีขนาดใหญ่มากยิ่งขึ้น บริษัทคู่แข่งขันของไมโครซอฟท์สำหรับผลิตภัณท์ระบบจัดการฐานข้อมูล ก็คงจะต้องออกกลยุทธใหม่ ๆ ออกมาแข่งขัน ซึ่งก่อให้เกิดประโยชน์ต่อผู้ใช้งาน นักภูมิศาส์ตรและบุคคลในวงการที่เกี่ยวข้องทั่วโลก ทั้งมืออาชีพและสมัครเล่น จะมีแหล่งข้อมูลใหม่ที่สำคัญโดยไม่ต้องมีดาวเทียมแผนที่เป็นของตัวเอง เป็นต้น
[TerraServer]


This page hosted by   Get your own Free Home Page 1