(การสร้างเสียง ) ( มาตรฐาน ) ( ตัวอย่าง ) ( ก้าวต่อไป ) ( ศัพท์เทคนิค )
การสร้างเสียง การสร้างเสียงมี 2 แบบ คือ

1.การสังเคราะห์เสียง(Synthesis)

คือการสร้างเสียงใหม่จากข้อมูลหรือรูปแบบของเสียงที่มีการบันทึกไว้ โดยข้อมูลจะถูกอ่านจากแฟ้มเสียง แล้วส่งข้ามบัสไปยังการ์ดเสียง ตัวแปลง DAC(Digital to Analog Converter)ในการ์ดเสียง จะแปลงข้อมูลมาเป็นแบบ Analog แล้วส่งต่อไปยังลำโพงต่อไป

OPL-3 เป็นมาตรฐาน FM synthesisการสังเคราะห์เสียง โดยผสมสัญญาณความถี่ต่ำเข้าด้วยกันจนได้สัญญาณเสียงใหม่ที่มีความถี่ซับซ้อนยิ่งขึ้นของ yamaha ซึ่งใช้ sine wave หรือ operator
ในการสร้างเสียงมาตรฐาน สามารถสังเคราะห์เสียงสำหรับเครื่องดนตรีบางชนิดได้เป็นอย่างดี แต่บางชนิดเช่น กลองและเปียโน เสียงจะแย่มากไม่สมจริง เพราะเป็นเสียงที่ถูกสร้างขึ้นมาจาก CHIP เสียงตัวเล็กๆบนการ์ดเสียง ดังนั้นจึงไม่จำเป็นต้องพึ่งพาซีพียูแต่อย่างใด

Wavetable เป็นมาตรฐาน synthesis ที่จะเก็บตัวอย่าง waveform ของเครื่องดนตรีแต่ละชิ้นไว้ใน ROM โดยที่คุณภาพของเสียงขึ้นอยู่กับขนาดของ ROM
จากนั้นซินธิไซเซอร์จะนำ waveform มาประกอบกันเป็นเสียงสังเคราะห์สำหรับเครื่องดนตรีต่างๆ

2.การบันทึกเสียงและเล่นกลับ(Record and Play back)


(2.1) การบันทึกเสียงแบบ Waveform ใช้สำหรับบันทึกเสียงพูด,เสียงเพลง,เสียงประกอบต่างๆ หรือเสียงใดๆก็ได้ ผ่านไมโครโฟน หรืออุปกรณ์เสียงอื่นๆผ่านทางช่อง Line-In ของการ์ดเสียง จะมีลักษณะของการบันทึกเหมือนกับเทปเพลง สัญญาณเสียงแบบ Analog จะถูกส่งผ่านไมโครโฟน ส่งไปยังตัวแปลง ADC(Analog to Digital Converter) ซึ่งจะสุ่มตัวอย่างเสียงเป็นระยะๆไม่ต่อเนื่องกัน และแปลงเป็นชุดของตัวเลข digital แล้วเก็บเป็นแฟ้ม .wav ที่มีขนาดใหญ่ โดยที่คุณภาพของเสียงจะขึ้นอยู่กับ sampling rateจำนวนของสัญญาณเสียงที่สุ่มขึ้นมา(sample) ในระยะเวลาที่กำหนด และ resolution ของการบันทึก และ การปรับแต่งเสียงทำได้เพียงตัดต่อ และใส่ Special effect เท่านั้น การปรับจังหวะของเพลงเร็วขึ้นจะทำให้เสียงที่ได้ยินกลายเป็นเสียงแหลมเล็ก
(2.2 )การบันทึกเสียงแบบ MIDI ใช้สำหรับบันทึกเสียงเพลง ผ่านโปรแกรม Sequencer หรือเครื่องดนตรี MIDI เหมือนกับโน้ตเพลงจะได้แฟ้ม .mid ที่มีขนาดเล็ก โดยมีเสียงที่ต่างกันสำหรับ Synthesizer แต่ละตัว และมีความยืดหยุ่นในการปรับแต่งหรือแก้ไขได้มาก การปรับจังหวะของเพลงไม่กระทบต่อระดับเสียงของตัวโน้ต

การบีบอัดหรือขยายข้อมูลเสียง(CODEC) จะใช้หลักการ PCM (Pulse Code Modulation)แต่ละครั้งของการสุ่มสัญญาณเสียง(ตัวอย่างเสียงหรือ sample) จะเก็บข้อมูลเกี่ยวกับสัญญาณเสียง ณ ขณะเวลาต่างๆอย่างละเอียด โดยเก็บข้อมูลในขนาด 16 bit

ADPCM(Adaptive Pulse Code Modulation) เป็นวิธีการบีบอัดข้อมูลที่จะบันทึกเฉพาะความแตกต่างระหว่าง Sample โดยเก็บข้อมูลขนาด 4 bit มีอัตราในการบีบอัดในระดับ 4:1

MPEG(Motion Picture Experts Group) เป็นมาตรฐานการบีบอัดและขยายเสียงและภาพ มีอัตราในการบีบอัดในระดับ 20:1

MP3(MPEG-1 Layer 3) เป็นมาตรฐานการบีบอัดและขยายเสียงและภาพ โดยการใช้ตัวแบบทางคณิตศาสตร์ในการฟังเสียงของมนุษย์เพื่อตัดทอนความถี่ที่มนุษย์ไม่สามารถได้ยินออกไป ทำให้ได้ขนาดแฟ้มที่เล็กลง ปัจจุบันใช้เป็นมาตรฐานในการบีบอัดเพลงบน internet มีอัตราในการบีบอัดในระดับ 96:1 ที่คุณภาพเสียงโทรศัพท์ จนถึง 14-12:1 ที่คุณภาพระดับเสียงจากซีดี

Truespeech เป็นมาตรฐานการบีบอัดและขยายเสียงพูด พัฒนาโดยบริษัท DSP Group มีอัตราในการบีบอัดในระดับ 25:1

VoxWare เป็นมาตรฐานการบีบอัดและขยายเสียงพูด พัฒนาโดยบริษัท Voxware มีอัตราในการบีบอัดในระดับ 35:1 โดยการใช้เทคโนโลยี MetaVoice ที่แบ่งเสียงพูดออกเป็น 2 ส่วน คือส่วนลักษณะของเสียงพูด และส่วนออกเสียงและความถี่ของเสียง

กลับไปที่สารบัญ

ประวัติของการสร้างเสียง

การสร้างเสียง Beep จากรหัส ASCII

ใช้รหัส ASCII 07 แล้วกำหนดจังหวะในการส่งเสียง


การสร้างเสียงจาก Interrupt Request โดยใช้ลำโพงภายในเครื่อง

เราใช้ Port 61 ในการสร้างเสียง โดยใช้นำข้อมูลออกไปให้โปรแกรม ซึ่งจะส่งเสียงออกทางลำโพงภายในเครื่อง PC และเราสามารถกำหนดความถี่ของเสียงโดยให้
โน๊ต C ใช้ 262
โน๊ต D ใช้ 294
โน๊ต E ใช้ 330
โน๊ต F ใช้ 347
โน๊ต G ใช้ 392
โน๊ต A ใช้ 440
โน๊ต B ใช้ 494
โน๊ต C ใช้ 524


การสร้างเสียงจาก การ์ดเสียง SoundBlaster

กลับไปที่สารบัญ

คุณภาพของเสียง

คุณภาพของเสียงประกอบด้วยส่วนประกอบสำคัญ 9 อย่าง สำหรับการสร้างเสียงที่เหมือนจริง ซึ่งมีผลต่อคุณภาพของการรับฟัง หากมีการเปลี่ยนแปลงแก้ไข เพิ่มเติมหรือตัดส่วนประกอบอันใดอันหนึ่งออกไป จะมีผลให้เสียงเปลี่ยนไปเกิดเป็นเสียงใหม่ขึ้น

"ส่วนประกอบของเสียงดนตรี":

  1. ระดับเสียง( Pitch)
    ระดับเสียงขึ้นอยู่กับความถี่ของเสียง โดยปกติเราจะแบ่งระดับเสียงออกเป็นกลุ่มได้ 3 กลุ่มคือ
    • ระดับเสียงต่ำ(เสียงต่ำ-bass) จะให้เสียงฟังดูมีอำนาจและอบอุ่น เช่นเสียงฟ้าผ่า หรือเสียงยิงปืน
    • ระดับเสียงกลาง จะให้เสียงกระตุ้นที่มีพลัง คนทั่วไปมักจะมีความรู้สึกไวมากต่อเสียงระดับนี้ เช่น เสียงโทรศัพท์
    • ระดับเสียงสูง(เสียงแหลม-treble) จะให้เสียงเหมือนทักทาย(presence)ซึ่งทำให้เราฟังได้อย่างชัดเจน,รู้สึกว่าเหมือนได้ยินอยู่ใกล้ๆ และมีชีวิตชีวา เช่นเสียงกระดิ่ง,ระฆัง หรือฉิ่งเล็กๆ    
  2. น้ำเสียง(Timbre)
    น้ำเสียงเกิดจากการผสมผสานอย่างกลมกลืนของ ความถี่เสียง,เสียงคู่แปดและเสียงสอดแทรก จนกลายเป็นรูปแบบเฉพาะตัว ทำให้แต่ละเสียงพูด, เสียงดนตรี และเสียงเอฟเฟคท์ มีเอกลักษณ์เฉพาะตัว

  3. เสียงประสาน(Harmonics,overtones,เสียงสอดแทรก)   เมื่อวัตถุสั่นสะเทือน มันจะให้กำเนิดคลื่นเสียงที่มีความถี่ที่แน่นอน ความถี่ที่เกิดขึ้นแต่ละครั้งจะปล่อยคลื่นความถี่จำนวนมากที่เรียกว่า คลื่นสอดแทรก การรวมความถี่พิ้นฐานและคลื่นสอดแทรก จะได้ผลเป็นรูปแบบคลื่นที่ซับซ้อน ซึ่งขึ้นอยู่กับน้ำเสียงของเสียงนั้นๆ การมีเสียงประสานจำนวนมาก จะช่วยทำให้เสียงมีลักษณะน่าสนใจยิ่งขึ้น เพราะทำให้เสียงฟังดูเหมือนเกิดจากเครื่องดนตรี(แหล่งกำเนิดเสียง)มากมายที่แตกต่างกัน ซึ่งความสามารถในการสั่นสะเทือนของวัตถุและการสร้างเสียงประสานสอดแทรกขึ้นมา สามารถวัดได้จากความพึงพอใจในการรับฟังของผู้ฟัง แก้วคริสตัลจะมีความสามารถในการสร้างเสียงที่ฟังแล้วไพเราะกว่าแก้วธรรมดา

  4. ความดังค่อย(Loudness)
    ความดังค่อยของเสียงขึ้นอยู่กับความเข้มของการให้กำเนิดเสียง เสียงระเบิดจะดังกว่าเสียงปืนแก๊ป เพราะว่า เสียงระเบิดทำให้อากาศสั่นสะเทือนมากกว่า    ต่อมาความดังค่อย ก็เปลี่ยนความหมายไปเป็น การเปรียบเทียบการได้ยินระหว่างเสียงหนึ่งกับเสียงหนึ่ง แม้ว่าเสียงยิงปืนจะดังสนั่นหวั่นไหวในห้องเล็กๆ แต่เราจะแทบไม่ได้ยินเสียงยิงปืนเลย เมื่อมีรถไฟใต้ดินวิ่งผ่านในสถานีรถไฟใต้ดิน หรือเมื่อเครื่องบินโดยสารขนาดใหญ่กำลังลงจอด เพราะมีเสียงที่ดังมากกว่ากลบเสียงยิงปืน
    "ความดังที่เหมาะสม" สำหรับคนปกติโดยทั่วไปจะอยู่ในระดับความถี่ระดับกลาง คือ 250 Hz - 5000 Hz    เมื่อ เสียงความถี่ระดับกลางและเสียงต่ำ ถูกเล่นในระดับความดังที่เท่ากัน ผู้ฟังจะรู้สึกว่าเสียงระดับกลางดังกว่า นั่นคือสาเหตุสำคัญที่เสียงฟ้าผ่าในหนังสยองขวัญ อาจจะสร้างบรรยากาศน่าตกใจกลัวเหมือนกับเสียงผู้หญิงกรีดร้อง

  5. ทำนอง(Rhythm)
    ทำนองหรือจังหวะของเสียงคือการกำหนดช่วงของการสลับกันระหว่างเสียงสูงต่ำดังค่อย อย่างต่อเนื่อง ถ้าเราให้จังหวะที่ถูกต้อง เสียงตอกไม้ที่ถูกแขวนด้วยเส้นลวดในกรอบไม้ จะฟังเหมือนเสียงกองทหารกำลังเดินแถวสวนสนาม ถ้าจังหวะของเสียงไม่ถูกต้อง ก็จะได้ยินเป็นเสียงตอกไม้ธรรมดา

    "ส่วนประกอบแวดล้อมของเสียง": 

  6. การขึ้นต้นของเสียง(Attack)
    คือ วิธีที่เสียงเริ่มต้น มี 2 แบบคือ :
    • แบบเร็ว( Fast attack) จะมีเสียงเริ่มต้น(A)ต่อเนื่องกับระดับเสียงที่ดังที่สุด (B)ในระยะใกล้ชิดและเร็วมาก เช่น เสียงยิงปืน หรือ เสียงกระแทกประตูดัง ปัง
    • แบบช้า(Slow attack) เสียงเริ่มต้น ที่จะมีระยะเวลาอุ่นเครื่องก่อนจะส่งเสียงอย่างต่อเนื่อง เช่น เสียงหมาคำรามในคอสั้นๆก่อนที่จะเห่า, เสียงฉีกกระดาษอย่างช้าๆ, เสียงประตูปิดอย่างช้าๆ, เสียงฟ้าผ่าเปรี้ยง
    เวลาฟ้าผ่า จะมีระยะเวลาเริ่มต้น 5 วินาที โดยจะมีเสียงฟ้าคำรามก่อน แต่บางครั้งฟ้าอาจจะผ่าทันทีทันใด โดยไม่มีเสียงเตือนล่วงหน้า ซึ่งเป็นเสียงที่เริ่มต้นแบบเร็ว

  7. การต่อเนื่องของเสียง(Sustain)
    เมื่อเสียงดังอย่างต่อเนื่อง จนถึงจุดที่ดังที่สุด ระยะเวลาที่เสียงยังคงดังต่อเนื่องขึ้นอยู่กับ กำลังการสั่นสะเทือนของแหล่งกำเนิดเสียง เมื่อแหล่งกำเนิดเสียงหยุดสั่น เสียงจะค่อยๆเบาลง เข้าสู่ระยะสิ้นสุดของเสียง  การแก้ไขดัดแปลงระยะเวลาต่อเนื่องของเสียง อาจเป็นเพียงการแก้ไขเสียงหรือเป็นการสร้างเสียงใหม่ ขึ้นมาก็ได้

  8. การสิ้นสุดของเสียง(Decay)
    คือ การลดช่วงกว้างของคลื่น(amplitude) เมื่อแหล่งกำเนิดเสียงหยุดสั่นสะเทือน ซึ่งระยะเวลาการสิ้นสุดจะเริ่มนับจากเสียงเริ่มเบาลงไปจนกระทั่งเสียงเงียบไป อัตราการสิ้นสุด จะขึ้นอยู่กับว่าเสียงค่อยๆเบาลงอย่างไร โดยการฟังเสียง
    • ในร่ม(ในอาคารปิดทึบซึ่งมีการดูดซับเสียงมาก) - จะมีช่วงของการสิ้นสุดของเสียงไม่นานและจะมีการสะท้อนของเสียงน้อยหรือแทบไม่มีเลย
    • กลางแจ้ง (พื้นที่เปิดโล่ง) - จะมีช่วงของการสิ้นสุดของเสียงนาน และอาจจะมีเสียงสะท้อน
    ช่วงการสิ้นสุดของเสียง บางทีเราก็เรียกว่า "หางเสียง" ส่วนช่วงเริ่มต้นของเสียง ก็เรียกว่า "ต้นเสียง"  คำแนะนำ: - เมื่อใดก็ตามที่คุณกำลังปรับแก้เสียง คุณควรจะใช้ห้องที่กว้างพอที่จะได้ยินหางเสียงที่ค่อยเบาลงๆเลือนจนเงียบไป

    "ส่วนประกอบของการบันทึกเสียงและเล่นกลับ":

  9. ความเร็ว(Speed)
    การเพิ่มหรือลดความเร็วในการเล่นเสียงจะเปลี่ยนคุณลักษณะของเสียงไป ถ้าคุณเล่นเสียงด้วยความเร็ว 2 เท่าของปกติ เสียงระเบิด จะฟังเหมือนเสียงยิงปืน และเสียงคนพูดจะฟังเหมือนเสียงตัวการ์ตูนที่พูดเร็วๆ  
 

เสียงรบกวน(NOISE)
เป็นสัญญาณรบกวนที่เกิดจากอุปกรณ์อิเล็คทรอนิคส์ ลักษณะจะเป็นเสียงดัง"ซ่าส์"ต่อเนื่องกัน อุปกรณ์ราคาแพงและมีคุณภาพดีมักจะให้กำเนิดเสียงรบกวนที่ว่านี้น้อยกว่าอุปกรณ์ที่มีราคาและคุณภาพต่ำกว่า   ถ้าเป็นการ์ดเสียง ยี่ห้อที่ราคาเกินครึ่งหมื่นขึ้นไปแล้วละก็เวลามีเสียงเพลงจะให้เสียงออกมาได้สะอาดน่าฟังเวลาเพลงจบก็จะเงียบสนิท ไม่มีเสียง"ซ่าส์"ออกมาให้รำคาญหูแต่อย่างใดใครที่มีโอกาสได้เป็นเจ้าของการ์ดเสียงราคาถูกๆที่แถมมากับคอมพิวเตอร์คงจะเคย ได้รับประสพการณ์แบบผู้เขียนมาบ้างแล้วก็ได้ เวลามีงานสังสรรค์กันในหมู่เพื่อนฝูงทีไรก็มักจะได้รับการร้องขอให้นำเอาคอมพิวเตอร์ส่วนตัว มาเปิดเพลงขับกล่อมกันหน่อย พอนำมาต่อเข้ากับเครื่องขยายเสียงให้มีความดังมากๆแล้ว เวลาเพลงจบลงทีไรทุกคนก็จะเห็นผู้เขียนเทียว วิ่งไปนั่งยองๆบนเก้าอี้(ไม่ให้ไฟดูด!) เพื่อหรี่วอลลุ่มลงเพราะว่าเสียงรบกวน ถูกขยายเสียงขึ้นมาดังลั่นงานเลยทีเดียวเวลาเพลงขึ้นแล้ว ค่อยเพิ่มวอลลุ่มอีกที

NOISE GATE ซึ่งปัจจุบันนี้การ์ดเสียงราคาถูกโดยทั่วไปต่างก็รู้ตัวดีว่าสิ่งที่ทำให้คุณภาพของเสียงเพลงด้อยไปถนัดใจนั้นมาจากเสียงรบกวนเป็นต้นเหตุ ครั้นจะไปใช้อุปกรณ์ที่มีราคาแพงๆคุณภาพดี ๆ ก็ไม่สามารถจะยืนราคานี้ต่อไปอีกได้ ก็เลยมีการพัฒนาวงจร NOISE GATE นี้ออกมา NOISE GATE จะทำหน้าที่คอยฟังเพลงไปพร้อม ๆ กันกับเรา เมื่อไรที่เสียงเพลงจบลง มันจะตัดสัญญาณเสียงลงกราวด์ไป ทำให้เราไม่มีโอกาสได้ยินเสียงรบกวนอีกเลย เมื่อไรที่เสียงเพลง เริ่มต้นขึ้น มันก็จะเลิกตัดสัญญาณเสียงลงกราวด์เพื่อปล่อยให้เสียงเพลงดังออกไปตามปกติตรงจุดนี้นี่เองที่ทำให้นักคอมพิวเตอร์ "หูทอง"ค่อนขอดเอาได้ เพราะว่าในขณะที่ การ์ดเสียง เล่นเพลงอยู่นั้น เสียงรบกวนไม่ได้หายไปใหน เพียงแต่ถูกเสียงเพลงที่ดังกว่ากลบ เอาไว้เท่านั้น จะสังเกตุได้จากเวลาที่มีชิ้นดนตรีบรรเลงน้อยชิ้นจะได้ยินเสียง"ซ่าส์"ดังไปพร้อมๆกันเลยทีเดียว นี่คือสาเหตุที่ทำให้  การ์ดเสียงชนิดราคาถูกพ่ายแพ้ต่อชนิดราคาแพงตรงที่"เสียงไม่สะอาด" นี่เองนอกจากเสียงไม่สะอาดแล้ว สิ่งที่ทำให้หลายต่อหลายคน ต้องยอมควักเงินเพื่อซื้อ การ์ดเสียง ราคาแพงไปเลยก็คืออาการ"ให้เสียงไม่ครบ" จากการทำงานของวงจร NOISE GATE ราคาถูกเหล่านี้ เพราะว่าในเพลงบางเพลงที่มี เนื้อหาค่อนข้างซึ้งกินใจ เวลาที่นักร้องทำเสียงแผ่วๆกระซิบคำว่า "ผมรักคุณ" ที่ข้างหูนั้น ถ้าหากว่าเสียงกระซิบนั้นแผ่วมากๆ วงจร NOISE GATE จะเข้าใจว่าเสียงเพลงนั้นได้จบลงแล้วก็เลยลัดสัญญานลงกราวด์ไปเสีย มีผลทำให้คนที่นั่งตรงข้ามกับเราไม่มีโอกาสได้ยินคำว่า "ผมรักคุณ" เลยแม้แต่ครั้งเดียว

กลับไปที่สารบัญ

มาตรฐานของ Soundcard

Sound Blaster ของ Creative Labs มีขีดความสามารถพื้นฐานของเสียงดิจิตอลที่ให้เสียงดนตรีและเสียงพูดเช่นเดียวกับ FM synthesis

Direct Sound ของ microsoft เป็นส่วนหนึ่งของ DirectX API เป็นอิสระจาก hardware แต่ต้องใช้ windows สามารถรองรับเสียงได้มากที่สุด 8 เสียงซึ่งสามารถควบคุมแต่ละเสียงเป็นอิสระจากกันได้ มีลักษณะเฉพาะ 2 อย่าง คือ
1 มีสองบัฟเฟอร์ โดยบัฟเฟอร์ที่สองจะควบคุมเสียงระดับต่ำ เช่นเสียงแบ็คกราวด์ เสียงดนตรี หรือเสียงพูดแล้ว ผสมเสียงเข้าด้วยกัน เมื่อเสียงถูกรวมเข้าด้วยกันแล้ว จะถูกส่งไปไว้ที่บัฟเฟอร์แรกเพื่อส่งออกลำโพงต่อไป
2 เสียง 3D หลักการทำงานคือจะวางเสียงในตำแหน่งที่แน่นอนซึ่งสัมพันธ์กับตำแหน่งของผู้ฟัง โดยสร้างตำแหน่งและระยะห่างเสมือนของแหล่งกำเนิดเสียงโดยใช้ความถี่ และความหนาแน่นของเสียง

A3Dคือการทำเสียงเอฟเฟกต์เสียง 3 มิติตามตำแหน่ง พัฒนาโดย Aureal semiconductor

Dolby AC-3 audio streamคือระบบเสียงดิจิตอลสำหรับ DVD ซึ่งเพิ่มความสามารถของระบบ Dolby surround sound โดยใช้ 5.1 Channel พร้อมกับ 1 subwoofer

MIDI(Musical Instrument Digital Interface)เป็น โปรโตคอลการสื่อสารที่ออกแบบมาเพื่อให้เครื่องดนตรี ตั้งแต่ 2 ชนิดขึ้นไปสื่อสารกันได้ โดยใช้คำสั่งโน้ต(note intruction เป็นคำสั่งเฉพาะของ MIDI)ในการสื่อสารกัน

-General MIDI(GM)จะกำหนดรูปแบบเสียงดนตรีไว้ 128 ชนิด ต้องสามารถเล่นโน้ตดนตรีได้ 24 ตัวพร้อมกัน และกำหนดให้ อุปกรณ์แต่ละตัวต้องมีเสียงกลองทาง MIDI ที่ channel 10 โดย

มาตรฐาน GM ประกอบด้วยสาระสำคัญคือ มีจำนวนเสียงเครื่องดนตรีที่เก็บเอาไว้ทั้งหมด 128 ชนิด ซึ่งจะรวมทั้งเสียงของเครื่องดนตรีจริงๆกับเสียงของเอฟเฟคต์ต่างๆ เช่นเสียงปรบมือ เสียงฝนตก ฯลฯเอาไว้ด้วย หมายเลขของเครื่องดนตรีแต่ละชนิดจะเรียกว่า PATCH โดยจะมีการแบ่ง PATCH ออกเป็นกลุ่มๆดังต่อไปนี้

  1. เปียโน(PIANO)
  2. เครื่องตีที่ไล่เสียง(CHROMATIC PERCUSSION)เช่นระนาด
  3. ออร์แกน(ORGAN)
  4. กีตาร์(GUITAR)
  5. เครื่องดนตรีเสียงต่ำ(BASS)
  6. เครื่องสาย(STRINGS)
  7. เสียงประสาน(ENSEMBLE)
  8. เครื่องเป่าทองเหลือง(BRASS)
  9. ขลุ่ย(REED)
  10. ปี่เสียงแหลม(PIPE)
  11. เสียงนำสังเคราะห์ (SYNTH LEAD)
  12. เสียงสนับสนุนสังเคราะห์ (SYNTH PAD)
  13. เสียงเอฟเฟคต์สังเคราะห์ (SYNTH EFFECTS)
  14. เสียงคนพูด(ETHNIC)
  15. เครื่องเคาะจังหวะ(PERCUSSIVE)
  16. เสียงเอฟเฟคต์ (SOUND EFFECTS)
 
และในแต่ละกลุ่มยังแบ่งย่อยๆไปอีกกลุ่มละ 8 ชนิด เช่น ในกลุ่มของเปียโน ก็จะมีเสียงของเปียโนชนิดต่างๆอีก 8 ชนิด หรือในกลุ่มของ BRASS ก็ประกอบด้วย ทรัมเป็ต , ทรัมโบน และเครื่องเป่าอื่นๆอีกรวม 8 ชนิด เป็นต้น

-Roland GS(General Synthesizer) พัฒนาขึ้นโดย Roland กำหนดเพิ่มเติมจาก GM โดยได้เพิ่มจำนวนของตาราง patchค่าของเสียงดนตรี(parameter)ที่ ซินธิไซเซอร์ใช้ในการสังเคราะห์เสียง และรหัสควบคุมอุปกรณ์ midi ในระดับสูง โดยมีรูปแบบของเสียงดนตรี 189 ชนิด

-Microsoft GS Wavetable SW Synth นี่ก็คือตัวเลือกที่มีผลให้ระบบ WINDOWS ทำการคำนวณเพื่อสร้างตารางของชนิดเครื่องดนตรี ให้ตรงกับมาตรฐานของ GS เพื่อว่าไม่ว่าจะนำไฟล์ MIDI ของเพลงใดค่ายใดมาเปิดก็จะได้อารมณ์เพลงจากเครื่องดนตรีชนิดเดียวกัน ทำให้ใครก็ตามที่ใช้ WINDOWS สามารถรับฟังดนตรีที่มีคุณภาพได้โดยที่ไม่ต้องไปซื้อหาการ์ดเสียงราคาแพงมาแต่อย่างใด ก็ทดลองเลือกฟังดูแล้วจะพบกับความไพเราะหนักแน่นของเสียงดนตรี แต่การที่จะเลือก ตัวเลือกนี้ได้ก็ขอให้พิจารณาประสิทธิภาพระบบคอมพิวเตอร์ของเราสักนิดก่อน เพราะว่าค่อนข้างจะ"กินแรง"จากซีพียูเอาการอยู่

-Yamaha XG(EXTENDED GENERAL MIDI) เป็นมาตรฐานที่ประกาศออกมาในปี 1994 จะกำหนดรูปแบบเสียงดนตรีไว้ 400 ชนิด มีเสียงกลอง 22 ชุด พัฒนาโดย Yamaha เพื่อบรรจุเสียงใหม่ๆลงไปในตารางเสียงนี้อีกเพื่อรองรับกับงานดนตรีของตนเอง มาตรฐาน XG ยังคงเข้ากันได้กับมาตรฐาน GM ตัวเดิมอยู่ แต่ได้เพิ่มเติมการทำงานอีกเป็น 2 โหมด คือ 1.) โหมด XG มีเครื่องดนตรี 16 กลุ่มเสียงทั้งหมดเพิ่มขึ้นเป็น 480 เสียง มีเสียงกลอง 9 ชุด และชุดเอฟเฟคต์อีก 2 ชุด 2.) โหมด TG3000B(GS Emulation) โดยจะครอบคลุมถึงมาตรฐานเสียงใน GS FORMAT ของ  ROLAND ด้วย และได้เพิ่มเติมเสียงขึ้นมาอีกเพื่อใช้กับซาวด์การ์ดและซาวด์โมดูลของ YAMAHA เองโดยเฉพาะ แต่ยังคงมีเครื่องดนตรี  16 กลุ่ม แต่เพิ่มเสียงเป็น 579 เสียง เป็นเสียงกลอง 8 ชุด และเอฟเฟคต์ 2 ชุด

-MPU-401 เป็นมาตรฐานหนึ่งที่ใช้กับ Daughter board ซึ่งจะมี Slot ที่เข้ากันได้พอดีกับการ์ดเสียงตัวนี้มาเสียบลงไป ซึ่งมีตั้งแต่ราคาไม่ถึง 500 บาท ไปจนถึงหมื่นกว่าบาทให้เลือกซื้อ    

กลับไปที่สารบัญ

PCI AUDIO : ก้าวต่อไปสำหรับระบบเสียงคุณภาพใน PC
ทำไมจึงเป็น PCI

ในปัจจุบันการพัฒนาระบบเสียงในเครื่อง PC ขาดความต่อเนื่องและการพัฒนาที่เพียงพอ เนื่องจากสาเหตุหลายประการ เช่น ราคา ความสามารถในการทำงานร่วมกับ DOS ในเกมส์ ขาดO/S Support ที่แน่นอน รวมถึงผู้บริโภคเน้นความสามารถทางด้าน Processor Unit และ Graphic มากกว่าคุณภาพด้านเสียง

แต่ในขณะเดียวกันการพัฒนาทางด้านกราฟฟิคทำให้สามารถสร้างภาพสามมิติ ,การ เล่นเกมส์ Multi Player ผู้บริโภคจึงมีความต้องการระบบเสียงที่ดีกว่า 16-Bit Stereo นักพัฒนารวมถึง วิศวกร จึงได้พยายามคิดค้นระบบ ที่สามารถรองรับการเข้าถึงของกระแสข้อมูลแบบ Multi- Simultaneous และ สามารถทำการสื่อสารแบบโทรศัพท์ได้ นอกจากนี้ยังรวมถึงการรองรับ การ กระจายเสียงแบบสามมิติ และ การบอกตำแหน่งของเสียง Effect ในเกมอีกด้วย

Sound Blaster ISA Bus Standard

ในระยะแรกๆที่ PC ยังใช้ DOS เป็นตัวปฏิบัติการและไม่มี Software มาตรฐานที่จะขับระบบเสียงนั้น Creative Lab's Sound Blaster Audio Technology ประสบความสำเร็จในการจับตลาดโดยการส่ง Software ซึ่งถูกพัฒนาโดยการเขียน Device Register Set ของ Creative เอง ซึ่งในเวลาต่อมาผู้ผลิต Chip เสียงอื่นๆจึงเริ่มที่จะให้ Sound Blaster Register เป็นส่วนหนึ่งใน Software ของผู้ผลิตนั้นๆ เพื่อที่จะรองรับ Hardware ของค่ายนั้นๆได้

A De Factor ได้ถูกสร้างขึ้นเพื่อรองรับ 1 ช่อง Stereo หรือ 2 ช่อง Mono ที่ความถี่ต่ำของ ISA Bus แต่เพราะว่าผู้ผลิตส่วนใหญ่นั้นเขียนโปรแกรมเพื่อให้เข้ากับ มาตรฐานของ Sound Blaster เพราะฉะนั้น Sound Blaster ISA- bus จะไม่หายไปในทันที แต่ตลาดจะเริ่มให้สนใจกับระบบเสียงมาก PCI ขึ้น

Microsoft

ทาง Microsoft ก็เริ่มให้ความสำคัญกับระบบเสียงแบบ PCI-Based Audio เพื่อจะทำตลาดออกขายให้แก่ผู้บริโภคและ นักธุรกิจโดยสินค้ามีความสามารถในการ ติดต่อสื่อ-สารและมีระบบเสียงที่ดี เช่น Direct Sound และDirect 3D APIs ของ Microsoft สามารถรองรับการส่งถ่ายข้อมูลหลายๆแหล่งพร้อมๆกันได้ ทำให้ Software สามารถผลิตระบบเสียงแบบ Surround และ Effect แบบสามมิติได้

อย่างไรก็ตามISA bus ของ Sound Blaster มีความสามารถจำกัดแค่การเข้าถึงข้อมูลเพียง 1 ช่องเท่านั้นทำให้สามารถเข้าถึงระบบหน่วยความจำของ PC ได้เพียง 1 data - stream เท่านั้น เพราะฉะนั้น Software ของ Microsoft จึงยังไม่สามารถแสดงประสิทธิภาพได้อย่างเต็มที่ จนกว่าจะมีระบบที่สามารถรองรับ Bus Mastering DMAได้ทั้ง 64 ช่อง

Unified Driver

ระบบ Win32 Driver Model ( WDM ) สามารถที่จะจัดการกระแสข้อมูลของระบบเสียงได้มีคุณภาพมากขึ้น โดยสามารถจัดระบบข้อมูลแบบ Multiple ให้เป็น แบบ Synchronize ได้ WDM สามารถใช้กับ WINDOW NT และ MEMPHISได้ แผนการขั้น ต่อไปคือ จะพยายามให้นำมาใช้กับ WINDOWS 95 โดยใช้วิธีการเจาะตลาดโดยการแสดงว่าระบบนี้ไม่สามารถรองรับโดย ISA bus ได้ ซึ่งทาง Microsoft พยายามเปลี่ยนตลาดให้ผู้บริโภคสนใจ PCI มากกว่า ISA แบบเดิมที่มีอยู่ ซึ่งจะเป็นหนทางในการพัฒนาอีกขั้นหนึ่งเพื่อให้เหมาะสม กับผู้ใช้งานที่มีความสามารถระดับหน้าได้

System Performance

ISA bus Technology เป็นส่วนหนึ่งที่ทำให้การออกแบบระบบเป็นปัญหา ใน-การใช้ Sound Blaster ISA bus นั้น หมายความว่า CPU นั้นจะถูกรบกวนจากการส่งถ่ายข้อมูลของระบบเสียง แต่ผลกระทบที่เกิดจาก ISA-bus จะ ถูกลดลงโดยระบบบางอย่าง เช่น F-mode DMA แต่จะต้องมีค่าใช้จ่ายบำรุงรักษาสูง

ESS Technology ได้ประมาณไว้ว่า 20% ของความสามารถของ CPU จะถูกกั้นไว้ด้วยการใช้ 16-bit Stereo sound ที่ 44.1 KHz กับ ISA bus-based ในขณะที่ PCI - Technology ของ ESS ที่เรียกว่า AGOGO - XP ใช้ความสามารถไม่ถึง 1% ของ CPU เพื่อส่งถ่ายข้อมูลในระดับเดียวกับ ISA bus

PCI Performance

ข้อได้เปรียบหลายประการของ PCI bus เช่น การส่งถ่ายข้อมูล จะสามารถทำได้ถึง 133 MB/sec ในขณะที่ ISA bus สามารถทำได้เพียง 7 MB/sec จากความสามารถนี้ทำให้ PCI สามารถส่งถ่ายข้อมูลแบบ Multiple Stream ได้ และยังลดความล่าช้าและ การขาดความต่อเนื่องในการสื่อสารแบบ Internet-based Interactive ,โทรศัพท์ และการประชุมทางสายโทรศัพท์ได้

Wavetable Sound

ในระยะแรก ISA-based Sound Blaster สามารถรองรับได้เพียงแค่ 8 bit PCM ( Pulse Code Modulation )เท่านั้น ในขณะที่แฟ้มข้อมูลของระบบเสียงมีขนาดใหญ่ เพราะฉะนั้นจำนวนเสียง ที่สามารถเลียนเสียงได้โดย Software จึงมีน้อย ซึ่งภายหลังจากนั้น FM Synthesis Capabilities จึงถูกพัฒนาขึ้นเพื่อให้สามารถสร้างเสียงจาก Synthesizing sine waves ได้

เมื่อเร็วๆนี้ที่ผ่านมา เทคนิคการสังเคราะห์ MIDI Wavetableได้ถูกพัฒนาให้สามารถ ทำเสียงที่เลียนแบบเสียงของเครื่องดนตรีได้อย่างสมบูรณ์แบบโดยการแยกแถบเสียง เทคโนโลยีของ Wavetable ใช้ algorithms เพื่อที่จะเก็บสะสมตัวอย่างความถี่ของเสียงที่จะทำให้เป็นระบบดิจิตอล ของการใช้เครื่องมือในการสร้างสรรค์ตัวโน้ต ,โทนเสียง และ ระดับของการแสดงให้หลากหลายออกไป

การยอมรับของตลาดที่มีต่อ PC Wavetable sound solutions เครื่องก่อนชะงักลงไป เพราะว่ามันไม่สามารถเข้ากันได้กับ Software ที่ถูกพัฒนามาเพื่อ Sound Blaster Standard และมันจะมีค่าใช้จ่ายสูงในการดัดแปลงให้มันเข้ากันได้ การเข้ากันของ software ในขณะนี้ได้ถูกแก้ไขโดย บริษัทผู้ขาย เช่น ESS Technology โดยการใช้การแก้ไขที่ Hardware ทั้งนี้การแก้ไขของ ESS Technology , TDMA ช่วยสร้างสรรค์แก่นแท้ของ ISA bus ที่เป็นคู่แข่งของ PCI bus ซึ่งค่าใช้จ่ายของเครื่องมือการสังเคราะห์ Wavetable เครื่องแรก ราคาแพงกว่าในขณะนี้อย่างมาก และ ในส่วนของการใช้งาน เช่น การดาวน์โหลด ชุดเสียงก็ยังทำงานได้ช้ากว่า

Downloadable Sound Samples

ครั้งแรกของการสังเคราะห์ Wavetable PCI Audio solutions จะใช้ ROM ในการเก็บเสียงตัวอย่างที่ต้องการเพื่อที่จะจำแนกเสียง เนื่องจาก ROM มีราคาแพงและ มีข้อจำกัดของจำนวนเสียงที่ Wavetable Engine สามารถผลิตได้ นอกจากนี้ ตัวอย่างเสียงจะถูก -ดาวน์โหลด โดยผู้ขาย Software และผู้ผลิต Hardware โดยไม่มีมาตรการควบคุม กับบริษัทผู้ขาย Wavetable Hardware Accelerator ซึ่งได้รับตัวอย่างเสียงมา

ESS Technology's PCI Audio solutions ใช้ PCI bus และ WaveCacheD6 Technology เพื่อที่จะเก็บเสียงตัวอย่าง MIDI ในหน่วยความจำหลักของคอมพิวเตอร์ (PC) การดาวน์โหลดเสียงตัวอย่างช่วยให้ประหยัดต้นทุนของ ROM และ อนุญาตให้ผู้พัฒนา Software ตัดสินใจอย่างแน่นอนว่าจะให้ Title ของพวกเขาจะใช้เสียงในทุกระบบเพื่อที่จะดาวน์โหลดเสียงให้ได้ประโยชน์สูงสุดได้อย่างไร

Customizable Sound

WaveCache เป็นทางเลือกที่ดีอย่างหนึ่ง ที่ได้ให้โอกาสผู้พัฒนา Software ได้ปรับปรุง จัดแต่ง เสียงในเกมส์ และในอุปกรณ์ Multimedia ยกตัวอย่างเช่น เสียงในเกมส์จะถูกปรับให้มีเสียงประกอบท่าทาง (acfion) ที่สมจริงมากยิ่งขึ้น ในขณะที่เพลงประกอบที่ได้จากอุปกรณ์ Multimedia ก็ได้รับการปรับปรุงเป็นอย่างดี

ทั้งหมดของ ESS Technology จากผลิตภัณฑ์ PCI solutions มีพื้นฐานอยู่บน สัญญาณเสียง 64 ช่องโดยแต่ละช่องจะถูกตั้งโปรแกรมโดยตัวเอง เพื่อที่จะควบคุม panning , tremolo , vibrato และ tone filtering ผลที่ได้ก็คือ ความสามารถในการสร้างเสียงในระดับ Orchestral Performance ทั้งนี้เสียงที่ได้จะขึ้นอยู่กับคุณภาพของลำโพงด้วย

นอกจากนี้แต่ละช่องจะช่วยสนับสนุนโปรแกรม Special Effect โดยอิสระ เช่น reverb , chorus , echo และ 3D special enhancement เป็นต้น จากความสามารถเหล่านี้ ผู้พัฒนา Software สามารถสร้าง 3D Audio Effect อย่างดีเยี่ยม โดยสามารถให้เสียงที่เหมือนจริง โดยมีการกระจายเสียงออกจากวัตถุที่เคลื่อนที่หรือ จากหลายๆ แหล่งเสียงรอบๆผู้ฟังได้

PC Audio - The Story Continues

จากการที่ระบบเสียงของคอมพิวเตอร์ กำลังจะเปลี่ยนแปลงจาก ISA bus-based solutions ไปเป็นระบบ PCI ดังที่เป็นวิวัฒนาการอย่างต่อเนื่องที่สำคัญของระบบเสียง การพัฒนาโครงสร้าง bus นี้เป็นการค้นพบใหม่ที่จะยืนยันได้ว่า ระบบเสียงของ PC ได้มีการก้าวหน้าไปอีกขั้นหนึ่งแล้ว ซึ่งจะมีการพัฒนาต่อๆไป


กลับไปที่สารบัญ

ศัพท์เทคนิคเกี่ยวกับ Soundcard

Channel -เป็นช่องสัญญาณซึ่ง MIDI ใช้ในการเคลื่อนย้าย
หรือรับข้อมูลสัญญาณเสียง MIDI controller 1 ตัว สามารถรองรับได้ 16 ช่องสัญญาณ

FM synthesis -คือการสังเคราะห์เสียง โดยผสมสัญญาณความถี่ต่ำเข้าด้วยกันจนได้สัญญาณเสียงใหม่ที่มีความถี่ซับซ้อนยิ่งขึ้น

Synthesizer -เป็นชิปที่ใช้สังเคราะห์เสียงดนตรี โดยคำนวณสร้างสัญญาณเสียง
จากค่า Patch ที่กำหนดไว้

Patch -เป็นค่าของเสียงดนตรี(parameter)ที่ ซินธิไซเซอร์ใช้ในการสังเคราะห์เสียง

Sequencer -เป็นซอฟแวร์ที่ใช้บันทึก,ปรับแต่ง และเล่นเพลงจากไฟล์ MIDI

MIDI Sequence -เป็นคำสั่งในการกำหนดลักษณะของเสียงในไฟล์ MIDI

Pitch -เป็นระดับเสียงของตัวโน้ตดนตรี ยิ่งความถี่ของ waveform มากเท่าไร เสียงยิ่งสูงมาก

Track -เป็นลักษณะทางตรรกะหรือกายภาพของเสียงที่ทำให้
สามารถบันทึกและปรับแต่งเสียงสำหรับแต่ละส่วนแยกเป็นอิสระจากกันได้

Sampling rate -จำนวนของสัญญาณเสียงที่สุ่มขึ้นมา(sample) ในระยะเวลาที่กำหนด

Polyphony -การเล่นโน้ตหลายๆตัวในเวลาเดียวกัน หรือ
การเล่นโน้ตตัวเดียวที่ให้เสียงแตกต่างกันหลายๆเสียงในเวลาเดียวกัน

DCI(Device control Interface)เป็น interface สำหรับ device driver พัฒนาขึ้นโดย Intel

กลับไปที่สารบัญ

1