INTERNATIONAL TELECOMMUNICATION UNION
CCITT
THE INTERNATIONAL
TELEGRAPH AND TELEPHONE
CONSULTATIVE COMMITTEE
GENERAL ASPECTS
OF DIGITAL
TRANSMISSION SYSTEMS
TERMINAL EQUIPMENTS
Coding of speech at 16kbit/s
using
low-delay code exited linear
prediction
(LD-CELP)
Recommendation G.728
Geneva, 1990
- Γενικά
-
Η σύσταση G.728 του ITU-T ορίζει έναν αλγόριθμο κωδικοποίησης φωνής
στα 16kbit/s με την χρήση ενός γραμμικού
προβλέπτη διέγερσης με μικρή
καθυστέρηση (low-delay code excited linear prediction (LD-CELP) ) . Ο συγκεκριμένος
αλγόριθμος απαι- τεί μεγάλη υπολογιστική ισχύ αλλά προσφέρει εξαιρετική
ποιότητα ήχου. Ο παράγοντας της μικρής καθυστέρησης ,καθιστά την συγκεκριμένη
τεχνική ιδανική για εφαρμογές τηλεδιά- σκεψης.
-
- Περιγραφή
-
Ο CELP codec ανήκει στην κατηγορία των υβριδικών codec
οι οποίοι χρησιμοποι- ούνται για την μετάδοση φωνής σε πολύ
χαμηλούς ρυθμούς μετάδοσης .Είναι ο αλγόριθμος που χρησιμοποιείται περισσότερο
από όλους του ίδιου είδους σε εφαρμογές που απαιτείται ρυθμός μετάδοσης
χαμηλότερος από 10kbit/s . Όπως και σε όλους τους υβριδικούς
codecs πραγματοποιείται ανάλυση του σήματος εισόδου
μέσω short και long term γραμμικών φίλτρων
και επιλογή προς κωδικοποίηση πακέτου με την μεγαλύτερη ενέργεια.
Η διαφορά του CELP από τους υπόλοιπούς codecs έγκειται στο γεγονός ότι
το σήμα διέγερσης κωδικο- ποιείται διανυσματικά. Η διέγερση παρέχεται από
ένα μεγάλο διανυσματικό κβαντιστή του οποίου η τιμές περιέχονται
σε ένα κατάλογο, και από έναν όρο κέρδους για τον έλεγχο του ύψους
της. Τυπικά ο κατάλογος των κωδικών του κβαντιστή αναπαριστάται
με 10bit και ο όρος του κέρδους με 5 bit. Με τον τρόπο αυτό ο ρυθμός
μετάδοσης μειώνεται σημαντικά , αν συγκρίνουμε τα 15bit με το 47
bit που απαιτούνται στον GSM RPE codec.
-
Ο κατάλογος που χρησιμοποιείται από τον CELP codec περιέχει λευκές γκαουσιανές
ακολουθίες. Αυτό γίνεται γιατί υποτίθεται ότι οι long και short term προβλέπτες
είναι ικανοί να μετακινήσουν σχεδόν όλη την περίσσεια του σήματος
φωνής για να παράγουν ένα τυχαίο υπολειπόμενο σήμα παρόμοιο με θόρυβο.
Επιπλέον αποδείχθηκε ότι η short-term συνάρ- τηση
πυκνότητας πιθανότητας του υπολειπόμενου σήματος ήταν γκαουσιανή . Με την
χρησι- μοποίηση ενός τέτοιου καταλόγου για
την παραγωγή της διέγερσης για ένα long ή short term φίλτρο
σύνθεσης μπορούμε να παράγουμε φωνητικό σήμα υψηλής ποιότητας.
-
Παρά ταύτα η επιλογή της καταλόγου που πρέπει να χρησιμοποιηθεί κάθε φορά
σαν είσοδος στην διαδικασία ανάλυσης-σύνθεσης προϋποθέτει
την εισαγωγή κάθε ακολουθίας διέγερσης μέσω του φίλτρου σύνθεσης
, για την σύγκρισή της με το πραγματικό σήμα . Το γεγονός
αυτό αυξάνει κατά πολύ την πολυπλοκότητα του συγκεκριμένου
αλγόριθμου. Η πολυπλοκότητα φτάνει σε τέτοιο βαθμό
ώστε να είναι αδύνατη η χρήση του σε real-time εφαρμογές όπως
αρχικά είχε προταθεί. Μετά από αρκετή επεξεργασία και κυρίως
μεταβάλ- λοντας τους καταλόγους των κωδικών λέξεων μειώθηκε
ως ένα βαθμό η πολυπλοκότητα. Ταυτόχρονα η ανάπτυξη των
DSP (Digital Sound Processors) επιτεύχθηκε η χρησιμοποίηση τους σε
real time εφαρμογής , με την χρήση ενός DSP χαμηλού κόστους.
-
Η ποιότητα του ήχου που παράγεται από τον CELP codec στα 16
kbit/s είναι σχεδόν ίδια με αυτήν που παράγεται από λογαριθμική κωδικοποίηση
PCM στα 64kbit/s.