Rezumat: Abordări obiect și descrierea scenei. Formarea scenelor audio-vizuale MPEG-4. Descrierea și sincronizarea fluxurilor de date pentru obiectele media. Profiluri. Demultiplexarea, sincronizarea și descrierea fluxurilor de date, limbajul de definiție al MPEG-7 (DDL). Masti alfa.
- televiziune digitală;
- aplicații grafice interactive (conținut sintetic);
- interactiv multimedia World Wide Web.
6.1. Standardul MPEG-4
Standardul MPEG-4 furnizează tehnologie pentru nevoile dezvoltatorilor, furnizorilor de servicii și utilizatorilor finali.
- reprezintă blocuri de informații audio, vizuale și audio-vizuale, numite "obiecte media". Aceste obiecte media pot fi de origine naturala sau artificiala; adică pot fi înregistrate utilizând o cameră sau un microfon sau pot fi generate de un computer;
- descrie compoziția acestor obiecte atunci când creează obiecte media compozite care formează scene audiovizuale;
- determină multiplexarea și sincronizarea datelor asociate obiectelor media, astfel încât acestea să poată fi transmise prin intermediul canalelor de rețea, oferind QoS, acceptabil pentru natura anumitor obiecte media;
- Aceasta determină interacțiunea cu scena audio-vizuală formată pe partea receptoare.
Reprezentarea codificată a obiectelor media
Scenele audio-vizuale MPEG-4 sunt formate din mai multe obiecte media organizate ierarhic. La periferia ierarhiei sunt obiecte media primitive, cum ar fi:
MPEG-4 standardizează numărul de astfel de obiecte media primitive capabile să reprezinte atât tipuri naturale cât și sintetice de conținut, care pot fi 2- sau 3-dimensionale. Pe lângă obiectele media menționate mai sus și prezentate în Fig. 3.1. MPEG-4 definește reprezentarea de cod a obiectelor, cum ar fi:
- text și grafică;
- vorbe capete sintetizate și text asociat folosit pentru sinteza de vorbire și animația capului;
- sunete sintetizate.
Obiectul mass-media în forma sa codificată constă din elemente descriptive care îi permit să fie procesate în scena audiovizuală și, dacă este necesar, să asocieze un flux de date cu acesta. Este important să rețineți că forma codată a fiecărui obiect media poate fi reprezentată independent de mediul înconjurător sau de fundal.
Reprezentarea codului obiectelor media este cea mai eficientă din punct de vedere al obținerii funcționalității necesare. Exemple de astfel de funcționalități sunt tratarea rezonabilă a erorilor, recuperarea ușoară și editarea obiectelor și reprezentarea obiectelor într-o formă scalabilă.
Compoziția obiectelor media
În Fig. 6.1 explică modul de descriere a scenelor audio-vizuale în MPEG-4, constând în obiecte individuale. Figura conține obiecte media compozite care combină obiecte media primitive. Primele obiecte media corespund periferii arborelui descriptiv, în timp ce obiectele media compozite sunt sub-copaci. Ca exemplu: obiectele vizuale care corespund persoanei vorbitoare și vocii sale sunt combinate unele cu altele, formând un nou obiect media compozit.
Fig. 6.1. Exemplu scenă MPEG-4
Această grupare permite dezvoltatorilor să creeze scene complexe, iar utilizatorii manipulează individual sau grupuri de astfel de obiecte.
MPEG-4 oferă un mod standardizat de descriere a scenelor, permițând:
- plasarea obiectelor media oriunde în sistemul de coordonate dat;
- aplicați transformări pentru a modifica aspectul geometric sau acustic al obiectului media;
- gruparea obiectelor media primitive pentru a forma obiecte media compozite;
- utilizarea fluxurilor de date pentru a modifica atributele obiectelor media (de exemplu, sunetul, textura în mișcare aparținând obiectului, parametrii de animație care controlează fața sintetică);
- modifică interactiv punctul de prezență al utilizatorului pe scenă (punctul său de observație și de ascultare).
Descrierea scenei este construită în multe feluri în același mod ca în VRML (Language Reality Modeling Language).
Descrierea și sincronizarea fluxurilor de date pentru obiectele media
Obiectele media pot necesita un flux de date care să fie convertit în unul sau mai multe fluxuri elementare. Descriptorul de obiecte identifică toate firele asociate obiectului media. Acest lucru vă permite să procesați ierarhic datele codificate, precum și informațiile media asociate despre conținut (numite "informații privind conținutul obiectelor").
Fiecare flux este caracterizat printr-un set de descriptori pentru configurarea informațiilor, de exemplu, pentru a determina resursele necesare ale dispozitivului de înregistrare și acuratețea informațiilor de timp codificate. Mai mult, descriptorii pot conține sugestii despre QoS care sunt necesare pentru transmisie (de exemplu, numărul maxim de biți / s, BER, prioritate etc.)
Livrarea de fluxuri de date
Livrarea sincronizată a fluxului de date al unui expeditor către un destinatar care utilizează diferite QoS disponibile în rețea este specificat în termeni de un strat de sincronizare și de livrare care conține un multiplexor cu două straturi (a se vedea Figura 6.2).
Primul strat de multiplexare este gestionat în conformitate cu specificația DMIF (Framework de integrare multimedia de livrare). Această multiplexare poate fi realizată prin multiplexorul FlexMux MPEG, care ne permite să grupăm fluxurile elementare ale ES (Elementary Streams) cu redundanță redusă. Multiplexarea la acest nivel poate fi folosită, de exemplu, pentru a grupa un ES cu cerințe similare QoS pentru a reduce numărul de conexiuni de rețea sau valori de întârziere.
Fig. 6.2. Modelul stratului de sistem MPEG-4
Stratul TransMux (Transport Multiplexing) din Fig. 6.2 simulează nivelul care oferă servicii de transport care îndeplinesc cerințele QoS. MPEG-4 specifică numai interfața acestui strat, în timp ce cerințele rămase pentru pachetele de date vor fi determinate de protocolul de transport. Orice stivă de protocol de transport existent, de exemplu (RTP) / UDP / IP, (AAL5) / ATM sau fluxul de transport MPEG-2. peste un strat de legătură adecvat poate deveni un caz special al TransMux. Alegerea este lăsată pentru utilizatorul final sau furnizorul de servicii și permite utilizarea MPEG-4 cu o gamă largă de medii de operare.
Utilizarea multiplexorului FlexMux este opțională și, așa cum se arată în Fig. 6.2. Acest strat poate fi gol dacă TransMux-ul subiacent oferă toate funcțiile necesare. Cu toate acestea, stratul de sincronizare este întotdeauna prezent. Având în vedere acest lucru, este posibil:
- identificarea modulelor de acces, a timbrelor de transport și a informațiilor de timp de referință și înregistrarea pierderilor de date;
- încărcați opțional datele din diferite fluxuri elementare către fluxurile FlexMux;
- transmite informații de control;
- Indicați nivelul necesar QoS pentru fiecare fir elementar și fluxul FlexMux;
- traduce aceste cerințe QoS în resurse reale ale rețelei;
- asociază fluxurile elementare cu obiecte media;
- transferați legarea fluxurilor elementare la canalele FlexMux și TransMux.
Interacționează cu obiectele media
Utilizatorul vede o scenă care se formează în funcție de designul dezvoltatorului. În funcție de gradul de libertate oferit de dezvoltator, utilizatorul are posibilitatea de a interacționa cu scena. Următoarele operațiuni pot fi permise utilizatorului:
- schimba punctul de observare / audierea pe scenă;
- mutați obiectele prin scenă;
- Apelați succesiunea evenimentelor făcând clic pe anumite obiecte, de exemplu pornind sau oprind fluxul de date;
- alegeți limba preferată atunci când o astfel de alegere este posibilă.
Gestionarea și identificarea proprietății intelectuale
Este important să puteți identifica proprietatea intelectuală în obiectele media MPEG-4. O listă completă a cerințelor privind identificarea proprietății intelectuale poate fi găsită pe pagina de pornire MPEG din secțiunea "Gestionarea și protecția proprietății intelectuale".
MPEG-4 include identificarea proprietății intelectuale prin stocarea identificatorilor unici care sunt eliberați de sistemele internaționale de numerotare (de exemplu ISAN (International Audio-Visual Number), ISRC (International Standard Recording Code) etc.). Aceste numere pot fi folosite pentru a identifica proprietarul actual al drepturilor obiectului media. Deoarece nu este identificat întregul conținut prin acest număr, MPEG-4 versiunea 1 oferă posibilitatea de a identifica proprietatea intelectuală folosind o pereche de valori-cheie (de exemplu: compozitor / John Smith). În plus, MPEG-4 oferă o interfață standardizată care este strâns integrată cu stratul de sistem pentru persoanele care doresc să utilizeze sisteme care controlează accesul la proprietatea intelectuală. Cu această interfață, sistemele de control al proprietății se pot integra ușor cu o parte standardizată a decodorului.
Având în vedere urgența problemei, în prezent se dezvoltă standardul MPEG-21, care reglementează relația dintre utilizatori și obiectele digitale.