FMUSER Wirless transmet la vidéo et l'audio plus facilement!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanais
ar.fmuser.org -> arabe
hy.fmuser.org -> Armenian
az.fmuser.org -> azerbaïdjanais
eu.fmuser.org -> basque
be.fmuser.org -> biélorusse
bg.fmuser.org -> Bulgare
ca.fmuser.org -> catalan
zh-CN.fmuser.org -> chinois (simplifié)
zh-TW.fmuser.org -> Chinois (traditionnel)
hr.fmuser.org -> croate
cs.fmuser.org -> tchèque
da.fmuser.org -> danois
nl.fmuser.org -> Néerlandais
et.fmuser.org -> estonien
tl.fmuser.org -> Philippin
fi.fmuser.org -> finnois
fr.fmuser.org -> Français
gl.fmuser.org -> Galicien
ka.fmuser.org -> géorgien
de.fmuser.org -> allemand
el.fmuser.org -> Grec
ht.fmuser.org -> Créole haïtien
iw.fmuser.org -> hébreu
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hongrois
is.fmuser.org -> islandais
id.fmuser.org -> indonésien
ga.fmuser.org -> irlandais
it.fmuser.org -> Italien
ja.fmuser.org -> japonais
ko.fmuser.org -> coréen
lv.fmuser.org -> letton
lt.fmuser.org -> Lituanien
mk.fmuser.org -> macédonien
ms.fmuser.org -> malais
mt.fmuser.org -> maltais
no.fmuser.org -> Norwegian
fa.fmuser.org -> persan
pl.fmuser.org -> polonais
pt.fmuser.org -> portugais
ro.fmuser.org -> Roumain
ru.fmuser.org -> russe
sr.fmuser.org -> serbe
sk.fmuser.org -> slovaque
sl.fmuser.org -> Slovène
es.fmuser.org -> espagnol
sw.fmuser.org -> Swahili
sv.fmuser.org -> suédois
th.fmuser.org -> Thai
tr.fmuser.org -> turc
uk.fmuser.org -> ukrainien
ur.fmuser.org -> ourdou
vi.fmuser.org -> Vietnamienne
cy.fmuser.org -> Gallois
yi.fmuser.org -> Yiddish
H.264, ou MPEG-4 Part Ten (AVC, Advanced Video Coding), est la dernière génération de normes de compression vidéo lancée conjointement par le Département de normalisation des télécommunications internationales de l'UIT-T et l'Organisation internationale de normalisation ISO / CEI en 2003. À Actuellement, la norme H.264 est largement utilisée dans la surveillance vidéo à distance filaire / sans fil, les médias interactifs en réseau, la télévision numérique et la vidéoconférence, etc.
Nom chinois H.264 + alias MPEG-4 Partie 10 Heure standard pour la compression vidéo de qualité en 2003
table des matières
1 Introduction de base
2 Faits saillants techniques
Comparaison des performances 3
Introduction de base
H.264 est une nouvelle vidéo numérique développée par l'équipe vidéo conjointe (JVT: équipe vidéo conjointe) du VCEG (Video Coding Experts Group) de l'UIT-T et MPEG (Moving Picture Coding Experts Group) de l'ISO / CEI
Serveur vidéo
Serveur vidéo
Norme de codage, il s'agit à la fois de l'UIT-T H.264 et de l'ISO / CEI MPEG-4 Partie 10. La sollicitation des projets a commencé en janvier 1998. Le premier projet a été achevé en septembre 1999. Le modèle d'essai TML-8 a été développé en mai 2001. Le conseil d'administration FCD de H.264 a été adopté lors de la 5e réunion du JVT en juin 2002.. Officiellement publié en mars 2003. Comme la norme précédente, H.264 est également un mode de codage hybride de DPCM plus le codage par transformée. Cependant, il adopte une conception simple de "retour aux sources", sans beaucoup d'options, et obtient des performances de compression bien meilleures que H.263 ++; renforce l'adaptabilité à divers canaux, adopte une structure et une syntaxe «conviviales pour le réseau», propice au traitement des erreurs et des pertes de paquets; un large éventail de cibles d'application pour répondre aux besoins de différentes vitesses, différentes résolutions et différentes occasions de transmission (stockage); son système de base est ouvert et aucun droit d'auteur n'est requis pour son utilisation. Techniquement, il existe de nombreux points forts dans la norme H.264, tels que le codage de symboles VLC unifié, l'estimation de déplacement multimode de haute précision, la transformation d'entiers basée sur des blocs 4 × 4 et la syntaxe de codage en couches. Ces mesures font que l'algorithme H.264 a une efficacité de codage très élevée, sous la même qualité d'image reconstruite, il peut économiser environ 50% du taux de code que H.263. La structure de flux de code H.264 a une forte adaptabilité au réseau, augmente les capacités de récupération d'erreur et peut bien s'adapter aux applications de réseau IP et sans fil.
Faits saillants techniques
Conception en couches
L'algorithme H.264 peut être conceptuellement divisé en deux couches: la couche de codage vidéo (VCL: Video Coding Layer) est responsable de la représentation efficace du contenu vidéo, et la couche d'abstraction du réseau (NAL: Network Abstraction Layer) est responsable de la manière appropriée requis par le pack réseau et transmettre les données. Une interface basée sur les paquets est définie entre VCL et NAL, et le conditionnement et la signalisation correspondante font partie de NAL. De cette manière, les tâches de haute efficacité de codage et de convivialité du réseau sont remplies respectivement par VCL et NAL. La couche VCL comprend un codage hybride de compensation de mouvement basé sur des blocs et de nouvelles fonctionnalités. À l'instar des précédentes normes de codage vidéo, H.264 n'inclut pas de fonctions telles que le prétraitement et le post-traitement dans le projet, ce qui peut augmenter la flexibilité de la norme. NAL est responsable de l'encapsulation des données en utilisant le format de segment du réseau sous-jacent, y compris le tramage, la signalisation des canaux logiques, l'utilisation des informations de synchronisation ou les signaux de fin de séquence. Par exemple, NAL prend en charge les formats de transmission vidéo sur les canaux à commutation de circuits et prend en charge les formats de transmission vidéo sur Internet à l'aide de RTP / UDP / IP. NAL comprend ses propres informations d'en-tête, des informations de structure de segment et des informations de charge réelle, c'est-à-dire les données VCL de la couche supérieure. (Si la technologie de segmentation des données est utilisée, les données peuvent être constituées de plusieurs parties).
Estimation de mouvement multimode de haute précision
H.264 prend en charge les vecteurs de mouvement avec une précision de 1/4 ou 1/8 pixel. Avec une précision de 1/4 de pixel, un filtre à 6 prises peut être utilisé pour réduire le bruit haute fréquence. Pour les vecteurs de mouvement avec une précision de 1/8 pixel, un filtre à 8 prises plus complexe peut être utilisé. Lorsqu'il effectue une estimation de mouvement, le codeur peut également choisir des filtres d'interpolation "améliorés" pour améliorer l'effet de la prédiction. Dans la prédiction de mouvement de H.264, un macro-bloc (MB) peut être divisé en différents sous-blocs comme le montre la figure 2, formant des tailles de bloc de 7 modes différents. Cette division multi-mode flexible et détaillée est plus adaptée à la forme des objets en mouvement réels dans l'image, ce qui améliore considérablement la précision de l'estimation du mouvement. De cette manière, 1, 2, 4, 8 ou 16 vecteurs de mouvement peuvent être inclus dans chaque macro-bloc. En H.264, le codeur est autorisé à utiliser plus d'une trame précédente pour l'estimation de mouvement, ce que l'on appelle la technologie de référence multi-trame. Par exemple, si 2 ou 3 trames sont juste des trames de référence codées, le codeur sélectionnera une meilleure trame de prédiction pour chaque macrobloc cible, et indiquera pour chaque macrobloc quelle trame est utilisée pour la prédiction.
Transformation entière
H.264 est similaire à la norme précédente, utilisant un codage de transformée par blocs pour le résidu, mais la transformation est une opération entière plutôt qu'une opération de nombre réel, et son processus est fondamentalement similaire à DCT. L'avantage de cette méthode est que la même transformation de précision et la même transformation inverse sont autorisées dans le codeur et le décodeur, et il est pratique d'utiliser des opérations simples en virgule fixe. En d'autres termes, il n'y a pas d '"erreur de transformation inverse". L'unité de transformation est de 4 × 4 blocs, au lieu de 8 × 8 blocs couramment utilisés dans le passé. Lorsque la taille du bloc de transformation est réduite, la division de l'objet en mouvement est plus précise, de sorte que non seulement la quantité de calcul de transformation est plus petite, mais que l'erreur de convergence au bord de l'objet en mouvement est également considérablement réduite. Afin que la méthode de transformation de bloc de petite taille ne produise pas la différence d'échelle de gris entre les blocs de la plus grande zone lisse de l'image, le coefficient DC de 16 blocs 4 × 4 des données de luminosité du macrobloc intra-trame (chaque petit bloc Un , un total de 16) effectue la deuxième transformation de bloc 4 × 4 et effectue une transformation de bloc 2 × 2 sur les coefficients DC de 4 blocs 4 × 4 de données de chrominance (un pour chaque petit bloc, 4 au total).
Afin d'améliorer la capacité de contrôle de débit de H.264, le changement de la taille de pas de quantification est contrôlé à environ 12.5%, au lieu d'une augmentation constante. La normalisation de l'amplitude du coefficient de transformée est traitée dans le processus de quantification inverse pour réduire la complexité de calcul. Afin de souligner la fidélité de la couleur, une taille de pas de quantification plus petite est adoptée pour le coefficient de chrominance.
VLC unifié
Il existe deux méthodes de codage entropique dans H.264, l'une consiste à utiliser un VLC unifié (UVLC: Universal VLC) pour tous les symboles à coder, et l'autre à utiliser un codage arithmétique binaire adaptatif au contenu (CABAC: Context-Adaptive Binary Codage arithmétique). CABAC est facultatif et ses performances de codage sont légèrement meilleures que celles d'UVLC, mais la complexité de calcul est également plus élevée. UVLC utilise un ensemble de mots de code de longueur illimitée, et la structure de conception est très régulière, et différents objets peuvent être codés avec la même table de codes. Cette méthode peut facilement générer un mot de code, et le décodeur peut facilement identifier le préfixe du mot de code, et UVLC peut rapidement obtenir une resynchronisation lorsqu'une erreur de bit se produit.
Prédiction intra
Dans les normes de la série H.26x et de la série MPEG-x précédentes, des méthodes de prédiction inter-images sont utilisées. Dans H.264, la prédiction intra-trame est disponible lors du codage d'images intra-image. Pour chaque bloc 4 × 4 (sauf pour le traitement spécial du bloc de bord), chaque pixel peut être prédit avec la somme pondérée différente des 17 pixels précédemment codés les plus proches (certains poids peuvent être 0), soit ce pixel 17 pixels dans le coin supérieur gauche du bloc. Evidemment, ce type de prédiction intra-trame n'est pas dans le temps, mais un algorithme de codage prédictif exécuté dans le domaine spatial, qui peut supprimer la redondance spatiale entre les blocs adjacents et obtenir une compression plus efficace.
Comme le montre la figure 4, a, b, ..., p dans le carré 4 × 4 sont 16 pixels à prédire, et A, B, ..., P sont des pixels qui ont été codés. Par exemple, la valeur du point m peut être prédite par la formule (J + 2K + L + 2) / 4, ou par la formule (A + B + C + D + I + J + K + L) / 8, etc. . Selon les points de référence de prédiction sélectionnés, il existe 9 modes différents pour la luminosité, mais seulement 1 mode pour la prédiction intra de la chrominance.
Pour les environnements IP et sans fil
Le projet H.264 contient des outils d'élimination des erreurs pour faciliter la transmission de la vidéo compressée dans un environnement avec des erreurs fréquentes et des pertes de paquets, comme la robustesse de la transmission dans les canaux mobiles ou les canaux IP. Afin de résister aux erreurs de transmission, la synchronisation temporelle dans le flux vidéo H.264 peut être réalisée en utilisant le rafraîchissement d'image intra-trame, et la synchronisation spatiale est prise en charge par un codage structuré par tranches. En même temps, afin de faciliter la resynchronisation après une erreur de bit, un certain point de resynchronisation est également prévu dans les données vidéo d'une image. De plus, le rafraîchissement du macrobloc intra-trame et les macroblocs de référence multiples permettent au codeur de prendre en compte non seulement l'efficacité du codage, mais également les caractéristiques du canal de transmission lors de la détermination du mode macrobloc.
En plus d'utiliser le changement de la taille de pas de quantification pour s'adapter au débit de code de canal, dans H.264, la méthode de segmentation de données est souvent utilisée pour traiter le changement de débit de code de canal. De manière générale, le concept de segmentation des données consiste à générer des données vidéo avec des priorités différentes dans le codeur pour prendre en charge la qualité de service QoS dans le réseau. Par exemple, la méthode de partitionnement de données basée sur la syntaxe est adoptée pour diviser les données de chaque trame en plusieurs parties en fonction de son importance, ce qui permet de rejeter les informations moins importantes lorsque la mémoire tampon déborde. Une méthode similaire de partitionnement des données temporelles peut également être adoptée, ce qui est accompli en utilisant plusieurs cadres de référence dans les cadres P et B.
Dans l'application de la communication sans fil, nous pouvons prendre en charge de grands changements de débit binaire du canal sans fil en modifiant la précision de quantification ou la résolution spatio-temporelle de chaque trame. Cependant, dans le cas de la multidiffusion, il est impossible d'exiger du codeur qu'il réponde à des débits binaires variables. Par conséquent, contrairement à la méthode FGS (Fine Granular Scalability) utilisée dans MPEG-4 (avec une efficacité inférieure), H.264 utilise des trames SP de commutation de flux au lieu d'un codage hiérarchique.
Comparaison des performances
TML-8 est un test pour H.264. Le PSNR fourni par les résultats des tests a clairement montré que par rapport aux performances de MPEG-4 (ASP: Advanced Simple Profile) et H.263 ++ (HLP: High Latency Profile), les résultats de H.264 présentent des avantages évidents.
Le PSNR de H.264 est évidemment meilleur que celui de MPEG-4 (ASP) et H.263 ++ (HLP). Dans le test de comparaison de 6 vitesses, le PSNR de H.264 est en moyenne de 2 dB supérieur à MPEG-4 (ASP). Il est supérieur de 3 dB à H.263 (HLP) en moyenne. Les 6 taux de test et leurs conditions associées sont: débit de 32 kbit / s, fréquence de trame de 10f / s et format QCIF; Taux de 64 kbit / s, fréquence d'images de 15f / s et format QCIF; Taux de 128 kbit / s, fréquence d'images de 15f / s et format CIF; Débit de 256 kbit / s, fréquence d'images de 15f / s et format QCIF; Débit de 512 kbit / s, fréquence d'images 30f / s et format CIF; Débit 1024 kbit / s, fréquence d'images 30f / s et format CIF.
|
Entrez l'email pour avoir une surprise
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanais
ar.fmuser.org -> arabe
hy.fmuser.org -> Armenian
az.fmuser.org -> azerbaïdjanais
eu.fmuser.org -> basque
be.fmuser.org -> biélorusse
bg.fmuser.org -> Bulgare
ca.fmuser.org -> catalan
zh-CN.fmuser.org -> chinois (simplifié)
zh-TW.fmuser.org -> Chinois (traditionnel)
hr.fmuser.org -> croate
cs.fmuser.org -> tchèque
da.fmuser.org -> danois
nl.fmuser.org -> Néerlandais
et.fmuser.org -> estonien
tl.fmuser.org -> Philippin
fi.fmuser.org -> finnois
fr.fmuser.org -> Français
gl.fmuser.org -> Galicien
ka.fmuser.org -> géorgien
de.fmuser.org -> allemand
el.fmuser.org -> Grec
ht.fmuser.org -> Créole haïtien
iw.fmuser.org -> hébreu
hi.fmuser.org -> Hindi
hu.fmuser.org -> Hongrois
is.fmuser.org -> islandais
id.fmuser.org -> indonésien
ga.fmuser.org -> irlandais
it.fmuser.org -> Italien
ja.fmuser.org -> japonais
ko.fmuser.org -> coréen
lv.fmuser.org -> letton
lt.fmuser.org -> Lituanien
mk.fmuser.org -> macédonien
ms.fmuser.org -> malais
mt.fmuser.org -> maltais
no.fmuser.org -> Norwegian
fa.fmuser.org -> persan
pl.fmuser.org -> polonais
pt.fmuser.org -> portugais
ro.fmuser.org -> Roumain
ru.fmuser.org -> russe
sr.fmuser.org -> serbe
sk.fmuser.org -> slovaque
sl.fmuser.org -> Slovène
es.fmuser.org -> espagnol
sw.fmuser.org -> Swahili
sv.fmuser.org -> suédois
th.fmuser.org -> Thai
tr.fmuser.org -> turc
uk.fmuser.org -> ukrainien
ur.fmuser.org -> ourdou
vi.fmuser.org -> Vietnamienne
cy.fmuser.org -> Gallois
yi.fmuser.org -> Yiddish
FMUSER Wirless transmet la vidéo et l'audio plus facilement!
Contact
Adresse :
No.305 Chambre HuiLan Building No.273 Huanpu Road Guangzhou Chine 510620
Catégories
Newsletter