Principes de base H264

Préface
L'algorithme de compression vidéo H264 est désormais sans aucun doute la plus utilisée et la plus populaire de toutes les techniques de compression vidéo. Avec l'introduction de bibliothèques open source telles que x264 / openh264 et ffmpeg, la plupart des utilisateurs n'ont plus besoin de faire trop de recherches sur les détails de H264, ce qui réduit considérablement le coût des utilisateurs de H264.

Mais pour faire bon usage de H264, nous devons encore comprendre les principes de base de H264. Aujourd'hui, nous allons examiner les principes de base de H264.

La technologie de compression H264 utilise principalement les méthodes suivantes pour compresser les données vidéo. comprendre:

La compression de prédiction intra-image résout le problème de la redondance des données spatiales.
La compression de prédiction inter-trame (estimation et compensation de mouvement) résout le problème de la redondance des données dans le domaine temporel.
Integer Discrete Cosine Transform (DCT), qui transforme la corrélation spatiale en données non pertinentes dans le domaine fréquentiel, puis la quantifie.
Compression CABAC.
Le cadre compressé est divisé en: image I, image P et image B:

I frame: image clé, utilisant la technologie de compression intra-image.
Image P: image de référence avant, lors de la compression, se référer uniquement à l'image précédemment traitée. Utilisez la technologie de compression audio d'image.
Cadre B: Un cadre de référence bidirectionnel. Lors de la compression, il fait référence à l'image précédente et à l'image suivante. Utilisation de la technologie de compression inter-images.
En plus des trames I / P / B, il existe également des séquences d'images GOP.

GOP: Entre deux images I se trouve une séquence d'images, et il n'y a qu'une seule image I dans une séquence d'images. Comme indiqué ci-dessous:

Technologie de compression H264
Le principe de base de H264 est en fait très simple, décrivons brièvement le processus de compression des données H264. Les images vidéo capturées par la caméra (calculées à 30 images par seconde) sont envoyées au buffer de l'encodeur H264. L'encodeur doit d'abord diviser les macroblocs pour chaque image.

Macrobloc de partition
H264 utilise une zone 16X16 comme bloc macro par défaut, et il peut également être divisé en taille 8X8.

Par analogie, la valeur de pixel de chaque macrobloc dans une image est calculée, et tous les macroblocs sont traités comme suit.

Sous-bloc
H264 utilise des macroblocs 16X16 pour des images relativement plates. Cependant, afin d'obtenir un taux de compression plus élevé, des sous-blocs plus petits peuvent également être divisés en macroblocs 16X16. La taille du sous-bloc peut être 8X16, 16X8, 8X8, 4X8, 8X4, 4X4, ce qui est très flexible.

Dans l'image ci-dessus, la plupart des macroblocs 16X16 dans le cadre rouge ont un fond bleu et une partie de l'image des trois aigles est dessinée dans ce macrobloc. Afin de mieux traiter les images partielles des trois aigles, les sous-blocs multiples H264 sont divisés en macroblocs 16X16.

De cette manière, après une compression intra-trame, des données plus efficaces peuvent être obtenues. La figure ci-dessous est le résultat de la compression des macroblocs ci-dessus en utilisant respectivement mpeg-2 et H264. La moitié gauche est le résultat de la compression après la division de sous-blocs MPEG-2, et la moitié droite est le résultat de la compression de sous-blocs H264. On peut voir que la méthode de division H264 présente plus d'avantages.

Une fois le bloc macro divisé, toutes les images du tampon du codeur H264 peuvent être regroupées.

Regroupement de cadres
Pour les données vidéo, il existe principalement deux types de redondance de données, l'un est la redondance des données dans le temps et l'autre est la redondance des données dans l'espace. Parmi eux, la redondance des données dans le temps est la plus importante. Parlons d'abord du problème de redondance du temps des données vidéo.

Pourquoi la redondance horaire est-elle la plus grande? En supposant que la caméra capture 30 images par seconde, les données de ces 30 images sont principalement liées. Il est également possible que plus de 30 trames de données, des dizaines de trames ou des centaines de trames de données soient particulièrement étroitement liées.

Pour ces images très étroitement liées, en fait, nous n'avons besoin de sauvegarder qu'une seule image de données, et d'autres images peuvent être prédites à partir de cette image selon certaines règles, de sorte que les données vidéo ont le plus de redondance temporelle.

Afin d'obtenir que les images pertinentes compressent les données via la méthode de prédiction, il est nécessaire de regrouper les images vidéo. Alors, comment déterminer que certains cadres sont étroitement liés et peuvent être regroupés? Jetons un œil à un exemple. Ci-dessous, une image vidéo capturée d'un groupe de boules de billard en mouvement. Les boules de billard roulent du coin supérieur droit au coin inférieur gauche.

L'encodeur H264 prélèvera à chaque fois deux trames adjacentes pour comparer les macroblocs afin de calculer la similitude des deux trames. Comme indiqué ci-dessous:

Grâce au balayage de macro-bloc et à la recherche de macro-bloc, on peut constater que la corrélation entre les deux trames est très élevée. De plus, on constate que le degré de corrélation de ce groupe de trames est très élevé. Par conséquent, les cadres ci-dessus peuvent être divisés en un seul groupe. L'algorithme est le suivant: dans les images adjacentes, les pixels généralement différents ne sont que dans les 10%, la différence de luminosité ne dépasse pas 2% et la différence de chromaticité ne change que dans 1%. Nous pensons que les graphiques peuvent être regroupés.

Dans un tel groupe d'images, après encodage, on ne conserve que les données complètes du premier post, et les autres frames sont calculées en se référant à l'image précédente. Nous appelons la première trame IDR / I, et d'autres trames, nous appelons la trame P / B, nous appelons donc le groupe de trames de données codées GOP.

Estimation et compensation de mouvement
Une fois les images regroupées dans le codeur H264, il est nécessaire de calculer les vecteurs de mouvement des objets du groupe d'images. En prenant l'image vidéo de billard en mouvement ci-dessus comme exemple, voyons comment il calcule le vecteur de mouvement.

L'encodeur H264 prend d'abord deux images de données vidéo de l'en-tête de tampon en séquence, puis effectue un balayage de macro-bloc. Lorsqu'un objet est trouvé dans l'une des images, la recherche est effectuée à proximité de l'autre image (dans la fenêtre de recherche). Si l'objet se trouve dans une autre image à ce moment, le vecteur de mouvement de l'objet peut être calculé. L'image suivante montre la position de la boule de billard après la recherche.

Grâce à la différence entre les positions des boules de billard dans l'image ci-dessus, la direction et la distance de l'image de la table peuvent être calculées. H264 enregistre la distance et la direction du mouvement de la balle dans chaque image tour à tour, et cela devient le suivant.

Une fois le vecteur de mouvement calculé, la même partie (c'est-à-dire la partie verte) est soustraite pour obtenir les données de compensation. En fin de compte, il suffit de compresser et d'enregistrer les données de compensation, puis l'image d'origine peut être restaurée lors du décodage. Les données compressées doivent uniquement enregistrer une petite quantité de données. Comme suit:

Nous appelons le vecteur de mouvement et la compensation une technologie de compression inter-images, qui résout la redondance des données des images vidéo dans le temps. En plus de la compression inter-trame, la compression des données doit également être effectuée dans la trame. La compression de données intra-trame résout la redondance des données spatiales. Nous allons maintenant introduire la technologie de compression intra-image.

Prédiction intra
L'œil humain a un degré de reconnaissance de l'image, il est très sensible à la luminosité des basses fréquences, et n'est pas très sensible à la luminosité des hautes fréquences. Par conséquent, sur la base de certaines recherches, les données qui ne sont pas sensibles aux yeux humains peuvent être supprimées d'une image. De cette manière, la technologie de prédiction intra est proposée.

La compression intra-image de H264 est très similaire à JPEG. Une fois qu'une image est divisée en macroblocs, chaque macrobloc peut être prédit dans 9 modes. Trouvez le mode de prédiction le plus proche de l'image d'origine.

L'image suivante est le processus de prédiction de chaque bloc macro dans l'image entière.

La comparaison entre l'image après prédiction intra et l'image d'origine est la suivante:

Ensuite, l'image d'origine et l'image intra-prédite sont soustraites pour obtenir une valeur résiduelle.

Ensuite, enregistrez les informations de mode de prédiction que nous avons obtenues auparavant, afin que nous puissions restaurer l'image d'origine lors du décodage. L'effet est le suivant:

Après la compression intra-trame et inter-trame, bien que les données soient considérablement réduites, il reste encore de la place pour une optimisation.

Faire un DCT sur les données résiduelles
Les données résiduelles peuvent être soumises à une transformée cosinus discrète entière pour supprimer la corrélation des données et compresser davantage les données. Comme le montre la figure ci-dessous, le côté gauche est le bloc macro des données d'origine et le côté droit est le bloc macro des données résiduelles calculées.

Le macrobloc de données résiduelles est numérisé comme le montre la figure ci-dessous:

Après avoir supprimé les données associées, nous pouvons voir que les données sont encore compressées.

Une fois le DCT terminé, ce n'est pas suffisant et CABAC est nécessaire pour une compression sans perte.

CABAC
La compression intra-image ci-dessus est une technique de compression avec perte. En d'autres termes, une fois l'image compressée, elle ne peut pas être complètement restaurée. CABAC est une technologie de compression sans perte.

La technologie de compression sans perte est peut-être la plus familière à tout le monde est le codage Huffman, un code court pour les mots haute fréquence, un code long pour les mots basse fréquence pour atteindre l'objectif de compression de données. VLC utilisé dans MPEG-2 est ce type d'algorithme, nous prenons AZ comme exemple, A appartient aux données haute fréquence et Z appartient aux données basse fréquence. Voyez comment cela se fait.

CABAC est également un code court pour les données haute fréquence et un code long pour les données basse fréquence. En même temps, il se compressera en fonction du contexte, ce qui est beaucoup plus efficace que VLC. L'effet est le suivant:

Maintenant, remplacez AZ par une image vidéo, et cela ressemblera à ce qui suit.

Il est évident d'après l'image ci-dessus que le schéma de compression sans perte utilisant CACBA est beaucoup plus efficace que VLC.

résumé
À ce stade, nous avons terminé le principe de codage H264. Cet article traite principalement des points suivants:
1. Jianyin a introduit quelques concepts de base dans H264. Tels que le cadre I / P / B, GOP.
2. Expliqué en détail les principes de base du codage H264, notamment:

Division de bloc de macro
Regroupement d'images
Principe de la technologie de compression intra-cadre
Le principe de la technologie de compression inter-trames.
DCT
Principe de compression CABAC.

Dans quelle mesure (long) le couvercle du transmetteur?

La portée de transmission dépend de nombreux facteurs. La distance réelle est basée sur l'antenne d'installer la hauteur, le gain de l'antenne, en utilisant l'environnement comme la construction et d'autres obstacles, la sensibilité du récepteur, l'antenne du récepteur. Installation de l'antenne plus élevée et l'utilisation dans la campagne, la distance sera beaucoup plus loin.

Transmetteur FM 5W Exemple d'utilisation dans la ville et ville natale:

J'ai une utilisation par le client 5W émetteur fm USA avec antenne GP dans sa ville natale, et il le tester avec une voiture, il couvre 10km (6.21mile).

Je teste l'émetteur fm 5W avec antenne GP dans ma ville natale, il couvre environ 2km (1.24mile).

Je teste l'émetteur fm 5W avec antenne GP dans la ville de Guangzhou, il couvre environ seulement 300meter (984ft).

Voici la gamme approximative de différents émetteurs de puissance FM. (La plage est de diamètre)

Transmetteur FM 0.1W ~ 5W: 100M ~ 1KM

5W ~ 15W FM Ttransmitter: 1KM ~ 3KM

Transmetteur FM 15W ~ 80W: 3KM ~ 10KM

Transmetteur FM 80W ~ 500W: 10KM ~ 30KM

Transmetteur FM 500W ~ 1000W: 30KM ~ 50KM

Transmetteur FM 1KW ~ 2KW: 50KM ~ 100KM

Transmetteur FM 2KW ~ 5KW: 100KM ~ 150KM

Transmetteur FM 5KW ~ 10KW: 150KM ~ 200KM

Comment nous contacter pour l'émetteur?

Appelez-moi + 8618078869184 OU
Envoyez-moi un courriel [email protected]
1.How loin que vous voulez couvrir de diamètre?
2.How haut de la tour vous?
3.Where êtes-vous?
Et nous allons vous donner plus de conseils professionnels.

À propos de nous

FMUSER.ORG est une société d’intégration de systèmes spécialisée dans la transmission sans fil RF / équipement audio vidéo / de studio / streaming et le traitement de données. Nous fournissons tout ce que vous souhaitez, du conseil au conseil en passant par l’intégration en rack, l’installation, la mise en service et la formation.

Nous proposons des émetteurs FM, des émetteurs de télévision analogique, des émetteurs de télévision numérique, des émetteurs VHF UHF, des antennes, des connecteurs de câble coaxial, STL, Traitement en direct, Produits de diffusion pour le studio, Surveillance du signal RF, Encodeurs RDS, Processeurs audio et Unités de contrôle de site distant, Les produits IPTV, encodeur / décodeur vidéo / audio, sont conçus pour répondre aux besoins des grands réseaux de diffusion internationaux et des petites stations privées.

Notre solution comprend une station de radio FM / une station de télévision analogique / une station de télévision numérique / un équipement de studio audio vidéo / une liaison d'émetteur de studio / un système de télémétrie d'émetteur / un système de télévision d'hôtel / une diffusion en direct IPTV / une diffusion en direct en continu / une conférence vidéo / un système de diffusion CATV.

Nous utilisons des produits de technologie de pointe pour tous les systèmes, car nous savons que la fiabilité et les performances élevées sont essentielles pour le système et la solution. Dans le même temps, nous devons également nous assurer que notre système de produits a un prix très raisonnable.

Nous avons des clients de diffuseurs publics et commerciaux, d'opérateurs de télécommunication et d'autorités de régulation, et nous proposons également des solutions et des produits à des centaines de diffuseurs plus petits, locaux et communautaires.

FMUSER.ORG exporte depuis plus de 15 ans et a des clients partout dans le monde. Avec 13 ans d'expérience dans ce domaine, nous avons une équipe professionnelle pour résoudre toutes sortes de problèmes du client. Nous nous sommes engagés à fournir des prix extrêmement raisonnables de produits et services professionnels. Email du contact : [email protected]

Notre Usine

Nous avons modernisation de l'usine. Vous êtes invités à visiter notre usine lorsque vous venez en Chine.

À l'heure actuelle, il existe déjà clients 1095 partout dans le monde visité notre bureau de Guangzhou Tianhe. Si vous venez en Chine, vous êtes invités à nous rendre visite.

Au Salon

Ceci est notre participation à 2012 Global Sources Hong Kong Electronics Fair . Les clients de partout dans le monde enfin avoir une chance de se réunir.

Où est Fmuser?

Vous pouvez rechercher ces numéros " 23.127460034623816,113.33224654197693 "dans google map, vous pouvez trouver notre bureau fmuser.

bureau FMUSER Guangzhou se trouve dans le district de Tianhe, qui est le centre du Canton . Très près à la Foire de Canton , gare de guangzhou, route Xiaobei et Dashatou , seul besion 10 minutes si prendre TAXIS . Bienvenue amis partout dans le monde à visiter et à négocier.

Contact: Blue Sky
Mobile: + 8618078869184
WhatsApp: + 8618078869184
WeChat: + 8618078869184
Courriel : [email protected]
QQ: 727926717
Skype: sky198710021
Adresse: No.305 Chambre Huilan bâtiment No.273 Huangpu route Guangzhou Chine Code postal: 510620

Français: Nous acceptons tous les paiements, tels que PayPal, carte de crédit, Western Union, Alipay, Money Bookers, T / T, LC, DP, DA, OA, Payoneer, si vous avez des questions, veuillez me contacter [email protected] ou WhatsApp + 8618078869184

PayPal.  www.paypal.com

Nous vous recommandons d'utiliser Paypal pour acheter nos articles, Le Paypal est un moyen sûr d'acheter sur Internet.

Chaque de notre liste d'articles en bas de page sur le dessus ont un logo paypal pour payer.

Carte de crédit.Si vous ne disposez pas paypal, mais vous avez la carte de crédit, vous pouvez également cliquer sur le bouton jaune PayPal pour payer avec votre carte de crédit.

-------------------------------------------------- -------------------

Mais si vous avez pas une carte de crédit et ne pas avoir un compte paypal ou difficile à obtenu un accout paypal, vous pouvez utiliser ce qui suit:
Western union.  www.westernunion.com

Paiement par Western Union à moi:

Prénom / Prénom: Yingfeng
Nom / Prénom / Nom de famille: Zhang
Nom complet: Yingfeng Zhang
Pays: Chine
Ville: Guangzhou

-------------------------------------------------- -------------------

T / T.  Payer par T / T (virement / transfert télégraphique / Virement bancaire)
PREMIÈRES INFORMATIONS BANCAIRES (COMPTE COMPTE) :

SWIFT BIC: BKCHHKHHXXX
Nom de la banque: BANK OF CHINA (HONG KONG) LIMITÉE, HONG KONG
Adresse de la banque: BANK OF CHINA TOWER, 1 GARDEN ROAD, CENTRAL, HONG KONG
CODE DE LA BANQUE: 012
Nom du compte: FMUSER INTERNATIONAL GROUP LIMITED
N ° de compte. : 012-676-2-007855-0

-------------------------------------------------- -------------------
Deuxième RENSEIGNEMENTS BANCAIRES (COMPTE) :
Bénéficiaire : Fmuser International Group Inc
Numéro de compte: 44050158090900000337
Banque du bénéficiaire : succursale de la China Construction Bank Guangdong
Code SWIFT : PCBCCNBJGDX
Adresse : NO.553 Tianhe Road, Guangzhou, Guangdong, district de Tianhe, Chine
** Remarque : lorsque vous transférez de l'argent sur notre compte bancaire, veuillez ne rien écrire dans la zone de remarque, sinon nous ne pourrons pas recevoir le paiement en raison de la politique du gouvernement sur le commerce international.

* Il sera envoyé en 1-2 jours ouvrables lorsque le paiement clair.

* Nous vous enverrons à votre adresse paypal. Si vous voulez changer l'adresse, s'il vous plaît envoyez votre adresse et le numéro de téléphone à mon email [email protected]

* Si les paquets est inférieur à 2kg, nous sera expédiée par la poste aérienne, il faudra environ 15-25days à votre main.

Si le paquet est plus que 2kg, nous expédions par EMS, DHL, UPS, Fedex livraison rapide express, il faudra environ 7 ~ 15days à votre main.

Si le paquet plus 100kg, nous vous ferons parvenir par DHL ou fret aérien. Il faudra environ 3 ~ 7days à votre main.

Tous les paquets sont la forme la Chine guangzhou.

* Le colis sera envoyé comme un "cadeau" et déclear le moins possible, l'acheteur n'a pas besoin de payer pour la "TAXE".

* Après bateau, nous vous enverrons un e-mail et vous donner le numéro de suivi.

Pour la garantie.
Contactez-nous --- >> Renvoyez-nous l'article --- >> Recevez et envoyez un autre remplacement.

Nom: Liu xiaoxia
Adresse: 305Fang HuiLanGe HuangPuDaDaoXi 273Hao TianHeQu Guangzhou en Chine.
Code postal: 510620
Téléphone: 8618078869184 XNUMX XNUMX XNUMX XNUMX

S'il vous plaît revenir à cette adresse et écrivez votre paypal adresse, nom, problème sur la note: