Le H.264 AVC est-il « meilleur » que le H265 HEVC ? Dans quelles conditions le H.264 peut-il surpasser le H.265 ?

Dans quelles conditions le H.264 peut-il surpasser le H.265 ?

Généralement, les nouvelles normes de compression vidéo offriront des avantages de performance par rapport aux normes existantes. Par exemple, H.265 HEVC est connu pour être 40% plus efficace que H.264 avec le coût de 10x plus de complexité.

Un client NETINT a observé que dans certaines circonstances, H.264 AVC peut surpasser H.265 HEVC. Le test PSNR suivant, qui utilise les codeurs open source libx265 et libx264 pour coder une vidéo de test identique, illustre ce point.

Figure 1 PSNR compare entre x265 et x264

Avec un paramètre de quantification (QP)=27, le débit binaire de H.265 et H.264 sont similaires (9,66Mbps vs 9,96Mbps) mais le PSNR de la vidéo encodée H.265 est plus faible (40,19 vs 41,8). Pourquoi cela se produit-il ?

Lorsque l’on compare avec l’image originale, l’image H.265 manque de petits détails.

Figure 2 – Utilisation de WinMerge pour comparer la première image pour H.264 (gauche), H.265.Centre), original(droite)

La comparaison suivante illustre les différences dans la façon dont x264 et x265 codent la vidéo.

Figure 3 – Image originale – Notez la présence du pixel noir mis en évidence dans le carré blanc

Figure 4 – Compressée avec x264, notez que le pixel est toujours présent

Figure 5 – Compressée avec x265, le pixel est absent.

Avec un QP fixe=27, l’encodage x265 a supprimé des pixels individuels qui n’ont pas affecté les performances visuelles subjectives mais ont créé une réduction significative des performances PSNR par rapport à l’image originale.

H.265 utilise des blocs 16×16, 32×32 ou 64×64. H264 utilise des blocs 4×4 ou 8×8. Le codage H.264 présente certains avantages pour le maintien de petits détails qui peuvent ne pas être visuellement détectables mais qui peuvent être mesurés dans les tests PSNR.

Tous les algorithmes de compression vidéo sont conçus pour préserver les détails significatifs auxquels l’œil humain est sensible (les algorithmes de compression pour l’apprentissage automatique sont en route !). Pour les images non naturelles comprenant des artefacts visuels ou du bruit introduit lors de la capture ou du traitement, le H.265 peut ne pas être en mesure de préserver les détails visuels de ces images mieux que le H.264.

Un exemple extrême de la performance relative du H.265 et du H.264 sur des images non naturelles est une image de bruit blanc pur.

Figure 6 – Une vidéo 512×512 de bruit blanc

Testé avec ces commandes pour x264 et x265 respectivement et avec force all i-frames:

ffmpeg -i .\images\noise-%03d.png -c:v libx264 -x264-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise264alli.264

ffmpeg -i .\images\noise-%03d.png -c:v libx265 -x265-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise265alli.265

Figure 7 – Vidéo de bruit blanc encodée avec x264 et x265, la comparaison du PSNR et de la taille du fichier

Avec QP fixe=27, le PSNR de x264 est de 35.87dB et le PSNR de x265 est de 23.02dB. x264 a une meilleure performance PSNR de 12 dB par rapport à x265 pour cette image de bruit aléatoire!

Bénéficiant d’une plus petite matrice de transformation (4×4), H.264 peut être meilleur pour préserver plus de détails que la matrice plus grande (16×16, ou plus) dans H265.

Pour les images avec plus de détails à haute fréquence qui incluent le bruit de diffusion ou les artefacts de compression (par exemple, le bruit de moustique), H.264 montrera un SNR plus élevé que H.265 avec le même QP.

De cette expérience, nous pouvons également comprendre les limites du test PSNR comme un test de qualité objectif qui ne s’aligne pas systématiquement avec la qualité visuelle réelle perçue. Les nouvelles méthodes d’évaluation de la qualité visuelle comme SSIM, MS-SSIM, VMAF s’alignent plus précisément sur le système visuel humain et représentent une évaluation plus précise de la qualité visuelle.

Pour répondre aux observations initiales du client, ils ont convenu que la vidéo d’entrée était fortement compressée et ne convenait pas pour être utilisée dans une telle évaluation.

Veuillez vous référer au site Web de NETINT sur la comparaison de tests plus subjectifs : Qualité subjective du transcodage HEVC

Leave a Reply