¿Es H.264 AVC «mejor» que H265 HEVC ? ¿En qué condiciones puede H.264 superar a H.265?

¿En qué condiciones puede H.264 superar a H.265?

En general, los nuevos estándares de compresión de vídeo ofrecerán ventajas de rendimiento en comparación con los existentes. Por ejemplo, se sabe que H.265 HEVC es un 40% más eficiente que H.264 con el coste de una complejidad 10 veces mayor.

Un cliente de NETINT observó que en algunas circunstancias H.264 AVC puede superar a H.265 HEVC. La siguiente prueba de PSNR, que utiliza los codificadores de código abierto libx265 y libx264 para codificar un vídeo de prueba idéntico, ilustra este punto.

Figura 1 Comparación de PSNR entre x265 y x264

Con el parámetro de cuantificación (QP)=27, el bitrate de H.265 y H.264 son similares (9,66Mbps frente a 9,96Mbps) pero la PSNR del vídeo codificado con H.265 es menor (40,19 frente a 41,8). ¿Por qué ocurre esto?

Cuando se compara con la imagen original, a la imagen H.265 le faltan pequeños detalles.

Figura 2 – Utilizando WinMerge para comparar el primer fotograma para H.264 (izquierda), H.265Centro), original(derecha)

La siguiente comparación ilustra las diferencias en cómo x264 y x265 codifican el vídeo.

Figura 3 – Imagen original – Nótese la presencia del píxel negro resaltado en el cuadrado blanco

Figura 4 – Comprimido con x264, nótese que el píxel sigue presente

Figura 5 – Comprimido con x265, el píxel ha desaparecido.

Con un QP=27 fijo, la codificación x265 eliminó píxeles individuales que no afectaron al rendimiento visual subjetivo pero crearon una reducción significativa del rendimiento PSNR en comparación con la imagen original.

H.265 utiliza bloques de 16×16, 32×32 o 64×64. H264 utiliza bloques de 4×4 u 8×8. La codificación H.264 tiene algunas ventajas para mantener pequeños detalles que pueden no ser visualmente detectables pero que pueden medirse en las pruebas de PSNR.

Todos los algoritmos de compresión de vídeo están diseñados para preservar los detalles significativos a los que el ojo humano es sensible (¡los algoritmos de compresión para el aprendizaje automático están en camino!). En el caso de las imágenes no naturales que incluyen artefactos visuales o ruido introducido durante la captura o el procesamiento, es posible que H.265 no pueda preservar los detalles visuales de estas imágenes mejor que H.264.

Un ejemplo extremo del rendimiento relativo de H.265 y H.264 en imágenes no naturales es una imagen de ruido blanco puro.

Figura 6 – Un vídeo de ruido blanco de 512×512

Probado con estos comandos para x264 y x265 respectivamente y con forzar todos los fotogramas i:

ffmpeg -i .\images\noise-%03d.png -c:v libx264 -x264-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise264alli.264

ffmpeg -i .\images-noise-%03d.png -c:v libx265 -x265-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise265alli.265

Figura 7 – Vídeo con ruido blanco codificado con x264 y x265, la comparación de la PSNR y el tamaño del archivo

Con QP=27 fijo, la PSNR de x264 es de 35.87dB y la PSNR de x265 es de 23,02dB. x264 tiene un rendimiento PSNR 12 dB mejor que x265 para esta imagen con ruido aleatorio

Al beneficiarse de una matriz de transformación más pequeña (4×4), H.264 puede ser mejor para preservar más detalles que la matriz más grande (16×16, o más grande) en H265.

Para imágenes con más detalles de alta frecuencia que incluyen ruido de dispersión o artefactos de compresión (por ejemplo, ruido de mosquito), H.264 mostrará una mayor SNR que H.265 con el mismo QP.

De este experimento, también podemos entender las limitaciones de la prueba PSNR como una prueba de calidad objetiva que no se alinea consistentemente con la calidad visual real percibida. Los nuevos métodos de evaluación de la calidad visual, como SSIM, MS-SSIM y VMAF, se ajustan mejor al sistema visual humano y representan una evaluación más precisa de la calidad visual.

Para responder a las observaciones originales del cliente, estuvieron de acuerdo en que el vídeo de entrada estaba muy comprimido y no era adecuado para utilizarlo en una evaluación de este tipo.

Por favor, consulte el sitio web de NETINT para ver más comparaciones de pruebas subjetivas: Calidad subjetiva de transcodificación HEVC

Leave a Reply