Ist H.264 AVC „besser“ als H265 HEVC ? Unter welchen Bedingungen kann H.264 die Leistung von H.265 übertreffen?

Unter welchen Bedingungen kann H.264 die Leistung von H.265 übertreffen?

Generell bieten neuere Videokompressionsstandards Leistungsvorteile im Vergleich zu bestehenden Standards. So ist beispielsweise bekannt, dass H.265 HEVC um 40 % effizienter ist als H.264, allerdings um den Preis einer 10-fach höheren Komplexität.

Ein NETINT-Kunde hat beobachtet, dass H.264 AVC unter bestimmten Umständen besser sein kann als H.265 HEVC. Der folgende PSNR-Test, bei dem die Open-Source-Encoder libx265 und libx264 zur Codierung identischer Testvideos verwendet werden, veranschaulicht dies.

Abbildung 1 PSNR-Vergleich zwischen x265 und x264

Bei einem Quantisierungsparameter (QP)=27 ist die Bitrate von H.265 und H.264 ähnlich (9,66Mbps vs. 9,96Mbps), aber der PSNR des H.265-kodierten Videos ist niedriger (40,19 vs. 41,8). Woran liegt das?

Im Vergleich zum Originalbild fehlen dem H.265-Bild kleine Details.

Abbildung 2 – Vergleich des ersten Frames mit WinMerge für H.264 (links), H.265Mitte), Original (rechts)

Der folgende Vergleich veranschaulicht die Unterschiede bei der Videokodierung von x264 und x265.

Abbildung 3 – Originalbild – Beachten Sie das Vorhandensein des schwarzen Pixels, das im weißen Quadrat hervorgehoben ist

Abbildung 4 – Komprimiert mit x264, beachten Sie, dass das Pixel noch vorhanden ist

Abbildung 5 – Komprimiert mit x265, das Pixel fehlt.

Bei einem festen QP=27 wurden bei der x265-Kodierung einzelne Pixel entfernt, die sich nicht auf die subjektive visuelle Leistung auswirkten, aber zu einer deutlichen Verringerung der PSNR-Leistung im Vergleich zum Originalbild führten.

H.265 verwendet 16×16, 32×32 oder 64×64 Blöcke. H264 verwendet 4×4 oder 8×8 Blöcke. Die H.264-Kodierung hat einige Vorteile bei der Erhaltung kleiner Details, die visuell nicht erkennbar sind, aber in PSNR-Tests gemessen werden können.

Alle Videokomprimierungsalgorithmen sind so konzipiert, dass sinnvolle Details, für die das menschliche Auge empfindlich ist, erhalten bleiben (Komprimierungsalgorithmen für maschinelles Lernen sind in Vorbereitung!). Bei unnatürlichen Bildern mit visuellen Artefakten oder Rauschen, die bei der Aufnahme oder Verarbeitung entstanden sind, kann H.265 die visuellen Details dieser Bilder möglicherweise nicht besser bewahren als H.264.

Ein extremes Beispiel für die relative Leistung von H.265 und H.264 bei unnatürlichen Bildern ist ein Bild mit reinem weißem Rauschen.

Abbildung 6 – Ein Video mit weißem Rauschen im Format 512×512

Getestet mit diesen Befehlen für x264 bzw. x265 und mit Force all i-frames:

ffmpeg -i .\images\noise-%03d.png -c:v libx264 -x264-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise264alli.264

ffmpeg -i .\images\noise-%03d.png -c:v libx265 -x265-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise265alli.265

Abbildung 7 – Video mit weißem Rauschen, kodiert mit x264 und x265, Vergleich des PSNR und der Dateigröße

Bei festem QP=27 beträgt der PSNR von x264 35.87dB und x265 PSNR 23.02dB. x264 hat eine 12 dB bessere PSNR-Leistung im Vergleich zu x265 für dieses Bild mit zufälligem Rauschen!

Durch die kleinere Transformationsmatrix (4×4) kann H.264 Bei Bildern mit mehr hochfrequenten Details, die Streurauschen oder Kompressionsartefakte (z. B. Moskito-Rauschen) enthalten, zeigt H.264 bei gleichem QP einen höheren SNR als H.265.

Aus diesem Experiment können wir auch die Grenzen des PSNR-Tests als objektiven Qualitätstest erkennen, der nicht immer mit der tatsächlich wahrgenommenen visuellen Qualität übereinstimmt. Neuere Methoden zur Bewertung der visuellen Qualität wie SSIM, MS-SSIM und VMAF entsprechen eher dem menschlichen visuellen System und stellen eine genauere Bewertung der visuellen Qualität dar.

Um auf die ursprünglichen Beobachtungen des Kunden einzugehen, stimmten sie zu, dass das Eingangsvideo stark komprimiert und für eine solche Bewertung nicht geeignet war.

Bitte besuchen Sie die NETINT-Website für weitere subjektive Testvergleiche: Subjektive HEVC-Transcodierungsqualität

Leave a Reply