Er H.264 AVC “bedre” end H265 HEVC ? Under hvilke betingelser kan H.264 overgå H.265?

Under hvilke betingelser kan H.264 overgå H.265?

Generelt vil nyere videokomprimeringsstandarder tilbyde ydelsesmæssige fordele i forhold til de eksisterende standarder. F.eks. er H.265 HEVC kendt for at være 40 % mere effektiv end H.264, men det koster 10 gange mere kompleksitet.

En NETINT-kunde bemærkede, at H.264 AVC under visse omstændigheder kan overgå H.265 HEVC. Følgende PSNR-test, som anvender open source libx265- og libx264-enkoderne til at kode identisk testvideo, illustrerer dette punkt.

Figur 1 PSNR sammenligning mellem x265 og x264

Med kvantiseringsparameter (QP)=27, er bitraten for H.265 og H.264 er ens (9,66 Mbps vs. 9,96 Mbps), men PSNR for den H.265-kodede video er lavere (40,19 vs. 41,8). Hvorfor sker dette?

Når man sammenligner med det originale billede, mangler H.265-billedet små detaljer.

Figur 2 – Brug af WinMerge til at sammenligne det første billede for H.264 (venstre), H.265Center), original(højre)

Den følgende sammenligning illustrerer forskellene i den måde, hvorpå x264 og x265 koder video.

Figur 3 – Originalt billede – bemærk tilstedeværelsen af sort pixel fremhævet i hvid firkant

Figur 4 – Komprimeret med x264, bemærk, at pixelen stadig er til stede

Figur 5 – Komprimeret med x265, pixelen er væk.

Med en fast QP=27 fjernede x265-kodning individuelle pixels, der ikke påvirkede den subjektive visuelle ydeevne, men skabte en betydelig reduktion i PSNR-præstationen sammenlignet med det oprindelige billede.

H.265 anvender 16×16, 32×32 eller 64×64 blokke. H264 anvender 4×4 eller 8×8 blokke. H.264-kodning har nogle fordele med hensyn til at bevare små detaljer, som måske ikke er visuelt påviselige, men som kan måles i PSNR-tests.

Alle videokomprimeringsalgoritmer er designet til at bevare meningsfulde detaljer, som det menneskelige øje er følsomt over for (komprimeringsalgoritmer til maskinlæring er på vej!). For unaturlige billeder, herunder visuelle artefakter eller støj, der er indført under optagelse eller behandling, er H.265 muligvis ikke i stand til at bevare de visuelle detaljer i disse billeder bedre end H.264.

Et ekstremt eksempel på den relative ydeevne af H.265 og H.264 på unaturlige billeder er et billede med ren hvid støj.

Figur 6 – En video med 512×512 hvid støj

Testet med disse kommandoer for henholdsvis x264 og x265 og med force all i-frames:

ffmpeg -i .\images\noise-%03d.png -c:v libx264 -x264-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise264alli.264

ffmpeg -i .\images\noise-%03d.png -c:v libx265 -x265-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise265alli.265

Figur 7 – Video med hvid støj kodet med x264 og x265, sammenligning af PSNR og filstørrelse

Med fast QP=27 er x264 PSNR 35.87dB og x265 PSNR er 23,02dB. x264 har 12 dB bedre PSNR-præstationer sammenlignet med x265 for dette billede med tilfældig støj!

Da H.264 bedre til at bevare flere detaljer end den større matrix (16×16 eller større) i H265.

For billeder med flere højfrekvente detaljer, som omfatter spredningsstøj eller komprimeringsartefakter (f.eks. myggestøj), vil H.264 vise en højere SNR end H.265 med samme QP.

Fra dette eksperiment kan vi også forstå begrænsningerne ved PSNR-testen som en objektiv kvalitetstest, der ikke konsekvent stemmer overens med den faktiske opfattede visuelle kvalitet. Nyere visuelle kvalitetsvurderingsmetoder som SSIM, MS-SSIM og VMAF stemmer mere præcist overens med det menneskelige visuelle system og repræsenterer en mere præcis vurdering af den visuelle kvalitet.

For at imødekomme kundens oprindelige bemærkninger var de enige om, at inputvideoen var stærkt komprimeret og ikke egnet til at blive brugt i en sådan evaluering.

Henvises til NETINT-webstedet om mere subjektiv test sammenligning: Subjektiv HEVC-transkodningskvalitet

Leave a Reply