H.264 AVC è “migliore” di H265 HEVC? In quali condizioni H.264 può superare H.265?
In quali condizioni H.264 può superare H.265?
Generalmente, i nuovi standard di compressione video offriranno vantaggi in termini di prestazioni rispetto a quelli esistenti. Per esempio, H.265 HEVC è noto per essere il 40% più efficiente di H.264 al costo di una complessità 10 volte superiore.
Un cliente NETINT ha osservato che in alcune circostanze H.264 AVC può superare H.265 HEVC. Il seguente test PSNR che utilizza gli encoder open source libx265 e libx264 per codificare video di prova identici illustra questo punto.
Figura 1 PSNR a confronto tra x265 e x264
Con il parametro di quantizzazione (QP)=27, il bitrate di H.265 e H.264 sono simili (9.66Mbps vs 9.96Mbps) ma il PSNR del video codificato con H.265 è inferiore (40.19 vs 41.8). Perché questo accade?
Se confrontata con l’immagine originale, l’immagine H.265 manca di piccoli dettagli.
Figura 2 – Utilizzando WinMerge per confrontare il primo frame per H.264 (sinistra), H.265Centro), originale (destra)
Il seguente confronto illustra le differenze nel modo in cui x264 e x265 codificano il video.
Figura 3 – Immagine originale – Nota la presenza del pixel nero evidenziato nel quadrato bianco
Figura 4 – Compresso con x264, nota che il pixel è ancora presente
Figura 5 – Compresso con x265, il pixel manca.
Con un QP fisso=27, la codifica x265 ha rimosso singoli pixel che non hanno influenzato le prestazioni visive soggettive ma hanno creato una significativa riduzione delle prestazioni PSNR rispetto all’immagine originale.
H.265 utilizza blocchi 16×16, 32×32 o 64×64. H264 utilizza blocchi 4×4 o 8×8. La codifica H.264 ha alcuni vantaggi per mantenere piccoli dettagli che possono non essere visivamente rilevabili ma possono essere misurati nei test PSNR.
Tutti gli algoritmi di compressione video sono progettati per conservare dettagli significativi a cui l’occhio umano è sensibile (gli algoritmi di compressione per l’apprendimento automatico sono in arrivo!) Per le immagini innaturali che includono artefatti visivi o rumore introdotto durante la cattura o l’elaborazione, H.265 potrebbe non essere in grado di preservare i dettagli visivi di queste immagini meglio di H.264.
Un esempio estremo delle prestazioni relative di H.265 e H.264 su immagini innaturali è un’immagine di puro rumore bianco.
Figura 6 – Un video con rumore bianco 512×512
Testato con questi comandi per x264 e x265 rispettivamente e con force all i-frames:
ffmpeg -i .\images\noise-%03d.png -c:v libx264 -x264-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise264alli.264
ffmpeg -i .\images\noise-%03d.png -c:v libx265 -x265-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise265alli.265
Figura 7 – Video con rumore bianco codificato con x264 e x265, il PSNR e il confronto delle dimensioni del file
Con QP fisso=27, il PSNR di x264 è 35.87dB e x265 PSNR è 23.02dB. x264 ha 12 dB di prestazioni PSNR migliori rispetto a x265 per questa immagine con rumore casuale!
Beneficiando di una matrice di trasformazione più piccola (4×4), H.264 può essere migliore per preservare più dettagli rispetto alla matrice più grande (16×16, o più grande) in H265.
Per le immagini con più dettagli ad alta frequenza che includono rumore di dispersione o artefatti di compressione (per esempio, rumore di zanzara), H.264 mostrerà un SNR più alto di H.265 con lo stesso QP.
Da questo esperimento, possiamo anche capire i limiti del test PSNR come un test di qualità oggettivo che non si allinea costantemente con la reale qualità visiva percepita. I nuovi metodi di valutazione della qualità visiva come SSIM, MS-SSIM, VMAF si allineano più accuratamente con il sistema visivo umano e rappresentano una valutazione più accurata della qualità visiva.
Per rispondere alle osservazioni originali del cliente, hanno concordato che il video in ingresso era pesantemente compresso e non adatto ad essere utilizzato in una tale valutazione.
Si prega di fare riferimento al sito web NETINT per un confronto più soggettivo del test: Qualità soggettiva della transcodifica HEVC
.
Leave a Reply