H.264AVCはH265HEVCより “良い “のか?

Under what conditions can H.264 outperform H.265?

一般的に、新しいビデオ圧縮規格は、既存のものと比較して、性能上の利点を提供することができます。 例えば、H.265 HEVCは、10倍以上の複雑さの代償として、H.264より40%効率的であることが知られています。

NETINTの顧客は、ある状況下でH.264 AVCがH.265 HEVCより優れていることを確認しました。 オープンソースのlibx265とlibx264エンコーダーを利用して同一のテストビデオをエンコードした以下のPSNRテストは、この点を説明しています。 とH.264は似ていますが(9.66Mbps vs 9.96Mbps) 、H.265でエンコードされたビデオのPSNRは低くなっています(40.19 vs 41.8).

元の画像と比較すると、H.265画像は小さなディテールが欠けています。

図2 – WinMergeを使って、H.264の最初のフレーム(左), H.265中央)、オリジナル(右)

次の比較は、x264とx265がどのようにビデオをエンコードするかの違いを示しています。

図 3 – オリジナル画像 – 白い四角で強調された黒いピクセルに注目

図 4 – x264 で圧縮、ピクセルがまだ存在

図 5 – x265 で圧縮、ピクセルが消失しています。

固定QP=27で、x265エンコーディングは、主観的な視覚性能には影響しないが、オリジナル画像と比較してPSNR性能の著しい低下を生み出す個々のピクセルを削除しました。 は、16×16、32×32、64×64 のブロックを使用します。 H264は4×4または8×8ブロックを使用します。 H.264 エンコーディングは、視覚的に検出できないかもしれませんが、PSNR テストで測定できる小さな詳細を維持するためのいくつかの利点があります。

すべてのビデオ圧縮アルゴリズムは、人間の目が敏感である意味のある詳細を維持するように設計されています(機械学習用の圧縮アルゴリズムが登場予定です!)。 キャプチャや処理中に導入されたビジュアルアーティファクトやノイズを含む不自然な画像に対して、H.265はH.264よりもこれらの画像の視覚的な詳細を保持することができないかもしれません。

図6 – ホワイトノイズの512×512ビデオ

以下のコマンドでx264とx265それぞれについてテストし、すべてのiフレームを強制しました:

ffmpeg -i .\images-notise-%03d.png -c:v libx264 -x264-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise264alli.264

ffmpeg -i .\imagesnoise-%03d.png -c:v libx265 -x265-params frame-threads=4:keyint=1:ref=1:no-open-gop=1:weightp=0:weightb=0:cutree=0:rc-lookahead=0:bframes=0:scenecut=0:b-adapt=0:repeat-headers=1:qp=27 -pix_fmt yuv420p noise265alli.265

図7 – x264とx265でエンコードしたホワイトノイズ映像、PSNRとファイルサイズの比較

QP=27固定で、x264 PSNRは35.0。このランダムノイズ画像では、x264の方がx265よりも12dB高いPSNR性能を示しています!

小さい変換行列(4×4)の恩恵を受けて、H.264は、そのような画像に対応しています。

散乱ノイズや圧縮アーチファクト(例えば、モスキートノイズ)を含む、より高い周波数の詳細を持つ画像については、H.264は、同じQPでH.265よりも高いSNRを示すでしょう。 SSIM、MS-SSIM、VMAF などの新しい視覚品質評価手法は、人間の視覚システムにより正確に一致し、視覚品質のより正確な評価を表します。

顧客の当初の見解に対処するために、彼らは入力ビデオが大きく圧縮されていて、この評価に使用するには適さないことに同意しました。 主観的な HEVC トランスコーディング品質

を参照してください。

Leave a Reply