TmpegEncのH265オプション

TmpegEncの話がでましたので、ついでにH265のオプションも気になったので調べてみました。
調べてみた、というよりも、先人たちの記事を丸写しした、といったほうが正しい。

参考にしたのは「私的x265解説まとめ:Nothing Here – ブロマガ」。

表の左側はTmpegEncで出力したMP4ファイルをMediainfoで設定を引っ張ってきたもの。
右にその解説。ただ、この設定がTmpegEncのどの設定項目なのかはまだ確かめていない。

wpp WPP(Wavefront Parallel Processing)、波状並列処理。
ctu=32 HEVCは動画をCTU(Coding Tree Unit:四分木型符号化単位)という正方画素ブロック単位にわけ、さらにそれをCU(Coding Unit:符号化単位)単位に分割して様々な処理を行う。PU(Prediction Unit:予測単位)とTU(Transform Unit:変換単位)が扱う領域の平坦なところをまとめて処理すればその分圧縮できるので、これの最大値が大きいほどビットレート当りの画質を稼ぎやすい。逆に複雑な部分にはより細かなCUを割り当てる。減らしたぶんだけエンコードも早くなる.
tu-intra-depth=1 ブロック階層はCUの四分木分割の回数
tu-inter-depth=1 ブロック階層はCUの四分木分割の回数
me=1 動き予測アルゴリズム。4:Full Searchは3:Starに毛が生えた程度で時間に見合うだけの出力が得られないので1:Hexか2:Umhでいいと思う。 Umhで満足できない画質なら、他の設定が悪いかソースが悪いの2択なので無理に上げる要素ではない。
subme=1 サブピクセル動き予測。数値を上げた分だけ画質も上がるがかなりエンコ時間が増える。3が実用的な値だと思う。5以上は時間が有る時にしたほうが良い。
merange=44 動き検索範囲。再生時間にもよるが増やしたぶんだけ効果はある。けど4桁5桁に設定するとエンコードが終わらないので57~99の範囲で設定するのがいいと思う。最大値にするとエラー吐いて止る。
no-rect CUに分けて処理する際に予測ブロックを正方形以外の形や長方形などにも分解できるようにする。
no-amp rectがオフだとampはオンにしても働かない。
max-merge=2 動き保障予測の範囲を決める。隣接するブロックの動き情報が似ていればそれを流用し、その位置情報を代わりに送る事で1つに統合して符号量を減らす。HEVCの強力な機能の1つで、動きの激しい動画では特に有効的。常に5でいいと思う
temporal-mvp
early-skip 最大サイズのCUを分析して省けそうな計算を取り除く。出力にほぼ差は出ないがエンコードが早くなる・・・・・・らしい。
no-fast-cbf Disable Cbf fast mode
rdpenalty=0 penalty for 32×32 intra TU in non-I slices. 0:disabled 1:RD-penalty 2:maximum
Default: 0
no-tskip Disable intra transform skipping
tskip-fast 唯一のN×Nイントラ予測(4×4ブロック)のスキップ変換を評価するパラメータ(解読不能)。
no-strong-intra-smoothing Disable strong intra smoothing for 32×32 block
no-lossless ロスレスの名のとおり超低圧縮(元の半分ぐらいの容量)でエンコしてくれる。
no-cu-lossless
no-constrained-intra Disable constrained intra prediction (use only intra coded reference pixels)
fast-intra イントラ予測では隣接する上左ブロックからの補間で予測画像を作成し、その差分を符号化することで容量を削減する初期値では有効になっており合計で10モードチェックする。–no-fast-intraで無効にすると合計で33モードチェックする。オフにしても劇的な画質向上はないけれどもエンコ時間は微増加.
open-gop
interlace=0
keyint=300
min-keyint=1
scenecut=80
rc-lookahead=10 レート制御先行検査フレーム数。先読みするスライス型フレームの最大数を決める。上げた分だけ効果はあるが最小値はbframesまでで、最大値はkeyframeを超えると効果が減る。
bframes=1 最大Bフレーム連続数。値が少ないほどエンコが早くなる。当たり前だけどb-adaptの値で効率が変化する。
bframe-bias=0 Bフレーム挿入傾向。値を増やせばよりBフレームを使うようになる。
b-adapt=0 適応的Bフレーム挿入。
ref=6 L0の最大参照数を決める。最大16まで使えるけどx265の方式ではBフレームを使用すると7までで、b-pyramidをオンにすると6までしか使用できない。それ以上にするとprofile none 、level none扱いとなりエラー吐いて止るので実質6まで。どうしても7以上使いたい場合はallow-non-conformanceをオンにする事で使える。アニメ素材や定点録画なら6にして、それ以外なら3以下でいいと思う。
no-weightp 重み付き予測を有効にする。Pスライスは1枚の画像から復号されるスライス
no-weightb 重み付き予測を有効にする。Bスライスは複数の画像から復号されるスライス
aq-mode=0 適応的QP(AQ)。複雑な部分ではビットレートを増やし、平坦な部分では減らす。 0でオフ。 1でAQをオン。 2でauto-variance AQをオン。
aq-strength=0.00 AQ強度。0にするとAQオフ。実写やゲーム以外のソースでは上げる必要はないと思う。
cbqpoffs=0 Chroma Cb QP Offset
Default: 0
crqpoffs=0 Chroma Cr QP Offset
Default: 0
rd=2 RDO(Rate Distortion Optimization)、レート歪み最適化のレベルを決める。3から5のどれかでいいと思う。
psy-rd=0.30 画質の視覚的な調整をする。人の視覚的に細かいと感じる部分をぼかす事で画質を稼ぐ。使うなら初期値か上げても1.00未満。
psy-rdoq=0.00 psy-rdのぼかしを防ぐことができる機能。rdoq-levelが1か2で使える。(?)実写や細かい粒子が漂う動画なんかでは、この値を高くすることで元の画質を保持できる。psy-rdと共に動きの激しい部分で効果がある。
signhide hide sign bit of one coeff per TU (rdo)
lft Enable Loop Filter
Default: Enabled
no-sao 画素適応オフセット(Sample Adaptive Offset)。エッジ・オフセット処理とバンド・オフセット処理で構成される。デブロッキングフィルタがブロックの境界の歪みを減らしてくれるのに対し、SAOはブロック内部のリンギング歪み、グラデーションの縞々の劣化を減らしくれる。
no-sao-non-deblock
no-b-pyramid ピラミッド参照。再生規格の問題で、PC以外で利用予定がないならオンでいい。
no-cutree x264のmbtreeのような物。動きが少なく参照数も少ないところはビットレートを少なく割り当て、頻繁に参照される部分には多く割り当てる。激しく動く動画では効果がある。オフにするメリットはエンコ時間が減らせるぐらい。
rc=2
pass
bitrate=2816
qcomp=0.60 ビットレート変動量。高い値にしておけばcqp(固定量子化量)の品質が改善する。
qpmin=0
qpmax=51
qpstep=4 最大QP変動幅。知らぬ間にコマンドから消えた。
cplxblur=20.0
qblur=0.5
vbv-maxrate=50000
vbv-bufsize=50000
ipratio=0.71
pbratio=1.30