際際滷

際際滷Share a Scribd company logo
perception-distortion tradeoff
のまとめ
2018/11/28
古勣
階盾颪砲いて岑瞳|(perception)と浴み(distortion)にはトレ`ドオフがある
ことを方僥議に幣している。
つまり岑瞳|と浴みの娼業をお札いに互めることはできない。
古勣
kSは和に佩くほど互娼業。しかし
gHには浴みが寄きくなり、罪S嘔へ
圻泣に除い泣が尖襪世、恣和は欺_音辛嬬
なI囃となる
階盾颪箸
階盾颪箸
まずは階盾颪砲弔い畽。
嘔イメ`ジのように詰盾颪了颪
互盾颪了颪Qする圭隈を
階盾顳Super Resolutionと柵ぶ。
嘔の鮫颪 waifu2x で階盾颪鯰个辰討
る。
では、どのように階盾颪鯰个辰討い襪里
というと、ベ`スはSRCNNという
Convolutional Neural Netoworkを聞った
階盾駟峽─
SRCNN
SRCNNのI尖の送れ
1. 圷の互盾饂颪らBIcubicでDown-sampleとUp-sampleを佩うことで詰盾饂
颪鯢撹する
2. 詰盾饂颪鯣訌Δ箸靴董圷の互盾饂颪箸硫邨屬なくなるようにCNNで僥す
る
シンプルですがこのように僥して階盾颪鯰个Δ海箸できる。
僥において宴旋なことは僥デ`タとして互盾饂颪ありさえすれば措い、
という泣で僥が否叟であり、また@くような_な鮫颪誼られる泣で帆Φ弔
Computer 閣庄壊庄看稼のタスクの匯つ。
SRCNN
鮫嵎得
浴みを燕す峺
Full-Reference Metric頼畠歌孚メトリック
頼畠歌孚アルゴリズムでは秘薦イメ`ジと、浴みのない兜豚の歌孚イメ`ジ
を曳^します。
ピクセルg了や吭龍g了などに卆贋するメトリック
旗燕箭
?MSEMean Square Error再従屈\`餓
?PSNRPeak Signal-to-Noise Ratio坤圦`ク佚催j咄曳
?SSIMStructural SIMilarity夛議貌來峺方
浴みを燕す峺烹PSNR
PSNRPeak Signal-to-Noise Ratio坤圦`ク佚催j咄曳
峠譲屈\`餓からСされ、浴みのパワ`にする恷寄ピクセル業の曳を
燕します。
和のようなシンプルな方塀で燕す。
MAXI
沙颪函りうる恷寄ピクセル
MSE 叉予睿颪了颪噺濬睿颪了颪砲弔い謄團セルごとのデ`タにしてMSEを
麻
浴みを燕す峺烹SSIM
MSEやPSNRによって箔まる、
?繁gがたrに湖じる`いと駅ずしも匯崑しない。
?仝鮫馮悶で富しずつ`う々仝蕉侭議に寄きく`う々といったrにほぼ揖じ
Y惚が卦ってくる。
匯圭、繁gは念宀よりも瘁宀によりい`いを湖じるA鬚ある。
その繁gが湖じる`いをより屎_に峺忙するためにできたものが
SSIM(Structural Similarity夛議貌來峺方)
浴みを燕す峺烹SSIM
ここで、μx
, μy
は峠譲、σx
, σy
は米餓、σxy
は慌蛍柊。
c1やc2は徭喇にQめることができますが、8ビット鮫颪栽
c1=(0.01 * 255)2
, c2=(0.03 * 255)2
を喘いることが謹い。
岑瞳|の峺
No-Reference Metric┠撚燐侫瓮肇螢奪
掲歌孚アルゴリズムでは秘薦イメ`ジのy議な蒙翮燭函徭隼に函誼された
イメ`ジの寄トデ`タベ`スによる僥gみモデルを曳^します。
岑瞳|をy協するためには、掲歌孚メトリックを聞喘する。
旗燕箭
?BRISQUEBlind/Referenceless Image Spatial Quality Evaluator
?NIQENatural Image Quality Evaluator
岑瞳|の峺烹NIQE
NIQENatural Image Quality Evaluator
モデルを僥させるために聞喘されるイメ`ジデ`タベ`スから函誼された蒙罿y協
したいイメ`ジから麻されたNSSNatural Scene Statisticベ`スの
蒙罿礼gの鉦xをy協します。
鮫颪寄
鮫颪寄とinterpolation(温寂)
鮫颪寄するHにはinterpolation(温寂や坪
靴箸發い)と冱われるデ`タのa頼I尖が駅
勣になる。
坪靴箸蓮△△觴番の方・禰`タ双を
児にして、そのデ`タ双の光曝gの
貭擇鯊颪瓩詈、鯒鵑瓩襪海函
またはそのようなv方を嚥えること。
麼な返隈としてがある
?Nearest Neighbor
?bilinear
?bicubic
鮫颪寄仝Bilinear隈々
Bilinear は褒圭鬚らリニア岷議に温寂
したもの
嘔蹐 linear 温寂
鮫颪寄仝Bilinear隈々
嘔蹐 bilinear 温寂
バイリニア温寂では
箔める了崔(x,y)の巓xの
2〜2鮫殆┌柑殆を聞って、
x業、鰆云議に温寂して、
x業、鯒鵑瓩泙后
鮫颪寄仝Bicubic隈々
Bicubicは褒圭鬚ら眉肝v方で温寂した
もの
バイキュ`ビック温寂では
箔める了崔(x,y)の巓xの4〜4鮫殆
┌隠胸殆を聞って、x業、
眉肝塀で温寂してx業、鯒鵑瓩泙后
SRGANと鮫嵎得
SRGAN
GANをMみzんだ階盾顱SRGAN々
これまでCNNベ`スの返隈が嶄伉でしたが、r旗の送れもありGenerative Adversarial
NetworksGANをMみzんだ階盾駟峽┐痢SRGAN々
(Super-Resolution Using GAN)が戻宛された。2016定9埖
1. ResNetによるかいエラ`を俐屎する侮いネットワ`ク
2. Style Tranferにも聞われているContent Lossを深]することで
愔瓦臨醫ゞ\`餓を喘いたものよりも、"麼Q議"な階盾颪鯰个
3. GANを秘しAdversarial Lossを深]してさらに麼Q議なuを佩う
4. Deconvolutionの旗わりにPixel Shuffle Layerを秘し互堀かつ_な
鮫颪鯢撹する
皆檎赫粥鰻のネットワ`ク
皆檎赫粥鰻のネットワ`ク
ResNetの旋喘
convolutionを宥る/宥らないの2つのパスがあるResidual夛
圻猟は
"Deep Residual Learning for Image Recognition"
MSRAからk燕され、2015/12の鮫騁JRコンペテ値璃
を尅るったネットワ`クの猟
ネットワ`クを侮くするときに、駅ずしもその弖紗蛍のレ
イヤ`を聞わず、バイパスするル`トも
Oけることで、gなネットワ`クから侮いネットワ`クに
錆らかに篁するもの。
Content Loss秘の嘘尚
云栖、詰盾餠隼颪ら階盾餠隼颪鯢撹するHには、しばしば、
どういうが屎しいかQ協できない栽が贋壓する。
このときに、ピクセルg了の屈\`餓を恷弌晒するよくある返隈では、
あるN"峠譲議な鮫"が恬られてしまう。
峠譲議な鮫颪蓮∋云議にぼやけてしまいがちで、云輝の互盾餠隼颪箸
gに蛍けられてしまう。
Content Loss秘の嘘尚
MSE楳弼
GAN┘レンジ弼で誼られた圷鮫顳┳
弼
MSEは、ピクセルg了の峠譲のために掲
械に錆らかにえますが、GANはより徭
隼なY惚を伏撹している。
橿のどれかを恬りたいのに、
`餓の恷弌晒で楳が恬られて
しまう
Content Loss秘の嘘尚
階盾颪宇えているQ協音嬬來 恷弌屈\`餓児覆粒盾颪任笋蠅ちなこと
"圷鮫颪里兇辰りしたた朕を隠贋しながらeの
荷恬を紗える"ために聞われていたのがContent
Loss
Content Loss秘の嘘尚
そこで、まず秘したのが、ピクセルg了でo尖やり栽わせようとすることを
やめて、もっとざっくりした蒙罿魃蹐靴討れるContent Lossを旋喘する
ということ。
ここでいうContent Lossというのは、鮫騁JRのためにトレ`ニングされた
eのネットワ`クに、階盾颪噺濬睿颪裡欧弔了颪鰺┐靴吹瓩痢
嶄g嗟平の屈\`餓を峺す。
Content Lossの恷弌晒}にしたことで誼られたのは、
"だいたいあってる鮫"を恬る嬬薦であり、 それだけでは頭返鯛ちで、
やはりぼやけた鮫颪砲覆辰討靴泙Α
Adversarial Lossによる"階盾"への鮄
GANの"デ`タセットと竃薦が蛍けられないように僥する"というアイデアは、まさに、
階盾颪猟慎弔髻
胆しい鮫颪鰈り、"階盾颪噺濬睿颪鰔蛍けられないように繁gを_す"
というところにおけば、そのまま送喘辛嬬なところ。
肝の蹐吠召垢茲Δ法蛍けがつかない鮫颪鯢撹するネットワ`クは、殆岷にGANの
碧Mみをつかってg廾できます。ただしgはこれだと、詰盾餠隼
に畠くvSのない階盾餠隼颪鯢撹してしまう。
なので、垢健2のContent Lossとm俳に詞ぜ栽わせて旋喘する。
(猟では1:0.00001)。
これにより、峠譲っぽい鮫颪鰈るからぼやける}が盾Qすることに。
Adversarial Lossによる"階盾"への鮄
Pixcel Shuffler
Pixel Shuffler は屎塀には Sub-Pixel Convolution
秘薦蒙羀泪奪廚慮ピクセルをKべ紋えて互盾餠箸別羀泪奪廚魍薦する。
チャンネルの侮さをサイズにQする。
秘薦マップの互さを Hin
、嫌を Win
とし、竃薦マップのチャネル方を Cout
,
寄蔚楕を r とします。
猟の蹐砲茲襪函參和のように秘薦マップをKべ紋えて互盾颪奮薦を
誼ます。
このKべ紋えのI尖を佩うv方をPSとすると、PSは
秘薦されたCout
?r2
〜Hin
〜Win
の蒙羀泪奪廚 Cout
〜rHin
〜rWin
に簧里靴導薦します。
箭えば秘薦マップが8〜2〜2 蔚楕r=2 の栽、竃薦マップは2〜4〜4 となり、
2蔚に寄されたものが竃薦されます。
Pixcel Shuffler
SRGANのu
これらの室g議な個鋲により繁gがて岑瞳|の措い階盾颪gF
できている。
モニタ`によってuされたY惚
岑瞳|とPNSRのvS
SRGANによって繁gがて岑瞳|の措いY惚が誼られた。
しかし、繁gがて岑瞳|の措いY惚がPNSR┬PMSEと珸vしていない。
岑瞳|とPNSRのvS
これは表}の僣に廣朕してみると、
 SRGANのY惚はPNSRの、詰いけれども僣の彜rをかく燕Fしている
 SRResNetのY惚はPNSRの、互いもののぼやけたような鮫
 になっている。
PNSRを互く恷m晒しようとして峠譲議に措いと房われる鮫颪鯢撹
してしまっている。
岑瞳嵎と浴みのトレ`ドオフ
The Perception-Distortion Tradeoff
貧の}に彭朕し、この岑瞳|とPNSRのvS來を協楚議にuした
猟が和
[1711.06077] The Perception-Distortion Tradeoff
勣泣
?階盾颪砲いて岑瞳|と浴みにはトレ`ドオフがある
 ★岑瞳|と浴みの娼業をお札いに互めることはできない
The Perception-Distortion Tradeoff
?鮫駮甡▲襯乾螢坤爐蓮伏撹鮫颪
峠譲浴みおよび岑瞳|によって蒙
原けられる
?岑浴み峠中には、アルゴリズムの碧
Mみにかかわらず、_撹できないI囃
が贋壓する
?_撹音辛嬬なI囃に除俊している
栽、アルゴリズムは捻壓議に辛嬬
?浴みまたは岑瞳|の泣でのみ個鋲
され、匯圭は麿圭を徂にしている。
uY惚
これらのメトリックにvして恷除の階盾駟峽┐砲弔いgYしたY惚
このgYでは、仝Ma et al.々という岑スコアでu
?PSNR/SSIMで互娼業が竃ているモデルEDSR
NTIRE2017コンペティション のWinning Solution 
などは仝Ma et al.々では娼業が詰い。
?剃にSRGANやEnhanceNetなどのモデルはPSNRの娼業は詰いものの、
 仝Ma et al.々は互いことがて函れます。
uY惚
kSで和に佩くほど、
Ma et al. の峺砲互く、
岑瞳|が互い。
匯圭、罪Sで恣へ佩くほど
SSIMの峺砲互く、浴みの
瞳|が互い。
岑瞳|の峺烹Ma et al.
3つの詰レベルのy議蒙罿ら、2ステ`ジの指「モデルをBする
ことでスコアを麻竃する。
Perceptual score
ECCV 2018 PIRM Workshop 階盾颪離灰鵐撻謄ションにて
岑瞳|の浴みのトレ`ドオフの}を未まえて、愔瓦淋u樫業とは
なり仟しいメトリックが秘された。
歌深猟
GANによる階盾颪もたらす仟しい圭鯰圓函 The Perception-Distortion Tradeoff々の
http://keiku.hatenablog.jp/entry/2018/07/22/220158
The Perception-Distortion Tradeoff
https://arxiv.org/abs/1711.06077
Image Super-Resolution Using Deep Convolutional Networks 2014定12埖
https://arxiv.org/abs/1501.00092
Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
https://arxiv.org/abs/1609.04802
鮫殆の温寂Nearest neighbor,Bilinear,Bicubic
http://imagingsolution.blog.fc2.com/blog-entry-142.html
歌深猟
Learning a No-Reference Quality Metric for Single-Image Super-Resolution
https://sites.google.com/site/chaoma99/sr-metric
Learning a No-Reference Quality Metric for Single-Image Super-Resolution
Learning a No-Reference Metric for Single-Image Super-Resolution - Chao Ma's Homepage
イメ`ジ鮫|メトリクス
https://jp.mathworks.com/help/images/image-quality-metrics.html#mw_f900794d-c956-452e-83bf-9b2224
a5773b
Making a `Completely Blind¨ Image Quality Analyzer
https://live.ece.utexas.edu/publications/2013/mittal2013.pdf
歌深猟
Deconvolutionの旗わりにPixel Shufflerを聞う
http://musyoku.github.io/2017/03/18/Deconvolution%E3%81%AE%E4%BB%A3%E3%82%8F%E3%82%8
A%E3%81%ABPixel-Shuffler%E3%82%92%E4%BD%BF%E3%81%86/
Deconvolution and Checkerboard Artifacts
https://distill.pub/2016/deconv-checkerboard/

More Related Content

Perception distortion-tradeoff 20181128