Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery
Unsupervised Anomaly Detection with Generative Adversarial Networks to Guide Marker Discovery
https://arxiv.org/abs/1703.05921
Jul 29, 2021
Anomaly Detection, Unsupervised Learning, GAN,
IPMI (2017)
1. どんなもの?
GANを使用した教師なし異常検知
画像空間から潜在空間へのマッピングに基づく新しい異常スコアリングスキームを伴う
網膜の光コヒーレンス・トモグラフィー画像を用いた結果、網膜液や反射率の高い病巣を含む画像などの異常画像を正しく識別することができた
2. 先行研究と比べてどこがすごい?
3. 技術や手法の”キモ”はどこ?
変数定義
$x$: 入力画像
$z$: 潜在空間
$p_g$: 分布
$G()$: Generator
$D()$: Discriminator
$f()$: 中間層の出力
$R(x)$: 残差スコア
$D(x)$: 識別スコア
$A(x)$ 異常スコア
学習
通常のGANと同じ2プレイヤーのミニマックスゲーム
\[\min_G \max_D V(D, G) = \mathbb{E}_{\bf x \rm \sim p_{data}(\bf x \rm)} [\log D(\bf x \rm)] + \mathbb{E}_{\bf z \rm \sim p_{\bf z \rm}(\bf z \rm)} [\log (1 - D(G(\bf z \rm)))]\]
生成器Generatorは生成する能力を向上させる
識別機Discriminatorは実画像と生成された画像を識別する能力を向上させる
推論(異常度の算出)
Residual loss
\[\mathcal{L}_R (\bf z\rm_{\gamma}) = \sum |\bf x\rm - G(\bf z\rm_{\gamma}) |\]
クエリ画像$x$と生成画像$G(z_\gamma)$の色覚的非類似性を測定
discrimination loss
\[\mathcal{L}_{D} (\bf z\rm_{\gamma}) = \sum | f(\bf x\rm ) - f(G(z\rm_{\gamma}))|\]
識別機Dの中間層の出力$f()$を使用することによって、Dが学習した特徴表現の情報を考慮に入れる
識別機Dを分類機ではなく特徴抽出器として使用
これら二つのLossの加重和の損失関数
\(\mathcal{L} (z\rm_{\gamma}) = (1-\lambda) \cdot \mathcal{L}_R (\bf z\rm_{\gamma}) + \lambda \cdot \mathcal{L}_{D} (\bf z\rm_{\gamma})\)を用いて
$\gamma$回のバックプロパゲーションを繰り返すことにより最適な潜在変数$z_\gamma$を得る。
その潜在変数$z_{\gamma}$を用いて、残差スコア \(R(x) = \mathcal{L}_R (\bf z\rm_{\gamma})\) と識別スコア \(D(x) = \mathcal{L}_D (z\rm_{\gamma})\) と定義したときのクエリ画像 $x$ の異常スコア
$ A(\bf x\rm) = (1- \lambda) \cdot R(\bf x\rm) + \lambda \cdot D(\bf x\rm) $
基準異常スコア
$ \hat{A}(\bf x\rm) = (1- \lambda) \cdot R(\bf x\rm) + \lambda \cdot \hat{D}(\bf x\rm)\qquad(\because \hat{D}(x) = \mathcal{L_{\hat{D}}} (z\rm_{\gamma}))$
4. どうやって有効だと検証した?
網膜の臨床高解像度SD-OCTボリューム
上から1行ごとに元画像、生成画像、異常個所、アノテーション
左から1ブロックごとに学習正常、テスト正常、テスト異常
(a). 他モデルとの比較
(b) 残差スコア(緑)、識別スコア(黒)、基準識別スコア(赤)に基づく異常検知精度
(c) 残差スコアの分布
(d) 判別スコアの分布
6. 関連文献
Yeh, R., Chen, C., Lim, T.Y., Hasegawa-Johnson, M., Do, M.N.: Semantic image inpainting with perceptual and contextual losses. arXiv:1607.07539 (2016)