Improving Unsupervised Defect Segmentation by Applying Structural Similarity to Autoencoders

Improving Unsupervised Defect Segmentation by Applying Structural Similarity to Autoencoders

https://arxiv.org/abs/2107.05855

Jul 14, 2021

Anomaly Detection, Unsupervised Learning, Anomaly Segmentation, Autoencoder,

VISAPP (2019)

1. どんなもの?

通常の畳み込みオートエンコーダで使用されるピクセルLossは位置ズレに弱く、強度の値が一定の場合に弱い。
そこで、輝度、コントラスト、構造情報を考慮した構造的類似性(SSIM)Lossを代わりに使用した。

2. 先行研究と比べてどこがすごい?

3. 技術や手法の”キモ”はどこ?

変数定義

学習

Layer Output Size Kernel Stride Padding
Input 128×128×1      
Conv1 64×64×32 4×4 2 1
Conv2 32×32×32 4×4 2 1
Conv3 32×32×32 3×3 1 1
Conv4 16×16×64 4×4 2 1
Conv5 16×16×64 3×3 1 1
Conv6 8×8×128 4×4 2 1
Conv7 8×8×64 3×3 1 1
Conv8 8×8×32 3×3 1 1
Conv9 1×1×d 8×8 1 0

推論(異常度の算出)

4. どうやって有効だと検証した?

6. 関連文献

  1. Zhou Wang, Alan C Bovik, Hamid R Sheikh, and Eero P Simoncelli. Image quality assessment: from error visibility to structural similarity. IEEE transactions on image processing, 13(4):600–612, 2004.
一覧へ戻る