Posts | 4

読んだ論文をまとめておく場所です

Posts | 4

Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection

  • YOLOv3やSSDのようなアンカーベースのモデルであるLaneATTを提案
  • 大域的情報の取得のためにAttentionも使用
  • CULaneとTuSimpleとLLAMASのデータセットで最先端手法を凌駕

Dec 13, 2022 Lane Detection CVPR (2021)

LineNet: a Zoomable CNN for Crowdsourced High Definition Maps Modeling in Urban Environments

  • 現在のCNNを用いた車線検出の研究はセグメンテーションに限定されており、直感的でなく不正確である
  • HDマップのモデリングのために、LP層とZoomモジュールを持つCNN手法のLineNetを提案
  • 車線検出用のデータセットTTLaneを紹介

Dec 13, 2022 Lane Detection arXiv (2018)

Lane Detection: A Survey with New Results

  • 視覚に基づく車線検出のデータセット、深層学習を用いた手法の比較
  • HD地図のモデリングに向けた新しいデータセット(TTLane)と複雑な道路状況での自立走行に向けた方向性とLineNetを紹介する

Dec 12, 2022 Lane Detection JCST (2020)

OFA: Unifying Architectures, Tasks, and Modalities Through a Simple Sequence-to-Sequence Learning Framework

  • 包括的なタスクを行うことができる、タスクとモダリティを無視できるフレームワークであるOFA(One For All)を提案
    • Text2Image, Visual Grounding, VQA, Image Caption, Image Classification, language modeling
  • 一般に公開されている2000万件の画像テキストペアのデータセットで事前学習
  • 自然言語理解(RoBERTa、ELECTRA、DeBERTa) 自然言語生成(UniLM、Pegasus、 ProphetNet) 画像分類(MoCo-v3、BEiT、MAE)と同等のパフォーマンスを達成
  • 未学習のタスクにも移行できる

Nov 29, 2022 Vision and Language ICML (2022)

QPIC: Query-Based Pairwise Human-Object Interaction Detection with Image-Wide Contextual Information

  • CNNベースのHOI手法ではCNNの局所性により全体の特徴を使用できず、手動で設定した関心領域に依存し、複数のHOIを混在する欠点がある
  • transformerベースの特徴抽出器を利用することで、画像全体を集約し複数のHOIの混在を避けることができる
  • 効果的なtransformerベースの特徴抽出器によって検出ヘッドがシンプルで直感的になり、文脈上重要な特徴をうまく抽出し、既存手法を大きく上回った
    • HICO-DETで5.37mAP↑,V-COCOで5.7mAP↑

Oct 20, 2022 HOI CVPR (2021)

Correlating Belongings with Passengers in a Simulated Airport Security Checkpoint

  • 空港の保安検査場における乗客と持ち物のトラッキング・関連付けのアルゴリズムを提示し、その有効性を実証
  • 手作業とディープラーニングベースのアプローチの両方を活用
  • 現実のデータセットで、乗客と持ち物を検出、トラッキング、関連付けることができた

Oct 17, 2022 Object Detection ICDSC (2018)

Egocentric Human-Object Interaction Detection Exploiting Synthetic Data

産業環境(電気基板のテストおよび修理作業)においてHOI検出を行う際に、大量のデータの収集・ラベリングは困難である。そこで、自動的にラベリングされた合成一人称画像を生成するパイプラインとツールを提案する。生成した合成データで事前学習をし、実データでファインチューニングをすることで、実データでのHOI検出の性能を向上させた。

Sep 5, 2022 HOI arXiv (2022)

Ref-NeRF: Structured View-Dependent Appearance for Neural Radiance Fields

  • 既存のNeRFは光沢のある表面の外観を正確に再現できない場合が多い
  • そこで、NeRFの視点から色を出力する箇所に手を加えたRef-NeRFを提案
  • 鏡面反射の精度を大幅に改善した

Aug 24, 2022 NeRF CVPR (2022)