論文の概要: Spatial Reasoning for Few-Shot Object Detection
- arxiv url: http://arxiv.org/abs/2211.01080v1
- Date: Wed, 2 Nov 2022 12:38:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 13:39:21.262623
- Title: Spatial Reasoning for Few-Shot Object Detection
- Title(参考訳): Few-Shotオブジェクト検出のための空間推論
- Authors: Geonuk Kim, Hong-Gyu Jung, Seong-Whan Lee
- Abstract要約: 本稿では,空間的推論フレームワークを提案する。
グラフ畳み込みネットワークをRoIとその関連性はそれぞれノードとエッジとして定義する。
提案手法は最先端の手法を著しく上回り, 広範囲なアブレーション研究により有効性を検証する。
- 参考スコア(独自算出の注目度): 21.3564383157159
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Although modern object detectors rely heavily on a significant amount of
training data, humans can easily detect novel objects using a few training
examples. The mechanism of the human visual system is to interpret spatial
relationships among various objects and this process enables us to exploit
contextual information by considering the co-occurrence of objects. Thus, we
propose a spatial reasoning framework that detects novel objects with only a
few training examples in a context. We infer geometric relatedness between
novel and base RoIs (Region-of-Interests) to enhance the feature representation
of novel categories using an object detector well trained on base categories.
We employ a graph convolutional network as the RoIs and their relatedness are
defined as nodes and edges, respectively. Furthermore, we present spatial data
augmentation to overcome the few-shot environment where all objects and
bounding boxes in an image are resized randomly. Using the PASCAL VOC and MS
COCO datasets, we demonstrate that the proposed method significantly
outperforms the state-of-the-art methods and verify its efficacy through
extensive ablation studies.
- Abstract(参考訳): 現代の物体検出器は大量の訓練データに大きく依存しているが、人間はいくつかの訓練例を使って容易に新しい物体を検出できる。
人間の視覚システムのメカニズムは,様々な対象間の空間的関係を解釈することであり,対象の共起を考慮し,文脈情報を活用できる。
そこで,本稿では,学習例の少ない新しい物体を,文脈内で検出する空間推論フレームワークを提案する。
我々は,新しいカテゴリーの特徴表現を強化するために,新しいカテゴリと基本RoI(Region-of-Interests)の幾何学的関連性を推定する。
グラフ畳み込みネットワークをroisとそれらの関連性をそれぞれノードとエッジとして定義する。
さらに,画像中のすべてのオブジェクトとバウンディングボックスをランダムに再サイズする,数ショット環境を克服するための空間データ拡張を提案する。
PASCAL VOCおよびMS COCOデータセットを用いて,提案手法が最先端の手法を著しく上回り,広範囲なアブレーション研究を通じて有効性を検証することを実証した。
関連論文リスト
- Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Local Feature Matching Using Deep Learning: A Survey [19.322545965903608]
局所的な特徴マッチングは、画像検索、3D再構成、オブジェクト認識といった領域を含むコンピュータビジョンの領域において幅広い応用を享受する。
近年,深層学習モデルの導入により,局所的特徴マッチング手法の探究が盛んに行われている。
また,移動構造,リモートセンシング画像登録,医用画像登録などの多様な領域における局所的特徴マッチングの実践的応用についても検討した。
論文 参考訳(メタデータ) (2024-01-31T04:32:41Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - GOOD: Exploring Geometric Cues for Detecting Objects in an Open World [33.25263418112558]
最先端のRGBベースのモデルは、トレーニングクラスの過度な適合に悩まされ、新しいオブジェクトの検出に失敗することが多い。
汎用単分子推定器により予測される深度や正規度などの幾何学的手法を取り入れることを提案する。
我々のGeometry-Guided Open World Object Detector (GOOD)は、新しいオブジェクトカテゴリの検出リコールを大幅に改善し、いくつかのトレーニングクラスですでにうまく機能している。
論文 参考訳(メタデータ) (2022-12-22T14:13:33Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Meta Faster R-CNN: Towards Accurate Few-Shot Object Detection with
Attentive Feature Alignment [33.446875089255876]
Few-shot Object Detection (FSOD) は、少数の例でオブジェクトを検出することを目的としている。
本稿では,データ不足ベースクラスから学習したメタ知識を新しいクラスに転送することで,メタラーニングに基づくマイショットオブジェクト検出手法を提案する。
論文 参考訳(メタデータ) (2021-04-15T19:01:27Z) - Few-shot Weakly-Supervised Object Detection via Directional Statistics [55.97230224399744]
少数ショットコモンオブジェクトローカライゼーション(COL)と少数ショット弱監視オブジェクト検出(WSOD)のための確率論的多重インスタンス学習手法を提案する。
本モデルでは,新しいオブジェクトの分布を同時に学習し,期待-最大化ステップにより局所化する。
提案手法は, 単純であるにもかかわらず, 少数のCOLとWSOD, 大規模WSODタスクにおいて, 高いベースラインを達成できることを示す。
論文 参考訳(メタデータ) (2021-03-25T22:34:16Z) - Semantic Relation Reasoning for Shot-Stable Few-Shot Object Detection [33.25064323136447]
フェーショット物体検出は、実世界のデータの固有の長尾分布のために、必要かつ長続きする問題である。
この研究は、新しい物体検出の学習に明確な関係推論を導入する。
実験では、SRR-FSDは、より高いショットで競争力のある結果を達成することができ、さらに重要なことは、より低い明示的なショットと暗黙的なショットの両方で、大幅にパフォーマンスが向上します。
論文 参考訳(メタデータ) (2021-03-02T18:04:38Z) - Context Decoupling Augmentation for Weakly Supervised Semantic
Segmentation [53.49821324597837]
微調整されたセマンティックセグメンテーションは、近年深く研究されている困難な問題です。
本稿では、オブジェクトが現れる固有のコンテキストを変更する Context Decoupling Augmentation (CDA) メソッドを紹介します。
提案手法の有効性を検証するため, PASCAL VOC 2012データセットにいくつかの代替ネットワークアーキテクチャを用いた広範な実験を行い, CDAが様々なWSSS手法を新たな最先端技術に拡張できることを実証した。
論文 参考訳(メタデータ) (2021-03-02T15:05:09Z) - Few-Shot Object Detection via Knowledge Transfer [21.3564383157159]
オブジェクト検出の従来の方法は、通常かなりの量のトレーニングデータと注釈付きバウンディングボックスを必要とする。
本稿では,いくつかの学習例からオブジェクトを検出することを目的とした,知識伝達によるオブジェクト検出について紹介する。
論文 参考訳(メタデータ) (2020-08-28T06:35:27Z) - Exploring Bottom-up and Top-down Cues with Attentive Learning for Webly
Supervised Object Detection [76.9756607002489]
本稿では,新しいクラスを対象としたWebSOD法を提案する。
提案手法はボトムアップとトップダウンを組み合わせた新しいクラス検出手法である。
提案手法は,3種類の新規/ベース分割を持つPASCAL VOCデータセット上で実証した。
論文 参考訳(メタデータ) (2020-03-22T03:11:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。