論文の概要: Intrinsic Relationship Reasoning for Small Object Detection
- arxiv url: http://arxiv.org/abs/2009.00833v1
- Date: Wed, 2 Sep 2020 06:03:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-22 19:21:49.249827
- Title: Intrinsic Relationship Reasoning for Small Object Detection
- Title(参考訳): 小物体検出のための固有関係推論
- Authors: Kui Fu, Jia Li, Lin Ma, Kai Mu, Yonghong Tian
- Abstract要約: 画像やビデオの小さなオブジェクトは通常、独立した個人ではない。その代わりに、意味的および空間的レイアウトの関係を多かれ少なかれ提示する。
本稿では,オブジェクト間の固有意味と空間的レイアウトの関係をモデル化し,推論する,小さなオブジェクト検出のための新しいコンテキスト推論手法を提案する。
- 参考スコア(独自算出の注目度): 44.68289739449486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The small objects in images and videos are usually not independent
individuals. Instead, they more or less present some semantic and spatial
layout relationships with each other. Modeling and inferring such intrinsic
relationships can thereby be beneficial for small object detection. In this
paper, we propose a novel context reasoning approach for small object detection
which models and infers the intrinsic semantic and spatial layout relationships
between objects. Specifically, we first construct a semantic module to model
the sparse semantic relationships based on the initial regional features, and a
spatial layout module to model the sparse spatial layout relationships based on
their position and shape information, respectively. Both of them are then fed
into a context reasoning module for integrating the contextual information with
respect to the objects and their relationships, which is further fused with the
original regional visual features for classification and regression.
Experimental results reveal that the proposed approach can effectively boost
the small object detection performance.
- Abstract(参考訳): 画像やビデオの小さなオブジェクトは通常独立した個人ではない。
代わりに、多かれ少なかれ、互いに意味的かつ空間的なレイアウト関係を提示する。
このような内在的な関係のモデリングと推論は、小さなオブジェクト検出に有用である。
本稿では,オブジェクト間の固有意味と空間的レイアウトの関係をモデル化し,推論する,小さなオブジェクト検出のための新しいコンテキスト推論手法を提案する。
具体的には,まず,最初の地域的特徴に基づいてスパース意味関係をモデル化する意味モジュールと,その位置と形状情報に基づいてスパース空間レイアウト関係をモデル化する空間レイアウトモジュールを構築した。
これら2つは、オブジェクトとそれらの関係に関するコンテキスト情報を統合するためのコンテキスト推論モジュールに供給され、分類と回帰のために元の地域視覚特徴とさらに融合される。
実験の結果,提案手法が小型物体検出性能を効果的に向上できることが判明した。
関連論文リスト
- Implicit Modeling of Non-rigid Objects with Cross-Category Signals [28.956412015920936]
MODIFは、複数のオブジェクトに対する変形フィールドとインスタンス固有の潜時符号を同時に学習する多目的深い暗黙関数である。
我々は,MODIFが各臓器の形状表現と他臓器との関係を良好に学習できることを示す。
論文 参考訳(メタデータ) (2023-12-15T22:34:17Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Benchmarking Spatial Relationships in Text-to-Image Generation [102.62422723894232]
本研究では,オブジェクト間の空間的関係を正確に生成するテキスト・ツー・イメージモデルについて検討する。
画像中にテキストで記述された空間関係がどれだけ正確に生成されるかを測定する評価指標であるVISORを提案する。
我々の実験では、最先端のT2Iモデルは高画質であるが、複数のオブジェクトを生成できる能力や、それらの間の空間的関係が著しく制限されていることが判明した。
論文 参考訳(メタデータ) (2022-12-20T06:03:51Z) - Spatial Reasoning for Few-Shot Object Detection [21.3564383157159]
本稿では,空間的推論フレームワークを提案する。
グラフ畳み込みネットワークをRoIとその関連性はそれぞれノードとエッジとして定義する。
提案手法は最先端の手法を著しく上回り, 広範囲なアブレーション研究により有効性を検証する。
論文 参考訳(メタデータ) (2022-11-02T12:38:08Z) - Discovering Objects that Can Move [55.743225595012966]
手動ラベルなしでオブジェクトを背景から分離する、オブジェクト発見の問題について検討する。
既存のアプローチでは、色、テクスチャ、位置などの外観の手がかりを使用して、ピクセルをオブジェクトのような領域に分類する。
私たちは、動的オブジェクト -- 世界で独立して動くエンティティ -- にフォーカスすることを選びます。
論文 参考訳(メタデータ) (2022-03-18T21:13:56Z) - DisARM: Displacement Aware Relation Module for 3D Detection [38.4380420322491]
Displacement Aware Relation Module (DisARM)は、ポイントクラウドシーンにおける3Dオブジェクト検出の性能を向上させるニューラルネットワークモジュールである。
アンカーを見つけるために,まず,対象性を考慮したサンプリング手法を用いて予備的な関係アンカーモジュールを実行する。
この軽量なリレーショナルモジュールは、最先端検出器に差し込む際にオブジェクトインスタンス検出の精度を著しく向上させる。
論文 参考訳(メタデータ) (2022-03-02T14:49:55Z) - Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。
クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文 参考訳(メタデータ) (2020-10-19T12:36:11Z) - Attention-based Joint Detection of Object and Semantic Part [4.389917490809522]
我々のモデルは2つのFaster-RCNNモデルに基づいて作成され、それらの特徴を共有して両方の表現を拡張します。
PASCAL-Part 2010データセットの実験では、関節検出は物体検出と部分検出の両方を同時に改善できることが示された。
論文 参考訳(メタデータ) (2020-07-05T18:54:10Z) - Spatial Priming for Detecting Human-Object Interactions [89.22921959224396]
画像中の人-物間相互作用(HOI)を検出するために,空間的レイアウト情報を利用する手法を提案する。
提案手法は,視覚モジュールを初期化して人間と物体の相互作用のタイプを予測するレイアウトモジュールから構成される。
提案したモデルでは、HICO-DetデータセットのmAPが24.79%に達し、これは現在の最先端よりも約2.8%高い。
論文 参考訳(メタデータ) (2020-04-09T23:20:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。