論文の概要: Object-to-Scene: Learning to Transfer Object Knowledge to Indoor Scene
Recognition
- arxiv url: http://arxiv.org/abs/2108.00399v1
- Date: Sun, 1 Aug 2021 08:37:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-03 15:19:01.096529
- Title: Object-to-Scene: Learning to Transfer Object Knowledge to Indoor Scene
Recognition
- Title(参考訳): object-to-scene: オブジェクト知識を屋内シーン認識に移すための学習
- Authors: Bo Miao, Liguang Zhou, Ajmal Mian, Tin Lun Lam, Yangsheng Xu
- Abstract要約: 本研究では,オブジェクトの特徴を抽出し,オブジェクト関係を学習して屋内シーンを認識するオブジェクト・ツー・シーン(OTS)手法を提案する。
OTSは、新たなストリームを使わずに、室内のシーン認識において、最先端の手法を2%以上上回っている。
- 参考スコア(独自算出の注目度): 19.503027767462605
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate perception of the surrounding scene is helpful for robots to make
reasonable judgments and behaviours. Therefore, developing effective scene
representation and recognition methods are of significant importance in
robotics. Currently, a large body of research focuses on developing novel
auxiliary features and networks to improve indoor scene recognition ability.
However, few of them focus on directly constructing object features and
relations for indoor scene recognition. In this paper, we analyze the
weaknesses of current methods and propose an Object-to-Scene (OTS) method,
which extracts object features and learns object relations to recognize indoor
scenes. The proposed OTS first extracts object features based on the
segmentation network and the proposed object feature aggregation module (OFAM).
Afterwards, the object relations are calculated and the scene representation is
constructed based on the proposed object attention module (OAM) and global
relation aggregation module (GRAM). The final results in this work show that
OTS successfully extracts object features and learns object relations from the
segmentation network. Moreover, OTS outperforms the state-of-the-art methods by
more than 2\% on indoor scene recognition without using any additional streams.
Code is publicly available at: https://github.com/FreeformRobotics/OTS.
- Abstract(参考訳): 周囲のシーンの正確な認識は、ロボットが合理的な判断と行動を行うのに役立つ。
したがって,効果的なシーン表現・認識手法の開発はロボット工学において重要である。
現在、屋内シーン認識能力を向上させるために、新しい補助機能やネットワークの開発に重点が置かれている。
しかし,オブジェクトの特徴と屋内シーン認識の関係を直接構築することに焦点を当てているものはほとんどない。
本稿では,現在の手法の弱点を分析し,オブジェクトの特徴を抽出し,オブジェクト関係を学習して屋内シーンを認識するオブジェクト・ツー・シーン(OTS)手法を提案する。
提案するOTSは,まず,分割ネットワークとオブジェクト特徴集約モジュール(OFAM)に基づいてオブジェクト特徴を抽出する。
その後、オブジェクト関係を計算し、提案したオブジェクト注意モジュール(OAM)とグローバル関係集約モジュール(GRAM)に基づいてシーン表現を構築する。
この研究の最終結果は、OTSがオブジェクトの特徴を抽出し、セグメンテーションネットワークからオブジェクトの関係を学習できることを示します。
さらに、OTSは、追加のストリームを使わずに、屋内シーン認識において2倍以上の精度で最先端の手法より優れている。
コードはhttps://github.com/FreeformRobotics/OTS.comで公開されている。
関連論文リスト
- Simultaneous Detection and Interaction Reasoning for Object-Centric Action Recognition [21.655278000690686]
エンドツーエンドのオブジェクト中心のアクション認識フレームワークを提案する。
同時に1つのステージで検出と相互作用の推論を行う。
我々はSomes-ElseとIkea-Assemblyという2つのデータセットで実験を行う。
論文 参考訳(メタデータ) (2024-04-18T05:06:12Z) - Localizing Active Objects from Egocentric Vision with Symbolic World
Knowledge [62.981429762309226]
タスクの指示をエゴセントリックな視点から積極的に下す能力は、AIエージェントがタスクを達成したり、人間をバーチャルに支援する上で不可欠である。
本稿では,現在進行中のオブジェクトの役割を学習し,指示から正確に抽出することで,アクティブなオブジェクトをローカライズするフレーズグラウンドモデルの性能を向上させることを提案する。
Ego4DおよびEpic-Kitchensデータセットに関するフレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-10-23T16:14:05Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - SOS! Self-supervised Learning Over Sets Of Handled Objects In Egocentric
Action Recognition [35.4163266882568]
本稿では,SOS(Self-Supervised Learning Over Sets)を導入し,OIC(ジェネリック・オブジェクト・イン・コンタクト)表現モデルを事前学習する。
OICは複数の最先端ビデオ分類モデルの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2022-04-10T23:27:19Z) - Bi-directional Object-context Prioritization Learning for Saliency
Ranking [60.62461793691836]
既存のアプローチは、オブジェクトオブジェクトかオブジェクトシーンの関係を学ぶことに集中しています。
我々は,人間の視覚認識システムにおいて,空間的注意と物体に基づく注意が同時に機能することが観察された。
本稿では,空間的注意を統一する新たな双方向手法を提案する。
論文 参考訳(メタデータ) (2022-03-17T16:16:03Z) - Exploiting Scene Graphs for Human-Object Interaction Detection [81.49184987430333]
ヒューマン・オブジェクト・インタラクション(Human-Object Interaction,HOI)検出は、人間とオブジェクト間のインタラクションのローカライズと認識を目的とした、基本的な視覚的タスクである。
そこで本研究では,シーングラフを用いたヒューマン・オブジェクト・インタラクション(SG2HOI)検出タスクのための新しい手法を提案する。
SG2HOIはSG情報を2つの方法で組み込む:(1)シーングラフを世界的文脈の手がかりに埋め込み、シーン固有の環境コンテキストとして機能し、(2)オブジェクトの近傍から関係を収集し、それらを対話に転送するリレーショナル・アウェア・メッセージ・パッシング・モジュールを構築する。
論文 参考訳(メタデータ) (2021-08-19T09:40:50Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - BORM: Bayesian Object Relation Model for Indoor Scene Recognition [3.3274747298291216]
室内のシーン表現に意味のあるオブジェクト表現を活用することを提案する。
まず,改良されたオブジェクトモデル(IOM)をベースラインとして,屋内シーンに関連するリッチなオブジェクトカテゴリを持つADE20Kデータセット上で事前学習したシーン解析アルゴリズムを導入することにより,オブジェクトの知識を充実させる。
オブジェクトの共起とペアのオブジェクト関係を解析するために、ベイズ的オブジェクト関係モデル(BORM)としてベイズ的視点からIOMを定式化する。
論文 参考訳(メタデータ) (2021-08-01T08:31:18Z) - A Deep Learning Approach to Object Affordance Segmentation [31.221897360610114]
我々は,ビデオと静的画像の両方において,画素単位の価格ラベルを推定するオートエンコーダを設計する。
本モデルは,ソフトアテンション機構を用いて,オブジェクトラベルやバウンディングボックスの必要性を克服する。
本モデルは,SOR3D-AFF上での強い教師付き手法と比較して,競争力のある結果が得られることを示す。
論文 参考訳(メタデータ) (2020-04-18T15:34:41Z) - Look-into-Object: Self-supervised Structure Modeling for Object
Recognition [71.68524003173219]
我々は,自己スーパービジョンを取り入れた「対象」(具体的かつ内在的に対象構造をモデル化する)を提案する。
認識バックボーンは、より堅牢な表現学習のために大幅に拡張可能であることを示す。
提案手法は汎用オブジェクト認識(ImageNet)や細粒度オブジェクト認識タスク(CUB, Cars, Aircraft)など,多数のベンチマークにおいて大きなパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-03-31T12:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。