論文の概要: Scene Graph Generation: A Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2201.00443v1
- Date: Mon, 3 Jan 2022 00:55:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 14:25:40.457042
- Title: Scene Graph Generation: A Comprehensive Survey
- Title(参考訳): Scene Graph Generation: 総合的な調査
- Authors: Guangming Zhu, Liang Zhang, Youliang Jiang, Yixuan Dang, Haoran Hou,
Peiyi Shen, Mingtao Feng, Xia Zhao, Qiguang Miao, Syed Afaq Ali Shah and
Mohammed Bennamoun
- Abstract要約: シーングラフは、その強力な意味表現とシーン理解への応用から研究の焦点となっている。
SGG(Scene Graph Generation)とは、画像を自動的にセマンティックなシーングラフにマッピングするタスクである。
本稿では,異なる入力モダリティをカバーする138の代表的な作品についてレビューし,既存の画像ベースSGGの手法を体系的に要約する。
- 参考スコア(独自算出の注目度): 35.80909746226258
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning techniques have led to remarkable breakthroughs in the field of
generic object detection and have spawned a lot of scene-understanding tasks in
recent years. Scene graph has been the focus of research because of its
powerful semantic representation and applications to scene understanding. Scene
Graph Generation (SGG) refers to the task of automatically mapping an image
into a semantic structural scene graph, which requires the correct labeling of
detected objects and their relationships. Although this is a challenging task,
the community has proposed a lot of SGG approaches and achieved good results.
In this paper, we provide a comprehensive survey of recent achievements in this
field brought about by deep learning techniques. We review 138 representative
works that cover different input modalities, and systematically summarize
existing methods of image-based SGG from the perspective of feature extraction
and fusion. We attempt to connect and systematize the existing visual
relationship detection methods, to summarize, and interpret the mechanisms and
the strategies of SGG in a comprehensive way. Finally, we finish this survey
with deep discussions about current existing problems and future research
directions. This survey will help readers to develop a better understanding of
the current research status and ideas.
- Abstract(参考訳): ディープラーニング技術は、ジェネリックオブジェクト検出の分野で目覚ましいブレークスルーをもたらし、近年では、シーンを理解する多くのタスクを生み出している。
シーングラフは、その強力な意味表現とシーン理解への応用から研究の焦点となっている。
シーングラフ生成(sgg: scene graph generation)は、画像を自動的にセマンティックな構造的なシーングラフにマッピングするタスクであり、検出されたオブジェクトとその関連を正しくラベル付けする必要がある。
これは難しい作業だが、コミュニティは多くのSGGアプローチを提案し、良い結果を得た。
本稿では,この分野での最近の成果について,ディープラーニング技術がもたらす総合的な調査を行う。
我々は,異なる入力モダリティをカバーする138の代表的な作品についてレビューし,特徴抽出と融合の観点から,画像ベースSGGの既存手法を体系的に要約する。
我々は,既存の視覚関係検出手法を接続し,体系化し,sggのメカニズムと戦略を包括的に要約し,解釈する。
最後に,現在の問題点と今後の研究方向性を深く議論して,この調査を終える。
この調査は、読者が現在の研究状況とアイデアをよりよく理解するのに役立つだろう。
関連論文リスト
- Unsupervised Object Discovery: A Comprehensive Survey and Unified Taxonomy [6.346947904159397]
教師なしのオブジェクト発見は、一般に、ラベル付き例を必要とせず、視覚データ中のオブジェクトのローカライズおよび/または分類のタスクとして解釈される。
本調査では,既存のアプローチの詳細な調査を行い,課題と採用手法のファミリーに基づいて,この課題を体系的に分類する。
本稿では,共通データセットとメトリクスの概要を述べるとともに,評価プロトコルの違いによる手法の比較の課題について述べる。
論文 参考訳(メタデータ) (2024-10-30T21:22:48Z) - Deep Graph Anomaly Detection: A Survey and New Perspectives [86.84201183954016]
グラフ異常検出(GAD)は、異常なグラフインスタンス(ノード、エッジ、サブグラフ、グラフ)を特定することを目的とする。
ディープラーニングアプローチ、特にグラフニューラルネットワーク(GNN)は、GADにとって有望なパラダイムとして現れています。
論文 参考訳(メタデータ) (2024-09-16T03:05:11Z) - Few-Shot Object Detection: Research Advances and Challenges [15.916463121997843]
Few-shot Object Detection (FSOD)は、少数の学習技術とオブジェクト検出技術を組み合わせて、注釈付きサンプルに制限のある新しいオブジェクトに迅速に適応する。
本稿では,近年のFSOD分野の進歩を概観する包括的調査を行う。
論文 参考訳(メタデータ) (2024-04-07T03:37:29Z) - Few-Shot Learning on Graphs: from Meta-learning to Pre-training and
Prompting [56.25730255038747]
この調査は、最近の展開を合成し、比較洞察を提供し、将来の方向性を特定するための取り組みである。
我々は,既存の研究をメタラーニングアプローチ,事前学習アプローチ,ハイブリッドアプローチの3つの主要なファミリーに体系的に分類した。
これらの手法間の関係を解析し,その強みと限界を比較する。
論文 参考訳(メタデータ) (2024-02-02T14:32:42Z) - Adaptive Visual Scene Understanding: Incremental Scene Graph Generation [18.541428517746034]
シーングラフ生成(SGG)は、画像を分析し、オブジェクトとその関係に関する意味のある情報を抽出する。
本稿では,関係の漸進性,シーンの漸進性,関係の一般化性という3つの学習体制からなるベンチマークを提案する。
また、RASと呼ばれる「分析によるリプレイ」手法についても紹介する。
論文 参考訳(メタデータ) (2023-10-02T21:02:23Z) - Towards Open-vocabulary Scene Graph Generation with Prompt-based
Finetuning [84.39787427288525]
シーングラフ生成(SGG)は、画像内のオブジェクト間の視覚的関係を検出するための基本的なタスクである。
オープンボキャブラリシーングラフ生成は,モデルが一連のベースオブジェクトクラスでトレーニングされる,斬新で現実的で困難な設定である。
我々のメソッドは、既存のメソッドが処理できない、完全に見えないオブジェクトクラスに対する推論をサポートすることができる。
論文 参考訳(メタデータ) (2022-08-17T09:05:38Z) - From Show to Tell: A Survey on Image Captioning [48.98681267347662]
視覚と言語を結びつけることは、ジェネレーティブ・インテリジェンスにおいて重要な役割を担っている。
画像キャプションの研究はまだ結論に達していない。
本研究の目的は,画像キャプション手法の包括的概要と分類を提供することである。
論文 参考訳(メタデータ) (2021-07-14T18:00:54Z) - Deep Learning for Scene Classification: A Survey [48.57123373347695]
シーン分類は、コンピュータビジョンにおける長年の、根本的かつ挑戦的な問題である。
大規模データセットの出現と深層学習技術のルネッサンスは、シーン表現と分類の分野において顕著な進歩をもたらした。
本稿では,深層学習によるシーン分類における最近の成果を総合的に調査する。
論文 参考訳(メタデータ) (2021-01-26T03:06:50Z) - Visual Relationship Detection using Scene Graphs: A Survey [1.3505077405741583]
シーングラフ(Scene Graph)は、シーンとその中のさまざまな関係をよりよく表現するためのテクニックである。
本稿では、シーングラフ生成の様々な技術、視覚的関係を表現するための有効性、下流の様々な課題の解決にどのように使われているかについて、詳細な調査を行う。
論文 参考訳(メタデータ) (2020-05-16T17:06:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。