論文の概要: Scene Graph Generation: A Comprehensive Survey
- arxiv url: http://arxiv.org/abs/2201.00443v1
- Date: Mon, 3 Jan 2022 00:55:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 14:25:40.457042
- Title: Scene Graph Generation: A Comprehensive Survey
- Title(参考訳): Scene Graph Generation: 総合的な調査
- Authors: Guangming Zhu, Liang Zhang, Youliang Jiang, Yixuan Dang, Haoran Hou,
Peiyi Shen, Mingtao Feng, Xia Zhao, Qiguang Miao, Syed Afaq Ali Shah and
Mohammed Bennamoun
- Abstract要約: シーングラフは、その強力な意味表現とシーン理解への応用から研究の焦点となっている。
SGG(Scene Graph Generation)とは、画像を自動的にセマンティックなシーングラフにマッピングするタスクである。
本稿では,異なる入力モダリティをカバーする138の代表的な作品についてレビューし,既存の画像ベースSGGの手法を体系的に要約する。
- 参考スコア(独自算出の注目度): 35.80909746226258
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning techniques have led to remarkable breakthroughs in the field of
generic object detection and have spawned a lot of scene-understanding tasks in
recent years. Scene graph has been the focus of research because of its
powerful semantic representation and applications to scene understanding. Scene
Graph Generation (SGG) refers to the task of automatically mapping an image
into a semantic structural scene graph, which requires the correct labeling of
detected objects and their relationships. Although this is a challenging task,
the community has proposed a lot of SGG approaches and achieved good results.
In this paper, we provide a comprehensive survey of recent achievements in this
field brought about by deep learning techniques. We review 138 representative
works that cover different input modalities, and systematically summarize
existing methods of image-based SGG from the perspective of feature extraction
and fusion. We attempt to connect and systematize the existing visual
relationship detection methods, to summarize, and interpret the mechanisms and
the strategies of SGG in a comprehensive way. Finally, we finish this survey
with deep discussions about current existing problems and future research
directions. This survey will help readers to develop a better understanding of
the current research status and ideas.
- Abstract(参考訳): ディープラーニング技術は、ジェネリックオブジェクト検出の分野で目覚ましいブレークスルーをもたらし、近年では、シーンを理解する多くのタスクを生み出している。
シーングラフは、その強力な意味表現とシーン理解への応用から研究の焦点となっている。
シーングラフ生成(sgg: scene graph generation)は、画像を自動的にセマンティックな構造的なシーングラフにマッピングするタスクであり、検出されたオブジェクトとその関連を正しくラベル付けする必要がある。
これは難しい作業だが、コミュニティは多くのSGGアプローチを提案し、良い結果を得た。
本稿では,この分野での最近の成果について,ディープラーニング技術がもたらす総合的な調査を行う。
我々は,異なる入力モダリティをカバーする138の代表的な作品についてレビューし,特徴抽出と融合の観点から,画像ベースSGGの既存手法を体系的に要約する。
我々は,既存の視覚関係検出手法を接続し,体系化し,sggのメカニズムと戦略を包括的に要約し,解釈する。
最後に,現在の問題点と今後の研究方向性を深く議論して,この調査を終える。
この調査は、読者が現在の研究状況とアイデアをよりよく理解するのに役立つだろう。
関連論文リスト
- Few-Shot Object Detection: Research Advances and Challenges [15.916463121997843]
Few-shot Object Detection (FSOD)は、少数の学習技術とオブジェクト検出技術を組み合わせて、注釈付きサンプルに制限のある新しいオブジェクトに迅速に適応する。
本稿では,近年のFSOD分野の進歩を概観する包括的調査を行う。
論文 参考訳(メタデータ) (2024-04-07T03:37:29Z) - Few-Shot Learning on Graphs: from Meta-learning to Pre-training and
Prompting [56.25730255038747]
この調査は、最近の展開を合成し、比較洞察を提供し、将来の方向性を特定するための取り組みである。
我々は,既存の研究をメタラーニングアプローチ,事前学習アプローチ,ハイブリッドアプローチの3つの主要なファミリーに体系的に分類した。
これらの手法間の関係を解析し,その強みと限界を比較する。
論文 参考訳(メタデータ) (2024-02-02T14:32:42Z) - Adaptive Visual Scene Understanding: Incremental Scene Graph Generation [20.255178648494756]
シーングラフ生成(SGG)は、画像を分析して、オブジェクトとその関係に関する意味のある情報を抽出する。
SGGにおける連続学習手法の欠如に対処するために,連続ScenEグラフ生成データセットを包括的に導入する。
論文 参考訳(メタデータ) (2023-10-02T21:02:23Z) - What's the Situation with Intelligent Mesh Generation: A Survey and
Perspectives [13.081274167488843]
Intelligent Mesh Generation(IMG)は、機械学習技術を利用してメッシュを生成する、新しくて有望な研究分野である。
比較的幼少期であったにもかかわらず、ICGはメッシュ生成技術の適応性と実用性を著しく向上させてきた。
本稿は,現在のIMGの状況について,体系的かつ徹底的な調査を行うことによって,このギャップを埋める試みである。
論文 参考訳(メタデータ) (2022-11-11T05:24:16Z) - Towards Open-vocabulary Scene Graph Generation with Prompt-based
Finetuning [84.39787427288525]
シーングラフ生成(SGG)は、画像内のオブジェクト間の視覚的関係を検出するための基本的なタスクである。
オープンボキャブラリシーングラフ生成は,モデルが一連のベースオブジェクトクラスでトレーニングされる,斬新で現実的で困難な設定である。
我々のメソッドは、既存のメソッドが処理できない、完全に見えないオブジェクトクラスに対する推論をサポートすることができる。
論文 参考訳(メタデータ) (2022-08-17T09:05:38Z) - Recent Advances in Embedding Methods for Multi-Object Tracking: A Survey [71.10448142010422]
マルチオブジェクトトラッキング(MOT)は、動画フレーム全体で対象物を関連付け、移動軌道全体を取得することを目的としている。
埋め込み法はMOTにおける物体の位置推定と時間的同一性関連において重要な役割を担っている。
まず 7 つの異なる視点からMOT への埋め込み手法の奥行き解析による包括的概要を述べる。
論文 参考訳(メタデータ) (2022-05-22T06:54:33Z) - From Show to Tell: A Survey on Image Captioning [48.98681267347662]
視覚と言語を結びつけることは、ジェネレーティブ・インテリジェンスにおいて重要な役割を担っている。
画像キャプションの研究はまだ結論に達していない。
本研究の目的は,画像キャプション手法の包括的概要と分類を提供することである。
論文 参考訳(メタデータ) (2021-07-14T18:00:54Z) - Deep Learning for Scene Classification: A Survey [48.57123373347695]
シーン分類は、コンピュータビジョンにおける長年の、根本的かつ挑戦的な問題である。
大規模データセットの出現と深層学習技術のルネッサンスは、シーン表現と分類の分野において顕著な進歩をもたらした。
本稿では,深層学習によるシーン分類における最近の成果を総合的に調査する。
論文 参考訳(メタデータ) (2021-01-26T03:06:50Z) - Visual Relationship Detection using Scene Graphs: A Survey [1.3505077405741583]
シーングラフ(Scene Graph)は、シーンとその中のさまざまな関係をよりよく表現するためのテクニックである。
本稿では、シーングラフ生成の様々な技術、視覚的関係を表現するための有効性、下流の様々な課題の解決にどのように使われているかについて、詳細な調査を行う。
論文 参考訳(メタデータ) (2020-05-16T17:06:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。