Fugu-MT 論文翻訳(概要): Symbolic Graph Inference for Compound Scene Understanding

論文の概要: Symbolic Graph Inference for Compound Scene Understanding

arxiv url: http://arxiv.org/abs/2410.22626v1
Date: Wed, 30 Oct 2024 01:06:12 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:42.145506
Title: Symbolic Graph Inference for Compound Scene Understanding
Title（参考訳）: 複合場面理解のための記号グラフ推論
Authors: FNU Aryan, Simon Stepputtis, Sarthak Bhagat, Joseph Campbell, Kwonjoon Lee, Hossein Nourkhiz Mahjoub, Katia Sycara,
Abstract要約: 本研究では,シーンのシーンと知識グラフに原因を負って空間情報をキャプチャし,共同グラフ検索において一般的なドメイン知識を活用できる新しいアプローチを提案する。 ADE20Kデータセット上で本手法の有効性を実証し,現在のシーン理解手法と比較する。
参考スコア（独自算出の注目度）: 7.9324385581860914
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Scene understanding is a fundamental capability needed in many domains, ranging from question-answering to robotics. Unlike recent end-to-end approaches that must explicitly learn varying compositions of the same scene, our method reasons over their constituent objects and analyzes their arrangement to infer a scene's meaning. We propose a novel approach that reasons over a scene's scene- and knowledge-graph, capturing spatial information while being able to utilize general domain knowledge in a joint graph search. Empirically, we demonstrate the feasibility of our method on the ADE20K dataset and compare it to current scene understanding approaches.
Abstract（参考訳）: シーン理解は、質問応答からロボット工学まで、多くの領域で必要とされる基本的な能力である。同じシーンの様々な構成を明示的に学習しなければならない最近のエンドツーエンドアプローチとは異なり、我々の手法は、構成対象を優先し、シーンの意味を推測するための配置を解析する。本研究では,シーンのシーンと知識グラフに原因を負って空間情報をキャプチャし,共同グラフ検索において一般的なドメイン知識を活用できる新しいアプローチを提案する。実験により,ADE20Kデータセット上で本手法の有効性を実証し,現状のシーン理解手法と比較した。

関連論文リスト

Explainable Scene Understanding with Qualitative Representations and Graph Neural Networks [15.836913530330786]
本稿では,自動走行におけるシーン理解のためのグラフニューラルネットワーク(GNN)と定性的説明可能なグラフ(QXG)の統合について検討する。本稿では,トラフィックシーンの関連オブジェクトを特定するために,グラフ構造全体を処理する新しいGNNアーキテクチャを提案する。
論文参考訳（メタデータ） (2025-04-17T10:21:30Z)
Generative Visual Commonsense Answering and Explaining with Generative Scene Graph Constructing [46.701439459096235]
我々はtextittextbfG2 という新しいビジュアルコモンセンス推論手法を提案する。まず、画像パッチとLCMを使用して、位置のないシーングラフを構築し、シーングラフの情報に基づいて回答と説明を行う。また、トレーニング中に貴重なシーングラフ情報を吸収するためのシーングラフの自動フィルタリングと選択戦略を提案する。
論文参考訳（メタデータ） (2025-01-15T04:00:36Z)
On Support Relations Inference and Scene Hierarchy Graph Construction from Point Cloud in Clustered Environments [3.4535508414601344]
3Dシーンでは、リッチな空間幾何学的・トポロジ的情報はしばしばRGBベースのシーン理解アプローチによって無視される。本研究では,物体間の関係を推定する場面理解のためのボトムアップ手法を開発した。
論文参考訳（メタデータ） (2024-04-22T02:42:32Z)
VLLMs Provide Better Context for Emotion Understanding Through Common Sense Reasoning [66.23296689828152]
我々は、視覚・言語モデルの機能を活用し、文脈内感情分類を強化する。第1段階では、VLLMが対象者の明らかな感情の自然言語で記述を生成できるように促すことを提案する。第2段階では、記述を文脈情報として使用し、画像入力とともに、トランスフォーマーベースのアーキテクチャのトレーニングに使用する。
論文参考訳（メタデータ） (2024-04-10T15:09:15Z)
Learning Scene Context Without Images [2.8184014933789365]
本研究では,アテンション機構を用いてシーンコンテキストの知識を機械に教える新しい手法を提案する。提案手法の特筆すべき側面は、シーンコンテキストを教えるための画像データセットからのラベルのみに依存することである。本研究では,異なるオブジェクト間のシーンワイドな関係を自己認識機構を用いて学習する方法を示す。
論文参考訳（メタデータ） (2023-11-18T07:27:25Z)
SGEITL: Scene Graph Enhanced Image-Text Learning for Visual Commonsense Reasoning [61.57887011165744]
マルチモーダルトランスフォーマーはVisual Commonsense Reasoningのタスクにおいて大きな進歩を遂げた。視覚的なシーングラフを常識的推論に組み込むためのScene Graph Enhanced Image-Text Learningフレームワークを提案する。
論文参考訳（メタデータ） (2021-12-16T03:16:30Z)
Exploiting Scene Graphs for Human-Object Interaction Detection [81.49184987430333]
ヒューマン・オブジェクト・インタラクション(Human-Object Interaction,HOI)検出は、人間とオブジェクト間のインタラクションのローカライズと認識を目的とした、基本的な視覚的タスクである。そこで本研究では,シーングラフを用いたヒューマン・オブジェクト・インタラクション(SG2HOI)検出タスクのための新しい手法を提案する。 SG2HOIはSG情報を2つの方法で組み込む:(1)シーングラフを世界的文脈の手がかりに埋め込み、シーン固有の環境コンテキストとして機能し、(2)オブジェクトの近傍から関係を収集し、それらを対話に転送するリレーショナル・アウェア・メッセージ・パッシング・モジュールを構築する。
論文参考訳（メタデータ） (2021-08-19T09:40:50Z)
Enhancing Social Relation Inference with Concise Interaction Graph and Discriminative Scene Representation [56.25878966006678]
我々はtextbfSocial rtextbfElation (PRISE) における textbfPractical textbfInference のアプローチを提案する。人の対話的特徴と全体主義的な場面の識別的特徴を簡潔に学習する。 PRISEはPIPAデータセットにおけるドメイン分類の改善を6.8$%で達成している。
論文参考訳（メタデータ） (2021-07-30T04:20:13Z)
Neural Scene Graphs for Dynamic Scenes [57.65413768984925]
動的シーンをシーングラフに分解する最初のニューラルレンダリング手法を提案する。我々は暗黙的に符号化されたシーンと、単一の暗黙の関数でオブジェクトを記述するために共同で学習された潜在表現を組み合わせる。
論文参考訳（メタデータ） (2020-11-20T12:37:10Z)
Visual Relationship Detection using Scene Graphs: A Survey [1.3505077405741583]
シーングラフ(Scene Graph)は、シーンとその中のさまざまな関係をよりよく表現するためのテクニックである。本稿では、シーングラフ生成の様々な技術、視覚的関係を表現するための有効性、下流の様々な課題の解決にどのように使われているかについて、詳細な調査を行う。
論文参考訳（メタデータ） (2020-05-16T17:06:06Z)
Spatio-Temporal Graph for Video Captioning with Knowledge Distillation [50.034189314258356]
空間と時間におけるオブジェクトの相互作用を利用したビデオキャプションのためのグラフモデルを提案する。我々のモデルは解釈可能なリンクを構築し、明示的な視覚的グラウンドを提供することができる。オブジェクト数の変動による相関を回避するため,オブジェクト認識型知識蒸留機構を提案する。
論文参考訳（メタデータ） (2020-03-31T03:58:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。