論文の概要: Abductive Action Inference
- arxiv url: http://arxiv.org/abs/2210.13984v4
- Date: Mon, 7 Aug 2023 11:29:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-09 00:38:11.945939
- Title: Abductive Action Inference
- Title(参考訳): 帰納的行動推論
- Authors: Clement Tan, Chai Kiat Yeo, Cheston Tan, Basura Fernando
- Abstract要約: 帰納的推論は、与えられた不完全な観測の集合に対して最も可能性の高い推論を行うことを目的としている。
本稿では「帰納的行動推論」として知られる新しい研究課題を紹介する。
本研究は,行動セット予測,行動シーケンス予測,帰納的行動検証という3つの重要な帰納的推論問題を考察した。
- 参考スコア(独自算出の注目度): 17.63418030761137
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Abductive reasoning aims to make the most likely inference for a given set of
incomplete observations. In this paper, we introduce a novel research task
known as "abductive action inference" which addresses the question of which
actions were executed by a human to reach a specific state shown in a single
snapshot. The research explores three key abductive inference problems: action
set prediction, action sequence prediction, and abductive action verification.
To tackle these challenging tasks, we investigate various models, including
established ones such as Transformers, Graph Neural Networks, CLIP, BLIP, GPT3,
end-to-end trained Slow-Fast, Resnet50-3D, and ViT models. Furthermore, the
paper introduces several innovative models tailored for abductive action
inference, including a relational graph neural network, a relational bilinear
pooling model, a relational rule-based inference model, a relational GPT-3
prompt method, and a relational Transformer model. Notably, the newly proposed
object-relational bilinear graph encoder-decoder (BiGED) model emerges as the
most effective among all methods evaluated, demonstrating good proficiency in
handling the intricacies of the Action Genome dataset. The contributions of
this research offer significant progress toward comprehending the implications
of human actions and making highly plausible inferences concerning the outcomes
of these actions.
- Abstract(参考訳): 帰納的推論(abductive reasoning)は、与えられた不完全な観測集合の最も可能性の高い推論を行うことを目的としている。
本稿では,1枚のスナップショットに示される特定の状態に到達するために,人間がどの動作を実行したのかという問題に対処する,「帰納的行動推論」と呼ばれる新しい研究課題を紹介する。
本研究は,行動セット予測,行動シーケンス予測,帰納的行動検証という3つの重要な帰納的推論問題を考察した。
これらの課題に対処するために,Transformers, Graph Neural Networks, CLIP, BLIP, GPT3, エンドツーエンドトレーニングSlow-Fast, Resnet50-3D, ViTモデルなどの確立したモデルについて検討する。
さらに,リレーショナルグラフニューラルネットワーク,リレーショナル双線形プールモデル,リレーショナルルールベース推論モデル,リレーショナルGAT-3プロンプト手法,リレーショナルトランスフォーマーモデルなど,帰納的行動推論に適した革新的なモデルをいくつか紹介する。
特に、新たに提案されたオブジェクト-リレーショナルビリニアグラフエンコーダ-デコーダ(BiGED)モデルは、評価されたすべてのメソッドの中で最も効果的であり、Action Genomeデータセットの複雑な処理に優れた習熟度を示す。
この研究の貢献は、人間の行動の意味を理解する上で大きな進歩をもたらし、これらの行動の結果について非常に妥当な推測を行う。
関連論文リスト
- From Recognition to Prediction: Leveraging Sequence Reasoning for Action Anticipation [30.161471749050833]
本稿では,ARR(Accence and Reasoning, 認識・推論)と呼ばれる注意機構を利用した新しいエンドツーエンドビデオモデリングアーキテクチャを提案する。
ARRは行動予測タスクを行動認識と推論タスクに分解し、次の行動予測(NAP)によって行動間の統計的関係を効果的に学習する。
さらに、広範囲なトレーニングデータを必要とする関係モデリングの課題に対処するために、デコーダの教師なし事前学習のための革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-08-05T18:38:29Z) - Graph Stochastic Neural Process for Inductive Few-shot Knowledge Graph Completion [63.68647582680998]
I-FKGC(inductive few-shot knowledge graph completion)と呼ばれる課題に焦点をあてる。
帰納的推論(inductive reasoning)の概念に着想を得て,I-FKGCを帰納的推論問題とした。
本稿では,仮説の連成分布をモデル化したニューラルプロセスに基づく仮説抽出器を提案する。
第2のモジュールでは、この仮説に基づいて、クエリセットのトリプルが抽出された仮説と一致するかどうかをテストするグラフアテンションベースの予測器を提案する。
論文 参考訳(メタデータ) (2024-08-03T13:37:40Z) - Co-guiding for Multi-intent Spoken Language Understanding [53.30511968323911]
本稿では,2つのタスク間の相互指導を実現するための2段階のフレームワークを実装した,コガイドネットと呼ばれる新しいモデルを提案する。
第1段階では,単一タスクによる教師付きコントラスト学習を提案し,第2段階ではコガイドによる教師付きコントラスト学習を提案する。
マルチインテリジェントSLU実験の結果,我々のモデルは既存のモデルよりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-22T08:06:22Z) - Interpretable Imitation Learning with Dynamic Causal Relations [65.18456572421702]
得られた知識を有向非巡回因果グラフの形で公開することを提案する。
また、この因果発見プロセスを状態依存的に設計し、潜在因果グラフのダイナミクスをモデル化する。
提案するフレームワークは,動的因果探索モジュール,因果符号化モジュール,予測モジュールの3つの部分から構成され,エンドツーエンドで訓練される。
論文 参考訳(メタデータ) (2023-09-30T20:59:42Z) - Deep Graph Reprogramming [112.34663053130073]
グラフニューラルネットワーク(GNN)に適したタスク再利用モデル「ディープグラフ再プログラミング」
本稿では,モデル再プログラミングパラダイムと並行して,革新的なデータ再プログラミングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-04-28T02:04:29Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - Adjacency List Oriented Relational Fact Extraction via Adaptive
Multi-task Learning [24.77542721790553]
本稿では,すべての事実抽出モデルをグラフ指向分析の観点から整理可能であることを示す。
この分析枠組みに基づいて,効率的なモデルaDjacency lIst oRientational faCT(Direct)を提案する。
論文 参考訳(メタデータ) (2021-06-03T02:57:08Z) - Disentangling Action Sequences: Discovering Correlated Samples [6.179793031975444]
我々は、データ自体が要因ではなく非絡み合いにおいて重要な役割を担い、非絡み合い表現は潜在変数とアクションシーケンスとを一致させることを示した。
本稿では,アクションシーケンスをステップバイステップで切り離すための新しいフレームワークFVAEを提案する。
dSprites と 3D Chairs の実験結果から, FVAE は絡み合いの安定性を向上させることが示された。
論文 参考訳(メタデータ) (2020-10-17T07:37:50Z) - GAMI-Net: An Explainable Neural Network based on Generalized Additive
Models with Structured Interactions [5.8010446129208155]
構造的相互作用を持つ一般化付加モデル(GAMI-Net)に基づく説明可能なニューラルネットワークを提案し,予測精度とモデル解釈可能性とのバランスを良好に追求する。
GAMI-Net(英語版)は、複数の添加物を持つ非絡み合ったフィードフォワードネットワークである。
合成関数と実世界のデータセットの双方に関する数値実験により,提案モデルが優れた解釈性を有することが示された。
論文 参考訳(メタデータ) (2020-03-16T11:51:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。