論文の概要: Abductive Action Inference
- arxiv url: http://arxiv.org/abs/2210.13984v4
- Date: Mon, 7 Aug 2023 11:29:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-09 00:38:11.945939
- Title: Abductive Action Inference
- Title(参考訳): 帰納的行動推論
- Authors: Clement Tan, Chai Kiat Yeo, Cheston Tan, Basura Fernando
- Abstract要約: 帰納的推論は、与えられた不完全な観測の集合に対して最も可能性の高い推論を行うことを目的としている。
本稿では「帰納的行動推論」として知られる新しい研究課題を紹介する。
本研究は,行動セット予測,行動シーケンス予測,帰納的行動検証という3つの重要な帰納的推論問題を考察した。
- 参考スコア(独自算出の注目度): 17.63418030761137
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Abductive reasoning aims to make the most likely inference for a given set of
incomplete observations. In this paper, we introduce a novel research task
known as "abductive action inference" which addresses the question of which
actions were executed by a human to reach a specific state shown in a single
snapshot. The research explores three key abductive inference problems: action
set prediction, action sequence prediction, and abductive action verification.
To tackle these challenging tasks, we investigate various models, including
established ones such as Transformers, Graph Neural Networks, CLIP, BLIP, GPT3,
end-to-end trained Slow-Fast, Resnet50-3D, and ViT models. Furthermore, the
paper introduces several innovative models tailored for abductive action
inference, including a relational graph neural network, a relational bilinear
pooling model, a relational rule-based inference model, a relational GPT-3
prompt method, and a relational Transformer model. Notably, the newly proposed
object-relational bilinear graph encoder-decoder (BiGED) model emerges as the
most effective among all methods evaluated, demonstrating good proficiency in
handling the intricacies of the Action Genome dataset. The contributions of
this research offer significant progress toward comprehending the implications
of human actions and making highly plausible inferences concerning the outcomes
of these actions.
- Abstract(参考訳): 帰納的推論(abductive reasoning)は、与えられた不完全な観測集合の最も可能性の高い推論を行うことを目的としている。
本稿では,1枚のスナップショットに示される特定の状態に到達するために,人間がどの動作を実行したのかという問題に対処する,「帰納的行動推論」と呼ばれる新しい研究課題を紹介する。
本研究は,行動セット予測,行動シーケンス予測,帰納的行動検証という3つの重要な帰納的推論問題を考察した。
これらの課題に対処するために,Transformers, Graph Neural Networks, CLIP, BLIP, GPT3, エンドツーエンドトレーニングSlow-Fast, Resnet50-3D, ViTモデルなどの確立したモデルについて検討する。
さらに,リレーショナルグラフニューラルネットワーク,リレーショナル双線形プールモデル,リレーショナルルールベース推論モデル,リレーショナルGAT-3プロンプト手法,リレーショナルトランスフォーマーモデルなど,帰納的行動推論に適した革新的なモデルをいくつか紹介する。
特に、新たに提案されたオブジェクト-リレーショナルビリニアグラフエンコーダ-デコーダ(BiGED)モデルは、評価されたすべてのメソッドの中で最も効果的であり、Action Genomeデータセットの複雑な処理に優れた習熟度を示す。
この研究の貢献は、人間の行動の意味を理解する上で大きな進歩をもたらし、これらの行動の結果について非常に妥当な推測を行う。
関連論文リスト
- Human Action Anticipation: A Survey [86.415721659234]
行動予測に関する文献は、行動予測、活動予測、意図予測、目標予測など、様々なタスクにまたがる。
我々の調査は、この断片化された文献を結びつけることを目的としており、最近の技術革新とモデルトレーニングと評価のための新しい大規模データセットの開発をカバーしています。
論文 参考訳(メタデータ) (2024-10-17T21:37:40Z) - Explanatory Model Monitoring to Understand the Effects of Feature Shifts on Performance [61.06245197347139]
そこで本研究では,機能シフトによるブラックボックスモデルの振る舞いを説明する新しい手法を提案する。
本稿では,最適輸送と共有値の概念を組み合わせた提案手法について,説明的性能推定として紹介する。
論文 参考訳(メタデータ) (2024-08-24T18:28:19Z) - From Recognition to Prediction: Leveraging Sequence Reasoning for Action Anticipation [30.161471749050833]
本稿では,ARR(Accence and Reasoning, 認識・推論)と呼ばれる注意機構を利用した新しいエンドツーエンドビデオモデリングアーキテクチャを提案する。
ARRは行動予測タスクを行動認識と推論タスクに分解し、次の行動予測(NAP)によって行動間の統計的関係を効果的に学習する。
さらに、広範囲なトレーニングデータを必要とする関係モデリングの課題に対処するために、デコーダの教師なし事前学習のための革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-08-05T18:38:29Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - Hybrid Predictive Coding: Inferring, Fast and Slow [62.997667081978825]
本稿では,反復型と償却型の両方を原則的に組み合わせたハイブリッド予測符号化ネットワークを提案する。
我々は,本モデルが本質的に不確実性に敏感であり,最小計算費用を用いて正確な信念を得るためにバランスを適応的にバランスさせることを実証した。
論文 参考訳(メタデータ) (2022-04-05T12:52:45Z) - Empirical Estimates on Hand Manipulation are Recoverable: A Step Towards
Individualized and Explainable Robotic Support in Everyday Activities [80.37857025201036]
ロボットシステムの鍵となる課題は、他のエージェントの振る舞いを理解することである。
正しい推論の処理は、(衝突)因子が実験的に制御されない場合、特に困難である。
人に関する観察研究を行うために必要なツールをロボットに装備することを提案する。
論文 参考訳(メタデータ) (2022-01-27T22:15:56Z) - Overcoming the Domain Gap in Contrastive Learning of Neural Action
Representations [60.47807856873544]
神経科学の基本的な目標は、神経活動と行動の関係を理解することである。
我々は,ハエが自然に生み出す行動からなる新しいマルチモーダルデータセットを作成した。
このデータセットと新しい拡張セットは、神経科学における自己教師あり学習手法の適用を加速することを約束します。
論文 参考訳(メタデータ) (2021-11-29T15:27:51Z) - Disentangling Action Sequences: Discovering Correlated Samples [6.179793031975444]
我々は、データ自体が要因ではなく非絡み合いにおいて重要な役割を担い、非絡み合い表現は潜在変数とアクションシーケンスとを一致させることを示した。
本稿では,アクションシーケンスをステップバイステップで切り離すための新しいフレームワークFVAEを提案する。
dSprites と 3D Chairs の実験結果から, FVAE は絡み合いの安定性を向上させることが示された。
論文 参考訳(メタデータ) (2020-10-17T07:37:50Z) - Uncovering the Data-Related Limits of Human Reasoning Research: An
Analysis based on Recommender Systems [1.7478203318226309]
認知科学は、理論駆動の観点から人間のような知性をモデル化する目的を追求している。
ソロジック推論は人間の推論研究のコアドメインの1つである。
最近のモデルの性能予測の結果、改善の停滞が明らかになった。
論文 参考訳(メタデータ) (2020-03-11T10:12:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。