論文の概要: ProbRes: Probabilistic Jump Diffusion for Open-World Egocentric Activity Recognition
- arxiv url: http://arxiv.org/abs/2504.03948v1
- Date: Fri, 04 Apr 2025 21:30:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-08 14:11:40.321740
- Title: ProbRes: Probabilistic Jump Diffusion for Open-World Egocentric Activity Recognition
- Title(参考訳): ProbRes: オープンワールドエゴセントリックな活動認識のための確率的ジャンプ拡散
- Authors: Sanjoy Kundu, Shanmukha Vellamchetti, Sathyanarayanan N. Aakur,
- Abstract要約: 本稿では,ジャンプ拡散に基づく確率的残留探索フレームワークProbResを紹介する。
複数の開度レベル(L0 - L3)にわたってProbResを体系的に評価し,検索空間の複雑さの増加に対する適応性を示した。
その結果,構造化された検索戦略の重要性が強調され,スケーラブルで効率的なオープンワールド活動認識への道が開かれた。
- 参考スコア(独自算出の注目度): 6.253919624802853
- License:
- Abstract: Open-world egocentric activity recognition poses a fundamental challenge due to its unconstrained nature, requiring models to infer unseen activities from an expansive, partially observed search space. We introduce ProbRes, a Probabilistic Residual search framework based on jump-diffusion that efficiently navigates this space by balancing prior-guided exploration with likelihood-driven exploitation. Our approach integrates structured commonsense priors to construct a semantically coherent search space, adaptively refines predictions using Vision-Language Models (VLMs) and employs a stochastic search mechanism to locate high-likelihood activity labels while minimizing exhaustive enumeration efficiently. We systematically evaluate ProbRes across multiple openness levels (L0 - L3), demonstrating its adaptability to increasing search space complexity. In addition to achieving state-of-the-art performance on benchmark datasets (GTEA Gaze, GTEA Gaze+, EPIC-Kitchens, and Charades-Ego), we establish a clear taxonomy for open-world recognition, delineating the challenges and methodological advancements necessary for egocentric activity understanding. Our results highlight the importance of structured search strategies, paving the way for scalable and efficient open-world activity recognition.
- Abstract(参考訳): オープンワールドのエゴセントリックな活動認識は、その制約のない性質のために根本的な課題を生じさせ、拡大した部分的に観察される探索空間から見えない活動を予測するモデルを必要とする。
本稿では,ジャンプ拡散に基づく確率的残留探索フレームワークProbResを紹介する。
提案手法は,意味的コヒーレントな探索空間を構築するために構造化されたコモンセンスを統合し,視覚言語モデル(VLM)を用いた予測を適応的に洗練し,確率的探索機構を用いて,全列挙を効率よく最小化しながら高次活動ラベルの探索を行う。
複数の開度レベル(L0 - L3)にわたってProbResを体系的に評価し,検索空間の複雑さの増加に対する適応性を示した。
ベンチマークデータセット(GTEA Gaze, GTEA Gaze+, EPIC-Kitchens, Charades-Ego)の最先端性能を達成することに加えて、オープンワールド認識のための明確な分類法を確立し、エゴセントリックな活動理解に必要な課題と方法論の進歩について述べる。
その結果,構造化された検索戦略の重要性が強調され,スケーラブルで効率的なオープンワールド活動認識への道が開かれた。
関連論文リスト
- Action abstractions for amortized sampling [49.384037138511246]
本稿では、政策最適化プロセスに行動抽象化(高レベルの行動)の発見を組み込むアプローチを提案する。
我々のアプローチでは、多くの高次軌道にまたがってよく使われるアクション列を反復的に抽出し、それらをアクション空間に追加する単一のアクションにチャンキングする。
論文 参考訳(メタデータ) (2024-10-19T19:22:50Z) - Posets and Bounded Probabilities for Discovering Order-inducing Features in Event Knowledge Graphs [6.96958458974878]
イベント知識グラフ(EKG)は、プロセス実行の複数の対話的なビューをキャプチャする。
未処理データからのEKG発見のオープンな問題に対処する。
統計的推測に基づくEKG探索アルゴリズムを導出する。
論文 参考訳(メタデータ) (2024-10-08T14:12:51Z) - ALGO: Object-Grounded Visual Commonsense Reasoning for Open-World Egocentric Action Recognition [6.253919624802853]
本研究では, ALGO-Action Learning with Grounded Object Recognitionを提案する。
まず,物体中心の視覚言語モデルを用いたニューロシンボリック・プロンプト手法を提案する。
第二に、事前のコモンセンス知識により、エネルギーに基づく象徴的パターン理論の枠組みを通して、プラプシブルな活動を発見する。
論文 参考訳(メタデータ) (2024-06-09T10:30:04Z) - Auto-configuring Exploration-Exploitation Tradeoff in Evolutionary Computation via Deep Reinforcement Learning [14.217528205889296]
進化計算(EC)アルゴリズムは、個人のグループを利用して最適解を協調的に探索する。
本稿では,ECサーチプロセスを通じて,調査トレードオフ(EET)を自律的に設定し,適応する深層強化学習ベースのフレームワークを提案する。
提案するフレームワークは,その単純さ,有効性,一般化性を特徴とし,多数の既存ECアルゴリズムを拡張できる可能性を秘めている。
論文 参考訳(メタデータ) (2024-04-12T04:48:32Z) - Imagine, Initialize, and Explore: An Effective Exploration Method in
Multi-Agent Reinforcement Learning [27.81925751697255]
複雑なシナリオにおける効率的なマルチエージェント探索法を提案する。
我々は、状態、観察、プロンプト、行動、報酬が自己回帰的に予測されるシーケンスモデリング問題として想像を定式化する。
臨界状態のエージェントを初期化することにより、IIEは潜在的に重要な未探索領域を発見する可能性を大幅に高める。
論文 参考訳(メタデータ) (2024-02-28T01:45:01Z) - On the Importance of Exploration for Generalization in Reinforcement
Learning [89.63074327328765]
本研究では,不確実性の高い状態の探索を支援する方法であるEDE: Exploration via Distributional Ensembleを提案する。
当社のアルゴリズムは,ProcgenとCrafterの両面で最先端を実現するための,最初のバリューベースアプローチである。
論文 参考訳(メタデータ) (2023-06-08T18:07:02Z) - k-Means Maximum Entropy Exploration [55.81894038654918]
余分な報酬を伴う連続空間での探索は、強化学習におけるオープンな問題である。
本研究では, 状態訪問分布のエントロピーに対する近似値の低界化に基づく人工好奇性アルゴリズムを提案する。
提案手法は,高次元連続空間における探索のためのベンチマークにおいて,計算効率と競合性の両方を示す。
論文 参考訳(メタデータ) (2022-05-31T09:05:58Z) - Provable Hierarchy-Based Meta-Reinforcement Learning [50.17896588738377]
HRLをメタRL設定で解析し、下流タスクで使用するメタトレーニング中に学習者が潜在階層構造を学習する。
我々は、この自然階層の標本効率の回復を保証し、抽出可能な楽観主義に基づくアルゴリズムとともに「多様性条件」を提供する。
我々の境界は、時間的・状態的・行動的抽象化などのHRL文献に共通する概念を取り入れており、我々の設定と分析が実際にHRLの重要な特徴を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-10-18T17:56:02Z) - Objective discovery of dominant dynamical processes with intelligible
machine learning [0.0]
本稿では,動的状態の同定を最適化問題として定式化する形式的定義を提案する。
本稿では,事前知識やアドホックな定義の必要性を排除した教師なし学習フレームワークを提案する。
我々の手法は、動的システム内でセレンディピティーな発見を可能にする、偏りのないデータ探索への一歩である。
論文 参考訳(メタデータ) (2021-06-21T20:57:23Z) - FIVES: Feature Interaction Via Edge Search for Large-Scale Tabular Data [106.76845921324704]
本稿では,FIVES (Feature Interaction Via Edge Search) という新しい手法を提案する。
FIVESは、定義された特徴グラフ上のエッジを探すために、インタラクティブな特徴生成のタスクを定式化する。
本稿では,対話的特徴の探索を動機づける理論的証拠を提示する。
論文 参考訳(メタデータ) (2020-07-29T03:33:18Z) - AutoOD: Automated Outlier Detection via Curiosity-guided Search and
Self-imitation Learning [72.99415402575886]
外乱検出は重要なデータマイニングの課題であり、多くの実用的応用がある。
本稿では,最適なニューラルネットワークモデルを探すことを目的とした自動外乱検出フレームワークであるAutoODを提案する。
さまざまな実世界のベンチマークデータセットに対する実験結果から、AutoODが特定したディープモデルが最高のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2020-06-19T18:57:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。