論文の概要: Actively Obtaining Environmental Feedback for Autonomous Action Evaluation Without Predefined Measurements
- arxiv url: http://arxiv.org/abs/2601.04235v1
- Date: Sun, 04 Jan 2026 09:52:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:52.80605
- Title: Actively Obtaining Environmental Feedback for Autonomous Action Evaluation Without Predefined Measurements
- Title(参考訳): 事前測定を伴わない自律行動評価のための環境フィードバックの能動的取得
- Authors: Hong Su,
- Abstract要約: AIエージェントは、事前に定義された測定に頼ることなく、環境と積極的に対話して、フィードバックを発見し、スクリーニングし、検証する。
自律的に計画し、行動を調整するためのセルフトリガ機構が導入された。
実験結果から,本提案手法は因子同定の効率と堅牢性を大幅に向上させることが示された。
- 参考スコア(独自算出の注目度): 0.11844977816228043
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Obtaining reliable feedback from the environment is a fundamental capability for intelligent agents to evaluate the correctness of their actions and to accumulate reusable knowledge. However, most existing approaches rely on predefined measurements or fixed reward signals, which limits their applicability in open-ended and dynamic environments where new actions may require previously unknown forms of feedback. To address these limitations, this paper proposes an Actively Feedback Getting model, in which an AI agent proactively interacts with the environment to discover, screen, and verify feedback without relying on predefined measurements. Rather than assuming explicit feedback definitions, the proposed method exploits action-induced environmental differences to identify target feedback that is not specified in advance, based on the observation that actions inevitably produce measurable changes in the environment. In addition, a self-triggering mechanism, driven by internal objectives such as improved accuracy, precision, and efficiency, is introduced to autonomously plan and adjust actions, thereby enabling faster and more focused feedback acquisition without external commands. Experimental results demonstrate that the proposed active approach significantly improves the efficiency and robustness of factor identification.
- Abstract(参考訳): 環境から信頼できるフィードバックを得ることは、知的エージェントが行動の正しさを評価し、再利用可能な知識を蓄積する基本的な能力である。
しかし、既存のほとんどのアプローチは事前に定義された測定や固定された報酬信号に依存しており、新しいアクションがこれまで未知の形式のフィードバックを必要とする可能性のある、オープンエンドおよび動的環境での適用性を制限する。
そこで本稿では,AIエージェントが環境と積極的に対話して,事前定義された測定に頼らずにフィードバックを発見し,スクリーニングし,検証する,アクティブフィードバックゲインモデルを提案する。
提案手法は, 明示的なフィードバック定義を仮定するのではなく, 行動が環境に必然的に測定可能な変化をもたらすという観察に基づいて, 予め特定されていない目標フィードバックを特定するために, 行動誘発環境差を利用する。
さらに、自律的に動作を計画し調整するために、精度、精度、効率などの内部目標によって駆動されるセルフトリガ機構を導入し、外部コマンドなしでより高速でより集中的なフィードバック獲得を可能にする。
実験結果から,本提案手法は因子同定の効率と堅牢性を大幅に向上させることが示された。
関連論文リスト
- ALFred: An Active Learning Framework for Real-world Semi-supervised Anomaly Detection with Adaptive Thresholds [2.1374208474242815]
ビデオ異常検出(VAD)は、ビデオ中の異常な活動を見つける上で重要な役割を果たす。
VADは、人間の行動の動的な性質、環境の変化、ドメインシフトにより、現実世界での使用が困難である。
VADに適したアクティブラーニングフレームワークを導入する。
論文 参考訳(メタデータ) (2025-08-12T16:18:54Z) - Stochastic Encodings for Active Feature Acquisition [100.47043816019888]
Active Feature Acquisitionは、インスタンスワイドでシーケンシャルな意思決定問題である。
目的は、テストインスタンスごとに独立して、現在の観測に基づいて計測する機能を動的に選択することである。
一般的なアプローチは強化学習(Reinforcement Learning)であり、トレーニングの困難を経験する。
我々は、教師付きで訓練された潜在変数モデルを導入し、潜在空間における観測不能な実現の可能性の多くにまたがる特徴を推論することで獲得する。
論文 参考訳(メタデータ) (2025-08-03T23:48:46Z) - Active Test-time Vision-Language Navigation [60.69722522420299]
ATENAは、不確実なナビゲーション結果に対するエピソードフィードバックを通じて、実用的な人間とロボットのインタラクションを可能にする、テスト時のアクティブな学習フレームワークである。
特にATENAは、成功エピソードにおける確実性を高め、失敗エピソードにおいてそれを減らすことを学び、不確実性の校正を改善している。
さらに,自信ある予測に基づいて,エージェントがナビゲーション結果を評価することができる自己学習戦略を提案する。
論文 参考訳(メタデータ) (2025-06-07T02:24:44Z) - Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z) - Know Where You're Uncertain When Planning with Multimodal Foundation Models: A Formal Framework [54.40508478482667]
認識と計画生成の不確実性を解消し、定量化し、緩和する包括的枠組みを提案する。
本稿では,知覚と意思決定の独特な性質に合わせた手法を提案する。
この不確実性分散フレームワークは, 変動率を最大40%削減し, タスク成功率をベースラインに比べて5%向上させることを示した。
論文 参考訳(メタデータ) (2024-11-03T17:32:00Z) - Uncertainty-boosted Robust Video Activity Anticipation [72.14155465769201]
ビデオアクティビティの予測は、ロボットビジョンから自動運転まで幅広い応用可能性を受け入れることで、将来何が起こるかを予測することを目的としている。
近年の進展にもかかわらず、コンテンツ進化過程やイベントラベルの動的相関として反映されたデータ不確実性問題は、何らかの形で無視されている。
本研究では,予測結果の信頼性を示す不確実な値を生成する,不確実性を考慮した頑健なビデオアクティビティ予測フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-29T12:31:38Z) - Evidential Active Recognition: Intelligent and Prudent Open-World
Embodied Perception [21.639429724987902]
アクティブな認識により、ロボットは新しい観察を探索し、望ましくない視界を回避しながらより多くの情報を得ることができる。
ほとんどの認識モジュールはクローズドワールドの仮定の下で開発されており、現在の観測における対象物体の欠如のような予期せぬ入力を処理できない。
本稿では,有効認識を逐次的エビデンス収集プロセスとして扱うことを提案する。
論文 参考訳(メタデータ) (2023-11-23T03:51:46Z) - Act-Then-Measure: Reinforcement Learning for Partially Observable
Environments with Active Measuring [4.033107207078282]
我々はマルコフ決定プロセス(MDP)について検討し、エージェントはいつどのように情報を集めるかを直接制御する。
これらのモデルでは、アクションは環境に影響を与える制御アクションと、エージェントが観察できるものに影響を与える測定アクションの2つのコンポーネントで構成される。
この仮定に従うと、ポリシー時間が短くなり、計算によって生じる性能損失の限界が証明される。
論文 参考訳(メタデータ) (2023-03-14T23:22:32Z) - Modulation of viability signals for self-regulatory control [1.370633147306388]
適応行動のドライバとしてのインストゥルメンタルバリューの役割を再考する。
強化学習タスクでは、好みの分布が報酬の概念に取って代わる。
論文 参考訳(メタデータ) (2020-07-18T01:11:51Z) - Learning "What-if" Explanations for Sequential Decision-Making [92.8311073739295]
実世界の意思決定の解釈可能なパラメータ化を実証行動に基づいて構築することが不可欠である。
そこで我々は,「何」の結果に対する嗜好の観点から,報酬関数をモデル化し,専門家による意思決定の学習的説明を提案する。
本研究は,行動の正確かつ解釈可能な記述を回復する上で,実効的逆強化学習手法であるバッチの有効性を強調した。
論文 参考訳(メタデータ) (2020-07-02T14:24:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。