論文の概要: R-HTN: Rebellious Online HTN Planning for Safety and Game AI
- arxiv url: http://arxiv.org/abs/2602.00951v1
- Date: Sun, 01 Feb 2026 01:05:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.48466
- Title: R-HTN: Rebellious Online HTN Planning for Safety and Game AI
- Title(参考訳): R-HTN: 安全とゲームAIのための反抗的なオンラインHTN計画
- Authors: Hector Munoz-Avila, David W. Aha, Paola Rizzo,
- Abstract要約: 本稿では,オンライン階層型タスクネットワーク (HTN) エージェントについて紹介する。
本研究は,HTN計画,オンライン計画,ディレクティブDという3つの概念を組み合わせる。
本稿では、オンラインHTN計画のための汎用アルゴリズムであるR-HTNについてディレクティブDで述べる。
- 参考スコア(独自算出の注目度): 0.1274452325287335
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce online Hierarchical Task Network (HTN) agents whose behaviors are governed by a set of built-in directives \D. Like other agents that are capable of rebellion (i.e., {\it intelligent disobedience}), our agents will, under some conditions, not perform a user-assigned task and instead act in ways that do not meet a user's expectations. Our work combines three concepts: HTN planning, online planning, and the directives \D, which must be considered when performing user-assigned tasks. We investigate two agent variants: (1) a Nonadaptive agent that stops execution if it finds itself in violation of \D~ and (2) an Adaptive agent that, in the same situation, instead modifies its HTN plan to search for alternative ways to achieve its given task. We present R-HTN (for: Rebellious-HTN), a general algorithm for online HTN planning under directives \D. We evaluate R-HTN in two task domains where the agent must not violate some directives for safety reasons or as dictated by their personality traits. We found that R-HTN agents never violate directives, and aim to achieve the user-given goals if feasible though not necessarily as the user expected.
- Abstract(参考訳): 本稿では,オンライン階層型タスクネットワーク(HTN)エージェントについて紹介する。
反乱を起こすことができる他のエージェント(すなわち知的不服従)と同様に、我々のエージェントは、ある条件下では、ユーザ指定のタスクを実行せず、ユーザの期待を満たさない方法で行動する。
HTNプランニング,オンラインプランニング,ディレクティブ \D という3つの概念を組み合わせて,ユーザ指定タスクの実行時に考慮する必要がある。
そこで本研究では,(1) 実行を停止する非適応エージェント,(2) 同じ状況下でHTN計画を変更し,与えられたタスクを達成するための代替方法を探索する適応エージェントについて検討する。
R-HTN(Rebellious-HTN:Rebellious-HTN)は、オンラインHTN計画のための汎用アルゴリズムである。
R-HTNを2つのタスク領域で評価し、エージェントが安全上の理由から指示に違反したり、その性格特性によって判断されたりしないようにした。
我々は、R-HTNエージェントが指示に反することはないことを発見し、ユーザが期待しているようにはいかないが、実現可能であれば、ユーザ目標を達成することを目標とした。
関連論文リスト
- Unintended Misalignment from Agentic Fine-Tuning: Risks and Mitigation [19.30407680164485]
エージェントタスクを実行するための微調整された大規模言語モデル(LLM)は、有害なタスクを実行する可能性が高くなる可能性がある。
プリフィックスインジェクションガード(PING)は、エージェント応答に自動的に生成された自然言語プレフィックスをプリペンドする。
Pingは、Webナビゲーションとコード生成タスクの両方において、さまざまなベンチマークで既存のプロンプトアプローチを一貫して上回っている。
論文 参考訳(メタデータ) (2025-08-19T17:53:35Z) - AgentDAM: Privacy Leakage Evaluation for Autonomous Web Agents [66.29263282311258]
我々は、AIウェブナビゲーションエージェントがデータ最小化のプライバシー原則に従うかどうかを測定する新しいベンチマークAgentDAMを紹介する。
我々のベンチマークは、現実的なWebインタラクションシナリオをエンドツーエンドでシミュレートし、既存のWebナビゲーションエージェントに適応する。
論文 参考訳(メタデータ) (2025-03-12T19:30:31Z) - Firewalls to Secure Dynamic LLM Agentic Networks [36.6600856429565]
LLMエージェントは、相互依存的な目標を持つ長期計画に関わるタスクについて、他のエンティティ表現エージェントとユーザに代わって通信する可能性が高い。
エージェント通信に必要な特性として,プロアクティビティ,適応性,プライバシ(タスク必要情報のみを共有する),セキュリティを挙げる。
本稿では,ネットワークセキュリティの原則にインスパイアされた実用的な設計とプロトコルを提案する。
論文 参考訳(メタデータ) (2025-02-03T21:00:14Z) - SmartAgent: Chain-of-User-Thought for Embodied Personalized Agent in Cyber World [50.937342998351426]
COUT(Chain-of-User-Thought)は、新しい推論パラダイムである。
我々は、サイバー環境を認識し、パーソナライズされた要求を推論するエージェントフレームワークであるSmartAgentを紹介する。
我々の研究は、まずCOUTプロセスを定式化し、パーソナライズされたエージェント学習を具体化するための予備的な試みとして役立ちます。
論文 参考訳(メタデータ) (2024-12-10T12:40:35Z) - Proactive Agents for Multi-Turn Text-to-Image Generation Under Uncertainty [22.793479783625454]
そこで本研究では,不確かさを解消するためのインタフェースを備えたプロアクティブなT2Iエージェントのプロトタイプを提案する。
このようなエージェントのシンプルなプロトタイプを構築し、スケーラブルで自動化された新しい評価手法を提案する。
3つの画像テキストデータセットを用いた実験は、提案されたT2Iエージェントが情報的質問をしたり、重要な情報を引き出す能力を示している。
論文 参考訳(メタデータ) (2024-12-09T18:56:32Z) - Improving Target-driven Visual Navigation with Attention on 3D Spatial
Relationships [52.72020203771489]
3次元屋内シーンにおける深部強化学習(DRL)を用いた目標駆動型視覚ナビゲーションについて検討した。
提案手法は視覚特徴と3次元空間表現を組み合わせてナビゲーションポリシーを学習する。
AI2-THORで実施した我々の実験は、SRとSPLの指標において、モデルがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2020-04-29T08:46:38Z) - Meta Reinforcement Learning with Autonomous Inference of Subtask
Dependencies [57.27944046925876]
本稿では,タスクがサブタスクグラフによって特徴づけられるような,新しい数発のRL問題を提案し,対処する。
メタ政治を直接学習する代わりに、Subtask Graph Inferenceを使ったメタラーナーを開発した。
実験の結果,2つのグリッドワールド領域とStarCraft II環境において,提案手法が潜在タスクパラメータを正確に推定できることが確認された。
論文 参考訳(メタデータ) (2020-01-01T17:34:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。