論文の概要: BOIL: Learning Environment Personalized Information
- arxiv url: http://arxiv.org/abs/2604.17137v1
- Date: Sat, 18 Apr 2026 20:24:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.353312
- Title: BOIL: Learning Environment Personalized Information
- Title(参考訳): BOIL:学習環境のパーソナライズド情報
- Authors: Rohan Patil, Henrik I. Christensen,
- Abstract要約: Blackbox Information Learning (BOIL)は、環境構造から貴重な洞察を抽出するためのスケーラブルなソリューションである。
本研究では,長期的水平線上での性能向上を目的とした戦略カバレッジ生成におけるBOILの有効性を実証する。
- 参考スコア(独自算出の注目度): 2.371938580286975
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Navigating complex environments poses challenges for multi-agent systems, requiring efficient extraction of insights from limited information. In this paper, we introduce the Blackbox Oracle Information Learning (BOIL) process, a scalable solution for extracting valuable insights from the environment structure. Leveraging the Pagerank algorithm and common information maximization, BOIL facilitates the extraction of information to guide long-term agent behavior applicable to problems such as coverage, patrolling, and stochastic reachability. Through experiments, we demonstrate the efficacy of BOIL in generating strategy distributions conducive to improved performance over extended time horizons, surpassing heuristic approaches in complex environments.
- Abstract(参考訳): 複雑な環境をナビゲートすることは、限られた情報から効率的な洞察の抽出を必要とするマルチエージェントシステムに課題をもたらす。
本稿では,環境構造から貴重な洞察を抽出するスケーラブルなソリューションであるBlackbox Oracle Information Learning(BOIL)プロセスを紹介する。
Pagerankアルゴリズムと共通情報の最大化を利用して、BOILは情報抽出を促進し、カバレッジ、パトロール、確率的到達性といった問題に適用可能な長期的なエージェントの動作をガイドする。
実験により,複雑な環境下でのヒューリスティックなアプローチを超越した,拡張時間地平線上での性能向上を目的とした戦略分布生成におけるBOILの有効性を実証した。
関連論文リスト
- WebSailor-V2: Bridging the Chasm to Proprietary Agents via Synthetic Data and Scalable Reinforcement Learning [73.91893534088798]
WebSailorは、この重要な機能を組み込むように設計された、完全なポストトレーニング方法論である。
我々のアプローチは、構造化サンプリングと情報難読化によって、新しい、不確実なタスクを生成することである。
WebSailorは複雑な情報検索タスクにおいて、すべてのオープンソースエージェントを著しく上回る。
論文 参考訳(メタデータ) (2025-09-16T17:57:03Z) - WebSailor: Navigating Super-human Reasoning for Web Agent [72.5231321118689]
WebSailorは、この重要な機能を組み込むように設計された、完全なポストトレーニング方法論である。
我々のアプローチは、構造化サンプリングと情報難読化によって、新しい、不確実なタスクを生成することである。
WebSailorは複雑な情報検索タスクにおいて、すべてのオープンソースエージェントを著しく上回っている。
論文 参考訳(メタデータ) (2025-07-03T12:59:07Z) - Guided Exploration for Efficient Relational Model Learning [20.853275384388805]
効率的な探索は、複雑で長期のタスクを持つ大規模環境で関係モデルを学習するために重要である。
ゴールリテラルバブリング(GLIB)は、新しいゴールの設定と計画によってランダムな探索を改善する。
バキングラージ(Baking-Large)は、多岐にわたる状態-作用空間と長距離タスクを持つ挑戦的ドメインである。
論文 参考訳(メタデータ) (2025-02-10T04:23:01Z) - WESE: Weak Exploration to Strong Exploitation for LLM Agents [95.6720931773781]
本稿では,オープンワールド対話型タスクの解法において,LLMエージェントの強化を目的としたWeak Exploration to Strong Exploitation (WESE)を提案する。
WESEは、探究と搾取のプロセスを分離し、費用対効果の弱いエージェントを用いて世界的知識の探索を行う。
次に、獲得した知識を格納し、タスク関連知識を抽出する知識グラフベースの戦略を導入する。
論文 参考訳(メタデータ) (2024-04-11T03:31:54Z) - Consciousness-Inspired Spatio-Temporal Abstractions for Better Generalization in Reinforcement Learning [83.41487567765871]
Skipperはモデルベースの強化学習フレームワークである。
これは、与えられたタスクをより小さく、より管理しやすいサブタスクに自動的に一般化する。
環境の関連部分には、スパースな意思決定と集中した抽象化を可能にする。
論文 参考訳(メタデータ) (2023-09-30T02:25:18Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with Online Learning [55.08287089554127]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - An Information-Theoretic Analysis of Nonstationary Bandit Learning [7.060755016117366]
非定常的バンディット学習問題では、意思決定者は継続的に情報を収集し、環境の潜伏状態が発展するにつれて行動選択を適応させなければならない。
我々は、最適なアクションシーケンスをプロセスとみなし、達成可能なパフォーマンスを分析するために情報理論的なアプローチをとる。
論文 参考訳(メタデータ) (2023-02-09T05:57:44Z) - Visual-Language Navigation Pretraining via Prompt-based Environmental
Self-exploration [83.96729205383501]
本稿では,言語埋め込みの高速適応を実現するために,プロンプトベースの学習を導入する。
我々のモデルは、VLNやREVERIEを含む多様な視覚言語ナビゲーションタスクに適応することができる。
論文 参考訳(メタデータ) (2022-03-08T11:01:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。