論文の概要: In-Context Learning for Pure Exploration in Continuous Spaces
- arxiv url: http://arxiv.org/abs/2602.17976v1
- Date: Fri, 20 Feb 2026 04:20:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 18:01:41.224721
- Title: In-Context Learning for Pure Exploration in Continuous Spaces
- Title(参考訳): 連続空間における純粋探索のためのインコンテキスト学習
- Authors: Alessio Russo, Yin-Ching Lee, Ryan Welch, Aldo Pacchiano,
- Abstract要約: 純粋探索とも呼ばれる能動的シーケンシャルテストでは、学習者は情報を適応的に取得する目的を負う。
C-ICPE-TSは、観測履歴を次の連続的なクエリアクションにマッピングするために、ディープニューラルネットワークポリシーをメタトレーニングするアルゴリズムである。
推論時には、C-ICPE-TSは未確認タスクの証拠を積極的に収集し、パラメータ更新や明示的な手作り情報モデルなしで真の仮説を推測する。
- 参考スコア(独自算出の注目度): 26.001092687873125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In active sequential testing, also termed pure exploration, a learner is tasked with the goal to adaptively acquire information so as to identify an unknown ground-truth hypothesis with as few queries as possible. This problem, originally studied by Chernoff in 1959, has several applications: classical formulations include Best-Arm Identification (BAI) in bandits, where actions index hypotheses, and generalized search problems, where strategically chosen queries reveal partial information about a hidden label. In many modern settings, however, the hypothesis space is continuous and naturally coincides with the query/action space: for example, identifying an optimal action in a continuous-armed bandit, localizing an $ε$-ball contained in a target region, or estimating the minimizer of an unknown function from a sequence of observations. In this work, we study pure exploration in such continuous spaces and introduce Continuous In-Context Pure Exploration for this regime. We introduce C-ICPE-TS, an algorithm that meta-trains deep neural policies to map observation histories to (i) the next continuous query action and (ii) a predicted hypothesis, thereby learning transferable sequential testing strategies directly from data. At inference time, C-ICPE-TS actively gathers evidence on previously unseen tasks and infers the true hypothesis without parameter updates or explicit hand-crafted information models. We validate C-ICPE-TS across a range of benchmarks, spanning continuous best-arm identification, region localization, and function minimizer identification.
- Abstract(参考訳): 純粋探索とも呼ばれる能動的シーケンシャルテストでは、学習者は情報を適応的に取得し、未知の基底真実仮説をできるだけ少ないクエリで特定する。
古典的な定式化には、BAI(Best-Arm Identification)とBAI(Best-Arm Identification)がある。
しかし、現代の多くの設定では、仮説空間は連続であり、クエリ/アクション空間と自然に一致する:例えば、連続武装のバンディットにおいて最適なアクションを識別したり、ターゲット領域に含まれる$ε$-ボールをローカライズしたり、未知の関数の最小化を観測列から推定する。
本研究では,このような連続空間における純粋探索について検討し,この状態に対する連続的In-Context Pure Explorationを導入する。
C-ICPE-TS(C-ICPE-TS)は、深い神経政策をメタトレーニングし、観測履歴をマッピングするアルゴリズムである。
i) 次の連続的なクエリアクションと
二 予測仮説により、データから直接、転送可能なシーケンシャルなテスト戦略を学習する。
推論時には、C-ICPE-TSは未確認タスクの証拠を積極的に収集し、パラメータ更新や明示的な手作り情報モデルなしで真の仮説を推測する。
C-ICPE-TSは,連続的ベストアーム識別,領域ローカライゼーション,関数最小化など,様々なベンチマークで検証する。
関連論文リスト
- In-Context Learning for Pure Exploration [28.404325855738502]
本研究は, 純粋探索(Pure Exploring)としても知られる, 能動的逐次仮説検定の課題について考察する。
In-Context Pure Exploration (ICPE)を導入し、トランスフォーマーをメタトレーニングして、観測履歴をクエリアクションと予測仮説にマッピングする。
ICPEは、新しいタスクの証拠を積極的に収集し、パラメータの更新なしに真の仮説を推測する。
論文 参考訳(メタデータ) (2025-06-02T17:04:50Z) - A Survey on Deep Learning-based Spatio-temporal Action Detection [8.456482280676884]
STADは、ビデオに存在するアクションを分類し、空間と時間でローカライズすることを目的としている。
それは、爆発的に出現する現実世界の応用のために、コンピュータビジョンにおける特に活発な研究領域となっている。
本稿では,STADの最先端の深層学習手法について概観する。
論文 参考訳(メタデータ) (2023-08-03T08:48:14Z) - Sequential Attention Source Identification Based on Feature
Representation [88.05527934953311]
本稿では,テンポラルシーケンスに基づくグラフ注意源同定(TGASI)と呼ばれるシーケンス・ツー・シーケンス・ベースのローカライズ・フレームワークを提案する。
なお、このインダクティブラーニングのアイデアは、TGASIが他の事前の知識を知らずに新しいシナリオのソースを検出できることを保証する。
論文 参考訳(メタデータ) (2023-06-28T03:00:28Z) - How to Construct Perfect and Worse-than-Coin-Flip Spoofing
Countermeasures: A Word of Warning on Shortcut Learning [20.486639064376014]
ショートカット学習(英: Shortcut learning、またはClever Hans effect)とは、学習エージェントがデータに存在する急激な相関を学習し、バイアスのあるモデルをもたらす状況を指す。
本研究では, 深層学習に基づくスプーフィング対策(CM)において, ある発話がスプーフィングされているか否かを予測するショートカットの発見に焦点をあてる。
論文 参考訳(メタデータ) (2023-05-31T15:58:37Z) - Large-scale Pre-trained Models are Surprisingly Strong in Incremental Novel Class Discovery [76.63807209414789]
我々は,クラスiNCDにおける現状問題に挑戦し,クラス発見を継続的に,真に教師なしで行う学習パラダイムを提案する。
凍結したPTMバックボーンと学習可能な線形分類器から構成される単純なベースラインを提案する。
論文 参考訳(メタデータ) (2023-03-28T13:47:16Z) - STEERING: Stein Information Directed Exploration for Model-Based
Reinforcement Learning [111.75423966239092]
遷移モデルの現在の推定値と未知の最適値との間の積分確率距離(IPM)の観点から探索インセンティブを提案する。
KSDに基づく新しいアルゴリズムを開発した。 textbfSTEin information dirtextbfEcted Explor for model-based textbfReinforcement Learntextbfing。
論文 参考訳(メタデータ) (2023-01-28T00:49:28Z) - Topological Data Analysis (TDA) Techniques Enhance Hand Pose
Classification from ECoG Neural Recordings [0.0]
時系列データのトポロジ的記述を導入し、手ポーズ分類を強化する。
4ラベルの分類問題に対して,可利用データに制限のあるAC精度で頑健な結果が得られた。
論文 参考訳(メタデータ) (2021-10-09T22:04:43Z) - Generalized Chernoff Sampling for Active Testing, Active Regression and
Structured Bandit Algorithms [16.19565714525819]
本稿では,組織的バンディット設定におけるアクティブラーニングとベストアーム識別について検討する。
チャーノフの元々のアクティブテスト手順に対する新しいサンプル境界複雑性を得る。
論文 参考訳(メタデータ) (2020-12-15T03:44:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。