論文の概要: Online Data Collection for Efficient Semiparametric Inference
- arxiv url: http://arxiv.org/abs/2411.03195v1
- Date: Tue, 05 Nov 2024 15:40:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-06 15:01:22.336688
- Title: Online Data Collection for Efficient Semiparametric Inference
- Title(参考訳): 効率的な半パラメトリック推論のためのオンラインデータ収集
- Authors: Shantanu Gupta, Zachary C. Lipton, David Childers,
- Abstract要約: 提案する2つのオンラインデータ収集ポリシーであるExplore-then-CommitとExplore-then-Greedyは、パラメータ推定を所定の時間で使用して、将来のステップで残りの予算を最適に割り当てる。
両政策がオラクル政策に対してゼロ後悔(MSEによる評価)を達成することを実証する。
- 参考スコア(独自算出の注目度): 41.49486724979923
- License:
- Abstract: While many works have studied statistical data fusion, they typically assume that the various datasets are given in advance. However, in practice, estimation requires difficult data collection decisions like determining the available data sources, their costs, and how many samples to collect from each source. Moreover, this process is often sequential because the data collected at a given time can improve collection decisions in the future. In our setup, given access to multiple data sources and budget constraints, the agent must sequentially decide which data source to query to efficiently estimate a target parameter. We formalize this task using Online Moment Selection, a semiparametric framework that applies to any parameter identified by a set of moment conditions. Interestingly, the optimal budget allocation depends on the (unknown) true parameters. We present two online data collection policies, Explore-then-Commit and Explore-then-Greedy, that use the parameter estimates at a given time to optimally allocate the remaining budget in the future steps. We prove that both policies achieve zero regret (assessed by asymptotic MSE) relative to an oracle policy. We empirically validate our methods on both synthetic and real-world causal effect estimation tasks, demonstrating that the online data collection policies outperform their fixed counterparts.
- Abstract(参考訳): 多くの研究が統計データ融合を研究しているが、それらは通常、様々なデータセットが事前に与えられていると仮定する。
しかし、実際には、利用可能なデータソース、そのコスト、各ソースから収集するサンプルの数など、データ収集の決定が難しい。
さらに、このプロセスは、ある時点に収集されたデータは、将来コレクションの判断を改善することができるため、シーケンシャルであることが多い。
我々の設定では、複数のデータソースへのアクセスと予算制約が与えられた場合、エージェントは、ターゲットパラメータを効率的に推定するために、どのデータソースをクエリするかをシーケンシャルに決めなければなりません。
モーメント選択(Online Moment Selection)は、モーメント条件の集合によって識別される任意のパラメータに適用される半パラメトリックフレームワークである。
興味深いことに、最適な予算配分は(未知の)真のパラメータに依存する。
提案する2つのオンラインデータ収集ポリシであるExplore-then-CommitとExplore-then-Greedyは,パラメータ推定を所定の時間で使用して,今後のステップで残予算を最適に割り当てる。
両政策がオラクル政策に対してゼロ後悔(漸近的MSEによる評価)を達成することを実証する。
提案手法を実世界の因果効果推定タスクと実世界の因果効果推定タスクの両方で実証的に検証し,オンラインデータ収集ポリシーが固定された手法よりも優れていることを示す。
関連論文リスト
- Compute-Constrained Data Selection [77.06528009072967]
コスト対応ユーティリティ関数を用いてデータ選択の問題を定式化し、その問題をトレーニングのための初期選択コストのトレーディングとしてモデル化する。
複数のタスク、微調整トークンのスケーリングによる計算予算、モデルサイズ、データ選択計算など、包括的な実験を網羅的に実施しています。
論文 参考訳(メタデータ) (2024-10-21T17:11:21Z) - How to Train Data-Efficient LLMs [56.41105687693619]
事前学習言語モデル(LLM)に対するデータ効率のアプローチについて検討する。
Ask-LLMと密度サンプリングがそれぞれのカテゴリで最適であることがわかった。
何百もの評価タスクと事前学習作業を含む19個のサンプルを比較したところ,Ask-LLMと密度がそれぞれのカテゴリで最適な方法であることが判明した。
論文 参考訳(メタデータ) (2024-02-15T02:27:57Z) - Experiment Planning with Function Approximation [49.50254688629728]
本研究では,文脈的帯域幅問題における関数近似を用いた実験計画の問題点について検討する。
本稿では,関数近似に適合する2つの実験計画戦略を提案する。
そこで, 均一サンプリング器は, 動作数が少ない設定において, 競合最適性を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-10T14:40:23Z) - Reinforced Approximate Exploratory Data Analysis [7.974685452145769]
まず,対話型データ探索環境におけるサンプリングの影響について検討し,近似誤差を導入する。
本稿では, サンプル選択を最適化し, 分析および洞察フローの持続性を維持するための, 深層強化学習(DRL)に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-12T20:20:22Z) - Optimizing Data Collection for Machine Learning [87.37252958806856]
現代のディープラーニングシステムは、素晴らしいパフォーマンスを達成するために巨大なデータセットを必要とします。
過度に収集したデータは不要な現在のコストを発生させる一方、過度に収集したデータは将来のコストと遅延を引き起こす可能性がある。
本稿では,データ収集を形式的最適データ収集問題としてモデル化するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2022-10-03T21:19:05Z) - Sales Channel Optimization via Simulations Based on Observational Data
with Delayed Rewards: A Case Study at LinkedIn [4.6405223560607105]
ランダム化実験から得られたデータに関するトレーニングモデルは、良い決定を下すのに最適である。
しかし、ランダム化実験は、しばしば時間を要する、コストがかかる、リスクが高い、実現不可能、または非倫理的である。
問題の特徴を扱える離散時間シミュレーションを構築し、異なるポリシーを評価するために使用します。
シミュレーションの結果,シンプルなMABポリシであるLinUCBは,他のポリシよりも一貫して優れていたことが示唆された。
論文 参考訳(メタデータ) (2022-09-16T07:08:37Z) - Active Sampling of Multiple Sources for Sequential Estimation [92.37271004438406]
本研究の目的は,パラメータを逐次推定するアクティブサンプリングアルゴリズムを設計し,信頼性の高い推定値を生成することである。
本稿では, エンフ条件推定コスト関数を導入し, 最近, トラクタブル解析を施した逐次推定手法を提案する。
論文 参考訳(メタデータ) (2022-08-10T15:58:05Z) - Efficient Online Estimation of Causal Effects by Deciding What to
Observe [26.222870185443913]
確率モデル(例えば因果効果)の任意の機能(例えば、因果効果)を可能な限り効率的に推定し、どのデータソースを問合せするかを各タイミングで決定することを目的としている。
モーメント条件として構造的仮定を符号化するフレームワークであるオンラインモーメント選択(OMS)を提案する。
我々のアルゴリズムは、現在のモーメントの推定値から示唆される最良の行動を選択することで探索のバランスをとる。
論文 参考訳(メタデータ) (2021-08-20T17:00:56Z) - Adaptive Sequential Design for a Single Time-Series [2.578242050187029]
期待される結果を最適化するために、設計の制御されたコンポーネントの最適かつ未知の選択を学習する。
我々は、時間とともに収集されたデータに基づいて、将来のタイムポイント実験にランダム化機構を適用する。
論文 参考訳(メタデータ) (2021-01-29T22:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。