論文の概要: Calibrated Optimal Decision Making with Multiple Data Sources and
Limited Outcome
- arxiv url: http://arxiv.org/abs/2104.10554v1
- Date: Wed, 21 Apr 2021 14:24:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 14:12:14.529686
- Title: Calibrated Optimal Decision Making with Multiple Data Sources and
Limited Outcome
- Title(参考訳): 複数のデータソースと限られた出力を用いた校正最適決定法
- Authors: Hengrui Cai, Wenbin Lu, Rui Song
- Abstract要約: 我々は,複数の補助源が利用可能な関心の第一サンプルにおいて,最適な意思決定問題を考える。
本稿では,限定的な結果に対処するための新たな校正最適決定規則 (CODR) を提案する。
- 参考スコア(独自算出の注目度): 20.60767385364074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the optimal decision-making problem in a primary sample of
interest with multiple auxiliary sources available. The outcome of interest is
limited in the sense that it is only observed in the primary sample. In
reality, such multiple data sources may belong to different populations and
thus cannot be combined directly. This paper proposes a novel calibrated
optimal decision rule (CODR) to address the limited outcome, by leveraging the
shared pattern in multiple data sources. Under a mild and testable assumption
that the conditional means of intermediate outcomes in different samples are
equal given baseline covariates and the treatment information, we can show that
the calibrated mean outcome of interest under the CODR is unbiased and more
efficient than using the primary sample solely. Extensive experiments on
simulated datasets demonstrate empirical validity and improvement of the
proposed CODR, followed by a real application on the MIMIC-III as the primary
sample with auxiliary data from eICU.
- Abstract(参考訳): 複数の補助的情報源が利用可能な一次サンプルの最適意思決定問題を考察する。
興味の結果は、一次サンプルでのみ観察されるという意味で制限される。
実際、このような複数のデータソースは異なる集団に属しており、直接結合することはできない。
本稿では,複数のデータソースの共有パターンを活用することで,限られた結果に対処できる新しい最適化最適決定規則(codr)を提案する。
異なる試料中の中間結果の条件付け手段が基準共変量と治療情報とで等しく、より穏やかで検証可能な仮定の下では、codr下での関心の校正された平均結果が、一次試料のみを使用するよりも偏りなく効率的であることを示すことができる。
シミュレーションデータセットの広範囲にわたる実験は,提案したCODRの実証的妥当性と改善を示し,次いでMIMIC-IIIをeICUの補助データを用いた一次サンプルとして実例とした。
関連論文リスト
- Federated Causal Inference: Multi-Centric ATE Estimation beyond Meta-Analysis [12.896319628045967]
我々は、中央に分散したデータから治療効果を推定するフェデレート因果推論(Federated Causal Inference)について検討する。
プラグインG-Formulaから得られた平均治療効果(ATE)推定器の3つのクラスを比較した。
論文 参考訳(メタデータ) (2024-10-22T10:19:17Z) - Not All Samples Should Be Utilized Equally: Towards Understanding and Improving Dataset Distillation [57.6797306341115]
我々は,サンプル難易度の観点から,マッチングに基づくDD手法の理解に向けて最初の一歩を踏み出した。
次に、データプルーニングのニューラルネットワークスケーリング法則をDDに拡張し、これらのマッチングベースの手法を理論的に説明する。
SDC(Sampple Difficulty Correction)アプローチを導入し、より簡単なサンプルを生成して、より高いデータセット品質を実現する。
論文 参考訳(メタデータ) (2024-08-22T15:20:32Z) - Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Data thinning for convolution-closed distributions [2.299914829977005]
本稿では,観測を2つ以上の独立した部分に分割する手法であるデータ薄型化を提案する。
教師なし学習手法の結果の検証には,データの薄化が有効であることを示す。
論文 参考訳(メタデータ) (2023-01-18T02:47:41Z) - Optimal Condition Training for Target Source Separation [56.86138859538063]
単一チャネルターゲットソース分離のための最適条件学習法を提案する。
多様な意味概念によってもたらされる相補的な情報は、興味の源泉を乱して分離するのに大いに役立ちます。
論文 参考訳(メタデータ) (2022-11-11T00:04:55Z) - Rethinking Collaborative Metric Learning: Toward an Efficient
Alternative without Negative Sampling [156.7248383178991]
コラボレーティブ・メトリック・ラーニング(CML)パラダイムはレコメンデーション・システム(RS)分野に広く関心を集めている。
負のサンプリングが一般化誤差のバイアス付き推定に繋がることがわかった。
そこで我々は,SFCML (textitSampling-Free Collaborative Metric Learning) という名前のCMLに対して,負のサンプリングを伴わない効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-06-23T08:50:22Z) - Estimation of Local Average Treatment Effect by Data Combination [3.655021726150368]
治療課題の遵守が不完全である場合には、局所的平均治療効果(LATE)を推定することが重要である。
以前提案されたLATE推定法では、関連するすべての変数を1つのデータセットで共同で観測することが必要であった。
最小値の定式化を回避し,より簡易なモデル選択を可能とする重み付き最小二乗推定器を提案する。
論文 参考訳(メタデータ) (2021-09-11T03:51:48Z) - The Pitfalls of Sample Selection: A Case Study on Lung Nodule
Classification [13.376247652484274]
肺結節分類では, LIDCデータセットについて多くの研究結果が報告されており, 理論的には, 提案手法の性能を直接比較し, 個人の貢献が与える影響を評価することが期待できる。
それぞれが異なるデータ選択プロセスを採用しており,良性と悪性の症例の総数と比率が大きく異なることが判明した。
特定の選択がデータ分布に深刻な影響を与える可能性があることを示し、あるサンプル分布において優れた性能を達成できるが、別のサンプル分布では達成できない可能性があることを示す。
論文 参考訳(メタデータ) (2021-08-11T18:07:07Z) - GEAR: On Optimal Decision Making with Auxiliary Data [20.607673853640744]
現在の最適決定規則(ODR)法は、通常、治療効果、すなわち実験サンプルを評価するために、サンプルに対する関心の最初の結果を必要とする。
本論文では, 実験試料中のODRの推定を容易にするための補助試料を用いて, この課題に対処すべく考案した。
本稿では, 拡張逆確率重み値推定器を一連の決定規則に対して最大化することにより, 実験および補助サンプルベース決定規則(GEAR)を提案する。
論文 参考訳(メタデータ) (2021-04-21T14:59:25Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。