論文の概要: Calibrated Optimal Decision Making with Multiple Data Sources and
Limited Outcome
- arxiv url: http://arxiv.org/abs/2104.10554v1
- Date: Wed, 21 Apr 2021 14:24:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 14:12:14.529686
- Title: Calibrated Optimal Decision Making with Multiple Data Sources and
Limited Outcome
- Title(参考訳): 複数のデータソースと限られた出力を用いた校正最適決定法
- Authors: Hengrui Cai, Wenbin Lu, Rui Song
- Abstract要約: 我々は,複数の補助源が利用可能な関心の第一サンプルにおいて,最適な意思決定問題を考える。
本稿では,限定的な結果に対処するための新たな校正最適決定規則 (CODR) を提案する。
- 参考スコア(独自算出の注目度): 20.60767385364074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the optimal decision-making problem in a primary sample of
interest with multiple auxiliary sources available. The outcome of interest is
limited in the sense that it is only observed in the primary sample. In
reality, such multiple data sources may belong to different populations and
thus cannot be combined directly. This paper proposes a novel calibrated
optimal decision rule (CODR) to address the limited outcome, by leveraging the
shared pattern in multiple data sources. Under a mild and testable assumption
that the conditional means of intermediate outcomes in different samples are
equal given baseline covariates and the treatment information, we can show that
the calibrated mean outcome of interest under the CODR is unbiased and more
efficient than using the primary sample solely. Extensive experiments on
simulated datasets demonstrate empirical validity and improvement of the
proposed CODR, followed by a real application on the MIMIC-III as the primary
sample with auxiliary data from eICU.
- Abstract(参考訳): 複数の補助的情報源が利用可能な一次サンプルの最適意思決定問題を考察する。
興味の結果は、一次サンプルでのみ観察されるという意味で制限される。
実際、このような複数のデータソースは異なる集団に属しており、直接結合することはできない。
本稿では,複数のデータソースの共有パターンを活用することで,限られた結果に対処できる新しい最適化最適決定規則(codr)を提案する。
異なる試料中の中間結果の条件付け手段が基準共変量と治療情報とで等しく、より穏やかで検証可能な仮定の下では、codr下での関心の校正された平均結果が、一次試料のみを使用するよりも偏りなく効率的であることを示すことができる。
シミュレーションデータセットの広範囲にわたる実験は,提案したCODRの実証的妥当性と改善を示し,次いでMIMIC-IIIをeICUの補助データを用いた一次サンプルとして実例とした。
関連論文リスト
- Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Improved Policy Evaluation for Randomized Trials of Algorithmic Resource
Allocation [54.72195809248172]
提案する新しい概念を応用した新しい推定器を提案する。
我々は,このような推定器が,サンプル手段に基づく一般的な推定器よりも精度が高いことを理論的に証明した。
論文 参考訳(メタデータ) (2023-02-06T05:17:22Z) - Data thinning for convolution-closed distributions [2.299914829977005]
本稿では,観測を2つ以上の独立した部分に分割する手法であるデータ薄型化を提案する。
教師なし学習手法の結果の検証には,データの薄化が有効であることを示す。
論文 参考訳(メタデータ) (2023-01-18T02:47:41Z) - Optimal Condition Training for Target Source Separation [56.86138859538063]
単一チャネルターゲットソース分離のための最適条件学習法を提案する。
多様な意味概念によってもたらされる相補的な情報は、興味の源泉を乱して分離するのに大いに役立ちます。
論文 参考訳(メタデータ) (2022-11-11T00:04:55Z) - Rethinking Collaborative Metric Learning: Toward an Efficient
Alternative without Negative Sampling [156.7248383178991]
コラボレーティブ・メトリック・ラーニング(CML)パラダイムはレコメンデーション・システム(RS)分野に広く関心を集めている。
負のサンプリングが一般化誤差のバイアス付き推定に繋がることがわかった。
そこで我々は,SFCML (textitSampling-Free Collaborative Metric Learning) という名前のCMLに対して,負のサンプリングを伴わない効率的な手法を提案する。
論文 参考訳(メタデータ) (2022-06-23T08:50:22Z) - Estimation of Local Average Treatment Effect by Data Combination [3.655021726150368]
治療課題の遵守が不完全である場合には、局所的平均治療効果(LATE)を推定することが重要である。
以前提案されたLATE推定法では、関連するすべての変数を1つのデータセットで共同で観測することが必要であった。
最小値の定式化を回避し,より簡易なモデル選択を可能とする重み付き最小二乗推定器を提案する。
論文 参考訳(メタデータ) (2021-09-11T03:51:48Z) - The Pitfalls of Sample Selection: A Case Study on Lung Nodule
Classification [13.376247652484274]
肺結節分類では, LIDCデータセットについて多くの研究結果が報告されており, 理論的には, 提案手法の性能を直接比較し, 個人の貢献が与える影響を評価することが期待できる。
それぞれが異なるデータ選択プロセスを採用しており,良性と悪性の症例の総数と比率が大きく異なることが判明した。
特定の選択がデータ分布に深刻な影響を与える可能性があることを示し、あるサンプル分布において優れた性能を達成できるが、別のサンプル分布では達成できない可能性があることを示す。
論文 参考訳(メタデータ) (2021-08-11T18:07:07Z) - GEAR: On Optimal Decision Making with Auxiliary Data [20.607673853640744]
現在の最適決定規則(ODR)法は、通常、治療効果、すなわち実験サンプルを評価するために、サンプルに対する関心の最初の結果を必要とする。
本論文では, 実験試料中のODRの推定を容易にするための補助試料を用いて, この課題に対処すべく考案した。
本稿では, 拡張逆確率重み値推定器を一連の決定規則に対して最大化することにより, 実験および補助サンプルベース決定規則(GEAR)を提案する。
論文 参考訳(メタデータ) (2021-04-21T14:59:25Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z) - Optimal Off-Policy Evaluation from Multiple Logging Policies [77.62012545592233]
我々は,複数のロギングポリシからオフ政治評価を行い,それぞれが一定のサイズ,すなわち階層化サンプリングのデータセットを生成する。
複数ロガーのOPE推定器は,任意のインスタンス,すなわち効率のよいインスタンスに対して最小分散である。
論文 参考訳(メタデータ) (2020-10-21T13:43:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。