論文の概要: METRIK: Measurement-Efficient Randomized Controlled Trials using Transformers with Input Masking
- arxiv url: http://arxiv.org/abs/2406.16351v1
- Date: Mon, 24 Jun 2024 06:47:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 15:53:24.616238
- Title: METRIK: Measurement-Efficient Randomized Controlled Trials using Transformers with Input Masking
- Title(参考訳): MeTRIK:入力マスキングを用いた変圧器を用いたランダム化制御試験
- Authors: Sayeri Lala, Niraj K. Jha,
- Abstract要約: 計画的欠落設計(PMD)は、メトリクスを取り除くことなく収集されるデータ量を削減できる。
METRIKは、試験設計者の目的を満たすPMDを生成するために、新しいサンプリングと選択アルゴリズムを実装している。
MeTRIKは、時間とメトリクス間の相関を利用して、生成されたPMDの下でのサンプリング効率と計算性能を向上する。
- 参考スコア(独自算出の注目度): 3.088223994180069
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clinical randomized controlled trials (RCTs) collect hundreds of measurements spanning various metric types (e.g., laboratory tests, cognitive/motor assessments, etc.) across 100s-1000s of subjects to evaluate the effect of a treatment, but do so at the cost of significant trial expense. To reduce the number of measurements, trial protocols can be revised to remove metrics extraneous to the study's objective, but doing so requires additional human labor and limits the set of hypotheses that can be studied with the collected data. In contrast, a planned missing design (PMD) can reduce the amount of data collected without removing any metric by imputing the unsampled data. Standard PMDs randomly sample data to leverage statistical properties of imputation algorithms, but are ad hoc, hence suboptimal. Methods that learn PMDs produce more sample-efficient PMDs, but are not suitable for RCTs because they require ample prior data (150+ subjects) to model the data distribution. Therefore, we introduce a framework called Measurement EfficienT Randomized Controlled Trials using Transformers with Input MasKing (METRIK), which, for the first time, calculates a PMD specific to the RCT from a modest amount of prior data (e.g., 60 subjects). Specifically, METRIK models the PMD as a learnable input masking layer that is optimized with a state-of-the-art imputer based on the Transformer architecture. METRIK implements a novel sampling and selection algorithm to generate a PMD that satisfies the trial designer's objective, i.e., whether to maximize sampling efficiency or imputation performance for a given sampling budget. Evaluated across five real-world clinical RCT datasets, METRIK increases the sampling efficiency of and imputation performance under the generated PMD by leveraging correlations over time and across metrics, thereby removing the need to manually remove metrics from the RCT.
- Abstract(参考訳): 臨床ランダム化対照試験(RCTs)は、100~1000名の被験者を対象に、様々な計量タイプ(実験室試験、認知・運動士評価など)にまたがる何百もの測定値を収集し、治療の効果を評価するが、かなりの臨床試験費用を犠牲にしている。
測定回数を減らすために、試験プロトコルを改訂して、研究の目的に反するメトリクスを除去することができるが、それを行うには追加の人的労力が必要であり、収集されたデータで研究できる仮説のセットを制限する必要がある。
対照的に、計画的欠落設計(PMD)は、アンサンプされたデータを出力することによって、メトリクスを除去することなく収集されるデータ量を削減できる。
標準的なPMDは、計算アルゴリズムの統計特性を利用するためにランダムにサンプルデータをサンプリングするが、アドホックであり、したがって準最適である。
PMDを学習する手法はよりサンプル効率のよいMDDを生成するが、データ分布をモデル化するために十分な事前データ(150以上の被験者)を必要とするため、RDTには適さない。
そこで,入力マスキング(METRIK)を用いたトランスフォーマを用いた測定効率Tランダム化制御試験というフレームワークを導入する。
具体的には、METRIKはMDを学習可能な入力マスキング層としてモデル化し、トランスフォーマーアーキテクチャに基づいた最先端のインデューサで最適化する。
METRIKは、試験設計者の目的、すなわち所定のサンプリング予算に対するサンプリング効率や計算性能の最大化を満足するMDを生成するために、新しいサンプリングと選択アルゴリズムを実装している。
実世界の5つの臨床RTTデータセットで評価され、METRIKは、時間とメトリクス間の相関を利用して、生成されたMDDの下でのサンプリング効率と計算性能を高め、RCTから手動でメトリクスを除去する必要性を除去する。
関連論文リスト
- Improving Bias Correction Standards by Quantifying its Effects on Treatment Outcomes [54.18828236350544]
Propensity score matching (PSM) は、分析のために同等の人口を選択することで選択バイアスに対処する。
異なるマッチング手法は、すべての検証基準を満たす場合でも、同じタスクに対する平均処理効果(ATE)を著しく異なるものにすることができる。
この問題に対処するため,新しい指標A2Aを導入し,有効試合数を削減した。
論文 参考訳(メタデータ) (2024-07-20T12:42:24Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - Instance-based Learning with Prototype Reduction for Real-Time
Proportional Myocontrol: A Randomized User Study Demonstrating
Accuracy-preserving Data Reduction for Prosthetic Embedded Systems [0.0]
本研究は, 義肢制御におけるジェスチャー検出のためのkNNスキームに基づく学習手法の設計, 実装, 検証を行う。
8チャンネルSEMGアームバンドを用いて,パラメータ化と比例スキームの変化の影響を解析した。
論文 参考訳(メタデータ) (2023-08-21T20:15:35Z) - AdjointDPM: Adjoint Sensitivity Method for Gradient Backpropagation of Diffusion Probabilistic Models [103.41269503488546]
既存のカスタマイズ方法は、事前訓練された拡散確率モデルをユーザが提供する概念に合わせるために、複数の参照例にアクセスする必要がある。
本論文は、DPMカスタマイズの課題として、生成コンテンツ上で定義された差別化可能な指標が唯一利用可能な監督基準である場合に解決することを目的とする。
本稿では,拡散モデルから新しいサンプルを初めて生成するAdjointDPMを提案する。
次に、随伴感度法を用いて、損失の勾配をモデルのパラメータにバックプロパゲートする。
論文 参考訳(メタデータ) (2023-07-20T09:06:21Z) - Constrained Probabilistic Mask Learning for Task-specific Undersampled
MRI Reconstruction [8.44194619347218]
アンダーサンプリング(アンダーサンプリング)は、磁気共鳴イメージング(MRI)において、k空間内のデータ点数をサブサンプリングする一般的な方法である。
データポイントからアンダーサンプリングマスクを直接学習する手法を提案する。
解剖学的に異なる部位で最適なアンダーサンプリングマスクが認められた。
論文 参考訳(メタデータ) (2023-05-25T14:42:04Z) - On Calibrating Diffusion Probabilistic Models [78.75538484265292]
拡散確率モデル(DPM)は様々な生成タスクにおいて有望な結果を得た。
そこで本研究では,任意の事前学習DPMを校正する簡単な方法を提案する。
キャリブレーション法は1回だけ行い, 得られたモデルをサンプリングに繰り返し使用することができる。
論文 参考訳(メタデータ) (2023-02-21T14:14:40Z) - StRegA: Unsupervised Anomaly Detection in Brain MRIs using a Compact
Context-encoding Variational Autoencoder [48.2010192865749]
教師なし異常検出(UAD)は、健康な被験者の異常なデータセットからデータ分布を学習し、分布サンプルの抽出に応用することができる。
本研究では,コンテクストエンコーディング(context-encoding)VAE(ceVAE)モデルのコンパクトバージョンと,前処理と後処理のステップを組み合わせて,UADパイプライン(StRegA)を作成することを提案する。
提案したパイプラインは、BraTSデータセットのT2w画像と0.859$pm$0.112の腫瘍を検出しながら、Diceスコアが0.642$pm$0.101に達した。
論文 参考訳(メタデータ) (2022-01-31T14:27:35Z) - Survival Prediction of Children Undergoing Hematopoietic Stem Cell
Transplantation Using Different Machine Learning Classifiers by Performing
Chi-squared Test and Hyper-parameter Optimization: A Retrospective Analysis [4.067706269490143]
効率的な生存率分類モデルが包括的に提示される。
欠落した値を入力し、ダミー変数符号化を用いてデータを変換し、チ二乗特徴選択を用いて59個の特徴から11個の最も相関した特徴にデータセットを圧縮することにより、合成データセットを生成する。
この点に関しては、決定木(Decision Tree)、ランダムフォレスト(Random Forest)、ロジスティック回帰(Logistic Regression)、K-Nearest Neighbors(K-Nearest Neighbors)、グラディエントブースティング(Gradient Boosting)、Ada Boost(Ada Boost)、XG Boost(XG Boost)など、いくつかの教師付きML手法が訓練された。
論文 参考訳(メタデータ) (2022-01-22T08:01:22Z) - On Predictive Explanation of Data Anomalies [3.1798318618973362]
PROTEUSは、不均衡なデータセットの機能選択用に設計されたAutoMLパイプラインである。
教師なし検出器の決定面を近似することで予測的な説明を生成する。
予期せぬデータで予測性能を確実に推定する。
論文 参考訳(メタデータ) (2021-10-18T16:59:28Z) - A Scalable MIP-based Method for Learning Optimal Multivariate Decision
Trees [17.152864798265455]
1ノルムサポートベクトルマシンモデルに基づく新しいMIP定式化を提案し、分類問題に対する多変量 ODT の訓練を行う。
我々は, MIP定式化の線形緩和を緩和する切削面技術を提供し, 実行時間の改善と最適性を実現する。
我々の定式化は、平均的なサンプル外テストの精度で、文献において、平均で約10%上回っていることを実証する。
論文 参考訳(メタデータ) (2020-11-06T14:17:41Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。