論文の概要: Predicting Disease Progress with Imprecise Lab Test Results
- arxiv url: http://arxiv.org/abs/2107.03620v1
- Date: Thu, 8 Jul 2021 06:03:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-09 13:31:25.473315
- Title: Predicting Disease Progress with Imprecise Lab Test Results
- Title(参考訳): 不正確な検査結果による疾患進展予測
- Authors: Mei Wang, Jianwen Su, Zhihua Lin
- Abstract要約: 既存のディープラーニング手法では、ほとんど全ての損失関数は、予測されたサンプルデータ値が正しい唯一のものであると仮定する。
本稿では,病状進行予測のための命令範囲損失(IR損失)法を提案し,それをLong Short Term Memory(LSTM)モデルに組み込む。
実データを用いた実験結果から,IR損失に基づく予測手法により,より安定かつ一貫した予測結果が得られることが示された。
- 参考スコア(独自算出の注目度): 8.70310158726824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In existing deep learning methods, almost all loss functions assume that
sample data values used to be predicted are the only correct ones. This
assumption does not hold for laboratory test data. Test results are often
within tolerable or imprecision ranges, with all values in the ranges
acceptable. By considering imprecision samples, we propose an imprecision range
loss (IR loss) method and incorporate it into Long Short Term Memory (LSTM)
model for disease progress prediction. In this method, each sample in
imprecision range space has a certain probability to be the real value,
participating in the loss calculation. The loss is defined as the integral of
the error of each point in the impression range space. A sampling method for
imprecision space is formulated. The continuous imprecision space is
discretized, and a sequence of imprecise data sets are obtained, which is
convenient for gradient descent learning. A heuristic learning algorithm is
developed to learn the model parameters based on the imprecise data sets.
Experimental results on real data show that the prediction method based on IR
loss can provide more stable and consistent prediction result when test samples
are generated from imprecision range.
- Abstract(参考訳): 既存のディープラーニング手法では、ほとんど全ての損失関数は、予測されたサンプルデータ値が正しい唯一のものであると仮定する。
この仮定は実験室のテストデータには当てはまらない。
テスト結果はしばしば許容範囲内または不正確範囲内であり、全ての値が許容範囲内である。
インプレシジョンサンプルを考慮し,インプレシション範囲損失(ir損失)法を提案し,疾患進行予測のためのlong short term memory(lstm)モデルに組み込む。
この方法では、不正確な範囲空間内の各サンプルは、損失計算に参加して実値となる確率が一定である。
損失は、印象範囲空間の各点の誤差の積分として定義される。
インプレクション空間のサンプリング法を定式化する。
連続的精度空間を離散化し、勾配降下学習に便利な一連の不正確なデータセットを得る。
不正確なデータセットに基づいてモデルパラメータを学習するためにヒューリスティック学習アルゴリズムを開発した。
実データを用いた実験の結果,ir損失に基づく予測手法は,不適合範囲から試験試料が生成される場合,より安定かつ一貫した予測結果が得られることがわかった。
関連論文リスト
- Detecting Errors in a Numerical Response via any Regression Model [21.651775224356214]
ノイズは多くの数値データセットを悩ませ、データ中の記録された値が真の基礎となる値と一致しない可能性がある。
真の誤りと自然データゆらぎを区別する妥当性スコアを導入する。
また,実世界の数値誤差を伴う5つの回帰データセットを含む新しいエラー検出ベンチマークも提案する。
論文 参考訳(メタデータ) (2023-05-26T02:15:26Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Imputation-Free Learning from Incomplete Observations [73.15386629370111]
本稿では,不備な値を含む入力からの推論をインプットなしでトレーニングするIGSGD法の重要性について紹介する。
バックプロパゲーションによるモデルのトレーニングに使用する勾配の調整には強化学習(RL)を用いる。
我々の計算自由予測は、最先端の計算手法を用いて従来の2段階の計算自由予測よりも優れている。
論文 参考訳(メタデータ) (2021-07-05T12:44:39Z) - Evaluating representations by the complexity of learning low-loss
predictors [55.94170724668857]
下流タスクの解決に使用されるデータの表現を評価することの問題点を考察する。
本稿では,関心のあるタスクにおける低損失を実現する表現の上に,予測器を学習する複雑性によって表現の質を測定することを提案する。
論文 参考訳(メタデータ) (2020-09-15T22:06:58Z) - The Shooting Regressor; Randomized Gradient-Based Ensembles [0.0]
ランダム化と損失関数勾配を利用して予測を計算するアンサンブル法を提案する。
複数の弱相関推定器は、誤差面上のランダムにサンプリングされた点の勾配を近似し、最終解に集約する。
論文 参考訳(メタデータ) (2020-09-14T03:20:59Z) - Impact of Medical Data Imprecision on Learning Results [9.379890125442333]
医療応用におけるインプレクションが予測結果に与える影響について検討した。
トレーニング済みのモデルを用いて、患者の甲状腺機能亢進症の将来状態を予測する。
論文 参考訳(メタデータ) (2020-07-24T06:54:57Z) - Least Squares Estimation Using Sketched Data with Heteroskedastic Errors [0.0]
ランダムなプロジェクションによってスケッチされたデータを用いた推定は、エラーがホモスケダスティックであるかのように振る舞うことを示す。
楽器関連性の第一段階Fテストを含む推論は、スケッチスキームが適切に選択された場合の完全なサンプルケースよりも簡単である。
論文 参考訳(メタデータ) (2020-07-15T15:58:27Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z) - A termination criterion for stochastic gradient descent for binary
classification [3.216356957608319]
そこで本研究では, ステップサイズ勾配勾配定位のための新しい, 単純で, 安価に終了試験を提案する。
実験の終了回数が有限であることを示すとともに,データ中のノイズが大きすぎると,終了時の予測分類器が誤分類の確率を最小化することを示す。
論文 参考訳(メタデータ) (2020-03-23T15:00:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。