論文の概要: Estimators of Entropy and Information via Inference in Probabilistic
Models
- arxiv url: http://arxiv.org/abs/2202.12363v1
- Date: Thu, 24 Feb 2022 21:04:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-28 14:32:08.158543
- Title: Estimators of Entropy and Information via Inference in Probabilistic
Models
- Title(参考訳): 確率モデルにおける推論によるエントロピーと情報の推定
- Authors: Feras A. Saad, Marco Cusumano-Towner, Vikash K. Mansinghka
- Abstract要約: エントロピーや相互情報といった情報理論量の推定は、統計学や機械学習における多くの問題の中心である。
本稿では,任意の変数に対する情報量に対する上限値と下限値の上限値を提供するEEVIを用いたエントロピー推定器を提案する。
- 参考スコア(独自算出の注目度): 1.4502611532302037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating information-theoretic quantities such as entropy and mutual
information is central to many problems in statistics and machine learning, but
challenging in high dimensions. This paper presents estimators of entropy via
inference (EEVI), which deliver upper and lower bounds on many information
quantities for arbitrary variables in a probabilistic generative model. These
estimators use importance sampling with proposal distribution families that
include amortized variational inference and sequential Monte Carlo, which can
be tailored to the target model and used to squeeze true information values
with high accuracy. We present several theoretical properties of EEVI and
demonstrate scalability and efficacy on two problems from the medical domain:
(i) in an expert system for diagnosing liver disorders, we rank medical tests
according to how informative they are about latent diseases, given a pattern of
observed symptoms and patient attributes; and (ii) in a differential equation
model of carbohydrate metabolism, we find optimal times to take blood glucose
measurements that maximize information about a diabetic patient's insulin
sensitivity, given their meal and medication schedule.
- Abstract(参考訳): エントロピーや相互情報といった情報理論量の推定は統計学や機械学習における多くの問題の中心であるが、高次元では困難である。
本稿では,確率的生成モデルにおいて,任意の変数に対する情報量に対する上・下限を導出するエントロピー推定法(eevi)を提案する。
これらの推定器は、対象モデルに合わせて調整可能で、精度の高い真の情報値の絞り込みに使用できる、amortized variational inferenceとシーケンシャルモンテカルロを含む提案分布関数で重要サンプリングを使用する。
医療領域からの2つの問題に対して,eeviのいくつかの理論的特性を提示し,スケーラビリティと有効性を示す。
i) 肝疾患を診断する専門的システムにおいて, 症状のパターンや患者属性を考慮し, 潜伏病に関する情報に基づいて, 臨床検査をランク付けする。
(ii)糖代謝の微分方程式モデルでは、食事や薬のスケジュールを考えると、糖尿病患者のインスリン感受性に関する情報を最大化する血糖値測定を行うのに最適な時間を見出す。
関連論文リスト
- Effect of Clinical History on Predictive Model Performance for Renal Complications of Diabetes [1.4330510916280879]
糖尿病は糖尿病性腎症の発症リスクが高いという特徴を持つ慢性疾患である。
このような合併症やその悪化のリスクを高める個人を早期に同定することは、適切な治療方針を設定する上で非常に重要である。
糖尿病患者に対する臨床関連糸球体濾過率(eGFR)閾値の交差を予測・予測するロジスティック回帰モデルを開発した。
論文 参考訳(メタデータ) (2024-09-10T20:27:00Z) - Deep State-Space Generative Model For Correlated Time-to-Event Predictions [54.3637600983898]
そこで本研究では,様々な種類の臨床イベント間の相互作用を捉えるために,潜伏状態空間生成モデルを提案する。
また,死亡率と臓器不全の関連性について有意な知見が得られた。
論文 参考訳(メタデータ) (2024-07-28T02:42:36Z) - Interpretable Causal Inference for Analyzing Wearable, Sensor, and Distributional Data [62.56890808004615]
本研究では,信頼性とロバストな意思決定を確実にする,分散データ解析の解釈可能な手法を開発した。
ADD MALTSの有用性について,糖尿病リスク軽減のための連続グルコースモニターの有効性について検討した。
論文 参考訳(メタデータ) (2023-12-17T00:42:42Z) - Unsupervised EHR-based Phenotyping via Matrix and Tensor Decompositions [0.6875312133832078]
本稿では,低ランク近似に基づく計算表現法について概観する。
近年,様々な制約を組み込んだ低ランクデータ近似手法が開発され,解釈可能性の向上が図られている。
論文 参考訳(メタデータ) (2022-09-01T09:47:27Z) - Reliable and Trustworthy Machine Learning for Health Using Dataset Shift
Detection [7.263558963357268]
予測不能なMLモデルの振る舞いは、特に健康領域において、その安全性に対する深刻な懸念を引き起こす。
マハラノビス距離およびグラム行列に基づく分布外検出法は,分布外データを高精度に検出できることを示す。
次に、アウト・オブ・ディストリビューションスコアを人間の解釈可能なConFIDENCE SCOREに変換し、ユーザーの健康MLアプリケーションとのインタラクションに与える影響を調査する。
論文 参考訳(メタデータ) (2021-10-26T20:49:01Z) - Pandemic model with data-driven phase detection, a study using COVID-19
data [0.0]
最近の新型コロナウイルスのパンデミックは、パンデミックを理解し、助言し、コントロールするために、活発な科学活動を促進している。
現在、データは世界中で停滞する速度で自由に利用できる。
保健当局は、突然の変化に適応できるより正確なモデルの必要性を認識している。
論文 参考訳(メタデータ) (2021-10-24T14:07:32Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - Personalized pathology test for Cardio-vascular disease: Approximate
Bayesian computation with discriminative summary statistics learning [48.7576911714538]
近似計算を用いて生物学的に有意なパラメータを推定するための血小板沈着モデルと推論手法を提案する。
この研究は、CVDの検出と治療のためのパーソナライズされた病理検査の先例のない機会を開く。
論文 参考訳(メタデータ) (2020-10-13T15:20:21Z) - A General Framework for Survival Analysis and Multi-State Modelling [70.31153478610229]
ニューラル常微分方程式を多状態生存モデル推定のためのフレキシブルで一般的な方法として用いる。
また,本モデルでは,サバイバルデータセット上での最先端性能を示すとともに,マルチステート環境での有効性を示す。
論文 参考訳(メタデータ) (2020-06-08T19:24:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。