論文の概要: Empirical Analysis of Zipf's Law, Power Law, and Lognormal Distributions
in Medical Discharge Reports
- arxiv url: http://arxiv.org/abs/2003.13352v3
- Date: Fri, 17 Jul 2020 01:35:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 07:37:18.433492
- Title: Empirical Analysis of Zipf's Law, Power Law, and Lognormal Distributions
in Medical Discharge Reports
- Title(参考訳): 医療用放電報告におけるZipf法則、電力法則、および対数正規分布の実証分析
- Authors: Juan C Quiroz, Liliana Laranjo, Catalin Tufanaru, Ahmet Baki
Kocaballi, Dana Rezazadegan, Shlomo Berkovsky, Enrico Coiera
- Abstract要約: 本論文は、ジップフの法則に従えば、医学的退院報告のテキストが従うかどうかを実証的に分析する。
MIMIC-IIIデータセットによる2万件の退院報告について検討した。
その結果, 排出報告は停電電力法則や対数正規分布に最も適していることがわかった。
- 参考スコア(独自算出の注目度): 8.531060561689232
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bayesian modelling and statistical text analysis rely on informed probability
priors to encourage good solutions. This paper empirically analyses whether
text in medical discharge reports follow Zipf's law, a commonly assumed
statistical property of language where word frequency follows a discrete power
law distribution. We examined 20,000 medical discharge reports from the
MIMIC-III dataset. Methods included splitting the discharge reports into
tokens, counting token frequency, fitting power law distributions to the data,
and testing whether alternative distributions--lognormal, exponential,
stretched exponential, and truncated power law--provided superior fits to the
data. Results show that discharge reports are best fit by the truncated power
law and lognormal distributions. Our findings suggest that Bayesian modelling
and statistical text analysis of discharge report text would benefit from using
truncated power law and lognormal probability priors.
- Abstract(参考訳): ベイズ的モデリングと統計テキスト解析は、良い解を奨励するために情報的確率先に依存する。
本稿では, 単語頻度が離散的な電力法分布に従う言語において, Zipfの法則に従うか否かを実験的に分析する。
MIMIC-IIIデータセットによる2万件の退院報告について検討した。
排出報告をトークンに分割し、トークンの頻度をカウントし、データに電力法則の分布を適合させ、代替の分布(正規分布、指数関数、伸張指数、および切り離された電力法)がデータに適合するかどうかをテストする。
その結果, 排出報告は停電電力法則や対数正規分布に最も適していることがわかった。
以上の結果から, 退避報告文のベイジアンモデルと統計的テキスト解析は, 停留電力法と対数正規確率前処理の利点が示唆された。
関連論文リスト
- Asymptotically Optimal Change Detection for Unnormalized Pre- and Post-Change Distributions [65.38208224389027]
本稿では,非正規化前および後の変化分布のみがアクセス可能である場合にのみ,変化を検出する問題に対処する。
提案手法は,最適性能を示すことが知られている累積サム統計量の推定に基づく。
論文 参考訳(メタデータ) (2024-10-18T17:13:29Z) - Interpretable Causal Inference for Analyzing Wearable, Sensor, and Distributional Data [62.56890808004615]
本研究では,信頼性とロバストな意思決定を確実にする,分散データ解析の解釈可能な手法を開発した。
ADD MALTSの有用性について,糖尿病リスク軽減のための連続グルコースモニターの有効性について検討した。
論文 参考訳(メタデータ) (2023-12-17T00:42:42Z) - Frequentist Guarantees of Distributed (Non)-Bayesian Inference [3.0873935965739685]
本稿では,分散(非)ベイズ推論問題に対する後続一貫性,正規性,後続収縮率などの頻繁な特性について述べる。
この結果から,分散ベイズ推定はパラメトリックな効率を保っていることがわかった。
解析結果を時間変化グラフに拡張し,指数関数型ファミリーモデル,分散ロジスティック回帰モデル,分散検出モデルに適用する。
論文 参考訳(メタデータ) (2023-11-14T14:50:46Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Flow Away your Differences: Conditional Normalizing Flows as an
Improvement to Reweighting [0.0]
本稿では, 条件分布の所望の変化を考慮に入れた再重み付け手法の代替手法を提案する。
条件付き正規化フローを用いて、完全条件付き確率分布を学習する。
この例では、ソースとターゲットの分布を同一のサンプルサイズで再重み付けする手法よりも、統計精度が最大3倍に向上する。
論文 参考訳(メタデータ) (2023-04-28T16:33:50Z) - Formalizing Statistical Causality via Modal Logic [0.8103046443444949]
因果効果を表現するための統計的因果言語(StaCL)を定義した。
StaCLは統計的因果推論の正確性を特定するのに使うことができる。
論文 参考訳(メタデータ) (2022-10-30T06:12:39Z) - Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。
これらの結果はサンプル状態と有限状態の両方で定式化する。
論文 参考訳(メタデータ) (2022-10-03T06:09:01Z) - Coupling Power Laws Offers a Powerful Method for Problems such as
Biodiversity and COVID-19 Fatality Predictions [0.0]
テイラーの権力法則(TPL)は、生物集団の空間的および時間的分布を特徴付けるために初めて発見された。
PLECはパワーロー関数の変種であり、最終的にパワーロー関数の指数的な成長を阻害する。
本稿では,TPLとPLECの結合(積分)により,特定のパワー・ロー現象の予測精度を向上させることを提案する。
論文 参考訳(メタデータ) (2021-05-23T19:07:16Z) - A Statistical Test for Probabilistic Fairness [11.95891442664266]
不正な分類を検知するための統計的仮説テストを提案する。
理論的にも実証的にも,提案された試験が正しいことを示す。
さらに,提案フレームワークは,データの最も好ましい摂動を識別することにより,解釈可能性を提供する。
論文 参考訳(メタデータ) (2020-12-09T00:20:02Z) - Fair Densities via Boosting the Sufficient Statistics of Exponential
Families [72.34223801798422]
フェアネスのためのデータ前処理にブースティングアルゴリズムを導入する。
私たちのアプローチは、最小限の公平性を確保しながら、より良いデータフィッティングへとシフトします。
実世界のデータに結果の質を示す実験結果が提示される。
論文 参考訳(メタデータ) (2020-12-01T00:49:17Z) - Showing Your Work Doesn't Always Work [73.63200097493576]
『Show Your Work: Improved Reporting of Experimental Results』では、最高の学習モデルの有効性を報告している。
解析的にそれらの推定器は偏りがあり、エラーを起こしやすい仮定を用いていることを示す。
我々は、偏見のない代替案を導き、統計的シミュレーションから経験的な証拠で主張を裏付ける。
論文 参考訳(メタデータ) (2020-04-28T17:59:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。