論文の概要: Model-based recursive partitioning for discrete event times
- arxiv url: http://arxiv.org/abs/2209.06592v1
- Date: Wed, 14 Sep 2022 12:17:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-15 13:49:52.680377
- Title: Model-based recursive partitioning for discrete event times
- Title(参考訳): 離散イベント時間に対するモデルベース再帰的パーティショニング
- Authors: Cynthia Huber, Matthias Schmid, Tim Friede
- Abstract要約: データ分割に使用されるテストのI型エラー率を制御する離散生存データ(MOB-dS)のMOBを提案する。
テストのI型誤差率はMOB-dSに対してよく制御されているが,MOBの誤差率のかなりのインフレーションが観察されている。
- 参考スコア(独自算出の注目度): 3.222802562733787
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Model-based recursive partitioning (MOB) is a semi-parametric statistical
approach allowing the identification of subgroups that can be combined with a
broad range of outcome measures including continuous time-to-event outcomes.
When time is measured on a discrete scale, methods and models need to account
for this discreetness as otherwise subgroups might be spurious and effects
biased. The test underlying the splitting criterion of MOB, the M-fluctuation
test, assumes independent observations. However, for fitting discrete
time-to-event models the data matrix has to be modified resulting in an
augmented data matrix violating the independence assumption. We propose MOB for
discrete Survival data (MOB-dS) which controls the type I error rate of the
test used for data splitting and therefore the rate of identifying subgroups
although none is present. MOB-ds uses a permutation approach accounting for
dependencies in the augmented time-to-event data to obtain the distribution
under the null hypothesis of no subgroups being present. Through simulations we
investigate the type I error rate of the new MOB-dS and the standard MOB for
different patterns of survival curves and event rates. We find that the type I
error rates of the test is well controlled for MOB-dS, but observe some
considerable inflations of the error rate for MOB. To illustrate the proposed
methods, MOB-dS is applied to data on unemployment duration.
- Abstract(参考訳): モデルベースの再帰的分割(MOB)は半パラメトリックな統計手法であり、連続的な時間と結果を含む幅広い結果の尺度と組み合わせることができる。
離散的なスケールで時間を測定するとき、他の部分群が刺激的であり、影響が偏っているため、方法やモデルはこの違いを考慮する必要がある。
Mゆらぎ試験(M-fluctuation test)であるMOBの分裂基準に基づく試験は、独立した観測を前提としている。
しかしながら、離散時間-イベントモデルを適用するためには、独立性仮定に違反する拡張データ行列を生成するために、データ行列を変更する必要がある。
本稿では,データ分割に使用するテストのタイプiエラー率を制御する離散サバイバルデータ(mob-ds)に対するモブを提案する。
MOB-dsは、拡張された時間から時間へのデータの依存関係を考慮に入れた置換アプローチを用いて、非部分群のnull仮説の下で分布を得る。
シミュレーションにより,新たなモブdと標準モブのタイプiエラー率を調査し,サバイバル曲線とイベント率の異なるパターンについて検討した。
テストのI型誤差率はMOB-dSに対してよく制御されているが,MOBの誤差率のかなりのインフレーションが観察されている。
提案手法を説明するために,MOB-dSを失業期間のデータに適用した。
関連論文リスト
- Data-driven Bayesian State Estimation with Compressed Measurement of Model-free Process using Semi-supervised Learning [57.04370580292727]
モデルフリープロセスの圧縮測定(BSCM)によるデータ駆動ベイズ状態の推定。
時間的測定ベクトルの次元は、推定される時間的状態ベクトルの次元よりも低い。
既存の2つの教師なし学習ベースのデータ駆動手法は、モデルフリープロセスのBSCM問題に対処できない。
半教師付き学習に基づくDANSE手法を開発し,その手法をSemiDANSEと呼ぶ。
論文 参考訳(メタデータ) (2024-07-10T05:03:48Z) - Bayesian temporal biclustering with applications to multi-subject neuroscience studies [6.515516311120015]
本研究では,時間不変な被検体の分割が時間変化による測定の分割を誘導するネスト分割を特徴とする時間的双クラスタリングのためのベイズモデルを提案する。
提案手法は,データ駆動による被検体数および測定クラスター数の決定と,測定分割における変化点数および位置の推定を可能にする。
論文 参考訳(メタデータ) (2024-06-24T20:41:37Z) - Your Absorbing Discrete Diffusion Secretly Models the Conditional Distributions of Clean Data [55.54827581105283]
本研究では, 吸収拡散の具体的なスコアを, クリーンデータの条件付き確率として表すことができることを示す。
時間に依存しない条件付き確率を特徴付ける時間条件のない専用拡散モデルを提案する。
5つのゼロショット言語モデルベンチマークにおける拡散モデル間のSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-06-06T04:22:11Z) - On Calibrating Diffusion Probabilistic Models [78.75538484265292]
拡散確率モデル(DPM)は様々な生成タスクにおいて有望な結果を得た。
そこで本研究では,任意の事前学習DPMを校正する簡単な方法を提案する。
キャリブレーション法は1回だけ行い, 得られたモデルをサンプリングに繰り返し使用することができる。
論文 参考訳(メタデータ) (2023-02-21T14:14:40Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Robust Continual Test-time Adaptation: Instance-aware BN and
Prediction-balanced Memory [58.72445309519892]
テストデータストリーム以外のデータストリームに対して堅牢な新しいテスト時間適応方式を提案する。
a)分布外サンプルの正規化を修正するIABN(Instance-Aware Batch Normalization)と、(b)クラスバランスのない方法で非i.d.ストリームからのデータストリームをシミュレートするPBRS(Predict- Balanced Reservoir Sampling)である。
論文 参考訳(メタデータ) (2022-08-10T03:05:46Z) - Sharing pattern submodels for prediction with missing values [12.981974894538668]
機械学習の多くのアプリケーションでは欠落値は避けられず、トレーニング中もテスト時にも課題が提示される。
パターンサブモデル(パターンサブモデル)と呼ばれる別の手法を提案する。これは、テスト時に欠落した値に対して、予測を堅牢にし、パターンサブモデルの予測力を維持または改善させる。
論文 参考訳(メタデータ) (2022-06-22T15:09:40Z) - Sampling in Dirichlet Process Mixture Models for Clustering Streaming
Data [5.660207256468972]
Dirichlet Process Mixture Model (DPMM)は、ストリーミングデータケースにとって自然な選択である。
オンラインDPMM推論のための既存の手法は、高速なデータストリームを扱うには遅すぎる。
本稿では,DPMMとDPMMサンプリングに基づくストリーミングデータクラスタリングのための非ストリーミング推論手法を提案する。
論文 参考訳(メタデータ) (2022-02-27T08:51:50Z) - Model-based Clustering with Missing Not At Random Data [0.8777702580252754]
我々は,MNARデータを含む,非常に一般的なタイプの欠落データを扱うために設計されたモデルベースのクラスタリングアルゴリズムを提案する。
いくつかのMNARモデルについて議論し、不足の原因は、欠落変数自体の値とクラスメンバーシップの両方に依存する。
MNARzと呼ばれる特定のMNARモデルに注目する。
論文 参考訳(メタデータ) (2021-12-20T09:52:12Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - The UU-test for Statistical Modeling of Unimodal Data [0.20305676256390928]
一次元データセットの一様性を決定するUUテスト(Unimodal Uniform test)手法を提案する。
このアプローチのユニークな特徴は、一様性の場合、一様混合モデルという形でデータの統計モデルも提供することである。
論文 参考訳(メタデータ) (2020-08-28T08:34:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。