Fugu-MT 論文翻訳(概要): Overcoming Dependent Censoring in the Evaluation of Survival Models

論文の概要: Overcoming Dependent Censoring in the Evaluation of Survival Models

arxiv url: http://arxiv.org/abs/2502.19460v3
Date: Mon, 19 May 2025 17:50:52 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-20 14:57:10.488789
Title: Overcoming Dependent Censoring in the Evaluation of Survival Models
Title（参考訳）: 生存モデル評価における依存度評価の克服
Authors: Christian Marius Lillelund, Shi-ang Qi, Russell Greiner,
Abstract要約: 本稿では,アルキメデスのコプラに基づく生存分析のための3つの新しい評価指標を提案する。また,現実的な半合成データセットを生成するためのフレームワークも開発している。
参考スコア（独自算出の注目度）: 4.795126873893598
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Conventional survival metrics, such as Harrell's concordance index (CI) and the Brier Score, rely on the independent censoring assumption for valid inference with right-censored data. However, in the presence of so-called dependent censoring, where the probability of censoring is related to the event of interest, these metrics can give biased estimates of the underlying model error. In this paper, we introduce three new evaluation metrics for survival analysis based on Archimedean copulas that can account for dependent censoring. We also develop a framework to generate realistic, semi-synthetic datasets with dependent censoring to facilitate the evaluation of the metrics. Our experiments in synthetic and semi-synthetic data demonstrate that the proposed metrics can provide more accurate estimates of the model error than conventional metrics under dependent censoring.
Abstract（参考訳）: Harrell's Concordance Index (CI) や Brier Score のような従来のサバイバル指標は、正しい検閲されたデータによる妥当な推測に対する独立した検閲仮定に依存している。しかし、いわゆる依存検閲の存在下では、検閲の確率が関心事と関連しているため、これらの指標は基礎となるモデルエラーの偏りのある推定値を与えることができる。本稿では,アルキメデスのコプラに基づく生存分析のための3つの新しい評価指標について紹介する。また,リアルタイムな半合成データセットを生成するためのフレームワークを開発し,メトリクスの評価を容易にする。合成および半合成データを用いた実験により, モデル誤差の精度は, 依存検閲下での従来の指標よりも高いことを示した。

関連論文リスト

Cobra Effect in Reference-Free Image Captioning Metrics [58.438648377314436]
視覚言語事前学習モデル(VLM)を活用した参照フリー手法の普及が出現している。本稿では,基準自由度に欠陥があるかどうかを考察する。 GPT-4Vは生成した文を評価するための評価ツールであり,提案手法がSOTA(State-of-the-art)の性能を達成することを示す。
論文参考訳（メタデータ） (2024-02-18T12:36:23Z)
Deep Copula-Based Survival Analysis for Dependent Censoring with Identifiability Guarantees [14.251687262492377]
センシングは生存分析における中心的な問題であり、各サンプルに対して時間対イベント(例えば、死亡)または時間対センサー(英語版)が観察される。そこで本研究では,依存検閲を同時に適用可能なフレキシブル・ディープ・ラーニング・ベース・サバイバル分析手法を提案する。
論文参考訳（メタデータ） (2023-12-24T23:34:01Z)
Bring Your Own Data! Self-Supervised Evaluation for Large Language Models [52.15056231665816]
大規模言語モデル(LLM)の自己教師型評価のためのフレームワークを提案する。閉書知識,毒性,長期文脈依存性を測定するための自己指導型評価戦略を実証する。自己監督評価と人監督評価との間には強い相関関係が認められた。
論文参考訳（メタデータ） (2023-06-23T17:59:09Z)
An Effective Meaningful Way to Evaluate Survival Models [34.21432603301076]
実際には、テストセットには検閲された個人が含まれています。本稿では,現実的な半合成サバイバルデータセットを生成するための,新しい効果的なアプローチを提案する。提案手法では,モデルの性能に基づいて精度の高いランク付けが可能であり,しばしば真のMAEと密接に一致している。
論文参考訳（メタデータ） (2023-06-01T23:22:46Z)
On the Blind Spots of Model-Based Evaluation Metrics for Text Generation [79.01422521024834]
テキスト生成評価指標のロバスト性分析に有用であるが,しばしば無視される手法を探索する。我々は、幅広い潜在的な誤差を設計、合成し、それらが測定値の余計な低下をもたらすかどうかを確認する。私たちの実験では、既存のメトリクスの興味深い不感、バイアス、あるいは抜け穴が明らかになりました。
論文参考訳（メタデータ） (2022-12-20T06:24:25Z)
A copula-based boosting model for time-to-event prediction with dependent censoring [0.0]
本稿では,加速故障時間モデルに基づくブースティングアプローチであるClayton-boostを紹介する。イベントと配信の検閲の間の依存関係を処理するために、Claytonコプラを使用する。これは、依存検閲の存在下で予測バイアスを除去する強力な能力を示している。
論文参考訳（メタデータ） (2022-10-10T17:38:00Z)
A Unified Evaluation of Textual Backdoor Learning: Frameworks and Benchmarks [72.7373468905418]
我々は,テキストバックドア学習の実装と評価を促進するオープンソースツールキットOpenBackdoorを開発した。また,単純なクラスタリングに基づく防御ベースラインであるCUBEを提案する。
論文参考訳（メタデータ） (2022-06-17T02:29:23Z)
Measuring Fairness of Text Classifiers via Prediction Sensitivity [63.56554964580627]
加速度予測感度は、入力特徴の摂動に対するモデルの予測感度に基づいて、機械学習モデルの公正度を測定する。この計量は、群フェアネス(統計パリティ)と個人フェアネスという特定の概念と理論的に関連付けられることを示す。
論文参考訳（メタデータ） (2022-03-16T15:00:33Z)
A Statistical Analysis of Summarization Evaluation Metrics using Resampling Methods [60.04142561088524]
信頼区間は比較的広く,信頼性の高い自動測定値の信頼性に高い不確実性を示す。多くのメトリクスはROUGEよりも統計的改善を示していないが、QAEvalとBERTScoreという2つの最近の研究は、いくつかの評価設定で行われている。
論文参考訳（メタデータ） (2021-03-31T18:28:14Z)
Conformalized Survival Analysis [6.92027612631023]
既存の生存分析技術は、強いモデリング仮定に大きく依存している。共形予測のアイデアに基づく推論手法を開発した。本手法の有効性と有効性は,英国バイオバンクの合成データと実際のCOVID-19データに基づいて実証した。
論文参考訳（メタデータ） (2021-03-17T16:32:26Z)
GO FIGURE: A Meta Evaluation of Factuality in Summarization [131.1087461486504]
本稿では,現実性評価指標を評価するメタ評価フレームワークGO FIGUREを紹介する。 10個の実測値のベンチマーク分析により、我々のフレームワークが堅牢で効率的な評価を提供することが明らかとなった。また、QAメトリクスは、ドメイン間の事実性を測定する標準的なメトリクスよりも一般的に改善されているが、パフォーマンスは、質問を生成する方法に大きく依存していることも明らかにしている。
論文参考訳（メタデータ） (2020-10-24T08:30:20Z)
Survival Estimation for Missing not at Random Censoring Indicators based on Copula Models [1.52292571922932]
そこで本研究では,MNARを非ランダムに検閲しない条件付き生存関数に対する条件付きコーパスモデルに基づく新しい条件付き生存関数推定器を提案する。理論的な結果に加えて,シミュレーションによる小サンプルに対する推定器の動作方法や,合成データおよび実データの解析による実用性を示す。
論文参考訳（メタデータ） (2020-09-03T15:04:27Z)
Performance metrics for intervention-triggering prediction models do not reflect an expected reduction in outcomes from using the model [71.9860741092209]
臨床研究者はしばしばリスク予測モデルの中から選択し評価する。振り返りデータから算出される標準メトリクスは、特定の仮定の下でのみモデルユーティリティに関係します。予測が時間を通して繰り返し配信される場合、標準メトリクスとユーティリティの関係はさらに複雑になる。
論文参考訳（メタデータ） (2020-06-02T16:26:49Z)
Nonparametric Score Estimators [49.42469547970041]
未知分布によって生成されたサンプルの集合からスコアを推定することは確率モデルの推論と学習における基本的なタスクである。正規化非パラメトリック回帰の枠組みの下で、これらの推定器の統一的なビューを提供する。カールフリーカーネルと高速収束による計算効果を享受する反復正規化に基づくスコア推定器を提案する。
論文参考訳（メタデータ） (2020-05-20T15:01:03Z)
Censored Quantile Regression Forest [81.9098291337097]
我々は、検閲に適応し、データが検閲を示さないときに量子スコアをもたらす新しい推定方程式を開発する。提案手法は, パラメトリックなモデリング仮定を使わずに, 時間単位の定量を推定することができる。
論文参考訳（メタデータ） (2020-01-08T23:20:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。