論文の概要: Boosting methods for interval-censored data with regression and classification
- arxiv url: http://arxiv.org/abs/2601.17973v1
- Date: Sun, 25 Jan 2026 20:05:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.56649
- Title: Boosting methods for interval-censored data with regression and classification
- Title(参考訳): 回帰と分類を用いた区間知覚データのブースティング手法
- Authors: Yuan Bian, Grace Y. Yi, Wenqing He,
- Abstract要約: 本稿では,時間間隔データを用いた回帰・分類タスクのための新しい非パラメトリックブースティング手法を提案する。
我々のアプローチは、不偏変換の検閲を利用して損失関数を調整し、変換応答をインプットする。
最適性と平均二乗誤差トレードオフを含む理論的性質を厳格に確立する。
- 参考スコア(独自算出の注目度): 4.5041160025507585
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Boosting has garnered significant interest across both machine learning and statistical communities. Traditional boosting algorithms, designed for fully observed random samples, often struggle with real-world problems, particularly with interval-censored data. This type of data is common in survival analysis and time-to-event studies where exact event times are unobserved but fall within known intervals. Effective handling of such data is crucial in fields like medical research, reliability engineering, and social sciences. In this work, we introduce novel nonparametric boosting methods for regression and classification tasks with interval-censored data. Our approaches leverage censoring unbiased transformations to adjust loss functions and impute transformed responses while maintaining model accuracy. Implemented via functional gradient descent, these methods ensure scalability and adaptability. We rigorously establish their theoretical properties, including optimality and mean squared error trade-offs. Our proposed methods not only offer a robust framework for enhancing predictive accuracy in domains where interval-censored data are common but also complement existing work, expanding the applicability of existing boosting techniques. Empirical studies demonstrate robust performance across various finite-sample scenarios, highlighting the practical utility of our approaches.
- Abstract(参考訳): ブースティングは、機械学習と統計コミュニティの両方で大きな関心を集めている。
従来のブーピングアルゴリズムは、完全に観測されたランダムなサンプルのために設計されており、現実世界の問題、特にインターバル検閲されたデータに悩まされることが多い。
この種のデータは、生存分析や、正確な事象時間が観測されていないが、既知の間隔に収まるような時間と時間の研究で一般的である。
このようなデータの効果的な処理は、医学研究、信頼性工学、社会科学などの分野において重要である。
そこで本研究では,時間間隔付きデータを用いた回帰・分類タスクのための新しい非パラメトリックブースティング手法を提案する。
モデル精度を維持しつつ,不偏変換の検閲を利用して損失関数を調整し,変換応答をインプットする。
これらの手法は機能的な勾配勾配によって実装され、スケーラビリティと適応性を保証する。
最適性と平均二乗誤差トレードオフを含む理論的性質を厳格に確立する。
提案手法は、間隔制限付きデータが一般的である領域において、予測精度を高めるための堅牢なフレームワークを提供するだけでなく、既存の作業も補完し、既存の強化技術の適用性を拡大する。
実験的な研究は、様々な有限サンプルシナリオにまたがるロバストな性能を示し、我々のアプローチの実用性を強調している。
関連論文リスト
- Explainable Human-in-the-Loop Segmentation via Critic Feedback Signals [0.20999222360659608]
セグメント化出力の人為的補正による介入学習を可能にする,ループ内対話型フレームワークを提案する。
筆者らのフレームワークは,挑戦的な立方体データに対して最大9mIoUポイントのセグメンテーション精度を向上させることを実証している。
この研究は、精度が高く、データセットバイアスに頑健で、データ効率が良く、都市気候モニタリングや自動運転といった現実世界の領域に適応可能なセグメンテーションシステムを構築するための、研究者や実践者のための実践的なフレームワークを提供する。
論文 参考訳(メタデータ) (2025-10-11T01:16:41Z) - Simple and Effective Specialized Representations for Fair Classifiers [8.489574504527196]
本稿では,特徴関数距離に基づく公平な分類手法を提案する。
特徴関数を利用することで,従来の手法に比べて安定で効率的な解が得られる。
本手法はロバスト性および計算効率を保ち,実世界の応用のための実用的な解法である。
論文 参考訳(メタデータ) (2025-05-16T22:59:46Z) - On the Interconnections of Calibration, Quantification, and Classifier Accuracy Prediction under Dataset Shift [58.91436551466064]
本稿では,データセットシフト条件下でのキャリブレーションと定量化の3つの基本問題間の相互接続について検討する。
これらのタスクのいずれか1つに対するオラクルへのアクセスは、他の2つのタスクの解決を可能にすることを示す。
本稿では,他の分野から借用した高度に確立された手法の直接適応に基づく各問題に対する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-05-16T15:42:55Z) - Instance-Specific Asymmetric Sensitivity in Differential Privacy [2.855485723554975]
我々は指数的メカニズムを通して出力を選択するためのパラダイムを提供する以前の作業の上に構築する。
我々のフレームワークは、近接度メートル法をわずかに修正し、スパースベクトル技法の単純かつ効率的な応用を提供する。
論文 参考訳(メタデータ) (2023-11-02T05:01:45Z) - Automatic Data Augmentation via Invariance-Constrained Learning [94.27081585149836]
下位のデータ構造は、しばしば学習タスクのソリューションを改善するために利用される。
データ拡張は、入力データに複数の変換を適用することで、トレーニング中にこれらの対称性を誘導する。
この作業は、学習タスクを解決しながらデータ拡張を自動的に適応することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2022-09-29T18:11:01Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Semantic Perturbations with Normalizing Flows for Improved
Generalization [62.998818375912506]
我々は、非教師付きデータ拡張を定義するために、潜在空間における摂動が利用できることを示す。
トレーニングを通して分類器に適応する潜伏性対向性摂動が最も効果的であることが判明した。
論文 参考訳(メタデータ) (2021-08-18T03:20:00Z) - Accurate and Robust Feature Importance Estimation under Distribution
Shifts [49.58991359544005]
PRoFILEは、新しい特徴重要度推定法である。
忠実さと頑健さの両面で、最先端のアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2020-09-30T05:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。