論文の概要: Fused Multinomial Logistic Regression Utilizing Summary-Level External Machine-learning Information
- arxiv url: http://arxiv.org/abs/2604.03939v1
- Date: Sun, 05 Apr 2026 02:37:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.841089
- Title: Fused Multinomial Logistic Regression Utilizing Summary-Level External Machine-learning Information
- Title(参考訳): 概要レベル外部機械学習情報を利用した融合多項ロジスティック回帰
- Authors: Chi-Shian Dai, Jun Shao,
- Abstract要約: 本稿では、モーメント制約による外部予測を組み込んだ一般的な経験的類似のフレームワークを提案する。
我々は,主モデルとして多項ロジスティック回帰に着目し,外部ソースにおける共通データ品質問題に対処する。
外部予測を組み込むと、一次のみの推定値に対して厳密な効率向上が得られる。
- 参考スコア(独自算出の注目度): 3.2819213801147282
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many modern applications, a carefully designed primary study provides individual-level data for interpretable modeling, while summary-level external information is available through black-box, efficient, and nonparametric machine-learning predictions. Although summary-level external information has been studied in the data integration literature, there is limited methodology for leveraging external nonparametric machine-learning predictions to improve statistical inference in the primary study. We propose a general empirical-likelihood framework that incorporates external predictions through moment constraints. An advantage of nonparametric machine-learning prediction is that it induces a rich class of valid moment restrictions that remain robust to covariate shift under a mild overlap condition without requiring explicit density-ratio modeling. We focus on multinomial logistic regression as the primary model and address common data-quality issues in external sources, including coarsened outcomes, partially observed covariates, covariate shift, and heterogeneity in generating mechanisms known as concept shift. We establish large-sample properties of the resulting fused estimator, including consistency and asymptotic normality under regularity conditions. Moreover, we provide mild sufficient conditions under which incorporating external predictions delivers a strict efficiency gain relative to the primary-only estimator. Simulation studies and an application to the National Health and Nutrition Examination Survey on multiclass blood-pressure classification.
- Abstract(参考訳): 現代の多くのアプリケーションにおいて、注意深く設計された一次研究は、解釈可能なモデリングのための個別レベルのデータを提供し、一方、要約レベルの外部情報はブラックボックス、効率的、非パラメトリックな機械学習予測を通じて利用可能である。
データ統合文献では,要約レベルの外部情報が研究されているが,外部の非パラメトリック機械学習予測を活用して統計的推測を改善する手法は限られている。
本稿では、モーメント制約による外部予測を組み込んだ一般的な経験的類似のフレームワークを提案する。
非パラメトリック機械学習予測の利点は、明示的な密度比のモデリングを必要とせず、わずかに重なり合う条件下で共変量シフトに頑健な、有効なモーメント制約の豊富なクラスを誘導することである。
本稿では,基本モデルとしての多項ロジスティック回帰に着目し,粗大化結果,部分的に観察された共変量,共変量シフト,概念シフトとして知られるメカニズム生成における不均一性など,外部ソースにおける共通データ品質問題に対処する。
我々は, 正則性条件下での整合性や漸近正規性を含む融解推定器の大サンプル特性を確立する。
さらに,外部予測を組み込むことで,主成分のみの推定値に対して厳密な効率向上が達成できる,穏やかな条件を提供する。
マルチクラス血圧分類に関する全国健康栄養検査調査へのシミュレーション研究と応用
関連論文リスト
- STAR : Bridging Statistical and Agentic Reasoning for Large Model Performance Prediction [78.0692157478247]
本稿では,知識駆動型エージェント推論を用いて,データ駆動型静的予測を橋渡しするフレームワークSTARを提案する。
STARはスコアベースとランクベースの両方の基準線を一貫して上回ることを示す。
論文 参考訳(メタデータ) (2026-02-12T16:30:07Z) - Fast Rates for Nonstationary Weighted Risk Minimization [6.015898117103068]
本稿では,非定常条件下でのサンプル外予測誤差について検討する。
本稿では,過大リスクを学習項と分布ドリフトに関連する誤り項に一般化する。
論文 参考訳(メタデータ) (2026-02-05T15:10:07Z) - Machine-Learning-Assisted Comparison of Regression Functions [6.536054952579518]
統計的推論の基本的な問題である回帰関数を比較するという古典的問題を再考する。
等回帰関数のヌル仮説を新たに特徴づけるカーネルベースの条件付き平均依存性の新たな概念を提案する。
フレキシブルな推定に近代的な機械学習手法を利用する2つの新しいテストを開発した。
論文 参考訳(メタデータ) (2025-10-28T17:59:15Z) - Multiply Robust Conformal Risk Control with Coarsened Data [0.0]
コンフォーマル予測(CP)は近年,膨大な関心を集めている。
本稿では、粗いデータから得られる結果に対して、分布自由な有効予測領域を得るという一般的な問題について考察する。
半パラメトリック理論の原則的利用は、フレキシブルな機械学習手法の促進の鍵となる利点を持つ。
論文 参考訳(メタデータ) (2025-08-21T12:14:44Z) - Robust Molecular Property Prediction via Densifying Scarce Labeled Data [53.24886143129006]
薬物発見において、研究を進める上で最も重要な化合物は、しばしば訓練セットを越えている。
本稿では, ラベル付きデータを利用して, 分布内データ(ID)と分布外データ(OOD)を補間する2段階最適化手法を提案する。
論文 参考訳(メタデータ) (2025-06-13T15:27:40Z) - Modelling higher education dropouts using sparse and interpretable post-clustering logistic regression [0.8437187555622164]
高等教育のドロップアウトは、世界中の第三次教育システムにとって重要な課題である。
本稿では,ロジスティック回帰の特殊形式として,大学ドロップアウト分析の文脈に特化して導入したモデルについて述べる。
論文 参考訳(メタデータ) (2025-05-12T14:05:23Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Supervised Multivariate Learning with Simultaneous Feature Auto-grouping
and Dimension Reduction [7.093830786026851]
本稿では,クラスタ化低ランク学習フレームワークを提案する。
2つの合同行列正則化を課し、予測因子を構成する特徴を自動的にグループ化する。
低ランクなモデリングよりも解釈可能であり、変数選択における厳密な空間性仮定を緩和する。
論文 参考訳(メタデータ) (2021-12-17T20:11:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。