論文の概要: Toward Calibrated Mixture-of-Experts Under Distribution Shift
- arxiv url: http://arxiv.org/abs/2606.20544v1
- Date: Thu, 18 Jun 2026 17:55:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:40.042692
- Title: Toward Calibrated Mixture-of-Experts Under Distribution Shift
- Title(参考訳): 分散シフト下におけるキャリブレーション・オブ・エクササイズに向けて
- Authors: Gina Wong, Drew Prinster, Suchi Saria, Rama Chellappa, Anqi Liu,
- Abstract要約: 分散シフトの幅の広いクラスにおいて, モデル全体のキャリブレーションを確保するのに, 専門家のキャリブレーションが十分であることを示す。
そこで本研究では,分布シフト下での経路集合のキャリブレーション誤差をペナル化する逆方向再重み付けを提案する。
- 参考スコア(独自算出の注目度): 43.193848309099614
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Calibration aligns a model's predictive uncertainty with the frequencies of its empirical outcomes and is important for understanding and trusting reported probabilities. Recent work shows that enforcing calibration at the level of individual predictors can improve ensemble accuracy and calibration, with mixture-of-experts (MoE) models showing strong empirical improvements in particular; however, the conditions under which calibration helps MoE are not well understood. In this work, we study how MoE models behave under distribution shift, focusing on how routing mechanisms interact with expert-level calibration. We show that expert calibration is sufficient to ensure calibration of the overall model under a broad class of distribution shifts in hard-routed models, but is insufficient for calibrating soft-routed models. To address this, we propose an adversarial reweighting that penalizes calibration errors of the routed aggregate under distribution shift, and we demonstrate that it improves the accuracy-calibration tradeoff both on average and on difficult subsets of the data, across model classes, prediction tasks, and distribution shifts.
- Abstract(参考訳): キャリブレーションは、モデルの予測の不確実性を経験的な結果の頻度と整合させ、報告された確率を理解し信頼するために重要である。
近年の研究では,個々の予測器レベルでのキャリブレーションを実施すれば,特に実験的改善が強く,アンサンブル精度とキャリブレーションが向上することが示されているが,キャリブレーションがMoEに寄与する条件はよく分かっていない。
本研究では,ルーティング機構が専門家レベルのキャリブレーションとどのように相互作用するかに着目し,分散シフトの下でMoEモデルがどのように振る舞うかを検討する。
ハードロートモデルにおける分布シフトの幅の広いクラスにおいて, モデル全体のキャリブレーションを確保するのに, 専門家のキャリブレーションが十分であることを示すが, ソフトロートモデルのキャリブレーションには不十分である。
そこで本研究では,分散シフト下での経路集合の校正誤差をペナルティ化する逆方向再重み付けを提案するとともに,モデルクラス,予測タスク,分布シフトなどを通じて,データの平均値および難解部分集合上での精度校正トレードオフを改善することを実証する。
関連論文リスト
- CalibrateMix: Guided-Mixup Calibration of Image Semi-Supervised Models [49.588973929678765]
CalibrateMixは、SSLモデルのキャリブレーションを改善することを目的とした、ミックスアップベースのアプローチである。
提案手法は,既存のSSL手法と比較して,期待校正誤差(ECE)の低減と精度の向上を実現している。
論文 参考訳(メタデータ) (2025-11-17T04:43:53Z) - Beyond One-Hot Labels: Semantic Mixing for Model Calibration [22.39558434131574]
textbfCalibration-aware Semantic Mixing (CSM) は、クラス特性の混合したトレーニングサンプルを生成する新しいフレームワークである。
我々はCSMが最先端のキャリブレーション手法よりも優れたキャリブレーションを実現することを示す。
論文 参考訳(メタデータ) (2025-04-18T08:26:18Z) - Reassessing How to Compare and Improve the Calibration of Machine Learning Models [7.183341902583164]
結果の予測確率がモデル予測に基づいてその結果の観測周波数と一致した場合、機械学習モデルを校正する。
キャリブレーションと予測の指標が追加の一般化の指標を伴わない限り、最先端のように見えるような簡単な再校正手法が存在することを示す。
論文 参考訳(メタデータ) (2024-06-06T13:33:45Z) - Calibrating Large Language Models with Sample Consistency [76.23956851098598]
本稿では,複数サンプルモデル生成系の分布から信頼度を導出する可能性について,一貫性の3つの尺度を用いて検討する。
その結果、一貫性に基づくキャリブレーション手法は、既存のポストホック手法よりも優れていることがわかった。
種々のLMの特性に合わせて,キャリブレーションに適した整合性指標を選択するための実用的なガイダンスを提供する。
論文 参考訳(メタデータ) (2024-02-21T16:15:20Z) - Calibration by Distribution Matching: Trainable Kernel Calibration
Metrics [56.629245030893685]
カーネルベースのキャリブレーションメトリクスを導入し、分類と回帰の両方で一般的なキャリブレーションの形式を統一・一般化する。
これらの指標は、異なるサンプル推定を許容しており、キャリブレーションの目的を経験的リスク最小化に組み込むのが容易である。
決定タスクにキャリブレーションメトリクスを調整し、正確な損失推定を行ない、後悔しない決定を行うための直感的なメカニズムを提供する。
論文 参考訳(メタデータ) (2023-10-31T06:19:40Z) - On Calibrating Semantic Segmentation Models: Analyses and An Algorithm [51.85289816613351]
セマンティックセグメンテーションキャリブレーションの問題について検討する。
モデルキャパシティ、作物サイズ、マルチスケールテスト、予測精度はキャリブレーションに影響を及ぼす。
我々は、単純で統一的で効果的なアプローチ、すなわち選択的スケーリングを提案する。
論文 参考訳(メタデータ) (2022-12-22T22:05:16Z) - Fair admission risk prediction with proportional multicalibration [0.16249424686052708]
マルチキャリブレーション制約は、柔軟に定義されたサブポピュレーション間のキャリブレーション誤差を補正する。
意思決定者は特定のグループに対するモデル予測を信頼するか、不信にするかを学ぶことができる。
本稿では,グループ間および予測ビン内における正の校正誤差を制限する基準である比例多重校正を提案する。
論文 参考訳(メタデータ) (2022-09-29T08:15:29Z) - Unsupervised Calibration under Covariate Shift [92.02278658443166]
ドメインシフト下でのキャリブレーションの問題を導入し、それに対処するための重要サンプリングに基づくアプローチを提案する。
実世界のデータセットと合成データセットの両方において,本手法の有効性を評価し検討した。
論文 参考訳(メタデータ) (2020-06-29T21:50:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。