論文の概要: Reliable Inference in Edge-Cloud Model Cascades via Conformal Alignment
- arxiv url: http://arxiv.org/abs/2510.17543v1
- Date: Mon, 20 Oct 2025 13:52:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.472044
- Title: Reliable Inference in Edge-Cloud Model Cascades via Conformal Alignment
- Title(参考訳): コンフォーマルアライメントによるエッジクラウドモデルカスケードの信頼性推論
- Authors: Jiayi Huang, Sangwoo Park, Nicola Paoletti, Osvaldo Simeone,
- Abstract要約: 条件付きカバレッジを維持する必要があるエッジクラウドカスケードについて検討する。
リスクレベルに対するユーザ制御でこの特性を認証するコンフォーマルアライメントに基づくカスケード機構を導入する。
- 参考スコア(独自算出の注目度): 30.8135853479509
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge intelligence enables low-latency inference via compact on-device models, but assuring reliability remains challenging. We study edge-cloud cascades that must preserve conditional coverage: whenever the edge returns a prediction set, it should contain the true label with a user-specified probability, as if produced by the cloud model. We formalize conditional coverage with respect to the cloud predictive distribution, and introduce a conformal alignment-based (CAb) cascading mechanism that certifies this property with user control over the risk level. Our method casts escalation from edge to cloud models as a multiple-hypothesis testing (MHT) problem, tailoring conformal alignment (CA) to select which inputs can be safely handled at the edge. The proposed CAb model cascading method yields statistical guarantees on the average fraction of edge decisions that satisfy cloud-level conditional coverage. The procedure applies to arbitrary edge prediction sets, including variants of conformal prediction (CP), and exposes a tunable trade-off among coverage, deferral rate, and set size. Experiments on CIFAR-100 image classification and the TeleQnA question-answering (QA) benchmark show that the proposed CAb cascade maintains the target conditional coverage for edge predictions while substantially reducing offloading to the cloud and incurring modest increases in prediction-set size.
- Abstract(参考訳): エッジインテリジェンスにより、コンパクトなオンデバイスモデルによる低レイテンシ推論が可能になるが、信頼性の保証は依然として難しい。
エッジが予測セットを返却するたびに、クラウドモデルで生成されたような、ユーザ指定の確率を持つ真のラベルを含むべきである。
我々は,クラウド予測分布に関する条件付きカバレッジを形式化し,リスクレベルに対するユーザ制御でこの特性を認証する適合アライメントベース(CAb)カスケーディング機構を導入する。
提案手法は, エッジからクラウドモデルへのエスカレーションをマルチハイプセシステスト (MHT) 問題として, エッジでどの入力を安全に処理できるかを選択するための整列アライメント (CA) を調整する。
提案したCAbモデルカスケーディング手法は,クラウドレベルの条件付きカバレッジを満たすエッジ決定の平均的な割合を統計的に保証する。
この手順は、共形予測(CP)の変種を含む任意のエッジ予測セットに適用され、カバー範囲、遅延レート、セットサイズの調整可能なトレードオフを公開する。
CIFAR-100画像分類とTeleQnAQanwering(QA)ベンチマークの実験により、提案したCAbカスケードは、エッジ予測の目標条件付きカバレッジを維持しつつ、クラウドへのオフロードを大幅に削減し、予測セットサイズのモデスト増加を招くことを示した。
関連論文リスト
- COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Online Conformal Probabilistic Numerics via Adaptive Edge-Cloud Offloading [52.499838151272016]
本研究は, PLS が生成する HPD 集合を, 長期のカバレッジ要件を保証するため, キャリブレーションする手法を提案する。
提案手法は,クラウドからエッジへの散発的なフィードバックを前提としたオンライン共形予測PLS (OCP-PLS) と呼ばれる。
OCP-PLSの有効性は、カバレッジ、予測セットサイズ、クラウド利用のトレードオフに関する洞察をもたらす実験を通じて検証される。
論文 参考訳(メタデータ) (2025-03-18T17:30:26Z) - Conformal Prediction Sets with Improved Conditional Coverage using Trust Scores [52.92618442300405]
有限サンプルにおいて、正確に分布のない条件付きカバレッジを達成することは不可能である。
本稿では,最も重要となる範囲を対象とするコンフォメーション予測アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-01-17T12:01:56Z) - Distilling Calibration via Conformalized Credal Inference [30.8135853479509]
信頼性を高める方法の1つは、ベイズ推定による不確実な定量化である。
本稿では,より複雑なモデルからキャリブレーション情報を抽出することにより,この問題に対処する低複雑さ手法を提案する。
視覚的および言語的タスクの実験により,提案手法はCD-CI (Conformalized Distillation for Credal Inference) と呼ばれ,校正性能が著しく向上することが示された。
論文 参考訳(メタデータ) (2025-01-10T15:57:23Z) - Approximate Conditional Coverage via Neural Model Approximations [0.030458514384586396]
実験的に信頼性の高い近似条件付きカバレッジを得るためのデータ駆動手法を解析する。
我々は、限界範囲のカバレッジ保証を持つ分割型代替案で、実質的な(そして、そうでない)アンダーカバーの可能性を実証する。
論文 参考訳(メタデータ) (2022-05-28T02:59:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。