論文の概要: SAGE: Training-Free Semantic Evidence Composition for Edge-Cloud Inference under Hard Uplink Budgets
- arxiv url: http://arxiv.org/abs/2604.19623v1
- Date: Tue, 21 Apr 2026 16:11:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.861071
- Title: SAGE: Training-Free Semantic Evidence Composition for Edge-Cloud Inference under Hard Uplink Budgets
- Title(参考訳): SAGE:ハードアップリンク予算下でのエッジクラウド推論のためのトレーニング不要なセマンティックエビデンス構成
- Authors: Inhyeok Choi, Hyuncheol Park,
- Abstract要約: 本研究は,共同推論における標準的アプローチである注意力に基づく重要度のみに基づく送信コンテンツの選択が,本質的にハード予算の下で制限されていることを示す。
SAGE(Semantic Attention-Guided Evidence)は,重要フィルタリングと埋め込み多様性サンプリングを組み合わせた,原則付き,トレーニング不要な手法である。
- 参考スコア(独自算出の注目度): 1.0742675209112622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge-cloud hybrid inference offloads difficult inputs to a powerful remote model, but the uplink channel imposes hard per-request constraints on the number of bits that can be transmitted. We show that selecting transmitted content based solely on attention-based importance, the standard approach in collaborative inference, is inherently limited under hard budgets. Two findings support this claim. First, replacing high-importance units with low-importance but complementary ones improves server accuracy. This shows that what matters is not individual importance but how well the transmitted set covers diverse aspects of the input. Second, spatially uniform selection without any content information achieves competitive accuracy at moderate budgets. This confirms that spatial coverage alone carries independent value. Based on this analysis, we propose SAGE (Semantic Attention-Guided Evidence), a principled, training-free method that combines importance filtering with embedding-diversity sampling. SAGE achieves 93% of the server ceiling in offloaded accuracy while transmitting fewer than half of the available evidence units on ImageNet-1K, substantially outperforming importance-only composition.
- Abstract(参考訳): エッジクラウドハイブリッド推論は、強力なリモートモデルに困難な入力をオフロードするが、アップリンクチャネルは送信可能なビット数に対して、リクエスト毎の厳しい制約を課す。
本研究は,共同推論における標準的アプローチである注意力に基づく重要度のみに基づく送信コンテンツの選択が,本質的にハード予算の下で制限されていることを示す。
2つの発見がこの主張を支持している。
まず、重要度の高いユニットを低重要性で置き換えることによって、サーバの精度が向上する。
これは、重要なことは個々の重要性ではなく、送信された集合が入力の様々な側面をいかにうまくカバーしているかを示している。
第二に、コンテンツ情報のない空間的に均一な選択は、適度な予算で競争精度を達成する。
これは、空間的カバレッジのみに独立した価値があることを示す。
そこで本研究では,SAGE(Semantic Attention-Guided Evidence)を提案する。
SAGEは、サーバの天井の93%をオフロード精度で達成し、ImageNet-1Kで利用可能なエビデンスユニットの半分以下を送信し、重要性のみの合成を著しく上回っている。
関連論文リスト
- Rethinking Multi-Condition DiTs: Eliminating Redundant Attention via Position-Alignment and Keyword-Scoping [61.459927600301654]
マルチコンディション制御は従来のコンカデント・アンド・アットエンドの戦略によってボトルネックとなる。
分析の結果,これらの相互作用の多くは空間的にも意味的にも冗長であることがわかった。
本稿では,これらの冗長性を解消するための高効率なフレームワークであるPKAを提案する。
論文 参考訳(メタデータ) (2026-02-06T16:39:10Z) - Is BatchEnsemble a Single Model? On Calibration and Diversity of Efficient Ensembles [2.957223821964636]
BatchEnsembleは、アンサンブルのような不確実性(EU)EUを、はるかに低いパラメータとメモリコストで提供することを目指している。
我々は,BatchEnsembleがDeep Ensemblesを過小評価するだけでなく,単一のモデルベースラインを密接に追跡していることを示す。
論文 参考訳(メタデータ) (2026-01-23T17:50:50Z) - Communication-Efficient Multi-Modal Edge Inference via Uncertainty-Aware Distributed Learning [60.650628083185616]
トレーニングと推論効率を向上させるために,3段階のコミュニケーション対応分散学習フレームワークを提案する。
StageIでは、デバイスがローカルなマルチモーダルな自己教師型学習を行い、デバイス-サーバ交換なしで共有およびモダリティ固有のエンコーダを得る。
集中的な顕在的融合校正による分散微調整は、モダリティごとの不確かさを解消し、ノイズやチャネルのフェーディングによって歪んだ特徴を確実に集約する。
不確実性誘導フィードバック機構であるStageIIIは、分散環境での通信精度のトレードオフを最適化し、不確実なサンプルに対する追加機能を選択的に要求する。
論文 参考訳(メタデータ) (2026-01-21T12:38:02Z) - JigsawComm: Joint Semantic Feature Encoding and Transmission for Communication-Efficient Cooperative Perception [7.867653563872962]
JigsawCommはエンドツーエンドのトレーニング、セマンティックアウェア、通信効率の良いCPフレームワークである。
正規化エンコーダを使用して、意味的関連性とスパースな特徴を抽出する。
軽量のFeature Utility Estimatorを使用して、各エージェントの機能を最終認識タスクへのコントリビューションを予測する。
論文 参考訳(メタデータ) (2025-11-21T23:36:24Z) - Market-Driven Subset Selection for Budgeted Training [1.7969777786551429]
それぞれのトレーニング例を取引可能な契約として扱う,市場ベースのフレームワークを提案する。
厳格な60kの予算の下でのGSM8Kの数学的推論では、セレクタは強い単一信号基底線でパリティを達成する。
本フレームワークは,逐次的推論および分類タスクのための固定的な計算予算の下で,多信号データキュレーションを統一する。
論文 参考訳(メタデータ) (2025-10-02T18:12:03Z) - Conformal Prediction for Zero-Shot Models [20.94974284175104]
分割共形予測パラダイムに基づくCLIPモデルの能力について検討する。
本稿では、キャリブレーションとクエリセットを併用してトランスダクティブを動作させるトランスダクティブ学習環境であるConf-OTを提案する。
論文 参考訳(メタデータ) (2025-05-30T15:16:19Z) - Every SAM Drop Counts: Embracing Semantic Priors for Multi-Modality Image Fusion and Beyond [52.486290612938895]
本稿では,Segment Anything Model (SAM) のセグメンテーションモデルからのセグメンテーション知識を利用して,融合結果の質を向上し,下流タスク適応性を実現する手法を提案する。
具体的には、SAMから高レベルなセマンティック・セマンティック・セマンティック・セマンティック・セマンティック・アテンション(SPA)モジュールを抽出し、永続リポジトリを介してソース情報を効率的に保持する。
本手法は,実運用効率を維持しつつ,高品質な視覚結果と下流タスク適応性のバランスを実現する。
論文 参考訳(メタデータ) (2025-03-03T06:16:31Z) - Collaborative Inference over Wireless Channels with Feature Differential Privacy [57.68286389879283]
複数の無線エッジデバイス間の協調推論は、人工知能(AI)アプリケーションを大幅に強化する可能性がある。
抽出された特徴を抽出することは、プロセス中に機密性の高い個人情報が暴露されるため、重大なプライバシーリスクをもたらす。
本稿では,ネットワーク内の各エッジデバイスが抽出された機能のプライバシを保護し,それらを中央サーバに送信して推論を行う,新たなプライバシ保存協調推論機構を提案する。
論文 参考訳(メタデータ) (2024-10-25T18:11:02Z) - From Channel Bias to Feature Redundancy: Uncovering the "Less is More" Principle in Few-Shot Learning [138.06600932634896]
ディープニューラルネットワークは、分散シフト中の新しいタスクへの表現の適応に失敗することが多い。
本稿では、この障害の背後にある中核的な障害であるチャネルバイアスを特定する。
数ショットのタスクでは、最も識別性の高い特徴次元の1-5%しか使用せず、分類精度が大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-10-05T19:00:49Z) - Distributed Contrastive Learning for Medical Image Segmentation [16.3860181959878]
監視されたディープラーニングは、高いパフォーマンスを達成するために大量のラベル付きデータを必要とします。
医用画像解析では、各サイトは限られた量のデータとラベルしか持たず、学習を効果的にしない。
アノテーションを限定した医用画像セグメンテーションのための2つのフェデレーション型自己教師型学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-07T20:47:05Z) - DICE: Diversity in Deep Ensembles via Conditional Redundancy Adversarial
Estimation [109.11580756757611]
メンバー間の多様性のおかげで、ディープアンサンブルは単一のネットワークよりもパフォーマンスが良い。
最近のアプローチでは、多様性を高めるための予測を規則化していますが、個々のメンバーのパフォーマンスも大幅に減少します。
DICEと呼ばれる新しいトレーニング基準を導入し、特徴間の素早い相関を減らして多様性を高める。
論文 参考訳(メタデータ) (2021-01-14T10:53:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。