論文の概要: Communication-Efficient Multi-Modal Edge Inference via Uncertainty-Aware Distributed Learning
- arxiv url: http://arxiv.org/abs/2601.14942v1
- Date: Wed, 21 Jan 2026 12:38:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.356351
- Title: Communication-Efficient Multi-Modal Edge Inference via Uncertainty-Aware Distributed Learning
- Title(参考訳): 不確実性を考慮した分散学習によるコミュニケーション効率の良いマルチモーダルエッジ推論
- Authors: Hang Zhao, Hongru Li, Dongfang Xu, Shenghui Song, Khaled B. Letaief,
- Abstract要約: トレーニングと推論効率を向上させるために,3段階のコミュニケーション対応分散学習フレームワークを提案する。
StageIでは、デバイスがローカルなマルチモーダルな自己教師型学習を行い、デバイス-サーバ交換なしで共有およびモダリティ固有のエンコーダを得る。
集中的な顕在的融合校正による分散微調整は、モダリティごとの不確かさを解消し、ノイズやチャネルのフェーディングによって歪んだ特徴を確実に集約する。
不確実性誘導フィードバック機構であるStageIIIは、分散環境での通信精度のトレードオフを最適化し、不確実なサンプルに対する追加機能を選択的に要求する。
- 参考スコア(独自算出の注目度): 60.650628083185616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic communication is emerging as a key enabler for distributed edge intelligence due to its capability to convey task-relevant meaning. However, achieving communication-efficient training and robust inference over wireless links remains challenging. This challenge is further exacerbated for multi-modal edge inference (MMEI) by two factors: 1) prohibitive communication overhead for distributed learning over bandwidth-limited wireless links, due to the \emph{multi-modal} nature of the system; and 2) limited robustness under varying channels and noisy multi-modal inputs. In this paper, we propose a three-stage communication-aware distributed learning framework to improve training and inference efficiency while maintaining robustness over wireless channels. In Stage~I, devices perform local multi-modal self-supervised learning to obtain shared and modality-specific encoders without device--server exchange, thereby reducing the communication cost. In Stage~II, distributed fine-tuning with centralized evidential fusion calibrates per-modality uncertainty and reliably aggregates features distorted by noise or channel fading. In Stage~III, an uncertainty-guided feedback mechanism selectively requests additional features for uncertain samples, optimizing the communication--accuracy tradeoff in the distributed setting. Experiments on RGB--depth indoor scene classification show that the proposed framework attains higher accuracy with far fewer training communication rounds and remains robust to modality degradation or channel variation, outperforming existing self-supervised and fully supervised baselines.
- Abstract(参考訳): タスク関連の意味を伝達する能力のため、分散エッジインテリジェンスにとって、セマンティック通信が重要な実現手段として浮上している。
しかし、無線リンク上での通信効率のトレーニングと堅牢な推論を実現することは依然として困難である。
この課題は、MMEI(Multi-modal edge inference)の2つの要因によってさらに悪化する。
1) 帯域幅に制限のある無線リンク上での分散学習における通信オーバーヘッドの禁止。
2) 異なるチャネルとノイズの多いマルチモーダル入力下でのロバスト性は限定的であった。
本稿では,無線チャネル上でのロバスト性を維持しつつ,トレーニングと推論効率を向上させるための3段階コミュニケーション対応分散学習フレームワークを提案する。
ステージ~Iでは、デバイスサーバ交換を使わずに、ローカルなマルチモーダルな自己教師型学習を行い、通信コストを削減できる。
ステージ~IIでは、集中的な顕在的融合校正による微調整は、モダリティごとの不確かさを解消し、ノイズやチャネルのフェーディングによって歪んだ特徴を確実に集約する。
第III段~第3段において、不確実性誘導フィードバック機構は、分散環境での通信精度のトレードオフを最適化し、不確実なサンプルに対する追加機能を選択的に要求する。RGBの詳細な屋内シーン分類実験により、提案するフレームワークは、訓練用通信ラウンドをはるかに少なく、かつ、モダリティ劣化やチャネル変動に頑健であり、既存の自己監督的かつ完全に監督されたベースラインを上回っていることが示された。
関連論文リスト
- RIS-aided Latent Space Alignment for Semantic Channel Equalization [10.555901476981923]
我々は,無線通信において,厳密なビットレベルの精度を保証するのではなく,意図した意味を伝達することに焦点を当てた新しいパラダイムを導入する。
これらのシステムは、しばしばデータから直接意味を学習し、エンコードするためにディープニューラルネットワーク(DNN)に依存しており、より効率的な通信を可能にしている。
本研究では、再構成可能なインテリジェントサーフェス(RIS)の存在を利用する物理・意味チャネル等化フレームワークを提案する。
提案手法は, 様々なシナリオや無線チャネル条件において, 従来型, 意味的, 意味的, 意味的チャネル等化へのアプローチを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2025-07-22T10:51:35Z) - Distributionally Robust Wireless Semantic Communication with Large AI Models [111.47794569742206]
現在のSemComシステムは、様々なノイズ条件、敵攻撃、アウト・オブ・ディストリビューション・データにまたがる一般化に失敗している。
Wassersteinは、意味的誤解釈やチャネル摂動に対するレジリエンスを提供するために、分布的に堅牢な最適化を採用している。
画像とテキストの伝送実験の結果、WaSeComは雑音や逆方向の摂動下で頑健性の向上を実現していることがわかった。
論文 参考訳(メタデータ) (2025-05-28T04:03:57Z) - Multi-Modal Self-Supervised Semantic Communication [52.76990720898666]
本稿では,マルチモーダルな自己教師型学習を活用し,タスク非依存の特徴抽出を強化するマルチモーダルセマンティックコミュニケーションシステムを提案する。
提案手法は,訓練関連通信オーバーヘッドを最小限に抑えつつ,モダリティの不変性とモダリティ特有の特徴の両方を効果的に捉えている。
この結果は、セマンティックコミュニケーションにおけるマルチモーダルな自己教師型学習の利点を浮き彫りにし、より効率的でスケーラブルなエッジ推論システムへの道を開いた。
論文 参考訳(メタデータ) (2025-03-18T06:13:02Z) - Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - Latent Diffusion Model-Enabled Low-Latency Semantic Communication in the Presence of Semantic Ambiguities and Wireless Channel Noises [18.539501941328393]
本稿では,ソースデータのアウトレイラを処理するために,遅延拡散モデルを用いたSemComシステムを開発した。
軽量な単層遅延空間変換アダプタは、送信機でのワンショット学習を完了させる。
終端整合蒸留法を用いて, 潜時空間で訓練した拡散模型を蒸留する。
論文 参考訳(メタデータ) (2024-06-09T23:39:31Z) - Low-Latency Federated Learning over Wireless Channels with Differential
Privacy [142.5983499872664]
フェデレートラーニング(FL)では、モデルトレーニングはクライアントに分散し、ローカルモデルは中央サーバによって集約される。
本稿では,各クライアントの差分プライバシ(DP)要件だけでなく,全体としてのトレーニング性能に制約された無線チャネル上でのFLトレーニング遅延を最小限に抑えることを目的とする。
論文 参考訳(メタデータ) (2021-06-20T13:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。