論文の概要: Multi-Modal Multi-Task Semantic Communication: A Distributed Information Bottleneck Perspective
- arxiv url: http://arxiv.org/abs/2510.04000v1
- Date: Sun, 05 Oct 2025 02:18:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-07 16:52:59.384466
- Title: Multi-Modal Multi-Task Semantic Communication: A Distributed Information Bottleneck Perspective
- Title(参考訳): マルチモーダルマルチタスクセマンティックコミュニケーション:分散情報基盤の視点から
- Authors: Yujie Zhou, Yiwei Liao, Cheng Peng, Yong Xiao, Yingyu Li,
- Abstract要約: マルチモーダルマルチタスクのための既存のAIベースのコーディングスキーム SemComは、すべてのタスクに参加するために、フルモーダルデータを持つ送信機を必要とすることが多い。
本稿では,分散情報ボトルネック理論を拡張した新しいフレームワークPoM$2$-DIBを提案する。
本稿では,PoM$2$-DIBが,物理制約下での各種タスクにおける全参加ベースラインと比較して高い推論品質を実現することを示す。
- 参考スコア(独自算出の注目度): 8.487773417911042
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic communication (SemCom) shifts the focus from data transmission to meaning delivery, enabling efficient and intelligent communication. Existing AI-based coding schemes for multi-modal multi-task SemCom often require transmitters with full-modal data to participate in all receivers' tasks, which leads to redundant transmissions and conflicts with the physical limits of channel capacity and computational capability. In this paper, we propose PoM$^2$-DIB, a novel framework that extends the distributed information bottleneck (DIB) theory to address this problem. Unlike the typical DIB, this framework introduces modality selection as an additional key design variable, enabling a more flexible tradeoff between communication rate and inference quality. This extension selects only the most relevant modalities for task participation, adhering to the physical constraints, while following efficient DIB-based coding. To optimize selection and coding end-to-end, we relax modality selection into a probabilistic form, allowing the use of score function estimation with common randomness to enable optimizable coordinated decisions across distributed devices. Experimental results on public datasets verify that PoM$^2$-DIB achieves high inference quality compared to full-participation baselines in various tasks under physical limits.
- Abstract(参考訳): セマンティックコミュニケーション(Semantic Communication, SemCom)は、データ転送からデリバリの意味へと焦点を移し、効率的でインテリジェントなコミュニケーションを可能にする。
既存のマルチモーダルマルチタスクのためのAIベースのコーディングスキーム SemComは、すべてのレシーバのタスクに参加するために、フルモーダルデータを持つ送信機を必要とすることが多い。
本稿では,分散情報ボトルネック(DIB)理論を拡張した新しいフレームワークPoM$^2$-DIBを提案する。
典型的なDIBとは異なり、このフレームワークはモダリティ選択を付加的な設計変数として導入し、通信速度と推論品質のより柔軟なトレードオフを可能にする。
この拡張は、効率的なDIBベースのコーディングに従いながら、物理的な制約に忠実なタスク参加のための最も関連性の高いモダリティのみを選択する。
選択とエンドツーエンドのコーディングを最適化するため,分散デバイス間で最適化可能な座標決定を可能にするために,スコア関数を共通ランダム性で推定することで,モダリティ選択を確率的形式に緩和する。
公開データセットにおける実験結果から,PoM$^2$-DIBは,物理制約下での各種タスクにおける全参加ベースラインと比較して高い推論品質が得られることが示された。
関連論文リスト
- Token Communication in the Era of Large Models: An Information Bottleneck-Based Approach [55.861432910722186]
UniToComは、トークンを処理と無線通信の両方の基本的な単位として扱う統一トークン通信パラダイムである。
本稿では,重要な情報を保持するトークンの学習を容易にする生成情報ボトルネック(GenIB)の原理を提案する。
我々は、離散トークンと連続トークンの両方の処理を統合するために、因果変換器に基づくマルチモーダル言語モデル(MLLM)を受信機に採用する。
論文 参考訳(メタデータ) (2025-07-02T14:03:01Z) - Task-Oriented Multimodal Token Transmission in Resource-Constrained Multiuser Networks [19.42660454288912]
本稿では,効率的なマルチモーダル情報融合と利用のためのタスク指向マルチモーダルトークン伝送方式を提案する。
モーダル間の整合性とタスク関連トークン伝送を改善するために,2段階のトレーニングアルゴリズムを設計する。
また、レイテンシと推論性能に対する重み付きサム最適化問題を定式化する。
論文 参考訳(メタデータ) (2025-05-06T14:17:05Z) - Take What You Need: Flexible Multi-Task Semantic Communications with Channel Adaptation [51.53221300103261]
本稿では,マスク付きオートエンコーダアーキテクチャに基づく,チャネル適応型・マルチタスク対応のセマンティックコミュニケーションフレームワークについて紹介する。
チャネル認識抽出器を用いて、リアルタイムのチャネル条件に応じて、関連情報を動的に選択する。
画像再構成や物体検出などのタスクにおける従来の手法と比較して,本手法の優れた性能を示す実験結果が得られた。
論文 参考訳(メタデータ) (2025-02-12T09:01:25Z) - A Multi-Head Ensemble Multi-Task Learning Approach for Dynamical
Computation Offloading [62.34538208323411]
共有バックボーンと複数の予測ヘッド(PH)を組み合わせたマルチヘッドマルチタスク学習(MEMTL)手法を提案する。
MEMTLは、追加のトレーニングデータを必要とせず、推測精度と平均平方誤差の両方でベンチマーク手法より優れている。
論文 参考訳(メタデータ) (2023-09-02T11:01:16Z) - Multi-Receiver Task-Oriented Communications via Multi-Task Deep Learning [49.83882366499547]
本稿では、送信機が複数の受信機と通信する環境でのタスク指向通信について検討する。
複数のタスクを完了し、複数の受信機と通信する共同最適化のためのマルチタスク深層学習手法を提案する。
論文 参考訳(メタデータ) (2023-08-14T01:34:34Z) - Communication-Efficient Framework for Distributed Image Semantic
Wireless Transmission [68.69108124451263]
IoTデバイスを用いたマルチタスク分散画像伝送のためのFederated Learning-based semantic communication (FLSC)フレームワーク。
各リンクは階層型視覚変換器(HVT)ベースの抽出器とタスク適応トランスレータで構成される。
チャネル状態情報に基づく多重出力多重出力伝送モジュール。
論文 参考訳(メタデータ) (2023-08-07T16:32:14Z) - Rate-Adaptive Coding Mechanism for Semantic Communications With
Multi-Modal Data [23.597759255020296]
本稿では,従来のチャネルエンコーダ/デコーダを組み込んだ分散マルチモーダルセマンティック通信フレームワークを提案する。
様々な種類のマルチモーダルなセマンティックタスクに対して、一般的なレート適応型符号化機構を確立する。
シミュレーションの結果,提案手法は従来のコミュニケーションシステムと既存のセマンティック通信システムより優れていることがわかった。
論文 参考訳(メタデータ) (2023-05-18T07:31:37Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Task-Oriented Communication for Multi-Device Cooperative Edge Inference [14.249444124834719]
協調エッジ推論は、単一デバイスの限られた感知能力を克服することができるが、通信オーバーヘッドを大幅に増加させ、過度の遅延を引き起こす可能性がある。
タスク指向方式で局所特徴抽出と分散特徴符号化を最適化する学習型通信方式を提案する。
論文 参考訳(メタデータ) (2021-09-01T03:56:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。