論文の概要: Synesthesia of Machines (SoM)-Based Task-Driven MIMO System for Image Transmission
- arxiv url: http://arxiv.org/abs/2509.02031v1
- Date: Tue, 02 Sep 2025 07:19:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.938952
- Title: Synesthesia of Machines (SoM)-Based Task-Driven MIMO System for Image Transmission
- Title(参考訳): 画像伝送のためのSoMに基づくタスク駆動MIMOシステムの合成
- Authors: Sijiang Li, Rongqing Zhang, Xiang Cheng, Jian Tang,
- Abstract要約: 本稿では,タスク駆動型マルチインプット・マルチインプット・マルチアウトプット(MIMO)システムを提案する。
SoM-MIMOはSNRのすべてのレベルにおいて平均6.30と10.48のmAP改善を実現し、通信オーバーヘッドは同一である。
- 参考スコア(独自算出の注目度): 24.440335179487388
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To support cooperative perception (CP) of networked mobile agents in dynamic scenarios, the efficient and robust transmission of sensory data is a critical challenge. Deep learning-based joint source-channel coding (JSCC) has demonstrated promising results for image transmission under adverse channel conditions, outperforming traditional rule-based codecs. While recent works have explored to combine JSCC with the widely adopted multiple-input multiple-output (MIMO) technology, these approaches are still limited to the discrete-time analog transmission (DTAT) model and simple tasks. Given the limited performance of existing MIMO JSCC schemes in supporting complex CP tasks for networked mobile agents with digital MIMO communication systems, this paper presents a Synesthesia of Machines (SoM)-based task-driven MIMO system for image transmission, referred to as SoM-MIMO. By leveraging the structural properties of the feature pyramid for perceptual tasks and the channel properties of the closed-loop MIMO communication system, SoM-MIMO enables efficient and robust digital MIMO transmission of images. Experimental results have shown that compared with two JSCC baseline schemes, our approach achieves average mAP improvements of 6.30 and 10.48 across all SNR levels, while maintaining identical communication overhead.
- Abstract(参考訳): 動的シナリオにおけるネットワーク型移動エージェントの協調認識(CP)を支援するためには,センサデータの効率的かつロバストな伝達が不可欠である。
ディープラーニングに基づくジョイントソースチャネル符号化(JSCC)は、従来のルールベースのコーデックよりも優れた、有害なチャネル条件下でのイメージ伝送の有望な結果を実証している。
最近の研究は、JSCCと広く採用されているMultiple-Input Multi-output (MIMO)技術を組み合わせているが、これらのアプローチは依然として離散時間アナログ伝送(DTAT)モデルと単純なタスクに限られている。
デジタルMIMO通信システムを用いたネットワーク化された移動体エージェントの複雑なCPタスクに対する既存のMIMO JSCC方式の限られた性能を考慮し,SoM-MIMOと呼ばれる画像伝送のためのSynesthesia of Machines(SoM)ベースのタスク駆動MIMOシステムを提案する。
SoM-MIMOは,特徴ピラミッドの構造特性と閉ループMIMO通信システムのチャネル特性を利用して,画像の効率的なデジタルMIMO伝送を可能にする。
実験の結果,JSCCのベースラインスキームを2つ比較すると,SNRのすべてのレベルにおいて平均mAPが6.30と10.48に向上し,通信オーバーヘッドは同一であることがわかった。
関連論文リスト
- Synergistic Localization and Sensing in MIMO-OFDM Systems via Mixed-Integer Bilevel Learning [7.475378160764602]
高性能なローカライゼーションとセンシングシステムは、ネットワーク効率と新たなインテリジェントアプリケーションに不可欠である。
チャネル状態情報(CSI)とディープラーニングを統合することが,近年,有望なソリューションとして浮上している。
この研究は、その潜在的なシナジーを活用するために、局所化タスクとセンシングタスクを共同でモデル化し、最適化することを目的としている。
論文 参考訳(メタデータ) (2025-07-07T06:34:22Z) - Large Language Model-Driven Distributed Integrated Multimodal Sensing and Semantic Communications [5.646293779615063]
本稿では,新しい大規模言語モデル (LLM) による分散分散マルチモーダルセンシングとセマンティックコミュニケーションフレームワークを提案する。
具体的には、RFモジュールとカメラモジュールを備えた複数の協調センシング装置で構成されている。
Genesis シミュレーションエンジンにより生成された合成多視点RF-視覚データセットの評価結果から,LLM-DiSAC が良好な性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-05-20T08:00:00Z) - Universal Approximation with XL MIMO Systems: OTA Classification via Trainable Analog Combining [22.304086107929137]
適切なアナログ合成成分を持つeXtremely Large (XL) Multi-Input Multiple-Output (MIMO) 無線システムは,フィードフォワードニューラルネットワークと同様に,ユニバーサル関数近似器の特性を示す。
本稿では,従来のデジタル処理やプリプロセッシングを必要とせず,OTA(Over-The-Air)エッジ推論の新たな定式化について述べる。
深層学習手法や従来のEMMと比較して,提案手法は複雑度を桁違いに低減したパー性能を実現し,超低消費電力無線機器に非常に魅力がある。
論文 参考訳(メタデータ) (2025-04-17T08:53:30Z) - Deep Joint Semantic Coding and Beamforming for Near-Space Airship-Borne Massive MIMO Network [70.63240823677182]
近距離飛行船搭載通信網は、緊急に信頼性と効率のよい飛行船対Xリンクを必要とする。
本稿では,MIMO(Multiple-Input multiple-output)技術とセマンティックコミュニケーションを統合することを提案する。
論文 参考訳(メタデータ) (2024-05-30T09:46:59Z) - Joint Multimodal Transformer for Emotion Recognition in the Wild [49.735299182004404]
マルチモーダル感情認識(MMER)システムは、通常、単調なシステムよりも優れている。
本稿では,キーベースのクロスアテンションと融合するために,ジョイントマルチモーダルトランス (JMT) を利用するMMER法を提案する。
論文 参考訳(メタデータ) (2024-03-15T17:23:38Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - Over-the-Air Split Machine Learning in Wireless MIMO Networks [56.27831295707334]
スプリット機械学習(ML)では、ニューラルネットワーク(NN)の異なるパーティションが異なる計算ノードによって実行される。
通信負担を軽減するため、OAC(Over-the-air calculation)は通信と同時に計算の全てまたは一部を効率的に実装することができる。
論文 参考訳(メタデータ) (2022-10-07T15:39:11Z) - Collaborative Intelligent Reflecting Surface Networks with Multi-Agent
Reinforcement Learning [63.83425382922157]
インテリジェント・リフレクション・サーフェス(IRS)は将来の無線ネットワークに広く応用されることが想定されている。
本稿では,エネルギー収穫能力を備えた協調型IRSデバイスを用いたマルチユーザ通信システムについて検討する。
論文 参考訳(メタデータ) (2022-03-26T20:37:14Z) - Fine Timing and Frequency Synchronization for MIMO-OFDM: An Extreme
Learning Approach [8.432859469083951]
極端学習機械(ELM)を用いて高精度同期を実現する手法を提案する。
提案手法は,チャネルパラメータの選択や,機械学習の観点からの「一般化能力」の観点からも頑健である。
論文 参考訳(メタデータ) (2020-07-17T21:41:38Z) - Massive MIMO As an Extreme Learning Machine [83.12538841141892]
低分解能アナログ・デジタルコンバータ(ADC)を用いたMIMOシステムによる自然極端学習機械(ELM)の試作
受信した信号にランダムなバイアスを加え、ELM出力の重みを最適化することにより、システムはハードウェアの障害に効果的に取り組むことができる。
論文 参考訳(メタデータ) (2020-07-01T04:15:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。