論文の概要: Vision Transformer Based Semantic Communications for Next Generation Wireless Networks
- arxiv url: http://arxiv.org/abs/2503.17275v1
- Date: Fri, 21 Mar 2025 16:23:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 14:55:17.627752
- Title: Vision Transformer Based Semantic Communications for Next Generation Wireless Networks
- Title(参考訳): ビジョントランスを用いた次世代無線ネットワークのためのセマンティック通信
- Authors: Muhammad Ahmed Mohsin, Muhammad Jazib, Zeeshan Alam, Muhmmad Farhan Khan, Muhammad Saad, Muhammad Ali Jamshed,
- Abstract要約: 本稿では視覚変換器(ViT)を用いた意味コミュニケーションフレームワークを提案する。
エンコーダ・デコーダ・フレームワークとしてViTを組み込むことで,提案アーキテクチャは画像から高いセマンティック・コンテントへ効率よくエンコードすることができる。
提案したViTネットワークに基づくアーキテクチャは,38dBのPak Signal-versato-noise Ratio(PSNR)を実現する。
- 参考スコア(独自算出の注目度): 3.8095664680229935
- License:
- Abstract: In the evolving landscape of 6G networks, semantic communications are poised to revolutionize data transmission by prioritizing the transmission of semantic meaning over raw data accuracy. This paper presents a Vision Transformer (ViT)-based semantic communication framework that has been deliberately designed to achieve high semantic similarity during image transmission while simultaneously minimizing the demand for bandwidth. By equipping ViT as the encoder-decoder framework, the proposed architecture can proficiently encode images into a high semantic content at the transmitter and precisely reconstruct the images, considering real-world fading and noise consideration at the receiver. Building on the attention mechanisms inherent to ViTs, our model outperforms Convolution Neural Network (CNNs) and Generative Adversarial Networks (GANs) tailored for generating such images. The architecture based on the proposed ViT network achieves the Peak Signal-to-noise Ratio (PSNR) of 38 dB, which is higher than other Deep Learning (DL) approaches in maintaining semantic similarity across different communication environments. These findings establish our ViT-based approach as a significant breakthrough in semantic communications.
- Abstract(参考訳): 6Gネットワークの進化する状況において、意味的コミュニケーションは、生データ精度よりも意味的意味の伝達を優先することで、データ伝達に革命をもたらす。
本稿では,帯域幅の需要を最小化しつつ,画像伝送中に高い意味的類似性を実現するために意図的に設計されたビジョントランスフォーマー(ViT)ベースのセマンティック通信フレームワークを提案する。
ViTをエンコーダ・デコーダ・フレームワークとして使用することにより,提案アーキテクチャは,映像を送信側で高セマンティックな内容に巧みにエンコードし,現実のフェーディングや受信側でのノイズを考慮した画像の正確な再構成を行うことができる。
ViTに固有の注意機構に基づいて、我々のモデルは、このような画像を生成するのに適した畳み込みニューラルネットワーク(CNN)とGAN(Generative Adversarial Networks)より優れている。
提案したViTネットワークに基づくアーキテクチャは,38dBのPeak Signal-to-Noise Ratio(PSNR)を実現する。
これらの知見は, セマンティックコミュニケーションにおける重要なブレークスルーとして, 我々のViTベースのアプローチを確立した。
関連論文リスト
- Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model [55.71885688565501]
本稿では,高品質な映像再構成を実現するために,意味情報を抽出し,送信するスケーラブルなビデオ意味コミュニケーションフレームワークを提案する。
具体的には、送信機では、それぞれテキストと構造的意味論として機能するソースビデオから記述と他の条件信号を抽出する。
受信機では、拡散に基づくGenAI大モデルを用いて、ビデオの再構成のために複数のモーダルのセマンティクスを融合させる。
論文 参考訳(メタデータ) (2025-02-19T15:59:07Z) - Semantic Communication based on Generative AI: A New Approach to Image Compression and Edge Optimization [1.450405446885067]
この論文は、最適化された画像圧縮とエッジネットワークリソース割り当てのための意味コミュニケーションと生成モデルを統合する。
通信インフラは、帯域幅効率とレイテンシーの大幅な改善の恩恵を受けることができる。
その結果、生成AIとセマンティックコミュニケーションを組み合わせて、より効率的なセマンティックゴール指向のコミュニケーションネットワークを構築する可能性を実証した。
論文 参考訳(メタデータ) (2025-02-01T21:48:31Z) - Semantic Feature Decomposition based Semantic Communication System of Images with Large-scale Visual Generation Models [5.867765921443141]
テクスチャカラーに基づく画像TCSCIのセマンティックコミュニケーションシステムを提案する。
イメージを自然言語記述(テキスト)、テクスチャ、色の意味的特徴に分解する。
非常に圧縮され、ノイズに強く、視覚的に類似した画像意味コミュニケーションを実現し、伝送プロセスの解釈性と編集性を確保する。
論文 参考訳(メタデータ) (2024-10-26T08:53:05Z) - Trustworthy Image Semantic Communication with GenAI: Explainablity, Controllability, and Efficiency [59.15544887307901]
画像意味コミュニケーション(ISC)は,高効率な映像コンテンツ伝送を実現する可能性に注目されている。
既存のISCシステムは、解釈可能性、操作性、互換性の課題に直面している。
我々は、複数の下流推論タスクにGenerative Artificial Intelligence(GenAI)を利用する新しい信頼できるISCフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-07T14:32:36Z) - Agent-driven Generative Semantic Communication with Cross-Modality and Prediction [57.335922373309074]
本稿では,強化学習に基づくエージェント駆動型ジェネリックセマンティックコミュニケーションフレームワークを提案する。
本研究では, エージェント支援型セマンティックエンコーダを開発し, 適応的セマンティック抽出とサンプリングを行う。
設計モデルの有効性をUA-DETRACデータセットを用いて検証し、全体的なA-GSCフレームワークの性能向上を実証した。
論文 参考訳(メタデータ) (2024-04-10T13:24:27Z) - Communication-Efficient Framework for Distributed Image Semantic
Wireless Transmission [68.69108124451263]
IoTデバイスを用いたマルチタスク分散画像伝送のためのFederated Learning-based semantic communication (FLSC)フレームワーク。
各リンクは階層型視覚変換器(HVT)ベースの抽出器とタスク適応トランスレータで構成される。
チャネル状態情報に基づく多重出力多重出力伝送モジュール。
論文 参考訳(メタデータ) (2023-08-07T16:32:14Z) - Wireless End-to-End Image Transmission System using Semantic
Communications [4.2421412410466575]
本研究は,物理チャネルを通してセマンティックセグメンテーションマップを送信する際に,帯域幅の節約という形での資源ゲインが巨大であることを示す。
本研究は,物理チャネル歪みと量子化雑音がセマンティック通信に基づくマルチメディアコンテンツ伝送に与える影響について検討する。
論文 参考訳(メタデータ) (2023-02-27T12:33:53Z) - Enabling the Wireless Metaverse via Semantic Multiverse Communication [82.47169682083806]
無線ネットワーク上のメタバースは、第6世代(6G)無線システムの新たなユースケースである。
メタバースを人間/機械エージェント固有のセマンティック・マルチバース(SM)に分解する新しいセマンティック・コミュニケーション・フレームワークを提案する。
各エージェントに格納されたSMは、セマンティックエンコーダとジェネレータから構成され、生成人工知能(AI)の最近の進歩を活用する。
論文 参考訳(メタデータ) (2022-12-13T21:21:07Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Demo: Real-Time Semantic Communications with a Vision Transformer [14.85519988496995]
画像伝送のためのエンドツーエンドのディープニューラルネットワークアーキテクチャを提案し,その実現可能性を示す。
我々の知る限りでは、視覚変換器を用いたリアルタイムセマンティックコミュニケーションを実装し、研究するのはこれが初めてである。
論文 参考訳(メタデータ) (2022-05-08T14:49:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。