論文の概要: Contrastive Language-Image Pre-Training Model based Semantic Communication Performance Optimization
- arxiv url: http://arxiv.org/abs/2507.08873v1
- Date: Thu, 10 Jul 2025 01:48:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:21.666654
- Title: Contrastive Language-Image Pre-Training Model based Semantic Communication Performance Optimization
- Title(参考訳): 意味的コミュニケーション性能最適化に基づくコントラスト言語-画像事前学習モデル
- Authors: Shaoran Yang, Dongyu Wei, Hanzhi Yu, Zhaohui Yang, Yuchen Liu, Mingzhe Chen,
- Abstract要約: 言語画像事前学習(CLIP)モデルに基づくセマンティックコミュニケーションフレームワークを設計する。
標準的なニューラルネットワーク(例えば畳み込みニューラルネットワーク)ベースのセマンティックエンコーダや、共通のデータセット上での共同トレーニングを必要とするデコーダと比較して、私たちのCLIPモデルベースの方法は、いかなるトレーニング手順も必要としない。
ノイズの多い無線ネットワーク上でのCLIPモデルに基づくセマンティックフレームワークの展開について検討する。
- 参考スコア(独自算出の注目度): 23.352326993320958
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, a novel contrastive language-image pre-training (CLIP) model based semantic communication framework is designed. Compared to standard neural network (e.g.,convolutional neural network) based semantic encoders and decoders that require joint training over a common dataset, our CLIP model based method does not require any training procedures thus enabling a transmitter to extract data meanings of the original data without neural network model training, and the receiver to train a neural network for follow-up task implementation without the communications with the transmitter. Next, we investigate the deployment of the CLIP model based semantic framework over a noisy wireless network. Since the semantic information generated by the CLIP model is susceptible to wireless noise and the spectrum used for semantic information transmission is limited, it is necessary to jointly optimize CLIP model architecture and spectrum resource block (RB) allocation to maximize semantic communication performance while considering wireless noise, the delay and energy used for semantic communication. To achieve this goal, we use a proximal policy optimization (PPO) based reinforcement learning (RL) algorithm to learn how wireless noise affect the semantic communication performance thus finding optimal CLIP model and RB for each user. Simulation results show that our proposed method improves the convergence rate by up to 40%, and the accumulated reward by 4x compared to soft actor-critic.
- Abstract(参考訳): 本稿では,CLIPモデルに基づくセマンティック・コミュニケーション・フレームワークを提案する。
一般的なニューラルネットワーク(例えば畳み込みニューラルネットワーク)ベースのセマンティックエンコーダや,共通のデータセット上での共同トレーニングを必要とするデコーダと比較して,我々のCLIPモデルベースの手法では,ニューラルネットワークモデルトレーニングを使わずに,送信者が元のデータの意味を抽出できるようなトレーニング手順は不要である。
次に、ノイズの多い無線ネットワーク上でのCLIPモデルに基づくセマンティックフレームワークの展開について検討する。
CLIPモデルが生成するセマンティック情報は、無線ノイズの影響を受けやすく、セマンティック情報伝達に使用するスペクトルが限られているため、セマンティック通信に使用する遅延とエネルギーを考慮しつつ、セマンティック通信性能を最大化するために、CLIPモデルアーキテクチャとスペクトルリソースブロック(RB)アロケーションを協調的に最適化する必要がある。
この目的を達成するために、我々は近ポリシー最適化(PPO)に基づく強化学習(RL)アルゴリズムを用いて、無線ノイズがセマンティック通信性能に与える影響を学習し、各ユーザに対して最適なCLIPモデルとRBを求める。
シミュレーションの結果,提案手法はソフトアクター・クリティックに比べて最大40%の収束率,累積報酬が4倍向上することがわかった。
関連論文リスト
- Latent Diffusion Model Based Denoising Receiver for 6G Semantic Communication: From Stochastic Differential Theory to Application [55.42071552739813]
生成人工知能(GAI)を利用した新しい意味コミュニケーションフレームワークを提案する。
意味的特徴抽出のための変分オートエンコーダを組み合わせた潜在拡散モデル(LDM)に基づくセマンティックコミュニケーションフレームワークを提案する。
提案システムはゼロショットの一般化をサポートし,低SNRおよびアウト・オブ・ディストリビューション条件下での優れた性能を実現する訓練自由フレームワークである。
論文 参考訳(メタデータ) (2025-06-06T03:20:32Z) - Plug-and-Play AMC: Context Is King in Training-Free, Open-Set Modulation with LLMs [22.990537822143907]
自動変調分類(AMC)は、効率的なスペクトル管理とロバストな無線通信において重要である。
本稿では,従来の信号処理技術と大規模言語モデルを統合する革新的なフレームワークを提案する。
この研究は、次世代無線ネットワークにおけるスケーラブルで解釈可能で汎用的な信号分類システムの基礎を築いた。
論文 参考訳(メタデータ) (2025-05-06T02:07:47Z) - Modeling and Performance Analysis for Semantic Communications Based on Empirical Results [53.805458017074294]
終端計測とSNRの関係をモデル化するためのAlpha-Beta-Gamma (ABG) 式を提案する。
画像再構成タスクでは、提案されたABG公式は、SCUNetやVision Transformerといった一般的なDLネットワークに適合する。
我々の知る限りでは、これはエンドツーエンドのパフォーマンス指標と意味コミュニケーションのためのSNRの間の最初の理論的表現である。
論文 参考訳(メタデータ) (2025-04-29T06:07:50Z) - Agent-driven Generative Semantic Communication with Cross-Modality and Prediction [57.335922373309074]
本稿では,強化学習に基づくエージェント駆動型ジェネリックセマンティックコミュニケーションフレームワークを提案する。
本研究では, エージェント支援型セマンティックエンコーダを開発し, 適応的セマンティック抽出とサンプリングを行う。
設計モデルの有効性をUA-DETRACデータセットを用いて検証し、全体的なA-GSCフレームワークの性能向上を実証した。
論文 参考訳(メタデータ) (2024-04-10T13:24:27Z) - Latency-Aware Generative Semantic Communications with Pre-Trained Diffusion Models [43.27015039765803]
我々は,事前学習した生成モデルを用いた遅延認識型セマンティックコミュニケーションフレームワークを開発した。
我々は,超低レート,低レイテンシ,チャネル適応型セマンティック通信を実証する。
論文 参考訳(メタデータ) (2024-03-25T23:04:09Z) - RIS-Based On-the-Air Semantic Communications -- a Diffractional Deep
Neural Network Approach [10.626169088908867]
現在のAIベースのセマンティックコミュニケーション手法は実装にデジタルハードウェアを必要とする。
RISベースのセマンティックコミュニケーションは、光速計算、計算能力の低さ、複数のタスクを同時に処理する能力など、魅力的な機能を提供する。
論文 参考訳(メタデータ) (2023-12-01T12:15:49Z) - Causal Semantic Communication for Digital Twins: A Generalizable
Imitation Learning Approach [74.25870052841226]
デジタルツイン(DT)は、物理世界の仮想表現と通信(例えば6G)、コンピュータ、人工知能(AI)技術を活用して、多くの接続されたインテリジェンスサービスを実現する。
無線システムは、厳密な通信制約下での情報意思決定を容易にするために意味コミュニケーション(SC)のパラダイムを利用することができる。
DTベースの無線システムでは,因果意味通信(CSC)と呼ばれる新しいフレームワークが提案されている。
論文 参考訳(メタデータ) (2023-04-25T00:15:00Z) - Semantic Communication Enabling Robust Edge Intelligence for
Time-Critical IoT Applications [87.05763097471487]
本稿では、時間クリティカルなIoTアプリケーションのためのセマンティック通信を用いて、堅牢なエッジインテリジェンスを設計することを目的とする。
本稿では,画像DCT係数が推定精度に与える影響を解析し,オフロードのためのチャネル非依存の有効性符号化を提案する。
論文 参考訳(メタデータ) (2022-11-24T20:13:17Z) - Toward Adaptive Semantic Communications: Efficient Data Transmission via
Online Learned Nonlinear Transform Source-Channel Coding [11.101344530143303]
深層学習モデルの過剰適合性を利用したオンライン学習型ジョイントソースとチャネルコーディング手法を提案する。
具体的には,市販の事前訓練型モデルを軽量なオンライン方式で展開し,ソースデータと環境領域の分散シフトに適応させる。
私たちはオーバーフィットの概念を極端に捉え、モデルや表現を個々のデータやチャネル状態インスタンスに適応させる実装フレンドリな一連のメソッドを提案します。
論文 参考訳(メタデータ) (2022-11-08T16:00:27Z) - Performance Optimization for Semantic Communications: An Attention-based
Reinforcement Learning Approach [187.4094332217186]
テキストデータ伝送のためのセマンティック通信フレームワークを提案する。
回復したテキストの意味的精度と完全性を共同でキャプチャする意味的類似度尺度(MSS)を提案する。
論文 参考訳(メタデータ) (2022-08-17T11:39:16Z) - Speech recognition for air traffic control via feature learning and
end-to-end training [8.755785876395363]
本稿では,特徴学習に基づく新しい自動音声認識(ASR)システムと,航空交通制御(ATC)システムのためのエンドツーエンドトレーニング手順を提案する。
提案モデルでは、特徴学習ブロック、リカレントニューラルネットワーク(RNN)、コネクショニストの時間的分類損失を統合する。
生波形から表現を学習する能力により、提案したモデルは完全なエンドツーエンドで最適化できる。
論文 参考訳(メタデータ) (2021-11-04T06:38:21Z) - Communication-Efficient and Distributed Learning Over Wireless Networks:
Principles and Applications [55.65768284748698]
機械学習(ML)は、第5世代(5G)通信システムなどのための有望なイネーブルである。
本稿では、関連するコミュニケーションとMLの原則を概観し、選択したユースケースでコミュニケーション効率と分散学習フレームワークを提示することを目的とする。
論文 参考訳(メタデータ) (2020-08-06T12:37:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。