Fugu-MT 論文翻訳(概要): Demo: Real-Time Semantic Communications with a Vision Transformer

論文の概要: Demo: Real-Time Semantic Communications with a Vision Transformer

arxiv url: http://arxiv.org/abs/2205.03886v1
Date: Sun, 8 May 2022 14:49:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-11 04:50:16.660433
Title: Demo: Real-Time Semantic Communications with a Vision Transformer
Title（参考訳）: デモ:ビジョントランスを用いたリアルタイムセマンティックコミュニケーション
Authors: Hanju Yoo, Taehun Jung, Linglong Dai, Songkuk Kim and Chan-Byoung Chae
Abstract要約: 画像伝送のためのエンドツーエンドのディープニューラルネットワークアーキテクチャを提案し,その実現可能性を示す。我々の知る限りでは、視覚変換器を用いたリアルタイムセマンティックコミュニケーションを実装し、研究するのはこれが初めてである。
参考スコア（独自算出の注目度）: 14.85519988496995
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Semantic communications are expected to enable the more effective delivery of meaning rather than a precise transfer of symbols. In this paper, we propose an end-to-end deep neural network-based architecture for image transmission and demonstrate its feasibility in a real-time wireless channel by implementing a prototype based on a field-programmable gate array (FPGA). We demonstrate that this system outperforms the traditional 256-quadrature amplitude modulation system in the low signal-to-noise ratio regime with the popular CIFAR-10 dataset. To the best of our knowledge, this is the first work that implements and investigates real-time semantic communications with a vision transformer.
Abstract（参考訳）: 意味コミュニケーションは、シンボルの正確な転送よりも、より効果的な意味の伝達を可能にすることが期待されている。本稿では,画像伝送のためのエンド・ツー・エンドのディープニューラルネットワークアーキテクチャを提案し,フィールドプログラミング可能なゲートアレイ(fpga)に基づくプロトタイプを実装し,その実現可能性を示す。本システムは,CIFAR-10データセットを用いた低信号対雑音比方式において,従来の256四分数振幅変調方式よりも優れていた。私たちの知る限りでは、これは視覚トランスフォーマーとリアルタイム意味コミュニケーションを実装し、調査する最初の仕事です。

関連論文リスト

Context Video Semantic Transmission with Variable Length and Rate Coding over MIMO Channels [49.624608869195065]
無線ビデオ伝送のためのコンテキストビデオセマンティックトランスミッション(CVST)フレームワークを提案する。我々は、特徴群と多重入力多重出力(MIMO)サブチャネルの関係を明確に定式化するために、コンテキストチャネル相関マップを学習する。近年の無線ビデオ・セマンティック・コミュニケーション・アプローチにおいて,標準化された分離符号化方式に対して性能が大幅に向上したことを示す。
論文参考訳（メタデータ） (2025-12-23T10:48:43Z)
VQ-DeepISC: Vector Quantized-Enabled Digital Semantic Communication with Channel Adaptive Image Transmission [8.858565507331395]
意味的特徴の離散化は、意味的コミュニケーションシステムとデジタルコミュニケーションシステムの相互運用を可能にする。チャネル適応画像伝送を用いたベクトル量子化(VQ)対応ディジタルセマンティック通信システムを提案する。
論文参考訳（メタデータ） (2025-08-01T02:35:34Z)
Modeling and Performance Analysis for Semantic Communications Based on Empirical Results [53.805458017074294]
終端計測とSNRの関係をモデル化するためのAlpha-Beta-Gamma (ABG) 式を提案する。画像再構成タスクでは、提案されたABG公式は、SCUNetやVision Transformerといった一般的なDLネットワークに適合する。我々の知る限りでは、これはエンドツーエンドのパフォーマンス指標と意味コミュニケーションのためのSNRの間の最初の理論的表現である。
論文参考訳（メタデータ） (2025-04-29T06:07:50Z)
Vision Transformer Based Semantic Communications for Next Generation Wireless Networks [3.8095664680229935]
本稿では視覚変換器(ViT)を用いた意味コミュニケーションフレームワークを提案する。エンコーダ・デコーダ・フレームワークとしてViTを組み込むことで,提案アーキテクチャは画像から高いセマンティック・コンテントへ効率よくエンコードすることができる。提案したViTネットワークに基づくアーキテクチャは,38dBのPak Signal-versato-noise Ratio(PSNR)を実現する。
論文参考訳（メタデータ） (2025-03-21T16:23:02Z)
Generative Video Semantic Communication via Multimodal Semantic Fusion with Large Model [55.71885688565501]
本稿では,高品質な映像再構成を実現するために,意味情報を抽出し,送信するスケーラブルなビデオ意味コミュニケーションフレームワークを提案する。具体的には、送信機では、それぞれテキストと構造的意味論として機能するソースビデオから記述と他の条件信号を抽出する。受信機では、拡散に基づくGenAI大モデルを用いて、ビデオの再構成のために複数のモーダルのセマンティクスを融合させる。
論文参考訳（メタデータ） (2025-02-19T15:59:07Z)
Token Communications: A Large Model-Driven Framework for Cross-modal Context-aware Semantic Communications [78.80966346820553]
我々は、生成意味コミュニケーション(GenSC)において、クロスモーダルなコンテキスト情報を活用するための大規模なモデル駆動フレームワークであるトークン通信(TokCom)を紹介する。本稿では,GFM/MLLMをベースとしたトークン処理をセマンティック通信システムに組み込む方法について検討し,将来無線ネットワークの様々な層において効率的なTokComを実現する上での鍵となる原則について述べる。
論文参考訳（メタデータ） (2025-02-17T18:14:18Z)
Vision Transformer-based Semantic Communications With Importance-Aware Quantization [13.328970689723096]
本稿では、無線画像伝送のための重要量化(IAQ)を用いた視覚変換器(ViT)に基づくセマンティック通信システムを提案する。筆者らのIAQフレームワークは, エラーのない, 現実的な通信シナリオにおいて, 従来の画像圧縮手法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-12-08T19:24:47Z)
Large Generative Model-assisted Talking-face Semantic Communication System [55.42631520122753]
本研究では,LGM-TSC(Large Generative Model-assisted Talking-face Semantic Communication)システムを提案する。送信機のジェネレーティブセマンティック・エクストラクタ(GSE)は、意味的にスパースな音声映像を高情報密度のテキストに変換する。意味的曖昧さと修正のためのLarge Language Model (LLM)に基づくPrivate Knowledge Base (KB)。 BERT-VITS2とSadTalkerモデルを用いた生成意味再構成(GSR)により、テキストを高QoE音声ビデオに変換する。
論文参考訳（メタデータ） (2024-11-06T12:45:46Z)
Semantic Feature Decomposition based Semantic Communication System of Images with Large-scale Visual Generation Models [5.867765921443141]
テクスチャカラーに基づく画像TCSCIのセマンティックコミュニケーションシステムを提案する。イメージを自然言語記述(テキスト)、テクスチャ、色の意味的特徴に分解する。非常に圧縮され、ノイズに強く、視覚的に類似した画像意味コミュニケーションを実現し、伝送プロセスの解釈性と編集性を確保する。
論文参考訳（メタデータ） (2024-10-26T08:53:05Z)
Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文参考訳（メタデータ） (2024-08-29T08:53:26Z)
Semantic Successive Refinement: A Generative AI-aided Semantic Communication Framework [27.524671767937512]
本稿では,単一ユーザシナリオを対象とした新しいジェネレーティブAIセマンティックコミュニケーション(GSC)システムを提案する。送信側では、Swin Transformerをベースとしたジョイントソースチャネル符号化機構を用いて、効率的なセマンティック特徴抽出を行う。受信側では、高度な拡散モデル(DM)が劣化した信号から高品質な画像を再構成し、知覚の詳細を高める。
論文参考訳（メタデータ） (2024-07-31T06:08:51Z)
TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文参考訳（メタデータ） (2024-04-15T06:01:48Z)
Latency-Aware Generative Semantic Communications with Pre-Trained Diffusion Models [43.27015039765803]
我々は,事前学習した生成モデルを用いた遅延認識型セマンティックコミュニケーションフレームワークを開発した。我々は,超低レート,低レイテンシ,チャネル適応型セマンティック通信を実証する。
論文参考訳（メタデータ） (2024-03-25T23:04:09Z)
Digital versus Analog Transmissions for Federated Learning over Wireless Networks [91.20926827568053]
資源制約付きネットワーク上での無線連合学習(FL)における2つの効果的な通信方式を比較した。まず,デジタルとアナログの両方の伝送方式と,実用的制約下での統一的かつ公正な比較手法について検討する。無線ネットワークにおけるFL性能評価のために,様々な不完全条件下での普遍収束解析を確立する。
論文参考訳（メタデータ） (2024-02-15T01:50:46Z)
Communication-Efficient Framework for Distributed Image Semantic Wireless Transmission [68.69108124451263]
IoTデバイスを用いたマルチタスク分散画像伝送のためのFederated Learning-based semantic communication (FLSC)フレームワーク。各リンクは階層型視覚変換器(HVT)ベースの抽出器とタスク適応トランスレータで構成される。チャネル状態情報に基づく多重出力多重出力伝送モジュール。
論文参考訳（メタデータ） (2023-08-07T16:32:14Z)
Model-based Deep Learning Receiver Design for Rate-Splitting Multiple Access [65.21117658030235]
本研究では,モデルベース深層学習(MBDL)に基づく実用的なRSMA受信機の設計を提案する。 MBDL受信機は、符号なしシンボル誤り率(SER)、リンクレベルシミュレーション(LLS)によるスループット性能、平均トレーニングオーバーヘッドの観点から評価される。その結果,MBDLはCSIRが不完全なSIC受信機よりも優れていた。
論文参考訳（メタデータ） (2022-05-02T12:23:55Z)
Multi-task Learning Approach for Modulation and Wireless Signal Classification for 5G and Beyond: Edge Deployment via Model Compression [1.218340575383456]
将来的な通信網は、異種無線デバイスの成長に対応するために、少ないスペクトルに対処する必要がある。我々は、深層ニューラルネットワークに基づくマルチタスク学習フレームワークの可能性を利用して、変調と信号分類タスクを同時に学習する。公共利用のための包括的ヘテロジニアス無線信号データセットを提供する。
論文参考訳（メタデータ） (2022-02-26T14:51:02Z)
End-to-End Learning for Uplink MU-SIMO Joint Transmitter and Non-Coherent Receiver Design in Fading Channels [11.182920270301304]
JTRD-Netと呼ばれる新しいエンドツーエンド学習手法が提案され、マルチユーザシングルインプットマルチ出力(MU-SIMO)ジョイントトランスミッタとフェーディングチャネルにおける非コヒーレントレシーバー設計(JTRD)をアップリンクする。送信側は、マルチユーザー波形設計を担当する並列線形層のグループとしてモデル化されています。非コヒーレント受信機は、マルチユーザ検出(MUD)機能を提供するために、ディープフィードフォワードニューラルネットワーク(DFNN)によって形成される。
論文参考訳（メタデータ） (2021-05-04T02:47:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。