論文の概要: A Survey on Semantic Communication for Vision: Categories, Frameworks, Enabling Techniques, and Applications
- arxiv url: http://arxiv.org/abs/2601.22202v1
- Date: Thu, 29 Jan 2026 17:19:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-02 18:28:14.99689
- Title: A Survey on Semantic Communication for Vision: Categories, Frameworks, Enabling Techniques, and Applications
- Title(参考訳): ビジョンのためのセマンティックコミュニケーションに関する調査:カテゴリ,フレームワーク,実装技術,応用
- Authors: Runze Cheng, Yao Sun, Ahmad Taha, Xuesong Liu, David Flynn, Muhammad Ali Imran,
- Abstract要約: 視覚データ伝送のためのSemComの体系的レビュー(SemCom-Vision)を提案する。
コンピュータビジョン(CV)と通信工学を統合した学際分析を行い、機械学習(ML)を利用したSemCom-Vision設計のための包括的なガイドラインを提供する。
本稿では,既存のSemCom-Visionアプローチを意味的保存通信(SPC),意味的拡張通信(SEC),意味的拡張通信(SRC)に分類するための新しい分類法を提案する。
- 参考スコア(独自算出の注目度): 8.12478698989831
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic communication (SemCom) emerges as a transformative paradigm for traffic-intensive visual data transmission, shifting focus from raw data to meaningful content transmission and relieving the increasing pressure on communication resources. However, to achieve SemCom, challenges are faced in accurate semantic quantization for visual data, robust semantic extraction and reconstruction under diverse tasks and goals, transceiver coordination with effective knowledge utilization, and adaptation to unpredictable wireless communication environments. In this paper, we present a systematic review of SemCom for visual data transmission (SemCom-Vision), wherein an interdisciplinary analysis integrating computer vision (CV) and communication engineering is conducted to provide comprehensive guidelines for the machine learning (ML)-empowered SemCom-Vision design. Specifically, this survey first elucidates the basics and key concepts of SemCom. Then, we introduce a novel classification perspective to categorize existing SemCom-Vision approaches as semantic preservation communication (SPC), semantic expansion communication (SEC), and semantic refinement communication (SRC) based on communication goals interpreted through semantic quantization schemes. Moreover, this survey articulates the ML-based encoder-decoder models and training algorithms for each SemCom-Vision category, followed by knowledge structure and utilization strategies. Finally, we discuss potential SemCom-Vision applications.
- Abstract(参考訳): セマンティック・コミュニケーション (Semantic Communication, SemCom) は、トラフィック集約型視覚データ伝送の変換パラダイムとして登場し、生データから有意義なコンテンツ伝送へと焦点を移し、通信資源への圧力の増大を緩和する。
しかし、SemComを実現するためには、視覚データに対する正確な意味的定量化、多様なタスクや目標の下での堅牢な意味的抽出と再構築、効果的な知識利用によるトランシーバ調整、予測不能な無線通信環境への適応といった課題に直面している。
本稿では、コンピュータビジョン(CV)と通信技術を組み合わせた学際的分析を行い、機械学習(ML)を利用したSemCom-Vision設計のための包括的なガイドラインを提供する。
具体的には、まず最初にSemComの基本と重要な概念を解明する。
そこで本研究では,既存のSemCom-Visionアプローチを意味的保存通信(SPC),意味的拡張通信(SEC),意味的拡張通信(SRC)に分類し,意味的量子化スキームを通して解釈されたコミュニケーション目標に基づく意味的洗練通信(SRC)に分類する。
さらに、この調査では、SemCom-VisionカテゴリごとにMLベースのエンコーダデコーダモデルとトレーニングアルゴリズムを記述し、その後に知識構造と利用戦略を示す。
最後に,SemCom-Visionの応用の可能性について論じる。
関連論文リスト
- Token Communications: A Large Model-Driven Framework for Cross-modal Context-aware Semantic Communications [78.80966346820553]
我々は、生成意味コミュニケーション(GenSC)において、クロスモーダルなコンテキスト情報を活用するための大規模なモデル駆動フレームワークであるトークン通信(TokCom)を紹介する。
本稿では,GFM/MLLMをベースとしたトークン処理をセマンティック通信システムに組み込む方法について検討し,将来無線ネットワークの様々な層において効率的なTokComを実現する上での鍵となる原則について述べる。
論文 参考訳(メタデータ) (2025-02-17T18:14:18Z) - Trustworthy Image Semantic Communication with GenAI: Explainablity, Controllability, and Efficiency [59.15544887307901]
画像意味コミュニケーション(ISC)は,高効率な映像コンテンツ伝送を実現する可能性に注目されている。
既存のISCシステムは、解釈可能性、操作性、互換性の課題に直面している。
我々は、複数の下流推論タスクにGenerative Artificial Intelligence(GenAI)を利用する新しい信頼できるISCフレームワークを提案する。
論文 参考訳(メタデータ) (2024-08-07T14:32:36Z) - Agent-driven Generative Semantic Communication with Cross-Modality and Prediction [57.335922373309074]
本稿では,強化学習に基づくエージェント駆動型ジェネリックセマンティックコミュニケーションフレームワークを提案する。
本研究では, エージェント支援型セマンティックエンコーダを開発し, 適応的セマンティック抽出とサンプリングを行う。
設計モデルの有効性をUA-DETRACデータセットを用いて検証し、全体的なA-GSCフレームワークの性能向上を実証した。
論文 参考訳(メタデータ) (2024-04-10T13:24:27Z) - Interplay of Semantic Communication and Knowledge Learning [17.508008926853186]
本章では,知識グラフ(KG)の利用に着目したSemComにおける知識学習の方法を明らかにする。
我々は,KG強化されたSemComシステムを導入し,レシーバを慎重に校正し,静的知識ベースからの知識を活用して復号性能を向上させる。
さらに、データ拡張のためのLarge Language Models (LLMs) との統合の可能性について検討し、SemComの潜在的な実装手段についてさらなる視点を提供する。
論文 参考訳(メタデータ) (2024-01-18T06:11:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。