論文の概要: Curriculum Learning for Goal-Oriented Semantic Communications with a
Common Language
- arxiv url: http://arxiv.org/abs/2204.10429v1
- Date: Thu, 21 Apr 2022 22:36:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-25 14:48:38.139301
- Title: Curriculum Learning for Goal-Oriented Semantic Communications with a
Common Language
- Title(参考訳): 共通言語を用いたゴール指向セマンティックコミュニケーションのためのカリキュラム学習
- Authors: Mohammad Karimzadeh Farshbafan, Walid Saad, and Merouane Debbah
- Abstract要約: 話者とリスナーが協調して一連のタスクを実行することを可能にするために,総合目標指向のセマンティックコミュニケーションフレームワークを提案する。
話者とリスナーのセマンティックコミュニケーションを実現するために,階層的信念に基づく共通言語を提案する。
最適化問題は、イベントの完全かつ抽象的な記述を決定するために定義される。
- 参考スコア(独自算出の注目度): 60.85719227557608
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Goal-oriented semantic communication will be a pillar of next-generation
wireless networks. Despite significant recent efforts in this area, most prior
works are focused on specific data types (e.g., image or audio), and they
ignore the goal and effectiveness aspects of semantic transmissions. In
contrast, in this paper, a holistic goal-oriented semantic communication
framework is proposed to enable a speaker and a listener to cooperatively
execute a set of sequential tasks in a dynamic environment. A common language
based on a hierarchical belief set is proposed to enable semantic
communications between speaker and listener. The speaker, acting as an observer
of the environment, utilizes the beliefs to transmit an initial description of
its observation (called event) to the listener. The listener is then able to
infer on the transmitted description and complete it by adding related beliefs
to the transmitted beliefs of the speaker. As such, the listener reconstructs
the observed event based on the completed description, and it then takes
appropriate action in the environment based on the reconstructed event. An
optimization problem is defined to determine the perfect and abstract
description of the events while minimizing the transmission and inference costs
with constraints on the task execution time and belief efficiency. Then, a
novel bottom-up curriculum learning (CL) framework based on reinforcement
learning is proposed to solve the optimization problem and enable the speaker
and listener to gradually identify the structure of the belief set and the
perfect and abstract description of the events. Simulation results show that
the proposed CL method outperforms traditional RL in terms of convergence time,
task execution cost and time, reliability, and belief efficiency.
- Abstract(参考訳): ゴール指向セマンティック通信は次世代無線ネットワークの柱となる。
この分野における最近の大きな取り組みにもかかわらず、ほとんどの先行研究は特定のデータ型(例えば、画像や音声)に焦点を当てており、意味伝達の目的と有効性を無視している。
そこで,本稿では,話者とリスナが動的環境において一連の逐次タスクを協調的に実行できるようにするため,総合的な目標指向意味コミュニケーションフレームワークを提案する。
話者とリスナーのセマンティックコミュニケーションを実現するために,階層的信念に基づく共通言語を提案する。
講演者は、環境のオブザーバとして機能し、その信念を利用して、その観察(イベントと呼ばれる)の初期記述をリスナーに送信する。
そして、リスナーは、送信された記述を推測し、話者の送信された信念に関連する信念を加えることでそれを完了することができる。
これにより、リスナは、完了した記述に基づいて観察されたイベントを再構成し、再構成されたイベントに基づいて環境において適切なアクションを行う。
タスクの実行時間と信念効率の制約により伝達コストと推論コストを最小限に抑えながら、イベントの完全かつ抽象的な記述を決定する最適化問題を定義する。
そこで,強化学習に基づく新たなボトムアップカリキュラム学習(CL)フレームワークを提案し,その最適化問題を解き,話者とリスナーが,信念セットの構造とイベントの完全かつ抽象的な記述を徐々に特定できるようにする。
シミュレーションの結果,提案手法は収束時間,タスク実行コスト,時間,信頼性,信条効率の点で従来のRLよりも優れていた。
関連論文リスト
- Predictive Speech Recognition and End-of-Utterance Detection Towards Spoken Dialog Systems [55.99999020778169]
本稿では,次の単語を予測し,発話終了まで残される時間を推定する機能について検討する。
我々は,音響情報と言語情報の両方を組み込んだクロスアテンションに基づくアルゴリズムを開発した。
その結果,提案モデルでは,提案する単語を予測し,将来のEOUイベントを実際のEOUより300ミリ秒前まで推定する能力を示した。
論文 参考訳(メタデータ) (2024-09-30T06:29:58Z) - Integrating Self-supervised Speech Model with Pseudo Word-level Targets
from Visually-grounded Speech Model [57.78191634042409]
擬似単語レベルのターゲットを学習プロセスに統合するフレームワークであるPseudo-Word HuBERT(PW-HuBERT)を提案する。
4つの音声言語理解(SLU)ベンチマークによる実験結果から,意味情報の収集におけるモデルの有用性が示唆された。
論文 参考訳(メタデータ) (2024-02-08T16:55:21Z) - Improving Speaker Diarization using Semantic Information: Joint Pairwise
Constraints Propagation [53.01238689626378]
本稿では,話者ダイアリゼーションシステムにおける意味情報を活用する新しい手法を提案する。
音声言語理解モジュールを導入し、話者関連意味情報を抽出する。
本稿では,これらの制約を話者ダイアリゼーションパイプラインに統合する新しい枠組みを提案する。
論文 参考訳(メタデータ) (2023-09-19T09:13:30Z) - Beyond Transmitting Bits: Context, Semantics, and Task-Oriented
Communications [88.68461721069433]
次世代システムは、メッセージセマンティクスを折り畳み、コミュニケーションの目標を設計に組み込むことによって、潜在的に豊かになる。
このチュートリアルは、初期適応、セマンティック・アウェア、タスク指向コミュニケーションから始まり、現在までの取り組みを要約する。
その焦点は、情報理論を利用して基礎を提供するアプローチと、意味論やタスク対応コミュニケーションにおける学習の重要な役割である。
論文 参考訳(メタデータ) (2022-07-19T16:00:57Z) - Direction-Aware Joint Adaptation of Neural Speech Enhancement and
Recognition in Real Multiparty Conversational Environments [21.493664174262737]
本稿では,現実の多人数会話環境における音声コミュニケーションを支援する拡張現実ヘッドセットの雑音音声認識について述べる。
本研究では,高信頼な推定文字を用いたクリーン音声信号とノイズ音声信号を用いて,マスク推定器とASRモデルを実行時に共同で更新する半教師付き適応手法を提案する。
論文 参考訳(メタデータ) (2022-07-15T03:43:35Z) - Learning to Mediate Disparities Towards Pragmatic Communication [9.321336642983875]
言語コミュニケーションに類似した能力を持つAIエージェントを構築するためのフレームワークとして,Pragmatic Rational Speaker (PRS)を提案する。
PRSは、作業メモリに軽量の差分調整層を追加することにより、話者-リスナーの差分を学習し、それに応じて音声を調整しようとする。
長期メモリを修正することで、PSSは様々なタイプのリスナを学習し適応するためにのみ、動作メモリを更新する。
論文 参考訳(メタデータ) (2022-03-25T14:46:43Z) - Common Language for Goal-Oriented Semantic Communications: A Curriculum
Learning Framework [66.81698651016444]
目標指向タスク実行を実現するための包括的セマンティックコミュニケーションフレームワークを提案する。
カリキュラム学習(CL)と強化学習(RL)を組み合わせた新しいトップダウンフレームワークを提案する。
シミュレーションの結果,提案手法は,学習中の収束時間,タスク実行時間,送信コストにおいて従来のRLよりも優れていた。
論文 参考訳(メタデータ) (2021-11-15T19:13:55Z) - Pre-training for Spoken Language Understanding with Joint Textual and
Phonetic Representation Learning [4.327558819000435]
音声表現を学習するための新しいテキスト音声前訓練手法を提案する。
音声言語理解ベンチマークであるFluent Speech CommandsとSNIPSの実験結果から,提案手法は強いベースラインモデルよりも有意に優れていることが示された。
論文 参考訳(メタデータ) (2021-04-21T05:19:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。