Fugu-MT 論文翻訳(概要): Curriculum Learning for Goal-Oriented Semantic Communications with a Common Language

論文の概要: Curriculum Learning for Goal-Oriented Semantic Communications with a Common Language

arxiv url: http://arxiv.org/abs/2204.10429v1
Date: Thu, 21 Apr 2022 22:36:06 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-25 14:48:38.139301
Title: Curriculum Learning for Goal-Oriented Semantic Communications with a Common Language
Title（参考訳）: 共通言語を用いたゴール指向セマンティックコミュニケーションのためのカリキュラム学習
Authors: Mohammad Karimzadeh Farshbafan, Walid Saad, and Merouane Debbah
Abstract要約: 話者とリスナーが協調して一連のタスクを実行することを可能にするために,総合目標指向のセマンティックコミュニケーションフレームワークを提案する。話者とリスナーのセマンティックコミュニケーションを実現するために,階層的信念に基づく共通言語を提案する。最適化問題は、イベントの完全かつ抽象的な記述を決定するために定義される。
参考スコア（独自算出の注目度）: 60.85719227557608
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Goal-oriented semantic communication will be a pillar of next-generation wireless networks. Despite significant recent efforts in this area, most prior works are focused on specific data types (e.g., image or audio), and they ignore the goal and effectiveness aspects of semantic transmissions. In contrast, in this paper, a holistic goal-oriented semantic communication framework is proposed to enable a speaker and a listener to cooperatively execute a set of sequential tasks in a dynamic environment. A common language based on a hierarchical belief set is proposed to enable semantic communications between speaker and listener. The speaker, acting as an observer of the environment, utilizes the beliefs to transmit an initial description of its observation (called event) to the listener. The listener is then able to infer on the transmitted description and complete it by adding related beliefs to the transmitted beliefs of the speaker. As such, the listener reconstructs the observed event based on the completed description, and it then takes appropriate action in the environment based on the reconstructed event. An optimization problem is defined to determine the perfect and abstract description of the events while minimizing the transmission and inference costs with constraints on the task execution time and belief efficiency. Then, a novel bottom-up curriculum learning (CL) framework based on reinforcement learning is proposed to solve the optimization problem and enable the speaker and listener to gradually identify the structure of the belief set and the perfect and abstract description of the events. Simulation results show that the proposed CL method outperforms traditional RL in terms of convergence time, task execution cost and time, reliability, and belief efficiency.
Abstract（参考訳）: ゴール指向セマンティック通信は次世代無線ネットワークの柱となる。この分野における最近の大きな取り組みにもかかわらず、ほとんどの先行研究は特定のデータ型(例えば、画像や音声)に焦点を当てており、意味伝達の目的と有効性を無視している。そこで,本稿では,話者とリスナが動的環境において一連の逐次タスクを協調的に実行できるようにするため,総合的な目標指向意味コミュニケーションフレームワークを提案する。話者とリスナーのセマンティックコミュニケーションを実現するために,階層的信念に基づく共通言語を提案する。講演者は、環境のオブザーバとして機能し、その信念を利用して、その観察(イベントと呼ばれる)の初期記述をリスナーに送信する。そして、リスナーは、送信された記述を推測し、話者の送信された信念に関連する信念を加えることでそれを完了することができる。これにより、リスナは、完了した記述に基づいて観察されたイベントを再構成し、再構成されたイベントに基づいて環境において適切なアクションを行う。タスクの実行時間と信念効率の制約により伝達コストと推論コストを最小限に抑えながら、イベントの完全かつ抽象的な記述を決定する最適化問題を定義する。そこで,強化学習に基づく新たなボトムアップカリキュラム学習(CL)フレームワークを提案し,その最適化問題を解き,話者とリスナーが,信念セットの構造とイベントの完全かつ抽象的な記述を徐々に特定できるようにする。シミュレーションの結果,提案手法は収束時間,タスク実行コスト,時間,信頼性,信条効率の点で従来のRLよりも優れていた。

関連論文リスト

Weakly-supervised Audio Temporal Forgery Localization via Progressive Audio-language Co-learning Network [17.91342898415867]
既存のATFL手法は、細かいアノテーションを使って効率的なネットワークを訓練することに依存している。そこで本稿では,ローカライズ性能を高めるために,協調学習と自己超越的手法を取り入れたプログレッシブ・オーディオ・コラーニング・ネットワーク(LOCO)を提案する。提案したLOCOは3つの公開ベンチマークでSOTA性能を達成する。
論文参考訳（メタデータ） (2025-05-03T17:57:57Z)
Multi-Modal Self-Supervised Semantic Communication [52.76990720898666]
本稿では,マルチモーダルな自己教師型学習を活用し,タスク非依存の特徴抽出を強化するマルチモーダルセマンティックコミュニケーションシステムを提案する。提案手法は,訓練関連通信オーバーヘッドを最小限に抑えつつ,モダリティの不変性とモダリティ特有の特徴の両方を効果的に捉えている。この結果は、セマンティックコミュニケーションにおけるマルチモーダルな自己教師型学習の利点を浮き彫りにし、より効率的でスケーラブルなエッジ推論システムへの道を開いた。
論文参考訳（メタデータ） (2025-03-18T06:13:02Z)
Linguistic Knowledge Transfer Learning for Speech Enhancement [29.191204225828354]
言語知識は、言語理解において重要な役割を果たす。ほとんどの音声強調法は、雑音とクリーンな音声のマッピング関係を学習するために音響的特徴に依存している。本稿では,言語知識をSEモデルに統合するクロスモーダル・ナレッジ・トランスファー(CMKT)学習フレームワークを提案する。
論文参考訳（メタデータ） (2025-03-10T09:00:18Z)
InSerter: Speech Instruction Following with Unsupervised Interleaved Pre-training [23.330297074014315]
本稿では,Interleaved Speech-Text Representation Pre-trainingの略であるInSerterという,シンプルでスケーラブルなトレーニング手法を提案する。 InSerterは、大規模な教師なし音声テキストシーケンスを事前訓練するために設計されており、テキストから音声への変換を用いて、広範テキストコーパスのランダムに選択されたセグメントから音声を合成する。提案したInSerterは、SpeechInstructBenchにおけるSOTA性能を実現し、多様な音声処理タスクにおいて、優れた、あるいは競争的な結果を示す。
論文参考訳（メタデータ） (2025-03-04T16:34:14Z)
Predictive Speech Recognition and End-of-Utterance Detection Towards Spoken Dialog Systems [55.99999020778169]
本稿では,次の単語を予測し,発話終了まで残される時間を推定する機能について検討する。我々は,音響情報と言語情報の両方を組み込んだクロスアテンションに基づくアルゴリズムを開発した。その結果,提案モデルでは,提案する単語を予測し,将来のEOUイベントを実際のEOUより300ミリ秒前まで推定する能力を示した。
論文参考訳（メタデータ） (2024-09-30T06:29:58Z)
Integrating Self-supervised Speech Model with Pseudo Word-level Targets from Visually-grounded Speech Model [57.78191634042409]
擬似単語レベルのターゲットを学習プロセスに統合するフレームワークであるPseudo-Word HuBERT(PW-HuBERT)を提案する。 4つの音声言語理解(SLU)ベンチマークによる実験結果から,意味情報の収集におけるモデルの有用性が示唆された。
論文参考訳（メタデータ） (2024-02-08T16:55:21Z)
Improving Speaker Diarization using Semantic Information: Joint Pairwise Constraints Propagation [53.01238689626378]
本稿では,話者ダイアリゼーションシステムにおける意味情報を活用する新しい手法を提案する。音声言語理解モジュールを導入し、話者関連意味情報を抽出する。本稿では,これらの制約を話者ダイアリゼーションパイプラインに統合する新しい枠組みを提案する。
論文参考訳（メタデータ） (2023-09-19T09:13:30Z)
Beyond Transmitting Bits: Context, Semantics, and Task-Oriented Communications [88.68461721069433]
次世代システムは、メッセージセマンティクスを折り畳み、コミュニケーションの目標を設計に組み込むことによって、潜在的に豊かになる。このチュートリアルは、初期適応、セマンティック・アウェア、タスク指向コミュニケーションから始まり、現在までの取り組みを要約する。その焦点は、情報理論を利用して基礎を提供するアプローチと、意味論やタスク対応コミュニケーションにおける学習の重要な役割である。
論文参考訳（メタデータ） (2022-07-19T16:00:57Z)
Direction-Aware Joint Adaptation of Neural Speech Enhancement and Recognition in Real Multiparty Conversational Environments [21.493664174262737]
本稿では,現実の多人数会話環境における音声コミュニケーションを支援する拡張現実ヘッドセットの雑音音声認識について述べる。本研究では,高信頼な推定文字を用いたクリーン音声信号とノイズ音声信号を用いて,マスク推定器とASRモデルを実行時に共同で更新する半教師付き適応手法を提案する。
論文参考訳（メタデータ） (2022-07-15T03:43:35Z)
Learning to Mediate Disparities Towards Pragmatic Communication [9.321336642983875]
言語コミュニケーションに類似した能力を持つAIエージェントを構築するためのフレームワークとして,Pragmatic Rational Speaker (PRS)を提案する。 PRSは、作業メモリに軽量の差分調整層を追加することにより、話者-リスナーの差分を学習し、それに応じて音声を調整しようとする。長期メモリを修正することで、PSSは様々なタイプのリスナを学習し適応するためにのみ、動作メモリを更新する。
論文参考訳（メタデータ） (2022-03-25T14:46:43Z)
Common Language for Goal-Oriented Semantic Communications: A Curriculum Learning Framework [66.81698651016444]
目標指向タスク実行を実現するための包括的セマンティックコミュニケーションフレームワークを提案する。カリキュラム学習(CL)と強化学習(RL)を組み合わせた新しいトップダウンフレームワークを提案する。シミュレーションの結果,提案手法は,学習中の収束時間,タスク実行時間,送信コストにおいて従来のRLよりも優れていた。
論文参考訳（メタデータ） (2021-11-15T19:13:55Z)
Pre-training for Spoken Language Understanding with Joint Textual and Phonetic Representation Learning [4.327558819000435]
音声表現を学習するための新しいテキスト音声前訓練手法を提案する。音声言語理解ベンチマークであるFluent Speech CommandsとSNIPSの実験結果から,提案手法は強いベースラインモデルよりも有意に優れていることが示された。
論文参考訳（メタデータ） (2021-04-21T05:19:13Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。