論文の概要: Multi-Intent Spoken Language Understanding: Methods, Trends, and Challenges
- arxiv url: http://arxiv.org/abs/2512.11258v1
- Date: Fri, 12 Dec 2025 03:46:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.644961
- Title: Multi-Intent Spoken Language Understanding: Methods, Trends, and Challenges
- Title(参考訳): 多言語音声言語理解:手法,動向,課題
- Authors: Di Wu, Ruiyu Fang, Liting Jiang, Shuangyong Song, Xiaomeng Huang, Shiquan Wang, Zhongqiu Li, Lingling Shi, Mengjiao Bao, Yongxiang Li, Hao Huang,
- Abstract要約: マルチインテント音声言語理解には、複数のインテント検出とスロットフィリングという2つのタスクが含まれる。
マルチインテリジェントSLUに関する既存の研究について、包括的で体系的なレビューがまだ残っていない。
- 参考スコア(独自算出の注目度): 21.520532115690504
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-intent spoken language understanding (SLU) involves two tasks: multiple intent detection and slot filling, which jointly handle utterances containing more than one intent. Owing to this characteristic, which closely reflects real-world applications, the task has attracted increasing research attention, and substantial progress has been achieved. However, there remains a lack of a comprehensive and systematic review of existing studies on multi-intent SLU. To this end, this paper presents a survey of recent advances in multi-intent SLU. We provide an in-depth overview of previous research from two perspectives: decoding paradigms and modeling approaches. On this basis, we further compare the performance of representative models and analyze their strengths and limitations. Finally, we discuss the current challenges and outline promising directions for future research. We hope this survey will offer valuable insights and serve as a useful reference for advancing research in multi-intent SLU.
- Abstract(参考訳): マルチインテント音声言語理解(SLU)には、複数のインテントを含む発話を共同で処理する複数のインテント検出とスロットフィリングという2つのタスクがある。
この特徴は、現実世界の応用をよく反映しているため、研究の関心が高まり、大きな進歩を遂げている。
しかし,マルチインテリジェントSLUに関する既存の研究について,包括的かつ体系的なレビューがまだ残っていない。
そこで本研究では,マルチインテリジェントSLUの最近の進歩について報告する。
我々は、デコードパラダイムとモデリングアプローチという2つの視点から、過去の研究を詳細に概観する。
そこで本研究では,代表モデルの性能を更に比較し,その強みと限界を解析する。
最後に,今後の課題について論じ,今後の研究に期待できる方向性を概説する。
我々は、この調査が貴重な洞察を与え、マルチインテリジェントSLUの研究を進める上で有用な参考となることを願っている。
関連論文リスト
- Deep Research: A Systematic Survey [118.82795024422722]
Deep Research (DR)は、大規模言語モデルの推論能力と検索エンジンなどの外部ツールを組み合わせることを目的としている。
本調査は,深層研究システムの包括的かつ体系的な概要を提示する。
論文 参考訳(メタデータ) (2025-11-24T15:28:28Z) - From Perception to Cognition: A Survey of Vision-Language Interactive Reasoning in Multimodal Large Language Models [66.36007274540113]
MLLM(Multimodal Large Language Models)は、物理的世界に対する深い人間的な理解と相互作用を達成するための試みである。
情報取得(知覚)や推論(認知)を行う際、しばしば浅く不整合な統合を示す。
この調査では、新しい統合分析フレームワーク「知覚から認知へ」を紹介した。
論文 参考訳(メタデータ) (2025-09-29T18:25:40Z) - What Factors Affect Multi-Modal In-Context Learning? An In-Depth Exploration [59.855712519568904]
本稿では,MM-ICLの中核となる3つのステップについて検討する。
本研究は, 実演検索におけるマルチモーダルレトリバーの必要性と, 演目間注文よりも演目内注文が重要であることを明らかにする。
論文 参考訳(メタデータ) (2024-10-27T15:37:51Z) - Towards Spoken Language Understanding via Multi-level Multi-grained Contrastive Learning [50.1035273069458]
音声言語理解(SLU)はタスク指向対話システムにおける中核的なタスクである。
本稿では,発話レベル,スロットレベル,単語レベルを含む3段階のコントラスト学習を実現するためのマルチレベルMMCLフレームワークを提案する。
本フレームワークは,2つの公開マルチインテリジェントSLUデータセットに対して,最先端の新たな結果を実現する。
論文 参考訳(メタデータ) (2024-05-31T14:34:23Z) - Recent Advances in Hate Speech Moderation: Multimodality and the Role of Large Models [52.24001776263608]
この包括的調査は、HSモデレーションの最近の歩みを掘り下げている。
大型言語モデル(LLM)と大規模マルチモーダルモデル(LMM)の急成長する役割を強調した。
研究における既存のギャップを、特に表現不足言語や文化の文脈で特定する。
論文 参考訳(メタデータ) (2024-01-30T03:51:44Z) - A Survey on Spoken Language Understanding: Recent Advances and New
Frontiers [35.59678070422133]
音声言語理解(SLU)は、ユーザクエリのセマンティクスフレームの抽出を目的とする。
深層ニューラルネットワークの破裂と事前訓練された言語モデルの進化により、SLUの研究は大きなブレークスルーを得た。
論文 参考訳(メタデータ) (2021-03-04T15:22:00Z) - Multimodal Research in Vision and Language: A Review of Current and
Emerging Trends [41.07256031348454]
本稿では,視覚的・言語的モダリティに関する最新の研究動向について概説する。
タスクの定式化におけるその応用と、意味認識やコンテンツ生成に関する様々な問題を解決する方法について検討する。
私たちは、この領域をよりモジュール的で透明なインテリジェントなシステムに向け、過去に現れた、多分野のパターンと洞察に光を当てました。
論文 参考訳(メタデータ) (2020-10-19T13:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。