論文の概要: Hybrid Dialogue State Tracking for Persian Chatbots: A Language Model-Based Approach
- arxiv url: http://arxiv.org/abs/2510.01052v1
- Date: Wed, 01 Oct 2025 15:57:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.657904
- Title: Hybrid Dialogue State Tracking for Persian Chatbots: A Language Model-Based Approach
- Title(参考訳): ペルシャチャットボットのためのハイブリッド対話状態追跡:言語モデルに基づくアプローチ
- Authors: Samin Mahdipour Aghabagher, Saeedeh Momtazi,
- Abstract要約: 対話状態追跡(DST)は会話AIの重要な要素である。
従来のルールベースのDSTは複雑な会話には十分ではない。
本研究では,ルールベースの手法と言語モデルを用いたハイブリッドDSTモデルを提案する。
- 参考スコア(独自算出の注目度): 2.2774471443318762
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dialogue State Tracking (DST) is an essential element of conversational AI with the objective of deeply understanding the conversation context and leading it toward answering user requests. Due to high demands for open-domain and multi-turn chatbots, the traditional rule-based DST is not efficient enough, since it cannot provide the required adaptability and coherence for human-like experiences in complex conversations. This study proposes a hybrid DST model that utilizes rule-based methods along with language models, including BERT for slot filling and intent detection, XGBoost for intent validation, GPT for DST, and online agents for real-time answer generation. This model is uniquely designed to be evaluated on a comprehensive Persian multi-turn dialogue dataset and demonstrated significantly improved accuracy and coherence over existing methods in Persian-based chatbots. The results demonstrate how effectively a hybrid approach may improve DST capabilities, paving the way for conversational AI systems that are more customized, adaptable, and human-like.
- Abstract(参考訳): 対話状態追跡(DST)は、会話のコンテキストを深く理解し、ユーザーの要求に答えるための会話AIの重要な要素である。
オープンドメインとマルチターンチャットボットの要求が高いため、従来のルールベースのDSTでは、複雑な会話において人間のような体験に必要な適応性と一貫性を提供することができないため、十分な効率が得られない。
本研究では,ルールベースの手法と言語モデルを用いたハイブリッドDSTモデルを提案する。例えば,BERTによるスロットフィリングとインテント検出,意図検証用XGBoost,DST用GPT,リアルタイム回答生成用オンラインエージェントなどである。
このモデルは、ペルシアの総合的なマルチターン対話データセットで評価されるように設計されており、ペルシアのチャットボットにおける既存の手法よりも精度とコヒーレンスを大幅に向上することを示した。
その結果、ハイブリッドアプローチがDST能力をいかに効果的に改善するかを示し、よりカスタマイズされ、適応可能で、人間のような会話型AIシステムへの道を開いた。
関連論文リスト
- V-VAE: A Variational Auto Encoding Framework Towards Fine-Grained Control over Human-Like Chat [19.038481783630864]
ロールプレイとペルソナベースのチャットアプローチは、静的な役割記述、粗い信号空間、低品質の合成データに大きく依存している。
人間のようなチャットは、感情的なトーン、状況認識、進化するパーソナリティなどの微妙な潜伏特性をモデル化する必要がある。
これらの制約に対処するため、変分自動符号化モジュールと細粒度で解釈可能な潜伏変数を含むV-VAEフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-02T10:38:02Z) - Beyond Ontology in Dialogue State Tracking for Goal-Oriented Chatbot [3.2288892242158984]
本稿では,対話状態追跡(DST)性能を向上させる新しい手法を提案する。
提案手法により,Large Language Model (LLM) による対話状態の推測が可能となる。
提案手法は,42.57%のJGAで最先端を達成し,オープンドメインの現実世界での会話でも良好に機能した。
論文 参考訳(メタデータ) (2024-10-30T07:36:23Z) - ChatSOP: An SOP-Guided MCTS Planning Framework for Controllable LLM Dialogue Agents [52.7201882529976]
対話エージェントの制御性を高めるため,SOP誘導モンテカルロ木探索(MCTS)計画フレームワークを提案する。
これを実現するために、GPT-4oを用いた半自動ロールプレイシステムを用いて、SOPアノテーション付きマルチシナリオ対話からなるデータセットをキュレートする。
また、SOP予測のための教師付き微調整と思考の連鎖推論を統合する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-04T12:23:02Z) - Large Language Models as Zero-shot Dialogue State Tracker through Function Calling [42.00097476584174]
本稿では,大言語モデル(LLM)を用いた対話状態追跡の関数呼び出しによる解法を提案する。
この方法はゼロショットDSTを改善し、広範囲のデータ収集やモデルチューニングなしに多様なドメインに適応できる。
提案手法は,オープン・ソースとプロプライエタリ・LLMの両面において,極めて優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2024-02-16T06:13:18Z) - Can You Follow Me? Testing Situational Understanding in ChatGPT [17.52769657390388]
situational understanding (SU)は、人間のようなAIエージェントにとって重要な能力である。
チャット指向モデルにおけるSUテストのための新しい合成環境を提案する。
タスクの基本的な単純さにもかかわらず、モデルの性能は正しい環境状態を維持することができないことを反映している。
論文 参考訳(メタデータ) (2023-10-24T19:22:01Z) - Does Collaborative Human-LM Dialogue Generation Help Information
Extraction from Human Dialogues? [55.28340832822234]
実際のアプリケーションにおける人間の対話の問題解決は、既存のWizard-of-Ozコレクションよりもはるかに複雑である。
本稿では,リアルな対話を合成できる人間間対話生成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-13T20:02:50Z) - SSP: Self-Supervised Post-training for Conversational Search [63.28684982954115]
本稿では,対話型検索モデルを効率的に初期化するための3つの自己教師型タスクを備えた学習後パラダイムであるフルモデル(モデル)を提案する。
提案手法の有効性を検証するために,CAsT-19 と CAsT-20 の2つのベンチマークデータセットを用いて,会話検索タスクにモデルにより訓練後の会話エンコーダを適用した。
論文 参考訳(メタデータ) (2023-07-02T13:36:36Z) - Stabilized In-Context Learning with Pre-trained Language Models for Few
Shot Dialogue State Tracking [57.92608483099916]
大規模事前学習言語モデル(PLM)は、多くのNLPタスクにまたがる優れた性能を示している。
対話状態追跡(DST)のようなより複雑なタスクでは、望ましい意図を確実に伝達するプロンプトを設計するのは簡単ではない。
対話文の長さを制限するためのサリエンシモデルを導入し、クエリ毎に多くの例を含めることができます。
論文 参考訳(メタデータ) (2023-02-12T15:05:10Z) - Prompt Learning for Few-Shot Dialogue State Tracking [75.50701890035154]
本稿では,限られたラベル付きデータを用いて,対話状態追跡(DST)モデルを効率的に学習する方法に焦点を当てる。
本稿では,2つの主要なコンポーネントである値ベースプロンプトと逆プロンプト機構からなる,数ショットDSTのためのプロンプト学習フレームワークを設計する。
実験により、我々のモデルは未確認のスロットを生成し、既存の最先端の数ショット法より優れていることが示された。
論文 参考訳(メタデータ) (2022-01-15T07:37:33Z) - Robust Conversational AI with Grounded Text Generation [77.56950706340767]
GTGは、大規模なTransformerニューラルネットワークをバックボーンとして使用するハイブリッドモデルである。
タスク完了のための対話的信念状態と実世界の知識に基づく応答を生成する。
論文 参考訳(メタデータ) (2020-09-07T23:49:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。