論文の概要: ProKG-Dial: Progressive Multi-Turn Dialogue Construction with Domain Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2508.01869v1
- Date: Sun, 03 Aug 2025 17:52:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:22.09884
- Title: ProKG-Dial: Progressive Multi-Turn Dialogue Construction with Domain Knowledge Graphs
- Title(参考訳): ProKG-Dial:ドメイン知識グラフを用いたプログレッシブな多段階対話構築
- Authors: Yuanyuan Liang, Xiaoman Wang, Tingyu Xie, Lei Pan,
- Abstract要約: 現在の大規模言語モデル(LLM)は一般的なNLPタスクでは優れているが、プロの設定ではドメイン固有の精度を欠いていることが多い。
ドメイン固有知識グラフ(KG)を用いた知識集中型多元対話構築フレームワークであるProKG Dialを紹介する。
医療知識グラフ上のProKGダイアルを多様性,セマンティック・コヒーレンス,エンティティ・カバレッジの観点から評価し,評価する。
- 参考スコア(独自算出の注目度): 3.9190413787169414
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Current large language models (LLMs) excel at general NLP tasks but often lack domain specific precision in professional settings. Building a high quality domain specific multi turn dialogue dataset is essential for developing specialized conversational systems. However, existing methods such as manual annotation, simulated human LLM interactions, and role based LLM dialogues are resource intensive or suffer from limitations in dialogue quality and domain coverage. To address these challenges, we introduce ProKG Dial, a progressive framework for constructing knowledge intensive multi turn dialogue datasets using domain specific knowledge graphs (KGs). ProKG Dial leverages the structured nature of KGs to encode complex domain knowledge and relationships, providing a solid foundation for generating meaningful and coherent dialogues. Specifically, ProKG Dial begins by applying community detection to partition the KG into semantically cohesive subgraphs. For each subgraph, the framework incrementally generates a series of questions and answers centered around a target entity, ensuring relevance and coverage. A rigorous filtering step is employed to maintain high dialogue quality. We validate ProKG Dial on a medical knowledge graph by evaluating the generated dialogues in terms of diversity, semantic coherence, and entity coverage. Furthermore, we fine tune a base LLM on the resulting dataset and benchmark it against several baselines. Both automatic metrics and human evaluations demonstrate that ProKG Dial substantially improves dialogue quality and domain specific performance, highlighting its effectiveness and practical utility.
- Abstract(参考訳): 現在の大規模言語モデル(LLM)は一般的なNLPタスクでは優れているが、プロの設定ではドメイン固有の精度を欠いていることが多い。
高品質なドメイン固有多元対話データセットの構築は、特殊な対話システムを開発する上で不可欠である。
しかし、手動アノテーション、シミュレーションされた人間のLLMインタラクション、ロールベースのLLM対話といった既存の手法は、リソース集約的であるか、対話品質やドメインカバレッジの制限に悩まされている。
これらの課題に対処するため,ドメイン固有知識グラフ(KG)を用いた多ターン対話データセット構築のためのプログレッシブフレームワークであるProKG Dialを紹介した。
ProKG DialはKGの構造的性質を利用して複雑なドメイン知識と関係を符号化し、意味のある一貫性のある対話を生成するための確かな基盤を提供する。
具体的には、コミュニティ検出を適用してKGを意味的に結合したサブグラフに分割することから、ProKGダイアルが始まります。
各サブグラフに対して、フレームワークは、対象エンティティを中心とした一連の質問と回答を段階的に生成し、関連性とカバレッジを保証する。
高い対話品質を維持するために厳格なフィルタリングステップが使用される。
医療知識グラフ上のProKGダイアルを多様性,セマンティック・コヒーレンス,エンティティ・カバレッジの観点から評価し,評価する。
さらに、得られたデータセットに基づいてベースLSMを微調整し、いくつかのベースラインに対してベンチマークする。
自動測定と人的評価の両方で、ProKG Dialは対話品質とドメイン固有性能を大幅に改善し、その有効性と実用性を強調している。
関連論文リスト
- CoDial: Interpretable Task-Oriented Dialogue Systems Through Dialogue Flow Alignment [24.936670177298584]
専門家の知識を実行可能な会話ロジックに変換する新しいフレームワークであるCoDialを導入する。
CoDialはColangのような既存のガードレール言語で簡単に実装できる。
推論ベースモデルのSTARデータセット上での最先端のパフォーマンスを実現し、よく知られたMultiWOZデータセット上の同様のベースラインと競合する。
論文 参考訳(メタデータ) (2025-06-02T21:12:27Z) - Bottom-Up Synthesis of Knowledge-Grounded Task-Oriented Dialogues with Iteratively Self-Refined Prompts [19.73376945990922]
ボトムアップな会話合成手法を導入し、まずQAペアを生成し、その後にコヒーレントな対話に結合する。
この構造は、プロプライエタリな知識を含まない段階における非局所モデルの使用を可能にする。
人的・自動的な評価は、我々のアプローチがより現実的で高品質な対話を生み出すことを示している。
論文 参考訳(メタデータ) (2025-04-19T18:25:53Z) - Dialogue Benchmark Generation from Knowledge Graphs with Cost-Effective Retrieval-Augmented LLMs [0.8772713588571283]
Chatty-Genは、対話ベンチマークのための新しい多段階検索拡張生成プラットフォームである。
Chatty-Genは生成プロセスを管理可能なステージに分解し、自動検証にアサーションルールを使用する。
いくつかの実および大のKGを用いた実験により、Chatty-Genは最先端システムよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2025-01-17T02:48:29Z) - Domain-Specific Retrieval-Augmented Generation Using Vector Stores, Knowledge Graphs, and Tensor Factorization [7.522493227357079]
大規模言語モデル(LLM)は大規模コーパスで事前訓練されている。
LLMは幻覚、知識の遮断、知識の帰属の欠如に悩まされる。
SMART-SLICはドメイン固有のLLMフレームワークである。
論文 参考訳(メタデータ) (2024-10-03T17:40:55Z) - DialCLIP: Empowering CLIP as Multi-Modal Dialog Retriever [83.33209603041013]
マルチモーダルダイアログ検索のためのパラメータ効率の高いプロンプトチューニング手法であるDialCLIPを提案する。
提案手法では,事前学習された視覚言語モデルCLIP内のプロンプトに抽出された文脈特徴を学習するためのマルチモーダルコンテキスト生成手法を提案する。
様々なタイプの検索を容易にするために,CLIP出力からマルチモーダル表現空間へのマッピングを学習するために,複数の専門家を設計する。
論文 参考訳(メタデータ) (2024-01-02T07:40:12Z) - Fine-Grained Analysis of Team Collaborative Dialogue [1.363890704621148]
Slackチャットを用いたソフトウェア開発領域における説明可能な分析ツールの開発に向けた最初の取り組みについて説明する。
本研究では,対話行動の発生頻度に基づく記述的メトリクスの設計と,長距離コンテキストを組み込むための変換器+CRFアーキテクチャを用いた初期結果を作成する。
論文 参考訳(メタデータ) (2023-12-09T05:38:32Z) - SuperDialseg: A Large-scale Dataset for Supervised Dialogue Segmentation [55.82577086422923]
文書地上対話の助けを借りて,対話のセグメンテーションポイントを実現可能な定義を提供する。
我々は,9,478の対話を含むSuperDialsegと呼ばれる大規模教師付きデータセットをリリースする。
また、対話セグメンテーションタスクの5つのカテゴリにまたがる18のモデルを含むベンチマークも提供する。
論文 参考訳(メタデータ) (2023-05-15T06:08:01Z) - Variational Reasoning over Incomplete Knowledge Graphs for
Conversational Recommendation [48.70062671767362]
不完全KGs会話レコメンダ(VRICR)に対する変分推論を提案する。
我々のキーとなる考え方は、CRSを伴って自然に大きな対話コーパスを組み込んで、不完全なKGを強化することである。
また、KGsの対話特化部分グラフを適応的知識グラフの分類的先行を持つ潜在変数として表す。
論文 参考訳(メタデータ) (2022-12-22T17:02:21Z) - PoE: a Panel of Experts for Generalized Automatic Dialogue Assessment [58.46761798403072]
モデルベース自動対話評価基準(ADEM)は,複数の領域にわたって良好に機能することが期待される。
大きな進歩にもかかわらず、ある領域でうまく機能するADEMは必ずしも他の領域に一般化するとは限らない。
本稿では,共有トランスフォーマーエンコーダと軽量アダプタの集合からなるPanel of Experts (PoE)ネットワークを提案する。
論文 参考訳(メタデータ) (2022-12-18T02:26:50Z) - Detecting and Classifying Malevolent Dialogue Responses: Taxonomy, Data
and Methodology [68.8836704199096]
コーパスベースの会話インタフェースは、テンプレートベースのエージェントや検索ベースのエージェントよりも多様な自然なレスポンスを生成することができる。
コーパスベースの会話エージェントの生成能力が増大すると、マレヴォレントな反応を分類し、フィルタリングする必要性が生じる。
不適切な内容の認識と分類に関するこれまでの研究は、主にある種のマレヴォレンスに焦点を絞っている。
論文 参考訳(メタデータ) (2020-08-21T22:43:27Z) - Improving Conversational Recommender Systems via Knowledge Graph based
Semantic Fusion [77.21442487537139]
対話型レコメンデータシステム(CRS)は,対話型対話を通じて高品質なアイテムをユーザに推薦することを目的としている。
まず、会話データ自体にユーザの好みを正確に理解するための十分なコンテキスト情報がない。
第二に、自然言語表現とアイテムレベルのユーザ嗜好の間には意味的なギャップがある。
論文 参考訳(メタデータ) (2020-07-08T11:14:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。