論文の概要: Neural Path Hunter: Reducing Hallucination in Dialogue Systems via Path
Grounding
- arxiv url: http://arxiv.org/abs/2104.08455v1
- Date: Sat, 17 Apr 2021 05:23:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 14:15:41.640338
- Title: Neural Path Hunter: Reducing Hallucination in Dialogue Systems via Path
Grounding
- Title(参考訳): ニューラルパスハンター:経路接地による対話システムにおける幻覚の低減
- Authors: Nouha Dziri, Andrea Madotto, Osmar Zaiane, Avishek Joey Bose
- Abstract要約: 知識グラフ(KG)による既知の事実に対するニューラルダイアログシステムの忠実度向上の課題に焦点をあてる。
KG の k-hop サブグラフを用いて生成した応答を修正する生成・再定義戦略に従ったニューラルパスハンターを提案する。
提案モデルは,モデルを再トレーニングすることなく,任意の対話生成応答に容易に適用できる。
- 参考スコア(独自算出の注目度): 15.62141731259161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dialogue systems powered by large pre-trained language models (LM) exhibit an
innate ability to deliver fluent and natural-looking responses. Despite their
impressive generation performance, these models can often generate factually
incorrect statements impeding their widespread adoption. In this paper, we
focus on the task of improving the faithfulness -- and thus reduce
hallucination -- of Neural Dialogue Systems to known facts supplied by a
Knowledge Graph (KG). We propose Neural Path Hunter which follows a
generate-then-refine strategy whereby a generated response is amended using the
k-hop subgraph of a KG. Neural Path Hunter leverages a separate token-level
fact critic to identify plausible sources of hallucination followed by a
refinement stage consisting of a chain of two neural LM's that retrieves
correct entities by crafting a query signal that is propagated over the k-hop
subgraph. Our proposed model can easily be applied to any dialogue generated
responses without retraining the model. We empirically validate our proposed
approach on the OpenDialKG dataset against a suite of metrics and report a
relative improvement of faithfulness over GPT2 dialogue responses by 8.4%.
- Abstract(参考訳): 大規模事前学習型言語モデル(lm)を用いた対話システムは、自然に流れるような応答を提供する。
印象的な世代パフォーマンスにもかかわらず、これらのモデルはしばしば、その普及を妨げている事実的に誤ったステートメントを生成する。
本稿では,知識グラフ(KG)によって提供される既知の事実に対して,ニューラル対話システムの忠実さを向上し,幻覚を低減することに焦点を当てる。
そこで我々は,KGのk-hopサブグラフを用いて,生成した応答を補正する生成-then-refine戦略に従うニューラルパスハンターを提案する。
Neural Path Hunterは別のトークンレベルの事実批判を利用して幻覚のもっともらしい源を識別し、その後k-hopサブグラフ上に伝播するクエリ信号を作成して正しいエンティティを検索する2つのニューラルLMの連鎖からなる洗練段階が続く。
提案モデルは,モデルを再トレーニングすることなく,任意の対話生成応答に容易に適用できる。
我々は,OpenDialKGデータセットに対する提案手法を一連の指標に対して実証的に検証し,GPT2対話応答に対する信頼度を8.4%向上させたことを報告した。
関連論文リスト
- A Cause-Effect Look at Alleviating Hallucination of Knowledge-grounded Dialogue Generation [51.53917938874146]
我々は,対話知識の相互作用を利用して,KGDの幻覚を緩和するための解決策を提案する。
本手法は,他の対話性能を損なうことなく幻覚を低減できることを示す。
論文 参考訳(メタデータ) (2024-04-04T14:45:26Z) - Improving the Robustness of Knowledge-Grounded Dialogue via Contrastive
Learning [71.8876256714229]
本稿では,知識ベース対話システムの堅牢性向上を目的とした,エンティティベースのコントラスト学習フレームワークを提案する。
提案手法は,自動評価スコアの点から,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2024-01-09T05:16:52Z) - HyPoradise: An Open Baseline for Generative Speech Recognition with
Large Language Models [81.56455625624041]
ASRの誤り訂正に外部の大規模言語モデル(LLM)を利用する最初のオープンソースベンチマークを導入する。
提案したベンチマークには、334,000組以上のN-best仮説を含む新しいデータセットHyPoradise (HP)が含まれている。
合理的なプロンプトと生成能力を持つLLMは、N-bestリストに欠けているトークンを修正できる。
論文 参考訳(メタデータ) (2023-09-27T14:44:10Z) - PICK: Polished & Informed Candidate Scoring for Knowledge-Grounded
Dialogue Systems [59.1250765143521]
現在の知識接地対話システムは、生成された応答を人間に好まれる品質に合わせるのに失敗することが多い。
我々は,世代別再描画フレームワークであるPolseed & Informed Candidate Scoring (PICK)を提案する。
対話履歴に関連性を維持しつつ,より忠実な応答を生成するためのPICKの有効性を示す。
論文 参考訳(メタデータ) (2023-09-19T08:27:09Z) - Diving Deep into Modes of Fact Hallucinations in Dialogue Systems [2.8360662552057323]
知識グラフ(KG)に基づく会話は、しばしば大きな事前訓練されたモデルを使用し、通常、事実幻覚に悩まされる。
我々は、応答を生成しながら、誤った内容を制御する微妙な信号を提供するエンティティレベルの幻覚検出システムを構築した。
論文 参考訳(メタデータ) (2023-01-11T13:08:57Z) - RHO ($\rho$): Reducing Hallucination in Open-domain Dialogues with
Knowledge Grounding [57.46495388734495]
本稿では、知識グラフ(KG)からリンクされたエンティティと関係述語を表現したRHO(rho$)を提案する。
本稿では,(1)テキスト埋め込みと対応するKG埋め込みを組み合わせるための局所知識基盤,(2)注目機構を介してRHOにマルチホップ推論能力を持たせるためのグローバル知識基盤を提案する。
論文 参考訳(メタデータ) (2022-12-03T10:36:34Z) - A Controllable Model of Grounded Response Generation [122.7121624884747]
現在のエンドツーエンドのニューラルネットワークモデルは、応答生成プロセスにセマンティックコントロールを課す柔軟性を本質的に欠いている。
我々は制御可能な接地応答生成(CGRG)と呼ばれるフレームワークを提案する。
このフレームワークを用いることで、会話のようなRedditデータセットでトレーニングされた、新しいインダクティブアテンション機構を備えたトランスフォーマーベースのモデルが、強力な生成ベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2020-05-01T21:22:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。