論文の概要: Genetic Approach to Mitigate Hallucination in Generative IR
- arxiv url: http://arxiv.org/abs/2409.00085v1
- Date: Sun, 25 Aug 2024 20:03:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-08 15:21:17.457892
- Title: Genetic Approach to Mitigate Hallucination in Generative IR
- Title(参考訳): 遺伝性IRにおける幻覚の緩和への遺伝的アプローチ
- Authors: Hrishikesh Kulkarni, Nazli Goharian, Ophir Frieder, Sean MacAvaney,
- Abstract要約: グラウンドド・アンサー・ジェネレーション(ジェネレーションIRの一部)の課題に焦点をあてる
検索エンジンから検索した結果に基づいて,ユーザの質問に対する直接的な回答を生成することを目的としている。
我々は、関連性のためのクロスエンコーダモデルとn-gramオーバーラップメトリックからなる新しい「バランスの取れたフィットネス機能」を既存の遺伝的アプローチに適用し、グラウンド化を促進する。
- 参考スコア(独自算出の注目度): 37.64658206917278
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative language models hallucinate. That is, at times, they generate factually flawed responses. These inaccuracies are particularly insidious because the responses are fluent and well-articulated. We focus on the task of Grounded Answer Generation (part of Generative IR), which aims to produce direct answers to a user's question based on results retrieved from a search engine. We address hallucination by adapting an existing genetic generation approach with a new 'balanced fitness function' consisting of a cross-encoder model for relevance and an n-gram overlap metric to promote grounding. Our balanced fitness function approach quadruples the grounded answer generation accuracy while maintaining high relevance.
- Abstract(参考訳): 生成言語モデルは幻覚する。
つまり、時にそれらは事実的に欠陥のある応答を生成する。
これらの不正確さは、応答が流動的かつ順応的であるため、特に不正確である。
我々は,検索エンジンから検索した結果に基づいて,ユーザの質問に対する直接的な回答を生成することを目的としたグラウンドドアンサー生成(ジェネレーティブIRの一部)の課題に焦点をあてる。
我々は,既存の遺伝的アプローチを,関連性のためのクロスエンコーダモデルと,グラウンド化を促進するためのn-gram重なりのメトリクスからなる新しい「バランスの取れたフィットネス機能」に適応させることで,幻覚に対処する。
我々のバランスの取れた適合関数アプローチは、高い妥当性を維持しながら、接地された回答の生成精度を4倍にします。
関連論文リスト
- Groundedness in Retrieval-augmented Long-form Generation: An Empirical Study [61.74571814707054]
検索した文書やモデルの事前学習データに生成されたすべての文が接地されているかどうかを評価する。
3つのデータセットと4つのモデルファミリーにまたがって、生成した文のかなりの部分が一貫してアングラウンド化されていることが明らかとなった。
以上の結果から,より大きなモデルではアウトプットをより効果的に基礎づける傾向にあるものの,正解のかなりの部分が幻覚によって損なわれていることが示唆された。
論文 参考訳(メタデータ) (2024-04-10T14:50:10Z) - Towards Mitigating Hallucination in Large Language Models via
Self-Reflection [63.2543947174318]
大規模言語モデル(LLM)は、質問応答(QA)タスクを含む生成的および知識集約的なタスクを約束している。
本稿では,広範に採用されているLCMとデータセットを用いた医療再生QAシステムにおける幻覚現象を解析する。
論文 参考訳(メタデータ) (2023-10-10T03:05:44Z) - Weakly Supervised Visual Question Answer Generation [2.7605547688813172]
視覚情報とキャプションから手続き的に質問応答対を合成的に生成する弱教師付き手法を提案する。
我々は,VQAデータセットの総合的な実験分析を行い,BLEUスコアのSOTA手法を著しく上回る結果を得た。
論文 参考訳(メタデータ) (2023-06-11T08:46:42Z) - Read before Generate! Faithful Long Form Question Answering with Machine
Reading [77.17898499652306]
LFQA(Long-form Question answering)は、ある質問に対する段落長の回答を生成することを目的としている。
生成と機械読取を協調的にモデル化する新しいエンドツーエンドフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-01T10:41:17Z) - MixQG: Neural Question Generation with Mixed Answer Types [54.23205265351248]
このギャップを埋めるために、ニューラル質問生成器MixQGを提案する。
yes/no, multiple-choice, extractive, abstractive answerなど,9つの質問応答データセットと多様な回答タイプを組み合わせる。
私たちのモデルは、目に見えない領域と見えない領域の両方で、既存の作業より優れています。
論文 参考訳(メタデータ) (2021-10-15T16:03:40Z) - Asking Questions Like Educational Experts: Automatically Generating
Question-Answer Pairs on Real-World Examination Data [10.353009081072992]
本稿では,実世界の検査データ上での質問応答対生成課題に対処し,RASに関する新たな統合フレームワークを提案する。
本稿では,質問文とキーフレーズを反復的に生成・最適化するマルチエージェント通信モデルを提案する。
実験結果から,質問応答対生成タスクにおいて,本モデルが大きなブレークスルーをもたらすことが明らかとなった。
論文 参考訳(メタデータ) (2021-09-11T04:10:57Z) - A Controllable Model of Grounded Response Generation [122.7121624884747]
現在のエンドツーエンドのニューラルネットワークモデルは、応答生成プロセスにセマンティックコントロールを課す柔軟性を本質的に欠いている。
我々は制御可能な接地応答生成(CGRG)と呼ばれるフレームワークを提案する。
このフレームワークを用いることで、会話のようなRedditデータセットでトレーニングされた、新しいインダクティブアテンション機構を備えたトランスフォーマーベースのモデルが、強力な生成ベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2020-05-01T21:22:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。