Fugu-MT 論文翻訳(概要): Model Analysis & Evaluation for Ambiguous Question Answering

論文の概要: Model Analysis & Evaluation for Ambiguous Question Answering

arxiv url: http://arxiv.org/abs/2305.12483v1
Date: Sun, 21 May 2023 15:20:20 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-23 20:03:55.959890
Title: Model Analysis & Evaluation for Ambiguous Question Answering
Title（参考訳）: あいまいな質問応答のモデル解析と評価
Authors: Konstantinos Papakostas, Irene Papadopoulou
Abstract要約: 質問回答モデルは、しばしば矛盾する情報の断片を組み合わせた長文の回答を生成するために必要である。この分野の最近の進歩は、流動的な応答を発生させる強力な能力を示しているが、いくつかの研究課題は未解決のままである。これらの側面を徹底的に調査し、現在のアプローチの限界について貴重な洞察を提供することを目指しています。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Ambiguous questions are a challenge for Question Answering models, as they require answers that cover multiple interpretations of the original query. To this end, these models are required to generate long-form answers that often combine conflicting pieces of information. Although recent advances in the field have shown strong capabilities in generating fluent responses, certain research questions remain unanswered. Does model/data scaling improve the answers' quality? Do automated metrics align with human judgment? To what extent do these models ground their answers in evidence? In this study, we aim to thoroughly investigate these aspects, and provide valuable insights into the limitations of the current approaches. To aid in reproducibility and further extension of our work, we open-source our code at https://github.com/din0s/ambig_lfqa.
Abstract（参考訳）: 曖昧な質問は、元のクエリの複数の解釈をカバーする回答を必要とするため、質問回答モデルの課題である。この目的のために、これらのモデルは、しばしば相反する情報の断片を結合する長い形式の回答を生成する必要がある。この分野の最近の進歩は、フルーエントな応答を生成する能力が強かったが、いくつかの研究課題は未解決のままである。モデル/データのスケーリングは回答の品質を改善するか? 自動メトリクスは人間の判断と一致しているか? これらのモデルはどの程度証拠として答えていますか。本研究では,これらの側面を徹底的に検討し,現在のアプローチの限界に関する貴重な知見を提供する。再現性と作業のさらなる拡張を支援するために、コードをhttps://github.com/din0s/ambig_lfqaでオープンソースにします。

関連論文リスト

Localizing and Mitigating Errors in Long-form Question Answering [79.63372684264921]
LFQA(Long-form Question answering)は、複雑な質問に対して徹底的で深い回答を提供し、理解を深めることを目的としている。この研究は、人書きおよびモデル生成LFQA回答の局所的エラーアノテーションを備えた最初の幻覚データセットであるHaluQuestQAを紹介する。
論文参考訳（メタデータ） (2024-07-16T17:23:16Z)
Long-form Question Answering: An Iterative Planning-Retrieval-Generation Approach [28.849548176802262]
長文質問応答(LFQA)は,段落の形で詳細な回答を生成するため,課題となる。本稿では,反復計画,検索,生成を伴うLFQAモデルを提案する。我々のモデルはLFQAタスクの様々なテキストおよび実測値の最先端モデルよりも優れていることがわかった。
論文参考訳（メタデータ） (2023-11-15T21:22:27Z)
UNK-VQA: A Dataset and a Probe into the Abstention Ability of Multi-modal Large Models [55.22048505787125]
本稿ではUNK-VQAと呼ばれる包括的データセットを提案する。まず、画像または疑問について意図的に摂動することで、既存のデータを拡大する。そこで我々は,新たなマルチモーダル大規模モデルのゼロショット性能と少数ショット性能を広範囲に評価した。
論文参考訳（メタデータ） (2023-10-17T02:38:09Z)
Answering Ambiguous Questions via Iterative Prompting [84.3426020642704]
オープンドメインの質問応答では、質問のあいまいさのため、複数の妥当な回答が存在する可能性がある。ひとつのアプローチは、すべての有効な回答を直接予測することですが、これは、妥当性と多様性のバランスに苦労する可能性があります。本稿では,あいまいな疑問に答える既存手法の欠陥に対処するため,AmbigPromptを提案する。
論文参考訳（メタデータ） (2023-07-08T04:32:17Z)
Realistic Conversational Question Answering with Answer Selection based on Calibrated Confidence and Uncertainty Measurement [54.55643652781891]
対話型質問回答モデル(ConvQA)は,会話中に複数回発生した質問文と過去の質問文のペアを用いて質問に回答することを目的としている。本稿では,会話履歴における不正確な回答を,ConvQAモデルから推定された信頼度と不確実性に基づいてフィルタリングすることを提案する。我々は2つの標準ConvQAデータセット上で、回答選択に基づくリアルな会話質問回答モデルの有効性を検証する。
論文参考訳（メタデータ） (2023-02-10T09:42:07Z)
Question Answering Survey: Directions, Challenges, Datasets, Evaluation Matrices [0.0]
QA分野の研究の方向性は,質問の種類,回答の種類,根拠の源泉,モデリングアプローチに基づいて分析される。これに続き、自動質問生成、類似性検出、言語に対する低リソース可用性など、この分野のオープンな課題が続きます。
論文参考訳（メタデータ） (2021-12-07T08:53:40Z)
SituatedQA: Incorporating Extra-Linguistic Contexts into QA [7.495151447459443]
SituatedQA(SituatedQA)は,時間的・地理的文脈を考慮に入れた質問に対して,システムが正しい回答を提示しなければならない,オープン検索型QAデータセットである。質問を求める情報のかなりの割合は、文脈に依存した回答であることがわかった。我々の研究は、既存のモデルが頻繁に更新される、あるいは珍しい場所から回答を得るのに苦労していることを示している。
論文参考訳（メタデータ） (2021-09-13T17:53:21Z)
Human-Adversarial Visual Question Answering [62.30715496829321]
我々は、最先端のVQAモデルと人間工学の例を比較検討する。これらの例で評価すると,多種多様な最先端モデルの性能が低下していることが分かる。
論文参考訳（メタデータ） (2021-06-04T06:25:32Z)
Answering Ambiguous Questions through Generative Evidence Fusion and Round-Trip Prediction [46.38201136570501]
本稿では,複数の通路からの証拠を集約し,一つの回答や質問対の集合を適応的に予測するモデルを提案する。我々のモデルはRefuelと呼ばれ、AmbigQAデータセット上で新しい最先端のパフォーマンスを実現し、NQ-OpenおよびTriviaQA上での競合性能を示す。
論文参考訳（メタデータ） (2020-11-26T05:48:55Z)
ManyModalQA: Modality Disambiguation and QA over Diverse Inputs [73.93607719921945]
本稿では, エージェントが3つの異なるモダリティを考慮し, 質問に答えなければならない, マルチモーダルな質問応答課題, ManyModalQAを提案する。われわれはウィキペディアをスクラップしてデータを収集し、クラウドソーシングを利用して質問と回答のペアを収集する。
論文参考訳（メタデータ） (2020-01-22T14:39:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。