論文の概要: TimelineQA: A Benchmark for Question Answering over Timelines
- arxiv url: http://arxiv.org/abs/2306.01069v1
- Date: Thu, 1 Jun 2023 18:17:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-05 18:22:29.512316
- Title: TimelineQA: A Benchmark for Question Answering over Timelines
- Title(参考訳): TimelineQA: タイムラインに対する質問回答のベンチマーク
- Authors: Wang-Chiew Tan, Jane Dwivedi-Yu, Yuliang Li, Lambert Mathias, Marzieh
Saeidi, Jing Nathan Yan, Alon Y. Halevy
- Abstract要約: ライフログ(Lifelog)とは、人生で経験した経験を記述したものである。
Lifelogsは、コンテキスト内でアドバイスを提供しようとするときに、パーソナルアシスタントに重要なリソースを提供することができる。
ライフログのクエリの進捗を加速するベンチマークであるTimelineQA1を作成した。
- 参考スコア(独自算出の注目度): 22.931761248196363
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lifelogs are descriptions of experiences that a person had during their life.
Lifelogs are created by fusing data from the multitude of digital services,
such as online photos, maps, shopping and content streaming services. Question
answering over lifelogs can offer personal assistants a critical resource when
they try to provide advice in context. However, obtaining answers to questions
over lifelogs is beyond the current state of the art of question answering
techniques for a variety of reasons, the most pronounced of which is that
lifelogs combine free text with some degree of structure such as temporal and
geographical information.
We create and publicly release TimelineQA1, a benchmark for accelerating
progress on querying lifelogs. TimelineQA generates lifelogs of imaginary
people. The episodes in the lifelog range from major life episodes such as high
school graduation to those that occur on a daily basis such as going for a run.
We describe a set of experiments on TimelineQA with several state-of-the-art QA
models. Our experiments reveal that for atomic queries, an extractive QA system
significantly out-performs a state-of-the-art retrieval-augmented QA system.
For multi-hop queries involving aggregates, we show that the best result is
obtained with a state-of-the-art table QA technique, assuming the ground truth
set of episodes for deriving the answer is available.
- Abstract(参考訳): ライフログ(Lifelog)とは、人生で経験した経験を記述したものである。
lifelogsは、オンライン写真、地図、ショッピング、コンテンツストリーミングサービスなど、多数のデジタルサービスからのデータを使って作成される。
ライフログに対する質問応答は、文脈でアドバイスを提供しようとするときに、パーソナルアシスタントに重要なリソースを提供する。
しかしながら、ライフログに関する質問に対する回答を得ることは、様々な理由から質問応答技術の現状を超えており、最も顕著なのは、ライフログが自由テキストと時間的・地理的情報といったある程度の構造を結合していることである。
ライフログのクエリの進捗を加速するベンチマークであるTimelineQA1を作成した。
TimelineQAは想像上の人々のライフログを生成する。
ライフログのエピソードは、高校卒業などの主要な人生のエピソードから、走りに行くなど日常的に起こるエピソードまで様々である。
本稿では,いくつかの最先端QAモデルを用いたTimelineQA実験について述べる。
実験の結果,原子クエリでは,抽出QAシステムは最先端の検索拡張QAシステムよりも大幅に優れていた。
集約を含むマルチホップクエリでは,回答を導出するエピソードの根本的真理セットが利用可能であることを前提として,最先端のテーブルQA技術を用いて最良の結果が得られることを示す。
関連論文リスト
- Multi-hop Question Answering under Temporal Knowledge Editing [9.356343796845662]
知識編集(KE)におけるマルチホップ質問応答(MQA)は,大規模言語モデルの時代において大きな注目を集めている。
KEの下でのMQAの既存のモデルは、明示的な時間的コンテキストを含む質問を扱う場合、パフォーマンスが劣っている。
TEMPoral knowLEdge augmented Multi-hop Question Answering (TEMPLE-MQA) を提案する。
論文 参考訳(メタデータ) (2024-03-30T23:22:51Z) - Joint Multi-Facts Reasoning Network For Complex Temporal Question
Answering Over Knowledge Graph [34.44840297353777]
時間的知識グラフ(TKG)は、時間範囲をアタッチすることで、通常の知識グラフの拡張である。
textbfunderlineMulti textbfunderlineFacts textbfunderlineReasoning textbfunderlineNetwork (JMFRN)を提案する。
論文 参考訳(メタデータ) (2024-01-04T11:34:39Z) - Towards Robust Temporal Reasoning of Large Language Models via a Multi-Hop QA Dataset and Pseudo-Instruction Tuning [73.51314109184197]
大規模言語モデル(LLM)には時間的知識の概念を理解することが不可欠である。
本稿では,複数質問応答と複数ホップの時間的推論に焦点をあてた複雑な時間的質問応答データセットであるComplex-TRを提案する。
論文 参考訳(メタデータ) (2023-11-16T11:49:29Z) - Locate before Answering: Answer Guided Question Localization for Video
Question Answering [70.38700123685143]
LocAnsは質問ロケータと回答予測器をエンドツーエンドモデルに統合する。
最新の2つのビデオQAデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-10-05T08:19:16Z) - RealTime QA: What's the Answer Right Now? [137.04039209995932]
本稿では,動的質問応答(QA)プラットフォームであるREALTIME QAを紹介する。
GPT-3 や T5 など,大規模事前学習型言語モデルに基づく強力なベースラインモデルを構築した。
GPT-3は、検索された文書が答えを見つけるのに十分な情報を提供していない場合、時代遅れの回答を返す傾向がある。
論文 参考訳(メタデータ) (2022-07-27T07:26:01Z) - UKP-SQUARE: An Online Platform for Question Answering Research [50.35348764297317]
我々は、研究者向けのオンラインQAプラットフォームであるUKP-SQUAREを紹介した。
UKP-SQUAREでは、ユーザフレンドリーなWebインターフェースと統合テストを通じて、モダンスキルの大規模なコレクションをクエリし、分析することができる。
論文 参考訳(メタデータ) (2022-03-25T15:00:24Z) - NExT-QA:Next Phase of Question-Answering to Explaining Temporal Actions [80.60423934589515]
NExT-QAは、厳密に設計されたビデオ質問回答(VideoQA)ベンチマークです。
因果的行動推論,時間的行動推論,共通場面理解を対象とする複数選択およびオープンエンドQAタスクを構築した。
トップパフォーマンスの手法は浅い場面記述に優れているが、因果的および時間的行動推論に弱い。
論文 参考訳(メタデータ) (2021-05-18T04:56:46Z) - Towards Automatic Generation of Questions from Long Answers [11.198653485869935]
本稿では,従来のAQGシステムの性能評価のための新しい評価ベンチマークを提案する。
既存のAQG法の性能は,回答の長さが大きくなるにつれて著しく低下することを示した。
トランスフォーマーに基づく手法は, 従来のAQG法よりも, 自己評価や人的評価の点で優れていた。
論文 参考訳(メタデータ) (2020-04-10T16:45:08Z) - Unsupervised Question Decomposition for Question Answering [102.56966847404287]
本論文では, ワンツーNアン教師付きシーケンスシーケンス(ONUS)のアルゴリズムを提案する。
当初,ドメイン外,マルチホップ開発セットのベースラインが強かったため,HotpotQAでは大きなQA改善が見られた。
論文 参考訳(メタデータ) (2020-02-22T19:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。