論文の概要: Towards More Realistic Generation of Information-Seeking Conversations
- arxiv url: http://arxiv.org/abs/2205.12609v1
- Date: Wed, 25 May 2022 09:33:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-27 04:31:58.887086
- Title: Towards More Realistic Generation of Information-Seeking Conversations
- Title(参考訳): 情報探索対話のより現実的な生成に向けて
- Authors: Gangwoo Kim, Sungdong Kim, Kang Min Yoo, Jaewoo Kang
- Abstract要約: まず、情報対称会話のための強力なシミュレータSimSeek-symを紹介し、質問者と回答者がすべての知識を共有する。
本研究では,2つのエージェント間の情報非対称性を仮定するSimSeek-asymを提案する。
実験の結果,SimSeek-asymは,CQAと会話検索という2つの下流タスクに対して,情報検索の会話を生成することができた。
- 参考スコア(独自算出の注目度): 28.00273990499349
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we introduce a novel framework SimSeek (simulating
information-seeking conversation from unlabeled documents) and compare two
variants of it to provide a deeper perspective into the information-seeking
behavior. We first introduce a strong simulator for information-symmetric
conversation, SimSeek-sym, where questioner and answerer share all knowledge
when conversing with one another. Although it simulates reasonable
conversations, we take a further step toward more realistic information-seeking
conversation. Hence, we propose SimSeek-asym that assumes information asymmetry
between two agents, which encourages the questioner to seek new information
from an inaccessible document. In our experiments, we demonstrate that
SimSeek-asym successfully generates information-seeking conversations for two
downstream tasks, CQA and conversational search. In particular, SimSeek-asym
improves baseline models by 1.1-1.9 F1 score in QuAC, and by 1.1 of MRR in
OR-QuAC. Moreover, we thoroughly analyze our synthetic datasets to identify
crucial factors for realistic information-seeking conversation.
- Abstract(参考訳): 本稿では,新しい枠組みであるsimseek(非ラベル文書からの情報参照会話をシミュレーションする)を紹介し,その2つの変種を比較し,情報参照行動に対する深い視点を提供する。
まず,情報対称対話のための強力なシミュレータSimSeek-symを導入する。
合理的な会話をシミュレートするが、より現実的な情報検索の会話へと進む。
そこで本研究では,2つのエージェント間の情報非対称性を仮定したsimseek-asymを提案する。
実験の結果,SimSeek-asymは,CQAと会話検索という2つの下流タスクに対して,情報検索の会話を生成することができた。
特に、SimSeek-asymはベースラインモデルをQuACで1.1-1.9 F1スコア、OR-QuACで1.1スコア改善している。
さらに,合成データセットを徹底的に解析し,現実的な情報検索会話の重要な要因を明らかにする。
関連論文リスト
- DialSim: A Real-Time Simulator for Evaluating Long-Term Multi-Party Dialogue Understanding of Conversational Agents [13.915753261117901]
リアルタイム対話シミュレータであるDialSimを紹介する。
本シミュレータでは、人気番組のキャラクターの役割をエージェントに割り当てる。
DialSimの主な特徴は、適切な時間内に応答するエージェントの能力を評価することである。
論文 参考訳(メタデータ) (2024-06-19T01:37:10Z) - History-Aware Conversational Dense Retrieval [31.203399110612388]
本稿では,コンテキスト依存型クエリ再構成と監視信号の自動マイニングという2つのアイデアを取り入れた,履歴認識型会話用Dense Retrieval(HAConvDR)システムを提案する。
2つの公開対話型検索データセットの実験は、HAConvDRの履歴モデリング機能の改善を実証している。
論文 参考訳(メタデータ) (2024-01-30T01:24:18Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - Information Extraction and Human-Robot Dialogue towards Real-life Tasks:
A Baseline Study with the MobileCS Dataset [52.22314870976088]
SereTODチャレンジは、実際のユーザとChina Mobileのカスタマーサービススタッフの実際のダイアログ書き起こしで構成されるMobileCSデータセットを編成してリリースする。
MobileCSデータセットに基づいて、SereTODチャレンジには2つのタスクがあり、対話システム自体の構築を評価するだけでなく、ダイアログの書き起こしからの情報も抽出する。
本稿では主に,MobileCSデータセットを用いた2つのタスクのベースラインスタディを示す。
論文 参考訳(メタデータ) (2022-09-27T15:30:43Z) - INSCIT: Information-Seeking Conversations with Mixed-Initiative
Interactions [47.90088587508672]
InSCItは、混合開始型インタラクションによる情報探索会話のためのデータセットである。
ユーザーエージェントは805対人会話から4.7Kである。
対話型知識認識とオープンドメイン質問応答の最先端モデルに基づく2つのシステムの結果を報告する。
論文 参考訳(メタデータ) (2022-07-02T06:18:12Z) - Evaluating Mixed-initiative Conversational Search Systems via User
Simulation [9.066817876491053]
このような検索システムの自動評価のための対話型ユーザシミュレータUSiを提案する。
Ui が生成した応答は,その基盤となる情報要求と同等であり,人間による回答に匹敵するものであることを示す。
論文 参考訳(メタデータ) (2022-04-17T16:27:33Z) - Exploring Multi-Modal Representations for Ambiguity Detection &
Coreference Resolution in the SIMMC 2.0 Challenge [60.616313552585645]
会話型AIにおける効果的なあいまいさ検出と参照解決のためのモデルを提案する。
具体的には,TOD-BERTとLXMERTをベースとしたモデルを用いて,多数のベースラインと比較し,アブレーション実験を行う。
以上の結果から,(1)言語モデルでは曖昧さを検出するためにデータの相関を活用でき,(2)言語モデルではビジョンコンポーネントの必要性を回避できることがわかった。
論文 参考訳(メタデータ) (2022-02-25T12:10:02Z) - ConvoSumm: Conversation Summarization Benchmark and Improved Abstractive
Summarization with Argument Mining [61.82562838486632]
我々は、さまざまなオンライン会話形式のニュースコメント、ディスカッションフォーラム、コミュニティ質問応答フォーラム、電子メールスレッドに関する4つの新しいデータセットをクラウドソースする。
我々は、データセットの最先端モデルをベンチマークし、データに関連する特徴を分析します。
論文 参考訳(メタデータ) (2021-06-01T22:17:13Z) - SIMMC 2.0: A Task-oriented Dialog Dataset for Immersive Multimodal
Conversations [9.626560177660634]
SIMMC 2.0は、マルチモーダルアシスタントエージェントの構築を成功に導くことを目的としています。
このデータセットは、ショッピングドメイン上のユーザーと仮想アシスタントの間の11Kタスク指向ダイアログ(117K発話)を備えています。
論文 参考訳(メタデータ) (2021-04-18T00:14:29Z) - Conversations with Search Engines: SERP-based Conversational Response
Generation [77.1381159789032]
我々は、検索エンジンと対話するためのパイプラインを開発するために、適切なデータセット、検索・アズ・ア・会話(SaaC)データセットを作成します。
また、このデータセットを用いて、検索エンジンと対話するための最先端パイプライン(Conversations with Search Engines (CaSE))も開発しています。
CaSEは、サポートされたトークン識別モジュールとプリア・アウェア・ポインタージェネレータを導入することで最先端を向上する。
論文 参考訳(メタデータ) (2020-04-29T13:07:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。