論文の概要: ArgSciChat: A Dataset for Argumentative Dialogues on Scientific Papers
- arxiv url: http://arxiv.org/abs/2202.06690v1
- Date: Mon, 14 Feb 2022 13:27:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-15 15:55:36.244697
- Title: ArgSciChat: A Dataset for Argumentative Dialogues on Scientific Papers
- Title(参考訳): argscichat: 科学論文における議論的対話のためのデータセット
- Authors: Federico Ruggeri, Mohsen Mesgar, Iryna Gurevych
- Abstract要約: 学術論文のドメインエキスパートとして科学者間の対話を収集する新しい枠組みを導入する。
我々のフレームワークは、科学者が論文を対話の根拠として提示し、論文のタイトルを気に入った対話に参加することを可能にする。
我々は、新しい議論的対話データセットArgSciChatの収集にフレームワークを使用し、41の対話から収集された498のメッセージを20の科学論文にまとめる。
- 参考スコア(独自算出の注目度): 61.772582143035606
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The applications of conversational agents for scientific disciplines (as
expert domains) are understudied due to the lack of dialogue data to train such
agents. While most data collection frameworks, such as Amazon Mechanical Turk,
foster data collection for generic domains by connecting crowd workers and task
designers, these frameworks are not much optimized for data collection in
expert domains. Scientists are rarely present in these frameworks due to their
limited time budget. Therefore, we introduce a novel framework to collect
dialogues between scientists as domain experts on scientific papers. Our
framework lets scientists present their scientific papers as groundings for
dialogues and participate in dialogue they like its paper title. We use our
framework to collect a novel argumentative dialogue dataset, ArgSciChat. It
consists of 498 messages collected from 41 dialogues on 20 scientific papers.
Alongside extensive analysis on ArgSciChat, we evaluate a recent conversational
agent on our dataset. Experimental results show that this agent poorly performs
on ArgSciChat, motivating further research on argumentative scientific agents.
We release our framework and the dataset.
- Abstract(参考訳): 専門分野としての)科学分野への会話エージェントの応用は、そのようなエージェントを訓練するための対話データがないために検討されている。
Amazon Mechanical Turkのようなほとんどのデータ収集フレームワークは、クラウドワーカーとタスクデザイナを接続することで汎用ドメインのデータ収集を促進するが、これらのフレームワークは専門家ドメインのデータ収集にはあまり最適化されていない。
限られた時間予算のため、これらのフレームワークには科学者がほとんどいない。
そこで本稿では,科学者間の対話をドメインの専門家として収集する新たな枠組みを提案する。
我々のフレームワークは、科学者が論文を対話の土台として提示し、その論文タイトルを気に入って対話に参加することができる。
我々は、新しい議論的対話データセットArgSciChatの収集にフレームワークを使用します。
41の対話から収集された498のメッセージと20の科学論文からなる。
ArgSciChatの広範な分析とともに、我々のデータセット上で最近の会話エージェントを評価する。
実験の結果、このエージェントはargscichatでは性能が悪く、議論的な科学的エージェントに関するさらなる研究の動機となった。
フレームワークとデータセットをリリースします。
関連論文リスト
- cPAPERS: A Dataset of Situated and Multimodal Interactive Conversations in Scientific Papers [5.103692331918768]
本研究は,学術論文のレビューから,対話型質問応答ペアのデータセットである会話型論文(cPAPERS)を紹介する。
本稿では,OpenReviewからこれらの質問応答ペアを収集し,ソースファイルからコンテキスト情報に関連付けるためのデータ収集戦略を提案する。
論文 参考訳(メタデータ) (2024-06-12T16:46:12Z) - SciNews: From Scholarly Complexities to Public Narratives -- A Dataset for Scientific News Report Generation [20.994565065595232]
我々は、科学ニュースの自動生成を容易にするための新しいコーパスを提示する。
本データセットは,9分野にわたる学術出版物と,それに対応する科学報告から構成される。
我々は、最先端のテキスト生成モデルを用いてデータセットをベンチマークする。
論文 参考訳(メタデータ) (2024-03-26T14:54:48Z) - FREDSum: A Dialogue Summarization Corpus for French Political Debates [26.76383031532945]
本稿では,多言語対話要約のための資源強化を目的とした,フランスの政治論争のデータセットを提案する。
われわれのデータセットは、手書きと注釈付き政治討論から成り、さまざまなトピックや視点をカバーしている。
論文 参考訳(メタデータ) (2023-12-08T05:42:04Z) - Does Collaborative Human-LM Dialogue Generation Help Information
Extraction from Human Dialogues? [55.28340832822234]
実際のアプリケーションにおける人間の対話の問題解決は、既存のWizard-of-Ozコレクションよりもはるかに複雑である。
本稿では,リアルな対話を合成できる人間間対話生成フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-13T20:02:50Z) - SuperDialseg: A Large-scale Dataset for Supervised Dialogue Segmentation [55.82577086422923]
文書地上対話の助けを借りて,対話のセグメンテーションポイントを実現可能な定義を提供する。
我々は,9,478の対話を含むSuperDialsegと呼ばれる大規模教師付きデータセットをリリースする。
また、対話セグメンテーションタスクの5つのカテゴリにまたがる18のモデルを含むベンチマークも提供する。
論文 参考訳(メタデータ) (2023-05-15T06:08:01Z) - NatCS: Eliciting Natural Customer Support Dialogues [5.398732055835996]
既存のタスク指向の対話データセットは、実際の顧客サポートの会話を表すものではない。
音声顧客サービス会話のマルチドメインコレクションであるNatCSを紹介する。
論文 参考訳(メタデータ) (2023-05-04T17:25:24Z) - Manual-Guided Dialogue for Flexible Conversational Agents [84.46598430403886]
対話データを効率的に構築し、利用する方法や、さまざまなドメインにモデルを大規模にデプロイする方法は、タスク指向の対話システムを構築する上で重要な問題である。
エージェントは対話とマニュアルの両方からタスクを学習する。
提案手法は,詳細なドメインオントロジーに対する対話モデルの依存性を低減し,様々なドメインへの適応をより柔軟にする。
論文 参考訳(メタデータ) (2022-08-16T08:21:12Z) - KETOD: Knowledge-Enriched Task-Oriented Dialogue [77.59814785157877]
対話システム研究における既存の研究は、主にタスク指向の対話とチャットを独立したドメインとして扱う。
本研究では,タスク指向対話と知識ベースチップチャットを一つのモデルに効果的に統合する方法について検討する。
論文 参考訳(メタデータ) (2022-05-11T16:01:03Z) - HybriDialogue: An Information-Seeking Dialogue Dataset Grounded on
Tabular and Textual Data [87.67278915655712]
我々は、ウィキペディアのテキストとテーブルの両方を基盤とした、クラウドソーシングされた自然な会話からなる新しい対話データセットHybriDialogueを提示する。
これらの会話は、複雑なマルチホップ質問をシンプルで現実的なマルチターン対話に分解することで生成される。
論文 参考訳(メタデータ) (2022-04-28T00:52:16Z) - Graph Based Network with Contextualized Representations of Turns in
Dialogue [0.0]
対話に基づく関係抽出(RE)は、対話に現れる2つの引数間の関係を抽出することを目的としている。
本稿では,対話の理解方法に着目したTUCORE-GCN(TUrn Context aware Graph Convolutional Network)を提案する。
論文 参考訳(メタデータ) (2021-09-09T03:09:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。