論文の概要: Overview and Insights from the SciVer Shared Task on Scientific Claim
Verification
- arxiv url: http://arxiv.org/abs/2107.08188v1
- Date: Sat, 17 Jul 2021 05:47:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-21 09:06:36.486670
- Title: Overview and Insights from the SciVer Shared Task on Scientific Claim
Verification
- Title(参考訳): 科学的クレーム検証に関するSciVer共有課題の概要と展望
- Authors: David Wadden, Kyle Lo
- Abstract要約: NAACL 2021 の第2回 Scholarly Document Processing (SDP) ワークショップで提示された SciVer 共有タスクの概要を紹介する。
11チームが合計14回のタスクリーダボードへの提出を行い、主要なタスク評価基準で+23 F1以上の改善を実現した。
- 参考スコア(独自算出の注目度): 5.78530472626281
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present an overview of the SciVer shared task, presented at the 2nd
Scholarly Document Processing (SDP) workshop at NAACL 2021. In this shared
task, systems were provided a scientific claim and a corpus of research
abstracts, and asked to identify which articles SUPPORT or REFUTE the claim as
well as provide evidentiary sentences justifying those labels. 11 teams made a
total of 14 submissions to the shared task leaderboard, leading to an
improvement of more than +23 F1 on the primary task evaluation metric. In
addition to surveying the participating systems, we provide several insights
into modeling approaches to support continued progress and future research on
the important and challenging task of scientific claim verification.
- Abstract(参考訳): 本稿では,第2回学術文書処理(sdp)ワークショップ(naacl 2021)で発表されたsciver共有タスクの概要を紹介する。
この共有タスクでは,システムに科学的な主張と研究要約のコーパスが提供され,その主張を支持する記事やREFUTEの特定と,それらのラベルを正当化する説明文が提供された。
11チームが共有タスクリーダーボードに合計14の応募を行い、主要なタスク評価基準で+23 f1以上の改善が行われた。
参加システムを調査することに加えて,継続的な進展を支援するモデリングアプローチや,科学的クレーム検証の重要かつ困難な課題に関する今後の研究について,いくつかの知見を提供する。
関連論文リスト
- Overview of the BioLaySumm 2024 Shared Task on the Lay Summarization of Biomedical Research Articles [21.856049605149646]
本稿では,生物医学研究論文のLay Summarisationに関する第2版BioLaySumm共有タスクのセットアップと結果について述べる。
我々は、この重要な課題に対する研究の関心をさらに高め、参加者に新しいアプローチを探求するよう促すことで、初版の成功に基づけることを目指している。
以上の結果から,大規模言語モデル(LLM)の活用に向けて,幅広い革新的アプローチが課題参加者によって取り入れられたことが示唆された。
論文 参考訳(メタデータ) (2024-08-16T07:00:08Z) - ArAIEval Shared Task: Propagandistic Techniques Detection in Unimodal and Multimodal Arabic Content [9.287041393988485]
我々は、ACL 2024と共同で開催されるアラビア2024会議の一環として組織された、ArAIEval共有タスクの第2版の概要を示す。
この版では、(i)つぶやきやニュース記事の特定による宣伝的テキストスパンの検出、(ii)プロパガンダ主義と非プロパガンダ主義のミームを区別する2つのタスクが提供されている。
最終評価フェーズには14チームが参加し、それぞれ6チームと9チームがタスク1と2に参加した。
論文 参考訳(メタデータ) (2024-07-05T04:28:46Z) - Overview of the PromptCBLUE Shared Task in CHIP2023 [26.56584015791646]
本稿では,CHIP-2023会議におけるPromptC BLUE共有タスクの概要について述べる。
一般的な医学自然言語処理において、中国のオープンドメインや医学ドメインの大規模言語モデル(LLM)に優れたテストベッドを提供する。
本稿では,タスク,データセット,評価指標,および両タスクの上位システムについて述べる。
論文 参考訳(メタデータ) (2023-12-29T09:05:00Z) - ArAIEval Shared Task: Persuasion Techniques and Disinformation Detection
in Arabic Text [41.3267575540348]
本稿では, EMNLP 2023と共同で開催される第1回アラビア2023会議の一環として組織されたArAIEval共有タスクの概要を紹介する。
ArAIEvalは、アラビア文字上の2つのタスクを提供する: (i) 説得テクニックの検出、ツイートやニュース記事における説得テクニックの識別、および (ii) ツイート上のバイナリとマルチクラスの設定における偽情報検出。
最終評価フェーズには合計20チームが参加し、タスク1と2には14チームと16チームが参加した。
論文 参考訳(メタデータ) (2023-11-06T15:21:19Z) - Overview of the BioLaySumm 2023 Shared Task on Lay Summarization of
Biomedical Research Articles [47.04555835353173]
本稿では,ACL 2023のBioNLPワークショップで開催されているバイオメディカルリサーチ記事のレイ要約(BioLaySumm)における共有タスクの結果について述べる。
この共有タスクの目的は、"遅延要約"を生成することができる抽象的な要約モデルを開発することである。
総合的な結果に加えて,BioLaySumm共有タスクのセットアップと洞察についても報告した。
論文 参考訳(メタデータ) (2023-09-29T15:43:42Z) - SciRepEval: A Multi-Format Benchmark for Scientific Document
Representations [52.01865318382197]
SciRepEvalは、科学文書表現のトレーニングと評価のための最初の総合的なベンチマークである。
SPECTERやSciNCLのような最先端のモデルが、タスクフォーマットをまたいだ一般化にどのように苦労しているかを示す。
ドキュメント毎に複数の埋め込みを学習する新しいアプローチは、それぞれ異なるフォーマットに合わせて、パフォーマンスを改善することができる。
論文 参考訳(メタデータ) (2022-11-23T21:25:39Z) - IAM: A Comprehensive and Large-Scale Dataset for Integrated Argument
Mining Tasks [59.457948080207174]
本稿では,一連の議論マイニングタスクに適用可能なIAMという,包括的で大規模なデータセットを提案する。
データセットの70k近い文は、引数特性に基づいて完全に注釈付けされている。
議論準備プロセスに関連する2つの新しい統合された議論マイニングタスクを提案する。(1) 姿勢分類付きクレーム抽出(CESC)と(2) クレーム・エビデンス・ペア抽出(CEPE)である。
論文 参考訳(メタデータ) (2022-03-23T08:07:32Z) - ICDAR 2021 Competition on Components Segmentation Task of Document
Photos [63.289361617237944]
3つの課題タスクが提案され、提供されたデータセット上で異なるセグメンテーションの割り当てが実行される。
収集されたデータはブラジルのいくつかのID文書のもので、その個人情報は便利に交換された。
さまざまなディープラーニングモデルが、各タスクで最高の結果を得るために、さまざまな戦略を持つ参加者によって適用されました。
論文 参考訳(メタデータ) (2021-06-16T00:49:58Z) - CAiRE-COVID: A Question Answering and Query-focused Multi-Document
Summarization System for COVID-19 Scholarly Information Management [48.251211691263514]
我々は、リアルタイム質問応答(QA)とマルチドキュメント要約システムであるCAiRE-COVIDを紹介し、Kaggle COVID-19 Open Researchデータセットチャレンジで10のタスクのうちの1つを勝ち取った。
本システムの目的は,コミュニティからの優先度の高い質問に答えることによって,新型コロナウイルスに関する数多くの学術論文をマイニングすることにある。
論文 参考訳(メタデータ) (2020-05-04T15:07:27Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。