論文の概要: UPB at SemEval-2021 Task 8: Extracting Semantic Information on
Measurements as Multi-Turn Question Answering
- arxiv url: http://arxiv.org/abs/2104.04549v1
- Date: Fri, 9 Apr 2021 18:23:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 09:27:41.795975
- Title: UPB at SemEval-2021 Task 8: Extracting Semantic Information on
Measurements as Multi-Turn Question Answering
- Title(参考訳): UPB at SemEval-2021 Task 8: Extracting Semantic Information on Measurements as Multi-Turn Question Answering
- Authors: Andrei-Marius Avram, George-Eduard Zaharia, Dumitru-Clementin Cercel,
Mihai Dascalu
- Abstract要約: 第8回SemEval-2021: Counts and Measurements(MeasEval)は、この方向の研究を促進することを目的としている。
参加者がモデルのトレーニングを行い、科学的テキストから測定に関する有意義な情報を抽出するデータセット。
我々の最高のパフォーマンスモデルは、テストセットで36.91%の重なり合うF1スコアを得た。
- 参考スコア(独自算出の注目度): 0.8315801422499861
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting semantic information on measurements and counts is an important
topic in terms of analyzing scientific discourses. The 8th task of
SemEval-2021: Counts and Measurements (MeasEval) aimed to boost research in
this direction by providing a new dataset on which participants train their
models to extract meaningful information on measurements from scientific texts.
The competition is composed of five subtasks that build on top of each other:
(1) quantity span identification, (2) unit extraction from the identified
quantities and their value modifier classification, (3) span identification for
measured entities and measured properties, (4) qualifier span identification,
and (5) relation extraction between the identified quantities, measured
entities, measured properties, and qualifiers. We approached these challenges
by first identifying the quantities, extracting their units of measurement,
classifying them with corresponding modifiers, and afterwards using them to
jointly solve the last three subtasks in a multi-turn question answering
manner. Our best performing model obtained an overlapping F1-score of 36.91% on
the test set.
- Abstract(参考訳): 計測とカウントに関する意味情報の抽出は、科学的な談話の分析において重要な話題である。
The 8th Task of SemEval-2021: Counts and Measurements (MeasEval)は、参加者が科学的テキストから測定に関する有意義な情報を抽出するためにモデルをトレーニングするデータセットを提供することによって、この方向の研究を促進することを目的としている。
競技は, 互いに上に構築される5つのサブタスクから構成される: (1) 定量範囲の識別, (2) 同定された量と値の修飾子分類からの単位抽出, (3) 測定された量と測定された特性の分割, (4) 等式範囲の識別, (5) 同定された量, 測定された量, 測定された特性, 等式間の関係抽出。
そこで我々は,まずこれらの課題にアプローチし,まず測定単位を抽出し,対応する修飾子で分類し,その後,最後の3つのサブタスクを多ターン質問応答方式で共同で解いた。
我々の最高のパフォーマンスモデルは、テストセットで36.91%の重なり合うF1スコアを得た。
関連論文リスト
- Pluralistic Salient Object Detection [108.74650817891984]
本稿では,与えられた入力画像に対して,複数の有意な有意な有意な有意な有意な有意な分割結果を生成することを目的とした新しい課題であるPSOD(multiistic Salient Object Detection)を紹介する。
新たに設計された評価指標とともに,2つのSODデータセット "DUTS-MM" と "DUS-MQ" を提案する。
論文 参考訳(メタデータ) (2024-09-04T01:38:37Z) - Dual Semantic Knowledge Composed Multimodal Dialog Systems [114.52730430047589]
本稿では,MDS-S2という新しいマルチモーダルタスク指向対話システムを提案する。
コンテキスト関連属性と関係知識を知識ベースから取得する。
また、合成された応答表現から意味情報を抽出するために、潜在クエリ変数のセットを考案する。
論文 参考訳(メタデータ) (2023-05-17T06:33:26Z) - SemEval-2023 Task 7: Multi-Evidence Natural Language Inference for
Clinical Trial Data [1.6932802756478729]
本稿では,SemEval 2023 Task 7-Multi-Evidence Natural Language Inference for Clinical Trial Dataの結果について述べる。
提案する課題には, マルチホップバイオメディカルおよび数値推論が必要である。
我々は,エビデンス選択タスクにおいて,エンテーメントタスクよりもはるかに優れたパフォーマンスを観察する。
論文 参考訳(メタデータ) (2023-05-04T16:58:19Z) - FETA: A Benchmark for Few-Sample Task Transfer in Open-Domain Dialogue [70.65782786401257]
本研究は、オープンドメイン対話における少数サンプルタスク転送のベンチマークであるFETAを導入することにより、対話型タスク転送について検討する。
FETAには10タスクと7タスクがアノテートされた2つの基礎的な会話が含まれており、データセット内タスク転送の研究を可能にする。
3つの人気のある言語モデルと3つの学習アルゴリズムを用いて、132のソースターゲットタスクペア間の転送可能性を分析する。
論文 参考訳(メタデータ) (2022-05-12T17:59:00Z) - High-Modality Multimodal Transformer: Quantifying Modality & Interaction
Heterogeneity for High-Modality Representation Learning [112.51498431119616]
本稿では,多種多様なモダリティを含む高モダリティシナリオに対する効率的な表現学習について検討する。
単一のモデルであるHighMMTは、テキスト、画像、オーディオ、ビデオ、センサー、プロプレセプション、スピーチ、時系列、セット、テーブル)と5つの研究領域から15のタスクをスケールする。
論文 参考訳(メタデータ) (2022-03-02T18:56:20Z) - Abstract, Rationale, Stance: A Joint Model for Scientific Claim
Verification [18.330265729989843]
我々は,3つのタスクのモジュールを,機械読解フレームワークを用いて共同で学習するアプローチをARSJointとして提案する。
ベンチマークデータセットSciFactの実験結果は、我々のアプローチが既存の作業より優れていることを示している。
論文 参考訳(メタデータ) (2021-09-13T10:07:26Z) - Wizard of Search Engine: Access to Information Through Conversations
with Search Engines [58.53420685514819]
我々は3つの側面からCISの研究を促進するために努力している。
目的検出(ID)、キーフレーズ抽出(KE)、行動予測(AP)、クエリ選択(QS)、通過選択(PS)、応答生成(RG)の6つのサブタスクでCIS用のパイプラインを定式化する。
検索エンジンのウィザード(WISE)と呼ばれるベンチマークデータセットをリリースし、CISのすべての側面について包括的かつ詳細な調査を可能にします。
論文 参考訳(メタデータ) (2021-05-18T06:35:36Z) - Counts@IITK at SemEval-2021 Task 8: SciBERT Based Entity And Semantic
Relation Extraction For Scientific Data [1.869621561196521]
本稿では,SemEval 2021 Task 8(MeasEval)を提案する。
MeasEvalは、数量の検索に焦点を当てた新しいスパン抽出、分類、および関係抽出タスクです。
論文 参考訳(メタデータ) (2021-04-03T09:47:51Z) - LRG at SemEval-2021 Task 4: Improving Reading Comprehension with
Abstract Words using Augmentation, Linguistic Features and Voting [0.6850683267295249]
フィリングインザブランクタイプの質問を考えると、タスクは5つのオプションのリストから最適な単語を予測することです。
マスク付き言語モデリング(MLM)タスクで事前訓練されたトランスフォーマーベースのモデルのエンコーダを使用して、Fill-in-the-Blank(FitB)モデルを構築します。
本稿では,BERT の入力長制限に対処するため,チャンク投票や Max Context という変種を提案する。
論文 参考訳(メタデータ) (2021-02-24T12:33:12Z) - DWIE: an entity-centric dataset for multi-task document-level
information extraction [23.412500230644433]
DWIEは、4つの主要な情報抽出(IE)アノテーションサブタスクを組み合わせた、新しく作成されたマルチタスクデータセットである。
DWIEは、完全なドキュメントのレベルで概念的エンティティの相互作用と特性を記述するエンティティ中心のデータセットとして考えられている。
論文 参考訳(メタデータ) (2020-09-26T15:53:22Z) - Grounded Situation Recognition [56.18102368133022]
画像の構造的要約を生成することを必要とする課題であるグラウンドドコンディション認識(GSR)を導入する。
GSRはセマンティック・サリエンシの識別、大規模で多様なエンティティの分類とローカライズという重要な技術的課題を提示している。
我々は,条件付きクエリ,視覚連鎖,接地型セマンティック・アウェアネス・イメージ検索の3つのモデルによって実現される3つの将来方向について,最初の知見を示す。
論文 参考訳(メタデータ) (2020-03-26T17:57:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。