論文の概要: SciCo: Hierarchical Cross-Document Coreference for Scientific Concepts
- arxiv url: http://arxiv.org/abs/2104.08809v1
- Date: Sun, 18 Apr 2021 10:42:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 06:22:09.745287
- Title: SciCo: Hierarchical Cross-Document Coreference for Scientific Concepts
- Title(参考訳): SciCo:科学概念の階層的相互文書照合
- Authors: Arie Cattan, Sophie Johnson, Daniel Weld, Ido Dagan, Iz Beltagy, Doug
Downey, Tom Hope
- Abstract要約: 我々は、科学論文における概念のための階層的CDCRの新しいタスクを提示する。
目標は、コアファレンスクラスタとそれらの間の階層を共同で推論することです。
このタスクのエキスパートアノテーションデータセットであるSciCoを作成します。これは、著名なECB+リソースよりも3倍大きいです。
- 参考スコア(独自算出の注目度): 28.96683772139377
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Determining coreference of concept mentions across multiple documents is
fundamental for natural language understanding. Work on cross-document
coreference resolution (CDCR) typically considers mentions of events in the
news, which do not often involve abstract technical concepts that are prevalent
in science and technology. These complex concepts take diverse or ambiguous
forms and have many hierarchical levels of granularity (e.g., tasks and
subtasks), posing challenges for CDCR. We present a new task of hierarchical
CDCR for concepts in scientific papers, with the goal of jointly inferring
coreference clusters and hierarchy between them. We create SciCo, an
expert-annotated dataset for this task, which is 3X larger than the prominent
ECB+ resource. We find that tackling both coreference and hierarchy at once
outperforms disjoint models, which we hope will spur development of joint
models for SciCo.
- Abstract(参考訳): 複数の文書にまたがる概念言及の相互参照を決定することは自然言語理解の基盤である。
クロスドキュメント・コア参照解決(CDCR)の研究は、一般的に、科学や技術でよく見られる抽象的な技術的概念を伴わない、ニュースにおける出来事の言及を考察する。
これらの複雑な概念は多様または曖昧な形式をとり、多くの階層的な粒度(タスクやサブタスクなど)を持ち、CDCRの課題を提起する。
本稿では,科学論文における概念の階層的CDCRの新たな課題として,コア参照クラスタとそれらの間の階層を共同で推論することを目的とする。
scicoは、このタスクのために専門家がアノテーションしたデータセットで、著名なecb+リソースの3倍の大きさです。
私たちは、コリファレンスと階層を一度に扱うことが、scicoのジョイントモデルの開発を促進することを望んでいる。
関連論文リスト
- Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized
Visual Class Discovery [69.91441987063307]
Generalized Category Discovery (GCD)は、既知のカテゴリと未知のカテゴリの両方からラベルのないデータをクラスタすることを目的としている。
現在のGCD法は、新しい視覚カテゴリーを発見する際に、人間の認知過程の多様性知覚性を無視する視覚的手がかりのみに依存している。
マルチモーダルなGCDを実現するための2段階のTextGCDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-12T07:06:50Z) - On the Affinity, Rationality, and Diversity of Hierarchical Topic
Modeling [29.277151061615434]
我々は交通計画と文脈対応階層的トピックモデル(TraCo)を提案する。
TraCoは依存関係を制約して、そのスパーシティとバランスを確保すると同時に、トピック階層の構築を規則化している。
以前は絡み合ったデコーディングではなく、アンタングル化されたデコーディングによって異なるレベルのトピックに異なる意味的な粒度を分散する。
論文 参考訳(メタデータ) (2024-01-25T11:47:58Z) - On Task-personalized Multimodal Few-shot Learning for Visually-rich
Document Entity Retrieval [59.25292920967197]
VDER(Few-shot document entity search)は、NLPアプリケーションにおいて重要なトピックである。
FewVEXは、エンティティレベルの少数ショットVDERの分野における将来の研究を促進するための、新しいデータセットである。
本稿では,タスクパーソナライズを効果的に実現することを中心に,タスク認識型メタラーニングベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-01T17:51:43Z) - Advancing Topic Segmentation and Outline Generation in Chinese Texts:
The Paragraph-level Topic Representation, Corpus, and Benchmark [68.37789691077892]
タイトル,サブヘッダ,段落を含む階層的な段落レベルのトピック構造表現を導入する。
我々は,これまでで最大であった4倍の大きさの中国段落レベルのトピック構造コーパス(CPTS)を構築した。
我々は,2つの基本課題(トピックセグメンテーションとアウトライン生成)におけるCPTSの計算可能性について,いくつかの強いベースラインで検証し,その有効性は下流タスクにおいて予め確認されている:談話解析である。
論文 参考訳(メタデータ) (2023-05-24T06:43:23Z) - MGDoc: Pre-training with Multi-granular Hierarchy for Document Image
Understanding [53.03978356918377]
異なるレベルの粒度のコンテンツ間の空間的階層的関係は、文書画像理解タスクに不可欠である。
既存の方法は単語レベルか地域レベルから特徴を学習するが、両方を同時に考えることができない。
MGDocは,ページレベル,領域レベル,単語レベル情報を同時にエンコードするマルチモーダル・マルチグラニュラ事前学習フレームワークである。
論文 参考訳(メタデータ) (2022-11-27T22:47:37Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - A Densely Connected Criss-Cross Attention Network for Document-level
Relation Extraction [3.276435438007766]
文書レベルの関係抽出(RE)は、与えられた文書内の2つのエンティティ間の関係を特定することを目的としている。
従来の研究は通常、参照レベルまたはエンティティレベルの文書グラフの情報伝達を通じて推論を完了した。
本稿では,文書レベルのREに対して,Densely Connected Criss-Cross Attention Network (Dense-CCNet) と呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2022-03-26T01:01:34Z) - WEC: Deriving a Large-scale Cross-document Event Coreference dataset
from Wikipedia [14.324743524196874]
本稿では,ウィキペディアからのクロスドキュメントイベントコアスのための大規模データセット収集のための効率的な手法であるウィキペディアイベントコアス(WEC)を提案する。
この手法を英語ウィキペディアに適用し,大規模wec-engデータセットを抽出する。
我々は,ドキュメント内コリファレンス解決のために最先端モデルのコンポーネントをクロスドキュメント設定に適応させるアルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-04-11T14:54:35Z) - CD2CR: Co-reference Resolution Across Documents and Domains [20.30046972135548]
クロスドキュメント・コリファレンス・レゾリューション (CDCR) は、多くのテキスト文書にまたがるエンティティや概念への言及を識別し、リンクするタスクである。
クロスドキュメント・クロスドメイン・コリファレンス・レゾリューション(CD$2$CR)のための新しいタスクと英語データセットを提案する。
このクロスドメインなクロスドキュメント設定では、既存のCDCRモデルはうまく動作せず、CD$2$CR上の現在の最先端CDCRモデルより優れたベースラインモデルを提供する。
論文 参考訳(メタデータ) (2021-01-29T15:18:30Z) - Generalizing Cross-Document Event Coreference Resolution Across Multiple
Corpora [63.429307282665704]
クロスドキュメントイベントコア参照解決(CDCR)は、文書の集合全体にわたってイベントの特定とクラスタ化を行う必要があるNLPタスクである。
CDCRは、下流のマルチドキュメントアプリケーションに利益をもたらすことを目標としているが、CDCRの適用による改善はまだ示されていない。
これまでのCDCRシステムは,1つのコーパスでのみ開発,トレーニング,テストが行われた。
論文 参考訳(メタデータ) (2020-11-24T17:45:03Z) - Expressiveness and machine processability of Knowledge Organization
Systems (KOS): An analysis of concepts and relations [0.0]
各知識組織システムの表現性と機械処理性の両方の可能性は、その構造規則によって広範囲に規制されている。
オントロジーは多種多様な関係を明示的に定義し、その性質上機械処理可能である。
論文 参考訳(メタデータ) (2020-03-11T12:35:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。