論文の概要: SciCo: Hierarchical Cross-Document Coreference for Scientific Concepts
- arxiv url: http://arxiv.org/abs/2104.08809v1
- Date: Sun, 18 Apr 2021 10:42:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-22 06:22:09.745287
- Title: SciCo: Hierarchical Cross-Document Coreference for Scientific Concepts
- Title(参考訳): SciCo:科学概念の階層的相互文書照合
- Authors: Arie Cattan, Sophie Johnson, Daniel Weld, Ido Dagan, Iz Beltagy, Doug
Downey, Tom Hope
- Abstract要約: 我々は、科学論文における概念のための階層的CDCRの新しいタスクを提示する。
目標は、コアファレンスクラスタとそれらの間の階層を共同で推論することです。
このタスクのエキスパートアノテーションデータセットであるSciCoを作成します。これは、著名なECB+リソースよりも3倍大きいです。
- 参考スコア(独自算出の注目度): 28.96683772139377
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Determining coreference of concept mentions across multiple documents is
fundamental for natural language understanding. Work on cross-document
coreference resolution (CDCR) typically considers mentions of events in the
news, which do not often involve abstract technical concepts that are prevalent
in science and technology. These complex concepts take diverse or ambiguous
forms and have many hierarchical levels of granularity (e.g., tasks and
subtasks), posing challenges for CDCR. We present a new task of hierarchical
CDCR for concepts in scientific papers, with the goal of jointly inferring
coreference clusters and hierarchy between them. We create SciCo, an
expert-annotated dataset for this task, which is 3X larger than the prominent
ECB+ resource. We find that tackling both coreference and hierarchy at once
outperforms disjoint models, which we hope will spur development of joint
models for SciCo.
- Abstract(参考訳): 複数の文書にまたがる概念言及の相互参照を決定することは自然言語理解の基盤である。
クロスドキュメント・コア参照解決(CDCR)の研究は、一般的に、科学や技術でよく見られる抽象的な技術的概念を伴わない、ニュースにおける出来事の言及を考察する。
これらの複雑な概念は多様または曖昧な形式をとり、多くの階層的な粒度(タスクやサブタスクなど)を持ち、CDCRの課題を提起する。
本稿では,科学論文における概念の階層的CDCRの新たな課題として,コア参照クラスタとそれらの間の階層を共同で推論することを目的とする。
scicoは、このタスクのために専門家がアノテーションしたデータセットで、著名なecb+リソースの3倍の大きさです。
私たちは、コリファレンスと階層を一度に扱うことが、scicoのジョイントモデルの開発を促進することを望んでいる。
関連論文リスト
- Data-driven Coreference-based Ontology Building [48.995395445597225]
参照解決は、伝統的に個々の文書理解のコンポーネントとして使用される。
よりグローバルな視点で、すべてのドキュメントレベルのコア参照関係から、ドメインについて何が学べるかを探求します。
コードとともに、クリエイティブ・コモンズライセンスの下でコア参照チェーンをリリースします。
論文 参考訳(メタデータ) (2024-10-22T14:30:40Z) - Inferring Scientific Cross-Document Coreference and Hierarchy with Definition-Augmented Relational Reasoning [7.086262532457526]
本稿では,全文文献を検索することで,概念記述の文脈依存的な定義を生成する手法を提案する。
さらに,2つの概念がどのように関連しているか,あるいは異なるのかを記述したリレーショナル定義を生成し,論文間のリンクの推論に関わる爆発に対処する効率的な再分類アプローチを設計する。
論文 参考訳(メタデータ) (2024-09-23T15:20:27Z) - Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized
Visual Class Discovery [69.91441987063307]
Generalized Category Discovery (GCD)は、既知のカテゴリと未知のカテゴリの両方からラベルのないデータをクラスタすることを目的としている。
現在のGCD法は、新しい視覚カテゴリーを発見する際に、人間の認知過程の多様性知覚性を無視する視覚的手がかりのみに依存している。
マルチモーダルなGCDを実現するための2段階のTextGCDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-12T07:06:50Z) - On the Affinity, Rationality, and Diversity of Hierarchical Topic
Modeling [29.277151061615434]
我々は交通計画と文脈対応階層的トピックモデル(TraCo)を提案する。
TraCoは依存関係を制約して、そのスパーシティとバランスを確保すると同時に、トピック階層の構築を規則化している。
以前は絡み合ったデコーディングではなく、アンタングル化されたデコーディングによって異なるレベルのトピックに異なる意味的な粒度を分散する。
論文 参考訳(メタデータ) (2024-01-25T11:47:58Z) - On Task-personalized Multimodal Few-shot Learning for Visually-rich
Document Entity Retrieval [59.25292920967197]
VDER(Few-shot document entity search)は、NLPアプリケーションにおいて重要なトピックである。
FewVEXは、エンティティレベルの少数ショットVDERの分野における将来の研究を促進するための、新しいデータセットである。
本稿では,タスクパーソナライズを効果的に実現することを中心に,タスク認識型メタラーニングベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-01T17:51:43Z) - MGDoc: Pre-training with Multi-granular Hierarchy for Document Image
Understanding [53.03978356918377]
異なるレベルの粒度のコンテンツ間の空間的階層的関係は、文書画像理解タスクに不可欠である。
既存の方法は単語レベルか地域レベルから特徴を学習するが、両方を同時に考えることができない。
MGDocは,ページレベル,領域レベル,単語レベル情報を同時にエンコードするマルチモーダル・マルチグラニュラ事前学習フレームワークである。
論文 参考訳(メタデータ) (2022-11-27T22:47:37Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - A Densely Connected Criss-Cross Attention Network for Document-level
Relation Extraction [3.276435438007766]
文書レベルの関係抽出(RE)は、与えられた文書内の2つのエンティティ間の関係を特定することを目的としている。
従来の研究は通常、参照レベルまたはエンティティレベルの文書グラフの情報伝達を通じて推論を完了した。
本稿では,文書レベルのREに対して,Densely Connected Criss-Cross Attention Network (Dense-CCNet) と呼ばれる新しいモデルを提案する。
論文 参考訳(メタデータ) (2022-03-26T01:01:34Z) - CD2CR: Co-reference Resolution Across Documents and Domains [20.30046972135548]
クロスドキュメント・コリファレンス・レゾリューション (CDCR) は、多くのテキスト文書にまたがるエンティティや概念への言及を識別し、リンクするタスクである。
クロスドキュメント・クロスドメイン・コリファレンス・レゾリューション(CD$2$CR)のための新しいタスクと英語データセットを提案する。
このクロスドメインなクロスドキュメント設定では、既存のCDCRモデルはうまく動作せず、CD$2$CR上の現在の最先端CDCRモデルより優れたベースラインモデルを提供する。
論文 参考訳(メタデータ) (2021-01-29T15:18:30Z) - Generalizing Cross-Document Event Coreference Resolution Across Multiple
Corpora [63.429307282665704]
クロスドキュメントイベントコア参照解決(CDCR)は、文書の集合全体にわたってイベントの特定とクラスタ化を行う必要があるNLPタスクである。
CDCRは、下流のマルチドキュメントアプリケーションに利益をもたらすことを目標としているが、CDCRの適用による改善はまだ示されていない。
これまでのCDCRシステムは,1つのコーパスでのみ開発,トレーニング,テストが行われた。
論文 参考訳(メタデータ) (2020-11-24T17:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。