Fugu-MT 論文翻訳(概要): SciCo: Hierarchical Cross-Document Coreference for Scientific Concepts

論文の概要: SciCo: Hierarchical Cross-Document Coreference for Scientific Concepts

arxiv url: http://arxiv.org/abs/2104.08809v1
Date: Sun, 18 Apr 2021 10:42:20 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-22 06:22:09.745287
Title: SciCo: Hierarchical Cross-Document Coreference for Scientific Concepts
Title（参考訳）: SciCo:科学概念の階層的相互文書照合
Authors: Arie Cattan, Sophie Johnson, Daniel Weld, Ido Dagan, Iz Beltagy, Doug Downey, Tom Hope
Abstract要約: 我々は、科学論文における概念のための階層的CDCRの新しいタスクを提示する。目標は、コアファレンスクラスタとそれらの間の階層を共同で推論することです。このタスクのエキスパートアノテーションデータセットであるSciCoを作成します。これは、著名なECB+リソースよりも3倍大きいです。
参考スコア（独自算出の注目度）: 28.96683772139377
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Determining coreference of concept mentions across multiple documents is fundamental for natural language understanding. Work on cross-document coreference resolution (CDCR) typically considers mentions of events in the news, which do not often involve abstract technical concepts that are prevalent in science and technology. These complex concepts take diverse or ambiguous forms and have many hierarchical levels of granularity (e.g., tasks and subtasks), posing challenges for CDCR. We present a new task of hierarchical CDCR for concepts in scientific papers, with the goal of jointly inferring coreference clusters and hierarchy between them. We create SciCo, an expert-annotated dataset for this task, which is 3X larger than the prominent ECB+ resource. We find that tackling both coreference and hierarchy at once outperforms disjoint models, which we hope will spur development of joint models for SciCo.
Abstract（参考訳）: 複数の文書にまたがる概念言及の相互参照を決定することは自然言語理解の基盤である。クロスドキュメント・コア参照解決(CDCR)の研究は、一般的に、科学や技術でよく見られる抽象的な技術的概念を伴わない、ニュースにおける出来事の言及を考察する。これらの複雑な概念は多様または曖昧な形式をとり、多くの階層的な粒度(タスクやサブタスクなど)を持ち、CDCRの課題を提起する。本稿では,科学論文における概念の階層的CDCRの新たな課題として,コア参照クラスタとそれらの間の階層を共同で推論することを目的とする。 scicoは、このタスクのために専門家がアノテーションしたデータセットで、著名なecb+リソースの3倍の大きさです。私たちは、コリファレンスと階層を一度に扱うことが、scicoのジョイントモデルの開発を促進することを望んでいる。

関連論文リスト

Improving Scientific Document Retrieval with Academic Concept Index [47.95234352955763]
汎用ドメインレトリバーを科学領域に適用することは、大規模ドメイン固有の関連アノテーションが不足しているため困難である。最近のアプローチでは、これらの問題を2つの独立した方向で解決している。本稿では,論文から重要な概念を抽出し,学術分類学に導かれる概念を整理する学術概念索引を紹介する。
論文参考訳（メタデータ） (2026-01-02T04:47:49Z)
HiCoGen: Hierarchical Compositional Text-to-Image Generation in Diffusion Models via Reinforcement Learning [66.99487505369254]
HiCoGenは、新しいChain of Synthesisパラダイムに基づいて構築されている。複雑なプロンプトを最小の意味単位に分解する。その後、これらのユニットを反復的に合成し、各ステップで生成された画像が次に重要な視覚的コンテキストを提供する。実験により,提案手法は概念カバレッジと構成精度の両方において,既存手法よりも有意に優れていた。
論文参考訳（メタデータ） (2025-11-25T06:24:25Z)
Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。 Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文参考訳（メタデータ） (2025-10-17T02:33:16Z)
DISRetrieval: Harnessing Discourse Structure for Long Document Retrieval [51.89673002051528]
DISRetrievalは、言語談話構造を利用して長い文書理解を強化する新しい階層的検索フレームワークである。本研究は,談話構造が文書の長さや問合せの種類によって検索効率を著しく向上することを確認する。
論文参考訳（メタデータ） (2025-05-26T14:45:12Z)
Enhancing Abstractive Summarization of Scientific Papers Using Structure Information [6.414732533433283]
本稿では,学術論文における構造的機能の自動認識を活用する2段階の抽象的要約フレームワークを提案する。第1段階では,多くの学術論文から章題を標準化し,構造関数認識のための大規模データセットを構築した。第2段階では、Longformerを用いて、セクション間のリッチなコンテキスト関係をキャプチャし、コンテキスト対応の要約を生成する。
論文参考訳（メタデータ） (2025-05-20T10:34:45Z)
Data-driven Coreference-based Ontology Building [48.995395445597225]
参照解決は、伝統的に個々の文書理解のコンポーネントとして使用される。よりグローバルな視点で、すべてのドキュメントレベルのコア参照関係から、ドメインについて何が学べるかを探求します。コードとともに、クリエイティブ・コモンズライセンスの下でコア参照チェーンをリリースします。
論文参考訳（メタデータ） (2024-10-22T14:30:40Z)
Inferring Scientific Cross-Document Coreference and Hierarchy with Definition-Augmented Relational Reasoning [7.086262532457526]
本稿では,全文文献を検索することで,概念記述の文脈依存的な定義を生成する手法を提案する。さらに,2つの概念がどのように関連しているか,あるいは異なるのかを記述したリレーショナル定義を生成し,論文間のリンクの推論に関わる爆発に対処する効率的な再分類アプローチを設計する。
論文参考訳（メタデータ） (2024-09-23T15:20:27Z)
Textual Knowledge Matters: Cross-Modality Co-Teaching for Generalized Visual Class Discovery [69.91441987063307]
Generalized Category Discovery (GCD)は、既知のカテゴリと未知のカテゴリの両方からラベルのないデータをクラスタすることを目的としている。現在のGCD法は、新しい視覚カテゴリーを発見する際に、人間の認知過程の多様性知覚性を無視する視覚的手がかりのみに依存している。マルチモーダルなGCDを実現するための2段階のTextGCDフレームワークを提案する。
論文参考訳（メタデータ） (2024-03-12T07:06:50Z)
On the Affinity, Rationality, and Diversity of Hierarchical Topic Modeling [29.277151061615434]
我々は交通計画と文脈対応階層的トピックモデル(TraCo)を提案する。 TraCoは依存関係を制約して、そのスパーシティとバランスを確保すると同時に、トピック階層の構築を規則化している。以前は絡み合ったデコーディングではなく、アンタングル化されたデコーディングによって異なるレベルのトピックに異なる意味的な粒度を分散する。
論文参考訳（メタデータ） (2024-01-25T11:47:58Z)
On Task-personalized Multimodal Few-shot Learning for Visually-rich Document Entity Retrieval [59.25292920967197]
VDER(Few-shot document entity search)は、NLPアプリケーションにおいて重要なトピックである。 FewVEXは、エンティティレベルの少数ショットVDERの分野における将来の研究を促進するための、新しいデータセットである。本稿では,タスクパーソナライズを効果的に実現することを中心に,タスク認識型メタラーニングベースのフレームワークを提案する。
論文参考訳（メタデータ） (2023-11-01T17:51:43Z)
MGDoc: Pre-training with Multi-granular Hierarchy for Document Image Understanding [53.03978356918377]
異なるレベルの粒度のコンテンツ間の空間的階層的関係は、文書画像理解タスクに不可欠である。既存の方法は単語レベルか地域レベルから特徴を学習するが、両方を同時に考えることができない。 MGDocは,ページレベル,領域レベル,単語レベル情報を同時にエンコードするマルチモーダル・マルチグラニュラ事前学習フレームワークである。
論文参考訳（メタデータ） (2022-11-27T22:47:37Z)
Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文参考訳（メタデータ） (2022-09-20T09:16:05Z)
A Densely Connected Criss-Cross Attention Network for Document-level Relation Extraction [3.276435438007766]
文書レベルの関係抽出(RE)は、与えられた文書内の2つのエンティティ間の関係を特定することを目的としている。従来の研究は通常、参照レベルまたはエンティティレベルの文書グラフの情報伝達を通じて推論を完了した。本稿では,文書レベルのREに対して,Densely Connected Criss-Cross Attention Network (Dense-CCNet) と呼ばれる新しいモデルを提案する。
論文参考訳（メタデータ） (2022-03-26T01:01:34Z)
CD2CR: Co-reference Resolution Across Documents and Domains [20.30046972135548]
クロスドキュメント・コリファレンス・レゾリューション (CDCR) は、多くのテキスト文書にまたがるエンティティや概念への言及を識別し、リンクするタスクである。クロスドキュメント・クロスドメイン・コリファレンス・レゾリューション(CD$2$CR)のための新しいタスクと英語データセットを提案する。このクロスドメインなクロスドキュメント設定では、既存のCDCRモデルはうまく動作せず、CD$2$CR上の現在の最先端CDCRモデルより優れたベースラインモデルを提供する。
論文参考訳（メタデータ） (2021-01-29T15:18:30Z)
Generalizing Cross-Document Event Coreference Resolution Across Multiple Corpora [63.429307282665704]
クロスドキュメントイベントコア参照解決(CDCR)は、文書の集合全体にわたってイベントの特定とクラスタ化を行う必要があるNLPタスクである。 CDCRは、下流のマルチドキュメントアプリケーションに利益をもたらすことを目標としているが、CDCRの適用による改善はまだ示されていない。これまでのCDCRシステムは,1つのコーパスでのみ開発,トレーニング,テストが行われた。
論文参考訳（メタデータ） (2020-11-24T17:45:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。