論文の概要: Explaining Relationships Between Scientific Documents
- arxiv url: http://arxiv.org/abs/2002.00317v3
- Date: Thu, 12 Aug 2021 23:28:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 20:06:27.820517
- Title: Explaining Relationships Between Scientific Documents
- Title(参考訳): 科学文書間の関係を説明する
- Authors: Kelvin Luu, Xinyi Wu, Rik Koncel-Kedziorski, Kyle Lo, Isabel Cachola,
and Noah A. Smith
- Abstract要約: 本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
- 参考スコア(独自算出の注目度): 55.23390424044378
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address the task of explaining relationships between two scientific
documents using natural language text. This task requires modeling the complex
content of long technical documents, deducing a relationship between these
documents, and expressing the details of that relationship in text. In addition
to the theoretical interest of this task, successful solutions can help improve
researcher efficiency in search and review. In this paper we establish a
dataset of 622K examples from 154K documents. We pretrain a large language
model to serve as the foundation for autoregressive approaches to the task. We
explore the impact of taking different views on the two documents, including
the use of dense representations extracted with scientific IE systems. We
provide extensive automatic and human evaluations which show the promise of
such models, but make clear challenges for future work.
- Abstract(参考訳): 自然言語テキストを用いた2つの科学文書間の関係を説明するタスクについて述べる。
このタスクでは、長い技術文書の複雑な内容をモデル化し、これらの文書間の関係を推論し、その関係の詳細をテキストで表現する必要がある。
この課題の理論的関心に加えて、成功したソリューションは研究者の探索とレビューの効率を向上させるのに役立つ。
本稿では154K文書から622Kサンプルのデータセットを作成する。
我々は,タスクに対する自己回帰的アプローチの基礎となるために,大規模言語モデルを事前訓練する。
科学的なIEシステムで抽出した濃密な表現の使用を含む,2つの文書に対して異なる視点を取ることの影響について検討する。
このようなモデルの有望さを示す広範な自動評価と人間評価を提供するが、今後の作業には明確な課題がある。
関連論文リスト
- Unified Multi-Modal Interleaved Document Representation for Information Retrieval [57.65409208879344]
我々は、異なるモダリティでインターリーブされた文書を均等に埋め込み、より包括的でニュアンスのある文書表現を生成する。
具体的には、テキスト、画像、テーブルの処理と統合を統一されたフォーマットと表現に統合する、近年のビジョン言語モデルの能力を活用して、これを実現する。
論文 参考訳(メタデータ) (2024-10-03T17:49:09Z) - ATLANTIC: Structure-Aware Retrieval-Augmented Language Model for
Interdisciplinary Science [0.0]
大きな言語モデルは、多くの自然言語処理タスクで印象的なパフォーマンスを記録します。
Retrieval augmentationは、外部の知識ソースからコンテキストを取得することで、効果的なソリューションを提供する。
本稿では,検索強化時に文書構造に対応する構造対応検索言語モデルを提案する。
論文 参考訳(メタデータ) (2023-11-21T02:02:46Z) - Retrieval-Generation Synergy Augmented Large Language Models [30.53260173572783]
本稿では,反復的な検索・生成協調フレームワークを提案する。
シングルホップQAとマルチホップQAタスクを含む4つの質問応答データセットの実験を行った。
論文 参考訳(メタデータ) (2023-10-08T12:50:57Z) - A Comprehensive Survey of Document-level Relation Extraction (2016-2023) [3.0204640945657326]
文書レベルの関係抽出(DocRE)は自然言語処理(NLP)研究の活発な領域である
本稿では,この分野における最近の進歩を包括的に概観し,文レベルの関係抽出と比較して,その適用方法の相違点を明らかにすることを目的とする。
論文 参考訳(メタデータ) (2023-09-28T12:43:32Z) - UniDoc: A Universal Large Multimodal Model for Simultaneous Text
Detection, Recognition, Spotting and Understanding [93.92313947913831]
テキスト検出と認識機能を備えた新しいマルチモーダルモデルUniDocを紹介する。
我々の知る限りでは、これはテキストの検出、認識、スポッティング、理解を同時に行うことができる最初の大規模マルチモーダルモデルである。
論文 参考訳(メタデータ) (2023-08-19T17:32:34Z) - Peek Across: Improving Multi-Document Modeling via Cross-Document
Question-Answering [49.85790367128085]
我々は,事前学習対象に答える新しいクロスドキュメント質問から,汎用的なマルチドキュメントモデルを事前学習する。
この新規なマルチドキュメントQA定式化は、クロステキスト情報関係をよりよく回復させるようモデルに指示する。
分類タスクや要約タスクに焦点を当てた従来のマルチドキュメントモデルとは異なり、事前学習対象の定式化により、短いテキスト生成と長いテキスト生成の両方を含むタスクを実行できる。
論文 参考訳(メタデータ) (2023-05-24T17:48:40Z) - Augmenting Document Representations for Dense Retrieval with
Interpolation and Perturbation [49.940525611640346]
ドキュメント拡張(Document Augmentation for dense Retrieval)フレームワークは、ドキュメントの表現をDense Augmentationとperturbationsで強化する。
2つのベンチマークデータセットによる検索タスクにおけるDARの性能評価を行い、ラベル付き文書とラベルなし文書の密集検索において、提案したDARが関連するベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2022-03-15T09:07:38Z) - Multi-Vector Models with Textual Guidance for Fine-Grained Scientific
Document Similarity [11.157086694203201]
本稿では, 微粒な面のマッチングに基づく新しい科学的文書類似性モデルを提案する。
本モデルは,テキスト管理の新たな形態として,関連論文の側面を記述した共引用文脈を用いて学習する。
論文 参考訳(メタデータ) (2021-11-16T11:12:30Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Reasoning with Latent Structure Refinement for Document-Level Relation
Extraction [20.308845516900426]
本稿では,潜在文書レベルグラフを自動的に誘導することにより,文間の関係推論を促進する新しいモデルを提案する。
具体的には、大規模文書レベルデータセット(DocRED)上でF1スコア59.05を達成する。
論文 参考訳(メタデータ) (2020-05-13T13:36:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。