論文の概要: Discourse-Aware Unsupervised Summarization of Long Scientific Documents
- arxiv url: http://arxiv.org/abs/2005.00513v2
- Date: Wed, 13 Jan 2021 16:57:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 23:56:30.387711
- Title: Discourse-Aware Unsupervised Summarization of Long Scientific Documents
- Title(参考訳): 長い科学文書の教師なし要約を意識した談話
- Authors: Yue Dong, Andrei Mircea, Jackie C. K. Cheung
- Abstract要約: 長い学術文書の抽出要約のための教師なしグラフに基づくランキングモデルを提案する。
提案手法は,情報源文書の2段階階層グラフ表現を仮定し,非対称な位置推定手法を用いて文の重要度を決定する。
PubMed と arXiv のデータセットの結果から,我々の手法は,自動測定と人的評価において,幅広いマージンで強い教師なしベースラインを上回ります。
- 参考スコア(独自算出の注目度): 13.405733237855404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an unsupervised graph-based ranking model for extractive
summarization of long scientific documents. Our method assumes a two-level
hierarchical graph representation of the source document, and exploits
asymmetrical positional cues to determine sentence importance. Results on the
PubMed and arXiv datasets show that our approach outperforms strong
unsupervised baselines by wide margins in automatic metrics and human
evaluation. In addition, it achieves performance comparable to many
state-of-the-art supervised approaches which are trained on hundreds of
thousands of examples. These results suggest that patterns in the discourse
structure are a strong signal for determining importance in scientific
articles.
- Abstract(参考訳): 長い学術文書の抽出要約のための教師なしグラフに基づくランキングモデルを提案する。
本手法では,ソース文書の2段階の階層グラフ表現を仮定し,非対称位置手がかりを用いて文重要度を判定する。
PubMed と arXiv のデータセットの結果から,我々の手法は,自動測定と人的評価において,幅広いマージンで強い教師なしベースラインを上回ります。
さらに、数十万のサンプルでトレーニングされた最先端の教師付きアプローチに匹敵するパフォーマンスを達成する。
これらの結果から, 談話構造におけるパターンは, 科学論文の重要性を判断するための強いシグナルであることが示唆された。
関連論文リスト
- Hierarchical Attention Graph for Scientific Document Summarization in Global and Local Level [3.7651378994837104]
ロングインプットは、文間の大域的高次関係と局所的文内関係を同時にモデル化することを妨げる。
本稿では,階層的談話構造に基づく文書のモデル化にグラフニューラルネットワークを用いた新しい手法であるHAESumを提案する。
提案手法を2つのベンチマークデータセットで検証し,実験結果からHAESumの有効性を実証した。
論文 参考訳(メタデータ) (2024-05-16T15:46:30Z) - Contrastive Hierarchical Discourse Graph for Scientific Document
Summarization [14.930704950433324]
CHANGESは、抽出科学論文要約のための対照的な階層型グラフニューラルネットワークである。
また,グローバルなテーマ認識文表現を学習するためのグラフコントラスト学習モジュールを提案する。
論文 参考訳(メタデータ) (2023-05-31T20:54:43Z) - MIReAD: Simple Method for Learning High-quality Representations from
Scientific Documents [77.34726150561087]
論文の高品質な表現を学習する簡単な方法であるMIREADを提案する。
私たちは、2000以上のジャーナルクラスで50万以上のPubMedとarXivの抽象クラスでMIREADをトレーニングします。
論文 参考訳(メタデータ) (2023-05-07T03:29:55Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - GoSum: Extractive Summarization of Long Documents by Reinforcement
Learning and Graph Organized discourse state [6.4805900740861]
長文要約のための強化学習に基づく抽出モデルであるGoSumを提案する。
GoSumは入力文書ごとに異なる談話レベルから異質なグラフを構築することで状態をエンコードする。
論文要約の2つのデータセット,PubMed と arXiv のモデルを評価する。
論文 参考訳(メタデータ) (2022-11-18T14:07:29Z) - Self-supervised Graph-level Representation Learning with Local and
Global Structure [71.45196938842608]
自己教師付き全グラフ表現学習のためのローカル・インスタンスとグローバル・セマンティック・ラーニング(GraphLoG)という統合フレームワークを提案する。
GraphLoGは、局所的な類似点の保存に加えて、グローバルなセマンティッククラスタをキャプチャする階層的なプロトタイプも導入している。
モデル学習のための効率的なオンライン予測最大化(EM)アルゴリズムがさらに開発された。
論文 参考訳(メタデータ) (2021-06-08T05:25:38Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - SummPip: Unsupervised Multi-Document Summarization with Sentence Graph
Compression [61.97200991151141]
SummPipはマルチドキュメント要約のための教師なしの手法である。
元の文書を文グラフに変換し、言語表現と深層表現の両方を考慮に入れます。
次に、スペクトルクラスタリングを適用して複数の文のクラスタを取得し、最後に各クラスタを圧縮して最終的な要約を生成する。
論文 参考訳(メタデータ) (2020-07-17T13:01:15Z) - Learning Neural Textual Representations for Citation Recommendation [7.227232362460348]
サブモジュラースコアリング機能において,シームズとトリプルトネットワークを併用した文書(センテンス-BERT)の深部表現を用いた引用推薦手法を提案する。
我々の知る限りでは、これは引用推薦のタスクに対して、ディープ表現とサブモジュラー選択を組み合わせるための最初のアプローチである。
論文 参考訳(メタデータ) (2020-07-08T12:38:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。