論文の概要: Discourse-Aware Unsupervised Summarization of Long Scientific Documents
- arxiv url: http://arxiv.org/abs/2005.00513v2
- Date: Wed, 13 Jan 2021 16:57:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 23:56:30.387711
- Title: Discourse-Aware Unsupervised Summarization of Long Scientific Documents
- Title(参考訳): 長い科学文書の教師なし要約を意識した談話
- Authors: Yue Dong, Andrei Mircea, Jackie C. K. Cheung
- Abstract要約: 長い学術文書の抽出要約のための教師なしグラフに基づくランキングモデルを提案する。
提案手法は,情報源文書の2段階階層グラフ表現を仮定し,非対称な位置推定手法を用いて文の重要度を決定する。
PubMed と arXiv のデータセットの結果から,我々の手法は,自動測定と人的評価において,幅広いマージンで強い教師なしベースラインを上回ります。
- 参考スコア(独自算出の注目度): 13.405733237855404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose an unsupervised graph-based ranking model for extractive
summarization of long scientific documents. Our method assumes a two-level
hierarchical graph representation of the source document, and exploits
asymmetrical positional cues to determine sentence importance. Results on the
PubMed and arXiv datasets show that our approach outperforms strong
unsupervised baselines by wide margins in automatic metrics and human
evaluation. In addition, it achieves performance comparable to many
state-of-the-art supervised approaches which are trained on hundreds of
thousands of examples. These results suggest that patterns in the discourse
structure are a strong signal for determining importance in scientific
articles.
- Abstract(参考訳): 長い学術文書の抽出要約のための教師なしグラフに基づくランキングモデルを提案する。
本手法では,ソース文書の2段階の階層グラフ表現を仮定し,非対称位置手がかりを用いて文重要度を判定する。
PubMed と arXiv のデータセットの結果から,我々の手法は,自動測定と人的評価において,幅広いマージンで強い教師なしベースラインを上回ります。
さらに、数十万のサンプルでトレーニングされた最先端の教師付きアプローチに匹敵するパフォーマンスを達成する。
これらの結果から, 談話構造におけるパターンは, 科学論文の重要性を判断するための強いシグナルであることが示唆された。
関連論文リスト
- Contrastive Hierarchical Discourse Graph for Scientific Document
Summarization [14.930704950433324]
CHANGESは、抽出科学論文要約のための対照的な階層型グラフニューラルネットワークである。
また,グローバルなテーマ認識文表現を学習するためのグラフコントラスト学習モジュールを提案する。
論文 参考訳(メタデータ) (2023-05-31T20:54:43Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - GoSum: Extractive Summarization of Long Documents by Reinforcement
Learning and Graph Organized discourse state [6.4805900740861]
長文要約のための強化学習に基づく抽出モデルであるGoSumを提案する。
GoSumは入力文書ごとに異なる談話レベルから異質なグラフを構築することで状態をエンコードする。
論文要約の2つのデータセット,PubMed と arXiv のモデルを評価する。
論文 参考訳(メタデータ) (2022-11-18T14:07:29Z) - Hub-aware Random Walk Graph Embedding Methods for Classification [68.8204255655161]
ノード分類問題に特化して設計されたランダムウォークに基づく2つの新しいグラフ埋め込みアルゴリズムを提案する。
提案手法は,実世界のネットワークの埋め込みを訓練した3つの分類アルゴリズムの分類性能を解析して実験的に評価する。
論文 参考訳(メタデータ) (2022-09-15T20:41:18Z) - HUMAP: Hierarchical Uniform Manifold Approximation and Projection [64.0476282000118]
HUMAPは、局所的・大域的構造と階層的探索を通してのメンタルマップの保存に柔軟に設計された、新しい階層的次元削減技術である。
本手法の優位性を示す実証的な証拠を,現在の階層的アプローチと比較し,その強みを示す2つのケーススタディを示す。
論文 参考訳(メタデータ) (2021-06-14T19:27:54Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - Evaluation Discrepancy Discovery: A Sentence Compression Case-study [0.6430130814523793]
測定基準も人的評価もシステム性能に関する結論を引き出すには十分でないことを示す。
我々は、システムが確立されたデータセットをゲームして最先端の結果を得る方法を示す。
論文 参考訳(メタデータ) (2021-01-22T12:28:41Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - SummPip: Unsupervised Multi-Document Summarization with Sentence Graph
Compression [61.97200991151141]
SummPipはマルチドキュメント要約のための教師なしの手法である。
元の文書を文グラフに変換し、言語表現と深層表現の両方を考慮に入れます。
次に、スペクトルクラスタリングを適用して複数の文のクラスタを取得し、最後に各クラスタを圧縮して最終的な要約を生成する。
論文 参考訳(メタデータ) (2020-07-17T13:01:15Z) - Learning Neural Textual Representations for Citation Recommendation [7.227232362460348]
サブモジュラースコアリング機能において,シームズとトリプルトネットワークを併用した文書(センテンス-BERT)の深部表現を用いた引用推薦手法を提案する。
我々の知る限りでは、これは引用推薦のタスクに対して、ディープ表現とサブモジュラー選択を組み合わせるための最初のアプローチである。
論文 参考訳(メタデータ) (2020-07-08T12:38:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。