Fugu-MT 論文翻訳(概要): Discourse-Aware Unsupervised Summarization of Long Scientific Documents

論文の概要: Discourse-Aware Unsupervised Summarization of Long Scientific Documents

arxiv url: http://arxiv.org/abs/2005.00513v2
Date: Wed, 13 Jan 2021 16:57:10 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-07 23:56:30.387711
Title: Discourse-Aware Unsupervised Summarization of Long Scientific Documents
Title（参考訳）: 長い科学文書の教師なし要約を意識した談話
Authors: Yue Dong, Andrei Mircea, Jackie C. K. Cheung
Abstract要約: 長い学術文書の抽出要約のための教師なしグラフに基づくランキングモデルを提案する。提案手法は,情報源文書の2段階階層グラフ表現を仮定し,非対称な位置推定手法を用いて文の重要度を決定する。 PubMed と arXiv のデータセットの結果から,我々の手法は,自動測定と人的評価において,幅広いマージンで強い教師なしベースラインを上回ります。
参考スコア（独自算出の注目度）: 13.405733237855404
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose an unsupervised graph-based ranking model for extractive summarization of long scientific documents. Our method assumes a two-level hierarchical graph representation of the source document, and exploits asymmetrical positional cues to determine sentence importance. Results on the PubMed and arXiv datasets show that our approach outperforms strong unsupervised baselines by wide margins in automatic metrics and human evaluation. In addition, it achieves performance comparable to many state-of-the-art supervised approaches which are trained on hundreds of thousands of examples. These results suggest that patterns in the discourse structure are a strong signal for determining importance in scientific articles.
Abstract（参考訳）: 長い学術文書の抽出要約のための教師なしグラフに基づくランキングモデルを提案する。本手法では,ソース文書の2段階の階層グラフ表現を仮定し,非対称位置手がかりを用いて文重要度を判定する。 PubMed と arXiv のデータセットの結果から,我々の手法は,自動測定と人的評価において,幅広いマージンで強い教師なしベースラインを上回ります。さらに、数十万のサンプルでトレーニングされた最先端の教師付きアプローチに匹敵するパフォーマンスを達成する。これらの結果から, 談話構造におけるパターンは, 科学論文の重要性を判断するための強いシグナルであることが示唆された。

関連論文リスト

SciFig: Towards Automating Scientific Figure Generation [41.73701976318102]
SciFigは研究論文のテキストから直接出版可能なパイプライン図を生成するエンドツーエンドのAIエージェントシステムである。本稿では,2,219個の実科学図を解析し,評価ルーブを抽出するルーブリックに基づく評価フレームワークを提案する。 SciFigは、データセットレベルの評価で70.1$%、紙固有の評価で66.2$%の全体的な品質を達成した。
論文参考訳（メタデータ） (2026-01-07T20:56:58Z)
Rethinking Graph-Based Document Classification: Learning Data-Driven Structures Beyond Heuristic Approaches [21.922739597512955]
本稿では,データ駆動型グラフ構造を学習し,手動設計の必要性を排除し,ドメイン依存を減らす手法を提案する。提案手法は,文の重み付きグラフをノードとして構築し,エッジは文ペア間の依存関係を識別する自己認識モデルを用いて学習する。
論文参考訳（メタデータ） (2025-07-18T12:05:54Z)
Hierarchical Attention Graph for Scientific Document Summarization in Global and Local Level [3.7651378994837104]
ロングインプットは、文間の大域的高次関係と局所的文内関係を同時にモデル化することを妨げる。本稿では,階層的談話構造に基づく文書のモデル化にグラフニューラルネットワークを用いた新しい手法であるHAESumを提案する。提案手法を2つのベンチマークデータセットで検証し,実験結果からHAESumの有効性を実証した。
論文参考訳（メタデータ） (2024-05-16T15:46:30Z)
Contrastive Hierarchical Discourse Graph for Scientific Document Summarization [14.930704950433324]
CHANGESは、抽出科学論文要約のための対照的な階層型グラフニューラルネットワークである。また,グローバルなテーマ認識文表現を学習するためのグラフコントラスト学習モジュールを提案する。
論文参考訳（メタデータ） (2023-05-31T20:54:43Z)
MIReAD: Simple Method for Learning High-quality Representations from Scientific Documents [77.34726150561087]
論文の高品質な表現を学習する簡単な方法であるMIREADを提案する。私たちは、2000以上のジャーナルクラスで50万以上のPubMedとarXivの抽象クラスでMIREADをトレーニングします。
論文参考訳（メタデータ） (2023-05-07T03:29:55Z)
Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文参考訳（メタデータ） (2022-12-08T11:53:12Z)
GoSum: Extractive Summarization of Long Documents by Reinforcement Learning and Graph Organized discourse state [6.4805900740861]
長文要約のための強化学習に基づく抽出モデルであるGoSumを提案する。 GoSumは入力文書ごとに異なる談話レベルから異質なグラフを構築することで状態をエンコードする。論文要約の2つのデータセット,PubMed と arXiv のモデルを評価する。
論文参考訳（メタデータ） (2022-11-18T14:07:29Z)
Self-supervised Graph-level Representation Learning with Local and Global Structure [71.45196938842608]
自己教師付き全グラフ表現学習のためのローカル・インスタンスとグローバル・セマンティック・ラーニング(GraphLoG)という統合フレームワークを提案する。 GraphLoGは、局所的な類似点の保存に加えて、グローバルなセマンティッククラスタをキャプチャする階層的なプロトタイプも導入している。モデル学習のための効率的なオンライン予測最大化(EM)アルゴリズムがさらに開発された。
論文参考訳（メタデータ） (2021-06-08T05:25:38Z)
Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文参考訳（メタデータ） (2021-04-07T11:13:35Z)
What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文参考訳（メタデータ） (2020-11-06T02:23:01Z)
SummPip: Unsupervised Multi-Document Summarization with Sentence Graph Compression [61.97200991151141]
SummPipはマルチドキュメント要約のための教師なしの手法である。元の文書を文グラフに変換し、言語表現と深層表現の両方を考慮に入れます。次に、スペクトルクラスタリングを適用して複数の文のクラスタを取得し、最後に各クラスタを圧縮して最終的な要約を生成する。
論文参考訳（メタデータ） (2020-07-17T13:01:15Z)
Learning Neural Textual Representations for Citation Recommendation [7.227232362460348]
サブモジュラースコアリング機能において,シームズとトリプルトネットワークを併用した文書(センテンス-BERT)の深部表現を用いた引用推薦手法を提案する。我々の知る限りでは、これは引用推薦のタスクに対して、ディープ表現とサブモジュラー選択を組み合わせるための最初のアプローチである。
論文参考訳（メタデータ） (2020-07-08T12:38:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。