論文の概要: Unsupervised Scientific Abstract Segmentation with Normalized Mutual
Information
- arxiv url: http://arxiv.org/abs/2305.11553v1
- Date: Fri, 19 May 2023 09:53:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-22 15:04:54.151346
- Title: Unsupervised Scientific Abstract Segmentation with Normalized Mutual
Information
- Title(参考訳): 正規化相互情報を用いた教師なし科学的抽象セグメンテーション
- Authors: Yingqiang Gao, Jessica Lam, Nianlong Gu, Richard H.R. Hahnloser
- Abstract要約: 抽象的セグメンテーションのための正規化相互情報(NMI)を実証的に検討する。
非構造的抽象化では、GreedyCASは全ての評価指標で最高の性能を発揮する。
NMIと評価指標との強い相関は,NMIが抽象的セグメンテーションに有効であることを明らかにする。
- 参考スコア(独自算出の注目度): 4.129225533930966
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The abstracts of scientific papers consist of premises and conclusions.
Structured abstracts explicitly highlight the conclusion sentences, whereas
non-structured abstracts may have conclusion sentences at uncertain positions.
This implicit nature of conclusion positions makes the automatic segmentation
of scientific abstracts into premises and conclusions a challenging task. In
this work, we empirically explore using Normalized Mutual Information (NMI) for
abstract segmentation. We consider each abstract as a recurrent cycle of
sentences and place segmentation boundaries by greedily optimizing the NMI
score between premises and conclusions. On non-structured abstracts, our
proposed unsupervised approach GreedyCAS achieves the best performance across
all evaluation metrics; on structured abstracts, GreedyCAS outperforms all
baseline methods measured by $P_k$. The strong correlation of NMI to our
evaluation metrics reveals the effectiveness of NMI for abstract segmentation.
- Abstract(参考訳): 科学論文の要約は前提と結論から成り立っている。
構造的抽象は結論文を明確に強調するが、非構造的抽象は不確実な位置で結論文を持つ。
この暗黙的な帰結位置の性質は、科学的抽象を前提に自動的に分割し、結論を困難なタスクにする。
本研究では,抽象的セグメンテーションのための正規化相互情報(NMI)を実証的に検討する。
我々は,各要約を,前提と結論のNMIスコアを鮮やかに最適化することにより,文の繰り返しサイクルと場所分割境界とみなす。
構造化された抽象化では、GreedyCASは$P_k$で測定されたすべてのベースラインメソッドよりも優れています。
NMIと評価指標との強い相関は,NMIが抽象的セグメンテーションに有効であることを明らかにする。
関連論文リスト
- Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.5923941324953]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。
我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。
推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文 参考訳(メタデータ) (2024-03-01T10:38:07Z) - Hierarchical State Abstraction Based on Structural Information
Principles [70.24495170921075]
本稿では、情報理論の観点から、新しい数学的構造情報原理に基づく状態抽象化フレームワーク、すなわちSISAを提案する。
SISAは、様々な表現学習目標と柔軟に統合され、パフォーマンスをさらに向上する一般的なフレームワークである。
論文 参考訳(メタデータ) (2023-04-24T11:06:52Z) - Simple Yet Effective Synthetic Dataset Construction for Unsupervised
Opinion Summarization [28.52201592634964]
本稿では、アスペクト特化と一般的な意見要約の両方を生成するための、単純で効果的な教師なしの2つのアプローチを提案する。
最初のアプローチであるSed Words Based Leave-One-Out (SW-LOO) は、正確にマッチングされたアスペクトシードワードによって、アスペクト関連のレビューを識別する。
第2のアプローチであるNLI-LOO(Natural Language Inference Based Leave-One-Out)では、NLIモデルを用いたアスペクト関連文を、シード語を使わずにより一般的な設定で識別する。
論文 参考訳(メタデータ) (2023-03-21T08:08:04Z) - Document Summarization with Text Segmentation [7.954814600961461]
我々は、抽出要約タスクを改善するために、固有文書セグメント構造を利用する。
2つのテキストセグメンテーションモデルを構築し、その出力予測を導入するための最も最適な戦略を見出す。
論文 参考訳(メタデータ) (2023-01-20T22:24:22Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Nested Named Entity Recognition as Holistic Structure Parsing [92.8397338250383]
本研究は,文中の全入れ子NEを全体構造としてモデル化し,全体構造解析アルゴリズムを提案する。
実験により、我々のモデルは、最先端にアプローチしたり、あるいは達成したりするような、広く使われているベンチマークで有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2022-04-17T12:48:20Z) - Automatic evaluation of scientific abstracts through natural language
processing [0.0]
本稿では,科学的研究の分類,セグメント化,評価を行う自然言語処理アルゴリズムを提案する。
提案フレームワークは, テキスト分類手法を用いて, 解決すべき課題に応じて, 抽象テキストを分類する。
要約の方法論は、その結果の感情分析に基づいてランク付けされる。
論文 参考訳(メタデータ) (2021-11-14T12:55:29Z) - Abstract, Rationale, Stance: A Joint Model for Scientific Claim
Verification [18.330265729989843]
我々は,3つのタスクのモジュールを,機械読解フレームワークを用いて共同で学習するアプローチをARSJointとして提案する。
ベンチマークデータセットSciFactの実験結果は、我々のアプローチが既存の作業より優れていることを示している。
論文 参考訳(メタデータ) (2021-09-13T10:07:26Z) - Topic-Centric Unsupervised Multi-Document Summarization of Scientific
and News Articles [3.0504782036247438]
本稿では,トピック中心のマルチドキュメント要約フレームワークを提案し,抽象的な要約を生成する。
提案アルゴリズムは,有能な言語単位選択とテキスト生成技術を開発することにより,抽象的な要約を生成する。
提案手法は,自動抽出評価指標を用いて評価した場合の最先端技術と一致し,人間の5つの評価指標の抽象的要約に優れる。
論文 参考訳(メタデータ) (2020-11-03T04:04:21Z) - Introducing Syntactic Structures into Target Opinion Word Extraction
with Deep Learning [89.64620296557177]
目的語抽出のためのディープラーニングモデルに文の構文構造を組み込むことを提案する。
また,ディープラーニングモデルの性能向上のために,新たな正規化手法を導入する。
提案モデルは,4つのベンチマークデータセット上での最先端性能を広範囲に解析し,達成する。
論文 参考訳(メタデータ) (2020-10-26T07:13:17Z) - Constrained Abstractive Summarization: Preserving Factual Consistency
with Constrained Generation [93.87095877617968]
本稿では,抽象要約の現実的一貫性を保ちつつ,制約付き抽象要約(CAS)を提案する。
我々は、CASを満たすために、一般的に自己回帰生成モデルに適用される語彙制約付き復号法を採用する。
対話的要約において1つの手動制約のみを使用する場合、最大13.8ROUGE-2ゲインを観測する。
論文 参考訳(メタデータ) (2020-10-24T00:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。