論文の概要: An Unsupervised Semantic Sentence Ranking Scheme for Text Documents
- arxiv url: http://arxiv.org/abs/2005.02158v1
- Date: Tue, 28 Apr 2020 20:17:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 21:47:53.267810
- Title: An Unsupervised Semantic Sentence Ranking Scheme for Text Documents
- Title(参考訳): テキスト文書における教師なし意味文ランキング方式
- Authors: Hao Zhang, Jie Wang
- Abstract要約: Semantic SentenceRank (SSR) は、文の相対的重要性に応じて単一の文書にランク付けするための教師なしのスキームである。
テキスト文書から必須の単語やフレーズを抽出し、それぞれ意味尺度を用いて、フレーズや単語に対する意味句グラフと、文章に対する意味文グラフを構築する。
- 参考スコア(独自算出の注目度): 9.272728720669846
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents Semantic SentenceRank (SSR), an unsupervised scheme for
automatically ranking sentences in a single document according to their
relative importance. In particular, SSR extracts essential words and phrases
from a text document, and uses semantic measures to construct, respectively, a
semantic phrase graph over phrases and words, and a semantic sentence graph
over sentences. It applies two variants of article-structure-biased PageRank to
score phrases and words on the first graph and sentences on the second graph.
It then combines these scores to generate the final score for each sentence.
Finally, SSR solves a multi-objective optimization problem for ranking
sentences based on their final scores and topic diversity through semantic
subtopic clustering. An implementation of SSR that runs in quadratic time is
presented, and it outperforms, on the SummBank benchmarks, each individual
judge's ranking and compares favorably with the combined ranking of all judges.
- Abstract(参考訳): 本稿では,ssr (semantic sentencerank) について述べる。ssr (unsupervised scheme, unsupervised scheme) は,その相対的重要性に応じて1つの文書中の文章を自動的にランク付けする手法である。
特に、ssrは、テキスト文書から本質的な単語と句を抽出し、それぞれ、句と単語についての意味句グラフと、文上の意味文グラフを構築するための意味尺度を用いる。
記事構造バイアスのPageRankの2つの変種を適用し、第1グラフのフレーズと単語、第2グラフの文をスコアする。
そしてこれらのスコアを組み合わせて、各文の最終スコアを生成する。
最後に、ssrは、意味サブトピッククラスタリングによる最終スコアとトピックの多様性に基づいて、文章をランク付けするための多目的最適化問題を解く。
2次時間で実行されるSSRの実装が提示され、SummBankベンチマークでは、各審査員のランキングよりも優れ、すべての審査員の合計ランキングと好意的に比較される。
関連論文リスト
- Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.5923941324953]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。
我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。
推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文 参考訳(メタデータ) (2024-03-01T10:38:07Z) - RankSum An unsupervised extractive text summarization based on rank
fusion [0.0]
本稿では,単一文書の抽出テキスト要約手法であるRansumを提案する。
ランクサムは、各特徴に対応する文の給与ランクを教師なしの方法で取得する。
CNN/DailyMail と DUC 2002 で利用可能な要約データセットについて検討した。
論文 参考訳(メタデータ) (2024-02-07T22:24:09Z) - Bipartite Graph Pre-training for Unsupervised Extractive Summarization
with Graph Convolutional Auto-Encoders [24.13261636386226]
本研究は, 文章表現の正当性や特徴を最適化するプロセスから, 事前学習した埋め込みを活用することで, 重要な文のランク付けに役立てるものであることを論じる。
そこで本研究では,文埋め込みのためのグラフ事前学習オートエンコーダを提案する。
論文 参考訳(メタデータ) (2023-10-29T12:27:18Z) - RankCSE: Unsupervised Sentence Representations Learning via Learning to
Rank [54.854714257687334]
本稿では,教師なし文表現学習のための新しい手法であるRangCSEを提案する。
コントラスト学習を伴うランキング一貫性とランキング蒸留を統一された枠組みに組み込む。
セマンティックテキスト類似性(STS)と転送タスク(TR)の両方について、広範な実験が実施されている。
論文 参考訳(メタデータ) (2023-05-26T08:27:07Z) - Text Summarization with Oracle Expectation [88.39032981994535]
抽出要約は、文書の中で最も重要な文を識別し、連結することによって要約を生成する。
ほとんどの要約データセットは、文書文が要約に値するかどうかを示す金のラベルを持っていない。
本稿では,ソフトな予測に基づく文ラベルを生成する,シンプルで効果的なラベル付けアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-26T14:10:08Z) - Contextual Networks and Unsupervised Ranking of Sentences [9.198786220570096]
我々は、CNATAR(Contextual Network Text Analysis Rank)と呼ばれる教師なしのアルゴリズムを考案し、文をスコアリングする。
SummBankのデータセットで提供される3人の審査員のランキングでは、CNATARの方が優れています。
また、CNATARと最新の教師付きニューラルネットワーク要約モデルの性能とオラクルの計算結果を比較した。
論文 参考訳(メタデータ) (2022-03-09T00:47:20Z) - Unsupervised Summarization for Chat Logs with Topic-Oriented Ranking and
Context-Aware Auto-Encoders [59.038157066874255]
本稿では,手動ラベル付きデータを用いずにチャット要約を行うrankaeという新しいフレームワークを提案する。
RankAEは、中心性と多様性に応じてトピックの発話を同時に選択するトピック指向のランキング戦略で構成されています。
消音自動エンコーダは、選択された発話に基づいて簡潔でコンテキスト情報に基づいた要約を生成するように設計されています。
論文 参考訳(メタデータ) (2020-12-14T07:31:17Z) - Discrete Optimization for Unsupervised Sentence Summarization with
Word-Level Extraction [31.648764677078837]
自動要約は、その最も重要な情報を保存しながら、文章の短いバージョンを生成する。
我々はこれら2つの側面を言語モデリングと意味的類似度メトリクスからなる教師なし目的関数でモデル化する。
提案手法は,ROUGEスコアによる教師なし文要約のための新しい最先端技術を実現する。
論文 参考訳(メタデータ) (2020-05-04T19:01:55Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence
Lip-Reading [96.48553941812366]
唇読解は唇運動系列から音声内容を推測することを目的としている。
seq2seqモデルの伝統的な学習プロセスには2つの問題がある。
本稿では,これら2つの問題に対処するために,PCPGに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T09:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。