論文の概要: Contextual Networks and Unsupervised Ranking of Sentences
- arxiv url: http://arxiv.org/abs/2203.04459v1
- Date: Wed, 9 Mar 2022 00:47:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 14:21:46.086259
- Title: Contextual Networks and Unsupervised Ranking of Sentences
- Title(参考訳): 文脈ネットワークと文の教師なしランキング
- Authors: Hao Zhang, You Zhou, Jie Wang
- Abstract要約: 我々は、CNATAR(Contextual Network Text Analysis Rank)と呼ばれる教師なしのアルゴリズムを考案し、文をスコアリングする。
SummBankのデータセットで提供される3人の審査員のランキングでは、CNATARの方が優れています。
また、CNATARと最新の教師付きニューラルネットワーク要約モデルの性能とオラクルの計算結果を比較した。
- 参考スコア(独自算出の注目度): 9.198786220570096
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We construct a contextual network to represent a document with syntactic and
semantic relations between word-sentence pairs, based on which we devise an
unsupervised algorithm called CNATAR (Contextual Network And Text Analysis
Rank) to score sentences, and rank them through a bi-objective 0-1 knapsack
maximization problem over topic analysis and sentence scores. We show that
CNATAR outperforms the combined ranking of the three human judges provided on
the SummBank dataset under both ROUGE and BLEU metrics, which in term
significantly outperforms each individual judge's ranking. Moreover, CNATAR
produces so far the highest ROUGE scores over DUC-02, and outperforms previous
supervised algorithms on the CNN/DailyMail and NYT datasets. We also compare
the performance of CNATAR and the latest supervised neural-network
summarization models and compute oracle results.
- Abstract(参考訳): そこで本研究では,文のスコア付けのために,cnatar (contextual network and text analysis rank) と呼ばれる教師なしアルゴリズムを考案し,トピック分析と文スコアの2つの目的の 0-1 knapsack 最大化問題を用いてランク付けする。
cnatarは, rougeとbleuの指標に基づいて,summbankデータセット上で提供された3人の裁判官のランキングを上回っており, 結果として各裁判官のランキングを大幅に上回っている。
さらに、CNATARは、これまでのDUC-02よりも高いROUGEスコアを生成し、CNN/DailyMailおよびNYTデータセット上で、以前の教師付きアルゴリズムよりも優れている。
また、CNATARと最新の教師付きニューラルネットワーク要約モデルの性能とオラクルの計算結果を比較した。
関連論文リスト
- Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.5923941324953]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。
我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。
推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文 参考訳(メタデータ) (2024-03-01T10:38:07Z) - Unsupervised Chunking with Hierarchical RNN [62.15060807493364]
本稿では,非階層的手法で単語をグループ化する構文的タスクであるチャンキングに対する教師なしアプローチを紹介する。
本稿では,単語-チャンク・チャンク-文合成をモデル化した2層階層型階層型リカレントニューラルネットワーク(HRNN)を提案する。
CoNLL-2000データセットの実験では、既存の教師なし手法よりも顕著な改善が見られ、フレーズF1スコアが最大6ポイント向上した。
論文 参考訳(メタデータ) (2023-09-10T02:55:12Z) - Learning to Paraphrase Sentences to Different Complexity Levels [3.0273878903284275]
文の単純化はNLPにおいて活発な研究課題であるが,その隣接する文の複雑化や同レベルのパラフレーズ化の課題はそうではない。
3つのタスクすべてでモデルをトレーニングするために、教師なしデータセットを2つ提示する。
論文 参考訳(メタデータ) (2023-08-04T09:43:37Z) - Influence of various text embeddings on clustering performance in NLP [0.0]
クラスタリングアプローチは、テキストレビューを個々のグループにグループ化することで、正しい星の評価を緩和するために使用することができる。
本稿では,これらのレビューを表現するために,異なるテキスト埋め込みを選択するタスクについて検討するとともに,組込み選択がクラスタリングアルゴリズムの様々なクラスの性能に与える影響について検討する。
論文 参考訳(メタデータ) (2023-05-04T20:53:19Z) - RankDNN: Learning to Rank for Few-shot Learning [70.49494297554537]
本稿では、画像検索の関連性ランキングをバイナリランキング関係分類として活用する、新しい数ショット学習パイプラインを提案する。
これは、数ショットの学習に関する新しい視点を提供し、最先端の手法を補完する。
論文 参考訳(メタデータ) (2022-11-28T13:59:31Z) - Long Document Summarization with Top-down and Bottom-up Inference [113.29319668246407]
本稿では、2つの側面の要約モデルを改善するための原則的推論フレームワークを提案する。
我々のフレームワークは、トップレベルが長距離依存性をキャプチャするドキュメントの階層的な潜在構造を前提としています。
本稿では,様々な要約データセットに対して提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-03-15T01:24:51Z) - GNNRank: Learning Global Rankings from Pairwise Comparisons via Directed
Graph Neural Networks [68.61934077627085]
本稿では,グラフ埋め込みを学習可能なGNNと互換性のあるモデリングフレームワークであるGNNRankを紹介する。
既存の手法と比較して,我々の手法が競争力があり,しばしば優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2022-02-01T04:19:50Z) - DisCoDisCo at the DISRPT2021 Shared Task: A System for Discourse
Segmentation, Classification, and Connective Detection [4.371388370559826]
我々のシステムはDisCoDisCoと呼ばれ、コンテキスト化された単語の埋め込みを手作りの機能で強化する。
関係分類の結果は、新しい2021ベンチマークで強い性能を示している。
複数の事前学習されたトランスフォーマーベース言語モデルの部分評価は、Next Sentence Predictionタスクで事前学習されたモデルが関係分類に最適であることを示している。
論文 参考訳(メタデータ) (2021-09-20T18:11:05Z) - Evaluating Text Coherence at Sentence and Paragraph Levels [17.99797111176988]
本稿では,既存の文順序付け手法の段落順序付けタスクへの適応について検討する。
また、ミニデータセットとノイズの多いデータセットを人工的に作成することで、既存のモデルの学習性と堅牢性を比較する。
我々は、リカレントグラフニューラルネットワークに基づくモデルがコヒーレンスモデリングの最適選択であると結論付けている。
論文 参考訳(メタデータ) (2020-06-05T03:31:49Z) - An Unsupervised Semantic Sentence Ranking Scheme for Text Documents [9.272728720669846]
Semantic SentenceRank (SSR) は、文の相対的重要性に応じて単一の文書にランク付けするための教師なしのスキームである。
テキスト文書から必須の単語やフレーズを抽出し、それぞれ意味尺度を用いて、フレーズや単語に対する意味句グラフと、文章に対する意味文グラフを構築する。
論文 参考訳(メタデータ) (2020-04-28T20:17:51Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。