論文の概要: Biased TextRank: Unsupervised Graph-Based Content Extraction
- arxiv url: http://arxiv.org/abs/2011.01026v1
- Date: Mon, 2 Nov 2020 15:17:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 11:56:06.339442
- Title: Biased TextRank: Unsupervised Graph-Based Content Extraction
- Title(参考訳): Biased TextRank: 教師なしグラフベースのコンテンツ抽出
- Authors: Ashkan Kazemi, Ver\'onica P\'erez-Rosas, Rada Mihalcea
- Abstract要約: Biased TextRankは、人気のあるTextRankアルゴリズムにインスパイアされたグラフベースのコンテンツ抽出手法である。
We present two application of Biased TextRank: focused summarization and explanation extract。
- 参考スコア(独自算出の注目度): 26.54218341713572
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Biased TextRank, a graph-based content extraction method
inspired by the popular TextRank algorithm that ranks text spans according to
their importance for language processing tasks and according to their relevance
to an input "focus." Biased TextRank enables focused content extraction for
text by modifying the random restarts in the execution of TextRank. The random
restart probabilities are assigned based on the relevance of the graph nodes to
the focus of the task. We present two applications of Biased TextRank: focused
summarization and explanation extraction, and show that our algorithm leads to
improved performance on two different datasets by significant ROUGE-N score
margins. Much like its predecessor, Biased TextRank is unsupervised, easy to
implement and orders of magnitude faster and lighter than current
state-of-the-art Natural Language Processing methods for similar tasks.
- Abstract(参考訳): テキストスパンを言語処理タスクにおける重要度や,入力「フォーカス」との関連度に応じてランク付けする,一般的なtextrankアルゴリズムに触発された,グラフに基づくコンテンツ抽出手法であるbiasted textrankを提案する。
Biased TextRankは、TextRankの実行時にランダム再起動を変更することで、テキストのコンテンツ抽出を可能にする。
ランダムな再起動確率は、タスクの焦点に対するグラフノードの関連性に基づいて割り当てられる。
偏り付きテキストランクの応用として,集中型要約と説明抽出の2つの応用を行い,アルゴリズムが2つの異なるデータセットの性能を,ルージュnスコアマージンで向上させることを示した。
前者と同様、biasted textrankは教師なしで実装が容易で、同様のタスクで現在の最先端自然言語処理メソッドよりも高速で軽量である。
関連論文リスト
- DNTextSpotter: Arbitrary-Shaped Scene Text Spotting via Improved Denoising Training [17.734265617973293]
任意のテキストスポッティングのための新しいDenoising Training(DNTextSpotter)を提案する。
DNTextSpotterは、denoising部のクエリをノイズのある位置クエリとノイズのあるコンテンツクエリに分解する。
4つのベンチマークで最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2024-08-01T07:52:07Z) - Copy Is All You Need [66.00852205068327]
既存のテキストコレクションからテキストセグメントを段階的にコピーするテキスト生成を定式化する。
提案手法は, 自動評価と人的評価の両方により, より優れた生成品質を実現する。
当社のアプローチでは,より大規模なテキストコレクションにスケールアップすることで,さらなるパフォーマンス向上を実現しています。
論文 参考訳(メタデータ) (2023-07-13T05:03:26Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - Evaluating Factual Consistency of Texts with Semantic Role Labeling [3.1776833268555134]
本稿では,テキスト要約を念頭に設計した参照不要評価指標SRLScoreを紹介する。
最終事実度スコアは、調整可能なスコアリング機構により算出される。
英語の要約データセットにおける人間の判断との相関は、SRLScoreが最先端の手法と競合していることを示している。
論文 参考訳(メタデータ) (2023-05-22T17:59:42Z) - ChatGraph: Interpretable Text Classification by Converting ChatGPT
Knowledge to Graphs [54.48467003509595]
ChatGPTは、様々な自然言語処理(NLP)タスクにおいて優れたパフォーマンスを示している。
テキスト分類などの特定のタスクにChatGPTのパワーを利用する新しいフレームワークを提案する。
本手法は,従来のテキスト分類法と比較して,より透過的な意思決定プロセスを提供する。
論文 参考訳(メタデータ) (2023-05-03T19:57:43Z) - Graph-based Semantical Extractive Text Analysis [0.0]
本研究では,テキストの部分間の意味的類似性を組み込むことで,TextRankアルゴリズムの結果を改善する。
キーワード抽出とテキスト要約とは別に,本フレームワークに基づくトピッククラスタリングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-12-19T18:30:26Z) - Text Revision by On-the-Fly Representation Optimization [76.11035270753757]
現在の最先端手法は、これらのタスクをシーケンスからシーケンスまでの学習問題として定式化している。
並列データを必要としないテキストリビジョンのための反復的なインプレース編集手法を提案する。
テキストの単純化に関する最先端の教師付き手法よりも、競争力があり、パフォーマンスも向上する。
論文 参考訳(メタデータ) (2022-04-15T07:38:08Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Rank over Class: The Untapped Potential of Ranking in Natural Language
Processing [8.637110868126546]
我々は、現在分類を用いて対処されている多くのタスクが、実際には分類モールドに切り替わっていると論じる。
本稿では,一対のテキストシーケンスの表現を生成するトランスフォーマーネットワークからなる新しいエンドツーエンドランキング手法を提案する。
重く歪んだ感情分析データセットの実験では、ランキング結果を分類ラベルに変換すると、最先端のテキスト分類よりも約22%改善する。
論文 参考訳(メタデータ) (2020-09-10T22:18:57Z) - Abstractive Summarization of Spoken and Written Instructions with BERT [66.14755043607776]
本稿では,BERTSumモデルの最初の対話型言語への応用について述べる。
我々は多種多様な話題にまたがるナレーションビデオの抽象要約を生成する。
我々は、これをインテリジェントな仮想アシスタントの機能として統合し、要求に応じて文字と音声の両方の指導内容の要約を可能にすることを想定する。
論文 参考訳(メタデータ) (2020-08-21T20:59:34Z) - Investigating Label Bias in Beam Search for Open-ended Text Generation [8.331919991368366]
オープンエンドテキスト生成では、ビームサーチはしばしば繰り返しおよびジェネリックテキストを生成する。
標準Seq2seqモデルは、その局所正規化確率の定式化によりラベルバイアスに悩まされる。
局所正規化最大推定とグローバル正規化シーケンスレベルのトレーニングを組み合わせることで、難易度を犠牲にすることなくラベルバイアスを低減できる。
論文 参考訳(メタデータ) (2020-05-22T05:17:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。