論文の概要: Optimizing Keyphrase Ranking for Relevance and Diversity Using Submodular Function Optimization (SFO)
- arxiv url: http://arxiv.org/abs/2410.20080v1
- Date: Sat, 26 Oct 2024 05:14:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:21:34.019544
- Title: Optimizing Keyphrase Ranking for Relevance and Diversity Using Submodular Function Optimization (SFO)
- Title(参考訳): 部分モジュラ関数最適化(SFO)を用いた関連性と多様性のためのキーワードランク付けの最適化
- Authors: Muhammad Umair, Syed Jalaluddin Hashmi, Young-Koo Lee,
- Abstract要約: キーワードランキングは情報検索と要約において重要な役割を果たす。
伝統的な手法は、しばしば多様性を見落とし、結果として冗長なキーフレーズをもたらす。
キーフレーズランキングにおける妥当性と多様性のバランスをとるために,サブモジュール関数最適化(SFO)を用いた新しい手法を提案する。
- 参考スコア(独自算出の注目度): 2.7869482272876622
- License:
- Abstract: Keyphrase ranking plays a crucial role in information retrieval and summarization by indexing and retrieving relevant information efficiently. Advances in natural language processing, especially large language models (LLMs), have improved keyphrase extraction and ranking. However, traditional methods often overlook diversity, resulting in redundant keyphrases. We propose a novel approach using Submodular Function Optimization (SFO) to balance relevance and diversity in keyphrase ranking. By framing the task as submodular maximization, our method selects diverse and representative keyphrases. Experiments on benchmark datasets show that our approach outperforms existing methods in both relevance and diversity metrics, achieving SOTA performance in execution time. Our code is available online.
- Abstract(参考訳): キーワードランキングは、関連情報のインデックス化と検索を効率的に行うことで、情報検索と要約において重要な役割を担っている。
自然言語処理の進歩、特に大きな言語モデル(LLM)は、キーフレーズの抽出とランキングを改善した。
しかし、伝統的な手法は、しばしば多様性を見落とし、結果として冗長なキーフレーズをもたらす。
キーフレーズランキングにおける妥当性と多様性のバランスをとるために,サブモジュール関数最適化(SFO)を用いた新しい手法を提案する。
タスクを部分モジュラー最大化(submodular maximization)としてフレーミングすることで,多様かつ代表的なキーフレーズを選択する。
ベンチマークデータセットの実験から,本手法は妥当性と多様性の両指標において既存手法よりも優れており,実行時のSOTA性能が向上していることが示された。
私たちのコードはオンラインで利用可能です。
関連論文リスト
- Large Language Models Prompting With Episodic Memory [53.8690170372303]
本稿では,POEM(PrOmpting with Episodic Memory)を提案する。
テストフェーズでは、各テストクエリのサンプルのシーケンスを最適化し、エピソードメモリにおけるトップkで最も類似したトレーニング例から最も高い合計報酬を得るシーケンスを選択する。
その結果,POEMはテキスト分類タスクにおいてTEMPERAやRLPromptといった最近の技術よりも5.3%向上していることがわかった。
論文 参考訳(メタデータ) (2024-08-14T11:19:28Z) - MetaKP: On-Demand Keyphrase Generation [52.48698290354449]
オンデマンドのキーフレーズ生成は,特定のハイレベルな目標や意図に従うキーフレーズを必要とする新しいパラダイムである。
そこで我々は,4つのデータセット,7500のドキュメント,3760の目標からなる大規模ベンチマークであるMetaKPを紹介した。
ソーシャルメディアからの流行事象検出に応用して,一般のNLP基盤として機能する可能性を示す。
論文 参考訳(メタデータ) (2024-06-28T19:02:59Z) - Multi-Modal Retrieval For Large Language Model Based Speech Recognition [15.494654232953678]
我々は,kNN-LMとクロスアテンション手法の2つのアプローチによるマルチモーダル検索を提案する。
音声に基づくマルチモーダル検索はテキストベースの検索よりも優れていることを示す。
我々は,Spoken-Squad質問応答データセットを用いて,最先端の認識結果を得る。
論文 参考訳(メタデータ) (2024-06-13T22:55:22Z) - Leveraging Translation For Optimal Recall: Tailoring LLM Personalization
With User Profiles [0.0]
本稿では,言語間情報検索システムにおけるリコール改善のための新しい手法について検討する。
提案手法は,マルチレベル翻訳,セマンティック埋め込みに基づく拡張,ユーザプロファイル中心の拡張を組み合わせた手法である。
ニュースとTwitterデータセットの実験では、ベースラインBM25ランキングよりも優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-21T03:25:14Z) - Open-vocabulary Keyword-spotting with Adaptive Instance Normalization [18.250276540068047]
本稿では,キーワード条件付き正規化パラメータを出力するためにテキストエンコーダを訓練するキーワードスポッティングの新しい手法であるAdaKWSを提案する。
近年のキーワードスポッティングやASRベースラインよりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-09-13T13:49:42Z) - EntropyRank: Unsupervised Keyphrase Extraction via Side-Information
Optimization for Language Model-based Text Compression [62.261476176242724]
本稿では,事前学習言語モデル(LM)とシャノンの情報に基づいて,テキストからキーワードやキーワードを抽出する教師なし手法を提案する。
具体的には,LMの条件エントロピーが最も高い句を抽出する。
論文 参考訳(メタデータ) (2023-08-25T14:23:40Z) - Pre-trained Language Models for Keyphrase Generation: A Thorough
Empirical Study [76.52997424694767]
事前学習言語モデルを用いて,キーフレーズ抽出とキーフレーズ生成の詳細な実験を行った。
PLMは、競争力のある高リソース性能と最先端の低リソース性能を持つことを示す。
さらに,領域内のBERTライクなPLMを用いて,強大かつデータ効率のよいキーフレーズ生成モデルを構築できることが示唆された。
論文 参考訳(メタデータ) (2022-12-20T13:20:21Z) - Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:48:04Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Keyphrase Extraction with Span-based Feature Representations [13.790461555410747]
キーフレーズは、文書を特徴付ける意味メタデータを提供することができる。
キーフレーズ抽出のための3つのアプローチ: (i) 従来の2段階ランキング法、 (ii) シーケンスラベリング、 (iii) ニューラルネットワークを用いた生成。
本稿では,すべてのコンテンツトークンから直接,キーフレーズのスパン的特徴表現を抽出する新規スパンキーフレーズ抽出モデルを提案する。
論文 参考訳(メタデータ) (2020-02-13T09:48:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。