Fugu-MT 論文翻訳(概要): Optimizing Keyphrase Ranking for Relevance and Diversity Using Submodular Function Optimization (SFO)

論文の概要: Optimizing Keyphrase Ranking for Relevance and Diversity Using Submodular Function Optimization (SFO)

arxiv url: http://arxiv.org/abs/2410.20080v1
Date: Sat, 26 Oct 2024 05:14:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:40.765882
Title: Optimizing Keyphrase Ranking for Relevance and Diversity Using Submodular Function Optimization (SFO)
Title（参考訳）: 部分モジュラ関数最適化(SFO)を用いた関連性と多様性のためのキーワードランク付けの最適化
Authors: Muhammad Umair, Syed Jalaluddin Hashmi, Young-Koo Lee,
Abstract要約: キーワードランキングは情報検索と要約において重要な役割を果たす。伝統的な手法は、しばしば多様性を見落とし、結果として冗長なキーフレーズをもたらす。キーフレーズランキングにおける妥当性と多様性のバランスをとるために,サブモジュール関数最適化(SFO)を用いた新しい手法を提案する。
参考スコア（独自算出の注目度）: 2.7869482272876622
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Keyphrase ranking plays a crucial role in information retrieval and summarization by indexing and retrieving relevant information efficiently. Advances in natural language processing, especially large language models (LLMs), have improved keyphrase extraction and ranking. However, traditional methods often overlook diversity, resulting in redundant keyphrases. We propose a novel approach using Submodular Function Optimization (SFO) to balance relevance and diversity in keyphrase ranking. By framing the task as submodular maximization, our method selects diverse and representative keyphrases. Experiments on benchmark datasets show that our approach outperforms existing methods in both relevance and diversity metrics, achieving SOTA performance in execution time. Our code is available online.
Abstract（参考訳）: キーワードランキングは、関連情報のインデックス化と検索を効率的に行うことで、情報検索と要約において重要な役割を担っている。自然言語処理の進歩、特に大きな言語モデル(LLM)は、キーフレーズの抽出とランキングを改善した。しかし、伝統的な手法は、しばしば多様性を見落とし、結果として冗長なキーフレーズをもたらす。キーフレーズランキングにおける妥当性と多様性のバランスをとるために,サブモジュール関数最適化(SFO)を用いた新しい手法を提案する。タスクを部分モジュラー最大化(submodular maximization)としてフレーミングすることで,多様かつ代表的なキーフレーズを選択する。ベンチマークデータセットの実験から,本手法は妥当性と多様性の両指標において既存手法よりも優れており,実行時のSOTA性能が向上していることが示された。私たちのコードはオンラインで利用可能です。

関連論文リスト

Importance Sampling for Multi-Negative Multimodal Direct Preference Optimization [68.64764778089229]
MISP-DPOはマルチモーダルDPOに複数の意味的に多様な負の画像を組み込む最初のフレームワークである。提案手法は,CLIP空間にプロンプトと候補画像を埋め込んで,意味的偏差を解釈可能な因子に発見するためにスパースオートエンコーダを適用する。 5つのベンチマーク実験により、MISP-DPOは従来手法よりも常にマルチモーダルアライメントを改善することが示された。
論文参考訳（メタデータ） (2025-09-30T03:24:09Z)
Post-training Large Language Models for Diverse High-Quality Responses [32.92680825196664]
強化学習 (Reinforcement Learning, RL) は,大規模言語モデル (LLM) の訓練後に一般的な手法として登場した。決定点プロセス(DPP)に基づくDQO(Diversity Quality Optimization)という新しいトレーニング手法を提案する。提案手法では,各プロンプトに対して応答群をサンプリングし,次にカーネルベースの類似度行列の行列式を用いて,これらの応答の埋め込みによって分散される体積として多様性を測定する。
論文参考訳（メタデータ） (2025-09-05T03:47:06Z)
Unleashing the Potential of Multi-Channel Fusion in Retrieval for Personalized Recommendations [33.79863762538225]
Recommender System(RS)の重要な課題は、大量のアイテムプールを効率的に処理して、厳格なレイテンシ制約の下で高度にパーソナライズされたレコメンデーションを提供することだ。本稿では,各チャネルに最適化された重みを割り当てることで,先進的なチャネル融合戦略を検討する。当社の手法はパーソナライズと柔軟性を両立させ,複数のデータセット間で大幅なパフォーマンス向上を実現し,現実のデプロイメントにおいて大きな成果を上げている。
論文参考訳（メタデータ） (2024-10-21T14:58:38Z)
Large Language Models Prompting With Episodic Memory [53.8690170372303]
本稿では,POEM(PrOmpting with Episodic Memory)を提案する。テストフェーズでは、各テストクエリのサンプルのシーケンスを最適化し、エピソードメモリにおけるトップkで最も類似したトレーニング例から最も高い合計報酬を得るシーケンスを選択する。その結果,POEMはテキスト分類タスクにおいてTEMPERAやRLPromptといった最近の技術よりも5.3%向上していることがわかった。
論文参考訳（メタデータ） (2024-08-14T11:19:28Z)
MetaKP: On-Demand Keyphrase Generation [52.48698290354449]
オンデマンドのキーフレーズ生成は,特定のハイレベルな目標や意図に従うキーフレーズを必要とする新しいパラダイムである。そこで我々は,4つのデータセット,7500のドキュメント,3760の目標からなる大規模ベンチマークであるMetaKPを紹介した。ソーシャルメディアからの流行事象検出に応用して,一般のNLP基盤として機能する可能性を示す。
論文参考訳（メタデータ） (2024-06-28T19:02:59Z)
Multi-Modal Retrieval For Large Language Model Based Speech Recognition [15.494654232953678]
我々は,kNN-LMとクロスアテンション手法の2つのアプローチによるマルチモーダル検索を提案する。音声に基づくマルチモーダル検索はテキストベースの検索よりも優れていることを示す。我々は,Spoken-Squad質問応答データセットを用いて,最先端の認識結果を得る。
論文参考訳（メタデータ） (2024-06-13T22:55:22Z)
Leveraging Translation For Optimal Recall: Tailoring LLM Personalization With User Profiles [0.0]
本稿では,言語間情報検索システムにおけるリコール改善のための新しい手法について検討する。提案手法は,マルチレベル翻訳,セマンティック埋め込みに基づく拡張,ユーザプロファイル中心の拡張を組み合わせた手法である。ニュースとTwitterデータセットの実験では、ベースラインBM25ランキングよりも優れたパフォーマンスを示している。
論文参考訳（メタデータ） (2024-02-21T03:25:14Z)
Open-vocabulary Keyword-spotting with Adaptive Instance Normalization [18.250276540068047]
本稿では,キーワード条件付き正規化パラメータを出力するためにテキストエンコーダを訓練するキーワードスポッティングの新しい手法であるAdaKWSを提案する。近年のキーワードスポッティングやASRベースラインよりも大幅に改善されている。
論文参考訳（メタデータ） (2023-09-13T13:49:42Z)
EntropyRank: Unsupervised Keyphrase Extraction via Side-Information Optimization for Language Model-based Text Compression [62.261476176242724]
本稿では,事前学習言語モデル(LM)とシャノンの情報に基づいて,テキストからキーワードやキーワードを抽出する教師なし手法を提案する。具体的には,LMの条件エントロピーが最も高い句を抽出する。
論文参考訳（メタデータ） (2023-08-25T14:23:40Z)
Pre-trained Language Models for Keyphrase Generation: A Thorough Empirical Study [76.52997424694767]
事前学習言語モデルを用いて,キーフレーズ抽出とキーフレーズ生成の詳細な実験を行った。 PLMは、競争力のある高リソース性能と最先端の低リソース性能を持つことを示す。さらに,領域内のBERTライクなPLMを用いて,強大かつデータ効率のよいキーフレーズ生成モデルを構築できることが示唆された。
論文参考訳（メタデータ） (2022-12-20T13:20:21Z)
Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文参考訳（メタデータ） (2022-03-15T17:48:04Z)
Keyphrase Extraction with Dynamic Graph Convolutional Networks and Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文参考訳（メタデータ） (2020-10-24T08:11:23Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。