論文の概要: Considering Length Diversity in Retrieval-Augmented Summarization
- arxiv url: http://arxiv.org/abs/2503.09249v1
- Date: Wed, 12 Mar 2025 10:43:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-13 15:40:28.119384
- Title: Considering Length Diversity in Retrieval-Augmented Summarization
- Title(参考訳): 検索強化要約における長さ多様性の検討
- Authors: Juseon-Do, Jaesung Hwang, Jingun Kwon, Hidetaka Kamigaito, Manabu Okumura,
- Abstract要約: 本稿では,要約長をよりよく制御するためのDL-MMR (Diverse Longth-aware Maxginal Relevance) アルゴリズムを提案する。
このアルゴリズムは、検索強化要約において、クエリ関連性と多様なターゲット長を組み合わせる。
実験の結果,従来のMMRアルゴリズムと比較して,長さの多様性を考慮したDL-MMRの有効性が示された。
- 参考スコア(独自算出の注目度): 25.621433363454983
- License:
- Abstract: This study investigates retrieval-augmented summarization by specifically examining the impact of exemplar summary lengths under length constraints, not covered by previous work. We propose a Diverse Length-aware Maximal Marginal Relevance (DL-MMR) algorithm to better control summary lengths. This algorithm combines the query relevance with diverse target lengths in retrieval-augmented summarization. Unlike previous methods that necessitate exhaustive exemplar exemplar relevance comparisons using MMR, DL-MMR considers the exemplar target length as well and avoids comparing exemplars to each other, thereby reducing computational cost and conserving memory during the construction of an exemplar pool. Experimental results showed the effectiveness of DL-MMR, which considers length diversity, compared to the original MMR algorithm. DL-MMR additionally showed the effectiveness in memory saving of 781,513 times and computational cost reduction of 500,092 times, while maintaining the same level of informativeness.
- Abstract(参考訳): 本研究は, 従来の研究対象ではなく, 長さ制約下での模範的な要約長の影響を具体的に調べることにより, 検索強化要約について検討する。
本稿では,要約長をよりよく制御するためのDL-MMR (Diverse Longth-aware Maxginal Relevance) アルゴリズムを提案する。
このアルゴリズムは、検索強化要約において、クエリの関連性と多様なターゲット長を結合する。
DL-MMRは,MMRを用いた排他的外見的関連性比較を必要とする従来の手法とは異なり,模見的対象長も考慮し,互いに比較しないため,模見的プール構築時の計算コストとメモリ保存を低減できる。
実験の結果,従来のMMRアルゴリズムと比較して,長さの多様性を考慮したDL-MMRの有効性が示された。
DL-MMRは,500,092倍のメモリ節約,500,092倍の計算コスト削減効果を示した。
関連論文リスト
- OneBatchPAM: A Fast and Frugal K-Medoids Algorithm [6.69456225406097]
本稿では,大規模データセットを適切な計算時間とメモリの複雑さで処理する新しいk-medoids近似アルゴリズムを提案する。
単一のサイズ m n のバッチは、ほとんどの k-メディドのベースラインと比較して、O(n2) ではなく、必要なメモリサイズとペアの異なる計算数を O(mn) に減少させる。
我々は,m = O(log(n)) のバッチが強い確率で元の局所探索アルゴリズムと同じ性能を保証するのに十分であることを示す理論的結果を得る。
論文 参考訳(メタデータ) (2025-01-31T16:48:16Z) - Efficient Long Context Language Model Retrieval with Compression [57.09163579304332]
情報検索のための新しいパラダイムとしてLong Context Language Models (LCLM)が登場した。
本稿では,LCLM検索に適した新しい圧縮手法を提案する。
また,CoLoRはテキスト内サイズを1.91倍に圧縮し,検索性能を6%向上することを示した。
論文 参考訳(メタデータ) (2024-12-24T07:30:55Z) - Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T11:47:56Z) - Better RAG using Relevant Information Gain [1.5604249682593647]
大きな言語モデル(LLM)のメモリを拡張する一般的な方法は、検索拡張生成(RAG)である。
本稿では,検索結果の集合に対するクエリに関連する総情報の確率的尺度である,関連情報ゲインに基づく新しい単純な最適化指標を提案する。
RAGシステムの検索コンポーネントのドロップイン置換として使用すると、質問応答タスクにおける最先端のパフォーマンスが得られる。
論文 参考訳(メタデータ) (2024-07-16T18:09:21Z) - SparseCL: Sparse Contrastive Learning for Contradiction Retrieval [87.02936971689817]
コントラディション検索(Contradiction Search)とは、クエリの内容に明示的に異を唱える文書を識別し、抽出することである。
類似性探索やクロスエンコーダモデルといった既存の手法には、大きな制限がある。
文間の微妙で矛盾したニュアンスを保存するために特別に訓練された文埋め込みを利用するSparseCLを導入する。
論文 参考訳(メタデータ) (2024-06-15T21:57:03Z) - Enhancing Transformer RNNs with Multiple Temporal Perspectives [18.884124657093405]
本稿では、リカレントニューラルネットワーク(RNN)アーキテクチャに適用可能な新しいアプローチである、複数時間視点の概念を紹介する。
この方法は、以前遭遇したテキストの多様な時間的ビューを維持することを含み、コンテキストを解釈する言語モデルの能力を大幅に強化する。
論文 参考訳(メタデータ) (2024-02-04T22:12:29Z) - An Efficient Algorithm for Clustered Multi-Task Compressive Sensing [60.70532293880842]
クラスタ化マルチタスク圧縮センシングは、複数の圧縮センシングタスクを解決する階層モデルである。
このモデルに対する既存の推論アルゴリズムは計算コストが高く、高次元ではうまくスケールしない。
本稿では,これらの共分散行列を明示的に計算する必要をなくし,モデル推論を大幅に高速化するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-30T15:57:14Z) - Algorithme EM r\'egularis\'e [0.0]
本稿では,より少ないサンプルサイズに対応するために,事前知識を効率的に活用するEMアルゴリズムの正規化バージョンを提案する。
実データを用いた実験では,クラスタリングのための提案アルゴリズムの性能が向上した。
論文 参考訳(メタデータ) (2023-07-04T23:19:25Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - A Robust Functional EM Algorithm for Incomplete Panel Count Data [66.07942227228014]
完全無作為な仮定(MCAR)の下での数え上げ過程の平均関数を推定する機能的EMアルゴリズムを提案する。
提案アルゴリズムは、いくつかの一般的なパネル数推定手法をラップし、不完全数にシームレスに対処し、ポアソン過程の仮定の誤特定に頑健である。
本稿では, 数値実験による提案アルゴリズムの有用性と喫煙停止データの解析について述べる。
論文 参考訳(メタデータ) (2020-03-02T20:04:38Z) - A Deep Learning Algorithm for High-Dimensional Exploratory Item Factor
Analysis [0.0]
探索項目因子分析(IFA)のための深層学習に基づくVIアルゴリズムについて検討する。
提案手法は、探索型IFAのための重要重み付きオートエンコーダ(IWAE)と呼ばれる深層人工ニューラルネットワークモデルを適用する。
IWAEは標本サイズやIWサンプル数の増加に伴って,より正確な推定値が得られることを示す。
論文 参考訳(メタデータ) (2020-01-22T03:02:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。