論文の概要: Multi-Dimensional Optimization for Text Summarization via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2406.00303v1
- Date: Sat, 1 Jun 2024 05:15:12 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 07:44:24.586845
- Title: Multi-Dimensional Optimization for Text Summarization via Reinforcement Learning
- Title(参考訳): 強化学習によるテキスト要約の多次元最適化
- Authors: Sangwon Ryu, Heejin Do, Yunsu Kim, Gary Geunbae Lee, Jungseul Ok,
- Abstract要約: 本研究では,4次元にまたがるバランスの取れた要約を生成するために,多目的強化学習を提案する。
従来のROUGEベースの報酬が参照サマリーに依存しているのとは違って、QAベースの報酬モデルが人間の好みに合わせている。
提案手法は, 代表的な要約データセットのベースラインモデルと比較して, かなりの性能向上を達成した。
- 参考スコア(独自算出の注目度): 12.083649916114402
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The evaluation of summary quality encompasses diverse dimensions such as consistency, coherence, relevance, and fluency. However, existing summarization methods often target a specific dimension, facing challenges in generating well-balanced summaries across multiple dimensions. In this paper, we propose multi-objective reinforcement learning tailored to generate balanced summaries across all four dimensions. We introduce two multi-dimensional optimization (MDO) strategies for adaptive learning: 1) MDO_min, rewarding the current lowest dimension score, and 2) MDO_pro, optimizing multiple dimensions similar to multi-task learning, resolves conflicting gradients across dimensions through gradient projection. Unlike prior ROUGE-based rewards relying on reference summaries, we use a QA-based reward model that aligns with human preferences. Further, we discover the capability to regulate the length of summaries by adjusting the discount factor, seeking the generation of concise yet informative summaries that encapsulate crucial points. Our approach achieved substantial performance gains compared to baseline models on representative summarization datasets, particularly in the overlooked dimensions.
- Abstract(参考訳): 要約品質の評価は、一貫性、コヒーレンス、妥当性、流布度などの様々な次元を含む。
しかし、既存の要約手法はしばしば特定の次元をターゲットにしており、複数の次元にわたってバランスのとれた要約を生成する際の課題に直面している。
本稿では,4次元すべてにまたがるバランスの取れた要約を生成するために,多目的強化学習を提案する。
適応学習のための2つの多次元最適化(MDO)戦略を導入する。
1)MDO_min、現在の最低寸法スコア、及び
2) MDO_proはマルチタスク学習に類似した複数の次元を最適化し、勾配投影により次元間の対立する勾配を解消する。
従来のROUGEベースの報酬が参照サマリーに依存しているのとは違って、QAベースの報酬モデルが人間の好みに合わせている。
さらに,重要な点をカプセル化した簡潔かつ情報に富んだ要約を生成するために,割引係数を調整して要約の長さを調節する能力を見出した。
提案手法は,特に見過ごされた次元において,代表的な要約データセットのベースラインモデルと比較して,かなりの性能向上を達成した。
関連論文リスト
- MODABS: Multi-Objective Learning for Dynamic Aspect-Based Summarization [29.111115148808196]
本稿では,Longformer-Encoder-Decoderを用いた新しい多目的学習フレームワークを提案する。
提案手法は3つの多様なデータセットのベースラインを著しく上回ることを示す。
論文 参考訳(メタデータ) (2024-06-05T17:32:28Z) - Sample Complexity Characterization for Linear Contextual MDPs [67.79455646673762]
文脈決定プロセス(CMDP)は、遷移カーネルと報酬関数がコンテキスト変数によってインデックス付けされた異なるMDPで時間とともに変化できる強化学習のクラスを記述する。
CMDPは、時間とともに変化する環境で多くの現実世界のアプリケーションをモデル化するための重要なフレームワークとして機能する。
CMDPを2つの線形関数近似モデルで検討する: 文脈変化表現とすべての文脈に対する共通線形重み付きモデルIと、すべての文脈に対する共通表現と文脈変化線形重み付きモデルIIである。
論文 参考訳(メタデータ) (2024-02-05T03:25:04Z) - Multiform Evolution for High-Dimensional Problems with Low Effective
Dimensionality [36.44425198302701]
進化的アルゴリズムを高次元最適化問題に拡張する。
全ての定式化を単一のマルチタスク設定に統一するマルチフォーム進化アルゴリズムを開発した。
その結果、目的タスクは様々な低次元探索で進化した解を効率的に再利用することができる。
論文 参考訳(メタデータ) (2023-12-30T08:13:47Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and
Multi-view Geometric Consistency Perception [60.23832277827669]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元する傾向がある。
水平深度と比表現に適した教師なし適応手法を提案する。
また,決定レベルのレイアウト解析のための最適化手法と,特徴レベルのマルチビューアグリゲーションのための1次元コストボリューム構築手法も導入する。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - Online Multi-Task Learning with Recursive Least Squares and Recursive Kernel Methods [50.67996219968513]
本稿では,オンラインマルチタスク学習(MTL)回帰問題に対する2つの新しいアプローチを紹介する。
入力空間の次元の2次パースタンスコストで精度よく近似的な再帰を実現する。
我々は,実世界の風速予測ケーススタディにおいて,オンラインMTL法と他の競技者との比較を行った。
論文 参考訳(メタデータ) (2023-08-03T01:41:34Z) - A Unified Model and Dimension for Interactive Estimation [20.39351301232109]
モデルにおける学習可能性を大きく捉えた異種性次元(dissimilarity dimension)という尺度を導入する。
このフレームワークは,統計的クエリ学習と構造化帯域幅の2つの古典的学習モデルを仮定し,統一することを示す。
論文 参考訳(メタデータ) (2023-06-09T18:21:04Z) - Semantics-Depth-Symbiosis: Deeply Coupled Semi-Supervised Learning of
Semantics and Depth [83.94528876742096]
我々は,意味的セグメンテーションと深さ推定という2つの密なタスクのMTL問題に取り組み,クロスチャネル注意モジュール(CCAM)と呼ばれる新しいアテンションモジュールを提案する。
次に,AffineMixと呼ばれる予測深度を用いた意味分節タスクのための新しいデータ拡張と,ColorAugと呼ばれる予測セマンティクスを用いた単純な深度増分を定式化する。
最後に,提案手法の性能向上をCityscapesデータセットで検証し,深度と意味に基づく半教師付きジョイントモデルにおける最先端結果の実現を支援する。
論文 参考訳(メタデータ) (2022-06-21T17:40:55Z) - PoBRL: Optimizing Multi-Document Summarization by Blending Reinforcement
Learning Policies [68.8204255655161]
マルチドキュメントの要約を解くための強化学習ベースのフレームワーク PoBRL を提案する。
私たちの戦略は、この多対象最適化を、強化学習によって個別に解決できるさまざまなサブ問題に分離します。
実験結果から,複数のマルチドキュメントデータセットにおける最先端の性能を示す。
論文 参考訳(メタデータ) (2021-05-18T02:55:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。