論文の概要: Leveraging Key Information Modeling to Improve Less-Data Constrained
News Headline Generation via Duality Fine-Tuning
- arxiv url: http://arxiv.org/abs/2210.04473v1
- Date: Mon, 10 Oct 2022 07:59:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 16:54:59.747325
- Title: Leveraging Key Information Modeling to Improve Less-Data Constrained
News Headline Generation via Duality Fine-Tuning
- Title(参考訳): キー情報モデリングによる2重性微調整による低データ制約ニュースヘッドライン生成の改善
- Authors: Zhuoxuan Jiang, Lingfeng Qiao, Di Yin, Shanshan Feng and Bo Ren
- Abstract要約: 本稿では,鍵情報予測と見出し生成タスクの確率的双対性制約を定式化することにより,新しい双対性微調整法を提案する。
提案手法は、限られたデータからより多くの情報をキャプチャし、別々のタスク間の接続を構築することができ、データ制約の少ない生成タスクに適している。
提案手法は,2つの公開データセット上で,言語モデリングの指標と情報量補正の指標を用いて,性能向上に有効かつ効果的であることを示すため,広範囲な実験を行った。
- 参考スコア(独自算出の注目度): 12.443476695459553
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent language generative models are mostly trained on large-scale datasets,
while in some real scenarios, the training datasets are often expensive to
obtain and would be small-scale. In this paper we investigate the challenging
task of less-data constrained generation, especially when the generated news
headlines are short yet expected by readers to keep readable and informative
simultaneously. We highlight the key information modeling task and propose a
novel duality fine-tuning method by formally defining the probabilistic duality
constraints between key information prediction and headline generation tasks.
The proposed method can capture more information from limited data, build
connections between separate tasks, and is suitable for less-data constrained
generation tasks. Furthermore, the method can leverage various pre-trained
generative regimes, e.g., autoregressive and encoder-decoder models. We conduct
extensive experiments to demonstrate that our method is effective and efficient
to achieve improved performance in terms of language modeling metric and
informativeness correctness metric on two public datasets.
- Abstract(参考訳): 最近の言語生成モデルは、主に大規模データセットでトレーニングされるが、実際のシナリオでは、トレーニングデータセットは、取得するコストが高く、小規模であることが多い。
本稿では,データ制約の少ない生成の課題について検討する。特に,生成したニュースの見出しが短く,読者が同時に読みやすく,情報的であることを期待している場合。
キー情報モデリングタスクを強調し、キー情報予測と見出し生成タスクの確率的双対性制約を正式に定義し、新しい双対性微調整手法を提案する。
提案手法は、限られたデータからより多くの情報をキャプチャし、別々のタスク間の接続を構築し、データ制約の少ない生成タスクに適している。
さらに、この方法は、例えば自己回帰モデルやエンコーダデコーダモデルなど、事前訓練された様々な生成規則を利用することができる。
提案手法は,2つの公開データセット上で,言語モデリングの指標と情報量補正の指標を用いて,性能向上に有効かつ効果的であることを示す。
関連論文リスト
- Multi-Stage Knowledge Integration of Vision-Language Models for Continual Learning [79.46570165281084]
蒸留法における人間の学習過程をエミュレートするマルチステージ知識統合ネットワーク(MulKI)を提案する。
Mulkiは、イデオロギーの排除、新しいイデオロギーの追加、イデオロギーの排除、コネクティクスの作りという4つの段階を通じてこれを達成している。
提案手法は,下流タスク間の連続学習をサポートしながら,ゼロショット能力の維持における大幅な改善を示す。
論文 参考訳(メタデータ) (2024-11-11T07:36:19Z) - TrACT: A Training Dynamics Aware Contrastive Learning Framework for Long-tail Trajectory Prediction [7.3292387742640415]
本稿では,よりリッチなトレーニングダイナミックス情報を,原型的コントラスト学習フレームワークに組み込むことを提案する。
我々は,2つの大規模自然主義データセットを用いたアプローチの実証評価を行った。
論文 参考訳(メタデータ) (2024-04-18T23:12:46Z) - Text2Data: Low-Resource Data Generation with Textual Control [104.38011760992637]
自然言語は、人間が機械とシームレスに対話するための共通かつ直接的な制御信号として機能する。
ラベルのないデータを用いて教師なし拡散モデルを用いて基礎となるデータ分布を理解する新しいアプローチであるText2Dataを提案する。
制御性を確保し、破滅的な忘れを効果的に防止する、新しい制約最適化ベースの学習目標を通じて制御可能な微調整を行う。
論文 参考訳(メタデータ) (2024-02-08T03:41:39Z) - Generative Deduplication For Socia Media Data Selection [4.545354973721937]
本稿では,ソーシャルメディアデータ選択のための新しい生成重複フレームワークを提案する。
我々のモデルはソーシャルメディアのNLPパイプラインを普遍的に拡張するための効率的な前処理手法として機能する。
論文 参考訳(メタデータ) (2024-01-11T12:43:26Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - Diffusion Model is an Effective Planner and Data Synthesizer for
Multi-Task Reinforcement Learning [101.66860222415512]
Multi-Task Diffusion Model (textscMTDiff) は、トランスフォーマーのバックボーンを組み込んだ拡散に基づく手法であり、生成計画とデータ合成のための素早い学習を行う。
生成計画において、textscMTDiffはMeta-World上の50のタスクとMaze2D上の8のマップで最先端のアルゴリズムより優れています。
論文 参考訳(メタデータ) (2023-05-29T05:20:38Z) - Curriculum-Based Self-Training Makes Better Few-Shot Learners for
Data-to-Text Generation [56.98033565736974]
テキスト生成の困難さによって決定される並べ替え順序でラベルのないデータを活用するために,カリキュラムベースの自己学習(CBST)を提案する。
提案手法は、微調整およびタスク適応型事前学習法より優れており、データ・テキスト・ジェネレーションのわずかな設定で最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2022-06-06T16:11:58Z) - Self-augmented Data Selection for Few-shot Dialogue Generation [18.794770678708637]
我々は,MR-to-Text生成問題に対処するために,自己学習フレームワークを採用する。
我々は,我々の生成モデルが最も不確実なデータを選択するための新しいデータ選択戦略を提案する。
論文 参考訳(メタデータ) (2022-05-19T16:25:50Z) - Integrating Semantics and Neighborhood Information with Graph-Driven
Generative Models for Document Retrieval [51.823187647843945]
本稿では,周辺情報をグラフ誘導ガウス分布でエンコードし,その2種類の情報をグラフ駆動生成モデルと統合することを提案する。
この近似の下では、トレーニング対象がシングルトンまたはペアワイズ文書のみを含む用語に分解可能であることを証明し、モデルが非関連文書と同じくらい効率的にトレーニングできることを示す。
論文 参考訳(メタデータ) (2021-05-27T11:29:03Z) - Iterative Data Programming for Expanding Text Classification Corpora [9.152045698511506]
実世界のテキスト分類タスクは、しばしば、取得するのに高価なラベル付きトレーニング例を必要とする。
機械教育の最近の進歩、特にデータプログラミングパラダイムは、トレーニングデータセットの迅速な作成を促進する。
近所の弱いモデルを生成することによってテキストデータセットを拡大するための,高速でシンプルなデータプログラミング手法を提案する。
論文 参考訳(メタデータ) (2020-02-04T17:12:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。