論文の概要: How to Train Text Summarization Model with Weak Supervisions
- arxiv url: http://arxiv.org/abs/2409.00098v1
- Date: Tue, 27 Aug 2024 02:35:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-08 15:11:32.910747
- Title: How to Train Text Summarization Model with Weak Supervisions
- Title(参考訳): 弱スーパービジョンを用いたテキスト要約モデルの訓練方法
- Authors: Yanbo Wang, Wenyu Chen, Shimin Shan,
- Abstract要約: 本稿では,複雑な目的を単純なタスクに分解し,各タスクの監視信号を生成する手法を提案する。
そして、これらの監視信号を管理可能な形式に統合し、簡単に学習することができる。
実験結果から,本手法はCNNとDailyMailのデータセットで極めて良好に動作することがわかった。
- 参考スコア(独自算出の注目度): 10.298535045401543
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Currently, machine learning techniques have seen significant success across various applications. Most of these techniques rely on supervision from human-generated labels or a mixture of noisy and imprecise labels from multiple sources. However, for certain complex tasks, even noisy or inexact labels are unavailable due to the intricacy of the objectives. To tackle this issue, we propose a method that breaks down the complex objective into simpler tasks and generates supervision signals for each one. We then integrate these supervision signals into a manageable form, resulting in a straightforward learning procedure. As a case study, we demonstrate a system used for topic-based summarization. This system leverages rich supervision signals to promote both summarization and topic relevance. Remarkably, we can train the model end-to-end without any labels. Experimental results indicate that our approach performs exceptionally well on the CNN and DailyMail datasets.
- Abstract(参考訳): 現在、機械学習技術は様々なアプリケーションで大きな成功を収めている。
これらの技術のほとんどは、人為的なラベルや、複数のソースからのノイズや不正確なラベルの混在の監視に依存している。
しかし、特定の複雑なタスクでは、目的の複雑さのためにノイズや不正確なラベルも利用できない。
この問題に対処するため,複雑な目的を単純なタスクに分割し,各タスクの監視信号を生成する手法を提案する。
そして、これらの監視信号を管理可能な形式に統合し、簡単に学習することができる。
ケーススタディでは、トピックベースの要約に使用されるシステムを実演する。
このシステムは、豊富な監視信号を利用して、要約とトピック関連性の両方を促進する。
注目すべきは、ラベルなしでモデルをエンドツーエンドにトレーニングできることです。
実験結果から,本手法はCNNとDailyMailのデータセットで極めて良好に動作することがわかった。
関連論文リスト
- Reinforced Labels: Multi-Agent Deep Reinforcement Learning for
Point-Feature Label Placement [0.0]
データビジュアライゼーションにおける複雑なタスクである配置のラベル付けにReinforcement Learning(RL)を導入する。
提案手法は,多エージェント深層強化学習を用いてラベル配置戦略を学習する。
提案手法により訓練された戦略は,未学習エージェントのランダムな戦略よりも有意に優れていた。
論文 参考訳(メタデータ) (2023-03-02T16:18:00Z) - Label-Efficient Interactive Time-Series Anomaly Detection [17.799924009674694]
ラベル効率の良い対話型時系列異常検出システム(LEIAD)を提案する。
この目標を達成するために、システムは弱い監督と活発な学習を協調的に統合する。
本稿では,3つの時系列異常検出データセットについて実験を行い,提案手法が既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-12-30T10:16:15Z) - An Embarrassingly Simple Approach to Semi-Supervised Few-Shot Learning [58.59343434538218]
間接学習の観点から、ラベルなしデータの正負の擬似ラベルを正確に予測するための、単純だが非常に効果的な手法を提案する。
私たちのアプローチは、オフザシェルフ操作のみを使用することで、ほんの数行のコードで実装できます。
論文 参考訳(メタデータ) (2022-09-28T02:11:34Z) - A Weakly Supervised Learning Framework for Salient Object Detection via
Hybrid Labels [96.56299163691979]
本稿では,ハイブリッドラベル下でのSODタスクに焦点をあてる。
このタスクにおけるラベルノイズと量不均衡の問題に対処するため、我々は3つの洗練されたトレーニング戦略を持つ新しいパイプラインフレームワークを設計する。
5つのSODベンチマーク実験により,本手法は弱教師付き/非教師付き手法と競合する性能を示した。
論文 参考訳(メタデータ) (2022-09-07T06:45:39Z) - New Intent Discovery with Pre-training and Contrastive Learning [21.25371293641141]
新しい意図発見は、ユーザ発話から新しい意図カテゴリーを明らかにして、サポート対象クラスのセットを拡張することを目的としている。
既存のアプローチは通常、大量のラベル付き発話に依存する。
本稿では,クラスタリングのためのラベルなしデータにおける自己超越的信号を活用するために,新たなコントラスト損失を提案する。
論文 参考訳(メタデータ) (2022-05-25T17:07:25Z) - Data Consistency for Weakly Supervised Learning [15.365232702938677]
機械学習モデルのトレーニングには、大量の人間が注釈付けしたデータを使用する。
本稿では、雑音ラベル、すなわち弱い信号を処理する新しい弱監督アルゴリズムを提案する。
本研究では,テキストと画像の分類作業において,最先端の弱い監督手法を著しく上回っていることを示す。
論文 参考訳(メタデータ) (2022-02-08T16:48:19Z) - Visual Transformer for Task-aware Active Learning [49.903358393660724]
プールベースのアクティブラーニングのための新しいパイプラインを提案する。
提案手法は,学習中に使用可能なアンラベリング例を利用して,ラベル付き例との相関関係を推定する。
ビジュアルトランスフォーマーは、ラベル付き例と非ラベル付き例の間の非ローカルビジュアル概念依存性をモデル化する。
論文 参考訳(メタデータ) (2021-06-07T17:13:59Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Constrained Labeling for Weakly Supervised Learning [15.365232702938677]
本稿では、弱い監視信号を組み合わせるための単純なデータフリーアプローチを提案する。
我々の手法は効率よく安定しており、数回の降下を繰り返して収束する。
本手法は,様々なテキスト・画像分類タスクにおいて,他の弱い監督手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-15T21:30:53Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。