論文の概要: Finding Friends and Flipping Frenemies: Automatic Paraphrase Dataset
Augmentation Using Graph Theory
- arxiv url: http://arxiv.org/abs/2011.01856v1
- Date: Tue, 3 Nov 2020 17:18:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 05:02:45.184350
- Title: Finding Friends and Flipping Frenemies: Automatic Paraphrase Dataset
Augmentation Using Graph Theory
- Title(参考訳): 友人の発見とフリップフネミー:グラフ理論を用いた自動パラフレーズデータセット拡張
- Authors: Hannah Chen, Yangfeng Ji, David Evans
- Abstract要約: 提案する文ペアラベルからパラフレーズグラフを構築し,推移性特性を用いて原文ペアから直接ラベルを推測することにより,拡張データセットを作成する。
提案手法は,事前学習されたBERTモデルから始まるこれらのデータセットを用いて学習したパラフレーズモデルを用いて評価し,自動強化されたトレーニングセットによりより正確なモデルが得られることを示す。
- 参考スコア(独自算出の注目度): 21.06607915149245
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most NLP datasets are manually labeled, so suffer from inconsistent labeling
or limited size. We propose methods for automatically improving datasets by
viewing them as graphs with expected semantic properties. We construct a
paraphrase graph from the provided sentence pair labels, and create an
augmented dataset by directly inferring labels from the original sentence pairs
using a transitivity property. We use structural balance theory to identify
likely mislabelings in the graph, and flip their labels. We evaluate our
methods on paraphrase models trained using these datasets starting from a
pretrained BERT model, and find that the automatically-enhanced training sets
result in more accurate models.
- Abstract(参考訳): ほとんどのNLPデータセットは手動でラベル付けされているため、一貫性のないラベル付けや制限されたサイズに悩まされている。
本稿では,データセットを期待される意味特性を持つグラフとして見ることにより,データセットを自動的に改善する手法を提案する。
提案する文ペアラベルからパラフレーズグラフを構築し,推移性特性を用いて原文ペアから直接ラベルを推測することにより,拡張データセットを作成する。
構造的バランス理論を使って、グラフの誤ったラベルを識別し、ラベルをひっくり返します。
本手法は,事前学習されたbertモデルから学習したパラフレーズモデルを用いて評価し,自動学習によりより正確なモデルが得られることを示す。
関連論文リスト
- Bayesian-guided Label Mapping for Visual Reprogramming [20.27639343292564]
1対1のマッピングは、事前訓練されたラベルと下流のラベルの間の複雑な関係を見落としてしまう可能性がある。
この観測により,ベイズ誘導ラベルマッピング法(BLM)を提案する。
事前訓練されたビジョンモデル(ResNeXtなど)とビジョン言語モデル(CLIPなど)の両方で実施された実験は、既存のラベルマッピング手法よりもBLMの優れた性能を示す。
論文 参考訳(メタデータ) (2024-10-31T15:20:43Z) - You can't handle the (dirty) truth: Data-centric insights improve pseudo-labeling [60.27812493442062]
擬似ラベル法を改善するためにラベル付きデータ品質を調査することが重要であることを示す。
具体的には、擬似ラベルの拡張のために、DIPSと呼ばれる新しいデータキャラクタリゼーションと選択フレームワークを導入する。
本研究では,多種多様な実世界のデータセットを対象とした擬似ラベル手法に対するDIPSの適用性と影響を実証する。
論文 参考訳(メタデータ) (2024-06-19T17:58:40Z) - Soft Curriculum for Learning Conditional GANs with Noisy-Labeled and
Uncurated Unlabeled Data [70.25049762295193]
本稿では,トレーニング中にノイズラベル付きおよび未処理データを受け入れる条件付き画像生成フレームワークを提案する。
本稿では,ラベルのないデータに新たなラベルを割り当てながら,逆行訓練にインスタンスワイドを割り当てるソフトカリキュラム学習を提案する。
実験により,本手法は,定量および定性性能の両面において,既存の半教師付き・ラベル付きロバストな手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-07-17T08:31:59Z) - Semi-Supervised Graph Imbalanced Regression [17.733488328772943]
本稿では,学習データを段階的にバランスさせ,自己学習によるモデルバイアスを低減するための半教師付きフレームワークを提案する。
その結果,提案フレームワークは予測されたグラフ特性の誤差を著しく低減することがわかった。
論文 参考訳(メタデータ) (2023-05-20T04:11:00Z) - Label Dependencies-aware Set Prediction Networks for Multi-label Text Classification [0.0]
グラフ畳み込みネットワークを活用し,ラベル間の統計的関係に基づいて隣接行列を構築する。
我々は,Bhattacharyya距離を設定された予測ネットワークの出力分布に適用することにより,リコール能力を向上する。
論文 参考訳(メタデータ) (2023-04-14T09:31:17Z) - Learned Label Aggregation for Weak Supervision [8.819582879892762]
本稿では,ラベル付きデータを容易に生成するために,弱い監視信号を集約するデータプログラミング手法を提案する。
生成したラベルの質は、すべてのLFからノイズの多いラベルを集約し、基底真実のラベルを推測するラベル集約モデルに依存する。
合成されたデータを用いてモデルをトレーニングし、モデルに効果的なアーキテクチャを設計できることを示す。
論文 参考訳(メタデータ) (2022-07-27T14:36:35Z) - Cross-Model Pseudo-Labeling for Semi-Supervised Action Recognition [98.25592165484737]
CMPL(Cross-Model Pseudo-Labeling)と呼ばれる,より効果的な擬似ラベル方式を提案する。
CMPLは、それぞれRGBモダリティとラベル付きデータのみを使用して、Kinetics-400とUCF-101のTop-1の精度を17.6%と25.1%で達成している。
論文 参考訳(メタデータ) (2021-12-17T18:59:41Z) - SLADE: A Self-Training Framework For Distance Metric Learning [75.54078592084217]
我々は、追加のラベルのないデータを活用することで、検索性能を向上させるための自己学習フレームワークSLADEを提案する。
まず、ラベル付きデータに基づいて教師モデルをトレーニングし、ラベルなしデータに対して擬似ラベルを生成する。
次に、最終機能埋め込みを生成するために、ラベルと擬似ラベルの両方で学生モデルをトレーニングします。
論文 参考訳(メタデータ) (2020-11-20T08:26:10Z) - Handling Missing Data with Graph Representation Learning [62.59831675688714]
特徴量計算とラベル予測のためのグラフベースのフレームワークであるGRAPEを提案する。
GRAPEでは,特徴計算をエッジレベル予測タスク,ラベル予測をノードレベル予測タスクとして定式化する。
9つのベンチマークデータセットによる実験結果から、GRAPEは計算タスクの平均絶対誤差を20%低く、ラベル予測タスクを10%低くすることがわかった。
論文 参考訳(メタデータ) (2020-10-30T17:59:13Z) - Data Cleansing with Contrastive Learning for Vocal Note Event
Annotations [1.859931123372708]
本稿では,時間変化のある構造化ラベルのための新しいデータクリーニングモデルを提案する。
本モデルでは, ラベルの局所的な変形を自動的に生成することにより, 対照的な学習方法を訓練する。
提案手法を用いて学習すると,転写モデルの精度が大幅に向上することが実証された。
論文 参考訳(メタデータ) (2020-08-05T12:24:37Z) - Semi-Supervised Models via Data Augmentationfor Classifying Interactive
Affective Responses [85.04362095899656]
本稿では、対話型感情応答を分類する半教師付きテキスト分類システムSMDA(Data Augmentation)を提案する。
ラベル付き文に対しては,ラベル分布の均一化と学習過程における教師付き損失の計算のためにデータ拡張を行った。
ラベルなし文に対しては,ラベルなし文に対する低エントロピー予測を擬似ラベルとして検討した。
論文 参考訳(メタデータ) (2020-04-23T05:02:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。