論文の概要: Practice Makes a Solver Perfect: Data Augmentation for Math Word Problem
Solvers
- arxiv url: http://arxiv.org/abs/2205.00177v1
- Date: Sat, 30 Apr 2022 06:23:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-05 07:16:25.074167
- Title: Practice Makes a Solver Perfect: Data Augmentation for Math Word Problem
Solvers
- Title(参考訳): 実践によって解法が完璧になる: 数学の単語問題を解くためのデータ拡張
- Authors: Vivek Kumar, Rishabh Maheshwary, Vikram Pudi
- Abstract要約: 既存の数学語問題(MWP)は、ベンチマークデータセットで高い精度を達成している。
以前の研究では、そのような解法は一般化が良くなく、高い性能を達成するために表面的な方法に依存していることが示されている。
既存のデータセットのサイズを5倍に増やすために,いくつかのデータ拡張手法を提案する。
- 参考スコア(独自算出の注目度): 11.64291139163626
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing Math Word Problem (MWP) solvers have achieved high accuracy on
benchmark datasets. However, prior works have shown that such solvers do not
generalize well and rely on superficial cues to achieve high performance. In
this paper, we first conduct experiments to showcase that this behaviour is
mainly associated with the limited size and diversity present in existing MWP
datasets. Next, we propose several data augmentation techniques broadly
categorized into Substitution and Paraphrasing based methods. By deploying
these methods we increase the size of existing datasets by five folds.
Extensive experiments on two benchmark datasets across three state-of-the-art
MWP solvers show that proposed methods increase the generalization and
robustness of existing solvers. On average, proposed methods significantly
increase the state-of-the-art results by over five percentage points on
benchmark datasets. Further, the solvers trained on the augmented dataset
perform comparatively better on the challenge test set. We also show the
effectiveness of proposed techniques through ablation studies and verify the
quality of augmented samples through human evaluation.
- Abstract(参考訳): 既存の数学語問題(MWP)は、ベンチマークデータセットで高い精度を達成している。
しかし、先行研究はそのような解法がうまく一般化せず、高パフォーマンスを達成するために表面的手がかりに頼っていることを示してきた。
本稿では,この動作が,既存のMWPデータセットに存在する限られたサイズと多様性に主に関連していることを示す実験を行う。
次に,置換法とパラフレージング法に大別されるデータ拡張手法を提案する。
これらのメソッドをデプロイすることで、既存のデータセットのサイズを5倍に増やします。
3つの最先端mwpソルバにおける2つのベンチマークデータセットの広範な実験は、提案手法が既存のソルバの一般化と堅牢性を高めることを示している。
提案手法は平均して,ベンチマークデータセットにおいて,最先端の結果を5ポイント以上向上させる。
さらに、拡張データセットでトレーニングされたソルバは、チャレンジテストセットにおいて比較良く動作する。
また,提案手法のアブレーション実験による有効性を示し,人体評価による拡張試料の品質検証を行った。
関連論文リスト
- Robust Analysis of Multi-Task Learning on a Complex Vision System [73.65915899030895]
マルチタスク学習(MTL)は過去10年間に広く研究されてきた。
複雑な実世界のシナリオにおけるパフォーマンスについて、まだ深く理解されていない。
論文 参考訳(メタデータ) (2024-02-05T22:15:55Z) - Spanning Training Progress: Temporal Dual-Depth Scoring (TDDS) for
Enhanced Dataset Pruning [54.511055635704764]
我々は、時間的デュアルディープス・スコーリング(TDDS)と呼ばれる新しいデータセット・プルーニング手法を提案する。
本手法は,10%のトレーニングデータで54.51%の精度を達成し,ランダム選択を7.83%以上,他の比較手法を12.69%以上上回る結果を得た。
論文 参考訳(メタデータ) (2023-11-22T03:45:30Z) - Improving Few-Shot Generalization by Exploring and Exploiting Auxiliary
Data [100.33096338195723]
補助データを用いたFew-shot Learning(FLAD)に焦点を当てる。
FLADは、一般化を改善するために、数ショットの学習中に補助データへのアクセスを前提としている。
提案するアルゴリズムは EXP3-FLAD と UCB1-FLAD の2つである。
論文 参考訳(メタデータ) (2023-02-01T18:59:36Z) - Advanced Data Augmentation Approaches: A Comprehensive Survey and Future
directions [57.30984060215482]
データ拡張の背景、レビューされたデータ拡張技術の新しい包括的分類法、および各技術の強さと弱点(可能ならば)を提供する。
また、画像分類、オブジェクト検出、セマンティックセグメンテーションなどの3つの一般的なコンピュータビジョンタスクに対して、データ拡張効果の総合的な結果を提供する。
論文 参考訳(メタデータ) (2023-01-07T11:37:32Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - On Modality Bias Recognition and Reduction [70.69194431713825]
マルチモーダル分類の文脈におけるモダリティバイアス問題について検討する。
本稿では,各ラベルの特徴空間を適応的に学習するプラグアンドプレイ損失関数法を提案する。
本手法は, ベースラインに比べ, 顕著な性能向上を実現している。
論文 参考訳(メタデータ) (2022-02-25T13:47:09Z) - Data Augmentation Approaches in Natural Language Processing: A Survey [28.91744006146676]
データ拡張(DA)は、ディープラーニング技術が失敗する可能性のあるデータの不足シナリオを軽減する。
DA手法の主な焦点の1つは、トレーニングデータの多様性を改善することである。
DA手法をパラフレーズ化, ノイズ化, サンプリングなど, 拡張データの多様性に基づいて3つのカテゴリに分類する。
論文 参考訳(メタデータ) (2021-10-05T07:35:32Z) - Adversarial Examples for Evaluating Math Word Problem Solvers [4.266990593059533]
MWP(Math Word Problem)は、ベンチマークデータセット上で高い性能を達成している。
既存のMWPソルバが言語を真に理解している範囲と数との関係はいまだ不明である。
我々は、最先端のMWPソルバの堅牢性を評価するために、敵攻撃を生成する。
論文 参考訳(メタデータ) (2021-09-13T12:47:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。