論文の概要: (Un)solving Morphological Inflection: Lemma Overlap Artificially
Inflates Models' Performance
- arxiv url: http://arxiv.org/abs/2108.05682v1
- Date: Thu, 12 Aug 2021 12:06:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-13 14:40:00.759879
- Title: (Un)solving Morphological Inflection: Lemma Overlap Artificially
Inflates Models' Performance
- Title(参考訳): (Un)解決形態変化:Lemma Overlap人工膨らませモデルの性能
- Authors: Omer Goldman, David Guriel, Reut Tsarfaty
- Abstract要約: 本稿では, より厳密な列車-試験分割を用いて, 形態的インフレクションモデルの再評価を提案する。
SIGMORPHONの2020年のシェアリングタスクにおける上位3つのシステムによる実験では、レムマスプリットは平均30ポイントの低下を示している。
- 参考スコア(独自算出の注目度): 7.2223831790495625
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: In the domain of Morphology, Inflection is a fundamental and important task
that gained a lot of traction in recent years, mostly via SIGMORPHON's
shared-tasks. With average accuracy above 0.9 over the scores of all languages,
the task is considered mostly solved using relatively generic neural
sequence-to-sequence models, even with little data provided. In this work, we
propose to re-evaluate morphological inflection models by employing harder
train-test splits that will challenge the generalization capacity of the
models. In particular, as opposed to the na\"ive split-by-form, we propose a
split-by-lemma method to challenge the performance on existing benchmarks. Our
experiments with the three top-ranked systems on the SIGMORPHON's 2020
shared-task show that the lemma-split presents an average drop of 30 percentage
points in macro-average for the 90 languages included. The effect is most
significant for low-resourced languages with a drop as high as 95 points, but
even high-resourced languages lose about 10 points on average. Our results
clearly show that generalizing inflection to unseen lemmas is far from being
solved, presenting a simple yet effective means to promote more sophisticated
models.
- Abstract(参考訳): 形態学の分野では、インフレクションは基本的な重要な課題であり、SIGMORPHONの共有タスクを通じて近年多くの注目を集めている。
全ての言語のスコアよりも0.9以上の精度で、このタスクは比較的汎用的なニューラルシークエンスモデルを用いてほとんど解決されていない。
本研究では,模型の一般化能力に挑戦する列車試験分割の難易度を生かして形態的変形モデルを再評価する。
特に、na\\ive split-by-formとは対照的に、既存のベンチマークのパフォーマンスに挑戦するスプリット・バイ・レンマ法を提案する。
SIGMORPHONの2020年の共有タスクにおける上位3つのシステムによる実験により、レマ・スプリットは、90言語を含むマクロ平均で平均30ポイントの減少を示した。
この効果は、95ポイントまで低下する低リソース言語にとって最も重要であるが、高リソース言語でさえ平均で約10ポイント減少している。
以上の結果から,未発見の補題への帰納法の一般化は解決に至らず,より洗練されたモデルを促進するための単純かつ効果的な方法を示していることが明らかとなった。
関連論文リスト
- Predictor-Corrector Enhanced Transformers with Exponential Moving Average Coefficient Learning [73.73967342609603]
トラクションエラーを最小限に抑えるための予測-相関学習フレームワークを提案する。
また、高次予測器を強化するために、指数関数的移動平均ベース係数学習法を提案する。
我々のモデルは3.8BのDeepNetを平均2.9のSacreBLEUで上回り、1/3のパラメータしか使用していない。
論文 参考訳(メタデータ) (2024-11-05T12:26:25Z) - HM3: Heterogeneous Multi-Class Model Merging [0.0]
本研究では,補助ガードレールモデルを単一多機能モデルに統合するためのトレーニングフリーモデルマージ手法について検討する。
異種ラベル空間とマルチクラス分類器をマージする簡単な手法として、異種多クラスモデルマージ(HM3)を提案する。
BERTをベースとしたガードモデルをマージする有望な結果が報告され、その一部はソースモデルよりも平均F1スコア高くなり、推論時間を最大44%削減する。
論文 参考訳(メタデータ) (2024-09-27T22:42:45Z) - Compressing Sentence Representation with maximum Coding Rate Reduction [0.0]
ほとんどの自然言語推論問題では、文表現は意味検索タスクに必要である。
スペースとハードウェアの制限のため、より小さなモデルを使用する場合には、同等の結果を得る必要がある。
複雑性と文埋め込みサイズを低減した新しい言語モデルは,セマンティック検索ベンチマークにおいて同等の結果が得られることを実証した。
論文 参考訳(メタデータ) (2023-04-25T09:23:43Z) - Mitigating Spurious Correlations in Multi-modal Models during
Fine-tuning [18.45898471459533]
モデル一般化を低下させたり、間違った理由でモデルが正しいことを導いたという豪華な相関は、現実世界のデプロイメントにおいて大きな堅牢性に関する懸念の1つです。
本稿では,特定の関心領域の微調整において,刺激的な相関に対処する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-04-08T05:20:33Z) - Tailoring Language Generation Models under Total Variation Distance [55.89964205594829]
ニューラルネットワーク生成の標準パラダイムは、最適化方法として最大推定(MLE)を採用する。
言語生成に適用するための実践的境界を開発する。
本稿では,TVD推定のトレードオフのバランスをとるためのTaiLr の目標について紹介する。
論文 参考訳(メタデータ) (2023-02-26T16:32:52Z) - mFACE: Multilingual Summarization with Factual Consistency Evaluation [79.60172087719356]
抽象的な要約は、事前訓練された言語モデルと大規模データセットの可用性のおかげで、近年で新たな関心を集めている。
有望な結果にもかかわらず、現在のモデルはいまだに現実的に矛盾した要約を生み出すことに苦しむ。
事実整合性評価モデルを利用して、多言語要約を改善する。
論文 参考訳(メタデータ) (2022-12-20T19:52:41Z) - Training Trajectories of Language Models Across Scales [99.38721327771208]
言語モデルのスケールアップは、前例のないパフォーマンス向上につながった。
異なるサイズの言語モデルは事前学習中にどのように学習するか?
より大きな言語モデルはなぜ望ましい振る舞いを示すのか?
論文 参考訳(メタデータ) (2022-12-19T19:16:29Z) - Part-Based Models Improve Adversarial Robustness [57.699029966800644]
人間の事前知識とエンドツーエンドの学習を組み合わせることで、ディープニューラルネットワークの堅牢性を向上させることができることを示す。
我々のモデルは、部分分割モデルと小さな分類器を組み合わせて、オブジェクトを同時に部品に分割するようにエンドツーエンドに訓練されている。
実験の結果,これらのモデルによりテクスチャバイアスが低減され,一般的な汚職に対する堅牢性が向上し,相関が急上昇することが示唆された。
論文 参考訳(メタデータ) (2022-09-15T15:41:47Z) - Improving Pre-trained Language Model Fine-tuning with Noise Stability
Regularization [94.4409074435894]
本稿では,LNSR(Layerwise Noise Stability Regularization)という,新規かつ効果的な微調整フレームワークを提案する。
具体的には、標準ガウス雑音を注入し、微調整モデルの隠れ表現を正規化することを提案する。
提案手法は,L2-SP,Mixout,SMARTなど他の最先端アルゴリズムよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-12T04:42:49Z) - Uncertainty Estimation for Language Reward Models [5.33024001730262]
言語モデルは、テキストコーパスの教師なしトレーニングからさまざまな能力を学ぶことができる。
人間がラベル付きデータを提供するよりも選択肢を選択する方が簡単であり、事前の作業はそのような選好比較から報酬モデルをトレーニングすることで最先端のパフォーマンスを達成した。
能動的学習とリスク-逆強化学習を用いてサンプル効率とロバスト性を向上させる不確実性推定によるこれらの問題に対処することを模索する。
論文 参考訳(メタデータ) (2022-03-14T20:13:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。