論文の概要: When Irregularity Helps: A Subclass Analysis of Inductive Bias in Neural Morphology
- arxiv url: http://arxiv.org/abs/2605.20558v1
- Date: Tue, 19 May 2026 23:18:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.41137
- Title: When Irregularity Helps: A Subclass Analysis of Inductive Bias in Neural Morphology
- Title(参考訳): 不規則性が助けになるとき--神経形態学における誘導バイアスのサブクラス解析
- Authors: Wen Zhang,
- Abstract要約: 非常に小さく、構造的に特異的な不規則なサブタイプが、モデルエラーの不均等な共有であることを示す。
これらの結果から, 過度な低周波形態素パターンと特定の形態素過程との相互作用により, 誤差濃度が誘導されることが示唆された。
- 参考スコア(独自算出の注目度): 6.1031222024562695
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Neural morphological generation systems often achieve high aggregate accuracy on benchmark datasets, yet such performance can conceal systematic errors concentrated in rare morphological subclasses. We examine Japanese past-tense verb inflection and show that a very small, structurally specific irregular subtype (<1% of data) accounts for a disproportionate share of model errors. Controlled ablation experiments demonstrate that removing this subtype yields larger improvements in generalization than removing all irregular verbs, indicating that not all irregularity contributes equally to model instability. These findings suggest that error concentration is driven by the interaction between extreme low-frequency morphological patterns and specific morphophonological processes, particularly gemination. We argue that morphological evaluation should incorporate finer-grained subclass analysis beyond standard conjugation categories.
- Abstract(参考訳): ニューラルな形態素生成システムは、しばしばベンチマークデータセット上で高い集約精度を達成するが、そのような性能は希少な形態素サブクラスに集中する系統的な誤りを隠蔽することができる。
本研究は, 日本語の過去の動詞の屈折について検討し, 非常に小さく, 構造的に特異的な不規則なサブタイプ(<1%) が, モデル誤差の不均等な割合を占めることを示した。
制御されたアブレーション実験では、このサブタイプを取り除くことで、不規則な動詞を全て除去するよりも一般化が向上し、すべての不規則性がモデル不安定性に等しく寄与するわけではないことが示されている。
これらの結果から, 過度な低周波形態素パターンと特定の形態素過程, 特にゲミネーションの相互作用により, 誤差濃度が引き起こされることが示唆された。
形態学的評価は、標準共役圏を超えてよりきめ細かいサブクラス分析を取り入れるべきである。
関連論文リスト
- Mind Your Moras: Orthography-Aware Error Analysis of Neural Japanese Morphological Generation [6.1031222024562695]
本報告では, 日本語の過去の形態変化の正書法に基づく誤り解析について述べる。
SIGMORPHON 2020 と 2023 の共有タスク規約に従ってフォーマットされたデータセットを用いて,過去センス形成における2つの文字レベルのシーケンス・ツー・シーケンスアーキテクチャの評価を行った。
高い集約精度にもかかわらず、モデルはヒラガナの特定の正書法特性を囲む体系的、言語学的に解釈可能な誤りを示す。
論文 参考訳(メタデータ) (2026-05-19T16:04:33Z) - Generative Classifiers Avoid Shortcut Solutions [84.23247217037134]
分類に対する差別的なアプローチは、しばしば、分配されるが、小さな分布シフトの下で失敗するショートカットを学習する。
生成型分類器は、主にスパイラルな特徴ではなく、コアとスパイラルの両方の全ての特徴をモデル化することでこの問題を回避することができることを示す。
拡散型および自己回帰型生成型分類器は,5つの標準画像およびテキスト分散シフトベンチマークにおいて最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-12-31T18:31:46Z) - Memorization and Regularization in Generative Diffusion Models [5.128303432235475]
拡散モデルは、生成モデリングの強力なフレームワークとして登場した。
この分析は、解析的に抽出可能な最小化器の再生を避けるための正規化の必要性を強調している。
実験は記憶の文脈で評価され、今後の正規化の方向性が強調される。
論文 参考訳(メタデータ) (2025-01-27T05:17:06Z) - SLA$^2$P: Self-supervised Anomaly Detection with Adversarial
Perturbation [77.71161225100927]
異常検出は、機械学習の基本的な問題であるが、難しい問題である。
本稿では,非教師付き異常検出のための新しい強力なフレームワークであるSLA$2$Pを提案する。
論文 参考訳(メタデータ) (2021-11-25T03:53:43Z) - Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。
提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。
我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文 参考訳(メタデータ) (2021-08-01T14:33:17Z) - Predicting Unreliable Predictions by Shattering a Neural Network [145.3823991041987]
線形ニューラルネットワークは、サブファンクションに分割することができる。
サブファンクションは、独自のアクティベーションパターン、ドメイン、経験的エラーを持っている。
完全なネットワークに対する経験的エラーは、サブファンクションに対する期待として記述できる。
論文 参考訳(メタデータ) (2021-06-15T18:34:41Z) - Searching for Search Errors in Neural Morphological Inflection [40.011530606430895]
単語レベルのタスクでは、ニューラルシークエンス・トゥ・シークエンスモデルの正確な推論は、空文字列がしばしば世界最適であることを明らかにする。
これらの観察は、多くのニューラルモデルのキャリブレーションが低いことは、タスクの特定のサブセットの特性に起因する可能性があることを示唆している。
論文 参考訳(メタデータ) (2021-02-16T19:42:42Z) - Understanding Classifier Mistakes with Generative Models [88.20470690631372]
ディープニューラルネットワークは教師付き学習タスクに有効であるが、脆弱であることが示されている。
本稿では、生成モデルを利用して、分類器が一般化に失敗するインスタンスを特定し、特徴付ける。
我々のアプローチは、トレーニングセットのクラスラベルに依存しないため、半教師付きでトレーニングされたモデルに適用できる。
論文 参考訳(メタデータ) (2020-10-05T22:13:21Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Generalization Error of Generalized Linear Models in High Dimensions [25.635225717360466]
任意の非線形性を持つニューラルネットワークを特徴付けるためのフレームワークを提供する。
正規ロジスティック回帰が学習に与える影響を解析する。
また,本モデルでは,特別事例の学習と配布の事例も捉えている。
論文 参考訳(メタデータ) (2020-05-01T02:17:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。