論文の概要: Neural Induction of Finite-State Transducers
- arxiv url: http://arxiv.org/abs/2601.10918v2
- Date: Tue, 20 Jan 2026 00:30:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 14:05:45.209912
- Title: Neural Induction of Finite-State Transducers
- Title(参考訳): 有限状態トランスデューサのニューラル誘導
- Authors: Michael Ginn, Alexis Palmer, Mans Hulden,
- Abstract要約: ニューラルネットワークによって学習された隠れ状態幾何に従って、非重み付き有限状態トランスデューサ(FST)を自動的に構築する新しい手法を提案する。
提案手法は, 実世界の形態変化, グラファイム・音素予測, および歴史的正規化のためのデータセット上で評価され, 構築されたFSTが多くのデータセットに対して極めて正確かつ堅牢であることを示す。
- 参考スコア(独自算出の注目度): 13.274838371184432
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Finite-State Transducers (FSTs) are effective models for string-to-string rewriting tasks, often providing the efficiency necessary for high-performance applications, but constructing transducers by hand is difficult. In this work, we propose a novel method for automatically constructing unweighted FSTs following the hidden state geometry learned by a recurrent neural network. We evaluate our methods on real-world datasets for morphological inflection, grapheme-to-phoneme prediction, and historical normalization, showing that the constructed FSTs are highly accurate and robust for many datasets, substantially outperforming classical transducer learning algorithms by up to 87% accuracy on held-out test sets.
- Abstract(参考訳): 有限状態トランスデューサ(FST)は文字列から文字列への書き換え作業に有効なモデルであり、高性能なアプリケーションに必要な効率性を提供することが多いが、手動でトランスデューサを構築することは困難である。
本研究では,再帰型ニューラルネットワークによって学習された隠れ状態幾何に従って,非重み付きFSTを自動的に構築する新しい手法を提案する。
提案手法は, 実世界のモーフィック・インフレクション, グラファイム・ツー・音素予測, 歴史的正規化のデータセットにおいて評価され, 構築されたFSTが多くのデータセットに対して極めて正確かつ堅牢であることを示し, 保持されたテストセットに対して最大87%の精度で古典的トランスデューサ学習アルゴリズムを著しく上回った。
関連論文リスト
- Self-Supervised Learning via Flow-Guided Neural Operator on Time-Series Data [57.85958428020496]
Flow-Guided Neural Operator (FGNO)は、演算子学習とフローマッチングを組み合わせた新しいフレームワークである。
FGNOは、短時間フーリエ変換を用いて関数空間のマッピングを学習し、異なる時間分解能を統一する。
推論中にノイズのある入力を使用する以前の生成SSL法とは異なり、ノイズのある表現を学習しながら、クリーンな入力を用いて表現抽出を行う。
論文 参考訳(メタデータ) (2026-02-12T18:54:57Z) - A Comparative Study of Adaptation Strategies for Time Series Foundation Models in Anomaly Detection [0.0]
時系列基礎モデル(TSFM)は、大きな異種データに基づいて事前訓練される。
我々は、ゼロショット推論、フルモデル適応、パラメータ効率の微調整戦略を比較した。
これらの結果は、TSFMをスケーラブルで効率的な時系列異常検出のための有望な汎用モデルとして位置づけている。
論文 参考訳(メタデータ) (2026-01-01T19:11:33Z) - WST: Weakly Supervised Transducer for Automatic Speech Recognition [26.373816643181843]
Weakly Supervised Transducer (WST) は、追加の信頼度推定や補助的な事前訓練モデルを必要とすることなく、書き起こし中のエラーを堅牢に処理するように設計されている。
合成データセットと工業データセットの実証評価により、WSTは最大70%の転写誤り率でも性能を効果的に維持できることが示された。
論文 参考訳(メタデータ) (2025-11-06T04:14:07Z) - Learning on Transformers is Provable Low-Rank and Sparse: A One-layer Analysis [63.66763657191476]
低ランク計算としての効率的な数値学習と推論アルゴリズムはトランスフォーマーに基づく適応学習に優れた性能を持つことを示す。
我々は、等級モデルが適応性を改善しながら一般化にどのように影響するかを分析する。
適切なマグニチュードベースのテストは,テストパフォーマンスに多少依存している,と結論付けています。
論文 参考訳(メタデータ) (2024-06-24T23:00:58Z) - Enhancing Sequential Model Performance with Squared Sigmoid TanH (SST) Activation Under Data Constraints [1.8624274002327752]
本研究では,データ制約下での逐次モデルの学習能力を高めるために,SST(Sigmoid TanH)アクティベーションの2乗化を提案する。
SSTは、信号が時間とともに伝播するにつれて、強い活性化と弱い活性化の差を増幅するために数学的なスクアリングを適用している。
我々は,手話認識,回帰,時系列分類タスクなどの多様なアプリケーションに対して,SSTを利用したLSTMとGRUを評価した。
論文 参考訳(メタデータ) (2024-02-14T09:20:13Z) - State Sequences Prediction via Fourier Transform for Representation
Learning [111.82376793413746]
本研究では,表現表現を効率よく学習する新しい方法である,フーリエ変換(SPF)による状態列予測を提案する。
本研究では,状態系列における構造情報の存在を理論的に解析する。
実験により,提案手法はサンプル効率と性能の両面で,最先端のアルゴリズムよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-10-24T14:47:02Z) - SIP: Injecting a Structural Inductive Bias into a Seq2Seq Model by Simulation [75.14793516745374]
本稿では, 構造的帰納バイアスをセック2セックモデルに効率よく注入し, 合成データの構造的変換をシミュレートする方法について述べる。
実験の結果,本手法は所望の帰納バイアスを付与し,FSTのようなタスクに対してより優れた数発学習を実現することがわかった。
論文 参考訳(メタデータ) (2023-10-01T21:19:12Z) - Label-free timing analysis of SiPM-based modularized detectors with
physics-constrained deep learning [9.234802409391111]
モジュール化検出器のタイミング解析のためのディープラーニングに基づく新しい手法を提案する。
本稿では,提案手法が求める最適関数の存在を数学的に証明し,モデルのトレーニングと校正のための体系的アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-24T09:16:31Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Semantic Perturbations with Normalizing Flows for Improved
Generalization [62.998818375912506]
我々は、非教師付きデータ拡張を定義するために、潜在空間における摂動が利用できることを示す。
トレーニングを通して分類器に適応する潜伏性対向性摂動が最も効果的であることが判明した。
論文 参考訳(メタデータ) (2021-08-18T03:20:00Z) - Latent Template Induction with Gumbel-CRFs [107.17408593510372]
文生成のための潜在テンプレートを推論するための構造化変分オートエンコーダについて検討する。
構造化推論ネットワークとして、トレーニング中に解釈可能なテンプレートを学習することを示す。
論文 参考訳(メタデータ) (2020-11-29T01:00:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。