Fugu-MT 論文翻訳(概要): Regular-pattern-sensitive CRFs for Distant Label Interactions

論文の概要: Regular-pattern-sensitive CRFs for Distant Label Interactions

arxiv url: http://arxiv.org/abs/2411.12484v2
Date: Mon, 16 Jun 2025 11:46:29 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-17 15:15:28.999053
Title: Regular-pattern-sensitive CRFs for Distant Label Interactions
Title（参考訳）: 距離ラベル相互作用のための規則パターン感度CRF
Authors: Sean Papay, Roman Klinger, Sebastian Pado,
Abstract要約: 長距離ラベルの相互作用を学習する能力を備えた標準線形鎖型CRFの強化手法として,正則パターン感応性CRFを提案する。ユーザが指定したパターンの集合からRPCRFを自動構築する方法を詳述し、そのモデルの有効性を3つの合成シーケンスモデリングデータセットのシーケンス上で実証する。
参考スコア（独自算出の注目度）: 10.64258723923874
License: http://creativecommons.org/licenses/by/4.0/
Abstract: While LLMs have grown popular in sequence labeling, linear-chain conditional random fields (CRFs) remain a popular alternative with the ability to directly model interactions between labels. However, the Markov assumption limits them to % only directly modeling interactions between adjacent labels. Weighted finite-state transducers (FSTs), in contrast, can model distant label--label interactions, but exact label inference is intractable in general. In this work, we present regular-pattern-sensitive CRFs (RPCRFs), a method of enriching standard linear-chain CRFs with the ability to learn long-distance label interactions through user-specified patterns. This approach allows users to write regular-expression label patterns concisely specifying which types of interactions the model should take into account, allowing the model to learn from data whether and in which contexts these patterns occur. The result can be interpreted alternatively as a CRF augmented with additional, non-local potentials, or as a finite-state transducer whose structure is defined by a set of easily-interpretable patterns. Critically, exact training and inference are tractable for many pattern sets. We detail how an RPCRF can be automatically constructed from a set of user-specified patterns, and demonstrate the model's effectiveness on a sequence of three synthetic sequence modeling datasets.
Abstract（参考訳）: LLMはシーケンシャルラベリングで人気が高まりつつあるが、リニアチェイン条件付きランダムフィールド(CRF)は、ラベル間の相互作用を直接モデル化する機能として人気がある。しかし、マルコフの仮定は、隣接するラベル間の相互作用を直接モデル化するだけに制限される。一方、重み付き有限状態トランスデューサ(FST)は、遠距離ラベル-ラベル相互作用をモデル化することができるが、正確なラベル推論は一般的には難解である。そこで本研究では,標準線形鎖型CRF(Regular-pattern-sensitive CRFs, RPCRFs)を提案する。このアプローチにより、モデルが考慮すべきインタラクションの種類を簡潔に指定した正規表現ラベルパターンを作成でき、モデルがこれらのパターンの発生時期と発生時期をデータから学習することができる。結果は、追加の非局所ポテンシャルを持つ CRF 拡張や、構造が容易に解釈可能なパターンの集合によって定義される有限状態トランスデューサとして解釈することができる。批判的に言えば、多くのパターンセットに対して正確なトレーニングと推論が可能である。ユーザが指定したパターンの集合からRPCRFを自動構築する方法を詳述し、そのモデルの有効性を3つの合成シーケンスモデリングデータセットのシーケンス上で実証する。

関連論文リスト

FreDF: Learning to Forecast in Frequency Domain [56.24773675942897]
時系列モデリングは、歴史的シーケンスとラベルシーケンスの両方に自己相関が存在するという点で、独特な課題である。本稿では、周波数領域の予測を学習することでラベル自己相関の複雑さを回避できる周波数強調直接予測(FreDF)を導入する。
論文参考訳（メタデータ） (2024-02-04T08:23:41Z)
Label-Retrieval-Augmented Diffusion Models for Learning from Noisy Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。本稿では,生成モデルの観点からラベルノイズ問題を再構成する。我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文参考訳（メタデータ） (2023-05-31T03:01:36Z)
Leveraging Instance Features for Label Aggregation in Programmatic Weak Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。 PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文参考訳（メタデータ） (2022-10-06T07:28:53Z)
Dependency Structure Misspecification in Multi-Source Weak Supervision Models [15.125993628007972]
下流分類器のテストセット性能に及ぼすラベルモデルの誤特定の影響について検討した。我々はモデリング誤差に関する新しい理論的境界を導出し、この誤差が実質的であることを実証的に示す。
論文参考訳（メタデータ） (2021-06-18T18:15:44Z)
A Unified Generative Adversarial Network Training via Self-Labeling and Self-Attention [38.31735499785227]
本稿では,任意のレベルのラベリングを統一的に処理できる新しいGANトレーニング手法を提案する。提案手法では,手動で定義したラベルを組み込むことができる人工ラベル方式を導入する。我々は, CIFAR-10, STL-10, SVHNに対するアプローチを評価し, 自己ラベルと自己アテンションの両方が生成データの品質を継続的に向上することを示す。
論文参考訳（メタデータ） (2021-06-18T04:40:26Z)
Momentum Pseudo-Labeling for Semi-Supervised Speech Recognition [55.362258027878966]
本稿では,半教師付き音声認識のための簡易かつ効果的な手法として,モーメント擬似ラベル(MPL)を提案する。 MPLは、平均的な教師メソッドにインスパイアされて、相互に相互作用し、学習するオンラインとオフラインの2つのモデルで構成されている。実験の結果,MPLはベースモデルよりも効果的に改善され,様々な半教師付きシナリオに拡張可能であることが示された。
論文参考訳（メタデータ） (2021-06-16T16:24:55Z)
Constraining Linear-chain CRFs to Regular Languages [10.759863489447204]
構造化予測における大きな課題は、出力構造内の相互依存を表現することである。我々は、非局所的な制約を含む幅広い制約を強制できるCRFの一般化を提案する。制約付きトレーニングは、制約付き復号化よりも決して悪くないことを実証し、実際は大幅に改善できることを実証的に示す。
論文参考訳（メタデータ） (2021-06-14T11:23:59Z)
Equivalence of Segmental and Neural Transducer Modeling: A Proof of Concept [56.46135010588918]
RNN-Transducerモデルとセグメントモデル(直接HMM)の広く使われているクラスが等価であることを証明する。空白確率はセグメント長確率に変換され,その逆も示された。
論文参考訳（メタデータ） (2021-04-13T11:20:48Z)
Label Confusion Learning to Enhance Text Classification Models [3.0251266104313643]
ラベル混乱モデル(lcm)はラベル間の意味的重複を捉えるためにラベル混乱を学習する。 lcmは、元のホットラベルベクトルを置き換えるより優れたラベル分布を生成することができる。 5つのテキスト分類ベンチマークデータセットの実験により、広く使われているディープラーニング分類モデルに対するLCMの有効性が明らかにされた。
論文参考訳（メタデータ） (2020-12-09T11:34:35Z)
Neural Latent Dependency Model for Sequence Labeling [47.32215014130811]
シークエンスラベリングにおける古典的アプローチは線形鎖条件付きランダムフィールド(CRF)である線形鎖 CRF の1つの制限は、ラベル間の長距離依存をモデル化できないことである。高次 CRF は線形鎖 CRF をその順序以上に拡張するが、計算複雑性は指数関数的に増大する。木構造を持つラベル間の任意の長さをモデル化するニューラル潜時依存モデル(NLDM)を提案する。
論文参考訳（メタデータ） (2020-11-10T10:05:21Z)
Semi-Supervised Speech Recognition via Graph-based Temporal Classification [59.58318952000571]
半教師付き学習は自己学習による自動音声認識において有望な結果を示した。このアプローチの有効性は、主に擬似ラベルの精度に依存する。 N-bestリストの別のASR仮説は、ラベルなしの発話に対してより正確なラベルを提供することができる。
論文参考訳（メタデータ） (2020-10-29T14:56:56Z)
Robust Question Answering Through Sub-part Alignment [53.94003466761305]
我々はアライメント問題として質問応答をモデル化する。私たちは、SQuAD v1.1でモデルをトレーニングし、いくつかの逆および外ドメインデータセットでそれをテストします。
論文参考訳（メタデータ） (2020-04-30T09:10:57Z)
Multi-Label Text Classification using Attention-based Graph Neural Network [0.0]
ラベル間の注意的依存構造を捉えるために,グラフアテンションネットワークに基づくモデルを提案する。提案モデルでは, 従来の最先端モデルと比較して, 類似あるいは良好な性能が得られた。
論文参考訳（メタデータ） (2020-03-22T17:12:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。