論文の概要: Regular-pattern-sensitive CRFs for Distant Label Interactions
- arxiv url: http://arxiv.org/abs/2411.12484v1
- Date: Tue, 19 Nov 2024 13:08:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-20 13:38:05.904663
- Title: Regular-pattern-sensitive CRFs for Distant Label Interactions
- Title(参考訳): 距離ラベル相互作用のための規則パターン感度CRF
- Authors: Sean Papay, Roman Klinger, Sebastian Pado,
- Abstract要約: RPCRF(Regular-pattern-sensitive CRF)は、標準線形鎖CRFを強化し、長距離ラベルの相互作用を学習する手法である。
ユーザが指定したパターンの集合からRPCRFを自動構築する方法を示し、合成データに対するモデルの有効性を示す。
- 参考スコア(独自算出の注目度): 10.64258723923874
- License:
- Abstract: Linear-chain conditional random fields (CRFs) are a common model component for sequence labeling tasks when modeling the interactions between different labels is important. However, the Markov assumption limits linear-chain CRFs to only directly modeling interactions between adjacent labels. Weighted finite-state transducers (FSTs) are a related approach which can be made to model distant label-label interactions, but exact label inference is intractable for these models in the general case, and the task of selecting an appropriate automaton structure for the desired interaction types poses a practical challenge. In this work, we present regular-pattern-sensitive CRFs (RPCRFs), a method of enriching standard linear-chain CRFs with the ability to learn long-distance label interactions which occur in user-specified patterns. This approach allows users to write regular-expression label patterns concisely specifying which types of interactions the model should take into account, allowing the model to learn from data whether and in which contexts these patterns occur. The result can be interpreted alternatively as a CRF augmented with additional, non-local potentials, or as a finite-state transducer whose structure is defined by a set of easily-interpretable patterns. Critically, unlike the general case for FSTs (and for non-chain CRFs), exact training and inference are tractable for many pattern sets. In this work, we detail how a RPCRF can be automatically constructed from a set of user-specified patterns, and demonstrate the model's effectiveness on synthetic data, showing how different types of patterns can capture different nonlocal dependency structures in label sequences.
- Abstract(参考訳): 線形鎖条件付きランダムフィールド(CRF)は、異なるラベル間の相互作用をモデル化する際のシーケンスラベリングタスクの共通モデルコンポーネントである。
しかし、マルコフの仮定は、隣接するラベル間の相互作用を直接モデル化することのみに線形鎖 CRF を制限している。
重み付き有限状態トランスデューサ(FST)は、遠隔ラベルとラベルの相互作用をモデル化するための関連するアプローチであるが、これらのモデルでは正確なラベル推論が難解であり、所望の相互作用タイプに対して適切なオートマトン構造を選択することが現実的な課題である。
本研究では,標準線形鎖型CRF(Regular-pattern-sensitive CRFs, RPCRFs)を提案する。
このアプローチにより、モデルが考慮すべきインタラクションの種類を簡潔に指定した正規表現ラベルパターンを作成でき、モデルがこれらのパターンの発生時期と発生時期をデータから学習することができる。
結果は、追加の非局所ポテンシャルを持つ CRF 拡張や、構造が容易に解釈可能なパターンの集合によって定義される有限状態トランスデューサとして解釈することができる。
批判的に、FST(および非鎖CRF)の一般的な場合とは異なり、多くのパターン集合に対して正確なトレーニングと推論が可能である。
本研究では,RPCRFをユーザ特定パターンの集合から自動的に構築し,そのモデルが合成データに有効であることを示すとともに,異なるタイプのパターンがラベル配列の異なる非局所的な依存関係構造をキャプチャする方法を示す。
関連論文リスト
- FreDF: Learning to Forecast in Frequency Domain [56.24773675942897]
時系列モデリングは、歴史的シーケンスとラベルシーケンスの両方に自己相関が存在するという点で、独特な課題である。
本稿では、周波数領域の予測を学習することでラベル自己相関の複雑さを回避できる周波数強調直接予測(FreDF)を導入する。
論文 参考訳(メタデータ) (2024-02-04T08:23:41Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - Leveraging Instance Features for Label Aggregation in Programmatic Weak
Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。
PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。
既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文 参考訳(メタデータ) (2022-10-06T07:28:53Z) - Dependency Structure Misspecification in Multi-Source Weak Supervision
Models [15.125993628007972]
下流分類器のテストセット性能に及ぼすラベルモデルの誤特定の影響について検討した。
我々はモデリング誤差に関する新しい理論的境界を導出し、この誤差が実質的であることを実証的に示す。
論文 参考訳(メタデータ) (2021-06-18T18:15:44Z) - Constraining Linear-chain CRFs to Regular Languages [10.759863489447204]
構造化予測における大きな課題は、出力構造内の相互依存を表現することである。
我々は、非局所的な制約を含む幅広い制約を強制できるCRFの一般化を提案する。
制約付きトレーニングは、制約付き復号化よりも決して悪くないことを実証し、実際は大幅に改善できることを実証的に示す。
論文 参考訳(メタデータ) (2021-06-14T11:23:59Z) - Equivalence of Segmental and Neural Transducer Modeling: A Proof of
Concept [56.46135010588918]
RNN-Transducerモデルとセグメントモデル(直接HMM)の広く使われているクラスが等価であることを証明する。
空白確率はセグメント長確率に変換され,その逆も示された。
論文 参考訳(メタデータ) (2021-04-13T11:20:48Z) - Neural Latent Dependency Model for Sequence Labeling [47.32215014130811]
シークエンスラベリングにおける古典的アプローチは線形鎖条件付きランダムフィールド(CRF)である
線形鎖 CRF の1つの制限は、ラベル間の長距離依存をモデル化できないことである。
高次 CRF は線形鎖 CRF をその順序以上に拡張するが、計算複雑性は指数関数的に増大する。
木構造を持つラベル間の任意の長さをモデル化するニューラル潜時依存モデル(NLDM)を提案する。
論文 参考訳(メタデータ) (2020-11-10T10:05:21Z) - Robust Question Answering Through Sub-part Alignment [53.94003466761305]
我々はアライメント問題として質問応答をモデル化する。
私たちは、SQuAD v1.1でモデルをトレーニングし、いくつかの逆および外ドメインデータセットでそれをテストします。
論文 参考訳(メタデータ) (2020-04-30T09:10:57Z) - Multi-Label Text Classification using Attention-based Graph Neural
Network [0.0]
ラベル間の注意的依存構造を捉えるために,グラフアテンションネットワークに基づくモデルを提案する。
提案モデルでは, 従来の最先端モデルと比較して, 類似あるいは良好な性能が得られた。
論文 参考訳(メタデータ) (2020-03-22T17:12:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。