論文の概要: Regular-pattern-sensitive CRFs for Distant Label Interactions
- arxiv url: http://arxiv.org/abs/2411.12484v2
- Date: Mon, 16 Jun 2025 11:46:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-17 15:15:28.999053
- Title: Regular-pattern-sensitive CRFs for Distant Label Interactions
- Title(参考訳): 距離ラベル相互作用のための規則パターン感度CRF
- Authors: Sean Papay, Roman Klinger, Sebastian Pado,
- Abstract要約: 長距離ラベルの相互作用を学習する能力を備えた標準線形鎖型CRFの強化手法として,正則パターン感応性CRFを提案する。
ユーザが指定したパターンの集合からRPCRFを自動構築する方法を詳述し、そのモデルの有効性を3つの合成シーケンスモデリングデータセットのシーケンス上で実証する。
- 参考スコア(独自算出の注目度): 10.64258723923874
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While LLMs have grown popular in sequence labeling, linear-chain conditional random fields (CRFs) remain a popular alternative with the ability to directly model interactions between labels. However, the Markov assumption limits them to % only directly modeling interactions between adjacent labels. Weighted finite-state transducers (FSTs), in contrast, can model distant label--label interactions, but exact label inference is intractable in general. In this work, we present regular-pattern-sensitive CRFs (RPCRFs), a method of enriching standard linear-chain CRFs with the ability to learn long-distance label interactions through user-specified patterns. This approach allows users to write regular-expression label patterns concisely specifying which types of interactions the model should take into account, allowing the model to learn from data whether and in which contexts these patterns occur. The result can be interpreted alternatively as a CRF augmented with additional, non-local potentials, or as a finite-state transducer whose structure is defined by a set of easily-interpretable patterns. Critically, exact training and inference are tractable for many pattern sets. We detail how an RPCRF can be automatically constructed from a set of user-specified patterns, and demonstrate the model's effectiveness on a sequence of three synthetic sequence modeling datasets.
- Abstract(参考訳): LLMはシーケンシャルラベリングで人気が高まりつつあるが、リニアチェイン条件付きランダムフィールド(CRF)は、ラベル間の相互作用を直接モデル化する機能として人気がある。
しかし、マルコフの仮定は、隣接するラベル間の相互作用を直接モデル化するだけに制限される。
一方、重み付き有限状態トランスデューサ(FST)は、遠距離ラベル-ラベル相互作用をモデル化することができるが、正確なラベル推論は一般的には難解である。
そこで本研究では,標準線形鎖型CRF(Regular-pattern-sensitive CRFs, RPCRFs)を提案する。
このアプローチにより、モデルが考慮すべきインタラクションの種類を簡潔に指定した正規表現ラベルパターンを作成でき、モデルがこれらのパターンの発生時期と発生時期をデータから学習することができる。
結果は、追加の非局所ポテンシャルを持つ CRF 拡張や、構造が容易に解釈可能なパターンの集合によって定義される有限状態トランスデューサとして解釈することができる。
批判的に言えば、多くのパターンセットに対して正確なトレーニングと推論が可能である。
ユーザが指定したパターンの集合からRPCRFを自動構築する方法を詳述し、そのモデルの有効性を3つの合成シーケンスモデリングデータセットのシーケンス上で実証する。
関連論文リスト
- FreDF: Learning to Forecast in Frequency Domain [56.24773675942897]
時系列モデリングは、歴史的シーケンスとラベルシーケンスの両方に自己相関が存在するという点で、独特な課題である。
本稿では、周波数領域の予測を学習することでラベル自己相関の複雑さを回避できる周波数強調直接予測(FreDF)を導入する。
論文 参考訳(メタデータ) (2024-02-04T08:23:41Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - Leveraging Instance Features for Label Aggregation in Programmatic Weak
Supervision [75.1860418333995]
Programmatic Weak Supervision (PWS) は、トレーニングラベルを効率的に合成するための広く普及したパラダイムとして登場した。
PWSのコアコンポーネントはラベルモデルであり、複数のノイズ管理ソースの出力をラベル関数として集約することで、真のラベルを推論する。
既存の統計ラベルモデルは一般的にLFの出力のみに依存し、基礎となる生成過程をモデル化する際のインスタンスの特徴を無視している。
論文 参考訳(メタデータ) (2022-10-06T07:28:53Z) - Dependency Structure Misspecification in Multi-Source Weak Supervision
Models [15.125993628007972]
下流分類器のテストセット性能に及ぼすラベルモデルの誤特定の影響について検討した。
我々はモデリング誤差に関する新しい理論的境界を導出し、この誤差が実質的であることを実証的に示す。
論文 参考訳(メタデータ) (2021-06-18T18:15:44Z) - Constraining Linear-chain CRFs to Regular Languages [10.759863489447204]
構造化予測における大きな課題は、出力構造内の相互依存を表現することである。
我々は、非局所的な制約を含む幅広い制約を強制できるCRFの一般化を提案する。
制約付きトレーニングは、制約付き復号化よりも決して悪くないことを実証し、実際は大幅に改善できることを実証的に示す。
論文 参考訳(メタデータ) (2021-06-14T11:23:59Z) - Equivalence of Segmental and Neural Transducer Modeling: A Proof of
Concept [56.46135010588918]
RNN-Transducerモデルとセグメントモデル(直接HMM)の広く使われているクラスが等価であることを証明する。
空白確率はセグメント長確率に変換され,その逆も示された。
論文 参考訳(メタデータ) (2021-04-13T11:20:48Z) - Neural Latent Dependency Model for Sequence Labeling [47.32215014130811]
シークエンスラベリングにおける古典的アプローチは線形鎖条件付きランダムフィールド(CRF)である
線形鎖 CRF の1つの制限は、ラベル間の長距離依存をモデル化できないことである。
高次 CRF は線形鎖 CRF をその順序以上に拡張するが、計算複雑性は指数関数的に増大する。
木構造を持つラベル間の任意の長さをモデル化するニューラル潜時依存モデル(NLDM)を提案する。
論文 参考訳(メタデータ) (2020-11-10T10:05:21Z) - Robust Question Answering Through Sub-part Alignment [53.94003466761305]
我々はアライメント問題として質問応答をモデル化する。
私たちは、SQuAD v1.1でモデルをトレーニングし、いくつかの逆および外ドメインデータセットでそれをテストします。
論文 参考訳(メタデータ) (2020-04-30T09:10:57Z) - Multi-Label Text Classification using Attention-based Graph Neural
Network [0.0]
ラベル間の注意的依存構造を捉えるために,グラフアテンションネットワークに基づくモデルを提案する。
提案モデルでは, 従来の最先端モデルと比較して, 類似あるいは良好な性能が得られた。
論文 参考訳(メタデータ) (2020-03-22T17:12:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。