論文の概要: Finite Sentence-Interface Control for Learning Bounded-Fan-Out Linear MCFGs under Fixed Monoid Typing
- arxiv url: http://arxiv.org/abs/2605.11644v1
- Date: Tue, 12 May 2026 07:07:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.652897
- Title: Finite Sentence-Interface Control for Learning Bounded-Fan-Out Linear MCFGs under Fixed Monoid Typing
- Title(参考訳): 固定型モノイドタイピング下での境界ファンアウト線形MCFG学習のための有限文インタフェース制御
- Authors: Takayuki Kuriyama,
- Abstract要約: 固定的有限モノイド準同型(h)の下での有界ファンアウト線形多重文脈自由文法の正データ学習について検討する。
このような事象に対して,文-インタフェース型を有限外部制御オブジェクトとして導入する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study positive-data learning of bounded-fan-out linear multiple context-free grammars under a fixed explicit finite monoid homomorphism \(h\). The main obstacle beyond the context-free case is that an MCFG nonterminal derives a tuple whose components may be placed in a surrounding sentence in different orders. We introduce sentence-interface types as finite external control objects for such tuple occurrences. A type records the permutation of tuple components in the final sentence together with the \(h\)-values of the boundary intervals between them. For reduced working binary linear nondeleting MCFG presentations whose string languages satisfy \((f,h)\)-tuple substitutability, we build a typed refinement, a finite characteristic sample, and a canonical positive-data learner. Once the sample contains this characteristic sample and remains contained in the target language, the learner reconstructs the language exactly. Consequently, for fixed fan-out bound \(f\) and fixed explicit \(h\), the resulting class is identifiable in the limit from positive data. Moreover, the hypothesis associated with any given finite sample is constructible in polynomial time for fixed \(f\) and fixed \(h\), including output size. Thus sentence-interface control is the finite mechanism that lifts fixed-\(h\) distributional reconstruction from context-free grammars to bounded-fan-out linear MCFGs.
- Abstract(参考訳): 固定的有限モノイド準同型 \(h\) の下で有界ファンアウト線形多重文脈自由文法の正データ学習について検討する。
文脈自由の場合以外の大きな障害は、MCFG非終端が周囲の文に異なる順序で成分を配置できるタプルを導出することである。
このようなタプル発生に対する有限外部制御オブジェクトとして文-インタフェース型を導入する。
型は、その間の境界間隔の \(h\)-値とともに、最終文中のタプル成分の置換を記録する。
文字列言語が \((f,h)\)-tuple 置換性を満足する2次線形非削除型 MCFG プレゼンテーションの縮小のために, 型付き洗練, 有限特性サンプル, 正正データ学習器を構築する。
この特徴サンプルが対象言語に含まれると、学習者は言語を正確に再構築する。
したがって、固定ファンアウト境界 \(f\) と固定明示 \(h\) に対して、得られるクラスは正のデータから極限で識別できる。
さらに、任意の有限標本に関連する仮説は、出力サイズを含む固定 \(f\) と固定 \(h\) の多項式時間で構成可能である。
したがって、文-インタフェース制御は、文脈自由文法から有界ファンアウト線形MCFGへの固定-\(h\)分布再構成を持ち上げる有限メカニズムである。
関連論文リスト
- Primal-Dual Guided Decoding for Constrained Discrete Diffusion [5.219025684249083]
KL正規化最適化問題として制約付き生成を定式化する推定時間法であるプリマル・デュアルガイド付き復号法を提案する。
各復調ステップでは、制約違反に基づくミラー降下により乗算器が更新され、付加的制約依存バイアスによりトークンロジットを修飾する。
ドメイン固有のスコアリング機能によってインスタンス化された1つのアルゴリズムは、関連するドメイン固有の品質指標を保存しながら制約満足度を向上することを示す。
論文 参考訳(メタデータ) (2026-05-10T20:55:19Z) - \texttt{BayesBreak}: Generalized Hierarchical Bayesian Segmentation with Irregular Designs, Multi-Sample Hierarchies, and Grouped/Latent-Group Designs [0.0]
厳密な推論は、狭い可能性クラス、単一シーケンス設定、インデックス・ユニフォームの設計と結びついていることが多い。
textttBayesBreakは、単純な分離を中心に構築されたモジュール型のオフラインベイズセグメンテーションフレームワークである。
共役前駆体を持つ重み付き指数家族確率に対しては、ブロック証拠と後部モーメントは累積的十分な統計量から閉形式で利用できる。
論文 参考訳(メタデータ) (2026-03-16T00:36:16Z) - Zonkey: A Hierarchical Diffusion Language Model with Differentiable Tokenization and Probabilistic Attention [0.0]
Zonkeyは階層的な拡散モデルであり、生文字から文書レベルの表現まで、完全にトレーニング可能なパイプラインを通じて制限に対処する。
コアとなるのは、確率的開始順序(BOS)決定を学習する、差別化可能なトークンである。
Zonkeyは、ノイズからコヒーレントで可変長のテキストを生成し、創発的な階層を示す。
論文 参考訳(メタデータ) (2026-01-29T14:17:37Z) - Partial Feedback Online Learning [88.27143767009376]
我々は、偏見フィードバックオンライン学習と呼ばれる新しい学習プロトコルについて研究する。
各インスタンスは許容できるラベルのセットを許可するが、学習者は1ラウンドごとに許容できるラベルを1つだけ観察する。
論文 参考訳(メタデータ) (2026-01-29T09:39:11Z) - Constrained Discrete Diffusion [61.81569616239755]
本稿では,拡散過程における微分可能制約最適化の新たな統合であるCDD(Constrained Discrete Diffusion)を紹介する。
CDDは直接、離散拡散サンプリングプロセスに制約を課し、トレーニング不要で効果的なアプローチをもたらす。
論文 参考訳(メタデータ) (2025-03-12T19:48:12Z) - Unsupervised Discontinuous Constituency Parsing with Mildly
Context-Sensitive Grammars [14.256041558454786]
教師なし不連続構文解析のための文脈に敏感な文法を用いた文法帰納法について検討した。
提案手法はルール構造を事前に修正し,パラメータ学習を最大限に活用することに焦点を当てる。
ドイツ語とオランダ語の実験から,我々の手法は連続的かつ不連続な構造を持つ言語的に意味のある木を誘導できることが示された。
論文 参考訳(メタデータ) (2022-12-18T18:10:45Z) - Sequential Recommendation via Stochastic Self-Attention [68.52192964559829]
Transformerベースのアプローチでは、アイテムをベクトルとして埋め込んで、ドット積の自己アテンションを使用してアイテム間の関係を測定する。
本稿では,これらの問題を克服するための新しいtextbfStochastic textbfSelf-textbfAttention (STOSA) を提案する。
我々は、アイテムと項目の位置関係を列で特徴づける新しいワッサースタイン自己保持モジュールを考案した。
論文 参考訳(メタデータ) (2022-01-16T12:38:45Z) - Generalized Funnelling: Ensemble Learning and Heterogeneous Document
Embeddings for Cross-Lingual Text Classification [78.83284164605473]
emphFunnelling (Fun)は、最近提案された言語間テキスト分類手法である。
Emph Generalized Funnelling (gFun) はFunの一般化である。
gFunは、Funや最先端のベースラインよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-09-17T23:33:04Z) - A Differentiable Relaxation of Graph Segmentation and Alignment for AMR
Parsing [75.36126971685034]
我々は、アライメントとセグメンテーションをモデルの潜在変数として扱い、エンドツーエンドのトレーニングの一部としてそれらを誘導する。
また,AMRの個々の構造を扱うために手作りされたLyu2018AMRPAのセグメンテーションルールに依存するモデルにもアプローチした。
論文 参考訳(メタデータ) (2020-10-23T21:22:50Z) - An Integer Linear Programming Framework for Mining Constraints from Data [81.60135973848125]
データから制約をマイニングするための一般的なフレームワークを提案する。
特に、構造化された出力予測の推論を整数線形プログラミング(ILP)問題とみなす。
提案手法は,9×9のスドクパズルの解法を学習し,基礎となるルールを提供することなく,例からツリー問題を最小限に分散させることが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-18T20:09:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。