論文の概要: LatticeBridge: Rare-Event Sequential Inference for Faithful Structured Sequence Synthesis
- arxiv url: http://arxiv.org/abs/2606.11203v1
- Date: Wed, 22 Apr 2026 09:24:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.827896
- Title: LatticeBridge: Rare-Event Sequential Inference for Faithful Structured Sequence Synthesis
- Title(参考訳): LatticeBridge: 忠実な構造配列合成のための希少事象系列推論
- Authors: Faruk Alpay, Bugra Kilictas,
- Abstract要約: 構造的シーケンス生成は、1つの出力で複数の入力由来の制約を満たすためにモデルを必要とすることが多い。
LatticeBridgeは、コンパクトなプレフィックス言語モデル、インスタンスコンパイルされたサーフェスオートマトン、およびねじれたシーケンシャルなモンテカルロデコーダを組み合わせる。
LatticeBridgeは正確なアンカー満足度と平均アンカーカバレッジを向上させる。
- 参考スコア(独自算出の注目度): 0.5729426778193398
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Structured sequence generation often requires a model to satisfy several input-derived constraints in a single output. Standard decoding methods may assign high probability to fluent continuations while placing low mass on continuations that realize all required anchors jointly. We study this regime as a rare-event sequential inference problem. LatticeBridge combines a compact prefix language model, instance-compiled surface automata, and a twisted sequential Monte Carlo (SMC) decoder with resampling, multilevel splitting, and a source-support proposal term derived from instance-provided phrases. The constraint representation is compiled from each input instance and does not rely on manually curated lexical classes. On 2,610 attainable validation tasks spanning CommonGen, E2E NLG, and WikiBio, the particle decoder improves exact anchor satisfaction and mean anchor coverage over greedy, beam-filtered, and best-of-k ancestral baselines under a shared proposal model. Since exact anchor satisfaction alone does not rule out unsupported attribute substitutions, the evaluation reports required-anchor coverage, source coverage, source-intrusion diagnostics, overlap, runtime, and particle statistics jointly. The benchmark characterizes the faithfulness-overlap-latency frontier under a fixed proposal model.
- Abstract(参考訳): 構造的シーケンス生成は、1つの出力で複数の入力由来の制約を満たすためにモデルを必要とすることが多い。
標準的な復号法は、必要なすべてのアンカーを同時に実現した継続に低質量を配置しながら、流動的な継続に高い確率を割り当てることができる。
我々はこの状態を稀な逐次推論問題として研究する。
LatticeBridgeは、コンパクトなプレフィックス言語モデル、インスタンスコンパイルされたサーフェスオートマトン、および、再サンプリング、マルチレベル分割、およびインスタンス提供されたフレーズから派生したソースサポート提案項を含む、ねじれたシーケンシャルなモンテカルロデコーダを組み合わせたものである。
制約表現は各入力インスタンスからコンパイルされ、手動で計算された語彙クラスに依存しない。
CommonGen、E2E NLG、WikiBioにまたがる2,610の達成可能な検証タスクでは、パーティクルデコーダは、共有提案モデルの下で、グリージー、ビームフィルタ、および最高の祖先のベースラインよりも正確なアンカー満足度と平均アンカーカバレッジを向上させる。
正確なアンカー満足度だけでは、サポート対象の属性置換を規定しないため、評価では、必要アンカーカバレッジ、ソースカバレッジ、ソース侵入診断、オーバーラップ、実行時、および粒子統計を共同で報告する。
このベンチマークは、固定された提案モデルの下で忠実度オーバーラップレイテンシフロンティアを特徴付ける。
関連論文リスト
- Hacking Generative Perplexity: Why Unconditional Text Evaluation Needs Distributional Metrics [49.443264461057645]
拡散および連続フローベースの言語モデルは、言語モデリングに対する非自己回帰的な主要な代替手段として現れている。
両方のパラダイムの進歩は、生成的複雑度(gen-PPL)によって圧倒的に追跡される。
我々は、この指標は正しくないと主張している。構築により、gen-PPLは、文法性やセマンティックコヒーレンスではなく、スコアARの下でのみ予測可能性を測定する。
論文 参考訳(メタデータ) (2026-06-07T02:35:56Z) - Mitigating Bias in Locally Constrained Decoding via Tractable Proposals [73.78736135699953]
既存の局所的制約付き復号法は、ミオプティックに次のトークンを隠蔽することで制約を強制する。
最近の研究では、シーケンシャルなモンテカルロ法を用いてバイアスを緩和しているが、効果的な提案分布や潜在的な関数を設計することは重要な課題である。
我々は、$p_mathrmlm( cdot mid mathrmconstraint)$からSMCサンプリングのための提案とポテンシャルを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2026-06-01T08:58:18Z) - Context Pruning for Coding Agents via Multi-Rubric Latent Reasoning [14.508049757681862]
LLMベースのコーディングエージェントは、トークンの予算の大部分をリポジトリファイルを読むのに費やしている。
この定式化がモデリングのボトルネックを生み出すことを示す。
コード関連性を2つの解釈可能な品質次元に分解する構造化プルーニングフレームワークであるLaMRを提案する。
論文 参考訳(メタデータ) (2026-05-14T18:30:10Z) - Asymmetric Generative Recommendation via Multi-Expert Projection and Multi-Faceted Hierarchical Quantization [39.92412918837748]
AsymRecは、入力と出力の表現を分離する非対称な連続離散フレームワークである。
常に最先端のジェネレーティブ・レコメンデーターを平均15.8%上回っている。
論文 参考訳(メタデータ) (2026-05-14T07:55:43Z) - Beyond Scattered Acceptance: Fast and Coherent Inference for DLMs via Longest Stable Prefixes [10.877713536966601]
Longestahead Prefix(LSP)スケジューラは、モノリシックプレフィックスの吸収に基づく、トレーニング不要でモデルに依存しない推論パラダイムである。
LSPは1つのフォワードパスを介してトークンの安定性を評価し、安定な予測の連続した左整列ブロックを動的に識別する。
原子のコミットメントの前に、言語や構造的受容の境界を画定する。
論文 参考訳(メタデータ) (2026-03-05T18:25:26Z) - PRISM: Purified Representation and Integrated Semantic Modeling for Generative Sequential Recommendation [28.629759086187352]
本稿では,PRISMとPureified RepresentationとIntegrated Semantic Modelingを組み合わせた新しい生成レコメンデーションフレームワークを提案する。
PRISMは4つの実世界のデータセットで、最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-01-23T08:50:16Z) - Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling [90.86991492288487]
トークンの制約を評価するのは 違法にコストがかかる
LCDは文字列上のグローバル分布を歪め、ローカル情報のみに基づいてトークンをサンプリングすることができる。
我々のアプローチは最先端のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-07T18:30:18Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - Retrieve-and-Fill for Scenario-based Task-Oriented Semantic Parsing [110.4684789199555]
シナリオベースのセマンティックパーシングを導入し、最初に発話の「scenario」を曖昧にする必要がある元のタスクの変種を紹介します。
この定式化により、タスクの粗くきめ細かな側面を分離することが可能となり、それぞれがオフザシェルフニューラルネットワークモジュールで解決される。
私たちのモデルはモジュール化され、差別化可能で、解釈可能で、シナリオから余分な監督を得られるようになります。
論文 参考訳(メタデータ) (2022-02-02T08:00:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。