論文の概要: On Union-Closedness of Language Generation
- arxiv url: http://arxiv.org/abs/2506.18642v1
- Date: Mon, 23 Jun 2025 13:42:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:37.004402
- Title: On Union-Closedness of Language Generation
- Title(参考訳): 言語生成の統一性について
- Authors: Steve Hanneke, Amin Karbasi, Anay Mehrotra, Grigoris Velegkas,
- Abstract要約: Kleinberg と Mullainathan によるモデルで,Li,Raman,Tewari によって拡張された言語生成について検討する。
我々の結果は、生成可能なクラスや不均一に生成可能なクラスの有限和を証明することによって、Li と al. の2つの開問題を解決する。
提案手法は,言語生成の進展領域に独立した関心を持つ可能性のある,新たな対角化の議論とともに,注意深く構築されたクラスを利用する。
- 参考スコア(独自算出の注目度): 48.36356615217017
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We investigate language generation in the limit - a model by Kleinberg and Mullainathan [NeurIPS 2024] and extended by Li, Raman, and Tewari [COLT 2025]. While Kleinberg and Mullainathan proved generation is possible for all countable collections, Li et al. defined a hierarchy of generation notions (uniform, non-uniform, and generatable) and explored their feasibility for uncountable collections. Our first set of results resolve two open questions of Li et al. by proving finite unions of generatable or non-uniformly generatable classes need not be generatable. These follow from a stronger result: there is a non-uniformly generatable class and a uniformly generatable class whose union is non-generatable. This adds to the aspects along which language generation in the limit is different from traditional tasks in statistical learning theory like classification, which are closed under finite unions. In particular, it implies that given two generators for different collections, one cannot combine them to obtain a single "more powerful" generator, prohibiting this notion of boosting. Our construction also addresses a third open question of Li et al. on whether there are uncountable classes that are non-uniformly generatable and do not satisfy the eventually unbounded closure (EUC) condition introduced by Li, Raman, and Tewari. Our approach utilizes carefully constructed classes along with a novel diagonalization argument that could be of independent interest in the growing area of language generation.
- Abstract(参考訳): Kleinberg と Mullainathan [NeurIPS 2024] によるモデルで,Li,Raman,Tewari (COLT 2025) によって拡張された言語生成について検討する。
Kleinberg と Mullainathan はすべての可算コレクションに対して生成が可能であることを証明したが、Li ら al は生成概念(ユニフォーム、非ユニフォーム、ジェネラタブル)の階層を定義し、非可算コレクションに対するそれらの実現可能性を探った。
生成可能級数あるいは非一様級数の有限和を証明し、Li と al の開問題2つを解く。
これらはより強い結果から従う: 一様でない生成可能なクラスと一様に生成可能なクラスがあり、結合は生成不可能である。
このことは、極限における言語生成が、有限の結合の下で閉じた分類のような統計学習理論における伝統的なタスクとは異なる側面を増す。
特に、異なるコレクションに対して2つのジェネレータが与えられた場合、それらを組み合わせて1つの"より強力な"ジェネレータを得ることはできない。
我々の構成は、Li, Raman, Tewari が導入した最終的に有界な閉包(EUC)条件を満たさない非可算類が存在するかどうかに関して、Li と al に関する第3のオープンな疑問にも対処する。
提案手法は,言語生成の進展領域に独立した関心を持つ可能性のある,新たな対角化の議論とともに,注意深く構築されたクラスを利用する。
関連論文リスト
- Characterizations of Language Generation With Breadth [16.30681257128492]
Kleinberg と Mullainathan [KM24] が導入した言語生成の限界について検討する。
KM24は、制限の任意の可算言語コレクションから文字列を生成するアルゴリズムを提案した。
正確な幅を持つ世代はAngluinの同定条件によって特徴づけられることを示す。
論文 参考訳(メタデータ) (2024-12-24T16:24:43Z) - Exploring Facets of Language Generation in the Limit [10.18252143035175]
任意の可算言語コレクションは、その極限において非一様生成の強い特性を持つ生成子を持つことを示す。
我々は,[KM24]の生成アルゴリズムにおける妥当性と幅の緊張関係を,徹底的な生成の定義を導入して定式化する。
また,包括的生成が可能な言語コレクションの正確な特徴付けも提供する。
論文 参考訳(メタデータ) (2024-11-22T22:13:40Z) - Generation through the lens of learning theory [18.355039522639565]
統計的学習理論のレンズを通して生成を研究する。
我々は「一様」および「非一様」生成と呼び、どの仮説類が一様かつ一様でない生成可能かを特徴づける。
論文 参考訳(メタデータ) (2024-10-17T16:14:49Z) - Unlocking Anticipatory Text Generation: A Constrained Approach for Large Language Models Decoding [75.06872859716049]
大規模言語モデル(LLM)は、テキスト生成の強力な能力を示している。
毒性や幻覚などの望ましくない行動が現れることがある。
将来制約付き生成問題としてテキスト生成の形式化を提案する。
論文 参考訳(メタデータ) (2023-12-11T06:35:33Z) - Unextendibility, uncompletability, and many-copy indistinguishable ensembles [49.1574468325115]
任意の二分的純絡み合った状態の補集合は、最大濃度の非直交的拡張不可能な積基底(nUPB)を形成する積状態によって分散されることを示す。
また,混合状態の減少に伴い局所的不識別性が増大する多部構成多部構成不識別アンサンブルのクラスについても報告する。
論文 参考訳(メタデータ) (2023-03-30T16:16:41Z) - Conditional Hybrid GAN for Sequence Generation [56.67961004064029]
本稿では,この問題を解決するための条件付きハイブリッドGAN(C-Hybrid-GAN)を提案する。
我々はGumbel-Softmax法を利用して離散値列の分布を近似する。
提案したC-Hybrid-GANは、文脈条件付き離散値シーケンス生成において既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-09-18T03:52:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。