論文の概要: Quantifying Noise in Language Generation
- arxiv url: http://arxiv.org/abs/2601.21237v1
- Date: Thu, 29 Jan 2026 03:58:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.558179
- Title: Quantifying Noise in Language Generation
- Title(参考訳): 言語生成におけるノイズの定量化
- Authors: Aaron Li, Ian Zhang,
- Abstract要約: 均一な生成と非一様生成の両方において、単一ノイズ文字列が生成可能なコレクションの集合を厳密に減少させることを示す。
非一様雑音依存性に関する最初の特徴付けを行う。
- 参考スコア(独自算出の注目度): 0.3795745240553126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Kleinberg and Mullainathan recently proposed a formal framework for studying the phenomenon of language generation, called language generation in the limit. In this model, an adversary gives an enumeration of example strings from an unknown target language, and the algorithm is tasked with correctly generating unseen strings from the target language within finite time. Refined notions of non-uniform and uniform generation were later introduced by Li, Raman, and Tewari (2025), and a noisy model was introduced by Raman and Raman (2025), which allows the adversary to insert extraneous strings. A natural question in the noisy model is to quantify the effect of noise, by studying the impact of each additional extraneous string. We show two complementary results in this setting. We first show that for both uniform and non-uniform generation, a single noisy string strictly reduces the set of collections that can be generated, thus answering an open question in Raman and Raman (2025). Then, we show for both uniform and non-uniform generation that generation with a single noisy string is equivalent to generation with any finite amount of noise, sharply contrasting with the strict hierarchy for noisy generation in the limit shown by Bai, Panigrahi, and Zhang (2026). Finally, we leverage our previous results to provide the first known characterization for non-uniform noise-dependent generatability.
- Abstract(参考訳): Kleinberg氏とMullainathan氏は最近、言語生成という言語生成の現象を研究するための正式なフレームワークを提案した。
このモデルでは、敵は未知の対象言語からサンプル文字列の列挙を行い、アルゴリズムは有限時間以内に対象言語から未知の文字列を正しく生成する。
非一様および一様生成の概念は後に Li, Raman, and Tewari (2025) によって導入され、Raman and Raman (2025) によってノイズモデルが導入された。
ノイズモデルにおける自然な疑問は、各追加の外部弦の影響を研究することによって、ノイズの効果を定量化することである。
この設定では2つの相補的な結果を示す。
まず、一様生成と非一様生成の両方に対して、単一の雑音列が生成可能なコレクションの集合を厳密に減らし、ラマンとラマン(2025)の開問題に答えることを示す。
そして、一個の雑音列を持つ生成が任意の有限量の雑音を持つ生成と等価であることを示し、Bai, Panigrahi, Zhang (2026) で示される極限における雑音生成の厳密な階層と鋭く対比する。
最後に, 従来の結果を利用して, 非一様ノイズ依存的生成性の評価を行った。
関連論文リスト
- Language Generation with Infinite Contamination [17.31852533022177]
そこでは,未知のターゲット言語である$K$から文字列の逆列挙をアルゴリズムが観測する。
私たちは、驚くべきことに、密度のある世代は、同じ一般性で達成可能であることを示しています。
これは、カリキュラム学習がノイズの多いWebデータから学ぶために重要であることを示唆している。
論文 参考訳(メタデータ) (2025-11-10T18:59:39Z) - Language Generation in the Limit: Noise, Loss, and Feedback [10.280148603465697]
一様生成可能なコレクションの有限和が極限において生成可能であることを示し、非一様生成に対して同じことが真であるかどうかを問う。
均一および非一様生成に対するこれらのモデルの等価性を示し、非一様雑音発生のキャラクタリゼーションを提供する。
論文 参考訳(メタデータ) (2025-07-21T07:18:04Z) - On Union-Closedness of Language Generation [48.36356615217017]
Kleinberg と Mullainathan によるモデルで,Li,Raman,Tewari によって拡張された言語生成について検討する。
我々の結果は、生成可能なクラスや不均一に生成可能なクラスの有限和を証明することによって、Li と al. の2つの開問題を解決する。
提案手法は,言語生成の進展領域に独立した関心を持つ可能性のある,新たな対角化の議論とともに,注意深く構築されたクラスを利用する。
論文 参考訳(メタデータ) (2025-06-23T13:42:25Z) - On Characterizations for Language Generation: Interplay of Hallucinations, Breadth, and Stability [16.30681257128492]
[KM24] は、その極限における任意の可算言語コレクションから生成するアルゴリズムである。
近年の研究では、広さの異なる概念を導入し、広さの世代が可能であるかを探求している。
以上の結果から,安定性が要求される場合には,多くの既存概念による生成が等しく困難になることが示唆された。
論文 参考訳(メタデータ) (2024-12-24T16:24:43Z) - Exploring Facets of Language Generation in the Limit [10.18252143035175]
任意の可算言語コレクションは、その極限において非一様生成の強い特性を持つ生成子を持つことを示す。
我々は,[KM24]の生成アルゴリズムにおける妥当性と幅の緊張関係を,徹底的な生成の定義を導入して定式化する。
また,包括的生成が可能な言語コレクションの正確な特徴付けも提供する。
論文 参考訳(メタデータ) (2024-11-22T22:13:40Z) - Gumbel Counterfactual Generation From Language Models [64.55296662926919]
対実的推論が介入と概念的に異なることを示す。
そこで本研究では,真の文字列反事実を生成するためのフレームワークを提案する。
提案手法は,従来の介入手法が望ましくない副作用を有意に生み出しているのに対し,本手法は有意義な反事実を生じさせることを示す。
論文 参考訳(メタデータ) (2024-11-11T17:57:30Z) - Unconditional Audio Generation with Generative Adversarial Networks and
Cycle Regularization [48.55126268721948]
本稿では,歌声のメル-スペクトログラムの無条件生成のためのGANモデルを提案する。
我々は、時間次元のいくつかの構造を誘導するために、ジェネレータに階層的アーキテクチャーを用いる。
歌声生成だけでなく,歌声生成のための新モデルの性能評価を行った。
論文 参考訳(メタデータ) (2020-05-18T08:35:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。