Fugu-MT 論文翻訳(概要): Next Token Prediction Is a Dead End for Creativity

論文の概要: Next Token Prediction Is a Dead End for Creativity

arxiv url: http://arxiv.org/abs/2505.19277v1
Date: Sun, 25 May 2025 19:18:11 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-27 16:58:43.027441
Title: Next Token Prediction Is a Dead End for Creativity
Title（参考訳）: 次世代のトーケン予測は、創造性に終止符を打つ
Authors: Ibukun Olatunji, Mark Sheppard,
Abstract要約: トークンの予測は、基本的に実際の創造性と不一致である、と我々は主張する。創造性を予測的なアウトプットではなくインタラクティブなプロセスとして考えることで、より表現力があり、応答性があり、人間の創造的なプラクティスと整合するAIシステムに対するビジョンを提供します。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: This paper argues that token prediction is fundamentally misaligned with real creativity. While next-token models have enabled impressive advances in language generation, their architecture favours surface-level coherence over spontaneity, originality, and improvisational risk. We use battle rap as a case study to expose the limitations of predictive systems, demonstrating that they cannot truly engage in adversarial or emotionally resonant exchanges. By reframing creativity as an interactive process rather than a predictive output, we offer a vision for AI systems that are more expressive, responsive, and aligned with human creative practice.
Abstract（参考訳）: トークン予測は、本質的に実際の創造性と不一致である、と論じる。次世代モデルは言語生成の大幅な進歩を可能にしているが、そのアーキテクチャは自発性、独創性、即興的リスクよりも表面レベルのコヒーレンスを好む。我々は、予測システムの限界を明らかにするためのケーススタディとしてバトルラップを使用し、それらが真に敵対的または感情的に共鳴する交換を行うことができないことを示す。創造性を予測的なアウトプットではなくインタラクティブなプロセスとして考えることで、より表現力があり、応答性があり、人間の創造的なプラクティスと整合するAIシステムに対するビジョンを提供します。

関連論文リスト

Intention-Guided Cognitive Reasoning for Egocentric Long-Term Action Anticipation [52.6091162517921]
INSIGHTは、エゴセントリックなアクション予測のための2段階のフレームワークである。最初の段階では、INSIGHTは手動オブジェクトの相互作用領域から意味的にリッチな特徴を抽出することに焦点を当てている。第2段階では、明示的な認知的推論をシミュレートする強化学習ベースのモジュールを導入する。
論文参考訳（メタデータ） (2025-08-03T12:52:27Z)
Discrete JEPA: Learning Discrete Token Representations without Reconstruction [23.6286989806018]
認知知性の象徴的な基礎は、観測から隠れたパターンを抽出することにある。本稿では,意味的トークン化による潜在予測符号化フレームワークであるDisdisrete-JEPAを提案する。我々のアプローチは、人工知能システムにおける世界モデリングと計画能力の進歩に大きな影響を与えることを約束する。
論文参考訳（メタデータ） (2025-06-17T10:15:17Z)
Rethinking Causal Mask Attention for Vision-Language Inference [17.450072268270773]
本研究では,異なる因果マスキング戦略が視覚言語推論にどのように影響するかを検討する。我々は,この設定に適した今後の注目の家族を提案する。将来的な意味的コンテキストを過去の表現に選択的に圧縮することは推論に有効であることを示す。
論文参考訳（メタデータ） (2025-05-24T08:59:28Z)
Recent Advances in Discrete Speech Tokens: A Review [25.038527125935747]
離散的な音声トークンは、その離散的でコンパクトで簡潔な性質によって特徴づけられ、効率的な伝送と記憶に有利である。現在の研究は、個別の音声トークンを音響トークンと意味トークンの2つの主要なクラスに分類し、それぞれがリッチな研究領域へと発展してきた。本研究は,既存の分類学と最近の音声トークン化の革新を体系的に合成し,各パラダイムの長所と短所を批判的に検討し,トークンタイプ間での系統的比較を提示する。
論文参考訳（メタデータ） (2025-02-10T14:08:25Z)
Alien Recombination: Exploring Concept Blends Beyond Human Cognitive Availability in Visual Art [90.8684263806649]
視覚芸術の創造において、AIが人間の認知的限界を超越する方法を示します。我々の研究は、視覚芸術には膨大な未探索の概念的組み合わせが含まれているという仮説を立てている。本稿では,人間の認知能力を超えた概念の組み合わせを同定し,生成するエイリアン組換え法を提案する。
論文参考訳（メタデータ） (2024-11-18T11:55:38Z)
Where Am I and What Will I See: An Auto-Regressive Model for Spatial Localization and View Prediction [60.964512894143475]
本稿では,空間的局所化とビュー予測を共同で扱う新しい自動回帰フレームワークである生成空間変換器(GST)を提案する。本モデルでは,カメラのポーズを1つの画像から同時に推定し,新しいカメラのポーズから視点を予測し,空間認識と視覚予測のギャップを効果的に埋める。
論文参考訳（メタデータ） (2024-10-24T17:58:05Z)
DiffuseDef: Improved Robustness to Adversarial Attacks via Iterative Denoising [35.10201243366131]
DiffuseDefは、言語分類タスクのための新しい敵防御手法である。拡散層をエンコーダと分類器の間のデノイザとして組み込む。これは、一般的なブラックボックスやホワイトボックスの敵攻撃に対して最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-06-28T22:36:17Z)
Expressivity and Speech Synthesis [51.75420054449122]
われわれはこれまでの方法論の進歩を概説し、その次のレベルの人工表現性に到達するための継続的な取り組みを概説した。また、社会的な意味と、急速に進歩する表現型音声合成(ESS)技術についても論じる。
論文参考訳（メタデータ） (2024-04-30T08:47:24Z)
Few-Shot Adversarial Prompt Learning on Vision-Language Models [62.50622628004134]
知覚不能な逆境摂動に対するディープニューラルネットワークの脆弱性は、広く注目を集めている。それまでの努力は、相手の視覚的特徴をテキストの監督と整合させることで、ゼロショットの敵の堅牢性を達成した。本稿では、限られたデータで入力シーケンスを適応させることで、対向性を大幅に向上させる、数ショットの対向的プロンプトフレームワークを提案する。
論文参考訳（メタデータ） (2024-03-21T18:28:43Z)
A Survey on Transferability of Adversarial Examples across Deep Neural Networks [53.04734042366312]
逆の例では、機械学習モデルを操作して誤った予測を行うことができます。敵の例の転送可能性により、ターゲットモデルの詳細な知識を回避できるブラックボックス攻撃が可能となる。本研究は, 対角移動可能性の展望を考察した。
論文参考訳（メタデータ） (2023-10-26T17:45:26Z)
FATRER: Full-Attention Topic Regularizer for Accurate and Robust Conversational Emotion Recognition [18.377696715586396]
本稿では,フルアテンショントピック正規化器によって強化された感情認識器を提案する。表現と損失の両方の観点から正規化を実装するために,共同トピックモデリング戦略が導入された。実験により,我々のモデルは最先端モデルよりも良好な結果が得られることが示された。
論文参考訳（メタデータ） (2023-07-23T04:01:24Z)
The Creative Frontier of Generative AI: Managing the Novelty-Usefulness Tradeoff [0.4873362301533825]
生成人工知能(AI)システムにおける新規性と有用性の最適バランスについて検討する。どちらの側面も過度に強調すると、幻覚や暗記のような限界に繋がる。
論文参考訳（メタデータ） (2023-06-06T11:44:57Z)
NaturalAdversaries: Can Naturalistic Adversaries Be as Effective as Artificial Adversaries? [61.58261351116679]
自然言語理解タスクのための2段階の逆例生成フレームワーク(NaturalAdversaries)を提案する。モデルパラメータへのアクセスレベルに基づいて、ブラックボックスとホワイトボックスの双方に適応可能である。以上の結果から,これらの対立はドメイン全体にわたって一般化され,ニューラルネットワーク分類モデルの堅牢性向上に向けた今後の研究への洞察が得られた。
論文参考訳（メタデータ） (2022-11-08T16:37:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。