論文の概要: Next Token Prediction Is a Dead End for Creativity
- arxiv url: http://arxiv.org/abs/2505.19277v1
- Date: Sun, 25 May 2025 19:18:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.027441
- Title: Next Token Prediction Is a Dead End for Creativity
- Title(参考訳): 次世代のトーケン予測は、創造性に終止符を打つ
- Authors: Ibukun Olatunji, Mark Sheppard,
- Abstract要約: トークンの予測は、基本的に実際の創造性と不一致である、と我々は主張する。
創造性を予測的なアウトプットではなくインタラクティブなプロセスとして考えることで、より表現力があり、応答性があり、人間の創造的なプラクティスと整合するAIシステムに対するビジョンを提供します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper argues that token prediction is fundamentally misaligned with real creativity. While next-token models have enabled impressive advances in language generation, their architecture favours surface-level coherence over spontaneity, originality, and improvisational risk. We use battle rap as a case study to expose the limitations of predictive systems, demonstrating that they cannot truly engage in adversarial or emotionally resonant exchanges. By reframing creativity as an interactive process rather than a predictive output, we offer a vision for AI systems that are more expressive, responsive, and aligned with human creative practice.
- Abstract(参考訳): トークン予測は、本質的に実際の創造性と不一致である、と論じる。
次世代モデルは言語生成の大幅な進歩を可能にしているが、そのアーキテクチャは自発性、独創性、即興的リスクよりも表面レベルのコヒーレンスを好む。
我々は、予測システムの限界を明らかにするためのケーススタディとしてバトルラップを使用し、それらが真に敵対的または感情的に共鳴する交換を行うことができないことを示す。
創造性を予測的なアウトプットではなくインタラクティブなプロセスとして考えることで、より表現力があり、応答性があり、人間の創造的なプラクティスと整合するAIシステムに対するビジョンを提供します。
関連論文リスト
- The Art of Generative Narrativity [0.0]
生成AIは、聴衆の経験を通じて物語を引用する可能性を持つ非言語形式の実験につながる。
5つの中央セクションにおいて,現代言語自動化の課題を予見し,その根底にある概念的枠組みを考察する。
閉会の節では、これらの模範者の表現的特徴を要約し、生成的AIの文化的影響と失敗を批判的に評価する価値を下記する。
論文 参考訳(メタデータ) (2026-03-01T12:58:24Z) - ADEPT: RL-Aligned Agentic Decoding of Emotion via Evidence Probing Tools -- From Consensus Learning to Ambiguity-Driven Emotion Reasoning [67.22219034602514]
ADEPT(Agentic Decoding of Emotion via Evidence Probing Tools)は,感情認識をマルチターン探索プロセスとして再構成するフレームワークである。
ADEPTはSLLMを進化する候補感情を維持するエージェントに変換し、専用のセマンティックおよび音響探査ツールを適応的に呼び出す。
ADEPTは、ほとんどの設定において主感情の精度を向上し、微妙な感情の特徴を著しく改善することを示した。
論文 参考訳(メタデータ) (2026-02-13T08:33:37Z) - Reflection Pretraining Enables Token-Level Self-Correction in Biological Sequence Models [82.79223371188756]
CoT(Chain-of-Thought)は、大規模言語モデルを用いた自然言語処理において、高度なタスク解決機能を備えている。
CoTをタンパク質やRNA言語モデルのような非自然言語ドメインに適用することは、まだ不可能である。
生物シークエンスモデルではじめて事前学習を導入し、中間的推論を行えるようにした。
論文 参考訳(メタデータ) (2025-12-24T05:25:17Z) - DeceptionBench: A Comprehensive Benchmark for AI Deception Behaviors in Real-world Scenarios [57.327907850766785]
現実的な現実のシナリオにまたがる騙しのキャラクタリゼーションは未解明のままである。
DeceptionBenchは、さまざまなドメインにまたがる認知傾向を体系的に評価する最初のベンチマークです。
本研究は,本質的な側面から,ユーザ満足度を優先する自己関心のエゴスティックな傾向を示すモデルや,サイコファンティックな行動を示すモデルについて検討する。
実世界のフィードバックダイナミクスのより現実的なシミュレーションを構築するために,持続的マルチターン相互作用ループを組み込んだ。
論文 参考訳(メタデータ) (2025-10-17T10:14:26Z) - Are Modern Speech Enhancement Systems Vulnerable to Adversarial Attacks? [30.146146330834938]
本研究は, 音声強調モデルに対向雑音を注入できることを示す。
予測音声強調モデルが実際にこのような方法で操作可能であることを実験的に検証する。
我々は, サンプルを用いた拡散モデルが, 設計によるこのような敵攻撃に対して, 本質的に堅牢性を示すことを強調した。
論文 参考訳(メタデータ) (2025-09-25T12:39:19Z) - Ego-centric Predictive Model Conditioned on Hand Trajectories [52.531681772560724]
自我中心のシナリオでは、次の行動とその視覚的結果の両方を予測することは、人間と物体の相互作用を理解するために不可欠である。
我々は,エゴセントリックなシナリオにおける行動と視覚的未来を共同でモデル化する,統合された2段階予測フレームワークを提案する。
我々のアプローチは、エゴセントリックな人間の活動理解とロボット操作の両方を扱うために設計された最初の統一モデルである。
論文 参考訳(メタデータ) (2025-08-27T13:09:55Z) - Intention-Guided Cognitive Reasoning for Egocentric Long-Term Action Anticipation [52.6091162517921]
INSIGHTは、エゴセントリックなアクション予測のための2段階のフレームワークである。
最初の段階では、INSIGHTは手動オブジェクトの相互作用領域から意味的にリッチな特徴を抽出することに焦点を当てている。
第2段階では、明示的な認知的推論をシミュレートする強化学習ベースのモジュールを導入する。
論文 参考訳(メタデータ) (2025-08-03T12:52:27Z) - Discrete JEPA: Learning Discrete Token Representations without Reconstruction [23.6286989806018]
認知知性の象徴的な基礎は、観測から隠れたパターンを抽出することにある。
本稿では,意味的トークン化による潜在予測符号化フレームワークであるDisdisrete-JEPAを提案する。
我々のアプローチは、人工知能システムにおける世界モデリングと計画能力の進歩に大きな影響を与えることを約束する。
論文 参考訳(メタデータ) (2025-06-17T10:15:17Z) - Rethinking Causal Mask Attention for Vision-Language Inference [17.450072268270773]
本研究では,異なる因果マスキング戦略が視覚言語推論にどのように影響するかを検討する。
我々は,この設定に適した今後の注目の家族を提案する。
将来的な意味的コンテキストを過去の表現に選択的に圧縮することは推論に有効であることを示す。
論文 参考訳(メタデータ) (2025-05-24T08:59:28Z) - Recent Advances in Discrete Speech Tokens: A Review [25.038527125935747]
離散的な音声トークンは、その離散的でコンパクトで簡潔な性質によって特徴づけられ、効率的な伝送と記憶に有利である。
現在の研究は、個別の音声トークンを音響トークンと意味トークンの2つの主要なクラスに分類し、それぞれがリッチな研究領域へと発展してきた。
本研究は,既存の分類学と最近の音声トークン化の革新を体系的に合成し,各パラダイムの長所と短所を批判的に検討し,トークンタイプ間での系統的比較を提示する。
論文 参考訳(メタデータ) (2025-02-10T14:08:25Z) - Alien Recombination: Exploring Concept Blends Beyond Human Cognitive Availability in Visual Art [90.8684263806649]
視覚芸術の創造において、AIが人間の認知的限界を超越する方法を示します。
我々の研究は、視覚芸術には膨大な未探索の概念的組み合わせが含まれているという仮説を立てている。
本稿では,人間の認知能力を超えた概念の組み合わせを同定し,生成するエイリアン組換え法を提案する。
論文 参考訳(メタデータ) (2024-11-18T11:55:38Z) - Where Am I and What Will I See: An Auto-Regressive Model for Spatial Localization and View Prediction [60.964512894143475]
本稿では,空間的局所化とビュー予測を共同で扱う新しい自動回帰フレームワークである生成空間変換器(GST)を提案する。
本モデルでは,カメラのポーズを1つの画像から同時に推定し,新しいカメラのポーズから視点を予測し,空間認識と視覚予測のギャップを効果的に埋める。
論文 参考訳(メタデータ) (2024-10-24T17:58:05Z) - DiffuseDef: Improved Robustness to Adversarial Attacks via Iterative Denoising [35.10201243366131]
DiffuseDefは、言語分類タスクのための新しい敵防御手法である。
拡散層をエンコーダと分類器の間のデノイザとして組み込む。
これは、一般的なブラックボックスやホワイトボックスの敵攻撃に対して最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-28T22:36:17Z) - Expressivity and Speech Synthesis [51.75420054449122]
われわれはこれまでの方法論の進歩を概説し、その次のレベルの人工表現性に到達するための継続的な取り組みを概説した。
また、社会的な意味と、急速に進歩する表現型音声合成(ESS)技術についても論じる。
論文 参考訳(メタデータ) (2024-04-30T08:47:24Z) - Few-Shot Adversarial Prompt Learning on Vision-Language Models [62.50622628004134]
知覚不能な逆境摂動に対するディープニューラルネットワークの脆弱性は、広く注目を集めている。
それまでの努力は、相手の視覚的特徴をテキストの監督と整合させることで、ゼロショットの敵の堅牢性を達成した。
本稿では、限られたデータで入力シーケンスを適応させることで、対向性を大幅に向上させる、数ショットの対向的プロンプトフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-21T18:28:43Z) - A Survey on Transferability of Adversarial Examples across Deep Neural Networks [53.04734042366312]
逆の例では、機械学習モデルを操作して誤った予測を行うことができます。
敵の例の転送可能性により、ターゲットモデルの詳細な知識を回避できるブラックボックス攻撃が可能となる。
本研究は, 対角移動可能性の展望を考察した。
論文 参考訳(メタデータ) (2023-10-26T17:45:26Z) - FATRER: Full-Attention Topic Regularizer for Accurate and Robust
Conversational Emotion Recognition [18.377696715586396]
本稿では,フルアテンショントピック正規化器によって強化された感情認識器を提案する。
表現と損失の両方の観点から正規化を実装するために,共同トピックモデリング戦略が導入された。
実験により,我々のモデルは最先端モデルよりも良好な結果が得られることが示された。
論文 参考訳(メタデータ) (2023-07-23T04:01:24Z) - The Creative Frontier of Generative AI: Managing the Novelty-Usefulness
Tradeoff [0.4873362301533825]
生成人工知能(AI)システムにおける新規性と有用性の最適バランスについて検討する。
どちらの側面も過度に強調すると、幻覚や暗記のような限界に繋がる。
論文 参考訳(メタデータ) (2023-06-06T11:44:57Z) - NaturalAdversaries: Can Naturalistic Adversaries Be as Effective as
Artificial Adversaries? [61.58261351116679]
自然言語理解タスクのための2段階の逆例生成フレームワーク(NaturalAdversaries)を提案する。
モデルパラメータへのアクセスレベルに基づいて、ブラックボックスとホワイトボックスの双方に適応可能である。
以上の結果から,これらの対立はドメイン全体にわたって一般化され,ニューラルネットワーク分類モデルの堅牢性向上に向けた今後の研究への洞察が得られた。
論文 参考訳(メタデータ) (2022-11-08T16:37:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。