論文の概要: An Alternative Trajectory for Generative AI
- arxiv url: http://arxiv.org/abs/2603.14147v1
- Date: Sat, 14 Mar 2026 22:33:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-17 16:19:35.632583
- Title: An Alternative Trajectory for Generative AI
- Title(参考訳): ジェネレーティブAIのための代替軌道
- Authors: Margarita Belova, Yuval Kansal, Yihao Liang, Jiaxin Xiao, Niraj K. Jha,
- Abstract要約: 本稿では,ドメイン固有超知能に基づく代替トラジェクトリを提案する。
1つの巨大なジェネラリストモデルではなく、我々は「DSSモデルの社会」を想定する。
このパラダイムは、能力をサイズから切り離して、インテリジェンスをエネルギー集約型データセンタから、セキュアなオンデバイスエキスパートに移行することを可能にする。
- 参考スコア(独自算出の注目度): 4.176445342688645
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The generative artificial intelligence (AI) ecosystem is undergoing rapid transformations that threaten its sustainability. As models transition from research prototypes to high-traffic products, the energetic burden has shifted from one-time training to recurring, unbounded inference. This is exacerbated by reasoning models that inflate compute costs by orders of magnitude per query. The prevailing pursuit of artificial general intelligence through scaling of monolithic models is colliding with hard physical constraints: grid failures, water consumption, and diminishing returns on data scaling. This trajectory yields models with impressive factual recall but struggles in domains requiring in-depth reasoning, possibly due to insufficient abstractions in training data. Current large language models (LLMs) exhibit genuine reasoning depth only in domains like mathematics and coding, where rigorous, pre-existing abstractions provide structural grounding. In other fields, the current approach fails to generalize well. We propose an alternative trajectory based on domain-specific superintelligence (DSS). We argue for first constructing explicit symbolic abstractions (knowledge graphs, ontologies, and formal logic) to underpin synthetic curricula enabling small language models to master domain-specific reasoning without the model collapse problem typical of LLM-based synthetic data methods. Rather than a single generalist giant model, we envision "societies of DSS models": dynamic ecosystems where orchestration agents route tasks to distinct DSS back-ends. This paradigm shift decouples capability from size, enabling intelligence to migrate from energy-intensive data centers to secure, on-device experts. By aligning algorithmic progress with physical constraints, DSS societies move generative AI from an environmental liability to a sustainable force for economic empowerment.
- Abstract(参考訳): 生成的人工知能(AI)エコシステムは、その持続可能性を脅かす急激な変革を実行している。
モデルが研究プロトタイプからハイトラフィック製品へと移行するにつれ、エネルギー負荷は1回のトレーニングから、繰り返し、非バウンドな推論へとシフトした。
これは、クエリ毎に桁違いの計算コストを増大させる推論モデルによって悪化する。
モノリシックモデルのスケーリングによる人工知能の一般的な追求は、グリッド障害、水消費、データスケーリングのリターンの減少といった厳しい物理的制約と結びついている。
この軌道は、印象的な事実的リコールを伴うモデルを生成するが、おそらくはトレーニングデータの抽象化が不十分なため、詳細な推論を必要とする領域で苦労する。
現在の大規模言語モデル(LLM)は、厳密で既存の抽象概念が構造的基盤を提供する数学やコーディングのような領域でのみ真の推論深度を示す。
他の分野では、現在のアプローチはうまく一般化できない。
本稿では,ドメイン固有超知能(DSS)に基づく代替トラジェクトリを提案する。
LLMベースの合成データ手法に典型的なモデル崩壊問題なしに、小言語モデルでドメイン固有の推論をマスターできる合成カリキュラムを基盤として、明示的な記号抽象(知識グラフ、オントロジー、形式論理)を最初に構築することを議論する。
オーケストレーションエージェントがタスクをDSSバックエンドにルーティングする動的エコシステム。
このパラダイムは、能力をサイズから切り離して、インテリジェンスをエネルギー集約型データセンタから、セキュアなオンデバイスエキスパートに移行することを可能にする。
アルゴリズムの進歩を物理的制約と整合させることで、DSS社会は生成AIを環境責任から持続可能な経済力へと移動させる。
関連論文リスト
- RADAR: Closed-Loop Robotic Data Generation via Semantic Planning and Autonomous Causal Environment Reset [48.645870795753105]
ロボットのためのロバスト自動データ取得(RADAR)について紹介する。
RADARは完全に自律的でクローズドループのデータ生成エンジンで、収集サイクルから人間の介入を完全に取り除きます。
シミュレーションでは、複雑な長期タスクにおいて、最大90%の成功率を達成する。
論文 参考訳(メタデータ) (2026-03-12T11:18:52Z) - History-Aware Neural Operator: Robust Data-Driven Constitutive Modeling of Path-Dependent Materials [8.579506050944875]
本研究では、ニューラルネットワークを用いた非弾性材料のデータ駆動モデリングのためのエンドツーエンド学習フレームワークを提案する。
近年のストレス・ストレス・ヒストリーの短い部分から経路依存的な物質応答を予測する自己回帰モデルであるヒストリー・アウェア・ニューラル・オペレータ(HANO)を開発した。
我々は, 脆性固体の弾塑性と進行異方性損傷の2つのベンチマーク問題に対してHANOを評価した。
論文 参考訳(メタデータ) (2025-06-12T05:19:17Z) - Shifting AI Efficiency From Model-Centric to Data-Centric Compression [67.45087283924732]
AI研究の焦点は、モデル中心の圧縮からデータ中心の圧縮へとシフトしている、と私たちは主張する。
データ中心圧縮は、モデルトレーニングや推論中に処理されたデータのボリュームを直接圧縮することで、AI効率を向上させる。
我々の研究は、AIの効率性に関する新たな視点を提供し、既存の取り組みを合成し、コンテキスト長の増大によって引き起こされる課題に対処するためにイノベーションを触媒することを目的としています。
論文 参考訳(メタデータ) (2025-05-25T13:51:17Z) - Generalising from Self-Produced Data: Model Training Beyond Human Constraints [0.0]
本稿では,AIモデルが新たな知識を自律的に生成し,検証する新しい枠組みを提案する。
このアプローチの中心は、人間のベンチマークを必要とせずに学習をガイドする、無制限で使い捨ての数値報酬である。
論文 参考訳(メタデータ) (2025-04-07T03:48:02Z) - DSMoE: Matrix-Partitioned Experts with Dynamic Routing for Computation-Efficient Dense LLMs [86.76714527437383]
本稿では,事前学習したFFN層を計算ブロックに分割することで,分散化を実現するDSMoEを提案する。
我々は,Sigmoid アクティベーションとストレートスルー推定器を用いた適応型エキスパートルーティングを実装し,トークンがモデル知識の様々な側面に柔軟にアクセスできるようにする。
LLaMAモデルを用いた実験により、DSMoEは既存のプルーニング法やMoE法に比べて優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-02-18T02:37:26Z) - Learning by Surprise: Surplexity for Mitigating Model Collapse in Generative AI [1.6545633988217645]
合成コンテンツがWebに浸透するにつれて、生成的AIモデルは自身の出力で再訓練される可能性がある。
これによってモデルが崩壊し、世代間でパフォーマンスと多様性が徐々に失われます。
本稿では,モデルの次点確率分布から直接崩壊を特徴付ける新しい尺度を提案する。
論文 参考訳(メタデータ) (2024-10-16T08:02:48Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。