論文の概要: Sora and V-JEPA Have Not Learned The Complete Real World Model -- A Philosophical Analysis of Video AIs Through the Theory of Productive Imagination
- arxiv url: http://arxiv.org/abs/2407.10311v1
- Date: Mon, 6 May 2024 18:18:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-22 12:59:07.420506
- Title: Sora and V-JEPA Have Not Learned The Complete Real World Model -- A Philosophical Analysis of Video AIs Through the Theory of Productive Imagination
- Title(参考訳): SoraとV-JEPAは、完全な実世界モデルを学んでいない - 創造的イマジネーションの理論によるビデオAIの哲学的分析
- Authors: Jianqiu Zhang,
- Abstract要約: 我々は、カント哲学に基づくコヒーレント世界モデルを生成する生産的想像論を発展させる。
我々は、真の世界理解が可能なコヒーレント世界モデルの3つの必須要素を同定する。
我々は,AI生産的想像力に基づくエンジンのための革新的なトレーニングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.625487348969185
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Sora from Open AI has shown exceptional performance, yet it faces scrutiny over whether its technological prowess equates to an authentic comprehension of reality. Critics contend that it lacks a foundational grasp of the world, a deficiency V-JEPA from Meta aims to amend with its joint embedding approach. This debate is vital for steering the future direction of Artificial General Intelligence(AGI). We enrich this debate by developing a theory of productive imagination that generates a coherent world model based on Kantian philosophy. We identify three indispensable components of the coherent world model capable of genuine world understanding: representations of isolated objects, an a priori law of change across space and time, and Kantian categories. Our analysis reveals that Sora is limited because of its oversight of the a priori law of change and Kantian categories, flaws that are not rectifiable through scaling up the training. V-JEPA learns the context-dependent aspect of the a priori law of change. Yet it fails to fully comprehend Kantian categories and incorporate experience, leading us to conclude that neither system currently achieves a comprehensive world understanding. Nevertheless, each system has developed components essential to advancing an integrated AI productive imagination-understanding engine. Finally, we propose an innovative training framework for an AI productive imagination-understanding engine, centered around a joint embedding system designed to transform disordered perceptual input into a structured, coherent world model. Our philosophical analysis pinpoints critical challenges within contemporary video AI technologies and a pathway toward achieving an AI system capable of genuine world understanding, such that it can be applied for reasoning and planning in the future.
- Abstract(参考訳): Open AIのSoraは例外的なパフォーマンスを示しているが、その技術力が現実の真正な理解に匹敵するかどうかについて精査されている。
批評家は、MetaのV-JEPAの欠如は、共同埋め込みアプローチの修正を目指している。
この議論は、AI(Artificial General Intelligence, AGI)の今後の方向性を決める上で不可欠である。
我々は、カント哲学に基づくコヒーレントな世界モデルを生み出す生産的想像論を発展させることで、この議論を豊かにする。
我々は、真の世界理解が可能なコヒーレント世界モデルの3つの必須要素を同定する: 孤立した物体の表現、空間と時間にわたる変化の優先法則、そしてカント圏である。
我々の分析によると、Soraは変化の優先法則やカント的カテゴリーの監督によって制限されているため、トレーニングのスケールアップによって修正できない欠陥が指摘されている。
V-JEPAは、変化の優先法則の文脈依存的な側面を学ぶ。
しかし、カント語圏を完全に理解し、経験を取り入れることに失敗し、現在、どちらのシステムも包括的な世界理解を達成していないと結論づける。
それでも、それぞれのシステムは、AI生産的な想像力に基づくエンジンの進化に不可欠なコンポーネントを開発した。
最後に、乱れた知覚入力を構造化されたコヒーレントな世界モデルに変換するように設計された統合埋め込みシステムを中心に、AI生産的な想像力に基づくエンジンのための革新的なトレーニングフレームワークを提案する。
我々の哲学的分析は、現代のビデオAI技術における重要な課題と、将来推論や計画に応用できる真の世界理解が可能なAIシステムを実現するための道筋を浮き彫りにしている。
関連論文リスト
- Imagining and building wise machines: The centrality of AI metacognition [78.76893632793497]
AIシステムは知恵を欠いている。
AI研究はタスクレベルの戦略に焦点を当てているが、メタ認知はAIシステムでは未発達である。
メタ認知機能をAIシステムに統合することは、その堅牢性、説明可能性、協力性、安全性を高めるために不可欠である。
論文 参考訳(メタデータ) (2024-11-04T18:10:10Z) - AI and Social Theory [0.0]
我々は、人工知能(AI)が意味するものを定義することから始まる、AI駆動型社会理論のプログラムをスケッチする。
そして、AIベースのモデルがデジタルデータの可用性を増大させ、予測力に基づいて異なる社会的理論の有効性をテストするためのモデルを構築します。
論文 参考訳(メタデータ) (2024-07-07T12:26:16Z) - Deception Analysis with Artificial Intelligence: An Interdisciplinary Perspective [0.9790236766474198]
私たちは、欺くAIに関するタイムリーで意味のある学際的な視点を構築します。
DAMAS - 社会認知モデル作成のための総合的多エージェントシステムフレームワークで, 詐欺の分析を行う。
本稿では,コンピュータサイエンス,哲学,心理学,倫理,インテリジェンス・アナリティクスの観点から,AIアプローチによる騙しのモデル化と説明について述べる。
論文 参考訳(メタデータ) (2024-06-09T10:31:26Z) - Artificial General Intelligence (AGI)-Native Wireless Systems: A Journey Beyond 6G [58.440115433585824]
デジタルツイン(DT)のようなサービスをサポートする将来の無線システムの構築は、メタサーフェスのような従来の技術への進歩を通じて達成することが困難である。
人工知能(AI)ネイティブネットワークは、無線技術のいくつかの制限を克服することを約束する一方で、開発は依然としてニューラルネットワークのようなAIツールに依存している。
本稿では、AIネイティブ無線システムの概念を再考し、それらを人工知能(AGI)ネイティブシステムに変換するために必要な共通感覚を取り入れた。
論文 参考訳(メタデータ) (2024-04-29T04:51:05Z) - Position Paper: Agent AI Towards a Holistic Intelligence [53.35971598180146]
エージェントAI - 大きな基盤モデルをエージェントアクションに統合する具体的システム。
本稿では,エージェント・ファウンデーション・モデル(エージェント・ファウンデーション・モデル)を提案する。
論文 参考訳(メタデータ) (2024-02-28T16:09:56Z) - A call for embodied AI [1.7544885995294304]
我々は、人工知能の次の基本ステップとして、エンボディードAIを提案する。
Embodied AIの範囲を広げることで、認知アーキテクチャに基づく理論的枠組みを導入する。
このフレームワークはFristonのアクティブな推論原則と一致しており、EAI開発に対する包括的なアプローチを提供する。
論文 参考訳(メタデータ) (2024-02-06T09:11:20Z) - Concept Alignment [10.285482205152729]
我々は、私たちが価値を整合させる前に、AIシステムと人間が世界を理解するために使用する概念を整合させることが不可欠であると主張する。
哲学、認知科学、ディープラーニングのアイデアを統合し、概念の整合性の必要性を説明します。
論文 参考訳(メタデータ) (2024-01-09T23:32:18Z) - Imaginations of WALL-E : Reconstructing Experiences with an
Imagination-Inspired Module for Advanced AI Systems [2.452498006404167]
本システムは,テキスト入力と他のモダリティのギャップを埋めるイマジネーションに着想を得たモジュールを備える。
これは、人間の解釈と異なるが、等しく有効であるかもしれない概念の独特な解釈につながる。
この研究は、想像力に触発されたAIシステムの開発における重要な進歩を表している。
論文 参考訳(メタデータ) (2023-08-20T20:10:55Z) - Pathway to Future Symbiotic Creativity [76.20798455931603]
そこで本研究では, 5クラス階層の創造システムを分類し, 擬人アーティストから機械アーティストへの創造の道筋を示す。
芸術創造においては、機械は欲求、感謝、感情を含む人間の精神状態を理解する必要があるが、機械の創造的能力と限界も理解する必要がある。
我々は、人間互換のAIシステムが「ループ内人間」の原理に基づいているべきだという哲学を取り入れた、未来のマシンアーティストを構築するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-18T15:12:02Z) - An interdisciplinary conceptual study of Artificial Intelligence (AI)
for helping benefit-risk assessment practices: Towards a comprehensive
qualification matrix of AI programs and devices (pre-print 2020) [55.41644538483948]
本稿では,インテリジェンスの概念に対処するさまざまな分野の既存の概念を包括的に分析する。
目的は、AIシステムを評価するための共有概念や相違点を特定することである。
論文 参考訳(メタデータ) (2021-05-07T12:01:31Z) - Dark, Beyond Deep: A Paradigm Shift to Cognitive AI with Humanlike
Common Sense [142.53911271465344]
我々は、次世代のAIは、新しいタスクを解決するために、人間のような「暗黒」の常識を取り入れなければならないと論じている。
我々は、人間のような常識を持つ認知AIの5つの中核領域として、機能、物理学、意図、因果性、実用性(FPICU)を識別する。
論文 参考訳(メタデータ) (2020-04-20T04:07:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。