論文の概要: Can Mental Imagery Improve the Thinking Capabilities of AI Systems?
- arxiv url: http://arxiv.org/abs/2507.12555v2
- Date: Sun, 20 Jul 2025 15:39:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-22 12:28:43.158373
- Title: Can Mental Imagery Improve the Thinking Capabilities of AI Systems?
- Title(参考訳): メンタルイメージはAIシステムの思考能力を改善するか?
- Authors: Slimane Larabi,
- Abstract要約: メンタルイメージをマシン思考フレームワークに組み込む方法について検討する。
提案するフレームワークは,3つの補助単位である入力データユニット,要求ユニット,メンタルイメージユニットによって支援された認知的思考ユニットを統合する。
このフレームワーク内では、データは自然言語の文やスケッチとして表現され、情報と意思決定の両方の目的に役立っている。
- 参考スコア(独自算出の注目度): 0.6345523830122166
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Although existing models can interact with humans and provide satisfactory responses, they lack the ability to act autonomously or engage in independent reasoning. Furthermore, input data in these models is typically provided as explicit queries, even when some sensory data is already acquired. In addition, AI agents, which are computational entities designed to perform tasks and make decisions autonomously based on their programming, data inputs, and learned knowledge, have shown significant progress. However, they struggle with integrating knowledge across multiple domains, unlike humans. Mental imagery plays a fundamental role in the brain's thinking process, which involves performing tasks based on internal multisensory data, planned actions, needs, and reasoning capabilities. In this paper, we investigate how to integrate mental imagery into a machine thinking framework and how this could be beneficial in initiating the thinking process. Our proposed machine thinking framework integrates a Cognitive thinking unit supported by three auxiliary units: the Input Data Unit, the Needs Unit, and the Mental Imagery Unit. Within this framework, data is represented as natural language sentences or drawn sketches, serving both informative and decision-making purposes. We conducted validation tests for this framework, and the results are presented and discussed.
- Abstract(参考訳): 既存のモデルは人間と相互作用し、満足な反応を与えることができるが、自律的に行動したり、独立した推論を行う能力は欠如している。
さらに、これらのモデルの入力データは、感覚データが既に取得されている場合でも、通常明示的なクエリとして提供される。
さらに、タスクを実行し、プログラム、データ入力、学習知識に基づいて自律的に決定を下すように設計された計算エンティティであるAIエージェントは、大きな進歩を見せている。
しかし、彼らは人間とは異なり、複数のドメインにまたがる知識の統合に苦労している。
メンタルイメージは脳の思考プロセスにおいて基本的な役割を担い、内部の多感覚データ、計画された行動、要求、推論能力に基づいてタスクを実行する。
本稿では,精神イメージを機械思考の枠組みに統合する方法と,それが思考プロセスの開始にどう役立つかを検討する。
提案するマシン思考フレームワークは,入力データユニット,要求ユニット,メンタルイメージユニットの3つの補助ユニットによって支援される認知的思考ユニットを統合している。
このフレームワーク内では、データは自然言語の文やスケッチとして表現され、情報と意思決定の両方の目的に役立っている。
筆者らは,本フレームワークの検証試験を行い,その結果を提示し,考察した。
関連論文リスト
- Thinking Beyond Tokens: From Brain-Inspired Intelligence to Cognitive Foundations for Artificial General Intelligence and its Societal Impact [27.722167796617114]
本稿では,人工知能,認知神経科学,心理学,生成モデル,エージェントベースシステムの学際的合成について述べる。
我々は汎用知能のアーキテクチャと認知の基礎を分析し、モジュラー推論、永続記憶、マルチエージェント協調の役割を強調した。
我々は、人工知能への道の鍵となる科学的、技術的、倫理的課題を特定します。
論文 参考訳(メタデータ) (2025-07-01T16:52:25Z) - Reasoning in machine vision: learning to think fast and slow [10.430190333487957]
推論は人間の知性の目印であり、複雑で不慣れなシナリオで適応的な意思決定を可能にする。
マシンインテリジェンスは、推論時にソリューションを動的に洗練する能力がないため、トレーニングデータに縛られている。
本稿では,思考時間の増加に伴う性能向上を実現することにより,視覚における機械推論を可能にする新しい学習パラダイムを提案する。
論文 参考訳(メタデータ) (2025-06-27T10:03:05Z) - Neural Brain: A Neuroscience-inspired Framework for Embodied Agents [58.58177409853298]
大規模な言語モデルのような現在のAIシステムは、いまだに解体され続けており、物理的に世界と関わりが持てない。
この課題の核心は、人間のような適応性を持つエンボディエージェントを駆動するために設計された中枢知能システムであるNeural Brain(ニューラル・ブレイン)の概念である。
本稿では,2つの基本的な課題に対処する,エンボディエージェントのニューラルブレインの統一的枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-12T15:05:34Z) - Dissociating Artificial Intelligence from Artificial Consciousness [0.4537124110113416]
機械学習と計算能力の発展は、人工知能が手の届くところにあることを示唆している。
コンピューターが人間と機能的に同等なら、私たちが意識しているように、視覚、音、思考を体験するだろうか?
我々は統合情報理論(IIT)を用いて、システムが意識的かどうかを判断するための原則的ツールを提供する。
論文 参考訳(メタデータ) (2024-12-05T19:28:35Z) - Enabling High-Level Machine Reasoning with Cognitive Neuro-Symbolic
Systems [67.01132165581667]
本稿では,認知アーキテクチャを外部のニューロシンボリックコンポーネントと統合することにより,AIシステムにおける高レベル推論を実現することを提案する。
本稿では,ACT-Rを中心としたハイブリッドフレームワークについて紹介し,最近の応用における生成モデルの役割について論じる。
論文 参考訳(メタデータ) (2023-11-13T21:20:17Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Building Human-like Communicative Intelligence: A Grounded Perspective [1.0152838128195465]
言語学習における驚くべき進歩の後、AIシステムは人間のコミュニケーション能力の重要な側面を反映しない天井に近づいたようだ。
本稿は、ナチビストと象徴的パラダイムに基づく認知にインスパイアされたAIの方向性には、現代AIの進歩を導くために必要なサブストラテジと具体性がないことを示唆する。
本稿では,「地下」言語知能構築のための具体的かつ実装可能なコンポーネントのリストを提案する。
論文 参考訳(メタデータ) (2022-01-02T01:43:24Z) - Cognitive architecture aided by working-memory for self-supervised
multi-modal humans recognition [54.749127627191655]
人間パートナーを認識する能力は、パーソナライズされた長期的な人間とロボットの相互作用を構築するための重要な社会的スキルです。
ディープラーニングネットワークは最先端の結果を達成し,そのような課題に対処するための適切なツールであることが実証された。
1つの解決策は、ロボットに自己スーパービジョンで直接の感覚データから学習させることである。
論文 参考訳(メタデータ) (2021-03-16T13:50:24Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z) - Machine Common Sense [77.34726150561087]
機械の常識は、人工知能(AI)において広範で潜在的に無拘束な問題のままである
本稿では、対人インタラクションのようなドメインに焦点を当てたコモンセンス推論のモデル化の側面について論じる。
論文 参考訳(メタデータ) (2020-06-15T13:59:47Z) - How to Answer Why -- Evaluating the Explanations of AI Through Mental
Model Analysis [0.0]
人間中心のAI研究の鍵となる疑問は、ユーザーのメンタルモデルをどのように有効に調査するかである。
実験的な研究手法としてメンタルモデルが適切かどうかを評価する。
本稿では、人間中心の方法で説明可能なAIアプローチを評価するための模範的手法を提案する。
論文 参考訳(メタデータ) (2020-01-11T17:15:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。