論文の概要: Psychometric Tests for AI Agents and Their Moduli Space
- arxiv url: http://arxiv.org/abs/2511.19262v1
- Date: Mon, 24 Nov 2025 16:15:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:25.301781
- Title: Psychometric Tests for AI Agents and Their Moduli Space
- Title(参考訳): AIエージェントの心理測定テストとモジュール空間
- Authors: Przemyslaw Chojecki,
- Abstract要約: 我々は、電池上のAAI関数の概念を正確に定義し、合理的な自律性/汎用知能スコアが満足するべきであると判断する。
従来定義されていた複合指標('AAI-Index')が,AAI関数の特別な場合であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We develop a moduli-theoretic view of psychometric test batteries for AI agents and connect it explicitly to the AAI score developed previously. First, we make precise the notion of an AAI functional on a battery and set out axioms that any reasonable autonomy/general intelligence score should satisfy. Second, we show that the composite index ('AAI-Index') defined previously is a special case of our AAI functional. Third, we introduce the notion of a cognitive core of an agent relative to a battery and define the associated AAI$_{\textrm{core}}$ score as the restriction of an AAI functional to that core. Finally, we use these notions to describe invariants of batteries under evaluation-preserving symmetries and outline how moduli of equivalent batteries are organized.
- Abstract(参考訳): 我々は、AIエージェントのための心理測定テストバッテリーのモジュラー理論的なビューを開発し、それを以前に開発されたAAIスコアに明示的に接続する。
まず、電池上のAAI関数の概念を正確に定義し、合理的な自律性/汎用知能スコアが満たすべき公理を設定します。
第2に、以前に定義された複合指標('AAI-Index')が、AAI関数の特別な場合であることを示す。
第3に、バッテリーに対するエージェントの認知コアの概念を導入し、関連するAAI$_{\textrm{core}}$スコアを、そのコアに対するAAI関数の制限として定義する。
最後に、これらの概念を用いて、評価保存対称性の下での電池の不変量を記述し、等価電池のモジュラーがどのように構成されているかを概説する。
関連論文リスト
- An Operational Kardashev-Style Scale for Autonomous AI - Towards AGI and Superintelligence [0.0]
我々は,Kardashevにインスパイアされたものの,自律型AI(AAI)尺度を提案する。
固定されたロボットプロセス自動化(AAI-0)から完全な人工知能(AAI-4)に至るまでの進捗を計測する。
AAI-インデクスによって集約された10つの能力軸(自律性、一般性、計画、記憶/永続性、ツール経済、自己改革、社会性/コーディネーション、身体的、世界モデル忠実性、経済的アウトプット)を定義する。
論文 参考訳(メタデータ) (2025-11-17T14:24:27Z) - STARec: An Efficient Agent Framework for Recommender Systems via Autonomous Deliberate Reasoning [54.28691219536054]
我々は、自律的な熟考的推論機能を備えたレコメンデータシステムを支援する、ゆっくり考えられた拡張エージェントフレームワークSTARecを紹介する。
我々は,先進的推論モデルと嗜好整合型報酬形成から構造化知識の蒸留を組み合わせた2段階のパラダイムであるアンカー強化訓練を開発する。
MovieLens 1MとAmazon CDsベンチマークの実験では、STARecは最先端のベースラインと比較して、大幅なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-26T08:47:58Z) - The next question after Turing's question: Introducing the Grow-AI test [51.56484100374058]
本研究は,GROW-AIと呼ばれる人工知能評価の枠組みを拡張することを目的としている。
GROW-AIは、チューリングテストの自然な後継者である"Can Machine grow up?
この作品の独創性は、人間の世界から人工知能への「成長」過程の概念的な変換にある。
論文 参考訳(メタデータ) (2025-08-22T10:19:42Z) - Fusion Intelligence for Digital Twinning AI Data Centers: A Synergistic GenAI-PhyAI Approach [17.699432259756456]
Fusion Intelligenceは、GenAIの自動化をPhyAIのドメイン基盤と同期させる新しいフレームワークである。
ケーススタディでは、AIDCデジタルツインの作成と検証を自動化する上で、我々のフレームワークの利点を実証している。
論文 参考訳(メタデータ) (2025-05-26T01:58:34Z) - Aitomia: Your Intelligent Assistant for AI-Driven Atomistic and Quantum Chemical Simulations [2.547250631115307]
AitomiaはAIを利用したプラットフォームで、AI駆動の原子論と量子化学(QC)シミュレーションの実行を支援する。
チャットボットとAIエージェントを備えており、専門家や非専門家が原子論シミュレーションのセットアップと実行を支援する。
相富は、原子論的なシミュレーションを行う際の障壁を低くし、シミュレーションを民主化し、関連する分野での研究と開発を加速することが期待されている。
論文 参考訳(メタデータ) (2025-05-13T03:11:41Z) - AGITB: A Signal-Level Benchmark for Evaluating Artificial General Intelligence [0.0]
Artificial General Intelligence Testbed (AGITB)は14の初等試験からなる新しいベンチマークスイートを導入した。
AGITBは、事前訓練することなく、段階的に、時間的シーケンスで次の入力を予測する能力に関するモデルを評価する。
ヒトの皮質は全てのテストを満たすが、現在のAIシステムは完全なAGITB基準を満たしていない。
論文 参考訳(メタデータ) (2025-04-06T10:01:15Z) - General Scales Unlock AI Evaluation with Explanatory and Predictive Power [57.7995945974989]
ベンチマークはAIの進歩を導くものだが、汎用AIシステムには限られた説明力と予測力を提供している。
私たちは、一般的なAIベンチマークが実際に何を計測しているかを説明することができる、AI評価のための一般的な尺度を紹介します。
私たちの完全に自動化された方法論は、飽和しない一般的なスケールにインスタンス要求を配置する18の新しく作られたルーリックの上に構築されます。
論文 参考訳(メタデータ) (2025-03-09T01:13:56Z) - Pangu-Agent: A Fine-Tunable Generalist Agent with Structured Reasoning [50.47568731994238]
人工知能(AI)エージェント作成の鍵となる方法は強化学習(RL)である
本稿では,構造化推論をAIエージェントのポリシーに統合し,学習するための一般的なフレームワークモデルを提案する。
論文 参考訳(メタデータ) (2023-12-22T17:57:57Z) - Levels of AGI for Operationalizing Progress on the Path to AGI [53.28828093836034]
本稿では,人工知能(AGI)モデルとその前駆体の性能と動作を分類する枠組みを提案する。
このフレームワークは、AGIのパフォーマンス、一般性、自律性のレベルを導入し、モデルを比較し、リスクを評価し、AGIへの道筋に沿って進捗を測定する共通の言語を提供する。
論文 参考訳(メタデータ) (2023-11-04T17:44:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。