論文の概要: The Role of Higher-Order Cognitive Models in Active Learning
- arxiv url: http://arxiv.org/abs/2401.04397v1
- Date: Tue, 9 Jan 2024 07:39:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-10 16:43:48.050770
- Title: The Role of Higher-Order Cognitive Models in Active Learning
- Title(参考訳): アクティブラーニングにおける高次認知モデルの役割
- Authors: Oskar Keurulainen, Gokhan Alcan, Ville Kyrki
- Abstract要約: 我々は、人間のフィードバックのためのアクティブな学習のための新しいパラダイムを提唱する。
エージェントのレベルが上がると、アクティブな学習システムと教師との合理的コミュニケーションの質的に異なる形態がもたらされるかについて議論する。
- 参考スコア(独自算出の注目度): 8.847360368647752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Building machines capable of efficiently collaborating with humans has been a
longstanding goal in artificial intelligence. Especially in the presence of
uncertainties, optimal cooperation often requires that humans and artificial
agents model each other's behavior and use these models to infer underlying
goals, beliefs or intentions, potentially involving multiple levels of
recursion. Empirical evidence for such higher-order cognition in human behavior
is also provided by previous works in cognitive science, linguistics, and
robotics. We advocate for a new paradigm for active learning for human feedback
that utilises humans as active data sources while accounting for their higher
levels of agency. In particular, we discuss how increasing level of agency
results in qualitatively different forms of rational communication between an
active learning system and a teacher. Additionally, we provide a practical
example of active learning using a higher-order cognitive model. This is
accompanied by a computational study that underscores the unique behaviors that
this model produces.
- Abstract(参考訳): 人間と効率的に協力できる機械の構築は、人工知能の長年の目標だった。
特に不確実性が存在する場合、最適な協力のためには、人間と人工エージェントが互いの行動をモデル化し、これらのモデルを使用して基礎となる目標、信念、意図を推測し、複数のレベルの再帰を伴う可能性がある。
人間の行動における高次認知の実証的証拠は、認知科学、言語学、ロボット工学における過去の研究によってもたらされる。
我々は、人間をアクティブなデータソースとして利用する人間のフィードバックのためのアクティブな学習のための新しいパラダイムを提唱する。
特に,エージェントのレベルの増加が,アクティブラーニングシステムと教師間の合理的コミュニケーションの質的に異なる形態をもたらすかについて議論する。
さらに,高次認知モデルを用いた能動的学習の実践例を提案する。
これは、このモデルが生成するユニークな振る舞いの基盤となる計算研究に付随する。
関連論文リスト
- Can Language Models Learn to Skip Steps? [59.84848399905409]
我々は推論においてステップをスキップする能力について研究する。
効率を高めたり認知負荷を減らすためのステップをスキップする人間とは異なり、モデルはそのようなモチベーションを持っていない。
私たちの研究は、人間のようなステップスキッピング能力に関する最初の調査である。
論文 参考訳(メタデータ) (2024-11-04T07:10:24Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。
モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot [52.277579221741746]
住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。
人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。
本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
論文 参考訳(メタデータ) (2023-11-09T13:01:21Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Machine Psychology [54.287802134327485]
我々は、心理学にインスパイアされた行動実験において、研究のための実りある方向が、大きな言語モデルに係わっていると論じる。
本稿では,本手法が表に示す理論的視点,実験パラダイム,計算解析技術について述べる。
これは、パフォーマンスベンチマークを超えた、生成人工知能(AI)のための「機械心理学」の道を開くものだ。
論文 参考訳(メタデータ) (2023-03-24T13:24:41Z) - NeuroCERIL: Robotic Imitation Learning via Hierarchical Cause-Effect
Reasoning in Programmable Attractor Neural Networks [2.0646127669654826]
本稿では,脳にインスパイアされた神経認知アーキテクチャであるNeuroCERILについて紹介する。
シミュレーションされたロボット模倣学習領域において,NeuroCERILは様々な手続き的スキルを習得できることを示す。
我々は、NeuroCERILは人間のような模倣学習の実行可能な神経モデルであると結論付けた。
論文 参考訳(メタデータ) (2022-11-11T19:56:11Z) - Modeling Human Behavior Part I -- Learning and Belief Approaches [0.0]
探索とフィードバックを通じて行動のモデルや方針を学ぶ手法に焦点を当てる。
次世代の自律的適応システムは、主にAIエージェントと人間がチームとして一緒に働く。
論文 参考訳(メタデータ) (2022-05-13T07:33:49Z) - MIRROR: Differentiable Deep Social Projection for Assistive Human-Robot
Communication [18.711591679232367]
人体実験から人体モデルを簡単に学習する手法であるMIRRORを提案する。
また, CARLAシミュレータを用いて, (i) MIRRORが複雑な領域に拡張可能であることを示す。
論文 参考訳(メタデータ) (2022-03-06T05:01:00Z) - Learning Human Rewards by Inferring Their Latent Intelligence Levels in
Multi-Agent Games: A Theory-of-Mind Approach with Application to Driving Data [18.750834997334664]
我々は、人間は有理論的であり、他人の意思決定過程を推論する際に異なる知能レベルを持っていると論じる。
学習中の人間の潜在知能レベルを推論する,新しいマルチエージェント逆強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-03-07T07:48:31Z) - AGENT: A Benchmark for Core Psychological Reasoning [60.35621718321559]
直観心理学は、観察可能な行動を駆動する隠された精神変数を推論する能力です。
他のエージェントを推論する機械エージェントに対する近年の関心にもかかわらず、そのようなエージェントが人間の推論を駆動するコア心理学の原則を学ぶか保持するかは明らかではない。
本稿では,プロシージャが生成する3dアニメーション,エージェントを4つのシナリオで構成したベンチマークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:58:23Z) - Imitating Interactive Intelligence [24.95842455898523]
仮想環境の簡略化を用いて、人間と自然に相互作用できる人工エージェントの設計方法を検討する。
人間とロバストに相互作用できるエージェントを構築するには、人間と対話しながらトレーニングするのが理想的です。
我々は,人間とエージェントエージェントの対話行動の相違を低減するために,逆強化学習の考え方を用いる。
論文 参考訳(メタデータ) (2020-12-10T13:55:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。