論文の概要: Beyond Predefined Learning Objects: A Thinking-Learning Interaction Model for Up-to-Date Autonomous Robot Learning
- arxiv url: http://arxiv.org/abs/2605.23987v1
- Date: Sun, 17 May 2026 07:04:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:17.43993
- Title: Beyond Predefined Learning Objects: A Thinking-Learning Interaction Model for Up-to-Date Autonomous Robot Learning
- Title(参考訳): 事前定義された学習対象を超えて: 最新の自律ロボット学習のための思考学習相互作用モデル
- Authors: Hong Su,
- Abstract要約: 本稿では,自律型ロボットのための思考学習インタラクションモデルを提案する。
適応的な入力特徴発見、出力カテゴリ拡張、学習モデル更新、アクションルーチン再構築をサポートする。
- 参考スコア(独自算出の注目度): 0.11844977816228043
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous robots operating in open and changing environments cannot always rely on predefined inputs, outputs, and action routines. Although existing learning methods enable robots to improve their performance through environmental interaction, the objects of learning are often fixed in advance, such as input features, recognition outputs, network structures, task goals, or action sequences. This limits their ability to adapt when new features, new categories, or more efficient task routines appear during long-term operation. To address this problem, this paper proposes a thinking-learning interaction model for autonomous robots. The core idea is that thinking guides learning by identifying potential changes, selecting useful evidence, organizing training materials, and planning verification actions, while learning promotes thinking by updating task knowledge, feature-selection experience, action strategies, and future reasoning processes. Based on this bidirectional mechanism, the robot can gradually move beyond predefined learning settings and adapt its recognition relations and action relations through continuous interaction with the environment. Specifically, the proposed model supports adaptive input feature discovery, output category expansion, learning model update, and action routine reconstruction. Experimental results show that the proposed model improves the final recognition accuracy from 0.419 to 0.845 in feature adaptation, achieves higher new-category formation accuracy and model-update success rate, and reduces the average action length from 13.0 to 4.0 in action routine reconstruction. In learning-enhanced thinking, the useful evidence selection rate increases from 0.272 to 0.965, indicating that learning results can effectively improve future evidence selection and reasoning.
- Abstract(参考訳): オープンで変化する環境で動く自律ロボットは、事前に定義されたインプット、アウトプット、アクションルーチンに常に依存することはできない。
既存の学習手法では、ロボットが環境相互作用を通じて性能を向上させることができるが、学習対象は、入力特徴、認識出力、ネットワーク構造、タスクゴール、アクションシーケンスなど、事前に固定されていることが多い。
これにより、新機能や新しいカテゴリ、あるいは長期的な運用中により効率的なタスクルーチンが現れる場合に、適応する能力が制限される。
そこで本研究では,自律型ロボットのための思考学習インタラクションモデルを提案する。
中心となる考え方は、思考が潜在的な変化を特定し、有効な証拠を選定し、トレーニング資料を編成し、検証行動を計画し、一方、学習はタスク知識、特徴選択経験、行動戦略、将来の推論プロセスの更新によって思考を促進することである。
この双方向のメカニズムに基づいて、ロボットは事前に定義された学習設定を超えて徐々に移動し、環境との継続的な相互作用を通じて認識関係と行動関係を適応させることができる。
具体的には、適応的な入力特徴探索、出力カテゴリ拡張、学習モデル更新、行動ルーチン再構築をサポートする。
実験結果から,提案モデルは特徴適応において0.419から0.845に改善し,新たなカテゴリ生成精度とモデル更新成功率を向上し,アクションルーチン再構築において平均動作長を13.0から4.0に短縮した。
学習促進思考においては、有用なエビデンス選択率は0.272から0.965に増加し、学習結果が将来のエビデンス選択と推論を効果的に改善できることを示す。
関連論文リスト
- Learning Causal Structure Distributions for Robust Planning [53.753366558072806]
構造情報の不確実性を考慮しながら,機能的関係を学習することで,より堅牢な力学モデルがもたらされることがわかった。
これは、因果構造を無視し、ロボットシステムにおける相互作用の空間性を活用するのに失敗する一般的なモデル学習手法とは対照的である。
本稿では,本モデルを用いてロボットの力学を学習し,新しい環境下での新たな作業を行うためのサンプリング・ベース・プランナーを併用することを提案する。
論文 参考訳(メタデータ) (2025-08-08T22:43:17Z) - Action Flow Matching for Continual Robot Learning [54.10050120844738]
ロボット工学における継続的な学習は、変化する環境やタスクに常に適応できるシステムを求める。
本稿では,オンラインロボット力学モデルアライメントのためのフローマッチングを利用した生成フレームワークを提案する。
ロボットは,不整合モデルで探索するのではなく,行動自体を変換することで,より効率的に情報収集を行う。
論文 参考訳(メタデータ) (2025-04-25T16:26:15Z) - Reciprocal Learning of Intent Inferral with Augmented Visual Feedback for Stroke [2.303526979876375]
本稿では,意図的推論型分類器への人間の適応を容易にする双方向パラダイムを提案する。
我々はこのパラダイムを、脳卒中のためのロボットハンドの整形制御の文脈で実証する。
脳卒中患者を対象に行った実験では,他者に対するパフォーマンスに悪影響を及ぼすことなく,サブセットでの相互学習によるパフォーマンス向上が見られた。
論文 参考訳(メタデータ) (2024-12-10T22:49:36Z) - Sample Efficient Robot Learning in Supervised Effect Prediction Tasks [0.0]
MUSEL(Model Uncertainty for Sample-Efficient Learning)は、ロボット工学における回帰タスクに適した新しいALフレームワークである。
MUSELは学習精度とサンプル効率を両立させ,情報的サンプルを選択する学習行動効果の有効性を検証した。
論文 参考訳(メタデータ) (2024-12-03T09:48:28Z) - Discovering Temporally-Aware Reinforcement Learning Algorithms [42.016150906831776]
既存の2つの目的発見アプローチに簡単な拡張を提案する。
一般的に使用されるメタ段階的アプローチは適応的目的関数の発見に失敗する。
論文 参考訳(メタデータ) (2024-02-08T17:07:42Z) - Enhancing Robot Learning through Learned Human-Attention Feature Maps [6.724036710994883]
ロボット学習にフォーカスポイントに関する補助情報を埋め込むことで、学習プロセスの効率性と堅牢性が向上すると考えられる。
本稿では,人間の注意を近似予測モデルでモデル化し,エミュレートするための新しいアプローチを提案する。
我々は,物体検出と模倣学習という2つの学習課題にアプローチを試行する。
論文 参考訳(メタデータ) (2023-08-29T14:23:44Z) - Incremental procedural and sensorimotor learning in cognitive humanoid
robots [52.77024349608834]
本研究は,手順を段階的に学習する認知エージェントを提案する。
各サブステージで必要とされる認知機能と, エージェントが未解決の課題に, 新たな機能の追加がどう対処するかを示す。
結果は、このアプローチが複雑なタスクを段階的に解くことができることを示している。
論文 参考訳(メタデータ) (2023-04-30T22:51:31Z) - Procedure Planning in Instructional Videosvia Contextual Modeling and
Model-based Policy Learning [114.1830997893756]
本研究は,実生活ビデオにおける目標指向アクションを計画するモデルを学習することに焦点を当てる。
本研究では,ベイズ推論とモデルに基づく模倣学習を通して,人間の行動のモデル化を行う新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-05T01:06:53Z) - Never Stop Learning: The Effectiveness of Fine-Tuning in Robotic
Reinforcement Learning [109.77163932886413]
本稿では,ロボットによるロボット操作ポリシーを,政治以外の強化学習を通じて微調整することで,新たなバリエーションに適応する方法を示す。
この適応は、タスクをゼロから学習するために必要なデータの0.2%未満を使用する。
事前訓練されたポリシーを適用するという私たちのアプローチは、微調整の過程で大きなパフォーマンス向上につながります。
論文 参考訳(メタデータ) (2020-04-21T17:57:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。