論文の概要: User profile-driven large-scale multi-agent learning from demonstration
in federated human-robot collaborative environments
- arxiv url: http://arxiv.org/abs/2103.16434v1
- Date: Tue, 30 Mar 2021 15:33:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-31 17:06:50.912784
- Title: User profile-driven large-scale multi-agent learning from demonstration
in federated human-robot collaborative environments
- Title(参考訳): ロボット協調環境におけるユーザプロファイル駆動型大規模マルチエージェント学習
- Authors: Georgios Th. Papadopoulos, Asterios Leonidis, Margherita Antona,
Constantine Stephanidis
- Abstract要約: 本稿では,提示された人間の行動のきめ細かい表現を提供する,新しいユーザプロファイルの定式化について紹介する。
全体的な設計は、人間の行動の短期的および長期的分析/解釈を可能にする。
- 参考スコア(独自算出の注目度): 5.218882272051637
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning from Demonstration (LfD) has been established as the dominant
paradigm for efficiently transferring skills from human teachers to robots. In
this context, the Federated Learning (FL) conceptualization has very recently
been introduced for developing large-scale human-robot collaborative
environments, targeting to robustly address, among others, the critical
challenges of multi-agent learning and long-term autonomy. In the current work,
the latter scheme is further extended and enhanced, by designing and
integrating a novel user profile formulation for providing a fine-grained
representation of the exhibited human behavior, adopting a Deep Learning
(DL)-based formalism. In particular, a hierarchically organized set of key
information sources is considered, including: a) User attributes (e.g.
demographic, anthropomorphic, educational, etc.), b) User state (e.g. fatigue
detection, stress detection, emotion recognition, etc.) and c)
Psychophysiological measurements (e.g. gaze, electrodermal activity, heart
rate, etc.) related data. Then, a combination of Long Short-Term Memory (LSTM)
and stacked autoencoders, with appropriately defined neural network
architectures, is employed for the modelling step. The overall designed scheme
enables both short- and long-term analysis/interpretation of the human behavior
(as observed during the feedback capturing sessions), so as to adaptively
adjust the importance of the collected feedback samples when aggregating
information originating from the same and different human teachers,
respectively.
- Abstract(参考訳): learning from demonstration(lfd)は、人間の教師からロボットにスキルを効率的に移すための主要なパラダイムとして確立されている。
この文脈において、フェデレーション・ラーニング(fl)の概念化は、近年、多エージェント学習や長期的な自律性といった重要な課題にロバストに対処すべく、大規模な人間とロボットの協調環境を開発するために導入された。
現在の研究では、Deep Learning(DL)ベースのフォーマリズムを採用して、展示された人間の行動のきめ細かい表現を提供する新しいユーザープロファイルの定式化を設計し、統合することにより、後者のスキームをさらに拡張・拡張する。
特に、a) ユーザ属性(例えば、)を含む重要な情報ソースの階層的に整理されたセットが検討される。
人口統計、人格化、教育などです
) b) ユーザ状態(例えば、)
疲労検知、ストレス検出、感情認識など
c)心理生理的測定(例)
視線、電磁気活動、心拍数など
関連データ。
次に、モデリングステップとして、ニューラルネットワークアーキテクチャを適切に定義したlong short-term memory(lstm)とstacked autoencoderの組み合わせを用いる。
総合的な設計手法により、(フィードバック取得セッション中に観察されたように)人間の行動の短期的および長期的分析/解釈を可能とし、同一および異なる人間教師からの情報を集約する場合に、収集されたフィードバックサンプルの重要性を適応的に調整する。
関連論文リスト
- Brain-Cognition Fingerprinting via Graph-GCCA with Contrastive Learning [28.681229869236393]
縦断的神経画像研究は、脳機能と認知の間の動的相互作用を研究することによって、脳の老化と疾患の理解を改善することを目的としている。
本稿では,グラフ注意ネットワークと一般化相関解析を用いた教師なし学習モデルを提案する。
個々の人の独特の神経・認知表現型を反映した脳認知指紋を作成するために、モデルは個別化およびマルチモーダル・コントラスト学習にも依存する。
論文 参考訳(メタデータ) (2024-09-20T20:36:20Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。
モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Hello Again! LLM-powered Personalized Agent for Long-term Dialogue [63.65128176360345]
モデルに依存しない長期対話エージェント(LD-Agent)を導入する。
イベント認識、ペルソナ抽出、応答生成のための3つの独立した調整可能なモジュールが組み込まれている。
LD-Agentの有効性, 汎用性, クロスドメイン性について実験的に検証した。
論文 参考訳(メタデータ) (2024-06-09T21:58:32Z) - DSAM: A Deep Learning Framework for Analyzing Temporal and Spatial Dynamics in Brain Networks [4.041732967881764]
ほとんどのrs-fMRI研究は、関心のある脳領域にまたがる単一の静的機能接続行列を計算している。
これらのアプローチは、脳のダイナミクスを単純化し、目の前のゴールを適切に考慮していないリスクがある。
本稿では,時系列から直接ゴール固有の機能的接続行列を学習する,解釈可能な新しいディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-19T23:35:06Z) - Real-time Addressee Estimation: Deployment of a Deep-Learning Model on
the iCub Robot [52.277579221741746]
住所推定は、社会ロボットが人間とスムーズに対話するために必要なスキルである。
人間の知覚スキルにインスパイアされたディープラーニングモデルは、iCubロボットに設計、訓練、デプロイされる。
本研究では,人間-ロボットのリアルタイムインタラクションにおいて,そのような実装の手順とモデルの性能について述べる。
論文 参考訳(メタデータ) (2023-11-09T13:01:21Z) - Learn to Predict How Humans Manipulate Large-sized Objects from
Interactive Motions [82.90906153293585]
本稿では,動きデータと動的記述子を融合させるグラフニューラルネットワークHO-GCNを提案する。
動的記述子を消費するネットワークは、最先端の予測結果が得られ、未確認オブジェクトへのネットワークの一般化に役立つことを示す。
論文 参考訳(メタデータ) (2022-06-25T09:55:39Z) - Beyond Tracking: Using Deep Learning to Discover Novel Interactions in
Biological Swarms [3.441021278275805]
本稿では,システムレベルの状態を全体像から直接予測するディープ・ネットワーク・モデルを提案する。
結果の予測モデルは、人間の理解した予測モデルに基づいていないため、説明モジュールを使用する。
これは、行動生態学における人工知能の例である。
論文 参考訳(メタデータ) (2021-08-20T22:50:41Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Cross-individual Recognition of Emotions by a Dynamic Entropy based on
Pattern Learning with EEG features [2.863100352151122]
複数の個体の神経生理学的特徴に関連する情報的指標を抽象化するために,動的エントロピーに基づくパターン学習(DEPL)として表されるディープラーニングフレームワークを提案する。
DEPLは、ダイナミックエントロピーに基づく特徴の皮質位置間の相互依存性をモデル化することにより、ディープ畳み込みニューラルネットワークによって生成された表現の能力を向上した。
論文 参考訳(メタデータ) (2020-09-26T07:22:07Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z) - Human Action Recognition and Assessment via Deep Neural Network
Self-Organization [0.0]
本章では,深度マップとRGB画像からの行動の学習と認識のための階層モデルを紹介する。
これらのモデルの特徴は、非定常分布に迅速に適応する自己組織化ネットワークの利用である。
論文 参考訳(メタデータ) (2020-01-04T15:58:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。