論文の概要: A General, Evolution-Inspired Reward Function for Social Robotics
- arxiv url: http://arxiv.org/abs/2202.00617v1
- Date: Tue, 1 Feb 2022 18:05:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-02 15:29:12.613818
- Title: A General, Evolution-Inspired Reward Function for Social Robotics
- Title(参考訳): 進化に触発された社会ロボットの報酬機能
- Authors: Thomas Kingsford
- Abstract要約: 本稿では,ソーシャルロボティクスにおける強化学習エージェントの展開に必要なリアルタイムかつ高密度な報酬機能を提供するメカニズムとして,ソーシャル・リワード機能を提案する。
ソーシャル・リワード・ファンクション(Social Reward Function)は、単純で安定的で文化に依存しない報酬機能を提供することを目的として、人間の遺伝的に与えられた社会的知覚能力を忠実に模倣するように設計されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The field of social robotics will likely need to depart from a paradigm of
designed behaviours and imitation learning and adopt modern reinforcement
learning (RL) methods to enable robots to interact fluidly and efficaciously
with humans. In this paper, we present the Social Reward Function as a
mechanism to provide (1) a real-time, dense reward function necessary for the
deployment of RL agents in social robotics, and (2) a standardised objective
metric for comparing the efficacy of different social robots. The Social Reward
Function is designed to closely mimic those genetically endowed social
perception capabilities of humans in an effort to provide a simple, stable and
culture-agnostic reward function. Presently, datasets used in social robotics
are either small or significantly out-of-domain with respect to social
robotics. The use of the Social Reward Function will allow larger in-domain
datasets to be collected close to the behaviour policy of social robots, which
will allow both further improvements to reward functions and to the behaviour
policies of social robots. We believe this will be the key enabler to
developing efficacious social robots in the future.
- Abstract(参考訳): 社会ロボット工学の分野は、デザインされた行動と模倣学習のパラダイムから離れ、ロボットが人間と流動的で効果的に対話できるように、現代的な強化学習(RL)手法を採用する必要があるだろう。
本稿では,(1)ソーシャルロボットにおけるrlエージェントの展開に必要なリアルタイムかつ高密度な報酬機能,(2)異なるソーシャルロボットの有効性を比較するための標準化された客観的指標を提供するためのメカニズムとして,ソーシャル報酬機能を提案する。
社会的報酬機能は、単純で安定で文化に依存しない報酬機能を提供するために、人間の遺伝的に付与された社会的知覚能力を密接に模倣するように設計されている。
現在、社会ロボティクスで使用されるデータセットは、社会ロボティクスに関して、小さくも著しくドメイン外である。
ソーシャル・リワード・ファンクション(Social Reward Function)を使用することで、より大きなドメイン内のデータセットを社会ロボットの行動ポリシーに近く収集することができる。
これが将来、効果的なソーシャルロボットを開発するための鍵となると信じています。
関連論文リスト
- Nadine: An LLM-driven Intelligent Social Robot with Affective Capabilities and Human-like Memory [3.3906920519220054]
Nadineプラットフォームのためのインテリジェントで堅牢なソーシャルロボティクスシステムを開発するための当社のアプローチについて説明する。
我々は,Large Language Models(LLMs)を統合し,これらのモデルの強力な推論と命令追従機能を巧みに活用することで,これを実現する。
このアプローチは、人間のような長期記憶や洗練された感情評価を実装しない、現在最先端のLCMベースのエージェントと比較して、斬新である。
論文 参考訳(メタデータ) (2024-05-30T15:55:41Z) - Socially Integrated Navigation: A Social Acting Robot with Deep Reinforcement Learning [0.7864304771129751]
移動ロボットは様々な混み合った状況で大規模に使われており、私たちの社会の一部になっている。
個人を考慮した移動ロボットの社会的に許容されるナビゲーション行動は、スケーラブルなアプリケーションと人間の受容にとって必須の要件である。
本稿では,ロボットの社会行動が適応的であり,人間との相互作用から生じる,社会統合型ナビゲーション手法を提案する。
論文 参考訳(メタデータ) (2024-03-14T18:25:40Z) - Robot Interaction Behavior Generation based on Social Motion Forecasting for Human-Robot Interaction [9.806227900768926]
本稿では,共有ロボット表現空間における社会的動き予測のモデル化を提案する。
ECHOは上記の共有空間で活動し、社会的シナリオで遭遇したエージェントの将来の動きを予測する。
我々は,多対人動作予測タスクにおけるモデルの評価を行い,最先端の性能を大きなマージンで獲得する。
論文 参考訳(メタデータ) (2024-02-07T11:37:14Z) - Habitat 3.0: A Co-Habitat for Humans, Avatars and Robots [119.55240471433302]
Habitat 3.0は、家庭環境における協調ロボットタスクを研究するためのシミュレーションプラットフォームである。
複雑な変形可能な体と外観と運動の多様性をモデル化する際の課題に対処する。
Human-in-the-loopインフラストラクチャは、マウス/キーボードまたはVRインターフェースを介してシミュレーションされたロボットとの実際のヒューマンインタラクションを可能にする。
論文 参考訳(メタデータ) (2023-10-19T17:29:17Z) - SOTOPIA: Interactive Evaluation for Social Intelligence in Language Agents [107.4138224020773]
人工エージェントと人間との複雑な社会的相互作用をシミュレートするオープンエンド環境であるSOTOPIAを提案する。
エージェントは、複雑な社会的目標を達成するために協調し、協力し、交換し、互いに競い合う。
GPT-4は,人間よりも目標達成率が著しく低く,社会的常識的推論や戦略的コミュニケーション能力の発揮に苦慮していることがわかった。
論文 参考訳(メタデータ) (2023-10-18T02:27:01Z) - SACSoN: Scalable Autonomous Control for Social Navigation [62.59274275261392]
我々は、社会的に邪魔にならないナビゲーションのための政策の訓練方法を開発した。
この反事実的摂動を最小化することにより、共有空間における人間の自然な振る舞いを変えない方法でロボットに行動を促すことができる。
屋内移動ロボットが人間の傍観者と対話する大規模なデータセットを収集する。
論文 参考訳(メタデータ) (2023-06-02T19:07:52Z) - Socially Compliant Navigation Dataset (SCAND): A Large-Scale Dataset of
Demonstrations for Social Navigation [92.66286342108934]
社会ナビゲーションは、ロボットのような自律的なエージェントが、人間のような他の知的エージェントの存在下で、社会的に従順な方法でナビゲートする能力である。
私たちのデータセットには8.7時間、128の軌道、25マイルの社会的に適合した人間の遠隔運転デモが含まれています。
論文 参考訳(メタデータ) (2022-03-28T19:09:11Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - Federated Continual Learning for Socially Aware Robotics [4.224305864052757]
ソーシャルロボットは、新しいユーザーに対して行動に適応せず、十分なプライバシー保護を提供していない。
本稿では,ソーシャルロボットのプライバシとパーソナライゼーションを改善する分散型学習手法を提案する。
分散学習は,概念実証型社会意識ナビゲーションドメインにおいて,集中学習の代替として実現可能であることを示す。
論文 参考訳(メタデータ) (2022-01-14T15:54:51Z) - PHASE: PHysically-grounded Abstract Social Events for Machine Social
Perception [50.551003004553806]
私たちは、物理的に根拠のある抽象的なソーシャルイベント、フェーズのデータセットを作成します。
フェーズは人間の実験によって検証され、人間は社会出来事において豊かな相互作用を知覚する。
ベースラインモデルとして,最新のフィードフォワードニューラルネットワークよりも優れたベイズ逆計画手法SIMPLEを導入する。
論文 参考訳(メタデータ) (2021-03-02T18:44:57Z) - From Learning to Relearning: A Framework for Diminishing Bias in Social
Robot Navigation [3.3511723893430476]
社会的ナビゲーションモデルは、差別や差別のような社会的不公平を複製し、促進し、増幅することができる。
提案するフレームワークは,安全性と快適性を考慮したソーシャルコンテキストを学習プロセスに組み込んだtextitlearningと,発生前に潜在的に有害な結果を検出し修正するtextitrelearningの2つのコンポーネントで構成されている。
論文 参考訳(メタデータ) (2021-01-07T17:42:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。