論文の概要: Q-SMASH: Q-Learning-based Self-Adaptation of Human-Centered Internet of
Things
- arxiv url: http://arxiv.org/abs/2107.05949v1
- Date: Tue, 13 Jul 2021 09:41:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-14 14:45:10.749233
- Title: Q-SMASH: Q-Learning-based Self-Adaptation of Human-Centered Internet of
Things
- Title(参考訳): Q-SMASH:人間中心のモノの自己適応
- Authors: Hamed Rahimi, Iago Felipe Trentin, Fano Ramparany, Olivier Boissier
- Abstract要約: この記事では、人間中心環境におけるIoTオブジェクトの自己適応のための強化学習に基づくアプローチであるQ-SMASHについて述べる。
Q-SMASHは、人間の価値を尊重しながらユーザの行動を学ぶことを目的としている。
Q-SMASHの学習能力は、ユーザの行動変化に適応し、より正確な意思決定を可能にする。
- 参考スコア(独自算出の注目度): 0.8602553195689512
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As the number of Human-Centered Internet of Things (HCIoT) applications
increases, the self-adaptation of its services and devices is becoming a
fundamental requirement for addressing the uncertainties of the environment in
decision-making processes. Self-adaptation of HCIoT aims to manage run-time
changes in a dynamic environment and to adjust the functionality of IoT objects
in order to achieve desired goals during execution. SMASH is a semantic-enabled
multi-agent system for self-adaptation of HCIoT that autonomously adapts IoT
objects to uncertainties of their environment. SMASH addresses the
self-adaptation of IoT applications only according to the human values of
users, while the behavior of users is not addressed. This article presents
Q-SMASH: a multi-agent reinforcement learning-based approach for
self-adaptation of IoT objects in human-centered environments. Q-SMASH aims to
learn the behaviors of users along with respecting human values. The learning
ability of Q-SMASH allows it to adapt itself to the behavioral change of users
and make more accurate decisions in different states and situations.
- Abstract(参考訳): ヒューマン中心のモノのインターネット(hciot)アプリケーション数が増加するにつれて、そのサービスやデバイスの自己適応は意思決定プロセスにおける環境の不確実性に対処するための基本的な要件になりつつある。
HCIoTの自己適応は、動的環境における実行時の変更を管理し、IoTオブジェクトの機能を調整することで、実行中に望ましい目標を達成することを目的としている。
SMASHは,IoTオブジェクトを環境の不確実性に自律的に適応する,HCIoTの自己適応のためのセマンティック対応マルチエージェントシステムである。
SMASHは、ユーザの行動に対処する一方で、ユーザの人的価値に応じてのみ、IoTアプリケーションの自己適応に対処する。
この記事では、人間中心環境におけるIoTオブジェクトの自己適応のためのマルチエージェント強化学習ベースのアプローチであるQ-SMASHについて述べる。
Q-SMASHは人間の価値観を尊重しながらユーザの行動を学ぶことを目的としている。
Q-SMASHの学習能力は、ユーザの行動変化に適応し、異なる状態や状況におけるより正確な意思決定を可能にする。
関連論文リスト
- Metacognition for Unknown Situations and Environments (MUSE) [3.2020845462590697]
未知の状況と環境(MUSE)フレームワークのメタ認知を提案する。
MUSEはメタ認知プロセス、特に自己認識と自己制御を自律エージェントに統合する。
エージェントは自己認識と自己制御の大幅な改善を示す。
論文 参考訳(メタデータ) (2024-11-20T18:41:03Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - The Internet of Senses: Building on Semantic Communications and Edge
Intelligence [67.75406096878321]
インターネット・オブ・センセーズ(IoS)は、すべてのヒト受容体に対する欠陥のないテレプレゼンススタイルのコミュニケーションを約束する。
我々は,新たなセマンティックコミュニケーションと人工知能(AI)/機械学習(ML)パラダイムがIoSユースケースの要件を満たす方法について詳しく述べる。
論文 参考訳(メタデータ) (2022-12-21T03:37:38Z) - Goal-Conditioned Q-Learning as Knowledge Distillation [136.79415677706612]
目標条件設定における非政治強化学習と知識蒸留との関連について検討する。
これは,目標の空間が高次元である場合に,目標条件付き非政治強化学習の性能を向上させることを実証的に示す。
また,複数のスパース目標を同時に達成した場合に,この手法を効果的に学習できることを示す。
論文 参考訳(メタデータ) (2022-08-28T22:01:10Z) - Autonomous Open-Ended Learning of Tasks with Non-Stationary
Interdependencies [64.0476282000118]
固有のモチベーションは、目標間のトレーニング時間を適切に割り当てるタスクに依存しないシグナルを生成することが証明されている。
内在的に動機付けられたオープンエンドラーニングの分野におけるほとんどの研究は、目標が互いに独立しているシナリオに焦点を当てているが、相互依存タスクの自律的な獲得を研究するのはごくわずかである。
特に,タスク間の関係に関する情報をアーキテクチャのより高レベルなレベルで組み込むことの重要性を示す。
そして、自律的に取得したシーケンスを格納する新しい学習層を追加することで、前者を拡張する新しいシステムであるH-GRAILを紹介する。
論文 参考訳(メタデータ) (2022-05-16T10:43:01Z) - Learning to Walk Autonomously via Reset-Free Quality-Diversity [73.08073762433376]
品質多様性アルゴリズムは、多様かつ高いパフォーマンスのスキルからなる大規模で複雑な行動レパートリーを発見することができる。
既存のQDアルゴリズムは、手動による人間の監督と介入を必要とするエピソードリセットと同様に、多数の評価を必要とする。
本稿では,オープンエンド環境におけるロボットの自律学習に向けたステップとして,リセットフリー品質多様性最適化(RF-QD)を提案する。
論文 参考訳(メタデータ) (2022-04-07T14:07:51Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - SMASH: a Semantic-enabled Multi-agent Approach for Self-adaptation of
Human-centered IoT [0.8602553195689512]
本稿では、人間中心環境におけるIoTアプリケーションの自己適応のためのマルチエージェントアプローチであるSMASHを提案する。
SMASHエージェントは、BDIエージェントモデルに基づく4層アーキテクチャを備え、人間の価値観とゴール推論、計画、行動を統合する。
論文 参考訳(メタデータ) (2021-05-31T12:33:27Z) - FaiR-IoT: Fairness-aware Human-in-the-Loop Reinforcement Learning for
Harnessing Human Variability in Personalized IoT [0.0]
FaiR-IoTは、適応性と公平性を意識したヒューマンインザループIoTアプリケーションのための強化学習ベースのフレームワークです。
提案手法は, (i) 人型運転支援システム, (ii) 人型運転支援システムの2つの応用について検証した。
これらの2つのアプリケーションで得られた結果は、FaiR-IoTの一般性とパーソナライズされたエクスペリエンスを提供する能力を評価します。
論文 参考訳(メタデータ) (2021-03-30T02:30:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。