論文の概要: Autonomous particles
- arxiv url: http://arxiv.org/abs/2301.10077v1
- Date: Tue, 24 Jan 2023 15:31:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 13:16:28.832039
- Title: Autonomous particles
- Title(参考訳): 自律粒子
- Authors: Nikola Andrejic and Vitaly Vanchurin
- Abstract要約: 本稿では,関連する情報をブルート力で学習する必要はないが,本システムの本質的な対称性から同定することができると論じる。
我々は自律運転における強化学習問題について詳細に分析し、対応する対称性はガリレオ対称性である。
数値実験では、他の粒子と衝突することなく運転方法を学ぶために、自動運転車は4つの関連する不変量しか必要としないことを示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consider a reinforcement learning problem where an agent has access to a very
large amount of information about the environment, but it can only take very
few actions to accomplish its task and to maximize its reward. Evidently, the
main problem for the agent is to learn a map from a very high-dimensional space
(which represents its environment) to a very low-dimensional space (which
represents its actions). The high-to-low dimensional map implies that most of
the information about the environment is irrelevant for the actions to be
taken, and only a small fraction of information is relevant. In this paper we
argue that the relevant information need not be learned by brute force (which
is the standard approach), but can be identified from the intrinsic symmetries
of the system. We analyze in details a reinforcement learning problem of
autonomous driving, where the corresponding symmetry is the Galilean symmetry,
and argue that the learning task can be accomplished with very few relevant
parameters, or, more precisely, invariants. For a numerical demonstration, we
show that the autonomous vehicles (which we call autonomous particles since
they describe very primitive vehicles) need only four relevant invariants to
learn how to drive very well without colliding with other particles. The simple
model can be easily generalized to include different types of particles (e.g.
for cars, for pedestrians, for buildings, for road signs, etc.) with different
types of relevant invariants describing interactions between them. We also
argue that there must exist a field theory description of the learning system
where autonomous particles would be described by fermionic degrees of freedom
and interactions mediated by the relevant invariants would be described by
bosonic degrees of freedom.
- Abstract(参考訳): エージェントが環境に関する非常に多くの情報にアクセス可能な強化学習問題を考えるが、そのタスクを達成し、報酬を最大化するためには、非常に少ない行動しか実行できない。
明らかに、エージェントの主な問題は、非常に高次元の空間(その環境を表す)から非常に低次元の空間(その作用を表す)への写像を学ぶことである。
高度から低次元の地図は、環境に関する情報のほとんどは取るべき行動とは無関係であり、わずかな情報しか関係がないことを示している。
この論文では、関連する情報は(標準的なアプローチである)ブルート力によって学習される必要はないが、システムの本質的対称性から識別できると主張する。
我々は、対応する対称性がガリレオ対称性である自律運転の強化学習問題を詳細に分析し、学習課題は関連するパラメータ、あるいはより正確には不変量によって達成できると主張する。
数値的な実演では、他の粒子と衝突することなく運転方法を学ぶために、自動運転車(非常に原始的な車両を説明するために自律的粒子と呼ぶ)は4つの関連する不変量しか必要としないことを示した。
単純なモデルは、様々な種類の粒子(車、歩行者、建物、道路標識など)と、それらの相互作用を記述する異なる種類の不変量を含むように容易に一般化することができる。
また, 自律粒子がフェルミオン的自由度によって記述され, 関連する不変量によって媒介される相互作用がボソニック自由度によって記述されるような学習系の場理論記述も存在すべきである。
関連論文リスト
- G2L: Semantically Aligned and Uniform Video Grounding via Geodesic and
Game Theory [70.75605157754771]
ジオデシック・ゲーム・ローカライゼーション(Geodesic and Game Localization, G2L)は,ジオデシック・ゲーム理論によるセマンティック・アライメントと均一なビデオグラウンドティング・フレームワークである。
本研究は,モデルが正しいクロスモーダル表現を学習するための測地距離を利用したモーメント間の相関関係を定量化する。
論文 参考訳(メタデータ) (2023-07-26T16:14:21Z) - Towards fully covariant machine learning [0.0]
機械学習において、最も可視的な受動的対称性はグラフの可逆対称性または置換対称性である。
受動的対称性を尊重すべきならば,機械学習の実践について,dos と not について議論する。
論文 参考訳(メタデータ) (2023-01-31T16:01:12Z) - Particle-Based Score Estimation for State Space Model Learning in
Autonomous Driving [62.053071723903834]
マルチオブジェクト状態推定はロボットアプリケーションの基本的な問題である。
粒子法を用いて最大形パラメータを学習することを検討する。
自動運転車から収集した実データに本手法を適用した。
論文 参考訳(メタデータ) (2022-12-14T01:21:05Z) - Grounded Relational Inference: Domain Knowledge Driven Explainable Autonomous Driving [47.22329993674051]
我々は、人間のドメイン知識とモデル固有の因果関係の両方に整合した説明を生成する説明可能なモデルを開発することを目的とする。
特に、自律運転における重要なビルディングブロック、マルチエージェントインタラクションモデリングに焦点を当てる。
シミュレーションと実環境設定の両方で対話的な交通シナリオをモデル化できることを実証する。
論文 参考訳(メタデータ) (2021-02-23T19:34:32Z) - Fundamental Limits and Tradeoffs in Invariant Representation Learning [99.2368462915979]
多くの機械学習アプリケーションは、2つの競合する目標を達成する表現を学習する。
ミニマックスゲーム理論の定式化は、精度と不変性の基本的なトレードオフを表す。
分類と回帰の双方において,この一般的かつ重要な問題を情報論的に解析する。
論文 参考訳(メタデータ) (2020-12-19T15:24:04Z) - Dependency Decomposition and a Reject Option for Explainable Models [4.94950858749529]
近年のディープラーニングモデルは様々な推論タスクにおいて非常によく機能する。
最近の進歩は特徴を視覚化し、入力の属性を記述する方法を提供します。
本稿では, 目的の画像分類出力に対する確率分布に関する依存性を初めて解析する。
論文 参考訳(メタデータ) (2020-12-11T17:39:33Z) - Detecting 32 Pedestrian Attributes for Autonomous Vehicles [103.87351701138554]
本稿では、歩行者を共同で検出し、32の歩行者属性を認識するという課題に対処する。
本稿では,複合フィールドフレームワークを用いたマルチタスク学習(MTL)モデルを提案する。
競合検出と属性認識の結果と,より安定したMTLトレーニングを示す。
論文 参考訳(メタデータ) (2020-12-04T15:10:12Z) - Living in the Physics and Machine Learning Interplay for Earth
Observation [7.669855697331746]
推論は変数の関係を理解し、物理的に解釈可能なモデルを導出することを意味する。
機械学習モデルだけでも優れた近似器であるが、物理学の最も基本的な法則を尊重しないことが多い。
これは、地球系の知識を発見できるアルゴリズムを開発し、適用するための、長期的なAIの集合的なアジェンダである。
論文 参考訳(メタデータ) (2020-10-18T16:58:20Z) - Studying Person-Specific Pointing and Gaze Behavior for Multimodal
Referencing of Outside Objects from a Moving Vehicle [58.720142291102135]
物体選択と参照のための自動車応用において、手指しと目視が広く研究されている。
既存の車外参照手法は静的な状況に重点を置いているが、移動車両の状況は極めて動的であり、安全性に制約がある。
本研究では,外部オブジェクトを参照するタスクにおいて,各モダリティの具体的特徴とそれら間の相互作用について検討する。
論文 参考訳(メタデータ) (2020-09-23T14:56:19Z) - Interaction Graphs for Object Importance Estimation in On-road Driving
Videos [9.344790309080283]
ドライバーのリアルタイム意思決定における各オブジェクトの重要性を推定する学習は、人間の運転行動をよりよく理解するのに役立ちます。
相互作用グラフを用いたオブジェクト重要度推定のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-12T22:28:56Z) - Intelligence, physics and information -- the tradeoff between accuracy
and simplicity in machine learning [5.584060970507507]
私は、インテリジェンスを多くの統合的な側面で見ることと、タスクのパフォーマンスと複雑さの間の普遍的な2日間のトレードオフは、2つの実現可能な視点を提供すると信じています。
この論文では、インテリジェンスのいくつかの側面においていくつかの重要な問題に対処し、2期間のトレードオフにおける相転移について研究する。
論文 参考訳(メタデータ) (2020-01-11T18:34:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。