論文の概要: Learning and Optimization with 3D Orientations
- arxiv url: http://arxiv.org/abs/2509.17274v1
- Date: Sun, 21 Sep 2025 23:11:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 18:58:16.192475
- Title: Learning and Optimization with 3D Orientations
- Title(参考訳): 3次元指向による学習と最適化
- Authors: Alexandros Ntagkas, Constantinos Tsakonas, Chairi Kiourt, Konstantinos Chatzilygeroudis,
- Abstract要約: 本稿では,3次元配向に関連するすべての表現と「トリック」を,簡潔かつ統一した表記法で明確に提示する。
それらを代表的なシナリオでベンチマークします。
シナリオに応じてガイドラインを提供し、記述されたすべての配向数学の参照実装を提供する。
- 参考スコア(独自算出の注目度): 39.146761527401424
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There exist numerous ways of representing 3D orientations. Each representation has both limitations and unique features. Choosing the best representation for one task is often a difficult chore, and there exist conflicting opinions on which representation is better suited for a set of family of tasks. Even worse, when dealing with scenarios where we need to learn or optimize functions with orientations as inputs and/or outputs, the set of possibilities (representations, loss functions, etc.) is even larger and it is not easy to decide what is best for each scenario. In this paper, we attempt to a) present clearly, concisely and with unified notation all available representations, and "tricks" related to 3D orientations (including Lie Group algebra), and b) benchmark them in representative scenarios. The first part feels like it is missing from the robotics literature as one has to read many different textbooks and papers in order have a concise and clear understanding of all possibilities, while the benchmark is necessary in order to come up with recommendations based on empirical evidence. More precisely, we experiment with the following settings that attempt to cover most widely used scenarios in robotics: 1) direct optimization, 2) imitation/supervised learning with a neural network controller, 3) reinforcement learning, and 4) trajectory optimization using differential dynamic programming. We finally provide guidelines depending on the scenario, and make available a reference implementation of all the orientation math described.
- Abstract(参考訳): 3次元の向きを表す方法は数多く存在する。
各表現には制限とユニークな特徴がある。
1つのタスクに最適な表現を選択することは、しばしば難しい雑用であり、あるタスクのファミリーにどの表現がより適しているかという矛盾する意見がある。
さらに悪いことに、入力や出力として向き付けされた関数を学習したり、最適化する必要のあるシナリオを扱う場合、可能性のセット(表現、損失関数など)はさらに大きくなり、シナリオ毎に何がベストかを判断するのは簡単ではありません。
本稿では,これからの課題について述べる。
a) 明快で簡潔かつ統一された記法で、すべての利用可能な表現、および(リー群代数を含む)3次元配向に関連する「トリック」を提示し、
b) 代表的なシナリオでそれらをベンチマークする。
最初の部分は、あらゆる可能性について簡潔で明確な理解をするために、さまざまな教科書や論文を読まなければならないため、ロボティクスの文献から欠落しているように感じられる。
より正確には、ロボット工学において最も広く使われているシナリオをカバーしようとする、以下の設定を実験する。
1)直接最適化。
2 ニューラルネットワーク制御器による模倣・指導学習
3)強化学習、及び
4) 微分動的プログラミングを用いた軌道最適化
最終的に、シナリオに応じてガイドラインを提供し、記述されたすべての配向数学の参照実装を利用可能にします。
関連論文リスト
- Aligning Multimodal LLM with Human Preference: A Survey [62.89722942008262]
大規模言語モデル(LLM)は、タスク固有のトレーニングを必要とせずに、単純なプロンプトで幅広い汎用タスクを処理できる。
MLLM(Multimodal Large Language Models)は、視覚的、聴覚的、テキスト的データを含む複雑なタスクに対処する大きな可能性を実証している。
しかし、真理性、安全性、o1のような推論、および人間の嗜好との整合性に関する重要な問題は未解決のままである。
論文 参考訳(メタデータ) (2025-03-18T17:59:56Z) - Reinforcement Learning with Lie Group Orientations for Robotics [4.342261315851938]
配向のリー群構造に固執するネットワークの入力と出力の簡単な修正を提案する。
その結果,既存の学習ライブラリで直接使用可能な,簡単かつ効率的な実装が得られた。
ロボット工学におけるオリエンテーションのためのLie理論を簡潔に紹介し、我々のアプローチを動機づけ、概説する。
論文 参考訳(メタデータ) (2024-09-18T12:50:28Z) - DecisionNCE: Embodied Multimodal Representations via Implicit Preference Learning [27.705230758809094]
マルチモーダル・プレトレーニングは,自律型ロボットにおける表現学習の目標のトリニティのための効果的な戦略である。
画像シーケンスから意味のあるタスク進行情報を同時に抽出できる統一目的を提案する。
DecisionNCEは、ローカルおよびグローバルなタスク進行機能の両方をエレガントに抽出する、具体化された表現学習フレームワークを提供する。
論文 参考訳(メタデータ) (2024-02-28T07:58:24Z) - MOCA: Self-supervised Representation Learning by Predicting Masked Online Codebook Assignments [72.6405488990753]
自己教師付き学習は、ビジョントランスフォーマーネットワークの欲求を軽減できる。
所望のプロパティを統一する単段および単段のMOCAを提案する。
我々は,様々な評価プロトコルにおいて,低照度設定と強力な実験結果に対して,最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-07-18T15:46:20Z) - CorNav: Autonomous Agent with Self-Corrected Planning for Zero-Shot Vision-and-Language Navigation [73.78984332354636]
CorNavは視覚・言語ナビゲーションのための新しいゼロショットフレームワークである。
将来の計画の見直しや行動調整のための環境フィードバックが組み込まれている。
ゼロショットマルチタスク設定ですべてのベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-06-17T11:44:04Z) - Learning Downstream Task by Selectively Capturing Complementary
Knowledge from Multiple Self-supervisedly Learning Pretexts [20.764378638979704]
本稿では,タスクに適した表現を適応的に絞り込むために,アテンション機構を活用する新しい手法を提案する。
本手法は,知識収集において,現在普及しているテキストマッチング手法をはるかに上回っている。
論文 参考訳(メタデータ) (2022-04-11T16:46:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。