論文の概要: Fourier Features Let Agents Learn High Precision Policies with Imitation Learning
- arxiv url: http://arxiv.org/abs/2606.12334v1
- Date: Wed, 10 Jun 2026 17:05:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.581089
- Title: Fourier Features Let Agents Learn High Precision Policies with Imitation Learning
- Title(参考訳): エージェントが模倣学習で高精度なポリシーを学習できるFourier機能
- Authors: Balázs Gyenes, Emiliyan Gospodinov, Jan Frieling, Enrico Krohmer, Nicolas Schreiber, Xiaogang Jia, Niklas Freymuth, Gerhard Neumann,
- Abstract要約: 高精度なロボット操作には、きめ細かい空間推論が必要である。
ポイントクラウドをベースとした3D情報を直接活用するポリシは、純粋にイメージベースのものよりも、より強力な幾何学的事前を提供する。
本稿では,高次元フーリエ空間にカーテシアン空間から点雲をマッピングし,高周波数特徴に直接アクセス可能な点雲エンコーダを効果的に装備することを提案する。
- 参考スコア(独自算出の注目度): 19.962537764526186
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-precision robotic manipulation requires fine-grained spatial reasoning that is often difficult to achieve with RGB-only policies due to depth ambiguity and perspective scale issues. Policies that leverage 3D information directly, such as those based on point clouds, offer a stronger geometric prior over purely image-based ones, yet their performance remains highly task-dependent. We hypothesize that this discrepancy may be due to the spectral bias of neural networks towards learning low frequency functions, which especially affects architectures conditioned on slow-moving Cartesian features. We thus propose to map point clouds from Cartesian space into high-dimensional Fourier space, effectively equipping the point cloud encoder with direct access to high-frequency features. We experimentally validate the use of Fourier features on challenging manipulation tasks from the RoboCasa and ManiSkill3 benchmarks and on a real robot setup. Despite their simplicity, we find that Fourier features provide significant benefits across diverse encoder architectures and benchmarks and are robust across hyperparameters. Our results indicate that Fourier features let policies leverage geometric details more effectively than Cartesian features, showing their potential as a general-purpose tool for point cloud-based imitation learning. We provide source code and videos on our project page: https://fourier-il.github.io/fourier-il
- Abstract(参考訳): 高精度なロボット操作には、奥行きの曖昧さと視点のスケールの問題により、RGBのみのポリシーで達成し難い、きめ細かい空間推論が必要である。
ポイントクラウドをベースとした3D情報を直接活用するポリシは、純粋にイメージベースのものよりも強力な幾何学的事前を提供するが、そのパフォーマンスはタスクに依存している。
この相違は、低周波関数の学習に対するニューラルネットワークのスペクトルバイアスに起因する可能性があり、特にスローモーションカルテジアン特徴に規定されたアーキテクチャに影響を及ぼす。
そこで我々は,カルト空間から高次元フーリエ空間へ点雲をマッピングし,高周波数特徴に直接アクセス可能な点雲エンコーダを効果的に装備することを提案する。
我々は,RoboCasa と ManiSkill3 のベンチマークや実際のロボットのセットアップにおいて,Fourier 機能の使用が困難な操作タスクに与える影響を実験的に検証した。
その単純さにもかかわらず、Fourierの機能は様々なエンコーダアーキテクチャやベンチマークにまたがって大きなメリットをもたらし、ハイパーパラメータにわたって堅牢であることに気付きました。
以上の結果から,Fourier機能により,カルテシアン機能よりも幾何的細部を効果的に活用することが可能であり,点クラウドによる模倣学習の汎用ツールとしての可能性を示している。
私たちはプロジェクトページでソースコードとビデオを提供しています。
関連論文リスト
- Point Cloud Unsupervised Pre-training via 3D Gaussian Splatting [7.070581940661794]
我々は,ポイントクラウド表現を学習するために,GS$3$という効率的なフレームワークを提案する。
具体的には、入力されたRGB-D画像を3次元空間にバックプロジェクションし、ポイントクラウドエンコーダを用いてポイントワイズ機能を抽出する。
論文 参考訳(メタデータ) (2024-11-27T16:11:45Z) - Parameter-Efficient Fine-Tuning in Spectral Domain for Point Cloud Learning [49.91297276176978]
我々は,ポイントクラウドのための新しい固有textbfPointGST (textbfGraph textbfSpectral textbfTuning) 法を提案する。
ポイントGSTは事前訓練されたモデルを凍結し、スペクトル領域の微調整パラメータのための軽量で訓練可能なポイントクラウドスペクトルアダプタ(PCSA)を導入する。
さまざまなタスクにわたる挑戦的なポイントクラウドデータセットの実験では、ポイントGSTが完全に微調整されたデータセットを上回るだけでなく、トレーニング可能なパラメータも大幅に削減されていることが示されている。
論文 参考訳(メタデータ) (2024-10-10T17:00:04Z) - PFGS: High Fidelity Point Cloud Rendering via Feature Splatting [5.866747029417274]
スパースポイントから高品質な画像をレンダリングする新しいフレームワークを提案する。
この手法はまず3次元ガウス格子と点雲のレンダリングを橋渡しする。
異なるベンチマーク実験により、レンダリング品質と主成分の必要性の観点から、我々の手法の優位性を示す。
論文 参考訳(メタデータ) (2024-07-04T11:42:54Z) - ParaPoint: Learning Global Free-Boundary Surface Parameterization of 3D Point Clouds [52.03819676074455]
ParaPointは、グローバルな自由境界面パラメータ化を実現するための教師なしのニューラルネットワークパイプラインである。
この研究は、グローバルマッピングと自由境界の両方を追求するニューラルポイントクラウドパラメータ化を調査する最初の試みである。
論文 参考訳(メタデータ) (2024-03-15T14:35:05Z) - Feature 3DGS: Supercharging 3D Gaussian Splatting to Enable Distilled Feature Fields [54.482261428543985]
ニューラル・ラジアンス・フィールドを使用する手法は、新しいビュー合成のような従来のタスクに汎用的である。
3次元ガウシアンスプラッティングは, 実時間ラディアンス場レンダリングにおける最先端の性能を示した。
この問題を効果的に回避するために,アーキテクチャとトレーニングの変更を提案する。
論文 参考訳(メタデータ) (2023-12-06T00:46:30Z) - GPr-Net: Geometric Prototypical Network for Point Cloud Few-Shot
Learning [2.4366811507669115]
GPr-Netは、点雲の原型位相を捉える軽量で計算効率の良い幾何学的ネットワークである。
GPr-Netは、ポイントクラウド上の数ショット学習において最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-04-12T17:32:18Z) - QFF: Quantized Fourier Features for Neural Field Representations [28.82293263445964]
我々は、QFF(Quantized Fourier Features)を用いることで、モデルのサイズが小さくなり、トレーニングが速くなり、複数のアプリケーションの品質が向上することを示した。
QFFは簡単にコーディングでき、高速に計算でき、多くのニューラルネットワーク表現に加えてシンプルなドロップインとして機能する。
論文 参考訳(メタデータ) (2022-12-02T00:11:22Z) - Revisiting Point Cloud Simplification: A Learnable Feature Preserving
Approach [57.67932970472768]
MeshとPoint Cloudの単純化手法は、3Dモデルの複雑さを低減しつつ、視覚的品質と関連する健全な機能を維持することを目的としている。
そこで本研究では,正解点の標本化を学習し,高速点雲の簡易化手法を提案する。
提案手法は、入力空間から任意のユーザ定義の点数を選択し、視覚的知覚誤差を最小限に抑えるために、その位置を再配置するよう訓練されたグラフニューラルネットワークアーキテクチャに依存する。
論文 参考訳(メタデータ) (2021-09-30T10:23:55Z) - Fourier Features Let Networks Learn High Frequency Functions in Low
Dimensional Domains [69.62456877209304]
単純なフーリエ特徴写像を通して入力点を渡すことで、多層パーセプトロンが高周波関数を学習できることを示す。
結果は、最先端の結果を達成するコンピュータビジョンとグラフィックの進歩に光を当てた。
論文 参考訳(メタデータ) (2020-06-18T17:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。