論文の概要: Floxels: Fast Unsupervised Voxel Based Scene Flow Estimation
- arxiv url: http://arxiv.org/abs/2503.04718v1
- Date: Thu, 06 Mar 2025 18:58:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 16:00:34.217295
- Title: Floxels: Fast Unsupervised Voxel Based Scene Flow Estimation
- Title(参考訳): Floxels: 高速な教師なしボクセル型シーンフロー推定
- Authors: David T. Hoffmann, Syed Haseeb Raza, Hanqiu Jiang, Denis Tananaev, Steffen Klingenhoefer, Martin Meinke,
- Abstract要約: 1) 最適化手法と2) 最適化手法の2つのアプローチが進化した。
Floxelsは、計算コストのごく一部で同等のパフォーマンスを達成しながら、教師なしの手法の中でEulerFlowにしか勝っていない。
FloxelsはEulerFlow上で60~140倍の大幅なスピードアップを実現し、1シーケンスあたりのランタイムを1日から10分に短縮する。
- 参考スコア(独自算出の注目度): 1.429392440481971
- License:
- Abstract: Scene flow estimation is a foundational task for many robotic applications, including robust dynamic object detection, automatic labeling, and sensor synchronization. Two types of approaches to the problem have evolved: 1) Supervised and 2) optimization-based methods. Supervised methods are fast during inference and achieve high-quality results, however, they are limited by the need for large amounts of labeled training data and are susceptible to domain gaps. In contrast, unsupervised test-time optimization methods do not face the problem of domain gaps but usually suffer from substantial runtime, exhibit artifacts, or fail to converge to the right solution. In this work, we mitigate several limitations of existing optimization-based methods. To this end, we 1) introduce a simple voxel grid-based model that improves over the standard MLP-based formulation in multiple dimensions and 2) introduce a new multiframe loss formulation. 3) We combine both contributions in our new method, termed Floxels. On the Argoverse 2 benchmark, Floxels is surpassed only by EulerFlow among unsupervised methods while achieving comparable performance at a fraction of the computational cost. Floxels achieves a massive speedup of more than ~60 - 140x over EulerFlow, reducing the runtime from a day to 10 minutes per sequence. Over the faster but low-quality baseline, NSFP, Floxels achieves a speedup of ~14x.
- Abstract(参考訳): シーンフロー推定は、ロバストな動的オブジェクト検出、自動ラベリング、センサ同期など、多くのロボットアプリケーションの基本課題である。
この問題に対する2つのアプローチが進化した。
1)監督・監督
2)最適化に基づく手法。
教師付き手法は推論中は高速であり、高品質な結果が得られるが、大量のラベル付きトレーニングデータを必要とするため制限されており、ドメインギャップの影響を受けやすい。
対照的に、教師なしテストタイム最適化手法は、ドメインギャップの問題に直面するのではなく、多くの場合、実質的なランタイムに悩まされ、アーティファクトを示し、正しいソリューションに収束しない。
本研究では,既存の最適化手法のいくつかの制限を緩和する。
この目的のために、私たちは
1)マルチ次元の標準MLPモデルよりも優れた単純なボクセルグリッドモデルを導入する。
2) 新しい多フレーム損失定式化を導入する。
3)Floxelsと呼ばれる新しい手法に両コントリビューションを組み合わせる。
Argoverse 2ベンチマークでは、Floxelsは教師なしメソッドの中でEulerFlowにしか勝っていないが、計算コストのごく一部で同等のパフォーマンスを実現している。
FloxelsはEulerFlow上で約60~140倍の大幅なスピードアップを実現し、1シーケンスあたりのランタイムを1日から10分に短縮する。
高速だが低品質のベースラインであるNSFPでは、Floxelsは14倍のスピードアップを達成する。
関連論文リスト
- ScoreFlow: Mastering LLM Agent Workflows via Score-based Preference Optimization [51.280919773837645]
エージェントワークフロー最適化のための高性能フレームワークであるScoreFlowを開発した。
ScoreFlowは、量的フィードバックを考慮に入れた直接選好最適化手法の新たな変種であるScore-DPOを組み込んでいる。
質問応答、コーディング、数学的推論を通じて、既存のベースラインよりも8.2%改善されている。
論文 参考訳(メタデータ) (2025-02-06T18:47:49Z) - DiffIM: Differentiable Influence Minimization with Surrogate Modeling and Continuous Relaxation [23.06479920145709]
影響最小化(IMIN)は、ノード間の伝播を減らすために入力グラフの構造を操作する問題である。
DiffIMは、加速のための2つの異なるスキームを持つIMINの新しい手法である。
提案手法は,IMINの性能劣化をほとんど(あるいは全く)伴わず,性能を著しく向上させることを示す。
論文 参考訳(メタデータ) (2025-02-03T03:54:23Z) - Dual-frame Fluid Motion Estimation with Test-time Optimization and Zero-divergence Loss [9.287932323337163]
3次元粒子追跡速度計(PTV)は乱流解析の鍵となる技術である。
深層学習に基づく手法は、2フレームの流体運動推定において顕著な精度を達成している。
我々は,完全に自己管理された新しい手法を導入し,完全に教師された手法よりも優れていた。
論文 参考訳(メタデータ) (2024-10-15T18:00:00Z) - Consistency Flow Matching: Defining Straight Flows with Velocity Consistency [97.28511135503176]
本稿では,速度場の自己整合性を明示する新しいFM法であるConsistency Flow Matching(Consistency-FM)を紹介する。
予備実験により、一貫性FMは、一貫性モデルよりも4.4倍速く収束することにより、トレーニング効率を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-07-02T16:15:37Z) - FuzzyFlow: Leveraging Dataflow To Find and Squash Program Optimization
Bugs [92.47146416628965]
FuzzyFlowはプログラム最適化をテストするために設計されたフォールトローカライゼーションとテストケース抽出フレームワークである。
我々は、データフロープログラム表現を活用して、完全に再現可能なシステム状態と最適化のエリア・オブ・エフェクトをキャプチャする。
テスト時間を削減するため,テスト入力を最小限に抑えるアルゴリズムを設計し,再計算のためのメモリ交換を行う。
論文 参考訳(メタデータ) (2023-06-28T13:00:17Z) - ZeroFlow: Scalable Scene Flow via Distillation [66.70820145266029]
シーンフロー推定は、時間的に連続する点雲間の3次元運動場を記述するタスクである。
State-of-the-artメソッドは、強い事前とテスト時の最適化技術を使用するが、フルサイズの点雲を処理するには数秒の順序を必要とする。
本研究では,ラベルなし最適化手法を用いて擬似ラベルを生成し,フィードフォワードモデルを監督する簡易でスケーラブルな蒸留フレームワークであるScene Flow via Distillationを提案する。
論文 参考訳(メタデータ) (2023-05-17T17:56:59Z) - Explicit Second-Order Min-Max Optimization Methods with Optimal Convergence Guarantee [86.05440220344755]
我々は,非制約のmin-max最適化問題のグローバルなサドル点を求めるために,不正確な正規化ニュートン型手法を提案し,解析する。
提案手法は有界集合内に留まるイテレートを生成し、その反復は制限関数の項で$O(epsilon-2/3)$内の$epsilon$-saddle点に収束することを示す。
論文 参考訳(メタデータ) (2022-10-23T21:24:37Z) - Multipoint-BAX: A New Approach for Efficiently Tuning Particle
Accelerator Emittance via Virtual Objectives [47.52324722637079]
マルチポイントクエリにおけるブラックボックス最適化のための情報理論アルゴリズムであるMultipoint-BAXを提案する。
我々はマルチポイントBAXを用いてLinac Coherent Light Source(LCLS)とAdvanced Accelerator Experimental Tests II(FACET-II)の発光を最小化する。
論文 参考訳(メタデータ) (2022-09-10T04:01:23Z) - Fast and Robust Non-Rigid Registration Using Accelerated
Majorization-Minimization [35.66014845211251]
非剛性登録は、ターゲット形状と整合する非剛性な方法でソース形状を変形させるが、コンピュータビジョンにおける古典的な問題である。
既存のメソッドは通常$ell_p$型ロバストノルムを使用してアライメントエラーを測定し、変形の滑らかさを規則化する。
本稿では、アライメントと正規化のためのグローバルなスムーズなロバストノルムに基づく、ロバストな非剛体登録のための定式化を提案する。
論文 参考訳(メタデータ) (2022-06-07T16:00:33Z) - Self Normalizing Flows [65.73510214694987]
本稿では,各層における学習された近似逆数により,勾配の高価な項を置き換えることで,フローの正規化を訓練するための柔軟なフレームワークを提案する。
これにより、各レイヤの正確な更新の計算複雑性が$mathcalO(D3)$から$mathcalO(D2)$に削減される。
実験により,これらのモデルは非常に安定であり,正確な勾配値と類似したデータ可能性値に最適化可能であることが示された。
論文 参考訳(メタデータ) (2020-11-14T09:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。