論文の概要: SynFlow: Scaling Up LiDAR Scene Flow Estimation with Synthetic Data
- arxiv url: http://arxiv.org/abs/2604.09411v1
- Date: Fri, 10 Apr 2026 15:25:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.927843
- Title: SynFlow: Scaling Up LiDAR Scene Flow Estimation with Synthetic Data
- Title(参考訳): SynFlow: 合成データによるLiDARシーンフロー推定のスケールアップ
- Authors: Qingwen Zhang, Xiaomeng Zhu, Chenhan Jiang, Patric Jensfelt,
- Abstract要約: 我々は、スケーラブルなシミュレーションから、堅牢な実世界の動きを学習するパラダイムのシフトを提案する。
我々は,LiDARシーンフロー用に設計された大規模合成データセットを生成するデータ生成パイプラインであるSynFlowを紹介する。
実験の結果,SynFlow-4kはドメイン不変な動作を先行して提供することがわかった。
- 参考スコア(独自算出の注目度): 8.686885768051345
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Reliable 3D dynamic perception requires models that can anticipate motion beyond predefined categories, yet progress is hindered by the scarcity of dense, high-quality motion annotations. While self-supervision on unlabeled real data offers a path forward, empirical evidence suggests that scaling unlabeled data fails to close the performance gap due to noisy proxy signals. In this paper, we propose a shift in paradigm: learning robust real-world motion priors entirely from scalable simulation. We introduce SynFlow, a data generation pipeline that generates large-scale synthetic dataset specifically designed for LiDAR scene flow. Unlike prior works that prioritize sensor-specific realism, SynFlow employs a motion-oriented strategy to synthesize diverse kinematic patterns across 4,000 sequences ($\sim$940k frames), termed SynFlow-4k. This represents a 34x scale-up in annotated volume over existing real-world benchmarks. Our experiments demonstrate that SynFlow-4k provides a highly domain-invariant motion prior. In a zero-shot regime, models trained exclusively on our synthetic data generalize across multiple real-world benchmarks, rivaling in-domain supervised baselines on nuScenes and outperforming state-of-the-art methods on TruckScenes by 31.8%. Furthermore, SynFlow-4k serves as a label-efficient foundation: fine-tuning with only 5% of real-world labels surpasses models trained from scratch on the full available budget. We open-source the pipeline and dataset to facilitate research in generalizable 3D motion estimation. More detail can be found at https://kin-zhang.github.io/SynFlow.
- Abstract(参考訳): 信頼性の高い3D動的知覚には、事前に定義されたカテゴリを超えて動きを予測できるモデルが必要であるが、高画質なモーションアノテーションが不足しているために進行が妨げられている。
ラベルのない実データに対する自己監督は、先進的な道筋を提供するが、ラベルのないデータのスケーリングは、ノイズの多いプロキシ信号によるパフォーマンスギャップを埋めることができない、という実証的な証拠がある。
本稿では,スケーラブルなシミュレーションから実世界の強靭な動きを学習するパラダイムのシフトを提案する。
我々は,LiDARシーンフロー用に設計された大規模合成データセットを生成するデータ生成パイプラインであるSynFlowを紹介する。
センサー固有のリアリズムを優先する以前の研究とは異なり、SynFlowは、SynFlow-4kと呼ばれる4000のシーケンスにまたがる多様なキネマティックパターンを合成する動き指向の戦略を採用している。
これは、既存の実世界のベンチマークよりも34倍の量の注釈付きボリュームである。
実験の結果,SynFlow-4kはドメイン不変な動作を先行して提供することがわかった。
ゼロショット方式では、我々の合成データに特化して訓練されたモデルは、複数の実世界のベンチマークにまたがって一般化され、nuScenesのドメイン内教師付きベースラインに匹敵し、TrackScenesの最先端メソッドよりも31.8%向上した。
さらに、SynFlow-4kはラベル効率のよい基盤として機能し、実際のラベルのわずか5%の微調整は、利用可能な全予算をゼロからトレーニングしたモデルを上回る。
我々はパイプラインとデータセットをオープンソース化し、一般化可能な3Dモーション推定の研究を容易にする。
詳細はhttps://kin-zhang.github.io/SynFlow.comで確認できる。
関連論文リスト
- UniFlow: Towards Zero-Shot LiDAR Scene Flow for Autonomous Vehicles via Cross-Domain Generalization [46.6187296172395]
我々は多種多様なLiDARセンサに転送する一般的な動きの先行を学習する。
我々は、複数の大規模LiDARシーンフローデータセットを統一し、訓練するフィードフォワードモデルのファミリーであるUniFlowを提案する。
UniFlowは、TruckScenesのような目に見えないデータセットで最先端の精度を実現し、TruckScenes固有のモデルよりも30.1%向上している。
論文 参考訳(メタデータ) (2025-11-23T02:51:42Z) - BlendCLIP: Bridging Synthetic and Real Domains for Zero-Shot 3D Object Classification with Multimodal Pretraining [2.400704807305413]
ゼロショットの3Dオブジェクト分類は、自動運転のような現実世界のアプリケーションには不可欠だ。
トレーニングに使用される合成データと、現実世界で遭遇するノイズの多いLiDARスキャンとの間の大きな領域ギャップによって、しばしば妨げられる。
BlendCLIPは、両ドメインの強みを戦略的に組み合わせることで、この合成と現実のギャップを橋渡しするマルチモーダル事前学習フレームワークである。
論文 参考訳(メタデータ) (2025-10-21T03:08:27Z) - Scaling Laws of Synthetic Data for Language Models [125.41600201811417]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文 参考訳(メタデータ) (2025-03-25T11:07:12Z) - MegaSynth: Scaling Up 3D Scene Reconstruction with Synthesized Data [59.88075377088134]
合成データを用いたトレーニングにより3次元シーン再構成のスケールアップを提案する。
私たちの研究の中心は、700Kシーンからなる手続き的に生成された3DデータセットであるMega Synthです。
実験の結果,Mega Synthとの共同トレーニングや事前トレーニングにより,画像領域間で1.2~1.8dBPSNRの再現性が改善された。
論文 参考訳(メタデータ) (2024-12-18T18:59:38Z) - UnrealPerson: An Adaptive Pipeline towards Costless Person
Re-identification [102.58619642363959]
本稿では,unrealpersonという,非現実的な画像データをフル活用して,トレーニングとデプロイメントの両面でコストを削減する新しいパイプラインを提案する。
3,000のIDと12万のインスタンスで、MSMT17に直接転送されると38.5%のランク-1の精度が得られる。
論文 参考訳(メタデータ) (2020-12-08T08:15:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。