論文の概要: SF2SE3: Clustering Scene Flow into SE(3)-Motions via Proposal and
Selection
- arxiv url: http://arxiv.org/abs/2209.08532v1
- Date: Sun, 18 Sep 2022 10:54:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 18:10:18.022359
- Title: SF2SE3: Clustering Scene Flow into SE(3)-Motions via Proposal and
Selection
- Title(参考訳): SF2SE3: 提案と選択によるシーンフローのSE(3)へのクラスタリング
- Authors: Leonhard Sommer, Philipp Schr\"oppel, and Thomas Brox
- Abstract要約: SF2SE3は,独立に動く剛体物体とそのSE(3)運動へのセグメンテーションの形でシーンダイナミクスを推定する新しい手法である。
SF2SE3は2つのステレオまたはRGB-D画像で動作する。
SF2SE3のシーンフロー推定,オブジェクトセグメンテーション,ビジュアルオドメトリーへの応用について,複数のデータセットで評価を行った。
- 参考スコア(独自算出の注目度): 33.324875941480244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose SF2SE3, a novel approach to estimate scene dynamics in form of a
segmentation into independently moving rigid objects and their SE(3)-motions.
SF2SE3 operates on two consecutive stereo or RGB-D images. First, noisy scene
flow is obtained by application of existing optical flow and depth estimation
algorithms. SF2SE3 then iteratively (1) samples pixel sets to compute
SE(3)-motion proposals, and (2) selects the best SE(3)-motion proposal with
respect to a maximum coverage formulation. Finally, objects are formed by
assigning pixels uniquely to the selected SE(3)-motions based on consistency
with the input scene flow and spatial proximity. The main novelties are a more
informed strategy for the sampling of motion proposals and a maximum coverage
formulation for the proposal selection. We conduct evaluations on multiple
datasets regarding application of SF2SE3 for scene flow estimation, object
segmentation and visual odometry. SF2SE3 performs on par with the state of the
art for scene flow estimation and is more accurate for segmentation and
odometry.
- Abstract(参考訳): SF2SE3は,独立に動く剛体物体とそのSE(3)運動へのセグメンテーションの形でシーンダイナミクスを推定する新しい手法である。
SF2SE3は2つのステレオまたはRGB-D画像で動作する。
まず,既存の光学的流れと深度推定アルゴリズムを用いて雑音場の流れを求める。
sf2se3は、(1)ピクセル集合をサンプリングしてse(3)モーションプロポーザルを計算し、(2)最大カバレッジ定式化に関して最適なse(3)モーションプロポーザルを選択する。
最後に、入力シーンフローと空間近接との整合性に基づいて、選択されたSE(3)モーションに一意に画素を割り当ててオブジェクトを形成する。
主な新規性は、運動提案のサンプリングのためのより情報的な戦略と、提案選択のための最大カバレッジ定式化である。
SF2SE3のシーンフロー推定,オブジェクトセグメンテーション,ビジュアルオドメトリーへの応用について,複数のデータセットで評価を行った。
SF2SE3はシーンフロー推定のための技術の状態と同等に動作し、セグメンテーションやオドメトリーの精度が高い。
関連論文リスト
- SecondPose: SE(3)-Consistent Dual-Stream Feature Fusion for Category-Level Pose Estimation [79.12683101131368]
カテゴリーレベルのオブジェクトのポーズ推定は、既知のカテゴリから6次元のポーズと3次元の大きさを予測することを目的としている。
我々は、DINOv2のセマンティックカテゴリにオブジェクト固有の幾何学的特徴を統合する新しいアプローチであるSecondPoseを提案する。
論文 参考訳(メタデータ) (2023-11-18T17:14:07Z) - Scene-Generalizable Interactive Segmentation of Radiance Fields [64.37093918762]
我々はSGISRF(Scene-Generalizable Interactive in Radiance Fields)の最初の試みを行う。
そこで本研究では,複数視点の2D画像に対して,対話的なユーザクリック数回しか表示されない,新しい(見えない)シーンの3Dオブジェクトセグメンテーションを実現するSGISRF手法を提案する。
多様なシーンをカバーする2つの実世界の挑戦的ベンチマーク実験は,1) 提案手法の有効性とシーン一般化性を示し,2) シーン固有の最適化を必要とする古典的手法と比較して良好な性能を示した。
論文 参考訳(メタデータ) (2023-08-09T17:55:50Z) - Multi-body SE(3) Equivariance for Unsupervised Rigid Segmentation and
Motion Estimation [49.56131393810713]
本稿では、SE(3)同変アーキテクチャと、この課題に教師なしで取り組むためのトレーニング戦略を提案する。
本手法は,0.25Mパラメータと0.92G FLOPを用いて,モデル性能と計算効率を両立させる。
論文 参考訳(メタデータ) (2023-06-08T22:55:32Z) - A Deep Learning-based Global and Segmentation-based Semantic Feature
Fusion Approach for Indoor Scene Classification [0.6578923037198714]
本研究ではセグメンテーションマスクを用いてシーン横断のセグメンテーションカテゴリの2次元空間配置を求める手法を提案する。
2分岐ネットワークであるGS2F2Appは、RGB画像から抽出したCNNベースのグローバル機能と、提案したSSFから抽出したセグメンテーションベースの機能を利用する。
論文 参考訳(メタデータ) (2023-02-13T15:12:11Z) - Neural Volumetric Object Selection [126.04480613166194]
マルチプレーン画像(MPI)やニューラルレイディアンスフィールド(NeRF)のような,神経体積の3次元表現における物体の選択手法を提案する。
提案手法では,前景と背景の2次元ユーザを1つの視点で記述し,対象物の3次元セグメンテーションを自動的に推定する。
論文 参考訳(メタデータ) (2022-05-30T08:55:20Z) - FESTA: Flow Estimation via Spatial-Temporal Attention for Scene Point
Clouds [28.899804787744202]
シーンフローは、自律運転、ロボットナビゲーション、AR/VRなど、さまざまなアプリケーションにとって重要な3Dシーンのダイナミクスを描いている。
典型的な点雲サンプリングパターンのばらつきと不規則さのため、点雲からシーンフローを抽出することは依然として困難である。
不安定な抽象問題を軽減するために, 注意を伴う空間抽象(SA2)層を提案する。
a temporal abstraction with attention (ta2) layer は、時間領域における注意を正すために提案され、より広い範囲でスケールされた動きの利点をもたらす。
論文 参考訳(メタデータ) (2021-04-01T23:04:04Z) - Learning to Segment Rigid Motions from Two Frames [72.14906744113125]
本研究では, 運動場から独立物体の動きを復元する幾何学的解析により, モジュラーネットワークを提案する。
2つの連続フレームを入力とし、背景のセグメンテーションマスクと複数の剛体移動オブジェクトを予測し、3次元の剛体変換によってパラメータ化する。
本手法はkittiおよびsintelにおける剛体運動セグメンテーションの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-11T04:20:30Z) - Hierarchical Attention Learning of Scene Flow in 3D Point Clouds [28.59260783047209]
本稿では,2つの連続する3次元点雲からのシーンフロー推定の問題について検討する。
隣接フレームにおける点特徴の相関を学習するために, 二重注意を有する新しい階層型ニューラルネットワークを提案する。
実験の結果,提案したネットワークは3次元シーンフロー推定の最先端性能より優れていた。
論文 参考訳(メタデータ) (2020-10-12T14:56:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。