論文の概要: The Selective Disk Bispectrum and Its Inversion, with Application to Multi-Reference Alignment
- arxiv url: http://arxiv.org/abs/2511.19706v1
- Date: Mon, 24 Nov 2025 21:15:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-26 17:37:04.164742
- Title: The Selective Disk Bispectrum and Its Inversion, with Application to Multi-Reference Alignment
- Title(参考訳): 選択ディスクバイスペクトルとその逆変換とマルチ参照アライメントへの応用
- Authors: Adele Myers, Nina Miolane,
- Abstract要約: 画像形状解析のための高速な回転不変表現である選択的ディスクバイスペクトルを提案する。
この表現は回転した画像に対して多重参照アライメントを可能にすることを示す。
これらの結果は、回転不変形状データから学習するための実用的で理論的に基礎付けられたツールとしてディスクバイスペクトルを確立する。
- 参考スコア(独自算出の注目度): 10.72207664572929
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many computer vision and shape analysis tasks, practitioners are interested in learning from the shape of the object in an image, while disregarding the object's orientation. To this end, it is valuable to define a rotation-invariant representation of images, retaining all information about that image, but disregarding the way an object is rotated in the frame. To be practical for learning tasks, this representation must be computationally efficient for large datasets and invertible, so the representation can be visualized in image space. To this end, we present the selective disk bispectrum: a fast, rotation-invariant representation for image shape analysis. While the translational bispectrum has long been used as a translational invariant representation for 1-D and 2-D signals, its extension to 2-D (disk) rotational invariance on images has been hindered by the absence of an invertible formulation and its cubic complexity. In this work, we derive an explicit inverse for the disk bispectrum, which allows us to define a "selective" disk bispectrum, which only uses the minimal number of coefficients needed for faithful shape recovery. We show that this representation enables multi-reference alignment for rotated images-a task previously intractable for disk bispectrum methods. These results establish the disk bispectrum as a practical and theoretically grounded tool for learning on rotation-invariant shape data.
- Abstract(参考訳): 多くのコンピュータビジョンや形状解析タスクにおいて、実践者は物体の向きを無視しながら、画像中の物体の形状から学ぶことに興味を持っている。
この目的のために、画像の回転不変表現を定義し、その画像に関するすべての情報を保持するが、オブジェクトがフレーム内で回転する方法を無視することは重要である。
タスクを学習するためには、この表現は大きなデータセットに対して計算的に効率的で非可逆でなければならないので、画像空間で表現を視覚化することができる。
この目的のために、画像形状解析のための高速な回転不変表現である選択的ディスクバイスペクトルを提案する。
翻訳双スペクトルは1-D信号と2-D信号の変換不変表現として長い間用いられてきたが、画像上の2-D(disk)回転不変性への拡張は、可逆的な定式化の欠如と3次複雑さによって妨げられている。
本研究では, 円盤双スペクトルに対して, 忠実な形状回復に必要な最小限の係数のみを使用する「選択的」円板双スペクトルを定義できる明示的な逆関数を導出する。
この表現により、回転した画像に対するマルチ参照アライメントが可能であることが示される。
これらの結果は、回転不変形状データから学習するための実用的で理論的に基礎付けられたツールとしてディスクバイスペクトルを確立する。
関連論文リスト
- DVMNet++: Rethinking Relative Pose Estimation for Unseen Objects [59.51874686414509]
既存のアプローチでは、通常、接地構造オブジェクト境界ボックスと、多数の離散仮説を持つ近似3次元回転を用いて3次元翻訳を予測している。
本稿では,1回のパスで相対オブジェクトのポーズを計算するDeep Voxel Matching Network (DVMNet++)を提案する。
提案手法は,最先端手法と比較して計算コストの低い新しいオブジェクトに対して,より正確な相対的ポーズ推定を行う。
論文 参考訳(メタデータ) (2024-03-20T15:41:32Z) - Evaluating 3D Shape Analysis Methods for Robustness to Rotation
Invariance [22.306775502181818]
本稿では,最近の3次元形状記述子のSO(3)回転に対する堅牢性について解析する。
物体が異なる方向で行われる3次元屋内シーンのデータベースを考察する。
論文 参考訳(メタデータ) (2023-05-29T18:39:31Z) - Adaptive Rotated Convolution for Rotated Object Detection [96.94590550217718]
本稿では、回転物体検出問題に対処するために、適応回転変換(ARC)モジュールを提案する。
ARCモジュールでは、コンボリューションカーネルが適応的に回転し、異なる画像に異なる向きのオブジェクト特徴を抽出する。
提案手法は,81.77%mAPのDOTAデータセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-14T11:53:12Z) - Category-level Shape Estimation for Densely Cluttered Objects [94.64287790278887]
そこで本研究では,密に散らばった物体のカテゴリレベルの形状推定手法を提案する。
我々のフレームワークは、多視点視覚情報融合によって、各オブジェクトをクラッタに分割する。
シミュレーション環境と実世界の実験から,本手法が高精度な形状推定を実現することが示された。
論文 参考訳(メタデータ) (2023-02-23T13:00:17Z) - Category-Level 6D Object Pose Estimation with Flexible Vector-Based
Rotation Representation [51.67545893892129]
モノクロRGB-D画像からカテゴリレベルの6次元ポーズとサイズ推定のための新しい3次元グラフ畳み込みに基づくパイプラインを提案する。
まず,3次元グラフ畳み込みを用いた向き対応オートエンコーダの設計を行った。
そして, 回転情報を潜在特徴から効率的に復号化するために, フレキシブルなベクトルベースデコンポーザブルな回転表現を設計する。
論文 参考訳(メタデータ) (2022-12-09T02:13:43Z) - Disentangled Implicit Shape and Pose Learning for Scalable 6D Pose
Estimation [44.8872454995923]
単一オートエンコーダを用いた複数オブジェクトの合成データに対する自己教師付き学習により,スケーラブルな6次元ポーズ推定のための新しい手法を提案する。
提案手法は,T-LESS と NOCS REAL275 という実データを持つ2つのマルチオブジェクトベンチマークで検証し,ポーズ推定精度と一般化の点で既存の RGB 法より優れていることを示す。
論文 参考訳(メタデータ) (2021-07-27T01:55:30Z) - Extreme Rotation Estimation using Dense Correlation Volumes [73.35119461422153]
本稿では,RGB画像対の相対的な3次元回転を極端に推定する手法を提案する。
画像が重なり合わなくても、それらの幾何学的関係に関して豊富な隠れた手がかりがあるかもしれないと観察する。
本稿では,2つの入力画像間の全ての点を比較することで,そのような暗黙の手がかりを自動的に学習できるネットワーク設計を提案する。
論文 参考訳(メタデータ) (2021-04-28T02:00:04Z) - Roto-Translation Equivariant Convolutional Networks: Application to
Histopathology Image Analysis [11.568329857588099]
畳み込みネットワークにおける特殊ユークリッド運動群SE(2)の幾何学的構造を符号化する枠組みを提案する。
提案手法を用いることで,一貫した性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2020-02-20T13:44:29Z) - Variable-Viewpoint Representations for 3D Object Recognition [27.913222855275997]
共通表現連続体の2つの極端に2種類の入力表現が存在することを示す。
この2つの極点の間の点にある興味深い中間表現を同定する。
系統的な経験実験を通して、入力情報の関数としてこの連続体に沿って精度がどのように変化するかを示す。
論文 参考訳(メタデータ) (2020-02-08T10:06:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。