論文の概要: Star-Fusion: A Multi-modal Transformer Architecture for Discrete Celestial Orientation via Spherical Topology
- arxiv url: http://arxiv.org/abs/2604.26582v1
- Date: Wed, 29 Apr 2026 12:01:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.388105
- Title: Star-Fusion: A Multi-modal Transformer Architecture for Discrete Celestial Orientation via Spherical Topology
- Title(参考訳): Star-Fusion: 球面トポロジーによる離散チェレスタオリエンテーションのためのマルチモーダルトランスフォーマーアーキテクチャ
- Authors: May Hammad, Menatallh Hammad,
- Abstract要約: 本稿では,方向推定を離散的なトポロジ的分類タスクとして再構成するマルチモーダルアーキテクチャであるStar-Fusionを提案する。
提案アーキテクチャは、光度特徴抽出のためのSwinV2-Tiny変換器バックボーン、空間接地のための三部構造畳み込み熱マップブランチ、幾何アンカーのための座標ベースを用いる。
人工ヒッパルコス由来のデータセットによる実験的評価では、スターフュージョンはトップ1の精度93.4%、トップ3の精度97.8%を達成している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable celestial attitude determination is a critical requirement for autonomous spacecraft navigation, yet traditional "Lost-in-Space" (LIS) algorithms often suffer from high computational overhead and sensitivity to sensor-induced noise. While deep learning has emerged as a promising alternative, standard regression models are often confounded by the non-Euclidean topology of the celestial sphere and by the periodic boundary conditions of Right Ascension (RA) and Declination (Dec). In this paper, we present Star-Fusion, a multi-modal architecture that reformulates orientation estimation as a discrete topological classification task. Our approach leverages spherical K-Means clustering to partition the celestial sphere into K topologically consistent regions, effectively mitigating coordinate wrapping artifacts. The proposed architecture employs a tripartite fusion strategy: a SwinV2-Tiny transformer backbone for photometric feature extraction, a convolutional heatmap branch for spatial grounding, and a coordinate-based MLP for geometric anchoring. Experimental evaluations on a synthetic Hipparcos-derived dataset demonstrate that Star-Fusion achieves a Top-1 accuracy of 93.4% and a Top-3 accuracy of 97.8%. Furthermore, the model exhibits high computational efficiency, maintaining an inference latency of 18.4 ms on resource-constrained COTS hardware, making it a viable candidate for real-time onboard deployment in next-generation satellite constellations.
- Abstract(参考訳): 信頼性の高い天体の姿勢決定は、自律的な宇宙船ナビゲーションにとって重要な要件であるが、従来の"LOST-in-Space"アルゴリズムは、しばしば高い計算オーバーヘッドとセンサーによるノイズに対する感度に悩まされる。
深層学習は有望な代替として現れてきたが、標準回帰モデルは、天球の非ユークリッド位相と、右昇天(RA)とデクリエーション(Dec)の周期的境界条件によって構築されることが多い。
本稿では,方向推定を離散的なトポロジ的分類タスクとして再構成するマルチモーダルアーキテクチャであるStar-Fusionを提案する。
この手法は球面K-平均クラスタリングを利用して、天球をKの位相的に一貫した領域に分割し、効果的に座標ラップアーティファクトを緩和する。
提案アーキテクチャでは、光度特徴抽出のためのSwinV2-Tiny変換器バックボーン、空間接地のための畳み込みヒートマップブランチ、幾何学的アンカーのための座標ベースMLPという3部融合方式を採用している。
人工ヒッパルコス由来のデータセットによる実験的評価では、スターフュージョンはトップ1の精度93.4%、トップ3の精度97.8%を達成している。
さらに、このモデルは高い計算効率を示し、リソース制約のCOTSハードウェア上で18.4ミリ秒の遅延を保ち、次世代の衛星コンステレーションにおけるリアルタイムのオンボード展開の候補となる。
関連論文リスト
- SCC-Loc: A Unified Semantic Cascade Consensus Framework for UAV Thermal Geo-Localization [6.618475712125794]
クロスモーダル・サーマルジオローカライゼーション (TG) は、グローバルナビゲーション衛星システム (GNSS) による無人航空機 (UAV) の堅牢で全天候のソリューションを提供する。
このボトルネックを解消するために,セマンティック・カスケード・コンセンサス・ローカライゼーション・フレームワークであるSCC-Locを提案する。
実験により、SCC-Locは新しい最先端技術を確立し、平均局所化誤差を9.37mに抑え、精度を7.6倍に改善した。
論文 参考訳(メタデータ) (2026-04-03T15:44:47Z) - Fluxamba: Topology-Aware Anisotropic State Space Models for Geological Lineament Segmentation in Multi-Source Remote Sensing [6.815807403335458]
トポロジ対応の機能修正フレームワークを導入した軽量アーキテクチャを提案する。
F Fluxambaは3.4Mパラメータと6.3G FLOPで24FPS以上のリアルタイム推論速度を達成する。
論文 参考訳(メタデータ) (2026-01-24T03:55:21Z) - SVRecon: Sparse Voxel Rasterization for Surface Reconstruction [60.92372415355283]
我々は最近提案されたスパースボキセル化パラダイムをSVReconの統合により高忠実度表面再構成の課題に拡張する。
本手法は, 常に高速な収束を保ちながら, 強い復元精度を実現する。
論文 参考訳(メタデータ) (2025-11-21T16:32:01Z) - STAR: A Benchmark for Astronomical Star Fields Super-Resolution [52.895107920663236]
54,738個のフラックス一貫性の星体画像対を含む大規模SRデータセットSTARを提案する。
本稿では,Flux-Invariant Super Resolution (FISR)モデルを提案する。
論文 参考訳(メタデータ) (2025-07-22T09:28:28Z) - Towards Scalable Foundation Model for Multi-modal and Hyperspectral Geospatial Data [14.104497777255137]
本稿では,3つのイノベーションを取り入れた高効率空間スペクトル変換器について紹介する。
位置マスキングとチャネルマスキングを統合したHyperspectral Masked Autoencoderフレームワークを用いたLESS ViTの事前訓練を行った。
実験により, 提案手法は, 最先端のマルチモーダル地空間基盤モデルと競合する性能を示す。
論文 参考訳(メタデータ) (2025-03-17T05:42:19Z) - SGFormer: Spherical Geometry Transformer for 360 Depth Estimation [52.23806040289676]
パノラマ歪みは360度深度推定において大きな課題となる。
本稿では,SGFormer という球面形状変換器を提案し,上記の問題に対処する。
また、様々な解像度で空間構造を補うために、クエリベースの大域的条件位置埋め込みを提案する。
論文 参考訳(メタデータ) (2024-04-23T12:36:24Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。