論文の概要: PixRO: Pixel-Distributed Rotational Odometry with Gaussian Belief Propagation
- arxiv url: http://arxiv.org/abs/2406.09726v2
- Date: Sun, 24 Aug 2025 10:29:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:44.986548
- Title: PixRO: Pixel-Distributed Rotational Odometry with Gaussian Belief Propagation
- Title(参考訳): PixRO:Gaussian Belief Propagationを用いた画素分散回転オドメトリー
- Authors: Ignacio Alzugaray, Riku Murai, Andrew Davison,
- Abstract要約: 画素レベルで分布する新しい測光回転推定アルゴリズムを提案する。
各画素は、他の画素と情報を交換することで、カメラのグローバルな動きを推定し、グローバルなコンセンサスを達成する。
- 参考スコア(独自算出の注目度): 12.942063363292888
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Images are the standard input for most computer vision algorithms. However, their processing often reduces to parallelizable operations applied locally and independently to individual pixels. Yet, many of these low-level raw pixel readings only provide redundant or noisy information for specific high-level tasks, leading to inefficiencies in both energy consumption during their transmission off-sensor and computational resources in their subsequent processing. As novel sensors featuring advanced in-pixel processing capabilities emerge, we envision a paradigm shift toward performing increasingly complex visual processing directly in-pixel, reducing computational overhead downstream. We advocate for synthesizing high-level cues at the pixel level, enabling their off-sensor transmission to directly support downstream tasks more effectively than raw pixel readings. This paper conceptualizes a novel photometric rotation estimation algorithm to be distributed at pixel level, where each pixel estimates the global motion of the camera by exchanging information with other pixels to achieve global consensus. We employ a probabilistic formulation and leverage Gaussian Belief Propagation (GBP) for decentralized inference using messaging-passing. The proposed proposed technique is evaluated on real-world public datasets and we offer a in-depth analysis of the practicality of applying GBP to distributed rotation estimation at pixel level.
- Abstract(参考訳): 画像は、ほとんどのコンピュータビジョンアルゴリズムの標準入力である。
しかし、それらの処理はしばしば、個々のピクセルに対して局所的に独立して適用される並列化可能な操作に還元される。
しかし、これらの低レベルの原画素の読み出しの多くは、特定の高レベルなタスクに対して冗長またはノイズの多い情報しか提供しないため、送信時のエネルギー消費とその後の処理における計算資源の両方が非効率になる。
高度な画素内処理機能を備えた新しいセンサが出現するにつれて、より複雑な画像処理を画素内で直接実行するためのパラダイムシフトが想定され、計算オーバーヘッドが下流で減少する。
我々は、高レベルなキューをピクセルレベルで合成し、オフセンサーの送信により、生のピクセル読解よりも下流のタスクを効果的に支援することができることを提唱する。
本稿では,各画素が他の画素と情報を交換してカメラのグローバルな動きを推定し,大域的なコンセンサスを実現する,新たな光度回転推定アルゴリズムを概念化する。
我々は確率的定式化を採用し、メッセージパスを用いた分散推論にガウス的信念伝搬(GBP)を利用する。
提案手法は実世界の公開データセットを用いて評価し,GBPを画素レベルでの分散回転推定に応用する実践性について詳細に解析する。
関連論文リスト
- PixelWorld: Towards Perceiving Everything as Pixels [50.13953243722129]
我々は,すべてのモダリティ(テキスト,テーブル,コード,図,画像など)をピクセル入力として統一することを提案する。
既存のモデルの性能を評価するために、上述したすべてのモダリティをピクセル空間に統合する新しい評価スイートであるPixelWorldを紹介した。
論文 参考訳(メタデータ) (2025-01-31T17:39:21Z) - Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Pixel-Inconsistency Modeling for Image Manipulation Localization [59.968362815126326]
デジタル画像法医学は、画像認証と操作のローカライゼーションにおいて重要な役割を果たす。
本稿では,画素不整合アーチファクトの解析を通じて,一般化されたロバストな操作ローカライゼーションモデルを提案する。
実験により,本手法は固有の画素不整合偽指紋を抽出することに成功した。
論文 参考訳(メタデータ) (2023-09-30T02:54:51Z) - Superpixel Transformers for Efficient Semantic Segmentation [32.537400525407186]
本稿では,画像の過剰部分化というスーパーピクセルの考え方を活用し,近代的なトランスフォーマーフレームワークでそれらを適用することによって,その解決策を提案する。
提案手法は,グローバルな自己認識機構によって生成されるリッチなスーパーピクセル特徴により,セマンティックセマンティックセグメンテーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-28T23:09:30Z) - Learn how to Prune Pixels for Multi-view Neural Image-based Synthesis [10.571582038258443]
本稿では,ピクセルプルーニングの手法であるLeHoPPを提案する。
レンダリングビューにおける各入力ピクセルの重要性について検討し、無関係なピクセルの使用を避ける。
画像ベースのレンダリングネットワークを再トレーニングしなくても,合成品質と画素レートのトレードオフは良好である。
論文 参考訳(メタデータ) (2023-05-05T14:29:24Z) - Probabilistic Deep Metric Learning for Hyperspectral Image
Classification [91.5747859691553]
本稿では,ハイパースペクトル画像分類のための確率論的深度学習フレームワークを提案する。
ハイパースペクトルセンサーが捉えた画像に対して、各ピクセルのカテゴリを予測することを目的としている。
我々のフレームワークは、既存のハイパースペクトル画像分類法に容易に適用できる。
論文 参考訳(メタデータ) (2022-11-15T17:57:12Z) - Enhancing Multi-Scale Implicit Learning in Image Super-Resolution with
Integrated Positional Encoding [4.781615891172263]
画像超解像コンテキストにおいて,各画素を局所領域からの信号の集約とみなす。
画素領域上の周波数情報を集約することで従来の位置符号化を拡張した位置符号化(IPE)を提案する。
IPE-LIIFの定量的および定性的評価による有効性を示し、さらに画像スケールへのIPEの一般化能力を示す。
論文 参考訳(メタデータ) (2021-12-10T06:09:55Z) - A Novel Upsampling and Context Convolution for Image Semantic
Segmentation [0.966840768820136]
最近のセマンティックセグメンテーションの方法は、しばしば深い畳み込みニューラルネットワークを用いたエンコーダデコーダ構造を採用している。
ネットワーク内の画像の空間情報を効率的に保存するために,ガイドフィルタに基づく高密度アップサンプリング畳み込み法を提案する。
ADE20KとPascal-Contextのベンチマークデータセットでは,それぞれ82.86%,81.62%の画素精度を記録した。
論文 参考訳(メタデータ) (2021-03-20T06:16:42Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z) - Personal Privacy Protection via Irrelevant Faces Tracking and Pixelation
in Video Live Streaming [61.145467627057194]
我々は、ビデオライブストリーミングにおいて、自動プライバシーフィルタリングを生成するためのFace Pixelationと呼ばれる新しい方法を開発した。
無関係な人々の顔の高速かつ正確なピクセル化のために、FPVLSは2つのコアステージのフレームツービデオ構造で構成されています。
収集したビデオライブストリーミングデータセットにおいて、FPVLSは満足度の高い精度、リアルタイム効率を取得し、オーバーピクセル問題を含む。
論文 参考訳(メタデータ) (2021-01-04T16:18:26Z) - A U-Net Based Discriminator for Generative Adversarial Networks [86.67102929147592]
GAN(Generative Adversarial Network)のための代替U-Netベースの識別器アーキテクチャを提案する。
提案アーキテクチャにより,合成画像のグローバルコヒーレンスを維持しつつ,画素単位の詳細なフィードバックを生成元に提供することができる。
斬新な判別器は、標準分布と画像品質の指標の観点から、最先端の技術を向上する。
論文 参考訳(メタデータ) (2020-02-28T11:16:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。