論文の概要: Double-Helix Vision (DH-V2): A Geometry-Based Visual Sampler for Bandwidth-Constrained Perception
- arxiv url: http://arxiv.org/abs/2606.14773v1
- Date: Tue, 09 Jun 2026 16:38:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:32.06711
- Title: Double-Helix Vision (DH-V2): A Geometry-Based Visual Sampler for Bandwidth-Constrained Perception
- Title(参考訳): Double-Helix Vision (DH-V2): 帯域制限型知覚のための幾何学に基づくビジュアルサンプリング
- Authors: Jinwen Wen,
- Abstract要約: ダブルヘリックスビジョン (Double-Helix Vision, DH) は、2D画像をゴールデンインスパイアされたスパイラル軌道を用いてコンパクトな1D信号に圧縮する幾何学ベースのビジュアルサンプリング装置である。
4K解像度では、DHは1,433倍の圧縮比(99.93%)を達成し、シーンの幾何学的構造を保っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present Double-Helix Vision (DH), a geometry-based visual sampler that compresses 2D images into compact 1D signals using paired golden-ratio-inspired spiral trajectories. Rather than processing every pixel uniformly, DH employs two phase-shifted helices (Alpha and Beta, offset by 180 degrees) to sample the image with biologically-inspired foveation: high density at the center, sparse coverage at the periphery. At 4K resolution, DH achieves a 1,433x compression ratio (99.93% reduction) while preserving the geometric structure of the scene. The full perception pipeline -- including spatial mapping, temporal collision detection, and intra-frame structural disparity estimation -- runs in 0.52 ms at 1080p on CPU-only hardware, with no neural network dependencies. On CIFAR-10 at extreme sampling budgets (K=128 points per helix), DH achieves a +6.03% accuracy gain over uniform random sampling. A JSON-serializable Robotics API is provided, delivering sub-millisecond spatial perception reports in 2.7 KB packets. Code and benchmarks are available under the MIT License.
- Abstract(参考訳): 2次元画像を1次元のコンパクトな信号に圧縮するDouble-Helix Vision (DH)を提案する。
すべてのピクセルを均一に処理する代わりに、DHは2つの位相シフトしたヘリス(アルファとベータ、180度オフセット)を使用して、生物学的にインスパイアされた葉をサンプリングする。
4K解像度では、DHは1,433倍の圧縮比(99.93%の縮小)を達成し、シーンの幾何学的構造を保存する。
空間マッピング、時間的衝突検出、フレーム内構造差推定を含む完全な知覚パイプラインは、CPUのみのハードウェア上で1080pで0.52msで動作し、ニューラルネットワークに依存しない。
極端なサンプリング予算(ヘリックス毎のK=128点)でのCIFAR-10では、DHは均一なランダムサンプリングよりも+6.03%精度が向上する。
JSONシリアライズ可能なロボティクスAPIが提供され、2.7KBのパケットでミリ秒以下の空間認識レポートを提供する。
コードとベンチマークはMITライセンス下で利用できる。
関連論文リスト
- Scaling Parallel Sequence Models to Foundation-Scale Vision Encoders [123.58723804218151]
ビジョンファウンデーションモデルは、自己注意の二次的なコストによってボトルネックとなる。
2次元空間伝搬伝搬に基づくC-GSPNを提案する。
論文 参考訳(メタデータ) (2026-05-30T14:29:43Z) - Generative Video Compression with One-Dimensional Latent Representation [59.29493435530304]
1次元(1次元)遅延表現(GVC1D)による生成ビデオ圧縮について紹介する。
GVC1Dはビデオデータを、短期と長期の両方の文脈で条件付けられた極端にコンパクトな1D潜在トークンにエンコードする。
実験結果から,GVC1Dの圧縮効率は従来の圧縮法よりも優れていた。
論文 参考訳(メタデータ) (2026-03-16T14:02:17Z) - High-Fidelity Compression of Seismic Velocity Models via SIREN Auto-Decoders [4.372801786407988]
Inlicit Neural Representations (INR) は、グリッド解像度とは独立に連続的な信号を表現するための強力なパラダイムとして登場した。
SIREN(Sinusoidal Networks)自動デコーダに基づく多構造地震波速度モデルを表現する高忠実度ニューラルネットワークフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-15T08:43:39Z) - Generative Latent Coding for Ultra-Low Bitrate Image Compression [61.71793017252801]
本稿では,生成ベクトル量子化変分自動エンコーダ(VQ-VAE)の潜時空間で変換符号化を行う生成潜時符号化アーキテクチャを提案する。
生成潜伏空間は、より空間性が高く、より豊かな意味を持ち、人間の知覚との整合性が良く、高現実性および高忠実性圧縮を達成するのに有利である。
論文 参考訳(メタデータ) (2025-12-23T09:35:40Z) - AutoScape: Geometry-Consistent Long-Horizon Scene Generation [69.2451355181344]
AutoScapeは長距離走行シーン生成フレームワークである。
20秒以上のリアルで幾何学的に一貫したドライビングビデオを生成する。
ロングホライゾンのFIDとFVDのスコアは、それぞれ48.6%、FVDは43.0%向上している。
論文 参考訳(メタデータ) (2025-10-23T16:44:34Z) - Sparse Transformer for Ultra-sparse Sampled Video Compressive Sensing [23.788589833081957]
デジタルカメラは1ピクセルあたり0.1マイクロジュールを消費し、ビデオをキャプチャしてエンコードする。
我々は,各空間位置において,サブフレームを1に設定したUltra-Sparse Smpling(USS)方式を提案する。
次に,DMD(Digital Micro-mirror Device)エンコーディングシステムを構築し,USS戦略の有効性を検証する。
論文 参考訳(メタデータ) (2025-09-10T02:03:06Z) - Video Compression for Spatiotemporal Earth System Data [4.347703075408795]
大規模な地球系データセットは、標準的なビデオと類似した特徴を示す。
我々は、データセットによるマルチチャネル圧縮のためのライブラリであるxarray videoをビデオとして提示する。
実世界の4つのマルチチャネルデータセットに対して,本ライブラリの有効性を示す。
論文 参考訳(メタデータ) (2025-06-24T14:20:05Z) - bit2bit: 1-bit quanta video reconstruction via self-supervised photon prediction [57.199618102578576]
疎二分量時間画像データから高画質の画像スタックを元の解像度で再構成する新しい方法であるbit2bitを提案する。
Poisson denoisingの最近の研究に触発されて、スパースバイナリ光子データから高密度な画像列を生成するアルゴリズムを開発した。
本研究では,様々な課題の画像条件下でのSPADの高速映像を多種多種に含む新しいデータセットを提案する。
論文 参考訳(メタデータ) (2024-10-30T17:30:35Z) - AliasNet: Alias Artefact Suppression Network for Accelerated
Phase-Encode MRI [4.752084030395196]
スパース再構成はMRIの重要な側面であり、取得時間を短縮し、空間時間分解能を改善するのに役立つ。
1D AliasNetモジュールと既存の2Dディープラーニング(DL)リカバリ技術を組み合わせることで、画像の品質が向上することが実証された。
論文 参考訳(メタデータ) (2023-02-17T13:16:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。