論文の概要: SpectralZoom: Efficient Segmentation with an Adaptive Hyperspectral Camera
- arxiv url: http://arxiv.org/abs/2406.04287v1
- Date: Thu, 6 Jun 2024 17:33:23 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-07 13:40:27.605453
- Title: SpectralZoom: Efficient Segmentation with an Adaptive Hyperspectral Camera
- Title(参考訳): SpectralZoom: 適応型ハイパースペクトルカメラによる効率的なセグメンテーション
- Authors: Jackson Arnold, Sophia Rossi, Chloe Petrosino, Ethan Mitchell, Sanjeev J. Koppal,
- Abstract要約: 得られたデータフットプリントとハイパースペクトルセグメンテーションの計算負荷を緩和するビジョントランスフォーマー(ViT)アルゴリズムを提案する。
我々のカメラは、高スペクトル立方体全体を1つの高解像度でキャプチャする代わりに、異なる解像度で画像領域やパッチを適応的にサンプリングすることができる。
- 参考スコア(独自算出の注目度): 3.0175628677371935
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Hyperspectral image segmentation is crucial for many fields such as agriculture, remote sensing, biomedical imaging, battlefield sensing and astronomy. However, the challenge of hyper and multi spectral imaging is its large data footprint. We propose both a novel camera design and a vision transformer-based (ViT) algorithm that alleviate both the captured data footprint and the computational load for hyperspectral segmentation. Our camera is able to adaptively sample image regions or patches at different resolutions, instead of capturing the entire hyperspectral cube at one high resolution. Our segmentation algorithm works in concert with the camera, applying ViT-based segmentation only to adaptively selected patches. We show results both in simulation and on a real hardware platform demonstrating both accurate segmentation results and reduced computational burden.
- Abstract(参考訳): ハイパースペクトル画像のセグメンテーションは農業、リモートセンシング、バイオメディカルイメージング、戦場センシング、天文学など多くの分野において重要である。
しかし、ハイパースペクトルとマルチスペクトルイメージングの課題は、その大きなデータフットプリントである。
本稿では,撮影データフットプリントとハイパースペクトルセグメンテーションの計算負荷を緩和する,新しいカメラ設計とビジョントランスフォーマー(ViT)アルゴリズムを提案する。
我々のカメラは、高スペクトル立方体全体を1つの高解像度でキャプチャする代わりに、異なる解像度で画像領域やパッチを適応的にサンプリングすることができる。
我々のセグメンテーションアルゴリズムはカメラと連携して動作し、ViTベースのセグメンテーションを適応的に選択されたパッチにのみ適用する。
シミュレーションおよび実ハードウェアプラットフォーム上では,精度の高いセグメンテーション結果と計算負荷の低減の両方を示す。
関連論文リスト
- Redundancy-Aware Camera Selection for Indoor Scene Neural Rendering [54.468355408388675]
カメラの空間的多様性と画像の意味的変動の両方を取り入れた類似度行列を構築した。
カメラ選択を最適化するために,多様性に基づくサンプリングアルゴリズムを適用した。
IndoorTrajという新しいデータセットも開発しています。仮想屋内環境で人間が捉えた、長くて複雑なカメラの動きが含まれています。
論文 参考訳(メタデータ) (2024-09-11T08:36:49Z) - View-Consistent Hierarchical 3D Segmentation Using Ultrametric Feature Fields [52.08335264414515]
我々は3次元シーンを表すニューラル・レージアンス・フィールド(NeRF)内の新しい特徴場を学習する。
本手法は、ビュー一貫性の多粒性2Dセグメンテーションを入力とし、3D一貫性のセグメンテーションの階層構造を出力として生成する。
提案手法と,多視点画像と多粒性セグメンテーションを用いた合成データセットのベースラインの評価を行い,精度と視点整合性を向上したことを示す。
論文 参考訳(メタデータ) (2024-05-30T04:14:58Z) - Memory-Constrained Semantic Segmentation for Ultra-High Resolution UAV
Imagery [35.96063342025938]
本稿では,超高解像度UAV画像の高効率・高効率セグメンテーションを実現するための複雑な課題について検討する。
本稿では、ローカルパッチ以外のコンテキストにアクセスすることなく、ローカル推論のためのGPUメモリ効率が高く効果的なフレームワークを提案する。
基礎となる高解像度情報の潜在的な意味バイアスを補正するために,効率的なメモリベースインタラクション方式を提案する。
論文 参考訳(メタデータ) (2023-10-07T07:44:59Z) - Vision Transformers: From Semantic Segmentation to Dense Prediction [139.15562023284187]
視覚的予測のための視覚変換器(ViT)のグローバルな文脈学習の可能性について検討する。
我々のモチベーションは、グローバルコンテキストを全受容界層で学習することで、ViTがより強力な長距離依存性情報を取得することである。
階層型ローカル・グローバル・トランスフォーマー (HLG) のファミリを定式化し, 窓内部の局所的な注意と, ピラミッド建築における窓全体のグローバルアテンションを特徴とする。
論文 参考訳(メタデータ) (2022-07-19T15:49:35Z) - Unsupervised Segmentation of Hyperspectral Remote Sensing Images with
Superpixels [22.92045376407794]
本稿では,ハイパースペクトルリモートセンシング画像セグメンテーションのための教師なし手法を提案する。
この方法は、スペクトル画素情報とともに、予備的なハイパースペクトルスーパーピクセルセグメンテーションを入力とする平均シフトクラスタリングアルゴリズムを利用する。
その結果,提案手法の妥当性を技術状況と比較した。
論文 参考訳(メタデータ) (2022-04-26T13:20:33Z) - Real-time Hyperspectral Imaging in Hardware via Trained Metasurface
Encoders [55.16861072631285]
ハイパースペクトルイメージングは、コンピュータビジョンにおける画像分類と自動パターン認識のためのスペクトルシグネチャを特定するために大きな注目を集めている。
上述した制限に対処する新しい統合アーキテクチャであるHyplexを紹介する。
HyplexはCMOS互換で高速なハイパースペクトルカメラで、バルク光学を人工知能によって逆向きにデザインされたナノスケールのメタ曲面に置き換える。
論文 参考訳(メタデータ) (2022-04-05T09:52:51Z) - Panoptic SwiftNet: Pyramidal Fusion for Real-time Panoptic Segmentation [0.0]
多くのアプリケーションは、安価なハードウェアや組み込みハードウェアの大規模な入力解像度よりも高速な推論を必要とする。
マルチスケール特徴抽出のためのバックボーン容量をトレードオフすることで,この目標を達成することを提案する。
本稿では,Cityscapes,Vistas,COCO,BSB-Aerialデータセットについてパノラマ実験を行った。
論文 参考訳(メタデータ) (2022-03-15T13:47:40Z) - Toward Efficient Hyperspectral Image Processing inside Camera Pixels [1.6449390849183356]
ハイパースペクトルカメラは、数百のスペクトル帯が存在するため、大量のデータを生成する。
この問題を軽減するために,PIP (Processing-in-Pixel) 形式を提案する。
我々のPIP最適化カスタムCNN層は、入力データを効果的に圧縮し、データをHSI処理ユニットに送信するために必要な帯域幅を大幅に削減する。
論文 参考訳(メタデータ) (2022-03-11T01:06:02Z) - XCiT: Cross-Covariance Image Transformers [73.33400159139708]
本稿では,トークンではなく機能チャネルをまたいで機能する自己注意の「伝達」バージョンを提案する。
その結果、XCAはトークン数に線形複雑さを持ち、高解像度画像の効率的な処理を可能にする。
論文 参考訳(メタデータ) (2021-06-17T17:33:35Z) - SASSI -- Super-Pixelated Adaptive Spatio-Spectral Imaging [17.2152544145501]
高い空間分解能と時間分解能を持つ新しいビデオレートハイパースペクトラム画像装置を紹介します。
超画素分割画像によって誘導されるハイパースペクトルシーンのシーン適応空間サンプリングは、高品質の再構築を得ることができる。
提案手法を広範にシミュレーションし,600倍900万画素の空間分解能でハイパースペクトル映像を測定する実験室のプロトタイプとして検証した。
論文 参考訳(メタデータ) (2020-12-28T21:34:18Z) - Efficient Video Semantic Segmentation with Labels Propagation and
Refinement [138.55845680523908]
本稿では,ハイブリッドGPU/CPUを用いた高精細ビデオのリアルタイムセマンティックセマンティックセマンティック化の問題に取り組む。
i) CPU上では、非常に高速な光フロー法であり、ビデオの時間的側面を利用して、あるフレームから次のフレームへ意味情報を伝達するために使用される。
高解像度フレーム(2048 x 1024)を持つ一般的なCityscapesデータセットでは、単一のGPUとCPU上で80から1000Hzの動作ポイントが提案されている。
論文 参考訳(メタデータ) (2019-12-26T11:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。