論文の概要: Computational Imaging for Enhanced Computer Vision
- arxiv url: http://arxiv.org/abs/2509.08712v1
- Date: Wed, 10 Sep 2025 16:02:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-11 15:16:52.484653
- Title: Computational Imaging for Enhanced Computer Vision
- Title(参考訳): コンピュータビジョンの高度化のためのコンピュータイメージング
- Authors: Humera Shaikh, Kaur Jashanpreet,
- Abstract要約: 本稿では,コンピュータビジョン(CV)応用における計算画像(CI)技術とその変換的影響を包括的に調査する。
従来のイメージング手法では、低照度、動きのぼやけ、高ダイナミックレンジといった困難な条件下で、高忠実度な視覚データを提供できない。
光場イメージング、高ダイナミックレンジ(ブルーリング)イメージング、デブロアリング、高速イメージング、グラア緩和などの計算イメージング技術は、これらの制限に対処する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a comprehensive survey of computational imaging (CI) techniques and their transformative impact on computer vision (CV) applications. Conventional imaging methods often fail to deliver high-fidelity visual data in challenging conditions, such as low light, motion blur, or high dynamic range scenes, thereby limiting the performance of state-of-the-art CV systems. Computational imaging techniques, including light field imaging, high dynamic range (HDR) imaging, deblurring, high-speed imaging, and glare mitigation, address these limitations by enhancing image acquisition and reconstruc- tion processes. This survey systematically explores the synergies between CI techniques and core CV tasks, including object detection, depth estimation, optical flow, face recognition, and keypoint detection. By analyzing the relationships between CI methods and their practical contributions to CV applications, this work highlights emerging opportunities, challenges, and future research directions. We emphasize the potential for task-specific, adaptive imaging pipelines that improve robustness, accuracy, and efficiency in real-world scenarios, such as autonomous navigation, surveillance, augmented reality, and robotics.
- Abstract(参考訳): 本稿では,コンピュータビジョン(CV)応用における計算画像(CI)技術とその変換的影響を包括的に調査する。
従来のイメージング手法では、低照度、動きのぼかし、ダイナミックレンジのシーンのような困難な条件下で高忠実度な視覚データを配信できないことが多く、それによって最先端のCVシステムの性能が制限される。
光場イメージング、ハイダイナミックレンジ(HDR)イメージング、デブロアリング、高速イメージング、グラア緩和などの計算イメージング技術は、画像取得と再構成-イオンプロセスの強化によってこれらの制限に対処する。
本調査では,物体検出,深度推定,光学フロー,顔認識,キーポイント検出など,CI技術とコアCVタスクの相乗効果を系統的に検討する。
CIメソッドとCVアプリケーションへの実践的コントリビューションの関係を分析することで、この研究は、新たな機会、課題、そして将来の研究方向性を強調します。
自律的なナビゲーション、監視、拡張現実、ロボット工学といった現実のシナリオにおいて、ロバスト性、正確性、効率性を向上するタスク固有の適応イメージングパイプラインの可能性を強調します。
関連論文リスト
- Hyperspectral Imaging [49.45523645429475]
ハイパースペクトルイメージング(Hyperspectral Imaging、HSI)は、空間情報とスペクトル情報を同時にキャプチャする高度なセンシングモダリティである。
このプライマーは、基礎となる物理原理とセンサーアーキテクチャから、データ取得、キャリブレーション、修正における重要なステップまで、HSIの概要を包括的に示す。
論文 参考訳(メタデータ) (2025-08-11T15:47:24Z) - Retrieval Augmented Generation and Understanding in Vision: A Survey and New Outlook [85.43403500874889]
Retrieval-augmented Generation (RAG) は人工知能(AI)において重要な技術である。
具体化されたAIのためのRAGの最近の進歩は、特に計画、タスク実行、マルチモーダル知覚、インタラクション、特殊ドメインの応用に焦点を当てている。
論文 参考訳(メタデータ) (2025-03-23T10:33:28Z) - Rewards-based image analysis in microscopy [2.906546126874626]
イメージングとハイパースペクトルデータの分析は、生物学、医学、化学、物理学などの科学分野において重要である。
現在、このタスクは、認知、空間サンプリング、キーポイント検出、特徴生成、クラスタリング、次元減少、物理に基づく非畳み込みといった複雑な人間設計の反復的なステップに依存している。
過去10年間の機械学習の導入により、教師なし学習によるイメージセグメンテーションやオブジェクト検出、教師なし手法による次元削減といったタスクが加速した。
ここでは、専門家による意思決定の原則を採用し、強い伝達学習を示す報酬ベースの進歩について論じる。
論文 参考訳(メタデータ) (2025-02-23T19:19:38Z) - Semantics Disentanglement and Composition for Versatile Codec toward both Human-eye Perception and Machine Vision Task [47.7670923159071]
本研究は,人間の目知覚と機械視タスクを同時に強化する革新的セマンティックス Disentanglement と COmposition versatile (DISCOVER) を導入する。
このアプローチはタスク毎のラベルの集合をマルチモーダルな大モデルで導き出し、グラウンドモデルを用いて正確なローカライズを行い、エンコーダ側の画像成分の包括的理解とアンタングル化を可能にする。
復号段階では、これらの符号化されたコンポーネントを生成モデルから先行して活用することにより、画像の総合的な再構成を実現し、人間の視覚知覚とマシンベースの分析タスクの両方のパフォーマンスを最適化する。
論文 参考訳(メタデータ) (2024-12-24T04:32:36Z) - Low-Light Enhancement Effect on Classification and Detection: An Empirical Study [48.6762437869172]
我々は,低照度画像強調法(LLIE)が高レベル視覚タスクに与える影響を評価する。
本研究は,人間の視覚知覚における画像強調と,機械解析における切り離しを示唆するものである。
この洞察は、人間と機械の視覚の両方のニーズに合致するLLIE技術の開発に不可欠である。
論文 参考訳(メタデータ) (2024-09-22T14:21:31Z) - CViT: Continuous Vision Transformer for Operator Learning [24.1795082775376]
連続ビジョントランスフォーマー(Continuous Vision Transformer、CViT)は、コンピュータビジョンの進歩を活用して複雑な物理システムを学ぶ際の課題に対処する、新しい神経オペレーターアーキテクチャである。
CViTは、ビジョントランスフォーマーエンコーダ、新しいグリッドベースの座標埋め込み、マルチスケール依存関係を効果的にキャプチャするクエリワイドのクロスアテンション機構を組み合わせたものである。
本研究では, 流体力学, 気候モデル, 反応拡散過程を含む多種多様な偏微分方程式(PDE)システムにおけるCViTの有効性を実証する。
論文 参考訳(メタデータ) (2024-05-22T21:13:23Z) - Computation-efficient Deep Learning for Computer Vision: A Survey [121.84121397440337]
ディープラーニングモデルは、さまざまな視覚的知覚タスクにおいて、人間レベルのパフォーマンスに到達または超えた。
ディープラーニングモデルは通常、重要な計算資源を必要とし、現実のシナリオでは非現実的な電力消費、遅延、または二酸化炭素排出量につながる。
新しい研究の焦点は計算効率のよいディープラーニングであり、推論時の計算コストを最小限に抑えつつ、良好な性能を達成することを目指している。
論文 参考訳(メタデータ) (2023-08-27T03:55:28Z) - Self-supervised Interest Point Detection and Description for Fisheye and
Perspective Images [7.451395029642832]
キーポイント検出とマッチングは多くのコンピュータビジョンにおける基本的な課題である。
本研究では,画像取得に使用されるカメラの形状が原因で発生する場合に焦点をあてる。
我々は最先端のアプローチを構築し、関心点検出器と記述子ネットワークのトレーニングを可能にする自己監督的な手順を導出する。
論文 参考訳(メタデータ) (2023-06-02T22:39:33Z) - Interpretable Hyperspectral AI: When Non-Convex Modeling meets
Hyperspectral Remote Sensing [57.52865154829273]
ハイパースペクトルイメージング、別名画像分光法は、地球科学リモートセンシング(RS)におけるランドマーク技術です。
過去10年間で、主に熟練した専門家によってこれらのハイパースペクトル(HS)製品を分析するための取り組みが行われています。
このため、さまざまなHS RSアプリケーションのためのよりインテリジェントで自動的なアプローチを開発することが急務です。
論文 参考訳(メタデータ) (2021-03-02T03:32:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。