論文の概要: Enhancing the machine vision performance with multi-spectral light
sources
- arxiv url: http://arxiv.org/abs/2311.06276v1
- Date: Fri, 20 Oct 2023 11:50:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-19 14:30:24.284632
- Title: Enhancing the machine vision performance with multi-spectral light
sources
- Title(参考訳): マルチスペクトル光源を用いたマシンビジョン性能の向上
- Authors: Feng Zhang, Rui Bao, Congqi Dai, Wanlu Zhang, Shu Liu, and Ruiqian Guo
- Abstract要約: この性能は、35の異なるマルチスペクトル光源で調査された。
その結果、どちらのモデルにも、純白光よりも精度が高い純白光源が常に存在することがわかった。
- 参考スコア(独自算出の注目度): 10.168812588407526
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study mainly focuses on the performance of different multi-spectral
light sources on different object colors in machine vision and tries to enhance
machine vision with multi-spectral light sources. Using different color pencils
as samples, by recognizing the collected images with two classical neural
networks, AlexNet and VGG19, the performance was investigated under 35
different multi-spectral light sources. The results show that for both models
there are always some non-pure white light sources, whose accuracy is better
than pure white light, which suggests the potential of multi-spectral light
sources to further enhance the effectiveness of machine vision. The comparison
of both models is also performed, and surprised to find that the overall
performance of VGG19 is lower than that of AlexNet, which shows that the
importance of the choice of multi-spectral light sources and models.
- Abstract(参考訳): 本研究は主に、異なる物体色における異なるマルチスペクトル光源の性能に着目し、マルチスペクトル光源によるマシンビジョンの向上を試みている。
異なるカラー鉛筆をサンプルとして、収集した画像をAlexNetとVGG19の2つの古典的ニューラルネットワークで認識することにより、35種類のマルチスペクトル光源で性能を調べた。
その結果、両モデルには常に純白光よりも精度が高い純白光が存在することが示され、マシンビジョンの有効性をさらに高めるためのマルチスペクトル光源の可能性が示唆された。
両モデルの比較も行われており、VGG19の全体的な性能がAlexNetよりも低いことに驚き、マルチスペクトル光源とモデルの選択の重要性が示されている。
関連論文リスト
- RelitLRM: Generative Relightable Radiance for Large Reconstruction Models [52.672706620003765]
本稿では,新しい照明下での3Dオブジェクトの高品質なガウススプレイティング表現を生成するためのRelitLRMを提案する。
複雑なキャプチャと遅い最適化を必要とする従来の逆レンダリングとは異なり、RelitLRMはフィードフォワードトランスフォーマーベースのモデルを採用している。
スパースビューフィードフォワードRelitLRMは、最先端の密集ビュー最適化ベースラインに対して、競争力のあるリライティング結果を提供する。
論文 参考訳(メタデータ) (2024-10-08T17:40:01Z) - Beyond Night Visibility: Adaptive Multi-Scale Fusion of Infrared and
Visible Images [49.75771095302775]
赤外線および可視画像を用いた適応型マルチスケール核融合ネットワーク(AMFusion)を提案する。
まず、赤外画像と可視画像から空間的特徴と意味的特徴を分離し、前者が光分布の調整に使用される。
第2に,事前学習したバックボーンから抽出した検出機能を利用して,意味的特徴の融合を誘導する。
第3に、通常の光強度で融合画像を制約する新しい照明損失を提案する。
論文 参考訳(メタデータ) (2024-03-02T03:52:07Z) - Attentive Illumination Decomposition Model for Multi-Illuminant White
Balancing [27.950125640986805]
多くの商用カメラにおけるホワイトバランス(WB)アルゴリズムは、単色および均一な照明を前提としている。
スロットアテンションを利用して,各スロットが個別の照度を表すようなホワイトバランスモデルを提案する。
この設計により、モデルは個々の照度に対する色度と重量マップを生成でき、最終照明マップを構成するために融合される。
論文 参考訳(メタデータ) (2024-02-28T12:15:29Z) - Does complimentary information from multispectral imaging improve face
presentation attack detection? [2.8090476488905254]
プレゼンテーション攻撃検出(PAD)は、特に可視光スペクトルにおいて広く研究されている。
3種類の異なる人工物から得られた8種類のプレゼンテーションアーティファクトに対して構築したマルチスペクトル画像に基づくPADを提案する。
スコア融合法と画像融合法に基づくPADは優れた性能を示し, 提示品の検出にマルチスペクトルイメージングを用いることの重要性を示した。
論文 参考訳(メタデータ) (2023-11-20T07:04:46Z) - Improving Lens Flare Removal with General Purpose Pipeline and Multiple
Light Sources Recovery [69.71080926778413]
フレアアーティファクトは、画像の視覚的品質と下流のコンピュータビジョンタスクに影響を与える。
現在の方法では、画像信号処理パイプラインにおける自動露光やトーンマッピングは考慮されていない。
本稿では、ISPを再検討し、より信頼性の高い光源回収戦略を設計することで、レンズフレア除去性能を向上させるソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-31T04:58:17Z) - Intriguing properties of synthetic images: from generative adversarial
networks to diffusion models [19.448196464632]
実際の画像と偽画像を区別する上で,どの画像の特徴がより優れているかを知ることが重要である。
本稿では, 実画像と生成画像の最も法学的に関係した特徴を発見することを目的とした, 異なる家系の多数の画像生成装置の系統的研究について報告する。
論文 参考訳(メタデータ) (2023-04-13T11:13:19Z) - Spectral MVIR: Joint Reconstruction of 3D Shape and Spectral Reflectance [15.600451871592107]
画像形成における幾何学的原理とフォトメトリック原理の両方を考慮したレンダリングモデルを提案する。
直交スペクトル反射率と3次元形状の連成再構成のためのコスト最適化MVIRフレームワークを構築した。
論文 参考訳(メタデータ) (2021-04-15T08:36:23Z) - Light Stage Super-Resolution: Continuous High-Frequency Relighting [58.09243542908402]
光ステージから採取した人間の顔の「超解像」を学習ベースで解析する手法を提案する。
本手法では,ステージ内の隣接する照明に対応する撮像画像を集約し,ニューラルネットワークを用いて顔の描画を合成する。
我々の学習モデルは、リアルな影と特異なハイライトを示す任意の光方向のレンダリングを生成することができる。
論文 参考訳(メタデータ) (2020-10-17T23:40:43Z) - Cross-Spectral Periocular Recognition with Conditional Adversarial
Networks [59.17685450892182]
本研究では,近赤外・近赤外スペクトル間の近赤外画像の変換を訓練した条件付き生成逆相関ネットワークを提案する。
EER=1%, GAR>99% @ FAR=1%, ポリUデータベースの最先端技術に匹敵するスペクトル近視性能を得た。
論文 参考訳(メタデータ) (2020-08-26T15:02:04Z) - Combining Visible and Infrared Spectrum Imagery using Machine Learning
for Small Unmanned Aerial System Detection [1.392250707100996]
本研究は,SUASの視覚的検出に機械学習を用いたLWIRと可視光センサの利点を組み合わせることを提案する。
検出率は71.2+-8.3%で、LWIRに比べて69%、可視スペクトル単独では30.4%向上した。
論文 参考訳(メタデータ) (2020-03-27T21:06:14Z) - Multi-View Photometric Stereo: A Robust Solution and Benchmark Dataset
for Spatially Varying Isotropic Materials [65.95928593628128]
多視点光度ステレオ技術を用いて3次元形状と空間的に異なる反射率の両方をキャプチャする手法を提案する。
我々のアルゴリズムは、遠近点光源と遠近点光源に適している。
論文 参考訳(メタデータ) (2020-01-18T12:26:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。