論文の概要: Style-Based Neural Architectures for Real-Time Weather Classification
- arxiv url: http://arxiv.org/abs/2604.18251v1
- Date: Mon, 20 Apr 2026 13:28:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.901909
- Title: Style-Based Neural Architectures for Real-Time Weather Classification
- Title(参考訳): リアルタイム気象分類のためのスタイルベースニューラルネットワーク
- Authors: Hamed Ouattara, Pascal Houssam Salmane, Pierre Duthon, Frédéric Bernardin, Omar Ait Aider,
- Abstract要約: 画像から気象条件をリアルタイムに分類するためのニューラルネットワークアーキテクチャを3つ提案する。
1つのモデルは"Multi-PatchGAN"と呼ばれ、Pix2PixやCycleGANのようなよく知られたアーキテクチャで使用されるPatchGANに基づいている。
2番目のモデルである"Truncated ResNet50"は、最初の9層のみを保持するResNet50の簡易版である。
- 参考スコア(独自算出の注目度): 2.7837697086152122
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present three neural network architectures designed for real-time classification of weather conditions (sunny, rain, snow, fog) from images. These models, inspired by recent advances in style transfer, aim to capture the stylistic elements present in images. One model, called "Multi-PatchGAN", is based on PatchGANs used in well-known architectures such as Pix2Pix and CycleGAN, but here adapted with multiple patch sizes for detection tasks. The second model, "Truncated ResNet50", is a simplified version of ResNet50 retaining only its first nine layers. This truncation, determined by an evolutionary algorithm, facilitates the extraction of high-frequency features essential for capturing subtle stylistic details. Finally, we propose "Truncated ResNet50 with Gram Matrix and Attention", which computes Gram matrices for each layer during training and automatically weights them via an attention mechanism, thus optimizing the extraction of the most relevant stylistic expressions for classification. These last two models outperform the state of the art and demonstrate remarkable generalization capability on several public databases. Although developed for weather detection, these architectures are also suitable for other appearance-based classification tasks, such as animal species recognition, texture classification, disease detection in medical imaging, or industrial defect identification.
- Abstract(参考訳): 本稿では,画像から気象条件(雨,雪,霧)をリアルタイムに分類するために設計された3つのニューラルネットワークアーキテクチャを提案する。
これらのモデルは、最近のスタイル転送の進歩にインスパイアされ、画像に存在するスタイル的要素を捉えることを目的としている。
1つのモデルは"Multi-PatchGAN"と呼ばれ、Pix2PixやCycleGANのようなよく知られたアーキテクチャで使用されるPatchGANをベースとしている。
2番目のモデルである"Truncated ResNet50"は、最初の9層のみを保持するResNet50の簡易版である。
このトランケーションは、進化的アルゴリズムによって決定され、微妙なスタイリスティックな詳細を捉えるのに不可欠な高周波特徴の抽出を容易にする。
最後に,学習中の各レイヤの文法行列を計算し,注意機構によって自動的に重み付けし,最も関連するスタイル表現の抽出を最適化する"Truncated ResNet50 with Gram Matrix and Attention"を提案する。
これら2つのモデルは最先端のモデルより優れており、いくつかの公開データベース上での顕著な一般化能力を示している。
気象検出のために開発されたが、これらのアーキテクチャは、動物種認識、テクスチャ分類、医療画像における疾患検出、工業的欠陥識別など、外見に基づく他の分類タスクにも適している。
関連論文リスト
- RATLIP: Generative Adversarial CLIP Text-to-Image Synthesis Based on Recurrent Affine Transformations [0.0]
条件付きアフィン変換(CAT)は、画像中のコンテンツ合成を制御するために、GANの異なる層に適用されている。
まず、各レイヤがグローバル情報にアクセスできるようにするために、CATとRAT(Recurrent Neural Network)をモデル化する。
次に、リカレントニューラルネットワークにおける情報忘れの特性を軽減するために、RAT間のシャッフルアテンションを導入する。
論文 参考訳(メタデータ) (2024-05-13T18:49:18Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Dual-Activated Lightweight Attention ResNet50 for Automatic Histopathology Breast Cancer Image Classification [0.0]
本研究では,乳がんの新たな分類法であるDual-Activated Lightweight Attention ResNet50モデルを提案する。
トレーニング済みのResNet50モデルと軽量なアテンション機構を統合し、ResNet50の第4層にアテンションモジュールを埋め込む。
DALAResNet50法は,40X,100X,200X,400Xの乳がん組織像を用いて,それぞれ98.5%,98.7%,97.9%,94.3%の検診を行った。
論文 参考訳(メタデータ) (2023-08-25T03:08:41Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Multilayer deep feature extraction for visual texture recognition [0.0]
本稿では,テクスチャ分類における畳み込みニューラルネットワークの精度向上に着目した。
事前訓練されたニューラルネットワークの複数の畳み込み層から特徴を抽出し、フィッシャーベクトルを用いてそのような特徴を集約する。
本手法は,ブラジルの植物種識別の実践的課題と同様に,ベンチマークデータセットのテクスチャ分類における有効性を検証する。
論文 参考訳(メタデータ) (2022-08-22T03:53:43Z) - ZippyPoint: Fast Interest Point Detection, Description, and Matching
through Mixed Precision Discretization [71.91942002659795]
我々は,ネットワーク量子化技術を用いて推論を高速化し,計算限定プラットフォームでの利用を可能にする。
バイナリディスクリプタを用いた効率的な量子化ネットワークZippyPointは,ネットワーク実行速度,ディスクリプタマッチング速度,3Dモデルサイズを改善する。
これらの改善は、ホモグラフィー推定、視覚的ローカライゼーション、マップフリーな視覚的再ローカライゼーションのタスクで評価されるように、小さなパフォーマンス劣化をもたらす。
論文 参考訳(メタデータ) (2022-03-07T18:59:03Z) - Deep learning for lithological classification of carbonate rock micro-CT
images [52.77024349608834]
本研究は,ブラジルのプリサルト炭酸塩岩微視的画像のパターン同定にディープラーニング技術を適用することを目的としている。
4つの畳み込みニューラルネットワークモデルが提案された。
精度によると、リサイズ画像で訓練されたモデル2は、最初の評価アプローチでは平均75.54%、2番目の評価では平均81.33%に達した。
論文 参考訳(メタデータ) (2020-07-30T19:14:00Z) - Identity Enhanced Residual Image Denoising [61.75610647978973]
我々は、アイデンティティマッピングモジュールのチェーンと、画像の復号化のための残像アーキテクチャの残像からなる、完全な畳み込みネットワークモデルを学ぶ。
提案するネットワークは,従来の最先端・CNNアルゴリズムよりも極めて高い数値精度と画像品質を実現している。
論文 参考訳(メタデータ) (2020-04-26T04:52:22Z) - Large-scale spatiotemporal photonic reservoir computer for image
classification [0.8701566919381222]
本稿では,手書き桁の分類を行うために,フィードフォワードとリカレントニューラルネットワークを実装するためのスケーラブルなフォトニックアーキテクチャを提案する。
実験では、既製の光学部品と電子部品を利用して、現在16,384ノードのネットワークサイズを実現している。
論文 参考訳(メタデータ) (2020-04-06T10:22:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。