論文の概要: Cloud Detection through Wavelet Transforms in Machine Learning and Deep
Learning
- arxiv url: http://arxiv.org/abs/2007.13678v1
- Date: Fri, 10 Jul 2020 20:55:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 21:49:34.399558
- Title: Cloud Detection through Wavelet Transforms in Machine Learning and Deep
Learning
- Title(参考訳): 機械学習とディープラーニングにおけるウェーブレット変換によるクラウド検出
- Authors: Philippe Reiter
- Abstract要約: クラウド検出は、リモートセンシングデータを用いた画像認識とオブジェクト検出の専用アプリケーションである。
本稿では、Wavelet Transform(WT)理論を説明し、より広く使われている画像および信号処理変換と比較し、WTを強力な信号圧縮器として利用する方法について検討する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cloud detection is a specialized application of image recognition and object
detection using remotely sensed data. The task presents a number of challenges,
including analyzing images obtained in visible, infrared and multi-spectral
frequencies, usually without ground truth data for comparison. Moreover,
machine learning and deep learning (MLDL) algorithms applied to this task are
required to be computationally efficient, as they are typically deployed in
low-power devices and called to operate in real-time.
This paper explains Wavelet Transform (WT) theory, comparing it to more
widely used image and signal processing transforms, and explores the use of WT
as a powerful signal compressor and feature extractor for MLDL classifiers.
- Abstract(参考訳): クラウド検出は、リモートセンシングデータを用いた画像認識とオブジェクト検出の専用アプリケーションである。
このタスクは、可視、赤外線、多スペクトルの周波数で得られた画像を分析することを含む、多くの課題を提示している。
さらに、このタスクに適用された機械学習とディープラーニング(MLDL)アルゴリズムは、通常は低消費電力デバイスにデプロイされ、リアルタイムに動作するよう要求されるため、計算効率が要求される。
本稿では、Wavelet Transform(WT)理論を、より広く使われている画像および信号処理変換と比較し、強力な信号圧縮器およびMLDL分類器の機能抽出器としてのWTの利用について検討する。
関連論文リスト
- Deep Learning, Machine Learning -- Digital Signal and Image Processing: From Theory to Application [17.284340134417285]
デジタル信号処理(DSP)とDIP(Digital Image Processing)と機械学習(ML)とディープラーニング(DL)は、コンピュータビジョンにおいて人気のある研究分野である。
我々は、画像強調、フィルタリング技術、パターン認識における変換的応用を強調した。
我々は、リアルタイムデータ処理を最適化するアルゴリズムを実装し、コンピュータビジョンにおけるスケーラブルで高性能なソリューションの基礎を形成します。
論文 参考訳(メタデータ) (2024-10-27T02:00:33Z) - Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Efficient Multi-scale Network with Learnable Discrete Wavelet Transform for Blind Motion Deblurring [25.36888929483233]
そこで本研究では,シングルインプットとマルチアウトプット(SIMO)に基づくマルチスケールネットワークを提案する。
実世界の軌道特性を学習可能なウェーブレット変換モジュールと組み合わせて、ぼやけた画像から鋭い画像へのステップバイステップ遷移の方向連続性と周波数特性に着目した。
論文 参考訳(メタデータ) (2023-12-29T02:59:40Z) - Transformer-based SAR Image Despeckling [53.99620005035804]
本稿では,SAR画像復号化のためのトランスフォーマーネットワークを提案する。
提案する非特定ネットワークは、トランスフォーマーベースのエンコーダにより、異なる画像領域間のグローバルな依存関係を学習することができる。
実験により,提案手法は従来型および畳み込み型ニューラルネットワークに基づく解法よりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2022-01-23T20:09:01Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - M2TR: Multi-modal Multi-scale Transformers for Deepfake Detection [74.19291916812921]
Deepfake技術によって生成された鍛造画像は、デジタル情報の信頼性に深刻な脅威をもたらします。
本稿では,Deepfake検出のための微妙な操作アーチファクトを異なるスケールで捉えることを目的とする。
最先端の顔スワッピングと顔の再現方法によって生成された4000のDeepFakeビデオで構成される高品質のDeepFakeデータセットSR-DFを紹介します。
論文 参考訳(メタデータ) (2021-04-20T05:43:44Z) - Automatic Target Recognition (ATR) from SAR Imaginary by Using Machine
Learning Techniques [0.0]
合成開口レーダ(SAR)画像におけるターゲット自動認識(ATR)は、高レベルノイズを含むため、非常に難しい問題となる。
本研究では,SAR画像を用いた移動目標と静止目標を機械学習で検出する手法を提案する。
論文 参考訳(メタデータ) (2020-09-11T21:27:59Z) - A DICOM Framework for Machine Learning Pipelines against Real-Time
Radiology Images [50.222197963803644]
Nifflerは、研究クラスタでの機械学習パイプラインの実行を可能にする統合フレームワークである。
ニフラーはDigital Imaging and Communications in Medicine (DICOM)プロトコルを使用して画像データの取得と保存を行っている。
我々は,そのアーキテクチャと3つのユースケースを提示する: リアルタイムに画像から下大静脈フィルターを検出すること,スキャナ利用の同定,およびスキャナクロックの校正。
論文 参考訳(メタデータ) (2020-04-16T21:06:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。