論文の概要: Stop-band Energy Constraint for Orthogonal Tunable Wavelet Units in Convolutional Neural Networks for Computer Vision problems
- arxiv url: http://arxiv.org/abs/2507.16114v1
- Date: Mon, 21 Jul 2025 23:57:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:13.910141
- Title: Stop-band Energy Constraint for Orthogonal Tunable Wavelet Units in Convolutional Neural Networks for Computer Vision problems
- Title(参考訳): コンピュータビジョン問題に対する畳み込みニューラルネットワークにおける直交可変ウェーブレットユニットの停止帯域エネルギー制約
- Authors: An D. Le, Hung Nguyen, Sungbal Seo, You-Suk Bae, Truong Q. Nguyen,
- Abstract要約: 本研究では,CNNにおける画像分類と異常検出の改善を目的とした格子構造を持つ波長可変ウェーブレットユニットにおけるフィルタの停止帯域エネルギー制約を導入する。
ResNet-18に統合されたこの方法は、畳み込み、プーリング、サンプル処理を強化し、CIFAR-10では2.48%、Describable Texturesデータセットでは13.56%の精度向上を実現している。
MVTec hazelnut 異常検出タスクにおいて,提案手法はセグメンテーションと検出の両面で競合し,既存の手法より優れている。
- 参考スコア(独自算出の注目度): 8.116961165681603
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work introduces a stop-band energy constraint for filters in orthogonal tunable wavelet units with a lattice structure, aimed at improving image classification and anomaly detection in CNNs, especially on texture-rich datasets. Integrated into ResNet-18, the method enhances convolution, pooling, and downsampling operations, yielding accuracy gains of 2.48% on CIFAR-10 and 13.56% on the Describable Textures dataset. Similar improvements are observed in ResNet-34. On the MVTec hazelnut anomaly detection task, the proposed method achieves competitive results in both segmentation and detection, outperforming existing approaches.
- Abstract(参考訳): 格子構造を持つ直交可変ウェーブレットユニットにおけるフィルタの停止帯域エネルギー制約を導入し、特にテクスチャリッチデータセットにおいて、CNNにおける画像分類と異常検出を改善することを目的とした。
ResNet-18に統合されたこの方法は、畳み込み、プーリング、サンプル処理を強化し、CIFAR-10では2.48%、Describable Texturesデータセットでは13.56%の精度向上を実現している。
ResNet-34でも同様の改善が見られた。
MVTec hazelnut 異常検出タスクにおいて,提案手法はセグメンテーションと検出の両面で競合し,既存の手法より優れている。
関連論文リスト
- Spectral Feature Extraction for Robust Network Intrusion Detection Using MFCCs [0.4779196219827506]
本稿では,Mel- frequency cepstral coefficients (MFCC) とResNet-18を用いて,IoTネットワークトラフィックの異常を識別する手法を提案する。
我々のアプローチは、MFCCの強みとResNet-18の堅牢な特徴抽出機能を組み合わせることで、異常検出のための強力なフレームワークを提供する。
論文 参考訳(メタデータ) (2025-07-14T01:25:26Z) - SDTN and TRN: Adaptive Spectral-Spatial Feature Extraction for Hyperspectral Image Classification [1.2871580250533408]
ハイパースペクトル画像分類は、精密農業において重要な役割を担い、作物の健康モニタリング、病気の検出、土壌分析に関する正確な洞察を提供する。
従来の手法は高次元データ、スペクトル空間の冗長性、ラベル付きサンプルの不足に悩まされ、しばしば準最適性能に繋がる。
これらの課題に対処するために,テンソル分解と正規化機構を組み合わせた自己適応正規化ネットワーク(SDTN)を提案し,テンソルランクを動的に調整する。
このアプローチは、高い分類精度を維持するだけでなく、計算の複雑さを大幅に減らし、リソース制約のある環境でのリアルタイムデプロイメントに非常に適している。
論文 参考訳(メタデータ) (2025-07-13T04:53:33Z) - Biorthogonal Tunable Wavelet Unit with Lifting Scheme in Convolutional Neural Network [2.9377547378375803]
提案したユニットは、畳み込み、プーリング、ダウンサンプリング操作を強化し、畳み込みニューラルネットワーク(CNN)における画像分類と異常検出を改善した。
18層の残留ニューラルネットワーク(ResNet-18)に統合されると、CIFAR-10の分類精度は2.12%向上し、Describable Texturesデータセット(DTD)は9.73%向上した。
MVTec Anomaly DetectionデータセットのHazelnutカテゴリにおける異常検出のために,提案手法はセグメンテーションと検出の両タスクにおいて,競合的かつバランスの取れた性能を達成した。
論文 参考訳(メタデータ) (2025-07-01T13:42:46Z) - EECD-Net: Energy-Efficient Crack Detection with Spiking Neural Networks and Gated Attention [6.723950151272841]
本稿では,道路亀裂検出のための多段階検出手法であるEECD-Netを提案する。
SRCNN(Super-Resolution Convolutional Neural Network)は、低画質画像に固有の課題に対処するために用いられる。
これらの画像をスパースパルスシーケンスに変換するために,CIF(Continuous Integrate-and-Fire)ニューロンを用いたSCU(Spike Convolution Unit)を提案する。
CrackVision12Kベンチマークの実験では、EECD-Netは98.6%の精度で検出された。
論文 参考訳(メタデータ) (2025-06-05T00:19:36Z) - Point Cloud Denoising With Fine-Granularity Dynamic Graph Convolutional Networks [58.050130177241186]
ノイズの摂動は、しばしば3次元の点雲を破損させ、表面の再構成、レンダリング、さらなる処理といった下流のタスクを妨げる。
本稿では,GDGCNと呼ばれる粒度動的グラフ畳み込みネットワークについて紹介する。
論文 参考訳(メタデータ) (2024-11-21T14:19:32Z) - Dual-Frequency Filtering Self-aware Graph Neural Networks for Homophilic and Heterophilic Graphs [60.82508765185161]
我々は、Dual-Frequency Filtering Self-Aware Graph Neural Networks (DFGNN)を提案する。
DFGNNは低域通過フィルタと高域通過フィルタを統合し、滑らかで詳細な位相的特徴を抽出する。
フィルター比を動的に調整し、ホモフィルグラフとヘテロフィルグラフの両方に対応する。
論文 参考訳(メタデータ) (2024-11-18T04:57:05Z) - Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - DCNN: Dual Cross-current Neural Networks Realized Using An Interactive Deep Learning Discriminator for Fine-grained Objects [48.65846477275723]
本研究では、微細な画像分類の精度を向上させるために、新しい二重電流ニューラルネットワーク(DCNN)を提案する。
弱い教師付き学習バックボーンモデルを構築するための新しい特徴として、(a)異種データの抽出、(b)特徴マップの解像度の維持、(c)受容領域の拡大、(d)グローバル表現と局所特徴の融合などがある。
論文 参考訳(メタデータ) (2024-05-07T07:51:28Z) - ASWT-SGNN: Adaptive Spectral Wavelet Transform-based Self-Supervised
Graph Neural Network [20.924559944655392]
本稿では,適応スペクトルウェーブレット変換を用いた自己教師付きグラフニューラルネットワーク(ASWT-SGNN)を提案する。
ASWT-SGNNは高密度スペクトル領域におけるフィルタ関数を正確に近似し、コストの高い固有分解を避ける。
ノード分類タスクにおける最先端モデルに匹敵するパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-10T03:07:42Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - CPFN: Cascaded Primitive Fitting Networks for High-Resolution Point
Clouds [51.47100091540298]
本稿では,グローバルおよびローカルなプリミティブ検出ネットワークの検出結果をアダプティブパッチサンプリングネットワークに依存したCPFN(Cascaded Primitive Fitting Networks)を提案する。
CPFNは、高解像度のポイントクラウドデータセット上で、最先端のSPFNのパフォーマンスを13-14%改善し、特に20-22%の微細プリミティブの検出を改善している。
論文 参考訳(メタデータ) (2021-08-31T23:27:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。