論文の概要: Biorthogonal Tunable Wavelet Unit with Lifting Scheme in Convolutional Neural Network
- arxiv url: http://arxiv.org/abs/2507.00739v1
- Date: Tue, 01 Jul 2025 13:42:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:22:59.641268
- Title: Biorthogonal Tunable Wavelet Unit with Lifting Scheme in Convolutional Neural Network
- Title(参考訳): 畳み込みニューラルネットワークにおけるリフティング方式を用いた生体直交可変ウェーブレットユニット
- Authors: An Le, Hung Nguyen, Sungbal Seo, You-Suk Bae, Truong Nguyen,
- Abstract要約: 提案したユニットは、畳み込み、プーリング、ダウンサンプリング操作を強化し、畳み込みニューラルネットワーク(CNN)における画像分類と異常検出を改善した。
18層の残留ニューラルネットワーク(ResNet-18)に統合されると、CIFAR-10の分類精度は2.12%向上し、Describable Texturesデータセット(DTD)は9.73%向上した。
MVTec Anomaly DetectionデータセットのHazelnutカテゴリにおける異常検出のために,提案手法はセグメンテーションと検出の両タスクにおいて,競合的かつバランスの取れた性能を達成した。
- 参考スコア(独自算出の注目度): 2.9377547378375803
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work introduces a novel biorthogonal tunable wavelet unit constructed using a lifting scheme that relaxes both the orthogonality and equal filter length constraints, providing greater flexibility in filter design. The proposed unit enhances convolution, pooling, and downsampling operations, leading to improved image classification and anomaly detection in convolutional neural networks (CNN). When integrated into an 18-layer residual neural network (ResNet-18), the approach improved classification accuracy on CIFAR-10 by 2.12% and on the Describable Textures Dataset (DTD) by 9.73%, demonstrating its effectiveness in capturing fine-grained details. Similar improvements were observed in ResNet-34. For anomaly detection in the hazelnut category of the MVTec Anomaly Detection dataset, the proposed method achieved competitive and wellbalanced performance in both segmentation and detection tasks, outperforming existing approaches in terms of accuracy and robustness.
- Abstract(参考訳): 本研究は, 直交性および等長制約を緩和し, フィルタ設計の柔軟性を向上するリフト方式を用いて構築した, 新規な直交波長可変ウェーブレットユニットを提案する。
提案したユニットは、畳み込み、プーリング、ダウンサンプリング操作を強化し、畳み込みニューラルネットワーク(CNN)における画像分類と異常検出を改善した。
18層の残留ニューラルネットワーク(ResNet-18)に統合されると、CIFAR-10の分類精度は2.12%向上し、Describable Textures Dataset(DTD)は9.73%向上した。
ResNet-34でも同様の改善が見られた。
MVTec Anomaly DetectionデータセットのHazelnutカテゴリにおける異常検出のために,提案手法はセグメント化と検出の両タスクにおいて競合的かつバランスの取れた性能を達成し,精度とロバスト性の観点から既存手法より優れていた。
関連論文リスト
- Model-Driven Deep Neural Network for Enhanced AoA Estimation Using 5G gNB [25.578334082503755]
現在の無線ネットワークは、位置決め機能を実現するためにモデル駆動アプローチに依存している。
人工知能を位置決めフレームワークに統合することは、位置情報ベースのサービスの正確性と堅牢性に革命をもたらす、有望なソリューションを提供する。
本稿では,モデル駆動型深層ニューラルネットワーク(MoD-DNN)を提案する。
論文 参考訳(メタデータ) (2024-12-10T01:16:48Z) - Deep-Unrolling Multidimensional Harmonic Retrieval Algorithms on Neuromorphic Hardware [78.17783007774295]
本稿では,高精度かつエネルギー効率の高い単発多次元高調波検索のための変換に基づくニューロモルフィックアルゴリズムの可能性について検討する。
複雑な値の畳み込み層と活性化をスパイクニューラルネットワーク(SNN)に変換する新しい手法を開発した。
変換されたSNNは、元のCNNに比べて性能が低下し、ほぼ5倍の電力効率を実現している。
論文 参考訳(メタデータ) (2024-12-05T09:41:33Z) - The object detection model uses combined extraction with KNN and RF classification [0.0]
本研究は,GLCMとLCPを特徴ベクトルとして組み合わせた新しい手法と,分類のためのVEによる物体検出の分野に寄与する。
システムテストでは4,437枚の2D画像のデータセットを使用し、KNNの精度は92.7%、F1スコアは92.5%、RF性能は低かった。
論文 参考訳(メタデータ) (2024-05-09T05:21:42Z) - DCNN: Dual Cross-current Neural Networks Realized Using An Interactive Deep Learning Discriminator for Fine-grained Objects [48.65846477275723]
本研究では、微細な画像分類の精度を向上させるために、新しい二重電流ニューラルネットワーク(DCNN)を提案する。
弱い教師付き学習バックボーンモデルを構築するための新しい特徴として、(a)異種データの抽出、(b)特徴マップの解像度の維持、(c)受容領域の拡大、(d)グローバル表現と局所特徴の融合などがある。
論文 参考訳(メタデータ) (2024-05-07T07:51:28Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - Robust lEarned Shrinkage-Thresholding (REST): Robust unrolling for
sparse recover [87.28082715343896]
我々は、モデルミス特定を前進させるのに堅牢な逆問題を解決するためのディープニューラルネットワークについて検討する。
我々は,アルゴリズムの展開手法を根底にある回復問題のロバストバージョンに適用することにより,新しい堅牢なディープニューラルネットワークアーキテクチャを設計する。
提案したRESTネットワークは,圧縮センシングとレーダイメージングの両問題において,最先端のモデルベースおよびデータ駆動アルゴリズムを上回る性能を示す。
論文 参考訳(メタデータ) (2021-10-20T06:15:45Z) - Implementing a foveal-pit inspired filter in a Spiking Convolutional
Neural Network: a preliminary study [0.0]
我々は,網膜卵管刺激によるガウスフィルタとランク順符号化の差異を取り入れたスポーキング畳み込みニューラルネットワーク(SCNN)を提示した。
このモデルは、Nengoライブラリーで実装されているように、スパイキングニューロンで動作するように適応されたバックプロパゲーションアルゴリズムの変種を用いて訓練される。
ネットワークは最大90%の精度で達成され、損失はクロスエントロピー関数を用いて計算される。
論文 参考訳(メタデータ) (2021-05-29T15:28:30Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - SAR-U-Net: squeeze-and-excitation block and atrous spatial pyramid
pooling based residual U-Net for automatic liver CT segmentation [3.192503074844775]
Squeeze-and-Excitation(SE)ブロック,Atrous Space Pyramid Pooling(ASPP),Resternal Learningといったテクニックを活用した,U-Netベースのフレームワークが提案されている。
提案手法の有効性を2つの公開データセットLiTS17とSLiver07で検証した。
論文 参考訳(メタデータ) (2021-03-11T02:32:59Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。