論文の概要: Dilated Convolution with Learnable Spacings
- arxiv url: http://arxiv.org/abs/2408.06383v1
- Date: Sat, 10 Aug 2024 12:12:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-14 19:48:49.046301
- Title: Dilated Convolution with Learnable Spacings
- Title(参考訳): 学習可能な空間による拡張畳み込み
- Authors: Ismail Khalfaoui-Hassani,
- Abstract要約: この論文は、Dilated Convolution with Learnable Spacings (DCLS)法を提示し、評価する。
コンピュータビジョン、音声、音声処理の分野における様々な教師あり学習実験を通じて、DCLS法は、標準および高度な畳み込み技術よりも優れていることを証明した。
- 参考スコア(独自算出の注目度): 1.8130068086063336
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This thesis presents and evaluates the Dilated Convolution with Learnable Spacings (DCLS) method. Through various supervised learning experiments in the fields of computer vision, audio, and speech processing, the DCLS method proves to outperform both standard and advanced convolution techniques. The research is organized into several steps, starting with an analysis of the literature and existing convolution techniques that preceded the development of the DCLS method. We were particularly interested in the methods that are closely related to our own and that remain essential to capture the nuances and uniqueness of our approach. The cornerstone of our study is the introduction and application of the DCLS method to convolutional neural networks (CNNs), as well as to hybrid architectures that rely on both convolutional and visual attention approaches. DCLS is shown to be particularly effective in tasks such as classification, semantic segmentation, and object detection. Initially using bilinear interpolation, the study also explores other interpolation methods, finding that Gaussian interpolation slightly improves performance. The DCLS method is further applied to spiking neural networks (SNNs) to enable synaptic delay learning within a neural network that could eventually be transferred to so-called neuromorphic chips. The results show that the DCLS method stands out as a new state-of-the-art technique in SNN audio classification for certain benchmark tasks in this field. These tasks involve datasets with a high temporal component. In addition, we show that DCLS can significantly improve the accuracy of artificial neural networks for the multi-label audio classification task. We conclude with a discussion of the chosen experimental setup, its limitations, the limitations of our method, and our results.
- Abstract(参考訳): この論文は、Dilated Convolution with Learnable Spacings (DCLS)法を提示し、評価する。
コンピュータビジョン、音声、音声処理の分野における様々な教師あり学習実験を通じて、DCLS法は、標準および高度な畳み込み技術よりも優れていることを証明した。
この研究は、DCLS法の開発に先立つ文献と既存の畳み込み技術の分析から始まり、いくつかの段階に分けられる。
特に私たちは,我々のアプローチのニュアンスや独自性を捉える上で,私たち自身と密接な関係を持つ手法に関心を持っていました。
我々の研究の要点は、畳み込みニューラルネットワーク(CNN)と、畳み込みと視覚的注意の両方に依存するハイブリッドアーキテクチャへのDCLS法の導入と適用である。
DCLSは、分類、セマンティックセグメンテーション、オブジェクト検出といったタスクに特に有効であることが示されている。
当初は双線型補間法を用いていたが、この研究では他の補間法も検討し、ガウス補間が性能をわずかに改善することを発見した。
DCLS法はさらに、スパイクニューラルネットワーク(SNN)にも適用され、ニューラルネットワーク内でシナプス遅延学習を可能にし、最終的にはいわゆるニューロモルフィックチップに転送される。
以上の結果から,DCLS法はSNN音声分類における新たな最先端技術として注目されている。
これらのタスクは、高テンポラルなコンポーネントを持つデータセットを含む。
さらに,マルチラベル音声分類タスクにおいて,DCLSが人工知能ニューラルネットワークの精度を大幅に向上できることを示す。
我々は,選択した実験装置,その限界,方法の限界,その結果について論じる。
関連論文リスト
- CRNNTL: convolutional recurrent neural network and transfer learning for
QSAR modelling [4.090810719630087]
本稿では,QSARモデリングのための畳み込みリカレントニューラルネットワークと伝達学習(CRNNTL)を提案する。
我々の戦略は、特徴抽出のための畳み込みニューラルネットワークと繰り返しニューラルネットワークの両方の利点と、データ拡張手法の利点を生かしている。
論文 参考訳(メタデータ) (2021-09-07T20:04:55Z) - A Study On the Effects of Pre-processing On Spatio-temporal Action
Recognition Using Spiking Neural Networks Trained with STDP [0.0]
ビデオ分類タスクにおいて,教師なし学習手法で訓練したSNNの行動を研究することが重要である。
本稿では,時間情報を静的な形式に変換し,遅延符号化を用いて視覚情報をスパイクに変換する手法を提案する。
スパイクニューラルネットワークを用いた行動認識における行動の形状と速度の類似性の効果を示す。
論文 参考訳(メタデータ) (2021-05-31T07:07:48Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Drowsiness Detection Based On Driver Temporal Behavior Using a New
Developed Dataset [1.8811803364757564]
顔の特徴を自動的に抽出するためにYOLOv3 (You Look Only Once-version3) CNNを適用した。
そして、LSTMニューラルネットワークを用いて、あくびや点滅時間などのドライバーの時間行動を学ぶ。
以上の結果から,CNNとLSTMの併用による眠気検出と提案手法の有効性が示唆された。
論文 参考訳(メタデータ) (2021-03-31T21:15:29Z) - Supervised training of spiking neural networks for robust deployment on
mixed-signal neuromorphic processors [2.6949002029513167]
混合信号アナログ/デジタル電子回路はスパイキングニューロンやシナプスを非常に高いエネルギー効率でエミュレートすることができる。
ミスマッチは、同一構成ニューロンとシナプスの効果的なパラメータの違いとして表現される。
ミスマッチに対する堅牢性や,その他の一般的なノイズ源を最大化することで,この課題に対処する,教師付き学習アプローチを提案する。
論文 参考訳(メタデータ) (2021-02-12T09:20:49Z) - A journey in ESN and LSTM visualisations on a language task [77.34726150561087]
我々は,CSL(Cross-Situationnal Learning)タスクでESNとLSTMを訓練した。
その結果, 性能比較, 内部力学解析, 潜伏空間の可視化の3種類が得られた。
論文 参考訳(メタデータ) (2020-12-03T08:32:01Z) - Solving Sparse Linear Inverse Problems in Communication Systems: A Deep
Learning Approach With Adaptive Depth [51.40441097625201]
疎信号回復問題に対するエンドツーエンドの訓練可能なディープラーニングアーキテクチャを提案する。
提案手法は,出力するレイヤ数を学習し,各タスクのネットワーク深さを推論フェーズで動的に調整する。
論文 参考訳(メタデータ) (2020-10-29T06:32:53Z) - Continual Learning in Recurrent Neural Networks [67.05499844830231]
リカレントニューラルネットワーク(RNN)を用いた逐次データ処理における連続学習手法の有効性を評価する。
RNNに弾性重み強化などの重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重み-重
そこで本研究では,重み付け手法の性能が処理シーケンスの長さに直接的な影響を受けず,むしろ高動作メモリ要求の影響を受けていることを示す。
論文 参考訳(メタデータ) (2020-06-22T10:05:12Z) - Parallelization Techniques for Verifying Neural Networks [52.917845265248744]
検証問題に基づくアルゴリズムを反復的に導入し、2つの分割戦略を探索する。
また、ニューラルネットワークの検証問題を単純化するために、ニューロンアクティベーションフェーズを利用する、高度に並列化可能な前処理アルゴリズムも導入する。
論文 参考訳(メタデータ) (2020-04-17T20:21:47Z) - Rectified Linear Postsynaptic Potential Function for Backpropagation in
Deep Spiking Neural Networks [55.0627904986664]
スパイキングニューラルネットワーク(SNN)は、時間的スパイクパターンを用いて情報を表現し、伝達する。
本稿では,情報符号化,シナプス可塑性,意思決定におけるスパイクタイミングダイナミクスの寄与について検討し,将来のDeepSNNやニューロモルフィックハードウェアシステムの設計への新たな視点を提供する。
論文 参考訳(メタデータ) (2020-03-26T11:13:07Z) - Multi-Scale Neural network for EEG Representation Learning in BCI [2.105172041656126]
本稿では,複数の周波数/時間範囲における特徴表現を探索する深層多スケールニューラルネットワークを提案する。
スペクトル時間情報を用いた脳波信号の表現により,提案手法を多種多様なパラダイムに応用することができる。
論文 参考訳(メタデータ) (2020-03-02T04:06:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。