論文の概要: RecNet: Early Attention Guided Feature Recovery
- arxiv url: http://arxiv.org/abs/2302.09409v1
- Date: Sat, 18 Feb 2023 19:53:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-02-21 18:46:55.154534
- Title: RecNet: Early Attention Guided Feature Recovery
- Title(参考訳): RecNet: 早期注意誘導機能回復
- Authors: Subrata Biswas, Bashima Islam
- Abstract要約: センサの不確かさは入力ストリームの破損を招き、ディープニューラルネットワーク(DNN)の性能を阻害する
本稿では,入力特徴量の全要素における情報エントロピーを推定し,不足情報を入力特徴量行列に補間するRecNetを提案する。
提案手法は,マイクロホンアレイからの音声ストリームが劣化する音事象検出および位置推定アプリケーション上で評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Uncertainty in sensors results in corrupted input streams and hinders the
performance of Deep Neural Networks (DNN), which focus on deducing information
from data. However, for sensors with multiple input streams, the relevant
information among the streams correlates and hence contains mutual information.
This paper utilizes this opportunity to recover the perturbed information due
to corrupted input streams. We propose RecNet, which estimates the information
entropy at every element of the input feature to the network and interpolates
the missing information in the input feature matrix. Finally, using the
estimated information entropy and interpolated data, we introduce a novel
guided replacement procedure to recover the complete information that is the
input to the downstream DNN task. We evaluate the proposed algorithm on a sound
event detection and localization application where audio streams from the
microphone array are corrupted. We have recovered the performance drop due to
the corrupted input stream and reduced the localization error with
non-corrupted input streams.
- Abstract(参考訳): センサの不確実性は入力ストリームの破損を引き起こし、データから情報を引き出すことに焦点を当てたディープニューラルネットワーク(dnn)のパフォーマンスを阻害する。
しかし、複数の入力ストリームを持つセンサでは、ストリーム間の関連情報は相関し、相互情報を含む。
本稿では,この機会を利用して,入力ストリームの破損による混乱情報を復元する。
本稿では,入力特徴量の各要素の情報エントロピーをネットワークに推定し,入力特徴量行列の欠落情報を補間するrecnetを提案する。
最後に、推定情報エントロピーと補間データを用いて、下流DNNタスクへの入力である完全な情報を復元するための新しいガイド付き置換手順を導入する。
提案手法は,マイクロホンアレイからの音声ストリームが破損する音イベント検出と局所化の応用について評価する。
故障した入力ストリームによる性能低下を回復し,非破壊入力ストリームによるローカライズエラーを低減した。
関連論文リスト
- Noisy Test-Time Adaptation in Vision-Language Models [73.14136220844156]
テスト時間適応(TTA)は、テスト中のターゲットデータのみに依存することにより、ソースデータとターゲットデータの分散シフトに対処することを目的としている。
本稿では、ゼロショット方式で、テスト時にノイズのあるサンプルをターゲットとするデータにモデルを適応させることに焦点を当てたゼロショットノイズTTA(ZS-NTTA)を提案する。
本稿では, 冷凍機の出力を擬似ラベルとして利用し, ノイズ検出器の訓練を行う適応ノイズ検出器(AdaND)を提案する。
論文 参考訳(メタデータ) (2025-02-20T14:37:53Z) - Enhancing Unsupervised Feature Selection via Double Sparsity Constrained Optimization [6.342485512772862]
教師なし単一特徴選択(UFS)は機械学習やパターン認識に広く応用されている。
既存の手法のほとんどはスパーシリティしか考慮していないため、サブセットを選択し、元のサブセットと区別することは困難である。
本稿では,DSCOFSと呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2025-01-01T05:05:46Z) - M$^3$-Impute: Mask-guided Representation Learning for Missing Value Imputation [12.174699459648842]
M$3$-Imputeは、不足情報や新しいマスキング手法との相関性を明示的に活用することを目的としている。
実験の結果,M$3$-Imputeは平均20点,第2bのMAEスコアが4点であった。
論文 参考訳(メタデータ) (2024-10-11T13:25:32Z) - Denoising LM: Pushing the Limits of Error Correction Models for Speech Recognition [21.516152600963775]
Denoising LM (DLM) は大量の合成データで訓練された$textitscaled$エラー補正モデルである。
DLMは、$textittest-clean$で1.5%のワードエラー率(WER)、$textittest-other$で3.3%のWERを達成する。
論文 参考訳(メタデータ) (2024-05-24T05:05:12Z) - Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Joint Channel Estimation and Feedback with Masked Token Transformers in
Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。
エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。
提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文 参考訳(メタデータ) (2023-06-08T06:15:17Z) - Age of Information in Deep Learning-Driven Task-Oriented Communications [78.84264189471936]
本稿では,その送信機におけるデータを利用した受信機におけるタスク実行を目的とした,タスク指向コミュニケーションにおける年齢概念について検討する。
送信機-受信機操作は、共同で訓練されたディープニューラルネットワーク(DNN)のエンコーダ-デコーダペアとしてモデル化される。
論文 参考訳(メタデータ) (2023-01-11T04:15:51Z) - Pedestrian Spatio-Temporal Information Fusion For Video Anomaly
Detection [1.5736899098702974]
歩行者の情報を統合するために, 異常検出手法を提案する。
出力フレームと真値との差に応じて異常検出を行う。
The experimental results on the CUHK Avenue and ShanghaiTech datasets shows that the proposed method is superior than the current mainstream video anomaly detection method。
論文 参考訳(メタデータ) (2022-11-18T06:41:02Z) - IR2Net: Information Restriction and Information Recovery for Accurate
Binary Neural Networks [24.42067007684169]
重みとアクティベーションのバイナライゼーションは、ディープニューラルネットワークを効率よく圧縮し、モデル推論を加速するが、深刻な精度低下を引き起こす。
提案するIR$2$Netは,BNNのポテンシャルを刺激し,入力情報を制限し,特徴情報を復元することでネットワークの精度を向上させる。
実験の結果,ResNet-18 の sim 10x 浮動小数点演算 (FLOPs) の削減でも,本手法は依然として同等の精度を達成できることがわかった。
論文 参考訳(メタデータ) (2022-10-06T02:03:26Z) - Context Recovery and Knowledge Retrieval: A Novel Two-Stream Framework
for Video Anomaly Detection [48.05512963355003]
本稿では,文脈回復と知識検索に基づく2ストリームフレームワークを提案する。
文脈回復ストリームに対しては,動き情報を完全に活用して将来のフレームを予測するU-Netを提案する。
知識検索ストリームに対して,学習可能な局所性に敏感なハッシュを提案する。
正規性に関する知識をハッシュテーブルにエンコードして格納し、テストイベントと知識表現の間の距離を用いて異常の確率を明らかにする。
論文 参考訳(メタデータ) (2022-09-07T03:12:02Z) - Offline Reinforcement Learning at Multiple Frequencies [62.08749079914275]
本研究では、オフライン強化学習アルゴリズムが、トレーニング中に複数の周波数を混合したデータに対応できるかどうかについて検討する。
学習を安定させるために$Q$-valueの更新率で一貫性を強制する、単純だが効果的なソリューションを提案する。
論文 参考訳(メタデータ) (2022-07-26T17:54:49Z) - Fault Detection and Diagnosis with Imbalanced and Noisy Data: A Hybrid
Framework for Rotating Machinery [2.580765958706854]
回転機械製造システムの保守コスト低減には, 故障診断が重要な役割を担っている。
従来のフォールト検出および診断(FDD)フレームワークは、現実の状況に対処する際のパフォーマンスが劣っている。
本稿では、上記の3つのコンポーネントを用いて、効果的な信号ベースFDDシステムを実現するハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-09T01:09:59Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Causal Discovery from Sparse Time-Series Data Using Echo State Network [0.0]
時系列データ間の因果関係の発見は、症状の原因の診断に役立つ。
本稿では,2つの部分から構成される新しいシステムを提案する。第1部はガウスプロセス回帰を,第2部はエコー状態ネットワークを活用する。
本稿では,対応するマシューズ相関係数 (MCC) と受信器動作特性曲線 (ROC) について報告する。
論文 参考訳(メタデータ) (2022-01-09T05:55:47Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。
従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。
本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文 参考訳(メタデータ) (2021-05-22T10:17:38Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z) - Representation Learning for Sequence Data with Deep Autoencoding
Predictive Components [96.42805872177067]
本稿では,シーケンスデータの有用な表現が潜在空間における単純な構造を示すべきという直感に基づく,シーケンスデータの自己教師型表現学習法を提案する。
我々は,過去と将来のウィンドウ間の相互情報である潜在特徴系列の予測情報を最大化することにより,この潜時構造を奨励する。
提案手法は,ノイズの多い動的システムの潜時空間を復元し,タスク予測のための予測特徴を抽出し,エンコーダを大量の未ラベルデータで事前訓練する場合に音声認識を改善する。
論文 参考訳(メタデータ) (2020-10-07T03:34:01Z) - Forgetting Outside the Box: Scrubbing Deep Networks of Information
Accessible from Input-Output Observations [143.3053365553897]
本稿では、訓練された深層ネットワークからトレーニングデータのコホートへの依存を取り除く手順について述べる。
忘れられたコホートについて,クエリ毎にどれだけの情報を取り出すことができるか,という新たな境界を導入する。
我々は,ニューラルタンジェントカーネルにインスパイアされたDNNのアクティベーションとウェイトダイナミクスの接続を利用して,アクティベーションの情報を計算する。
論文 参考訳(メタデータ) (2020-03-05T23:17:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。