Fugu-MT 論文翻訳(概要): RecNet: Early Attention Guided Feature Recovery

論文の概要: RecNet: Early Attention Guided Feature Recovery

arxiv url: http://arxiv.org/abs/2302.09409v1
Date: Sat, 18 Feb 2023 19:53:12 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-21 18:46:55.154534
Title: RecNet: Early Attention Guided Feature Recovery
Title（参考訳）: RecNet: 早期注意誘導機能回復
Authors: Subrata Biswas, Bashima Islam
Abstract要約: センサの不確かさは入力ストリームの破損を招き、ディープニューラルネットワーク(DNN)の性能を阻害する本稿では,入力特徴量の全要素における情報エントロピーを推定し,不足情報を入力特徴量行列に補間するRecNetを提案する。提案手法は,マイクロホンアレイからの音声ストリームが劣化する音事象検出および位置推定アプリケーション上で評価する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Uncertainty in sensors results in corrupted input streams and hinders the performance of Deep Neural Networks (DNN), which focus on deducing information from data. However, for sensors with multiple input streams, the relevant information among the streams correlates and hence contains mutual information. This paper utilizes this opportunity to recover the perturbed information due to corrupted input streams. We propose RecNet, which estimates the information entropy at every element of the input feature to the network and interpolates the missing information in the input feature matrix. Finally, using the estimated information entropy and interpolated data, we introduce a novel guided replacement procedure to recover the complete information that is the input to the downstream DNN task. We evaluate the proposed algorithm on a sound event detection and localization application where audio streams from the microphone array are corrupted. We have recovered the performance drop due to the corrupted input stream and reduced the localization error with non-corrupted input streams.
Abstract（参考訳）: センサの不確実性は入力ストリームの破損を引き起こし、データから情報を引き出すことに焦点を当てたディープニューラルネットワーク(dnn)のパフォーマンスを阻害する。しかし、複数の入力ストリームを持つセンサでは、ストリーム間の関連情報は相関し、相互情報を含む。本稿では,この機会を利用して,入力ストリームの破損による混乱情報を復元する。本稿では,入力特徴量の各要素の情報エントロピーをネットワークに推定し,入力特徴量行列の欠落情報を補間するrecnetを提案する。最後に、推定情報エントロピーと補間データを用いて、下流DNNタスクへの入力である完全な情報を復元するための新しいガイド付き置換手順を導入する。提案手法は,マイクロホンアレイからの音声ストリームが破損する音イベント検出と局所化の応用について評価する。故障した入力ストリームによる性能低下を回復し,非破壊入力ストリームによるローカライズエラーを低減した。

関連論文リスト

Key-Augmented Neural Triggers for Knowledge Sharing [3.8718804267599416]
Key-Augmented Neural Triggersは、知識アンカーをトレーニングと推論の両方に組み込む。局所的なコンテキストにおけるフラグメンテーションとグラウンドディング推論を減らす。スケーラブルで低レイテンシでオンプレミスのデプロイメントに適している。
論文参考訳（メタデータ） (2025-08-05T11:40:56Z)
Gated Attention for Large Language Models: Non-linearity, Sparsity, and Attention-Sink-Free [81.65559031466452]
我々は、ゲーティング強化ソフトマックスアテンションの変種を調べる実験を行った。 SDPA(Scaled Dot-Product Attention)後の頭部特異的シグモイドゲートを簡易に修正することで,性能が向上することがわかった。
論文参考訳（メタデータ） (2025-05-10T17:15:49Z)
BEVDiffLoc: End-to-End LiDAR Global Localization in BEV View based on Diffusion Model [8.720833232645155]
Bird's-Eye-View (BEV) 画像は、自動運転において最も広く採用されているデータ表現の1つである。ポーズの条件生成としてLiDAR局所化を定式化する新しいフレームワークであるBEVDiffLocを提案する。
論文参考訳（メタデータ） (2025-03-14T13:17:43Z)
Noisy Test-Time Adaptation in Vision-Language Models [73.14136220844156]
テスト時間適応(TTA)は、テスト中のターゲットデータのみに依存することにより、ソースデータとターゲットデータの分散シフトに対処することを目的としている。本稿では、ゼロショット方式で、テスト時にノイズのあるサンプルをターゲットとするデータにモデルを適応させることに焦点を当てたゼロショットノイズTTA(ZS-NTTA)を提案する。本稿では, 冷凍機の出力を擬似ラベルとして利用し, ノイズ検出器の訓練を行う適応ノイズ検出器(AdaND)を提案する。
論文参考訳（メタデータ） (2025-02-20T14:37:53Z)
Enhancing Unsupervised Feature Selection via Double Sparsity Constrained Optimization [6.342485512772862]
教師なし単一特徴選択(UFS)は機械学習やパターン認識に広く応用されている。既存の手法のほとんどはスパーシリティしか考慮していないため、サブセットを選択し、元のサブセットと区別することは困難である。本稿では,DSCOFSと呼ばれる新しい手法を提案する。
論文参考訳（メタデータ） (2025-01-01T05:05:46Z)
M$^3$-Impute: Mask-guided Representation Learning for Missing Value Imputation [12.174699459648842]
M$3$-Imputeは、不足情報や新しいマスキング手法との相関性を明示的に活用することを目的としている。実験の結果,M$3$-Imputeは平均20点,第2bのMAEスコアが4点であった。
論文参考訳（メタデータ） (2024-10-11T13:25:32Z)
Improved Out-of-Scope Intent Classification with Dual Encoding and Threshold-based Re-Classification [6.975902383951604]
現在の手法は、予測不可能なアウトリーチ分布で困難に直面している。本稿では,これらの課題に対処するため,Dual for Threshold-Based Re-Classification (DETER)を提案する。我々のモデルは以前のベンチマークより優れており、未知のインテントに対するF1スコアの13%と5%に向上しています。
論文参考訳（メタデータ） (2024-05-30T11:46:42Z)
Denoising LM: Pushing the Limits of Error Correction Models for Speech Recognition [21.516152600963775]
Denoising LM (DLM) は大量の合成データで訓練された$textitscaled$エラー補正モデルである。 DLMは、$textittest-clean$で1.5%のワードエラー率(WER)、$textittest-other$で3.3%のWERを達成する。
論文参考訳（メタデータ） (2024-05-24T05:05:12Z)
Identification of 4FGL uncertain sources at Higher Resolutions with Inverse Discrete Wavelet Transform [0.562479170374811]
来るべき大天体データの時代には、地上の望遠鏡や宇宙の望遠鏡からターゲット源を見つけるのが重宝される。本研究は,AGN候補の発見と4FGL DR3からBL Lac/FSRQ候補を同定することに焦点を当てた。
論文参考訳（メタデータ） (2024-01-05T01:02:34Z)
Deep Neural Networks Tend To Extrapolate Predictably [51.303814412294514]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文参考訳（メタデータ） (2023-10-02T03:25:32Z)
Global Context Aggregation Network for Lightweight Saliency Detection of Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。 3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文参考訳（メタデータ） (2023-09-22T06:19:11Z)
Joint Channel Estimation and Feedback with Masked Token Transformers in Massive MIMO Systems [74.52117784544758]
本稿では,CSI行列内の固有周波数領域相関を明らかにするエンコーダデコーダに基づくネットワークを提案する。エンコーダ・デコーダネットワーク全体がチャネル圧縮に使用される。提案手法は,共同作業における現状のチャネル推定およびフィードバック技術より優れる。
論文参考訳（メタデータ） (2023-06-08T06:15:17Z)
Age of Information in Deep Learning-Driven Task-Oriented Communications [78.84264189471936]
本稿では,その送信機におけるデータを利用した受信機におけるタスク実行を目的とした,タスク指向コミュニケーションにおける年齢概念について検討する。送信機-受信機操作は、共同で訓練されたディープニューラルネットワーク(DNN)のエンコーダ-デコーダペアとしてモデル化される。
論文参考訳（メタデータ） (2023-01-11T04:15:51Z)
Pedestrian Spatio-Temporal Information Fusion For Video Anomaly Detection [1.5736899098702974]
歩行者の情報を統合するために, 異常検出手法を提案する。出力フレームと真値との差に応じて異常検出を行う。 The experimental results on the CUHK Avenue and ShanghaiTech datasets shows that the proposed method is superior than the current mainstream video anomaly detection method。
論文参考訳（メタデータ） (2022-11-18T06:41:02Z)
IR2Net: Information Restriction and Information Recovery for Accurate Binary Neural Networks [24.42067007684169]
重みとアクティベーションのバイナライゼーションは、ディープニューラルネットワークを効率よく圧縮し、モデル推論を加速するが、深刻な精度低下を引き起こす。提案するIR$2$Netは,BNNのポテンシャルを刺激し,入力情報を制限し,特徴情報を復元することでネットワークの精度を向上させる。実験の結果,ResNet-18 の sim 10x 浮動小数点演算 (FLOPs) の削減でも,本手法は依然として同等の精度を達成できることがわかった。
論文参考訳（メタデータ） (2022-10-06T02:03:26Z)
Context Recovery and Knowledge Retrieval: A Novel Two-Stream Framework for Video Anomaly Detection [48.05512963355003]
本稿では,文脈回復と知識検索に基づく2ストリームフレームワークを提案する。文脈回復ストリームに対しては,動き情報を完全に活用して将来のフレームを予測するU-Netを提案する。知識検索ストリームに対して,学習可能な局所性に敏感なハッシュを提案する。正規性に関する知識をハッシュテーブルにエンコードして格納し、テストイベントと知識表現の間の距離を用いて異常の確率を明らかにする。
論文参考訳（メタデータ） (2022-09-07T03:12:02Z)
Offline Reinforcement Learning at Multiple Frequencies [62.08749079914275]
本研究では、オフライン強化学習アルゴリズムが、トレーニング中に複数の周波数を混合したデータに対応できるかどうかについて検討する。学習を安定させるために$Q$-valueの更新率で一貫性を強制する、単純だが効果的なソリューションを提案する。
論文参考訳（メタデータ） (2022-07-26T17:54:49Z)
Magic ELF: Image Deraining Meets Association Learning and Transformer [63.761812092934576]
本稿では,CNN と Transformer を統合化して,画像デライニングにおける学習のメリットを活用することを目的とする。降雨除去と背景復旧を関連づける新しいマルチインプット・アテンション・モジュール (MAM) を提案する。提案手法(ELF)は,最先端手法(MPRNet)を平均0.25dB向上させる。
論文参考訳（メタデータ） (2022-07-21T12:50:54Z)
Fault Detection and Diagnosis with Imbalanced and Noisy Data: A Hybrid Framework for Rotating Machinery [2.580765958706854]
回転機械製造システムの保守コスト低減には, 故障診断が重要な役割を担っている。従来のフォールト検出および診断(FDD)フレームワークは、現実の状況に対処する際のパフォーマンスが劣っている。本稿では、上記の3つのコンポーネントを用いて、効果的な信号ベースFDDシステムを実現するハイブリッドフレームワークを提案する。
論文参考訳（メタデータ） (2022-02-09T01:09:59Z)
The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。 KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文参考訳（メタデータ） (2022-01-29T10:54:57Z)
Causal Discovery from Sparse Time-Series Data Using Echo State Network [0.0]
時系列データ間の因果関係の発見は、症状の原因の診断に役立つ。本稿では,2つの部分から構成される新しいシステムを提案する。第1部はガウスプロセス回帰を,第2部はエコー状態ネットワークを活用する。本稿では,対応するマシューズ相関係数 (MCC) と受信器動作特性曲線 (ROC) について報告する。
論文参考訳（メタデータ） (2022-01-09T05:55:47Z)
SignalNet: A Low Resolution Sinusoid Decomposition and Estimation Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文参考訳（メタデータ） (2021-06-10T04:21:20Z)
Video-based Person Re-identification without Bells and Whistles [49.51670583977911]
ビデオベースの人物再識別(Re-ID)は、異なるカメラの下で歩行者を特定するために、ビデオトラッカーとトリミングされたビデオフレームをマッチングすることを目的としている。従来の方法による不完全な検出と追跡の結果から, 収穫したトラックレットの空間的, 時間的不整合が生じている。本稿では,深層学習に基づくトラックレットの検出と追跡を適用することで,これらの予期せぬノイズを効果的に低減できる簡易な再検出リンク(DL)モジュールを提案する。
論文参考訳（メタデータ） (2021-05-22T10:17:38Z)
Bridging the Gap Between Clean Data Training and Real-World Inference for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文参考訳（メタデータ） (2021-04-13T17:54:33Z)
Conditioning Trick for Training Stable GANs [70.15099665710336]
本稿では,GANトレーニング中の不安定性問題に対応するため,ジェネレータネットワークに正規性から逸脱する条件付け手法を提案する。我々は、生成元をシュア分解のスペクトル領域で計算された実サンプルの正規化関数から逸脱するように強制する。
論文参考訳（メタデータ） (2020-10-12T16:50:22Z)
Representation Learning for Sequence Data with Deep Autoencoding Predictive Components [96.42805872177067]
本稿では,シーケンスデータの有用な表現が潜在空間における単純な構造を示すべきという直感に基づく,シーケンスデータの自己教師型表現学習法を提案する。我々は,過去と将来のウィンドウ間の相互情報である潜在特徴系列の予測情報を最大化することにより,この潜時構造を奨励する。提案手法は,ノイズの多い動的システムの潜時空間を復元し,タスク予測のための予測特徴を抽出し,エンコーダを大量の未ラベルデータで事前訓練する場合に音声認識を改善する。
論文参考訳（メタデータ） (2020-10-07T03:34:01Z)
Learning Condition Invariant Features for Retrieval-Based Localization from 1M Images [85.81073893916414]
我々は、より正確で、より一般化されたローカライゼーション特徴を学習する新しい方法を開発した。難易度の高いオックスフォード・ロボットカーの夜間条件では、5m以内の局所化精度でよく知られた三重項損失を24.4%上回っている。
論文参考訳（メタデータ） (2020-08-27T14:46:22Z)
Generalized Focal Loss: Learning Qualified and Distributed Bounding Boxes for Dense Object Detection [85.53263670166304]
一段検出器は基本的に、物体検出を密度の高い分類と位置化として定式化する。 1段検出器の最近の傾向は、局所化の質を推定するために個別の予測分岐を導入することである。本稿では, 上記の3つの基本要素, 品質推定, 分類, ローカライゼーションについて述べる。
論文参考訳（メタデータ） (2020-06-08T07:24:33Z)
Forgetting Outside the Box: Scrubbing Deep Networks of Information Accessible from Input-Output Observations [143.3053365553897]
本稿では、訓練された深層ネットワークからトレーニングデータのコホートへの依存を取り除く手順について述べる。忘れられたコホートについて,クエリ毎にどれだけの情報を取り出すことができるか,という新たな境界を導入する。我々は,ニューラルタンジェントカーネルにインスパイアされたDNNのアクティベーションとウェイトダイナミクスの接続を利用して,アクティベーションの情報を計算する。
論文参考訳（メタデータ） (2020-03-05T23:17:35Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。