論文の概要: Spiking Music: Audio Compression with Event Based Auto-encoders
- arxiv url: http://arxiv.org/abs/2402.01571v1
- Date: Fri, 2 Feb 2024 17:07:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-05 14:15:52.673717
- Title: Spiking Music: Audio Compression with Event Based Auto-encoders
- Title(参考訳): Spiking Music:イベントベースのオートエンコーダによるオーディオ圧縮
- Authors: Martim Lisboa, Guillaume Bellec
- Abstract要約: ニューロンはスパイクと呼ばれる時間的出来事を通じて情報を伝達する。
イベントベースの符号化は音声圧縮に有効であることを示す。
我々は、ピアノ録音の大規模なMAESTROデータセットでこれを検証した。
- 参考スコア(独自算出の注目度): 3.7710541619011737
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neurons in the brain communicate information via punctual events called
spikes. The timing of spikes is thought to carry rich information, but it is
not clear how to leverage this in digital systems. We demonstrate that
event-based encoding is efficient for audio compression. To build this
event-based representation we use a deep binary auto-encoder, and under high
sparsity pressure, the model enters a regime where the binary event matrix is
stored more efficiently with sparse matrix storage algorithms. We test this on
the large MAESTRO dataset of piano recordings against vector quantized
auto-encoders. Not only does our "Spiking Music compression" algorithm achieve
a competitive compression/reconstruction trade-off, but selectivity and
synchrony between encoded events and piano key strikes emerge without
supervision in the sparse regime.
- Abstract(参考訳): 脳内のニューロンはスパイクと呼ばれる時間的出来事を通じて情報を伝達する。
スパイクのタイミングは豊富な情報を持っていると考えられているが、デジタルシステムでこれを利用する方法は不明である。
音声圧縮にはイベントベースのエンコーディングが有効であることを示す。
このイベントベースの表現を構築するには、深いバイナリの自動エンコーダを使用し、高いスパース性圧力下で、分散行列ストレージアルゴリズムによりバイナリイベントマトリックスをより効率的に格納するレジームに入る。
我々は、ベクトル量子化オートエンコーダに対するピアノ録音の大規模なmaestroデータセットでこれをテストする。
我々の「スポーキング・ミュージック・圧縮」アルゴリズムは、競争力のある圧縮/再構成トレードオフを達成するだけでなく、符号化されたイベントとピアノキーストライクの間の選択性と同期をスパース体制の監督なしに実現します。
関連論文リスト
- A Closer Look at Neural Codec Resynthesis: Bridging the Gap between Codec and Waveform Generation [65.05719674893999]
トークン予測と回帰に基づく2つの戦略について検討し,Schr"odinger Bridgeに基づく新しい手法を提案する。
異なるデザイン選択が機械と人間の知覚にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2024-10-29T18:29:39Z) - Edge Storage Management Recipe with Zero-Shot Data Compression for Road
Anomaly Detection [1.4563998247782686]
本研究では,高忠実度音声を保存しながら,効率的なストレージ管理手法を提案する。
収集した高解像度オーディオをコンパクトなコードに符号化する計算ファイル圧縮手法を推奨する。
そこで本研究では,単純かつ効果的なオートエンコーダに基づくデータ圧縮手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T01:30:21Z) - SpikeCodec: An End-to-end Learned Compression Framework for Spiking
Camera [48.194993029659685]
連続的なモーション記録機能を備えたバイオインスピレーション付きスパイクカメラは、大きな注目を集めている。
本研究では,シーンリカバリ,変分自動エンコーダとスパイクシミュレータを用いた新しいスパイク圧縮フレームワークを提案する。
我々の知る限り、これは効率的でロバストなスパイクストリーム圧縮のための最初のデータ訓練モデルである。
論文 参考訳(メタデータ) (2023-06-25T03:11:21Z) - Information compression via hidden subgroup quantum autoencoders [5.502955304070116]
隠れサブグループ型の既知対称性を持つデータベースにおけるシーケンスデータについて検討する。
与えられた群構造を持つデータは、隠れた部分群問題と同じクエリ複雑性で圧縮可能であることを証明した。
我々は、群構造を変動的に見つける量子アルゴリズムを設計し、それを用いてデータを圧縮する。
論文 参考訳(メタデータ) (2023-06-13T18:06:19Z) - A Novel Approach for Neuromorphic Vision Data Compression based on Deep
Belief Network [0.2578242050187029]
ニューロモルフィックカメラ(Neuromorphic camera)は、人間の目が局所的な明るさの変化だけを捉えているイメージセンサーである。
本稿では,イベントデータに対する深層学習に基づく新しい圧縮手法を提案する。
論文 参考訳(メタデータ) (2022-10-27T12:21:14Z) - High Fidelity Neural Audio Compression [92.4812002532009]
我々は、ニューラルネットワークを利用した最先端のリアルタイム、高忠実、オーディオを導入する。
ストリーミングエンコーダ-デコーダアーキテクチャと、エンドツーエンドでトレーニングされた量子化潜在空間で構成されている。
単一マルチスケール・スペクトログラム・アドバイザリーを用いて、トレーニングを簡素化し、高速化する。
論文 参考訳(メタデータ) (2022-10-24T17:52:02Z) - Masked Autoencoders that Listen [79.99280830830854]
本稿では,画像ベースMasked Autoencoders(MAE)の音声スペクトログラムからの自己教師型表現学習への簡単な拡張について検討する。
MAEにおけるTransformer encoder-decoderの設計に続いて、Audio-MAEはまず、ハイマスキング比でオーディオスペクトログラムパッチを符号化し、エンコーダ層を介して非マスキングトークンのみを供給します。
次にデコーダは、入力スペクトログラムを再構築するために、マスクトークンでパッドされたエンコードされたコンテキストを再注文し、デコードする。
論文 参考訳(メタデータ) (2022-07-13T17:59:55Z) - COIN++: Data Agnostic Neural Compression [55.27113889737545]
COIN++は、幅広いデータモダリティをシームレスに扱うニューラルネットワーク圧縮フレームワークである。
様々なデータモダリティを圧縮することで,本手法の有効性を示す。
論文 参考訳(メタデータ) (2022-01-30T20:12:04Z) - SoundStream: An End-to-End Neural Audio Codec [78.94923131038682]
本稿では,音声,音楽,一般音声を効率よく圧縮できる新しいニューラルオーディオシステムSoundStreamを紹介する。
SoundStreamは完全な畳み込みエンコーダ/デコーダネットワークと残留ベクトル量子化器に頼っている。
エンコーダまたはデコーダ側で、追加のレイテンシなしで、共同圧縮と拡張を行うことができます。
論文 参考訳(メタデータ) (2021-07-07T15:45:42Z) - Lossy Event Compression based on Image-derived Quad Trees and Poisson
Disk Sampling [6.5364852148089545]
隣接する強度画像から得られたクワッドツリー(QT)セグメンテーションマップに基づく新しいイベント圧縮アルゴリズムを提案する。
提案アルゴリズムは,最先端技術と比較して6倍以上の圧縮を実現する。
論文 参考訳(メタデータ) (2020-05-03T03:18:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。