論文の概要: Exploring how a Generative AI interprets music
- arxiv url: http://arxiv.org/abs/2308.00015v1
- Date: Mon, 31 Jul 2023 15:35:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 16:50:03.511817
- Title: Exploring how a Generative AI interprets music
- Title(参考訳): ジェネレーティブAIが音楽の解釈方法を探る
- Authors: Gabriela Barenboim, Luigi Del Debbio, Johannes Hirn, Veronica Sanz
- Abstract要約: GoogleのMusicVAEは512次元のラテントスペースを備えた変分自動エンコーダで、いくつかの音楽バーを表現しています。
平均して、ほとんどの潜伏ニューロンは、本物の音楽トラックを流すと静かであることに気付きます。
メロディの概念は、音楽の長いシーケンスのために独立したニューロンにのみ現れるように思われる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We use Google's MusicVAE, a Variational Auto-Encoder with a 512-dimensional
latent space to represent a few bars of music, and organize the latent
dimensions according to their relevance in describing music. We find that, on
average, most latent neurons remain silent when fed real music tracks: we call
these "noise" neurons. The remaining few dozens of latent neurons that do fire
are called "music neurons". We ask which neurons carry the musical information
and what kind of musical information they encode, namely something that can be
identified as pitch, rhythm or melody. We find that most of the information
about pitch and rhythm is encoded in the first few music neurons: the neural
network has thus constructed a couple of variables that non-linearly encode
many human-defined variables used to describe pitch and rhythm. The concept of
melody only seems to show up in independent neurons for longer sequences of
music.
- Abstract(参考訳): GoogleのMusicVAEは512次元の潜伏空間を持つ変分自動エンコーダで、いくつかの音楽のバーを表現し、音楽の記述の関連性に応じて潜伏次元を整理します。
平均すると、ほとんどの潜在ニューロンは、実際の音楽トラックに餌をやる時、沈黙し続ける:これらの「ノイズ」ニューロンと呼ぶ。
燃焼する他の数十個の潜伏ニューロンは「音楽ニューロン」と呼ばれる。
我々は、どのニューロンが音楽情報を持ち、どのような音楽情報、つまり、ピッチ、リズム、メロディとして識別できるのかを尋ねる。
ニューラルネットワークは、ピッチとリズムを記述するために使用される多くの人間定義変数を非線形にエンコードする2つの変数を構築した。
メロディの概念は、音楽の長いシーケンスのために独立したニューロンにのみ現れるように見える。
関連論文リスト
- Investigating the Encoding of Words in BERT's Neurons using Feature
Textualization [11.943486282441143]
本稿では,埋め込み語空間におけるニューロンの表現を生成する手法を提案する。
生成した表現は、個々のニューロンにおける符号化された知識についての洞察を与えることができる。
論文 参考訳(メタデータ) (2023-11-14T15:21:49Z) - Brain2Music: Reconstructing Music from Human Brain Activity [1.4777718769290527]
機能的磁気共鳴画像(fMRI)を用いた脳活動からの音楽再構成手法を提案する。
本手法では,fMRIデータからの埋め込みを条件とした音楽検索やMusicLM音楽生成モデルを用いる。
生成された音楽は、ジャンル、楽器、ムードといった意味的特性に関して、人間の被験者が経験した音楽刺激に類似している。
論文 参考訳(メタデータ) (2023-07-20T17:55:17Z) - Constraints on the design of neuromorphic circuits set by the properties
of neural population codes [61.15277741147157]
脳内では、情報はコード化され、伝達され、行動を伝えるために使用される。
ニューロモルフィック回路は、脳内のニューロンの集団が使用するものと互換性のある方法で情報を符号化する必要がある。
論文 参考訳(メタデータ) (2022-12-08T15:16:04Z) - Natural Language Descriptions of Deep Visual Features [50.270035018478666]
オープンエンド,コンポジション,自然言語による記述で自動的にニューロンをラベル付けする手法を提案する。
我々はMILANを用いて、視覚モデルにおける属性、カテゴリ、関係情報を選択的に選択したニューロンの分布と重要性を特徴付ける。
また、これらの特徴を曖昧にすることを目的としたデータセットでトレーニングされたモデルにおいて、人種や性別といった保護されたカテゴリに敏感な、監査用のMILANも使用しています。
論文 参考訳(メタデータ) (2022-01-26T18:48:02Z) - Comparing the Accuracy of Deep Neural Networks (DNN) and Convolutional
Neural Network (CNN) in Music Genre Recognition (MGR): Experiments on Kurdish
Music [0.0]
8種類のクルド音楽ジャンルの880のサンプルを含むデータセットを開発した。
我々は、Deep Neural Network(DNN)とConvolutional Neural Network(CNN)の2つの機械学習アプローチを評価し、そのジャンルを認識した。
論文 参考訳(メタデータ) (2021-11-22T09:21:48Z) - Astrocytes mediate analogous memory in a multi-layer neuron-astrocytic
network [52.77024349608834]
情報の一部が数秒間堅牢な活動パターンとして維持され、他の刺激が来なければ完全に消滅することを示す。
この種の短期記憶は、操作情報を数秒保存し、次のパターンとの重複を避けるために完全に忘れてしまう。
任意のパターンをロードし、一定の間隔で保存し、適切な手掛かりパターンを入力に適用した場合に検索する方法について示す。
論文 参考訳(メタデータ) (2021-08-31T16:13:15Z) - Multi-Channel Automatic Music Transcription Using Tensor Algebra [0.0]
本報告は,既存の音楽の書き起こし技術を開発することを目的としている。
また、マルチチャンネル自動音楽書き起こしの概念も導入する。
論文 参考訳(メタデータ) (2021-07-23T14:07:40Z) - MusicBERT: Symbolic Music Understanding with Large-Scale Pre-Training [97.91071692716406]
シンボリック・ミュージックの理解(シンボリック・ミュージックの理解)とは、シンボリック・データから音楽を理解することを指す。
MusicBERTは、音楽理解のための大規模な事前訓練モデルである。
論文 参考訳(メタデータ) (2021-06-10T10:13:05Z) - Compositional Explanations of Neurons [52.71742655312625]
本稿では, 合成論理的概念を同定し, 深部表現におけるニューロンの説明手順について述べる。
本稿では,視覚と自然言語処理のモデルにおける解釈可能性に関するいくつかの疑問に答えるために,この手順を用いる。
論文 参考訳(メタデータ) (2020-06-24T20:37:05Z) - Non-linear Neurons with Human-like Apical Dendrite Activations [81.18416067005538]
XOR論理関数を100%精度で学習し, 標準的なニューロンに後続のアピーカルデンドライト活性化(ADA)が認められた。
コンピュータビジョン,信号処理,自然言語処理の6つのベンチマークデータセットについて実験を行った。
論文 参考訳(メタデータ) (2020-02-02T21:09:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。