論文の概要: Relating Human Perception of Musicality to Prediction in a Predictive
Coding Model
- arxiv url: http://arxiv.org/abs/2210.16587v1
- Date: Sat, 29 Oct 2022 12:20:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-01 19:04:25.950314
- Title: Relating Human Perception of Musicality to Prediction in a Predictive
Coding Model
- Title(参考訳): 予測符号化モデルにおける音楽の知覚と予測の関係
- Authors: Nikolas McNeal, Jennifer Huang, Aniekan Umoren, Shuqi Dai, Roger
Dannenberg, Richard Randall, Tai Sing Lee
- Abstract要約: 人間の音楽知覚をモデル化するための予測符号化にインスパイアされたニューラルネットワークの利用について検討する。
このネットワークは階層視覚野における反復的相互作用の計算神経科学理論に基づいて開発された。
このネットワークを用いて階層的な聴覚システムをモデル化し、ランダムなピッチ列の楽しさに関して、人間と同じような選択をするかどうかを検討する。
- 参考スコア(独自算出の注目度): 0.8062120534124607
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We explore the use of a neural network inspired by predictive coding for
modeling human music perception. This network was developed based on the
computational neuroscience theory of recurrent interactions in the hierarchical
visual cortex. When trained with video data using self-supervised learning, the
model manifests behaviors consistent with human visual illusions. Here, we
adapt this network to model the hierarchical auditory system and investigate
whether it will make similar choices to humans regarding the musicality of a
set of random pitch sequences. When the model is trained with a large corpus of
instrumental classical music and popular melodies rendered as mel spectrograms,
it exhibits greater prediction errors for random pitch sequences that are rated
less musical by human subjects. We found that the prediction error depends on
the amount of information regarding the subsequent note, the pitch interval,
and the temporal context. Our findings suggest that predictability is
correlated with human perception of musicality and that a predictive coding
neural network trained on music can be used to characterize the features and
motifs contributing to human perception of music.
- Abstract(参考訳): 人間の音楽知覚をモデル化するための予測符号化にインスパイアされたニューラルネットワークの利用について検討する。
このネットワークは階層視覚野における反復相互作用の計算神経科学理論に基づいて開発された。
自己教師付き学習を用いて映像データを訓練すると、モデルは人間の視覚錯覚と一致した行動を示す。
本稿では,このネットワークを用いて階層的聴覚系をモデル化し,ランダムピッチ系列の楽音性について人間にも同様の選択をするかどうかを検討する。
モデルが楽器のクラシック音楽とメロディの大規模なコーパスで訓練されると、人間の被験者による楽譜の低いランダムなピッチ列に対する予測誤差が大きくなる。
予測誤差は,その後の音符,ピッチ間隔,時間的文脈などの情報量に依存することがわかった。
以上の結果から,予測可能性と音楽知覚との関係が示唆され,音楽に訓練された予測符号化ニューラルネットワークを用いて,音楽知覚に寄与する特徴やモチーフを特徴付けることができる。
関連論文リスト
- Mode-conditioned music learning and composition: a spiking neural network inspired by neuroscience and psychology [5.2419221159594676]
そこで我々は,脳のメカニズムや心理的理論にインスパイアされたスパイクニューラルネットワークを提案し,音楽モードとキーを表現する。
我々の研究は、音楽を学び、生成するだけでなく、人間の認知と人工知能のギャップを埋めるシステムを作ることを目指している。
論文 参考訳(メタデータ) (2024-11-22T07:29:26Z) - A Survey of Music Generation in the Context of Interaction [3.6522809408725223]
機械学習は、メロディーとポリフォニックの両方の曲の作曲と生成に成功している。
これらのモデルのほとんどは、ライブインタラクションによる人間と機械の共創には適していない。
論文 参考訳(メタデータ) (2024-02-23T12:41:44Z) - Deep Generative Models of Music Expectation [2.900810893770134]
本稿では, 拡散モデルを用いて, 最新の深層確率生成モデルを用いて, 音楽入力シーケンスの近似確率を計算することを提案する。
従来の研究とは異なり、ディープニューラルネットワークによってパラメータ化されたこのような生成モデルは、トレーニングセット自体から直接、複雑な非線形特徴を学習することができる。
本研究では,事前学習した拡散モデルが,被測定対象の「ライキング」評価と負の二次的関係を示す音楽的前提値をもたらすことを示す。
論文 参考訳(メタデータ) (2023-10-05T12:25:39Z) - Comparision Of Adversarial And Non-Adversarial LSTM Music Generative
Models [2.569647910019739]
この研究は、MIDIデータに基づいて、リカレントニューラルネットワーク音楽作曲家の敵対的および非敵対的な訓練を実装し、比較する。
この評価は, 対人訓練がより審美的に楽しむ音楽を生み出すことを示唆している。
論文 参考訳(メタデータ) (2022-11-01T20:23:49Z) - Searching for the Essence of Adversarial Perturbations [73.96215665913797]
本稿では,ニューラルネットワークの誤予測の原因となる,人間の認識可能な情報を含む対人摂動について述べる。
この人間の認識可能な情報の概念は、敵の摂動に関連する重要な特徴を説明できる。
論文 参考訳(メタデータ) (2022-05-30T18:04:57Z) - Learning Theory of Mind via Dynamic Traits Attribution [59.9781556714202]
本稿では,過去のトラジェクトリからアクターの潜在特性ベクトルを生成するニューラルToMアーキテクチャを提案する。
この特性ベクトルは、予測ニューラルネットワークの高速重み付けスキームを介して予測機構を乗法的に変調する。
実験により,高速重量はエージェントの特性をモデル化し,マインドリーディング能力を向上させるために優れた誘導バイアスを与えることが示された。
論文 参考訳(メタデータ) (2022-04-17T11:21:18Z) - Tracing Back Music Emotion Predictions to Sound Sources and Intuitive
Perceptual Qualities [6.832341432995627]
音楽感情認識は,音楽情報検索研究において重要な課題である。
より良いモデルに向けた重要なステップの1つは、モデルが実際にデータから学んでいるものを理解することである。
本研究では,高レベルの感情予測に結びつくスペクトル画像セグメントを用いて,モデル予測の説明を導出する方法を示す。
論文 参考訳(メタデータ) (2021-06-14T22:49:19Z) - The Neural Coding Framework for Learning Generative Models [91.0357317238509]
本稿では,脳の予測処理理論に触発された新しい神経生成モデルを提案する。
同様に、私たちの生成モデルにおける人工ニューロンは、隣接するニューロンが何をするかを予測し、予測が現実にどの程度一致するかに基づいてパラメータを調整します。
論文 参考訳(メタデータ) (2020-12-07T01:20:38Z) - Score-informed Networks for Music Performance Assessment [64.12728872707446]
MPAモデルにスコア情報を組み込んだディープニューラルネットワークに基づく手法はまだ研究されていない。
スコアインフォームド性能評価が可能な3つのモデルを提案する。
論文 参考訳(メタデータ) (2020-08-01T07:46:24Z) - Noisy Agents: Self-supervised Exploration by Predicting Auditory Events [127.82594819117753]
本稿では, エージェントが行動の因果的影響を理解することを奨励する, 強化学習(Reinforcement Learning, RL)の本質的なモチベーションを提案する。
ニューラルネットワークを用いて聴覚事象を予測し、予測誤差を本質的な報奨として利用し、RL探索を誘導する。
Atariゲームの実験結果から、我々の新しい本質的な動機は、最先端のベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2020-07-27T17:59:08Z) - RL-Duet: Online Music Accompaniment Generation Using Deep Reinforcement
Learning [69.20460466735852]
本稿では,オンライン伴奏生成のための深層強化学習アルゴリズムを提案する。
提案アルゴリズムは人体に応答し,メロディック,ハーモニック,多種多様な機械部品を生成する。
論文 参考訳(メタデータ) (2020-02-08T03:53:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。