論文の概要: Modeling Perceptual Loudness of Piano Tone: Theory and Applications
- arxiv url: http://arxiv.org/abs/2209.10674v1
- Date: Wed, 21 Sep 2022 21:57:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 14:54:31.407402
- Title: Modeling Perceptual Loudness of Piano Tone: Theory and Applications
- Title(参考訳): ピアノ音の知覚ラウドネスのモデル化:理論と応用
- Authors: Yang Qu, Yutian Qin, Lecheng Chao, Hangkai Qian, Ziyu Wang, Gus Xia
- Abstract要約: 本論文では,ピアノ音のモデル化による自然な音高知覚の理論と応用について検討する。
この理論をピアノ制御伝達に適用し、2つの異なるピアノのMIDI速度を調整する。
実験により,我々の理論的ラウドネスモデリングとそれに対応する性能制御伝達アルゴリズムの両方がベースラインを著しく上回ることがわかった。
- 参考スコア(独自算出の注目度): 5.332554289408091
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The relationship between perceptual loudness and physical attributes of sound
is an important subject in both computer music and psychoacoustics. Early
studies of "equal-loudness contour" can trace back to the 1920s and the
measured loudness with respect to intensity and frequency has been revised many
times since then. However, most studies merely focus on synthesized sound, and
the induced theories on natural tones with complex timbre have rarely been
justified. To this end, we investigate both theory and applications of
natural-tone loudness perception in this paper via modeling piano tone. The
theory part contains: 1) an accurate measurement of piano-tone equal-loudness
contour of pitches, and 2) a machine-learning model capable of inferring
loudness purely based on spectral features trained on human subject
measurements. As for the application, we apply our theory to piano control
transfer, in which we adjust the MIDI velocities on two different player pianos
(in different acoustic environments) to achieve the same perceptual effect.
Experiments show that both our theoretical loudness modeling and the
corresponding performance control transfer algorithm significantly outperform
their baselines.
- Abstract(参考訳): 聴覚と音の物理的特性の関係は、コンピュータ音楽と精神音響学の両方において重要である。
等度ラウドネス輪郭」の初期の研究は1920年代までさかのぼり、それ以来、強度と周波数に関する測定されたラウドネスは何度も改訂されてきた。
しかし、ほとんどの研究は合成音のみに焦点を当てており、複雑な音色を持つ自然音に関する誘導理論はほとんど正当化されていない。
そこで本研究では,ピアノ音のモデル化による自然な音高知覚の理論と応用について検討する。
理論部は以下の通りである。
1)ピッチのピアノ音等ラウドネスパターンの高精度測定と,
2)人体測定に基づいて訓練されたスペクトル特徴に基づいて純粋に音質を推定できる機械学習モデル。
そこで本研究では,2つの異なる演奏者ピアノのmidi速度を(異なる音響環境において)調整し,同じ知覚効果を達成するための理論をピアノ制御伝達に適用する。
実験により,我々の理論的ラウドネスモデリングとそれに対応する性能制御伝達アルゴリズムの両方がベースラインを著しく上回ることがわかった。
関連論文リスト
- Sine, Transient, Noise Neural Modeling of Piano Notes [0.0]
3つのサブモジュールはピアノ録音からコンポーネントを学び、ハーモニック、トランジェント、ノイズ信号を生成する。
特異点から、三弦の異なる鍵と畳み込みに基づくネットワークとの結合をエミュレートする。
その結果、モデルがターゲットの部分分布と一致し、スペクトルの上部のエネルギーがより多くの課題をもたらすことを予測した。
論文 参考訳(メタデータ) (2024-09-10T13:48:18Z) - A Theory-Based Explainable Deep Learning Architecture for Music Emotion [5.463499090813422]
本稿では,音楽に対する感情応答を予測するための理論ベースで説明可能な深層学習畳み込みニューラルネットワーク(CNN)を開発した。
我々は、音響物理から周波数調和構造を利用する新しいCNNフィルタを設計し、音楽的特徴の知覚に影響を及ぼす。
本稿では,デジタル広告を応用したモデルの有用性について解説する。
論文 参考訳(メタデータ) (2024-08-13T16:01:27Z) - DITTO: Diffusion Inference-Time T-Optimization for Music Generation [49.90109850026932]
Diffusion Inference-Time T-Optimization (DITTO) は、事前訓練されたテキストから音楽への拡散モデルを推論時に制御するためのフレームワークである。
我々は、インペイント、アウトペイント、ループ化、強度、メロディ、音楽構造制御など、驚くほど幅広い音楽生成応用を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:10:10Z) - Physics-Driven Diffusion Models for Impact Sound Synthesis from Videos [78.49864987061689]
従来の衝撃音合成法では、音を表現・合成できる物理パラメータのセットを得るために物理シミュレーションを用いていた。
既存のビデオ駆動ディープラーニングベースのアプローチは、視覚コンテンツと衝撃音の間の弱い対応を捉えることしかできなかった。
サイレントビデオクリップに高忠実度衝撃音を合成できる物理駆動拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-03-29T17:59:53Z) - Learning Interpretable Low-dimensional Representation via Physical
Symmetry [8.606028974758479]
現代物理学からインスピレーションを得て、物理対称性を時系列データの潜在空間に対する自己整合制約として利用する。
物理的対称性は、自己教師方式で非競合モノフォニック・オーディオから線形ピッチファクターを学習することにつながることを示す。
同じ手法がコンピュータビジョンに適用でき、ラベルなしで動く単純な物体のビデオから3Dカルテシア空間を学習することができる。
論文 参考訳(メタデータ) (2023-02-05T21:48:42Z) - SpecGrad: Diffusion Probabilistic Model based Neural Vocoder with
Adaptive Noise Spectral Shaping [51.698273019061645]
SpecGradは拡散雑音に適応し、その時間変化スペクトル包絡が条件付き対数メル分光器に近づく。
時間周波数領域で処理され、計算コストは従来のDDPMベースのニューラルボコーダとほぼ同じである。
論文 参考訳(メタデータ) (2022-03-31T02:08:27Z) - A Perceptual Measure for Evaluating the Resynthesis of Automatic Music
Transcriptions [10.957528713294874]
本研究では,室内音響や楽器などの環境要因が変化した場合の演奏の知覚に焦点を当てた。
我々は「演出」の概念と「芸術的意図」を表現する「解釈」の概念を区別することを提案する。
論文 参考訳(メタデータ) (2022-02-24T18:09:22Z) - DiffSinger: Diffusion Acoustic Model for Singing Voice Synthesis [53.19363127760314]
DiffSingerは、音楽スコアで調整されたメログラムにノイズを反復的に変換するパラメータ化されたマルコフチェーンです。
中国の歌唱データセットで行った評価は、DiffSingerが最先端のSVSワークを顕著な差で上回っていることを示している。
論文 参考訳(メタデータ) (2021-05-06T05:21:42Z) - Vector-Quantized Timbre Representation [53.828476137089325]
本稿では, スペクトル特性の近似分解を生成的特徴の集合で学習することにより, 個々の音色をより柔軟に合成することを目的とする。
音量分布の量子化表現を学習するために、大音量から切り離された離散潜在空間を持つオートエンコーダを導入する。
オーケストラ楽器と歌唱音声間の音声の翻訳結果と、ボーカルの模倣音から楽器への変換結果について詳述する。
論文 参考訳(メタデータ) (2020-07-13T12:35:45Z) - Generative Modelling for Controllable Audio Synthesis of Expressive
Piano Performance [6.531546527140474]
ガウス混合変分オートエンコーダ(GM-VAE)に基づく可制御型ニューラルオーディオシンセサイザー
そこで本研究では,モデルが音声に対してきめ細かな形態変化を適用可能であることを実証する。
論文 参考訳(メタデータ) (2020-06-16T12:54:41Z) - Audio Impairment Recognition Using a Correlation-Based Feature
Representation [85.08880949780894]
本稿では,特徴対の相関に基づく手作り特徴の新しい表現を提案する。
実験段階において,コンパクトな特徴次元と計算速度の向上の観点から,優れた性能を示す。
論文 参考訳(メタデータ) (2020-03-22T13:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。