論文の概要: AI and Tempo Estimation: A Review
- arxiv url: http://arxiv.org/abs/2401.00209v1
- Date: Sat, 30 Dec 2023 11:42:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-03 18:31:53.748978
- Title: AI and Tempo Estimation: A Review
- Title(参考訳): AIとテンポの推定: レビュー
- Authors: Geoff Luck
- Abstract要約: テンポの音楽的創造性への中心的な重要性は、特定の感情を表現するためにどのように使われるかに見ることができる。
伝統的なテンポ推定法は、典型的には、音楽のリズム構造を反映する信号周期性を検出する。
人工知能(AI)は、音楽の創造性 - 音楽のテンポ - の重要な側面を大規模に見積もる、私たちの理解と能力を伝えるために利用されてきた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The author's goal in this paper is to explore how artificial intelligence
(AI) has been utilised to inform our understanding of and ability to estimate
at scale a critical aspect of musical creativity - musical tempo. The central
importance of tempo to musical creativity can be seen in how it is used to
express specific emotions (Eerola and Vuoskoski 2013), suggest particular
musical styles (Li and Chan 2011), influence perception of expression (Webster
and Weir 2005) and mediate the urge to move one's body in time to the music
(Burger et al. 2014). Traditional tempo estimation methods typically detect
signal periodicities that reflect the underlying rhythmic structure of the
music, often using some form of autocorrelation of the amplitude envelope
(Lartillot and Toiviainen 2007). Recently, AI-based methods utilising
convolutional or recurrent neural networks (CNNs, RNNs) on spectral
representations of the audio signal have enjoyed significant improvements in
accuracy (Aarabi and Peeters 2022). Common AI-based techniques include those
based on probability (e.g., Bayesian approaches, hidden Markov models (HMM)),
classification and statistical learning (e.g., support vector machines (SVM)),
and artificial neural networks (ANNs) (e.g., self-organising maps (SOMs), CNNs,
RNNs, deep learning (DL)). The aim here is to provide an overview of some of
the more common AI-based tempo estimation algorithms and to shine a light on
notable benefits and potential drawbacks of each. Limitations of AI in this
field in general are also considered, as is the capacity for such methods to
account for idiosyncrasies inherent in tempo perception, i.e., how well
AI-based approaches are able to think and act like humans.
- Abstract(参考訳): 本論文の著者の目標は,音楽創造性の重要な側面である音楽的テンポを大規模に見積もる上で,人工知能(ai)がいかに活用されているかを検討することである。
テンポと音楽の創造性の中心的な重要性は、特定の感情を表現するのにどのように使われているか(Eerola and Vuoskoski 2013)、特定の音楽スタイルを提案する(Li and Chan 2011)、表現の知覚に影響を与える(Webster and Weir 2005)、音楽に間に合うように体を動かすという衝動を仲介する(Burger et al. 2014)。
伝統的なテンポ推定法は、しばしば振幅エンベロープのある種の自己相関(Lartillot and Toiviainen 2007)を用いて、音楽のリズム構造を反映する信号周期性を検出する。
近年、音声信号のスペクトル表現に畳み込みニューラルネットワーク(CNN、RNN)を利用するAIベースの手法では、精度が大幅に向上している(アラビとピーター2022)。
一般的なAIベースの技術には、確率に基づくもの(ベイズ的アプローチ、隠れマルコフモデル(HMM))、分類と統計的学習(例えば、サポートベクトルマシン(SVM))、人工知能ニューラルネットワーク(ANN)(例えば、自己組織化マップ(SOM))、CNN、RNN、ディープラーニング(DL))などがある。
ここでの目的は、より一般的なAIベースのテンポ推定アルゴリズムの概要を提供し、それぞれの顕著なメリットと潜在的な欠点に光を当てることである。
この分野でのAIの限界もまた、テンポ知覚に固有の慣用性、すなわちAIベースのアプローチがいかに人間のように考え、振る舞うことができるかを説明する能力として考慮されている。
関連論文リスト
- A Joint Spectro-Temporal Relational Thinking Based Acoustic Modeling Framework [10.354955365036181]
リレーショナル思考は人間の音声理解において重要な役割を担っているが、人工音声認識システムではまだ活用されていない。
本稿では,スペクトル時間的関係思考に基づく音響モデリングフレームワークを提案する。
このフレームワーク上に構築されたモデルは、TIMITデータセットよりも7.82%の音素認識タスクを改善した最先端システムを上回っている。
論文 参考訳(メタデータ) (2024-09-17T05:45:33Z) - Converging Paradigms: The Synergy of Symbolic and Connectionist AI in LLM-Empowered Autonomous Agents [55.63497537202751]
コネクショニストと象徴的人工知能(AI)の収束を探求する記事
従来、コネクショナリストAIはニューラルネットワークにフォーカスし、シンボリックAIはシンボリック表現とロジックを強調していた。
大型言語モデル(LLM)の最近の進歩は、人間の言語をシンボルとして扱う際のコネクショナリストアーキテクチャの可能性を強調している。
論文 参考訳(メタデータ) (2024-07-11T14:00:53Z) - A challenge in A(G)I, cybernetics revived in the Ouroboros Model as one
algorithm for all thinking [0.0]
論文の目的は、現在の人工知能アプローチの長所と短所を明らかにすることである。
サイバネティックスとアナログ制御プロセスの側面を新たに取り入れることが提案されている。
論文 参考訳(メタデータ) (2024-03-07T07:39:54Z) - Brain-Inspired Computational Intelligence via Predictive Coding [89.6335791546526]
予測符号化(PC)は、マシンインテリジェンスタスクにおいて有望なパフォーマンスを示している。
PCは様々な脳領域で情報処理をモデル化することができ、認知制御やロボティクスで使用することができる。
論文 参考訳(メタデータ) (2023-08-15T16:37:16Z) - Neurosymbolic AI - Why, What, and How [9.551858963199987]
人間は知覚と認知の組み合わせを使って環境と相互作用する。
一方、機械認識はより複雑な計算を包含する。
本稿では,ニューロシンボリックAIの新たなパラダイムを紹介する。
論文 参考訳(メタデータ) (2023-05-01T13:27:22Z) - Neuro-Symbolic Learning of Answer Set Programs from Raw Data [54.56905063752427]
Neuro-Symbolic AIは、シンボリックテクニックの解釈可能性と、生データから学ぶ深層学習の能力を組み合わせることを目的としている。
本稿では,ニューラルネットワークを用いて生データから潜在概念を抽出するNSIL(Neuro-Symbolic Inductive Learner)を提案する。
NSILは表現力のある知識を学習し、計算的に複雑な問題を解き、精度とデータ効率の観点から最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-25T12:41:59Z) - Neurocompositional computing: From the Central Paradox of Cognition to a
new generation of AI systems [120.297940190903]
AIの最近の進歩は、限られた形態のニューロコンフォメーションコンピューティングの使用によってもたらされている。
ニューロコンポジションコンピューティングの新しい形式は、より堅牢で正確で理解しやすいAIシステムを生み出します。
論文 参考訳(メタデータ) (2022-05-02T18:00:10Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Abstract Spatial-Temporal Reasoning via Probabilistic Abduction and
Execution [97.50813120600026]
時空間推論は人工知能(AI)の課題である
最近の研究は、この種の抽象的推論タスクに焦点を当てている -- Raven's Progressive Matrices (RPM)
ニューロシンボリックな確率的アブダクションと実行学習者(PrAE)を提案する。
論文 参考訳(メタデータ) (2021-03-26T02:42:18Z) - Opportunities and Challenges in Explainable Artificial Intelligence
(XAI): A Survey [2.7086321720578623]
深層ニューラルネットワークのブラックボックスの性質は、ミッションクリティカルなアプリケーションでの利用に挑戦する。
XAIは、AI決定に関する高品質な解釈可能、直感的、人間に理解可能な説明を生成するためのツール、テクニック、アルゴリズムのセットを推進している。
論文 参考訳(メタデータ) (2020-06-16T02:58:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。