論文の概要: chatter: a Python library for applying information theory and AI/ML models to animal communication
- arxiv url: http://arxiv.org/abs/2512.17935v1
- Date: Thu, 11 Dec 2025 01:23:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-29 00:37:57.068616
- Title: chatter: a Python library for applying information theory and AI/ML models to animal communication
- Title(参考訳): chatter: 動物コミュニケーションに情報理論とAI/MLモデルを適用するPythonライブラリ
- Authors: Mason Youngblood,
- Abstract要約: chatterは、連続的な潜伏空間における動物のコミュニケーションを分析するための新しいPythonライブラリである。
分類学的には無知であり、鳥類、コウモリ、クジラ、霊長類の発声で試験されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The study of animal communication often involves categorizing units into types (e.g. syllables in songbirds, or notes in humpback whales). While this approach is useful in many cases, it necessarily flattens the complexity and nuance present in real communication systems. chatter is a new Python library for analyzing animal communication in continuous latent space using information theory and modern machine learning techniques. It is taxonomically agnostic, and has been tested with the vocalizations of birds, bats, whales, and primates. By leveraging a variety of different architectures, including variational autoencoders and vision transformers, chatter represents vocal sequences as trajectories in high-dimensional latent space, bypassing the need for manual or automatic categorization of units. The library provides an end-to-end workflow -- from preprocessing and segmentation to model training and feature extraction -- that enables researchers to quantify the complexity, predictability, similarity, and novelty of vocal sequences.
- Abstract(参考訳): 動物コミュニケーションの研究は、しばしば単位をタイプ(例えば、鳴鳥の音節、ハチクジラの音節)に分類する。
このアプローチは多くのケースで有用であるが、実際の通信システムに存在する複雑さとニュアンスをフラットにする。
chatterは、情報理論と最新の機械学習技術を使用して、継続的な潜伏空間における動物のコミュニケーションを分析するための新しいPythonライブラリである。
分類学的には無知であり、鳥類、コウモリ、クジラ、霊長類の発声で試験されている。
可変オートエンコーダやヴィジュアルトランスフォーマーなど、さまざまなアーキテクチャを活用することで、チャッターは声列を高次元ラテント空間におけるトラジェクトリとして表現し、手動やユニットの自動分類の必要性を回避できる。
このライブラリは、前処理やセグメンテーションからモデルトレーニング、特徴抽出まで、エンドツーエンドのワークフローを提供する。これにより、研究者は、ボーカルシーケンスの複雑さ、予測可能性、類似性、新規性を定量化できる。
関連論文リスト
- Beyond Words: Interjection Classification for Improved Human-Computer Interaction [40.386408975769136]
我々は、干渉分類のために収集された干渉信号のデータセットを提示し、公開する。
性能向上のために,テンポやピッチ変換などの手法を用いてトレーニングデータセットを増強する。
データセットは、拡張パイプライン、ベースラインモデル、評価スクリプトのためのPythonライブラリである。
論文 参考訳(メタデータ) (2025-09-03T10:08:33Z) - An Exploratory Framework for Future SETI Applications: Detecting Generative Reactivity via Language Models [0.0]
我々は、地球外信号の復号化を前提とせず、入力が生成系における言語行動を引き起こすかどうかを評価する。
音声入力は,ヒトの発声,ハンプバッククジラの発声,Phyloscopus trochilus Birdong,アルゴリズムによる白色雑音の4種類を検討した。
その結果,クジラと鳥の発声は白色雑音よりもSIPスコアが高く,ヒトの発声は中程度の反応しか起こらなかった。
論文 参考訳(メタデータ) (2025-06-03T10:46:57Z) - Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価する。
3つのニューラルアーキテクチャに対して、チョムスキー階層の様々な言語について結果を提供する。
我々の貢献は、将来の研究において、言語認識の主張を理論的に健全に検証するのに役立つだろう。
論文 参考訳(メタデータ) (2024-11-11T16:33:25Z) - Multi Modal Information Fusion of Acoustic and Linguistic Data for Decoding Dairy Cow Vocalizations in Animal Welfare Assessment [0.0]
本研究では,マルチモーダルデータ融合技術を用いて乳牛の接触呼をデコードすることを目的とする。
本研究では,自然言語処理モデルを用いて,牛の発声音声の音声記録を書式に転写する。
発声は、苦痛や覚醒に関連する高頻度通話と、満足感や落ち着きに関連する低頻度通話に分類した。
論文 参考訳(メタデータ) (2024-11-01T09:48:30Z) - Feature Representations for Automatic Meerkat Vocalization Classification [15.642602544201308]
本稿では,自動メエルカット発声解析のための特徴表現について検討する。
2つのデータセットを対象としたコールタイプ分類研究により、人間の音声処理のために開発された特徴抽出法が、自動メエルカット呼分析に効果的に活用できることが明らかになった。
論文 参考訳(メタデータ) (2024-08-27T10:51:51Z) - WhaleNet: a Novel Deep Learning Architecture for Marine Mammals Vocalizations on Watkins Marine Mammal Sound Database [49.1574468325115]
textbfWhaleNet (Wavelet Highly Adaptive Learning Ensemble Network) は海洋哺乳動物の発声を分類するための高度な深層アンサンブルアーキテクチャである。
既存のアーキテクチャよりも8-10%の精度で分類精度を向上し、分類精度は9,7.61%である。
論文 参考訳(メタデータ) (2024-02-20T11:36:23Z) - Dictionary Learning Improves Patch-Free Circuit Discovery in Mechanistic
Interpretability: A Case Study on Othello-GPT [59.245414547751636]
本稿では,アクティベーションパッチに代わる回路発見フレームワークを提案する。
当社のフレームワークはアウト・オブ・ディストリビューション(out-of-distribution)に悩まされており、複雑さの観点からより効率的であることが証明されています。
我々はOthelloという名前の合成タスクで訓練された小さなトランスフォーマーを掘り下げ、その内部に人間に理解可能な微細な回路がいくつかある。
論文 参考訳(メタデータ) (2024-02-19T15:04:53Z) - Preliminary study on using vector quantization latent spaces for TTS/VC
systems with consistent performance [55.10864476206503]
本稿では,潜在言語埋め込みをモデル化するための量子化ベクトルの利用について検討する。
トレーニングにおいて、潜伏空間上の異なるポリシーを強制することにより、潜伏言語埋め込みを得ることができる。
実験の結果,ベクトル量子化法で構築した音声クローニングシステムは,知覚的評価の点でわずかに劣化していることがわかった。
論文 参考訳(メタデータ) (2021-06-25T07:51:35Z) - Cetacean Translation Initiative: a roadmap to deciphering the
communication of sperm whales [97.41394631426678]
最近の研究では、非ヒト種における音響コミュニケーションを分析するための機械学習ツールの約束を示した。
マッコウクジラの大量生物音響データの収集と処理に必要な重要な要素について概説する。
開発された技術能力は、非人間コミュニケーションと動物行動研究を研究する幅広いコミュニティにおいて、クロス応用と進歩をもたらす可能性が高い。
論文 参考訳(メタデータ) (2021-04-17T18:39:22Z) - Category-Learning with Context-Augmented Autoencoder [63.05016513788047]
実世界のデータの解釈可能な非冗長表現を見つけることは、機械学習の鍵となる問題の一つである。
本稿では,オートエンコーダのトレーニングにデータ拡張を利用する新しい手法を提案する。
このような方法で変分オートエンコーダを訓練し、補助ネットワークによって変換結果を予測できるようにする。
論文 参考訳(メタデータ) (2020-10-10T14:04:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。