論文の概要: Cetacean Translation Initiative: a roadmap to deciphering the
communication of sperm whales
- arxiv url: http://arxiv.org/abs/2104.08614v1
- Date: Sat, 17 Apr 2021 18:39:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 14:46:08.488525
- Title: Cetacean Translation Initiative: a roadmap to deciphering the
communication of sperm whales
- Title(参考訳): cetacean translation initiative: a roadmap tociphering the communication of sperm whales
- Authors: Jacob Andreas, Ga\v{s}per Begu\v{s}, Michael M. Bronstein, Roee
Diamant, Denley Delaney, Shane Gero, Shafi Goldwasser, David F. Gruber, Sarah
de Haas, Peter Malkin, Roger Payne, Giovanni Petri, Daniela Rus, Pratyusha
Sharma, Dan Tchernov, Pernille T{\o}nnesen, Antonio Torralba, Daniel Vogt,
Robert J. Wood
- Abstract要約: 最近の研究では、非ヒト種における音響コミュニケーションを分析するための機械学習ツールの約束を示した。
マッコウクジラの大量生物音響データの収集と処理に必要な重要な要素について概説する。
開発された技術能力は、非人間コミュニケーションと動物行動研究を研究する幅広いコミュニティにおいて、クロス応用と進歩をもたらす可能性が高い。
- 参考スコア(独自算出の注目度): 97.41394631426678
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The past decade has witnessed a groundbreaking rise of machine learning for
human language analysis, with current methods capable of automatically
accurately recovering various aspects of syntax and semantics - including
sentence structure and grounded word meaning - from large data collections.
Recent research showed the promise of such tools for analyzing acoustic
communication in nonhuman species. We posit that machine learning will be the
cornerstone of future collection, processing, and analysis of multimodal
streams of data in animal communication studies, including bioacoustic,
behavioral, biological, and environmental data. Cetaceans are unique non-human
model species as they possess sophisticated acoustic communications, but
utilize a very different encoding system that evolved in an aquatic rather than
terrestrial medium. Sperm whales, in particular, with their highly-developed
neuroanatomical features, cognitive abilities, social structures, and discrete
click-based encoding make for an excellent starting point for advanced machine
learning tools that can be applied to other animals in the future. This paper
details a roadmap toward this goal based on currently existing technology and
multidisciplinary scientific community effort. We outline the key elements
required for the collection and processing of massive bioacoustic data of sperm
whales, detecting their basic communication units and language-like
higher-level structures, and validating these models through interactive
playback experiments. The technological capabilities developed by such an
undertaking are likely to yield cross-applications and advancements in broader
communities investigating non-human communication and animal behavioral
research.
- Abstract(参考訳): 過去10年間、人間の言語分析のための機械学習は画期的な隆盛を遂げており、現在の手法では、構文や意味論のさまざまな側面(文構造や接頭辞の意味など)を、大規模なデータコレクションから正確に復元することができる。
近年の研究では、非ヒト種における音響コミュニケーションの分析ツールが期待されている。
我々は, 生物音響, 行動, 生物学的, 環境データなど, 動物のコミュニケーション研究におけるマルチモーダルデータストリームの収集, 処理, 解析の基盤として, 機械学習が重要であると仮定する。
ケタカンは高度な音響通信を持つため、独特な非ヒトのモデル種であるが、地上の媒体ではなく水中で進化した全く異なるエンコーディングシステムを使用している。
特にスペルムクジラは、高度に発達した神経解剖学的特徴、認知能力、社会構造、離散的なクリックベースの符号化によって、将来他の動物にも応用できる高度な機械学習ツールの出発点となる。
本稿では,既存の技術と多分野の科学コミュニティの取り組みに基づいて,この目標に向けてのロードマップについて述べる。
マッコウクジラの大量生物音響データの収集と処理に必要な重要な要素を概説し,それらの基本コミュニケーションユニットと言語ライクな高レベル構造を検出し,インタラクティブな再生実験によりモデルを検証する。
このような事業によって開発された技術能力は、非人間コミュニケーションと動物行動研究を研究する幅広いコミュニティにおいて、クロス応用と進歩をもたらす可能性がある。
関連論文リスト
- Multi Modal Information Fusion of Acoustic and Linguistic Data for Decoding Dairy Cow Vocalizations in Animal Welfare Assessment [0.0]
本研究では,マルチモーダルデータ融合技術を用いて乳牛の接触呼をデコードすることを目的とする。
本研究では,自然言語処理モデルを用いて,牛の発声音声の音声記録を書式に転写する。
発声は、苦痛や覚醒に関連する高頻度通話と、満足感や落ち着きに関連する低頻度通話に分類した。
論文 参考訳(メタデータ) (2024-11-01T09:48:30Z) - Multimodal Fusion with LLMs for Engagement Prediction in Natural Conversation [70.52558242336988]
我々は,不関心や混乱の兆候を検出することを目的として,言語的および非言語的手がかりを精査することにより,ダイアディック的相互作用における係り合いを予測することに焦点を当てた。
本研究では,カジュアルなダイアディック会話に携わる34人の参加者を対象に,各会話の最後に自己報告されたエンゲージメント評価を行うデータセットを収集する。
大規模言語モデル(LLMs)を用いた新たな融合戦略を導入し,複数行動モダリティをマルチモーダル・トランスクリプトに統合する。
論文 参考訳(メタデータ) (2024-09-13T18:28:12Z) - Feature Representations for Automatic Meerkat Vocalization Classification [15.642602544201308]
本稿では,自動メエルカット発声解析のための特徴表現について検討する。
2つのデータセットを対象としたコールタイプ分類研究により、人間の音声処理のために開発された特徴抽出法が、自動メエルカット呼分析に効果的に活用できることが明らかになった。
論文 参考訳(メタデータ) (2024-08-27T10:51:51Z) - Unveiling the pressures underlying language learning and use in neural networks, large language models, and humans: Lessons from emergent machine-to-machine communication [5.371337604556311]
本稿では,ニューラルエージェントと人間の言語行動のミスマッチが解決された3症例について概説する。
我々は、コミュニケーションの成功、生産努力、学習可能性、その他の心理・社会言語学的要因といった、言語学習と台頭のための重要なプレッシャーを識別する。
論文 参考訳(メタデータ) (2024-03-21T14:33:34Z) - Language Evolution with Deep Learning [49.879239655532324]
計算モデリングは言語の出現の研究において重要な役割を担っている。
構造化言語の出現を誘発する可能性のある条件と学習プロセスをシミュレートすることを目的としている。
この章では、最近機械学習の分野に革命をもたらした別の種類の計算モデル、ディープ・ラーニング・モデルについて論じる。
論文 参考訳(メタデータ) (2024-03-18T16:52:54Z) - OmniMotionGPT: Animal Motion Generation with Limited Data [70.35662376853163]
最初のテキストアニマルモーションデータセットであるAnimalML3Dを紹介した。
我々は,動物データに基づくヒトの動き生成ベースラインのトレーニング結果よりも定量的かつ質的に,高い多様性と忠実さで動物の動きを生成することができる。
論文 参考訳(メタデータ) (2023-11-30T07:14:00Z) - Transferable Models for Bioacoustics with Human Language Supervision [0.0]
BioLingualは、対照的な言語-オーディオ事前学習に基づくバイオ音響学の新しいモデルである。
分類群にまたがる1000種以上の呼び出しを識別し、完全なバイオ音響タスクをゼロショットで実行し、自然のテキストクエリから動物の発声記録を検索する。
論文 参考訳(メタデータ) (2023-08-09T14:22:18Z) - Co-Located Human-Human Interaction Analysis using Nonverbal Cues: A
Survey [71.43956423427397]
本研究の目的は,非言語的キューと計算手法を同定し,効果的な性能を実現することである。
この調査は、最も広い範囲の社会現象と相互作用設定を巻き込むことによって、相手と異なる。
もっともよく使われる非言語キュー、計算方法、相互作用環境、センシングアプローチは、それぞれマイクとカメラを備えた3,4人で構成される会話活動、ベクターマシンのサポート、ミーティングである。
論文 参考訳(メタデータ) (2022-07-20T13:37:57Z) - Seeing biodiversity: perspectives in machine learning for wildlife
conservation [49.15793025634011]
機械学習は、野生生物種の理解、モニタリング能力、保存性を高めるために、この分析的な課題を満たすことができると我々は主張する。
本質的に、新しい機械学習アプローチとエコロジー分野の知識を組み合わせることで、動物生態学者は現代のセンサー技術が生み出すデータの豊富さを生かすことができる。
論文 参考訳(メタデータ) (2021-10-25T13:40:36Z) - Decoding EEG Brain Activity for Multi-Modal Natural Language Processing [9.35961671939495]
自然言語処理タスクを改善するために脳波脳活動データの可能性を体系的に分析する最初の大規模研究を行った。
脳波信号を周波数帯域にフィルタリングすることはブロードバンド信号よりも有益であることがわかった。
単語埋め込みタイプの範囲のために、EEGデータは二分および三分感情の分類を改善し、複数のベースラインを上回ります。
論文 参考訳(メタデータ) (2021-02-17T09:44:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。