論文の概要: Towards Lexical Analysis of Dog Vocalizations via Online Videos
- arxiv url: http://arxiv.org/abs/2309.13086v1
- Date: Thu, 21 Sep 2023 23:53:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-26 22:25:13.135263
- Title: Towards Lexical Analysis of Dog Vocalizations via Online Videos
- Title(参考訳): オンラインビデオによる犬声の語彙分析に向けて
- Authors: Yufei Wang, Chunhao Zhang, Jieyi Huang, Mengyue Wu, Kenny Zhu
- Abstract要約: 本研究は, 犬声のセマンティクスに関するデータ駆動調査を行い, 異なる音種と一貫したセマンティクスを関連づけることにより, 犬声のセマンティクスについて検討した。
そこで我々はまず,シバイヌの音の新たなデータセットと,YouTubeから収集した位置情報や活動などのコンテキスト情報を提示する。
犬の発声とそれに対応する位置と活動の条件付き確率の分析から, 犬音の意味的意味に関する過去の研究の裏付けとなる証拠が発見された。
- 参考スコア(独自算出の注目度): 19.422796780268605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deciphering the semantics of animal language has been a grand challenge. This
study presents a data-driven investigation into the semantics of dog
vocalizations via correlating different sound types with consistent semantics.
We first present a new dataset of Shiba Inu sounds, along with contextual
information such as location and activity, collected from YouTube with a
well-constructed pipeline. The framework is also applicable to other animal
species. Based on the analysis of conditioned probability between dog
vocalizations and corresponding location and activity, we discover supporting
evidence for previous heuristic research on the semantic meaning of various dog
sounds. For instance, growls can signify interactions. Furthermore, our study
yields new insights that existing word types can be subdivided into
finer-grained subtypes and minimal semantic unit for Shiba Inu is word-related.
For example, whimper can be subdivided into two types, attention-seeking and
discomfort.
- Abstract(参考訳): 動物言語のセマンティクスを解読することは大きな課題だった。
本研究では,犬声発声のセマンティクスについて,一貫したセマンティクスと異なる音型を関連付けてデータ駆動による検討を行う。
そこで我々はまず,よく構築されたパイプラインでYouTubeから収集した,芝犬音の新しいデータセットと,位置や活動などのコンテキスト情報を紹介する。
この枠組みは他の動物種にも適用できる。
犬の発声とそれに対応する位置と活動の条件付き確率の分析から,犬音の意味に関する過去のヒューリスティックな研究の裏付けとなる証拠を発見した。
例えば、グロールは相互作用を表わすことができる。
さらに,本研究では,既存の単語型を細粒度サブタイプに分割し,シバイヌの最小意味単位が単語関連であることを示す。
例えば、気まぐれは注意力と不快感の2つのタイプに分けられる。
関連論文リスト
- Feature Representations for Automatic Meerkat Vocalization Classification [15.642602544201308]
本稿では,自動メエルカット発声解析のための特徴表現について検討する。
2つのデータセットを対象としたコールタイプ分類研究により、人間の音声処理のために開発された特徴抽出法が、自動メエルカット呼分析に効果的に活用できることが明らかになった。
論文 参考訳(メタデータ) (2024-08-27T10:51:51Z) - Towards a Universal Method for Meaningful Signal Detection [0.0]
人間の発話と特定の動物の発声は、ある発話が伝達する内容を解読できるため、意味のある内容を伝えることができることが知られている。
本稿では,信号が意味を持つかどうかを判断するための代替手法として,信号自体を解析し,伝達された意味とは無関係であることを示す。
論文 参考訳(メタデータ) (2024-07-28T15:45:08Z) - Towards Dog Bark Decoding: Leveraging Human Speech Processing for Automated Bark Classification [23.974783158267428]
犬の樹皮分類課題に対処するために,人間の音声で事前訓練した自己教師付き音声表現モデルの利用について検討する。
音声埋め込み表現の使用は、より単純な分類基準よりも大幅に改善されることを示す。
また、大規模人間の音声音響学で事前訓練されたモデルでは、いくつかのタスクでさらなる性能向上が期待できる。
論文 参考訳(メタデータ) (2024-04-29T14:41:59Z) - Phonetic and Lexical Discovery of a Canine Language using HuBERT [40.578021131708155]
本稿では,犬の発声における潜在的なコミュニケーションパターンについて検討し,従来の言語分析障壁を超越する。
本稿では,HuBERTを用いた自己教師型アプローチを提案し,音素ラベルの正確な分類を可能にした。
我々は,ユーザのアップロードした犬の音声に語彙内に存在する音素n-gramを強調表示するWebベースの犬声分類ラベリングシステムを開発した。
論文 参考訳(メタデータ) (2024-02-25T04:35:45Z) - Does My Dog ''Speak'' Like Me? The Acoustic Correlation between Pet Dogs
and Their Human Owners [19.422796780268605]
本稿では,犬声の表情と人間の言語環境との相関性について予備的検討を行った。
われわれはまず、シバイヌの犬の声のデータセットをYouTubeから公開し、7500曲のクリーンなサウンドクリップを提供している。
分類課題と顕著な因子分析により,2つの言語環境における声道の音響的差異が顕著であることがわかった。
論文 参考訳(メタデータ) (2023-09-21T23:49:21Z) - Do Orcas Have Semantic Language? Machine Learning to Predict Orca
Behaviors Using Partially Labeled Vocalization Data [50.02992288349178]
機械学習が発声から振舞いを予測できるかどうかを検討する。
私たちはMcMurdo Sound orcasの最近の録音で作業しています。
最近の機械学習技術と慎重に組み合わせることで、96.4%の分類精度が得られる。
論文 参考訳(メタデータ) (2023-01-28T06:04:22Z) - CLAMP: Prompt-based Contrastive Learning for Connecting Language and
Animal Pose [70.59906971581192]
本稿では,言語とAniMal Poseを効果的に接続するための,新しいプロンプトベースのコントラスト学習手法を提案する。
CLAMPは、ネットワークトレーニング中にテキストプロンプトを動物のキーポイントに適応させることでギャップを埋めようとしている。
実験結果から, 教師付き, 少数ショット, ゼロショット設定下での最先端性能が得られた。
論文 参考訳(メタデータ) (2022-06-23T14:51:42Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Cetacean Translation Initiative: a roadmap to deciphering the
communication of sperm whales [97.41394631426678]
最近の研究では、非ヒト種における音響コミュニケーションを分析するための機械学習ツールの約束を示した。
マッコウクジラの大量生物音響データの収集と処理に必要な重要な要素について概説する。
開発された技術能力は、非人間コミュニケーションと動物行動研究を研究する幅広いコミュニティにおいて、クロス応用と進歩をもたらす可能性が高い。
論文 参考訳(メタデータ) (2021-04-17T18:39:22Z) - SPLAT: Speech-Language Joint Pre-Training for Spoken Language
Understanding [61.02342238771685]
音声理解には、入力音響信号を解析してその言語内容を理解し、予測するモデルが必要である。
大規模無注釈音声やテキストからリッチな表現を学習するために,様々な事前学習手法が提案されている。
音声と言語モジュールを協調的に事前学習するための,新しい半教師付き学習フレームワークであるSPLATを提案する。
論文 参考訳(メタデータ) (2020-10-05T19:29:49Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。