論文の概要: CatFLW: Cat Facial Landmarks in the Wild Dataset
- arxiv url: http://arxiv.org/abs/2305.04232v1
- Date: Sun, 7 May 2023 09:39:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-09 16:50:18.814358
- Title: CatFLW: Cat Facial Landmarks in the Wild Dataset
- Title(参考訳): CatFLW:野生のデータセットにある猫の顔のランドマーク
- Authors: George Martvel and Nareed Farhat and Ilan Shimshoni and Anna Zamansky
- Abstract要約: 本稿では,野生の猫顔ランドマーク (Cat Facial Landmarks in the Wild, CatFLW) というデータセットを提案する。
2016年のネコの顔は環境や環境によって異なり、48の顔のランドマークがアノテートされている。
私たちの知る限りでは、このデータセットは猫の顔のランドマークの量が最も多い。
- 参考スコア(独自算出の注目度): 3.3022383854506843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Animal affective computing is a quickly growing field of research, where only
recently first efforts to go beyond animal tracking into recognizing their
internal states, such as pain and emotions, have emerged. In most mammals,
facial expressions are an important channel for communicating information about
these states. However, unlike the human domain, there is an acute lack of
datasets that make automation of facial analysis of animals feasible.
This paper aims to fill this gap by presenting a dataset called Cat Facial
Landmarks in the Wild (CatFLW) which contains 2016 images of cat faces in
different environments and conditions, annotated with 48 facial landmarks
specifically chosen for their relationship with underlying musculature, and
relevance to cat-specific facial Action Units (CatFACS). To the best of our
knowledge, this dataset has the largest amount of cat facial landmarks
available.
In addition, we describe a semi-supervised (human-in-the-loop) method of
annotating images with landmarks, used for creating this dataset, which
significantly reduces the annotation time and could be used for creating
similar datasets for other animals.
The dataset is available on request.
- Abstract(参考訳): 動物情動コンピューティングは急速に成長している研究分野であり、痛みや感情などの内的状態の認識に動物追跡以上の取り組みが最近始まったばかりである。
ほとんどの哺乳類では、表情はこれらの状態に関する情報を伝える重要な経路である。
しかし、人間の領域とは異なり、動物の顔分析の自動化を可能にするデータセットが急性欠如している。
このギャップを埋めるために,猫の顔の異なる環境や環境における2016年の画像を含むCat Facial Landmarks in the Wild (CatFLW) というデータセットを提示し,下層の筋肉との関係,および猫特有の顔アクションユニット(CatFACS)との関連性について,48の顔のランドマークを注釈した。
私たちの知る限りでは、このデータセットは猫の顔のランドマークの量が最も多い。
さらに,画像にランドマークを付与する半教師付き(ループ内)手法について述べる。このデータセットの作成には,アノテーションの時間を大幅に短縮し,他の動物に対して類似したデータセットを作成するのに使用できる。
データセットはリクエストで利用可能だ。
関連論文リスト
- PetFace: A Large-Scale Dataset and Benchmark for Animal Identification [2.3020018305241337]
動物顔識別のための包括的リソースであるPetFaceデータセットを紹介する。
PetFaceには、13の動物科の257,484個体と、実験動物とペット動物の両方を含む319種の品種が含まれている。
我々は、見知らぬ個人に対する再識別や、見つからない個人に対する検証を含むベンチマークを提供する。
論文 参考訳(メタデータ) (2024-07-18T14:28:31Z) - DogFLW: Dog Facial Landmarks in the Wild Dataset [5.51724397504775]
犬3,274点の注釈付き画像を含む類似データセットを開発した。
我々のデータセットは、46の顔解剖に基づくランドマークのスキームに基づいている。
論文 参考訳(メタデータ) (2024-05-19T09:59:36Z) - AnimateZoo: Zero-shot Video Generation of Cross-Species Animation via Subject Alignment [64.02822911038848]
動物アニメーションを作成するため, ゼロショット拡散に基づくビデオジェネレータAnimateZooを提案する。
AnimateZooで使われる主要なテクニックは、2つのステップを含む被写体アライメントです。
我々のモデルは、正確な動き、一貫した外観、高忠実度フレームを特徴とする映像を生成することができる。
論文 参考訳(メタデータ) (2024-04-07T12:57:41Z) - OmniMotionGPT: Animal Motion Generation with Limited Data [70.35662376853163]
最初のテキストアニマルモーションデータセットであるAnimalML3Dを紹介した。
我々は,動物データに基づくヒトの動き生成ベースラインのトレーニング結果よりも定量的かつ質的に,高い多様性と忠実さで動物の動きを生成することができる。
論文 参考訳(メタデータ) (2023-11-30T07:14:00Z) - Multimodal Foundation Models for Zero-shot Animal Species Recognition in
Camera Trap Images [57.96659470133514]
モーションアクティベートカメラトラップは、世界中の野生生物を追跡・監視するための効率的なツールである。
教師付き学習技術は、そのような画像を分析するためにうまく展開されているが、そのような訓練には専門家のアノテーションが必要である。
コストのかかるラベル付きデータへの依存を減らすことは、人間の労働力を大幅に減らした大規模野生生物追跡ソリューションを開発する上で、大きな可能性を秘めている。
論文 参考訳(メタデータ) (2023-11-02T08:32:00Z) - Automated Detection of Cat Facial Landmarks [8.435125986009881]
猫の顔画像に境界ボックスと48個の顔のランドマークを付加した新しいデータセットを提出した。
本稿では、拡大エンセムベ法を用いて、ランドマーク検出畳み込みニューラルネットワークに基づくモデルを提案する。
本モデルは猫の顔に優れた性能を示し,ヒトの顔のランドマーク検出に一般化可能である。
論文 参考訳(メタデータ) (2023-10-15T10:44:36Z) - Multi-Domain Norm-referenced Encoding Enables Data Efficient Transfer
Learning of Facial Expression Recognition [62.997667081978825]
本稿では,表情認識における伝達学習のための生物学的メカニズムを提案する。
提案アーキテクチャでは,人間の脳が,頭部形状の異なる表情を自然に認識する方法について解説する。
本モデルでは, FERGデータセットの分類精度92.15%を極端に高いデータ効率で達成する。
論文 参考訳(メタデータ) (2023-04-05T09:06:30Z) - Multiface: A Dataset for Neural Face Rendering [108.44505415073579]
本研究では,新しいマルチビュー,高解像度のヒューマン・フェイス・データセットであるMultifaceを提案する。
顔のパフォーマンスの高解像度同期映像をキャプチャする大規模なマルチカメラ装置であるMugsyを紹介する。
Multifaceの目的は、学術コミュニティにおける高品質データへのアクセシビリティのギャップを埋め、VRテレプレゼンスの研究を可能にすることである。
論文 参考訳(メタデータ) (2022-07-22T17:55:39Z) - Deep Learning Models for Automated Classification of Dog Emotional
States from Facial Expressions [1.32383730641561]
近年のディープラーニング技術を用いて,犬の(肯定的な)期待と(否定的な)フラストレーションを分類した。
我々の知る限りでは、この研究はイヌの感情を自動分類するタスクに最初に取り組むものである。
論文 参考訳(メタデータ) (2022-06-11T21:37:38Z) - Animal Kingdom: A Large and Diverse Dataset for Animal Behavior
Understanding [4.606145900630665]
大規模で多様なデータセットであるAnimal Kingdomを作成し、複数の注釈付きタスクを提供します。
私たちのデータセットには、関連する動物行動セグメントをローカライズする50時間のアノテーション付きビデオが含まれています。
本研究では,未確認新種動物を用いた行動認識の一般的な特徴と特定の特徴を学習する協調行動認識(CARe)モデルを提案する。
論文 参考訳(メタデータ) (2022-04-18T02:05:15Z) - CapsField: Light Field-based Face and Expression Recognition in the Wild
using Capsule Routing [81.21490913108835]
本稿では,畳み込みニューラルネットワークに基づく新しい深層顔・表情認識ソリューションであるCapsFieldを提案する。
提案手法は,最先端技術と比較して,顔および表情認識タスクにおいて優れた性能を実現する。
論文 参考訳(メタデータ) (2021-01-10T09:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。