論文の概要: PETS-SWINF: A regression method that considers images with metadata
based Neural Network for pawpularity prediction on 2021 Kaggle Competition
"PetFinder.my"
- arxiv url: http://arxiv.org/abs/2201.06061v1
- Date: Sun, 16 Jan 2022 14:54:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-19 13:30:57.675850
- Title: PETS-SWINF: A regression method that considers images with metadata
based Neural Network for pawpularity prediction on 2021 Kaggle Competition
"PetFinder.my"
- Title(参考訳): PETS-SWINF:2021年カグルコンペティション「PetFinder.my」におけるPawpularity予測のためのメタデータベースニューラルネットワークを用いた画像の回帰手法
- Authors: Yizheng Wang, Yinghua Liu
- Abstract要約: 本稿では,画像のメタデータを考慮したPETS-SWINFという画像回帰モデルを提案する。
実験結果から,提案モデルにおけるRMSE損失は17.71876,17.76449であった。
トップボードのスコアは3545チーム中15位(金メダル)で、現在「PetFinder.my」で2021年のカグル大会に出場している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Millions of stray animals suffer on the streets or are euthanized in shelters
every day around the world. In order to better adopt stray animals, scoring the
pawpularity (cuteness) of stray animals is very important, but evaluating the
pawpularity of animals is a very labor-intensive thing. Consequently, there has
been an urgent surge of interest to develop an algorithm that scores
pawpularity of animals. However, the dataset in Kaggle not only has images, but
also metadata describing images. Most methods basically focus on the most
advanced image regression methods in recent years, but there is no good method
to deal with the metadata of images. To address the above challenges, the paper
proposes an image regression model called PETS-SWINF that considers metadata of
the images. Our results based on a dataset of Kaggle competition,
"PetFinder.my", show that PETS-SWINF has an advantage over only based images
models. Our results shows that the RMSE loss of the proposed model on the test
dataset is 17.71876 but 17.76449 without metadata. The advantage of the
proposed method is that PETS-SWINF can consider both low-order and high-order
features of metadata, and adaptively adjust the weights of the image model and
the metadata model. The performance is promising as our leadboard score is
ranked 15 out of 3545 teams (Gold medal) currently for 2021 Kaggle competition
on the challenge "PetFinder.my".
- Abstract(参考訳): 何百万もの野良動物が路上で苦しむか、世界中に毎日避難所で感染している。
野良動物をよりよく採用するためには、野良動物の尾状度(切断性)を評価することが非常に重要であるが、動物の尾状度を評価することは非常に労働集約的である。
その結果,動物の耳障り性を評価するアルゴリズムの開発が急激な関心を集めている。
しかし、Kaggleのデータセットには画像だけでなく、画像を記述するメタデータもある。
たいていの手法は、近年では最も高度な画像回帰法にフォーカスしているが、画像のメタデータを扱う良い方法はない。
上記の課題に対処するため,画像のメタデータを考慮したPETS-SWINFという画像回帰モデルを提案する。
PetFinder.my" というKaggleのコンペティションのデータセットから得られた結果から,PETS-SWINF が画像モデルのみに対して優位であることが分かる。
実験結果から,提案モデルにおけるRMSEの損失は17.71876,17.76449であった。
提案手法の利点は,PETS-SWINFがメタデータの低次特徴と高次特徴の両方を考慮し,画像モデルとメタデータモデルの重みを適応的に調整できることである。
トップボードスコアは3545チーム中15位(金メダル)で、現在"PetFinder.my"というチャレンジで2021年のKaggleコンペティションに出場している。
関連論文リスト
- Watch out Venomous Snake Species: A Solution to SnakeCLEF2023 [27.7177597421459]
SnakeCLEF2023コンペティションは、ヘビ種識別のための高度なアルゴリズムの開発を目的としている。
本稿では,画像とメタデータの両方を活用する手法を提案する。
本手法は,F1と他の指標を組み合わせて,F1の91.31%のスコアを得る。
論文 参考訳(メタデータ) (2023-07-19T04:59:58Z) - LostPaw: Finding Lost Pets using a Contrastive Learning-based
Transformer with Visual Input [0.5156484100374059]
本研究では,ペットのイメージを正確に識別できるコントラストニューラルネットワークモデルを提案する。
このモデルは、犬画像の大規模なデータセットに基づいて訓練され、3倍のクロスバリデーションによって評価された。
我々の研究結果は、失われたペットを見つけるためのツールとして、コントラストニューラルネットワークモデルが約束されていることを示唆している。
論文 参考訳(メタデータ) (2023-04-28T11:23:44Z) - AIM 2022 Challenge on Instagram Filter Removal: Methods and Results [66.98814754338841]
本稿では,Instagramフィルタ除去におけるAIM 2022チャレンジの方法と結果を紹介する。
この課題の主な目的は、コンテンツを保存する際に適用されたフィルタの影響を緩和する、現実的で視覚的に可視な画像を作ることである。
ベースラインとしてこのタスクに関する2つの先行研究があり、チャレンジの最終段階では合計9つのチームが競い合っています。
論文 参考訳(メタデータ) (2022-10-17T12:21:59Z) - Inverse Image Frequency for Long-tailed Image Recognition [59.40098825416675]
Inverse Image Frequency (IIF) と呼ばれる新しいデバイアス法を提案する。
IIFは畳み込みニューラルネットワークの分類層におけるロジットの乗法的マージン調整変換である。
我々の実験では、IIFは長い尾のベンチマークにおいて、最先端の技術を超越していることが示されている。
論文 参考訳(メタデータ) (2022-09-11T13:31:43Z) - Prior-Aware Synthetic Data to the Rescue: Animal Pose Estimation with
Very Limited Real Data [18.06492246414256]
そこで本研究では,対象動物からの実際の画像のみを必要とする四足歩行におけるポーズ推定のためのデータ効率のよい戦略を提案する。
ImageNetのような一般的な画像データセットに事前トレーニングされた重み付きバックボーンネットワークを微調整することで、ターゲット動物のポーズデータに対する高い需要を軽減できることが確認された。
そこで我々はPASynと呼ばれる先行認識型合成動物データ生成パイプラインを導入し,ロバストポーズ推定に不可欠な動物のポーズデータを増やした。
論文 参考訳(メタデータ) (2022-08-30T01:17:50Z) - Bugs in the Data: How ImageNet Misrepresents Biodiversity [98.98950914663813]
ImageNet-1k検証セットで野生動物を表す269のクラスから13450の画像を解析した。
多くのクラスが未定義あるいは重複しており、画像の12%が誤ってラベル付けされていることがわかった。
また,ImageNet-1kに含まれる野生生物関連ラベルと画像の両方が,地理的,文化的に有意な偏見を呈していることがわかった。
論文 参考訳(メタデータ) (2022-08-24T17:55:48Z) - Portuguese Man-of-War Image Classification with Convolutional Neural
Networks [58.720142291102135]
ポルトガルマン・オブ・ウォー(ポルトガル語: Man-of-war、PMW)は、長い触手を持つゼラチン質の生物である。
本稿では,InstagramのソーシャルメディアからPMW画像を認識するための畳み込みニューラルネットワークの利用について報告する。
論文 参考訳(メタデータ) (2022-07-04T03:06:45Z) - BARC: Learning to Regress 3D Dog Shape from Images by Exploiting Breed
Information [66.77206206569802]
私たちのゴールは、1枚の画像から犬の3D形状とポーズを復元することです。
近年の研究では、画像から手足のスケールパラメータを追加してSMAL動物モデルを直接回帰する研究が提案されている。
我々の手法はBARC(Breed-Augmented Regression using Classification)と呼ばれ、いくつかの重要な方法で先行作業を越えています。
この研究は、a-prioriの遺伝子類似性に関する情報が、3Dトレーニングデータの欠如を補うのに役立つことを示している。
論文 参考訳(メタデータ) (2022-03-29T13:16:06Z) - Towards Fine-grained Image Classification with Generative Adversarial
Networks and Facial Landmark Detection [0.0]
GANベースのデータ拡張を使用して、余分なデータセットインスタンスを生成します。
近年の視覚変換器 (ViT) モデルを用いて, きめ細かい画像分類の精度を評価し, 評価を行った。
論文 参考訳(メタデータ) (2021-08-28T06:32:42Z) - Improving and Simplifying Pattern Exploiting Training [81.77863825517511]
Pattern Exploiting Training (PET)は、数発学習にパターンを利用する最近のアプローチである。
本稿では,未ラベルデータのないショットラーニングに焦点をあて,ADAPETを導入する。
ADAPETは、タスク固有のラベルなしデータなしでSuperGLUE上のPETより優れています。
論文 参考訳(メタデータ) (2021-03-22T15:52:45Z) - Who Left the Dogs Out? 3D Animal Reconstruction with Expectation
Maximization in the Loop [25.40930904714051]
モノクラーインターネット画像から犬の3Dポーズと形状を復元する,エンドツーエンドの自動手法を提案する。
パラメータ推定の正則化を支援するために,従来の作業よりも形状よりもよりリッチな事前学習を行う。
我々は、Stanford Dogデータセット、20,580犬の画像の'in the wild'データセットで結果を実証した。
論文 参考訳(メタデータ) (2020-07-21T21:52:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。