論文の概要: Player Re-Identification Using Body Part Appearences
- arxiv url: http://arxiv.org/abs/2310.14469v1
- Date: Mon, 23 Oct 2023 00:52:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 23:30:55.508396
- Title: Player Re-Identification Using Body Part Appearences
- Title(参考訳): 身体部分外観を用いたプレイヤー再同定
- Authors: Mahesh Bhosale, Abhishek Kumar, David Doermann
- Abstract要約: サッカー選手の再識別のための身体部分の外観を学習するニューラルネットワークアーキテクチャを提案する。
我々のモデルはネットワークをトレーニングするために SoccerNet-V3 の再識別データセットにいかなる部分アノテーションも必要としない。
我々は,OsNetやInceptionNetといった最先端モデルよりも優れていることを示すことによって,モデルの有効性を示す。
- 参考スコア(独自算出の注目度): 5.9969431417128405
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a neural network architecture that learns body part appearances
for soccer player re-identification. Our model consists of a two-stream network
(one stream for appearance map extraction and the other for body part map
extraction) and a bilinear-pooling layer that generates and spatially pools the
body part map. Each local feature of the body part map is obtained by a
bilinear mapping of the corresponding local appearance and body part
descriptors. Our novel representation yields a robust image-matching feature
map, which results from combining the local similarities of the relevant body
parts with the weighted appearance similarity. Our model does not require any
part annotation on the SoccerNet-V3 re-identification dataset to train the
network. Instead, we use a sub-network of an existing pose estimation network
(OpenPose) to initialize the part substream and then train the entire network
to minimize the triplet loss. The appearance stream is pre-trained on the
ImageNet dataset, and the part stream is trained from scratch for the
SoccerNet-V3 dataset. We demonstrate the validity of our model by showing that
it outperforms state-of-the-art models such as OsNet and InceptionNet.
- Abstract(参考訳): サッカー選手の再識別のための身体部分の外観を学習するニューラルネットワークアーキテクチャを提案する。
本モデルは,2ストリームネットワーク(外観マップ抽出用ストリームと身体部分マップ抽出用ストリーム)と,身体部分マップを空間的にプールするバイリニアプール層で構成されている。
体部マップの各局所的特徴は、対応する局所的外観と体部記述子の双線型写像によって得られる。
提案手法では, 画像マッチング特徴マップが頑健であり, 関連部位の局所的類似度と重み付けされた外観類似度を組み合わせて得られる。
我々のモデルはネットワークをトレーニングするために SoccerNet-V3 の再識別データセットにいかなる部分アノテーションも必要としない。
代わりに、既存のポーズ推定ネットワーク(openpose)のサブネットワークを使用して、部分サブストリームを初期化し、ネットワーク全体をトレーニングして三重項損失を最小限にします。
外観ストリームはImageNetデータセットで事前トレーニングされ、その部分ストリームは SoccerNet-V3データセットのスクラッチからトレーニングされる。
我々は,OsNetやInceptionNetといった最先端モデルよりも優れていることを示すことによって,モデルの有効性を示す。
関連論文リスト
- SCAResNet: A ResNet Variant Optimized for Tiny Object Detection in Transmission and Distribution Towers [0.42028553027796633]
従来のディープラーニングベースのオブジェクト検出ネットワークは、データ前処理の段階でイメージをリサイズし、特徴マップの均一なサイズとスケールを達成する。
本研究では,複数の表現部分空間からコンテキスト情報を抽出し学習するために,位置対応型マルチヘッドCriss-Cross Imageryを導入する。
このアプローチにより、大きさやスケールの異なる画像が一様次元の特徴写像を生成でき、特徴写像の伝搬に利用できる。
論文 参考訳(メタデータ) (2024-04-05T15:48:36Z) - SODAWideNet -- Salient Object Detection with an Attention augmented Wide
Encoder Decoder network without ImageNet pre-training [3.66237529322911]
我々は、ImageNet事前トレーニングなしで、Salient Object Detectionを直接訓練したスクラッチからニューラルネットワークを開発することを検討する。
本稿では,Salient Object Detection のためのエンコーダデコーダ型ネットワーク SODAWideNet を提案する。
SODAWideNet-S (3.03M) と SODAWideNet (9.03M) の2つの変種は、5つのデータセット上の最先端モデルと競合する性能を達成する。
論文 参考訳(メタデータ) (2023-11-08T16:53:44Z) - CA$^2$T-Net: Category-Agnostic 3D Articulation Transfer from Single
Image [41.70960551470232]
本稿では,物体の単一画像から静止状態(非有声)3Dモデルへ動きを伝達するニューラルネットワーク手法を提案する。
我々のネットワークは、入力画像に表示される調音を再現するために、オブジェクトのポーズ、部分分割、および対応する動きパラメータを予測することを学習する。
論文 参考訳(メタデータ) (2023-01-05T18:57:12Z) - Single-view 3D Mesh Reconstruction for Seen and Unseen Categories [69.29406107513621]
シングルビュー3Dメッシュ再構成は、シングルビューRGB画像から3D形状を復元することを目的とした、基本的なコンピュータビジョンタスクである。
本稿では,一視点3Dメッシュ再構成に取り組み,未知のカテゴリのモデル一般化について検討する。
我々は、再構築におけるカテゴリ境界を断ち切るために、エンドツーエンドの2段階ネットワークであるGenMeshを提案する。
論文 参考訳(メタデータ) (2022-08-04T14:13:35Z) - Vision Transformer for NeRF-Based View Synthesis from a Single Input
Image [49.956005709863355]
本稿では,グローバルな特徴と局所的な特徴を両立させ,表現力のある3D表現を実現することを提案する。
新たなビューを合成するために,学習した3次元表現に条件付き多層パーセプトロン(MLP)ネットワークを訓練し,ボリュームレンダリングを行う。
提案手法は,1つの入力画像のみから新しいビューを描画し,複数のオブジェクトカテゴリを1つのモデルで一般化することができる。
論文 参考訳(メタデータ) (2022-07-12T17:52:04Z) - Learning to Segment Human Body Parts with Synthetically Trained Deep
Convolutional Networks [58.0240970093372]
本稿では,合成データのみを用いて学習した深部畳み込みニューラルネットワークに基づく人体部分分割のための新しい枠組みを提案する。
提案手法は,人体部品の実際の注釈付きデータを用いてモデルを訓練することなく,最先端の結果が得られる。
論文 参考訳(メタデータ) (2021-02-02T12:26:50Z) - D$^2$IM-Net: Learning Detail Disentangled Implicit Fields from Single
Images [6.121310352120004]
本稿では,入力画像から幾何学的詳細を復元する最初の1視点3次元再構成ネットワークを提案する。
私たちの重要なアイデアは、ネットワークを訓練して、2つの機能からなる詳細に区切られた再構築を学ぶことです。
論文 参考訳(メタデータ) (2020-12-11T21:42:52Z) - Refinement of Predicted Missing Parts Enhance Point Cloud Completion [62.997667081978825]
点雲完了は、部分的な観測から3次元形状の点集合表現を用いて完全な幾何学を予測するタスクである。
従来のアプローチでは、不完全点集合によって供給されるエンコーダ・デコーダモデルにより、点雲全体を直接推定するニューラルネットワークが提案されていた。
本稿では、欠落した幾何を計算し、既知の入力と予測点クラウドを融合することに焦点を当てたエンドツーエンドニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-10-08T22:01:23Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z) - Learning 3D Human Shape and Pose from Dense Body Parts [117.46290013548533]
本研究では,3次元の人体形状を学習し,身体部分の密接な対応からポーズをとるために,分解・集約ネットワーク(DaNet)を提案する。
ローカルストリームからのメッセージは集約され、回転ベースのポーズの堅牢な予測が強化される。
提案手法は,Human3.6M,UP3D,COCO,3DPWを含む屋内および実世界のデータセットで検証される。
論文 参考訳(メタデータ) (2019-12-31T15:09:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。