論文の概要: Joint Skeletal and Semantic Embedding Loss for Micro-gesture
Classification
- arxiv url: http://arxiv.org/abs/2307.10624v1
- Date: Thu, 20 Jul 2023 06:44:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-21 14:29:36.107766
- Title: Joint Skeletal and Semantic Embedding Loss for Micro-gesture
Classification
- Title(参考訳): マイクロジェスチャ分類における関節骨格およびセマンティクス埋め込み損失
- Authors: Kun Li, Dan Guo, Guoliang Chen, Xinge Peng, and Meng Wang
- Abstract要約: 動作分類性能を向上させるために骨格とセマンティック埋め込み損失を組み込んだ3D-CNNを用いたマイクロ位置認識ネットワークを提案する。
私たちは、トップ1の正確さで2位を1.10%上回る微身長分類チャレンジで1位にランクインした。
- 参考スコア(独自算出の注目度): 22.39508716880036
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we briefly introduce the solution of our team HFUT-VUT for the
Micros-gesture Classification in the MiGA challenge at IJCAI 2023. The
micro-gesture classification task aims at recognizing the action category of a
given video based on the skeleton data. For this task, we propose a
3D-CNNs-based micro-gesture recognition network, which incorporates a skeletal
and semantic embedding loss to improve action classification performance.
Finally, we rank 1st in the Micro-gesture Classification Challenge, surpassing
the second-place team in terms of Top-1 accuracy by 1.10%.
- Abstract(参考訳): 本稿では,IJCAI 2023におけるMiGAチャレンジにおけるマイクロスゲクチュア分類のためのチームHFUT-VUTのソリューションについて紹介する。
マイクロジェスチャー分類タスクは、骨格データに基づいて、所定のビデオのアクションカテゴリを認識することを目的としている。
そこで本研究では,3D-CNNを用いたマイクロ位置認識ネットワークを提案する。
最後に,トップ1の精度で第2位を1.10%上回って,マイクロジェスチャ分類チャレンジで1位にランクインした。
関連論文リスト
- Prototype Learning for Micro-gesture Classification [47.92089840320192]
我々は,IJCAI 2024におけるMiGAチャレンジにおいて,マイクロ位置分類のためのHFUT-VUTの開発したソリューションを紹介した。
マイクロジェスチャー分類タスクのタスクは、より微細で微妙な身体の動きに焦点を当てたビデオクリップのカテゴリを認識することである。
我々は、MG特徴の識別能力を向上させるために、2つの革新的なモジュール、すなわち、クロスモーダル融合モジュールと原型精製モジュールを利用する。
論文 参考訳(メタデータ) (2024-08-06T10:56:53Z) - AlignZeg: Mitigating Objective Misalignment for Zero-shot Semantic Segmentation [123.88875931128342]
ゼロショット視覚認識の性能を損なう深刻な問題は、客観的なミスアライメントと呼ばれる。
セグメンテーションパイプラインを包括的に改善したAlignZegという新しいアーキテクチャを提案する。
実験によると、AlignZegはゼロショットセマンティックセマンティックセグメンテーションを著しく強化している。
論文 参考訳(メタデータ) (2024-04-08T16:51:33Z) - Automated Detection of Myopic Maculopathy in MMAC 2023: Achievements in
Classification, Segmentation, and Spherical Equivalent Prediction [6.993091116816899]
筋萎縮性黄斑変性は、病理性近視症患者の視力喪失の主要な原因である。
早期発見と即時治療は、筋萎縮性黄斑症による視力障害の予防に不可欠である。
これがMMAC(Myopic Maculopathy Analysis Challenge)の焦点であった。
論文 参考訳(メタデータ) (2024-01-08T00:26:21Z) - CIM: Class-Irrelevant Mapping for Few-Shot Classification [58.02773394658623]
FSC(Few-shot Classification)は近年のホットな問題の一つである。
事前訓練されたFEMを評価する方法は、FSCコミュニティにおいて最も重要な焦点である。
CIM(Class-Irrelevant Mapping)と呼ばれるシンプルなフレキシブルな手法を提案する。
論文 参考訳(メタデータ) (2021-09-07T03:26:24Z) - 1st Place Solution to ICDAR 2021 RRC-ICTEXT End-to-end Text Spotting and
Aesthetic Assessment on Integrated Circuit [17.471330378900657]
本論文では,ICDAR 2021ロバストリーディングチャレンジ-集積回路テキストスポッティングと審美評価への提案手法を提案する。
テキストスポッティングタスクでは、統合回路上で文字を検出し、yolov5検出モデルに基づいて分類する。
審美評価タスクには,各キャラクタの審美クラスを識別するために,3つの分類枝を追加する。
論文 参考訳(メタデータ) (2021-04-08T06:52:49Z) - Group Collaborative Learning for Co-Salient Object Detection [152.67721740487937]
協調物体をリアルタイムで検出できる新しいグループ協調学習フレームワーク(GCoNet)を提案する(16ms)。
CoCA、CoSOD3k、Cosal2015の3つの挑戦的なベンチマークに関する大規模な実験は、我々の単純なGCoNetが10の最先端モデルより優れ、新しい最先端モデルを達成することを実証している。
論文 参考訳(メタデータ) (2021-03-15T13:16:03Z) - A Two-Stage Approach to Device-Robust Acoustic Scene Classification [63.98724740606457]
デバイスロバスト性を改善するために,完全畳み込みニューラルネットワーク(CNN)に基づく2段階システムを提案する。
以上の結果から,提案したASCシステムにより,開発環境における最先端の精度が得られた。
クラスアクティベーションマッピングを用いたニューラルサリエンシ解析により、モデルによって学習されたパターンに関する新たな洞察が得られる。
論文 参考訳(メタデータ) (2020-11-03T03:27:18Z) - Multi-class segmentation under severe class imbalance: A case study in
roof damage assessment [2.5962674918633697]
頭上画像からのルーフ損傷分類とセグメンテーションは、ユニークな課題である。
この作業では、強いクラス不均衡によって生じる課題に対処することを選択します。
この問題の緩和を目的とした4つの異なる手法を提案する。
論文 参考訳(メタデータ) (2020-10-14T15:08:54Z) - Device-Robust Acoustic Scene Classification Based on Two-Stage
Categorization and Data Augmentation [63.98724740606457]
我々は,GT,USTC,Tencent,UKEの4つのグループからなる共同で,DCASE 2020 Challengeの第1タスク - 音響シーン分類(ASC)に取り組む。
タスク1aは、複数の(実とシミュレートされた)デバイスで記録されたオーディオ信号のASCを10種類の微細なクラスにフォーカスする。
Task 1bは、低複雑さのソリューションを使用して、データを3つの上位クラスに分類することに関心がある。
論文 参考訳(メタデータ) (2020-07-16T15:07:14Z) - Joint Liver Lesion Segmentation and Classification via Transfer Learning [2.055949720959582]
伝達学習と共同学習アプローチは畳み込みニューラルネットワーク(CNN)の性能向上に広く利用されている
ターゲットデータセットが通常非常に小さい医療画像アプリケーションでは、転送学習は特徴学習を改善する一方、共同学習はネットワークの一般化と堅牢性を改善する効果を示す。
単純なジョイント・フレームワークは一般的に使われているマルチタスク・アーキテクチャ(Y-Net)よりも優れており、分類精度が10%向上したのに対し、Y-Netは3%向上した。
論文 参考訳(メタデータ) (2020-04-26T11:06:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。