論文の概要: A Baseline Study and Benchmark for Few-Shot Open-Set Action Recognition with Feature Residual Discrimination
- arxiv url: http://arxiv.org/abs/2603.04125v1
- Date: Wed, 04 Mar 2026 14:43:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.350584
- Title: A Baseline Study and Benchmark for Few-Shot Open-Set Action Recognition with Feature Residual Discrimination
- Title(参考訳): 特徴的残差識別を用いたFew-Shotオープンセット行動認識のためのベースライン研究とベンチマーク
- Authors: Stefano Berti, Giulia Pasquale, Lorenzo Natale,
- Abstract要約: FS-AR(Few-temporal Action Recognition)は有望な結果を示しているが、実世界のオープンセットシナリオでは失敗するクローズドセットの仮定によって制限されることが多い。
これを解決するために,Residual Discriminator (FR-Disc) に基づく拡張を提案する。
我々のFR-Discは、クローズドセットの精度を損なうことなく、未知性を著しく向上させ、新しいF-AR拒絶機能を実現する。
- 参考スコア(独自算出の注目度): 5.348876409230946
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Few-Shot Action Recognition (FS-AR) has shown promising results but is often limited by a closed-set assumption that fails in real-world open-set scenarios. While Few-Shot Open-Set (FSOS) recognition is well-established for images, its extension to spatio-temporal video data remains underexplored. To address this, we propose an architectural extension based on a Feature-Residual Discriminator (FR-Disc), adapting previous work on skeletal data to the more complex video domain. Extensive experiments on five datasets demonstrate that while common open-set techniques provide only marginal gains, our FR-Disc significantly enhances unknown rejection capabilities without compromising closed-set accuracy, setting a new state-of-the-art for FSOS-AR. The project website, code, and benchmark are available at: https://hsp-iit.github.io/fsosar/.
- Abstract(参考訳): Few-Shot Action Recognition (FS-AR)は有望な結果を示しているが、実世界のオープンセットシナリオでは失敗するクローズドセットの仮定によって制限されることが多い。
Few-Shot Open-Set (FSOS) 認識は画像に対して十分に確立されているが、時空間ビデオデータへの拡張は未定である。
そこで,本稿では,より複雑なビデオ領域に骨格データに関する以前の研究を適応させる,FR-Disc(Feature-Residual Discriminator)に基づくアーキテクチャ拡張を提案する。
5つのデータセットに対する大規模な実験により、共通のオープンセット技術は限界ゲインしか提供しないが、我々のFR-Discは、クローズドセットの精度を損なうことなく未知の拒絶能力を著しく向上し、FSOS-ARのための新しい最先端技術を確立した。
プロジェクトのWebサイト、コード、ベンチマークは、https://hsp-iit.github.io/fsosar/.com/で公開されている。
関連論文リスト
- Knowledge-Informed Neural Network for Complex-Valued SAR Image Recognition [51.03674130115878]
本稿では,新しい「圧縮集約圧縮」アーキテクチャ上に構築された軽量なフレームワークであるKnowledge-Informed Neural Network(KINN)を紹介する。
KINNはパラメータ効率の認識における最先端を確立し、データスカースとアウト・オブ・ディストリビューションのシナリオにおいて例外的な一般化を提供する。
論文 参考訳(メタデータ) (2025-10-23T07:12:26Z) - Open-Set Facial Expression Recognition [42.62439125553367]
顔表情認識(FER)モデルは一般的に、7つの基本クラスを固定したデータセットで訓練される。
最近の研究では、基本的なものよりもはるかに多くの表現が存在することが指摘されている。
オープンセットFERタスクを初めて提案する。
論文 参考訳(メタデータ) (2024-01-23T05:57:50Z) - Exploring Diverse Representations for Open Set Recognition [51.39557024591446]
オープンセット認識(OSR)では、テスト中に未知のサンプルを拒絶しながら、クローズドセットに属するサンプルを分類する必要がある。
現在、生成モデルはOSRの差別モデルよりもよく機能している。
本稿では,多種多様な表現を識別的に学習するMulti-Expert Diverse Attention Fusion(MEDAF)を提案する。
論文 参考訳(メタデータ) (2024-01-12T11:40:22Z) - Navigating Open Set Scenarios for Skeleton-based Action Recognition [45.488649741347]
探索されていないオープンセット骨格に基づく行動認識(OS-SAR)課題に取り組む。
そこで本稿では, 骨格関節, 骨, 速度の相互アライメントを利用した距離に基づく相互モーダル法を提案する。
論文 参考訳(メタデータ) (2023-12-11T12:29:32Z) - Rethinking the Domain Gap in Near-infrared Face Recognition [65.7871950460781]
不均一顔認識(HFR)は、視覚領域(VIS)と近赤外領域(NIR)にまたがる複雑な顔画像マッチング作業を伴う。
HFRに関する既存の文献の多くは、ドメインギャップを主要な課題と認識し、それを入力レベルまたは機能レベルでブリッジする取り組みを指示している。
大規模同質なVISデータで事前トレーニングを行った場合、大規模ニューラルネットワークはより小さなニューラルネットワークとは異なり、HFRでは例外的なゼロショット性能を示す。
論文 参考訳(メタデータ) (2023-12-01T14:43:28Z) - LORD: Leveraging Open-Set Recognition with Unknown Data [10.200937444995944]
LORDは未知のデータを活用することでオープンセット認識を活用するためのフレームワークである。
我々は、背景データを利用した3つのモデルに依存しない訓練戦略を特定し、それらを確立された分類器に適用する。
論文 参考訳(メタデータ) (2023-08-24T06:12:41Z) - Progressive Open Space Expansion for Open-Set Model Attribution [19.985618498466042]
我々は,OSMA(Open-Set Model Attribution)という課題に焦点をあて,既知のモデルに画像を同時に属性付けし,未知のモデルからそれらを識別する。
既存のオープンセット認識(OSR)タスクと比較して、OSMAは既知のモデルと未知のモデルとの区別が視覚的に知覚できないトレースに限られているため、より難しい。
本稿では, 閉集合と同一のセマンティクスを維持しつつ, 異なる認識不能なトレースを埋め込んだオープンセットサンプルをシミュレートした, プログレッシブオープンスペース拡張(POSE)ソリューションを提案する。
論文 参考訳(メタデータ) (2023-03-13T05:53:11Z) - OpenAUC: Towards AUC-Oriented Open-Set Recognition [151.5072746015253]
従来の機械学習は、トレーニングとテストセットが同じラベル空間を共有するという密接な前提に従っている。
Open-Set Recognition (OSR) は、クローズセットサンプルとオープンセットサンプルの両方で正確な予測を行うことを目的としている。
これらの問題を解決するために,OpenAUCという新しいメトリクスを提案する。
論文 参考訳(メタデータ) (2022-10-22T08:54:15Z) - Open-Set Recognition: A Good Closed-Set Classifier is All You Need [146.6814176602689]
分類器が「ゼロ・オブ・ア・ア・ア・ベ」決定を行う能力は、閉集合クラスにおける精度と高い相関関係があることが示される。
この相関を利用して、閉セット精度を向上させることにより、クロスエントロピーOSR'ベースライン'の性能を向上させる。
また、セマンティックノベルティを検出するタスクをより尊重する新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2021-10-12T17:58:59Z) - OpenGAN: Open-Set Recognition via Open Data Generation [76.00714592984552]
実世界の機械学習システムは、トレーニングデータとは異なる新しいテストデータを分析する必要がある。
オープンセット識別のための概念的にエレガントな2つのアイデアは、1) オープンvs閉鎖二元判別器を識別的に学習し、2) GAN を用いてクローズドセットデータ分布を教師なし学習する。
OpenGANは、それぞれのアプローチの限界をいくつかの技術的な洞察と組み合わせて解決します。
論文 参考訳(メタデータ) (2021-04-07T06:19:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。