論文の概要: Looking into the Unknown: Exploring Action Discovery for Segmentation of Known and Unknown Actions
- arxiv url: http://arxiv.org/abs/2508.05529v1
- Date: Thu, 07 Aug 2025 16:00:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 18:59:39.948811
- Title: Looking into the Unknown: Exploring Action Discovery for Segmentation of Known and Unknown Actions
- Title(参考訳): 未知と未知の行動のセグメンテーションのための行動発見の探索
- Authors: Federico Spurio, Emad Bahrami, Olga Zatsarynna, Yazan Abu Farha, Gianpiero Francesca, Juergen Gall,
- Abstract要約: 私たちは、データセットであいまいなアクションを定義し、注釈を付けるという課題に対処する、新しいセットアップであるAction Discoveryを紹介します。
この設定では、既知のアクションと呼ばれるアクションのサブセットだけがトレーニングデータに注釈付けされ、他の未知のアクションはラベル付けされていない。
このシナリオは神経科学のような分野において特に関係があり、よく定義された行動は、しばしば見過ごされる微妙な、または頻繁な行動と共存する。
- 参考スコア(独自算出の注目度): 16.42937388046283
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce Action Discovery, a novel setup within Temporal Action Segmentation that addresses the challenge of defining and annotating ambiguous actions and incomplete annotations in partially labeled datasets. In this setup, only a subset of actions - referred to as known actions - is annotated in the training data, while other unknown actions remain unlabeled. This scenario is particularly relevant in domains like neuroscience, where well-defined behaviors (e.g., walking, eating) coexist with subtle or infrequent actions that are often overlooked, as well as in applications where datasets are inherently partially annotated due to ambiguous or missing labels. To address this problem, we propose a two-step approach that leverages the known annotations to guide both the temporal and semantic granularity of unknown action segments. First, we introduce the Granularity-Guided Segmentation Module (GGSM), which identifies temporal intervals for both known and unknown actions by mimicking the granularity of annotated actions. Second, we propose the Unknown Action Segment Assignment (UASA), which identifies semantically meaningful classes within the unknown actions, based on learned embedding similarities. We systematically explore the proposed setting of Action Discovery on three challenging datasets - Breakfast, 50Salads, and Desktop Assembly - demonstrating that our method considerably improves upon existing baselines.
- Abstract(参考訳): 我々は、時間的アクションセグメンテーション(Temporal Action Segmentation)内の新しいセットアップであるAction Discoveryを紹介し、部分的にラベル付けされたデータセットであいまいなアクションや不完全なアノテーションを定義し、注釈付けするという課題に対処する。
この設定では、既知のアクションと呼ばれるアクションのサブセットだけがトレーニングデータに注釈付けされ、他の未知のアクションはラベル付けされていない。
このシナリオは神経科学のような分野において特に関係があり、明確に定義された行動(例えば、歩く、食べるなど)は、しばしば見過ごされる微妙なまたは頻繁な行動と共存する。
この問題に対処するために、既知のアノテーションを利用して、未知のアクションセグメントの時間的および意味的な粒度をガイドする2段階のアプローチを提案する。
まず,アノテートされたアクションの粒度を模倣することにより,未知のアクションと未知のアクションの時間間隔を識別するグラニュラリティガイドセグメンテーションモジュール(GGSM)を導入する。
第2に、未知のアクション内で意味のあるクラスを識別する未知のアクションセグメンテーションアサインメント(UASA)について、学習された埋め込み類似性に基づいて提案する。
私たちは、Breakfast、50Salads、Desktop Assemblyという3つの挑戦的なデータセットに基づいて、提案されたAction Discoveryの設定を体系的に検討し、私たちのメソッドが既存のベースラインを大幅に改善することを示す。
関連論文リスト
- Proposal-based Temporal Action Localization with Point-level Supervision [29.98225940694062]
ポイントレベルの時間的行動ローカライゼーション(PTAL)は、未トリミングビデオにおけるアクションの認識とローカライズを目的としている。
そこで本研究では,フレキシブル期間のアクション提案を生成し,評価することで,アクションをローカライズする手法を提案する。
実験の結果,提案手法は最先端手法の競争力や性能に優れることがわかった。
論文 参考訳(メタデータ) (2023-10-09T08:27:05Z) - Weakly-Supervised Temporal Action Localization by Inferring Salient
Snippet-Feature [26.7937345622207]
弱教師付き時間的アクションローカライゼーションは、教師なしビデオ内のアクション領域を特定し、アクションカテゴリを同時に特定することを目的としている。
擬似ラベル生成は、この課題を解決するための有望な戦略であるが、現在の手法ではビデオの自然な時間構造を無視している。
そこで本研究では,有意なスニペット特徴を推定し,時間的動作の局所化を弱く制御する手法を提案する。
論文 参考訳(メタデータ) (2023-03-22T06:08:34Z) - Segmenting Known Objects and Unseen Unknowns without Prior Knowledge [86.46204148650328]
全体論的セグメンテーションは、目に見えない未知のカテゴリのオブジェクトを、それに関する事前の知識なしにインスタンスに識別し、分離することを目的としている。
U3HSでは、未知の領域を極めて不確実な領域として見つけ、対応するインスタンス認識の埋め込みを個々のオブジェクトにクラスタ化する。
MS、Cityscapes、Lost&Foundの公開データに関する実験は、U3HSの有効性を実証している。
論文 参考訳(メタデータ) (2022-09-12T16:59:36Z) - SegTAD: Precise Temporal Action Detection via Semantic Segmentation [65.01826091117746]
意味的セグメンテーションの新しい視点で時間的行動検出のタスクを定式化する。
TADの1次元特性により、粗粒度検出アノテーションを細粒度セマンティックセマンティックアノテーションに無償で変換できる。
1Dセマンティックセグメンテーションネットワーク(1D-SSN)と提案検出ネットワーク(PDN)からなるエンドツーエンドフレームワークSegTADを提案する。
論文 参考訳(メタデータ) (2022-03-03T06:52:13Z) - Few-Shot Fine-Grained Action Recognition via Bidirectional Attention and
Contrastive Meta-Learning [51.03781020616402]
現実世界のアプリケーションで特定のアクション理解の需要が高まっているため、きめ細かいアクション認識が注目を集めている。
そこで本研究では,各クラスに付与されるサンプル数だけを用いて,新規なきめ細かい動作を認識することを目的とした,数発のきめ細かな動作認識問題を提案する。
粒度の粗い動作では進展があったが、既存の数発の認識手法では、粒度の細かい動作を扱う2つの問題に遭遇する。
論文 参考訳(メタデータ) (2021-08-15T02:21:01Z) - Weakly Supervised Temporal Action Localization Through Learning Explicit
Subspaces for Action and Context [151.23835595907596]
ビデオレベルの監視のみの下で、アクションインスタンスの時間的開始と終了をローカライズする方法を学ぶ。
アクションとコンテキストそれぞれについて,2つの機能サブスペースを学習するフレームワークを提案する。
提案手法は3つのベンチマークで最先端のWS-TAL法より優れている。
論文 参考訳(メタデータ) (2021-03-30T08:26:53Z) - Sparse Semi-Supervised Action Recognition with Active Learning [10.558951653323286]
骨格に基づく行動認識の最先端の手法は、ラベルに依存して管理されている。
本稿では,骨格に基づく行動認識のための新しい手法であるSESARを提案する。
本研究の結果は, 単独骨格を用いた教師付きクラスタ識別と, スパースラベル標本に適用した場合のアクティブラーニング手法に優れていた。
論文 参考訳(メタデータ) (2020-12-03T07:48:31Z) - Intra- and Inter-Action Understanding via Temporal Action Parsing [118.32912239230272]
本研究では,スポーツビデオにサブアクションの手動アノテーションを付加した新しいデータセットを構築し,その上に時間的行動解析を行う。
スポーツ活動は通常、複数のサブアクションから構成されており、このような時間構造に対する意識は、行動認識に有益であることを示す。
また,時間的解析手法を多数検討し,そのラベルを知らずにトレーニングデータからサブアクションをマイニングできる改良手法を考案した。
論文 参考訳(メタデータ) (2020-05-20T17:45:18Z) - FineGym: A Hierarchical Video Dataset for Fine-grained Action
Understanding [118.32912239230272]
FineGymは体操ビデオの上に構築された新しいアクション認識データセットだ。
アクションレベルとサブアクションレベルの両方で3レベルのセマンティック階層を持つテンポラリアノテーションを提供する。
この新たな粒度レベルは、行動認識に重大な課題をもたらす。
論文 参考訳(メタデータ) (2020-04-14T17:55:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。