論文の概要: The Third Place Solution for CVPR2022 AVA Accessibility Vision and
Autonomy Challenge
- arxiv url: http://arxiv.org/abs/2206.13718v1
- Date: Tue, 28 Jun 2022 03:05:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-29 12:37:10.508202
- Title: The Third Place Solution for CVPR2022 AVA Accessibility Vision and
Autonomy Challenge
- Title(参考訳): CVPR2022 AVAアクセシビリティビジョンの第三位ソリューションと自律化への挑戦
- Authors: Bo Yan, Leilei Cao, Zhuang Li, Hongbin Wang
- Abstract要約: 本稿では,CVPR2022 AVA Challengeへの提出の技術的詳細を紹介する。
まず,本課題に対する適切なモデルとデータ拡張戦略の導入を支援するために,いくつかの実験を行った。
次に,性能向上のための効果的なトレーニング戦略を適用した。
- 参考スコア(独自算出の注目度): 12.37168905253371
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of AVA challenge is to provide vision-based benchmarks and methods
relevant to accessibility. In this paper, we introduce the technical details of
our submission to the CVPR2022 AVA Challenge. Firstly, we conducted some
experiments to help employ proper model and data augmentation strategy for this
task. Secondly, an effective training strategy was applied to improve the
performance. Thirdly, we integrated the results from two different segmentation
frameworks to improve the performance further. Experimental results demonstrate
that our approach can achieve a competitive result on the AVA test set.
Finally, our approach achieves 63.008\%AP@0.50:0.95 on the test set of CVPR2022
AVA Challenge.
- Abstract(参考訳): AVAチャレンジの目標は、アクセシビリティに関連するビジョンベースのベンチマークとメソッドを提供することだ。
本稿では,CVPR2022 AVA Challengeへの提出の技術的詳細を紹介する。
まず,本課題に適切なモデルとデータ拡張戦略を導入するための実験を行った。
次に,性能向上のための効果的なトレーニング戦略を適用した。
第3に、2つの異なるセグメンテーションフレームワークの結果を統合し、パフォーマンスをさらに改善しました。
実験の結果,本手法はavaテストセット上での競争結果を得ることができた。
最後に,CVPR2022 AVA Challengeのテストセットで63.008\%AP@0.50:0.95を達成する。
関連論文リスト
- Demonstrating the Efficacy of Kolmogorov-Arnold Networks in Vision Tasks [4.8951183832371]
Kolmogorov-Arnold Network (KAN) は多層投影(MLP)の代替として出現している。
本研究は,MNIST, CIFAR10, CIFAR100の複数試行を通して, 視覚タスクにおけるkanの有効性を実証した。
これらの結果から,kanはビジョンタスクに有意な可能性を秘めており,今後の評価においてさらなる改善が期待できると考えられる。
論文 参考訳(メタデータ) (2024-06-21T07:20:34Z) - Devil's Advocate: Anticipatory Reflection for LLM Agents [53.897557605550325]
我々のアプローチは、LLMエージェントに対して、与えられたタスクを管理可能なサブタスクに分解するように促す。
イントロスペクティブ・イントロスペクティブ・イントロスペクティブ・イントロスペクティブ(introspective intervention)を3回実施する。
潜在的な障害の予測と、アクション実行前の代替策。
サブタスクの目的とのポストアクションアライメントと、計画実行における最大限の努力を保証するための改善によるバックトラック。
論文 参考訳(メタデータ) (2024-05-25T19:20:15Z) - The Second Place Solution for ICCV2021 VIPriors Instance Segmentation
Challenge [6.087398773657721]
データ効率のよいコンピュータビジョンのためのビジュアルインダクティブプライオリティ(VIPriors)は、競合に対して、データ不足の環境でモデルをゼロからトレーニングするように求めている。
ICCV 2021 VIPriorsインスタンスセグメンテーションチャレンジの技術的詳細を紹介する。
ICCV 2021 VIPriors インスタンスセグメンテーションの試験セットで 40.2%AP@0.50:0.95 を達成することができる。
論文 参考訳(メタデータ) (2021-12-02T09:23:02Z) - "Knights": First Place Submission for VIPriors21 Action Recognition
Challenge at ICCV 2021 [39.990872080183884]
本稿では,Kineetics400ViPriorsの小さなサブセット上での動作認識タスクを解決するために,「夜」を提示する。
提案手法は,最先端の時間的コントラスト型自己教師型事前学習,ビデオトランスフォーマーモデル,光学フローのモダリティの3つの構成要素を有する。
論文 参考訳(メタデータ) (2021-10-14T22:47:31Z) - NTIRE 2021 Multi-modal Aerial View Object Classification Challenge [88.89190054948325]
CVPR の NTIRE 2021 ワークショップと共同で,MAVOC (Multi-modal Aerial View Object Classification) の最初の挑戦を紹介した。
この課題は、EOとSAR画像を用いた2つの異なるトラックで構成されている。
本コンペティションで提案した最上位の手法について検討し,その成果を目視テストセットで評価する。
論文 参考訳(メタデータ) (2021-07-02T16:55:08Z) - Two-Stream Consensus Network: Submission to HACS Challenge 2021
Weakly-Supervised Learning Track [78.64815984927425]
弱い監督による時間的行動ローカライゼーションの目標は、ビデオの興味ある動作を時間的に特定し、分類することである。
この課題では,2ストリームコンセンサスネットワーク(TSCN)を主要なフレームワークとして採用しています。
この課題では,本手法が今後の学術研究のベースラインとなることを期待して,第2位にランクインした。
論文 参考訳(メタデータ) (2021-06-21T03:36:36Z) - Efficient Self-supervised Vision Transformers for Representation
Learning [86.57557009109411]
疎密な自己意識を持つマルチステージアーキテクチャは、モデリングの複雑さを著しく低減できることを示す。
そこで本研究では,モデルがよりきめ細かな領域依存を捕捉できるような,領域マッチングの事前学習タスクを提案する。
この2つの手法を組み合わせることで,ImageNet線形プローブ評価において,EsViTは81.3%のトップ1を達成した。
論文 参考訳(メタデータ) (2021-06-17T19:57:33Z) - Relation Modeling in Spatio-Temporal Action Localization [25.09128518931016]
本稿では,CVPR 2021 における AVA-Kinetics Crossover Challenge of ActivityNet ワークショップの報告を行う。
提案手法は,関係時間的行動検出に複数種類の関係手法を用いており,大規模ビデオデータセットのエンドツーエンドトレーニングにおいて,複数の関係モデリングを統合するためのトレーニング戦略を採用している。
AVA-Kineticsのテストセットで40.67 mAPを達成した。
論文 参考訳(メタデータ) (2021-06-15T11:40:18Z) - Analysing Affective Behavior in the second ABAW2 Competition [70.86998050535944]
ABAW2 2021コンペティションは、IEEE FG 2020-コンペティションと共同で開催された最初の非常に成功したABAWコンペティションに続く第2回である。
論文 参考訳(メタデータ) (2021-06-14T11:30:19Z) - A Stronger Baseline for Ego-Centric Action Detection [38.934802199184354]
本稿では,CVPR2021ワークショップ主催のEPIC-KITCHENS-100コンペティションで使用した,エゴセントリックなビデオアクション検出手法について分析する。
我々の課題は、長い未トリミングビデオでアクションの開始時刻と終了時刻を特定し、アクションカテゴリを予測することである。
我々は、ショートデュレーションアクションに適応できる提案を生成するためにスライディングウインドウ戦略を採用する。
論文 参考訳(メタデータ) (2021-06-13T08:11:31Z) - Learning a Weakly-Supervised Video Actor-Action Segmentation Model with
a Wise Selection [97.98805233539633]
弱教師付きビデオアクターアクションセグメンテーション(VAAS)について検討する。
トレーニングサンプルのワイズ選択とモデル評価基準(WS2)を併用した汎用弱弱化フレームワークを提案する。
WS2は、弱い教師付きVOSとVAASタスクの両方で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2020-03-29T21:15:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。