論文の概要: NEVIS'22: A Stream of 100 Tasks Sampled from 30 Years of Computer Vision
Research
- arxiv url: http://arxiv.org/abs/2211.11747v2
- Date: Tue, 16 May 2023 22:15:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-18 20:35:37.487148
- Title: NEVIS'22: A Stream of 100 Tasks Sampled from 30 Years of Computer Vision
Research
- Title(参考訳): NEVIS'22:30年間のコンピュータビジョン研究から得られた100のタスクのストリーム
- Authors: Jorg Bornschein, Alexandre Galashov, Ross Hemsley, Amal Rannen-Triki,
Yutian Chen, Arslan Chaudhry, Xu Owen He, Arthur Douillard, Massimo Caccia,
Qixuang Feng, Jiajun Shen, Sylvestre-Alvise Rebuffi, Kitty Stacpoole, Diego
de las Casas, Will Hawkins, Angeliki Lazaridou, Yee Whye Teh, Andrei A. Rusu,
Razvan Pascanu and Marc'Aurelio Ranzato
- Abstract要約: 我々は,100以上の視覚的分類タスクのストリームからなるベンチマークであるNever-Ending VIsual-classification Stream (NEVIS'22)を紹介する。
分類に制限されているにもかかわらず、OCR、テクスチャ分析、シーン認識など、様々なタスクが生成される。
NEVIS'22は、タスクの規模と多様性のために、現在のシーケンシャルな学習アプローチに対して前例のない課題を提起している。
- 参考スコア(独自算出の注目度): 96.53307645791179
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A shared goal of several machine learning communities like continual
learning, meta-learning and transfer learning, is to design algorithms and
models that efficiently and robustly adapt to unseen tasks. An even more
ambitious goal is to build models that never stop adapting, and that become
increasingly more efficient through time by suitably transferring the accrued
knowledge. Beyond the study of the actual learning algorithm and model
architecture, there are several hurdles towards our quest to build such models,
such as the choice of learning protocol, metric of success and data needed to
validate research hypotheses. In this work, we introduce the Never-Ending
VIsual-classification Stream (NEVIS'22), a benchmark consisting of a stream of
over 100 visual classification tasks, sorted chronologically and extracted from
papers sampled uniformly from computer vision proceedings spanning the last
three decades. The resulting stream reflects what the research community
thought was meaningful at any point in time, and it serves as an ideal test bed
to assess how well models can adapt to new tasks, and do so better and more
efficiently as time goes by. Despite being limited to classification, the
resulting stream has a rich diversity of tasks from OCR, to texture analysis,
scene recognition, and so forth. The diversity is also reflected in the wide
range of dataset sizes, spanning over four orders of magnitude. Overall,
NEVIS'22 poses an unprecedented challenge for current sequential learning
approaches due to the scale and diversity of tasks, yet with a low entry
barrier as it is limited to a single modality and well understood supervised
learning problems. Moreover, we provide a reference implementation including
strong baselines and an evaluation protocol to compare methods in terms of
their trade-off between accuracy and compute.
- Abstract(参考訳): 継続的学習、メタラーニング、トランスファーラーニングといった機械学習コミュニティの共通の目標は、目に見えないタスクに効率的かつ堅牢に適応するアルゴリズムとモデルを設計することである。
さらに野心的な目標は、適応をやめないモデルを構築することであり、知識を適切に移すことで、時間とともにより効率的になることです。
実際の学習アルゴリズムとモデルアーキテクチャの研究以外にも、学習プロトコルの選択、成功の基準、研究仮説の検証に必要なデータなど、そのようなモデルの構築にはいくつかのハードルがあります。
本研究では,過去30年間のコンピュータビジョン処理から一様に抽出された文書から,100以上の視覚的分類タスクからなるベンチマークであるNever-Ending VIsual-classification Stream (NEVIS'22)を紹介する。
結果として得られたストリームは、調査コミュニティがどんな時点で有意義だと考えたかを反映しており、モデルが新しいタスクにどのように適応できるかを評価するための理想的なテストベッドとして機能する。
分類に制限されているにもかかわらず、OCR、テクスチャ分析、シーン認識など、様々なタスクが生成される。
この多様性は、広範囲のデータセットサイズにも反映されており、4桁を超える。
全体として、nevis'22はタスクの規模と多様性のため、現在の逐次学習アプローチでは前例のない課題となっているが、単一のモダリティと教師付き学習問題に限定されているため、参入障壁は低い。
さらに,高いベースラインを含む参照実装と,精度と計算のトレードオフの観点からメソッドを比較するための評価プロトコルを提供する。
関連論文リスト
- A Multitask Deep Learning Model for Classification and Regression of Hyperspectral Images: Application to the large-scale dataset [44.94304541427113]
ハイパースペクトル画像上で複数の分類タスクと回帰タスクを同時に行うマルチタスク深層学習モデルを提案する。
我々は、TAIGAと呼ばれる大規模なハイパースペクトルデータセットに対するアプローチを検証した。
結果の総合的定性的および定量的分析により,提案手法が他の最先端手法よりも有意に優れていることを示す。
論文 参考訳(メタデータ) (2024-07-23T11:14:54Z) - Adaptive Rentention & Correction for Continual Learning [114.5656325514408]
連続学習における一般的な問題は、最新のタスクに対する分類層のバイアスである。
アダプティブ・リテンション・アンド・コレクション (ARC) のアプローチを例に挙げる。
ARCはCIFAR-100とImagenet-Rのデータセットで平均2.7%と2.6%のパフォーマンス向上を達成した。
論文 参考訳(メタデータ) (2024-05-23T08:43:09Z) - A Shapelet-based Framework for Unsupervised Multivariate Time Series Representation Learning [29.511632089649552]
時系列固有のシェープレットに基づく表現を学習し,多変量時系列のための新しいURLフレームワークを提案する。
我々の知る限りでは、これは、教師なし汎用表現学習におけるシェープレットベースの埋め込みを探求する最初の研究である。
統一型シェープレットベースのエンコーダと,マルチグレードコントラストとマルチスケールアライメントを備えた新しい学習目標が,目的達成のために特に設計されている。
論文 参考訳(メタデータ) (2023-05-30T09:31:57Z) - Hierarchically Structured Task-Agnostic Continual Learning [0.0]
本研究では,連続学習のタスク非依存的な視点を取り入れ,階層的情報理論の最適性原理を考案する。
我々は,情報処理経路の集合を作成することで,忘れを緩和する,Mixture-of-Variational-Experts層と呼ばれるニューラルネットワーク層を提案する。
既存の連続学習アルゴリズムのようにタスク固有の知識を必要としない。
論文 参考訳(メタデータ) (2022-11-14T19:53:15Z) - An Evolutionary Approach to Dynamic Introduction of Tasks in Large-scale
Multitask Learning Systems [4.675744559395732]
マルチタスク学習は、複数のタスクから学習できるモデルが知識伝達によってより良い品質と効率を達成すると仮定する。
最先端のMLモデルは、タスクごとに高いカスタマイズに依存し、タスクの数をスケールするのではなく、サイズとデータスケールを活用する。
本稿では,大規模マルチタスクモデルを生成でき,新しいタスクの動的かつ連続的な追加を支援する進化的手法を提案する。
論文 参考訳(メタデータ) (2022-05-25T13:10:47Z) - Continual Object Detection via Prototypical Task Correlation Guided
Gating Mechanism [120.1998866178014]
pRotOtypeal taSk corrElaTion guided gaTingAnism (ROSETTA)による連続物体検出のためのフレキシブルなフレームワークを提案する。
具体的には、統一されたフレームワークはすべてのタスクで共有され、タスク対応ゲートは特定のタスクのサブモデルを自動的に選択するために導入されます。
COCO-VOC、KITTI-Kitchen、VOCのクラスインクリメンタル検出、および4つのタスクの逐次学習の実験により、ROSETTAが最先端のパフォーマンスを得ることが示された。
論文 参考訳(メタデータ) (2022-05-06T07:31:28Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - The Effect of Diversity in Meta-Learning [79.56118674435844]
少ないショット学習は、少数の例から見れば、新しいタスクに対処できる表現を学習することを目的としている。
近年の研究では,タスク分布がモデルの性能に重要な役割を担っていることが示されている。
タスクの多様性がメタ学習アルゴリズムに与える影響を評価するために,多種多様なモデルとデータセットのタスク分布について検討する。
論文 参考訳(メタデータ) (2022-01-27T19:39:07Z) - A System for Real-Time Interactive Analysis of Deep Learning Training [66.06880335222529]
現在利用可能なシステムは、トレーニングプロセスが始まる前に指定しなければならないログデータのみを監視することに限定されている。
本稿では,リアルタイム情報を生成するライブプロセス上で対話型クエリを実行可能にするシステムを提案する。
論文 参考訳(メタデータ) (2020-01-05T11:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。