論文の概要: TAGLETS: A System for Automatic Semi-Supervised Learning with Auxiliary
Data
- arxiv url: http://arxiv.org/abs/2111.04798v1
- Date: Mon, 8 Nov 2021 20:08:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-10 14:40:39.591428
- Title: TAGLETS: A System for Automatic Semi-Supervised Learning with Auxiliary
Data
- Title(参考訳): TAGLETS:補助データを用いた半教師付き自動学習システム
- Authors: Wasu Piriyakulkij and Cristina Menghini and Ross Briden and Nihal V.
Nayak and Jeffrey Zhu and Elaheh Raisi and Stephen H. Bach
- Abstract要約: 機械学習の実践者は、しばしば幅広いデータにアクセスすることができる。
TAGLETSは3種類のデータを自動的に活用する技術を研究するために開発されたシステムである。
- 参考スコア(独自算出の注目度): 8.653321928148545
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning practitioners often have access to a spectrum of data:
labeled data for the target task (which is often limited), unlabeled data, and
auxiliary data, the many available labeled datasets for other tasks. We
describe TAGLETS, a system built to study techniques for automatically
exploiting all three types of data and creating high-quality, servable
classifiers. The key components of TAGLETS are: (1) auxiliary data organized
according to a knowledge graph, (2) modules encapsulating different methods for
exploiting auxiliary and unlabeled data, and (3) a distillation stage in which
the ensembled modules are combined into a servable model. We compare TAGLETS
with state-of-the-art transfer learning and semi-supervised learning methods on
four image classification tasks. Our study covers a range of settings, varying
the amount of labeled data and the semantic relatedness of the auxiliary data
to the target task. We find that the intelligent incorporation of auxiliary and
unlabeled data into multiple learning techniques enables TAGLETS to match-and
most often significantly surpass-these alternatives. TAGLETS is available as an
open-source system at github.com/BatsResearch/taglets.
- Abstract(参考訳): マシンラーニングの実践者は、ターゲットタスク(しばしば制限されている)のラベル付きデータ、ラベルなしデータ、その他のタスクのラベル付きデータセットなど、さまざまなデータにアクセスすることができる。
3種類のデータを自動的に活用し、高品質で可読な分類器を作成するための技術を学ぶためのシステムであるtagletsについて述べる。
TAGLETSの主な構成要素は、(1)知識グラフに基づいて整理された補助データ、(2)補助的および未ラベルのデータを利用する異なる手法をカプセル化したモジュール、(3)アンサンブルされたモジュールを可観測モデルに結合する蒸留段階である。
4つの画像分類タスクにおいて,TAGLETSと最先端の伝達学習および半教師付き学習手法を比較した。
本研究は,対象タスクに対するラベル付きデータの量や補助データの意味的関連性など,さまざまな設定をカバーする。
補助的および未ラベルのデータを複数の学習手法にインテリジェントに組み込むことで、TAGLETSはマッチし、最も多くはそれを超える代替手段となる。
TAGLETSはgithub.com/BatsResearch/tagletsのオープンソースシステムとして利用可能である。
関連論文リスト
- An Automatic Prompt Generation System for Tabular Data Tasks [3.117741687220381]
大規模言語モデル(LLM)は、慎重に構築されたプロンプトを通じて、いくつかのタスクでその能力を実証している。
本稿では,複数のLDMに適した革新的オートプロンプト生成システムを提案する。
論文 参考訳(メタデータ) (2024-05-09T08:32:55Z) - Distribution Matching for Multi-Task Learning of Classification Tasks: a
Large-Scale Study on Faces & Beyond [62.406687088097605]
マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。
MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。
本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-02T14:18:11Z) - Towards Heterogeneous Long-tailed Learning: Benchmarking, Metrics, and Toolbox [9.202606514025653]
長期データ配信は、eコマース、金融、バイオメディカルサイエンス、サイバーセキュリティなど、さまざまな分野に課題をもたらす。
私たちはHeroLTを開発した。HeroLTは18の最先端アルゴリズム、10の評価指標、および6つのタスクと4つのデータモダリティにわたる17の現実世界データセットを統合した、包括的な長期学習ベンチマークだ。
論文 参考訳(メタデータ) (2023-07-17T04:32:45Z) - Automated Few-shot Classification with Instruction-Finetuned Language
Models [76.69064714392165]
我々は、AuT-Fewが最先端の数ショット学習方法より優れていることを示す。
AuT-Few は RAFT few-shot ベンチマークにおいて,データセット間で最高のランク付け手法であることを示す。
論文 参考訳(メタデータ) (2023-05-21T21:50:27Z) - A Benchmark Generative Probabilistic Model for Weak Supervised Learning [2.0257616108612373]
アノテーションの負担を軽減するために、弱監視学習アプローチが開発されている。
遅延変数モデル(PLVM)が4つのデータセット間で最先端のパフォーマンスを実現することを示す。
論文 参考訳(メタデータ) (2023-03-31T07:06:24Z) - AutoGeoLabel: Automated Label Generation for Geospatial Machine Learning [69.47585818994959]
リモートセンシングデータのためのラベルの自動生成のためのビッグデータ処理パイプラインを評価する。
我々は,大規模データプラットフォームであるIBM PAIRSを用いて,密集都市部でそのようなラベルを動的に生成する。
論文 参考訳(メタデータ) (2022-01-31T20:02:22Z) - AstronomicAL: An interactive dashboard for visualisation, integration
and classification of data using Active Learning [0.0]
Astronomicalは、人間とループで対話的なラベリングとトレーニングのダッシュボードである。
アクティブラーニングを使用して、信頼性の高いデータセットと堅牢な分類器を作成することができる。
ユーザーは異なるソースからデータを視覚化して統合することができる。
論文 参考訳(メタデータ) (2021-09-11T07:32:26Z) - Generate, Annotate, and Learn: Generative Models Advance Self-Training
and Knowledge Distillation [58.64720318755764]
Semi-Supervised Learning (SSL)は多くのアプリケーションドメインで成功している。
知識蒸留(KD)により、深層ネットワークとアンサンブルの圧縮が可能となり、新しいタスク固有の未ラベルの例について知識を蒸留する際に最良の結果が得られる。
我々は、非条件生成モデルを用いて、ドメイン内の未ラベルデータを合成する「生成、注釈、学習(GAL)」と呼ばれる一般的なフレームワークを提案する。
論文 参考訳(メタデータ) (2021-06-11T05:01:24Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z) - Dual-Teacher: Integrating Intra-domain and Inter-domain Teachers for
Annotation-efficient Cardiac Segmentation [65.81546955181781]
本稿では,新しい半教師付きドメイン適応手法,すなわちDual-Teacherを提案する。
学生モデルは、2つの教師モデルによってラベル付けされていない対象データとラベル付けされた情報源データの知識を学習する。
提案手法では, ラベルなしデータとモダリティ間データとを並列に利用でき, 性能が向上することを示した。
論文 参考訳(メタデータ) (2020-07-13T10:00:44Z) - Beyond without Forgetting: Multi-Task Learning for Classification with
Disjoint Datasets [27.570773346794613]
解離データセットを用いた分類のためのマルチタスク学習(MTL)は、ひとつのタスクにラベル付きデータセットが1つしかない場合、MTLを探索することを目的としている。
半教師付き学習にインスパイアされ、擬似ラベル付きラベル付きラベル付きデータセットを使用して各タスクを容易にする。
提案手法は,ラベル付きデータセットに信頼度の高い擬似ラベルを持つラベル付きデータセットのトレーニングサンプルを選択し,ラベル付きデータセットに密接なデータ配信を行うための,選択型拡張(MTL-SA)法である。
論文 参考訳(メタデータ) (2020-03-15T03:19:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。