論文の概要: Alfred: A System for Prompted Weak Supervision
- arxiv url: http://arxiv.org/abs/2305.18623v1
- Date: Mon, 29 May 2023 21:16:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 19:18:08.738778
- Title: Alfred: A System for Prompted Weak Supervision
- Title(参考訳): Alfred: 急激な弱みのスーパービジョンのためのシステム
- Authors: Peilin Yu and Stephen Bach
- Abstract要約: Alfredは、プログラムによる弱い監督(PWS)のための最初のシステムであり、プロンプトによって機械学習のためのトレーニングデータを生成する。
弱い監督ソースが専門家によってコード化されている典型的なPWSシステムとは対照的に、Alfredは自然言語のプロンプトを通じて、ユーザーが主題の専門知識をエンコードすることを可能にする。
- 参考スコア(独自算出の注目度): 0.571097144710995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Alfred is the first system for programmatic weak supervision (PWS) that
creates training data for machine learning by prompting. In contrast to typical
PWS systems where weak supervision sources are programs coded by experts,
Alfred enables users to encode their subject matter expertise via natural
language prompts for language and vision-language models. Alfred provides a
simple Python interface for the key steps of this emerging paradigm, with a
high-throughput backend for large-scale data labeling. Users can quickly
create, evaluate, and refine their prompt-based weak supervision sources; map
the results to weak labels; and resolve their disagreements with a label model.
Alfred enables a seamless local development experience backed by models served
from self-managed computing clusters. It automatically optimizes the execution
of prompts with optimized batching mechanisms. We find that this optimization
improves query throughput by 2.9x versus a naive approach. We present two
example use cases demonstrating Alfred on YouTube comment spam detection and
pet breeds classification. Alfred is open source, available at
https://github.com/BatsResearch/alfred.
- Abstract(参考訳): Alfredは、プログラムによる弱い監督(PWS)のための最初のシステムであり、プロンプトによって機械学習のためのトレーニングデータを生成する。
弱い監督源が専門家によってコード化されている典型的なPWSシステムとは対照的に、Alfredは言語や視覚言語モデルのための自然言語プロンプトを通じて、ユーザーが主題の専門知識をエンコードすることができる。
Alfred氏は、この新興パラダイムの重要なステップのための単純なPythonインターフェースを提供し、大規模データラベリングのための高スループットバックエンドを提供する。
ユーザは、迅速にプロンプトベースの弱い監督ソースを作成し、評価し、洗練し、結果を弱いラベルにマップし、ラベルモデルとの相違を解消することができる。
Alfredは、セルフマネージドコンピューティングクラスタから提供されるモデルによって、シームレスなローカル開発エクスペリエンスを実現する。
最適化されたバッチ機構でプロンプトの実行を自動的に最適化する。
この最適化によってクエリのスループットが2.9倍向上する。
本稿では,YouTubeにおけるAlfredコメントスパム検出とペット品種分類の2例を紹介する。
Alfredはオープンソースで、https://github.com/BatsResearch/alfred.comで入手できる。
関連論文リスト
- Aggregate-and-Adapt Natural Language Prompts for Downstream Generalization of CLIP [24.22470408549266]
Aggregate-and-Adapted Prompt Embedding (AAPE) としての即時埋め込み
AAPEは、視覚言語理解タスクを含む、さまざまな下流データ分散とタスクに一般化できることが示されている。
また、AAPEは非標準およびOOD例の処理に特に有用であることを示す。
論文 参考訳(メタデータ) (2024-10-31T07:41:13Z) - Adapting Vision-Language Models to Open Classes via Test-Time Prompt Tuning [50.26965628047682]
学習済みのモデルをオープンクラスに適応させることは、機械学習において難しい問題である。
本稿では,両者の利点を組み合わせたテスト時プロンプトチューニング手法を提案する。
提案手法は,基本クラスと新クラスの両方を考慮し,すべての比較手法を平均的に上回る結果を得た。
論文 参考訳(メタデータ) (2024-08-29T12:34:01Z) - OpenGCD: Assisting Open World Recognition with Generalized Category
Discovery [4.600906853436266]
望ましいオープンワールド認識(OWR)システムは、3つのタスクを実行する必要がある。
上記の問題を逐次解決するために,3つの鍵となるアイデアを組み合わせたOpenGCDを提案する。
2つの標準分類ベンチマークと挑戦的なデータセットの実験は、OpenGCDが優れた互換性を提供するだけでなく、他のベースラインを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2023-08-14T04:10:45Z) - Dynamic Perceiver for Efficient Visual Recognition [87.08210214417309]
特徴抽出手順と早期分類タスクを分離する動的知覚器(Dyn-Perceiver)を提案する。
特徴ブランチは画像の特徴を抽出し、分類ブランチは分類タスクに割り当てられた遅延コードを処理する。
早期出口は分類枝に限られており、低レベルの特徴において線形分離性は不要である。
論文 参考訳(メタデータ) (2023-06-20T03:00:22Z) - BadPrompt: Backdoor Attacks on Continuous Prompts [16.780478840918995]
本研究は,バックドア攻撃に対する連続的プロンプト学習アルゴリズムの脆弱性に関する最初の研究である。
本稿では,バックドア攻撃に対するタスク適応アルゴリズムであるBadPromptを提案する。
我々は、5つのデータセットと2つの連続的プロンプトモデル上でのBadPromptの性能を評価する。
論文 参考訳(メタデータ) (2022-11-27T04:23:18Z) - Prompt-driven efficient Open-set Semi-supervised Learning [52.30303262499391]
オープンセット半教師付き学習(OSSL)は関心を集めており、未ラベルデータにのみOOD(Out-of-distribution)サンプルが組み込まれているというより実践的なシナリオを調査している。
我々はOpenPromptと呼ばれる,プロンプト駆動の効率的なOSSLフレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-28T16:25:08Z) - A novel evaluation methodology for supervised Feature Ranking algorithms [0.0]
本稿では,特徴ランクの新たな評価手法を提案する。
合成データセットを使用することで、特徴重要度スコアを事前に知ることができ、より体系的な評価が可能になる。
新しい方法論を使った大規模な実験を容易にするため、fsevalと呼ばれるベンチマークフレームワークがPythonで構築された。
論文 参考訳(メタデータ) (2022-07-09T12:00:36Z) - Supporting Vision-Language Model Inference with Confounder-pruning Knowledge Prompt [71.77504700496004]
視覚言語モデルは、オープンセットの視覚概念を扱うために、画像とテキストのペアを共通の空間に整列させることで事前訓練される。
事前訓練されたモデルの転送可能性を高めるため、最近の研究では、固定または学習可能なプロンプトが採用されている。
しかし、どのようにして、どのプロンプトが推論性能を改善するのかは、まだ不明である。
論文 参考訳(メタデータ) (2022-05-23T07:51:15Z) - skweak: Weak Supervision Made Easy for NLP [13.37847225239485]
我々は、Pythonベースのソフトウェアツールキットskweakを紹介し、NLP開発者は幅広いNLPタスクに弱い監督を適用できる。
ドメイン知識から派生したラベル付け関数を使用して、指定されたデータセットのアノテーションを自動的に取得する。
得られたラベルは生成モデルで集約され、各ラベル関数の精度(および可能性のある混乱)を推定する。
論文 参考訳(メタデータ) (2021-04-19T23:26:51Z) - Your "Flamingo" is My "Bird": Fine-Grained, or Not [60.25769809922673]
我々は,異なるレベルの専門知識の下で,様々なきめ細かい定義を調整する方法を検討する。
われわれはまず総合的な人間研究を行い、ほとんどの参加者が多粒度ラベルを好むことを確認した。
粗いレベルのラベル予測は、きめ細かい特徴学習をさらに高める。
論文 参考訳(メタデータ) (2020-11-18T02:24:54Z) - OPFython: A Python-Inspired Optimum-Path Forest Classifier [68.8204255655161]
本稿では,OPFythonと表記されるPythonベースのOptimum-Path Forestフレームワークを提案する。
OPFythonはPythonベースのライブラリなので、C言語よりもフレンドリーな環境とプロトタイピングの作業スペースを提供する。
論文 参考訳(メタデータ) (2020-01-28T15:46:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。