論文の概要: Label Sleuth: From Unlabeled Text to a Classifier in a Few Hours
- arxiv url: http://arxiv.org/abs/2208.01483v1
- Date: Tue, 2 Aug 2022 14:31:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-08-03 13:27:23.600665
- Title: Label Sleuth: From Unlabeled Text to a Classifier in a Few Hours
- Title(参考訳): Label Sleuth: ラベルなしテキストから数時間で分類器へ
- Authors: Eyal Shnarch, Alon Halfon, Ariel Gera, Marina Danilevsky, Yannis
Katsis, Leshem Choshen, Martin Santillan Cooper, Dina Epelboim, Zheng Zhang,
Dakuo Wang, Lucy Yip, Liat Ein-Dor, Lena Dankin, Ilya Shnayderman, Ranit
Aharonov, Yunyao Li, Naftali Liberman, Philip Levin Slesarev, Gwilym Newton,
Shila Ofek-Koifman, Noam Slonim, Yoav Katz
- Abstract要約: 本稿では,テキスト分類器のラベル付けと作成のためのフリーオープンソースシステムであるLabel Sleuthを紹介する。
Label Sleuthをオープンソース化することで、NLPモデルの利用を拡大するユーザと開発者のコミュニティを構築したいと思っています。
- 参考スコア(独自算出の注目度): 36.87964390013446
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Text classification can be useful in many real-world scenarios, saving a lot
of time for end users. However, building a custom classifier typically requires
coding skills and ML knowledge, which poses a significant barrier for many
potential users. To lift this barrier, we introduce Label Sleuth, a free open
source system for labeling and creating text classifiers. This system is unique
for (a) being a no-code system, making NLP accessible to non-experts, (b)
guiding users through the entire labeling process until they obtain a custom
classifier, making the process efficient -- from cold start to classifier in a
few hours, and (c) being open for configuration and extension by developers. By
open sourcing Label Sleuth we hope to build a community of users and developers
that will broaden the utilization of NLP models.
- Abstract(参考訳): テキスト分類は多くの現実世界のシナリオで有用であり、エンドユーザにとって多くの時間を節約できる。
しかし、カスタム分類器を構築するには、コーディングスキルとml知識が必要であり、多くの潜在的なユーザにとって大きな障壁となる。
この障壁を克服するために,テキスト分類器のラベル付けと作成のための無料オープンソースシステムである Label Sleuth を紹介した。
このシステムはユニークです
(a)ノンコードシステムであり、NLPを非専門家に利用できるようにする。
(b)カスタムの分類器を得るまで、ユーザをラベル付けプロセス全体を通して案内し、プロセスを数時間でコールドスタートから分類器まで効率的にする。
(c) 開発者による設定と拡張はオープンです。
Label Sleuthをオープンソース化することで、NLPモデルの利用を拡大するユーザと開発者のコミュニティを構築したいと思っています。
関連論文リスト
- Query-Based Knowledge Sharing for Open-Vocabulary Multi-Label
Classification [5.985859108787149]
マルチラベルゼロショット学習はコンピュータビジョンにおける非自明なタスクである。
本稿では,この課題に対する新しい問合せに基づく知識共有パラダイムを提案する。
NUS-WIDE および Open Images では、ゼロショットタスクの最先端手法を5.9%、mAP の4.5%で大幅に上回っている。
論文 参考訳(メタデータ) (2024-01-02T12:18:40Z) - Multi-Label Knowledge Distillation [86.03990467785312]
本稿では,新しい多ラベル知識蒸留法を提案する。
一方、マルチラベル学習問題をバイナリ分類問題に分割することにより、ロジットからの情報的意味知識を利用する。
一方,ラベルワイド埋め込みの構造情報を活用することにより,学習した特徴表現の識別性を向上する。
論文 参考訳(メタデータ) (2023-08-12T03:19:08Z) - Description-Enhanced Label Embedding Contrastive Learning for Text
Classification [65.01077813330559]
モデル学習プロセスにおける自己監督型学習(SSL)と新しい自己監督型関係関係(R2)分類タスクの設計
テキスト分類とR2分類を最適化対象として扱うテキスト分類のための関係学習ネットワーク(R2-Net)の関係について検討する。
ラベルセマンティックラーニングのためのマルチアスペクト記述を得るためのWordNetからの外部知識。
論文 参考訳(メタデータ) (2023-06-15T02:19:34Z) - Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - Open-Vocabulary Multi-Label Classification via Multi-modal Knowledge
Transfer [55.885555581039895]
マルチラベルゼロショット学習(ML-ZSL)は、事前訓練されたテキストラベル埋め込みによる知識の伝達に焦点を当てている。
マルチラベル分類のためのMKT(Multimodal Knowledge Transfer)と呼ばれる新しいオープン語彙フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T08:32:18Z) - Automatic Multi-Label Prompting: Simple and Interpretable Few-Shot
Classification [15.575483080819563]
本稿では,自動マルチラベルプロンプト(AMuLaP)を提案する。
提案手法は,1対多のラベルマッピングと統計に基づくアルゴリズムを用いて,プロンプトテンプレートを付与したラベルマッピングを選択する。
実験の結果,AMuLaPは人的労力や外部リソースを使わずにGLUEベンチマーク上での競合性能を実証した。
論文 参考訳(メタデータ) (2022-04-13T11:15:52Z) - Trustable Co-label Learning from Multiple Noisy Annotators [68.59187658490804]
監督されたディープラーニングは、大量の注釈付き例に依存している。
典型的な方法は、複数のノイズアノテータから学習することである。
本稿では,emphTrustable Co-label Learning (TCL)と呼ばれるデータ効率のよい手法を提案する。
論文 参考訳(メタデータ) (2022-03-08T16:57:00Z) - SURF: Improving classifiers in production by learning from busy and
noisy end users [12.034109933050036]
従来のクラウドソーシングアルゴリズムがこのユーザフィードバック設定で苦労していることを示す。
我々はこの非応答曖昧性に対処できる新しいアルゴリズム SURF を提案する。
論文 参考訳(メタデータ) (2020-10-12T16:59:35Z) - A Pitfall of Learning from User-generated Data: In-depth Analysis of
Subjective Class Problem [1.218340575383456]
ユーザ定義ラベルに主観クラスと客観クラスという2種類のクラスを提案する。
我々はこれを主観的クラス問題と定義し、オラクルクエリを使わずにデータセット内の主観的ラベルを検出するためのフレームワークを提供する。
論文 参考訳(メタデータ) (2020-03-24T02:25:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。