論文の概要: OneLabeler: A Flexible System for Building Data Labeling Tools
- arxiv url: http://arxiv.org/abs/2203.14227v1
- Date: Sun, 27 Mar 2022 07:22:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-02 21:14:17.016830
- Title: OneLabeler: A Flexible System for Building Data Labeling Tools
- Title(参考訳): OneLabeler: データラベリングツールを構築するための柔軟なシステム
- Authors: Yu Zhang, Yun Wang, Haidong Zhang, Bin Zhu, Siming Chen, Dongmei Zhang
- Abstract要約: OneLabelerは、データラベリングツールを構築するための共通ソフトウェアモジュールの構成と構成をサポートする。
開発者とのユーザスタディは、OneLabelerが多様なデータラベリングツールの効率的な構築をサポートする証拠を提供する。
- 参考スコア(独自算出の注目度): 48.15772261649084
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Labeled datasets are essential for supervised machine learning. Various data
labeling tools have been built to collect labels in different usage scenarios.
However, developing labeling tools is time-consuming, costly, and
expertise-demanding on software development. In this paper, we propose a
conceptual framework for data labeling and OneLabeler based on the conceptual
framework to support easy building of labeling tools for diverse usage
scenarios. The framework consists of common modules and states in labeling
tools summarized through coding of existing tools. OneLabeler supports
configuration and composition of common software modules through visual
programming to build data labeling tools. A module can be a human, machine, or
mixed computation procedure in data labeling. We demonstrate the expressiveness
and utility of the system through ten example labeling tools built with
OneLabeler. A user study with developers provides evidence that OneLabeler
supports efficient building of diverse data labeling tools.
- Abstract(参考訳): 教師付き機械学習にはラベル付きデータセットが不可欠である。
さまざまな利用シナリオでラベルを収集するために、さまざまなデータラベリングツールが構築されている。
しかし、ラベリングツールの開発には時間がかかり、コストがかかり、ソフトウェア開発に専門知識が要求される。
本稿では,データラベリングの概念フレームワークとOneLabelerを提案する。
このフレームワークは、既存のツールのコーディングを通じて要約されたラベルツールの共通モジュールとステートで構成されている。
OneLabelerは、ビジュアルプログラミングを通じて共通ソフトウェアモジュールの構成と構成をサポートし、データラベリングツールを構築する。
モジュールは、データラベリングにおける人、機械、または混合計算手順である。
OneLabelerで構築した10種類のラベリングツールを用いて,システムの表現性と実用性を実証する。
開発者とのユーザスタディは、OneLabelerが多様なデータラベリングツールの効率的な構築をサポートする証拠を提供する。
関連論文リスト
- Thinking Like an Annotator: Generation of Dataset Labeling Instructions [59.603239753484345]
本稿では、公開されていないラベリング命令に対処するため、新しいタスクであるラベリング命令生成を導入する。
1)データセット内のカテゴリ毎に視覚的に代表されるサンプルのセットを生成し,2)サンプルに対応するテキストラベルを提供する。
このフレームワークは人間のアノテーションのプロキシとして機能し、最終的なラベル付け命令セットを生成し、その品質を評価するのに役立つ。
論文 参考訳(メタデータ) (2023-06-24T18:32:48Z) - Imprecise Label Learning: A Unified Framework for Learning with Various Imprecise Label Configurations [91.67511167969934]
imprecise label learning (ILL)は、様々な不正確なラベル構成で学習を統合するためのフレームワークである。
我々は、ILLが部分ラベル学習、半教師付き学習、雑音ラベル学習にシームレスに適応できることを実証した。
論文 参考訳(メタデータ) (2023-05-22T04:50:28Z) - AutoWS: Automated Weak Supervision Framework for Text Classification [1.748907524043535]
本稿では、ドメインエキスパートへの依存を減らしつつ、弱い監督プロセスの効率を高めるための新しい枠組みを提案する。
本手法では,ラベルクラス毎にラベル付きサンプルの小さなセットが必要であり,多数のラベル付きデータにノイズ付きラベルを割り当てるラベル付き関数のセットを自動生成する。
論文 参考訳(メタデータ) (2023-02-07T07:12:05Z) - SciAnnotate: A Tool for Integrating Weak Labeling Sources for Sequence
Labeling [55.71459234749639]
SciAnnotateはSciAnnotateという名前のテキストアノテーションのためのウェブベースのツールで、科学的なアノテーションツールを指す。
我々のツールは、弱いラベルを作成するために複数のユーザフレンドリーなインターフェースを提供する。
本研究では,Bertifying Conditional Hidden Markov Modelを用いて,ツールが生成する弱いラベルを識別する手法を提案する。
論文 参考訳(メタデータ) (2022-08-07T19:18:13Z) - TagRuler: Interactive Tool for Span-Level Data Programming by
Demonstration [1.4050836886292872]
データプログラミングは、プログラミングの方法を知っているユーザーにのみアクセス可能だった。
我々はTagRulerという新しいツールを構築し、アノテータがプログラミングなしでスパンレベルのラベリング関数を簡単に構築できるようにする。
論文 参考訳(メタデータ) (2021-06-24T04:49:42Z) - A Study on the Autoregressive and non-Autoregressive Multi-label
Learning [77.11075863067131]
本稿では,ラベルとラベルの依存関係を共同で抽出する自己アテンションに基づく変分エンコーダモデルを提案する。
したがって、ラベルラベルとラベル機能の両方の依存関係を保ちながら、すべてのラベルを並列に予測することができる。
論文 参考訳(メタデータ) (2020-12-03T05:41:44Z) - Data Programming by Demonstration: A Framework for Interactively
Learning Labeling Functions [2.338938629983582]
本稿では,ユーザによるインタラクティブなデモンストレーションによるラベル付けルールを生成するために,DPBD(Data Programming by Demo)という新しいフレームワークを提案する。
DPBDは、ユーザからのラベリング関数記述の負担を軽減し、より高いレベルのセマンティクスに集中できるようにすることを目的としている。
文書分類のためのラベル付けルールを,文書例におけるユーザのスパンレベルアノテーションを用いて合成する対話型システムであるReducerを用いて,我々のフレームワークを運用する。
論文 参考訳(メタデータ) (2020-09-03T04:25:08Z) - Adversarial Knowledge Transfer from Unlabeled Data [62.97253639100014]
本稿では,インターネット規模の未ラベルデータから知識を伝達し,分類器の性能を向上させるための新しいAdversarial Knowledge Transferフレームワークを提案する。
我々の手法の重要な新しい側面は、ラベル付けされていないソースデータは、ラベル付けされたターゲットデータと異なるクラスであることができ、個別のプリテキストタスクを定義する必要がないことである。
論文 参考訳(メタデータ) (2020-08-13T08:04:27Z) - Embeddings of Label Components for Sequence Labeling: A Case Study of
Fine-grained Named Entity Recognition [41.60109880213463]
モデルへの埋め込みとしてラベル成分情報を統合することを提案する。
提案手法は,特に低周波ラベルを持つ事例において,性能の向上を実証する。
論文 参考訳(メタデータ) (2020-06-02T03:47:19Z) - Generative Adversarial Data Programming [32.2164057862111]
本稿では,ラベル付け機能を用いた遠隔監視信号を用いて,与えられたデータのラベルをほぼ一定時間で取得できることを示す。
このフレームワークは、自己教師付きラベル付き画像生成、ラベル付き画像生成へのゼロショットテキスト、転送学習、マルチタスク学習など、さまざまな設定に拡張されている。
論文 参考訳(メタデータ) (2020-04-30T07:06:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。