論文の概要: Small-Text: Active Learning for Text Classification in Python
- arxiv url: http://arxiv.org/abs/2107.10314v7
- Date: Sat, 7 Oct 2023 10:34:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 17:44:25.394721
- Title: Small-Text: Active Learning for Text Classification in Python
- Title(参考訳): Small-Text: Pythonのテキスト分類のためのアクティブラーニング
- Authors: Christopher Schr\"oder, Lydia M\"uller, Andreas Niekler, Martin
Potthast
- Abstract要約: small-textはPython用の使いやすいアクティブラーニングライブラリである。
シングルラベルとマルチラベルのテキスト分類のためのプールベースのアクティブラーニングを提供する。
- 参考スコア(独自算出の注目度): 23.87081733039124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce small-text, an easy-to-use active learning library, which offers
pool-based active learning for single- and multi-label text classification in
Python. It features numerous pre-implemented state-of-the-art query strategies,
including some that leverage the GPU. Standardized interfaces allow the
combination of a variety of classifiers, query strategies, and stopping
criteria, facilitating a quick mix and match, and enabling a rapid and
convenient development of both active learning experiments and applications.
With the objective of making various classifiers and query strategies
accessible for active learning, small-text integrates several well-known
machine learning libraries, namely scikit-learn, PyTorch, and Hugging Face
transformers. The latter integrations are optionally installable extensions, so
GPUs can be used but are not required. Using this new library, we investigate
the performance of the recently published SetFit training paradigm, which we
compare to vanilla transformer fine-tuning, finding that it matches the latter
in classification accuracy while outperforming it in area under the curve. The
library is available under the MIT License at
https://github.com/webis-de/small-text, in version 1.3.0 at the time of
writing.
- Abstract(参考訳): このライブラリは、Pythonのシングルラベルとマルチラベルのテキスト分類にプールベースのアクティブラーニングを提供する。
GPUを活用するものなど、数多くの実装済みの最先端クエリ戦略を備えている。
標準化されたインターフェースは、様々な分類器、クエリ戦略、および停止基準の組み合わせを可能にし、迅速な混合とマッチングを容易にし、アクティブな学習実験とアプリケーションの両方を迅速かつ便利な開発を可能にする。
さまざまな分類器とクエリ戦略をアクティブな学習に利用できるようにすることを目的として、small-textは、scikit-learn、pytorch、hughing face transformersなどの有名な機械学習ライブラリを統合する。
後者の統合はオプションでインストール可能な拡張なので、gpuは使用できるが不要である。
この新たなライブラリを用いて,バニラ変圧器の微調整と比較した最近発表されたSetFitトレーニングパラダイムの性能を検討した。
このライブラリはMITライセンスでhttps://github.com/webis-de/small-textで、執筆時点でバージョン1.3.0で利用できる。
関連論文リスト
- AttriCLIP: A Non-Incremental Learner for Incremental Knowledge Learning [54.66912435998658]
連続学習は、モデルが逐次到着したデータから段階的に知識を学習できるようにすることを目的としている。
本稿では,新しいクラスやタスクの知識を段階的に抽出する,AttriCLIPという非インクリメンタル学習手法を提案する。
論文 参考訳(メタデータ) (2023-05-19T07:39:17Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - hyperbox-brain: A Toolbox for Hyperbox-based Machine Learning Algorithms [9.061408029414455]
Hyperbox-brainはオープンソースのPythonライブラリで、主要なハイパーボックスベースの機械学習アルゴリズムを実装している。
Hyperbox-brainは、よく知られたScikit-learnおよびnumpyツールボックスと互換性のある統一APIを公開する。
論文 参考訳(メタデータ) (2022-10-06T06:40:07Z) - problexity -- an open-source Python library for binary classification
problem complexity assessment [0.0]
分類問題の複雑性評価は、教師付き学習領域における多くのトピックの重要な要素である。
現在、問題複雑性尺度の計算を可能にする学術コミュニティで利用可能なツールは、C++とR言語のライブラリとしてのみ利用可能である。
本稿では,Python言語における22の複雑性尺度を推定するソフトウェアモジュールについて述べる。
論文 参考訳(メタデータ) (2022-07-14T07:32:15Z) - IMBENS: Ensemble Class-imbalanced Learning in Python [26.007498723608155]
imbensはオープンソースのPythonツールボックスで、クラス不均衡なデータに対してアンサンブル学習アルゴリズムを実装し、デプロイする。
imbensはMITオープンソースライセンスでリリースされており、Python Package Index (PyPI)からインストールすることができる。
論文 参考訳(メタデータ) (2021-11-24T20:14:20Z) - Solo-learn: A Library of Self-supervised Methods for Visual
Representation Learning [83.02597612195966]
solo-learnは視覚表現学習のための自己指導型のメソッドのライブラリである。
Pythonで実装され、PytorchとPytorch Lightningを使用して、このライブラリは研究と業界のニーズの両方に適合する。
論文 参考訳(メタデータ) (2021-08-03T22:19:55Z) - Revisiting Deep Local Descriptor for Improved Few-Shot Classification [56.74552164206737]
textbfDense textbfClassification と textbfAttentive textbfPooling を利用して埋め込みの質を向上させる方法を示す。
広範に使われているグローバル平均プール (GAP) の代わりに, 注意深いプールを施し, 特徴マップをプールすることを提案する。
論文 参考訳(メタデータ) (2021-03-30T00:48:28Z) - Captum: A unified and generic model interpretability library for PyTorch [49.72749684393332]
我々は,PyTorch用の新しい,統一されたオープンソースモデル解釈可能性ライブラリを紹介する。
このライブラリには、多くの勾配と摂動に基づく属性アルゴリズムの汎用的な実装が含まれている。
分類モデルと非分類モデルの両方に使用できる。
論文 参考訳(メタデータ) (2020-09-16T18:57:57Z) - ktrain: A Low-Code Library for Augmented Machine Learning [0.0]
ktrainはローコードPythonライブラリで、機械学習をよりアクセスしやすく、適用しやすくする。
初心者と経験豊富な実践者の両方が構築し、トレーニングし、検査し、適用するための、洗練された最先端の機械学習モデルを簡単にするように設計されている。
論文 参考訳(メタデータ) (2020-04-19T14:18:20Z) - fastai: A Layered API for Deep Learning [1.7223564681760164]
fastaiは、実践者に高度なコンポーネントを提供するディープラーニングライブラリである。
これは研究者に、新しいアプローチを構築するために混在し、マッチできる低レベルのコンポーネントを提供する。
論文 参考訳(メタデータ) (2020-02-11T21:16:48Z) - OPFython: A Python-Inspired Optimum-Path Forest Classifier [68.8204255655161]
本稿では,OPFythonと表記されるPythonベースのOptimum-Path Forestフレームワークを提案する。
OPFythonはPythonベースのライブラリなので、C言語よりもフレンドリーな環境とプロトタイピングの作業スペースを提供する。
論文 参考訳(メタデータ) (2020-01-28T15:46:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。