論文の概要: Small-Text: Active Learning for Text Classification in Python
- arxiv url: http://arxiv.org/abs/2107.10314v7
- Date: Sat, 7 Oct 2023 10:34:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-13 17:44:25.394721
- Title: Small-Text: Active Learning for Text Classification in Python
- Title(参考訳): Small-Text: Pythonのテキスト分類のためのアクティブラーニング
- Authors: Christopher Schr\"oder, Lydia M\"uller, Andreas Niekler, Martin
Potthast
- Abstract要約: small-textはPython用の使いやすいアクティブラーニングライブラリである。
シングルラベルとマルチラベルのテキスト分類のためのプールベースのアクティブラーニングを提供する。
- 参考スコア(独自算出の注目度): 23.87081733039124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce small-text, an easy-to-use active learning library, which offers
pool-based active learning for single- and multi-label text classification in
Python. It features numerous pre-implemented state-of-the-art query strategies,
including some that leverage the GPU. Standardized interfaces allow the
combination of a variety of classifiers, query strategies, and stopping
criteria, facilitating a quick mix and match, and enabling a rapid and
convenient development of both active learning experiments and applications.
With the objective of making various classifiers and query strategies
accessible for active learning, small-text integrates several well-known
machine learning libraries, namely scikit-learn, PyTorch, and Hugging Face
transformers. The latter integrations are optionally installable extensions, so
GPUs can be used but are not required. Using this new library, we investigate
the performance of the recently published SetFit training paradigm, which we
compare to vanilla transformer fine-tuning, finding that it matches the latter
in classification accuracy while outperforming it in area under the curve. The
library is available under the MIT License at
https://github.com/webis-de/small-text, in version 1.3.0 at the time of
writing.
- Abstract(参考訳): このライブラリは、Pythonのシングルラベルとマルチラベルのテキスト分類にプールベースのアクティブラーニングを提供する。
GPUを活用するものなど、数多くの実装済みの最先端クエリ戦略を備えている。
標準化されたインターフェースは、様々な分類器、クエリ戦略、および停止基準の組み合わせを可能にし、迅速な混合とマッチングを容易にし、アクティブな学習実験とアプリケーションの両方を迅速かつ便利な開発を可能にする。
さまざまな分類器とクエリ戦略をアクティブな学習に利用できるようにすることを目的として、small-textは、scikit-learn、pytorch、hughing face transformersなどの有名な機械学習ライブラリを統合する。
後者の統合はオプションでインストール可能な拡張なので、gpuは使用できるが不要である。
この新たなライブラリを用いて,バニラ変圧器の微調整と比較した最近発表されたSetFitトレーニングパラダイムの性能を検討した。
このライブラリはMITライセンスでhttps://github.com/webis-de/small-textで、執筆時点でバージョン1.3.0で利用できる。
関連論文リスト
- Adapting Vision-Language Models to Open Classes via Test-Time Prompt Tuning [50.26965628047682]
学習済みのモデルをオープンクラスに適応させることは、機械学習において難しい問題である。
本稿では,両者の利点を組み合わせたテスト時プロンプトチューニング手法を提案する。
提案手法は,基本クラスと新クラスの両方を考慮し,すべての比較手法を平均的に上回る結果を得た。
論文 参考訳(メタデータ) (2024-08-29T12:34:01Z) - AttriCLIP: A Non-Incremental Learner for Incremental Knowledge Learning [53.32576252950481]
連続学習は、モデルが逐次到着したデータから段階的に知識を学習できるようにすることを目的としている。
本稿では,新しいクラスやタスクの知識を段階的に抽出する,AttriCLIPという非インクリメンタル学習手法を提案する。
論文 参考訳(メタデータ) (2023-05-19T07:39:17Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - PyRelationAL: a python library for active learning research and development [1.0061110876649197]
アクティブラーニング(英: Active Learning, AL)は、反復的かつ経済的にデータを取得する手法の開発に焦点を当てたMLのサブフィールドである。
本稿では,AL研究のためのオープンソースライブラリであるPyRelationALを紹介する。
プールベースのアクティブラーニング戦略を構成するための2段階の設計方法論をベースとしたモジュラーツールキットについて述べる。
論文 参考訳(メタデータ) (2022-05-23T08:21:21Z) - IMBENS: Ensemble Class-imbalanced Learning in Python [26.007498723608155]
imbensはオープンソースのPythonツールボックスで、クラス不均衡なデータに対してアンサンブル学習アルゴリズムを実装し、デプロイする。
imbensはMITオープンソースライセンスでリリースされており、Python Package Index (PyPI)からインストールすることができる。
論文 参考訳(メタデータ) (2021-11-24T20:14:20Z) - MRCpy: A Library for Minimax Risk Classifiers [10.380882297891272]
PythonライブラリであるMRCpyは、ロバストリスク最小化(RRM)アプローチに基づいて、ミニマックスリスク分類器(MRC)を実装している。
MRCpyは、Scikit-learnのような人気のあるPythonライブラリの標準に従い、可読性と使いやすさと、他のライブラリとのシームレスな統合を容易にする。
論文 参考訳(メタデータ) (2021-08-04T10:31:20Z) - Solo-learn: A Library of Self-supervised Methods for Visual
Representation Learning [83.02597612195966]
solo-learnは視覚表現学習のための自己指導型のメソッドのライブラリである。
Pythonで実装され、PytorchとPytorch Lightningを使用して、このライブラリは研究と業界のニーズの両方に適合する。
論文 参考訳(メタデータ) (2021-08-03T22:19:55Z) - Captum: A unified and generic model interpretability library for PyTorch [49.72749684393332]
我々は,PyTorch用の新しい,統一されたオープンソースモデル解釈可能性ライブラリを紹介する。
このライブラリには、多くの勾配と摂動に基づく属性アルゴリズムの汎用的な実装が含まれている。
分類モデルと非分類モデルの両方に使用できる。
論文 参考訳(メタデータ) (2020-09-16T18:57:57Z) - ktrain: A Low-Code Library for Augmented Machine Learning [0.0]
ktrainはローコードPythonライブラリで、機械学習をよりアクセスしやすく、適用しやすくする。
初心者と経験豊富な実践者の両方が構築し、トレーニングし、検査し、適用するための、洗練された最先端の機械学習モデルを簡単にするように設計されている。
論文 参考訳(メタデータ) (2020-04-19T14:18:20Z) - fastai: A Layered API for Deep Learning [1.7223564681760164]
fastaiは、実践者に高度なコンポーネントを提供するディープラーニングライブラリである。
これは研究者に、新しいアプローチを構築するために混在し、マッチできる低レベルのコンポーネントを提供する。
論文 参考訳(メタデータ) (2020-02-11T21:16:48Z) - OPFython: A Python-Inspired Optimum-Path Forest Classifier [68.8204255655161]
本稿では,OPFythonと表記されるPythonベースのOptimum-Path Forestフレームワークを提案する。
OPFythonはPythonベースのライブラリなので、C言語よりもフレンドリーな環境とプロトタイピングの作業スペースを提供する。
論文 参考訳(メタデータ) (2020-01-28T15:46:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。