論文の概要: Evaluation of Representation Models for Text Classification with AutoML
Tools
- arxiv url: http://arxiv.org/abs/2106.12798v1
- Date: Thu, 24 Jun 2021 07:19:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 15:19:20.313969
- Title: Evaluation of Representation Models for Text Classification with AutoML
Tools
- Title(参考訳): AutoMLツールを用いたテキスト分類のための表現モデルの評価
- Authors: Sebastian Br\"andle, Marc Hanussek, Matthias Blohm, and Maximilien
Kintz
- Abstract要約: この作業は、AutoMLツールによって自動生成される3つの手作業によるテキスト表現とテキスト埋め込みを比較する。
結果は、自動生成されたテキスト埋め込みによって、単純なテキスト表現がAutoMLツールよりも優れていることを示している。
- 参考スコア(独自算出の注目度): 0.9318327342147515
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated Machine Learning (AutoML) has gained increasing success on tabular
data in recent years. However, processing unstructured data like text is a
challenge and not widely supported by open-source AutoML tools. This work
compares three manually created text representations and text embeddings
automatically created by AutoML tools. Our benchmark includes four popular
open-source AutoML tools and eight datasets for text classification purposes.
The results show that straightforward text representations perform better than
AutoML tools with automatically created text embeddings.
- Abstract(参考訳): 自動化機械学習(automl)は近年、表データで成功を収めている。
しかし、テキストのような構造化されていないデータの処理は困難であり、オープンソースのautomlツールでは広くサポートされていない。
この作業は、AutoMLツールによって自動生成される3つの手作業によるテキスト表現とテキスト埋め込みを比較する。
ベンチマークには、テキスト分類のための4つの人気のあるautomlツールと8つのデータセットが含まれています。
その結果,テキスト埋め込みを自動生成したautomlツールよりも簡易なテキスト表現が優れていることがわかった。
関連論文リスト
- AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - Large Language Models for Automated Data Science: Introducing CAAFE for
Context-Aware Automated Feature Engineering [52.09178018466104]
データセットのセマンティックな特徴を生成するために、コンテキスト認識自動特徴工学(CAAFE)を導入する。
方法論的には単純だが、CAAFEは14のデータセットのうち11のパフォーマンスを改善している。
我々は,AutoMLシステムの範囲をセマンティックなAutoMLに拡張できるコンテキスト認識ソリューションの重要性を強調した。
論文 参考訳(メタデータ) (2023-05-05T09:58:40Z) - An Empirical Study on the Usage of Automated Machine Learning Tools [10.901346577426542]
自動機械学習(AutoML)ツールの人気は、ここ数年で高まっている。
最近の研究は、AutoMLツールを使用した実践者の経験を質的研究した。
我々は,ML実践者がプロジェクトにおいてAutoMLツールをどのように利用するかを理解するための実証的研究を行った。
論文 参考訳(メタデータ) (2022-08-28T02:01:58Z) - Benchmarking Multimodal AutoML for Tabular Data with Text Fields [83.43249184357053]
テキストフィールドを含む18個のマルチモーダルデータテーブルを組み立てる。
このベンチマークにより、研究者は、数値的、分類的、テキスト的特徴を用いて教師あり学習を行うための独自の方法を評価することができる。
論文 参考訳(メタデータ) (2021-11-04T09:29:16Z) - Privileged Zero-Shot AutoML [16.386335031156]
この作業は、データセットと関数記述を使用することで、自動機械学習(AutoML)システムの品質を改善する。
ゼロショットのAutoMLは、実行時間と予測時間を数分からミリ秒に短縮する。
論文 参考訳(メタデータ) (2021-06-25T16:31:05Z) - Comparison of Automated Machine Learning Tools for SMS Spam Message
Filtering [0.0]
Short Message Service (SMS)は、モバイルユーザーによるコミュニケーションに使用される人気のサービスである。
本研究では,SMSスパムメッセージフィルタリングのための3つの自動機械学習(AutoML)ツールの分類性能比較を行った。
実験の結果,アンサンブルモデルが最も優れた分類性能を示した。
論文 参考訳(メタデータ) (2021-06-16T10:16:07Z) - A Neophyte With AutoML: Evaluating the Promises of Automatic Machine
Learning Tools [1.713291434132985]
本稿では,機械学習(ML)経験の少ない人の視点から,現代の自動機械学習(AutoML)ツールについて考察する。
ML技術の使用を簡素化し、民主化するために作られたAutoMLツールは、使いやすくも開発中のツールも数多くある。
論文 参考訳(メタデータ) (2021-01-14T19:28:57Z) - Leveraging Automated Machine Learning for Text Classification:
Evaluation of AutoML Tools and Comparison with Human Performance [0.07734726150561087]
この研究では、13の異なるポピュラーデータセット上の4つのAutoMLツールを比較します。
その結果、AutoMLツールは13のタスクのうち4つで機械学習コミュニティよりも優れています。
論文 参考訳(メタデータ) (2020-12-07T10:31:13Z) - Auto-Sklearn 2.0: Hands-free AutoML via Meta-Learning [45.643809726832764]
第2回ChaLearn AutoMLチャレンジへの勝利を動機とした新しいAutoMLアプローチを紹介します。
我々はPoSH Auto-Sklearnを開発した。これは、厳格な時間制限下で、AutoMLシステムが大きなデータセットでうまく機能することを可能にする。
また、真にハンズフリーなAutoMLに対する解決策を提案する。
論文 参考訳(メタデータ) (2020-07-08T12:41:03Z) - AutoGluon-Tabular: Robust and Accurate AutoML for Structured Data [120.2298620652828]
オープンソースのAutoMLフレームワークであるAutoGluon-Tabularを紹介します。
KaggleとOpenML AutoML Benchmarkの50の分類および回帰タスクからなるスイートのテストによると、AutoGluonはより速く、より堅牢で、はるかに正確である。
論文 参考訳(メタデータ) (2020-03-13T23:10:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。