論文の概要: Classification of Tabular Data by Text Processing
- arxiv url: http://arxiv.org/abs/2311.12521v1
- Date: Tue, 21 Nov 2023 10:56:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-23 01:06:36.084063
- Title: Classification of Tabular Data by Text Processing
- Title(参考訳): テキスト処理による表データの分類
- Authors: Keshav Ramani, Daniel Borrajo
- Abstract要約: 本稿では,テクストのテキスト処理技術を用いて分類課題を解決する新しいフレームワークであるテキストベース分類(TBC)を提案する。
いくつかのデータセットに対する実験結果から,このフレームワークは予測されたクラスの精度,精度,リコールにおいて,いくつかの最先端技術モデルに匹敵する性能を発揮することが示された。
- 参考スコア(独自算出の注目度): 1.5275877367371649
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Natural Language Processing technology has advanced vastly in the past
decade. Text processing has been successfully applied to a wide variety of
domains. In this paper, we propose a novel framework, Text Based
Classification(TBC), that uses state of the art text processing techniques to
solve classification tasks on tabular data. We provide a set of controlled
experiments where we present the benefits of using this approach against other
classification methods. Experimental results on several data sets also show
that this framework achieves comparable performance to that of several state of
the art models in accuracy, precision and recall of predicted classes.
- Abstract(参考訳): 自然言語処理技術はこの10年で大きく進歩した。
テキスト処理は、様々なドメインにうまく適用されている。
本稿では,表データ上の分類課題を解決するために,最先端の技術テキスト処理技術を用いた新しいフレームワークであるtext based classification(tbc)を提案する。
我々は,本手法を他の分類法と比較した場合の利点を示す制御実験のセットを提供する。
いくつかのデータセットに対する実験結果から、このフレームワークは予測されたクラスの精度、精度、リコールにおいて、いくつかの最先端技術モデルと同等のパフォーマンスを達成することが示された。
関連論文リスト
- Text Classification using Graph Convolutional Networks: A Comprehensive Survey [11.1080224302799]
グラフ畳み込みネットワーク(GCN)ベースのアプローチは、この10年間、この分野で大きな注目を集めてきた。
本研究の目的は,GCNをベースとしたテキスト分類手法をアーキテクチャや監視方法に関して要約し,分類することである。
論文 参考訳(メタデータ) (2024-10-12T07:03:42Z) - Text Serialization and Their Relationship with the Conventional Paradigms of Tabular Machine Learning [0.0]
本研究では,機械学習タスクにおける特徴表現と予測に言語モデル(LM)をどのように使用できるかを検討する。
本研究は,新しいLM技術が表型機械学習の伝統的なパラダイムとどのように比較されるかを評価する。
以上の結果から,現在の事前学習モデルは従来の手法に取って代わるべきではないことがわかった。
論文 参考訳(メタデータ) (2024-06-19T21:19:37Z) - ChatGraph: Interpretable Text Classification by Converting ChatGPT
Knowledge to Graphs [54.48467003509595]
ChatGPTは、様々な自然言語処理(NLP)タスクにおいて優れたパフォーマンスを示している。
テキスト分類などの特定のタスクにChatGPTのパワーを利用する新しいフレームワークを提案する。
本手法は,従来のテキスト分類法と比較して,より透過的な意思決定プロセスを提供する。
論文 参考訳(メタデータ) (2023-05-03T19:57:43Z) - Document Provenance and Authentication through Authorship Classification [5.2545206693029884]
本稿では,単一文書と複数文書の分類のためのアンサンブルベースのテキスト処理フレームワークを提案する。
提案するフレームワークには,最先端のテキスト分類アルゴリズムがいくつか組み込まれている。
フレームワークは大規模なベンチマークデータセットで評価される。
論文 参考訳(メタデータ) (2023-03-02T12:26:03Z) - Evaluating Unsupervised Text Classification: Zero-shot and
Similarity-based Approaches [0.6767885381740952]
類似性に基づくアプローチは、テキスト文書表現とクラス記述表現の類似性に基づいてインスタンスを分類しようとする。
ゼロショットテキスト分類手法は、未知クラスの適切なラベルをテキスト文書に割り当てることで、トレーニングタスクから得られる知識を一般化することを目的としている。
本稿では, 類似度に基づくゼロショットとゼロショットのアプローチを, 未確認クラスのテキスト分類のために体系的に評価する。
論文 参考訳(メタデータ) (2022-11-29T15:14:47Z) - Selective Text Augmentation with Word Roles for Low-Resource Text
Classification [3.4806267677524896]
異なる単語はテキスト分類において異なる役割を担い、それによってテキスト拡張の適切な役割を戦略的に選択することができる。
本研究では,まず,テキスト中の単語とテキストカテゴリの関係を,統計的相関と意味的類似性の観点から同定する。
本稿では,STA(Selective Text Augmentation)と呼ばれる新たな拡張手法を提案する。
論文 参考訳(メタデータ) (2022-09-04T08:13:11Z) - Many-Class Text Classification with Matching [65.74328417321738]
textbfText textbfClassification をテキストとラベル間のtextbfMatching 問題として定式化し,TCM というシンプルなフレームワークを提案する。
従来のテキスト分類手法と比較して、TCMは分類ラベルのきめ細かい意味情報を活用している。
論文 参考訳(メタデータ) (2022-05-23T15:51:19Z) - LeQua@CLEF2022: Learning to Quantify [76.22817970624875]
LeQua 2022は、テキストデータセットで'を定量化する方法を評価するための新しい実験室である。
本研究の目的は、バイナリ設定とシングルラベルのマルチクラス設定の両方において、学習方法の比較評価のための設定を提供することである。
論文 参考訳(メタデータ) (2021-11-22T14:54:20Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Deep Learning Based Text Classification: A Comprehensive Review [75.8403533775179]
本稿では,近年開発されたテキスト分類のための150以上のディープラーニングモデルについてレビューする。
また、テキスト分類に広く使われている40以上の一般的なデータセットの要約も提供する。
論文 参考訳(メタデータ) (2020-04-06T02:00:30Z) - Exploring the Limits of Transfer Learning with a Unified Text-to-Text
Transformer [64.22926988297685]
下流タスクで微調整される前に、まずデータリッチタスクでモデルが事前訓練されるトランスファーラーニングは、自然言語処理(NLP)において強力な手法として登場した。
本稿では,すべてのテキストベースの言語問題をテキスト・トゥ・テキスト・フォーマットに変換する統一フレームワークにより,NLPのためのトランスファー学習手法を導入する状況について検討する。
論文 参考訳(メタデータ) (2019-10-23T17:37:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。