論文の概要: Company classification using zero-shot learning
- arxiv url: http://arxiv.org/abs/2305.01028v1
- Date: Mon, 1 May 2023 18:36:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-03 16:19:32.201430
- Title: Company classification using zero-shot learning
- Title(参考訳): ゼロショット学習を用いた企業分類
- Authors: Maryan Rizinski, Andrej Jankov, Vignesh Sankaradas, Eugene Pinsky,
Igor Miskovski, Dimitar Trajanov
- Abstract要約: NLPとゼロショット学習を用いた企業分類手法を提案する。
企業におけるテキスト記述の公開データセットに対するアプローチを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, natural language processing (NLP) has become increasingly
important in a variety of business applications, including sentiment analysis,
text classification, and named entity recognition. In this paper, we propose an
approach for company classification using NLP and zero-shot learning. Our
method utilizes pre-trained transformer models to extract features from company
descriptions, and then applies zero-shot learning to classify companies into
relevant categories without the need for specific training data for each
category. We evaluate our approach on publicly available datasets of textual
descriptions of companies, and demonstrate that it can streamline the process
of company classification, thereby reducing the time and resources required in
traditional approaches such as the Global Industry Classification Standard
(GICS). The results show that this method has potential for automation of
company classification, making it a promising avenue for future research in
this area.
- Abstract(参考訳): 近年,感情分析,テキスト分類,名前付きエンティティ認識など,さまざまなビジネスアプリケーションにおいて自然言語処理(NLP)の重要性が高まっている。
本論文では,NLPとゼロショット学習を用いた企業分類手法を提案する。
本手法は,事前に学習したトランスフォーマモデルを用いて企業説明から特徴を抽出し,各カテゴリの特定のトレーニングデータを必要としない企業を関連カテゴリに分類する。
我々は,企業のテキスト記述の公開データセットに対するアプローチを評価し,企業分類のプロセスを合理化し,グローバル産業分類基準(GICS)などの従来の手法で必要とされる時間と資源を削減できることを実証した。
その結果, この手法は企業分類の自動化の可能性を秘めており, 今後の研究の道筋として有望であることがわかった。
関連論文リスト
- Are Large Language Models Good Classifiers? A Study on Edit Intent Classification in Scientific Document Revisions [62.12545440385489]
大規模言語モデル(LLM)は、テキスト生成の大幅な進歩をもたらしたが、分類タスクの強化の可能性はまだ未検討である。
生成と符号化の両方のアプローチを含む分類のための微調整LDMを徹底的に研究するためのフレームワークを提案する。
我々はこのフレームワークを編集意図分類(EIC)においてインスタンス化する。
論文 参考訳(メタデータ) (2024-10-02T20:48:28Z) - Exploring Fine-grained Retail Product Discrimination with Zero-shot Object Classification Using Vision-Language Models [50.370043676415875]
スマートリテールアプリケーションでは、多数の製品とその頻繁なターンオーバーは信頼性の高いゼロショットオブジェクト分類方法を必要とする。
我々は28の異なる製品カテゴリからなるMIMEXデータセットを紹介した。
我々は、提案したMIMEXデータセット上で、最先端ビジョン言語モデル(VLM)のゼロショットオブジェクト分類性能をベンチマークする。
論文 参考訳(メタデータ) (2024-09-23T12:28:40Z) - Contextuality Helps Representation Learning for Generalized Category Discovery [5.885208652383516]
本稿では、文脈性の概念を活用することにより、一般化カテゴリー発見(GCD)への新たなアプローチを提案する。
我々のモデルでは,コントラスト学習に最も近いコンテキストが使用されるインスタンスレベルと,コントラスト学習を利用するクラスタレベルという,2つのコンテキストレベルを統合している。
文脈情報の統合は、特徴学習を効果的に改善し、その結果、すべてのカテゴリの分類精度が向上する。
論文 参考訳(メタデータ) (2024-07-29T07:30:41Z) - Annotation Guidelines-Based Knowledge Augmentation: Towards Enhancing Large Language Models for Educational Text Classification [11.69740323250258]
大規模言語モデル(LLM)を改善するためのガイドラインベース知識拡張(AGKA)アプローチを提案する。
AGKAはGPT 4.0を使用して、アノテーションガイドラインからラベル定義の知識を取得し、ランダムアンダーサンプラーを適用していくつかの典型的な例を選択する。
実験の結果、AGKAは非微調整LDM(特にGPT 4.0とLlama 3 70B)を増強できることが示された。
論文 参考訳(メタデータ) (2024-06-03T03:09:01Z) - Transductive Learning for Textual Few-Shot Classification in API-based
Embedding Models [46.79078308022975]
わずかなラベル付きデータで新しい分類タスクを実行するために、モデルをトレーニングするショットは少ない。
本稿では,事前学習したモデルの埋め込みを,計算コストとデータプライバシ制約を備えたゲートAPIを通じて提供するシナリオを紹介する。
我々はNLPコミュニティが見落としてきた学習パラダイムであるトランスダクティブ推論を提案する。
論文 参考訳(メタデータ) (2023-10-21T12:47:10Z) - Classifying Organizations for Food System Ontologies using Natural
Language Processing [9.462188694526134]
環境問題に関連する組織を自動的に分類できるNLPモデルを開発した。
入力として、NLPモデルは、組織ごとにGoogle検索エンジンによって検索されるテキストスニペットが提供される。
我々はNLPモデルが知識グラフを蓄積するための情報収集に有望なアプローチであると信じている。
論文 参考訳(メタデータ) (2023-09-19T19:07:48Z) - Bias and Fairness in Large Language Models: A Survey [73.87651986156006]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Open World Classification with Adaptive Negative Samples [89.2422451410507]
オープンワールド分類は、自然言語処理における重要な実践的妥当性と影響を伴う課題である。
そこで本研究では, アンダーライン適応型アンダーラインアンプ (ANS) に基づいて, 学習段階における効果的な合成オープンカテゴリサンプルを生成する手法を提案する。
ANSは最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-03-09T21:12:46Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Open-set learning with augmented categories by exploiting unlabelled
data [1.2691047660244337]
この研究は、拡張されたカテゴリによるオープンセット学習と呼ばれる新しい学習方針の中で、観測されたノーベルカテゴリーと観測されていないノーベルカテゴリを一般化する最初のものである。
我々は,オープン・LACUを,肯定的かつ難解な学習,半教師付き学習,オープン・セット認識の統一政策として導入する。
提案したOpen-LACUは、最先端および第一級の結果を得る。
論文 参考訳(メタデータ) (2020-02-04T15:32:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。