論文の概要: Company classification using zero-shot learning
- arxiv url: http://arxiv.org/abs/2305.01028v2
- Date: Thu, 26 Oct 2023 20:19:37 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-30 18:17:10.840461
- Title: Company classification using zero-shot learning
- Title(参考訳): ゼロショット学習を用いた企業分類
- Authors: Maryan Rizinski, Andrej Jankov, Vignesh Sankaradas, Eugene Pinsky,
Igor Miskovski, Dimitar Trajanov
- Abstract要約: NLPとゼロショット学習を用いた企業分類手法を提案する。
Wharton Research Data Services(WRDS)を用いて得られたデータセットに対する我々のアプローチを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, natural language processing (NLP) has become increasingly
important in a variety of business applications, including sentiment analysis,
text classification, and named entity recognition. In this paper, we propose an
approach for company classification using NLP and zero-shot learning. Our
method utilizes pre-trained transformer models to extract features from company
descriptions, and then applies zero-shot learning to classify companies into
relevant categories without the need for specific training data for each
category. We evaluate our approach on a dataset obtained through the Wharton
Research Data Services (WRDS), which comprises textual descriptions of publicly
traded companies. We demonstrate that the approach can streamline the process
of company classification, thereby reducing the time and resources required in
traditional approaches such as the Global Industry Classification Standard
(GICS). The results show that this method has potential for automation of
company classification, making it a promising avenue for future research in
this area.
- Abstract(参考訳): 近年,感情分析,テキスト分類,名前付きエンティティ認識など,さまざまなビジネスアプリケーションにおいて自然言語処理(NLP)の重要性が高まっている。
本論文では,NLPとゼロショット学習を用いた企業分類手法を提案する。
本手法は,事前に学習したトランスフォーマモデルを用いて企業説明から特徴を抽出し,各カテゴリの特定のトレーニングデータを必要としない企業を関連カテゴリに分類する。
我々は、上場企業のテキスト記述を含むwharton research data services (wrds) によって得られたデータセットに対するアプローチを評価した。
本稿では,企業分類のプロセスの合理化を図り,グローバル産業分類基準(GICS)などの従来の手法で必要とされる時間と資源を削減できることを実証する。
その結果, この手法は企業分類の自動化の可能性を秘めており, 今後の研究の道筋として有望であることがわかった。
関連論文リスト
- Transductive Learning for Textual Few-Shot Classification in API-based
Embedding Models [46.79078308022975]
わずかなラベル付きデータで新しい分類タスクを実行するために、モデルをトレーニングするショットは少ない。
本稿では,事前学習したモデルの埋め込みを,計算コストとデータプライバシ制約を備えたゲートAPIを通じて提供するシナリオを紹介する。
我々はNLPコミュニティが見落としてきた学習パラダイムであるトランスダクティブ推論を提案する。
論文 参考訳(メタデータ) (2023-10-21T12:47:10Z) - Classifying Organizations for Food System Ontologies using Natural
Language Processing [9.462188694526134]
環境問題に関連する組織を自動的に分類できるNLPモデルを開発した。
入力として、NLPモデルは、組織ごとにGoogle検索エンジンによって検索されるテキストスニペットが提供される。
我々はNLPモデルが知識グラフを蓄積するための情報収集に有望なアプローチであると信じている。
論文 参考訳(メタデータ) (2023-09-19T19:07:48Z) - Bias and Fairness in Large Language Models: A Survey [76.65471160523444]
本稿では,大規模言語モデル(LLM)のバイアス評価と緩和手法に関する総合的な調査を行う。
まず、自然言語処理における社会的偏見と公平性の概念を統合し、形式化し、拡張する。
次に,3つの直感的な2つのバイアス評価法と1つの緩和法を提案し,文献を統一する。
論文 参考訳(メタデータ) (2023-09-02T00:32:55Z) - Named entity recognition using GPT for identifying comparable companies [0.0]
我々は,OpenAIのGPTのような大規模言語モデル(LLM)を用いることで,標準的なエンティティ認識(NER)手法よりも精度と成功率が高いことを示す。
定量的に高い精度を実証し、質的に言えば、適切な競合する企業同士のピアグループを作るのに使用できることを示す。
論文 参考訳(メタデータ) (2023-07-11T16:48:16Z) - Exploring Open-Vocabulary Semantic Segmentation without Human Labels [76.15862573035565]
我々は、既存の事前学習された視覚言語モデル(VL)を利用して意味的セグメンテーションモデルを訓練するZeroSegを提案する。
ZeroSegは、VLモデルで学んだ視覚概念をセグメントトークンの集合に蒸留することでこれを克服し、それぞれが対象画像の局所化領域を要約する。
提案手法は,他のゼロショットセグメンテーション法と比較して,同じトレーニングデータを用いた場合と比較して,最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-01T08:47:06Z) - Open World Classification with Adaptive Negative Samples [89.2422451410507]
オープンワールド分類は、自然言語処理における重要な実践的妥当性と影響を伴う課題である。
そこで本研究では, アンダーライン適応型アンダーラインアンプ (ANS) に基づいて, 学習段階における効果的な合成オープンカテゴリサンプルを生成する手法を提案する。
ANSは最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-03-09T21:12:46Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Transfer Learning for Information Extraction with Limited Data [2.201264358342234]
本稿では,詳細な情報抽出への実践的アプローチを提案する。
まずBERTを利用して、実際のシナリオにおけるトレーニングデータの制限に対処します。
次に、BERTを畳み込みニューラルネットワークで積み重ねて、分類のための隠れ表現を学習する。
論文 参考訳(メタデータ) (2020-03-06T08:08:20Z) - Open-set learning with augmented categories by exploiting unlabelled
data [1.2691047660244337]
この研究は、拡張されたカテゴリによるオープンセット学習と呼ばれる新しい学習方針の中で、観測されたノーベルカテゴリーと観測されていないノーベルカテゴリを一般化する最初のものである。
我々は,オープン・LACUを,肯定的かつ難解な学習,半教師付き学習,オープン・セット認識の統一政策として導入する。
提案したOpen-LACUは、最先端および第一級の結果を得る。
論文 参考訳(メタデータ) (2020-02-04T15:32:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。