論文の概要: A Unified Framework to Classify Business Activities into International Standard Industrial Classification through Large Language Models for Circular Economy
- arxiv url: http://arxiv.org/abs/2409.18988v1
- Date: Tue, 17 Sep 2024 05:30:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 05:10:43.394433
- Title: A Unified Framework to Classify Business Activities into International Standard Industrial Classification through Large Language Models for Circular Economy
- Title(参考訳): 循環経済のための大規模言語モデルによるビジネス活動の国際標準産業分類への統一化フレームワーク
- Authors: Xiang Li, Lan Zhao, Junhao Ren, Yajuan Sun, Chuan Fu Tan, Zhiquan Yeo, Gaoxi Xiao,
- Abstract要約: 本稿では,Large Language Models(LLMs)を利用して,経済活動に関するテキストデータを国際標準産業分類(ISIC)に分類する。
提案手法は, GPT-2モデルを微調整した182ラベルテストデータセットに対して95%の精度で達成する。
この研究は、持続可能な循環経済の実践を促進するグローバルな取り組みに寄与する。
- 参考スコア(独自算出の注目度): 4.521283981812536
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Effective information gathering and knowledge codification are pivotal for developing recommendation systems that promote circular economy practices. One promising approach involves the creation of a centralized knowledge repository cataloguing historical waste-to-resource transactions, which subsequently enables the generation of recommendations based on past successes. However, a significant barrier to constructing such a knowledge repository lies in the absence of a universally standardized framework for representing business activities across disparate geographical regions. To address this challenge, this paper leverages Large Language Models (LLMs) to classify textual data describing economic activities into the International Standard Industrial Classification (ISIC), a globally recognized economic activity classification framework. This approach enables any economic activity descriptions provided by businesses worldwide to be categorized into the unified ISIC standard, facilitating the creation of a centralized knowledge repository. Our approach achieves a 95% accuracy rate on a 182-label test dataset with fine-tuned GPT-2 model. This research contributes to the global endeavour of fostering sustainable circular economy practices by providing a standardized foundation for knowledge codification and recommendation systems deployable across regions.
- Abstract(参考訳): 循環経済の実践を促進するレコメンデーションシステムの開発には,効果的な情報収集と知識の体系化が重要である。
有望なアプローチの1つは、歴史的廃棄物から資源へのトランザクションをカタログ化する集中型知識リポジトリの作成であり、これはその後、過去の成功に基づいてレコメンデーションの生成を可能にする。
しかし、そのような知識リポジトリを構築する上で重要な障壁は、地域によって異なるビジネス活動を表す普遍的な標準化された枠組みが存在しないことである。
この課題に対処するために,本稿では,大規模言語モデル(LLM)を用いて,経済活動を記述するテキストデータを国際標準産業分類(ISIC)に分類する。
このアプローチにより、世界中の企業が提供している経済活動の記述をISIC標準に分類することが可能となり、集中型知識リポジトリの作成が容易になる。
提案手法は, GPT-2モデルを微調整した182ラベルテストデータセットに対して95%の精度で達成する。
本研究は、地域間で展開可能な知識体系化・推薦システムのための標準化された基盤を提供することにより、持続可能な循環経済プラクティスを育成するグローバルな取り組みに寄与する。
関連論文リスト
- Unlocking NACE Classification Embeddings with OpenAI for Enhanced Analysis and Processing [0.0]
欧州共同体における経済活動統計分類(英: Statistical Classification of Economic Activity in the European Community, NACE)は、欧州連合内の経済活動と産業活動の分類の標準分類体系である。
本稿では,NACE分類を低次元埋め込みに変換するための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-17T19:49:46Z) - GeoSEE: Regional Socio-Economic Estimation With a Large Language Model [17.31652821477571]
大規模言語モデル(LLM)を用いた統合パイプラインを用いて,様々な社会経済指標を推定できるGeoSEEを提案する。
システムは、自然言語ベースのテキストフォーマットで選択したモジュールの結果を集約した後、コンテキスト内学習を通じてターゲットインジケータを算出する。
本手法は、教師なしコンテキストとローショットコンテキストの両方において、他の予測モデルよりも優れている。
論文 参考訳(メタデータ) (2024-06-14T07:50:22Z) - Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
大規模テキストコーパスで事前訓練されたLarge Language Models (LLMs) は、推奨システムを強化するための有望な道を示す。
オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-07T04:00:30Z) - FinGPT: Instruction Tuning Benchmark for Open-Source Large Language
Models in Financial Datasets [9.714447724811842]
本稿では,オープンソースの大規模言語モデルに対して,インストラクションチューニングパラダイムに固有のアプローチを導入する。
私たちは、オープンソースのモデルの相互運用性に乗じて、シームレスで透過的な統合を確保します。
本稿では,エンドツーエンドのトレーニングとテストのためのベンチマーク手法を提案し,費用対効果を生かした。
論文 参考訳(メタデータ) (2023-10-07T12:52:58Z) - Cross-Lingual NER for Financial Transaction Data in Low-Resource
Languages [70.25418443146435]
半構造化テキストデータにおける言語間名前認識のための効率的なモデリングフレームワークを提案する。
我々は2つの独立したSMSデータセットを英語とアラビア語で使用し、それぞれが半構造化された銀行取引情報を持っている。
わずか30のラベル付きサンプルにアクセスすることで、我々のモデルは、英語からアラビア語までの商人、金額、その他の分野の認識を一般化することができる。
論文 参考訳(メタデータ) (2023-07-16T00:45:42Z) - KoLA: Carefully Benchmarking World Knowledge of Large Language Models [87.96683299084788]
我々は知識指向LLMアセスメントベンチマーク(KoLA)を構築した。
人間の認知を模倣して、知識関連能力の4段階の分類を形成し、19ドルのタスクをカバーします。
私たちは、LLMによって事前訓練されたコーパスであるウィキペディアと、継続的に収集された新興コーパスを使用して、目に見えないデータや進化する知識を扱う能力を評価します。
論文 参考訳(メタデータ) (2023-06-15T17:20:46Z) - Company classification using zero-shot learning [0.0]
NLPとゼロショット学習を用いた企業分類手法を提案する。
Wharton Research Data Services(WRDS)を用いて得られたデータセットに対する我々のアプローチを評価する。
論文 参考訳(メタデータ) (2023-05-01T18:36:06Z) - Open World Classification with Adaptive Negative Samples [89.2422451410507]
オープンワールド分類は、自然言語処理における重要な実践的妥当性と影響を伴う課題である。
そこで本研究では, アンダーライン適応型アンダーラインアンプ (ANS) に基づいて, 学習段階における効果的な合成オープンカテゴリサンプルを生成する手法を提案する。
ANSは最先端の手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-03-09T21:12:46Z) - Knowledge-Aware Federated Active Learning with Non-IID Data [75.98707107158175]
本稿では,アノテーション予算に制限のあるグローバルモデルを効率的に学習するための,連合型アクティブラーニングパラダイムを提案する。
フェデレートされたアクティブラーニングが直面する主な課題は、サーバ上のグローバルモデルのアクティブサンプリング目標と、ローカルクライアントのアクティブサンプリング目標とのミスマッチである。
本稿では,KSAS (Knowledge-Aware Federated Active Learning) とKCFU (Knowledge-Compensatory Federated Update) を組み合わせた,知識対応型アクティブ・ラーニング(KAFAL)を提案する。
論文 参考訳(メタデータ) (2022-11-24T13:08:43Z) - The Open-World Lottery Ticket Hypothesis for OOD Intent Classification [68.93357975024773]
我々はOODに対するモデル過信の根本的な原因を明かした。
Lottery Ticket仮説も,オープンワールドシナリオに拡張しています。
論文 参考訳(メタデータ) (2022-10-13T14:58:35Z) - Industry Adoption Scenarios for Authoritative Data Stores using the ISDA
Common Domain Model [0.0]
我々は、効率を大幅に向上し、コストを削減するために、ポストトレーダ業界が標準化し、単純化する機会を探る。
この中には、貿易のライフサイクルを通じて、ビジネスイベントやプロセスのデジタル表現の標準セットとして、国際スワップ・デリバティブズ・アソシエーション・コモン・ドメイン・モデル(CDM)への移行も含まれる。
論文 参考訳(メタデータ) (2020-07-13T16:59:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。