論文の概要: An Ensemble-based approach for assigning text to correct Harmonized
system code
- arxiv url: http://arxiv.org/abs/2211.04313v1
- Date: Tue, 8 Nov 2022 15:32:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 16:29:52.936863
- Title: An Ensemble-based approach for assigning text to correct Harmonized
system code
- Title(参考訳): Harmonized System Code の修正にテキストを割り当てる Ensemble ベースのアプローチ
- Authors: Shubham, Avinash Arya, Subarna Roy, Sridhar Jonnala
- Abstract要約: ハーモナイズドシステム(HS)は、業界分類システムの中で、取引された商品を分類する最も標準化された数値手法である。
Bert-transformer, NER, 距離ベースアプローチ, 知識グラフからなる階層型アンサンブルモデルは, 未知のテキスト記述をHS法で分類する際に, スケーラビリティ, カバレッジ, ニュアンスを捕捉する能力, 自動化, 監査要求に対処するために開発された。
- 参考スコア(独自算出の注目度): 2.365702128814616
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Industries must follow government rules and regulations around the world to
classify products when assessing duties and taxes for international shipment.
Harmonized System (HS) is the most standardized numerical method of classifying
traded products among industry classification systems. A hierarchical ensemble
model comprising of Bert- transformer, NER, distance-based approaches, and
knowledge-graphs have been developed to address scalability, coverage, ability
to capture nuances, automation and auditing requirements when classifying
unknown text-descriptions as per HS method.
- Abstract(参考訳): 産業は、国際出荷の義務や税金を評価する際に、世界中の政府の規則や規制に従って製品を分類しなければならない。
ハーモン化システム(harmonized system, hs)は、産業分類システムの中で最も標準化された商品の分類方法である。
Bert-transformer, NER, 距離ベースアプローチ, 知識グラフからなる階層型アンサンブルモデルは, 未知のテキスト記述をHS法で分類する際に, スケーラビリティ, カバレッジ, ニュアンスを捕捉する能力, 自動化, 監査要求に対処するために開発された。
関連論文リスト
- An Open Knowledge Graph-Based Approach for Mapping Concepts and Requirements between the EU AI Act and International Standards [1.9142148274342772]
EUのAI法は、規制の遵守に関する技術的要件に従って、そのような組織の焦点をシフトする。
本稿では、規則や標準における規範文に関連する用語と要件をマッピングするための、シンプルで繰り返し可能なメカニズムを提供する。
論文 参考訳(メタデータ) (2024-08-21T18:21:09Z) - Learnable Item Tokenization for Generative Recommendation [78.30417863309061]
LETTER (Larnable Tokenizer for generaTivE Recommendation) を提案する。
LETTERは、セマンティック正規化のためのResidual Quantized VAE、協調正規化のためのコントラストアライメント損失、コードの割り当てバイアスを軽減するための多様性損失を組み込んでいる。
論文 参考訳(メタデータ) (2024-05-12T15:49:38Z) - Towards Standards-Compliant Assistive Technology Product Specifications via LLMs [7.30389619012625]
我々は、AT製品仕様のコンプライアンスプロセスを合理化するための先駆的なフレームワークであるCompliATを紹介します。
CompliATは3つの重要なタスクに対処する。一貫性の用語をチェックし、標準に従って製品を分類し、主要な製品仕様を標準要件にトレースする。
本稿では,国際標準に適合するAT製品を正確に分類するために,検索拡張生成モデルを活用する新しい製品分類手法を提案する。
論文 参考訳(メタデータ) (2024-04-04T00:10:39Z) - RulePrompt: Weakly Supervised Text Classification with Prompting PLMs and Self-Iterative Logical Rules [30.239044569301534]
弱教師付きテキスト分類(WSTC)は、大量のテキストを分類できるため、注目を集めている。
本稿では,ルールマイニングモジュールとルール強化擬似ラベル生成モジュールからなるWSTCタスクに対して,ルールプロンプトというPLMベースのアプローチを提案する。
提案手法は解釈可能なカテゴリー規則を導出し,難解なカテゴリを曖昧にすることの利点を証明した。
論文 参考訳(メタデータ) (2024-03-05T12:50:36Z) - Gen-Z: Generative Zero-Shot Text Classification with Contextualized
Label Descriptions [50.92702206798324]
ゼロショットテキスト分類のための生成的プロンプトフレームワークを提案する。
GEN-Zはラベルの自然言語記述に基づく入力テキストのLM可能性を測定する。
データソースの文脈化によるゼロショット分類は、ゼロショットベースラインと少数ショットベースラインの両方を一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2023-11-13T07:12:57Z) - Prompt Tuned Embedding Classification for Multi-Label Industry Sector Allocation [2.024620791810963]
本研究では,マルチラベルテキスト分類のためのPrompt Tuningとベースラインの性能をベンチマークする。
企業を投資会社の独自産業分類に分類するために適用される。
このモデルのパフォーマンスは、よく知られた企業とあまり知られていない企業の両方で一貫していることを確認します。
論文 参考訳(メタデータ) (2023-09-21T13:45:32Z) - Using novel data and ensemble models to improve automated labeling of
Sustainable Development Goals [0.0]
国連(UN)の持続可能な開発目標の作業を監視するために、テキストに基づくラベル付けシステムが提案されている。
系はその特異性(真正レート)と感度(真負レート)で大きく異なることを示す。
次に、ラベリングシステムをプールするアンサンブルモデルにより、これらの制限を緩和し、現在利用可能な全システムのラベリング性能を上回ることを示す。
論文 参考訳(メタデータ) (2023-01-25T07:44:46Z) - Hybrid Rule-Neural Coreference Resolution System based on Actor-Critic
Learning [53.73316523766183]
コアレゾリューションシステムは2つの主要なタスクに取り組む必要がある。
ひとつのタスクは、潜在的な言及のすべてを検出することであり、もう1つは、可能な言及ごとに前者のリンクを学習することである。
本稿では,アクター・クリティカル・ラーニングに基づく複合ルール・ニューラル・コア参照解決システムを提案する。
論文 参考訳(メタデータ) (2022-12-20T08:55:47Z) - Learning Label Modular Prompts for Text Classification in the Wild [56.66187728534808]
そこで本研究では,非定常学習/テスト段階の異なるテキスト分類手法を提案する。
複雑なタスクをモジュラー成分に分解することで、そのような非定常環境下での堅牢な一般化が可能になる。
テキスト分類タスクのためのラベルモジュール型プロンプトチューニングフレームワークMODcularPROMPTを提案する。
論文 参考訳(メタデータ) (2022-11-30T16:26:38Z) - Token-level Sequence Labeling for Spoken Language Understanding using
Compositional End-to-End Models [94.30953696090758]
音声合成言語理解システムを構築した。
ASRのために訓練された中間デコーダを頼りにすることで、私たちのエンドツーエンドシステムは、入力モダリティを音声からトークンレベルの表現に変換する。
我々のモデルは、名前付きエンティティ認識のラベル付けタスクにおいて、カスケードモデルと直接エンド・ツー・エンドモデルの両方より優れている。
論文 参考訳(メタデータ) (2022-10-27T19:33:18Z) - Interpretable Reinforcement Learning with Multilevel Subgoal Discovery [77.34726150561087]
離散環境のための新しい強化学習モデルを提案する。
モデルでは、エージェントは確率的ルールの形で環境に関する情報を学習する。
学習には報酬関数は不要であり、エージェントは達成するための第一の目標のみを与える必要がある。
論文 参考訳(メタデータ) (2022-02-15T14:04:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。