論文の概要: A centroid based framework for text classification in itsm environments
- arxiv url: http://arxiv.org/abs/2511.20667v1
- Date: Wed, 12 Nov 2025 15:44:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.319874
- Title: A centroid based framework for text classification in itsm environments
- Title(参考訳): テキスト分類のためのセンタロイドベースのフレームワーク
- Authors: Hossein Mohanna, Ali Ait-Bachir,
- Abstract要約: 本稿では,カテゴリごとのセマンティック表現とセントロイド表現を分離したセマンティック分類フレームワークを提案する。
123カテゴリのチケット8,968枚で評価され、トレーニングの5.9倍、インクリメンタルアップデートの152倍の高速化を実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text classification with hierarchical taxonomies is a fundamental requirement in IT Service Management (ITSM) systems, where support tickets must be categorized into tree-structured taxonomies. We present a dual-embedding centroid-based classification framework that maintains separate semantic and lexical centroid representations per category, combining them through reciprocal rank fusion at inference time. The framework achieves performance competitive with Support Vector Machines (hierarchical F1: 0.731 vs 0.727) while providing interpretability through centroid representations. Evaluated on 8,968 ITSM tickets across 123 categories, this method achieves 5.9 times faster training and up to 152 times faster incremental updates. With 8.6-8.8 times speedup across batch sizes (100-1000 samples) when excluding embedding computation. These results make the method suitable for production ITSM environments prioritizing interpretability and operational efficiency.
- Abstract(参考訳): 階層分類を用いたテキスト分類はITSM(IT Service Management)システムの基本要件であり、サポートチケットを木構造分類に分類しなければならない。
本稿では,カテゴリごとのセマンティック表現とレキシカルセントロイド表現を分離したセマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック・セマンティック
このフレームワークはSupport Vector Machines(階層型F1: 0.731 vs 0.727)と性能を競い合う。
123カテゴリの8,968 ITSMチケットで評価され、トレーニングの5.9倍、インクリメンタルアップデートの152倍の高速化を実現している。
埋め込み計算を除いた場合、バッチサイズ(100-1000サンプル)で8.6-8.8倍のスピードアップを行う。
これらの結果から,解釈性と運用効率を優先したITS環境の製作に適した方法が得られた。
関連論文リスト
- Break the Tie: Learning Cluster-Customized Category Relationships for Categorical Data Clustering [51.11677202873771]
定性的な値を持つカテゴリ属性は、実際のデータセットのクラスタ分析においてユビキタスである。
数値属性のユークリッド距離とは異なり、分類属性はそれらの可能な値の明確な関係を欠いている。
本稿では属性カテゴリの固有関係関係を破り、様々なクラスタ分布を柔軟に明らかにするのに適したカスタマイズされた距離メトリクスを学習する。
論文 参考訳(メタデータ) (2025-11-12T06:57:24Z) - MAFA: A Multi-Agent Framework for Enterprise-Scale Annotation with Configurable Task Adaptation [0.0]
本稿では,企業規模のアノテーションをマルチエージェントコラボレーションによって変換する実運用システムを提案する。
Mafaは、平均86%のアノテータとの合意を達成しながら、100万の発話バックログを削除した。
論文 参考訳(メタデータ) (2025-10-16T00:30:08Z) - GLiClass: Generalist Lightweight Model for Sequence Classification Tasks [49.2639069781367]
本稿では,シーケンス分類タスクにGLiNERアーキテクチャを適用する新しい手法であるGLiClassを提案する。
提案手法は,ゼロショットおよび少数ショット学習シナリオに必要な柔軟性を維持しつつ,埋め込み方式に匹敵する高い精度と効率を実現する。
論文 参考訳(メタデータ) (2025-08-11T06:22:25Z) - IOCC: Aligning Semantic and Cluster Centers for Few-shot Short Text Clustering [15.657808381423736]
クラスタリングタスクでは、特徴空間を明確で分離された分布に構造化することが不可欠である。
本稿では,クラスタセンターとセマンティックセンターのアライメントを実現するための,数発のコントラスト学習手法であるIOCCを提案する。
IOCCは従来の手法より優れており、バイオメディカルデータセットの課題に対して最大7.34%の改善が達成されている。
論文 参考訳(メタデータ) (2025-08-08T08:47:13Z) - A Dynamic Framework for Semantic Grouping of Common Data Elements (CDE) Using Embeddings and Clustering [0.782496834711349]
本研究の目的は、異種バイオメディカルデータセット間の共通データ要素(CDE)の調和を容易にする動的でスケーラブルなフレームワークを開発することである。
本手法では,CDEを意味的関係やパターンをキャプチャする高密度ベクトルに変換するコンテキスト対応テキスト埋め込みに,Large Language Models (LLMs) を利用する。
論文 参考訳(メタデータ) (2025-06-02T18:43:37Z) - MOKD: Cross-domain Finetuning for Few-shot Classification via Maximizing Optimized Kernel Dependence [97.93517982908007]
NCCは、ドメイン間数ショットの分類において、少数ショットの分類が可能なメートル法空間を構築するために表現を学ぶことを目的としている。
本稿では,異なるクラスから得られた2つの標本の NCC 学習表現に高い類似性があることを見出した。
ラベル付きデータによって示されるクラスタ構造にマッチするクラス固有の表現の集合を学習するために、最適化されたカーネル依存(MOKD)を最大化する二段階最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-29T05:59:52Z) - LSTM-based Deep Neural Network With A Focus on Sentence Representation for Sequential Sentence Classification in Medical Scientific Abstracts [37.514112936955236]
文レベルでの包括的文表現に焦点をあてたLSTMに基づくディープラーニングネットワークを提案する。
提案システムでは,最先端システムと比較して高い競争力が得られる。
論文 参考訳(メタデータ) (2024-01-29T03:05:35Z) - ProTeCt: Prompt Tuning for Taxonomic Open Set Classification [59.59442518849203]
分類学的オープンセット(TOS)設定では、ほとんどショット適応法はうまくいきません。
本稿では,モデル予測の階層的一貫性を校正する即時チューニング手法を提案する。
次に,階層整合性のための新しいPrompt Tuning(ProTeCt)手法を提案し,ラベル集合の粒度を分類する。
論文 参考訳(メタデータ) (2023-06-04T02:55:25Z) - Merging Subject Matter Expertise and Deep Convolutional Neural Network
for State-Based Online Machine-Part Interaction Classification [5.216662889312795]
機械部品のインタラクション分類は、スマートマニュファクチャリング(SM)の重要イネーブルであるCyber-Physical Systems(CPS)が必要とする重要な機能である
本研究では,Deep Convolutional Neural Network (CNN) ベースのフレームワークを用いて,機械部品間相互作用の点検出と時系列分類を行う。
論文 参考訳(メタデータ) (2021-12-08T20:23:13Z) - CoPHE: A Count-Preserving Hierarchical Evaluation Metric in Large-Scale
Multi-Label Text Classification [70.554573538777]
ニューラルLMTCモデルの予測の階層的評価について論じる。
先行技術における構造化ラベル空間の表現における構造的問題について述べる。
深度に基づく表現を用いた階層的評価のための指標セットを提案する。
論文 参考訳(メタデータ) (2021-09-10T13:09:12Z) - Fine-Grained Visual Classification with Efficient End-to-end
Localization [49.9887676289364]
本稿では,エンド・ツー・エンドの設定において,分類ネットワークと融合可能な効率的なローカライゼーションモジュールを提案する。
我々は,CUB200-2011,Stanford Cars,FGVC-Aircraftの3つのベンチマークデータセット上で,新しいモデルを評価する。
論文 参考訳(メタデータ) (2020-05-11T14:07:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。