論文の概要: Hierarchical thematic classification of major conference proceedings
- arxiv url: http://arxiv.org/abs/2406.14983v1
- Date: Fri, 21 Jun 2024 08:48:57 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-24 14:03:36.940634
- Title: Hierarchical thematic classification of major conference proceedings
- Title(参考訳): 主要な会議手続の階層的テーマ分類
- Authors: Arsentii Kuzmin, Alexander Aduenko, Vadim Strijov,
- Abstract要約: 木という形態で専門家が与えるトピックの階層構造を固定したテキストコレクションを考察する。
システムは、ある文書に関連付けてトピックを分類する。
トピック関連性を計算するために,重み付き階層的類似度関数を提案する。
- 参考スコア(独自算出の注目度): 44.99833362998488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we develop a decision support system for the hierarchical text classification. We consider text collections with a fixed hierarchical structure of topics given by experts in the form of a tree. The system sorts the topics by relevance to a given document. The experts choose one of the most relevant topics to finish the classification. We propose a weighted hierarchical similarity function to calculate topic relevance. The function calculates the similarity of a document and a tree branch. The weights in this function determine word importance. We use the entropy of words to estimate the weights. The proposed hierarchical similarity function formulates a joint hierarchical thematic classification probability model of the document topics, parameters, and hyperparameters. The variational Bayesian inference gives a closed-form EM algorithm. The EM algorithm estimates the parameters and calculates the probability of a topic for a given document. Compared to hierarchical multiclass SVM, hierarchical PLSA with adaptive regularization, and hierarchical naive Bayes, the weighted hierarchical similarity function has better improvement in ranking accuracy in an abstract collection of a major conference EURO and a website collection of industrial companies.
- Abstract(参考訳): 本稿では,階層型テキスト分類のための意思決定支援システムを開発する。
木という形態で専門家が与えるトピックの階層構造を固定したテキストコレクションを考察する。
システムは、ある文書に関連するトピックを分類する。
専門家は、分類を完了する最も関連性の高いトピックの1つを選択します。
トピック関連性を計算するために,重み付き階層的類似度関数を提案する。
関数は文書と木の枝の類似性を計算する。
この関数の重みは単語の重要性を決定する。
私たちは単語のエントロピーを使って重みを見積もる。
提案した階層的類似関数は,文書のトピック,パラメータ,ハイパーパラメータの階層的分類確率モデルを定式化する。
変分ベイズ予想は閉形式EMアルゴリズムを与える。
EMアルゴリズムはパラメータを推定し、与えられた文書のトピックの確率を算出する。
階層型マルチクラスSVM,適応正規化を伴う階層型PLSA,階層型ナイーブベイズに比べ,重み付き階層型類似性関数は,主要な会議であるEUROと産業企業のウェブサイトの要約コレクションにおいて,ランキング精度の向上を図っている。
関連論文リスト
- Hierarchical Multi-Label Classification of Scientific Documents [47.293189105900524]
我々はSciHTCと呼ばれる科学論文の階層的多ラベルテキスト分類のための新しいデータセットを提案する。
このデータセットは、ACM CCSツリーから186,160の論文と1,233のカテゴリを含んでいる。
我々の最良のモデルでは、マクロF1スコアが34.57%に達し、このデータセットが大きな研究機会を提供することを示す。
論文 参考訳(メタデータ) (2022-11-05T04:12:57Z) - Long Document Summarization with Top-down and Bottom-up Inference [113.29319668246407]
本稿では、2つの側面の要約モデルを改善するための原則的推論フレームワークを提案する。
我々のフレームワークは、トップレベルが長距離依存性をキャプチャするドキュメントの階層的な潜在構造を前提としています。
本稿では,様々な要約データセットに対して提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-03-15T01:24:51Z) - Conical Classification For Computationally Efficient One-Class Topic
Determination [0.0]
本稿では,特定のトピックに関連する文書を識別するコニカル分類手法を提案する。
分析の結果、我々のアプローチはデータセットの予測能力が高く、計算も高速であることがわかった。
論文 参考訳(メタデータ) (2021-10-31T01:27:12Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - TagRec: Automated Tagging of Questions with Hierarchical Learning
Taxonomy [0.0]
オンライン教育プラットフォームは、階層的な学習分類に基づく学術的な質問を組織する
本稿では,分類学と質問のセマンティック関連性を最適化する類似性に基づく検索タスクとして,問題を定式化する。
本研究では,本手法が未確認ラベルの扱いに役立ち,野生の分類学的タグ付けに有効であることを示す。
論文 参考訳(メタデータ) (2021-07-03T11:50:55Z) - Sawtooth Factorial Topic Embeddings Guided Gamma Belief Network [49.458250193768826]
本稿では,文書の深部生成モデルであるGBNのソートゥース要素埋め込みについて述べる。
単語も話題も同じ次元の埋め込みベクトルとして表現される。
我々のモデルは、より深い解釈可能なトピックを抽出する他のニューラルネットワークモデルよりも優れています。
論文 参考訳(メタデータ) (2021-06-30T10:14:57Z) - Pitfalls of Assessing Extracted Hierarchies for Multi-Class
Classification [4.89253144446913]
私たちは、実践者がメソッドについて誤解を招くような結論を下すかもしれない、一般的な落とし穴を特定します。
階層の質が実験的な設定によってどう無関係になるかを示す。
その結果,多くのクラスを持つデータセットは,これらのクラスが相互に関係する複雑な構造を持つことが明らかとなった。
論文 参考訳(メタデータ) (2021-01-26T21:50:57Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - Deep Hierarchical Classification for Category Prediction in E-commerce
System [16.6932395109085]
電子商取引システムでは、カテゴリ予測は与えられたテキストのカテゴリを自動的に予測する。
ニューラルネットワークにマルチスケール階層情報を組み込んだDeep Hierarchical Classificationフレームワークを提案する。
また、階層的予測損失を罰する新たな複合損失関数も定義する。
論文 参考訳(メタデータ) (2020-05-14T02:29:14Z) - Efficient strategies for hierarchical text classification: External
knowledge and auxiliary tasks [3.5557219875516655]
我々は、あるクラス分類の上位から下位まで、文書のカテゴリを予測するための一連の推論手順を実行する。
効率的なアプローチでは、よく知られた2つの英語データセットにおいて、パラメータを劇的に減らし、過去の研究を上回りました。
論文 参考訳(メタデータ) (2020-05-05T20:22:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。