論文の概要: Using Zero-shot Prompting in the Automatic Creation and Expansion of
Topic Taxonomies for Tagging Retail Banking Transactions
- arxiv url: http://arxiv.org/abs/2401.06790v2
- Date: Sun, 11 Feb 2024 15:54:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 20:55:22.738610
- Title: Using Zero-shot Prompting in the Automatic Creation and Expansion of
Topic Taxonomies for Tagging Retail Banking Transactions
- Title(参考訳): 商品取引タグ付けにおける話題分類の自動作成と拡張におけるゼロショットプロンプトの利用
- Authors: Daniel de S. Moraes, Pedro T. C. Santos, Polyana B. da Costa, Matheus
A. S. Pinto, Ivan de J. P. Pinto, \'Alvaro M. G. da Veiga, Sergio Colcher,
Antonio J. G. Busson, Rafael H. Rocha, Rennan Gaio, Rafael Miceli, Gabriela
Tourinho, Marcos Rabaioli, Leandro Santos, Fellipe Marques, David Favaro
- Abstract要約: 本研究は、命令ベース微調整LDMを用いたトピックの構築と拡張のための教師なし手法を提案する(大規模言語モデル)。
既存の分類を新しい用語で拡張するために、ゼロショットプロンプトを使用して、新しいノードを追加する場所を見つける。
得られたタグを使って、小売銀行のデータセットから商人を特徴づけるタグを割り当てます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work presents an unsupervised method for automatically constructing and
expanding topic taxonomies using instruction-based fine-tuned LLMs (Large
Language Models). We apply topic modeling and keyword extraction techniques to
create initial topic taxonomies and LLMs to post-process the resulting terms
and create a hierarchy. To expand an existing taxonomy with new terms, we use
zero-shot prompting to find out where to add new nodes, which, to our
knowledge, is the first work to present such an approach to taxonomy tasks. We
use the resulting taxonomies to assign tags that characterize merchants from a
retail bank dataset. To evaluate our work, we asked 12 volunteers to answer a
two-part form in which we first assessed the quality of the taxonomies created
and then the tags assigned to merchants based on that taxonomy. The evaluation
revealed a coherence rate exceeding 90% for the chosen taxonomies. The
taxonomies' expansion with LLMs also showed exciting results for parent node
prediction, with an f1-score above 70% in our taxonomies.
- Abstract(参考訳): 本研究では,命令ベースの微調整 LLM (Large Language Models) を用いてトピック分類を自動構築・拡張するための教師なし手法を提案する。
トピックモデリングとキーワード抽出技術を用いて、最初のトピック分類法とLLMを作成し、結果の項を後処理し、階層を作成する。
既存の分類を新しい用語で拡張するために、ゼロショットプロンプトを使用して、新しいノードをどこに追加するかを見つける。
結果の分類を使って、小売銀行のデータセットから商人を特徴付けるタグを割り当てます。
作業を評価するため,12名のボランティアに,作成した分類の質を最初に評価し,その分類に基づいて商人に割り当てられたタグについて回答を求めた。
評価の結果,選択した分類群では90%を超えるコヒーレンス率を示した。
また, LLMによる分類学の拡張は, 親ノード予測のエキサイティングな結果を示し, うちの分類学ではf1スコアが70%以上であった。
関連論文リスト
- Creating a Fine Grained Entity Type Taxonomy Using LLMs [0.0]
本研究は, GPT-4とその先進的な反復である GPT-4 Turbo が, 詳細な実体型分類学を自律的に開発する可能性について検討する。
我々の目的は、広く分類されたエンティティタイプから始まる包括的な分類体系を構築することである。
この分類は、GPT-4の内部知識ベースを利用して反復的なプロンプト技術によって徐々に洗練される。
論文 参考訳(メタデータ) (2024-02-19T21:32:19Z) - Chain-of-Layer: Iteratively Prompting Large Language Models for Taxonomy Induction from Limited Examples [34.88498567698853]
Chain-of-Layerは、特定のエンティティセットから誘導されるように設計された、コンテキスト学習フレームワークである。
実世界の4つのベンチマークにおいて,Chain-of-Layerが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-02-12T03:05:54Z) - Towards Visual Taxonomy Expansion [50.462998483087915]
本稿では,分類拡張タスクに視覚的特徴を導入し,VTE(Visual Taxonomy Expansion)を提案する。
テキストと視覚のセマンティクスをクラスタリングするためのテキストハイパーネミー学習タスクとビジュアルプロトタイプ学習タスクを提案する。
提案手法を2つのデータセットで評価し,有意な結果を得た。
論文 参考訳(メタデータ) (2023-09-12T10:17:28Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion [50.794640012673064]
データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
論文 参考訳(メタデータ) (2021-04-08T11:00:43Z) - Can Taxonomy Help? Improving Semantic Question Matching using Question
Taxonomy [37.57300969050908]
セマンティックな質問マッチングのためのハイブリッド手法を提案する。
深層学習に基づく質問から得られた質問クラスで最先端のディープラーニングモデルを強化することにより、提案された2層分類を英語の質問に使用します。
論文 参考訳(メタデータ) (2021-01-20T16:23:04Z) - Octet: Online Catalog Taxonomy Enrichment with Self-Supervision [67.26804972901952]
オンラインカタログエンリッチメンTのための自己教師型エンドツーエンドフレームワークOctopを提案する。
本稿では,用語抽出のためのシーケンスラベリングモデルをトレーニングし,分類構造を捉えるためにグラフニューラルネットワーク(GNN)を用いることを提案する。
Octetは、オンラインカタログを、オープンワールド評価の2倍に強化する。
論文 参考訳(メタデータ) (2020-06-18T04:53:07Z) - STEAM: Self-Supervised Taxonomy Expansion with Mini-Paths [53.45704816829921]
本稿では,STEAMという自己管理型分類拡張モデルを提案する。
STEAMは自然の自己超越信号を生成し、ノードアタッチメント予測タスクを定式化する。
実験の結果、STEAMは11.6%の精度と7.0%の相反ランクで、最先端の分類法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T00:32:53Z) - TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced
Graph Neural Network [62.12557274257303]
分類学は機械解釈可能な意味論から成り、多くのウェブアプリケーションに貴重な知識を提供する。
そこで我々は,既存の分類学から,クエリの集合を自動生成するTaxoExpanという,新しい自己教師型フレームワークを提案する。
本研究では,(1)既存の分類学におけるアンカー概念の局所構造を符号化する位置強調グラフニューラルネットワーク,(2)学習モデルが自己超越データにおけるラベルノイズに敏感になるようなノイズローバスト学習の2つの手法を開発する。
論文 参考訳(メタデータ) (2020-01-26T21:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。