論文の概要: Octet: Online Catalog Taxonomy Enrichment with Self-Supervision
- arxiv url: http://arxiv.org/abs/2006.10276v1
- Date: Thu, 18 Jun 2020 04:53:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 13:51:20.324218
- Title: Octet: Online Catalog Taxonomy Enrichment with Self-Supervision
- Title(参考訳): Octet: 自己監督によるオンラインカタログ分類の充実
- Authors: Yuning Mao, Tong Zhao, Andrey Kan, Chenwei Zhang, Xin Luna Dong,
Christos Faloutsos, Jiawei Han
- Abstract要約: オンラインカタログエンリッチメンTのための自己教師型エンドツーエンドフレームワークOctopを提案する。
本稿では,用語抽出のためのシーケンスラベリングモデルをトレーニングし,分類構造を捉えるためにグラフニューラルネットワーク(GNN)を用いることを提案する。
Octetは、オンラインカタログを、オープンワールド評価の2倍に強化する。
- 参考スコア(独自算出の注目度): 67.26804972901952
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Taxonomies have found wide applications in various domains, especially online
for item categorization, browsing, and search. Despite the prevalent use of
online catalog taxonomies, most of them in practice are maintained by humans,
which is labor-intensive and difficult to scale. While taxonomy construction
from scratch is considerably studied in the literature, how to effectively
enrich existing incomplete taxonomies remains an open yet important research
question. Taxonomy enrichment not only requires the robustness to deal with
emerging terms but also the consistency between existing taxonomy structure and
new term attachment. In this paper, we present a self-supervised end-to-end
framework, Octet, for Online Catalog Taxonomy EnrichmenT. Octet leverages
heterogeneous information unique to online catalog taxonomies such as user
queries, items, and their relations to the taxonomy nodes while requiring no
other supervision than the existing taxonomies. We propose to distantly train a
sequence labeling model for term extraction and employ graph neural networks
(GNNs) to capture the taxonomy structure as well as the query-item-taxonomy
interactions for term attachment. Extensive experiments in different online
domains demonstrate the superiority of Octet over state-of-the-art methods via
both automatic and human evaluations. Notably, Octet enriches an online catalog
taxonomy in production to 2 times larger in the open-world evaluation.
- Abstract(参考訳): 分類学は様々なドメイン、特にアイテム分類、ブラウジング、検索に広く応用されている。
オンラインカタログ分類法が普及しているにもかかわらず、そのほとんどが人間が維持しており、労働集約的でスケールが難しい。
スクラッチからの分類学の構築は文献でかなり研究されているが、既存の不完全な分類学を効果的に濃縮する方法は、オープンで重要な研究課題である。
分類学の豊かさは、新しい用語を扱うための堅牢性だけでなく、既存の分類学構造と新しい用語のアタッチメントとの整合性も要求する。
本稿では,オンラインカタログ分類エンリッチメントのための自己教師付きエンド・ツー・エンドフレームワーク octet を提案する。
Octetは、ユーザクエリ、アイテム、およびそれらの分類ノードとの関係など、オンラインカタログ分類に特有の異種情報を活用しながら、既存の分類体系以外の監督を必要としない。
用語抽出のためのシーケンスラベリングモデルを遠方からトレーニングし、グラフニューラルネットワーク(GNN)を用いて分類構造を捉え、項アタッチメントのためのクエリ-item-taxonomyインタラクションを提案する。
異なるオンラインドメインにおける大規模な実験は、自動評価と人的評価の両方を通して、最先端の手法よりもOctopの方が優れていることを示す。
特にオクテットは、オンラインでのカタログ分類を、オープンワールド評価の2倍に強化している。
関連論文リスト
- Creating a Fine Grained Entity Type Taxonomy Using LLMs [0.0]
本研究は, GPT-4とその先進的な反復である GPT-4 Turbo が, 詳細な実体型分類学を自律的に開発する可能性について検討する。
我々の目的は、広く分類されたエンティティタイプから始まる包括的な分類体系を構築することである。
この分類は、GPT-4の内部知識ベースを利用して反復的なプロンプト技術によって徐々に洗練される。
論文 参考訳(メタデータ) (2024-02-19T21:32:19Z) - Chain-of-Layer: Iteratively Prompting Large Language Models for Taxonomy Induction from Limited Examples [34.88498567698853]
Chain-of-Layerは、特定のエンティティセットから誘導されるように設計された、コンテキスト学習フレームワークである。
実世界の4つのベンチマークにおいて,Chain-of-Layerが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-02-12T03:05:54Z) - TaxoEnrich: Self-Supervised Taxonomy Completion via Structure-Semantic
Representations [28.65753036636082]
本稿では,既存の分類学における意味的特徴と構造的情報の両方を効果的に活用する新しい分類学補完フレームワークを提案する。
分類エンリッチは,(1)概念の意味的意味と分類学的関係を,強力な事前学習言語モデルに基づいて組み込んだ分類記述型埋め込み,(2)分類の構造情報を符号化して候補位置表現を学習する分類認識シーケンシャルエンコーダの4つの構成要素から構成される。
異なるドメインからの4つの大規模な実世界のデータセットの実験は、TaxoEnrichがすべての評価指標の中で最高のパフォーマンスを達成し、過去の最先端よりも大きなマージンでパフォーマンスを向上していることを示している。
論文 参考訳(メタデータ) (2022-02-10T08:10:43Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion [50.794640012673064]
データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
論文 参考訳(メタデータ) (2021-04-08T11:00:43Z) - Studying Taxonomy Enrichment on Diachronic WordNet Versions [70.27072729280528]
本稿では,資源の乏しい環境での分類拡張の可能性について検討し,多数の言語に適用可能な手法を提案する。
我々は、分類の豊かさを訓練し評価するための新しい英語とロシア語のデータセットを作成し、他の言語のためのそのようなデータセットを作成する技術を記述する。
論文 参考訳(メタデータ) (2020-11-23T16:49:37Z) - STEAM: Self-Supervised Taxonomy Expansion with Mini-Paths [53.45704816829921]
本稿では,STEAMという自己管理型分類拡張モデルを提案する。
STEAMは自然の自己超越信号を生成し、ノードアタッチメント予測タスクを定式化する。
実験の結果、STEAMは11.6%の精度と7.0%の相反ランクで、最先端の分類法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T00:32:53Z) - TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced
Graph Neural Network [62.12557274257303]
分類学は機械解釈可能な意味論から成り、多くのウェブアプリケーションに貴重な知識を提供する。
そこで我々は,既存の分類学から,クエリの集合を自動生成するTaxoExpanという,新しい自己教師型フレームワークを提案する。
本研究では,(1)既存の分類学におけるアンカー概念の局所構造を符号化する位置強調グラフニューラルネットワーク,(2)学習モデルが自己超越データにおけるラベルノイズに敏感になるようなノイズローバスト学習の2つの手法を開発する。
論文 参考訳(メタデータ) (2020-01-26T21:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。