論文の概要: TXtract: Taxonomy-Aware Knowledge Extraction for Thousands of Product
Categories
- arxiv url: http://arxiv.org/abs/2004.13852v2
- Date: Fri, 1 May 2020 14:54:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 02:37:34.597141
- Title: TXtract: Taxonomy-Aware Knowledge Extraction for Thousands of Product
Categories
- Title(参考訳): TXtract:何千もの製品カテゴリの分類学的知識抽出
- Authors: Giannis Karamanolakis, Jun Ma, Xin Luna Dong
- Abstract要約: TXtractは、階層的な分類で組織された何千もの製品カテゴリに適用される分類学的知識抽出モデルである。
私たちのアプローチは、数千のカテゴリに対して単一のモデルをトレーニングすると同時に、カテゴリ固有の属性値を抽出するので、どちらもスケーラブルです。
- 参考スコア(独自算出の注目度): 39.40384354390674
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Extracting structured knowledge from product profiles is crucial for various
applications in e-Commerce. State-of-the-art approaches for knowledge
extraction were each designed for a single category of product, and thus do not
apply to real-life e-Commerce scenarios, which often contain thousands of
diverse categories. This paper proposes TXtract, a taxonomy-aware knowledge
extraction model that applies to thousands of product categories organized in a
hierarchical taxonomy. Through category conditional self-attention and
multi-task learning, our approach is both scalable, as it trains a single model
for thousands of categories, and effective, as it extracts category-specific
attribute values. Experiments on products from a taxonomy with 4,000 categories
show that TXtract outperforms state-of-the-art approaches by up to 10% in F1
and 15% in coverage across all categories.
- Abstract(参考訳): 製品プロファイルから構造化知識を抽出することは、電子商取引における様々なアプリケーションにとって不可欠である。
知識抽出に関する最先端のアプローチは、それぞれ1つのカテゴリの製品のために設計されているため、数千のカテゴリを含む現実のeコマースシナリオには適用されない。
本稿では,分類学的に整理された何千もの製品カテゴリに適用可能な分類学的知識抽出モデルであるtxtractを提案する。
カテゴリ条件付き自己アテンションとマルチタスク学習を通じて、数千のカテゴリに対して単一のモデルをトレーニングし、カテゴリ固有の属性値を抽出し、効果的なアプローチもスケーラブルです。
4000のカテゴリーを持つ分類学からの製品に関する実験では、TXtractはF1における最先端のアプローチを最大10%、全カテゴリにわたって15%上回っている。
関連論文リスト
- Exploring Fine-grained Retail Product Discrimination with Zero-shot Object Classification Using Vision-Language Models [50.370043676415875]
スマートリテールアプリケーションでは、多数の製品とその頻繁なターンオーバーは信頼性の高いゼロショットオブジェクト分類方法を必要とする。
我々は28の異なる製品カテゴリからなるMIMEXデータセットを紹介した。
我々は、提案したMIMEXデータセット上で、最先端ビジョン言語モデル(VLM)のゼロショットオブジェクト分類性能をベンチマークする。
論文 参考訳(メタデータ) (2024-09-23T12:28:40Z) - Creating a Fine Grained Entity Type Taxonomy Using LLMs [0.0]
本研究は, GPT-4とその先進的な反復である GPT-4 Turbo が, 詳細な実体型分類学を自律的に開発する可能性について検討する。
我々の目的は、広く分類されたエンティティタイプから始まる包括的な分類体系を構築することである。
この分類は、GPT-4の内部知識ベースを利用して反復的なプロンプト技術によって徐々に洗練される。
論文 参考訳(メタデータ) (2024-02-19T21:32:19Z) - Text Classification for Predicting Multi-level Product Categories [0.0]
オンラインショッピングプラットフォームでは、製品の詳細な分類がユーザナビゲーションを促進する。
本研究では,食品の商品名分類に焦点をあてる。
論文 参考訳(メタデータ) (2021-09-02T17:00:05Z) - Exploiting Knowledge Graphs for Facilitating Product/Service Discovery [1.2691047660244332]
本研究は,データ分類に教師なしアプローチを採用することにより,データWeb上でのeコマースのための費用対効果のソリューションを提案する。
提案アーキテクチャでは,Web言語OWLで利用可能な製品について記述し,それをトリプルストアに格納する。
特定の製品のユーザ入力仕様は、利用可能な製品カテゴリと一致し、知識グラフを生成する。
論文 参考訳(メタデータ) (2020-10-11T10:22:10Z) - Generating Categories for Sets of Entities [34.32017697099142]
カテゴリーシステムは知識ベースの中心的な構成要素であり、意味論的に関連する概念と実体の階層的なグループ化を提供する。
本稿では,ニューラルネットワークの抽象的要約モデルを用いて,エンティティの集合のカテゴリを生成する手法を提案する。
ウィキペディアのカテゴリに基づいたテストコレクションを開発し,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2020-08-19T13:31:07Z) - Adversarial Mixture Of Experts with Category Hierarchy Soft Constraint [21.334343559739878]
我々はMixture of Expert(MoE)フレームワークを利用して、クエリカテゴリごとに専門的なランキングモデルを学ぶ。
専門家のアウトプットに逆正則化の形式を導入し、互いに意見の相違を強いる。
これは、異なるカテゴリのゲート出力ベクトルのより強いクラスタリング効果によって検証される。
論文 参考訳(メタデータ) (2020-07-24T04:47:40Z) - AutoKnow: Self-Driving Knowledge Collection for Products of Thousands of
Types [127.99385433323859]
当社のAutoKnowは、製品に関する情報の整理に対処する自動(自動運転)システムです。
このシステムには、分類学の構築、製品財産の識別、知識抽出、異常検出、同義語発見のための一連の新しい技術が含まれている。
AutoKnowは、1万以上の製品タイプの製品知識を収集している。
論文 参考訳(メタデータ) (2020-06-24T04:35:17Z) - Octet: Online Catalog Taxonomy Enrichment with Self-Supervision [67.26804972901952]
オンラインカタログエンリッチメンTのための自己教師型エンドツーエンドフレームワークOctopを提案する。
本稿では,用語抽出のためのシーケンスラベリングモデルをトレーニングし,分類構造を捉えるためにグラフニューラルネットワーク(GNN)を用いることを提案する。
Octetは、オンラインカタログを、オープンワールド評価の2倍に強化する。
論文 参考訳(メタデータ) (2020-06-18T04:53:07Z) - Automatic Validation of Textual Attribute Values in E-commerce Catalog
by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。
限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。
ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文 参考訳(メタデータ) (2020-06-15T21:31:05Z) - TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced
Graph Neural Network [62.12557274257303]
分類学は機械解釈可能な意味論から成り、多くのウェブアプリケーションに貴重な知識を提供する。
そこで我々は,既存の分類学から,クエリの集合を自動生成するTaxoExpanという,新しい自己教師型フレームワークを提案する。
本研究では,(1)既存の分類学におけるアンカー概念の局所構造を符号化する位置強調グラフニューラルネットワーク,(2)学習モデルが自己超越データにおけるラベルノイズに敏感になるようなノイズローバスト学習の2つの手法を開発する。
論文 参考訳(メタデータ) (2020-01-26T21:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。