論文の概要: Towards Open-World Product Attribute Mining: A Lightly-Supervised
Approach
- arxiv url: http://arxiv.org/abs/2305.18350v1
- Date: Fri, 26 May 2023 11:51:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 22:22:45.111958
- Title: Towards Open-World Product Attribute Mining: A Lightly-Supervised
Approach
- Title(参考訳): オープンワールド製品属性マイニングに向けて:軽監督アプローチ
- Authors: Liyan Xu, Chenwei Zhang, Xian Li, Jingbo Shang, Jinho D. Choi
- Abstract要約: 電子商取引製品における属性マイニングのための新しいタスク設定を提案する。
我々は、既存の種型の属性語彙を拡張し、また、新しい属性タイプを自動的に発見することを目的としている。
提案手法は,既存型の属性を最大12倍まで拡張し,新しいタイプの39%の値を検出する。
- 参考スコア(独自算出の注目度): 60.52087154731358
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new task setting for attribute mining on e-commerce products,
serving as a practical solution to extract open-world attributes without
extensive human intervention. Our supervision comes from a high-quality seed
attribute set bootstrapped from existing resources, and we aim to expand the
attribute vocabulary of existing seed types, and also to discover any new
attribute types automatically. A new dataset is created to support our setting,
and our approach Amacer is proposed specifically to tackle the limited
supervision. Especially, given that no direct supervision is available for
those unseen new attributes, our novel formulation exploits self-supervised
heuristic and unsupervised latent attributes, which attains implicit semantic
signals as additional supervision by leveraging product context. Experiments
suggest that our approach surpasses various baselines by 12 F1, expanding
attributes of existing types significantly by up to 12 times, and discovering
values from 39% new types.
- Abstract(参考訳): 本研究では,電子商取引製品における属性マイニングのための新たなタスクセットを提案し,人的介入を伴わずにオープンワールド属性を抽出する実践的なソリューションとして機能する。
我々の監督は、既存のリソースからブートストラップされた高品質なシード属性セットから来ており、既存のシードタイプの属性語彙を拡張し、新しい属性タイプを自動的に発見することを目的としています。
我々の設定をサポートするために新しいデータセットが作成され、限定的な監督に取り組むために、我々のアプローチであるAmacerが特に提案されている。
特に,新たな属性に対して直接の監視ができないことを考えると,新たな定式化では自己監督型ヒューリスティックおよび非教師なし潜在属性を活用できる。
実験の結果,提案手法は様々なベースラインを12f1で上回り,既存型の属性を最大12倍に拡大し,新たに39%の型から値を見出した。
関連論文リスト
- EIVEN: Efficient Implicit Attribute Value Extraction using Multimodal LLM [52.016009472409166]
EIVENは暗黙的な属性値抽出のためのデータおよびパラメータ効率の良い生成フレームワークである。
本稿では,モデル混同を減らすための新しい学習・比較手法を提案する。
実験の結果,EIVENは暗黙的属性値の抽出において既存の手法よりも有意に優れていることがわかった。
論文 参考訳(メタデータ) (2024-04-13T03:15:56Z) - SAGE: Structured Attribute Value Generation for Billion-Scale Product
Catalogs [1.1184789007828977]
SAGEは、世界規模のeコマースカタログにまたがる商品の属性値を推測するためのジェネレーティブLLMである。
本稿では,属性値予測問題をSeq2Seq要約タスクとして新たに定式化する。
SAGEは、eコマースカタログの実践的な設定で生じる属性値予測タスクのすべての側面に取り組むことができる最初の方法である。
論文 参考訳(メタデータ) (2023-09-12T02:24:16Z) - OA-Mine: Open-World Attribute Mining for E-Commerce Products with Weak
Supervision [93.26737878221073]
オープンワールド環境における属性マイニングの問題点を考察し,新しい属性とその値の抽出を行う。
本稿では、まず属性値候補を生成し、次にそれらを属性のクラスタにグループ化する、原則化されたフレームワークを提案する。
我々のモデルは強いベースラインをはるかに上回り、目に見えない属性や製品タイプに一般化することができる。
論文 参考訳(メタデータ) (2022-04-29T04:16:04Z) - Spread Spurious Attribute: Improving Worst-group Accuracy with Spurious
Attribute Estimation [72.92329724600631]
本稿では,最悪のグループ精度を向上させるために,疑似属性に基づくアルゴリズムSpread Spurious Attributeを提案する。
各種ベンチマークデータセットに対する実験により,アルゴリズムはベースライン法より一貫して優れていることが示された。
また,提案したSSAは,フル (100%) のスプリアス特性監視を用いた手法に匹敵する性能を達成できることを実証した。
論文 参考訳(メタデータ) (2022-04-05T09:08:30Z) - Make an Omelette with Breaking Eggs: Zero-Shot Learning for Novel
Attribute Synthesis [65.74825840440504]
我々は,ZSLA(Zero Shot Learning for Attributes)を提案する。
提案手法は,新しい属性の検出器をゼロショット学習方式で合成することができる。
提案手法は,Caltech-UCSD Birds-200-2011データセット上の32個の属性のみを用いて,他の207個の新しい属性を合成することができる。
論文 参考訳(メタデータ) (2021-11-28T15:45:54Z) - Creating Training Sets via Weak Indirect Supervision [66.77795318313372]
Weak Supervision (WS)フレームワークは、複数の潜在的にノイズの多い監督ソースからトレーニングラベルを合成する。
Weak Indirect Supervision (WIS) は、トレーニングラベルの自動合成のための新しい研究課題である。
我々は,ユーザが提供するラベル関係を利用して間接的な監督源をモデル化し活用する確率論的モデリング手法PLRMを開発した。
論文 参考訳(メタデータ) (2021-10-07T14:09:35Z) - Disentangled Face Attribute Editing via Instance-Aware Latent Space
Search [30.17338705964925]
GAN(Generative Adversarial Networks)の潜在空間には、意味的な方向性の豊富な集合が存在する。
既存のメソッドは属性のばらつきが弱いため、望ましい属性を変更する際には、他の属性が望ましくない変更になる可能性がある。
本稿では,不整合属性編集のセマンティックな方向を求めるために,インスタンス認識遅延空間探索を行う新しいフレームワーク(IALS)を提案する。
論文 参考訳(メタデータ) (2021-05-26T16:19:08Z) - Self-Supervised Features Improve Open-World Learning [13.880789191591088]
本稿では,インクリメンタル学習,アウトオブディストリビューション検出,オープンワールド学習を組み合わせた統一オープンワールドフレームワークを提案する。
教師なしの特徴表現の下では、未知をラベル外空間または分布外検出のいずれかに分類する。
私たちのパイプラインのインクリメンタルな学習コンポーネントは、imagenet-100プロトコルの最先端と比較して実行するゼロ例のオンラインモデルです。
論文 参考訳(メタデータ) (2021-02-15T21:03:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。