論文の概要: Distant Supervision for E-commerce Query Segmentation via Attention
Network
- arxiv url: http://arxiv.org/abs/2011.04166v1
- Date: Mon, 9 Nov 2020 03:00:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 01:08:53.170369
- Title: Distant Supervision for E-commerce Query Segmentation via Attention
Network
- Title(参考訳): アテンションネットワークによるeコマース問合せセグメンテーションの遠隔監視
- Authors: Zhao Li, Donghui Ding, Pengcheng Zou, Yu Gong, Xi Chen, Ji Zhang,
Jianliang Gao, Youxi Wu and Yucong Duan
- Abstract要約: 本稿では,外部のコンテキスト情報を自然に効果的に活用し,クエリセグメンテーションを支援するような,アテンションモジュールを備えたBiLSTM-CRFベースのモデルを提案する。
2つのデータセットの実験は、いくつかのベースラインと比較して、我々のアプローチの有効性を示している。
- 参考スコア(独自算出の注目度): 22.946144345151605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The booming online e-commerce platforms demand highly accurate approaches to
segment queries that carry the product requirements of consumers. Recent works
have shown that the supervised methods, especially those based on deep
learning, are attractive for achieving better performance on the problem of
query segmentation. However, the lack of labeled data is still a big challenge
for training a deep segmentation network, and the problem of Out-of-Vocabulary
(OOV) also adversely impacts the performance of query segmentation. Different
from query segmentation task in an open domain, e-commerce scenario can provide
external documents that are closely related to these queries. Thus, to deal
with the two challenges, we employ the idea of distant supervision and design a
novel method to find contexts in external documents and extract features from
these contexts. In this work, we propose a BiLSTM-CRF based model with an
attention module to encode external features, such that external contexts
information, which can be utilized naturally and effectively to help query
segmentation. Experiments on two datasets show the effectiveness of our
approach compared with several kinds of baselines.
- Abstract(参考訳): オンライン電子商取引プラットフォームは、消費者の製品要求を満たすセグメントクエリに非常に正確なアプローチを要求する。
近年の研究では、教師付き手法、特にディープラーニングに基づく手法が、クエリのセグメンテーション問題において、よりよいパフォーマンスを達成する上で魅力的であることが示されている。
しかし、ディープセグメンテーションネットワークのトレーニングにおいてラベル付きデータの欠如は依然として大きな課題であり、アウトオブボキャブラリ(OOV)の問題もクエリセグメンテーションのパフォーマンスに悪影響を及ぼす。
オープンドメインのクエリセグメンテーションタスクとは異なり、eコマースシナリオはこれらのクエリに密接に関連する外部ドキュメントを提供することができる。
そこで,この2つの課題に対処するために,外部文書の文脈を探索し,それらの文脈から特徴を抽出するための新しい手法を設計・設計する。
本研究では,自然に効果的に活用できる外部コンテキスト情報などの外部特徴を符号化するアテンションモジュールを備えたBiLSTM-CRFモデルを提案する。
2つのデータセットにおける実験は、複数のベースラインと比較して、我々のアプローチの有効性を示している。
関連論文リスト
- QueryNER: Segmentation of E-commerce Queries [12.563241705572409]
電子商取引クエリセグメンテーションのための手動注釈付きデータセットと付随モデルを提案する。
私たちの研究は、クエリを広く適用可能な型を持った意味のあるチャンクに分割するという目標に焦点を当てています。
論文 参考訳(メタデータ) (2024-05-15T16:58:35Z) - LaSagnA: Language-based Segmentation Assistant for Complex Queries [39.620806493454616]
視覚のための大規模言語モデル(vLLM)は、バウンディングボックスやマスクを含む知覚結果を生成する。
本研究では,これらの問題の主な原因が,学習クエリの複雑さの不足であることを認めた。
本稿では,提案フォーマットの直接統合による課題を効果的に解決するための3つの新しい戦略を提案する。
論文 参考訳(メタデータ) (2024-04-12T14:40:45Z) - SEGIC: Unleashing the Emergent Correspondence for In-Context Segmentation [87.18373801829314]
In-context segmentationは、"in-context example"と呼ばれるいくつかのラベル付きサンプルイメージを使用して、新しいイメージをセグメント化することを目的としている。
単一ビジョン基盤モデル(VFM)に基づくエンドツーエンドのセグメンテーション・イン・コンテクストフレームワークSEGICを提案する。
SEGICは、ワンショットセグメンテーションベンチマークで最先端のパフォーマンスをもたらす、単純だが効果的なアプローチである。
論文 参考訳(メタデータ) (2023-11-24T18:59:42Z) - Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。
我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。
クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文 参考訳(メタデータ) (2023-11-19T06:00:39Z) - PPN: Parallel Pointer-based Network for Key Information Extraction with
Complex Layouts [29.73609439825548]
キー情報抽出は、ドキュメントから構造化された値セマンティックエンティティを抽出することを目的とした課題である。
既存の手法は2段階のパイプライン戦略に従っており、エラー伝搬問題につながる可能性がある。
ゼロショットおよび少数ショットシナリオに適用可能なエンドツーエンドモデルであるParallel Pointer-based Network (PPN)を紹介する。
論文 参考訳(メタデータ) (2023-07-20T03:29:09Z) - Open-vocabulary Panoptic Segmentation with Embedding Modulation [71.15502078615587]
オープン語彙のイメージセグメンテーションは、現実世界における重要な応用のために注目を集めている。
従来のクローズド・ボキャブラリ・セグメンテーション法は、新しいオブジェクトを特徴づけることができないが、最近のいくつかのオープン・ボキャブラリ試みは、満足のいく結果を得る。
オープン語彙パノプトンのための全能的でデータ効率のよいフレームワークであるOPSNetを提案する。
論文 参考訳(メタデータ) (2023-03-20T17:58:48Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Aspect-Oriented Summarization through Query-Focused Extraction [23.62412515574206]
実際のユーザのニーズは、特定のクエリではなく、ユーザが興味を持っているデータセットの幅広いトピックという側面に、より深く浸透することが多い。
抽出クエリに焦点を絞った学習手法をベンチマークし、モデルを訓練するための対照的な拡張手法を提案する。
我々は2つのアスペクト指向データセットを評価し、この手法が一般的な要約システムよりも焦点を絞った要約を得られることを発見した。
論文 参考訳(メタデータ) (2021-10-15T18:06:21Z) - BriNet: Towards Bridging the Intra-class and Inter-class Gaps in
One-Shot Segmentation [84.2925550033094]
ほとんどショットのセグメンテーションは、限られたトレーニングサンプルで見えないオブジェクトインスタンスをセグメンテーションするためのモデルの一般化に焦点を当てている。
本稿では,クエリの抽出した特徴とサポートイメージのギャップを埋めるフレームワーク BriNet を提案する。
本フレームワークの有効性は,他の競合手法よりも優れる実験結果によって実証された。
論文 参考訳(メタデータ) (2020-08-14T07:45:50Z) - Query Focused Multi-Document Summarization with Distant Supervision [88.39032981994535]
既存の作業は、クエリとテキストセグメント間の関連性を推定する検索スタイルの手法に大きく依存している。
本稿では,クエリに関連するセグメントを推定するための個別モジュールを導入した粗大なモデリングフレームワークを提案する。
我々のフレームワークは、標準QFSベンチマークにおいて、強力な比較システムよりも優れていることを実証する。
論文 参考訳(メタデータ) (2020-04-06T22:35:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。