論文の概要: Guiding Corpus-based Set Expansion by Auxiliary Sets Generation and
Co-Expansion
- arxiv url: http://arxiv.org/abs/2001.10106v1
- Date: Mon, 27 Jan 2020 22:34:07 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 08:18:05.857533
- Title: Guiding Corpus-based Set Expansion by Auxiliary Sets Generation and
Co-Expansion
- Title(参考訳): 補助集合生成と共展開によるコーパスベース集合展開の誘導
- Authors: Jiaxin Huang, Yiqing Xie, Yu Meng, Jiaming Shen, Yunyi Zhang and
Jiawei Han
- Abstract要約: コーパスベースのセット展開アルゴリズムは、語彙パターンと分布類似性を組み込むことで、与えられた種子をブートストラップする。
Set-CoExpanは、ユーザの興味のターゲットセットと密接に関連する負のセットとして、補助セットを自動的に生成する。
本研究では,Set-CoExpanが強いベースライン法を著しく上回ることを示す。
- 参考スコア(独自算出の注目度): 45.716171458483636
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given a small set of seed entities (e.g., ``USA'', ``Russia''), corpus-based
set expansion is to induce an extensive set of entities which share the same
semantic class (Country in this example) from a given corpus. Set expansion
benefits a wide range of downstream applications in knowledge discovery, such
as web search, taxonomy construction, and query suggestion. Existing
corpus-based set expansion algorithms typically bootstrap the given seeds by
incorporating lexical patterns and distributional similarity. However, due to
no negative sets provided explicitly, these methods suffer from semantic drift
caused by expanding the seed set freely without guidance. We propose a new
framework, Set-CoExpan, that automatically generates auxiliary sets as negative
sets that are closely related to the target set of user's interest, and then
performs multiple sets co-expansion that extracts discriminative features by
comparing target set with auxiliary sets, to form multiple cohesive sets that
are distinctive from one another, thus resolving the semantic drift issue. In
this paper we demonstrate that by generating auxiliary sets, we can guide the
expansion process of target set to avoid touching those ambiguous areas around
the border with auxiliary sets, and we show that Set-CoExpan outperforms strong
baseline methods significantly.
- Abstract(参考訳): シードエンティティの小さなセット(例: `usa'', ``russia'')が与えられると、コーパスベースのセット拡張は、与えられたコーパスから同じ意味クラス(この例ではカントリー)を共有する広範なエンティティセットを誘導する。
セット拡張は、Web検索、分類学の構築、クエリ提案など、知識発見における幅広いダウンストリームアプリケーションに恩恵をもたらす。
既存のコーパスベースのセット展開アルゴリズムは、通常、語彙パターンと分布類似性を組み込むことで、与えられた種子をブートストラップする。
しかし、負集合が明示的に提供されていないため、これらの方法は誘導なしで種子集合を自由に広げることによる意味的ドリフトに苦しむ。
本稿では,ユーザの関心のターゲットセットと密接な関係を持つ負の集合として補助集合を自動生成する新しいフレームワーク,Set-CoExpanを提案し,その上で,対象集合と補助集合を比較して識別的特徴を抽出し,互いに異なる複数の結合集合を形成し,意味的ドリフト問題を解消する。
本稿では, 補助集合を生成することにより, 補助集合との境界付近の曖昧な領域に触れることを避けるために, 目標集合の拡張過程を導出することができることを示す。
関連論文リスト
- A Universal Sets-level Optimization Framework for Next Set Recommendation [15.808908615022709]
Next Set Recommendation (NSRec) はトレンド研究のトピックである。
我々は N ext Set Recommendation (SNSRec) のための普遍的および S ets レベルの最適化フレームワークを公開している。
私たちのアプローチは、妥当性と多様性の両方に関して、従来方法よりも一貫して優れています。
論文 参考訳(メタデータ) (2024-10-30T13:53:46Z) - SetCSE: Set Operations using Contrastive Learning of Sentence Embeddings [6.988934943372354]
SetCSEは複雑なセマンティクスを表現するためにセットを使用し、構造化情報クエリのための明確に定義された操作を組み込む。
そこで本稿では,文の埋め込みモデルに対する意味論の理解を高めるために,集合間のコントラスト学習手法を提案する。
本研究では,SetCSEが複合意味論に関する人間の言語表現の慣習に準拠していることを示す。
論文 参考訳(メタデータ) (2024-04-25T02:05:30Z) - Enhancing Neural Subset Selection: Integrating Background Information into Set Representations [53.15923939406772]
対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文 参考訳(メタデータ) (2024-02-05T16:09:35Z) - Foundational theories of hesitant fuzzy sets and hesitant fuzzy
information systems and their applications for multi-strength intelligent
classifiers [32.78664473821173]
ヘシタントファジィ集合は、不確実性やためらいのある場合において広く用いられる。
ある種の集合として、ヘジットファジィ集合は包含関係を明確に定義する必要がある。
論文 参考訳(メタデータ) (2023-11-07T14:03:28Z) - Redundancy-aware unsupervised rankings for collections of gene sets [0.28675177318965034]
本稿では,重要度スコアを用いて,集合的包括的視点からコンテキストを研究するコレクションの経路をランク付けすることを提案する。
提案手法は,遺伝子集合の集合の解釈可能性を高めるためにバイオインフォマティクスにおける実用的有用性を示す。
論文 参考訳(メタデータ) (2023-07-30T09:39:42Z) - GausSetExpander: A Simple Approach for Entity Set Expansion [0.0]
最適輸送技術に基づく教師なしの手法であるGausSetExpanderを提案する。
我々は、最先端の手法と比較することで、我々のアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-02-28T09:44:43Z) - Exploring Set Similarity for Dense Self-supervised Representation
Learning [96.35286140203407]
本研究では,高密度自己教師型表現学習のためのtextbfset textbfsimilarity (SetSim) を提案する。
ピクセルワイドの類似性学習をセットワイドに一般化し,よりセマンティックな情報や構造的な情報を含むため,ロバスト性を向上させる。
具体的には、ビューの注意的特徴に頼って対応する集合を定め、不適切な対応を引き起こす可能性のあるノイズの多い背景をフィルタリングする。
論文 参考訳(メタデータ) (2021-07-19T09:38:27Z) - Mini-Batch Consistent Slot Set Encoder for Scalable Set Encoding [50.61114177411961]
大規模のミニバッチセットエンコーディングに必要な、Mini-Batch Consistencyと呼ばれる新しいプロパティを紹介します。
本稿では,設定要素に対してミニバッチ処理が可能で,より多くのデータが到着するにつれて,セット表現を更新できる,スケーラブルで効率的なセット符号化機構を提案する。
論文 参考訳(メタデータ) (2021-03-02T10:10:41Z) - Empower Entity Set Expansion via Language Model Probing [58.78909391545238]
既存の拡張方法は、コンテキスト特徴を適応的に選択し、新しいエンティティを抽出することで、シードエンティティをブートストラップする。
エンティティセット拡張の鍵となる課題は、クラスセマンティクスをシフトし、後のイテレーションで累積エラーにつながる曖昧なコンテキスト機能を選択することを避けることである。
セマンティックドリフト問題に対処するために、自動生成されたクラス名を活用する新しい反復的集合拡張フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-29T00:09:43Z) - Learn to Predict Sets Using Feed-Forward Neural Networks [63.91494644881925]
本稿では、ディープフィードフォワードニューラルネットワークを用いた設定予測の課題に対処する。
未知の置換と基数を持つ集合を予測するための新しい手法を提案する。
関連視覚問題に対する集合定式化の有効性を実証する。
論文 参考訳(メタデータ) (2020-01-30T01:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。