論文の概要: EmbeddingTree: Hierarchical Exploration of Entity Features in Embedding
- arxiv url: http://arxiv.org/abs/2308.01329v1
- Date: Wed, 2 Aug 2023 17:22:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-04 16:15:15.587651
- Title: EmbeddingTree: Hierarchical Exploration of Entity Features in Embedding
- Title(参考訳): EmbeddingTree: 埋め込みにおけるエンティティ機能の階層的な探索
- Authors: Yan Zheng, Junpeng Wang, Chin-Chia Michael Yeh, Yujie Fan, Huiyuan
Chen, Liang Wang, Wei Zhang
- Abstract要約: この研究は階層的な埋め込み探索アルゴリズムである EmbeddingTree を提案する。
EmbeddingTreeをベースとしたインタラクティブな可視化ツールも開発されている。
業界規模の商業データと30Musicリスニング/プレイリストデータセットに対して生成された埋め込みによって, EmbeddingTreeと可視化ツールの有効性を実証した。
- 参考スコア(独自算出の注目度): 26.95676543794246
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Embedding learning transforms discrete data entities into continuous
numerical representations, encoding features/properties of the entities.
Despite the outstanding performance reported from different embedding learning
algorithms, few efforts were devoted to structurally interpreting how features
are encoded in the learned embedding space. This work proposes EmbeddingTree, a
hierarchical embedding exploration algorithm that relates the semantics of
entity features with the less-interpretable embedding vectors. An interactive
visualization tool is also developed based on EmbeddingTree to explore
high-dimensional embeddings. The tool helps users discover nuance features of
data entities, perform feature denoising/injecting in embedding training, and
generate embeddings for unseen entities. We demonstrate the efficacy of
EmbeddingTree and our visualization tool through embeddings generated for
industry-scale merchant data and the public 30Music listening/playlists
dataset.
- Abstract(参考訳): 埋め込み学習は、離散データエンティティを連続的な数値表現に変換し、エンティティの特徴や特性を符号化する。
異なる組込み学習アルゴリズムから報告された優れた性能にもかかわらず、学習された組込み空間で機能がどのようにエンコードされるかの構造的な解釈に費やされる努力はほとんどなかった。
本研究は、エンティティ特徴のセマンティクスと、解釈不能な埋め込みベクトルを関連付ける階層的埋め込み探索アルゴリズムであるembeddtreeを提案する。
EmbeddingTreeをベースとしたインタラクティブな可視化ツールも開発されている。
このツールは、データエンティティのニュアンス特徴を発見し、埋め込みトレーニングで特徴の推論/インジェクションを実行し、見えないエンティティへの埋め込みを生成するのに役立つ。
業界規模の商業データと30Musicリスニング/プレイリストデータセットに対して生成された埋め込みによって, EmbeddingTreeと可視化ツールの有効性を実証した。
関連論文リスト
- Prospector Heads: Generalized Feature Attribution for Large Models &
Data [63.33062996732212]
本稿では,特徴帰属のための説明に基づく手法の,効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。
我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。
クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文 参考訳(メタデータ) (2023-11-19T06:00:39Z) - Entity-Agnostic Representation Learning for Parameter-Efficient
Knowledge Graph Embedding [30.7075844882004]
本稿では,知識グラフの埋め込みによる非効率なパラメータ記憶コストの問題に対処するエンティティに依存しない表現学習手法を提案する。
我々は、識別可能な情報をエンティティ埋め込みに変換するために、普遍的でエンティティに依存しないエンコーダを学習する。
実験の結果,EARLはパラメータが少なく,ベースラインよりもリンク予測タスクが優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T16:49:46Z) - GE-Blender: Graph-Based Knowledge Enhancement for Blender [3.8841367260456487]
見えないエンティティは対話生成タスクに大きな影響を与える可能性がある。
我々は、エンティティノードを抽出してグラフを構築し、コンテキストの表現を強化する。
未確認のエンティティがグラフに存在しない問題を適用するために、名前付きエンティティタグ予測タスクを追加します。
論文 参考訳(メタデータ) (2023-01-30T13:00:20Z) - What and How of Machine Learning Transparency: Building Bespoke
Explainability Tools with Interoperable Algorithmic Components [77.87794937143511]
本稿では,データ駆動予測モデルを説明するためのハンズオントレーニング教材について紹介する。
これらのリソースは、解釈可能な表現合成、データサンプリング、説明生成の3つのコアビルディングブロックをカバーする。
論文 参考訳(メタデータ) (2022-09-08T13:33:25Z) - Disentangling Visual Embeddings for Attributes and Objects [38.27308243429424]
オブジェクト属性認識における合成ゼロショット学習の問題点について検討する。
以前の作業では、オブジェクト分類のために事前訓練されたバックボーンネットワークで抽出された視覚的特徴を使用する。
視覚空間における属性とオブジェクトの特徴をアンタングルできる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-05-17T17:59:36Z) - Improving Entity Linking through Semantic Reinforced Entity Embeddings [16.868791358905916]
そこで本稿では, コンテキスト共通性の学習を容易にするため, 実体埋め込みに微粒な意味情報を注入する手法を提案する。
エンティティの埋め込みに基づいて、エンティティリンクにおける最先端のパフォーマンスを新たに達成しました。
論文 参考訳(メタデータ) (2021-06-16T00:27:56Z) - Interpretable and Low-Resource Entity Matching via Decoupling Feature
Learning from Decision Making [22.755892575582788]
Entity Matchingは、同じ現実世界のオブジェクトを表すエンティティレコードを認識することを目的としている。
異種情報融合(HIF)とキー属性ツリー(KAT)誘導からなる新しいEMフレームワークを提案する。
提案手法は効率が高く,ほとんどの場合SOTA EMモデルより優れている。
論文 参考訳(メタデータ) (2021-06-08T08:27:31Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z) - Synbols: Probing Learning Algorithms with Synthetic Datasets [112.45883250213272]
Synbolsは、低解像度画像にレンダリングされた潜在機能のリッチな構成で、新しいデータセットを高速に生成するツールである。
ツールの高レベルインターフェースは、潜在機能で新しいディストリビューションを高速に生成するための言語を提供する。
Synbolsの汎用性を示すために,各種学習環境における標準学習アルゴリズムの限界と欠陥を識別するために,本手法を用いる。
論文 参考訳(メタデータ) (2020-09-14T13:03:27Z) - Probing Linguistic Features of Sentence-Level Representations in Neural
Relation Extraction [80.38130122127882]
ニューラルリレーション抽出(RE)に関連する言語特性を対象とした14の探索タスクを導入する。
私たちは、40以上の異なるエンコーダアーキテクチャと2つのデータセットでトレーニングされた言語的特徴の組み合わせによって学習された表現を研究するためにそれらを使用します。
アーキテクチャによって引き起こされるバイアスと言語的特徴の含意は、探索タスクのパフォーマンスにおいて明らかに表現されている。
論文 参考訳(メタデータ) (2020-04-17T09:17:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。