Fugu-MT 論文翻訳(概要): EmbeddingTree: Hierarchical Exploration of Entity Features in Embedding

論文の概要: EmbeddingTree: Hierarchical Exploration of Entity Features in Embedding

arxiv url: http://arxiv.org/abs/2308.01329v1
Date: Wed, 2 Aug 2023 17:22:13 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-04 16:15:15.587651
Title: EmbeddingTree: Hierarchical Exploration of Entity Features in Embedding
Title（参考訳）: EmbeddingTree: 埋め込みにおけるエンティティ機能の階層的な探索
Authors: Yan Zheng, Junpeng Wang, Chin-Chia Michael Yeh, Yujie Fan, Huiyuan Chen, Liang Wang, Wei Zhang
Abstract要約: この研究は階層的な埋め込み探索アルゴリズムである EmbeddingTree を提案する。 EmbeddingTreeをベースとしたインタラクティブな可視化ツールも開発されている。業界規模の商業データと30Musicリスニング/プレイリストデータセットに対して生成された埋め込みによって, EmbeddingTreeと可視化ツールの有効性を実証した。
参考スコア（独自算出の注目度）: 26.95676543794246
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Embedding learning transforms discrete data entities into continuous numerical representations, encoding features/properties of the entities. Despite the outstanding performance reported from different embedding learning algorithms, few efforts were devoted to structurally interpreting how features are encoded in the learned embedding space. This work proposes EmbeddingTree, a hierarchical embedding exploration algorithm that relates the semantics of entity features with the less-interpretable embedding vectors. An interactive visualization tool is also developed based on EmbeddingTree to explore high-dimensional embeddings. The tool helps users discover nuance features of data entities, perform feature denoising/injecting in embedding training, and generate embeddings for unseen entities. We demonstrate the efficacy of EmbeddingTree and our visualization tool through embeddings generated for industry-scale merchant data and the public 30Music listening/playlists dataset.
Abstract（参考訳）: 埋め込み学習は、離散データエンティティを連続的な数値表現に変換し、エンティティの特徴や特性を符号化する。異なる組込み学習アルゴリズムから報告された優れた性能にもかかわらず、学習された組込み空間で機能がどのようにエンコードされるかの構造的な解釈に費やされる努力はほとんどなかった。本研究は、エンティティ特徴のセマンティクスと、解釈不能な埋め込みベクトルを関連付ける階層的埋め込み探索アルゴリズムであるembeddtreeを提案する。 EmbeddingTreeをベースとしたインタラクティブな可視化ツールも開発されている。このツールは、データエンティティのニュアンス特徴を発見し、埋め込みトレーニングで特徴の推論/インジェクションを実行し、見えないエンティティへの埋め込みを生成するのに役立つ。業界規模の商業データと30Musicリスニング/プレイリストデータセットに対して生成された埋め込みによって, EmbeddingTreeと可視化ツールの有効性を実証した。

関連論文リスト

Learning Order Forest for Qualitative-Attribute Data Clustering [52.612779710298526]
本稿では,属性内定性値間の局所的な順序関係を柔軟に表現する木のような距離構造を探索する。より適切な木構造とクラスタを反復的に獲得するために,共同学習機構を提案する。実験により、共同学習は森林をクラスタリングタスクに適応させ、正確な結果を得ることを示した。
論文参考訳（メタデータ） (2026-03-03T07:49:50Z)
FUTURE: Flexible Unlearning for Tree Ensemble [23.336396189756574]
木アンサンブルは、様々な領域で最先端のパフォーマンスを達成し、分類タスクにおける有効性で広く認識されている。データプライバシと忘れるべきテキストライトに重点を置いているため、ツリーアンサンブルが機密情報を忘れるように、いくつかの未学習アルゴリズムが提案されている。木アンサンブルのための新しいアンラーニングアルゴリズムであるFUTUREを提案する。
論文参考訳（メタデータ） (2025-08-28T19:45:36Z)
Explainable Mapper: Charting LLM Embedding Spaces Using Perturbation-Based Explanation and Verification Agents [11.168089496463125]
大規模言語モデル(LLM)は、単語、文、概念間のリッチな意味的および構文的関係をキャプチャする高次元埋め込みを生成する。これらの埋め込み特性の半自動アノテーションのためのフレームワークを導入する。
論文参考訳（メタデータ） (2025-07-24T17:43:40Z)
ReTreever: Tree-based Coarse-to-Fine Representations for Retrieval [64.44265315244579]
そこで本研究では,様々なレベルで参照文書を整理し,表現するためのツリーベース手法を提案する。我々の手法はReTreeverと呼ばれ、クエリと参照ドキュメントが同様のツリーブランチに割り当てられるように、バイナリツリーの内部ノード毎のルーティング関数を共同で学習する。我々の評価では、ReTreeverは一般的に完全な表現精度を保っている。
論文参考訳（メタデータ） (2025-02-11T21:35:13Z)
Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文参考訳（メタデータ） (2024-10-31T06:55:24Z)
Deep Feature Embedding for Tabular Data [2.1301560294088318]
本稿では,軽量なディープニューラルネットワークを利用した新しいディープ埋め込みフレームワークを提案する。数値的特徴量には、2段階の特徴展開と深層変換法が用いられる。実世界のデータセットを用いて実験を行い、性能評価を行った。
論文参考訳（メタデータ） (2024-08-30T10:05:24Z)
Disentangling Dense Embeddings with Sparse Autoencoders [0.0]
スパースオートエンコーダ(SAE)は、複雑なニューラルネットワークから解釈可能な特徴を抽出する可能性を示している。大規模言語モデルからの高密度テキスト埋め込みに対するSAEの最初の応用の1つを提示する。その結果,解釈可能性を提供しながら意味的忠実さを保っていることが明らかとなった。
論文参考訳（メタデータ） (2024-08-01T15:46:22Z)
Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文参考訳（メタデータ） (2024-02-06T22:15:09Z)
Open-Vocabulary Camouflaged Object Segmentation [66.94945066779988]
OVCOS(Open-vocabulary camouflaged Object segmentation)を導入した。我々は11,483個の手選択画像とそれに対応するオブジェクトクラスを含む大規模複合シーンデータセット(textbfOVCamo)を構築した。クラスセマンティック知識の指導とエッジ情報と深度情報からの視覚構造的手がかりの補足を統合することにより、提案手法は効率よくカモフラージュされたオブジェクトを捕捉できる。
論文参考訳（メタデータ） (2023-11-19T06:00:39Z)
What and How of Machine Learning Transparency: Building Bespoke Explainability Tools with Interoperable Algorithmic Components [77.87794937143511]
本稿では,データ駆動予測モデルを説明するためのハンズオントレーニング教材について紹介する。これらのリソースは、解釈可能な表現合成、データサンプリング、説明生成の3つのコアビルディングブロックをカバーする。
論文参考訳（メタデータ） (2022-09-08T13:33:25Z)
Disentangling Visual Embeddings for Attributes and Objects [38.27308243429424]
オブジェクト属性認識における合成ゼロショット学習の問題点について検討する。以前の作業では、オブジェクト分類のために事前訓練されたバックボーンネットワークで抽出された視覚的特徴を使用する。視覚空間における属性とオブジェクトの特徴をアンタングルできる新しいアーキテクチャを提案する。
論文参考訳（メタデータ） (2022-05-17T17:59:36Z)
Improving Entity Linking through Semantic Reinforced Entity Embeddings [16.868791358905916]
そこで本稿では, コンテキスト共通性の学習を容易にするため, 実体埋め込みに微粒な意味情報を注入する手法を提案する。エンティティの埋め込みに基づいて、エンティティリンクにおける最先端のパフォーマンスを新たに達成しました。
論文参考訳（メタデータ） (2021-06-16T00:27:56Z)
Interpretable and Low-Resource Entity Matching via Decoupling Feature Learning from Decision Making [22.755892575582788]
Entity Matchingは、同じ現実世界のオブジェクトを表すエンティティレコードを認識することを目的としている。異種情報融合(HIF)とキー属性ツリー(KAT)誘導からなる新しいEMフレームワークを提案する。提案手法は効率が高く,ほとんどの場合SOTA EMモデルより優れている。
論文参考訳（メタデータ） (2021-06-08T08:27:31Z)
A Comparative Study on Structural and Semantic Properties of Sentence Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文参考訳（メタデータ） (2020-09-23T15:45:32Z)
Probing Linguistic Features of Sentence-Level Representations in Neural Relation Extraction [80.38130122127882]
ニューラルリレーション抽出(RE)に関連する言語特性を対象とした14の探索タスクを導入する。私たちは、40以上の異なるエンコーダアーキテクチャと2つのデータセットでトレーニングされた言語的特徴の組み合わせによって学習された表現を研究するためにそれらを使用します。アーキテクチャによって引き起こされるバイアスと言語的特徴の含意は、探索タスクのパフォーマンスにおいて明らかに表現されている。
論文参考訳（メタデータ） (2020-04-17T09:17:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。