Fugu-MT 論文翻訳(概要): Understanding Higher-Order Correlations Among Semantic Components in Embeddings

論文の概要: Understanding Higher-Order Correlations Among Semantic Components in Embeddings

arxiv url: http://arxiv.org/abs/2409.19919v1
Date: Wed, 9 Oct 2024 14:57:48 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-05 16:57:15.412195
Title: Understanding Higher-Order Correlations Among Semantic Components in Embeddings
Title（参考訳）: 埋め込みにおける意味成分の高次相関の理解
Authors: Momose Oyama, Hiroaki Yamagiwa, Hidetoshi Shimodaira,
Abstract要約: 独立成分分析(ICA)は、埋め込みの固有の幾何学的構造を意味的要素として解釈する有効な方法である。 ICAが排除できない推定成分間の非依存性を定量化した。構造全体の可視化は、セマンティックコンポーネントの最大スパンニングツリーを使用して行われた。
参考スコア（独自算出の注目度）: 2.8402080392117757
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Independent Component Analysis (ICA) is an effective method for interpreting the intrinsic geometric structure of embeddings as semantic components. While ICA theory assumes that embeddings can be linearly decomposed into independent components, real-world data often do not satisfy this assumption. Consequently, there are remaining non-independencies between the estimated components that ICA cannot eliminate. We quantified these non-independencies using higher-order correlations and demonstrated that when the higher-order correlation between two components is large, it indicates a strong semantic association between them. The entire structure was revealed through visualization using a maximum spanning tree of semantic components. These findings allow for further understanding of embeddings through ICA.
Abstract（参考訳）: 独立成分分析(ICA)は、埋め込みの固有の幾何学的構造を意味的要素として解釈する有効な方法である。 ICA理論は埋め込みを独立成分に線形に分解できると仮定するが、現実のデータはこの仮定を満たさないことが多い。その結果、ICAが排除できない推定コンポーネントの間には、非依存が残っている。我々は高次相関を用いてこれらの非独立性を定量化し、高次相関が大きい場合、それら間の強い意味的関連性を示すことを示した。構造全体の可視化は、セマンティックコンポーネントの最大スパンニングツリーを使用して行われた。これらの知見はICAによる埋め込みのさらなる理解を可能にする。

関連論文リスト

Sparse Feature Coactivation Reveals Composable Semantic Modules in Large Language Models [12.194272268150398]
大規模言語モデルにおける意味的に一貫性のあるコンテキスト一貫性のあるネットワークコンポーネントを同定する。国と関係性に関する意味的要素を非難することは、予測可能な方法でモデル出力を変化させることを示す。関係コンポーネント自体の中では、後層のノードがモデル出力に強い因果関係を持つ傾向がある。
論文参考訳（メタデータ） (2025-06-22T19:01:13Z)
CORG: Generating Answers from Complex, Interrelated Contexts [57.213304718157985]
現実世界のコーパスでは、知識は文書間で頻繁に再帰するが、曖昧な命名、時代遅れの情報、エラーのためにしばしば矛盾を含む。以前の研究では、言語モデルはこれらの複雑さに苦しむことが示されており、典型的には孤立した単一要因に焦点を当てている。複数のコンテキストを個別に処理されたグループに整理するフレームワークであるContext Organizer (CORG)を紹介する。
論文参考訳（メタデータ） (2025-04-25T02:40:48Z)
A Revisit of Total Correlation in Disentangled Variational Auto-Encoder with Partial Disentanglement [2.287736287148466]
完全に非絡み合った変分自動エンコーダ(VAE)は、観測から非絡み合った潜伏成分を識別することを目的としている。完全不整合VAEを部分的相関(PC)項に一般化するPDisVAE(Partially Disentangled VAE)を開発した。このフレームワークはグループ単位の独立性を扱うことができ、標準のVAEまたは完全に切り離されたVAEに自然に還元することができる。
論文参考訳（メタデータ） (2025-02-04T12:46:21Z)
Revisiting Structured Sentiment Analysis as Latent Dependency Graph Parsing [38.27437431585664]
スパンの内部構造は無視されるため、スパンの境界トークンのみが関係予測やスパン認識に使用される。長いスパンはSSAデータセットのかなりの割合を占めており、内部構造が無視されるという問題をさらに悪化させる。本稿では,2段階解析手法を提案し,木CRFをアルゴリズム内部に制約を課し,遅延構造を明示的にモデル化する。
論文参考訳（メタデータ） (2024-07-05T18:18:50Z)
Discovering Universal Geometry in Embeddings with ICA [3.1921092049934647]
それぞれの埋め込みは、いくつかの内在的解釈可能な軸の合成として表現できることを示す。埋め込みの幾何学的パターンにおける普遍的意味構造の発見は、埋め込みにおける表現の理解を深める。
論文参考訳（メタデータ） (2023-05-22T16:04:44Z)
On Neural Architecture Inductive Biases for Relational Tasks [76.18938462270503]
合成ネットワーク一般化(CoRelNet)と呼ばれる類似度分布スコアに基づく簡単なアーキテクチャを導入する。単純なアーキテクチャの選択は、分布外一般化において既存のモデルより優れていることが分かる。
論文参考訳（メタデータ） (2022-06-09T16:24:01Z)
Shared Independent Component Analysis for Multi-Subject Neuroimaging [107.29179765643042]
本稿では,ShICA (Shared Independent Component Analysis) を導入し,各ビューを加法ガウス雑音によって汚染された共有独立成分の線形変換としてモデル化する。このモデルは、成分がガウス的でないか、あるいはノイズ分散に十分な多様性がある場合、同定可能であることを示す。我々は,fMRIおよびMEGデータセットの実証的証拠として,ShICAが代替品よりも正確な成分推定を行うことを示す。
論文参考訳（メタデータ） (2021-10-26T08:54:41Z)
Compositional Generalization in Dependency Parsing [15.953482168182003]
しかし、依存性には構成解析ベンチマークがない。複合分散の増大は依存性性能を低下させるが、意味解析性能ほど劇的ではない。最も難しい分割において、依存関係の低いパフォーマンスを駆動する多くの構文構造を特定します。
論文参考訳（メタデータ） (2021-10-13T16:32:24Z)
A Dataset-Level Geometric Framework for Ensemble Classifiers [0.76146285961466]
多数決と重み付けされた多数決は、アンサンブル学習で一般的に使用される2つの組み合わせスキームである。本稿では,これら2つの組み合わせスキームの特性群を,データセットレベルの幾何学的枠組みの下で正式に提示する。
論文参考訳（メタデータ） (2021-06-16T09:48:12Z)
Learning compositional structures for semantic graph parsing [81.41592892863979]
本稿では、AM依存性解析をニューラル潜在変数モデルで直接トレーニングする方法を示す。本モデルでは,いくつかの言語現象を独自に把握し,教師あり学習に匹敵する精度を達成している。
論文参考訳（メタデータ） (2021-06-08T14:20:07Z)
Linguistic dependencies and statistical dependence [76.89273585568084]
文脈における単語の確率を推定するために,事前学習した言語モデルを用いる。最大CPMI木は非文脈PMI推定値から抽出した木よりも言語的依存関係によく対応していることがわかった。
論文参考訳（メタデータ） (2021-04-18T02:43:37Z)
Learning to Decouple Relations: Few-Shot Relation Classification with Entity-Guided Attention and Confusion-Aware Training [49.9995628166064]
本稿では,2つのメカニズムを備えたモデルであるCTEGを提案する。一方、注意を誘導するEGA機構を導入し、混乱を引き起こす情報をフィルタリングする。一方,コンフュージョン・アウェア・トレーニング(CAT)法は,関係の識別を明示的に学習するために提案されている。
論文参考訳（メタデータ） (2020-10-21T11:07:53Z)
Hierarchical Human Parsing with Typed Part-Relation Reasoning [179.64978033077222]
このタスクでは、人体構造をモデル化する方法が中心的なテーマである。深層グラフネットワークの表現能力と階層的人間構造を同時に活用することを模索する。
論文参考訳（メタデータ） (2020-03-10T16:45:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。