論文の概要: Evaluating Sparse Interpretable Word Embeddings for Biomedical Domain
- arxiv url: http://arxiv.org/abs/2005.05114v1
- Date: Mon, 11 May 2020 13:56:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-04 19:25:30.772641
- Title: Evaluating Sparse Interpretable Word Embeddings for Biomedical Domain
- Title(参考訳): 生医学領域におけるスパース解釈可能な単語埋め込みの評価
- Authors: Mohammad Amin Samadi, Mohammad Sadegh Akhondzadeh, Sayed Jalal Zahabi,
Mohammad Hossein Manshaei, Zeinab Maleki, Payman Adibi
- Abstract要約: 解釈可能性(英: Interpretability)は、生体医学的応用において不可欠な部分である正当化の鍵となる手段である。
医療領域における単語埋め込みの解釈可能性に関する包括的研究を行い,スパース法の役割に着目した。
実験結果から, 下流タスクにおける元のベクトルの性能を保ちながら, 疎単語ベクトルの方がはるかに解釈可能性が高いことがわかった。
- 参考スコア(独自算出の注目度): 1.3526604206343171
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Word embeddings have found their way into a wide range of natural language
processing tasks including those in the biomedical domain. While these vector
representations successfully capture semantic and syntactic word relations,
hidden patterns and trends in the data, they fail to offer interpretability.
Interpretability is a key means to justification which is an integral part when
it comes to biomedical applications. We present an inclusive study on
interpretability of word embeddings in the medical domain, focusing on the role
of sparse methods. Qualitative and quantitative measurements and metrics for
interpretability of word vector representations are provided. For the
quantitative evaluation, we introduce an extensive categorized dataset that can
be used to quantify interpretability based on category theory. Intrinsic and
extrinsic evaluation of the studied methods are also presented. As for the
latter, we propose datasets which can be utilized for effective extrinsic
evaluation of word vectors in the biomedical domain. Based on our experiments,
it is seen that sparse word vectors show far more interpretability while
preserving the performance of their original vectors in downstream tasks.
- Abstract(参考訳): 単語の埋め込みは、バイオメディカルドメインを含む幅広い自然言語処理タスクに応用されている。
これらのベクトル表現は、意味的および構文的な単語関係、隠れたパターン、データの傾向をうまく捉えるが、解釈可能性を提供しない。
解釈性は、生物医学的応用において不可欠な部分である正当化の鍵となる手段である。
医療領域における単語埋め込みの解釈可能性に関する包括的研究を行い,スパース法の役割に着目した。
単語ベクトル表現の解釈可能性に関する定性的かつ定量的な測定とメトリクスを提供する。
定量的評価のために,分類理論に基づく解釈可能性の定量化に使用できる広範な分類データセットを提案する。
また,本研究手法の本質的および外生的評価について述べる。
後者については,バイオメディカル領域における単語ベクトルの外部評価に有効なデータセットを提案する。
実験結果から, スパースワードベクトルは, 下流タスクにおける元のベクトルの性能を維持しつつ, はるかに高い解釈性を示すことがわかった。
関連論文リスト
- How well do distributed representations convey contextual lexical semantics: a Thesis Proposal [3.3585951129432323]
本稿では,現代ニューラルネットワークによる語彙意味の符号化における分散表現の有効性について検討する。
文脈に影響された意味の関連性と類似性に基づいて,曖昧さの4つの源を同定する。
次に、多言語データセットの収集や構築、様々な言語モデルの利用、言語解析ツールの利用により、これらの情報源を評価することを目的とする。
論文 参考訳(メタデータ) (2024-06-02T14:08:51Z) - Agentivit\`a e telicit\`a in GilBERTo: implicazioni cognitive [77.71680953280436]
本研究の目的は,トランスフォーマーに基づくニューラルネットワークモデルが語彙意味論を推論するかどうかを検討することである。
考慮される意味的性質は、テリシティ(定性とも組み合わされる)と作用性である。
論文 参考訳(メタデータ) (2023-07-06T10:52:22Z) - Leveraging knowledge graphs to update scientific word embeddings using
latent semantic imputation [0.0]
glslsiは、最新の知識グラフからドメイン固有の単語を埋め込むことができることを示す。
生物医学領域における希少項およびOOV項に対して,LSIは信頼性の高い埋め込みベクトルを生成可能であることを示す。
論文 参考訳(メタデータ) (2022-10-27T12:15:26Z) - An Informational Space Based Semantic Analysis for Scientific Texts [62.997667081978825]
本稿では、意味分析のための計算手法と、短い科学的テキストの意味の定量化について紹介する。
科学的意味の表現は、心理的特性ではなく、状況表現を置き換えることで標準化される。
本研究は,テキストの意味の幾何学的表現の基礎となる研究である。
論文 参考訳(メタデータ) (2022-05-31T11:19:32Z) - Discriminative Attribution from Counterfactuals [64.94009515033984]
本稿では,特徴属性と反実的説明を組み合わせたニューラルネットワークの解釈可能性について述べる。
本手法は,特徴属性法の性能を客観的に評価するために有効であることを示す。
論文 参考訳(メタデータ) (2021-09-28T00:53:34Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - Group-Sparse Matrix Factorization for Transfer Learning of Word
Embeddings [31.849734024331283]
本稿では,グループパースペナルティによって構造を生かし,学習ドメイン固有の単語埋め込みを効率的に伝達する直感的な推定手法を提案する。
非コーパス目的関数によって同定される局所最小値はすべて、標準正規化条件下での最小値と統計的に区別できないことを証明した。
論文 参考訳(メタデータ) (2021-04-18T18:19:03Z) - Prototypical Representation Learning for Relation Extraction [56.501332067073065]
本論文では, 遠隔ラベルデータから予測可能, 解釈可能, 堅牢な関係表現を学習することを目的とする。
文脈情報から各関係のプロトタイプを学習し,関係の本質的意味を最善に探求する。
いくつかの関係学習タスクの結果,本モデルが従来の関係モデルを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-03-22T08:11:43Z) - Knowledge-Base Enriched Word Embeddings for Biomedical Domain [5.086571902225929]
利用可能なコーポラとドメイン知識の情報を共同利用したバイオメディカルドメインのための新しい単語埋め込みモデルを提案する。
既存のアプローチとは異なり、提案手法は単純だが、ドメインリソースで利用可能な正確な知識を正しく捉えることに長けている。
論文 参考訳(メタデータ) (2021-02-20T18:18:51Z) - A Comparative Study on Structural and Semantic Properties of Sentence
Embeddings [77.34726150561087]
本稿では,関係抽出に広く利用されている大規模データセットを用いた実験セットを提案する。
異なる埋め込み空間は、構造的および意味的特性に対して異なる強度を持つことを示す。
これらの結果は,埋め込み型関係抽出法の開発に有用な情報を提供する。
論文 参考訳(メタデータ) (2020-09-23T15:45:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。