論文の概要: A Comparison of Two Fluctuation Analyses for Natural Language Clustering
Phenomena: Taylor and Ebeling & Neiman Methods
- arxiv url: http://arxiv.org/abs/2009.06257v1
- Date: Mon, 14 Sep 2020 08:30:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 12:41:39.906095
- Title: A Comparison of Two Fluctuation Analyses for Natural Language Clustering
Phenomena: Taylor and Ebeling & Neiman Methods
- Title(参考訳): 自然言語クラスタリング現象に対する2つのゆらぎ解析の比較:TaylorとEbeling & Neiman法
- Authors: Kumiko Tanaka-Ishii and Shuntaro Takahashi
- Abstract要約: 本稿ではTaylorとEbeling & Neimanの揺らぎ解析手法について考察する。
いずれの手法も、実際のテキストを独立に、同一に分散した(d.d.)シーケンスと区別することができる。
- 参考スコア(独自算出の注目度): 4.56877715768796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article considers the fluctuation analysis methods of Taylor and Ebeling
& Neiman. While both have been applied to various phenomena in the statistical
mechanics domain, their similarities and differences have not been clarified.
After considering their analytical aspects, this article presents a large-scale
application of these methods to text. It is found that both methods can
distinguish real text from independently and identically distributed (i.i.d.)
sequences. Furthermore, it is found that the Taylor exponents acquired from
words can roughly distinguish text categories; this is also the case for
Ebeling and Neiman exponents, but to a lesser extent. Additionally, both
methods show some possibility of capturing script kinds.
- Abstract(参考訳): 本稿ではTaylorとEbeling & Neimanの揺らぎ解析手法について考察する。
どちらも統計力学領域の様々な現象に応用されているが、その類似性と相違は解明されていない。
分析的側面を考慮して,本論文ではこれらの手法を大規模にテキストに適用する。
いずれの手法も、実際のテキストを独立に、同一に分散した(d.d.)シーケンスと区別することができる。
さらに、単語から取得したテイラー指数は、テキストカテゴリーを大まかに区別できるが、これはエベリング指数やネイマン指数にも当てはまる。
さらに、どちらのメソッドもスクリプトの種類をキャプチャする可能性を示している。
関連論文リスト
- Conjuring Semantic Similarity [59.18714889874088]
2つのテキスト表現間の意味的類似性は、潜伏者の「意味」の間の距離を測定する
テキスト表現間の意味的類似性は、他の表現を言い換えるのではなく、それらが引き起こすイメージに基づいている、という新しいアプローチを提案する。
提案手法は,人間の注釈付きスコアに適合するだけでなく,テキスト条件付き生成モデル評価のための新たな道を開く意味的類似性に関する新たな視点を提供する。
論文 参考訳(メタデータ) (2024-10-21T18:51:34Z) - Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2024-10-14T08:45:35Z) - Explaining Text Similarity in Transformer Models [52.571158418102584]
説明可能なAIの最近の進歩により、トランスフォーマーの説明の改善を活用することで、制限を緩和できるようになった。
両線形類似性モデルにおける2次説明の計算のために開発された拡張であるBiLRPを用いて、NLPモデルにおいてどの特徴相互作用が類似性を促進するかを調べる。
我々の発見は、異なる意味的類似性タスクやモデルに対するより深い理解に寄与し、新しい説明可能なAIメソッドが、どのようにして深い分析とコーパスレベルの洞察を可能にするかを強調した。
論文 参考訳(メタデータ) (2024-05-10T17:11:31Z) - A Comparative Study of Sentence Embedding Models for Assessing Semantic
Variation [0.0]
本稿では,複数の文献において,連続する文間の意味的類似性の時系列と対の文類似性の行列を用いた最近の文埋め込み法について比較する。
文の埋め込み手法のほとんどは、ある文書において意味的類似性の高相関パターンを推定するが、興味深い相違が見られる。
論文 参考訳(メタデータ) (2023-08-08T23:31:10Z) - Evaluating the Robustness of Interpretability Methods through
Explanation Invariance and Equivariance [72.50214227616728]
解釈可能性法は、それらの説明が説明されたモデルを忠実に記述した場合にのみ有用である。
特定の対称性群の下で予測が不変であるニューラルネットワークを考える。
論文 参考訳(メタデータ) (2023-04-13T17:59:03Z) - Contextualized language models for semantic change detection: lessons
learned [4.436724861363513]
本稿では,ダイアクロニック・セマンティック・チェンジを検出する文脈的埋め込みに基づく手法の出力の質的分析を行う。
本研究の結果から,文脈化手法は,実際のダイアクロニック・セマンティック・シフトを行なわない単語に対して,高い変化スコアを予測できることが示唆された。
我々の結論は、事前学習された文脈化言語モデルは、語彙感覚の変化と文脈分散の変化を補う傾向にあるということである。
論文 参考訳(メタデータ) (2022-08-31T23:35:24Z) - Comparing Baseline Shapley and Integrated Gradients for Local
Explanation: Some Additional Insights [3.871148938060281]
統合グラディエント(Sundararajan, Taly, & Yan, 2017)とベースラインシェープリー(Sundararajan, Najmi, 2020)の2つの新しい手法を検討する。
両者が同じ説明をし,その相違点を論じる。
また、ReLUアクティベーション機能を持つニューラルネットワークがモデルに適合するかどうかをシミュレーション研究で調べる。
論文 参考訳(メタデータ) (2022-08-12T03:18:15Z) - Understanding Contrastive Learning Requires Incorporating Inductive
Biases [64.56006519908213]
下流タスクにおけるコントラスト学習の成功を理論的に説明しようとする最近の試みは、エム強化の特性とエムコントラスト学習の損失の値によって保証が証明されている。
このような分析は,関数クラスやトレーニングアルゴリズムの帰納的バイアスを無視し,いくつかの設定において不確実な保証につながることを実証する。
論文 参考訳(メタデータ) (2022-02-28T18:59:20Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Generalized Word Shift Graphs: A Method for Visualizing and Explaining
Pairwise Comparisons Between Texts [0.15833270109954134]
計算テキスト分析における一般的な課題は、2つのコーパスが単語頻度、感情、情報内容などの測定によってどのように異なるかを定量化することである。
一般化された単語シフトグラフを導入し、個々の単語が2つのテキスト間の変動にどのように貢献するかを意味的かつ解釈可能な要約を生成する。
このフレームワークは、相対周波数、辞書スコア、Kulback-LeiblerやJensen-Shannonの発散といったエントロピーに基づく測度など、テキストの比較によく使われる多くのアプローチを自然に含んでいることを示す。
論文 参考訳(メタデータ) (2020-08-05T17:27:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。