論文の概要: A Comparison of Two Fluctuation Analyses for Natural Language Clustering
Phenomena: Taylor and Ebeling & Neiman Methods
- arxiv url: http://arxiv.org/abs/2009.06257v1
- Date: Mon, 14 Sep 2020 08:30:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-18 12:41:39.906095
- Title: A Comparison of Two Fluctuation Analyses for Natural Language Clustering
Phenomena: Taylor and Ebeling & Neiman Methods
- Title(参考訳): 自然言語クラスタリング現象に対する2つのゆらぎ解析の比較:TaylorとEbeling & Neiman法
- Authors: Kumiko Tanaka-Ishii and Shuntaro Takahashi
- Abstract要約: 本稿ではTaylorとEbeling & Neimanの揺らぎ解析手法について考察する。
いずれの手法も、実際のテキストを独立に、同一に分散した(d.d.)シーケンスと区別することができる。
- 参考スコア(独自算出の注目度): 4.56877715768796
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article considers the fluctuation analysis methods of Taylor and Ebeling
& Neiman. While both have been applied to various phenomena in the statistical
mechanics domain, their similarities and differences have not been clarified.
After considering their analytical aspects, this article presents a large-scale
application of these methods to text. It is found that both methods can
distinguish real text from independently and identically distributed (i.i.d.)
sequences. Furthermore, it is found that the Taylor exponents acquired from
words can roughly distinguish text categories; this is also the case for
Ebeling and Neiman exponents, but to a lesser extent. Additionally, both
methods show some possibility of capturing script kinds.
- Abstract(参考訳): 本稿ではTaylorとEbeling & Neimanの揺らぎ解析手法について考察する。
どちらも統計力学領域の様々な現象に応用されているが、その類似性と相違は解明されていない。
分析的側面を考慮して,本論文ではこれらの手法を大規模にテキストに適用する。
いずれの手法も、実際のテキストを独立に、同一に分散した(d.d.)シーケンスと区別することができる。
さらに、単語から取得したテイラー指数は、テキストカテゴリーを大まかに区別できるが、これはエベリング指数やネイマン指数にも当てはまる。
さらに、どちらのメソッドもスクリプトの種類をキャプチャする可能性を示している。
関連論文リスト
- Tracing the Genealogies of Ideas with Large Language Model Embeddings [0.0]
大規模コーパスにまたがる知的影響を検出する新しい手法を提案する。
この手法を用いて、19世紀の約40万冊のノンフィクション書籍と学術出版物のコーパスから文章をベクトル化する。
論文 参考訳(メタデータ) (2024-01-13T18:42:27Z) - A Comparative Study of Sentence Embedding Models for Assessing Semantic
Variation [0.0]
本稿では,複数の文献において,連続する文間の意味的類似性の時系列と対の文類似性の行列を用いた最近の文埋め込み法について比較する。
文の埋め込み手法のほとんどは、ある文書において意味的類似性の高相関パターンを推定するが、興味深い相違が見られる。
論文 参考訳(メタデータ) (2023-08-08T23:31:10Z) - Evaluating the Robustness of Interpretability Methods through
Explanation Invariance and Equivariance [72.50214227616728]
解釈可能性法は、それらの説明が説明されたモデルを忠実に記述した場合にのみ有用である。
特定の対称性群の下で予測が不変であるニューラルネットワークを考える。
論文 参考訳(メタデータ) (2023-04-13T17:59:03Z) - Contextualized language models for semantic change detection: lessons
learned [4.436724861363513]
本稿では,ダイアクロニック・セマンティック・チェンジを検出する文脈的埋め込みに基づく手法の出力の質的分析を行う。
本研究の結果から,文脈化手法は,実際のダイアクロニック・セマンティック・シフトを行なわない単語に対して,高い変化スコアを予測できることが示唆された。
我々の結論は、事前学習された文脈化言語モデルは、語彙感覚の変化と文脈分散の変化を補う傾向にあるということである。
論文 参考訳(メタデータ) (2022-08-31T23:35:24Z) - Comparing Baseline Shapley and Integrated Gradients for Local
Explanation: Some Additional Insights [3.871148938060281]
統合グラディエント(Sundararajan, Taly, & Yan, 2017)とベースラインシェープリー(Sundararajan, Najmi, 2020)の2つの新しい手法を検討する。
両者が同じ説明をし,その相違点を論じる。
また、ReLUアクティベーション機能を持つニューラルネットワークがモデルに適合するかどうかをシミュレーション研究で調べる。
論文 参考訳(メタデータ) (2022-08-12T03:18:15Z) - Understanding Contrastive Learning Requires Incorporating Inductive
Biases [64.56006519908213]
下流タスクにおけるコントラスト学習の成功を理論的に説明しようとする最近の試みは、エム強化の特性とエムコントラスト学習の損失の値によって保証が証明されている。
このような分析は,関数クラスやトレーニングアルゴリズムの帰納的バイアスを無視し,いくつかの設定において不確実な保証につながることを実証する。
論文 参考訳(メタデータ) (2022-02-28T18:59:20Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - An Empirical Comparison of Instance Attribution Methods for NLP [62.63504976810927]
本研究は,トレーニングサンプルの重要性に関して,異なるインスタンス属性が一致した度合いを評価する。
単純な検索メソッドは、グラデーションベースの方法によって識別されたものと異なるトレーニングインスタンスを生成する。
論文 参考訳(メタデータ) (2021-04-09T01:03:17Z) - Detecting Word Sense Disambiguation Biases in Machine Translation for
Model-Agnostic Adversarial Attacks [84.61578555312288]
本稿では,統計的データ特性に基づく曖昧な誤りの予測手法を提案する。
我々は,曖昧な誤りを生じさせるため,文の摂動を最小限に抑える,単純な敵攻撃戦略を開発する。
以上の結果から,曖昧さの堅牢性はドメイン間で大きく異なり,同一データ上でトレーニングされた異なるモデルが異なる攻撃に対して脆弱であることが示唆された。
論文 参考訳(メタデータ) (2020-11-03T17:01:44Z) - Generalized Word Shift Graphs: A Method for Visualizing and Explaining
Pairwise Comparisons Between Texts [0.15833270109954134]
計算テキスト分析における一般的な課題は、2つのコーパスが単語頻度、感情、情報内容などの測定によってどのように異なるかを定量化することである。
一般化された単語シフトグラフを導入し、個々の単語が2つのテキスト間の変動にどのように貢献するかを意味的かつ解釈可能な要約を生成する。
このフレームワークは、相対周波数、辞書スコア、Kulback-LeiblerやJensen-Shannonの発散といったエントロピーに基づく測度など、テキストの比較によく使われる多くのアプローチを自然に含んでいることを示す。
論文 参考訳(メタデータ) (2020-08-05T17:27:11Z) - A computational model implementing subjectivity with the 'Room Theory'.
The case of detecting Emotion from Text [68.8204255655161]
本研究は,テキスト分析における主観性と一般的文脈依存性を考慮した新しい手法を提案する。
単語間の類似度を用いて、ベンチマーク中の要素の相対的関連性を抽出することができる。
この方法は、主観的評価がテキストの相対値や意味を理解するために関係しているすべてのケースに適用できる。
論文 参考訳(メタデータ) (2020-05-12T21:26:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。