論文の概要: Topic Modeling in the Voynich Manuscript
- arxiv url: http://arxiv.org/abs/2107.02858v1
- Date: Tue, 6 Jul 2021 19:50:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-08 14:09:33.749434
- Title: Topic Modeling in the Voynich Manuscript
- Title(参考訳): ヴォイニヒ写本における話題モデリング
- Authors: Rachel Sterneck, Annie Polish, Claire Bowern
- Abstract要約: 本稿では,Voynich Manuscript(Beinecke MS408)のトピックモデリングによる調査結果について述べる。
我々は、Voynichページをトピックにクラスタリングするために、潜時ディリクレ割り当て、潜時意味分析、非負行列分解を用いる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This article presents the results of investigations using topic modeling of
the Voynich Manuscript (Beinecke MS408). Topic modeling is a set of
computational methods which are used to identify clusters of subjects within
text. We use latent dirichlet allocation, latent semantic analysis, and
nonnegative matrix factorization to cluster Voynich pages into `topics'. We
then compare the topics derived from the computational models to clusters
derived from the Voynich illustrations and from paleographic analysis. We find
that computationally derived clusters match closely to a conjunction of scribe
and subject matter (as per the illustrations), providing further evidence that
the Voynich Manuscript contains meaningful text.
- Abstract(参考訳): 本稿では,Voynich Manuscript(Beinecke MS408)のトピックモデリングによる調査結果について述べる。
トピックモデリング(英: Topic Modeling)は、テキスト内の対象のクラスタを識別する計算手法の集合である。
我々は,voynich ページを ‘topics' に分類するために,潜在ディリクレ割り当て,潜在意味解析,非負行列分解を用いる。
次に,計算モデルから得られたトピックを,ヴォイニッヒの挿絵と古図解析から得られたクラスターと比較する。
計算によって導出されたクラスターは、(図面によれば)書式と主題の結合と密接に一致し、ヴォイニッヒ写本が意味のあるテキストを含んでいるというさらなる証拠を与える。
関連論文リスト
- The Geometric Structure of Topic Models [0.0]
研究や応用に広く利用されているにもかかわらず、トピックモデルの詳細な分析は依然としてオープンな研究トピックである。
平坦なトピックモデルから順序構造を導出する入射幾何学的手法を提案する。
規則的モチーフに基づく概念階層のための新しい可視化パラダイムを提案する。
論文 参考訳(メタデータ) (2024-03-06T10:53:51Z) - Topics in the Haystack: Extracting and Evaluating Topics beyond
Coherence [0.0]
本稿では,文と文書のテーマを深く理解する手法を提案する。
これにより、一般的な単語やネオロジズムを含む潜在トピックを検出することができる。
本稿では, 侵入者の単語の人間識別と相関係数を示し, 単語侵入作業において, ほぼ人間レベルの結果を得る。
論文 参考訳(メタデータ) (2023-03-30T12:24:25Z) - Topics in Contextualised Attention Embeddings [7.6650522284905565]
最近の研究で、言語モデルから単語レベルの文脈表現をクラスタ化することは、潜在ディリクレ割当から単語の潜在トピックで見つかる単語クラスタをエミュレートすることを示した。
重要な疑問は、潜在トピックをモデル化するように明示的に設計されていない言語モデルにおいて、そのような話題の単語クラスタが、クラスタリングを通じてどのように自動的に形成されるかである。
BERT と DistilBERT を用いて,このような話題クラスタをモデル化する上で,アテンションフレームワークが重要な役割を担っていることがわかった。
論文 参考訳(メタデータ) (2023-01-11T07:26:19Z) - Topics as Entity Clusters: Entity-based Topics from Language Models and
Graph Neural Networks [0.7734726150561089]
本稿では,概念的エンティティを用いたクラスタベースのトピックモデリング手法を提案する。
エンティティは、リレーショナル情報に富んだ実世界の概念の言語に依存しない表現である。
当社のアプローチは、コヒーレンシメトリクス全体で、他の最先端トピックモデルよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-01-06T10:54:54Z) - Knowledge-Aware Bayesian Deep Topic Model [50.58975785318575]
本稿では,事前知識を階層型トピックモデリングに組み込むベイズ生成モデルを提案する。
提案モデルでは,事前知識を効率的に統合し,階層的なトピック発見と文書表現の両面を改善する。
論文 参考訳(メタデータ) (2022-09-20T09:16:05Z) - TopicNet: Semantic Graph-Guided Topic Discovery [51.71374479354178]
既存の階層的なトピックモデルでは、教師なしの方法でテキストコーパスから意味論的意味のあるトピックを抽出することができる。
TopicNetを階層的なトピックモデルとして導入し、学習に影響を与えるための帰納的バイアスとして、事前構造知識を注入する。
論文 参考訳(メタデータ) (2021-10-27T09:07:14Z) - Sawtooth Factorial Topic Embeddings Guided Gamma Belief Network [49.458250193768826]
本稿では,文書の深部生成モデルであるGBNのソートゥース要素埋め込みについて述べる。
単語も話題も同じ次元の埋め込みベクトルとして表現される。
我々のモデルは、より深い解釈可能なトピックを抽出する他のニューラルネットワークモデルよりも優れています。
論文 参考訳(メタデータ) (2021-06-30T10:14:57Z) - Author Clustering and Topic Estimation for Short Texts [69.54017251622211]
同じ文書中の単語間の強い依存をモデル化することにより、遅延ディリクレ割当を拡張できる新しいモデルを提案する。
同時にユーザをクラスタ化し、ホック後のクラスタ推定の必要性を排除しています。
我々の手法は、短文で生じる問題に対する従来のアプローチよりも、-または----------- で機能する。
論文 参考訳(メタデータ) (2021-06-15T20:55:55Z) - Matching Visual Features to Hierarchical Semantic Topics for Image
Paragraph Captioning [50.08729005865331]
本稿では,階層的トピック誘導画像段落生成フレームワークを開発した。
複数の抽象レベルでの画像とテキストの相関をキャプチャするために、変分推論ネットワークを設計します。
段落生成を導くために、学習した階層的トピックと視覚的特徴を言語モデルに統合する。
論文 参考訳(メタデータ) (2021-05-10T06:55:39Z) - Tired of Topic Models? Clusters of Pretrained Word Embeddings Make for
Fast and Good Topics too! [5.819224524813161]
事前学習した単語の埋め込みをクラスタリングし、重み付けされたクラスタリングと上位単語の再ランク付けのための文書情報を組み込んだ別の方法を提案する。
このアプローチの最も優れた組み合わせは、従来のトピックモデルと同様に機能するが、ランタイムと計算の複雑さは低い。
論文 参考訳(メタデータ) (2020-04-30T16:18:18Z) - How Far are We from Effective Context Modeling? An Exploratory Study on
Semantic Parsing in Context [59.13515950353125]
文法に基づく意味解析を行い,その上に典型的な文脈モデリング手法を適用する。
我々は,2つの大きなクロスドメインデータセットに対して,13のコンテキストモデリング手法を評価した。
論文 参考訳(メタデータ) (2020-02-03T11:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。