論文の概要: Approaches to the classification of complex systems: Words, texts, and
more
- arxiv url: http://arxiv.org/abs/2205.04060v1
- Date: Mon, 9 May 2022 06:27:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-10 22:33:24.313921
- Title: Approaches to the classification of complex systems: Words, texts, and
more
- Title(参考訳): 複雑なシステムの分類へのアプローチ:単語、テキストなど
- Authors: Andrij Rovenchak
- Abstract要約: 量子アンサンブルにおけるレベルの占有を伴うテキスト中の単語の分布の類似性は、統計物理学による表面的な類似性を示唆している。
これにより、この物理的類推に基づいてテキストの様々なパラメータを定義することができる。
同様のアプローチは、例えば、よく知られた言語的な類似によるゲノムを研究するために開発することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Chapter starts with introductory information about quantitative
linguistics notions, like rank--frequency dependence, Zipf's law, frequency
spectra, etc. Similarities in distributions of words in texts with level
occupation in quantum ensembles hint at a superficial analogy with statistical
physics. This enables one to define various parameters for texts based on this
physical analogy, including "temperature", "chemical potential", entropy, and
some others. Such parameters provide a set of variables to classify texts
serving as an example of complex systems. Moreover, texts are perhaps the
easiest complex systems to collect and analyze.
Similar approaches can be developed to study, for instance, genomes due to
well-known linguistic analogies. We consider a couple of approaches to define
nucleotide sequences in mitochondrial DNAs and viral RNAs and demonstrate their
possible application as an auxiliary tool for comparative analysis of genomes.
Finally, we discuss entropy as one of the parameters, which can be easily
computed from rank--frequency dependences. Being a discriminating parameter in
some problems of classification of complex systems, entropy can be given a
proper interpretation only in a limited class of problems. Its overall role and
significance remain an open issue so far.
- Abstract(参考訳): 章は、ランク-周波数依存、zipfの法則、周波数スペクトルなど、量的言語学の概念に関する入門情報から始まる。
量子アンサンブルにおけるレベル占有を持つテキストにおける単語の分布の類似性は、統計物理学との表層的類似性を暗示している。
これにより、「温度」、「化学的ポテンシャル」、「エントロピー」など、この物理的類似に基づいてテキストの様々なパラメータを定義することができる。
このようなパラメータは、複雑なシステムの例として機能するテキストを分類する変数のセットを提供する。
さらに、テキストはおそらく収集および分析する最も簡単な複雑なシステムである。
同様のアプローチは、例えば、よく知られた言語類似物によるゲノムを研究するために開発することができる。
ミトコンドリアdnaおよびウイルスrnaのヌクレオチド配列を定義するいくつかのアプローチを検討し、ゲノムの比較解析のための補助的ツールとしてそれらの応用を実証する。
最後に, ランク周波数依存性から容易に計算できるパラメータの1つとしてエントロピーについて考察する。
複素系の分類のいくつかの問題において識別パラメータであるため、エントロピーは限定された問題のクラスでのみ適切な解釈を与えることができる。
これまでのところ、その全体的な役割と重要性は未解決のままである。
関連論文リスト
- Explaining Datasets in Words: Statistical Models with Natural Language Parameters [66.69456696878842]
本稿では, クラスタリング, 時系列, 分類モデルなど, 自然言語の述語によってパラメータ化される統計モデル群を紹介する。
当社のフレームワークは、ユーザチャット対話の分類、時間の経過とともにどのように進化するかの特徴付け、一方の言語モデルが他方よりも優れているカテゴリを見つけることなど、幅広い問題に適用しています。
論文 参考訳(メタデータ) (2024-09-13T01:40:20Z) - Complex systems approach to natural language [0.0]
複雑性科学の観点から、自然言語の研究で使用される主要な方法論概念を概説する。
定量的言語学における3つの主要な複雑性関連研究動向を概説する。
論文 参考訳(メタデータ) (2024-01-05T12:01:26Z) - Predictive complexity of quantum subsystems [0.0]
我々は、異なるサブシステムからなる量子系の予測状態と予測複雑性を定義する。
予測は、外部ヒルベルト空間における状態ベクトルの同値類によって形成される。
また、長い範囲の絡み合いと短い範囲の絡み合いを区別できる局所順序パラメータとしても機能する。
論文 参考訳(メタデータ) (2023-09-26T18:58:56Z) - Probing multipartite entanglement through persistent homology [6.107978190324034]
永続的ホモロジーによる多部交絡の研究を提案する。
永続ホモロジーは トポロジカルデータ分析で 使われるツールです
永続バーコードはそのトポロジ的要約よりもきめ細かな情報を提供することを示す。
論文 参考訳(メタデータ) (2023-07-14T17:24:33Z) - How Do Transformers Learn Topic Structure: Towards a Mechanistic
Understanding [56.222097640468306]
我々は、トランスフォーマーが「意味構造」を学ぶ方法の機械的理解を提供する
数学的解析とウィキペディアデータの実験を組み合わせることで、埋め込み層と自己保持層がトピック構造をエンコードしていることを示す。
論文 参考訳(メタデータ) (2023-03-07T21:42:17Z) - An Informational Space Based Semantic Analysis for Scientific Texts [62.997667081978825]
本稿では、意味分析のための計算手法と、短い科学的テキストの意味の定量化について紹介する。
科学的意味の表現は、心理的特性ではなく、状況表現を置き換えることで標準化される。
本研究は,テキストの意味の幾何学的表現の基礎となる研究である。
論文 参考訳(メタデータ) (2022-05-31T11:19:32Z) - Quantum state inference from coarse-grained descriptions: analysis and
an application to quantum thermodynamics [101.18253437732933]
本稿では,最大エントロピー原理法と最近提案された平均アサインメントマップ法を比較した。
割り当てられた記述が測定された制約を尊重するという事実にもかかわらず、記述は従来のシステム環境構造を超えたシナリオで異なる。
論文 参考訳(メタデータ) (2022-05-16T19:42:24Z) - Quantifying Synthesis and Fusion and their Impact on Machine Translation [79.61874492642691]
自然言語処理(NLP)では、一般に、融合や凝集のような厳密な形態を持つ言語全体をラベル付けする。
本研究では,単語とセグメントレベルで形態型を定量化することにより,そのようなクレームの剛性を低減することを提案する。
本研究では, 英語, ドイツ語, トルコ語の非教師なし・教師付き形態素分割法について検討する一方, 融合ではスペイン語を用いた半自動手法を提案する。
そして、機械翻訳品質と単語(名詞と動詞)における合成・融合の程度との関係を分析する。
論文 参考訳(メタデータ) (2022-05-06T17:04:58Z) - Testing the Quantitative Spacetime Hypothesis using Artificial Narrative
Comprehension (II) : Establishing the Geometry of Invariant Concepts, Themes,
and Namespaces [0.0]
本研究は、セマンティック時空仮説の継続的な適用に寄与し、物語テキストの教師なし分析を実証する。
データストリームは、バイオインフォマティクス解析の方法で、マルチスケール干渉計によって、小さな成分に解析され、分別される。
入力のフラグメントは、各スケールで新しい有効言語を定義するアルファベット階層のシンボルとして機能する。
論文 参考訳(メタデータ) (2020-09-23T11:19:17Z) - The role of feature space in atomistic learning [62.997667081978825]
物理的にインスパイアされた記述子は、原子論シミュレーションへの機械学習技術の応用において重要な役割を果たしている。
異なる記述子のセットを比較するためのフレームワークを導入し、メトリクスとカーネルを使ってそれらを変換するさまざまな方法を紹介します。
原子密度のn-体相関から構築した表現を比較し,低次特徴の利用に伴う情報損失を定量的に評価した。
論文 参考訳(メタデータ) (2020-09-06T14:12:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。