論文の概要: Local Compositional Complexity: How to Detect a Human-readable Messsage
- arxiv url: http://arxiv.org/abs/2501.03664v1
- Date: Tue, 07 Jan 2025 10:04:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-08 15:49:29.415016
- Title: Local Compositional Complexity: How to Detect a Human-readable Messsage
- Title(参考訳): 局所構成複雑性: 可読性メッセージの検出方法
- Authors: Louis Mahon,
- Abstract要約: 我々は、データがメッセージを伝えるのに役立つ方法で構造化されている場合、高い特定の複雑さの感覚に焦点を当てます。
本稿では、データの最も短い記述を構造化された部分と非構造化された部分に分割して、データの複雑さを測定するための一般的なフレームワークについて述べる。
我々は、局所的な構成性を適切な特定の構造として提案することにより、人間のコミュニケーションを指向したより正確で計算可能な定義を導出する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Data complexity is an important concept in the natural sciences and related areas, but lacks a rigorous and computable definition. In this paper, we focus on a particular sense of complexity that is high if the data is structured in a way that could serve to communicate a message. In this sense, human speech, written language, drawings, diagrams and photographs are high complexity, whereas data that is close to uniform throughout or populated by random values is low complexity. We describe a general framework for measuring data complexity based on dividing the shortest description of the data into a structured and an unstructured portion, and taking the size of the former as the complexity score. We outline an application of this framework in statistical mechanics that may allow a more objective characterisation of the macrostate and entropy of a physical system. Then, we derive a more precise and computable definition geared towards human communication, by proposing local compositionality as an appropriate specific structure. We demonstrate experimentally that this method can distinguish meaningful signals from noise or repetitive signals in auditory, visual and text domains, and could potentially help determine whether an extra-terrestrial signal contained a message.
- Abstract(参考訳): データ複雑性は自然科学や関連分野において重要な概念であるが、厳密で計算可能な定義が欠けている。
本稿では,メッセージの伝達に役立つような方法でデータが構造化された場合,複雑度の高い特定の感覚に焦点を当てる。
この意味では、人間のスピーチ、書き言葉、図面、図、写真は複雑さが高いが、ランダムな値で一様に近いデータは複雑さが低い。
本稿では,データの最も短い記述を構造化された部分と非構造化された部分に分割し,前者のサイズを複雑性スコアとする一般的なフレームワークについて述べる。
物理系のマクロ状態とエントロピーのより客観的な特徴付けを可能にする統計力学におけるこの枠組みの適用について概説する。
そこで我々は、局所的な構成性を適切な特定の構造として提案することにより、人間のコミュニケーションを指向したより正確で計算可能な定義を導出する。
本手法は,聴覚領域,視覚領域,テキスト領域において,有意な信号と聴覚領域,視覚領域,およびテキスト領域の繰り返し信号とを区別し,地球外信号がメッセージを含むか否かを判断する上で有効であることを示す。
関連論文リスト
- Unsupervised detection of semantic correlations in big data [47.201377047286215]
本稿では,2進数として表される高次元データにおける意味的相関を検出する手法を提案する。
本研究では,データ記述に必要な独立座標の最小個数を定量化するデータセットの2値固有次元を推定する。
提案アルゴリズムは, いわゆる次元の呪いとは無関係であり, ビッグデータ解析に利用することができる。
論文 参考訳(メタデータ) (2024-11-04T14:37:07Z) - Multi-scale structural complexity as a quantitative measure of visual complexity [1.3499500088995464]
マルチスケール構造複雑性尺度(MSSC)は,物体の構造的複雑性を,その階層構造における異なるスケール間の相違点の量として定義する手法である。
我々は、MSSCが他の計算複雑性尺度と同等の主観的複雑性と相関し、より直感的であり、画像のカテゴリ間で一貫性があり、計算が容易であることを示した。
論文 参考訳(メタデータ) (2024-08-07T20:26:35Z) - Linguistic Structure from a Bottleneck on Sequential Information Processing [5.850665541267672]
予測情報によって制約されたコードに自然言語のような体系性が生じることを示す。
人間の言語は、音韻学、形態学、構文学、意味論のレベルにおいて、低い予測情報を持つように構成されている。
論文 参考訳(メタデータ) (2024-05-20T15:25:18Z) - The Computational Complexity of Concise Hypersphere Classification [49.57441416941195]
本稿では,二元データに対する超球分類問題の複雑性理論による最初の研究である。
パラメータ化複雑性のパラダイムを用いて、入力データに存在する可能性のある構造特性の影響を分析する。
論文 参考訳(メタデータ) (2023-12-12T09:33:03Z) - How Do Transformers Learn Topic Structure: Towards a Mechanistic
Understanding [56.222097640468306]
我々は、トランスフォーマーが「意味構造」を学ぶ方法の機械的理解を提供する
数学的解析とウィキペディアデータの実験を組み合わせることで、埋め込み層と自己保持層がトピック構造をエンコードしていることを示す。
論文 参考訳(メタデータ) (2023-03-07T21:42:17Z) - Structured information extraction from complex scientific text with
fine-tuned large language models [55.96705756327738]
そこで本研究では,共振器認識と関係抽出のための簡単なシーケンス・ツー・シーケンス手法を提案する。
このアプローチは、約500組のプロンプトで微調整された、事前訓練済みの大規模言語モデル(LLM)であるGPT-3を利用する。
このアプローチは、構造化されていないテキストから抽出された構造化知識の大規模なデータベースを得るための、シンプルで、アクセス可能で、非常に柔軟な経路を示す。
論文 参考訳(メタデータ) (2022-12-10T07:51:52Z) - Semantic-Native Communication: A Simplicial Complex Perspective [50.099494681671224]
トポロジカル空間の観点から意味コミュニケーションを研究する。
送信機はまずデータを$k$の単純複素数にマッピングし、その高次相関を学習する。
受信機は構造を復号し、行方不明または歪んだデータを推測する。
論文 参考訳(メタデータ) (2022-10-30T22:33:44Z) - Compositional Processing Emerges in Neural Networks Solving Math
Problems [100.80518350845668]
人工知能の最近の進歩は、大きなモデルが十分な言語データに基づいて訓練されると、文法構造が表現に現れることを示している。
我々は、この研究を数学的推論の領域にまで拡張し、どのように意味を構成するべきかについての正確な仮説を定式化することができる。
私たちの研究は、ニューラルネットワークがトレーニングデータに暗黙的に構造化された関係について何かを推測できるだけでなく、個々の意味の合成を合成全体へと導くために、この知識を展開できることを示している。
論文 参考訳(メタデータ) (2021-05-19T07:24:42Z) - Testing the Quantitative Spacetime Hypothesis using Artificial Narrative
Comprehension (II) : Establishing the Geometry of Invariant Concepts, Themes,
and Namespaces [0.0]
本研究は、セマンティック時空仮説の継続的な適用に寄与し、物語テキストの教師なし分析を実証する。
データストリームは、バイオインフォマティクス解析の方法で、マルチスケール干渉計によって、小さな成分に解析され、分別される。
入力のフラグメントは、各スケールで新しい有効言語を定義するアルファベット階層のシンボルとして機能する。
論文 参考訳(メタデータ) (2020-09-23T11:19:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。