論文の概要: From edges to meaning: Semantic line sketches as a cognitive scaffold for ancient pictograph invention
- arxiv url: http://arxiv.org/abs/2604.12865v2
- Date: Wed, 15 Apr 2026 14:29:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 13:09:57.53878
- Title: From edges to meaning: Semantic line sketches as a cognitive scaffold for ancient pictograph invention
- Title(参考訳): 縁から意味へ:古代ピクトグラフ発明の認知的足場としての意味線スケッチ
- Authors: Seowung Leem, Lin Gu, Ruogu Fang,
- Abstract要約: 本研究は,視覚入力を安定的境界に基づく抽象概念に圧縮する脳固有の傾向から,古代ピクトグラフィーの書体が出現したことを示す。
本研究は,ヒトが最初に知覚を記号として認識する認知過程を再カプセル化するための枠組みを構築した。
- 参考スコア(独自算出の注目度): 6.252200625372005
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Humans readily recognize objects from sparse line drawings, a capacity that appears early in development and persists across cultures, suggesting neural rather than purely learned origins. Yet the computational mechanism by which the brain transforms high-level semantic knowledge into low-level visual symbols remains poorly understood. Here we propose that ancient pictographic writing emerged from the brain's intrinsic tendency to compress visual input into stable, boundary-based abstractions. We construct a biologically inspired digital twin of the visual hierarchy that encodes an image into low-level features, generates a contour sketch, and iteratively refines it through top-down feedback guided by semantic representations, mirroring the feedforward and recurrent architecture of the human visual cortex. The resulting symbols bear striking structural resemblance to early pictographs across culturally distant writing systems, including Egyptian hieroglyphs, Chinese oracle bone characters, and proto-cuneiform, and offer candidate interpretations for undeciphered scripts. Our findings support a neuro-computational origin of pictographic writing and establish a framework in which AI can recapitulate the cognitive processes by which humans first externalized perception into symbols.
- Abstract(参考訳): 人間は、発達の初期段階に現れ、文化全体にわたって持続する能力であるスパース線図から容易に物体を認識し、純粋に学習された起源ではなく神経を示唆する。
しかし、脳が高レベルな意味的知識を低レベルな視覚的シンボルに変換する計算機構は、いまだに理解されていない。
そこで本研究では,脳の内在的な傾向から,視覚入力を安定的境界に基づく抽象概念に圧縮する古画像記述法を提案する。
低レベルの特徴に画像をエンコードし、輪郭スケッチを生成し、セマンティックな表現によって導かれるトップダウンフィードバックを通じて、人間の視覚皮質のフィードフォワードおよびリカレントな構造を反映し、それを反復的に洗練する、生物学的にインスピレーションを受けた視覚階層のデジタル双対を構築する。
結果として得られたシンボルは、エジプトのヒエログリフ、中国のオーラクルの骨文字、原形など、文化的に遠く離れた文字体系にまたがる初期のピクトグラフに顕著な構造的類似性を持ち、未解読の文字に対する候補解釈を提供する。
本研究は,ヒトが最初に知覚を記号として認識する認知過程を再カプセル化するための枠組みを構築した。
関連論文リスト
- Hierarchical Process Reward Models are Symbolic Vision Learners [56.94353087007494]
記号型コンピュータビジョンは、明示的な論理規則と構造化された表現を通して図を表現し、機械ビジョンの解釈可能な理解を可能にする。
これは、ピクセルベースのビジュアルモデルと根本的に異なる学習パラダイムを必要とする。
本稿では, インプットダイアグラムをプリミティブにエンコードし, インプットダイアグラムを再構築する自己教師型オートエンコーダを提案する。
論文 参考訳(メタデータ) (2025-12-02T18:46:40Z) - Learning Interpretable Representations Leads to Semantically Faithful EEG-to-Text Generation [52.51005875755718]
我々は脳波からテキストへの復号に焦点をあて、後部崩壊のレンズを通して幻覚の問題に対処する。
脳波とテキスト間の情報容量のミスマッチを認め、デコードタスクをコア意味のセマンティックな要約として再設計する。
パブリックなZuCoデータセットの実験では、GLIMが一貫して、流動的なEEG基底文を生成することが示されている。
論文 参考訳(メタデータ) (2025-05-21T05:29:55Z) - Brain2Text Decoding Model Reveals the Neural Mechanisms of Visual Semantic Processing [0.17188280334580194]
本稿では,fMRI信号を直接自然な画像のテキスト記述にデコードする新しいフレームワークを提案する。
視覚情報なしで訓練された新しいディープラーニングモデルは、最先端のセマンティックデコーディング性能を実現する。
論文 参考訳(メタデータ) (2025-03-15T07:28:02Z) - Visual Theory of Mind Enables the Invention of Proto-Writing [10.013537728631038]
エビデンスによれば、一部の書記システムの初期の形態は、元々は象徴的なピクトグラフで構成されていた。
私たちのモデルは、原著の出現の背景にある認知的・文化的プロセスに光を当てています。
論文 参考訳(メタデータ) (2025-02-03T17:50:37Z) - What Makes a Maze Look Like a Maze? [92.80800000328277]
本稿では,Deep Grounding(DSG)という,視覚的抽象化の明示的な構造化表現を活用してグラウンド化と推論を行うフレームワークを紹介する。
DSGの中核はスキーマ-依存性グラフによる抽象概念の記述で、より原始的なシンボルに分解される。
DSGは視覚言語モデルの抽象的視覚的推論性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2024-09-12T16:41:47Z) - Emergent Graphical Conventions in a Visual Communication Game [80.79297387339614]
人間は象徴的な言語とは別にグラフィカルなスケッチと通信する。
視覚コミュニケーションゲームをする2つのニューラルエージェントを介して、このような進化過程をモデル化し、シミュレートする第一歩を踏み出す。
我々は,コミュニケーションと抽象的なグラフィカルな慣行を成功させるために,エージェントを共同で進化させる新しい強化学習手法を考案した。
論文 参考訳(メタデータ) (2021-11-28T18:59:57Z) - Natural Language Rationales with Full-Stack Visual Reasoning: From
Pixels to Semantic Frames to Commonsense Graphs [106.15931418425906]
本研究は,複数の複雑な視覚的推論課題にまたがる自然言語の有理性の生成に焦点を当てた最初の研究である。
RationaleVT Transformerは、事前学習された言語モデルとオブジェクト認識、接地された視覚的セマンティックフレーム、視覚的コモンセンスグラフを組み合わせることで、自由テキスト論理を生成することを学習する統合モデルである。
実験の結果, 基礎となる事前学習言語モデルは視覚適応の恩恵を受けており, 複雑な視覚的・テキスト的推論タスクに対するモデル解釈可能性の補完として, 自由文合理化が有望な研究方向であることを示唆した。
論文 参考訳(メタデータ) (2020-10-15T05:08:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。