論文の概要: Beyond bouba/kiki: Multidimensional semantic signals are deeply woven into the fabric of natural language
- arxiv url: http://arxiv.org/abs/2603.17306v1
- Date: Wed, 18 Mar 2026 03:02:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.488919
- Title: Beyond bouba/kiki: Multidimensional semantic signals are deeply woven into the fabric of natural language
- Title(参考訳): ブバ・キキの先:多次元意味信号が自然言語の織物に深く織られる
- Authors: Gexin Zhao,
- Abstract要約: 英語の個々の文字音素が構造化された多次元意味信号を持っていることを示す。
本研究は,音意味の象徴性は時折好奇心ではなく,音韻信号の広範で構造的な性質であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A foundational assumption in linguistics holds that the relationship between a word's sound and its meaning is arbitrary. Accumulating evidence from sound symbolism challenges this view, yet no study has systematically mapped the multidimensional semantic profile of every phonological unit within a language. Here we show that individual letter-phonemes in English carry structured, multidimensional semantic signals. Using a minimal-pair paradigm spanning all 220 pairwise letter contrasts, three large language models independently recover consistent phoneme-meaning associations across nine perceptual dimensions. These associations are systematically predicted by articulatory-phonetic features, with manner and place of articulation mapping onto distinct semantic dimensions. Behavioral data from English speakers confirm these patterns at rates well above chance (80.8%), and preliminary cross-linguistic evidence from five typologically diverse languages suggests that core mappings generalize beyond English. Our findings indicate that sound-meaning iconicity is not an occasional curiosity but a pervasive, structured property of the phonological signal, one so systematic that large language models recover it when given only text input, without exposure to speech or articulation during the task.
- Abstract(参考訳): 言語学における基礎的な仮定は、単語の音と意味の関係は任意である、というものである。
音の記号による証拠の蓄積はこの見解に異議を唱えるが、言語内のすべての音韻単位の多次元的意味プロファイルを体系的にマッピングした研究は行われていない。
ここでは、英語の個々の文字音素が構造化された多次元意味信号を持っていることを示す。
220対の文字のコントラストにまたがる最小ペアのパラダイムを用いて、3つの大きな言語モデルは、9次元にわたる一貫した音素意味の関連を独立に回復する。
これらの関連性は調音的・音声的特徴によって体系的に予測され、それぞれ異なる意味的次元への調音マッピングの方法と場所が示される。
英語話者の行動データは、これらのパターンを偶然よりもはるかに高い確率(80.8%)で確認し、5つのタイプ的多様言語からの予備的なクロス言語的証拠は、コアマッピングが英語を超えて一般化されることを示唆している。
本研究は,音意味の象徴性は時折好奇心ではなく,音韻信号の広範かつ構造的特性であり,大きな言語モデルがタスク中に音声や調音に触れることなく,テキスト入力のみを与えられたときに,それを復元できるような体系的であることを示唆する。
関連論文リスト
- Adversarially Probing Cross-Family Sound Symbolism in 27 Languages [8.003991476447572]
本稿では,音の記号を意味領域で計算した最初の言語間比較分析を行う。
音韻学的形式は、不関連言語でさえ、偶然にサイズ意味を予測できる。
系譜を超えて探究するために,サイズ信号を保持しながら言語同一性を抑える逆スクラバを訓練する。
論文 参考訳(メタデータ) (2025-12-13T09:06:50Z) - Do Language Models Associate Sound with Meaning? A Multimodal Study of Sound Symbolism [20.62188582405012]
MLLM(Multimodal Large Language Models)が人間の言語における聴覚情報をどのように解釈するかを検討する。
LEX-ICONは,4つの自然言語から8,052個の単語からなる,広範囲なミメティックな単語データセットである。
その結果,(1)MLLMの音韻直感は,複数の意味的次元にわたる既存の言語研究と一致し,(2)印象的音韻に焦点をあてる音韻的注意パターンが明らかになった。
論文 参考訳(メタデータ) (2025-11-13T07:46:09Z) - Emergent morpho-phonological representations in self-supervised speech models [3.9374885962486172]
本研究では,単語認識に最適化されたS3M変種が音韻的および形態学的現象をどう表すかを検討する。
それらの表現は、英語の名詞と動詞を通常の屈折形に結びつけるのに使用できる大域的な線形幾何を示す。
論文 参考訳(メタデータ) (2025-09-26T22:16:35Z) - False Friends Are Not Foes: Investigating Vocabulary Overlap in Multilingual Language Models [53.01170039144264]
多言語コーパスで訓練されたサブワードトークンライザは、言語間で重複するトークンを自然に生成する。
トークンの重複は言語間転送を促進するのか、それとも言語間の干渉を導入するのか?
相反する語彙を持つモデルでは、重なり合う結果が得られます。
論文 参考訳(メタデータ) (2025-09-23T07:47:54Z) - Languages in Multilingual Speech Foundation Models Align Both Phonetically and Semantically [58.019484208091534]
事前訓練された言語モデル(LM)における言語間アライメントは、テキストベースのLMの効率的な転送を可能にしている。
テキストに基づく言語間アライメントの発見と手法が音声に適用されるかどうかについては、未解決のままである。
論文 参考訳(メタデータ) (2025-05-26T07:21:20Z) - The realization of tones in spontaneous spoken Taiwan Mandarin: a corpus-based survey and theory-driven computational modeling [1.7723990552388866]
本研究では,マンダリン音節単語の音節認識と2つの音節の組み合わせについて検討した。
その結果、文脈や音素的実現における意味は、標準言語理論が予測するよりもはるかに絡み合っていることがわかった。
論文 参考訳(メタデータ) (2025-03-29T17:39:55Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - Low-Dimensional Structure in the Space of Language Representations is
Reflected in Brain Responses [62.197912623223964]
言語モデルと翻訳モデルは,単語の埋め込み,構文的・意味的タスク,将来的な単語埋め込みとの間を円滑に介在する低次元構造を示す。
この表現埋め込みは、各特徴空間が、fMRIを用いて記録された自然言語刺激に対する人間の脳反応にどれだけうまく対応しているかを予測することができる。
これは、埋め込みが脳の自然言語表現構造の一部を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-06-09T22:59:12Z) - Decomposing lexical and compositional syntax and semantics with deep
language models [82.81964713263483]
GPT2のような言語変換器の活性化は、音声理解中の脳活動に線形にマップすることが示されている。
本稿では,言語モデルの高次元アクティベーションを,語彙,構成,構文,意味表現の4つのクラスに分類する分類法を提案する。
その結果は2つの結果が浮かび上がった。
まず、構成表現は、語彙よりも広範な皮質ネットワークを募集し、両側の側頭、頭頂、前頭前皮質を包含する。
論文 参考訳(メタデータ) (2021-03-02T10:24:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。