論文の概要: Chinese sensorimotor and embodiment norms for 3,000 lexicalized concepts
- arxiv url: http://arxiv.org/abs/2605.22616v2
- Date: Thu, 28 May 2026 10:13:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 08:38:11.586993
- Title: Chinese sensorimotor and embodiment norms for 3,000 lexicalized concepts
- Title(参考訳): 3000の語彙化概念に対する中国感覚運動と実施規範
- Authors: Jing Chen, Gábor Parti, Yin Zhong, Chu-Ren Huang, Marco Marelli,
- Abstract要約: マンダリン中国語における3000の語彙化概念に関する新しい規範データベースを提案する。
感性評価は純粋言語表現からほぼ回復可能であることを示す。
- 参考スコア(独自算出の注目度): 7.791823269861084
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding how conceptual knowledge is grounded in bodily experience, and to what extent machine systems can acquire such knowledge without direct sensorimotor experience, are central questions in both cognitive science and embodied artificial intelligence research. Large-scale normative resources are essential for investigating these questions empirically, yet such resources remain sparse for non-Indo-European languages. We present a novel normative database for 3,000 lexicalized concepts in Mandarin Chinese, comprising 11-dimensional sensorimotor ratings and unidimensional embodiment ratings collected from 378 native Mandarin speakers. The ratings demonstrate high reliability and strong cross-norm validity with existing Chinese resources, each of which covers fewer words and a subset of the 11 sensorimotor dimensions. In a validation study, we tested new variables derived from a theoretically motivated metric, Perceptual Strength of Embodiment (PSE) (Huang et al., 2025), together with seven common composite variables, on lexical decision tasks. The results suggest that PSE-Sensorimotor and Minkowski-3 are the strongest composite predictors of lexical decision performance, capturing the facilitatory effects of sensorimotor information on lexical processing. A further exploratory study showed that sensorimotor ratings are substantially recoverable from purely linguistic representations using simple regression models (mean Spearman r = .62 across dimensions), though recovery varied markedly: visual and auditory dimensions yielded higher correspondence than chemosensory ones. Representational similarity analysis further showed that the relational geometry of the sensorimotor space is also partially recoverable (r = .540), consistent with the view that distributional language use encodes aspects of embodied conceptual structure.
- Abstract(参考訳): 概念的知識がどのように身体的経験に根ざされているか、そして機械システムが直接的な感覚的経験を伴わずにそのような知識をどの程度獲得できるかを理解することは、認知科学と具体的人工知能研究の両方において中心的な問題である。
これらの疑問を実証的に調査するためには大規模な規範的資源が不可欠であるが、インド・ヨーロッパ語以外の言語ではそのような資源は希少である。
マンダリン語話者378名から収集した11次元感性評価と一次元体格評価を含む,中国語の語彙化概念3000名を対象とした新しい規範データベースを提案する。
評価は、既存の中国の資源に対して高い信頼性と強いクロスノーム妥当性を示し、それぞれがより少ない単語と11の知覚的次元のサブセットをカバーしている。
理論的に動機づけられた指標であるPSE(Perceptual Strength of Embodiment, Huang et al , 2025)から派生した新しい変数と7つの一般的な複合変数を語彙的決定タスクで検証した。
その結果, PSE-Sensorimotor と Minkowski-3 は語彙決定性能の最も強い複合予測因子であり, 語彙情報による語彙処理の促進効果が示唆された。
さらなる探索研究により、感覚運動士格付けは単純な回帰モデル(スピアマン r = .62 次元)を用いて純粋言語表現から実質的に回復可能であることが示されたが、回復は顕著に変化し、視覚的次元と聴覚的次元は化学感覚モデルよりも高い対応性を得た。
表現的類似性解析により、感覚運動子の空間の関係幾何学も部分的に復元可能である(r = .540)ことが示され、分布言語はエンコードされた概念構造の側面を持つという見解と一致している。
関連論文リスト
- How does fine-tuning improve sensorimotor representations in large language models? [4.652723324101191]
大規模言語モデル(LLM)は、重要な「身体的ギャップ」を示す
本研究では,タスク固有の微調整が,このギャップをいかに埋めるかについて検討する。
論文 参考訳(メタデータ) (2026-02-09T13:14:04Z) - Revisiting Modality Invariance in a Multilingual Speech-Text Model via Neuron-Level Analysis [15.638379666159127]
言語とモダリティの情報を符号化した場所、選択的ニューロンがデコードにどのように影響するか、そしてこの影響がネットワーク全体にどの程度集中しているかについて検討する。
我々は,平均精度ランキングを用いて言語選択性ニューロンとモダリティ選択性ニューロンを同定し,その機能的役割を推定時に中心的置換介入を用いて検討し,言語とモダリティ間のアクティベーション・マグニチュードの不平等を解析した。
論文 参考訳(メタデータ) (2026-01-24T09:22:18Z) - SensorLM: Learning the Language of Wearable Sensors [50.95988682423808]
本稿では,自然言語によるウェアラブルセンサデータ理解を可能にするセンサ言語基盤モデルのファミリーであるSensorLMを紹介する。
本稿では,センサデータから統計的,構造的,意味的な情報を収集する階層的なキャプション生成パイプラインを提案する。
このアプローチにより、これまでで最大のセンサー言語データセットのキュレーションが可能となり、103,000人以上から5970万時間以上のデータを収集した。
論文 参考訳(メタデータ) (2025-06-10T17:13:09Z) - Mechanistic Understanding and Mitigation of Language Confusion in English-Centric Large Language Models [56.61984030508691]
言語混乱に関する最初の機械論的解釈可能性研究について述べる。
混乱点(CP)がこの現象の中心であることを示す。
比較分析によって同定された少数の臨界ニューロンを多言語で調整したニューロンで編集すると、混乱が著しく軽減されることがわかった。
論文 参考訳(メタデータ) (2025-05-22T11:29:17Z) - Trustworthy Alignment of Retrieval-Augmented Large Language Models via Reinforcement Learning [84.94709351266557]
検索強化に関して,言語モデルの信頼性に焦点をあてる。
検索強化言語モデルには,文脈的知識とパラメトリック的知識の両方に応じて応答を供給できる本質的な能力があると考えられる。
言語モデルと人間の嗜好の整合性に着想を得て,検索強化言語モデルを外部証拠にのみ依存する状況に整合させるための第一歩を踏み出した。
論文 参考訳(メタデータ) (2024-10-22T09:25:21Z) - Discovering and Reasoning of Causality in the Hidden World with Large Language Models [109.62442253177376]
我々はCausal representatiOn AssistanT(COAT)と呼ばれる新しいフレームワークを開発し、因果発見に有用な測定変数を提案する。
大規模言語モデル (LLM) と因果関係を直接推論する代わりに、COAT は中間因果発見結果から LLM へのフィードバックを構築し、提案した変数を洗練させる。
論文 参考訳(メタデータ) (2024-02-06T12:18:54Z) - Exploring Spatial Schema Intuitions in Large Language and Vision Models [8.944921398608063]
大規模言語モデル(LLM)が言語ブロック構築に関する暗黙の人間の直感を効果的に捉えているかどうかを検討する。
驚くべきことに、モデル出力と人間の反応の相関が出現し、具体的体験と具体的なつながりのない適応性が明らかになる。
本研究は,大規模言語モデルによる言語,空間経験,計算間の相互作用の微妙な理解に寄与する。
論文 参考訳(メタデータ) (2024-02-01T19:25:50Z) - Retrieval-based Disentangled Representation Learning with Natural
Language Supervision [61.75109410513864]
本稿では,VDR(Vocabulary Disentangled Retrieval)を提案する。
提案手法では,両エンコーダモデルを用いて語彙空間におけるデータと自然言語の両方を表現する。
論文 参考訳(メタデータ) (2022-12-15T10:20:42Z) - Contextualized Sensorimotor Norms: multi-dimensional measures of
sensorimotor strength for ambiguous English words, in context [9.13755431537592]
我々は112の英単語に対する文脈化感性判断の新しい語彙資源を構築した。
これらの評価は、ランカスターのSensorimotor Normsと重複しているが異なる情報をエンコードしていることを示す。
これらの評価は、基底言語モデルを構築する研究者にとって「カオスセット」として使われる可能性があることを示唆する。
論文 参考訳(メタデータ) (2022-03-10T21:23:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。