論文の概要: Words that make SENSE: Sensorimotor Norms in Learned Lexical Token Representations
- arxiv url: http://arxiv.org/abs/2602.00469v1
- Date: Sat, 31 Jan 2026 02:48:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.204983
- Title: Words that make SENSE: Sensorimotor Norms in Learned Lexical Token Representations
- Title(参考訳): センセーを作る言葉:学習語彙表現における感覚モチーフノルム
- Authors: Abhinav Gupta, Toben H. Mintz, Jesse Thomason,
- Abstract要約: 私たちは$textSENSE$ $(textbfStextensorimotor $ $textbfEtextmbedding $ $textbfNtextorm $ $textbfStextcoring $ $ $textbfEtextngine)$という学習プロジェクションモデルを提示します。
- 参考スコア(独自算出の注目度): 15.183419946488401
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While word embeddings derive meaning from co-occurrence patterns, human language understanding is grounded in sensory and motor experience. We present $\text{SENSE}$ $(\textbf{S}\text{ensorimotor }$ $\textbf{E}\text{mbedding }$ $\textbf{N}\text{orm }$ $\textbf{S}\text{coring }$ $\textbf{E}\text{ngine})$, a learned projection model that predicts Lancaster sensorimotor norms from word lexical embeddings. We also conducted a behavioral study where 281 participants selected which among candidate nonce words evoked specific sensorimotor associations, finding statistically significant correlations between human selection rates and $\text{SENSE}$ ratings across 6 of the 11 modalities. Sublexical analysis of these nonce words selection rates revealed systematic phonosthemic patterns for the interoceptive norm, suggesting a path towards computationally proposing candidate phonosthemes from text data.
- Abstract(参考訳): 単語の埋め込みは共起パターンに由来するが、人間の言語理解は感覚と運動経験に基礎を置いている。
我々は$\text{SENSE}$ $(\textbf{S}\text{ensorimotor }$ $\textbf{E}\text{mbedding }$ $\textbf{N}\text{orm }$ $\textbf{S}\text{coring }$ $\textbf{E}\text{ngine})$、単語の語彙埋め込みからランカスターの知覚的ノルムを予測する学習プロジェクションモデルを提示します。
また, 被験者281名を対象に, 特定の感触者関係を誘発する候補語の中から, 人選選択率と有意な相関関係がみられた。
これらの名詞選択率の亜語彙的分析により、知覚的規範の体系的な音韻論的パターンが明らかとなり、テキストデータから候補音韻を計算的に提案する道のりが示唆された。
関連論文リスト
- CoKe: Customizable Fine-Grained Story Evaluation via Chain-of-Keyword Rationalization [90.15027447565427]
思考の連鎖(CoT)は、モデルの予測を導くのに役立つ自由テキストの説明を生成する。
自己一貫性(SC: Self-Consistency)は、複数の生成された説明に対する予測を疎外する。
我々は、$textbfC$hain-$textbfo$f-$textbfKe$ywords (CoKe)を提案する。
論文 参考訳(メタデータ) (2025-03-21T13:37:46Z) - On the Proper Treatment of Tokenization in Psycholinguistics [53.960910019072436]
論文は、トークンレベルの言語モデルは、精神言語学研究で使用される前に、文字レベルの言語モデルにマージ化されるべきであると主張している。
興味領域自体のサブプライムよりも心理学的予測が優れている様々な焦点領域を見いだす。
論文 参考訳(メタデータ) (2024-10-03T17:18:03Z) - Driving Context into Text-to-Text Privatization [0.0]
textitMetric Differential Privacyは、単語のベクトルにノイズを加えることによって、テキストからテキストへの民営化を可能にする。
分類精度が6.05%のかなり高いことを実証する。
論文 参考訳(メタデータ) (2023-06-02T11:33:06Z) - Probing Brain Context-Sensitivity with Masked-Attention Generation [87.31930367845125]
我々は、GPT-2変換器を用いて、一定量の文脈情報をキャプチャする単語埋め込みを生成する。
そして、自然主義的なテキストを聴く人間のfMRI脳活動を予測することができるかどうかを検証した。
論文 参考訳(メタデータ) (2023-05-23T09:36:21Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - Signal in Noise: Exploring Meaning Encoded in Random Character Sequences
with Character-Aware Language Models [0.7454831343436739]
ランダムな文字列からなる$n$-grams、または$garble$は、現在ある言語内外における単語の意味を研究するための新しい文脈を提供する。
characterBERT を用いて,巨大コーパス,既存言語,擬似単語の埋め込みを研究することにより,モデルの高次元埋め込み空間の軸を同定し,これらのクラスを$n$-gram で分離する。
論文 参考訳(メタデータ) (2022-03-15T13:48:38Z) - Contextualized Sensorimotor Norms: multi-dimensional measures of
sensorimotor strength for ambiguous English words, in context [9.13755431537592]
我々は112の英単語に対する文脈化感性判断の新しい語彙資源を構築した。
これらの評価は、ランカスターのSensorimotor Normsと重複しているが異なる情報をエンコードしていることを示す。
これらの評価は、基底言語モデルを構築する研究者にとって「カオスセット」として使われる可能性があることを示唆する。
論文 参考訳(メタデータ) (2022-03-10T21:23:00Z) - Augmenting semantic lexicons using word embeddings and transfer learning [1.101002667958165]
本稿では,単語埋め込みと伝達学習を用いて,感情スコアを比較的低コストで拡張するための2つのモデルを提案する。
評価の結果、両モデルともAmazon Mechanical Turkのレビュアーと同様の精度で新しい単語を採点できるが、コストはごくわずかである。
論文 参考訳(メタデータ) (2021-09-18T20:59:52Z) - A Case Study of Spanish Text Transformations for Twitter Sentiment
Analysis [1.9694608733361543]
感性分析は、与えられたテキストの極性、すなわちその正性または負性を決定するテキストマイニングタスクである。
テキスト表現の新しい形式は、スラング、正書法、文法的誤りを用いてテキストを分析するための新しい課題を示す。
論文 参考訳(メタデータ) (2021-06-03T17:24:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。