論文の概要: AI-enhanced semantic feature norms for 786 concepts
- arxiv url: http://arxiv.org/abs/2505.10718v1
- Date: Thu, 15 May 2025 21:43:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:13.66034
- Title: AI-enhanced semantic feature norms for 786 concepts
- Title(参考訳): 786概念のためのAIによる意味的特徴規範
- Authors: Siddharth Suresh, Kushin Mukherjee, Tyler Giallanza, Xizheng Yu, Mia Patil, Jonathan D. Cohen, Timothy T. Rogers,
- Abstract要約: 大規模言語モデル(LLM)からの応答を伴って人為的特徴ノルムのデータセットを増強する新しいアプローチを導入する。
私たちは、AIによって強化された機能規範データセット、NOVA: Norms Optimized Via AIが、概念間の機能密度と重複をはるかに高めていることに気付きました。
- 参考スコア(独自算出の注目度): 8.68405554675708
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic feature norms have been foundational in the study of human conceptual knowledge, yet traditional methods face trade-offs between concept/feature coverage and verifiability of quality due to the labor-intensive nature of norming studies. Here, we introduce a novel approach that augments a dataset of human-generated feature norms with responses from large language models (LLMs) while verifying the quality of norms against reliable human judgments. We find that our AI-enhanced feature norm dataset, NOVA: Norms Optimized Via AI, shows much higher feature density and overlap among concepts while outperforming a comparable human-only norm dataset and word-embedding models in predicting people's semantic similarity judgments. Taken together, we demonstrate that human conceptual knowledge is richer than captured in previous norm datasets and show that, with proper validation, LLMs can serve as powerful tools for cognitive science research.
- Abstract(参考訳): 意味的特徴ノルムは、人間の概念的知識の研究に基礎を置いているが、伝統的な手法は、規範研究の労働集約性に起因する概念/機能カバレッジと品質の妥当性の間のトレードオフに直面している。
本稿では,大規模言語モデル (LLM) からの応答で人為的特徴ノルムのデータセットを増強し,信頼性の高い人的判断に対する規範の品質を検証する手法を提案する。
我々のAI強化機能規範データセットであるNOVA: Norms Optimized Via AIは、人の意味的類似性判断を予測する上で、同等の人間のみの規範データセットと単語埋め込みモデルよりもはるかに高い機能密度と概念間の重複を示す。
合わせて、人間の概念的知識が従来の標準データセットよりも豊かであることを示し、適切な検証を行うことで、LLMが認知科学研究の強力なツールとなることを示す。
関連論文リスト
- Empirically evaluating commonsense intelligence in large language models with large-scale human judgments [4.7206754497888035]
本稿では,人工知能における常識を評価する新しい手法を提案する。
モデルの判断と人口の対応を計測する。
私たちのフレームワークは、異なる、しばしば互換性のない、知識の社会的備蓄を持つ人間の集合体にAIモデルを適用することの要求に寄与します。
論文 参考訳(メタデータ) (2025-05-15T13:55:27Z) - EgoNormia: Benchmarking Physical Social Norm Understanding [52.87904722234434]
我々は,人間インタラクションのエゴ中心のビデオに基づいて,1,853の挑戦的多段階MCQ質問からなるデータセット$|epsilon|$を提示する。
規範的行動には、安全、プライバシー、プロキシ、丁寧さ、協力、協調/行動、コミュニケーション/相対性という7つのカテゴリが含まれる。
論文 参考訳(メタデータ) (2025-02-27T19:54:16Z) - Interpreting Pretrained Language Models via Concept Bottlenecks [55.47515772358389]
事前訓練された言語モデル(PLM)は、様々な自然言語処理タスクにおいて大きな進歩を遂げてきた。
ブラックボックスの性質による解釈可能性の欠如は、責任ある実装に課題をもたらす。
本研究では,人間にとって理解しやすい高レベルで有意義な概念を用いて,PLMを解釈する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-11-08T20:41:18Z) - Semantic Feature Verification in FLAN-T5 [0.0]
機械検証された規範は、人間の規範だけで表現されるもの以上の概念構造の側面を捉えていることを示す。
その結果,LLMは従来の意味的特徴ノルムの検証方法を大幅に強化する可能性が示唆された。
論文 参考訳(メタデータ) (2023-04-12T03:37:57Z) - Beyond Interpretable Benchmarks: Contextual Learning through Cognitive
and Multimodal Perception [0.0]
この研究は、チューリングテストがコンピュータシステムを人為的に形作る試みであると誤解されていることを主張する。
通訳性に欠けるにもかかわらず、汎用知能の基盤として暗黙の学習を強調している。
論文 参考訳(メタデータ) (2022-12-04T08:30:04Z) - NormSAGE: Multi-Lingual Multi-Cultural Norm Discovery from Conversations
On-the-Fly [61.77957329364812]
本稿では,対話型多言語・多文化規範発見の新たな課題に対処する枠組みを提案する。
NormSAGEはノルム発見タスクと会話コンテキストを表す有向質問を通じてノルムに関する知識を導き出す。
さらに、発見される規範が正しいことを保証する自己検証メカニズムにより、言語モデル幻覚のリスクに対処する。
論文 参考訳(メタデータ) (2022-10-16T18:30:05Z) - Human-AI Collaboration via Conditional Delegation: A Case Study of
Content Moderation [47.102566259034326]
我々は,人間-AI協調のための代替パラダイムとして条件付きデリゲートを提案する。
我々は、条件付きデリゲートルールの作成において、人間を支援する新しいインタフェースを開発する。
本研究は,モデル性能向上における条件付きデリゲートの実現可能性を示す。
論文 参考訳(メタデータ) (2022-04-25T17:00:02Z) - WenLan 2.0: Make AI Imagine via a Multimodal Foundation Model [74.4875156387271]
我々は,膨大なマルチモーダル(視覚的・テキスト的)データを事前学習した新しい基礎モデルを開発する。
そこで本研究では,様々な下流タスクにおいて,最先端の成果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-27T12:25:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。