Fugu-MT 論文翻訳(概要): Semantic Feature Verification in FLAN-T5

論文の概要: Semantic Feature Verification in FLAN-T5

arxiv url: http://arxiv.org/abs/2304.05591v1
Date: Wed, 12 Apr 2023 03:37:57 GMT
ステータス: 翻訳完了
システム内更新日: 2023-04-13 16:18:51.421264
Title: Semantic Feature Verification in FLAN-T5
Title（参考訳）: FLAN-T5における意味的特徴検証
Authors: Siddharth Suresh, Kushin Mukherjee, Timothy T. Rogers
Abstract要約: 機械検証された規範は、人間の規範だけで表現されるもの以上の概念構造の側面を捉えていることを示す。その結果,LLMは従来の意味的特徴ノルムの検証方法を大幅に強化する可能性が示唆された。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This study evaluates the potential of a large language model for aiding in generation of semantic feature norms - a critical tool for evaluating conceptual structure in cognitive science. Building from an existing human-generated dataset, we show that machine-verified norms capture aspects of conceptual structure beyond what is expressed in human norms alone, and better explain human judgments of semantic similarity amongst items that are distally related. The results suggest that LLMs can greatly enhance traditional methods of semantic feature norm verification, with implications for our understanding of conceptual representation in humans and machines.
Abstract（参考訳）: 本研究では,認知科学における概念構造評価のための重要なツールである意味的特徴規範の生成を支援する大規模言語モデルの可能性を評価した。既存の人間生成データセットから、機械検証された規範は、人間の規範にのみ表されるもの以上の概念構造の側面を捉え、異なる関係のある項目間の意味的類似性の人間の判断をよりよく説明する。その結果,LLMは従来の意味的特徴ノルム検証手法を大幅に強化し,人間や機械における概念表現の理解に寄与することが示唆された。

関連論文リスト

Human-like conceptual representations emerge from language prediction [72.5875173689788]
大規模言語モデル(LLMs)は、言語データに対する次世代の予測を通じてのみ訓練され、顕著な人間的な振る舞いを示す。これらのモデルは、人間に似た概念を発達させ、もしそうなら、そのような概念はどのように表現され、組織化されるのか? 以上の結果から,LLMは言語記述から他の概念に関する文脈的手がかりに関して柔軟に概念を導出できることが示唆された。これらの結果は、構造化された人間のような概念表現が、現実世界の接地なしに言語予測から自然に現れることを証明している。
論文参考訳（メタデータ） (2025-01-21T23:54:17Z)
Learning Discrete Concepts in Latent Hierarchical Models [73.01229236386148]
自然の高次元データから学習する概念は、ヒューマンアライメントと解釈可能な機械学習モデルの構築の可能性を秘めている。我々は概念を階層的因果モデルを通して関連付けられた離散潜在因果変数として定式化する。我々は、理論的な主張を合成データ実験で裏付ける。
論文参考訳（メタデータ） (2024-06-01T18:01:03Z)
Concept Induction using LLMs: a user experiment for assessment [1.1982127665424676]
本研究では,人間に対する説明として意味のある高レベルな概念を生成するために,LLM(Large Language Model)の可能性を探る。我々は、LLMによって生成された概念を、人間によって生成された概念とECII概念誘導システムという、他の2つの方法と比較する。人為的な説明は依然として優れているが, GPT-4 から派生した概念は, ECII が生成した概念よりも人間にとって理解しやすいことが示唆された。
論文参考訳（メタデータ） (2024-04-18T03:22:02Z)
ConcEPT: Concept-Enhanced Pre-Training for Language Models [57.778895980999124]
ConcEPTは、概念知識を事前訓練された言語モデルに注入することを目的としている。これは、事前訓練されたコンテキストで言及されたエンティティの概念を予測するために、外部エンティティの概念予測を利用する。実験の結果,ConcEPTは概念強化事前学習により概念知識を向上することがわかった。
論文参考訳（メタデータ） (2024-01-11T05:05:01Z)
Interpreting Pretrained Language Models via Concept Bottlenecks [55.47515772358389]
事前訓練された言語モデル(PLM)は、様々な自然言語処理タスクにおいて大きな進歩を遂げてきた。ブラックボックスの性質による解釈可能性の欠如は、責任ある実装に課題をもたらす。本研究では,人間にとって理解しやすい高レベルで有意義な概念を用いて,PLMを解釈する新しい手法を提案する。
論文参考訳（メタデータ） (2023-11-08T20:41:18Z)
Interpretability is in the Mind of the Beholder: A Causal Framework for Human-interpretable Representation Learning [22.201878275784246]
説明可能なAIは、入力機能などの低レベル要素の観点から定義された説明から、データから学んだ解釈可能な概念でエンコードされた説明へとシフトしている。しかし、そのような概念を確実に取得する方法は、基本的には不明確である。ポストホックな説明器と概念に基づくニューラルネットワークの両方に適した解釈可能な表現を得るための数学的枠組みを提案する。
論文参考訳（メタデータ） (2023-09-14T14:26:20Z)
A Recursive Bateson-Inspired Model for the Generation of Semantic Formal Concepts from Spatial Sensory Data [77.34726150561087]
本稿では,複雑な感覚データから階層構造を生成するための記号のみの手法を提案する。このアプローチは、概念や概念の創始の鍵としてのバテソンの差異の概念に基づいている。このモデルは、トレーニングなしでかなりリッチだが人間に読まれる概念表現を生成することができる。
論文参考訳（メタデータ） (2023-07-16T15:59:13Z)
Conceptual structure coheres in human cognition but not in large language models [7.405352374343134]
概念構造は, 文化, 言語, 推定方法の違いに対して堅牢であることを示す。結果は、現代の大言語モデルと人間の認知の間に重要な違いを浮き彫りにしている。
論文参考訳（メタデータ） (2023-04-05T21:27:01Z)
GlanceNets: Interpretabile, Leak-proof Concept-based Models [23.7625973884849]
概念ベースモデル(CBM)は、高レベルの概念の語彙の獲得と推論によって、ハイパフォーマンスと解釈可能性を組み合わせる。我々は、モデル表現と基礎となるデータ生成プロセスとの整合性の観点から、解釈可能性を明確に定義する。 GlanceNetsは不整合表現学習とオープンセット認識の技法を利用してアライメントを実現する新しいCBMである。
論文参考訳（メタデータ） (2022-05-31T08:53:53Z)
Translational Concept Embedding for Generalized Compositional Zero-shot Learning [73.60639796305415]
一般合成ゼロショット学習は、ゼロショット方式で属性オブジェクト対の合成概念を学習する手段である。本稿では,これら2つの課題を統一的なフレームワークで解決するために,翻訳概念の埋め込み(translational concept embedded)という新しいアプローチを提案する。
論文参考訳（メタデータ） (2021-12-20T21:27:51Z)
A Minimalist Dataset for Systematic Generalization of Perception, Syntax, and Semantics [131.93113552146195]
我々は,機械が一般化可能な概念を学習する能力を調べるため,新しいデータセットであるHINT(Hand written arithmetic with INTegers)を提案する。 HINTでは、イメージなどの生信号から概念がどのように認識されるかを学ぶことが機械のタスクである。我々は、RNN、Transformer、GPT-3など、様々なシーケンス・ツー・シーケンスモデルで広範囲に実験を行った。
論文参考訳（メタデータ） (2021-03-02T01:32:54Z)
Understanding Interpretability by generalized distillation in Supervised Classification [3.5473853445215897]
最近の解釈戦略は、複雑な機械学習モデルの根底にある決定メカニズムの人間の理解に焦点を当てている。本稿では,他のMLモデルと相対的に定義される解釈・蒸留式を提案する。 MNIST、Fashion-MNIST、Stanford40データセットに関する提案フレームワークの評価を行った。
論文参考訳（メタデータ） (2020-12-05T17:42:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。