論文の概要: Teaching and Critiquing Conceptualization and Operationalization in NLP
- arxiv url: http://arxiv.org/abs/2512.18505v1
- Date: Sat, 20 Dec 2025 20:47:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.371416
- Title: Teaching and Critiquing Conceptualization and Operationalization in NLP
- Title(参考訳): NLPにおける概念化と運用の指導と評価
- Authors: Vagrant Gautam,
- Abstract要約: 学生が概念化と運用に関するこれらの疑問を探求するために作成したセミナーを概説する。
各サブフィールドは、これらの用語の意味と、それらをどのように扱うべきかについて、共通の理解または概念化を持っています。
- 参考スコア(独自算出の注目度): 1.6063240324252115
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: NLP researchers regularly invoke abstract concepts like "interpretability," "bias," "reasoning," and "stereotypes," without defining them. Each subfield has a shared understanding or conceptualization of what these terms mean and how we should treat them, and this shared understanding is the basis on which operational decisions are made: Datasets are built to evaluate these concepts, metrics are proposed to quantify them, and claims are made about systems. But what do they mean, what should they mean, and how should we measure them? I outline a seminar I created for students to explore these questions of conceptualization and operationalization, with an interdisciplinary reading list and an emphasis on discussion and critique.
- Abstract(参考訳): NLP研究者は、しばしば「解釈可能性」、「バイアス」、「推論」、「ステレオタイプ」といった抽象概念を定義せずに呼び出す。
各サブフィールドは、これらの用語が何を意味するのか、どのように扱うべきかについての共通の理解または概念化を持ち、この共有された理解は、運用上の決定を下す基盤である: データセットはこれらの概念を評価するために構築され、メトリクスはそれらを定量化するために提案され、システムに関する主張が作成されます。
しかし、それらが何を意味するべきで、どのように測定すべきなのか?
学生が概念化と運用化に関するこれらの課題を探求するために作成したセミナーの概要を,学際的な読解リストと,議論と批判に重点を置いて紹介する。
関連論文リスト
- A Geometric Unification of Concept Learning with Concept Cones [58.70836885177496]
解釈可能性の2つの伝統は、並べて進化してきたが、互いに話すことはめったにない:概念ボトルネックモデル(CBM)とスパースオートエンコーダ(SAE)。
両パラダイムが同じ幾何学的構造をインスタンス化することを示す。
CBMは人間の定義した参照ジオメトリを提供するが、SAEは学習した円錐がCBMをどの程度よく近似するか、あるいは包含しているかによって評価することができる。
論文 参考訳(メタデータ) (2025-12-08T09:51:46Z) - Rethinking Saliency Maps: A Cognitive Human Aligned Taxonomy and Evaluation Framework for Explanations [16.045822460720363]
基準フレーム$times$ Granularity (RFxG) の分類について紹介する。
RFxGは2つの本質的な軸に沿ってサリエンシの説明を整理する: 参照フレーム: ポイントワイズ(なぜこの予測は?)とコントラスト的(なぜこの予測は代替ではないのか?
我々の総合的な評価フレームワークは、これらのメトリクスを10の最先端の正当性メソッド、4つのモデルアーキテクチャ、3つのデータセットに適用します。
論文 参考訳(メタデータ) (2025-11-17T07:29:25Z) - FaCT: Faithful Concept Traces for Explaining Neural Network Decisions [56.796533084868884]
ディープネットワークは、幅広いタスクで顕著なパフォーマンスを示しているが、それらの機能に関するグローバルな概念レベルの理解は、依然として重要な課題である。
本稿では,概念に基づく説明の忠実さを強調し,モデル独立な機械的概念説明を用いた新しいモデルを提案する。
私たちの概念はクラス間で共有され、あらゆるレイヤから、ロジットへの貢献と入力-視覚化を忠実にトレースすることができます。
論文 参考訳(メタデータ) (2025-10-29T13:35:46Z) - On the Role of Entity and Event Level Conceptualization in Generalizable Reasoning: A Survey of Tasks, Methods, Applications, and Future Directions [62.06913340614293]
本稿では,概念化されるインスタンスのタイプに基づいて,異なる概念化のタイプを4つのレベルに分類する。
本稿では,150以上の論文を包括的に調査し,概念化に関連するさまざまな定義,リソース,手法,下流アプリケーションについて調査する。
論文 参考訳(メタデータ) (2024-06-16T10:32:41Z) - The Empty Signifier Problem: Towards Clearer Paradigms for
Operationalising "Alignment" in Large Language Models [18.16062736448993]
本稿では,大規模言語モデル(LLM)における「アライメント」の概念を,ポスト構造主義社会政治理論のレンズを通して論じる。
1) モデル行動のどの次元が重要か,2) 意味と定義がこれらの次元にどのように分類されるか,といったことを議論する枠組みを提案する。
透明性と批判的評価の文化を育成し,LLMと人間集団の整合性の複雑さをコミュニティがナビゲートするのを支援することを目的としている。
論文 参考訳(メタデータ) (2023-10-03T22:02:17Z) - ConceptBed: Evaluating Concept Learning Abilities of Text-to-Image
Diffusion Models [79.10890337599166]
本研究では,284のユニークな視覚概念と33Kの合成テキストプロンプトからなる大規模データセットであるConceptBedを紹介する。
我々は、対象、属性、スタイルのいずれかである視覚概念を評価し、また、構成性の4つの次元(計数、属性、関係、行動)を評価する。
私たちの結果は、概念を学ぶことと、既存のアプローチが克服に苦労する構成性を維持することのトレードオフを示しています。
論文 参考訳(メタデータ) (2023-06-07T18:00:38Z) - Interpretable Neural-Symbolic Concept Reasoning [7.1904050674791185]
概念に基づくモデルは、人間の理解可能な概念のセットに基づいてタスクを学習することでこの問題に対処することを目的としている。
本稿では,概念埋め込みに基づく最初の解釈可能な概念ベースモデルであるDeep Concept Reasoner (DCR)を提案する。
論文 参考訳(メタデータ) (2023-04-27T09:58:15Z) - COPEN: Probing Conceptual Knowledge in Pre-trained Language Models [60.10147136876669]
概念的知識は人間の認知と知識基盤の基本である。
既存の知識探索作業は、事前訓練された言語モデル(PLM)の事実知識のみに焦点を当て、概念知識を無視する。
PLMが概念的類似性によってエンティティを編成し、概念的特性を学習し、コンテキスト内でエンティティを概念化するかどうかを調査する3つのタスクを設計する。
タスクのために、393のコンセプトをカバーする24kのデータインスタンスを収集、注釈付けします。
論文 参考訳(メタデータ) (2022-11-08T08:18:06Z) - Separating Skills and Concepts for Novel Visual Question Answering [66.46070380927372]
アウト・オブ・ディストリビューションデータへの一般化は、VQA(Visual Question Answering)モデルにおいて問題となっている。
「スキル」とは、数え方や属性認識などの視覚的なタスクであり、その疑問に言及された「概念」に適用される。
モデル内でこれらの2つの要因を暗黙的に分離するスキルと概念を学習するための新しい手法を提案する。
論文 参考訳(メタデータ) (2021-07-19T18:55:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。