論文の概要: Negative Ontology of True Target for Machine Learning: Towards Evaluation and Learning under Democratic Supervision
- arxiv url: http://arxiv.org/abs/2604.24824v1
- Date: Mon, 27 Apr 2026 15:01:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.521834
- Title: Negative Ontology of True Target for Machine Learning: Towards Evaluation and Learning under Democratic Supervision
- Title(参考訳): 機械学習のための真のターゲットの負のオントロジー:民主的監督下での評価と学習に向けて
- Authors: Yongquan Yang,
- Abstract要約: 本稿では、真のターゲット(TT)の存在と非存在に関する仮定の変化が、機械学習(ML)に基づく予測モデリングの新しい視点と洞察をいかに生み出すかを哲学的に考察する。
民主党監督下での評価・学習のための知識システムを提案する。
- 参考スコア(独自算出の注目度): 2.0885838435144963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article philosophically examines how shifts in assumptions regarding the existence and non-existence of the true target (TT) give rise to new perspectives and insights for machine learning (ML)-based predictive modeling and, correspondingly, proposes a knowledge system for evaluation and learning under Democratic Supervision. By systematically analysing the existence assumption of the TT in current mainstream ML paradigms, we explicitly adopt a negative ontology perspective, positing that the TT does not objectively exist in the real world, and, grounded in this non-existence assumption, define Democratic Supervision for ML. We further present Multiple Inaccurate True Targets (MIATTs) as an instance-level realization of Democratic Supervision. Building upon MIATTs, we derive principles, for the logic-driven generation and assessment of MIATTs, a logical assessment formulation for evaluation with MIATTs, and undefinable true target learning for learning with MIATTs. Based on these components, we establish the evaluation and learning with MIATTs (EL-MIATTs) framework for ML-based predictive modelling. A real-world application demonstrates the potential of the proposed EL-MIATTs framework in supporting education and professional development for individuals, aligning with prior discussions of Democratic Supervision in the fields of education and professional development.
- Abstract(参考訳): 本稿では、真の目標(TT)の存在と非存在に関する仮定の変化が、機械学習に基づく予測モデリング(ML)における新たな視点と洞察をいかに生み出すかを哲学的に考察し、それに対応して、民主的スーパービジョンの下での評価と学習のための知識システムを提案する。
現在主流のMLパラダイムにおけるTTの存在前提を体系的に分析することにより、TTが現実世界に客観的に存在しないというネガティブなオントロジーの視点を明示的に採用し、この非存在前提に基づいて、MLの民主的スーパービジョンを定義する。
さらに、民主党スーパービジョンのインスタンスレベルの実現として、多重不正確な真のターゲット(MIATT)を提示する。
MIATTを基盤として,論理駆動型MIATTの生成と評価,MIATTを用いた評価のための論理的評価式,MIATTによる学習のための決定不可能な真の目標学習の原則を導出する。
これらの要素に基づいて,MLに基づく予測モデルのためのMIATT(EL-MIATT)フレームワークによる評価と学習を確立する。
現実の応用は、個人のための教育と専門的開発を支援するために提案されたEL-MIATTsフレームワークの可能性を示し、教育と専門的開発分野における民主的スーパービジョンの以前の議論と一致している。
関連論文リスト
- LAF-Based Evaluation and UTTL-Based Learning Strategies with MIATTs [2.0885838435144963]
多くの実世界の機械学習(ML)アプリケーションでは、真のターゲットは曖昧さや主観的情報のために正確に定義できない。
実世界において、与えられたMLタスクの真のターゲットが客観的に存在しないという仮定の下で、EL-MIATTsフレームワークが提案されている。
LAFに基づく評価アルゴリズムとMIATTを用いたUTTLに基づく学習戦略の2つの補完メカニズムを開発した。
論文 参考訳(メタデータ) (2026-04-22T15:47:38Z) - Model Utility Law: Evaluating LLMs beyond Performance through Mechanism Interpretable Metric [99.56567010306807]
大規模言語モデル(LLM)は、学術、産業、そして日々のアプリケーションに欠かせないものになっている。
大規模言語モデル (LLM) 時代における評価の課題の1つは一般化問題である。
従来の性能スコアを補完するメカニズムの解釈可能性向上指標であるモデル利用指数(MUI)を提案する。
論文 参考訳(メタデータ) (2025-04-10T04:09:47Z) - A Comprehensive Survey of Machine Unlearning Techniques for Large Language Models [35.893819613585315]
本研究では,大規模言語モデル(LLM)の文脈における機械学習手法について検討する。
LLMのアンラーニングは、LLMから望ましくないデータの影響を取り除くための原則的なアプローチを提供する。
研究の関心が高まりつつあるにもかかわらず、既存の研究を体系的に整理し、重要な洞察を蒸留する総合的な調査は行われていない。
論文 参考訳(メタデータ) (2025-02-22T12:46:14Z) - Benchmarks as Microscopes: A Call for Model Metrology [76.64402390208576]
現代の言語モデル(LM)は、能力評価において新たな課題を提起する。
メトリクスに自信を持つためには、モデルミアロジの新たな規律が必要です。
論文 参考訳(メタデータ) (2024-07-22T17:52:12Z) - MR-GSM8K: A Meta-Reasoning Benchmark for Large Language Model Evaluation [60.65820977963331]
大規模言語モデル(LLM)のための新しい評価パラダイムを導入する。
このパラダイムは、しばしば推論プロセスを無視する結果指向の評価から、より包括的な評価へと重点を移す。
GSM8Kデータセットにこのパラダイムを適用し,MR-GSM8Kベンチマークを開発した。
論文 参考訳(メタデータ) (2023-12-28T15:49:43Z) - Evaluation Gaps in Machine Learning Practice [13.963766987258161]
実際に、機械学習モデルの評価は、しばしば、非文脈化された予測行動の狭い範囲に焦点を当てる。
評価対象の理想化された幅と実際の評価対象の狭い焦点との間の評価ギャップについて検討した。
これらの特性を研究することで、規範的な影響を持つコミットメントの範囲について、機械学習分野の暗黙の仮定を実証する。
論文 参考訳(メタデータ) (2022-05-11T04:00:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。