Fugu-MT 論文翻訳(概要): Data Laundering: Artificially Boosting Benchmark Results through Knowledge Distillation

論文の概要: Data Laundering: Artificially Boosting Benchmark Results through Knowledge Distillation

arxiv url: http://arxiv.org/abs/2412.15255v1
Date: Sun, 15 Dec 2024 19:38:48 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-23 18:46:08.637645
Title: Data Laundering: Artificially Boosting Benchmark Results through Knowledge Distillation
Title（参考訳）: データ洗浄:知識蒸留によるベンチマーク結果の強化
Authors: Jonibek Mansurov, Akhmed Sakip, Alham Fikri Aji,
Abstract要約: 知識蒸留は言語モデルベンチマークスコアを操作するために変換可能であることを示す。データロンダリング(Data Laundering)は、金融マネーロンダリングに似た3段階のプロセスである。提案手法は,真の推論機能を開発することなく,ベンチマーク精度を大幅に向上させることができることを示す。
参考スコア（独自算出の注目度）: 11.215746700797618
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In this paper, we show that knowledge distillation can be subverted to manipulate language model benchmark scores, revealing a critical vulnerability in current evaluation practices. We introduce "Data Laundering," a three-phase process analogous to financial money laundering, that enables the covert transfer of benchmark-specific knowledge through seemingly legitimate intermediate training steps. Through extensive experiments with a 2-layer BERT student model, we show how this approach can achieve substantial improvements in benchmark accuracy (up to 75\% on GPQA) without developing genuine reasoning capabilities. Notably, this method can be exploited intentionally or even unintentionally, as researchers may inadvertently adopt this method that inflates scores using knowledge distillation without realizing the implications. While our findings demonstrate the effectiveness of this technique, we present them as a cautionary tale highlighting the urgent need for more robust evaluation methods in AI. This work aims to contribute to the ongoing discussion about evaluation integrity in AI development and the need for benchmarks that more accurately reflect true model capabilities. The code is available at \url{https://github.com/mbzuai-nlp/data_laundering}.
Abstract（参考訳）: 本稿では,知識蒸留が言語モデルベンチマークのスコアを操作するために変換可能であることを示し,現在の評価手法における重大な脆弱性を明らかにする。本稿では,金融マネーロンダリングに類似した3段階のプロセスであるData Launderingを紹介する。 2層BERTの学生モデルによる広範囲な実験を通じて,本手法が真の推論機能を開発することなく,ベンチマーク精度(GPQAでは最大75%)を大幅に向上できることを示す。特に、この手法は意図的あるいは意図的に利用することができるが、研究者はこの手法を意図せず、知識蒸留を用いて楽譜を膨らませる手法を採用することができる。本研究は,この手法の有効性を実証する一方で,AIにおけるより堅牢な評価手法の必要性を強調した注意物語として提示する。この研究は、AI開発における評価の整合性に関する継続的な議論と、真のモデル機能をより正確に反映したベンチマークの必要性に寄与することを目的としている。コードは \url{https://github.com/mbzuai-nlp/data_laundering} で公開されている。

関連論文リスト

Revisiting Logit Distributions for Reliable Out-of-Distribution Detection [73.9121001113687]
アウト・オブ・ディストリビューション(OOD)検出は、オープンワールドアプリケーションにおけるディープラーニングモデルの信頼性を保証するために重要である。 LogitGapは、最大ロジットと残りのロジットの関係を利用する、ポストホックなOOD検出手法である。我々は、LogitGapが様々なOOD検出シナリオとベンチマークにわたって、最先端のパフォーマンスを一貫して達成していることを示す。
論文参考訳（メタデータ） (2025-10-23T02:16:45Z)
Towards Robust Artificial Intelligence: Self-Supervised Learning Approach for Out-of-Distribution Detection [0.19599274203282294]
本稿では,ラベル付きデータを必要としないOOD検出手法を提案する。提案手法は自己教師付き学習の原理を利用して,ラベルのないデータから有用な表現を学習する。
論文参考訳（メタデータ） (2025-10-14T16:55:25Z)
Value from Observations: Towards Large-Scale Imitation Learning via Self-Improvement [19.883973457999282]
Imitation Learning from Observation (IfO)は、大規模に振る舞いを学ぶ強力な方法を提供する。本稿では,主にバイモーダル品質のデータ分布を用いた理想的なシナリオについて検討し,そのようなデータから学習する方法を提案する。提案手法は,専門家データと非専門家データ間の情報伝達に値関数を用いて,アクションフリーな実演にRLに基づく模倣学習を適用した。
論文参考訳（メタデータ） (2025-07-09T09:55:23Z)
Query-Level Uncertainty in Large Language Models [13.195074492564332]
我々は,レイヤやトークン間の自己評価を活用する,emphInternal Confidenceと呼ばれる新しい,トレーニング不要な手法を導入する。事実的QAと数学的推論の両タスクに関する実証的な結果は、我々の内的信頼度がいくつかの基準線を上回ることを示す。提案手法は,効率のよいRAGとモデルカスケードに利用でき,性能を維持しながら推論コストを低減できる。
論文参考訳（メタデータ） (2025-06-11T12:39:48Z)
Active Learning Methods for Efficient Data Utilization and Model Performance Enhancement [5.4044723481768235]
本稿では,より少ないラベル付き例を用いてモデルの性能向上を支援する機械学習の戦略である,アクティブラーニング(AL)の概要を紹介する。 ALの基本概念を導入し、コンピュータビジョン、自然言語処理、トランスファーラーニング、実世界のアプリケーションなど、様々な分野でどのように使われているかについて議論する。
論文参考訳（メタデータ） (2025-04-21T20:42:13Z)
OAL: Enhancing OOD Detection Using Latent Diffusion [5.357756138014614]
Outlier Aware Learning (OAL)フレームワークは、潜伏空間で直接OODトレーニングデータを合成する。 In-Distribution (ID) と収集したOOD特徴の区別を増幅する相互情報に基づくコントラスト学習手法を提案する。
論文参考訳（メタデータ） (2024-06-24T11:01:43Z)
Teaching with Uncertainty: Unleashing the Potential of Knowledge Distillation in Object Detection [47.0507287491627]
本稿では,物体検出のための知識の不確実性を考慮した特徴量に基づく蒸留パラダイムを提案する。モンテカルロのドロップアウト手法を利用して,学生モデルの学習過程に知識の不確実性を導入する。本手法は,複雑な構造や計算資源を必要とせずに,KDプロセス中に効果的に機能する。
論文参考訳（メタデータ） (2024-06-11T06:51:02Z)
Ladder-of-Thought: Using Knowledge as Steps to Elevate Stance Detection [73.31406286956535]
姿勢検出タスクにLadder-of-Thought(LoT)を導入する。 LoTは、小さなLMに高品質な外部知識を同化させ、生成した中間的論理を精査するように指示する。実験では, 姿勢検出タスクにおけるCoTのGPT-3.5よりも16%改善し, 10%向上した。
論文参考訳（メタデータ） (2023-08-31T14:31:48Z)
Goodhart's Law Applies to NLP's Explanation Benchmarks [57.26445915212884]
ERASER(Comprehensiveness and sufficiency)メトリクスとEVAL-X(EVAL-X)メトリクスの2つのセットを批判的に検討する。実験結果の予測や説明を変えることなく,モデル全体の包括性と充足率を劇的に向上させることができることを示す。我々の結果は、現在のメトリクスが説明可能性の研究をガイドする能力に疑問を呈し、これらのメトリクスが正確に捉えるものを再評価する必要性を強調します。
論文参考訳（メタデータ） (2023-08-28T03:03:03Z)
Precise Benchmarking of Explainable AI Attribution Methods [0.0]
本稿では,最新のXAI属性手法のベンチマークのための新しい評価手法を提案する。提案手法は, 基礎的真理の説明を伴う合成分類モデルから成り立っている。実験の結果, Guided-Backprop 法と Smoothgrad XAI 法の性能に関する新たな知見が得られた。
論文参考訳（メタデータ） (2023-08-06T17:03:32Z)
Knowledge Distillation via Token-level Relationship Graph [12.356770685214498]
token-level Relation Graph (TRG) を用いた知識蒸留法を提案する。 TRGを利用することで、教師モデルから高レベルの意味情報を効果的にエミュレートすることができる。我々は,提案手法の有効性を,いくつかの最先端手法に対して評価する実験を行った。
論文参考訳（メタデータ） (2023-06-20T08:16:37Z)
Out-of-Distribution Detection with Hilbert-Schmidt Independence Optimization [114.43504951058796]
異常検出タスクはAIの安全性において重要な役割を担っている。ディープニューラルネットワーク分類器は通常、アウト・オブ・ディストリビューション(OOD)の入力を、信頼性の高いイン・ディストリビューション・クラスに誤って分類する傾向がある。我々は,OOD検出タスクにおいて実用的かつ理論的に有効な代替確率論的パラダイムを提案する。
論文参考訳（メタデータ） (2022-09-26T15:59:55Z)
Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文参考訳（メタデータ） (2022-01-11T23:01:12Z)
What Stops Learning-based 3D Registration from Working in the Real World? [53.68326201131434]
この研究は、3Dポイントのクラウド登録失敗の原因を特定し、その原因を分析し、解決策を提案する。最終的に、これは最も実践的な3D登録ネットワーク(BPNet)に変換される。我々のモデルは微調整をせずに実データに一般化し、商用センサで得られた見えない物体の点雲上で最大67%の精度に達する。
論文参考訳（メタデータ） (2021-11-19T19:24:27Z)
Efficient training of lightweight neural networks using Online Self-Acquired Knowledge Distillation [51.66271681532262]
オンライン自己獲得知識蒸留(OSAKD)は、ディープニューラルネットワークの性能をオンライン的に向上することを目的としている。出力特徴空間におけるデータサンプルの未知確率分布を推定するために、k-nnノンパラメトリック密度推定手法を用いる。
論文参考訳（メタデータ） (2021-08-26T14:01:04Z)
Enhancing the Generalization for Intent Classification and Out-of-Domain Detection in SLU [70.44344060176952]
インテント分類は、音声言語理解(SLU)における主要な課題である近年の研究では、余分なデータやラベルを使用することで、OOD検出性能が向上することが示されている。本稿では、IND意図分類とOOD検出の両方をサポートしながら、INDデータのみを用いてモデルを訓練することを提案する。
論文参考訳（メタデータ） (2021-06-28T08:27:38Z)
Developing a Fidelity Evaluation Approach for Interpretable Machine Learning [2.2448567386846916]
複雑なモデルの解釈性を改善するために、説明可能なAI(XAI)メソッドが使用される。特に、ブラックボックスの説明の忠実さを評価するには、さらなる発展が必要である。本評価は, 基礎となる予測モデルの内部メカニズム, 使用法の内部メカニズム, モデルおよびデータの複雑さが, すべて説明忠実性に影響を与えることを示唆している。
論文参考訳（メタデータ） (2021-06-16T00:21:16Z)
Self-Supervised Relational Reasoning for Representation Learning [5.076419064097733]
自己教師型学習では、ラベルのないデータに対して代替ターゲットを定義することにより、代理目的を達成することを課題とする。本稿では,学習者が無ラベルデータに暗黙的な情報から信号をブートストラップできる,新たな自己教師型関係推論法を提案する。提案手法は,標準データセット,プロトコル,バックボーンを用いて,厳密な実験手順に従って評価する。
論文参考訳（メタデータ） (2020-06-10T14:24:25Z)
Universal Value Density Estimation for Imitation Learning and Goal-Conditioned Reinforcement Learning [5.406386303264086]
いずれの場合も、効果的な解法は、エージェントが指定された状態に確実に到達する必要がある。この研究は、密度推定の最近の進歩を利用して、与えられた状態に到達することを効果的に学習するアプローチを導入する。最初のコントリビューションとして、この手法を目標条件付き強化学習に使用し、それが効率的であり、ドメインの後方偏見に支障を来さないことを示す。第2のコントリビューションとして、模倣学習へのアプローチを拡張し、標準的なベンチマークタスクにおける最先端のサンプル効率を実現することを示す。
論文参考訳（メタデータ） (2020-02-15T23:46:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。