論文の概要: Breaking Robustness Barriers in Cognitive Diagnosis: A One-Shot Neural Architecture Search Perspective
- arxiv url: http://arxiv.org/abs/2601.04918v1
- Date: Thu, 08 Jan 2026 13:17:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.213797
- Title: Breaking Robustness Barriers in Cognitive Diagnosis: A One-Shot Neural Architecture Search Perspective
- Title(参考訳): 認知診断におけるロバスト性障害の破滅--ワンショットニューラルアーキテクチャ検索の視点から
- Authors: Ziwen Wang, Shangshang Yang, Xiaoshan Yu, Haiping Ma, Xingyi Zhang,
- Abstract要約: 認知診断のためのワンショットニューラルネットワーク探索法を提案する。
OSCDはトレーニングと検索という2つの異なる段階を通じて運用されている。
探索段階において、異種雑音シナリオ下での最適アーキテクチャ探索を定式化する。
- 参考スコア(独自算出の注目度): 19.30893604363489
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the advancement of network technologies, intelligent tutoring systems (ITS) have emerged to deliver increasingly precise and tailored personalized learning services. Cognitive diagnosis (CD) has emerged as a core research task in ITS, aiming to infer learners' mastery of specific knowledge concepts by modeling the mapping between learning behavior data and knowledge states. However, existing research prioritizes model performance enhancement while neglecting the pervasive noise contamination in observed response data, significantly hindering practical deployment. Furthermore, current cognitive diagnosis models (CDMs) rely heavily on researchers' domain expertise for structural design, which fails to exhaustively explore architectural possibilities, thus leaving model architectures' full potential untapped. To address this issue, we propose OSCD, an evolutionary multi-objective One-Shot neural architecture search method for Cognitive Diagnosis, designed to efficiently and robustly improve the model's capability in assessing learner proficiency. Specifically, OSCD operates through two distinct stages: training and searching. During the training stage, we construct a search space encompassing diverse architectural combinations and train a weight-sharing supernet represented via the complete binary tree topology, enabling comprehensive exploration of potential architectures beyond manual design priors. In the searching stage, we formulate the optimal architecture search under heterogeneous noise scenarios as a multi-objective optimization problem (MOP), and develop an optimization framework integrating a Pareto-optimal solution search strategy with cross-scenario performance evaluation for resolution. Extensive experiments on real-world educational datasets validate the effectiveness and robustness of the optimal architectures discovered by our OSCD model for CD tasks.
- Abstract(参考訳): ネットワーク技術の進歩に伴い、インテリジェント・チュータリング・システム(ITS)が登場し、より正確でカスタマイズされたパーソナライズされた学習サービスを提供するようになった。
認知診断(CD)は、学習行動データと知識状態のマッピングをモデル化することにより、学習者の特定の知識概念の熟達を推し進めることを目的として、ITSの中核研究課題として登場した。
しかし、既存の研究では、観測された応答データにおける広汎な騒音汚染を無視しながら、モデル性能の向上を優先し、実用的な展開を著しく妨げている。
さらに、現在の認知診断モデル(CDM)は、構造設計に関する研究者の専門知識に大きく依存しているため、アーキテクチャの可能性を徹底的に探求することができない。
この問題に対処するために,認知診断のための進化的多目的ワンショットニューラルアーキテクチャ探索法であるOSCDを提案する。
具体的には、OSCDはトレーニングとサーチという2つの異なる段階を通して動作する。
トレーニング段階では,多様なアーキテクチャの組み合わせを包含した探索空間を構築し,完全な二分木トポロジーによって表現される重み共有スーパーネットを訓練し,手作業による設計以上の潜在的なアーキテクチャの包括的探索を可能にする。
探索段階において,多目的最適化問題 (MOP) として異種雑音シナリオ下での最適アーキテクチャ探索を定式化し,Pareto-Optimal Solution Search戦略とクロスシナリオ性能評価を組み合わせた最適化フレームワークを開発する。
実世界の教育データセットに関する大規模な実験は、我々のOSCDモデルによるCDタスクの最適アーキテクチャの有効性とロバスト性を検証する。
関連論文リスト
- Interpretable by Design: Query-Specific Neural Modules for Explainable Reinforcement Learning [0.3655021726150367]
我々はRLシステムを推論エンジンとして設計し、環境に関する多様な問い合わせに答える。
クエリ条件付き決定論的推論ネットワーク(QDIN)は,クエリの種類を第一級市民として扱う統一アーキテクチャである。
予測精度は、制御性能が最適以下であってもほぼ完璧なレベルに達する。
論文 参考訳(メタデータ) (2025-11-11T20:08:32Z) - A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。
これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。
本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文 参考訳(メタデータ) (2024-12-18T14:11:15Z) - EM-DARTS: Hierarchical Differentiable Architecture Search for Eye Movement Recognition [20.209756662832365]
微分可能なニューラルアーキテクチャサーチ(DARTS)は、高い探索効率でアーキテクチャ設計のマニュアルプロセスを自動化する。
眼球運動認識のためのDLアーキテクチャを自動設計する階層的微分可能なアーキテクチャ探索アルゴリズムEM-DARTSを提案する。
EM-DARTSは、最先端の認識性能につながる最適なアーキテクチャを実現できることを示す。
論文 参考訳(メタデータ) (2024-09-22T13:11:08Z) - Implantable Adaptive Cells: A Novel Enhancement for Pre-Trained U-Nets in Medical Image Segmentation [0.0]
本稿では,医用画像分割におけるトレーニング済みニューラルネットワークの性能向上のための新しいアプローチを提案する。
本稿では, 部分連結DARTSをベースとした小型モジュールであるIAC(Indegable Adaptive Cell)のコンセプトを提案する。
MRIとCT画像を用いた4つの医学データセットの実験では、様々なU-Net構成に対して一貫した精度の向上が示されている。
論文 参考訳(メタデータ) (2024-05-06T12:40:15Z) - Unsupervised Graph Neural Architecture Search with Disentangled
Self-supervision [51.88848982611515]
教師なしグラフニューラルアーキテクチャサーチは、文献では未発見のままである。
本稿では,Distangled Self-supervised Graph Neural Architecture Searchモデルを提案する。
我々のモデルは、教師なしの方法で、いくつかのベースライン手法に対して最先端のパフォーマンスを達成することができる。
論文 参考訳(メタデータ) (2024-03-08T05:23:55Z) - Designing Novel Cognitive Diagnosis Models via Evolutionary
Multi-Objective Neural Architecture Search [13.9289351255891]
進化的多目的ニューラルアーキテクチャサーチ(NAS)による新しい認知診断モデルの自動設計を提案する。
2つの実世界のデータセットに対する実験により、提案手法によって探索された認知診断モデルは、既存のモデルよりもはるかに優れた性能を示し、人間設計モデルと同じくらい優れた解釈性を有することが示された。
論文 参考訳(メタデータ) (2023-07-10T09:09:26Z) - Learning Interpretable Models Through Multi-Objective Neural
Architecture Search [0.9990687944474739]
本稿では,タスク性能と「イントロスペクタビリティ」の両方を最適化するフレームワークを提案する。
タスクエラーとイントロスペクタビリティを共同で最適化することは、エラー内で実行されるより不整合でデバッグ可能なアーキテクチャをもたらすことを実証する。
論文 参考訳(メタデータ) (2021-12-16T05:50:55Z) - LENAS: Learning-based Neural Architecture Search and Ensemble for 3D Radiotherapy Dose Prediction [42.38793195337463]
本稿では3次元放射線治療線量予測のための知識蒸留とニューラルネットワーク検索を統合した,学習に基づく新しいアンサンブル手法 LENAS を提案する。
当社のアプローチは、巨大なアーキテクチャ空間から各ブロックを徹底的に検索して、有望なパフォーマンスを示す複数のアーキテクチャを識別することから始まります。
モデルアンサンブルによってもたらされる複雑さを軽減するため、教師-学生パラダイムを採用し、複数の学習ネットワークからの多様な出力を監視信号として活用する。
論文 参考訳(メタデータ) (2021-06-12T10:08:52Z) - A Design Space Study for LISTA and Beyond [79.76740811464597]
近年では、反復アルゴリズムの展開による問題固有のディープネットワーク構築に大きな成功を収めている。
本稿では,深層ネットワークにおける設計アプローチとしてのアンローリングの役割について再考する。
スパースリカバリのためのlistaを代表例として,未ロールモデルに対する設計空間調査を初めて実施した。
論文 参考訳(メタデータ) (2021-04-08T23:01:52Z) - Investigating Bi-Level Optimization for Learning and Vision from a
Unified Perspective: A Survey and Beyond [114.39616146985001]
機械学習やコンピュータビジョンの分野では、モチベーションやメカニズムが異なるにもかかわらず、複雑な問題の多くは、一連の密接に関連するサブプロトコルを含んでいる。
本稿では,BLO(Bi-Level Optimization)の観点から,これらの複雑な学習と視覚問題を一様に表現する。
次に、値関数に基づく単一レベル再構成を構築し、主流勾配に基づくBLO手法を理解し、定式化するための統一的なアルゴリズムフレームワークを確立する。
論文 参考訳(メタデータ) (2021-01-27T16:20:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。