論文の概要: Interactive Machine Learning: From Theory to Scale
- arxiv url: http://arxiv.org/abs/2512.23924v1
- Date: Tue, 30 Dec 2025 00:49:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.24795
- Title: Interactive Machine Learning: From Theory to Scale
- Title(参考訳): インタラクティブ機械学習:理論からスケールへ
- Authors: Yinglun Zhu,
- Abstract要約: この論文はインタラクティブな機械学習について研究し、学習者がどのように情報を収集するか、どの行動を取るかに積極的に影響を与える。
我々は,新しいアルゴリズム原理を開発し,3次元の対話型学習の基本的限界を確立する。
- 参考スコア(独自算出の注目度): 12.234169944475537
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning has achieved remarkable success across a wide range of applications, yet many of its most effective methods rely on access to large amounts of labeled data or extensive online interaction. In practice, acquiring high-quality labels and making decisions through trial-and-error can be expensive, time-consuming, or risky, particularly in large-scale or high-stakes settings. This dissertation studies interactive machine learning, in which the learner actively influences how information is collected or which actions are taken, using past observations to guide future interactions. We develop new algorithmic principles and establish fundamental limits for interactive learning along three dimensions: active learning with noisy data and rich model classes, sequential decision making with large action spaces, and model selection under partial feedback. Our results include the first computationally efficient active learning algorithms achieving exponential label savings without low-noise assumptions; the first efficient, general-purpose contextual bandit algorithms whose guarantees are independent of the size of the action space; and the first tight characterizations of the fundamental cost of model selection in sequential decision making. Overall, this dissertation advances the theoretical foundations of interactive learning by developing algorithms that are statistically optimal and computationally efficient, while also providing principled guidance for deploying interactive learning methods in large-scale, real-world settings.
- Abstract(参考訳): 機械学習は幅広いアプリケーションで顕著な成功を収めてきたが、最も効果的な方法は大量のラベル付きデータへのアクセスや広範囲のオンラインインタラクションに依存している。
実際には、高品質なラベルを取得し、トライアル・アンド・エラーによる意思決定は、特に大規模または高レベルの設定において、高価、時間的、あるいはリスクを伴う可能性がある。
この論文は対話型機械学習を研究し、学習者が情報収集の仕方や、どの行動を取るかに積極的に影響を与える。
ノイズの多いデータとリッチモデルクラスによるアクティブラーニング,大規模なアクション空間によるシーケンシャルな意思決定,部分的なフィードバックによるモデル選択という3つの側面に沿って,新しいアルゴリズムの原則を開発し,対話型学習の基本的な限界を確立する。
その結果,低雑音の仮定を伴わない指数的ラベル保存を実現する最初の計算効率のよい能動的学習アルゴリズム,行動空間のサイズによらず保証を行うための汎用的コンテキストバンディットアルゴリズム,および逐次決定におけるモデル選択の基本コストの厳密な評価が得られた。
全体として、この論文は、統計的に最適で計算効率のよいアルゴリズムを開発することによって、対話型学習の理論的基礎を前進させ、また、大規模で実世界の環境で対話型学習手法を展開するための原則化されたガイダンスを提供する。
関連論文リスト
- A Human-Centered Approach for Improving Supervised Learning [0.44378250612683995]
本稿では、パフォーマンス、時間、リソースの制約のバランスをとる方法を示す。
この研究のもう1つの目標は、人間中心のアプローチを用いて、エンサンブルスをより説明しやすく、理解しやすくすることである。
論文 参考訳(メタデータ) (2024-10-14T10:27:14Z) - Advancing Deep Active Learning & Data Subset Selection: Unifying
Principles with Information-Theory Intuitions [3.0539022029583953]
本論文は,ディープラーニングモデルのラベルとトレーニング効率を向上させることにより,ディープラーニングの実践性を高めることを目的とする。
本稿では,情報理論の原理に基づくデータサブセット選択手法,特にアクティブラーニングとアクティブサンプリングについて検討する。
論文 参考訳(メタデータ) (2024-01-09T01:41:36Z) - RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - PILOT: A Pre-Trained Model-Based Continual Learning Toolbox [65.57123249246358]
本稿では,PILOTとして知られるモデルベース連続学習ツールボックスについて紹介する。
一方、PILOTはL2P、DualPrompt、CODA-Promptといった事前学習モデルに基づいて、最先端のクラスインクリメンタル学習アルゴリズムを実装している。
一方、PILOTは、事前学習されたモデルの文脈に典型的なクラス増分学習アルゴリズムを適合させ、それらの効果を評価する。
論文 参考訳(メタデータ) (2023-09-13T17:55:11Z) - Responsible Active Learning via Human-in-the-loop Peer Study [88.01358655203441]
我々は,データプライバシを同時に保持し,モデルの安定性を向上させるために,Pear Study Learning (PSL) と呼ばれる責任あるアクティブラーニング手法を提案する。
まず,クラウドサイドのタスク学習者(教師)から未学習データを分離する。
トレーニング中、タスク学習者は軽量なアクティブ学習者に指示し、アクティブサンプリング基準に対するフィードバックを提供する。
論文 参考訳(メタデータ) (2022-11-24T13:18:27Z) - What Makes Good Contrastive Learning on Small-Scale Wearable-based
Tasks? [59.51457877578138]
本研究では,ウェアラブル型行動認識タスクにおけるコントラスト学習について検討する。
本稿では,PyTorchライブラリのtextttCL-HAR について述べる。
論文 参考訳(メタデータ) (2022-02-12T06:10:15Z) - The Statistical Complexity of Interactive Decision Making [126.04974881555094]
複雑度尺度であるDecision-Estimation Coefficientは,サンプル効率のインタラクティブ学習に必要かつ十分であることが証明された。
統合アルゴリズム設計原則であるE2Dは、教師付き推定のための任意のアルゴリズムを、意思決定のためのオンラインアルゴリズムに変換する。
論文 参考訳(メタデータ) (2021-12-27T02:53:44Z) - Clustering Analysis of Interactive Learning Activities Based on Improved
BIRCH Algorithm [0.0]
良質な学習行動の構築は、学習者の学習過程と学習効果にとって非常に重要であり、データ駆動型教育意思決定の鍵となる基礎である。
多期間・多コースのオンライン学習行動ビッグデータセットを取得し,学習行動を多次元学習インタラクションアクティビティとして記述する必要がある。
ランダムウォーキング戦略に基づくBIRCHクラスタリングの改良アルゴリズムを設計し、キーラーニングインタラクションアクティビティの検索評価とデータを実現する。
論文 参考訳(メタデータ) (2020-10-08T07:46:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。