論文の概要: A Systematic Study of Behavioral Cloning for Scientific Data Annotation
- arxiv url: http://arxiv.org/abs/2606.07568v1
- Date: Tue, 26 May 2026 02:19:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.73045
- Title: A Systematic Study of Behavioral Cloning for Scientific Data Annotation
- Title(参考訳): 科学的データアノテーションのための行動クローンの体系的研究
- Authors: Ishaan Singh Chandok, Core Francisco Park,
- Abstract要約: 本稿では,科学的アノテーションを用いた行動クローニングの枠組みについて紹介する。
モデルでは,タスククリティカルな決定の前にGUI力学を学習し,トレーニングデータよりもミスが少ないことを示す。
マルチタスク・ビヘイビア・クローン上でのスケーリングモデルは、より大きなモデルの方がスケール範囲内でよりデータ効率が高いことを示している。
- 参考スコア(独自算出の注目度): 5.5575224613422725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scientific data annotation, such as tracking animals in video or proofreading neural reconstructions, remains bottlenecked by the "last mile" problem: even with strong automation, verification and correction consume substantial human effort. Standard approaches train models to directly predict annotations, discarding the rich supervision in how experts navigate, click, verify, and correct. We introduce a framework for studying behavioral cloning on scientific annotation: 9 synthetic tasks paired with synthetic annotations that simulate realistic human strategies including exploration, mistake correction, and strategic decision-making. Our experiments reveal several findings. First, skills emerge hierarchically: models learn GUI mechanics before task-critical decisions, and commit fewer mistakes than the training data while retaining the ability to correct errors when they occur. Second, scaling models on multi-task behavioral cloning shows that larger models are more data efficient within our scale range. Third, multi-task pretraining enables efficient fine-tuning to new tasks, while training from scratch fails entirely. Fourth, linear probes reveal that models internally represent latent variables of the annotation process such as task phase and data position; interestingly, we find a shared mistake representation that generalizes across different annotation tasks. Overall, our framework establishes systematic benchmarks and identifies key bottlenecks, providing a foundation for scaling behavioral cloning to real-world scientific data annotation.
- Abstract(参考訳): ビデオ中の動物の追跡や神経再構築の証明のような科学的データアノテーションは、「ラストマイル」問題によってボトルネックを被っている。
標準アプローチでは、モデルをトレーニングして、アノテーションを直接予測し、専門家のナビゲート、クリック、検証、修正に関する豊富な監督を廃止する。
9つの合成タスクと合成アノテーションを組み合わせ、探索、誤り訂正、戦略的意思決定を含む現実的な人間の戦略をシミュレートする。
私たちの実験ではいくつかの結果が明らかになった。
モデルはタスククリティカルな決定の前にGUIの仕組みを学び、トレーニングデータよりも少ないミスを犯し、エラーが発生した時に修正する能力を保持します。
第二に、マルチタスクの振る舞いクローン上でのスケーリングモデルでは、より大きなモデルの方がスケール範囲内でよりデータ効率が高いことが示される。
第3に、マルチタスク事前トレーニングは、スクラッチからのトレーニングが完全に失敗する一方で、新しいタスクへの効率的な微調整を可能にする。
第4に、線形プローブは、タスクフェーズやデータ位置などのアノテーションプロセスの潜在変数を内部的に表現する。
全体として、我々のフレームワークは系統的なベンチマークを確立し、重要なボトルネックを特定し、実際の科学的データアノテーションに行動クローンをスケールするための基盤を提供する。
関連論文リスト
- Learning Feature Encoder with Synthetic Anomalies for Weakly Supervised Graph Anomaly Detection [66.0756595768692]
本稿では,グラフ異常に適した特徴学習戦略を活用する,弱い教師付きグラフ異常検出手法を提案する。
提案手法は,合成異常により頑健な特徴表現を抽出するマルチタスク学習方式に基づいている。
公開データセットに関する実験は、我々の手法が競合相手よりも優れていることを示す。
論文 参考訳(メタデータ) (2026-05-12T08:27:06Z) - What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - CellTranspose: Few-shot Domain Adaptation for Cellular Instance
Segmentation [4.38301148531795]
我々は、最小限の新しい注釈付きデータとトレーニング時間を必要とするアプローチを設計する問題に対処する。
我々は、いくつかの注釈付きサンプルを非常に効率的に活用する、特別な対照的な損失を設計する。
論文 参考訳(メタデータ) (2022-12-28T23:00:50Z) - Learning Curves for Sequential Training of Neural Networks:
Self-Knowledge Transfer and Forgetting [9.734033555407406]
我々は,タスクからタスクまでの目標関数を継続的に学習するニューラルネットワークをニューラルネットワークとして検討する。
モデルが複数のタスクで同じターゲット関数を学習する連続学習の変種について検討する。
同じターゲットであっても、トレーニングされたモデルは、各タスクのサンプルサイズに応じて、何らかの転送と忘れを見せる。
論文 参考訳(メタデータ) (2021-12-03T00:25:01Z) - Towards Open-World Feature Extrapolation: An Inductive Graph Learning
Approach [80.8446673089281]
グラフ表現と学習を伴う新しい学習パラダイムを提案する。
本フレームワークは,1) 下位モデルとしてのバックボーンネットワーク(フィードフォワードニューラルネットなど)が,予測ラベルの入力および出力として機能を取り,2) 上位モデルとしてのグラフニューラルネットワークが,観測データから構築された特徴データグラフをメッセージパッシングすることで,新機能の埋め込みを外挿することを学ぶ。
論文 参考訳(メタデータ) (2021-10-09T09:02:45Z) - Self-supervised driven consistency training for annotation efficient
histopathology image analysis [13.005873872821066]
大きなラベル付きデータセットでニューラルネットワークをトレーニングすることは、計算病理学において依然として支配的なパラダイムである。
本研究では,非教師付き表現学習のための強力な監視信号を学ぶために,ヒストロジ全体スライディング画像の背景となる多段階的文脈的手がかりを利用する自己教師付きプレテキストタスクを提案する。
また,タスク固有の未ラベルデータとの予測整合性に基づいて,事前学習した表現を下流タスクに効果的に転送することを学ぶ教師による半教師付き一貫性パラダイムを提案する。
論文 参考訳(メタデータ) (2021-02-07T19:46:21Z) - Learning What Makes a Difference from Counterfactual Examples and
Gradient Supervision [57.14468881854616]
ニューラルネットワークの一般化能力を改善するための補助的学習目標を提案する。
我々は、異なるラベルを持つ最小差の例のペア、すなわち反ファクトまたはコントラストの例を使用し、タスクの根底にある因果構造を示す信号を与える。
このテクニックで訓練されたモデルは、配布外テストセットのパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2020-04-20T02:47:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。