論文の概要: CurEvo: Curriculum-Guided Self-Evolution for Video Understanding
- arxiv url: http://arxiv.org/abs/2604.26707v1
- Date: Wed, 29 Apr 2026 14:15:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.436929
- Title: CurEvo: Curriculum-Guided Self-Evolution for Video Understanding
- Title(参考訳): CurEvo: ビデオ理解のためのカリキュラムガイドによる自己進化
- Authors: Guiyi Zeng, Junqing Yu, Yi-Ping Phoebe Chen, Xu Chen, Wei Yang, Zikai Song,
- Abstract要約: CurEvoは、ビデオ理解のためのカリキュラム指向の自己進化フレームワークである。
タスクの難易度を規制し、評価基準を洗練し、モデルの能力に応じてデータの多様性をバランスさせる。
我々は,CurEvoが4つのビデオQAベンチマークにおいて,ベンチマーク精度と評価器に基づくセマンティックスコアの両方を一貫して改善することを示した。
- 参考スコア(独自算出の注目度): 28.448749858825607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in self-evolution video understanding frameworks have demonstrated the potential of autonomous learning without human annotations. However, existing methods often suffer from weakly controlled optimization and uncontrolled difficulty progression, as they lack structured guidance throughout the iterative learning process. To address these limitations, we propose CurEvo, a curriculum-guided self-evolution framework that introduces curriculum learning into self-evolution to achieve more structured and progressive model improvement. CurEvo dynamically regulates task difficulty, refines evaluation criteria, and balances data diversity according to model competence, forming a curriculum-guided feedback loop that aligns learning complexity with model capability. Built upon this principle, we develop a multi-dimensional adaptive QA framework that jointly evolves question generation and answer evaluation across perception, recognition, and understanding dimensions, ensuring coherent and measurable curriculum progression. Through this integration, CurEvo transforms weakly controlled self-evolution into a more structured learning process for autonomous video understanding. Across seven backbones, CurEvo consistently improves both benchmark accuracy and evaluator-based semantic score on four VideoQA benchmarks, validating the effectiveness of curriculum-guided self-evolution for video understanding.
- Abstract(参考訳): 自己進化型ビデオ理解フレームワークの最近の進歩は、人間のアノテーションを使わずに自律学習の可能性を示している。
しかし、既存の手法は反復学習プロセス全体を通して構造化されたガイダンスが欠如しているため、弱い制御された最適化と制御の難しさの進行に悩まされることが多い。
これらの制約に対処するため,カリキュラム指導型自己進化フレームワークであるCurEvoを提案し,カリキュラム学習を自己進化に導入し,より構造化され,進歩的なモデル改善を実現する。
CurEvoは、タスクの難易度を動的に調整し、評価基準を洗練し、モデルの能力に応じてデータの多様性をバランスさせ、学習複雑性とモデルの能力とを整合させるカリキュラム誘導フィードバックループを形成する。
この原理に基づいて,認識,認識,理解の各次元にわたって質問生成と回答評価を共同で進化させ,一貫性と測定可能なカリキュラムの進展を確実にする多次元適応型QAフレームワークを開発した。
この統合を通じて、CurEvoは弱制御された自己進化を、自律的なビデオ理解のためのより構造化された学習プロセスに変換する。
7つのバックボーンにわたって、CurEvoは4つのVideoQAベンチマークにおいて、ベンチマーク精度と評価者に基づくセマンティックスコアの両方を一貫して改善し、ビデオ理解のためのカリキュラム誘導自己進化の有効性を検証する。
関連論文リスト
- Synergizing Understanding and Generation with Interleaved Analyzing-Drafting Thinking [154.2388970262703]
Unified Vision-Language Models (UVLM) は、単一のフレームワーク内での理解と生成の両方をサポートすることで、マルチモーダル学習を促進することを目的としている。
本稿では,解析処理と起案処理を交互に行う新たな思考パラダイムである,インターリーブド・アナライジング・ドレイティング問題解決ループ(AD-Loop)を紹介する。
テキスト思考を視覚的思考とインターリーブすることで、AD-Loopはモデルが理解と出力の両方を反復的に洗練し、真のシナジーを育むことができる。
論文 参考訳(メタデータ) (2026-02-24T23:26:09Z) - Human-Inspired Continuous Learning of Internal Reasoning Processes: Learning How to Think for Adaptive AI Systems [0.11844977816228043]
内部推論プロセスは、動的現実世界環境で持続的な適応が可能なAIシステムの開発に不可欠である。
本研究では,シーケンシャルな推論モデル内での推論,行動,反射,検証を統一する,人間にインスパイアされた継続的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-12T03:19:04Z) - A Review of Learning-Based Motion Planning: Toward a Data-Driven Optimal Control Approach [9.141034088788233]
高レベルの自律運転のための運動プランニングは、透明で不安定なパイプライン方式と、現代の学習ベースシステムの適応的で不透明な「ブラックボックス」特性とのトレードオフによって制約される。
本稿では,古典的制御と機械学習の適応能力を統合する統一フレームワークとして,データ駆動型最適制御パラダイムを提案する。
本稿では,「Human-Centric」のカスタマイズ,「Platform-Adaptive」の動的適応,自己学習による「System Self-Optimization」の3つの重要な次世代機能を実現するためのフレームワークの可能性を検討する。
論文 参考訳(メタデータ) (2025-12-12T14:01:24Z) - Language Guided Concept Bottleneck Models for Interpretable Continual Learning [62.09201360376577]
継続的な学習は、学習した情報を忘れることなく、学習システムが新しい知識を常に獲得することを目的としている。
既存のCLメソッドのほとんどは、モデルパフォーマンスを改善するための学習知識の保存に重点を置いている。
両課題に対処するために,言語指導型概念ボトルネックモデルを統合する新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2025-03-30T02:41:55Z) - A Survey on Self-Evolution of Large Language Models [116.54238664264928]
大規模言語モデル(LLM)は、様々な分野やインテリジェントエージェントアプリケーションにおいて大きく進歩している。
この問題に対処するために、LLMが自律的に獲得し、洗練し、モデル自身によって生成された経験から学ぶことができる自己進化的アプローチが急速に成長している。
論文 参考訳(メタデータ) (2024-04-22T17:43:23Z) - SELF: Self-Evolution with Language Feedback [68.6673019284853]
SELF(Self-Evolution with Language Feedback)は、大規模言語モデルを進化させる新しいアプローチである。
LLMは、人間の学習プロセスと同様、自己回帰を通じて自己改善を可能にする。
数学および一般タスクにおける実験により,SELFは人間の介入なしにLLMの能力を高めることができることが示された。
論文 参考訳(メタデータ) (2023-10-01T00:52:24Z) - Comparison and Analysis of New Curriculum Criteria for End-to-End ASR [10.698093106994804]
カリキュラム学習は、知識の組織的で構造化された同化が、より速いトレーニングとより良い理解を可能にする能力を持つという観察に基づいて構築される。
我々は,自動音声認識の文脈でカリキュラム学習を採用する。
トレーニングセットに構造を付加するため、外部ニューラルネットワークからのフィードバックを利用するか、モデル自体からのフィードバックを取り入れる複数のスコアリング関数を探索した。
論文 参考訳(メタデータ) (2022-08-10T06:56:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。