Fugu-MT 論文翻訳(概要): Transfer Learning Applied to Computer Vision Problems: Survey on Current Progress, Limitations, and Opportunities

論文の概要: Transfer Learning Applied to Computer Vision Problems: Survey on Current Progress, Limitations, and Opportunities

arxiv url: http://arxiv.org/abs/2409.07736v1
Date: Thu, 12 Sep 2024 03:59:15 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-13 17:51:48.921168
Title: Transfer Learning Applied to Computer Vision Problems: Survey on Current Progress, Limitations, and Opportunities
Title（参考訳）: コンピュータビジョン問題に応用したトランスファーラーニング:現状,限界,機会に関する調査
Authors: Aaryan Panda, Damodar Panigrahi, Shaswata Mitra, Sudip Mittal, Shahram Rahimi,
Abstract要約: Transfer Learning (TL)は、事前訓練されたモデルを再利用することで、様々なCV問題に対処する。 TLは、ほぼ同等の精度を提供する一方で、データとコンピューティングを少なくする。我々の研究は、TL開発とCVアプリケーションが現実世界の問題を解決するためにどのようにそれを使うかに焦点を当てている。
参考スコア（独自算出の注目度）: 2.913761513290171
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: The field of Computer Vision (CV) has faced challenges. Initially, it relied on handcrafted features and rule-based algorithms, resulting in limited accuracy. The introduction of machine learning (ML) has brought progress, particularly Transfer Learning (TL), which addresses various CV problems by reusing pre-trained models. TL requires less data and computing while delivering nearly equal accuracy, making it a prominent technique in the CV landscape. Our research focuses on TL development and how CV applications use it to solve real-world problems. We discuss recent developments, limitations, and opportunities.
Abstract（参考訳）: コンピュータビジョン(CV)の分野は課題に直面している。当初は手作りの機能とルールベースのアルゴリズムに頼っていたため、精度は限られていた。機械学習(ML)の導入により、特にTransfer Learning(TL)は、トレーニング済みモデルの再利用によって、さまざまなCV問題に対処する。 TLは、ほぼ同等の精度を提供する一方で、データとコンピューティングを少なくし、CVランドスケープにおいて顕著な技術である。我々の研究は、TL開発とCVアプリケーションが現実世界の問題を解決するためにどのようにそれを使うかに焦点を当てている。最近の発展、限界、機会について論じる。

関連論文リスト

Data-Efficient Challenges in Visual Inductive Priors: A Retrospective [9.961131337487243]
ディープラーニングは、うまく動作するモデルをトレーニングするために、大量のデータを必要とします。データ不足の設定では、パフォーマンスが劣化する可能性がある。データ不足環境でのトレーニングモデルにどのようなディープラーニング手法が有用かを検討する。
論文参考訳（メタデータ） (2025-06-10T09:21:48Z)
Efficient Knowledge Feeding to Language Models: A Novel Integrated Encoder-Decoder Architecture [0.0]
ICVは言語モデルの潜在埋め込みを用いて、コンテキスト内学習をリキャストする。 ICVは直接情報をモデルに統合し、この情報をより効率的に処理することができる。
論文参考訳（メタデータ） (2025-02-07T04:24:07Z)
Mind the Interference: Retaining Pre-trained Knowledge in Parameter Efficient Continual Learning of Vision-Language Models [79.28821338925947]
ドメインクラスのインクリメンタル学習は現実的だが、継続的な学習シナリオである。これらの多様なタスクに対処するために、事前訓練されたビジョンランゲージモデル(VLM)を導入し、その強力な一般化性を実現する。事前訓練されたVLMにエンコードされた知識は、新しいタスクに適応する際に妨げられ、固有のゼロショット能力を損なう。既存の手法では、膨大なオーバーヘッドを必要とする余分なデータセットに知識蒸留でVLMをチューニングすることで、この問題に対処している。我々は、事前学習した知識を保持できるDIKI(Distributed-Aware Interference-free Knowledge Integration)フレームワークを提案する。
論文参考訳（メタデータ） (2024-07-07T12:19:37Z)
Continual Learning on Graphs: Challenges, Solutions, and Opportunities [72.7886669278433]
本稿では,既存の連続グラフ学習(CGL)アルゴリズムの総合的なレビューを行う。従来の連続学習手法と比較し,従来の連続学習手法の適用性を分析した。アクセス可能なアルゴリズムの包括的なリストを含む、最新のリポジトリを維持します。
論文参考訳（メタデータ） (2024-02-18T12:24:45Z)
Robust Machine Learning by Transforming and Augmenting Imperfect Training Data [6.928276018602774]
この論文は、現代の機械学習のいくつかのデータ感度を探求する。まず、トレーニングデータで測定された事前の人間の識別をMLが符号化するのを防ぐ方法について論じる。次に、トレーニング中に予測忠実度を提供するが、デプロイ時に信頼性が低い突発的特徴を含むデータから学習する問題について論じる。
論文参考訳（メタデータ） (2023-12-19T20:49:28Z)
Zero-knowledge Proof Meets Machine Learning in Verifiability: A Survey [19.70499936572449]
高品質なモデルは、効率的な最適化アルゴリズムだけでなく、膨大なデータと計算能力に基づいて構築されたトレーニングと学習プロセスにも依存する。計算リソースの制限やデータプライバシの懸念など,さまざまな課題があるため,モデルを必要とするユーザは,マシンラーニングモデルをローカルにトレーニングすることはできないことが多い。本稿では,ゼロ知識証明に基づく検証可能な機械学習(ZKP-VML)技術について包括的に調査する。
論文参考訳（メタデータ） (2023-10-23T12:15:23Z)
Federated Learning for Computer Vision [5.068927407250747]
コンピュータビジョン(CV)は、機械学習(ML)ツールを幅広いタスクに活用することで、社会を変革する上で重要な役割を果たしている。処理に必要な膨大な計算負荷と、データの保存と処理に関連する潜在的なプライバシーリスクにより、これらのアルゴリズムは厳しい制約下に置かれた。フェデレートラーニング(FL)は将来性のあるソリューションとして登場し、モデルをローカルにトレーニングし、全体的なパフォーマンスを改善するためにそれらを交換することで、プライバシ保護を可能にする。
論文参考訳（メタデータ） (2023-08-24T16:05:14Z)
Towards AGI in Computer Vision: Lessons Learned from GPT and Large Language Models [98.72986679502871]
大規模言語モデル(LLM)を利用したチャットシステムが出現し、人工知能(AGI)を実現するための有望な方向へと急速に成長するしかし、コンピュータビジョン(CV)におけるAGIへの道のりは未だに不明である。 CVアルゴリズムを世界規模で対話可能な環境に配置し、その動作に関する将来のフレームを予測するための事前トレーニングを行い、さまざまなタスクをこなすための命令で微調整するパイプラインを想像する。
論文参考訳（メタデータ） (2023-06-14T17:15:01Z)
Learning without Forgetting for Vision-Language Models [65.49600786387106]
CIL(Class-Incremental Learning)あるいは継続的学習(Continuous Learning)は、現実世界において望ましい能力である。 VLM(Vision-Language Models)の最近の進歩は、一般化可能な表現を学習する上で有望な能力を示している。本稿では,VLM を忘れずに学習できる ProjectiOn Fusion (PROOF) を提案する。
論文参考訳（メタデータ） (2023-05-30T17:59:32Z)
Task-Attentive Transformer Architecture for Continual Learning of Vision-and-Language Tasks Using Knowledge Distillation [18.345183818638475]
連続学習(CL)は、逐次到着するタスク間で知識伝達を可能にすることで、治療の役割を果たす。バイモーダル・ビジョン・アンド・ランゲージ・タスクを学習するためのトランスフォーマーベースのCLアーキテクチャを開発した。私たちのアプローチは、メモリと時間のオーバーヘッドが少ないため、多数のタスクにスケーラブルに学習するものです。
論文参考訳（メタデータ） (2023-03-25T10:16:53Z)
Knowledge as Invariance -- History and Perspectives of Knowledge-augmented Machine Learning [69.99522650448213]
機械学習の研究は転換点にある。研究の関心は、高度にパラメータ化されたモデルのパフォーマンス向上から、非常に具体的なタスクへとシフトしている。このホワイトペーパーは、機械学習研究におけるこの新興分野の紹介と議論を提供する。
論文参考訳（メタデータ） (2020-12-21T15:07:19Z)
COG: Connecting New Skills to Past Experience with Offline Reinforcement Learning [78.13740204156858]
我々は、動的プログラミングによって新しいスキルを拡張するために、事前データを再利用できることを示します。我々は、新しいタスクを解決するために、以前のデータセットに見られるいくつかの動作をチェーンすることで、アプローチの有効性を実証する。我々は、高次元画像観察を低レベルのロボット制御コマンドにマッピングし、エンドツーエンドでポリシーを訓練する。
論文参考訳（メタデータ） (2020-10-27T17:57:29Z)
Curriculum Learning for Reinforcement Learning Domains: A Framework and Survey [53.73359052511171]
強化学習(Reinforcement Learning, RL)は、エージェントが限られた環境フィードバックしか持たないシーケンシャルな意思決定タスクに対処するための一般的なパラダイムである。本稿では、RLにおけるカリキュラム学習(CL)の枠組みを提案し、既存のCLメソッドを仮定、能力、目標の観点から調査・分類する。
論文参考訳（メタデータ） (2020-03-10T20:41:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。