論文の概要: SycnMapV2: Robust and Adaptive Unsupervised Segmentation
- arxiv url: http://arxiv.org/abs/2506.16297v1
- Date: Thu, 19 Jun 2025 13:17:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.082978
- Title: SycnMapV2: Robust and Adaptive Unsupervised Segmentation
- Title(参考訳): SycnMapV2:ロバストでアダプティブな教師なしセグメンテーション
- Authors: Heng Zhang, Zikang Wan, Danilo Vasconcellos Vargas,
- Abstract要約: 人間の視覚は、明示的な訓練を必要とせず、視覚的手がかりのセグメンテーションに優れており、ノイズの重大さが増大しても、非常に堅牢である。
SyncMapV2は、教師なしセグメンテーションを最先端のロバストネスで解決する最初の方法である。
SyncMapV2は、SOTA法で見られる23.8%の減少に比べて、デジタル汚職下では0.01%のmIoUが最小値の低下を示した。
- 参考スコア(独自算出の注目度): 8.481491061966853
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Human vision excels at segmenting visual cues without the need for explicit training, and it remains remarkably robust even as noise severity increases. In contrast, existing AI algorithms struggle to maintain accuracy under similar conditions. Here, we present SyncMapV2, the first to solve unsupervised segmentation with state-of-the-art robustness. SyncMapV2 exhibits a minimal drop in mIoU, only 0.01%, under digital corruption, compared to a 23.8% drop observed in SOTA methods.This superior performance extends across various types of corruption: noise (7.3% vs. 37.7%), weather (7.5% vs. 33.8%), and blur (7.0% vs. 29.5%). Notably, SyncMapV2 accomplishes this without any robust training, supervision, or loss functions. It is based on a learning paradigm that uses self-organizing dynamical equations combined with concepts from random networks. Moreover,unlike conventional methods that require re-initialization for each new input, SyncMapV2 adapts online, mimicking the continuous adaptability of human vision. Thus, we go beyond the accurate and robust results, and present the first algorithm that can do all the above online, adapting to input rather than re-initializing. In adaptability tests, SyncMapV2 demonstrates near-zero performance degradation, which motivates and fosters a new generation of robust and adaptive intelligence in the near future.
- Abstract(参考訳): 人間の視覚は、明示的な訓練を必要とせず、視覚的手がかりのセグメンテーションに優れており、ノイズの重大さが増大しても、非常に堅牢である。
対照的に、既存のAIアルゴリズムは、同様の条件下で精度を維持するのに苦労している。
SyncMapV2は、教師なしセグメンテーションを最先端のロバストネスで解決する最初の方法である。
SyncMapV2は、SOTA法で観測された23.8%の低下と比較して、mIoUの最小値が0.01%で、ノイズ(7.3%対37.7%)、天候(7.5%対33.8%)、ぼやけ(7.0%対29.5%)など、様々な種類の汚職に及んでいる。
特にSyncMapV2は、堅牢なトレーニング、監視、損失機能なしでこれを達成する。
これは、ランダムネットワークの概念と組み合わさった自己組織化力学方程式を用いた学習パラダイムに基づいている。
さらに、新しい入力ごとに再初期化を必要とする従来の方法とは異なり、SyncMapV2はオンラインで適応し、人間の視覚の継続的な適応性を模倣する。
このように、我々は正確で堅牢な結果を超えて、上記の全てをオンラインで実行し、再初期化ではなくインプットに適応する最初のアルゴリズムを提示します。
SyncMapV2は、適応性テストにおいて、近い将来、新しい世代の堅牢で適応的なインテリジェンスを動機付け、促進する、ほぼゼロに近いパフォーマンス劣化を示す。
関連論文リスト
- Foxtsage vs. Adam: Revolution or Evolution in Optimization? [4.939986309170004]
本研究は、ハイブリッドFOX-TSAとグラディエントDescentを統合した新しいハイブリッド最適化手法であるFoxtsageを導入し、マルチ層パーセプトロンモデルのトレーニングを行う。
実験の結果、Foxtsageは損失平均の42.03%の減少(Foxtsage: 9.508, Adam: 16.402)、損失標準偏差の42.19%の改善(Foxtsage: 20.86, Adam: 36.085)を達成した。
論文 参考訳(メタデータ) (2024-12-20T03:20:58Z) - ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction [89.89610257714006]
既存の手法は、これらのタスクの要求に応えるために高い精度を優先する。
本稿では,3次元セマンティック占有率予測とフロー推定のための一連の改善点を紹介する。
私たちの純粋な時間的アーキテクチャフレームワークであるALOccは、速度と精度の最適なトレードオフを実現しています。
論文 参考訳(メタデータ) (2024-11-12T11:32:56Z) - Adaptive Multi-step Refinement Network for Robust Point Cloud Registration [82.64560249066734]
ポイントクラウド登録は、同じシーンの2つのポイントクラウド間の相対的な厳密な変換を推定する。
本稿では,前ステップからの情報を活用することで,各ステップの登録品質を向上する適応型多段階改良ネットワークを提案する。
本手法は3DMatch/3DLoMatchベンチマークとKITTIベンチマークの両方で最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-12-05T18:59:41Z) - MIO : Mutual Information Optimization using Self-Supervised Binary Contrastive Learning [12.365801596593936]
我々は、事前学習タスクを二項分類問題としてモデル化し、暗黙的なコントラスト効果を誘導する。
既存の手法とは異なり、提案した損失関数は正対と負対の相互情報を最適化する。
提案手法は,ベンチマークデータセット上でのSOTA自己教師型コントラストフレームワークよりも優れている。
論文 参考訳(メタデータ) (2021-11-24T17:51:29Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z) - Smooth Adversarial Training [120.44430400607483]
ネットワークは正確かつ堅牢であると一般に信じられている。
ここでは、敵対的訓練に関する慎重な研究により、これらの共通の信念に挑戦する証拠を提示する。
本研究では、ReLUをそのスムーズな近似で置き換えて、逆行訓練を強化するスムーズな逆行訓練(SAT)を提案する。
論文 参考訳(メタデータ) (2020-06-25T16:34:39Z) - RNN-T Models Fail to Generalize to Out-of-Domain Audio: Causes and
Solutions [73.45995446500312]
ストリーミングおよび非ストリーミングリカレントニューラルネットワークトランスデューサ(RNN-T)のエンド・ツー・エンドモデルにおける一般化特性を解析した。
トレーニング中に複数の正規化手法を組み合わせる方法と,動的重複推論を用いる方法を提案する。
論文 参考訳(メタデータ) (2020-05-07T06:24:47Z) - Supervised Contrastive Learning [42.27949000093086]
我々は、自己教師付きバッチコントラストアプローチを完全教師付き設定に拡張する。
教師付きコントラスト(SupCon)損失の2つの可能なバージョンを分析し,損失の最も優れた定式化を同定した。
ResNet-200では、ImageNetデータセットでトップ1の精度が81.4%に達しています。
論文 参考訳(メタデータ) (2020-04-23T17:58:56Z) - Triple Wins: Boosting Accuracy, Robustness and Efficiency Together by
Enabling Input-Adaptive Inference [119.19779637025444]
深層ネットワークは、(クリーンな自然画像の場合)正確さと(敵対的な摂動画像の場合)頑健さの相違に直面することを最近提案された。
本稿では,入力適応推論に関連するマルチエグジットネットワークについて検討し,モデル精度,ロバスト性,効率の最適化において「スイートポイント」を達成する上での強い期待を示す。
論文 参考訳(メタデータ) (2020-02-24T00:40:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。