論文の概要: SILSM: A Sustainable Interactive Level Set Method for Progressive Refinement
- arxiv url: http://arxiv.org/abs/2605.24448v1
- Date: Sat, 23 May 2026 07:40:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.062846
- Title: SILSM: A Sustainable Interactive Level Set Method for Progressive Refinement
- Title(参考訳): SILSM: プログレッシブリファインメントのための持続可能な対話型レベルセット手法
- Authors: Jiachen Song, Dazhi Zhang, Fanghui Song, Zhichang Guo, Shengzhu Shi,
- Abstract要約: インタラクティブセグメンテーションは、スパースユーザーガイダンスを用いてターゲットオブジェクトを正確に分離することを目的としている。
伝統的な手法は、しばしば重い相互作用の重荷とパラメータの感度に悩まされる。
本稿では,これらの制約を克服するためのSILSM(Sustainable Interactive Level Set Method)を提案する。
- 参考スコア(独自算出の注目度): 2.6177066607073076
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interactive segmentation aims to precisely isolate target objects using sparse user guidance. However, traditional methods often suffer from heavy interaction burdens and parameter sensitivity, while deep learning approaches struggle with data dependency and iterative instability. Motivated by these limitations, we propose the Sustainable Interactive Level Set Method (SILSM). The proposed level set evolution equation incorporates interaction, regularization, and segmentation terms. Specifically, high-order regularization is employed to maintain numerical stability, and unlike traditional methods, we decouple user guidance into an independent interaction term to enable direct manual control over the zero-level set evolution. Furthermore, we develop a numerical algorithm tailored for multiple interactions, which facilitates dynamic refinement by effectively updating the segmentation results based on sequential user inputs. We theoretically demonstrate that the high-order term provides stronger regularization constraints than the conventional length term, while the interaction term ensures segmentation strictly within the user-selected region. Experimental results further demonstrate that the proposed method is robust to interactive inputs, achieves competitive performance at the first interaction, and supports stable multi-round interactions with progressively improved segmentation quality.
- Abstract(参考訳): インタラクティブセグメンテーションは、スパースユーザーガイダンスを用いてターゲットオブジェクトを正確に分離することを目的としている。
しかし、従来の手法は相互作用の重荷とパラメータの感度に悩まされることが多いが、ディープラーニングアプローチはデータの依存性と反復的不安定性に悩まされている。
これらの制約により,持続可能な対話レベル設定法 (SILSM) を提案する。
提案されたレベルセット進化方程式は、相互作用、正則化、セグメンテーション項を含む。
具体的には、数値安定性を維持するために高次正規化が用いられており、従来の手法とは異なり、ユーザーガイダンスを独立した相互作用項に分離し、ゼロレベル集合の進化を直接手動制御できるようにする。
さらに,複数のインタラクションに適した数値アルゴリズムを開発し,逐次ユーザ入力に基づいてセグメント化結果を効果的に更新することにより,動的洗練を容易にする。
我々は,高次項が従来の長さ項よりも強い正規化制約を提供するのに対し,相互作用項はユーザ選択領域内でのセグメンテーションを厳密に保証する。
さらに実験結果から,提案手法は対話型入力に対して堅牢であり,第1のインタラクションにおける競合性能を実現し,段階的に改良されたセグメンテーション品質を持つ安定したマルチラウンドインタラクションをサポートすることを示した。
関連論文リスト
- Revitalizing the Beginning: Avoiding Storage Dependency for Model Merging in Continual Learning [57.10440766103372]
Trajectory Regularized Merging (TRM) は、拡張されたトラジェクトリ部分空間内の最適化プロセスとしてマージフェーズを再構成するフレームワークである。
本フレームワークは,タスクアライメント,予測整合性,勾配応答性といった3つの相乗的目標を統合し,統合モデルの履歴安定性と再活性化最適化のダイナミクスを同時に保存する。
論文 参考訳(メタデータ) (2026-05-08T14:07:32Z) - HINT: Hierarchical Interaction Modeling for Autoregressive Multi-Human Motion Generation [55.73037290387896]
HINTは,階層的インタラクティクスモデリングを応用した多関節モーション生成のための最初の自動回帰フレームワークである。
第一に、HINTは正準化潜在空間内でのゆがみのある動きの表現を活用し、局所的な動きのセマンティクスを対人インタラクションから切り離す。
第二に、HINTは効率的なオンライン生成のためのスライドウインドウ戦略を採用し、局所的なウィンドウ内およびグローバルなクロスウインドウ条件を集約し、過去の人類の歴史、個人間の依存関係を捉え、テキストガイダンスと整合する。
論文 参考訳(メタデータ) (2026-01-28T08:47:23Z) - Interact2Ar: Full-Body Human-Human Interaction Generation via Autoregressive Diffusion Models [80.28579390566298]
テキスト条件付き自己回帰拡散モデルであるInteract2Arを導入する。
ハンドキネマティクスは専用のパラレルブランチを通じて組み込まれ、高忠実度フルボディ生成を可能にする。
我々のモデルは、時間的動きの合成、外乱へのリアルタイム適応、ディヤディックからマルチパーソンシナリオへの拡張など、一連のダウンストリームアプリケーションを可能にする。
論文 参考訳(メタデータ) (2025-12-22T18:59:50Z) - Towards Consistent Long-Term Pose Generation [0.0]
最小限の文脈から連続座標空間のポーズを直接生成する新しいワンステージアーキテクチャを提案する。
私たちの重要なイノベーションは、中間表現やトークンベースの生成の必要性を排除することです。
提案手法は,特に長期発生シナリオにおいて,既存の量子化法と自己回帰法を著しく上回っている。
論文 参考訳(メタデータ) (2025-07-24T12:57:22Z) - Learning Adaptive Node Selection with External Attention for Human Interaction Recognition [11.88304209222785]
ほとんどのGCNベースの手法は、個人を独立したグラフとして相互作用させ、固有の相互依存を無視している。
本研究では,外部注意ネットワークを用いたアクティブノード選択(ASEA)を提案する。
本手法は,各個人がGCNを用いて個人内関係を把握し,行動の詳細な表現を容易にする。
論文 参考訳(メタデータ) (2025-07-05T07:47:00Z) - Diffusion Generative Recommendation with Continuous Tokens [21.222713476105195]
ContRecは、連続トークンをLLMベースのRecSysにシームレスに統合するフレームワークである。
ContRecは従来型およびSOTA LLMベースのレコメンデータシステムよりも一貫して優れていることを示す。
本研究は,次世代レコメンデーションシステムにおける連続トークン化と生成モデリングの可能性を強調した。
論文 参考訳(メタデータ) (2025-04-16T12:01:03Z) - Boundary-aware Supervoxel-level Iteratively Refined Interactive 3D Image
Segmentation with Multi-agent Reinforcement Learning [33.181732857907384]
我々は,マルコフ決定プロセス(MDP)を用いた対話型画像分割をモデル化し,強化学習(RL)による解法を提案する。
ボクセル単位の予測のための大規模な探索空間を考えると, エージェント間でボクセルレベルポリシーを共有するマルチエージェント強化学習が採用されている。
4つのベンチマークデータセットによる実験結果から,提案手法は最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-03-19T15:52:56Z) - Learning Self-Modulating Attention in Continuous Time Space with
Applications to Sequential Recommendation [102.24108167002252]
本稿では,複雑で非線形に進化する動的ユーザの嗜好をモデル化する,自己変調型注意ネットワークを提案する。
提案手法がトップNシーケンシャルなレコメンデーションタスクに与える影響を実証的に示すとともに,3つの大規模実世界のデータセットによる結果から,我々のモデルが最先端のパフォーマンスを達成できることを示す。
論文 参考訳(メタデータ) (2022-03-30T03:54:11Z) - Progressively Guide to Attend: An Iterative Alignment Framework for
Temporal Sentence Grounding [53.377028000325424]
時間的文接地作業のための反復アライメントネットワーク(IA-Net)を提案する。
学習可能なパラメータを持つマルチモーダル特徴をパットすることで、非整合フレームワードペアの非整合問題を軽減する。
また、アライメントの知識を洗練させるために、各アライメントモジュールに従ってキャリブレーションモジュールを考案する。
論文 参考訳(メタデータ) (2021-09-14T02:08:23Z) - Modeling long-term interactions to enhance action recognition [81.09859029964323]
本稿では,フレームレベルと時間レベルの両方でオブジェクト間の相互作用のセマンティクスを利用する,エゴセントリックなビデオのアンダースタンドアクションに対する新しいアプローチを提案する。
ユーザの手とほぼ対応するプライマリ領域と、相互作用するオブジェクトに対応する可能性のあるセカンダリ領域のセットを入力として、領域ベースのアプローチを使用する。
提案手法は, 標準ベンチマークの動作認識において, 最先端技術よりも優れている。
論文 参考訳(メタデータ) (2021-04-23T10:08:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。