論文の概要: Domain-Specialized Object Detection via Model-Level Mixtures of Experts
- arxiv url: http://arxiv.org/abs/2604.18256v1
- Date: Mon, 20 Apr 2026 13:30:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.903478
- Title: Domain-Specialized Object Detection via Model-Level Mixtures of Experts
- Title(参考訳): エキスパートのモデルレベル混合によるドメイン特化オブジェクト検出
- Authors: Svetlana Pavlitska, Malte Stüven, Beyza Keskin, J. Marius Zöllner,
- Abstract要約: MoEは、特殊なニューラルネットワークを組み合わせるための構造化されたアプローチを提供し、従来のアンサンブルよりも高い解釈性を提供する。
本稿では,意味的に不連続なデータサブセットをトレーニングしたYOLOベースの検出器と,専門家の貢献を動的に重み付けする学習ゲーティングネットワークを組み合わせたMoEアーキテクチャを提案する。
BDD100Kデータセットの実験は、提案されたMoEが標準アンサンブルアプローチを一貫して上回っていることを示している。
- 参考スコア(独自算出の注目度): 10.43224188026554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mixture-of-Experts (MoE) models provide a structured approach to combining specialized neural networks and offer greater interpretability than conventional ensembles. While MoEs have been successfully applied to image classification and semantic segmentation, their use in object detection remains limited due to challenges in merging dense and structured predictions. In this work, we investigate model-level mixtures of object detectors and analyze their suitability for improving performance and interpretability in object detection. We propose an MoE architecture that combines YOLO-based detectors trained on semantically disjoint data subsets, with a learned gating network that dynamically weights expert contributions. We study different strategies for fusing detection outputs and for training the gating mechanism, including balancing losses to prevent expert collapse. Experiments on the BDD100K dataset demonstrate that the proposed MoE consistently outperforms standard ensemble approaches and provides insights into expert specialization across domains, highlighting model-level MoEs as a viable alternative to traditional ensembling for object detection. Our code is available at https://github.com/KASTEL-MobilityLab/mixtures-of-experts/.
- Abstract(参考訳): Mixture-of-Experts (MoE)モデルは、特殊なニューラルネットワークを組み合わせるための構造化されたアプローチを提供し、従来のアンサンブルよりも高い解釈性を提供する。
MoEは画像分類やセマンティックセグメンテーションにうまく応用されているが、密集した予測と構造化された予測を融合させることの難しさから、オブジェクト検出におけるそれらの使用は制限されている。
本研究では,対象検出器のモデルレベルの混合について検討し,対象検出の性能と解釈性を向上させるための適合性について検討する。
本稿では,意味的に不連続なデータサブセットをトレーニングしたYOLOベースの検出器と,専門家の貢献を動的に重み付けする学習ゲーティングネットワークを組み合わせたMoEアーキテクチャを提案する。
本研究では,検出出力の拡散と,専門家の崩壊を防ぐための損失分散を含むゲーティング機構の訓練について検討した。
BDD100Kデータセットの実験では、提案されたMoEが標準アンサンブルアプローチを一貫して上回り、ドメイン間の専門家の専門性に関する洞察を提供し、モデルレベルのMoEを、オブジェクト検出のための従来のアンサンブルの代替手段として強調している。
私たちのコードはhttps://github.com/KASTEL-MobilityLab/mixtures-of-experts/で利用可能です。
関連論文リスト
- Mixture of Experts with Soft Nearest Neighbor Loss: Resolving Expert Collapse via Representation Disentanglement [0.0]
Mixture-of-Experts (MoE)モデルは、ゲーティングネットワークの監督下でデータセットのサブセットを専門とする専門家ネットワークのセットを使用する。
SNNL(Soft Nearest Neighbor Loss)を用いた特徴抽出ネットワークを利用したMoEアーキテクチャを提案する。
SNNLを拡張したMoEモデルでは,よりフレキシブルなルーティング戦略をゲーティングネットワークに採用できるように,構造的に多様であることを示す。
論文 参考訳(メタデータ) (2026-03-20T18:29:51Z) - ExpertWeaver: Unlocking the Inherent MoE in Dense LLMs with GLU Activation Patterns [68.61814799047956]
Mixture-of-Experts (MoE)は、スパース専門家のアクティベーションを通じて計算効率を保ちながら、モデル容量を効果的にスケールする。
ExpertWeaverは、ニューロンをアクティベーションパターンに従ってパーティショニングする、トレーニング不要のフレームワークで、共有専門家と特殊なルーティング専門家をレイヤ適応構成で構成する。
論文 参考訳(メタデータ) (2026-02-17T11:50:58Z) - Mixture-of-Experts Models in Vision: Routing, Optimization, and Generalization [0.0]
画像分類設定におけるMoEの挙動について検討し、予測性能、専門家の活用、一般化に着目した。
我々は、CIFAR10データセット上の密度、SoftMoE、SparseMoE分類器を、同等のモデルキャパシティで比較する。
どちらのMoE変種も、正規化によるバランスの取れた専門家の利用を維持しながら、密度の高いベースラインよりもわずかに高い検証精度を達成する。
DenseとSparseMoEは、全てのモデルが同等の一般化性能を達成しているにもかかわらず、同様の曲率状態にあるのに対して、SoftMoEはこれらの指標によってよりシャープさを示す。
論文 参考訳(メタデータ) (2026-01-21T14:22:25Z) - Beyond Benchmarks: Understanding Mixture-of-Experts Models through Internal Mechanisms [55.1784306456972]
Mixture-of-Experts (MoE)アーキテクチャは、推論中にパラメータのサブセットだけをアクティベートすることで、効率とスケーラビリティを提供する、有望な方向性として登場した。
内部メトリックを用いて、ルーティング機構を明示的に取り入れ、専門家レベルの振る舞いを分析することで、MoEアーキテクチャのメカニズムを解明する。
その結果,(1)モデルの発展に伴ってニューロンの利用が減少し,より高度な一般化が期待できる,(2)ベンチマークのパフォーマンスが限られた信号のみを提供するダイナミックな軌道を示す,(3)複数の専門家の協力的貢献からタスク完了が生じる,(4)ニューロンレベルでの活性化パターンがデータ多様性のきめ細かいプロキシを提供する,といった結果が得られた。
論文 参考訳(メタデータ) (2025-09-28T15:13:38Z) - RouteMark: A Fingerprint for Intellectual Property Attribution in Routing-based Model Merging [69.2230254959204]
我々は,統合されたMoEモデルにおけるIP保護のためのフレームワークであるRouteMarkを提案する。
我々の重要な洞察は、タスク固有の専門家は、探索入力の下で安定かつ独特なルーティング行動を示すことである。
属性と改ざん検出のために,類似性に基づくマッチングアルゴリズムを導入する。
論文 参考訳(メタデータ) (2025-08-03T14:51:58Z) - Open-Set Object Detection By Aligning Known Class Representations [24.708230848232432]
Open-Set Object Detection (OSOD) は、未知の物体の検出に対処するための現代の研究の方向として登場した。
本稿では,意味空間におけるクラスタの有意義なアライメントを容易にするために,セマンティッククラスタリングに基づく新しいアプローチを提案する。
提案手法では,対象物検出の精度を高めるために,オブジェクトフォーカスモジュールが組み込まれている。
論文 参考訳(メタデータ) (2024-12-30T04:26:56Z) - Towards Adversarial Robustness of Model-Level Mixture-of-Experts Architectures for Semantic Segmentation [11.311414617703308]
都市交通シーンと高速道路交通シーンのセマンティックセグメンテーションにおけるMoEsの脆弱性を評価する。
多くの場合、MoEsは、インスタンスごとの攻撃や汎用的なホワイトボックス攻撃に対してより堅牢であり、転送攻撃に耐えられることを示す。
論文 参考訳(メタデータ) (2024-12-16T09:49:59Z) - Generalization Error Analysis for Sparse Mixture-of-Experts: A Preliminary Study [65.11303133775857]
Mixture-of-Experts (MoE)計算アマルガメート予測
Sparse MoEは、限られた数、あるいは1つの専門家だけを選択的に扱うことで、経験的に保存され、時にはパフォーマンスが向上する一方で、オーバーヘッドを大幅に削減する。
論文 参考訳(メタデータ) (2024-03-26T05:48:02Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - MoEC: Mixture of Expert Clusters [93.63738535295866]
Sparsely Mixture of Experts (MoE)は、安価な計算オーバーヘッドを持つ有望なスケーリング能力のため、大きな関心を集めている。
MoEは密度の高い層をスパースの専門家に変換し、ゲートルーティングネットワークを使用して専門家を条件付きで活性化させる。
しかし、専門家の数が増加するにつれて、乱雑なパラメータを持つMoEはデータアロケーションの過度な調整とスパースに悩まされる。
論文 参考訳(メタデータ) (2022-07-19T06:09:55Z) - Sparsely-gated Mixture-of-Expert Layers for CNN Interpretability [3.021134753248103]
小さいゲートのMixture of Expert (MoE)層が大きなトランスのスケーリングに成功している。
本研究では,コンピュータビジョンタスクのCNNに対して,スパースMOE層を適用し,モデル解釈性への影響を解析する。
論文 参考訳(メタデータ) (2022-04-22T09:40:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。