論文の概要: Bipartite Mode Matching for Vision Training Set Search from a Hierarchical Data Server
- arxiv url: http://arxiv.org/abs/2601.09531v1
- Date: Wed, 14 Jan 2026 14:55:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-15 18:59:20.438505
- Title: Bipartite Mode Matching for Vision Training Set Search from a Hierarchical Data Server
- Title(参考訳): 階層型データサーバからのビジョントレーニングセット検索のためのバイパートモードマッチング
- Authors: Yue Yao, Ruining Yang, Tom Gedeon,
- Abstract要約: 階層型データサーバと双方向モードマッチングアルゴリズム(BMM)を併用して,ソースモードとターゲットモードの整列を行う。
既存のトレーニングセット検索アルゴリズムと比較して、一致したサーバモードが、ターゲットドメインとのドメインギャップを一定に小さくするトレーニングセットを構成することを示す。
検索したトレーニングセットでトレーニングされたモデルは、他のトレーニングされたモデルよりも精度が高い。
- 参考スコア(独自算出の注目度): 22.63031655588843
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We explore a situation in which the target domain is accessible, but real-time data annotation is not feasible. Instead, we would like to construct an alternative training set from a large-scale data server so that a competitive model can be obtained. For this problem, because the target domain usually exhibits distinct modes (i.e., semantic clusters representing data distribution), if the training set does not contain these target modes, the model performance would be compromised. While prior existing works improve algorithms iteratively, our research explores the often-overlooked potential of optimizing the structure of the data server. Inspired by the hierarchical nature of web search engines, we introduce a hierarchical data server, together with a bipartite mode matching algorithm (BMM) to align source and target modes. For each target mode, we look in the server data tree for the best mode match, which might be large or small in size. Through bipartite matching, we aim for all target modes to be optimally matched with source modes in a one-on-one fashion. Compared with existing training set search algorithms, we show that the matched server modes constitute training sets that have consistently smaller domain gaps with the target domain across object re-identification (re-ID) and detection tasks. Consequently, models trained on our searched training sets have higher accuracy than those trained otherwise. BMM allows data-centric unsupervised domain adaptation (UDA) orthogonal to existing model-centric UDA methods. By combining the BMM with existing UDA methods like pseudo-labeling, further improvement is observed.
- Abstract(参考訳): 対象ドメインがアクセス可能であるが、リアルタイムデータアノテーションが実現不可能な状況について検討する。
代わりに、競争モデルが得られるように、大規模データサーバから代替のトレーニングセットを構築したいと考えています。
この問題に対して、ターゲットドメインは通常、異なるモード(すなわち、データ分散を表すセマンティッククラスタ)を示すため、トレーニングセットがこれらのターゲットモードを含まない場合は、モデルパフォーマンスが損なわれる。
既存の研究はアルゴリズムを反復的に改善するが、我々の研究はデータサーバの構造を最適化するしばしば見過ごされる可能性を探る。
ウェブ検索エンジンの階層的な性質に着想を得て,両部モードマッチングアルゴリズム(BMM)とともに階層型データサーバを導入し,ソースモードとターゲットモードの整列を行う。
各ターゲットモードについて、私たちはサーバデータツリーを見て、最も良いモードマッチングを求めます。
両部マッチングにより、全てのターゲットモードを1対1でソースモードと最適にマッチングすることを目指している。
既存のトレーニングセット検索アルゴリズムと比較して、一致したサーバモードは、オブジェクトの再識別(re-ID)と検出タスクをまたいで、ターゲットドメインとのドメインギャップを一貫して小さくするトレーニングセットを構成する。
その結果、探索したトレーニングセットでトレーニングされたモデルは、他のトレーニングされたモデルよりも精度が高いことがわかった。
BMMは、既存のモデル中心のUDAメソッドと直交するデータ中心の非教師なしドメイン適応(UDA)を可能にする。
BMMと擬似ラベルのような既存のUDA手法を組み合わせることにより、さらなる改善が観察される。
関連論文リスト
- RankPO: Preference Optimization for Job-Talent Matching [7.385902340910447]
大規模言語モデル(LLM)のための2段階トレーニングフレームワークを提案する。
最初の段階では、実際のマッチングルールから構築されたデータセット上でモデルをトレーニングするために、対照的な学習アプローチが使用される。
第2段階では、AIで計算したペアの選好とモデルを整合させるために、直接選好最適化(DPO)にインスパイアされた、新しい選好に基づく微調整手法を導入する。
論文 参考訳(メタデータ) (2025-03-13T10:14:37Z) - Entity Matching using Large Language Models [3.7277730514654555]
本稿では, PLM ベースのマーカに代わる, タスク固有の訓練データ依存モデルとして, LLM (Generative Large Language Model) を用いて検討する。
GPT4は一致判定のための構造化された説明を生成でき、一致した誤りの原因を自動的に特定できることを示す。
論文 参考訳(メタデータ) (2023-10-17T13:12:32Z) - Efficient Adaptive Human-Object Interaction Detection with
Concept-guided Memory [64.11870454160614]
概念誘導メモリ(ADA-CM)を用いた適応型HOI検出器を提案する。
ADA-CMには2つの操作モードがある。最初のモードでは、トレーニング不要のパラダイムで新しいパラメータを学習することなくチューニングできる。
提案手法は, HICO-DET と V-COCO のデータセットに対して, より少ないトレーニング時間で, 最新技術による競合的な結果を得る。
論文 参考訳(メタデータ) (2023-09-07T13:10:06Z) - Universal Semi-supervised Model Adaptation via Collaborative Consistency
Training [92.52892510093037]
我々は、Universal Semi-supervised Model Adaptation (USMA)と呼ばれる現実的で挑戦的なドメイン適応問題を導入する。
本稿では,2つのモデル間の予測整合性を規則化する協調的整合性トレーニングフレームワークを提案する。
実験により,いくつかのベンチマークデータセットにおける本手法の有効性が示された。
論文 参考訳(メタデータ) (2023-07-07T08:19:40Z) - Seeking Similarities over Differences: Similarity-based Domain Alignment
for Adaptive Object Detection [86.98573522894961]
本研究では,Unsupervised Domain Adaptation (UDA) アルゴリズムが検出に使用するコンポーネントを一般化するフレームワークを提案する。
具体的には、最適な設計選択を生かした新しいUDAアルゴリズムViSGAを提案し、インスタンスレベルの特徴を集約する単純だが効果的な方法を提案する。
類似性に基づくグループ化と対角トレーニングの両方により、モデルでは、ゆるやかに整列されたドメインにまたがるすべてのインスタンスにマッチせざるを得ず、機能グループを粗い整列することに集中することが可能であることが示されています。
論文 参考訳(メタデータ) (2021-10-04T13:09:56Z) - On Universal Black-Box Domain Adaptation [53.7611757926922]
実践的な展開という観点から,ドメイン適応の最小限の制約条件について検討する。
ソースモデルのインターフェースのみがターゲットドメインで利用可能であり、2つのドメイン間のラベル空間関係が異なることや未知であることが許されている。
対象試料の局所近傍における予測の整合性によって正規化された自己訓練フレームワークに統一することを提案する。
論文 参考訳(メタデータ) (2021-04-10T02:21:09Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。