論文の概要: Privacy-enhancing Sclera Segmentation Benchmarking Competition: SSBC 2025
- arxiv url: http://arxiv.org/abs/2508.10737v1
- Date: Thu, 14 Aug 2025 15:16:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-15 22:24:48.378898
- Title: Privacy-enhancing Sclera Segmentation Benchmarking Competition: SSBC 2025
- Title(参考訳): プライバシー向上のためのScleraセグメンテーションベンチマークコンペ:SSBC 2025
- Authors: Matej Vitek, Darian Tomašević, Abhijit Das, Sabari Nathan, Gökhan Özbulak, Gözde Ayşe Tataroğlu Özbulak, Jean-Paul Calbimonte, André Anjos, Hariohm Hemant Bhatt, Dhruv Dhirendra Premani, Jay Chaudhari, Caiyong Wang, Jian Jiang, Chi Zhang, Qi Zhang, Iyyakutti Iyappan Ganapathi, Syed Sadaf Ali, Divya Velayudan, Maregu Assefa, Naoufel Werghi, Zachary A. Daniels, Leeon John, Ritesh Vyas, Jalil Nourmohammadi Khiarak, Taher Akbari Saeed, Mahsa Nasehi, Ali Kianfar, Mobina Pashazadeh Panahi, Geetanjali Sharma, Pushp Raj Panth, Raghavendra Ramachandra, Aditya Nigam, Umapada Pal, Peter Peer, Vitomir Štruc,
- Abstract要約: 2025 スクレラベンチマークコンペティション(Sclera Benchmarkingコンペティション)は、合成眼画像を用いてトレーニングされたプライバシー保護のスクレラ分離モデルに焦点を当てた。
コンペの目標は、合成データでトレーニングされたモデルが、実世界のデータセットでトレーニングされたモデルと比較して、いかにうまく機能するかを評価することだった。
- 参考スコア(独自算出の注目度): 25.085972689649108
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a summary of the 2025 Sclera Segmentation Benchmarking Competition (SSBC), which focused on the development of privacy-preserving sclera-segmentation models trained using synthetically generated ocular images. The goal of the competition was to evaluate how well models trained on synthetic data perform in comparison to those trained on real-world datasets. The competition featured two tracks: $(i)$ one relying solely on synthetic data for model development, and $(ii)$ one combining/mixing synthetic with (a limited amount of) real-world data. A total of nine research groups submitted diverse segmentation models, employing a variety of architectural designs, including transformer-based solutions, lightweight models, and segmentation networks guided by generative frameworks. Experiments were conducted across three evaluation datasets containing both synthetic and real-world images, collected under diverse conditions. Results show that models trained entirely on synthetic data can achieve competitive performance, particularly when dedicated training strategies are employed, as evidenced by the top performing models that achieved $F_1$ scores of over $0.8$ in the synthetic data track. Moreover, performance gains in the mixed track were often driven more by methodological choices rather than by the inclusion of real data, highlighting the promise of synthetic data for privacy-aware biometric development. The code and data for the competition is available at: https://github.com/dariant/SSBC_2025.
- Abstract(参考訳): 本稿では,合成眼画像を用いて学習したプライバシ保存スクレラセグメンテーションモデルの開発に焦点を当てた,2025年スクレラセグメンテーションベンチマークコンペティション(SSBC)の概要を述べる。
コンペの目標は、合成データでトレーニングされたモデルが、実世界のデータセットでトレーニングされたモデルと比較して、いかにうまく機能するかを評価することだった。
コンペティションには2つのトラックがあった。
(i)モデル開発用の合成データのみに頼り、$
(ii)合成データと(限られた量の)実世界のデータを組み合わせて混合する。
合計9つの研究グループが多様なセグメンテーションモデルを提出し、トランスフォーマーベースのソリューション、軽量モデル、生成フレームワークによってガイドされるセグメンテーションネットワークなど、さまざまなアーキテクチャ設計を採用した。
様々な条件下で収集された合成画像と実世界の画像の両方を含む3つの評価データセットを用いて実験を行った。
以上の結果から,合成データに基づく完全トレーニングモデルでは,特に専用トレーニング戦略を採用する場合の競争性能が向上し,合成データトラックにおけるF_1$スコアが0.8ドルを超えることが証明された。
さらに、混合トラックのパフォーマンス向上は、実際のデータを含めることよりも、方法論的な選択によって促進され、プライバシを意識したバイオメトリック開発のための合成データの約束が強調された。
コンペティションのコードとデータは、https://github.com/dariant/SSBC_2025で公開されている。
関連論文リスト
- Aug2Search: Enhancing Facebook Marketplace Search with LLM-Generated Synthetic Data Augmentation [11.08205028521878]
Aug2Searchは、Generative AI(GenAI)モデルによって生成された合成データを活用するEBRベースのフレームワークである。
本稿では,GenAI,特にLarge Language Models(LLMs)の高品質な合成データ生成能力について検討する。
Aug2Searchは1億の合成データサンプルを使用して、ROC_AUCの最大4%の改善を実現している。
論文 参考訳(メタデータ) (2025-05-21T22:33:40Z) - Scaling Laws of Synthetic Data for Language Models [132.67350443447611]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文 参考訳(メタデータ) (2025-03-25T11:07:12Z) - Hybrid Training Approaches for LLMs: Leveraging Real and Synthetic Data to Enhance Model Performance in Domain-Specific Applications [0.0]
本研究では,超微調整型大規模言語モデル(LLM)のハイブリッドアプローチについて検討する。
転写された実データと高品質な合成セッションを組み合わせたデータセットを利用することで、ドメイン固有の実データの制限を克服することを目的とした。
本研究は,基本基礎モデル,実データで微調整されたモデル,ハイブリッド微調整されたモデルという3つのモデルを評価した。
論文 参考訳(メタデータ) (2024-10-11T18:16:03Z) - Learning from Synthetic Data for Visual Grounding [55.21937116752679]
そこで本研究では,SynGroundが市販のビジョン・アンド・ランゲージモデルのローカライズ能力を向上できることを示す。
SynGroundで生成されたデータは、事前訓練されたALBEFモデルとBLIPモデルのポインティングゲーム精度をそれぞれ4.81%、絶対パーセンテージポイント17.11%向上させる。
論文 参考訳(メタデータ) (2024-03-20T17:59:43Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - Style-Hallucinated Dual Consistency Learning for Domain Generalized
Semantic Segmentation [117.3856882511919]
本稿では、ドメインシフトを処理するためのStyle-HAllucinated Dual consistEncy Learning(SHADE)フレームワークを提案する。
SHADEは3つの実世界のデータセットの平均mIoUに対して5.07%と8.35%の精度で改善し、最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-04-06T02:49:06Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。