論文の概要: Silent Failures in Federated Personalization of Foundation Models
- arxiv url: http://arxiv.org/abs/2606.00947v1
- Date: Sun, 31 May 2026 01:33:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:28.99455
- Title: Silent Failures in Federated Personalization of Foundation Models
- Title(参考訳): ファウンデーションモデルのフェデレーションパーソナライズにおける無秩序な失敗
- Authors: YongKyung Oh, Alex Bui,
- Abstract要約: 『沈黙の失敗』には、増幅バイアス、公平さの崩壊、アライメントの侵食が含まれる。
基礎モデルパーソナライゼーション,データセットシフト,コアフェデレーション制約の相互作用から生じる6つのサイレント障害モードの分類を導入する。
本稿では,プライバシ保護行動評価に関する研究課題をまとめ,サイレント障害が信頼に値するフェデレーション人工知能の標準診断カテゴリとなることを提案する。
- 参考スコア(独自算出の注目度): 6.116163085721452
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models are increasingly personalized on decentralized private data through federated learning and are now deployed at scale under growing regulatory requirements for post-market monitoring. We argue that this convergence creates a distinct and under-recognized class of trustworthiness failures, which we term "Silent Failures." These include amplified bias, fairness collapse, and alignment erosion that may remain difficult to detect because federated learning's privacy constraints limit visibility into model behavior. A landscape analysis of existing benchmarks reveals a structural divide. Federated benchmarks evaluate system performance but provide limited insight into model behavior, whereas centralized trustworthiness benchmarks assess behavior but require model access incompatible with federated privacy. We introduce a taxonomy of six silent failure modes arising from the interaction of foundation model personalization, dataset shift, and core federated constraints. Our analysis shows that privacy-preserving training alone is insufficient for trustworthy deployment. We conclude with a research agenda for privacy-preserving behavioral evaluation and propose that silent failures become a standard diagnostic category for trustworthy federated artificial intelligence.
- Abstract(参考訳): ファウンデーションモデルは、フェデレーションラーニングを通じて分散プライベートデータにパーソナライズされ、現在、ポストマーケット監視の規制要件の増大の下で大規模にデプロイされている。
我々は、この収束によって、信頼の欠如が明確で認識されていない階級が生まれると論じる。
これらには、増幅バイアス、公平性の崩壊、そして、フェデレーション学習のプライバシー制限がモデル行動の可視性を制限しているため、検出が困難である可能性のあるアライメントの浸食が含まれる。
既存のベンチマークのランドスケープ分析では、構造的な違いが明らかになっている。
フェデレートされたベンチマークはシステムパフォーマンスを評価するが、モデル行動に関する限られた洞察を提供する一方、集中型の信頼性ベンチマークは振る舞いを評価するが、フェデレーションされたプライバシと互換性のないモデルアクセスを必要とする。
基礎モデルパーソナライゼーション,データセットシフト,コアフェデレーション制約の相互作用から生じる6つのサイレント障害モードの分類を導入する。
分析の結果,プライバシ保護トレーニングだけでは,信頼性の高いデプロイメントには不十分であることが判明した。
本稿では,プライバシ保護行動評価に関する研究課題をまとめ,サイレント障害が信頼に値するフェデレーション人工知能の標準診断カテゴリとなることを提案する。
関連論文リスト
- From Automation to Collaboration: Human-in-the-Loop Methods for Safe and Trustworthy NLP [0.28675177318965045]
大規模言語モデルは、ハイテイクなNLPタスクに広くデプロイされているが、バイアス、幻覚、敵対的脆弱性、信頼できない一般化といったリスクが残っている。
本研究では,NLPを自動化から安全性とロバスト性のためのコラボレーションへ移行する最近のヒューマン・イン・ザ・ループ手法について検討する。
論文 参考訳(メタデータ) (2026-05-24T19:27:20Z) - Byzantine-Robust and Differentially Private Federated Optimization under Weaker Assumptions [89.52532304099522]
フェデレートラーニング(FL)は、クライアントが生データを集中せずに共有モデルを共同でトレーニングすることを可能にし、固有のプライバシーレベルを提供する。
グラデーションとモデル更新は機密情報を漏洩する可能性があるが、悪意のあるサーバはビザンティン操作のような敵攻撃をマウントする可能性がある。
これらの脆弱性は、統合されたフレームワーク内の差分プライバシー(DP)とビザンチンの堅牢性に対処する必要性を強調している。
Byz-Clip21-SGD2Mを提案する。
論文 参考訳(メタデータ) (2026-03-24T17:39:09Z) - Evidential Trust-Aware Model Personalization in Decentralized Federated Learning for Wearable IoT [16.700861880781087]
分散連合学習(DFL)は、一元的な調整なしにエッジデバイス間で協調的なモデルトレーニングを可能にする。
本稿では,DFLにおける信頼を意識したモデルパーソナライゼーションを実現するために,明らかなディープラーニングを活用するフレームワークであるMurmuraを紹介する。
論文 参考訳(メタデータ) (2025-12-22T08:26:54Z) - On the MIA Vulnerability Gap Between Private GANs and Diffusion Models [51.53790101362898]
GAN(Generative Adversarial Networks)と拡散モデルが高品質な画像合成のための主要なアプローチとして登場している。
差分自己生成モデルが直面するプライバシーリスクの統一的および実証的分析について述べる。
論文 参考訳(メタデータ) (2025-09-03T14:18:22Z) - Fin-Fed-OD: Federated Outlier Detection on Financial Tabular Data [11.027356898413139]
実世界のシナリオにおける異常検出は、動的でしばしば未知の異常分布による課題を引き起こす。
本稿では、データの機密性を損なうことなく、個々の組織における異常検出を強化するという課題に対処する。
本稿では,表現学習とフェデレーション学習技術を利用して未知の異常の検出を改善する手法を提案する。
論文 参考訳(メタデータ) (2024-04-23T11:22:04Z) - Auditing and Generating Synthetic Data with Controllable Trust Trade-offs [54.262044436203965]
合成データセットとAIモデルを包括的に評価する総合監査フレームワークを導入する。
バイアスや差別の防止、ソースデータへの忠実性の確保、実用性、堅牢性、プライバシ保護などに焦点を当てている。
多様なユースケースにまたがる様々な生成モデルを監査することにより,フレームワークの有効性を実証する。
論文 参考訳(メタデータ) (2023-04-21T09:03:18Z) - One-shot Empirical Privacy Estimation for Federated Learning [43.317478030880956]
ワンショット」アプローチは、モデルパラメータに適合する単一トレーニング実行において、モデルのプライバシ損失の効率的な監査や推定を可能にする。
提案手法は,ガウス機構下でのプライバシー損失を正当に推定できることを示す。
論文 参考訳(メタデータ) (2023-02-06T19:58:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。