論文の概要: SYNTHONY: A Stress-Aware, Intent-Conditioned Agent for Deep Tabular Generative Models Selection
- arxiv url: http://arxiv.org/abs/2604.00293v1
- Date: Tue, 31 Mar 2026 22:37:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.752484
- Title: SYNTHONY: A Stress-Aware, Intent-Conditioned Agent for Deep Tabular Generative Models Selection
- Title(参考訳): Synthony: 深部尿細管生成モデル選択のためのストレス対応インテントコンディションエージェント
- Authors: Hochan Son, Xiaofeng Lin, Jason Ni, Guang Cheng,
- Abstract要約: 最高のパフォーマンスのシンセサイザー・ファミリーは、長い尾の縁、高い心のカテゴリー、ジプシアン不均衡、小さなサンプル・レギュレーションといった分布的なストレスに頼っている。
本研究では,4つの解釈可能な応力次元に沿ってデータセットの難易度を定量化する,合成固有のメタ機能表現であるストレスプロファイリングを提案する。
7つのデータセット、10つのシンセサイザー、3つのインテントのベンチマークで、ストレスベースのメタフィーチャーがシンセサイザーのパフォーマンスを高く予測できることを実証した。
- 参考スコア(独自算出の注目度): 8.191141111613272
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Deep generative models for tabular data (GANs, diffusion models, and LLM-based generators) exhibit highly non-uniform behavior across datasets; the best-performing synthesizer family depends strongly on distributional stressors such as long-tailed marginals, high-cardinality categorical, Zipfian imbalance, and small-sample regimes. This brittleness makes practical deployment challenging, especially when users must balance competing objectives of fidelity, privacy, and utility. We study {intent-conditioned tabular synthesis selection}: given a dataset and a user intent expressed as a preference over evaluation metrics, the goal is to select a synthesizer that minimizes regret relative to an intent-specific oracle. We propose {stress profiling}, a synthesis-specific meta-feature representation that quantifies dataset difficulty along four interpretable stress dimensions, and integrate it into {SYNTHONY}, a selection framework that matches stress profiles against a calibrated capability registry of synthesizer families. Across a benchmark of 7 datasets, 10 synthesizers, and 3 intents, we demonstrate that stress-based meta-features are highly predictive of synthesizer performance: a $k$NN selector using these features achieves strong Top-1 selection accuracy, substantially outperforming zero-shot LLM selectors and random baselines. We analyze the gap between meta-feature-based and capability-based selection, identifying the hand-crafted capability registry as the primary bottleneck and motivating learned capability representations as a direction for future work.
- Abstract(参考訳): グラフデータ(GAN,拡散モデル,LDMベースジェネレータ)の深部生成モデルは,データセット間の非均一な挙動を示す。
この不安定さは、特にユーザが競合するフィデリティ、プライバシ、ユーティリティの目標のバランスをとる必要がある場合に、現実的なデプロイメントを難しくする。
評価指標よりも優先的に表現されたデータセットとユーザ意図が与えられた場合、目的は、意図特異的なオラクルに対する後悔を最小限に抑えるシンセサイザーを選択することである。
本研究では,4つの解釈可能な応力次元に沿ってデータセットの難易度を定量化する,合成固有のメタ機能表現である {stress profiling} を提案し,それを合成器ファミリーのキャリブレーション機能レジストリに対して,ストレスプロファイルと一致する選択フレームワーク {SYNTHONY} に統合する。
7つのデータセット、10のシンセサイザー、および3つのインテントのベンチマークにおいて、ストレスベースのメタフィーチャーはシンセサイザー性能の高い予測性を示す。
メタ機能ベースと能力ベースの選択のギャップを分析し、手作りの機能レジストリを主要なボトルネックとして特定し、学習した能力表現を将来の作業の方向性として動機づける。
関連論文リスト
- HeteroFedSyn: Differentially Private Tabular Data Synthesis for Heterogeneous Federated Settings [19.298643158289906]
我々は,新しいタイプの微分プライバシー(DP)データ合成フレームワークであるHeteroFedSynを提案する。
HeteroFedSynは、水平の連邦設定に特化して設計されている。
HeteroFedSynは、フェデレートされた実行に固有のノイズの増加にもかかわらず、集中型合成に匹敵する実用性を実現している。
論文 参考訳(メタデータ) (2026-03-09T18:44:01Z) - Synthetic Interaction Data for Scalable Personalization in Large Language Models [67.31884245564086]
本稿ではPersonaGymという高忠実な合成データ生成フレームワークを紹介する。
パーソナライゼーションを静的なペルソナ-参照ペアとして扱う以前の作業とは異なり、PersonaGymは動的な選好プロセスをモデル化する。
我々は,高忠実度マルチターンパーソナライズされたインタラクショントラジェクトリの大規模かつ高品質で多様な合成データセットであるPersonaAtlasをリリースする。
論文 参考訳(メタデータ) (2026-02-12T20:41:22Z) - Dissecting Linear Recurrent Models: How Different Gating Strategies Drive Selectivity and Generalization [5.057995083193427]
線形リカレントニューラルネットワークは、トランスフォーマーのソフトマックスアテンションメカニズムの効率的な代替手段として登場した。
既存のベンチマークタスクは、大きな違いを明らかにするには単純すぎるか、実験のために過度にリソースを消費する。
本稿では,SelectivBenchを紹介した。SelectivBenchは軽量でカスタマイズ可能な,シーケンスモデルを体系的に評価するためのベンチマークタスクである。
論文 参考訳(メタデータ) (2026-01-18T21:49:21Z) - Optimised Feature Subset Selection via Simulated Annealing [39.58317527488534]
本稿では,$ell_0$-norm特徴選択のための新しいアルゴリズムであるSA-FDRを紹介する。
SA-FDRは、高い予測精度を達成しつつ、よりコンパクトな特徴部分集合を一貫して選択することを示す。
その結果、SA-FDRは高次元設定で解釈可能なモデルを設計するための柔軟で効果的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-07-31T13:57:38Z) - Few-shot Steerable Alignment: Adapting Rewards and LLM Policies with Neural Processes [50.544186914115045]
大きな言語モデル(LLM)は、日々のアプリケーションにますます組み込まれています。
個人ユーザの多様な嗜好との整合性を確保することは、重要な課題となっている。
数発のステアライメントのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-18T16:14:59Z) - Data-adaptive Differentially Private Prompt Synthesis for In-Context Learning [16.04405606517753]
大規模言語モデル(LLM)は、実例やデモに埋め込まれた文脈情報に依存して、文脈内学習(ICL)を行う。
我々は、AdaDPSynと呼ばれる新しいデータ適応微分プライベートアルゴリズムを導入し、プライベートデータセットから合成例を生成する。
AdaDPSynは、データ固有の統計特性に応じて、データ合成機構のノイズレベルを適応的に調整する。
論文 参考訳(メタデータ) (2024-10-15T22:06:30Z) - Self-Supervised Dataset Distillation for Transfer Learning [77.4714995131992]
ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。
両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。
転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-10-10T10:48:52Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。