Fugu-MT 論文翻訳(概要): Householder Projector for Unsupervised Latent Semantics Discovery

論文の概要: Householder Projector for Unsupervised Latent Semantics Discovery

arxiv url: http://arxiv.org/abs/2307.08012v1
Date: Sun, 16 Jul 2023 11:43:04 GMT
ステータス: 翻訳完了
システム内更新日: 2023-07-18 16:11:44.345606
Title: Householder Projector for Unsupervised Latent Semantics Discovery
Title（参考訳）: 教師なし潜在セマンティクス発見のための家計プロジェクタ
Authors: Yue Song, Jichao Zhang, Nicu Sebe, Wei Wang
Abstract要約: Householder Projectorは、画像の忠実さを犠牲にすることなく、StyleGANがより複雑で正確なセマンティック属性を見つけるのに役立つ。プロジェクタを事前訓練したStyleGAN2/StyleGAN3に統合し、複数のベンチマークでモデルを評価する。
参考スコア（独自算出の注目度）: 58.92485745195358
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Generative Adversarial Networks (GANs), especially the recent style-based generators (StyleGANs), have versatile semantics in the structured latent space. Latent semantics discovery methods emerge to move around the latent code such that only one factor varies during the traversal. Recently, an unsupervised method proposed a promising direction to directly use the eigenvectors of the projection matrix that maps latent codes to features as the interpretable directions. However, one overlooked fact is that the projection matrix is non-orthogonal and the number of eigenvectors is too large. The non-orthogonality would entangle semantic attributes in the top few eigenvectors, and the large dimensionality might result in meaningless variations among the directions even if the matrix is orthogonal. To avoid these issues, we propose Householder Projector, a flexible and general low-rank orthogonal matrix representation based on Householder transformations, to parameterize the projection matrix. The orthogonality guarantees that the eigenvectors correspond to disentangled interpretable semantics, while the low-rank property encourages that each identified direction has meaningful variations. We integrate our projector into pre-trained StyleGAN2/StyleGAN3 and evaluate the models on several benchmarks. Within only $1\%$ of the original training steps for fine-tuning, our projector helps StyleGANs to discover more disentangled and precise semantic attributes without sacrificing image fidelity.
Abstract（参考訳）: GAN(Generative Adversarial Networks)、特に最近のスタイルベースジェネレータ(StyleGANs)は、構造化潜在空間において汎用的な意味を持つ。潜時セマンティクス発見法が潜時コードの周りを動き回るようになり、1つの要素しか経時的に変化しない。近年,教師なしの手法では,潜在符号を解釈可能な方向として特徴にマッピングするプロジェクション行列の固有ベクトルを直接使用するという有望な方法が提案されている。しかし、見落とされがちな事実は、射影行列が非直交的であり、固有ベクトルの数が大きすぎることである。非直交性は、トップ数個の固有ベクトルで意味的属性を絡ませ、大きな次元性は、行列が直交であっても、方向の無意味な変化をもたらすかもしれない。これらの問題を回避するために, 射影行列をパラメータ化するために, フレキシブルで一般の低次直交行列表現であるhouseer projectorを提案する。直交性は固有ベクトルが非絡み合いの解釈可能な意味論に対応することを保証し、一方低ランク性はそれぞれの特定方向が有意な変動を持つことを奨励する。プロジェクタを事前訓練したStyleGAN2/StyleGAN3に統合し、複数のベンチマークでモデルを評価する。私たちのプロジェクタは、微調整のためのオリジナルのトレーニングステップのわずか1\%で、画像の忠実さを犠牲にすることなく、より複雑で正確なセマンティック属性を見つけるのに役立ちます。

関連論文リスト

Efficient Adaptation of Pre-trained Vision Transformer underpinned by Approximately Orthogonal Fine-Tuning Strategy [57.54306942529943]
約直交微調整(AOFT)による低ランク重量行列の表現法を提案する。本手法は,下流画像分類タスクにおける競合性能を実現する。
論文参考訳（メタデータ） (2025-07-17T16:09:05Z)
Efficient Adaptation of Pre-trained Vision Transformer via Householder Transformation [53.88562288388169]
一般的な戦略である。事前訓練された視覚変換器(ViT)のPEFT(Efficient Fine-Tuning)は、下流タスクにモデルを適応させる。適応行列を表現するために,Singular Value Decomposition (SVD) にインスパイアされた新しいPEFT手法を提案する。 SVDは行列を左ユニタリ行列、スケーリング値の対角行列、右ユニタリ行列の積に分解する。
論文参考訳（メタデータ） (2024-10-30T12:08:30Z)
Refined Risk Bounds for Unbounded Losses via Transductive Priors [58.967816314671296]
線形回帰の逐次変分を2乗損失、ヒンジ損失の分類問題、ロジスティック回帰で再検討する。我々の鍵となるツールは、慎重に選択された導出先を持つ指数重み付けアルゴリズムに基づいている。
論文参考訳（メタデータ） (2024-10-29T00:01:04Z)
Optimal Projections for Discriminative Dictionary Learning using the JL-lemma [0.5461938536945723]
次元減少に基づく辞書学習法は、しばしば反復的ランダムプロジェクションを用いている。本稿では、ジョンソン-リンデンシュトラウス補題を用いて、投影行列をデランドマイズする構成的手法を提案する。
論文参考訳（メタデータ） (2023-08-27T02:59:59Z)
Disentanglement via Latent Quantization [60.37109712033694]
本研究では,組織化された潜在空間からの符号化と復号化に向けた帰納的バイアスを構築する。本稿では,基本データレコーダ (vanilla autoencoder) と潜時再構成 (InfoGAN) 生成モデルの両方に追加することで,このアプローチの広範な適用性を実証する。
論文参考訳（メタデータ） (2023-05-28T06:30:29Z)
Controlling Directions Orthogonal to a Classifier [11.882219706353045]
本稿では,与えられた分類器に不変な方向を識別し,それらの方向をスタイル転送などのタスクで制御できるようにすることを提案する。直交変動の制御が重要である3つのユースケースとして,スタイル伝達,ドメイン適応,公平性を挙げる。コードはhttp://github.com/Newbeeer/orthogonal_classifierで入手できる。
論文参考訳（メタデータ） (2022-01-27T01:23:08Z)
Orthogonal Jacobian Regularization for Unsupervised Disentanglement in Image Generation [64.92152574895111]
直交ジャコビアン正規化法(OroJaR)を提案する。提案手法は, 絡み合った, 制御可能な画像生成に有効であり, 最先端の手法に対して好適に機能する。
論文参考訳（メタデータ） (2021-08-17T15:01:46Z)
EigenGAN: Layer-Wise Eigen-Learning for GANs [84.33920839885619]
EigenGANは、異なる発電機層から解釈可能で制御可能な寸法を無監督にマイニングすることができます。特定の固有次元の係数をトラバースすることで、ジェネレータは特定の意味属性に対応する連続的な変化を伴うサンプルを生成することができる。
論文参考訳（メタデータ） (2021-04-26T11:14:37Z)
Disentangled Representation Learning and Generation with Manifold Optimization [10.69910379275607]
本研究は,変分方向の促進による絡み合いを明確に促進する表現学習フレームワークを提案する。理論的な議論と様々な実験により、提案モデルは、生成品質と非絡み合い表現学習の両方の観点から、多くのVAE変種よりも改善されていることが示された。
論文参考訳（メタデータ） (2020-06-12T10:00:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。