論文の概要: Measuring global properties of neural generative model outputs via
generating mathematical objects
- arxiv url: http://arxiv.org/abs/2105.13669v1
- Date: Fri, 28 May 2021 08:38:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-31 13:46:13.231386
- Title: Measuring global properties of neural generative model outputs via
generating mathematical objects
- Title(参考訳): 数学的物体生成によるニューラル生成モデル出力の大域的特性の測定
- Authors: Bernt Ivar Utst{\o}l N{\o}dland
- Abstract要約: 我々は反射性ポリトープのデータセットで深層生成モデルを訓練する。
これにより、モデルが生成したサンプルの様々なグローバルな特性をいかにうまく捉えたかを比較することができる。
また、モデルが単にデータを記憶している程度をチェックするテストも行います。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We train deep generative models on datasets of reflexive polytopes. This
enables us to compare how well the models have picked up on various global
properties of generated samples. Our datasets are complete in the sense that
every single example, up to changes of coordinate, is included in the dataset.
Using this property we also perform tests checking to what extent the models
are merely memorizing the data. We also train models on the same dataset
represented in two different ways, enabling us to measure which form is easiest
to learn from. We use these experiments to show that deep generative models can
learn to generate geometric objects with non-trivial global properties, and
that the models learn some underlying properties of the objects rather than
simply memorizing the data.
- Abstract(参考訳): 我々は反射性ポリトープのデータセットで深層生成モデルを訓練する。
これにより、モデルが生成したサンプルの様々なグローバルな特性をいかにうまく捉えたかを比較することができる。
データセットは、座標の変更まで、すべての例がデータセットに含まれているという意味で、完全なものです。
このプロパティを使用すると、モデルがデータを覚えている程度までテストを実行します。
また、2つの異なる方法で表現された同じデータセット上でモデルをトレーニングすることで、どのフォームから学ぶのが一番簡単かを測定できます。
これらの実験は、深層生成モデルが非自明な大域的特性を持つ幾何学的オブジェクトを生成することを学習し、そのモデルが単にデータを記憶するのではなく、対象の基本的な特性を学習できることを示すものである。
関連論文リスト
- Diffusion Models as Data Mining Tools [87.77999285241219]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。
特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。
この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文 参考訳(メタデータ) (2024-07-20T17:14:31Z) - (Deep) Generative Geodesics [57.635187092922976]
2つのデータポイント間の類似性を評価するために,新しい測定基準を導入する。
我々の計量は、生成距離と生成測地学の概念的定義に繋がる。
彼らの近似は、穏やかな条件下で真の値に収束することが証明されている。
論文 参考訳(メタデータ) (2024-07-15T21:14:02Z) - Modified CycleGAN for the synthesization of samples for wheat head
segmentation [0.09999629695552192]
注釈付きデータセットがない場合は、モデル開発に合成データを使用することができる。
そこで我々は,小麦頭部分割のための現実的な注釈付き合成データセットを開発した。
その結果、Diceのスコアは内部データセットで83.4%、外部のGlobal Wheat Head Detectionデータセットで83.6%に達した。
論文 参考訳(メタデータ) (2024-02-23T06:42:58Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - A Case for Dataset Specific Profiling [0.9023847175654603]
データ駆動科学は、科学的な発見が、リッチで規律固有のデータセットに対する計算AIモデルの実行に依存する、新興パラダイムである。
現代的な機械学習フレームワークを使用することで、誰でも科学的応用を可能にするデータに隠された概念を明らかにする計算モデルを開発し、実行することができる。
重要で広く使われているデータセットでは、データセットに対して実行できるすべての計算モデルのパフォーマンスを計算することは、クラウドリソースの点でコストを禁ずる。
論文 参考訳(メタデータ) (2022-08-01T18:38:05Z) - A Topological-Framework to Improve Analysis of Machine Learning Model
Performance [5.3893373617126565]
本稿では、データセットをモデルが動作する「空間」として扱う機械学習モデルを評価するためのフレームワークを提案する。
本稿では,各サブポピュレーション間でのモデル性能の保存と解析に有用なトポロジカルデータ構造であるプレシーブについて述べる。
論文 参考訳(メタデータ) (2021-07-09T23:11:13Z) - Model-agnostic multi-objective approach for the evolutionary discovery
of mathematical models [55.41644538483948]
現代のデータ科学では、どの部分がより良い結果を得るために置き換えられるかというモデルの性質を理解することがより興味深い。
合成データ駆動型モデル学習において,多目的進化最適化を用いてアルゴリズムの所望特性を求める。
論文 参考訳(メタデータ) (2021-07-07T11:17:09Z) - Generative Models as Distributions of Functions [72.2682083758999]
生成モデルは一般的に、画像のようなグリッドのようなデータに基づいて訓練される。
本稿では,離散格子を放棄し,連続関数による個々のデータポイントのパラメータ化を行う。
論文 参考訳(メタデータ) (2021-02-09T11:47:55Z) - Dataset Cartography: Mapping and Diagnosing Datasets with Training
Dynamics [118.75207687144817]
我々はデータセットを特徴付け、診断するモデルベースのツールであるData Mapsを紹介した。
私たちは、トレーニング中の個々のインスタンス上でのモデルの振る舞いという、ほとんど無視された情報のソースを活用しています。
以上の結果から,データ量から品質へのフォーカスの変化は,ロバストなモデルとアウト・オブ・ディストリビューションの一般化に繋がる可能性が示唆された。
論文 参考訳(メタデータ) (2020-09-22T20:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。