論文の概要: Counting Worlds Branching Time Semantics for post-hoc Bias Mitigation in generative AI
- arxiv url: http://arxiv.org/abs/2604.19431v1
- Date: Tue, 21 Apr 2026 13:00:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.777054
- Title: Counting Worlds Branching Time Semantics for post-hoc Bias Mitigation in generative AI
- Title(参考訳): 生成AIにおけるポストホックバイアス緩和のための時間意味論の分数的世界
- Authors: Alessandro G. Buda, Giuseppe Primiero, Leonardo Ceragioli, Melissa Antonelli,
- Abstract要約: 我々は、一連の生成AI出力のバイアスを推論するために設計された分岐時間論理であるCTLFを紹介する。
出力系列の異なる点において、CTLF式が具体的な公正性をどう表現できるかを示す。
- 参考スコア(独自算出の注目度): 39.146761527401424
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative AI systems are known to amplify biases present in their training data. While several inference-time mitigation strategies have been proposed, they remain largely empirical and lack formal guarantees. In this paper we introduce CTLF, a branching-time logic designed to reason about bias in series of generative AI outputs. CTLF adopts a counting worlds semantics where each world represents a possible output at a given step in the generation process and introduces modal operators that allow us to verify whether the current output series respects an intended probability distribution over a protected attribute, to predict the likelihood of remaining within acceptable bounds as new outputs are generated, and to determine how many outputs are needed to remove in order to restore fairness. We illustrate the framework on a toy example of biased image generation, showing how CTLF formulas can express concrete fairness properties at different points in the output series.
- Abstract(参考訳): 生成AIシステムは、トレーニングデータに存在するバイアスを増幅することが知られている。
いくつかの推論時間緩和戦略が提案されているが、それらは主に経験的であり、正式な保証がない。
本稿では,一連の生成AI出力のバイアスを考慮した分岐時間論理であるCTLFを紹介する。
CTLFは、各世界が生成プロセスの所定のステップで可能な出力を表現できるカウントワールドセマンティクスを採用し、現在の出力系列が保護属性上の意図された確率分布を尊重するかどうかを検証できるモダル演算子を導入し、新しい出力が生成されると許容範囲内に残る確率を予測し、公正性を回復するためにどれだけの出力を除去する必要があるかを決定する。
本稿では,CTLF式が出力系列の異なる点において,具体的な公平性を表現できることを示す。
関連論文リスト
- Entropy-Aligned Decoding of LMs for Better Writing and Reasoning [21.971790771470324]
言語モデル(LM)は、真の言語分布を回復するために、数十億のトークンで訓練されている。
現在、LMからのバニラランダムサンプリングは、品質の低い世代を生み出している。
本稿では,将来の軌道のエントロピーをLMデコーディングに組み込んだ超パラメータフリーデコーディング手法EPICを紹介する。
論文 参考訳(メタデータ) (2026-01-05T01:37:10Z) - RDPM: Solve Diffusion Probabilistic Models via Recurrent Token Prediction [17.005198258689035]
拡散確率モデル(DPM)は、高忠実度画像合成のデファクトアプローチとして登場した。
本稿では, 再帰的拡散確率モデル(RDPM, Recurrent Diffusion Probabilistic Model)を提案する。
論文 参考訳(メタデータ) (2024-12-24T12:28:19Z) - Identifying and Mitigating Social Bias Knowledge in Language Models [52.52955281662332]
個々人の社会的偏見をきめ細かなキャリブレーションを可能にする新しいデバイアス・アプローチであるFairness Stamp(FAST)を提案する。
FASTは最先端のベースラインを超え、デバイアス性能が優れている。
これは、大きな言語モデルにおける公平性を達成するためのきめ細かいデバイアス戦略の可能性を強調している。
論文 参考訳(メタデータ) (2024-08-07T17:14:58Z) - Time-series Generation by Contrastive Imitation [87.51882102248395]
モーメントマッチングの目的によってモチベーションされ、複合的エラーを軽減し、局所的(しかし前方的な)遷移ポリシーを最適化する。
推論において、学習されたポリシーは反復的なサンプリングのジェネレータとして機能し、学習されたエネルギーはサンプルの品質を評価するための軌道レベル尺度として機能する。
論文 参考訳(メタデータ) (2023-11-02T16:45:25Z) - Conformal Language Modeling [61.94417935386489]
生成言語モデル(LM)の共形予測のための新しい手法を提案する。
標準共形予測は厳密で統計的に保証された予測セットを生成する。
我々は,オープンドメイン質問応答,テキスト要約,ラジオロジーレポート生成において,複数のタスクに対するアプローチの約束を実証する。
論文 参考訳(メタデータ) (2023-06-16T21:55:08Z) - Out-of-Distribution Detection and Selective Generation for Conditional
Language Models [40.15896981028647]
条件付き言語モデル(CLM)は、出力シーケンスで次のトークンを分類するために主に訓練される。
CLMの高精度かつ軽量なOOD検出法を提案する。
提案手法は,高品質な出力を選択的に生成するために,分布シフトの一般的かつ現実的な設定の下でどのように使用できるかを示す。
論文 参考訳(メタデータ) (2022-09-30T16:17:11Z) - Probabilistic Kolmogorov-Arnold Network [1.4732811715354455]
本稿では,アレータティック不確実性の場合に出力の確率分布を推定する手法を提案する。
提案手法は, 出力の入力依存確率分布と, 入力による分布型の変化を対象とする。
本手法は任意の回帰モデルに適用できるが, 計算効率のよいモデルの構築につながるため,kansと組み合わせる。
論文 参考訳(メタデータ) (2021-04-04T23:49:15Z) - Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。
本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。
我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文 参考訳(メタデータ) (2020-07-17T21:50:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。