論文の概要: A logical alarm for misaligned binary classifiers
- arxiv url: http://arxiv.org/abs/2409.11052v1
- Date: Tue, 17 Sep 2024 10:19:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-18 17:05:36.335738
- Title: A logical alarm for misaligned binary classifiers
- Title(参考訳): 不整合二元分類器に対する論理的アラーム
- Authors: Andrés Corrada-Emmanuel, Ilya Parker, Ramesh Bharadwaj,
- Abstract要約: 直感は二分分類タスクを実行したエージェントを評価するために形式化されています。
これは、二項応答子のすべての評価によって普遍的に従わなければならない公理の集合を確立することによってなされる。
このアプローチと形式的ソフトウェア検証の類似点と,近年の安全保証AIの課題に対する実用性について論じる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: If two agents disagree in their decisions, we may suspect they are not both correct. This intuition is formalized for evaluating agents that have carried out a binary classification task. Their agreements and disagreements on a joint test allow us to establish the only group evaluations logically consistent with their responses. This is done by establishing a set of axioms (algebraic relations) that must be universally obeyed by all evaluations of binary responders. A complete set of such axioms are possible for each ensemble of size N. The axioms for $N = 1, 2$ are used to construct a fully logical alarm - one that can prove that at least one ensemble member is malfunctioning using only unlabeled data. The similarities of this approach to formal software verification and its utility for recent agendas of safe guaranteed AI are discussed.
- Abstract(参考訳): 2人のエージェントが彼らの決定に異を唱えるなら、どちらも正しいとは思えないかもしれない。
この直感は、二分分類タスクを実行したエージェントを評価するために形式化されている。
共同テストに関する合意や意見の相違により, 論理的に応答に整合したグループ評価が確立できる。
これは、二項応答子のすべての評価によって普遍的に従わなければならない公理(代数的関係)の集合を確立することによってなされる。
N = 1, 2$ の公理は、完全に論理的なアラームを構築するために使用され、少なくとも1つのアンサンブルメンバーがラベルのないデータのみを使用して誤動作していることを証明できる。
このアプローチと形式的ソフトウェア検証の類似点と,近年の安全保証AIの課題に対する実用性について論じる。
関連論文リスト
- The logic of NTQR evaluations of noisy AI agents: Complete postulates
and logically consistent error correlations [0.0]
教師なし設定におけるノイズの多いAIエージェントの監視におけるAI安全性の問題について考察する。
本論文では,ML文献ですでにいくつかの仮定が特定されているが,そのようには認識されていないことを示す。
評価の代数的仮定による論理一貫性の定式化が,AIアルゴリズムを用いた機械の安全性向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-12-08T22:06:44Z) - Streaming algorithms for evaluating noisy judges on unlabeled data --
binary classification [0.0]
我々は、代数的故障モードを用いて、ほぼ誤りのないトリオスを探索し、評価アンサンブルを過度に相関するものとして否定する。
生き残ったアンサンブルが生み出す結果は、時には1%にも達することがある。
独立性が仮定されるときに生じる推定値のテイラー展開は、実際、分類器はわずかに相関しているので、独立評価器が代数的盲点を持つかを明らかにするのに役立つ」。
論文 参考訳(メタデータ) (2023-06-02T17:52:59Z) - Predicting the Score of Atomic Candidate OWL Class Axioms [0.0]
公理スコアは計算コストがかかることが多いため、レベルワイドな生成・テストアルゴリズムや進化アルゴリズムのような検索手法で使用する場合、問題となる。
本稿では,候補クラスの公理の可能性を推定する推論の代用として,予測モデルを開発するという課題に対処する。
この研究で得られたアプローチは、候補クラスの公理の確率スコアを正確に学習し、様々なクラス公理に対してそれを行うことができることを示す。
論文 参考訳(メタデータ) (2022-12-21T08:30:24Z) - Towards Continuous Consistency Axiom [0.0]
機械学習分野、特にクラスタリングにおける新しいアルゴリズムの開発には、ラベル付きデータセットの可用性が必要である。
我々は、クラインバーグの内部整合公理を中心的整合公理に置き換える別の公理系を提案する。
我々は、新しいシステムが、自動調整された$k$を持つ$k$-meansの階層的なバージョンに適合していることを示し、矛盾しない。
論文 参考訳(メタデータ) (2022-02-12T08:25:01Z) - Unsupervised Full Constituency Parsing with Neighboring Distribution
Divergence [48.69930912510414]
本稿では,最近導入されたメトリクスの特性を利用して,教師なしかつトレーニング不要なラベル付け手法を提案する。
実装のために,NDD を Dual POS-NDD に実装し,文中の構成要素とそのラベルを検出する "モールド" を構築する。
DP-NDDは, 構成成分を正確にラベル付けするだけでなく, より単純なルールを持つ従来手法よりも, より正確なラベル付き選挙区木を誘導することを示す。
論文 参考訳(メタデータ) (2021-10-29T17:27:34Z) - Logical Credal Networks [87.25387518070411]
本稿では,論理と確率を組み合わせた先行モデルの多くを一般化した表現的確率論的論理である論理的クレダルネットワークを紹介する。
本稿では,不確実性のあるマスターミンドゲームを解くこと,クレジットカード詐欺を検出することを含む,最大後部推論タスクの性能について検討する。
論文 参考訳(メタデータ) (2021-09-25T00:00:47Z) - Nested Counterfactual Identification from Arbitrary Surrogate
Experiments [95.48089725859298]
観測と実験の任意の組み合わせからネスト反事実の同定について検討した。
具体的には、任意のネストされた反事実を非ネストされたものへ写像できる反ファクト的非ネスト定理(英語版)(CUT)を証明する。
論文 参考訳(メタデータ) (2021-07-07T12:51:04Z) - Independence Tests Without Ground Truth for Noisy Learners [0.0]
独立二項分類器の正確な解について論じる。
その実用性はその唯一の前提によって妨げられている。
スカラー回帰器の基底真理不変系の同様の予想は解ける。
論文 参考訳(メタデータ) (2020-10-28T13:03:26Z) - Pointwise Binary Classification with Pairwise Confidence Comparisons [97.79518780631457]
ペアワイズ比較(Pcomp)分類を提案し、ラベルのないデータのペアしか持たない。
我々はPcomp分類をノイズラベル学習に結びつけて、進歩的UREを開発し、一貫性の正則化を課すことにより改善する。
論文 参考訳(メタデータ) (2020-10-05T09:23:58Z) - Foundations of Reasoning with Uncertainty via Real-valued Logics [70.43924776071616]
我々は、本質的にすべての実数値論理をカバーするためにパラメータ化できる、音と強完全公理化を与える。
文のクラスは非常に豊かであり、各クラスは実数値論理の式の集合に対して可能な実値の集合を記述する。
論文 参考訳(メタデータ) (2020-08-06T02:13:11Z) - L2R2: Leveraging Ranking for Abductive Reasoning [65.40375542988416]
学習システムの帰納的推論能力を評価するために,帰納的自然言語推論タスク(alpha$NLI)を提案する。
新たな$L2R2$アプローチは、Learning-to-rankフレームワークの下で提案されている。
ARTデータセットの実験は、公開リーダボードの最先端に到達します。
論文 参考訳(メタデータ) (2020-05-22T15:01:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。