このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20200218となっている論文です。

PDF登録状況(公開日: 20200218)

TitleAuthorsAbstract論文公表日・翻訳日
# コヒーレント駆動型ブログリエ・サニャック干渉計

Coherently driven photonic de Broglie Sagnac interferometer ( http://arxiv.org/abs/2002.01753v2 )

ライセンス: Link先を確認
B. S. Ham(参考訳) 量子測定は、ハイゼンベルクの量子的優位性により、量子力学の潜在的な応用に向けて標準量子限界を破り、数十年にわたって集中的に研究されてきた。 量子測定の核は、ハイゼンベルクの不確かさの原理を満たす対応する非可換変数に対して、1つのパラメータでクエンチされた2部光子対または圧縮光の量子相関にある。 その結果、量子測定は、測定感度において平方根の法則の量子利得をもたらす。 フォトニック・ド・ブロイ波 (PBW) は、特にレイリー基準の古典的限界を超える位相分解能の増強、あるいは単に回折限界のために量子力学においてそのような利得の鍵となる特徴である。 しかし、NOON状態のような高次エンタングルド光子対の効率が非常に低いため、量子メロロジーのためのPBWの実装は厳しく制限されている。 ここでは、新しいタイプのpbwに対して、量子測定の全く異なるメカニズムを導入し、修正されたsagnac干渉計の潜在的な応用について提示する。

Quantum measurements have been intensively researched over decades due to quantum advantage of Heisenberg limit beating the standard quantum limit toward potential applications of quantum metrology. The kernel of quantum measurements is in the quantum correlation between bipartite photon pairs or squeezed light quenched by one parameter over corresponding noncommuting variable satisfying Heisenberg uncertainty principle. As a result, quantum measurements bring a quantum gain of the square root law in measurement sensitivity. Photonic de Broglie waves (PBW) have been the key feature of such a gain in quantum metrology especially for phase resolution enhancement beyond the classical limit of Rayleigh criterion or simply the diffraction limit. Due to extremely low efficiency of higher-order entangled photon pair generations such as a NOON state, however, the implementation of PBW for quantum metrology has been severely limited. Here, a completely different mechanism of quantum measurements is introduced for a new type of PBW and presented for its potential application of a modified Sagnac interferometer, where the resolution enhancement is several orders of magnitude higher than its classical counterpart.
翻訳日:2023-06-04 16:27:03 公開日:2020-02-18
# $\boldsymbol{\mathsf{A}}^{2}$ 項を持つ量子 Rabi モデルの厳密解

Exact solution for the quantum Rabi model with the $\boldsymbol{\mathsf{A}}^{2}$ term ( http://arxiv.org/abs/2002.03702v2 )

ライセンス: Link先を確認
I. D. Feranchuk and N. Q. San and A. U. Leonau and O. D. Skoromnik(参考訳) 量子ラビモデル(QRM)は空洞量子力学の基礎レベルでの放射-物質相互作用の解析に広く用いられている。 典型的には、qrmハミルトニアンは$\boldsymbol{\mathsf{p}} \cdot \boldsymbol{\mathsf{a}}$項のみを含むが、量子電気力学の完全非相対論的ハミルトニアンには$\boldsymbol{\mathsf{a}}^{2}$項も含まれる。 ここでは、QRMハミルトニアンが$\boldsymbol{\mathsf{A}}^{2}$ term (QRMA) を持つときの正確な正準変換の助けを借りて、正規化周波数とカップリング定数と固有状態がフィールドの圧縮状態を通して表現される標準QRMモデルハミルトニアンに還元される。 その結果、$\boldsymbol{\mathsf{a}}^{2}$項は、強結合状態においてqrmの挙動を純粋に電磁相互作用によって定性的に変化させる: キャビティ内の原子の基底状態エネルギーの値は真空中よりも高く、量子数が異なるエネルギー準位の交差数は減少する。

Quantum Rabi model (QRM) is widely used for the analysis of the radiation-matter interaction at the fundamental level in cavity quantum electrodynamics. Typically the QRM Hamiltonian includes only $\boldsymbol{\mathsf{p}} \cdot \boldsymbol{\mathsf{A}}$ term, however, the complete nonrelativistic Hamiltonian of quantum electrodynamics includes $\boldsymbol{\mathsf{A}}^{2}$ term as well. Here we find an exact solution and demonstrate with the help of the exact canonical transformations that the QRM Hamiltonian with the $\boldsymbol{\mathsf{A}}^{2}$ term (QRMA) is reduced to the standard QRM model Hamiltonian with the renormalized frequency and the coupling constant and the eigenstates are expressed through the squeezed states of the field. As a result, the $\boldsymbol{\mathsf{A}}^{2}$ term qualitatively changes the behavior of the QRM with purely electromagnetic interaction in the strong coupling regime: the value of the ground state energy of an atom inside the cavity is higher than in vacuum and the number of crossing of energy levels with different quantum numbers decreases.
翻訳日:2023-06-04 01:54:07 公開日:2020-02-18
# Pseudogap Anderson 不純物平衡モデル:マスター方程式テンソルネットワークアプローチ

Pseudogap Anderson impurity model out of equilibrium: A master equation tensor network approach ( http://arxiv.org/abs/2002.04656v2 )

ライセンス: Link先を確認
Delia M. Fugger, Daniel Bauernfeind, Max E. Sorantin, and Enrico Arrigoni(参考訳) 状態密度にパワーロー擬ギャップを持つ単一不純物アンダーソン模型の平衡と非平衡特性について検討した。 平衡では、モデルは一般化された近藤から局所モーメント位相への量子位相遷移を示すことが知られている。 本研究は, バイアス電圧の影響を受け, これらの相の平衡を超えた拡張に焦点をあてる。 補助マスター方程式アプローチと行列積状態(MPS)に基づくスキームを組み合わせることで、現在の定常状態に直接対処することができる。 平衡状態から始めると、MPSによるシステムの基底状態スペクトル特性の直接的数値評価と比較することにより、結果の相関付けを行う。 ここで、自己エネルギーのパワーロー指数を外挿して位相境界を求めるスキームは、数値的再正規化群によって得られた以前の結果と非常によく一致する。 次に, 位相境界の両側に作用する2点について, バイアス電圧の関数としての非平衡実験を行う。 近藤系では、スペクトル関数の共鳴は、増大するバイアス電圧の関数として分割される。 代わりに、局所モーメント状態は、化学ポテンシャルの位置に近いスペクトルに減少を示す。 同様の特徴は対応する自己エネルギーで観測される。 近藤スプリットピークは周波数関数としてのパワーロー挙動にほぼ従っており、その指数は電圧にわずかに依存する。 最後に、近藤系における微分コンダクタンスは、有限電圧における特異な最大値を示すが、その高さは精度レベル以下である。

We study equilibrium and nonequilibrium properties of the single-impurity Anderson model with a power-law pseudogap in the density of states. In equilibrium, the model is known to display a quantum phase transition from a generalized Kondo to a local moment phase. In the present work, we focus on the extension of these phases beyond equilibrium, i.e. under the influence of a bias voltage. Within the auxiliary master equation approach combined with a scheme based on matrix product states (MPS) we are able to directly address the current-carrying steady state. Starting with the equilibrium situation, we first corroborate our results by comparing with a direct numerical evaluation of ground state spectral properties of the system by MPS. Here, a scheme to locate the phase boundary by extrapolating the power-law exponent of the self energy produces a very good agreement with previous results obtained by the numerical renormalization group. Our nonequilibrium study as a function of the applied bias voltage is then carried out for two points on either side of the phase boundary. In the Kondo regime the resonance in the spectral function is splitted as a function of the increasing bias voltage. The local moment regime, instead, displays a dip in the spectrum near the position of the chemical potentials. Similar features are observed in the corresponding self energies. The Kondo split peaks approximately obey a power-law behavior as a function of frequency, whose exponents depend only slightly on voltage. Finally, the differential conductance in the Kondo regime shows a peculiar maximum at finite voltages, whose height, however, is below the accuracy level.
翻訳日:2023-06-03 23:21:43 公開日:2020-02-18
# 平行および反平行スピンによる最適オリエンテーリングの実験

Experimental optimal orienteering via parallel and antiparallel spins ( http://arxiv.org/abs/2002.07364v1 )

ライセンス: Link先を確認
Jun-Feng Tang, Zhibo Hou, Jiangwei Shang, Huangjun Zhu, Guo-Yong Xiang, Chuan-Feng Li, Guang-Can Guo(参考訳) 反平行スピンは平行スピンの向き付けに優れている。 この興味深い現象は、量子状態ではなく量子測定に関連する絡み合いと結びついている。 フォトニックシステムを用いて,並列スピンと反平行スピンに基づく最適オリエンテーリングプロトコルを実験的に実現した。 パラレルスピンや反パラレルスピンから方向情報を復号するための最適な絡み合い測定は、フォトニック量子ウォーク(英語版)を用いて実現され、量子情報処理や基礎研究に広く興味を持つ有用なアイデアである。 我々の実験は、オリエンテーリングにおける平行スピンに対する反平行スピンの利点を明らかに示している。 さらに、絡み合いの測定は、量子状態に絡み合いがない場合でも、局所的な測定よりも多くの情報を抽出することができる。

Antiparallel spins are superior in orienteering to parallel spins. This intriguing phenomenon is tied to entanglement associated with quantum measurements rather than quantum states. Using photonic systems, we experimentally realize the optimal orienteering protocols based on parallel spins and antiparallel spins, respectively. The optimal entangling measurements for decoding the direction information from parallel spins and antiparallel spins are realized using photonic quantum walks, which is a useful idea that is of wide interest in quantum information processing and foundational studies. Our experiments clearly demonstrate the advantage of antiparallel spins over parallel spins in orienteering. In addition, entangling measurements can extract more information than local measurements even if no entanglement is present in the quantum states.
翻訳日:2023-06-03 07:26:37 公開日:2020-02-18
# 量子制御による直接状態測定における系統誤差

Systematic errors in direct state measurements with quantum controlled measurements ( http://arxiv.org/abs/2002.07328v1 )

ライセンス: Link先を確認
Le Bin Ho(参考訳) Von Neumann測定フレームワークは、ターゲットシステムとプローブの間の動的相互作用を記述する。 対照的に、量子制御測定フレームワークは、量子ビットプローブを使用してターゲットシステム上の異なる演算子の動作を制御し、普遍的な量子計算を確立するのに便利である。 本研究では,量子状態を直接測定するための量子制御計測フレームワークを用いる。 量子制御測定フレームワークの2つのタイプを紹介し,これらのタイプに起因する系統的誤差(真の値と推定値のバイアス)について検討する。 系統的誤差を数値的に検討し,信頼度領域を評価し,不完全な検出から生じる実験ノイズの影響について検討した。 我々の分析は直接量子状態トモグラフィーに重要な応用がある。

Von Neumann measurement framework describes a dynamic interaction between a target system and a probe. In contrast, a quantum controlled measurement framework uses a qubit probe to control the actions of different operators on the target system, and convenient for establishing universal quantum computation. In this work, we use a quantum controlled measurement framework for measuring quantum states directly. We introduce two types of the quantum controlled measurement framework and investigate the systematic error (the bias between the true value and the estimated values) that caused by these types. We numerically investigate the systematic errors, evaluate the confidence region, and investigate the effect of experimental noise that arises from the imperfect detection. Our analysis has important applications in direct quantum state tomography.
翻訳日:2023-06-03 07:26:18 公開日:2020-02-18
# 開量子系に対する量子絡み合いとボルン・マルコフ近似

Quantum entanglement and the Born-Markov approximation for an open quantum system ( http://arxiv.org/abs/2002.07320v1 )

ライセンス: Link先を確認
Andrey R. Kolovsky(参考訳) 我々は,浴槽の微視的モデル,すなわち,量子カオスの意味でカオスであるパラメータ領域のボース・ハバード連鎖を考えることにより,開量子系のボルン・マルコフ近似を再検討する。 浴槽の強いエルゴード的性質は、マルコフのマスター方程式を第一原理から導出するために必要なすべての近似を正当化する。

We revisit the Born-Markov approximation for an open quantum system by considering a microscopic model of the bath, namely, the Bose-Hubbard chain in the parameter region where it is chaotic in the sense of Quantum Chaos. It is shown that strong ergodic properties of the bath justify all approximations required for deriving the Markovian master equation from the first principles.
翻訳日:2023-06-03 07:25:59 公開日:2020-02-18
# 因果ホライズンによる相関再分配

Correlation Redistribution by Causal Horizons ( http://arxiv.org/abs/2002.07316v1 )

ライセンス: Link先を確認
L. Pipolo de Gioia, M. C. de Oliveira(参考訳) ミンコフスキー真空(minkowski vacuum $|0\rangle_m$)は、慣性観測者が粒子を欠き、リンドラーウェッジの1つのリンドラー観測者によって熱浴として扱われる。 我々は、自由スカラーKlein-Gordon場の観点から、慣性観測者アリスと左右リンドラーの相関関係の定量化の問題がRob/AntiRobを観察する。 我々は,局所的にアクセス可能でアクセス不能な情報や,密接な絡み合い,形成の絡み合いなど,情報量の分析に重点を置いている。 我々は、慣性観測者単独による相関構造について、リンドラー観測者の導入は、形成の絡み合いによって定量化できる相関再分配をもたらすと結論付けた。

The Minkowski vacuum $|0\rangle_M$, which for an inertial observer is devoid of particles, is treated as a thermal bath by Rindler observers living in a single Rindler wedge, as a result of the discrepancy in the definition of positive frequency between the two classes of observers and a strong entanglement between degrees of freedom in the left and right Rindler wedges. We revisit, in the context of a free scalar Klein-Gordon field, the problem of quantification of the correlations between an inertial observer Alice and left/right Rindler observes Rob/AntiRob. We emphasize the analysis of informational quantities, like the locally accessible and locally inaccessible information, and a closely associated entanglement measure, the entanglement of formation. We conclude that, with respect to the correlation structure probed by inertial observers alone, the introduction of a Rindler observer gives rise to a correlation redistribution which can be quantified by the entanglement of formation.
翻訳日:2023-06-03 07:25:46 公開日:2020-02-18
# くしゃみではなく騒音は深い量子状態における同期を促進する

Noise, not squeezing, boosts synchronization in the deep quantum regime ( http://arxiv.org/abs/2002.07488v1 )

ライセンス: Link先を確認
Wai Keong Mok, Leong Chuan Kwek, Hermanni Heimonen(参考訳) 同期は自然界において普遍的に起こる。 ファンデルpol発振器は同期を調べるのに好まれるモデルである。 ここでは、非古典的効果がダイナミクスを支配する深部量子状態における発振子について研究する。 結果はこう示しています (i)絞り込み運転は効果を失わせる。 (ii)ノイズは同期を促進する (iii)同期は有界であり、 (iv)リミットサイクルは強い運転に影響を受けない。 同期測度を提案し,解析的に計算する。 これらの結果は、量子状態と深部量子状態の同期に固有の違いを反映している。

Synchronization occurs ubiquitously in nature. The van der Pol oscillator has been a favorite model to investigate synchronization. Here we study the oscillator in the deep quantum regime, where nonclassical effects dominate the dynamics. Our results show: (i) squeezed driving loses its effect, (ii) noise boosts synchronization, (iii) synchronization is bounded, and (iv) the limit-cycle is insensitive to strong driving. We propose a synchronization measure and analytically calculate it. These results reflect intrinsic differences between synchronization in the quantum and deep quantum regimes.
翻訳日:2023-06-03 07:21:16 公開日:2020-02-18
# マヨラナ粒子の相対論的量子力学

Relativistic Quantum Mechanics of the Majorana Particle ( http://arxiv.org/abs/2002.07482v1 )

ライセンス: Link先を確認
H. Arodz(参考訳) 本論文は自由マヨラナ粒子の相対論的量子力学の教育的紹介である。 この比較的単純な理論は、ディラック粒子のよく知られた量子力学とは異なる。 我々はその3つの等価な定式化を示す。 次に、いわゆる軸運動量観測可能性を導入し、その作用素の固有関数の観点からディラック方程式の一般解を議論する。 poincar\'e 群の関連する既約表現について論じる。 最後に、質量を持たないマヨラナ粒子の場合、量子力学はスピンゲージ理論として再構成可能であることを示す。

This article is a pedagogical introduction to relativistic quantum mechanics of the free Majorana particle. This relatively simple theory differs from the well-known quantum mechanics of the Dirac particle in several important aspects. We present its three equivalent formulations. Next, so called axial momentum observable is introduced, and general solution of the Dirac equation is discussed in terms of eigenfunctions of that operator. Pertinent irreducible representations of the Poincar\'e group are discussed. Finally, we show that in the case of massless Majorana particle the quantum mechanics can be reformulated as a spinorial gauge theory.
翻訳日:2023-06-03 07:21:10 公開日:2020-02-18
# 地理学生養成ツールとしての仮想情報教育環境のディダクティクスの可能性

The didactic potential of virtual information educational environment as a tool of geography students training ( http://arxiv.org/abs/2002.07473v1 )

ライセンス: Link先を確認
Olga Bondarenko, Olena Pakhomova, Wlodzimierz Lewoniewski(参考訳) 論文は「仮想情報教育環境」(viee)の概念を明らかにし、その意味を科学文献で明らかにする研究者の見解を検討する。 本論文は,google classroomを用いたブレンド学習体験の分析に基づいて,地理学生教育における仮想情報教育環境のディダクティクス可能性を決定する。 また、特徴(没入、相互作用、ダイナミズム、存在感、連続性、因果性)も規定している。 The authors highlighted the advantages of virtual information educational environment implementation, such as: increase of the efficiency of the educational process by intensifying the process of cognition and interpersonal interactive communication; continuous access to multimedia content both in Google Classroom and beyond; saving student time due to the absence of necessity to work out the training material "manually"; availability of virtual pages of the virtual class; individualization of the educational process; formation of informational culture of the geography students ; and more productive learning of the educational material at the expense of IT educational facilities. この論文は、コンピュータ化の低いレベル、ソフトウェア製品の重要量、品質の低いレベル、地理学生の専門教育におけるVIEEの役割の過小評価、経済的な刺激の欠如などについて言及している。

The article clarifies the concept of "virtual information educational environment" (VIEE) and examines the researchers' views on its meaning exposed in the scientific literature. The article determines the didactic potential of the virtual information educational environment for the geography students training based on the analysis of the authors' experience of blended learning by means of the Google Classroom. It also specifies the features (immersion, interactivity, and dynamism, sense of presence, continuity, and causality). The authors highlighted the advantages of virtual information educational environment implementation, such as: increase of the efficiency of the educational process by intensifying the process of cognition and interpersonal interactive communication; continuous access to multimedia content both in Google Classroom and beyond; saving student time due to the absence of necessity to work out the training material "manually"; availability of virtual pages of the virtual class; individualization of the educational process; formation of informational culture of the geography students ; and more productive learning of the educational material at the expense of IT educational facilities. Among the disadvantages the article mentions low level of computerization, insignificant quantity and low quality of software products, underestimation of the role of VIEE in the professional training of geography students, and the lack of economic stimuli, etc.
翻訳日:2023-06-03 07:21:01 公開日:2020-02-18
# Rydberg原子を個別に制御した多体物理

Many-Body Physics with Individually-Controlled Rydberg Atoms ( http://arxiv.org/abs/2002.07413v1 )

ライセンス: Link先を確認
Antoine Browaeys and Thierry Lahaye(参考訳) 過去10年にわたり、ライドバーグ状態に興奮して互いに相互作用する個別に制御された中性原子の系は、多体問題、特にスピン系を量子シミュレーションするための有望なプラットフォームとして浮上してきた。 ここでは、これらの実験で使用される量子ガス顕微鏡と光学的ツイーザのアレイの基礎となる技術について概説し、Rydberg原子間の異なる種類の相互作用が、様々な量子スピンモデルへの自然なマッピングを可能にし、このプラットフォームで得られた最近の結果について述べる。

Over the last decade, systems of individually-controlled neutral atoms, interacting with each other when excited to Rydberg states, have emerged as a promising platform for quantum simulation of many-body problems, in particular spin systems. Here, we review the techniques underlying quantum gas microscopes and arrays of optical tweezers used in these experiments, explain how the different types of interactions between Rydberg atoms allow a natural mapping onto various quantum spin models, and describe recent results that were obtained with this platform to study quantum many-body physics.
翻訳日:2023-06-03 07:20:18 公開日:2020-02-18
# 超ナロースペクトルによる磁気誘起光透過

Magnetically Induced Optical Transparency With Ultra-Narrow Spectrum ( http://arxiv.org/abs/2002.07409v1 )

ライセンス: Link先を確認
Guohui Dong, Dazhi Xu and Peng Zhang(参考訳) 磁気誘導型光透過性(MIOT)は、空洞量子力学(Cavity QED)系における狭い透過スペクトルを実現する技術であり、光空洞(Phys. Rev. 118, 263601 (2017))における88Sr原子の最近の実験で実証されている。 この実験では、MIOTは、キャビティモード周波数の変動に強い免疫を持つプローブビームの新しい狭い透過窓を誘導する。 この透過窓の直線幅は電子3P1状態(約2pi*7.5kHz)の崩壊速度に近づき、キャビティモード周波数(約2pi*150kHz)の不確かさよりもはるかに小さい。 本研究では,電子的3p1状態と3p0状態とを結合する2つのラマンビームとをそれぞれ3p0状態とすることにより,miotによる伝送窓の線幅を更に低減する手法を提案する。 このアプローチでは、伝送線路幅を桁違いに減らすことができる。 また、相対送信電力のピーク値やプローブビームの送信速度はラマンビームによってほぼ変化しない。 この結果は,キャビティ量子力学(キャビティQED)に基づく精密測定やその他の量子光学プロセスの研究に有用である。

Magnetically induced optical transparency (MIOT) is a technique to realize the narrow transmission spectrum in a cavity quantum electric dynamics (cavity QED) system, which is demonstrated in the recent experiment of cold 88Sr atoms in an optical cavity [Phys. Rev. Lett. 118, 263601 (2017)]. In this experiment, MIOT induces a new narrow transmission window for the probe beam, which is highly immune to the fluctuation of the cavity mode frequency. The linewidth of this transmission window approaches the decay rate of the electronic 3P1 state (about 2pi*7.5kHz) and is much less than the uncertainty of the cavity mode frequency (about 2pi*150kHz). In this work, we propose an approach to further reduce the linewidth of this MIOT-induced transmission window, with the help of two Raman beams which couples the electronic 3P1 state to the3S1state, and the3S1state to the 3P0 state, respectively. With this approach, one can reduce the transmission linewidth by orders of magnitude. Moreover, the peak value of the relative transmission power or the transmission rate of the probe beam is almost unchanged by the Raman beams. Our results are helpful for the study of precision measurement and other quantum optical processes based on cavity quantum electronic dynamics (cavity-QED).
翻訳日:2023-06-03 07:20:06 公開日:2020-02-18
# 量子クーポンコレクタ

Quantum Coupon Collector ( http://arxiv.org/abs/2002.07688v1 )

ライセンス: Link先を確認
Srinivasan Arunachalam and Aleksandrs Belovs and Andrew M. Childs and Robin Kothari and Ansis Rosmanis and Ronald de Wolf(参考訳) 我々は、$k$-要素集合$S\subseteq[n]$が、その要素の均一な重ね合わせ$|S\rangle$からいかに効率的に学習できるかを研究する。 |s\rangle=\sum_{i\in s}|i\rangle/\sqrt{|s|}$ を ``coupon collector problem の古典的な解析のように、$s$ 上の一様ランダムなサンプルの量子バージョンと考えることができる。 もし$k$が$n$に近いなら、ランダムなサンプルよりも漸近的に少ない量子サンプルを使って$s$を学ぶことができる。 特に、$n-k=O(1)$ 欠落元がある場合、$O(k)$ suffice の $|S\rangle$ suffice は、古典的なクーポンコレクタが必要とする $\Theta(k\log k)$ ランダムサンプルとは対照的である。 一方、$n-k=\Omega(k)$ならば、$\Omega(k\log k)$量子サンプルは必要である。 より一般的には、$k$と$n$ごとに必要となる量子サンプルの数に厳密な制限を与え、効率的な量子学習アルゴリズムを与える。 また、$|S\rangle$を反射できるようなモデルに厳密な境界を与える。 最後に、クーポン収集と、量子の場合の分離を示さない適切なPAC学習と不適切なPAC学習を分離した既知の例を関連付ける。

We study how efficiently a $k$-element set $S\subseteq[n]$ can be learned from a uniform superposition $|S\rangle$ of its elements. One can think of $|S\rangle=\sum_{i\in S}|i\rangle/\sqrt{|S|}$ as the quantum version of a uniformly random sample over $S$, as in the classical analysis of the ``coupon collector problem.'' We show that if $k$ is close to $n$, then we can learn $S$ using asymptotically fewer quantum samples than random samples. In particular, if there are $n-k=O(1)$ missing elements then $O(k)$ copies of $|S\rangle$ suffice, in contrast to the $\Theta(k\log k)$ random samples needed by a classical coupon collector. On the other hand, if $n-k=\Omega(k)$, then $\Omega(k\log k)$ quantum samples are~necessary. More generally, we give tight bounds on the number of quantum samples needed for every $k$ and $n$, and we give efficient quantum learning algorithms. We also give tight bounds in the model where we can additionally reflect through $|S\rangle$. Finally, we relate coupon collection to a known example separating proper and improper PAC learning that turns out to show no separation in the quantum case.
翻訳日:2023-06-03 07:11:28 公開日:2020-02-18
# クトリットのスピンによるランダム生成

Random generation with the spin of a qutrit ( http://arxiv.org/abs/2002.07675v1 )

ライセンス: Link先を確認
Fran\c{c}ois ARNAULT, Don ANOMAN(参考訳) ランダムな生成に単一キュートリットを用いることを検討する。 これは単一のクトリットが文脈性を示すため可能である。 生成したシーケンスのエントロピーを最適化する。 これを実現するために、我々はCBSの不平等に頼るのではなく、特定の状態の使用と忠実性の確認に頼っている。 ちなみに、このチェックは光子対やスピン-1/2粒子に適用されるCHSH不等式の変種と見なすことができる(量子は区別できない量子ビットの対としてしばしば実現される)。 この乱数生成器の物理的実現は、一般に$\su(3)$ qutrit操作ではなく、スピン演算と測定のみを実装する必要があるという事実によって緩和されるべきである。

We consider the use of a single qutrit for random generation. This is possible because single qutrits exhibit contextuality features. We aim to optimize the entropy of the generated sequence. To do this, we do not rely on the KCBS inequality but instead on the use of a specific state and a check for fidelity. By the way, we show that this check can be considered as a variant of the CHSH inequality applied to pairs of photons or spin-1/2 particles (qutrits are often realized as a pair of indistinguishable qubits). The physical realisation of this random generator should be eased by the fact it needs only to implement spin operations and measurement, not general $\SU(3)$ qutrit manipulations.
翻訳日:2023-06-03 07:10:42 公開日:2020-02-18
# プロセス理論における統合情報

Integrated Information in Process Theories ( http://arxiv.org/abs/2002.07654v1 )

ライセンス: Link先を確認
Sean Tull and Johannes Kleiner(参考訳) プロセス理論の単純なグラフィカル言語、すなわち対称モノイド圏において、トノニらによる統合情報理論(iit)の鍵概念がどのように研究できるかを実証する。 これにより、IITはザナルディ、トマ、ヴェヌティの量子IITを含む幅広い物理理論に一般化できる。

We demonstrate how the key notions of Tononi et al.'s Integrated Information Theory (IIT) can be studied within the simple graphical language of process theories, i.e. symmetric monoidal categories. This allows IIT to be generalised to a broad range of physical theories, including as a special case the Quantum IIT of Zanardi, Tomka and Venuti.
翻訳日:2023-06-03 07:10:08 公開日:2020-02-18
# 散逸量子ビットの時間最適制御

Time-optimal control of a dissipative qubit ( http://arxiv.org/abs/2002.07653v1 )

ライセンス: Link先を確認
Chungwei Lin, Dries Sels, and Yebin Wang(参考訳) ポントリャーギンの最大原理に基づく形式主義は、制限された制御を持つハミルトニアン(英語版)、すなわち有界振幅を持つ単一の制御場(英語版)によって一般初期状態を目標状態へ駆動する時間最適化プロトコルを決定するために適用される。 bath と qubit の結合は lindblad master equation によってモデル化される。 散逸は通常、システムを最大混合状態に駆動するので、一般に、デコヒーレンスによってシステムがターゲット状態に近づくのを防ぐ最適な進化時間が存在する。 しかし、特定の散逸チャネルの場合、最適制御はシステムを無限に長い最大エントロピー状態から遠ざけることができる。 この特定の状況が生じる状況については、詳しく論じる。 時間最適プロトコルを構築するための数値手順について述べる。 特に、ここで採用される形式主義は、孤立あるいは散逸的量子ビットの制御において不可欠であることが判明した時間依存特異制御を効率的に評価することができる。

A formalism based on Pontryagin's maximum principle is applied to determine the time-optimal protocol that drives a general initial state to a target state by a Hamiltonian with limited control, i.e., there is a single control field with bounded amplitude. The coupling between the bath and the qubit is modeled by a Lindblad master equation. Dissipation typically drives the system to the maximally mixed state; consequently, there generally exists an optimal evolution time beyond which the decoherence prevents the system from getting closer to the target state. For some specific dissipation channel, however, the optimal control can keep the system from the maximum entropy state for infinitely long. The conditions under which this specific situation arises are discussed in detail. The numerical procedure to construct the time-optimal protocol is described. In particular, the formalism adopted here can efficiently evaluate the time-dependent singular control which turns out to be crucial in controlling either an isolated or a dissipative qubit.
翻訳日:2023-06-03 07:10:01 公開日:2020-02-18
# 時空間相関の非一夫一婦制とブラックホール情報損失パラドックス

Non-monogamy of spatio-temporal correlations and the black hole information loss paradox ( http://arxiv.org/abs/2002.07628v1 )

ライセンス: Link先を確認
C. Marletto, V.Vedral, S.Virz\`i, E.Rebufello, A.Avella, F.Piacentini, M.Gramegna, I.Degiovanni, M.Genovese(参考訳) 擬密度行列は量子状態の一般化であり、量子相関の単元性に従わない。 これはブラックホールの蒸発に伴う情報損失のパラドックスの解決策になるのだろうか? 本稿では、これらの擬似状態を用いて量子理論を拡張し、ブラックホール蒸発に伴う統計を記述する理論的提案を述べる。 また,この物理現象を記述する擬似密度行列の相関をトモグラフィーで再現する光学的手法のシミュレーションを用いて,この理論の実験的実証を行った。

Pseudo-density matrices are a generalisation of quantum states and do not obey monogamy of quantum correlations. Could this be the solution to the paradox of information loss during the evaporation of a black hole? In this paper we discuss this possibility, providing a theoretical proposal to extend quantum theory with these pseudo-states to describe the statistics arising in black-hole evaporation. We also provide an experimental demonstration of this theoretical proposal, using a simulation in optical regime, that tomographically reproduces the correlations of the pseudo-density matrix describing this physical phenomenon.
翻訳日:2023-06-03 07:08:58 公開日:2020-02-18
# 選挙中の政治指導者の視認性と一般選挙の結果との関係 スペインにおける事例研究

Relationship between the visibility of political leaders during campaign and the outcome in general elections. A case study for Spain ( http://arxiv.org/abs/2002.07768v1 )

ライセンス: Link先を確認
J. Estevez, JJ. Dominguez, M. Gra\~na(参考訳) 本稿では、2019年11月の総選挙において、13のオンライン新聞からなるメディアがスペイン右翼党(vox)の選挙結果を高めたという証拠を見出した。 我々は、2019年11月1日から10日までの選挙運動において、これらのメディアで言及されている政党や指導者について検討する。

In this article, the authors find the evidence that media coverage consisting of 13 online newspapers enhanced the electoral results of right wing party in Spain (Vox) during general elections in November 2019. We consider the political parties and leaders mentions in these media during the electoral campaign from 1st to 10th November 2019, and only visibility or prominence dimension is necessary for the evidence.
翻訳日:2023-06-03 07:03:07 公開日:2020-02-18
# 定在波キャビティモードに結合した原子のマスク状態

Masked states of an atom coupled to a standing-wave cavity mode ( http://arxiv.org/abs/2002.07743v1 )

ライセンス: Link先を確認
R. Guti\'errez-J\'auregui(参考訳) 三次元周期プロファイルを表示するキャビティモードに結合した原子の固有状態の形状を得る。 量子化運動は、原子の自由度がマスキングされた縮退状態、すなわち、この複合系の1つの成分が検出されると、他の成分が絡み合っている状態となることが示されている。 システムが駆動と散逸を含むように拡張されると、臨界駆動振幅で散逸性量子相転移が実行される。 文献で報告されている他の相転移とは異なり、縮退は電磁場の検出時に不整合状態の重ね合わせでシステムを準備する。 フィールドの探索は、状態のマスキングのため、原子のコヒーレンスが長期間存続できる遷移点以上の順序を暗示する。

The form of the eigenstates of an atom coupled to a cavity mode displaying a three dimensional periodic profile are obtained. It is shown that the quantized motion leads to degenerate states where the atomic degrees of freedom are masked, that is, upon detection of one component of this composite system the others remain in an entangled state. When the system is extended to include drive and dissipation it is found to undergo a dissipative quantum phase transition at a critical drive amplitude. Unlike other phase transitions reported in the literature, the degeneracy prepares the system in a superposition of incompatible states upon detection of the electromagnetic field. Probing the field hints at an order above the transition point that, due to state masking, allows for atomic coherence to survive at long times.
翻訳日:2023-06-03 07:02:50 公開日:2020-02-18
# デジタル時代の人工的知性倫理 : 工学的倫理的枠組みの提案

Artificial Intelligent Ethics in the Digital Era: an Engineering Ethical Framework Proposal ( http://arxiv.org/abs/2002.07734v1 )

ライセンス: Link先を確認
Esteban Garc\'ia-Cuesta(参考訳) 現在、テクノロジーは私たちの生活のあらゆる面で採用されており、業界における最も重要な変革の原動力の1つです。 さらに、私たちが日々使っているシステムやデジタルサービスは、社会的または個人の振る舞いをモデル化できる人工知能技術に依存しており、それによって個人的決定や行動も変更される。 本稿では、技術的観点から、信頼の促進や、人工知能の適切な活用による社会的利益の確保など、いくつかの重要な課題について、簡潔に論じる。 この目標を達成するために、我々は、設計によって実際のエンジニアリング倫理を開発するための共通のコンテキストを定義する最初の試みとして、ジェネリック倫理的技術的枠組みを提案する。 この最初の提案がアーリーアダプター、特に標準化チームに役立つことを願っています。

Nowadays technology is being adopted on every aspect of our lives and it is one of most important transformation driver in industry. Moreover, many of the systems and digital services that we use daily rely on artificial intelligent technology capable of modeling social or individual behaviors that in turns also modify personal decisions and actions. In this paper, we briefly discuss, from a technological perspective, a number of critical issues including the purpose of promoting trust and ensure social benefit by the proper use of Artificial Intelligent Systems. To achieve this goal we propose a generic ethical technological framework as a first attempt to define a common context towards developing real engineering ethical by design. We hope that this initial proposal to be useful for early adopters and especially for standardization teams.
翻訳日:2023-06-03 07:02:38 公開日:2020-02-18
# 非相反超電導回路におけるハードウェアエンコーディンググリッド状態

Hardware-Encoding Grid States in a Non-Reciprocal Superconducting Circuit ( http://arxiv.org/abs/2002.07718v1 )

ライセンス: Link先を確認
Martin Rymarz, Stefano Bosco, Alessandro Ciani, David P. DiVincenzo(参考訳) 本稿では,非相互デバイスと,接地空間が2倍縮退し,接地状態がGottesman-Kitaev-Preskill(GKP)符号の近似符号であるジョセフソン接合からなる回路設計について述べる。 本研究では,2次元平面に閉じ込められた単一電子の問題と,強磁場と周期電位の影響について,回路の等価性を検討することにより,回路の低エネルギーダイナミクスを決定する。 この回路は、電荷やフラックスノイズなどの超伝導回路の一般的なノイズチャネルに対して自然に保護されており、パッシブ量子誤差補正に使用できることを示唆している。 また, 実験的な実現のための現実的な設計パラメータを提案するとともに, 1 および 2 量子ビットゲート, 状態準備, 読み出しを行うプロトコルについて述べる。

We present a circuit design composed of a non-reciprocal device and Josephson junctions whose ground space is doubly degenerate and the ground states are approximate codewords of the Gottesman-Kitaev-Preskill (GKP) code. We determine the low-energy dynamics of the circuit by working out the equivalence of this system to the problem of a single electron confined in a two-dimensional plane and under the effect of strong magnetic field and of a periodic potential. We find that the circuit is naturally protected against the common noise channels in superconducting circuits, such as charge and flux noise, implying that it can be used for passive quantum error correction. We also propose realistic design parameters for an experimental realization and we describe possible protocols to perform logical one- and two-qubit gates, state preparation and readout.
翻訳日:2023-06-03 07:01:57 公開日:2020-02-18
# 光学結晶中の荷電粒子波動関数の時間発展:プラズマベースの陽子ビームに対するコヒーレント・カピツァ・ディラック効果

Time evolution of charged particle wave functions in optical crystal: The coherent Kapitza-Dirac effect for plasma-based proton beams ( http://arxiv.org/abs/2002.07710v1 )

ライセンス: Link先を確認
Sushanta Barman and Sudeep Bhattacharjee(参考訳) 一次元の無限二乗井戸に閉じ込められた光学結晶の電顕的ポテンシャルに対する定常固有値と固有値を求める。 ガウス粒子として取り込まれた粒子の初期状態は、池の運動電位の定常固有状態に基づいて拡張され、光結晶との相互作用中に粒子の波動関数のその後の時間進化が得られる。 確率密度の時間発展の結果から, 粒子は横方向の等距離位置で局在し, 回折パターンが導かれることがわかった。 回折パターンの時間的進化を分析する。 そこで, マイクロ波プラズマを用いた陽子ビームシステムの回折パターンを観察するために, 実験パラメータを最適化した陽子ビームの回折について検討した。 この観測は陽子ベースの物質波干渉計の設計に重要である。

The stationary eigenstates and eigenvalues for the ponderomotive potential of an optical crystal confined in a one-dimensional infinite square well are numerically obtained. The initial states of the incoming particles taken as Gaussian, are expanded in the basis of the stationary eigenstates of the ponderomotive potential, to obtain the subsequent time evolution of the wave function of the particle during the interaction with the optical crystal. From the results of the time evolution of the probability density, it is observed that the particles get localized at equidistant positions in the transverse direction, which results in the diffraction pattern. The temporal evolution of the diffraction pattern is analyzed. As an application, the diffraction of proton beams is studied, where the experimental parameters are optimized to observe the diffraction pattern for a microwave plasma-based proton beam system. The observations are important for design of proton based matter-wave interferometers.
翻訳日:2023-06-03 07:01:35 公開日:2020-02-18
# 非線形開量子系の非平衡ダイナミクスからのゆらぎ-散逸関係

Fluctuation-Dissipation Relation from the Nonequilibrium Dynamics of a Nonlinear Open Quantum System ( http://arxiv.org/abs/2002.07694v1 )

ライセンス: Link先を確認
Jen-Tsung Hsiang, Bei-Lok Hu(参考訳) ゆらぎ散逸関係(FDR)が開量子系の非平衡力学(線形応答理論から従来のFDRを超越した)の文脈で現れる場合、我々は非ガウス系に転換し、この問題をスカラー量子バスと相互作用する無調波発振器として検討する。 本稿では,無調和発振器と熱浴のエネルギー交換率(エネルギー)に関する一般式(非摂動式)を提案する。 安定な最終平衡状態が存在し、非調和振動子の2点関数の非定常成分がパワーバランスの評価に無視的な寄与を持つ場合、平衡が非調和振動子のFDRを意味することを非摂動的に示すことができる。 次に、弱いアンハーモニック振動子を用いて、これらの2つの仮定が、我々の1次摂動結果に従って本当に満足できることを示す:開系ダイナミクスの緩和後に純エネルギー交換は消滅し、平衡状態は後期に存在する。

Continuing our inquiry into the conditions when fluctuation-dissipation relations (FDR) may appear in the context of nonequilibrium dynamics of open quantum systems (over and beyond the conventional FDR from linear response theory) we turn to nonGaussian systems and consider this issue for an anharmonic oscillator interacting with a scalar quantum field bath. We present the general {nonperturbative} expressions for the rate of energy (power) exchange between the anharmonic oscillator and the thermal bath. For the cases that a stable final equilibrium state exists, and the nonstationary components of the two-point functions of the anharmonic oscillator have negligible contributions to the evaluation of the power balance, we can show nonperturbatively that equilibration implies an FDR for the anharmonic oscillator. We then use a weakly anharmonic oscillator as an example to illustrate that those two assumptions indeed are satisfied according to our first-order perturbative results: that the net energy exchange vanishes after relaxation in the open system dynamics and an equilibrium state exists at late times.
翻訳日:2023-06-03 07:00:10 公開日:2020-02-18
# 非コヒーレント照明下での光化学ダイナミクス:自己組織化分子j-アグリゲーションによる光収穫

Photochemical dynamics under incoherent illumination: light harvesting in self-assembled molecular J-aggregates ( http://arxiv.org/abs/2002.08896v1 )

ライセンス: Link先を確認
Luis Felipe Morales-Curiel and Roberto de J. Le\'on-Montiel(参考訳) 有機合成分子j-アグリゲーションにおける輸送現象は、新しい有機太陽電池デバイスの設計において潜在的に重要な役割を担っているため、長い間多くの注目を集めてきた。 励起子はコヒーレントレーザー光源によって誘導されるか、特定のクロモフォア上の局所励起によって初期化されるという仮定の下で、j-アグリゲーションにおける励起子エネルギー移動を記述する多くの理論的および実験的研究が行われている。 しかしながら、これらの仮定は、特に有機太陽電池の構成要素として、J-アグリゲートの効率を評価するための正確な説明を与えていない。 自然条件下では、j-アグリゲーションは(太陽光のように)一貫性のない光源となり、単一の分子ではなく光合成複合体全体を照らす。 本研究は, 自己組織化分子集合体における光合成エネルギー輸送の効率に関する最初の研究である。 シアン染料j-アグリゲーゼの最小限のモデルを用いて,アグリゲーションを非コヒーレント光で励起すると長距離輸送効率が向上することを示す。 この結果から,高効率な有機太陽電池など,長距離無干渉励起子輸送が望まれるデバイスにおいて,j-アグリゲーションは極めて優れた候補であることが示唆された。

Transport phenomena in organic, self-assembled molecular J-aggregates have long attracted a great deal of attention due to its potential role in designing novel organic photovoltaic devices. A large number of theoretical and experimental studies have been carried out describing excitonic energy transfer in J-aggregates under the assumption that excitons are induced by a coherent laser-light source or initialized by a localized excitation on a particular chromophore. However, these assumptions may not provide an accurate description to assess the efficiency of J-aggregates, particularly as building blocks of organic solar cells. In natural conditions, J-aggregates would be subjected to an incoherent source of light (as is sunlight), which would illuminate the whole photosynthetic complex rather than a single molecule. In this work, we present the first study of the efficiency of photosynthetic energy transport in self-assembled molecular aggregates under incoherent sunlight illumination. By making use of a minimalistic model of a cyanine dye J-aggregate, we demonstrate that long-range transport efficiency is enhanced when exciting the aggregate with incoherent light. Our results thus support the conclusion that J-aggregates are indeed excellent candidates for devices where efficient long-range incoherently-induced exciton transport is desired, such as in highly efficient organic solar cells.
翻訳日:2023-06-03 06:51:50 公開日:2020-02-18
# 任意の励起プロファイルを持つ効率的な集団インバージョンのためのユニバーサル複合パルス

Universal Composite Pulses for Efficient Population Inversion with an Arbitrary Excitation Profile ( http://arxiv.org/abs/2002.08321v1 )

ライセンス: Link先を確認
Genko T. Genov, Marcel Hain, Nikolay V. Vitanov, and Thomas Halfmann(参考訳) 広帯域複合パルス列の励起プロファイルを任意に回転させて高密度集団インバージョンを実現する手法を提案する。 これらのパルスは、実験パラメータ(例えば、パルス振幅、パルス持続時間、共鳴からの減衰、スタークシフト、望ましくない周波数チャープなど)における偏差を補償し、任意のパルス形状に適用できる。 この回転により、パルス領域の任意の組み合わせに対する高次ロバスト性およびデチューニング誤差を追加コストなしで達成することができる。 後者は特に有用であり、例えば、デチューニングエラーが適用フィールドのパワーと相関するスタークシフトによって引き起こされる場合などである。 我々は、これらの複合パルスの効率性と普遍性を、$\text{Pr}^{3+}\text{:}\text{Y}_2\text{SiO}_5\:$クリスタルで原子コヒーレンスを表現するための実験的実装により示す。

We introduce a method to rotate arbitrarily the excitation profile of universal broadband composite pulse sequences for robust high-fidelity population inversion. These pulses compensate deviations in any experimental parameter (e.g. pulse amplitude, pulse duration, detuning from resonance, Stark shifts, unwanted frequency chirp, etc.) and are applicable with any pulse shape. The rotation allows to achieve higher order robustness to any combination of pulse area and detuning errors at no additional cost. The latter can be particularly useful, e.g., when detuning errors are due to Stark shifts that are correlated with the power of the applied field. We demonstrate the efficiency and universality of these composite pulses by experimental implementation for rephasing of atomic coherences in a $\text{Pr}^{3+}\text{:}\text{Y}_2\text{SiO}_5\:$ crystal.
翻訳日:2023-06-03 06:51:27 公開日:2020-02-18
# 光学系外におけるホーキング放射

Hawking radiation in optics and beyond ( http://arxiv.org/abs/2002.07907v1 )

ライセンス: Link先を確認
Raul Aguero-Santacruz and David Bermudez(参考訳) ホーキング放射はもともと天体物理学で提案されたが、アナログホーキング放射の名で他の物理系に一般化・拡張された。 過去20年間、実験室で測定するためのいくつかの試みが行われ、最も成功したシステムの一つが光学である。 誘電体材料で相互作用する光はアナログホーキング効果を引き起こすが、実際にはその刺激されたバージョンはすでに検出されており、自発的な信号の探索は進行中である。 ホーキング放射の一般導出を概観し, 光学的類似性に着目し, 新たな数値計算結果を提示した。 最後に、ホーキング放射という用語の一般化を求める。

Hawking radiation was originally proposed in astrophysics, but it has been generalized and extended to other physical systems receiving the name of analogue Hawking radiation. In the last two decades, several attempts have been made to measure it in a laboratory, one of the most successful systems is in optics. Light interacting in a dielectric material causes an analogue Hawking effect, in fact, its stimulated version has already been detected and the search for the spontaneous signal is currently ongoing. We briefly review the general derivation of Hawking radiation, then we focus on the optical analogue and present some novel numerical results. Finally, we call for a generalization of the term Hawking radiation.
翻訳日:2023-06-03 06:50:59 公開日:2020-02-18
# 米国大統領演説における経済内容の相互接続性

The interconnectedness of the economic content in the speeches of the US Presidents ( http://arxiv.org/abs/2002.07880v1 )

ライセンス: Link先を確認
Matteo Cinelli, Valerio Ficcadenti, Jessica Riccioni(参考訳) 影響力のある政治家による演説は、国家の将来に決定的な影響を与える可能性がある。 特に、こうした演説の経済内容は、各国の経済とその金融市場に影響を与える。 このため、ジョージ・ワシントン(1789年4月)からドナルド・トランプ(2017年2月)までの45人のアメリカ合衆国大統領が述べた951の演説の経済内容を含む、新しいデータセットを調査した。 その際,テキストマイニング技術を用いて経済用語集を運営している。 本研究の目的は,大統領演説の経済的内容から得られるネットワーク内の重要な相互接続の構造を検討することである。 このようなネットワークでは、ノードは会話によって表現され、コサインの類似性の値によってリンクされる。 結果として得られるネットワークは、コア(すなわち、高度中央および密結合されたノードの集合)と周辺(すなわち、非中央および疎結合ノードの集合)からなる特異な構造を示す。 大統領が採用した異なる経済辞書の存在は、中核周辺構造を特徴づけている。 ネットワークのコアに属する大統領は、"関心"や"取引"のような一般的な(非技術的な)経済ロカットの使用を共有している。 より技術的で頻度の低い用語の使用は周辺を特徴づける(例えば "yield" など)。 さらに、時間に近いスピーチは共通の経済辞書を共有します。 これらの結果は、アメリカのブームと危機の期間における経済用語学の用法とともに、大統領演説間の経済内容の関係に関するユニークな洞察を提供する。

The speeches stated by influential politicians can have a decisive impact on the future of a country. In particular, the economic content of such speeches affects the economy of countries and their financial markets. For this reason, we examine a novel dataset containing the economic content of 951 speeches stated by 45 US Presidents from George Washington (April 1789) to Donald Trump (February 2017). In doing so, we use an economic glossary carried out by means of text mining techniques. The goal of our study is to examine the structure of significant interconnections within a network obtained from the economic content of presidential speeches. In such a network, nodes are represented by talks and links by values of cosine similarity, the latter computed using the occurrences of the economic terms in the speeches. The resulting network displays a peculiar structure made up of a core (i.e. a set of highly central and densely connected nodes) and a periphery (i.e. a set of non-central and sparsely connected nodes). The presence of different economic dictionaries employed by the Presidents characterize the core-periphery structure. The Presidents' talks belonging to the network's core share the usage of generic (non-technical) economic locutions like "interest" or "trade". While the use of more technical and less frequent terms characterizes the periphery (e.g. "yield" ). Furthermore, the speeches close in time share a common economic dictionary. These results together with the economics glossary usages during the US periods of boom and crisis provide unique insights on the economic content relationships among Presidents' speeches.
翻訳日:2023-06-03 06:50:25 公開日:2020-02-18
# 量子相転移における仕事統計

Work statistics across a quantum phase transition ( http://arxiv.org/abs/2002.07860v1 )

ライセンス: Link先を確認
Zhaoyu Fei, Nahuel Freitas, Vasco Cavina, H. T. Quan, Massimiliano Esposito(参考訳) 断熱摂動理論を用いて、量子相転移のクエンチ中に行われた仕事の統計について検討する。 作業の累積は, 平均欠陥密度に対するkibble-zurekスケーリングに類似した普遍的スケーリング挙動を示すことが示された。 2種類の変換が考慮され、臨界点を横切る2つのギャップのある位相間の待ち時間と、臨界点近くで終わる待ち時間である。 欠陥密度のスケーリング挙動とは対照的に, この2種類のクエンチでは, ワーク累積体のスケーリング挙動が定性的に異なることが示されている。 しかしながら、どちらの場合も対応する指数は、従来のキブル・ズレック機構(KZM)のように、系の次元と遷移の臨界指数によって完全に決定される。 そこで本研究では、量子相転移の非平衡ダイナミクスに関する理解を深め、KZMの作業統計へのインプリントを明らかにする。

We investigate the statistics of the work performed during a quench across a quantum phase transition using the adiabatic perturbation theory. It is shown that all the cumulants of work exhibit universal scaling behavior analogous to the Kibble-Zurek scaling for the average density of defects. Two kinds of transformations are considered: quenches between two gapped phases in which a critical point is traversed, and quenches that end near the critical point. In contrast to the scaling behavior of the density of defects, the scaling behavior of the work cumulants are shown to be qualitatively different for these two kinds of quenches. However, in both cases the corresponding exponents are fully determined by the dimension of the system and the critical exponents of the transition, as in the traditional Kibble-Zurek mechanism (KZM). Thus, our study deepens our understanding about the nonequilibrium dynamics of a quantum phase transition by revealing the imprint of the KZM on the work statistics.
翻訳日:2023-06-03 06:49:49 公開日:2020-02-18
# 強駆動型ランダム双極子磁石の量子力学

Quantum dynamics in strongly driven random dipolar magnets ( http://arxiv.org/abs/2002.07834v1 )

ライセンス: Link先を確認
M. Buchhold, C. S. Tang, D. M. Silevitch, T. F. Rosenbaum, G. Refael(参考訳) ランダム双極磁石LiHo$_x$Y$_{1-x}$F$_4$は、x<0.05$の小さなHo$^{3+}$濃度に対して強いフラストレーション状態に入る。 この状態において、Ho$^{3+}=イオンの磁気モーメントは、LiHo$_x$Y$_{1-x}$F$_4$の共通イジング近似に対する小さな量子補正を経験し、これは、Z_2$対称性の破れと異なる固有状態間のエネルギーシフトを小さな縮退させる。 この結果から, liho$_x$y$_{1-x}$f$_4$の強磁場モーメントの磁化率において, ほぼ縮退する2つの励起経路間の破壊的干渉がスペクトルホールを燃やすことがわかった。 ファノ共鳴(英語版)によって顕微鏡的に記述されたこのような感受性のスペクトルホールは、駆動レベルスキームがパラダイム的な$\Lambda$-shapeを持つような2、3つのフラストレーションモーメントのセットアップで既に起こりうる。 大きな磁気モーメントのクラスターに対して、対応するレベルスキームは、それらの遷移行列要素が無視できるほど小さいか、遷移のエネルギー差がドライブに強いオフ共鳴であるという意味で、ほぼ孤立した多体$\lambda$-スキームに分離される。 これにより、熱力学的極限における共通イジング近似に対する多体量子補正によるファノ共鳴の観測が可能になる。 本稿では,その駆動強度と周波数依存性,および格子の散逸が果たす重要な役割について考察する。

The random dipolar magnet LiHo$_x$Y$_{1-x}$F$_4$ enters a strongly frustrated regime for small Ho$^{3+}$ concentrations with $x<0.05$. In this regime, the magnetic moments of the Ho$^{3+}$ ions experience small quantum corrections to the common Ising approximation of LiHo$_x$Y$_{1-x}$F$_4$, which lead to a $Z_2$-symmetry breaking and small, degeneracy breaking energy shifts between different eigenstates. Here we show that destructive interference between two almost degenerate excitation pathways burns spectral holes in the magnetic susceptibility of strongly driven magnetic moments in LiHo$_x$Y$_{1-x}$F$_4$. Such spectral holes in the susceptibility, microscopically described in terms of Fano resonances, can already occur in setups of only two or three frustrated moments, for which the driven level scheme has the paradigmatic $\Lambda$-shape. For larger clusters of magnetic moments, the corresponding level schemes separate into almost isolated many-body $\Lambda$-schemes, in the sense that either the transition matrix elements between them are negligibly small or the energy difference of the transitions is strongly off-resonant to the drive. This enables the observation of Fano resonances, caused by many-body quantum corrections to the common Ising approximation also in the thermodynamic limit. We discuss its dependence on the driving strength and frequency as well as the crucial role that is played by lattice dissipation.
翻訳日:2023-06-03 06:49:34 公開日:2020-02-18
# 機械学習環境における個人用Mバンドウェーブレット機構

Differentially Private M-band Wavelet-Based Mechanisms in Machine Learning Environments ( http://arxiv.org/abs/2001.00012v2 )

ライセンス: Link先を確認
Kenneth Choi and Tony Lee(参考訳) 産業後の世界では、デジタルデータのプライバシに関して、データサイエンスとアナリティクスが重要視されている。 アクセス可能なデータセットのプライバシを確立する不適切な方法は、相手がユーザの予備知識を少量持っている場合でも、大量のユーザデータを侵害することができる。 多くの研究者が、機械学習に適用するためのデータの統計的整合性を維持する高いレベルのプライバシー保護メカニズムを開発してきた。 近年,Laplace や Privelet のメカニズムのような差分プライバシーの発達により,敵がデータセット内の要素を識別し,ユーザ情報を抽出する可能性が大幅に低下している。 本稿では,データにノイズを埋め込む離散Mバンドウェーブレット変換を用いた3つのプライバシー保護機構を開発する。 最初の2つの方法(LSとLS+)は、Laplace-Sigmoid分布を通してノイズを付加し、Laplace-Distributed値とSigmoid関数を乗算し、第3の方法は擬似量子ステガノグラフィーを用いてデータにノイズを埋め込む。 そこで我々は,機械学習環境における統計的解析により,差分プライバシーと学習可能性の両方を維持できることを実証した。

In the post-industrial world, data science and analytics have gained paramount importance regarding digital data privacy. Improper methods of establishing privacy for accessible datasets can compromise large amounts of user data even if the adversary has a small amount of preliminary knowledge of a user. Many researchers have been developing high-level privacy-preserving mechanisms that also retain the statistical integrity of the data to apply to machine learning. Recent developments of differential privacy, such as the Laplace and Privelet mechanisms, drastically decrease the probability that an adversary can distinguish the elements in a data set and thus extract user information. In this paper, we develop three privacy-preserving mechanisms with the discrete M-band wavelet transform that embed noise into data. The first two methods (LS and LS+) add noise through a Laplace-Sigmoid distribution that multiplies Laplace-distributed values with the sigmoid function, and the third method utilizes pseudo-quantum steganography to embed noise into the data. We then show that our mechanisms successfully retain both differential privacy and learnability through statistical analysis in various machine learning environments.
翻訳日:2023-01-17 02:23:20 公開日:2020-02-18
# スパイク共分散モデルにおける最小二乗最小ノルム推定器のリスク

Risk of the Least Squares Minimum Norm Estimator under the Spike Covariance Model ( http://arxiv.org/abs/1912.13421v2 )

ライセンス: Link先を確認
Yasaman Mahdaviyeh, Zacharie Naulet(参考訳) d$ のパラメータ数が $n$ と $\frac{d}{n} \rightarrow \infty$ に依存する場合の最小ノルム線形最小二乗推定器のリスクについて検討する。 データはスパイク共分散行列(spike covariance matrices)に制限され、固定された有限個の固有値が n$ で成長し、(漸近的に)同じ順序の他の固有値よりもはるかに大きい、という基礎となる低ランク構造を持つと仮定する。 この設定では、最小ノルム最小二乗推定器のリスクは、ヌル推定器のリスクと比較して消える。 我々は,このリスクに対して漸近的かつ非漸近的な上限を与えるとともに,スパイクモデルの仮定を活用して,従来の作品と比較してより厳密な境界となるバイアスの分析を行う。

We study risk of the minimum norm linear least squares estimator in when the number of parameters $d$ depends on $n$, and $\frac{d}{n} \rightarrow \infty$. We assume that data has an underlying low rank structure by restricting ourselves to spike covariance matrices, where a fixed finite number of eigenvalues grow with $n$ and are much larger than the rest of the eigenvalues, which are (asymptotically) in the same order. We show that in this setting risk of minimum norm least squares estimator vanishes in compare to risk of the null estimator. We give asymptotic and non asymptotic upper bounds for this risk, and also leverage the assumption of spike model to give an analysis of the bias that leads to tighter bounds in compare to previous works.
翻訳日:2023-01-16 20:25:23 公開日:2020-02-18
# ブラウン等を用いた2ビット交絡状態の雑音環境における決定論的階層的リモート状態生成

Deterministic hierarchical remote state preparation of a two-qubit entangled state using Brown et al. state in a noisy environment ( http://arxiv.org/abs/2001.00574v2 )

ライセンス: Link先を確認
Subhashish Barik, Aakash Warke, Bikash K. Behera, and Prasanta K. Panigrahi(参考訳) 量子通信は現在、リモート状態準備(RSP)の計画が研究者の注目を集めている最先端の研究分野の1つである。 RSPのいくつかの異なるスキームはすでに提案されている。 本稿では,Brown等から派生した7ビット高絡み合い状態を用いて,2ビットの絡み合い状態を送信する階層的RSPプロトコルを提案する。 また、このプロトコルで使用される量子通信チャネルに影響を与える振幅減衰(AD)と位相減衰(PD)という2つのよく知られたノイズモデルの効果について検討した。 ノイズ演算子及び受信機に対する状態の忠実度の変化についての調査を行う。 PDノイズはADノイズや高電力受信機よりも忠実度に影響し、ノイズの影響下で低電力受信機よりも忠実度の高い状態が得られる。 我々の知る限り、これまで提案された全てのRSPプロトコルと比較して、高出力受信機において高い忠実性、最大ADノイズの有無で0.89、最大PDノイズの有無で0.72を達成したと信じている。 ノイズの研究は、通信プロトコルへのノイズモデルの適用をよりよく理解するために、非常に教育的な方法で記述される。

Quantum communication is one of the cutting-edge research areas today, where the scheme of Remote State Preparation (RSP) has caught significant attention of researchers. A number of different schemes of RSP have already been proposed so far. We propose here a hierarchical RSP protocol for sending a two-qubit entangled state using a seven-qubit highly entangled state derived from Brown et al. state. We have also studied here the effects of two well known noise models namely amplitude damping (AD) and phase damping (PD) that affect the quantum communication channel used for the protocol. An investigation on the variation of fidelity of the state with respect to the noise operator and the receiver is made. PD noise is found to affect the fidelity more than the AD noise and the higher power receiver, obtains the state with higher fidelity than the lower power receiver under the effect of noise. To the best of our knowledge, we believe that we have achieved the highest fidelity for the higher power receiver, 0.89 in the presence of maximum AD noise and 0.72 in the presence of maximum PD noise, compared to all the previously proposed RSP protocols in noisy environments. The study of noise is described in a very pedagogical manner for better understanding of the application of noise models to a communication protocol.
翻訳日:2023-01-16 09:38:26 公開日:2020-02-18
# reformer: 効率的なトランスフォーマー

Reformer: The Efficient Transformer ( http://arxiv.org/abs/2001.04451v2 )

ライセンス: Link先を確認
Nikita Kitaev, {\L}ukasz Kaiser, Anselm Levskaya(参考訳) 大規模なトランスフォーマーモデルは、日常的に多くのタスクで最新の結果を達成するが、これらのモデルのトレーニングは、特に長いシーケンスにおいて、非常にコストがかかる。 変圧器の効率を向上させる2つの技術を紹介する。 例えば、ドット積の注意を局所性に敏感なハッシュを用いて置き換え、O($L^2$) から O($L\log L$) へ複雑さを変化させる。 さらに、標準的な残余ではなく可逆的な残余層を使用します。これは、$N$倍ではなく、トレーニングプロセスで1回だけアクティベーションを保存できます。 結果のモデルであるReformerはTransformerモデルと同等に動作し、長いシーケンスでははるかにメモリ効率が高く、はるかに高速である。

Large Transformer models routinely achieve state-of-the-art results on a number of tasks but training these models can be prohibitively costly, especially on long sequences. We introduce two techniques to improve the efficiency of Transformers. For one, we replace dot-product attention by one that uses locality-sensitive hashing, changing its complexity from O($L^2$) to O($L\log L$), where $L$ is the length of the sequence. Furthermore, we use reversible residual layers instead of the standard residuals, which allows storing activations only once in the training process instead of $N$ times, where $N$ is the number of layers. The resulting model, the Reformer, performs on par with Transformer models while being much more memory-efficient and much faster on long sequences.
翻訳日:2023-01-11 22:22:02 公開日:2020-02-18
# ノイズ量子ウォークのための機械学習転送効率

Machine learning transfer efficiencies for noisy quantum walks ( http://arxiv.org/abs/2001.05472v2 )

ライセンス: Link先を確認
Alexey A. Melnikov and Leonid E. Fedichkin and Ray-Kuang Lee and Alexander Alodjants(参考訳) 量子効果はネットワーク間の粒子移動において有利であることが知られている。 この利点を達成するためには、グラフタイプと量子システムコヒーレンスの両方に対する要件を見出さなければならない。 ここでは、シミュレーション例から学習することで、これらの要件を見つけるプロセスが自動化可能であることを示す。 この自動化は、特定のタイプの畳み込みニューラルネットワークを使用して、どのネットワークで、どのコヒーレンス要求の量子優位性が可能かを学習する。 我々の機械学習アプローチは、異なるサイズのサイクルグラフ上のノイズの多い量子ウォークの研究に応用されている。 その結果、トレーニングセット外のグラフであっても、デコヒーレンスパラメータの範囲全体に対する量子アドバンテージの存在を予測できることが判明した。 我々の結果は、量子実験の利点を実証するために重要であり、科学的研究と発見の自動化への道を開く。

Quantum effects are known to provide an advantage in particle transfer across networks. In order to achieve this advantage, requirements on both a graph type and a quantum system coherence must be found. Here we show that the process of finding these requirements can be automated by learning from simulated examples. The automation is done by using a convolutional neural network of a particular type that learns to understand with which network and under which coherence requirements quantum advantage is possible. Our machine learning approach is applied to study noisy quantum walks on cycle graphs of different sizes. We found that it is possible to predict the existence of quantum advantage for the entire decoherence parameter range, even for graphs outside of the training set. Our results are of importance for demonstration of advantage in quantum experiments and pave the way towards automating scientific research and discoveries.
翻訳日:2023-01-11 05:38:38 公開日:2020-02-18
# グラディエントDescentによるユニタリの学習

Learning Unitaries by Gradient Descent ( http://arxiv.org/abs/2001.11897v3 )

ライセンス: Link先を確認
Bobak Toussi Kiani, Seth Lloyd, Reevu Maity(参考訳) 交互演算子列の時間パラメータの勾配降下を通じてu(d)$で学習するユニタリ変換の難しさについて検討する。 損失ランドスケープの非凸性にもかかわらず、シーケンスが$d^2$以上のパラメータを含む場合、勾配降下は常に対象ユニタリに収束する、という数値的な証拠を提供する。 収束率は「計算相転移」を意味する。 d^2$ 未満のパラメータでは勾配降下は準最適解に収束するが、$d^2$ 以上のパラメータでは勾配降下は指数関数的に最適解に収束する。

We study the hardness of learning unitary transformations in $U(d)$ via gradient descent on time parameters of alternating operator sequences. We provide numerical evidence that, despite the non-convex nature of the loss landscape, gradient descent always converges to the target unitary when the sequence contains $d^2$ or more parameters. Rates of convergence indicate a "computational phase transition." With less than $d^2$ parameters, gradient descent converges to a sub-optimal solution, whereas with more than $d^2$ parameters, gradient descent converges exponentially to an optimal solution.
翻訳日:2023-01-05 07:11:03 公開日:2020-02-18
# 衛星画像における物体検出による解釈可能な貧困マップの生成

Generating Interpretable Poverty Maps using Object Detection in Satellite Images ( http://arxiv.org/abs/2002.01612v2 )

ライセンス: Link先を確認
Kumar Ayush, Burak Uzkent, Marshall Burke, David Lobell, Stefano Ermon(参考訳) 正確な地域レベルの貧困測定は、政府や人道的組織にとって、生活の改善と不足した資源の分配に向けた進捗を追跡する上で不可欠なタスクである。 近年,衛星画像を用いて貧困を予測するコンピュータビジョンの進歩が進んでいるが,政策立案者に対して解釈可能な特徴は生み出さず,実践者による採用を阻害している。 本稿では,高分解能(30cm)衛星画像に物体検出器を適用することで,地域レベルでの貧困を正確に予測するための解釈可能な計算枠組みを示す。 対象物の重み付けを特徴として、ウガンダの村レベルの貧困を予測する0.539 Pearson's r^2を達成し、既存の(解釈不可能でない)ベンチマークよりも31%改善した。 特徴量とアブレーション分析は,対象数と貧困予測の直観的関係を明らかにする。 以上の結果から,少なくともこの重要な領域では,可読性は性能の犠牲を伴わないことが示唆された。

Accurate local-level poverty measurement is an essential task for governments and humanitarian organizations to track the progress towards improving livelihoods and distribute scarce resources. Recent computer vision advances in using satellite imagery to predict poverty have shown increasing accuracy, but they do not generate features that are interpretable to policymakers, inhibiting adoption by practitioners. Here we demonstrate an interpretable computational framework to accurately predict poverty at a local level by applying object detectors to high resolution (30cm) satellite images. Using the weighted counts of objects as features, we achieve 0.539 Pearson's r^2 in predicting village-level poverty in Uganda, a 31% improvement over existing (and less interpretable) benchmarks. Feature importance and ablation analysis reveal intuitive relationships between object counts and poverty predictions. Our results suggest that interpretability does not have to come at the cost of performance, at least in this important domain.
翻訳日:2023-01-03 21:39:08 公開日:2020-02-18
# RGB赤外人物再同定のためのクロスモダリティペア画像生成

Cross-Modality Paired-Images Generation for RGB-Infrared Person Re-Identification ( http://arxiv.org/abs/2002.04114v2 )

ライセンス: Link先を確認
Guan-An Wang, Tianzhu Zhang. Yang Yang, Jian Cheng, Jianlong Chang, Xu Liang, Zengguang Hou(参考訳) RGB-赤外線(IR)人物の再識別は、RGB画像とIR画像の間に大きな相違があるため、非常に困難である。 主要な解決策は、ブリッジRGBとIRモダリティに整列した機能を学ぶことである。 しかし、RGBとIR画像間の対応ラベルが欠如しているため、ほとんどの手法はRGBとIRセット間の距離を小さくすることで、セットレベルのアライメントによる変動を緩和しようとする。 しかし、このセットレベルのアライメントは、RGB-IR Re-IDの性能を制限するいくつかのインスタンスの誤調整につながる可能性がある。 本稿では,既存の手法と異なり,クロスモダリティなペアイメージを生成し,大域的な集合レベルときめ細かいインスタンスレベルのアライメントを行う。 提案手法にはいくつかのメリットがある。 まず,本手法はモダリティ特有の特徴とモダリティ不変特徴を分離することで,セットレベルアライメントを行うことができる。 従来の方法と比較して,モダリティ特有の特徴を明示的に取り除き,モダリティの変動を低減できる。 第2に,人物のクロスモダリティアンペア画像が与えられた場合,交換画像からクロスモダリティペア画像を生成することができる。 これにより、各画像の距離を最小化することで、インスタンスレベルのアライメントを直接実行できます。 2つの標準ベンチマークの広範な実験結果から、提案されたモデルは最先端の手法に好適であることが示された。 特に、SYSU-MM01データセットでは、ランク1とmAPで9.2%と7.7%のゲインが得られる。 コードはhttps://github.com/wangguanan/JSIA-ReIDで入手できる。

RGB-Infrared (IR) person re-identification is very challenging due to the large cross-modality variations between RGB and IR images. The key solution is to learn aligned features to the bridge RGB and IR modalities. However, due to the lack of correspondence labels between every pair of RGB and IR images, most methods try to alleviate the variations with set-level alignment by reducing the distance between the entire RGB and IR sets. However, this set-level alignment may lead to misalignment of some instances, which limits the performance for RGB-IR Re-ID. Different from existing methods, in this paper, we propose to generate cross-modality paired-images and perform both global set-level and fine-grained instance-level alignments. Our proposed method enjoys several merits. First, our method can perform set-level alignment by disentangling modality-specific and modality-invariant features. Compared with conventional methods, ours can explicitly remove the modality-specific features and the modality variation can be better reduced. Second, given cross-modality unpaired-images of a person, our method can generate cross-modality paired images from exchanged images. With them, we can directly perform instance-level alignment by minimizing distances of every pair of images. Extensive experimental results on two standard benchmarks demonstrate that the proposed model favourably against state-of-the-art methods. Especially, on SYSU-MM01 dataset, our model can achieve a gain of 9.2% and 7.7% in terms of Rank-1 and mAP. Code is available at https://github.com/wangguanan/JSIA-ReID.
翻訳日:2023-01-02 09:20:24 公開日:2020-02-18
# H&Eにおける多視野Cnnと注意Cnnの肝細胞癌における全スライディング画像の解析

Analysis Of Multi Field Of View Cnn And Attention Cnn On H&E Stained Whole-slide Images On Hepatocellular Carcinoma ( http://arxiv.org/abs/2002.04836v2 )

ライセンス: Link先を確認
Mehmet Burak Say{\i}c{\i}, Rikiya Yamashita, Jeanne Shen(参考訳) 肝細胞癌(hcc)は、がん関連死の主要な原因である。 HCCの診断にはガラススライドの走査法である全スライディングイメージングが用いられている。 畳み込みニューラルネットワークアプリケーションでは高解像度のWhole-Slide画像の使用は不可能である。 したがって、Whole-Slideイメージのタイリングは、分類とセグメンテーションのために畳み込みニューラルネットワークを割り当てる一般的な手法である。 タイルサイズの決定は、小さな視野では大きな視野では情報をキャプチャすることができず、大きな視野ではセルスケールでは情報をキャプチャできないため、アルゴリズムの性能に影響を及ぼす。 本研究では,タイルサイズが分類問題の性能に及ぼす影響を分析した。 さらに、ビューCNNのMulti Fieldは、異なるタイルサイズが提供する情報を活用するために割り当てられ、注意CNNは最も貢献するタイルサイズに投票する能力を与えるために割り当てられる。 タイルサイズが1つ以上の場合,分類性能は3.97%向上し,いずれのアルゴリズムも1つのタイルサイズのみを用いたアルゴリズムよりも成功していることがわかった。

Hepatocellular carcinoma (HCC) is a leading cause of cancer-related death worldwide. Whole-slide imaging which is a method of scanning glass slides have been employed for diagnosis of HCC. Using high resolution Whole-slide images is infeasible for Convolutional Neural Network applications. Hence tiling the Whole-slide images is a common methodology for assigning Convolutional Neural Networks for classification and segmentation. Determination of the tile size affects the performance of the algorithms since small field of view can not capture the information on a larger scale and large field of view can not capture the information on a cellular scale. In this work, the effect of tile size on performance for classification problem is analysed. In addition, Multi Field of View CNN is assigned for taking advantage of the information provided by different tile sizes and Attention CNN is assigned for giving the capability of voting most contributing tile size. It is found that employing more than one tile size significantly increases the performance of the classification by 3.97% and both algorithms are found successful over the algorithm which uses only one tile size.
翻訳日:2023-01-01 19:28:28 公開日:2020-02-18
# 部分観測可能な環境と限られた通信のためのR-MADDPG

R-MADDPG for Partially Observable Environments and Limited Communication ( http://arxiv.org/abs/2002.06684v2 )

ライセンス: Link先を確認
Rose E. Wang, Michael Everett, Jonathan P. How(参考訳) 自動運転車間の協調を含むマルチエージェント強化学習(MARL)アルゴリズムを適用することで、現実的なタスクがいくつかある。 現実の世界は、部分可観測性や非定常性といったマルチエージェント学習システムにとって困難な条件を持っている。 さらに、エージェントが限られたリソース(例えばネットワーク帯域幅)を共有しなければならない場合、リソースの使用を調整する方法を学ぶ必要がある。 本稿では, 部分観測可能な集合点と限られた通信条件下でのマルチエージェント協調処理のための, R-MADDPG (Deep Recurrent Multiagent-critic framework) を提案する。 エージェントチームのパフォーマンスとコミュニケーション利用に対する再発の影響について検討する。 得られたフレームワークは、欠落した観察の共有、リソース制限の処理、エージェント間の異なる通信パターンの開発のための時間依存性を学習する。

There are several real-world tasks that would benefit from applying multiagent reinforcement learning (MARL) algorithms, including the coordination among self-driving cars. The real world has challenging conditions for multiagent learning systems, such as its partial observable and nonstationary nature. Moreover, if agents must share a limited resource (e.g. network bandwidth) they must all learn how to coordinate resource use. This paper introduces a deep recurrent multiagent actor-critic framework (R-MADDPG) for handling multiagent coordination under partial observable set-tings and limited communication. We investigate recurrency effects on performance and communication use of a team of agents. We demonstrate that the resulting framework learns time dependencies for sharing missing observations, handling resource limitations, and developing different communication patterns among agents.
翻訳日:2022-12-31 18:16:04 公開日:2020-02-18
# 関節表現を用いたニューラルマシン翻訳

Neural Machine Translation with Joint Representation ( http://arxiv.org/abs/2002.06546v2 )

ライセンス: Link先を確認
Yanyang Li, Qiang Wang, Tong Xiao, Tongran Liu, Jingbo Zhu(参考訳) 統計機械翻訳(SMT)システムの初期の成功は、例えばアライメントのような2つのソースとターゲットユニット間の相互作用の明示的なモデリングによるものであるが、最近のニューラル機械翻訳(NMT)システムは、部分的に効率のために相互作用を符号化する注意を頼っている。 本稿では,それぞれのインタラクションを考慮に入れた共同表現手法を提案する。 提案した効率的な注意操作で表現を洗練することで効率の悪さを解消する。 The resulting Reformer models offer a new Sequence-to- Sequence modelling paradigm besides the Encoder-Decoder framework and outperform the Transformer baseline in either the small scale IWSLT14 German-English, English-German and IWSLT15 Vietnamese-English or the large scale NIST12 Chinese-English translation tasks by about 1 BLEU point.We also propose a systematic model scaling approach, allowing the Reformer model to beat the state-of-the-art Transformer in IWSLT14 German-English and NIST12 Chinese-English with about 50% fewer parameters. コードはhttps://github.com/lyy1994/reformerで公開されている。

Though early successes of Statistical Machine Translation (SMT) systems are attributed in part to the explicit modelling of the interaction between any two source and target units, e.g., alignment, the recent Neural Machine Translation (NMT) systems resort to the attention which partially encodes the interaction for efficiency. In this paper, we employ Joint Representation that fully accounts for each possible interaction. We sidestep the inefficiency issue by refining representations with the proposed efficient attention operation. The resulting Reformer models offer a new Sequence-to- Sequence modelling paradigm besides the Encoder-Decoder framework and outperform the Transformer baseline in either the small scale IWSLT14 German-English, English-German and IWSLT15 Vietnamese-English or the large scale NIST12 Chinese-English translation tasks by about 1 BLEU point.We also propose a systematic model scaling approach, allowing the Reformer model to beat the state-of-the-art Transformer in IWSLT14 German-English and NIST12 Chinese-English with about 50% fewer parameters. The code is publicly available at https://github.com/lyy1994/reformer.
翻訳日:2022-12-31 18:07:33 公開日:2020-02-18
# 最適輸送を用いた微分可能トップk演算子

Differentiable Top-k Operator with Optimal Transport ( http://arxiv.org/abs/2002.06504v2 )

ライセンス: Link先を確認
Yujia Xie, Hanjun Dai, Minshuo Chen, Bo Dai, Tuo Zhao, Hongyuan Zha, Wei Wei, Tomas Pfister(参考訳) トップk演算、すなわちスコアの集合からkの最大または最小の要素を見つけることは重要なモデル要素であり、情報検索、機械学習、データマイニングに広く使われている。 しかし、トップk演算が例えばバブルアルゴリズムを用いてアルゴリズム的に実装されている場合、得られるモデルは、一般的な勾配降下アルゴリズムを用いてエンドツーエンドで訓練することはできない。 これは、これらの実装は通常、勾配を計算できないインデックスのスワップを含むためである。 さらに、入力スコアからその要素がトップk集合に属するかどうかのインジケータベクトルへの対応するマッピングは本質的に不連続である。 そこで本研究では, SOFT (Scalable Optimal transport-based diFferenTiable) top-k operator というスムーズな近似法を提案する。 具体的には、私たちのSOFTトップk演算子は、エントロピー最適輸送(EOT)問題の解として、トップk演算の出力を近似する。 これにより、EOT問題の最適条件に基づいて、SOFT演算子の勾配を効率的に近似することができる。 提案した演算子をk-アネレスト近傍およびビーム探索アルゴリズムに適用し,性能向上を示す。

The top-k operation, i.e., finding the k largest or smallest elements from a collection of scores, is an important model component, which is widely used in information retrieval, machine learning, and data mining. However, if the top-k operation is implemented in an algorithmic way, e.g., using bubble algorithm, the resulting model cannot be trained in an end-to-end way using prevalent gradient descent algorithms. This is because these implementations typically involve swapping indices, whose gradient cannot be computed. Moreover, the corresponding mapping from the input scores to the indicator vector of whether this element belongs to the top-k set is essentially discontinuous. To address the issue, we propose a smoothed approximation, namely the SOFT (Scalable Optimal transport-based diFferenTiable) top-k operator. Specifically, our SOFT top-k operator approximates the output of the top-k operation as the solution of an Entropic Optimal Transport (EOT) problem. The gradient of the SOFT operator can then be efficiently approximated based on the optimality conditions of EOT problem. We apply the proposed operator to the k-nearest neighbors and beam search algorithms, and demonstrate improved performance.
翻訳日:2022-12-31 17:41:21 公開日:2020-02-18
# GANを用いた自動車内ソフトウェアテストのための時系列生成制御

Controlled time series generation for automotive software-in-the-loop testing using GANs ( http://arxiv.org/abs/2002.06611v2 )

ライセンス: Link先を確認
Dhasarathy Parthasarathy, Karl B\"ackstr\"om, Jens Henriksson and S\'olr\'un Einarsd\'ottir(参考訳) 自動車のメカトロニクスシステムをテストするには、部分的にはsoftware-in-the-loopアプローチを用いる。 現在、入力刺激には2つの主要な技術がある。 ひとつのアプローチは、テストプロセスの制御とフィードバックを容易にする入力シーケンスを作成することだが、現実的なシナリオにシステムを公開できない。 もうひとつは、現実を説明できるフィールド操作から記録されたシーケンスを再生するが、広く使われるには十分なキャパシティの十分なラベル付きデータセットを収集する必要がある。 この研究は、GAN(Generative Adversarial Networks)のよく知られた教師なし学習フレームワークを用いて、記録された車載信号のラベルなしデータセットを学習し、合成入力刺激の生成に使用する。 さらに、パラメータベースの線形補間アルゴリズムが示され、生成された刺激が特定の参照とカスタマイズ可能な類似性関係に従うことが保証される。 この組み合わせにより、多種多様な有意義で現実的な入力パターンを制御可能とし、仮想テストカバレッジを改善し、高価なフィールドテストの必要性を減らすことができる。

Testing automotive mechatronic systems partly uses the software-in-the-loop approach, where systematically covering inputs of the system-under-test remains a major challenge. In current practice, there are two major techniques of input stimulation. One approach is to craft input sequences which eases control and feedback of the test process but falls short of exposing the system to realistic scenarios. The other is to replay sequences recorded from field operations which accounts for reality but requires collecting a well-labeled dataset of sufficient capacity for widespread use, which is expensive. This work applies the well-known unsupervised learning framework of Generative Adversarial Networks (GAN) to learn an unlabeled dataset of recorded in-vehicle signals and uses it for generation of synthetic input stimuli. Additionally, a metric-based linear interpolation algorithm is demonstrated, which guarantees that generated stimuli follow a customizable similarity relationship with specified references. This combination of techniques enables controlled generation of a rich range of meaningful and realistic input patterns, improving virtual test coverage and reducing the need for expensive field tests.
翻訳日:2022-12-31 17:39:34 公開日:2020-02-18
# マルチビュー情報を用いたロバスト表現の学習

Learning Robust Representations via Multi-View Information Bottleneck ( http://arxiv.org/abs/2002.07017v2 )

ライセンス: Link先を確認
Marco Federici, Anjan Dutta, Patrick Forr\'e, Nate Kushman, Zeynep Akata(参考訳) 情報ボトルネック原理は、表示における他の過剰な情報量を最小限に抑えつつ、ラベルの予測に関連するすべての情報をエンコーダに保持するように訓練することにより、表現学習のための情報理論的な方法を提供する。 しかし、元の定式化では、過剰な情報を識別するためにラベル付きデータが必要である。 本研究では,この能力を,同一の実体の2つのビューが提供されるが,ラベルが不明なマルチビューアン教師付き設定に拡張する。 これにより、両方のビューで共有されていない余分な情報を識別することができます。 理論的解析により、MIR-FlickrデータセットのSketchyデータセットとラベル限定バージョンで最先端の結果を生成する新しいマルチビューモデルが定義される。 また、標準的なデータ拡張技術を活用し、表現学習における一般的な教師なしアプローチと比較して、より優れた一般化能力を示す。

The information bottleneck principle provides an information-theoretic method for representation learning, by training an encoder to retain all information which is relevant for predicting the label while minimizing the amount of other, excess information in the representation. The original formulation, however, requires labeled data to identify the superfluous information. In this work, we extend this ability to the multi-view unsupervised setting, where two views of the same underlying entity are provided but the label is unknown. This enables us to identify superfluous information as that not shared by both views. A theoretical analysis leads to the definition of a new multi-view model that produces state-of-the-art results on the Sketchy dataset and label-limited versions of the MIR-Flickr dataset. We also extend our theory to the single-view setting by taking advantage of standard data augmentation techniques, empirically showing better generalization capabilities when compared to common unsupervised approaches for representation learning.
翻訳日:2022-12-31 12:07:47 公開日:2020-02-18
# 機械学習による複合回路機能故障率の推定について

On the Estimation of Complex Circuits Functional Failure Rate by Machine Learning Techniques ( http://arxiv.org/abs/2002.09945v1 )

ライセンス: Link先を確認
Thomas Lange, Aneesh Balakrishnan, Maximilien Glorieux, Dan Alexandrescu, Luca Sterpone(参考訳) デレーティングや脆弱性要因は、今日の機能安全要件によって要求される障害分析作業の主要な特徴である。 シーケンシャル論理セルの機能的デレーティングを決定するには、通常計算集約的なフォールトインジェクションシミュレーションのキャンペーンが必要である。 本稿では,機械学習を用いて個々のフリップフロップの関数的デレートを推定し,故障注入の最適化と改善を行う新しい手法を提案する。 そこでまず, 静的要素(セル特性, 回路構造, 合成特性)と動的要素(信号活性)を組み合わせた解析手法により, インスタンスごとの特徴セットを記述し, 抽出する。 次に、第一原理故障シミュレーションアプローチにより参照データを得る。 最後に、参照データセットの一部が機械学習アルゴリズムのトレーニングに使われ、残りの部分はトレーニングされたツールの精度の検証とベンチマークに使用される。 目的は、古典的な手法で到達し難い回路インスタンスの全リストに対して、正確にインスタンスごとの機能的デレーティングデータを提供できる訓練されたモデルを得ることである。 提案手法には,各種機械学習モデルの性能を,異なるトレーニングサイズで決定する実践的な例が伴っている。

De-Rating or Vulnerability Factors are a major feature of failure analysis efforts mandated by today's Functional Safety requirements. Determining the Functional De-Rating of sequential logic cells typically requires computationally intensive fault-injection simulation campaigns. In this paper a new approach is proposed which uses Machine Learning to estimate the Functional De-Rating of individual flip-flops and thus, optimising and enhancing fault injection efforts. Therefore, first, a set of per-instance features is described and extracted through an analysis approach combining static elements (cell properties, circuit structure, synthesis attributes) and dynamic elements (signal activity). Second, reference data is obtained through first-principles fault simulation approaches. Finally, one part of the reference dataset is used to train the Machine Learning algorithm and the remaining is used to validate and benchmark the accuracy of the trained tool. The intended goal is to obtain a trained model able to provide accurate per-instance Functional De-Rating data for the full list of circuit instances, an objective that is difficult to reach using classical methods. The presented methodology is accompanied by a practical example to determine the performance of various Machine Learning models for different training sizes.
翻訳日:2022-12-30 20:55:07 公開日:2020-02-18
# 圧縮センシングのための制限構造ランダムマトリクス

Restricted Structural Random Matrix for Compressive Sensing ( http://arxiv.org/abs/2002.07346v1 )

ライセンス: Link先を確認
Thuong Nguyen Canh and Byeungwoo Jeon(参考訳) 圧縮センシング(CS)は、センシング、圧縮、セキュリティのユニークな機能(すなわち、CSの測定は等しく重要である)で有名である。 しかし、トレードオフがある。 事前信号情報によるセンシングと圧縮効率の向上は、特定の測定値を好む傾向があるため、セキュリティが低下する。 この研究は、新しいサンプリングマトリクスである制限構造ランダムマトリクス(rsrm)を用いて、セキュリティを損なうことなく、センシングと圧縮効率を向上させることを目的とした。 RSRMはフレームベースおよびブロックベースセンシングの利点と、それ以前の大域的滑らかさを統合した(低解像度信号は高い相関関係にある)。 RSRMは、低分解能信号(エネルギーに等しい)に制限された複数のランダムなサブサンプリング信号のランダムな投射(等しく重要な)による圧縮測定を取得し、その観測は同様に重要である。 RSRMは制限等尺性を満たすことが証明され、最近の最先端の圧縮センシングと深層学習に基づく手法と同等の再構成性能を示す。

Compressive sensing (CS) is well-known for its unique functionalities of sensing, compressing, and security (i.e. CS measurements are equally important). However, there is a tradeoff. Improving sensing and compressing efficiency with prior signal information tends to favor particular measurements, thus decrease the security. This work aimed to improve the sensing and compressing efficiency without compromise the security with a novel sampling matrix, named Restricted Structural Random Matrix (RSRM). RSRM unified the advantages of frame-based and block-based sensing together with the global smoothness prior (i.e. low-resolution signals are highly correlated). RSRM acquired compressive measurements with random projection (equally important) of multiple randomly sub-sampled signals, which was restricted to be the low-resolution signals (equal in energy), thereby, its observations are equally important. RSRM was proven to satisfies the Restricted Isometry Property and shows comparable reconstruction performance with recent state-of-the-art compressive sensing and deep learning-based methods.
翻訳日:2022-12-30 20:54:47 公開日:2020-02-18
# ロバスト中心型問題に対するコアセットに基づく戦略

Coreset-based Strategies for Robust Center-type Problems ( http://arxiv.org/abs/2002.07463v1 )

ライセンス: Link先を確認
Andrea Pietracaprina, Geppino Pucci, Federico Sold\`a(参考訳) ある距離空間からの点のデータセット$V$を与えられた場合、一般的な$k$-center問題は、その最も近い中心からの任意の点の最大距離を最小化するために$k$ポイント(中心)のサブセットを特定する必要がある。 問題の定式化である \emph{robust} は、さらにパラメータである$z$ を特徴とし、中心からの距離を計算した場合に最大$v$ (outliers) の$z$ポイントを無視できる。 本稿では,ロバストな $k$-center 問題の2つの重要な制約付き変種,すなわちロバスト・マトロイド・センター (rmc) 問題,すなわち,返却された中心の集合が $v$ に基づいて構築されたランク $k$ のマトロイドの独立集合として制約されるようなロバスト・マトロイド・センター (rmc) 問題,および各要素 $i\in v$ が正のウェイト $w_i<1$ と返却された中心の合計重量が 1 以上でなければならないロバスト・ナップサック・センター (rkc) 問題に焦点を当てた。 効率的なシーケンシャル,mapreduce,ストリーミングアルゴリズムを実現する2つの問題に対して,coresetベースの戦略を考案する。 より具体的には、固定された$\epsilon>0$ に対して、アルゴリズムは、(3+\epsilon)$-approximation ratio を特徴とする解を返す。 さらに、アルゴリズムはデータセットの本質的な複雑さに明らかに適応し、その倍の次元$D$でキャプチャされる。 パラメータ $k,z,\epsilon, D$ の幅広い範囲に対して,$|V|$ のランニング時間線形な逐次アルゴリズムと,ラウンド/パスが少ないMapReduce/ストリーミングアルゴリズムと,実質的にサブ線形な局所/ワーキングメモリを得る。

Given a dataset $V$ of points from some metric space, the popular $k$-center problem requires to identify a subset of $k$ points (centers) in $V$ minimizing the maximum distance of any point of $V$ from its closest center. The \emph{robust} formulation of the problem features a further parameter $z$ and allows up to $z$ points of $V$ (outliers) to be disregarded when computing the maximum distance from the centers. In this paper, we focus on two important constrained variants of the robust $k$-center problem, namely, the Robust Matroid Center (RMC) problem, where the set of returned centers are constrained to be an independent set of a matroid of rank $k$ built on $V$, and the Robust Knapsack Center (RKC) problem, where each element $i\in V$ is given a positive weight $w_i<1$ and the aggregate weight of the returned centers must be at most 1. We devise coreset-based strategies for the two problems which yield efficient sequential, MapReduce, and Streaming algorithms. More specifically, for any fixed $\epsilon>0$, the algorithms return solutions featuring a $(3+\epsilon)$-approximation ratio, which is a mere additive term $\epsilon$ away from the 3-approximations achievable by the best known polynomial-time sequential algorithms for the two problems. Moreover, the algorithms obliviously adapt to the intrinsic complexity of the dataset, captured by its doubling dimension $D$. For wide ranges of the parameters $k,z,\epsilon, D$, we obtain a sequential algorithm with running time linear in $|V|$, and MapReduce/Streaming algorithms with few rounds/passes and substantially sublinear local/working memory.
翻訳日:2022-12-30 20:54:06 公開日:2020-02-18
# 深層強化学習によるマルチIssueバーゲティング

Multi-Issue Bargaining With Deep Reinforcement Learning ( http://arxiv.org/abs/2002.07788v1 )

ライセンス: Link先を確認
Ho-Chun Herbert Chang(参考訳) 交渉とは、エージェントが紛争を乗り越え、その余剰量を最大化するプロセスである。 バーゲティングゲームにおける深層強化学習の活用は明らかにされていないが,本研究では,公正な結果を生み出すために,その活用,適応,協力の能力を評価する。 入札と受入戦略、時間ベースのエージェント、行動に基づくエージェント、そしてセルフプレイの2つのアクター-クリティックネットワークが訓練された。 これらのエージェントに対するゲームプレイには、3つの重要な発見がある。 1) 神経エージェントは時間に基づくエージェントの活用を学び、決定嗜好値の明確な遷移を達成する。 コーシー分布は、ピーク中心と重い尾のため、サンプリング提供に適したものとして出現する。 連続制御に用いられる確率分布のクルトシスと分散感度は、探索と搾取のトレードオフを生み出す。 2) 神経エージェントは, 譲歩, 割引要因, 行動に基づく戦略の組み合わせに対して適応的な行動を示す。 3)最も重要なことは、神経エージェントが他の行動に基づくエージェントと協力することを学び、特定のケースでは、より公平な結果を強制するために非信頼できる脅威を利用する。 これは進化力学における評判に基づく戦略と類似しており、古典ゲーム理論における平衡から離れている。

Negotiation is a process where agents aim to work through disputes and maximize their surplus. As the use of deep reinforcement learning in bargaining games is unexplored, this paper evaluates its ability to exploit, adapt, and cooperate to produce fair outcomes. Two actor-critic networks were trained for the bidding and acceptance strategy, against time-based agents, behavior-based agents, and through self-play. Gameplay against these agents reveals three key findings. 1) Neural agents learn to exploit time-based agents, achieving clear transitions in decision preference values. The Cauchy distribution emerges as suitable for sampling offers, due to its peaky center and heavy tails. The kurtosis and variance sensitivity of the probability distributions used for continuous control produce trade-offs in exploration and exploitation. 2) Neural agents demonstrate adaptive behavior against different combinations of concession, discount factors, and behavior-based strategies. 3) Most importantly, neural agents learn to cooperate with other behavior-based agents, in certain cases utilizing non-credible threats to force fairer results. This bears similarities with reputation-based strategies in the evolutionary dynamics, and departs from equilibria in classical game theory.
翻訳日:2022-12-30 20:52:29 公開日:2020-02-18
# 深層学習による海洋生物音響学の検出と分類

Workshop Report: Detection and Classification in Marine Bioacoustics with Deep Learning ( http://arxiv.org/abs/2002.08249v1 )

ライセンス: Link先を確認
Fabio Frazao, Bruno Padovese, Oliver S. Kirsebom(参考訳) 2019年11月21~22日、約30人の研究者がカナダのビクトリアに集まり、MERIDIANが主催し、Ocean Networks Canadaが主催するワークショップ「Detection and Classification in Marine Bioacoustics with Deep Learning」を開催した。 ワークショップには、カナダ沿岸と米国からやってきた海洋生物学者、データ科学者、コンピュータ科学者が参加し、大学、政府(魚と海洋、国立海洋大気管理局)、産業(ジャスコ応用科学、google、axiomデータサイエンス)、非営利団体(orcasound、orcalab)など幅広い研究機関が参加した。 ワークショッププログラムは、口頭でのプレゼンテーション、オープンディスカッションセッション、ハンズオンチュートリアルの混合で構成されており、異なる分野の専門家が深層学習と水中音響における検出と分類アルゴリズムの開発に有望な可能性について会話する機会を提供している。 本ワークショップ報告では,プレゼンテーションとディスカッションセッションの要点を要約する。

On 21-22 November 2019, about 30 researchers gathered in Victoria, BC, Canada, for the workshop "Detection and Classification in Marine Bioacoustics with Deep Learning" organized by MERIDIAN and hosted by Ocean Networks Canada. The workshop was attended by marine biologists, data scientists, and computer scientists coming from both Canadian coasts and the US and representing a wide spectrum of research organizations including universities, government (Fisheries and Oceans Canada, National Oceanic and Atmospheric Administration), industry (JASCO Applied Sciences, Google, Axiom Data Science), and non-for-profits (Orcasound, OrcaLab). Consisting of a mix of oral presentations, open discussion sessions, and hands-on tutorials, the workshop program offered a rare opportunity for specialists from distinctly different domains to engage in conversation about deep learning and its promising potential for the development of detection and classification algorithms in underwater acoustics. In this workshop report, we summarize key points from the presentations and discussion sessions.
翻訳日:2022-12-30 20:52:09 公開日:2020-02-18
# クロスネットワークノード分類のためのadversarial deep network embedded

Adversarial Deep Network Embedding for Cross-network Node Classification ( http://arxiv.org/abs/2002.07366v1 )

ライセンス: Link先を確認
Xiao Shen, Quanyu Dai, Fu-lai Chung, Wei Lu, Kup-Sze Choi(参考訳) 本稿では,対象ネットワーク内のラベル付きノードを分類するために,ソースネットワークからの豊富なラベル付きノードを活用するクロスネットワークノード分類の課題について検討する。 既存のドメイン適応アルゴリズムは一般にネットワーク構造情報をモデル化できず、現在のネットワーク埋め込みモデルは、主にシングルネットワークアプリケーションに焦点を当てている。 したがって、両者はネットワーク間のノード分類問題を解決するために直接適用できない。 これにより,ネットワーク構造情報を適切に保存可能なネットワーク不変ノード表現を学習するために,敵対的ドメイン適応とディープネットワーク埋め込みを統合する,ACDNE(Adversarial Cross-network Deep Network Embedding)モデルを提案する。 ACDNEでは、ディープネットワーク埋め込みモジュールは2つの特徴抽出器を使用して、属性付き親和性とノード間のトポロジカルな近さを共同で保存する。 さらに、ノード分類器が組み込まれ、ノード表現をラベル識別する。 さらに、ノード表現をネットワーク不変にするために、逆領域適応手法が用いられる。 クロスネットワークノード分類において,提案した ACDNE モデルにより最先端の性能が得られることを示す。

In this paper, the task of cross-network node classification, which leverages the abundant labeled nodes from a source network to help classify unlabeled nodes in a target network, is studied. The existing domain adaptation algorithms generally fail to model the network structural information, and the current network embedding models mainly focus on single-network applications. Thus, both of them cannot be directly applied to solve the cross-network node classification problem. This motivates us to propose an adversarial cross-network deep network embedding (ACDNE) model to integrate adversarial domain adaptation with deep network embedding so as to learn network-invariant node representations that can also well preserve the network structural information. In ACDNE, the deep network embedding module utilizes two feature extractors to jointly preserve attributed affinity and topological proximities between nodes. In addition, a node classifier is incorporated to make node representations label-discriminative. Moreover, an adversarial domain adaptation technique is employed to make node representations network-invariant. Extensive experimental results demonstrate that the proposed ACDNE model achieves the state-of-the-art performance in cross-network node classification.
翻訳日:2022-12-30 20:46:31 公開日:2020-02-18
# KLダイバージェンスに基づくオンライン機械学習アルゴリズムのためのインテリジェントで再構成可能なアーキテクチャ

Intelligent and Reconfigurable Architecture for KL Divergence Based Online Machine Learning Algorithm ( http://arxiv.org/abs/2002.07713v1 )

ライセンス: Link先を確認
S. V. Sai Santosh and Sumit J. Darak(参考訳) オンライン機械学習(OML)アルゴリズムは、トレーニングフェーズを一切必要とせず、未知の環境に直接デプロイすることができる。 OMLにはマルチアーム・バンディット(MAB)アルゴリズムが含まれており、全てのアームの探索と最適なアームの活用のバランスをとることで、複数のアームの中で最高のアームを識別できる。 Kullback-Leibler divergence based upper confidence bound (KLUCB) は探索・探索トレードオフを最適化する最先端のMABアルゴリズムである。 これにより、KLUCBとPHYの統合をチップ上のシステム(SoC)で要求するロボティクスや無線アプリケーションの有用性が制限される。 本稿では,代用合成可能計算による最適化ルーチンを,性能を損なうことなく実現し,KLUCBアルゴリズムをSoC上に効率的にマッピングする。 提案したアーキテクチャは動的に再構成可能であり、アームの数やアルゴリズムの種類をオンザフライで変更することができる。 特に、最初の学習の後、オンザフライで軽量な UCB に切り替えると、レイテンシとスループットが約10倍改善される。 学習期間は未知のアーム統計に依存するため、アーキテクチャに埋め込まれたインテリジェンスを提供し、スイッチング瞬間を決定する。 本研究は,現実的無線アプリケーションを用いて,提案アーキテクチャの機能的正確性と有用性を検証し,知的無線の実現可能性を示す。

Online machine learning (OML) algorithms do not need any training phase and can be deployed directly in an unknown environment. OML includes multi-armed bandit (MAB) algorithms that can identify the best arm among several arms by achieving a balance between exploration of all arms and exploitation of optimal arm. The Kullback-Leibler divergence based upper confidence bound (KLUCB) is the state-of-the-art MAB algorithm that optimizes exploration-exploitation trade-off but it is complex due to underlining optimization routine. This limits its usefulness for robotics and radio applications which demand integration of KLUCB with the PHY on the system on chip (SoC). In this paper, we efficiently map the KLUCB algorithm on SoC by realizing optimization routine via alternative synthesizable computation without compromising on the performance. The proposed architecture is dynamically reconfigurable such that the number of arms, as well as type of algorithm, can be changed on-the-fly. Specifically, after initial learning, on-the-fly switch to light-weight UCB offers around 10-factor improvement in latency and throughput. Since learning duration depends on the unknown arm statistics, we offer intelligence embedded in architecture to decide the switching instant. We validate the functional correctness and usefulness of the proposed architecture via a realistic wireless application and detailed complexity analysis demonstrates its feasibility in realizing intelligent radios.
翻訳日:2022-12-30 20:45:27 公開日:2020-02-18
# k-means++: 定数近似を与えるステップはもっと少ない

k-means++: few more steps yield constant approximation ( http://arxiv.org/abs/2002.07784v1 )

ライセンス: Link先を確認
Davin Choo, Christoph Grunau, Julian Portmann, V\'aclav Rozho\v{n}(参考訳) Arthur and Vassilvitskii (SODA 2007) の k-means++ アルゴリズムは k-means クラスタリング問題を解くための最先端のアルゴリズムであり、期待して O(log k)-近似を与えることが知られている。 最近、Lattanzi氏とSohler氏(ICML 2019)は、k-means++をO(k log log k)ローカル検索ステップで拡張し、k-meansクラスタリング問題に一定の近似(期待)をもたらすことを提案した。 本稿では,任意の任意の小さな定数$\eps > 0$に対して,任意の局所探索ステップに$\eps k$を付加すれば,一定の近似保証(kの確率が高い)を達成でき,その論文の未解決問題を解消できることを示す。

The k-means++ algorithm of Arthur and Vassilvitskii (SODA 2007) is a state-of-the-art algorithm for solving the k-means clustering problem and is known to give an O(log k)-approximation in expectation. Recently, Lattanzi and Sohler (ICML 2019) proposed augmenting k-means++ with O(k log log k) local search steps to yield a constant approximation (in expectation) to the k-means clustering problem. In this paper, we improve their analysis to show that, for any arbitrarily small constant $\eps > 0$, with only $\eps k$ additional local search steps, one can achieve a constant approximation guarantee (with high probability in k), resolving an open problem in their paper.
翻訳日:2022-12-30 20:45:02 公開日:2020-02-18
# グラフにおける高次ラベル同質性と拡散

Higher-Order Label Homogeneity and Spreading in Graphs ( http://arxiv.org/abs/2002.07833v1 )

ライセンス: Link先を確認
Dhivya Eswaran, Srijan Kumar and Christos Faloutsos(参考訳) 高次ネットワーク構造はグラフ半教師あり学習に役立つか? グラフといくつかのラベル付き頂点が与えられた場合、残りの頂点のラベル付けは、レコメンデーションシステム、不正検出、タンパク質の同定など、いくつかのタスクにおけるアプリケーションにとって大きなインパクトとなる。 しかし、従来の方法はラベルを広めるためにエッジに依存しており、すべてのエッジが等しくないので制限される。 より強い接続を持つ頂点は、半教師付き学習タスクにおいてこれらの構造を活用できる方法を要求するグラフの高階構造に関与する。 そこで本研究では,高次構造を用いたラベル拡散のための高次ラベル拡散(HOLS)を提案する。 HOLSは理論上の保証が強く、ベースケース内での標準ラベルの拡散を減らす。 広範にわたる実験により,三角形を用いた高次ラベル拡散は,エッジのみを用いたラベル拡散よりも最大4.7%よいことがわかった。 従来の手法や最先端の手法と比較して,提案手法は高速でスケーラブルなグラフを保ちながら,全てのケースにおいて統計的に有意な精度向上をもたらす。

Do higher-order network structures aid graph semi-supervised learning? Given a graph and a few labeled vertices, labeling the remaining vertices is a high-impact problem with applications in several tasks, such as recommender systems, fraud detection and protein identification. However, traditional methods rely on edges for spreading labels, which is limited as all edges are not equal. Vertices with stronger connections participate in higher-order structures in graphs, which calls for methods that can leverage these structures in the semi-supervised learning tasks. To this end, we propose Higher-Order Label Spreading (HOLS) to spread labels using higher-order structures. HOLS has strong theoretical guarantees and reduces to standard label spreading in the base case. Via extensive experiments, we show that higher-order label spreading using triangles in addition to edges is up to 4.7% better than label spreading using edges alone. Compared to prior traditional and state-of-the-art methods, the proposed method leads to statistically significant accuracy gains in all-but-one cases, while remaining fast and scalable to large graphs.
翻訳日:2022-12-30 20:44:45 公開日:2020-02-18
# ガウス過程を有する安全クリティカルシステムのオンラインパラメータ推定

Online Parameter Estimation for Safety-Critical Systems with Gaussian Processes ( http://arxiv.org/abs/2002.07870v1 )

ライセンス: Link先を確認
Mouhyemen Khan and Abhijit Chatterjee(参考訳) パラメータ推定は複雑な力学系のモデリング、追跡、制御に不可欠である。 しかしパラメータの不確実性は、パラメータ値に依存するコントローラの下でのシステム性能を損なう可能性がある。 通常、パラメータは逆問題としてフレーム化された数値回帰アプローチを用いて推定される。 しかし、複数の局所最適点が存在すること、勾配に依存すること、多くの実験データ、安定性の問題などにより、非特異性に悩まされている。 これらの欠点に対処するため,オンラインパラメータ推定のためのガウス過程(GP)に基づくベイズ最適化フレームワークを提案する。 パラメータ空間の応答面上の効率的な探索戦略を用いて、最小限の機能評価で大域最適解を求める。 応答面は、ノイズデータ上のGPを用いて相関代理としてモデル化される。 GP後部予測分散は、スマートアダプティブサンプリングに利用される。 これは、限られた予算の下でグローバルオプティマに到達する上で鍵となる探索と搾取のトレードオフのバランスをとる。 我々は,パラメータの変化を考慮したシミュレーションにおいて,アクティベートされた平面振子と安全臨界振子について実演する。 また, 内部点法と逐次二次プログラムを用いて, 解法に対するベンチマークを行った。 制御器を新しい最適化パラメータで反復的に再構成することにより,システムにおけるトラジェクティブトラッキングを,名目ケースや他の解法よりも大幅に改善する。

Parameter estimation is crucial for modeling, tracking, and control of complex dynamical systems. However, parameter uncertainties can compromise system performance under a controller relying on nominal parameter values. Typically, parameters are estimated using numerical regression approaches framed as inverse problems. However, they suffer from non-uniqueness due to existence of multiple local optima, reliance on gradients, numerous experimental data, or stability issues. Addressing these drawbacks, we present a Bayesian optimization framework based on Gaussian processes (GPs) for online parameter estimation. It uses an efficient search strategy over a response surface in the parameter space for finding the global optima with minimal function evaluations. The response surface is modeled as correlated surrogates using GPs on noisy data. The GP posterior predictive variance is exploited for smart adaptive sampling. This balances the exploration versus exploitation trade-off which is key in reaching the global optima under limited budget. We demonstrate our technique on an actuated planar pendulum and safety-critical quadrotor in simulation with changing parameters. We also benchmark our results against solvers using interior point method and sequential quadratic program. By reconfiguring the controller with new optimized parameters iteratively, we drastically improve trajectory tracking of the system versus the nominal case and other solvers.
翻訳日:2022-12-30 20:44:28 公開日:2020-02-18
# 複雑回路における過渡的・ソフトなエラーに対処する機械学習

Machine Learning to Tackle the Challenges of Transient and Soft Errors in Complex Circuits ( http://arxiv.org/abs/2002.08882v1 )

ライセンス: Link先を確認
Thomas Lange, Aneesh Balakrishnan, Maximilien Glorieux, Dan Alexandrescu, Luca Sterpone(参考訳) 今日の複雑な回路の機能的故障率分析は難しい作業であり、人的努力、処理資源、ツールライセンスの面で大きな投資を必要とする。 これにより、デレーティングまたは脆弱性要因は、障害分析の取り組みの主要な手段となる。 通常、計算集約的なフォールトインジェクションシミュレーションキャンペーンは、機能レベルのきめ細かい信頼性メトリクスを取得するために必要である。 そこで本論文では,本手法を支援するために機械学習アルゴリズムを用いることにより,障害注入作業を最適化し,強化する。 具体的には、機械学習モデルを使用して、古典的な手法で到達するのが困難な回路インスタンスの完全なリストの正確なインスタンスごとの機能的デレーティングデータを予測する。 上記の手法は、静的要素(セル特性、回路構造、合成属性)と動的要素(シグナルアクティビティ)を組み合わせた分析アプローチによって抽出された、インテンス毎の機能セットを使用する。 第一原理故障シミュレーションアプローチにより参照データを得る。 この参照データセットの1つは機械学習モデルのトレーニングに使用され、残りの部分はトレーニングされたツールの精度の検証とベンチマークに使用される。 提案手法を実例に適用し,各種機械学習モデルの評価と比較を行った。

The Functional Failure Rate analysis of today's complex circuits is a difficult task and requires a significant investment in terms of human efforts, processing resources and tool licenses. Thereby, de-rating or vulnerability factors are a major instrument of failure analysis efforts. Usually computationally intensive fault-injection simulation campaigns are required to obtain a fine-grained reliability metrics for the functional level. Therefore, the use of machine learning algorithms to assist this procedure and thus, optimising and enhancing fault injection efforts, is investigated in this paper. Specifically, machine learning models are used to predict accurate per-instance Functional De-Rating data for the full list of circuit instances, an objective that is difficult to reach using classical methods. The described methodology uses a set of per-instance features, extracted through an analysis approach, combining static elements (cell properties, circuit structure, synthesis attributes) and dynamic elements (signal activity). Reference data is obtained through first-principles fault simulation approaches. One part of this reference dataset is used to train the machine learning model and the remaining is used to validate and benchmark the accuracy of the trained tool. The presented methodology is applied on a practical example and various machine learning models are evaluated and compared.
翻訳日:2022-12-30 20:43:50 公開日:2020-02-18
# 分離フィルタを用いた畳み込みニューラルネットワークの計算最適化

Computational optimization of convolutional neural networks using separated filters architecture ( http://arxiv.org/abs/2002.07754v1 )

ライセンス: Link先を確認
Elena Limonova and Alexander Sheshkus and Dmitry Nikolaev(参考訳) 本稿では,計算複雑性を低減し,ニューラルネットワーク処理を高速化する畳み込みニューラルネットワーク変換について考察する。 畳み込みニューラルネットワーク(convolutional neural networks, cnn)は,モバイルプラットフォームや組込みシステムでの認識など,計算能力の要求が過剰であるにも関わらず,画像認識に対する標準的なアプローチである。 本稿では,2次元畳み込みフィルタを分離フィルタの線形結合として表現するcnn構造変換を提案する。 標準訓練アルゴリズムによって分離された畳み込みフィルタを得ることができる。 この構造変換の計算効率について検討し、CPUやGPUで容易に処理できる高速実装を提案する。 産業用画像認識システムにおいて,文字と数字の認識のために設計されたCNNは,精度の低下のない15%の高速化を示す。 結論として,予測精度の低下の問題と,異なる認識問題への変換提案の適用について論じる。 畳み込みニューラルネットワーク、計算最適化、分離フィルタ、複雑性低減。

This paper considers a convolutional neural network transformation that reduces computation complexity and thus speedups neural network processing. Usage of convolutional neural networks (CNN) is the standard approach to image recognition despite the fact they can be too computationally demanding, for example for recognition on mobile platforms or in embedded systems. In this paper we propose CNN structure transformation which expresses 2D convolution filters as a linear combination of separable filters. It allows to obtain separated convolutional filters by standard training algorithms. We study the computation efficiency of this structure transformation and suggest fast implementation easily handled by CPU or GPU. We demonstrate that CNNs designed for letter and digit recognition of proposed structure show 15% speedup without accuracy loss in industrial image recognition system. In conclusion, we discuss the question of possible accuracy decrease and the application of proposed transformation to different recognition problems. convolutional neural networks, computational optimization, separable filters, complexity reduction.
翻訳日:2022-12-30 20:37:51 公開日:2020-02-18
# 銀河の最近の星形成史の制約 : 近似ベイズ計算によるアプローチ

Constraining the recent star formation history of galaxies : an Approximate Bayesian Computation approach ( http://arxiv.org/abs/2002.07815v1 )

ライセンス: Link先を確認
G. Aufort, L. Ciesla, P. Pudlo and V. Buat(参考訳) [Abridged]銀河は星形成速度と恒星質量の密接な関係にあるが、短期的な変動を伴う複雑な星形成履歴(SFH)を示すことが期待されている。 このパイロット研究の目的は、過去数十~数百年の恒星形成活動の強い変化を経験している銀河を同定する方法を提供することである。 言い換えると、提案手法は、平滑な通常のsfhではなくsedを適切にモデル化するために、ssfhの過去数百個のmyrのバリエーションが必要かどうかを判断する。 そこで我々は高信号-雑音比広帯域光度計を用いてCOSMOS銀河のサンプルを分析する。 本研究では,最先端統計手法である近似ベイズ計算を機械学習アルゴリズムに関連するモデル選択に適用し,観測された銀河のフラックス密度比に基づいて,柔軟なsfhが好ましい確率を与える。 そこで本研究では,シミュレーションsedのサンプルを用いて実験を行う。 アルゴリズムに供給される入力情報は、各銀河のブロードバンドUVからNIR(レストフレーム)フラックス比のセットである。 本手法は, 右SFHの回復において21%の誤差率を有し, 1デックス以上のSFR変動に敏感である。 ベイズ情報基準による適合度比較に基づいて,CIGALEを用いたより従来型のSEDフィッティング法を試行するが,得られた最良の誤差率は28%であった。 我々は新しい手法をCOSMOS銀河試料に適用する。 滑らかな遅延-\tau$ SFHのピークに対して強い決定的な証拠を持つ銀河の恒星質量分布は、滑らかな遅延-$\tau$ SFHのピークが好ましい銀河と比較して、M*の低い位置にある。 我々は、この結果がトレーニングによる偏見によるものではないという事実について議論する。 最後に、フレキシブルSFHは可能な限り最大のSFR-M*パラメータ空間をカバーできる必要があると論じる。

[Abridged] Although galaxies are found to follow a tight relation between their star formation rate and stellar mass, they are expected to exhibit complex star formation histories (SFH), with short-term fluctuations. The goal of this pilot study is to present a method that will identify galaxies that are undergoing a strong variation of star formation activity in the last tens to hundreds Myr. In other words, the proposed method will determine whether a variation in the last few hundreds of Myr of the SFH is needed to properly model the SED rather than a smooth normal SFH. To do so, we analyze a sample of COSMOS galaxies using high signal-to-noise ratio broad band photometry. We apply Approximate Bayesian Computation, a state-of-the-art statistical method to perform model choice, associated to machine learning algorithms to provide the probability that a flexible SFH is preferred based on the observed flux density ratios of galaxies. We present the method and test it on a sample of simulated SEDs. The input information fed to the algorithm is a set of broadband UV to NIR (rest-frame) flux ratios for each galaxy. The method has an error rate of 21% in recovering the right SFH and is sensitive to SFR variations larger than 1 dex. A more traditional SED fitting method using CIGALE is tested to achieve the same goal, based on fits comparisons through Bayesian Information Criterion but the best error rate obtained is higher, 28%. We apply our new method to the COSMOS galaxies sample. The stellar mass distribution of galaxies with a strong to decisive evidence against the smooth delayed-$\tau$ SFH peaks at lower M* compared to galaxies where the smooth delayed-$\tau$ SFH is preferred. We discuss the fact that this result does not come from any bias due to our training. Finally, we argue that flexible SFHs are needed to be able to cover that largest SFR-M* parameter space possible.
翻訳日:2022-12-30 20:35:38 公開日:2020-02-18
# 統合情報理論の数学的構造

The Mathematical Structure of Integrated Information Theory ( http://arxiv.org/abs/2002.07655v1 )

ライセンス: Link先を確認
Johannes Kleiner and Sean Tull(参考訳) 統合情報理論は意識の主要なモデルの一つである。 特定の状態において、脳のような物理的システムの意識的な経験の質と量を記述することを目的としている。 この貢献において、我々は理論の数学的構造を提唱し、本質を補助形式ツールから分離する。 我々は、トノニらの IIT 3.0 を持つ一般化 IIT の定義を提供する。 zanardiらによって導入されたquantum iitと同様に、al. 特別な場合として これは、将来の正式な研究の出発点となりうる理論の公理的定義と、正式な背景を持つ研究者にふさわしい導入を提供する。

Integrated Information Theory is one of the leading models of consciousness. It aims to describe both the quality and quantity of the conscious experience of a physical system, such as the brain, in a particular state. In this contribution, we propound the mathematical structure of the theory, separating the essentials from auxiliary formal tools. We provide a definition of a generalized IIT which has IIT 3.0 of Tononi et. al., as well as the Quantum IIT introduced by Zanardi et. al. as special cases. This provides an axiomatic definition of the theory which may serve as the starting point for future formal investigations and as an introduction suitable for researchers with a formal background.
翻訳日:2022-12-30 20:35:04 公開日:2020-02-18
# 深層学習アプローチによる心拍数自動計算と心大動脈瘤検出

Automated Cardiothoracic Ratio Calculation and Cardiomegaly Detection using Deep Learning Approach ( http://arxiv.org/abs/2002.07468v1 )

ライセンス: Link先を確認
Isarun Chamveha, Treethep Promwiset, Trongtum Tongdee, Pairash Saiviroonporn and Warasinee Chaisangmongkon(参考訳) 胸部X線像から心胸膜比(CTR)を計算するアルゴリズムを提案する。 VGG16エンコーダを用いたU-Netに基づく深層学習モデルを適用し,胸部X線画像から肺と心臓のマスクを抽出し,得られたマスクの範囲からCTRを算出する。 ヒトの放射線学者は我々のCTR測定を評価し、76.5 %$は調整の必要なく医療報告に含められた。 この結果は、自動化ツールを使用して放射線科医に節約された膨大な時間と労力につながります。

We propose an algorithm for calculating the cardiothoracic ratio (CTR) from chest X-ray films. Our approach applies a deep learning model based on U-Net with VGG16 encoder to extract lung and heart masks from chest X-ray images and calculate CTR from the extents of obtained masks. Human radiologists evaluated our CTR measurements, and $76.5\%$ were accepted to be included in medical reports without any need for adjustment. This result translates to a large amount of time and labor saved for radiologists using our automated tools.
翻訳日:2022-12-30 20:26:54 公開日:2020-02-18
# 時空間位相アパーチャ符号化による動きの劣化

Motion Deblurring using Spatiotemporal Phase Aperture Coding ( http://arxiv.org/abs/2002.07483v1 )

ライセンス: Link先を確認
Shay Elmalem, Raja Giryes and Emanuel Marom(参考訳) 動きのぼやけは写真でよく知られた問題であり、物体を捉えながら露光時間を制限している。 補うために大規模な研究が行われている。 そこで本研究では, 動きの鈍化に対する画像処理手法を提案する。 画像取得時のレンズ開口部における動的位相符号化を用いて、運動の軌跡を中間光学画像に符号化する。 この符号化は、各対象の空間的ぼかしを着色することにより、動き方向と範囲の両方を埋め込みます。 カラーキューは、画像復元に利用するために訓練された畳み込みニューラルネットワーク(cnn)を使用して、ブラインドデブラリングプロセスの事前情報として機能する。 提案手法は,シミュレーションと実世界実験の両方において,コーディングを伴わないブラインドデブラリングと,コード取得を利用した他のソリューションの利点を実証する。

Motion blur is a known issue in photography, as it limits the exposure time while capturing moving objects. Extensive research has been carried to compensate for it. In this work, a computational imaging approach for motion deblurring is proposed and demonstrated. Using dynamic phase-coding in the lens aperture during the image acquisition, the trajectory of the motion is encoded in an intermediate optical image. This encoding embeds both the motion direction and extent by coloring the spatial blur of each object. The color cues serve as prior information for a blind deblurring process, implemented using a convolutional neural network (CNN) trained to utilize such coding for image restoration. We demonstrate the advantage of the proposed approach over blind-deblurring with no coding and other solutions that use coded acquisition, both in simulation and real-world experiments.
翻訳日:2022-12-30 20:26:44 公開日:2020-02-18
# DivideMix: 半教師あり学習としてのノイズラベルによる学習

DivideMix: Learning with Noisy Labels as Semi-supervised Learning ( http://arxiv.org/abs/2002.07394v1 )

ライセンス: Link先を確認
Junnan Li, Richard Socher, Steven C.H. Hoi(参考訳) 深層ニューラルネットワークはアノテーションに飢えていることが知られている。 深層ネットワークで学習する際のアノテーションコストの削減に多くの努力が注がれている。 ノイズラベルを用いた学習とラベルなしデータの活用による半教師あり学習の2つの特徴がある。 本研究では,半教師付き学習技術を活用した雑音ラベル学習フレームワークであるDivideMixを提案する。 特にDivideMixは、サンプルごとの損失分布を混合モデルでモデル化し、トレーニングデータをクリーンなサンプルでラベル付きセットとノイズの多いサンプルでラベルなしセットに動的に分割し、ラベル付きデータとラベルなしデータの両方で半教師付き方法でトレーニングする。 確認バイアスを回避するため、各ネットワークが他のネットワークからデータセット分割を使用する2つの分岐ネットワークを同時に訓練する。 半教師付きトレーニングフェーズにおいて,ラベル付きサンプルとラベル付きサンプルのラベル付きコガッシングをそれぞれ行うことで,MixMatch戦略を改善する。 複数のベンチマークデータセットの実験は、最先端の手法よりも大幅に改善されている。 コードはhttps://github.com/LiJunnan 1992/DivideMixで入手できる。

Deep neural networks are known to be annotation-hungry. Numerous efforts have been devoted to reducing the annotation cost when learning with deep networks. Two prominent directions include learning with noisy labels and semi-supervised learning by exploiting unlabeled data. In this work, we propose DivideMix, a novel framework for learning with noisy labels by leveraging semi-supervised learning techniques. In particular, DivideMix models the per-sample loss distribution with a mixture model to dynamically divide the training data into a labeled set with clean samples and an unlabeled set with noisy samples, and trains the model on both the labeled and unlabeled data in a semi-supervised manner. To avoid confirmation bias, we simultaneously train two diverged networks where each network uses the dataset division from the other network. During the semi-supervised training phase, we improve the MixMatch strategy by performing label co-refinement and label co-guessing on labeled and unlabeled samples, respectively. Experiments on multiple benchmark datasets demonstrate substantial improvements over state-of-the-art methods. Code is available at https://github.com/LiJunnan1992/DivideMix .
翻訳日:2022-12-30 20:20:01 公開日:2020-02-18
# Universal-RCNN: 転送可能なグラフR-CNNによるUniversal Object Detector

Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN ( http://arxiv.org/abs/2002.07417v1 )

ライセンス: Link先を確認
Hang Xu, Linpu Fang, Xiaodan Liang, Wenxiong Kang, Zhenguo Li(参考訳) 支配的なオブジェクト検出アプローチは、各データセットを別々に扱い、広範囲な再トレーニングなしに他のドメインに適応できない特定のドメインに適合する。 本稿では,複数のドメインから多種多様なカテゴリの粒度を生かし,一つのシステムにおけるあらゆるカテゴリを予測できる汎用オブジェクト検出モデルの設計問題に対処する。 既存の作業では、複数の検出ブランチをひとつの共有バックボーンネットワークに統合することでこの問題を処理している。 しかし、このパラダイムは、カテゴリ階層、視覚の類似性、言語関係など、複数のドメイン間の重要な意味的相関を見落としている。 これらの欠点に対処するために,複数のデータセット間で関連する意味情報を伝播して意味的一貫性に達するグラフ伝達学習を取り入れたUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。 具体的には、まず、すべてのカテゴリのすべてのハイレベルな意味表現を統合することで、グローバルセマンティクスプールを生成します。 次に、ドメイン内推論モジュールは、空間認識GCNによってガイドされた1つのデータセット内のスパースグラフ表現を学習し、伝播する。 最後に、InterDomain Transfer Moduleが提案され、すべてのドメインにまたがる多様な転送依存性を活用でき、グローバルなセマンティックコンテキストへの参加と転送によって、地域的特徴表現を強化する。 複数のオブジェクト検出ベンチマーク(mAP: 49.1% on COCO)において,提案手法がマルチブランチモデルを大幅に上回り,最先端の結果が得られることを示した。

The dominant object detection approaches treat each dataset separately and fit towards a specific domain, which cannot adapt to other domains without extensive retraining. In this paper, we address the problem of designing a universal object detection model that exploits diverse category granularity from multiple domains and predict all kinds of categories in one system. Existing works treat this problem by integrating multiple detection branches upon one shared backbone network. However, this paradigm overlooks the crucial semantic correlations between multiple domains, such as categories hierarchy, visual similarity, and linguistic relationship. To address these drawbacks, we present a novel universal object detector called Universal-RCNN that incorporates graph transfer learning for propagating relevant semantic information across multiple datasets to reach semantic coherency. Specifically, we first generate a global semantic pool by integrating all high-level semantic representation of all the categories. Then an Intra-Domain Reasoning Module learns and propagates the sparse graph representation within one dataset guided by a spatial-aware GCN. Finally, an InterDomain Transfer Module is proposed to exploit diverse transfer dependencies across all domains and enhance the regional feature representation by attending and transferring semantic contexts globally. Extensive experiments demonstrate that the proposed method significantly outperforms multiple-branch models and achieves the state-of-the-art results on multiple object detection benchmarks (mAP: 49.1% on COCO).
翻訳日:2022-12-30 20:19:39 公開日:2020-02-18
# EHSOD:カスケードリファインメントを用いたCAM-Guided End-to-end Hybrid-Supervised Object Detection

EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with Cascade Refinement ( http://arxiv.org/abs/2002.07421v1 )

ライセンス: Link先を確認
Linpu Fang, Hang Xu, Zhili Liu, Sarah Parisot, Zhenguo Li(参考訳) 現在、完全に注釈付けされたデータに基づいて訓練されたオブジェクト検出器は、高い手作業によるアノテーションを必要とする。 一方、弱い監視検出器は性能がはるかに低く、現実的な環境では確実に使用できない。 本稿では,限られた量の完全注釈データを用いて高品質な検出器を訓練し,画像レベルラベルを用いた安価なデータを完全に活用することを目的とした,ハイブリッド教師付き物体検出問題の検討を行う。 最先端の手法は通常、擬似ラベルの生成と検出器の更新を交互に行う反復的なアプローチを提案する。 このパラダイムでは、各ラウンドで優れた擬似ラベルをマイニングするために、慎重に手動のハイパーパラメータチューニングが必要です。 これらの問題に対処するために、EDSODは、完全および弱い注釈付きデータの両方でワンショットで訓練できる、エンドツーエンドのハイブリッド監視オブジェクト検出システムである。 具体的には,2段検出器を用いて,2種類のラベル情報を完全に活用する2つのモジュールを提案する。 1) CAMRPNモジュールは,クラスアクティベーションヒートマップによって導かれる事前提案を見つけることを目的としている。 2)ハイブリッド制御カスケードモジュールは,画像レベルのデータに適合する補助ヘッドを用いて,バウンディングボックスの位置と分類をさらに洗練する。 大規模な実験は提案手法の有効性を実証し、COCO上の37.5% mAPのような完全な注釈付きデータで、複数のオブジェクト検出ベンチマークで同等の結果を得る。 コードとトレーニングされたモデルをリリースします。

Object detectors trained on fully-annotated data currently yield state of the art performance but require expensive manual annotations. On the other hand, weakly-supervised detectors have much lower performance and cannot be used reliably in a realistic setting. In this paper, we study the hybrid-supervised object detection problem, aiming to train a high quality detector with only a limited amount of fullyannotated data and fully exploiting cheap data with imagelevel labels. State of the art methods typically propose an iterative approach, alternating between generating pseudo-labels and updating a detector. This paradigm requires careful manual hyper-parameter tuning for mining good pseudo labels at each round and is quite time-consuming. To address these issues, we present EHSOD, an end-to-end hybrid-supervised object detection system which can be trained in one shot on both fully and weakly-annotated data. Specifically, based on a two-stage detector, we proposed two modules to fully utilize the information from both kinds of labels: 1) CAMRPN module aims at finding foreground proposals guided by a class activation heat-map; 2) hybrid-supervised cascade module further refines the bounding-box position and classification with the help of an auxiliary head compatible with image-level data. Extensive experiments demonstrate the effectiveness of the proposed method and it achieves comparable results on multiple object detection benchmarks with only 30% fully-annotated data, e.g. 37.5% mAP on COCO. We will release the code and the trained models.
翻訳日:2022-12-30 20:19:14 公開日:2020-02-18
# v4d:4d畳み込みニューラルネットワークによる映像レベルの表現学習

V4D:4D Convolutional Neural Networks for Video-level Representation Learning ( http://arxiv.org/abs/2002.07442v1 )

ライセンス: Link先を確認
Shiwen Zhang and Sheng Guo and Weilin Huang and Matthew R. Scott and Limin Wang(参考訳) ビデオ表現学習のための既存の3D CNNは、クリップベースの手法であり、時空間特徴の映像レベルの時間的進化を考慮しない。 本稿では,v4dと呼ばれるビデオレベルの4次元畳み込みニューラルネットワークを提案する。4次元畳み込みによる長距離時空間表現の進化をモデル化すると同時に,残留接続を持つ強固な3次元時空間表現を維持する。 具体的には、クリップ間相互作用を捕捉できる新しい4D残差ブロックを設計し、元のクリップレベル3D CNNの表現力を向上する。 4D残差ブロックは既存の3D CNNに容易に統合でき、階層的に長距離モデリングを行うことができる。 さらに,提案するV4Dのトレーニングと推論手法についても紹介する。 3つのビデオ認識ベンチマークで、V4Dは、最近の3D CNNよりも大きなマージンで、優れた結果を得る。

Most existing 3D CNNs for video representation learning are clip-based methods, and thus do not consider video-level temporal evolution of spatio-temporal features. In this paper, we propose Video-level 4D Convolutional Neural Networks, referred as V4D, to model the evolution of long-range spatio-temporal representation with 4D convolutions, and at the same time, to preserve strong 3D spatio-temporal representation with residual connections. Specifically, we design a new 4D residual block able to capture inter-clip interactions, which could enhance the representation power of the original clip-level 3D CNNs. The 4D residual blocks can be easily integrated into the existing 3D CNNs to perform long-range modeling hierarchically. We further introduce the training and inference methods for the proposed V4D. Extensive experiments are conducted on three video recognition benchmarks, where V4D achieves excellent results, surpassing recent 3D CNNs by a large margin.
翻訳日:2022-12-30 20:18:48 公開日:2020-02-18
# 行動認識のための知識統合ネットワーク

Knowledge Integration Networks for Action Recognition ( http://arxiv.org/abs/2002.07471v1 )

ライセンス: Link先を確認
Shiwen Zhang and Sheng Guo and Limin Wang and Weilin Huang and Matthew R. Scott(参考訳) 本研究では,映像行動認識のための知識統合ネットワーク(KINet)を提案する。 KINetは、人間の情報やシーンコンテキストなど、アクションを特定する上で非常に重要である意味のあるコンテキスト特徴を集約することができる。 アクション認識のためのメインブランチと、アクション認識のための人間とシーンの知識をエンコードできる人間の解析とシーン認識のための2つの補助ブランチからなる3つのブランチアーキテクチャを設計した。 本研究では,教師ネットワークとしての事前学習モデル2つを探索し,KINetの補助的タスクを訓練するための人間とシーンの知識を抽出する。 さらに、補助知識を中程度の畳み込み特徴に符号化するクロスブランチ統合(CBI)モジュールと、高レベルの文脈情報を効果的に融合するアクション知識グラフ(AKG)を含む2レベル知識符号化機構を提案する。 これにより、3つのタスクを協調的にトレーニングできるエンドツーエンドのトレーニング可能なフレームワークが実現され、モデルが強力なコンテキスト知識を効率的に計算できるようになる。 KINetは、大規模アクション認識ベンチマークKinetics-400の最先端性能を77.8%で達成している。 さらに,我々のkinetは,運動学訓練モデルからutf-101へ移行することで,97.8%のtop-1精度が得られることを実証した。

In this work, we propose Knowledge Integration Networks (referred as KINet) for video action recognition. KINet is capable of aggregating meaningful context features which are of great importance to identifying an action, such as human information and scene context. We design a three-branch architecture consisting of a main branch for action recognition, and two auxiliary branches for human parsing and scene recognition which allow the model to encode the knowledge of human and scene for action recognition. We explore two pre-trained models as teacher networks to distill the knowledge of human and scene for training the auxiliary tasks of KINet. Furthermore, we propose a two-level knowledge encoding mechanism which contains a Cross Branch Integration (CBI) module for encoding the auxiliary knowledge into medium-level convolutional features, and an Action Knowledge Graph (AKG) for effectively fusing high-level context information. This results in an end-to-end trainable framework where the three tasks can be trained collaboratively, allowing the model to compute strong context knowledge efficiently. The proposed KINet achieves the state-of-the-art performance on a large-scale action recognition benchmark Kinetics-400, with a top-1 accuracy of 77.8%. We further demonstrate that our KINet has strong capability by transferring the Kinetics-trained model to UCF-101, where it obtains 97.8% top-1 accuracy.
翻訳日:2022-12-30 20:18:11 公開日:2020-02-18
# わずかなショット学習と空間的注意の役割

Few-Shot Few-Shot Learning and the role of Spatial Attention ( http://arxiv.org/abs/2002.07522v1 )

ライセンス: Link先を確認
Yann Lifchitz, Yannis Avrithis, Sylvaine Picard(参考訳) 少ないショット学習は、しばしば人間がいくつかの例から新しいタスクを学ぶ能力によって動機づけられる。 しかしながら、標準的な少数ショット分類ベンチマークでは、表現は限られた量のベースクラスデータで学習され、新しいタスクを学ぶ前に人間が蓄積した事前知識の量を無視していると仮定している。 同時に、たとえ強力な表現が利用可能であったとしても、ベースクラスデータが制限されたり、存在しない場合もあります。 これにより、異なるドメインの大規模データセット上で事前訓練された分類器から表現が得られ、トレーニングプロセスにアクセスできないと仮定し、ベースクラスデータはクラス毎に少数の例に制限され、それらの役割はスクラッチから学ぶのではなく、ドメインに手動で表現を適用することである。 表現は2つの段階、すなわち、利用可能ないくつかのベースクラスデータと、さらに少ない新しいタスクのデータに適応します。 そこで我々は,事前学習した分類器から,対象物に着目し,背景乱れを抑制する空間的注意マップを得る。 ベースクラスデータが少ない場合、ネットワークは暗黙的にフォーカスする場所を学べないため、これは新しい問題において重要である。 また,事前学習したネットワークはメタ学習なしで,新しいクラスに容易に適応できることを示した。

Few-shot learning is often motivated by the ability of humans to learn new tasks from few examples. However, standard few-shot classification benchmarks assume that the representation is learned on a limited amount of base class data, ignoring the amount of prior knowledge that a human may have accumulated before learning new tasks. At the same time, even if a powerful representation is available, it may happen in some domain that base class data are limited or non-existent. This motivates us to study a problem where the representation is obtained from a classifier pre-trained on a large-scale dataset of a different domain, assuming no access to its training process, while the base class data are limited to few examples per class and their role is to adapt the representation to the domain at hand rather than learn from scratch. We adapt the representation in two stages, namely on the few base class data if available and on the even fewer data of new tasks. In doing so, we obtain from the pre-trained classifier a spatial attention map that allows focusing on objects and suppressing background clutter. This is important in the new problem, because when base class data are few, the network cannot learn where to focus implicitly. We also show that a pre-trained network may be easily adapted to novel classes, without meta-learning.
翻訳日:2022-12-30 20:17:47 公開日:2020-02-18
# HoloLensトライアングルメッシュを用いたボクセルを用いた室内再構成

Voxel-Based Indoor Reconstruction From HoloLens Triangle Meshes ( http://arxiv.org/abs/2002.07689v1 )

ライセンス: Link先を確認
P. H\"ubner, M. Weinmann, S. Wursthorn(参考訳) 現在のモバイル拡張現実デバイスは、しばしばレンジセンサーを備えている。 例えばMicrosoft HoloLensは、カスタムアプリケーションで使用できる粗い三角形メッシュを提供するTime-Of-Flight (ToF)レンジカメラを備えている。 本稿では,屋内モデルの自動生成にトライアングルメッシュを用い,位置依存情報と物理的対応性を高める基盤となることを提案する。 本稿では,三角形メッシュのような非構造な3次元ジオメトリからの屋内自動再構成のためのvoxelに基づく新しい手法を提案する。 入力データの初期ボクセル化後、天井候補の連結ボクセル成分をセグメント化して下方に押出してフロア候補を見つけることにより、結果のボクセルグリッドに部屋を検出する。 Wall'、'Wall Opening'、'Interior Object'、'Empty Insider'といったセマンティックなクラスラベルは、ルールベースのvoxel sweepアルゴリズムによって、天井と床の間にある部屋のvoxelに割り当てられる。 最後に、検出された壁とその開口部の形状をボクセル表現で洗練する。 提案されたアプローチはマンハッタンの世界シナリオに限定されず、平面であるルームサーフェスに依存しない。

Current mobile augmented reality devices are often equipped with range sensors. The Microsoft HoloLens for instance is equipped with a Time-Of-Flight (ToF) range camera providing coarse triangle meshes that can be used in custom applications. We suggest to use the triangle meshes for the automatic generation of indoor models that can serve as basis for augmenting their physical counterpart with location-dependent information. In this paper, we present a novel voxel-based approach for automated indoor reconstruction from unstructured three-dimensional geometries like triangle meshes. After an initial voxelization of the input data, rooms are detected in the resulting voxel grid by segmenting connected voxel components of ceiling candidates and extruding them downwards to find floor candidates. Semantic class labels like 'Wall', 'Wall Opening', 'Interior Object' and 'Empty Interior' are then assigned to the room voxels in-between ceiling and floor by a rule-based voxel sweep algorithm. Finally, the geometry of the detected walls and their openings is refined in voxel representation. The proposed approach is not restricted to Manhattan World scenarios and does not rely on room surfaces being planar.
翻訳日:2022-12-30 20:17:23 公開日:2020-02-18
# インスタンス重み付けによる補完的ラスト発話選択によるマルチターン応答選択モデルの改善

Improving Multi-Turn Response Selection Models with Complementary Last-Utterance Selection by Instance Weighting ( http://arxiv.org/abs/2002.07397v1 )

ライセンス: Link先を確認
Kun Zhou and Wayne Xin Zhao and Yutao Zhu and Ji-Rong Wen and Jingsong Yu(参考訳) オープンドメイン検索に基づく対話システムは、パラメータを学習するためにかなりの量のトレーニングデータを必要とする。 しかし、実際には、トレーニングデータの負のサンプルは通常、ランダムに設定された無記名会話データから選択される。 生成されたトレーニングデータはノイズを含み、応答選択モデルの性能に影響する可能性が高い。 この課題に対処するために,データリソース自体の基盤となる相関を利用して,異なる種類の監視信号を導出し,ノイズデータの影響を低減することを検討する。 より具体的には、主補的タスクペアを考える。 メインタスク(我々の焦点)は、最後の発話とコンテキストが与えられた正しい応答を選択し、補完タスクは、応答とコンテキストが与えられた最後の発話を選択します。 キーポイントは、補完タスクの出力がメインタスクのインスタンス重みを設定するために使用されることです。 2つの公開データセットで広範な実験を行い,両データセットで有意な改善を得た。 また,提案手法のバリエーションを多面的に検討し,本手法の有効性を検証した。

Open-domain retrieval-based dialogue systems require a considerable amount of training data to learn their parameters. However, in practice, the negative samples of training data are usually selected from an unannotated conversation data set at random. The generated training data is likely to contain noise and affect the performance of the response selection models. To address this difficulty, we consider utilizing the underlying correlation in the data resource itself to derive different kinds of supervision signals and reduce the influence of noisy data. More specially, we consider a main-complementary task pair. The main task (\ie our focus) selects the correct response given the last utterance and context, and the complementary task selects the last utterance given the response and context. The key point is that the output of the complementary task is used to set instance weights for the main task. We conduct extensive experiments in two public datasets and obtain significant improvement in both datasets. We also investigate the variant of our approach in multiple aspects, and the results have verified the effectiveness of our approach.
翻訳日:2022-12-30 20:17:06 公開日:2020-02-18
# ニューラルマシン翻訳のためのディープラーニング技術に関する調査研究

A Survey of Deep Learning Techniques for Neural Machine Translation ( http://arxiv.org/abs/2002.07526v1 )

ライセンス: Link先を確認
Shuoheng Yang, Yuxin Wang, Xiaowen Chu(参考訳) 近年,自然言語処理 (NLP) は深層学習技術で大きな発展を遂げている。 機械翻訳のサブ分野において、ニューラルマシン翻訳(nmt)と呼ばれる新しいアプローチが登場し、学界と産業の両方から大きな注目を集めている。 しかし,過去数年間に提案された研究は極めて多く,この新技術動向の展開過程についてはほとんど研究が行われていない。 この文献調査は,NTTの起源と開発タイムラインを辿り,重要なブランチを調査し,異なる研究方向性を分類し,今後の研究動向について考察する。

In recent years, natural language processing (NLP) has got great development with deep learning techniques. In the sub-field of machine translation, a new approach named Neural Machine Translation (NMT) has emerged and got massive attention from both academia and industry. However, with a significant number of researches proposed in the past several years, there is little work in investigating the development process of this new technology trend. This literature survey traces back the origin and principal development timeline of NMT, investigates the important branches, categorizes different research orientations, and discusses some future research trends in this field.
翻訳日:2022-12-30 20:11:01 公開日:2020-02-18
# 脳波によるリハビリテーションロボット適応のための運動意図と反応時間の深層学習

Deep Learning of Movement Intent and Reaction Time for EEG-informed Adaptation of Rehabilitation Robots ( http://arxiv.org/abs/2002.08354v1 )

ライセンス: Link先を確認
Neelesh Kumar and Konstantinos P. Michmizos(参考訳) リハビリテーションロボットが運動学習を促進する上で,適応性が重要なメカニズムであることが示唆された。 しかし、一般的にはロボットから派生した運動運動運動学に基づくもので、特に感覚運動障害の存在下でのパフォーマンスを主観的に測定する。 本稿では,心電図(eeg)を用いて,運動学習の評価や適応に一般的に用いられる2つの運動成分を客観的に測定する深層畳み込みニューラルネットワーク(cnn)を提案する。 一 目標指向運動を開始する意図、及び 二 その運動の反応時間(rt) 13名の被験者が視覚刺激に反応して4方向にリハビリテーションロボットアームを移動させた室内実験から得られたデータに基づいてCNNを評価した。 cnn はインテント (intent vs. no intent) と rt (slow vs. fast) のバイナリ分類において, 80.08% と 79.82% の平均試験精度を達成した。 運動開始前に取得した同期脳波データから,運動学習における個々の運動成分の関連性を予測できることを示す。 したがって,このアプローチはロボット適応をリアルタイムで知らせることができ,リハビリテーション作業を行う能力をさらに向上させる可能性がある。

Mounting evidence suggests that adaptation is a crucial mechanism for rehabilitation robots in promoting motor learning. Yet, it is commonly based on robot-derived movement kinematics, which is a rather subjective measurement of performance, especially in the presence of a sensorimotor impairment. Here, we propose a deep convolutional neural network (CNN) that uses electroencephalography (EEG) as an objective measurement of two kinematics components that are typically used to assess motor learning and thereby adaptation: i) the intent to initiate a goal-directed movement, and ii) the reaction time (RT) of that movement. We evaluated our CNN on data acquired from an in-house experiment where 13 subjects moved a rehabilitation robotic arm in four directions on a plane, in response to visual stimuli. Our CNN achieved average test accuracies of 80.08% and 79.82% in a binary classification of the intent (intent vs. no intent) and RT (slow vs. fast), respectively. Our results demonstrate how individual movement components implicated in distinct types of motor learning can be predicted from synchronized EEG data acquired before the start of the movement. Our approach can, therefore, inform robotic adaptation in real-time and has the potential to further improve one's ability to perform the rehabilitation task.
翻訳日:2022-12-30 20:09:14 公開日:2020-02-18
# セマンティックセメンテーションのための高次ペアASPPネットワーク

High-Order Paired-ASPP Networks for Semantic Segmenation ( http://arxiv.org/abs/2002.07371v1 )

ライセンス: Link先を確認
Yu Zhang, Xin Sun, Junyu Dong, Changrui Chen, Yue Shen(参考訳) 現在の意味セグメンテーションモデルは一階の統計のみを利用するが、高階の統計を探索することは滅多にない。 しかし、一般的な一階統計は、一様でない表現をサポートするには不十分である。 本稿では,様々な特徴量から高次統計量を利用する高次ペアードASPPネットワークを提案する。 ネットワークはまず、バックボーンのすべてのステージからコンテキストの高階情報を抽出する高階表現モジュールを導入する。 彼らは一階法よりも意味的な手がかりや識別的な情報を提供できる。 さらに、早期の高次統計を最終段階に組み込むために、Paired-ASPPモジュールが提案されている。 最終予測のために、低レベル特徴における境界関連および空間コンテキストをさらに保存することができる。 我々の実験は、高次統計が混乱するオブジェクトのパフォーマンスを著しく高めていることを示している。 提案手法は,mIoUが81.6%,45.3%,52.9%,Cityscapes,ADE20K,Pascal-Contextの3つのベンチマークにおいて,ベルやホイッスルを使わずに競争性能を実現する。

Current semantic segmentation models only exploit first-order statistics, while rarely exploring high-order statistics. However, common first-order statistics are insufficient to support a solid unanimous representation. In this paper, we propose High-Order Paired-ASPP Network to exploit high-order statistics from various feature levels. The network first introduces a High-Order Representation module to extract the contextual high-order information from all stages of the backbone. They can provide more semantic clues and discriminative information than the first-order ones. Besides, a Paired-ASPP module is proposed to embed high-order statistics of the early stages into the last stage. It can further preserve the boundary-related and spatial context in the low-level features for final prediction. Our experiments show that the high-order statistics significantly boost the performance on confusing objects. Our method achieves competitive performance without bells and whistles on three benchmarks, i.e, Cityscapes, ADE20K and Pascal-Context with the mIoU of 81.6%, 45.3% and 52.9%.
翻訳日:2022-12-30 20:07:59 公開日:2020-02-18
# Kernel-ARMAモデリングによるネットワーククラスタリングとGrassmannian The Brain-Networkケース

Network Clustering Via Kernel-ARMA Modeling and the Grassmannian The Brain-Network Case ( http://arxiv.org/abs/2002.09943v1 )

ライセンス: Link先を確認
Cong Ye, Konstantinos Slavakis, Pratik V. Patil, Johan Nakuci, Sarah F. Muldoon, John Medaglia(参考訳) 本稿では,時系列データを付加したノードを持つネットワークのためのクラスタリングフレームワークを提案する。 このフレームワークは、状態クラスタリング、状態内のノードクラスタリング(トポロジ識別やコミュニティ検出)、サブネットワーク-状態系列の識別/追跡など、あらゆるタイプのネットワーククラスタリング問題に対処する。 ボトムアップアプローチでは、まずカーネルの自己回帰移動平均モデルを用いて生の時系列データから特徴を抽出し、非線型依存と低ランク表現を明らかにし、グラスマン多様体(グラスマン多様体)に写像する。 すべてのクラスタリングタスクは、グラスマン多様体の基底となるリーマン幾何学を新しい方法で活用することによって実行される。 提案手法を検証するために、脳ネットワーククラスタリングについて検討し、合成および実機能的磁気共鳴画像(fMRI)データに対する広範な数値実験を行い、提案した学習フレームワークがいくつかの最先端クラスタリング手法と比較した。

This paper introduces a clustering framework for networks with nodes annotated with time-series data. The framework addresses all types of network-clustering problems: State clustering, node clustering within states (a.k.a. topology identification or community detection), and even subnetwork-state-sequence identification/tracking. Via a bottom-up approach, features are first extracted from the raw nodal time-series data by kernel autoregressive-moving-average modeling to reveal non-linear dependencies and low-rank representations, and then mapped onto the Grassmann manifold (Grassmannian). All clustering tasks are performed by leveraging the underlying Riemannian geometry of the Grassmannian in a novel way. To validate the proposed framework, brain-network clustering is considered, where extensive numerical tests on synthetic and real functional magnetic resonance imaging (fMRI) data demonstrate that the advocated learning framework compares favorably versus several state-of-the-art clustering schemes.
翻訳日:2022-12-30 20:00:46 公開日:2020-02-18
# LocoGAN -- ローカルに進化したGAN

LocoGAN -- Locally Convolutional GAN ( http://arxiv.org/abs/2002.07897v1 )

ライセンス: Link先を確認
{\L}ukasz Struski, Szymon Knop, Jacek Tabor, Wiktor Daniec, Przemys{\l}aw Spurek(参考訳) 論文では、LocGANという完全な畳み込みGANモデルを構築し、遅延空間は、おそらく異なる解像度のノイズライクな画像によって与えられる。 学習は局所的であり、ノイズのようなイメージ全体ではなく、一定のサイズのサブイメージを処理する。 その結果、LocoGANはLSUN寝室データセットのような任意の次元の画像を生成することができる。 このアプローチのもう1つの利点は、完全に周期的な(例えば円筒状のパノラマ画像)もしくはほぼ周期的な、無限に長い(例えば壁紙)画像を生成することができる位置チャネルを使うことにある。

In the paper we construct a fully convolutional GAN model: LocoGAN, which latent space is given by noise-like images of possibly different resolutions. The learning is local, i.e. we process not the whole noise-like image, but the sub-images of a fixed size. As a consequence LocoGAN can produce images of arbitrary dimensions e.g. LSUN bedroom data set. Another advantage of our approach comes from the fact that we use the position channels, which allows the generation of fully periodic (e.g. cylindrical panoramic images) or almost periodic ,,infinitely long" images (e.g. wall-papers).
翻訳日:2022-12-30 20:00:13 公開日:2020-02-18
# 内因性行動を伴う公正な予測

Fair Prediction with Endogenous Behavior ( http://arxiv.org/abs/2002.07147v1 )

ライセンス: Link先を確認
Christopher Jung and Sampath Kannan and Changhwa Lee and Mallesh M. Pai and Aaron Roth and Rakesh Vohra(参考訳) 連続した領域(例えば刑事裁判)に展開される機械学習アルゴリズムが、異なる人口集団を「公平に」扱うかどうかに対する規制上の関心が高まっている。 しかしながら、フェアネスの概念はいくつか提案されているが、通常は互いに相容れない。 刑事司法を例として,社会が投獄規則を選択するモデルについて検討する。 異なる集団のエージェントは、外部の選択肢(例えば、法的雇用の機会)や犯罪を犯すかどうかを決定する。 グループ間でのタイプiとタイプiiのエラーの平等化は、犯罪率の最小化という目標と一致している。

There is increasing regulatory interest in whether machine learning algorithms deployed in consequential domains (e.g. in criminal justice) treat different demographic groups "fairly." However, there are several proposed notions of fairness, typically mutually incompatible. Using criminal justice as an example, we study a model in which society chooses an incarceration rule. Agents of different demographic groups differ in their outside options (e.g. opportunity for legal employment) and decide whether to commit crimes. We show that equalizing type I and type II errors across groups is consistent with the goal of minimizing the overall crime rate; other popular notions of fairness are not.
翻訳日:2022-12-30 20:00:01 公開日:2020-02-18
# 科学文献による全固体電池の合成過程の注釈と抽出

Annotating and Extracting Synthesis Process of All-Solid-State Batteries from Scientific Literature ( http://arxiv.org/abs/2002.07339v1 )

ライセンス: Link先を確認
Fusataka Kuniyoshi, Kohei Makino, Jun Ozawa, Makoto Miwa(参考訳) 合成プロセスは無機材料化学の分野で計算実験設計を達成するために不可欠である。 本研究では,全固体電池の合成過程の新たなコーパスと,科学文献に埋もれている合成過程を抽出する自動機械読取システムを提案する。 本稿では,フローグラフを用いた合成プロセスの表現を定義し,243枚の論文の実験的セクションからコーパスを作成する。 深層学習に基づくシーケンスタガーと単純なヒューリスティックルールに基づく関係抽出器を用いて自動機械読取システムを開発した。 実験の結果, 最適設定付きシーケンスタグは, 平均F1スコア0.826のエンティティを検出でき, 規則に基づく関係抽出器は平均F1スコア0.887のエンティティを検出できることがわかった。

The synthesis process is essential for achieving computational experiment design in the field of inorganic materials chemistry. In this work, we present a novel corpus of the synthesis process for all-solid-state batteries and an automated machine reading system for extracting the synthesis processes buried in the scientific literature. We define the representation of the synthesis processes using flow graphs, and create a corpus from the experimental sections of 243 papers. The automated machine-reading system is developed by a deep learning-based sequence tagger and simple heuristic rule-based relation extractor. Our experimental results demonstrate that the sequence tagger with the optimal setting can detect the entities with a macro-averaged F1 score of 0.826, while the rule-based relation extractor can achieve high performance with a macro-averaged F1 score of 0.887.
翻訳日:2022-12-30 19:59:18 公開日:2020-02-18
# 中国語単語分割のための新しいクラスタリングニューラルネットワーク

A New Clustering neural network for Chinese word segmentation ( http://arxiv.org/abs/2002.07458v1 )

ライセンス: Link先を確認
Yuze Zhao(参考訳) In this article I proposed a new model to achieve Chinese word segmentation(CWS),which may have the potentiality to apply in other domains in the future.It is a new thinking in CWS compared to previous works,to consider it as a clustering problem instead of a labeling problem.In this model,LSTM and self attention structures are used to collect context also sentence level features in every layer,and after several layers,a clustering model is applied to split characters into groups,which are the final segmentation results.I call this model CLNN.This algorithm can reach 98 percent of F score (without OOV words) and 85 percent to 95 percent F score (with OOV words) in training data sets.Error analyses shows that OOV words will greatly reduce performances,which needs a deeper research in the future.

In this article I proposed a new model to achieve Chinese word segmentation(CWS),which may have the potentiality to apply in other domains in the future.It is a new thinking in CWS compared to previous works,to consider it as a clustering problem instead of a labeling problem.In this model,LSTM and self attention structures are used to collect context also sentence level features in every layer,and after several layers,a clustering model is applied to split characters into groups,which are the final segmentation results.I call this model CLNN.This algorithm can reach 98 percent of F score (without OOV words) and 85 percent to 95 percent F score (with OOV words) in training data sets.Error analyses shows that OOV words will greatly reduce performances,which needs a deeper research in the future.
翻訳日:2022-12-30 19:59:02 公開日:2020-02-18
# 生体試料のフーリエ変換赤外スペクトルにおけるMie散乱補正のためのディープニューラルネットワーク

Deep Neural Networks for the Correction of Mie Scattering in Fourier-Transformed Infrared Spectra of Biological Samples ( http://arxiv.org/abs/2002.07681v1 )

ライセンス: Link先を確認
Arne P. Raulf and Joshua Butke and Lukas Menzen and Claus K\"upper and Frederik Gro{\ss}erueschkamp and Klaus Gerwert and Axel Mosig(参考訳) 細胞または組織標本から得られた赤外スペクトルは、しばしば相当量の(共鳴)ミエ散乱を伴い、フーリエ変換赤外分光法(FTIR)において、非線形で非付加的なスペクトル成分によって生化学的に関連のあるスペクトル情報を覆い隠蔽する。 FTIRスペクトルに対する多くの機械学習アプローチは、赤外線スペクトルから散乱成分を計算的に除去する前処理に頼っている。 本稿では,この複雑な前処理関数をディープニューラルネットワークを用いて近似する手法を提案する。 我々が示すように、結果のモデルは数桁の速さで、リアルタイム臨床応用に重要であるだけでなく、異なる組織タイプにまたがって強く一般化している。 さらに,提案手法は,計算時間と補正スペクトルとのトレードオフを克服し,人工基準スペクトルに偏りを生じさせる。

Infrared spectra obtained from cell or tissue specimen have commonly been observed to involve a significant degree of (resonant) Mie scattering, which often overshadows biochemically relevant spectral information by a non-linear, non-additive spectral component in Fourier transformed infrared (FTIR) spectroscopic measurements. Correspondingly, many successful machine learning approaches for FTIR spectra have relied on preprocessing procedures that computationally remove the scattering components from an infrared spectrum. We propose an approach to approximate this complex preprocessing function using deep neural networks. As we demonstrate, the resulting model is not just several orders of magnitudes faster, which is important for real-time clinical applications, but also generalizes strongly across different tissue types. Furthermore, our proposed method overcomes the trade-off between computation time and the corrected spectrum being biased towards an artificial reference spectrum.
翻訳日:2022-12-30 19:52:45 公開日:2020-02-18
# 神経注意型マルチビューマシン

Neural Attentive Multiview Machines ( http://arxiv.org/abs/2002.07696v1 )

ライセンス: Link先を確認
Oren Barkan, Ori Katz, Noam Koenigstein(参考訳) マルチビュー表現学習における重要な問題は、目前にある特定のタスクに対するビューの最適な組み合わせを見つけることである。 そこで我々は,新しいアテンション機構を用いて,マルチビュー項目の表現と類似性を学習するニューラル・アテンタティブ・マルチビュー・マシンであるNAMを紹介する。 NAMは複数の情報ソースを利用し、教師付きタスクに対する関連性を自動的に定量化する。 最後に、NAMの非常に実用的な利点は、ビューの欠如したデータセットに対する堅牢性である。 映画やアプリレコメンデーションのタスクにおけるNAMの有効性を実証する。 評価の結果,namは,コールドスタートシナリオを含むアイテムレコメンデーションタスクにおいて,単一ビューモデルや代替マルチビューメソッドよりも優れていた。

An important problem in multiview representation learning is finding the optimal combination of views with respect to the specific task at hand. To this end, we introduce NAM: a Neural Attentive Multiview machine that learns multiview item representations and similarity by employing a novel attention mechanism. NAM harnesses multiple information sources and automatically quantifies their relevancy with respect to a supervised task. Finally, a very practical advantage of NAM is its robustness to the case of dataset with missing views. We demonstrate the effectiveness of NAM for the task of movies and app recommendations. Our evaluations indicate that NAM outperforms single view models as well as alternative multiview methods on item recommendations tasks, including cold-start scenarios.
翻訳日:2022-12-30 19:52:13 公開日:2020-02-18
# グラフ群が与える位相に基づくフレキシブル・アウトリー検出器

A flexible outlier detector based on a topology given by graph communities ( http://arxiv.org/abs/2002.07791v1 )

ライセンス: Link先を確認
O. Ramos Terrades, A. Berenguel, D. Gil(参考訳) 異常検出は、機械学習手法と統計的予測モデルの最適性能に不可欠である。 データクリーニングプロセスにおける単なる技術的ステップではなく、不正な文書検出、医療応用、診断支援システム、セキュリティ脅威の検出など、多くの分野で重要なトピックである。 人口ベースの手法とは対照的に、近傍ベースの局所的なアプローチは、小さなサンプルサイズの不均衡問題でうまく機能する可能性を持つ単純な柔軟な手法である。 しかし、局所的なアプローチの主な関心事は、各サンプル地区の計算がメソッド性能に与える影響である。 ほとんどのアプローチでは特徴空間内の距離を使い、いくつかのパラメータを慎重に選択する必要がある1つの近傍を定義する。 この研究は、位相多様体と見なされる特徴空間におけるサンプルラベルの不均一性の局所測度に基づく局所的アプローチを示す。 トポロジーは、特徴空間内の互いに隣接する近傍を成す重み付きグラフのコミュニティを用いて計算される。 この方法では、パラメータの微調整なしに複素空間の構造を記述できる複数の近傍の集合を提供する。 実世界のデータセットに関する広範な実験は、マルチビューとシングルビューの設定において、我々のアプローチが、ローカルとグローバルの両方の戦略よりも優れていることを示している。

Outlier, or anomaly, detection is essential for optimal performance of machine learning methods and statistical predictive models. It is not just a technical step in a data cleaning process but a key topic in many fields such as fraudulent document detection, in medical applications and assisted diagnosis systems or detecting security threats. In contrast to population-based methods, neighborhood based local approaches are simple flexible methods that have the potential to perform well in small sample size unbalanced problems. However, a main concern of local approaches is the impact that the computation of each sample neighborhood has on the method performance. Most approaches use a distance in the feature space to define a single neighborhood that requires careful selection of several parameters. This work presents a local approach based on a local measure of the heterogeneity of sample labels in the feature space considered as a topological manifold. Topology is computed using the communities of a weighted graph codifying mutual nearest neighbors in the feature space. This way, we provide with a set of multiple neighborhoods able to describe the structure of complex spaces without parameter fine tuning. The extensive experiments on real-world data sets show that our approach overall outperforms, both, local and global strategies in multi and single view settings.
翻訳日:2022-12-30 19:51:54 公開日:2020-02-18
# 観測的不特定性、一般化可能性、自由エネルギー

Observational nonidentifiability, generalized likelihood and free energy ( http://arxiv.org/abs/2002.07884v1 )

ライセンス: Link先を確認
A.E. Allahverdyan(参考訳) 混合モデルにおけるパラメータ推定問題と観測的非同定性について検討した: 全モデル(隠れ変数も含む)は同定可能であるが、辺(観測される)モデルではない。 したがって、縁的可能性の大域的最大値は(無限に)退化し、縁的可能性の予測はユニークではない。 有効温度を導入し, 自由エネルギーに類似させることにより, 限界確率を一般化する方法を示す。 この一般化は、その最大化は、限界確率の1つの縮退した最大値のランダム選択や、そのような最大値上の平均値よりも良い一意な結果をもたらすため、観測的な非同定可能性を解決する。 一般化された確率は、条件性原理を持つような通常の可能性から多くの特徴を継承し、その局所的な最大値は適切に修正された期待最大化法によって探索することができる。 一般化可能性の最大化はエントロピー最適化に関係している。

We study the parameter estimation problem in mixture models with observational nonidentifiability: the full model (also containing hidden variables) is identifiable, but the marginal (observed) model is not. Hence global maxima of the marginal likelihood are (infinitely) degenerate and predictions of the marginal likelihood are not unique. We show how to generalize the marginal likelihood by introducing an effective temperature, and making it similar to the free energy. This generalization resolves the observational nonidentifiability, since its maximization leads to unique results that are better than a random selection of one degenerate maximum of the marginal likelihood or the averaging over many such maxima. The generalized likelihood inherits many features from the usual likelihood, e.g. it holds the conditionality principle, and its local maximum can be searched for via suitably modified expectation-maximization method. The maximization of the generalized likelihood relates to entropy optimization.
翻訳日:2022-12-30 19:50:24 公開日:2020-02-18
# スーパーグラフによる実証的政策評価

Empirical Policy Evaluation with Supergraphs ( http://arxiv.org/abs/2002.07905v1 )

ライセンス: Link先を確認
Daniel Vial, Vijay Subramanian(参考訳) 強化学習における経験的政策評価問題に対するアルゴリズムの考案と解析を行う。 我々のアルゴリズムは、すべての状態から前進する前方アプローチとは対照的に、高コスト状態から後方に探索し、高価値状態を見つける。 実験的に後方探索の有用性を実証した論文がいくつかあるが、我々のアルゴリズムは平均ケースサンプルの複雑さを$o(s \log s)$から$o(\log s)$まで低減できることを示す厳密な分析を行っている。

We devise and analyze algorithms for the empirical policy evaluation problem in reinforcement learning. Our algorithms explore backward from high-cost states to find high-value ones, in contrast to forward approaches that work forward from all states. While several papers have demonstrated the utility of backward exploration empirically, we conduct rigorous analyses which show that our algorithms can reduce average-case sample complexity from $O(S \log S)$ to as low as $O(\log S)$.
翻訳日:2022-12-30 19:49:56 公開日:2020-02-18
# 発話レベル感情認識のための階層的トランスフォーマネットワーク

Hierarchical Transformer Network for Utterance-level Emotion Recognition ( http://arxiv.org/abs/2002.07551v1 )

ライセンス: Link先を確認
QingBiao Li (Beijing University of Posts and Telecommunications), ChunHua Wu (Beijing University of Posts and Telecommunications), KangFeng Zheng (Beijing University of Posts and Telecommunications) and Zhe Wang (Beijing University of Posts and Telecommunications)(参考訳) テキスト中の感情の検出には大きな進歩があったが、発話レベルの感情認識(ULER)の分野では、解決すべき問題がまだたくさんある。 本稿では,ダイアログサイステンスにおけるULERの課題について述べる。 1)同じ発話は、異なる文脈や異なる話者から異なる感情を伝達することができる。 2) 長期的文脈的インフォーメーションは効果的に捉えにくい。 3)従来のテキスト分類問題とは異なり、このタスクは限られた数のデータセットでサポートされており、そのほとんどは不適切な会話や音声を含んでいる。 これらの問題に対処するために、単語レベルの入力をモデル化する下層変換器と、発話レベルの埋め込みのコンテキストをキャプチャする上層変換器を備えた階層変換器フレームワーク(他の研究の他に、この論文の「変換器」は変圧器のエンコーダ部分を指すことが多い)を提案する。 我々は,変換器(BERT)からの双方向エンコーダを,モデルに外部データを導入し,データ不足の問題をある程度解決する低レベルトランスフォーマーとして,事前訓練された言語モデル双方向エンコーダを用いた。 さらに、初めてモデルに話者埋め込みを追加し、モデルが話者間の相互作用を捉えられるようにします。 Friends, EmotionPush, EmoryNLPの3つのダイアログ感情データセットの実験により、提案した階層トランスフォーマーネットワークモデルは、マクロF1の観点から各データセットの最先端メソッドに対して1.98%、2.83%、および3.94%の改善を達成した。

While there have been significant advances in de-tecting emotions in text, in the field of utter-ance-level emotion recognition (ULER), there are still many problems to be solved. In this paper, we address some challenges in ULER in dialog sys-tems. (1) The same utterance can deliver different emotions when it is in different contexts or from different speakers. (2) Long-range contextual in-formation is hard to effectively capture. (3) Unlike the traditional text classification problem, this task is supported by a limited number of datasets, among which most contain inadequate conversa-tions or speech. To address these problems, we propose a hierarchical transformer framework (apart from the description of other studies, the "transformer" in this paper usually refers to the encoder part of the transformer) with a lower-level transformer to model the word-level input and an upper-level transformer to capture the context of utterance-level embeddings. We use a pretrained language model bidirectional encoder representa-tions from transformers (BERT) as the lower-level transformer, which is equivalent to introducing external data into the model and solve the problem of data shortage to some extent. In addition, we add speaker embeddings to the model for the first time, which enables our model to capture the in-teraction between speakers. Experiments on three dialog emotion datasets, Friends, EmotionPush, and EmoryNLP, demonstrate that our proposed hierarchical transformer network models achieve 1.98%, 2.83%, and 3.94% improvement, respec-tively, over the state-of-the-art methods on each dataset in terms of macro-F1.
翻訳日:2022-12-30 19:44:13 公開日:2020-02-18
# tie: facebookにおけるソーシャルメディアの完全性向上のための時間的インタラクション埋め込み

TIES: Temporal Interaction Embeddings For Enhancing Social Media Integrity At Facebook ( http://arxiv.org/abs/2002.07917v1 )

ライセンス: Link先を確認
Nima Noorshams, Saurabh Verma, Aude Hofleitner(参考訳) 設立以来、facebookはオンラインソーシャルコミュニティの不可欠な部分となっている。 人々はFacebookを頼りにし、他の人とつながり、コミュニティを構築する。 その結果,急速に成長するネットワークの完全性を,迅速かつスケーラブルに保護することが最重要である。 本稿では、プラットフォームを悪用しようとする人々から、Facebookにおけるさまざまなソーシャルメディアエンティティを保護するための取り組みについて述べる。 本稿では、ログな社会的相互作用を捉え、さらに適切な行動にフラグを立てるための、新しい時間的相互作用埋め込み(TIES)モデルを提案する。 TIESは、Facebookスケールネットワークにおける教師付き、ディープラーニング、生産可能なモデルである。 整合性に関する先行研究は、主にソーシャルエンティティの静的または特定の動的機能のみをキャプチャすることに焦点を当てている。 対照的に、TIESはグラフ埋め込みと深部連続パターン学習の領域における最近の進歩により、これらの変動挙動を統一モデルで捉えることができる。 関連が現実世界に与える影響を示すために,不正情報の拡散防止,偽アカウント検出,広告の支払いリスク低減など,プラットフォームの整合性を高めるためのアプリケーションをいくつか紹介する。

Since its inception, Facebook has become an integral part of the online social community. People rely on Facebook to make connections with others and build communities. As a result, it is paramount to protect the integrity of such a rapidly growing network in a fast and scalable manner. In this paper, we present our efforts to protect various social media entities at Facebook from people who try to abuse our platform. We present a novel Temporal Interaction EmbeddingS (TIES) model that is designed to capture rogue social interactions and flag them for further suitable actions. TIES is a supervised, deep learning, production ready model at Facebook-scale networks. Prior works on integrity problems are mostly focused on capturing either only static or certain dynamic features of social entities. In contrast, TIES can capture both these variant behaviors in a unified model owing to the recent strides made in the domains of graph embedding and deep sequential pattern learning. To show the real-world impact of TIES, we present a few applications especially for preventing spread of misinformation, fake account detection, and reducing ads payment risks in order to enhance the platform's integrity.
翻訳日:2022-12-30 19:43:40 公開日:2020-02-18
# プライバシ保護を備えたフェデレーションエクストラツリー

Federated Extra-Trees with Privacy Preserving ( http://arxiv.org/abs/2002.07323v1 )

ライセンス: Link先を確認
Yang Liu, Mingxin Chen, Wenxi Zhang, Junbo Zhang, Yu Zheng(参考訳) データは至るところに分散しており、集中化が難しいことがよく見られる。 データプライバシとセキュリティも、センシティブなトピックになります。 欧州連合の一般データ保護規則(GDPR)のような法律や規則は、市民のデータプライバシーを保護するように設計されている。 しかし、機械学習はパフォーマンス向上のために大量のデータを必要とし、現在の状況では、現実のAIアプリケーションを極めて困難な状況にデプロイする。 本稿では,これらの課題に対処するために,フェデレーション木モデルにおいて局所微分プライバシーを適用する,新たなプライバシー保存型フェデレーション機械学習モデルであるフェデレーション外木を提案する。 生データを交換することなく、異なるクライアント上でモデリングを共同処理することで、安全なマルチ機関機械学習システムを開発した。 我々は,公開データセットに関する広範囲な実験を行い,実世界のシナリオをシミュレートし,その効率と堅牢性を検証した。 全体として、データアイランド問題を扱うための拡張可能でスケーラブルで実用的なソリューションを提示しました。

It is commonly observed that the data are scattered everywhere and difficult to be centralized. The data privacy and security also become a sensitive topic. The laws and regulations such as the European Union's General Data Protection Regulation (GDPR) are designed to protect the public's data privacy. However, machine learning requires a large amount of data for better performance, and the current circumstances put deploying real-life AI applications in an extremely difficult situation. To tackle these challenges, in this paper we propose a novel privacy-preserving federated machine learning model, named Federated Extra-Trees, which applies local differential privacy in the federated trees model. A secure multi-institutional machine learning system was developed to provide superior performance by processing the modeling jointly on different clients without exchanging any raw data. We have validated the accuracy of our work by conducting extensive experiments on public datasets and the efficiency and robustness were also verified by simulating the real-world scenarios. Overall, we presented an extensible, scalable and practical solution to handle the data island problem.
翻訳日:2022-12-30 19:43:24 公開日:2020-02-18
# クラスタリングタスクによる自己スーパービジョンにおけるデータ変換の洞察

Data Transformation Insights in Self-supervision with Clustering Tasks ( http://arxiv.org/abs/2002.07384v1 )

ライセンス: Link先を確認
Abhimanu Kumar, Aniket Anand Deshmukh, Urun Dogan, Denis Charles, Eren Manavoglu(参考訳) ラベル不足ドメインに対するディープラーニングの利用を拡大する上で、セルフスーパービジョンが鍵となる。 ほとんどの自己監督型アプローチでは、データ変換が重要な役割を果たす。 しかし、これまで変換の影響は研究されていない。 さらに、異なる変換がシステムに異なる影響を与える可能性がある。 自己監督タスクにおけるデータ変換の利用,特にクラスタリングに関する新たな知見を提供する。 我々は、ある変換セットが自己教師付きクラスタリングの収束に役立つことを理論的および経験的に示す。 また、変換が役に立たない場合や、場合によっては有害な場合も示します。 コンベックスの有効な変換を伴うより高速な収束率と、元のオプティマ集合への収束の証明とともに、ある非凸目的の族を示す。 私たちは現実世界のデータ実験だけでなく合成も行っています。 実証的な結果が提供される理論的洞察に一致する。

Self-supervision is key to extending use of deep learning for label scarce domains. For most of self-supervised approaches data transformations play an important role. However, up until now the impact of transformations have not been studied. Furthermore, different transformations may have different impact on the system. We provide novel insights into the use of data transformation in self-supervised tasks, specially pertaining to clustering. We show theoretically and empirically that certain set of transformations are helpful in convergence of self-supervised clustering. We also show the cases when the transformations are not helpful or in some cases even harmful. We show faster convergence rate with valid transformations for convex as well as certain family of non-convex objectives along with the proof of convergence to the original set of optima. We have synthetic as well as real world data experiments. Empirically our results conform with the theoretical insights provided.
翻訳日:2022-12-30 19:42:28 公開日:2020-02-18
# ブロックサイクルデータによる分散最適化

Distributed Optimization over Block-Cyclic Data ( http://arxiv.org/abs/2002.07454v1 )

ライセンス: Link先を確認
Yucheng Ding, Chaoyue Niu, Yikai Yan, Zhenzhe Zheng, Fan Wu, Guihai Chen, Shaojie Tang, Rongfei Jia(参考訳) 本研究は,クライアントの非平衡データと非二項データとがブロック循環構造を持つフェデレート学習の基礎となる実践的データ特性について考察する。 このようなデータ構造は、協調トレーニング中にクライアントとブロックのバイアスを導入します。 このバイアスを克服するために, クライアントの総数に対して線形高速化を実現するために, 収束率$O(1/\sqrt{NT})$のマルチモデル並列SGD (MM-PSGD) とマルチチェーン並列SGD (MC-PSGD) という2つの新しい分散最適化アルゴリズムを提案する。 特にmm-psgdはブロック混合トレーニング戦略を採用し、mc-psgdはブロック分離トレーニング戦略をさらに追加している。 どちらのアルゴリズムも、異なるサイクルから生成された歴史的グローバルモデルを平均化し比較することで、ブロックごとに特定の予測子を作成する。 CIFAR-10データセットを用いてアルゴリズムを広範囲に評価した。 評価の結果, 従来のフェデレーション平均化アルゴリズムよりも精度が優れており, 臨界パラメータの分散に対するロバスト性も保たれていることがわかった。

We consider practical data characteristics underlying federated learning, where unbalanced and non-i.i.d. data from clients have a block-cyclic structure: each cycle contains several blocks, and each client's training data follow block-specific and non-i.i.d. distributions. Such a data structure would introduce client and block biases during the collaborative training: the single global model would be biased towards the client or block specific data. To overcome the biases, we propose two new distributed optimization algorithms called multi-model parallel SGD (MM-PSGD) and multi-chain parallel SGD (MC-PSGD) with a convergence rate of $O(1/\sqrt{NT})$, achieving a linear speedup with respect to the total number of clients. In particular, MM-PSGD adopts the block-mixed training strategy, while MC-PSGD further adds the block-separate training strategy. Both algorithms create a specific predictor for each block by averaging and comparing the historical global models generated in this block from different cycles. We extensively evaluate our algorithms over the CIFAR-10 dataset. Evaluation results demonstrate that our algorithms significantly outperform the conventional federated averaging algorithm in terms of test accuracy, and also preserve robustness for the variance of critical parameters.
翻訳日:2022-12-30 19:41:52 公開日:2020-02-18
# 自己回帰ニューラルネットワーク流を用いた重力波パラメータ推定

Gravitational-wave parameter estimation with autoregressive neural network flows ( http://arxiv.org/abs/2002.07656v1 )

ライセンス: Link先を確認
Stephen R. Green, Christine Simpson, Jonathan Gair(参考訳) ニューラルネットワークを用いた重力波データから二元ブラックホール系のパラメータを高速に推定するための自己回帰正規化フローを導入する。 正規化フロー(英: normalizing flow)は、単純な確率分布からより複雑な分布への変換を誘導するために用いられるサンプル空間上の可逆写像である。 重力波への最初の応用は、検出器ひずみデータに基づく自己回帰流を用いて、多変量標準正規分布を系のパラメータの後方分布にマッピングする。 5パラメータの$(m_1,m_2, \phi_0,t_c,d_l)$および定常ガウス雑音を一定パワースペクトル密度で実現したimrフェノムpv2波形からなる人工ひずみデータに基づいてモデルを訓練する。 これにより、重力波パラメータ推定に対する現在の最良のディープラーニングアプローチに匹敵するパフォーマンスが得られる。 次に、可変オートエンコーダフレームワークに自己回帰フローを組み込むことにより、より強力な潜在変数モデルを構築する。 このモデルはマルコフ連鎖モンテカルロに匹敵する性能を有し、特にマルチモーダルの$\phi_0$後方をうまくモデル化した。 最後に、拡張されたパラメータ空間上で自己回帰的潜在変数モデルをトレーニングし、スピン$(\chi_{1z}, \chi_{2z})$とバイナリ傾斜$\theta_{jn}$を含む。 いずれの場合もサンプリングは非常に高速で、後部サンプルを10^4$引き出すのに2秒もかからない。

We introduce the use of autoregressive normalizing flows for rapid likelihood-free inference of binary black hole system parameters from gravitational-wave data with deep neural networks. A normalizing flow is an invertible mapping on a sample space that can be used to induce a transformation from a simple probability distribution to a more complex one: if the simple distribution can be rapidly sampled and its density evaluated, then so can the complex distribution. Our first application to gravitational waves uses an autoregressive flow, conditioned on detector strain data, to map a multivariate standard normal distribution into the posterior distribution over system parameters. We train the model on artificial strain data consisting of IMRPhenomPv2 waveforms drawn from a five-parameter $(m_1, m_2, \phi_0, t_c, d_L)$ prior and stationary Gaussian noise realizations with a fixed power spectral density. This gives performance comparable to current best deep-learning approaches to gravitational-wave parameter estimation. We then build a more powerful latent variable model by incorporating autoregressive flows within the variational autoencoder framework. This model has performance comparable to Markov chain Monte Carlo and, in particular, successfully models the multimodal $\phi_0$ posterior. Finally, we train the autoregressive latent variable model on an expanded parameter space, including also aligned spins $(\chi_{1z}, \chi_{2z})$ and binary inclination $\theta_{JN}$, and show that all parameters and degeneracies are well-recovered. In all cases, sampling is extremely fast, requiring less than two seconds to draw $10^4$ posterior samples.
翻訳日:2022-12-30 19:41:15 公開日:2020-02-18
# 階層的相関クラスタリングとツリー保存埋め込み

Hierarchical Correlation Clustering and Tree Preserving Embedding ( http://arxiv.org/abs/2002.07756v1 )

ライセンス: Link先を確認
Morteza Haghir Chehreghani(参考訳) 本稿では,よく知られた相関クラスタリングを拡張して階層的クラスタを生成する階層的相関クラスタリング手法を提案する。 次に,(ツリー保存)埋め込みと特徴抽出に使用する階層の埋め込みについて検討する。 このような埋め込みの単一結合埋め込みとミニマックス距離との接続について検討し,特に相関クラスタリングのためのミニマックス距離の研究を行った。 最後に,いくつかのuciおよび20のニュースグループデータセット上での手法の性能を示す。

We propose a hierarchical correlation clustering method that extends the well-known correlation clustering to produce hierarchical clusters. We then investigate embedding the respective hierarchy to be used for (tree preserving) embedding and feature extraction. We study the connection of such an embedding to single linkage embedding and minimax distances, and in particular study minimax distances for correlation clustering. Finally, we demonstrate the performance of our methods on several UCI and 20 newsgroup datasets.
翻訳日:2022-12-30 19:33:43 公開日:2020-02-18
# CAUSE:Attribution Methods を用いたイベントシーケンスからグランガー因果関係の学習

CAUSE: Learning Granger Causality from Event Sequences using Attribution Methods ( http://arxiv.org/abs/2002.07906v1 )

ライセンス: Link先を確認
Wei Zhang, Thomas Kobber Panum, Somesh Jha, Prasad Chalasani, and David Page(参考訳) 本稿では,非同期,相互依存,多型イベントシーケンスからイベントタイプ間のグランガー因果関係を学習する問題について検討する。 既存の作業は、モデル柔軟性の制限またはモデル説明性の低下のいずれかに悩まされるため、さまざまなイベント相互依存性を持つさまざまなイベントシーケンスで、Granger因果関係を明らかにすることができない。 このような弱点に対処するため,研究課題の新たな枠組みであるCAUSE(Causality from AttribUtions on Sequence of Events)を提案する。 CAUSEの鍵となる考え方は、まず神経点過程を適合させることで、基礎となるイベント相互依存性を暗黙的にキャプチャし、その後、公理的帰属法を用いてグランガー因果統計から抽出することである。 各種イベント相互依存性を考慮に入れた複数のデータセット間で、CAUSEは、最先端の手法に対して、タイプ間グランガー因果関係を正しく推定する上で、優れた性能を発揮することを示す。

We study the problem of learning Granger causality between event types from asynchronous, interdependent, multi-type event sequences. Existing work suffers from either limited model flexibility or poor model explainability and thus fails to uncover Granger causality across a wide variety of event sequences with diverse event interdependency. To address these weaknesses, we propose CAUSE (Causality from AttribUtions on Sequence of Events), a novel framework for the studied task. The key idea of CAUSE is to first implicitly capture the underlying event interdependency by fitting a neural point process, and then extract from the process a Granger causality statistic using an axiomatic attribution method. Across multiple datasets riddled with diverse event interdependency, we demonstrate that CAUSE achieves superior performance on correctly inferring the inter-type Granger causality over a range of state-of-the-art methods.
翻訳日:2022-12-30 19:33:08 公開日:2020-02-18
# ブロックスイッチ:ディープラーニングセキュリティのための確率的アプローチ

Block Switching: A Stochastic Approach for Deep Learning Security ( http://arxiv.org/abs/2002.07920v1 )

ライセンス: Link先を確認
Xiao Wang, Siyue Wang, Pin-Yu Chen, Xue Lin, and Peter Chin(参考訳) 近年の敵対的攻撃の研究は、現代のディープラーニングモデルの脆弱性を明らかにしている。 すなわち、入力の微妙な摂動によって、訓練されたネットワークを高精度に構築し、任意の誤った予測を生成できるが、人間の視覚システムには受け入れられない。 本稿では,確率性に基づく敵の攻撃に対する防御戦略であるブロックスイッチング(bs)を提案する。 BSはモデルレイヤのブロックを複数の並列チャネルに置き換え、アクティブチャネルは実行時にランダムに割り当てられるので、敵に予測できない。 実験の結果,bsはより分散した入力勾配分布を示し,sap (stochastic activation pruning) のような他の確率的防御よりも優れた防御効果を示す。 他の防御と比べ、BSは以下の特徴が特徴である。 i)BSは検査精度の低下を減少させる。 (ii)BSは攻撃非依存で (iii)bsは他の防御と互換性があり、他と共同で使用できる。

Recent study of adversarial attacks has revealed the vulnerability of modern deep learning models. That is, subtly crafted perturbations of the input can make a trained network with high accuracy produce arbitrary incorrect predictions, while maintain imperceptible to human vision system. In this paper, we introduce Block Switching (BS), a defense strategy against adversarial attacks based on stochasticity. BS replaces a block of model layers with multiple parallel channels, and the active channel is randomly assigned in the run time hence unpredictable to the adversary. We show empirically that BS leads to a more dispersed input gradient distribution and superior defense effectiveness compared with other stochastic defenses such as stochastic activation pruning (SAP). Compared to other defenses, BS is also characterized by the following features: (i) BS causes less test accuracy drop; (ii) BS is attack-independent and (iii) BS is compatible with other defenses and can be used jointly with others.
翻訳日:2022-12-30 19:32:15 公開日:2020-02-18
# 第一原理に基づくニューラルネットワーク

A Neural Network Based on First Principles ( http://arxiv.org/abs/2002.07469v1 )

ライセンス: Link先を確認
Paul M Baggenstoss(参考訳) 本稿では,各層が線形次元還元変換から始まることを前提として,第一原理からニューラルネットワークを導出する。 このアプローチは、最大エントロピー(最大エントロピー)の原理に訴え、各層の入力データの後方分布を、層出力変数に基づいて求める。 この後方にはよく定義された平均である条件付き平均推定器があり、理論上はsgmoid、softplus、reluに似た活性化関数を持つニューラルネットワークの一種を用いて計算される。 これは暗黙的にそれらの使用の理論的正当化を提供する。 MaxEnt以前の条件分布と条件平均推定器を求める定理が提案され、特別の場合の結果が統一される。 層を組み合わせると、従来のフィードフォワード分析ネットワークと、再構成経路における線形ベイズ信念ネットワークの一種との自動エンコーダが生成される。

In this paper, a Neural network is derived from first principles, assuming only that each layer begins with a linear dimension-reducing transformation. The approach appeals to the principle of Maximum Entropy (MaxEnt) to find the posterior distribution of the input data of each layer, conditioned on the layer output variables. This posterior has a well-defined mean, the conditional mean estimator, that is calculated using a type of neural network with theoretically-derived activation functions similar to sigmoid, softplus, and relu. This implicitly provides a theoretical justification for their use. A theorem that finds the conditional distribution and conditional mean estimator under the MaxEnt prior is proposed, unifying results for special cases. Combining layers results in an auto-encoder with conventional feed-forward analysis network and a type of linear Bayesian belief network in the reconstruction path.
翻訳日:2022-12-30 19:25:12 公開日:2020-02-18
# ワッサースタイン最小速度法による非正規化モデル学習

A Wasserstein Minimum Velocity Approach to Learning Unnormalized Models ( http://arxiv.org/abs/2002.07501v1 )

ライセンス: Link先を確認
Ziyu Wang, Shuyu Cheng, Yueru Li, Jun Zhu, Bo Zhang(参考訳) スコアマッチングは柔軟な非正規化モデルの学習に効果的なアプローチを提供するが、その拡張性は二階微分の評価の必要性によって制限される。 本稿では,これらの目的とワッサーシュタイン勾配流との新たな関係を観測することにより,スコアマッチングを含む学習目的の一般ファミリーにスケーラブルな近似を提案する。 我々は、多様体上のニューラル密度推定器を学習し、暗黙の変分とワッサーシュタイン自動エンコーダを、多様体値の先行で訓練する。

Score matching provides an effective approach to learning flexible unnormalized models, but its scalability is limited by the need to evaluate a second-order derivative. In this paper, we present a scalable approximation to a general family of learning objectives including score matching, by observing a new connection between these objectives and Wasserstein gradient flows. We present applications with promise in learning neural density estimators on manifolds, and training implicit variational and Wasserstein auto-encoders with a manifold-valued prior.
翻訳日:2022-12-30 19:24:57 公開日:2020-02-18
# 量子化ロバストネスのためのグラディエント$\ell_1$正規化

Gradient $\ell_1$ Regularization for Quantization Robustness ( http://arxiv.org/abs/2002.07520v1 )

ライセンス: Link先を確認
Milad Alizadeh, Arash Behboodi, Mart van Baalen, Christos Louizos, Tijmen Blankevoort, Max Welling(参考訳) ニューラルネットワークの重み付けとアクティベーションの定量化が損失に与える影響を解析し、トレーニング後の量子化に対するロバスト性を改善する単純な正規化スキームを導出する。 量子化対応ネットワークをトレーニングすることにより、アプリケーション変更のエネルギーとメモリ要求として、異なるビット幅にオンデマンドで量子化できる1組の重みを格納できる。 特定のビット幅のみを目標とし、トレーニングデータやパイプラインへのアクセスを必要とするストレートスルー推定器を用いた量子化学習とは異なり、正規化ベースの手法は、"オンザフライ"後の量子化を様々なビット幅に道を開く。 量子化を$\ell_\infty$-bounded摂動としてモデル化することで、損失拡大の1次項を$\ell_1$-normの勾配を用いて正規化できることを示す。 我々はcifar-10とimagenetデータセット上の異なるアーキテクチャにおける正規化スキームの有効性を実験的に検証した。

We analyze the effect of quantizing weights and activations of neural networks on their loss and derive a simple regularization scheme that improves robustness against post-training quantization. By training quantization-ready networks, our approach enables storing a single set of weights that can be quantized on-demand to different bit-widths as energy and memory requirements of the application change. Unlike quantization-aware training using the straight-through estimator that only targets a specific bit-width and requires access to training data and pipeline, our regularization-based method paves the way for "on the fly'' post-training quantization to various bit-widths. We show that by modeling quantization as a $\ell_\infty$-bounded perturbation, the first-order term in the loss expansion can be regularized using the $\ell_1$-norm of gradients. We experimentally validate the effectiveness of our regularization scheme on different architectures on CIFAR-10 and ImageNet datasets.
翻訳日:2022-12-30 19:24:28 公開日:2020-02-18
# 問合せに基づく要約のための条件付き自己照合

Conditional Self-Attention for Query-based Summarization ( http://arxiv.org/abs/2002.07338v1 )

ライセンス: Link先を確認
Yujia Xie, Tianyi Zhou, Yi Mao, Weizhu Chen(参考訳) セルフアテンション機構は、シーケンス内の任意の位置間の依存性をキャプチャする柔軟性があるため、様々なnlpタスクで大きな成功を収めている。 クエリベースの要約(qsumm)やナレッジグラフ推論のような問題では、各入力シーケンスが追加のクエリに関連付けられている場合、条件付きコンテキスト依存を明示的にモデル化することで、より正確なソリューションが実現できます。 本稿では,条件依存モデリング用に設計されたニューラルネットワークモジュールであるtextit{conditional self-attention} (CSA)を提案する。 CSAは、入力の一致スコアを与えられたクエリに合わせることで、自己アテンションモジュール内の入力トークン間のペアの注意を調節する。 これにより、CSAによってモデル化されたコンテキスト依存は、クエリに非常に関連性がある。 さらに、異なる種類の注意によって定義されるCSAの変種について検討した。 DebatepediaとHotpotQAベンチマークデータセットの実験では、Qsumm問題に対するバニラトランスフォーマーや以前のモデルよりも一貫してパフォーマンスが向上している。

Self-attention mechanisms have achieved great success on a variety of NLP tasks due to its flexibility of capturing dependency between arbitrary positions in a sequence. For problems such as query-based summarization (Qsumm) and knowledge graph reasoning where each input sequence is associated with an extra query, explicitly modeling such conditional contextual dependencies can lead to a more accurate solution, which however cannot be captured by existing self-attention mechanisms. In this paper, we propose \textit{conditional self-attention} (CSA), a neural network module designed for conditional dependency modeling. CSA works by adjusting the pairwise attention between input tokens in a self-attention module with the matching score of the inputs to the given query. Thereby, the contextual dependencies modeled by CSA will be highly relevant to the query. We further studied variants of CSA defined by different types of attention. Experiments on Debatepedia and HotpotQA benchmark datasets show CSA consistently outperforms vanilla Transformer and previous models for the Qsumm problem.
翻訳日:2022-12-30 19:16:46 公開日:2020-02-18
# 変動LSTMネットワークを用いた短期交通流予測

Short-Term Traffic Flow Prediction Using Variational LSTM Networks ( http://arxiv.org/abs/2002.07922v1 )

ライセンス: Link先を確認
Mehrdad Farahani, Marzieh Farahani, Mohammad Manthouri, Okyay Kaynak(参考訳) 交通流動特性は、ある地域で最も重要な意思決定および交通警察の要因の1つである。 交通流の予測状態に対する認識は、交通管理と交通情報部門において最も重要なものである。 本研究の目的は,知的交通システムにおける歴史データに基づく深層学習技術を用いて,交通流の予測モデルを提案することである。 2019年、カルトランス性能測定システム(PeMS)から6ヶ月間収集された歴史的データ。 提案した予測モデルは,VLSTM-Eの変動長短期記憶エンコーダであり,他の従来の手法と比較して正確に流れを推定しようとする。 VLSTM-Eは、分散と欠落した値を考慮して、より信頼性の高い短期的トラフィックフローを提供できる。

Traffic flow characteristics are one of the most critical decision-making and traffic policing factors in a region. Awareness of the predicted status of the traffic flow has prime importance in traffic management and traffic information divisions. The purpose of this research is to suggest a forecasting model for traffic flow by using deep learning techniques based on historical data in the Intelligent Transportation Systems area. The historical data collected from the Caltrans Performance Measurement Systems (PeMS) for six months in 2019. The proposed prediction model is a Variational Long Short-Term Memory Encoder in brief VLSTM-E try to estimate the flow accurately in contrast to other conventional methods. VLSTM-E can provide more reliable short-term traffic flow by considering the distribution and missing values.
翻訳日:2022-12-30 19:16:29 公開日:2020-02-18
# プレアテンション機構からの辞書によるテキスト分類

Text Classification with Lexicon from PreAttention Mechanism ( http://arxiv.org/abs/2002.07591v1 )

ライセンス: Link先を確認
QingBiao LI (Beijing University of Posts and Telecommunications), Chunhua Wu (Beijing University of Posts and Telecommunications), Kangfeng Zheng (Beijing University of Posts and Telecommunications)(参考訳) 包括的で高品質な辞書は、伝統的なテキスト分類アプローチにおいて重要な役割を果たす。 そして、言語知識の利用を改善する。 このタスクには役立つが、最近のニューラルネットワークモデルでは、レキシコンはほとんど注目されていない。 まず、高品質のレキシコンを得るのは容易ではない。 我々は効率的な自動辞書抽出手法を欠き、ほとんどの辞書は手作りであり、これはビッグデータにとって非常に非効率である。 さらに、ニューラルネットワークでレキシコンを使用する効果的な方法は存在しません。 そこで本論文では,これらの制約に対処するために,テキスト分類に対する事前対応機構を提案する。 異なる注意を持つ単語はドメイン辞書を形成することができる。 3つのベンチマークテキスト分類タスクの実験は、我々のモデルが最先端の手法と比較して競合する結果が得られることを示している。 スタンフォード大映画レビューデータセットでは90.5%、主観性データセットでは82.3%、映画レビューでは93.7%である。 また,前置機構のないテキスト分類モデルと比較すると,前置機構の精度が0.9%-2.4%向上し,前置機構の有効性が証明された。 さらに、Pre-Attentionメカニズムは、さまざまなタイプのニューラルネットワーク(畳み込みニューラルネットワークやLong Short-Term Memory Networkなど)でうまく機能する。 同じデータセットでは、注意値が異なるニューラルネットワークに追従するために事前アテンション機構を使用する場合、注意値の高い単語は高い一致度を持つため、事前アテンション機構の汎用性と可搬性が証明される。 注意値で安定なレキシコンを 得ることができます 情報抽出の インスピレーションの方法です

A comprehensive and high-quality lexicon plays a crucial role in traditional text classification approaches. And it improves the utilization of the linguistic knowledge. Although it is helpful for the task, the lexicon has got little attention in recent neural network models. Firstly, getting a high-quality lexicon is not easy. We lack an effective automated lexicon extraction method, and most lexicons are hand crafted, which is very inefficient for big data. What's more, there is no an effective way to use a lexicon in a neural network. To address those limitations, we propose a Pre-Attention mechanism for text classification in this paper, which can learn attention of different words according to their effects in the classification tasks. The words with different attention can form a domain lexicon. Experiments on three benchmark text classification tasks show that our models get competitive result comparing with the state-of-the-art methods. We get 90.5% accuracy on Stanford Large Movie Review dataset, 82.3% on Subjectivity dataset, 93.7% on Movie Reviews. And compared with the text classification model without Pre-Attention mechanism, those with Pre-Attention mechanism improve by 0.9%-2.4% accuracy, which proves the validity of the Pre-Attention mechanism. In addition, the Pre-Attention mechanism performs well followed by different types of neural networks (e.g., convolutional neural networks and Long Short-Term Memory networks). For the same dataset, when we use Pre-Attention mechanism to get attention value followed by different neural networks, those words with high attention values have a high degree of coincidence, which proves the versatility and portability of the Pre-Attention mechanism. we can get stable lexicons by attention values, which is an inspiring method of information extraction.
翻訳日:2022-12-30 19:16:18 公開日:2020-02-18
# 構造化データの距離関数と類似関数の概観

An Overview of Distance and Similarity Functions for Structured Data ( http://arxiv.org/abs/2002.07420v1 )

ライセンス: Link先を確認
Santiago Onta\~n\'on(参考訳) 距離と類似性の概念は多くの機械学習アプローチや人工知能(AI)において重要な役割を担っている。 命題表現のための距離関数は徹底的に研究されているが、グラフ、フレーム、論理節などの構造化表現のための距離関数の研究は異なるコミュニティで行われており、理解されていない。 具体的には、データの構造的表現に距離や類似性関数を使う必要のある膨大な作業は、通常特定のアプリケーションにアドホック関数を使う。 そこで本論文の目的は,異なる分野における作業の相互関係を把握し,今後の作業の方向性を指摘するため,本研究の概要を提供することである。

The notions of distance and similarity play a key role in many machine learning approaches, and artificial intelligence (AI) in general, since they can serve as an organizing principle by which individuals classify objects, form concepts and make generalizations. While distance functions for propositional representations have been thoroughly studied, work on distance functions for structured representations, such as graphs, frames or logical clauses, has been carried out in different communities and is much less understood. Specifically, a significant amount of work that requires the use of a distance or similarity function for structured representations of data usually employs ad-hoc functions for specific applications. Therefore, the goal of this paper is to provide an overview of this work to identify connections between the work carried out in different areas and point out directions for future work.
翻訳日:2022-12-30 19:15:07 公開日:2020-02-18
# ブラックボックス攻撃に対する逆摂動の行列フリー生成について

On the Matrix-Free Generation of Adversarial Perturbations for Black-Box Attacks ( http://arxiv.org/abs/2002.07317v1 )

ライセンス: Link先を確認
Hisaichi Shibata, Shouhei Hanaoka, Yukihiro Nomura, Naoto Hayashi and Osamu Abe(参考訳) 一般に、入力に重畳される敵対的摂動はディープニューラルネットワーク(dnn)の現実的な脅威である。 本稿では,入力-出力関係にのみアクセスを要求するブラックボックス攻撃に対して,このような逆摂動の実用的な生成法を提案する。 これにより、攻撃者は、内部機能を起動したり、DNNの内部状態にアクセスすることなく、そのような摂動を発生させる。 以前の研究とは異なり、本研究で提示された摂動を生成するアルゴリズムは、クエリ試行をはるかに少なくする。 さらに, 対向摂動の有効性を示すために, DNNを用いた意味的セグメンテーション実験を行った。 その結果、同じ大きさの均一分布ランダムノイズを使用するよりも、ネットワークは摂動によって容易に認識できることがわかった。

In general, adversarial perturbations superimposed on inputs are realistic threats for a deep neural network (DNN). In this paper, we propose a practical generation method of such adversarial perturbation to be applied to black-box attacks that demand access to an input-output relationship only. Thus, the attackers generate such perturbation without invoking inner functions and/or accessing the inner states of a DNN. Unlike the earlier studies, the algorithm to generate the perturbation presented in this study requires much fewer query trials. Moreover, to show the effectiveness of the adversarial perturbation extracted, we experiment with a DNN for semantic segmentation. The result shows that the network is easily deceived with the perturbation generated than using uniformly distributed random noise with the same magnitude.
翻訳日:2022-12-30 19:14:55 公開日:2020-02-18
# 適応型領域ベースアクティブラーニング

Adaptive Region-Based Active Learning ( http://arxiv.org/abs/2002.07348v1 )

ライセンス: Link先を確認
Corinna Cortes, Giulia DeSalvo, Claudio Gentile, Mehryar Mohri, Ningshan Zhang(参考訳) 本稿では,入力空間を有限個の領域に適応的に分割し,各領域に対して異なる予測器を求める,新しいアクティブ学習アルゴリズムを提案する。 本稿では,アルゴリズムの一般化誤差とラベル複雑性の両立を理論的に保証し,アルゴリズムが定義する領域の数を軽度な仮定で解析する。 また,既存の単一領域と非適応領域ベースのアクティブラーニングベースラインに対して,実世界のデータセットに対する広範な実験結果について報告する。

We present a new active learning algorithm that adaptively partitions the input space into a finite number of regions, and subsequently seeks a distinct predictor for each region, both phases actively requesting labels. We prove theoretical guarantees for both the generalization error and the label complexity of our algorithm, and analyze the number of regions defined by the algorithm under some mild assumptions. We also report the results of an extensive suite of experiments on several real-world datasets demonstrating substantial empirical benefits over existing single-region and non-adaptive region-based active learning baselines.
翻訳日:2022-12-30 19:14:43 公開日:2020-02-18
# 敵攻撃の防御

Deflecting Adversarial Attacks ( http://arxiv.org/abs/2002.07405v1 )

ライセンス: Link先を確認
Yao Qin, Nicholas Frosst, Colin Raffel, Garrison Cottrell and Geoffrey Hinton(参考訳) 敵の攻撃に対する強力な防衛がその後、より先進的な防衛対応攻撃によって破壊されるサイクルが進行中である。 We present a new approach towards ending this cycle where we "deflect'' adversarial attacks by causing the attacker to produce an input that semantically resembles the attack's target class. To this end, we first propose a stronger defense based on Capsule Networks that combines three detection mechanisms to achieve state-of-the-art detection performance on both standard and defense-aware attacks. We then show that undetected attacks against our defense often perceptually resemble the adversarial target class by performing a human study where participants are asked to label images produced by the attack. These attack images can no longer be called "adversarial'' because our network classifies them the same way as humans do.

There has been an ongoing cycle where stronger defenses against adversarial attacks are subsequently broken by a more advanced defense-aware attack. We present a new approach towards ending this cycle where we "deflect'' adversarial attacks by causing the attacker to produce an input that semantically resembles the attack's target class. To this end, we first propose a stronger defense based on Capsule Networks that combines three detection mechanisms to achieve state-of-the-art detection performance on both standard and defense-aware attacks. We then show that undetected attacks against our defense often perceptually resemble the adversarial target class by performing a human study where participants are asked to label images produced by the attack. These attack images can no longer be called "adversarial'' because our network classifies them the same way as humans do.
翻訳日:2022-12-30 19:08:05 公開日:2020-02-18
# maplur: マップイメージのディープラーニングを用いた大気汚染推定の新しいパラダイムの検討

MapLUR: Exploring a new Paradigm for Estimating Air Pollution using Deep Learning on Map Images ( http://arxiv.org/abs/2002.07493v1 )

ライセンス: Link先を確認
Michael Steininger, Konstantin Kobs, Albin Zehe, Florian Lautenschlager, Martin Becker, Andreas Hotho(参考訳) 土地利用回帰モデル(LUR)は, 計測ステーションのない地域での大気汚染濃度の評価に重要である。 このようなモデルの多くは存在するが、制限されたローカルデータに基づいて手動で構築された機能を使用することが多い。 したがって、それらは通常複製が困難であり、彼らが開発した領域を超えて適応することが困難である。 本稿では,LURモデルのパラダイムシフトを提唱する。我々は,オープンかつグローバルに利用可能なデータのみを用いて,純粋にデータ駆動アプローチに基づくモデルを実現する,データ駆動,オープン,グローバル(DOG)パラダイムを提案する。 このパラダイムの進歩は、利用可能なデータソースのローカル特性にモデルを適応させる必要性を緩和し、大気汚染モデルがグローバルな新しい領域に一般化できるようにする。 LURのためのDOGパラダイムの実現可能性を説明するために,MapLURと呼ばれるディープラーニングモデルを導入する。 畳み込みニューラルネットワークアーキテクチャに基づいており、手動の機能エンジニアリングを必要とせずに、グローバルおよびオープンに利用可能なマップデータにのみトレーニングされている。 我々は, 線形回帰, ランダムフォレスト, マルチ層パーセプトロンといった最先端のベースラインを, 中央ロンドンにおけるモデル付き$\text{NO}_2$濃度の大きなデータセットを用いて比較した。 その結果,MapLURは手動でカスタマイズした機能を提供しても,これらのアプローチを著しく上回っていることがわかった。 さらに、DOGパラダイムに基づくモデル固有の自動特徴抽出は、容易に解釈可能な特徴を学習でき、従来のLURアプローチによく見られる特徴とよく似ていることを述べる。

Land-use regression (LUR) models are important for the assessment of air pollution concentrations in areas without measurement stations. While many such models exist, they often use manually constructed features based on restricted, locally available data. Thus, they are typically hard to reproduce and challenging to adapt to areas beyond those they have been developed for. In this paper, we advocate a paradigm shift for LUR models: We propose the Data-driven, Open, Global (DOG) paradigm that entails models based on purely data-driven approaches using only openly and globally available data. Progress within this paradigm will alleviate the need for experts to adapt models to the local characteristics of the available data sources and thus facilitate the generalizability of air pollution models to new areas on a global scale. In order to illustrate the feasibility of the DOG paradigm for LUR, we introduce a deep learning model called MapLUR. It is based on a convolutional neural network architecture and is trained exclusively on globally and openly available map data without requiring manual feature engineering. We compare our model to state-of-the-art baselines like linear regression, random forests and multi-layer perceptrons using a large data set of modeled $\text{NO}_2$ concentrations in Central London. Our results show that MapLUR significantly outperforms these approaches even though they are provided with manually tailored features. Furthermore, we illustrate that the automatic feature extraction inherent to models based on the DOG paradigm can learn features that are readily interpretable and closely resemble those commonly used in traditional LUR approaches.
翻訳日:2022-12-30 19:07:56 公開日:2020-02-18
# ゼロ次自然勾配降下を伴うクエリ効率のよいブラックボックス逆流

Towards Query-Efficient Black-Box Adversary with Zeroth-Order Natural Gradient Descent ( http://arxiv.org/abs/2002.07891v1 )

ライセンス: Link先を確認
Pu Zhao, Pin-Yu Chen, Siyue Wang, Xue Lin(参考訳) 現代のディープニューラルネットワーク(DNN)の大きな成果にもかかわらず、最先端のDNNの脆弱性とロバスト性は、高い信頼性を必要とする多くのアプリケーションドメインにおけるセキュリティ上の懸念を引き起こす。 DNNモデルの学習性能を妨害するために、様々な敵攻撃を提案する。 その中でも,ブラックボックス攻撃手法は実用性と単純さから特に注目されている。 ブラックボックス攻撃は通常、ステルス性と低コストを維持するためにより少ないクエリを好む。 しかし、現在のブラックボックス攻撃法の多くは1次勾配降下法を採用しており、これは比較的遅い収束やハイパーパラメータ設定に対する高い感度といった特定の欠陥を伴っている可能性がある。 本稿では,ブラックボックス攻撃シナリオに対応するゼロ次勾配推定手法と,クエリ効率を高めるために2次自然勾配降下法を組み込んだ,逆攻撃を設計するためのゼロ次自然勾配降下法(zo-ngd)を提案する。 画像分類データセットにおける経験的評価により,zo-ngdは最先端攻撃法と比較して,クエリの複雑度が有意に低いことが示されている。

Despite the great achievements of the modern deep neural networks (DNNs), the vulnerability/robustness of state-of-the-art DNNs raises security concerns in many application domains requiring high reliability. Various adversarial attacks are proposed to sabotage the learning performance of DNN models. Among those, the black-box adversarial attack methods have received special attentions owing to their practicality and simplicity. Black-box attacks usually prefer less queries in order to maintain stealthy and low costs. However, most of the current black-box attack methods adopt the first-order gradient descent method, which may come with certain deficiencies such as relatively slow convergence and high sensitivity to hyper-parameter settings. In this paper, we propose a zeroth-order natural gradient descent (ZO-NGD) method to design the adversarial attacks, which incorporates the zeroth-order gradient estimation technique catering to the black-box attack scenario and the second-order natural gradient descent to achieve higher query efficiency. The empirical evaluations on image classification datasets demonstrate that ZO-NGD can obtain significantly lower model query complexities compared with state-of-the-art attack methods.
翻訳日:2022-12-30 19:06:28 公開日:2020-02-18
# TensorShield: 画像上の敵攻撃に対するテンソルベースの防御

TensorShield: Tensor-based Defense Against Adversarial Attacks on Images ( http://arxiv.org/abs/2002.10252v1 )

ライセンス: Link先を確認
Negin Entezari, Evangelos E. Papalexakis(参考訳) 近年の研究では、ディープニューラルネットワーク(DNN)のような機械学習アプローチが、敵の攻撃によって簡単に騙されることが示されている。 データの微妙で知覚できない摂動は、ディープニューラルネットワークの結果を変えることができる。 脆弱な機械学習メソッドを活用することで、特にセキュリティが重要な要因である領域において、多くの懸念が生まれます。 したがって、敵攻撃に対する防御機構を設計することが重要である。 画像分類のタスクでは、主に画像の高周波スペクトルにおいて、目立たない摂動が発生する。 本稿では, テンソル分解法を前処理として活用し, 高周波の摂動を著しく破棄できる画像の低ランク近似を求める。 最近、shieldと呼ばれる防衛フレームワークは、imagenetデータセット上の画像のローカルパッチでランダム品質のjpeg圧縮を行うことで、畳み込みニューラルネットワーク(cnn)を敵の例に対して「空にする」ことができる。 テンソルをベースとした防御機構は、FGSM(Fast Gradient Descent)攻撃に対してシールドのSLQ法を14%上回り、同等の速度を維持する。

Recent studies have demonstrated that machine learning approaches like deep neural networks (DNNs) are easily fooled by adversarial attacks. Subtle and imperceptible perturbations of the data are able to change the result of deep neural networks. Leveraging vulnerable machine learning methods raises many concerns especially in domains where security is an important factor. Therefore, it is crucial to design defense mechanisms against adversarial attacks. For the task of image classification, unnoticeable perturbations mostly occur in the high-frequency spectrum of the image. In this paper, we utilize tensor decomposition techniques as a preprocessing step to find a low-rank approximation of images which can significantly discard high-frequency perturbations. Recently a defense framework called Shield could "vaccinate" Convolutional Neural Networks (CNN) against adversarial examples by performing random-quality JPEG compressions on local patches of images on the ImageNet dataset. Our tensor-based defense mechanism outperforms the SLQ method from Shield by 14% against FastGradient Descent (FGSM) adversarial attacks, while maintaining comparable speed.
翻訳日:2022-12-30 19:05:54 公開日:2020-02-18
# 変分オートエンコーダにおけるバランシング再構成誤差とKulback-Leibler分散

Balancing reconstruction error and Kullback-Leibler divergence in Variational Autoencoders ( http://arxiv.org/abs/2002.07514v1 )

ライセンス: Link先を確認
Andrea Asperti, Matteo Trentin(参考訳) 変分オートエンコーダの損失関数には、再構成損失、結果の画質の向上、および潜在空間の正則化として機能するクルバック・リーブラー分岐という2つのコンポーネントの間によく知られた緊張関係がある。 これら2つのコンポーネントを正しくバランスさせることは繊細な問題だ。 最近の研究で、Dai氏とWipf氏は、適切な損失関数に従ってネットワークがトレーニング中にバランス係数を学習できるようにすることで、合理的な改善を得た。 本稿では、学習を単純な決定論的計算に置き換え、基礎となるメカニズムを理解するのに役立ち、より高速で正確な行動をもたらすことを示す。 CifarやCelebaのような典型的なデータセットでは、我々の手法は以前のVAEアーキテクチャよりも優れている。

In the loss function of Variational Autoencoders there is a well known tension between two components: the reconstruction loss, improving the quality of the resulting images, and the Kullback-Leibler divergence, acting as a regularizer of the latent space. Correctly balancing these two components is a delicate issue, easily resulting in poor generative behaviours. In a recent work, Dai and Wipf obtained a sensible improvement by allowing the network to learn the balancing factor during training, according to a suitable loss function. In this article, we show that learning can be replaced by a simple deterministic computation, helping to understand the underlying mechanism, and resulting in a faster and more accurate behaviour. On typical datasets such as Cifar and Celeba, our technique sensibly outperforms all previous VAE architectures.
翻訳日:2022-12-30 19:05:34 公開日:2020-02-18
# 繰り返しニューラルネットワークの記憶能力の評価

Assessing the Memory Ability of Recurrent Neural Networks ( http://arxiv.org/abs/2002.07422v1 )

ライセンス: Link先を確認
Cheng Zhang, Qiuchi Li, Lingyu Hua and Dawei Song(参考訳) リカレントニューラルネットワーク(recurrent neural networks, rnn)は、処理中のシーケンス(例えば文)によって表現される意味情報の一部が隠れた層で記憶されることが知られている。 異なるタイプのリカレントユニットは、RNNが長期間にわたって情報を記憶できるように設計されている。 しかし、異なるリカレントユニットのメモリ能力は理論上も実験上も不明であり、それによってより効果的で説明可能なRNNの開発が制限される。 本稿では,RNNの記憶能力に影響を与える内部的・外部的要因を特定し解析し,シーケンスで表される意味を表現するためのセマンティックユークリッド空間を提案する。 セマンティックユークリッド空間に基づく一連の評価指標は、異なるリカレントユニットのメモリ能力を測定し、それらの制限を分析するために定義される。 これらの評価指標はまた、トレーニング中に異なるRNNに対して適切なシーケンス長を選択するための有用なガイダンスを提供する。

It is known that Recurrent Neural Networks (RNNs) can remember, in their hidden layers, part of the semantic information expressed by a sequence (e.g., a sentence) that is being processed. Different types of recurrent units have been designed to enable RNNs to remember information over longer time spans. However, the memory abilities of different recurrent units are still theoretically and empirically unclear, thus limiting the development of more effective and explainable RNNs. To tackle the problem, in this paper, we identify and analyze the internal and external factors that affect the memory ability of RNNs, and propose a Semantic Euclidean Space to represent the semantics expressed by a sequence. Based on the Semantic Euclidean Space, a series of evaluation indicators are defined to measure the memory abilities of different recurrent units and analyze their limitations. These evaluation indicators also provide a useful guidance to select suitable sequence lengths for different RNNs during training.
翻訳日:2022-12-30 18:59:39 公開日:2020-02-18
# 対称性部分群の作用に不変な計算効率のよいニューラルネットワーク

A Computationally Efficient Neural Network Invariant to the Action of Symmetry Subgroups ( http://arxiv.org/abs/2002.07528v1 )

ライセンス: Link先を確認
Piotr Kicki, Mete Ozay and Piotr Skrzypczy\'nski(参考訳) 本稿では,入力データに対する対称群の置換部分群$g \leq s_n$の作用に不変な関数を近似する計算効率の良い$g$-invariantニューラルネットワークを設計する手法を提案する。 提案されたネットワークアーキテクチャの重要な要素は、入力データの$g$-invariant latent表現を生成する新しい$g$-invariant transformationモジュールである。 この潜在表現は、ネットワーク内の多層パーセプトロンで処理される。 提案するアーキテクチャの普遍性を証明し,その特性を議論し,計算とメモリ効率を強調する。 理論的考察は、他の$G$不変ニューラルネットワークと比較して提案手法の有効性と強力な一般化特性を示す、異なるネットワーク構成を含む数値実験によって支持される。

We introduce a method to design a computationally efficient $G$-invariant neural network that approximates functions invariant to the action of a given permutation subgroup $G \leq S_n$ of the symmetric group on input data. The key element of the proposed network architecture is a new $G$-invariant transformation module, which produces a $G$-invariant latent representation of the input data. This latent representation is then processed with a multi-layer perceptron in the network. We prove the universality of the proposed architecture, discuss its properties and highlight its computational and memory efficiency. Theoretical considerations are supported by numerical experiments involving different network configurations, which demonstrate the effectiveness and strong generalization properties of the proposed method in comparison to other $G$-invariant neural networks.
翻訳日:2022-12-30 18:59:22 公開日:2020-02-18
# 低リソース言語データセット作成, キュレーション, 分類のためのアプローチの検討: Seswana と Sepedi

Investigating an approach for low resource language dataset creation, curation and classification: Setswana and Sepedi ( http://arxiv.org/abs/2003.04986v1 )

ライセンス: Link先を確認
Vukosi Marivate, Tshephisho Sefara, Vongani Chabalala, Keamogetswe Makhaya, Tumisho Mokgonyane, Rethabile Mokoena, Abiodun Modupe(参考訳) 自然言語処理の最近の進歩は、利用可能なキュレートされたデータと研究資源の観点から、よく表現された言語にとって恩恵となった。 低リソース言語の課題のひとつは、さまざまなユースケースのためのデータセットの収集、キュレーション、準備に関する明確なガイドラインである。 本研究では,setwanaとsepediのニュース見出し(短文)に着目した2つのデータセットの作成と,ニューストピック分類タスクの作成を行う。 作業の文書化や,分類のベースラインも行います。 我々は,低リソース言語に適したデータ拡張手法について検討し,分類器の性能向上を図る。

The recent advances in Natural Language Processing have been a boon for well-represented languages in terms of available curated data and research resources. One of the challenges for low-resourced languages is clear guidelines on the collection, curation and preparation of datasets for different use-cases. In this work, we take on the task of creation of two datasets that are focused on news headlines (i.e short text) for Setswana and Sepedi and creation of a news topic classification task. We document our work and also present baselines for classification. We investigate an approach on data augmentation, better suited to low resource languages, to improve the performance of the classifiers
翻訳日:2022-12-30 18:58:29 公開日:2020-02-18
# 局所的解釈可能なモデル非依存記述のための修正摂動サンプリング法

A Modified Perturbed Sampling Method for Local Interpretable Model-agnostic Explanation ( http://arxiv.org/abs/2002.07434v1 )

ライセンス: Link先を確認
Sheng Shi, Xinfeng Zhang, Wei Fan(参考訳) 現在の一般的なディープラーニングモデルは、推論プロセスと予測結果を説明する上では一般的に弱いため、説明可能性は人工知能と社会の間のゲートウェイである。 LIME(Local Interpretable Model-Agnostic Explanation)は、局所的に解釈可能なモデルを学ぶことによって、任意の分類器の予測を忠実に説明する手法である。 しかし、LIMEの標準実装におけるサンプリング操作は欠陥がある。 乱れたサンプルは一様分布から生成され、特徴間の複雑な相関は無視される。 本稿では,クランク集合構築問題として定式化された,新しい改良型パータブルサンプリング操作(mps-lime)を提案する。 画像分類において、MPS-LIMEはスーパーピクセル画像を非方向グラフに変換する。 様々な実験により,MPS-LIMEによるブラックボックスモデルの説明は,理解可能性,忠実度,効率の点で,はるかに優れた性能を発揮することが示された。

Explainability is a gateway between Artificial Intelligence and society as the current popular deep learning models are generally weak in explaining the reasoning process and prediction results. Local Interpretable Model-agnostic Explanation (LIME) is a recent technique that explains the predictions of any classifier faithfully by learning an interpretable model locally around the prediction. However, the sampling operation in the standard implementation of LIME is defective. Perturbed samples are generated from a uniform distribution, ignoring the complicated correlation between features. This paper proposes a novel Modified Perturbed Sampling operation for LIME (MPS-LIME), which is formalized as the clique set construction problem. In image classification, MPS-LIME converts the superpixel image into an undirected graph. Various experiments show that the MPS-LIME explanation of the black-box model achieves much better performance in terms of understandability, fidelity, and efficiency.
翻訳日:2022-12-30 18:57:48 公開日:2020-02-18