このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20200124となっている論文です。

PDF登録状況(公開日: 20200124)

TitleAuthorsAbstract論文公表日・翻訳日
# ミレニアル世代におけるパフォーマンスモデリングの指導

Teaching Performance Modeling in the era of millennials ( http://arxiv.org/abs/2001.08949v1 )

ライセンス: Link先を確認
Vittoria de Nitto Person\`e (University of Rome Tor Vergata, Rome, Italy)(参考訳) パフォーマンスモデリング(PM)の教育は70年代初頭に始まり、80年代にピークに達した。 その時代から今日まで、コンピューティングシステムは深く変化してきた。 さらに、過去20年間に経済危機が教育制度を巻き込んでおり、新しい世代は新たな学習方法を示している。 この時期、新しい文学が学習と教育に発展してきた。 重要な問題を強調するのはまれです。 高等教育は役割を変えつつある。 本稿では,世界中の大学におけるPM講座の現状を精査し,近年の教育の重要課題を浮き彫りにしようとしている。 この論文は、回答を与える目的ではなく、主にリフレクションや議論への道を開くことを目的としている。

Performance Modeling (PM) teaching started in the early 70s and reached its peak in the 80s. From those years and until today computing systems have deeply changed. Moreover, in the last two decades an economical crisis has involved the educational system, while the new generations show new learning modes. In this time, new literature has developed about learning and teaching. Rarely highlighting the critical issues. Higher learning is changing its role maybe unawares. In this paper, the author starts from a close examination of the state of the art of PM courses in Universities around the world and tries to highlight the main critical issues of teaching nowadays. The paper has not the aim to give answers but mainly that to open the way to reflections and discussions.
翻訳日:2023-06-06 03:03:12 公開日:2020-01-24
# 電位変形によるトラップイオンフォック状態の調製

Trapped-ion Fock state preparation by potential deformation ( http://arxiv.org/abs/2001.08948v1 )

ライセンス: Link先を確認
M. A. Sim\'on, M. Palmero, S. Mart\'inez-Garaot, J. G. Muga(参考訳) 本研究では, 内部準位間の遷移を誘導するレーザーパルスを必要とせず, 高励起エネルギー固有状態の高調波トラップを作製するプロトコルを提案する。 その代わり、プロトコルはシングルウェルとダブルウェル構成の間のトラップポテンシャルを円滑に変形させることに依存している。 変化の速度は、断熱パラメータを一定に保つことで非断熱遷移を最小限に抑えるように設定される。 高忠実度は制御パラメータの線形ランプよりも2桁以上小さい。 変形プロトコルは、基底状態と高励起状態を組み合わせた干渉感度を最適化するために重ね合わせを作成するためにも考案されている。

We propose protocols to prepare highly excited energy eigenstates of a trapped ion in a harmonic trap which do not require laser pulses to induce transitions among internal levels. Instead the protocols rely on smoothly deforming the trapping potential between single and double well configurations. The speed of the changes is set to minimize non-adiabatic transitions by keeping the adiabaticity parameter constant. High fidelities are found for times more than two orders of magnitude smaller than with linear ramps of the control parameter. Deformation protocols are also devised to prepare superpositions to optimize interferometric sensitivity, combining the ground state and a highly excited state.
翻訳日:2023-06-06 03:03:02 公開日:2020-01-24
# 量子制限強磁性ハロスコープによる軸索探索

Axion search with a quantum-limited ferromagnetic haloscope ( http://arxiv.org/abs/2001.08940v1 )

ライセンス: Link先を確認
N. Crescini, D. Alesini, C. Braggio, G. Carugno, D. D Agostino, D. Di Gioacchino, P. Falferi, U. Gambardella, C. Gatti, G. Iannone, C. Ligi, A. Lombardi, A. Ortolan, R. Pengo, G. Ruoso, L. Taffarello(参考訳) 強磁性ハロスコープは、電子スピンとの相互作用を利用して、アキソンの形でダークマターを探索する。 感度rf検出器に結合した軸-電磁場変換器からなる。 前者は光子-マグノンハイブリッド系であり、後者は量子制限ジョセフソンパラメトリック増幅器に基づいている。 ハイブリッドシステムは、静磁場によって単一のマイクロ波共振器モードに結合された直径2.1mmのyig球体からなる。 我々の装置は史上最も感度の高いrfスピン磁気センサだ。 最小検出可能なフィールドは5.5\times10^{-19}\,$Tで9hの積分時間を持ち、アキシオン電子結合定数 $g_{aee}\le1.7\times10^{-11}$ 95% CL に対応する。 我々のハロスコープの科学的な実行により、約120MHzの周波数範囲におけるDM-アキションの電子結合定数に対する最大の限界は、42.4$-$43.1\,\mu$eVである。 これはまた、静磁場を変化させて軸イオン質量走査を行う最初の装置でもある。

A ferromagnetic axion haloscope searches for Dark Matter in the form of axions by exploiting their interaction with electronic spins. It is composed of an axion-to-electromagnetic field transducer coupled to a sensitive rf detector. The former is a photon-magnon hybrid system, and the latter is based on a quantum-limited Josephson parametric amplifier. The hybrid system consists of ten 2.1 mm diameter YIG spheres coupled to a single microwave cavity mode by means of a static magnetic field. Our setup is the most sensitive rf spin-magnetometer ever realized. The minimum detectable field is $5.5\times10^{-19}\,$T with 9 h integration time, corresponding to a limit on the axion-electron coupling constant $g_{aee}\le1.7\times10^{-11}$ at 95% CL. The scientific run of our haloscope resulted in the best limit on DM-axions to electron coupling constant in a frequency span of about 120 MHz, corresponding to the axion mass range $42.4$-$43.1\,\mu$eV. This is also the first apparatus to perform an axion mass scanning by changing the static magnetic field.
翻訳日:2023-06-06 03:02:50 公開日:2020-01-24
# 最適化軌道角運動量ソータによる電子顕微鏡の効率的な分子識別

Efficient molecule discrimination in electron microcopy through an optimized orbital angular momentum sorter ( http://arxiv.org/abs/2001.08918v1 )

ライセンス: Link先を確認
Filippo Troiani, Enzo Rotunno, Stefano Frabboni, Raimond B.G. Ravelli, Peter J. Peters, Ebrahim Karimi, Vincenzo Grillo(参考訳) 電子顕微鏡におけるマクロ分子構造を特定のビーム整形法により識別する問題を考察する。 本手法は各電子の状態から抽出された分子情報を最大化することに基づく。 この目的のために、最適な観測可能性は量子状態識別の枠組みの中で導出され、プローブの量子特性から完全に説明することができる。 我々は、一般化軌道角運動量ソータ(OAM)に対するそのような最適観測値の実装をシミュレートし、その性能を最もよく知られた実空間アプローチと比較する。

We consider the problem of discriminating macromolecular structures in an electron microscope, through a specific beam shaping technique. Our approach is based on maximizing the which-molecule information extracted from the state of each electron. To this aim, the optimal observables are derived within the framework of quantum state discrimination, which allows one to fully account from the quantum character of the probe. We simulate the implementation of such optimal observable on a generalized orbital angular momentum (OAM) sorter and benchmark its performance against the best known real space approach.
翻訳日:2023-06-06 03:02:04 公開日:2020-01-24
# 量子インコヒーレンス、絡み合い、スーパールミナルシグナルの関連

Relating quantum incoherence, entanglement and superluminal signalling ( http://arxiv.org/abs/2001.08867v1 )

ライセンス: Link先を確認
Stanislav Filatov, Marcis Auzinsh(参考訳) そこで本研究では、不整合混合状態の特性とFTL信号の不整合性を関連づけた思考実験により、二つの粒子の絡み合いを調べた。 同一密度行列で記述されるが、異なる純状態を用いて生成される粒子のアンサンブルを識別する方法が出現すると、(古典的でない相関関係として)絡み合いの特性を用いてFTL信号装置を作成することができる。 ftlシグナルは可能であるとは言いませんが、現在の物理理論の上記の性質の間に論理的な関係が確立されています。

Hereby we inspect two-partite entanglement using thought experiment that relates properties of incoherently mixed states to the impossibility of faster-than-light (FTL) signalling. We show that if there appears a way to distinguish ensembles of particles that are described by the same density matrix, but are generated using different pure states - properties of entanglement (namely, non-classical correlations) could be employed to create an FTL signalling device. We do not claim FTL signalling is possible, rather, we establish the logical connection between the aforementioned properties of current physical theory which has not so far been evident.
翻訳日:2023-06-06 03:01:42 公開日:2020-01-24
# 位置依存質量系:古典的および量子的画像

Position-dependent mass systems: Classical and quantum pictures ( http://arxiv.org/abs/2002.02297v1 )

ライセンス: Link先を確認
Oscar Rosas-Ortiz(参考訳) 2019年6月24日~6月8日、ポーランドのビアロヴィエザにあるビアリストク大学数学物理学科(http://wgmp.uwb.edu.pl/wgmp38/part_s.html)が主催した「古典的および量子画像における位置依存質量系への代数的アプローチ」の要約。

Extended abstract of "Algebraic approach to position-dependent mass systems in both classical and quantum pictures", a series of three lectures delivered by the author in the VIII School on Geometry and Physics, 24 June-8 June 2019, organized by the Department of Mathematical Physics of the University of Bialystok, in Bialowieza, Poland (http://wgmp.uwb.edu.pl/wgmp38/part_s.html)
翻訳日:2023-06-06 02:57:26 公開日:2020-01-24
# 偏光不整光によるV型系の定常状態Fanoコヒーレンス

Steady-state Fano coherences in a V-type system driven by polarized incoherent light ( http://arxiv.org/abs/2001.09230v1 )

ライセンス: Link先を確認
Suyesh Koyu, Amro Dodin, Paul Brumer, and Timur V. Tscherbul(参考訳) 本研究では, コヒーレント駆動のない状態で, 偏光不整光によって連続的に励起される3レベルV系で発生する定常ファノコヒーレンスの性質について検討する。 定常コヒーレンスと励起状態の人口の比$\mathcal{c} = (1+\frac{\delta^2}{\gamma(r+\gamma)} )^{-1}$ は、励起状態分割$\delta$ が自発的崩壊率 $\gamma$ または非コヒーレント励起率 $r$ よりも小さいとき最大となる。 我々は、$\mathcal{c}$比がデファスレート$\gamma_d$の関数として最大を示す、興味深いレジームが存在することを実証する。 異なるタイミングで発生する個々の無干渉励起の破壊的干渉の環境抑制は, 驚くべきデファージングによる定常的ファノコヒーレンス強化を特徴としている。 2つの独立した熱浴に結合した一対の量子ビット間の非平衡フラックスと虚偽ファノのコヒーレンスを同定し、多レベル量子系の不整合駆動現象と量子ビットネットワークにおける非平衡量子輸送との直接的な関係を明らかにする。 定常状態のファノコヒーレンスの実際の部分は、熱力学的平衡の値から励起状態の集団の偏りに比例しており、励起状態の集団における定常状態ファノコヒーレンスのシグネチャを観測することができる。 偏光対等方性非コヒーレント光により励起されるカルシウム原子から放出される全蛍光信号を検出し,定常的なファノコヒーレンスを観測するための実験を行った。 熱駆動型原子・分子系における非平衡コヒーレント定常状態のさらなる理論的および実験的研究への道のりを開拓し,その生物学的プロセスにおける役割を探究する。

We explore the properties of steady-state Fano coherences generated in a three-level V-system continuously pumped by polarized incoherent light in the absence of coherent driving. The ratio of the stationary coherences to excited-state populations $\mathcal{C} = (1+\frac{\Delta^2}{\gamma(r+\gamma)} )^{-1}$ is maximized when the excited-state splitting $\Delta$ is small compared to either the spontaneous decay rate $\gamma$ or the incoherent pumping rate $r$. We demonstrate that an intriguing regime exists where the $\mathcal{C}$ ratio displays a maximum as a function of the dephasing rate $\gamma_d$. We attribute the surprising dephasing-induced enhancement of stationary Fano coherences to the environmental suppression of destructive interference of individual incoherent excitations generated at different times. We identify the imaginary Fano coherence with the non-equilibrium flux across a pair of qubits coupled to two independent thermal baths, unraveling a direct connection between the seemingly unrelated phenomena of incoherent driving of multilevel quantum systems and non-equilibrium quantum transport in qubit networks. The real part of the steady-state Fano coherence is found to be proportional to the deviation of excited-state populations from their values in thermodynamic equilibrium, making it possible to observe signatures of steady-state Fano coherences in excited-state populations. We put forward an experimental proposal for observing steady-state Fano coherences by detecting the total fluorescence signal emitted by Calcium atoms excited by polarized vs. isotropic incoherent light. Our analysis paves the way toward further theoretical and experimental studies of non-equilibrium coherent steady states in thermally driven atomic and molecular systems, and for the exploration of their potential role in biological processes.
翻訳日:2023-06-06 02:57:12 公開日:2020-01-24
# 指紋認証の現状と将来

An Overview of Fingerprint-Based Authentication: Liveness Detection and Beyond ( http://arxiv.org/abs/2001.09183v1 )

ライセンス: Link先を確認
Filipp Demenschonok, Jason Harrigan, and Tamara Bonaci(参考訳) 本稿では,認証に使用される指紋検出手法の概要について述べる。 我々は,現在の指紋センシング技術について,ハードウェアの観点から分析する。 次に,生体ユーザがシステム上で認証を試みていることを確認するために使用できる手法として,物理的活力を検出する手法に注目する。 我々は、悪意ある人物が指紋認証システムを騙して偽の指を本物として受け入れようとする攻撃(偽造攻撃)を防ぐのに、これらの手法がいかに効果的かを分析する。 次に、指紋などの生体データに対する幅広い攻撃ポイントを識別する。 最後に,指紋データ保護のための新しい対策を提案する。

In this paper, we provide an overview of fingerprint sensing methods used for authentication. We analyze the current fingerprint sensing technologies, from algorithmic, as well as from hardware perspectives. We then focus on methods to detect physical liveness, defined as techniques that can be used to ensure that a living human user is attempting to authenticate on a system. We analyze how effective these methods are at preventing attacks where a malicious entity tries to trick a fingerprint-based authentication system to accept a fake finger as a real one (spoofing attacks). We then identify broader attack points against biometric data, such as fingerprints. Finally, we propose novel measures to protect fingerprint data.
翻訳日:2023-06-06 02:56:07 公開日:2020-01-24
# 重力波関数の客観的還元に関する幾何学的考察

A geometric look at the objective gravitational wave function reduction ( http://arxiv.org/abs/2001.09109v1 )

ライセンス: Link先を確認
Faramarz Rahmani, Mehdi Golshani, Ghadir Jafari(参考訳) ref [1] では、シュル=オディンガー-ニュートン方程式による目的波動関数の還元の基準が導出されている。 本稿では,ボヘミア軌道の概念を用いて,この基準を導出する。 この研究には2つの結果がある。 まず、波動関数の還元問題に関する幾何学的視点と、還元過程における量子力と重力力の役割を表わすもう1つの視点を与える。

In ref [1], a criterion has been derived for the objective wave function reduction through the Shr\"odinger-Newton equation. In this paper, we shall derive that criterion by using the concept of Bohmian trajectories. This study has two consequences. First, providing a geometric perspective on the problem of wave function reduction and the other, representing the role of quantum force and gravitational force in the reduction process.
翻訳日:2023-06-06 02:55:20 公開日:2020-01-24
# ウンルー温度の推定精度

Precision in estimating Unruh temperature ( http://arxiv.org/abs/2001.09085v1 )

ライセンス: Link先を確認
Danilo Borim, Lucas C. C\'eleri and Vasileios I. Kiosses(参考訳) 量子メトロロジーの目標は、パラメータ推定の基本的なタスクにおける絡み合いや量子コヒーレンスのような量子資源の利用である。 ここでは相対論的量子距離論のシナリオにおけるウンルー温度の推定について考察する。 具体的には,2つの異なる症例について検討する。 まず、スカラー量子場と相互作用する1つのunruh-dewitt検出器が、有限個の固有時間に対して一様加速を行い、推定過程におけるコヒーレンスの役割を解析する。 その後、最初に絡まった2つの検出器について検討し、そのうちの1つは慣性であり、もう1つは加速する。 以上の結果から,Cramm\'{e}r-Rao 境界による最大精度を特徴付けるフィッシャー情報の最大値は,小さい加速度でのみ発生し,加速度が増加すると急速に減少することがわかった。 さらに、最初のコヒーレンスの役割は、単一の検出器ケースにおける--、または2つの検出器ケース内の絡み合いの役割は、フィッシャー情報を減らすことである。 したがって、このプロトコルでは、内部コヒーレンス(あるいは絡み合い)はアンルー温度を推定するための資源ではない。 これらの予期せぬ結果は、これまで考えられていたよりもunruh効果の検出がさらに困難であることを示している。 最後に,unruh効果とホーキング放射との関係を考慮し,ホーキング温度の推定の文脈において,我々の結果をどのように理解できるかを考察する。

The goal of quantum metrology is the exploitation of quantum resources, like entanglement or quantum coherence, in the fundamental task of parameter estimation. Here we consider the question of the estimation of the Unruh temperature in the scenario of relativistic quantum metrology. Specifically, we study two distinct cases. First, a single Unruh-DeWitt detector interacting with a scalar quantum field undergoes an uniform acceleration for a finite amount of proper time, and the role of coherence in the estimation process is analyzed. After this, we consider two initially entangled detectors, one of which is inertial while the other one undergoes acceleration. Our results show that the maximum of the Fisher information, thus characterizing the maximum possible precision according to Cramm\'{e}r-Rao bound, occurs only for small accelerations, while it decreases fast when acceleration increases. Moreover, the role of initial coherence ---in the single detector case---, or entanglement ---in the two detectors case---, is to decrease Fisher information. Therefore, under the considered protocol, internal coherence (or entanglement) is not a resource for estimating Unruh temperature. These unexpected results show that a detection of the Unruh effect can be even more challenge than previously thought. Finally, by considering the connection between Unruh effect and Hawking radiation, we discuss how our results can be understood in the context of the estimation of Hawking temperature.
翻訳日:2023-06-06 02:54:55 公開日:2020-01-24
# 開量子系と強相関電子系における有効非エルミートハミルトニアンの等価性

Equivalence of the effective non-hermitian Hamiltonians in the context of open quantum systems and strongly-correlated electron systems ( http://arxiv.org/abs/2001.09045v1 )

ライセンス: Link先を確認
Yoshihiro Michishita and Robert Peters(参考訳) 最近では、利得と損失を経験するオープン量子系だけでなく、強相関系の平衡単一粒子特性においても非エルミート現象が観測できることが明らかになっている。 しかし、各分野における非エルミート現象の出現の状況と要件は全く異なる。 ポスト選択の実装は、オープン量子システムにおいて非エルミート現象を観察するための重要な障害であるが、強い相関を持つシステムでは不要である。 これまで、両方の非エルミート現象の記述の関係は明らかにされていない。 本稿では,両分野に出現する非エルミート・ハミルトニアンが同一であることを示し,強い相関関係を持つ材料において非エルミート・ハミルトニアンが出現する条件を明らかにする。 この知識を用いて, 開量子系と強相関系の特殊応答関数を解析することにより, ポスト選択を必要とせずに非エルミート的性質を解析できる手法を提案する。

Recently, it has become clear that non-hermitian phenomena can be observed not only in open quantum systems experiencing gain and loss but also in equilibrium single-particle properties of strongly correlated systems. However, the circumstances and requirements for the emergence of non-hermitian phenomena in each field are entirely different. While the implementation of postselection is a significant obstacle to observe non-hermitian phenomena in open quantum systems, it is unnecessary in strongly correlated systems. Until now, a relation between both descriptions of non-hermitian phenomena has not been revealed. In this paper, we close this gap and demonstrate that the non-hermitian Hamiltonians emerging in both fields are identical, and we clarify the conditions for the emergence of a non-hermitian Hamiltonian in strongly correlated materials. Using this knowledge, we propose a method to analyze non-hermitian properties without the necessity of postselection by studying specific response functions of open quantum systems and strongly correlated systems.
翻訳日:2023-06-06 02:54:33 公開日:2020-01-24
# 不均一薄板によるカシミールエネルギー

Casimir energy due to inhomogeneous thin plates ( http://arxiv.org/abs/1912.12651v2 )

ライセンス: Link先を確認
Cesar D. Fosco and Francisco D. Mazzitelli(参考訳) 量子実スカラー場によるカシミールエネルギーを、不均質な性質を持つ2つの平面、無限、零幅の平行ミラーに結合した。 これらの性質は、我々が使用するモデルにおいて、各ミラー平面上で定義されたスカラー関数によって表される。 ゲルファント・ヤグロムの定理を用いて、そのような系のカシミールエネルギーに対するリフシッツ的な公式を構築する。 次に, ほぼ一定のスカラー関数の場合にはエネルギー摂動性を評価するとともに, 特性の空間的依存が十分に滑らかであるという仮定のもと, 導関数拡張を実装した。 特定の場合において、非平面完全鏡に対するカシミール相互作用エネルギーは平面鏡上の不均一性によって再現できる。

We study the Casimir energy due to a quantum real scalar field coupled to two planar, infinite, zero-width, parallel mirrors with non-homogeneous properties. These properties are represented, in the model we use, by scalar functions defined on each mirror's plane. Using the Gelfand-Yaglom's theorem, we construct a Lifshitz-like formula for the Casimir energy of such a system. Then we use it to evaluate the energy perturbatively, for the case of almost constant scalar functions, and also implementing a Derivative Expansion, under the assumption that the spatial dependence of the properties is sufficiently smooth. We point out that, in some particular cases, the Casimir interaction energy for non-planar perfect mirrors can be reproduced by inhomogeneities on planar mirrors.
翻訳日:2023-01-17 08:12:03 公開日:2020-01-24
# 時間パターンマッチングへのハイブリッドアプローチ

A Hybrid Approach to Temporal Pattern Matching ( http://arxiv.org/abs/2001.01661v2 )

ライセンス: Link先を確認
Konstantinos Semertzidis, Evaggelia Pitoura(参考訳) グラフパターンマッチングの主な目的は、入力グラフパターンクエリのすべての外観を、大きなデータグラフで見つけることである。 このような外観をマッチと呼ぶ。 本稿では,時間グラフにおける相互作用パターンのマッチングについて考察する。 そこで本研究では,構造と時間の両方に基づいて,潜在的なマッチングを効果的にフィルタリングするハイブリッド手法を提案する。 我々のアプローチは、エッジが時間によって順序づけられるグラフ表現を利用する。 提案手法の効率性を示す実データを用いて実験を行った。

The primary objective of graph pattern matching is to find all appearances of an input graph pattern query in a large data graph. Such appearances are called matches. In this paper, we are interested in finding matches of interaction patterns in temporal graphs. To this end, we propose a hybrid approach that achieves effective filtering of potential matches based both on structure and time. Our approach exploits a graph representation where edges are ordered by time. We present experiments with real datasets that illustrate the efficiency of our approach.
翻訳日:2023-01-14 02:54:54 公開日:2020-01-24
# 生体認証システムのランダム入力に対するレジリエンスについて

On the Resilience of Biometric Authentication Systems against Random Inputs ( http://arxiv.org/abs/2001.04056v2 )

ライセンス: Link先を確認
Benjamin Zi Hao Zhao, Hassan Jameel Asghar, Mohamed Ali Kaafar(参考訳) 特徴ベクトルまたは生入力として一様ランダムな入力を送信した攻撃者に対して、機械学習に基づく生体認証システムのセキュリティを評価し、対象ユーザの受け入れサンプルを見つける。 システムの平均偽陽性率(FPR)、すなわち、詐欺師を正当な使用者として誤って受け入れた割合は、そのような攻撃の成功確率の尺度として解釈することができる。 しかし,その成功率はFPRよりも高いことが多い。 特に, 平均fpr 0.03 の再構成生体計測系では, 成功率は 0.78 であった。 これは、機能空間の長さの知識しか持たない攻撃者が、平均2回未満の試行でユーザーを偽装できるため、システムのセキュリティに影響を及ぼす。 攻撃が成功した理由を詳細に分析し、4つの異なる生体指標と4つの異なる機械学習分類器を用いてその結果を検証する。 最後に,このような攻撃を効果的でなく,システムの精度にはほとんど影響しない緩和手法を提案する。

We assess the security of machine learning based biometric authentication systems against an attacker who submits uniform random inputs, either as feature vectors or raw inputs, in order to find an accepting sample of a target user. The average false positive rate (FPR) of the system, i.e., the rate at which an impostor is incorrectly accepted as the legitimate user, may be interpreted as a measure of the success probability of such an attack. However, we show that the success rate is often higher than the FPR. In particular, for one reconstructed biometric system with an average FPR of 0.03, the success rate was as high as 0.78. This has implications for the security of the system, as an attacker with only the knowledge of the length of the feature space can impersonate the user with less than 2 attempts on average. We provide detailed analysis of why the attack is successful, and validate our results using four different biometric modalities and four different machine learning classifiers. Finally, we propose mitigation techniques that render such attacks ineffective, with little to no effect on the accuracy of the system.
翻訳日:2023-01-11 23:51:41 公開日:2020-01-24
# 単語使用の進化をキャプチャする: クラスタを増やすか?

Capturing Evolution in Word Usage: Just Add More Clusters? ( http://arxiv.org/abs/2001.06629v2 )

ライセンス: Link先を確認
Matej Martinc, Syrielle Montariol, Elaine Zosa and Lidia Pivovarova(参考訳) 言葉の使い方は時代を経て進化し、社会の文化的・技術的進化を反映している。 意味的変化検出は、短時間であってもテキストデータ中の単語の進化を検出し分析するタスクである。 本稿では,最近NLP分野に革命をもたらしたセマンティックモデリングの一種である文脈的埋め込みに依存した新しい手法に焦点をあてる。 我々は、トランスフォーマティブベースのbertモデルの能力を利用して、単語の意味的変化を時間にわたって検出できるコンテキスト化された埋め込みを生成する。 それぞれの強みと弱みを確立するために、共通の環境でいくつかのアプローチを比較します。 また、既存のアプローチの性能を大幅に改善するために、改善のためのいくつかのアイデアを提案します。

The way the words are used evolves through time, mirroring cultural or technological evolution of society. Semantic change detection is the task of detecting and analysing word evolution in textual data, even in short periods of time. In this paper we focus on a new set of methods relying on contextualised embeddings, a type of semantic modelling that revolutionised the NLP field recently. We leverage the ability of the transformer-based BERT model to generate contextualised embeddings capable of detecting semantic change of words across time. Several approaches are compared in a common setting in order to establish strengths and weaknesses for each of them. We also propose several ideas for improvements, managing to drastically improve the performance of existing approaches.
翻訳日:2023-01-10 05:12:09 公開日:2020-01-24
# GTNet:ゼロショットオブジェクト検出のための生成転送ネットワーク

GTNet: Generative Transfer Network for Zero-Shot Object Detection ( http://arxiv.org/abs/2001.06812v2 )

ライセンス: Link先を確認
Shizhen Zhao, Changxin Gao, Yuanjie Shao, Lerenhan Li, Changqian Yu, Zhong Ji, Nong Sang(参考訳) ゼロショットオブジェクト検出(ZSD)のための生成転送ネットワーク(GTNet)を提案する。 GTNetはオブジェクト検出モジュールと知識伝達モジュールで構成される。 Object Detection Moduleは、大規模に見られるドメイン知識を学ぶことができる。 Knowledge Transfer Moduleは、機能シンセサイザーを利用して見えないクラス機能を生成し、Object Detection Moduleの新しい分類層をトレーニングするために適用します。 クラス内分散とIoU分散の両方で各未確認クラスの機能を合成するために,GTNetに容易に統合可能な特徴合成器としてIoU-Aware Generative Adversarial Network (IoUGAN) を設計する。 具体的には、クラス特徴生成ユニット(CFU)、フォアグラウンド特徴生成ユニット(FFU)、バックグラウンド特徴生成ユニット(BFU)の3つのユニットモデルで構成されている。 CFUは、クラスセマンティック埋め込みに条件付きクラス内の分散で見えない特徴を生成する。 FFUとBFUは、CFUの結果にIoUの分散を加え、それぞれクラス固有の前景と背景の特徴をもたらす。 提案手法を3つの公開データセット上で評価し,最新のzsd手法に好適な結果を得た。

We propose a Generative Transfer Network (GTNet) for zero shot object detection (ZSD). GTNet consists of an Object Detection Module and a Knowledge Transfer Module. The Object Detection Module can learn large-scale seen domain knowledge. The Knowledge Transfer Module leverages a feature synthesizer to generate unseen class features, which are applied to train a new classification layer for the Object Detection Module. In order to synthesize features for each unseen class with both the intra-class variance and the IoU variance, we design an IoU-Aware Generative Adversarial Network (IoUGAN) as the feature synthesizer, which can be easily integrated into GTNet. Specifically, IoUGAN consists of three unit models: Class Feature Generating Unit (CFU), Foreground Feature Generating Unit (FFU), and Background Feature Generating Unit (BFU). CFU generates unseen features with the intra-class variance conditioned on the class semantic embeddings. FFU and BFU add the IoU variance to the results of CFU, yielding class-specific foreground and background features, respectively. We evaluate our method on three public datasets and the results demonstrate that our method performs favorably against the state-of-the-art ZSD approaches.
翻訳日:2023-01-08 12:38:30 公開日:2020-01-24
# テキスト生成モデルにおける入出力共有埋め込みの正規化

Normalization of Input-output Shared Embeddings in Text Generation Models ( http://arxiv.org/abs/2001.07885v2 )

ライセンス: Link先を確認
Jinyang Liu, Yujia Zhai, Zizhong Chen(参考訳) ニューラルネットワークベースのモデルは、様々な自然言語処理タスクの最先端モデルであるが、特に、入力と出力の両方が語彙の巨大なサイズを持つテキスト生成タスク(例えば、機械翻訳、テキスト要約)において、ネットワークにおける入出力次元の問題はまだ完全に解決されていない。 そのため、入出力埋込み重量共有が広く導入され、改良が続けられている。 本稿では, 線形代数と統計理論に基づいて, 既設の入出力埋込重量共有法の欠点を把握し, 組込重量行列の正規化法が最高の性能を示すように, 入出力埋込重量共有埋込量改善法を提起する。 これらの手法は計算コストがほとんどなく、他の埋め込み技術と組み合わせることができ、最先端のニューラルネットワークモデルに適用した場合に有効性を示す。 Transformer-Bigモデルの場合、正規化技術はWMT'16 En-Deデータセットのモデルのオリジナルバージョンと比べて最大で0.6BLEUの改善と、IWSLT 14のデータセットのBLEUの改善が可能である。 dynamicconvモデルでは、wmt'16 en-deデータセットで0.5 bleu改善を達成でき、iwslt 14' de-en翻訳タスクで 0.41 bleu改善を達成している。

Neural Network based models have been state-of-the-art models for various Natural Language Processing tasks, however, the input and output dimension problem in the networks has still not been fully resolved, especially in text generation tasks (e.g. Machine Translation, Text Summarization), in which input and output both have huge sizes of vocabularies. Therefore, input-output embedding weight sharing has been introduced and adopted widely, which remains to be improved. Based on linear algebra and statistical theories, this paper locates the shortcoming of existed input-output embedding weight sharing method, then raises methods for improving input-output weight shared embedding, among which methods of normalization of embedding weight matrices show best performance. These methods are nearly computational cost-free, can get combined with other embedding techniques, and show good effectiveness when applied on state-of-the-art Neural Network models. For Transformer-big models, the normalization techniques can get at best 0.6 BLEU improvement compared to the original version of model on WMT'16 En-De dataset, and similar BLEU improvements on IWSLT 14' datasets. For DynamicConv models, 0.5 BLEU improvement can be attained on WMT'16 En-De dataset, and 0.41 BLEU improvement on IWSLT 14' De-En translation task is achieved.
翻訳日:2023-01-07 17:54:11 公開日:2020-01-24
# The Enron Corpus:Eメールの死体はどこに埋もれているか?

The Enron Corpus: Where the Email Bodies are Buried? ( http://arxiv.org/abs/2001.10374v1 )

ライセンス: Link先を確認
David Noever(参考訳) 詐欺の指標として最大規模の公開ドメイン電子メールデータベースを探索するため,機械学習を適用し,4つの調査課題を遂行する。 まず、金融記録と電子メールを用いて関心のある人物(POI)を特定し、ピーク精度は95.7%である。 第2に、公開されている個人識別情報(PII)を見つけ、5万件の未報告事例を発見。 第3に、カリフォルニアの停電訴訟で人間の専門家が得点した法的応答性のあるメールを自動的に警告し、最大99%の正確性を見出す。 最後に、企業危機の開始前後の3年間に1万人以上のユニークな人々に対して、主要なトピックと感情を追跡しています。 可能な場合、51のアルゴリズムの実行時間と比較し、巨大なデータセットにスケール可能なヒューマン解釈可能なビジネスルールを報告します。

To probe the largest public-domain email database for indicators of fraud, we apply machine learning and accomplish four investigative tasks. First, we identify persons of interest (POI), using financial records and email, and report a peak accuracy of 95.7%. Secondly, we find any publicly exposed personally identifiable information (PII) and discover 50,000 previously unreported instances. Thirdly, we automatically flag legally responsive emails as scored by human experts in the California electricity blackout lawsuit, and find a peak 99% accuracy. Finally, we track three years of primary topics and sentiment across over 10,000 unique people before, during and after the onset of the corporate crisis. Where possible, we compare accuracy against execution times for 51 algorithms and report human-interpretable business rules that can scale to vast datasets.
翻訳日:2023-01-07 05:38:02 公開日:2020-01-24
# 信頼性の高い自律システムの認証フレームワークを目指して

Towards a Framework for Certification of Reliable Autonomous Systems ( http://arxiv.org/abs/2001.09124v1 )

ライセンス: Link先を確認
Michael Fisher, Viviana Mascardi, Kristin Yvonne Rozier, Bernd-Holger Schlingloff, Michael Winikoff and Neil Yorke-Smith(参考訳) 計算システムは、人間の監督や制御なしに独自の決定を下したり、独自の行動を取ることができれば、自律的と呼ばれる。 このようなシステムの能力と普及は、日々の生活の多くに触れ始めている段階に達している。 しかし、規制当局は、例えば民間の空域で自律的に使うために、無人航空システムをどうやって認定できるのか? ここでは,自律システムの信頼性の高い動作を保証するために何が必要かを分析し,自動検証の最先端として何ができるかを分析し,研究者や技術者,規制当局に対する課題の明確化を含む規制ガイドラインの開発に向けたロードマップを提案する。 7つの異なるドメインのケーススタディがその記事を示しています。

A computational system is called autonomous if it is able to make its own decisions, or take its own actions, without human supervision or control. The capability and spread of such systems have reached the point where they are beginning to touch much of everyday life. However, regulators grapple with how to deal with autonomous systems, for example how could we certify an Unmanned Aerial System for autonomous use in civilian airspace? We here analyse what is needed in order to provide verified reliable behaviour of an autonomous system, analyse what can be done as the state-of-the-art in automated verification, and propose a roadmap towards developing regulatory guidelines, including articulating challenges to researchers, to engineers, and to regulators. Case studies in seven distinct domains illustrate the article.
翻訳日:2023-01-07 05:35:49 公開日:2020-01-24
# 高次元線形回帰に対するインプテーション

Imputation for High-Dimensional Linear Regression ( http://arxiv.org/abs/2001.09180v1 )

ライセンス: Link先を確認
Kabir Aladin Chandrasekher, Ahmed El Alaoui, Andrea Montanari(参考訳) 共変項の項目を欠いた高次元回帰について検討する。 実際には一般的な戦略は、不足したエントリを適切な代用で \emph{impute} し、余変数が完全に観察されたかのように振る舞う標準的な統計手続きを実行することである。 この問題に関する最近の文献では、その代わりに特定の、しばしば複雑な、あるいは非凸なアルゴリズムを設計することを提案している。 観測された共変量の条件付き平均で欠落したエントリを記入するより単純なアプローチについて検討する。 本稿では,この計算手法とLASSOや正方根LASSOのような標準オフザシェルフ法が組み合わさって,共変量<i.d.\サブガウス的なランダム設計条件における最小値推定率を保持することを示す。 さらに、この設定では平方根 LASSO が \emph{pivotal} のままであることを示す。 条件付き予測が正確に計算できず、データから近似しなければならない場合がしばしばある。 本研究は,共変体が自己回帰(AR)過程に従うか,あるいは疎精度行列を伴ってガウス的である2症例について検討した。 条件付き期待値の抽出可能な推定器を提案し,lassoによる線形回帰を行い,両者で同様の推定率を示す。 我々の理論結果を合成および半合成の例のシミュレーションで補完し、境界の鋭さだけでなく、理論的な仮定を超えてこの戦略の広範な有用性を示す。

We study high-dimensional regression with missing entries in the covariates. A common strategy in practice is to \emph{impute} the missing entries with an appropriate substitute and then implement a standard statistical procedure acting as if the covariates were fully observed. Recent literature on this subject proposes instead to design a specific, often complicated or non-convex, algorithm tailored to the case of missing covariates. We investigate a simpler approach where we fill-in the missing entries with their conditional mean given the observed covariates. We show that this imputation scheme coupled with standard off-the-shelf procedures such as the LASSO and square-root LASSO retains the minimax estimation rate in the random-design setting where the covariates are i.i.d.\ sub-Gaussian. We further show that the square-root LASSO remains \emph{pivotal} in this setting. It is often the case that the conditional expectation cannot be computed exactly and must be approximated from data. We study two cases where the covariates either follow an autoregressive (AR) process, or are jointly Gaussian with sparse precision matrix. We propose tractable estimators for the conditional expectation and then perform linear regression via LASSO, and show similar estimation rates in both cases. We complement our theoretical results with simulations on synthetic and semi-synthetic examples, illustrating not only the sharpness of our bounds, but also the broader utility of this strategy beyond our theoretical assumptions.
翻訳日:2023-01-07 05:35:35 公開日:2020-01-24
# ワイヤレスセキュリティが機械学習を満たすとき - モチベーション、課題、研究の方向性

When Wireless Security Meets Machine Learning: Motivation, Challenges, and Research Directions ( http://arxiv.org/abs/2001.08883v1 )

ライセンス: Link先を確認
Yalin E. Sagduyu, Yi Shi, Tugba Erpek, William Headley, Bryse Flowers, George Stantchev, Zhuo Lu(参考訳) 無線システムは、無線媒体の共有およびブロードキャスト性のため、妨害や盗聴などの様々な攻撃に対して脆弱である。 攻撃戦略と防衛戦略の両方をサポートするため、機械学習(ML)は、手作りの特徴やモデルによって捉えにくい無線通信特性から学習し、適応するための自動化手段を提供する。 本稿では,MLと無線セキュリティを橋渡しする研究のモチベーション,背景,範囲について論じる。 無線セキュリティのためのMLの文脈で調査された研究方向に基づいて、MLベースの攻撃・防御ソリューションと、無線ドメインにおける新たな敵ML技術が特定され、MLと無線セキュリティをブリッジする研究の取り組みを促進するロードマップと共に提供される。

Wireless systems are vulnerable to various attacks such as jamming and eavesdropping due to the shared and broadcast nature of wireless medium. To support both attack and defense strategies, machine learning (ML) provides automated means to learn from and adapt to wireless communication characteristics that are hard to capture by hand-crafted features and models. This article discusses motivation, background, and scope of research efforts that bridge ML and wireless security. Motivated by research directions surveyed in the context of ML for wireless security, ML-based attack and defense solutions and emerging adversarial ML techniques in the wireless domain are identified along with a roadmap to foster research efforts in bridging ML and wireless security.
翻訳日:2023-01-07 05:34:38 公開日:2020-01-24
# ポイント・オブ・インテンシブ・レコメンデーションのための行列因子化に基づく共同地理・時間モデル

Joint Geographical and Temporal Modeling based on Matrix Factorization for Point-of-Interest Recommendation ( http://arxiv.org/abs/2001.08961v1 )

ライセンス: Link先を確認
Hossein A. Rahmani, Mohammad Aliannejadi, Mitra Baratchi, Fabio Crestani(参考訳) 位置情報ベースのソーシャルネットワークの普及に伴い、POI(Point-of-Interest)レコメンデーションは重要なタスクとなり、POIを推奨するユーザの好みやモビリティパターンを学ぶ。 従来の研究では、地理的影響や時間的影響などの文脈情報を組み込むことで、データの疎性問題に対処してPOI勧告を改善する必要があることが示されている。 しかし、既存の手法は、これらの地理的影響の時間的特性を無視しつつ、POIとユーザ間の物理的距離に基づいて、地理的影響をモデル化する。 本稿では,ユーザの現在の時間的状況に応じて,ユーザのチェックインが複数の中心で発生することを明らかにする,ユーザモビリティパターンに関する研究を行う。 次に,ユーザの行動をより正確にモデル化する時空間的活動中心アルゴリズムを提案する。 最後に,二つの異なる条件下で行列因子化モデルに組み込むことにより,提案する文脈モデルの有効性を示す。 静的で,静的なさま ii) 時間的です。 STACPと呼ばれる提案手法の有効性を示すため,GowallaとFoursquareのLBSNから取得した2つのよく知られた実世界のデータセットについて実験を行った。 実験結果から,STACPモデルは最先端技術と比較して統計的に有意な性能向上が得られた。 また、ユーザの活動中心をモデル化するための地理的・時間的情報収集の有効性と、それらを共同でモデル化することの重要性を示す。

With the popularity of Location-based Social Networks, Point-of-Interest (POI) recommendation has become an important task, which learns the users' preferences and mobility patterns to recommend POIs. Previous studies show that incorporating contextual information such as geographical and temporal influences is necessary to improve POI recommendation by addressing the data sparsity problem. However, existing methods model the geographical influence based on the physical distance between POIs and users, while ignoring the temporal characteristics of such geographical influences. In this paper, we perform a study on the user mobility patterns where we find out that users' check-ins happen around several centers depending on their current temporal state. Next, we propose a spatio-temporal activity-centers algorithm to model users' behavior more accurately. Finally, we demonstrate the effectiveness of our proposed contextual model by incorporating it into the matrix factorization model under two different settings: i) static and ii) temporal. To show the effectiveness of our proposed method, which we refer to as STACP, we conduct experiments on two well-known real-world datasets acquired from Gowalla and Foursquare LBSNs. Experimental results show that the STACP model achieves a statistically significant performance improvement, compared to the state-of-the-art techniques. Also, we demonstrate the effectiveness of capturing geographical and temporal information for modeling users' activity centers and the importance of modeling them jointly.
翻訳日:2023-01-07 05:34:25 公開日:2020-01-24
# 神経組込みにおけるプログラムの構文表現と意味表現の比較

Comparison of Syntactic and Semantic Representations of Programs in Neural Embeddings ( http://arxiv.org/abs/2001.09201v1 )

ライセンス: Link先を確認
Austin P. Wright, Herbert Wiklicky(参考訳) プログラムの合成と理解に対するニューラルネットワークのアプローチはここ数年で広く普及し、同時にグラフベースのニューラルネットワークは有望な新しいツールとなった。 本研究は、ディープラーニングシステムにおけるプログラム表現における自然言語モデルと静的解析グラフモデルの有効性を比較する最初の実証研究である。 プログラム埋め込みのタスクにおいて、異なるグラフ表現を用いてグラフ畳み込みネットワークを比較する。 制御フローグラフの空間性とグラフ畳み込みネットワークの暗黙の集約は、これらのモデルが単純なモデルよりも悪い結果をもたらすことを示す。 したがって、グラフ畳み込みネットワークの構造よりもノイズを多く導入する形式特性のニュアンスな性質のため、純粋言語モデルや統計モデルに形式的情報を加えるだけではうまく機能しない。

Neural approaches to program synthesis and understanding have proliferated widely in the last few years; at the same time graph based neural networks have become a promising new tool. This work aims to be the first empirical study comparing the effectiveness of natural language models and static analysis graph based models in representing programs in deep learning systems. It compares graph convolutional networks using different graph representations in the task of program embedding. It shows that the sparsity of control flow graphs and the implicit aggregation of graph convolutional networks cause these models to perform worse than naive models. Therefore it concludes that simply augmenting purely linguistic or statistical models with formal information does not perform well due to the nuanced nature of formal properties introducing more noise than structure for graph convolutional networks.
翻訳日:2023-01-07 05:34:00 公開日:2020-01-24
# 事例研究:社会サービス介入による軽犯罪回避の予測的公平性

Case Study: Predictive Fairness to Reduce Misdemeanor Recidivism Through Social Service Interventions ( http://arxiv.org/abs/2001.09233v1 )

ライセンス: Link先を確認
Kit T. Rodolfa, Erika Salomon, Lauren Haynes, Ivan Higuera Mendieta, Jamie Larson, Rayid Ghani(参考訳) 刑事司法制度は現在、一連の軽犯罪によってシステム内外を循環する個人の結果を改善するために不備である。 多くの場合、ケースロードの制約とレコード結合の貧弱さのため、個人と個人との事前のやりとりは、ディバージョンプログラムの適用による積極的な方法でではなく、個人がシステムに戻ってくると考慮されない可能性がある。 ロサンゼルス市検察局は先日、この人口のリシディズムを減らそうとするRecidivism Reduction and Drug Diversion Unit(R2D2)を新設した。 本稿では、この新たなユニットとのコラボレーションを、リソース制約のある環境での機械学習に基づく意思決定に予測的株式を組み込むケーススタディとして説明する。 The program seeks to improve outcomes by developing individually-tailored social service interventions (i.e., diversions, conditional plea agreements, stayed sentencing, or other favorable case disposition based on appropriate social service linkage rather than traditional sentencing methods) for individuals likely to experience subsequent interactions with the criminal justice system, a time and resource-intensive undertaking that necessitates an ability to focus resources on individuals most likely to be involved in a future case. Seeking to achieve both efficiency (through predictive accuracy) and equity (improving outcomes in traditionally under-served communities and working to mitigate existing disparities in criminal justice outcomes), we discuss the equity outcomes we seek to achieve, describe the corresponding choice of a metric for measuring predictive fairness in this context, and explore a set of options for balancing equity and efficiency when building and selecting machine learning models in an operational public policy setting.

The criminal justice system is currently ill-equipped to improve outcomes of individuals who cycle in and out of the system with a series of misdemeanor offenses. Often due to constraints of caseload and poor record linkage, prior interactions with an individual may not be considered when an individual comes back into the system, let alone in a proactive manner through the application of diversion programs. The Los Angeles City Attorney's Office recently created a new Recidivism Reduction and Drug Diversion unit (R2D2) tasked with reducing recidivism in this population. Here we describe a collaboration with this new unit as a case study for the incorporation of predictive equity into machine learning based decision making in a resource-constrained setting. The program seeks to improve outcomes by developing individually-tailored social service interventions (i.e., diversions, conditional plea agreements, stayed sentencing, or other favorable case disposition based on appropriate social service linkage rather than traditional sentencing methods) for individuals likely to experience subsequent interactions with the criminal justice system, a time and resource-intensive undertaking that necessitates an ability to focus resources on individuals most likely to be involved in a future case. Seeking to achieve both efficiency (through predictive accuracy) and equity (improving outcomes in traditionally under-served communities and working to mitigate existing disparities in criminal justice outcomes), we discuss the equity outcomes we seek to achieve, describe the corresponding choice of a metric for measuring predictive fairness in this context, and explore a set of options for balancing equity and efficiency when building and selecting machine learning models in an operational public policy setting.
翻訳日:2023-01-07 05:33:47 公開日:2020-01-24
# 離散グラフィカルモデル --最適化の観点から

Discrete graphical models -- an optimization perspective ( http://arxiv.org/abs/2001.09017v1 )

ライセンス: Link先を確認
Bogdan Savchynskyy(参考訳) このモノグラフは、離散的グラフィカルモデルに対する離散エネルギー最小化に関するものである。 グラフィカルモデル、あるいはより正確には、グラフィカルモデルに対する最大後部推論を、純粋に組合せ最適化問題として考える。 モデリング、アプリケーション、確率論的解釈、その他多くの側面はここで無視されるか、例や発言でのみその場所を見つける。 問題の整数線形計画定式化や、線形計画法、ラグランジュ分解法、ラグランジュ分解に基づく緩和法を扱っている。 特に、多項式可解な非巡回問題と部分モジュラー問題の詳細な解析と対応する正確な最適化方法を提供する。 メッセージパッシングやグラフカットといった近似手法についても概説し,解析を行った。 モノグラフは、大学生や大学院生が最適化やグラフィカルモデルを研究するのに有用であり、また、グラフィカルモデルを調べたい最適化の専門家にも有用である。 両カテゴリの読者に相応しいグラフを作成するために,数学最適化の背景章をグラフィカルモデル特有の章と明確に分離する。

This monograph is about discrete energy minimization for discrete graphical models. It considers graphical models, or, more precisely, maximum a posteriori inference for graphical models, purely as a combinatorial optimization problem. Modeling, applications, probabilistic interpretations and many other aspects are either ignored here or find their place in examples and remarks only. It covers the integer linear programming formulation of the problem as well as its linear programming, Lagrange and Lagrange decomposition-based relaxations. In particular, it provides a detailed analysis of the polynomially solvable acyclic and submodular problems, along with the corresponding exact optimization methods. Major approximate methods, such as message passing and graph cut techniques are also described and analyzed comprehensively. The monograph can be useful for undergraduate and graduate students studying optimization or graphical models, as well as for experts in optimization who want to have a look into graphical models. To make the monograph suitable for both categories of readers we explicitly separate the mathematical optimization background chapters from those specific to graphical models.
翻訳日:2023-01-07 05:33:24 公開日:2020-01-24
# ビデオ中の異常をローカライズするシームズネットワークを用いた距離関数の学習

Learning a distance function with a Siamese network to localize anomalies in videos ( http://arxiv.org/abs/2001.09189v1 )

ライセンス: Link先を確認
Bharathkumar Ramachandra, Michael J. Jones, Ranga Raju Vatsavai(参考訳) 本研究は,監視ビデオ中の異常をローカライズするための新しいアプローチを導入する。 主な特徴は、一対のビデオパッチ(spatio-temporal region of video)間の距離関数を学ぶために、シアム畳み込みニューラルネットワーク(cnn)を使用するという考えである。 学習距離関数は、対象の動画に固有のものではなく、テストビデオの各ビデオパッチと通常のトレーニングビデオに見られるビデオパッチの間の距離を測定するために使用される。 テストビデオパッチが通常のビデオパッチと似ていない場合は、異常である必要がある。 提案手法を,4つの評価尺度と3つの目標ベンチマークデータセットを用いたアルゴリズムと比較した。 実験により、我々のアプローチは現在の最先端の手法に匹敵するか、相容れない性能を示す。

This work introduces a new approach to localize anomalies in surveillance video. The main novelty is the idea of using a Siamese convolutional neural network (CNN) to learn a distance function between a pair of video patches (spatio-temporal regions of video). The learned distance function, which is not specific to the target video, is used to measure the distance between each video patch in the testing video and the video patches found in normal training video. If a testing video patch is not similar to any normal video patch then it must be anomalous. We compare our approach to previously published algorithms using 4 evaluation measures and 3 challenging target benchmark datasets. Experiments show that our approach either surpasses or performs comparably to current state-of-the-art methods.
翻訳日:2023-01-07 05:26:32 公開日:2020-01-24
# 機械理解可能なポリシーとgdprコンプライアンスチェック

Machine Understandable Policies and GDPR Compliance Checking ( http://arxiv.org/abs/2001.08930v1 )

ライセンス: Link先を確認
Piero A. Bonatti, Sabrina Kirrane, Iliana M. Petrova, Luigi Sauro(参考訳) 欧州一般データ保護規則(gdpr)は、その実施を支援する技術的および組織的措置を要求。 この目的に向かって、SPECIAL H2020プロジェクトは、データコントローラやプロセッサがGDPRの義務に準拠する個人データ処理と共有を自動的にチェックできる一連のツールを提供することを目的としている。 プロジェクトの主な貢献は次のとおりである。 一 同意、事業方針及び規制義務の表現に使用できる政策言語 2 自動コンプライアンスチェックに対する2つの異なるアプローチは、データコントローラ/プロセッサが行うデータ処理が、データ主体が提供する同意を遵守すること、およびビジネスプロセスがGDPRに定める規制義務に従うことを実証するために使用することができる。

The European General Data Protection Regulation (GDPR) calls for technical and organizational measures to support its implementation. Towards this end, the SPECIAL H2020 project aims to provide a set of tools that can be used by data controllers and processors to automatically check if personal data processing and sharing complies with the obligations set forth in the GDPR. The primary contributions of the project include: (i) a policy language that can be used to express consent, business policies, and regulatory obligations; and (ii) two different approaches to automated compliance checking that can be used to demonstrate that data processing performed by data controllers / processors complies with consent provided by data subjects, and business processes comply with regulatory obligations set forth in the GDPR.
翻訳日:2023-01-07 05:26:14 公開日:2020-01-24
# Advaita:バグの重複検出システム

Advaita: Bug Duplicity Detection System ( http://arxiv.org/abs/2001.10376v1 )

ライセンス: Link先を確認
Amit Kumar, Manohar Madanu, Hari Prakash, Lalitha Jonnavithula, Srinivasa Rao Aravilli(参考訳) バグはソフトウェア開発で多い。 ソフトウェア品質を改善するため、バグトラッキングシステムを使用してバグを申請する。 報告されたバグの特性は、ヘッドライン、説明、プロジェクト、製品、コンポーネントで構成され、バグとバグの深刻度に影響される。 重複バグ率(重複バグの%)は、製品の成熟度、コードのサイズ、プロジェクトに取り組んでいるエンジニアの数に基づいて、1桁(1~9%)から2桁(40%)の範囲にある。 重複バグの範囲は、EclipseやFirefoxなど、いくつかのオープンソースプロジェクトで9%から39%である。 重複の検出は、2つのバグが同じ意味を持つかどうかを識別する。 この重複の検出は重複解消に役立つ。 重複バグの検出は、トリアージの労力を削減し、問題を修正する開発者の時間を節約する。 従来の自然言語処理技術は、文間の類似性を識別するのに精度が低い。 バグ追跡システムに存在するバグデータを用いて、複数の機械学習アルゴリズムを含む様々なアプローチを探索し、複数の文(つまり、それぞれのバグ記述)から重複したバグを識別できる実行可能なアプローチを得る。 このアプローチでは、基本的なテキスト統計的特徴、意味的特徴、文脈的特徴など、複数の機能セットを考慮する。 これらの特徴は見出し、説明、コンポーネントから抽出され、その後分類アルゴリズムのトレーニングに使用される。

Bugs are prevalent in software development. To improve software quality, bugs are filed using a bug tracking system. Properties of a reported bug would consist of a headline, description, project, product, component that is affected by the bug and the severity of the bug. Duplicate bugs rate (% of duplicate bugs) are in the range from single digit (1 to 9%) to double digits (40%) based on the product maturity , size of the code and number of engineers working on the project. Duplicate bugs range are between 9% to 39% in some of the open source projects like Eclipse, Firefox etc. Detection of duplicity deals with identifying whether any two bugs convey the same meaning. This detection of duplicates helps in de-duplication. Detecting duplicate bugs help reduce triaging efforts and saves time for developers in fixing the issues. Traditional natural language processing techniques are less accurate in identifying similarity between sentences. Using the bug data present in a bug tracking system, various approaches were explored including several machine learning algorithms, to obtain a viable approach that can identify duplicate bugs, given a pair of sentences(i.e. the respective bug descriptions). This approach considers multiple sets of features viz. basic text statistical features, semantic features and contextual features. These features are extracted from the headline, description and component and are subsequently used to train a classification algorithm.
翻訳日:2023-01-07 05:26:02 公開日:2020-01-24
# ネステロフの推定列からリーマン加速度へ

From Nesterov's Estimate Sequence to Riemannian Acceleration ( http://arxiv.org/abs/2001.08876v1 )

ライセンス: Link先を確認
Kwangjun Ahn and Suvrit Sra(参考訳) リーマン多様体に対する最初の大域的加速勾配法を提案する。 結果の確立に向けて,ネステロフの推定シーケンス手法を再検討し,それに対する別の分析手法の開発を行った。 そして、この解析をリーマン集合に拡張し、非ユークリッド構造による鍵的困難をある「計量歪み」に局所化する。 この歪みを制御するために,新しい幾何学的不等式を開発し,ネステロフの加速度勾配法に対するリーマンの対応式の提案と解析を可能にした。

We propose the first global accelerated gradient method for Riemannian manifolds. Toward establishing our result we revisit Nesterov's estimate sequence technique and develop an alternative analysis for it that may also be of independent interest. Then, we extend this analysis to the Riemannian setting, localizing the key difficulty due to non-Euclidean structure into a certain ``metric distortion.'' We control this distortion by developing a novel geometric inequality, which permits us to propose and analyze a Riemannian counterpart to Nesterov's accelerated gradient method.
翻訳日:2023-01-07 05:25:40 公開日:2020-01-24
# 離散的・連続的に変化する環境における視覚位置認識のための教師なし学習法

Unsupervised Learning Methods for Visual Place Recognition in Discretely and Continuously Changing Environments ( http://arxiv.org/abs/2001.08960v1 )

ライセンス: Link先を確認
Stefan Schubert and Peer Neubert and Peter Protzel(参考訳) 環境変化における視覚的位置認識は、厳しい外観変化にもかかわらず、2つの観測セット、クエリセットと参照セットのマッチングを見つける問題である。 近年,cnnを用いた画像比較で有望な結果が得られた。 しかしながら、文献からの既存の実験は、通常、各集合内の単一の特異な条件(例えば、日、クエリー、夜)を仮定する。 条件が1つのセット内で変化すると(例えば、日、クエリ: traversal daytime-dusk-night-dawn)、同じ条件下の異なる場所は、異なる条件下の同じ場所よりも突然よく見え、CNNベースの記述子のような最先端のアプローチは失敗する。 本論では,(1)非順序変化,(2)離散的インシーケンス変化,(3)連続的インシーケンス変化といった問題設定の階層を定義する。 これらの変化が2つの最先端CNN記述子に与える影響を実験的に評価する。 本実験は, ディスクリプタの統計的標準化の重要性を強調し, 連続的な変化の場合の限界を示す。 そこで本研究では,2つのPCAベースの手法を用いて教師なし学習手法の適用について検討し,統計的正規化のクラスタリングに基づく新たな拡張を提案する。

Visual place recognition in changing environments is the problem of finding matchings between two sets of observations, a query set and a reference set, despite severe appearance changes. Recently, image comparison using CNN-based descriptors showed very promising results. However, existing experiments from the literature typically assume a single distinctive condition within each set (e.g., reference: day, query: night). We demonstrate that as soon as the conditions change within one set (e.g., reference: day, query: traversal daytime-dusk-night-dawn), different places under the same condition can suddenly look more similar than same places under different conditions and state-of-the-art approaches like CNN-based descriptors fail. This paper discusses this practically very important problem of in-sequence condition changes and defines a hierarchy of problem setups from (1) no in-sequence changes, (2) discrete in-sequence changes, to (3) continuous in-sequence changes. We will experimentally evaluate the effect of these changes on two state-of-the-art CNN-descriptors. Our experiments emphasize the importance of statistical standardization of descriptors and shows its limitations in case of continuous changes. To address this practically most relevant setup, we investigate and experimentally evaluate the application of unsupervised learning methods using two available PCA-based approaches and propose a novel clustering-based extension of the statistical normalization.
翻訳日:2023-01-07 05:25:12 公開日:2020-01-24
# 自律運転における一般値関数を用いた知覚の予測

Perception as prediction using general value functions in autonomous driving applications ( http://arxiv.org/abs/2001.09113v1 )

ライセンス: Link先を確認
Daniel Graves, Kasra Rezaee, Sean Scheideman(参考訳) 我々は,一般価値関数(gvfs)を用いた自律運転の予測として知覚という枠組みを提案し,その実証を行った。 予測としての知覚は、エージェントが世界に対する認識に与える影響に関連するデータ駆動予測を学ぶ。 また、ポリシーや意図を明示的に学習することなく、他のエージェントが予測した行動が世界に与える影響を予測するデータ駆動アプローチも提供する。 我々は,GVFを用いてエージェントの前部安全と後部安全を予測し,前部および後部における車両の挙動の予測をカプセル化する学習による予測として認識を実証する。 安全予測は、他のエージェントを含むシミュレーション環境でランダムな相互作用を通じて学習される。 これらの予測は、適応クルーズ制御問題においてlqrベースのコントローラと類似した制御挙動を発生させるだけでなく、後方の車両が危険に接近した場合に高度な警告を与えるために使用できる。 予測は、特定の政策に従う際の安全性に対する長期的な影響を予測するための、コンパクトな政策に基づく予測である。 レースシミュレータで学習した予測を用いた2つのコントローラを解析し,予測の価値を理解し,clearpath jackalロボットと自律走行車プラットフォームにおける実世界での利用を実証する。

We propose and demonstrate a framework called perception as prediction for autonomous driving that uses general value functions (GVFs) to learn predictions. Perception as prediction learns data-driven predictions relating to the impact of actions on the agent's perception of the world. It also provides a data-driven approach to predict the impact of the anticipated behavior of other agents on the world without explicitly learning their policy or intentions. We demonstrate perception as prediction by learning to predict an agent's front safety and rear safety with GVFs, which encapsulate anticipation of the behavior of the vehicle in front and in the rear, respectively. The safety predictions are learned through random interactions in a simulated environment containing other agents. We show that these predictions can be used to produce similar control behavior to an LQR-based controller in an adaptive cruise control problem as well as provide advanced warning when the vehicle behind is approaching dangerously. The predictions are compact policy-based predictions that support prediction of the long term impact on safety when following a given policy. We analyze two controllers that use the learned predictions in a racing simulator to understand the value of the predictions and demonstrate their use in the real-world on a Clearpath Jackal robot and an autonomous vehicle platform.
翻訳日:2023-01-07 05:23:52 公開日:2020-01-24
# 深層強化学習を用いた視覚に基づく適応型クルーズ制御(ACC)

End-to-End Vision-Based Adaptive Cruise Control (ACC) Using Deep Reinforcement Learning ( http://arxiv.org/abs/2001.09181v1 )

ライセンス: Link先を確認
Zhensong Wei, Yu Jiang, Xishun Liao, Xuewei Qi, Ziran Wang, Guoyuan Wu, Peng Hao, Matthew Barth(参考訳) 本稿では,Double Deep Q-networksという深層強化学習手法を提案し,エンドツーエンドの視覚ベースの適応クルーズ制御(ACC)システムを設計した。 車両の物理的モデルと訓練とテストのための特徴データの両方を提供するゲームエンジンであるUnityで、ハイウェイシーンのシミュレーション環境が設定された。 内燃機関 (ice) と電気自動車 (ev) の強化学習モデルにおいて, 次の距離, スロットル/ブレーキ力に付随する良く設計された報酬機能を実装し, 適応クルーズ制御を行った。 差分統計と総エネルギー消費を異なる車両タイプで評価し, 報酬関数とパワートレイン特性の関係について検討した。 従来のレーダベースACCシステムやHuman-in-the-loopシミュレーションと比較して、提案するACCシステムは、予め設定された報酬関数に応じてより良いギャップ規制軌道またはよりスムーズな速度軌道を生成することができる。 提案システムは,先行車両の異なる速度軌道に適応し,リアルタイムに動作可能である。

This paper presented a deep reinforcement learning method named Double Deep Q-networks to design an end-to-end vision-based adaptive cruise control (ACC) system. A simulation environment of a highway scene was set up in Unity, which is a game engine that provided both physical models of vehicles and feature data for training and testing. Well-designed reward functions associated with the following distance and throttle/brake force were implemented in the reinforcement learning model for both internal combustion engine (ICE) vehicles and electric vehicles (EV) to perform adaptive cruise control. The gap statistics and total energy consumption are evaluated for different vehicle types to explore the relationship between reward functions and powertrain characteristics. Compared with the traditional radar-based ACC systems or human-in-the-loop simulation, the proposed vision-based ACC system can generate either a better gap regulated trajectory or a smoother speed trajectory depending on the preset reward function. The proposed system can be well adaptive to different speed trajectories of the preceding vehicle and operated in real-time.
翻訳日:2023-01-07 05:17:35 公開日:2020-01-24
# 通信制約下における分散ガウス平均推定:最適レートと通信効率アルゴリズム

Distributed Gaussian Mean Estimation under Communication Constraints: Optimal Rates and Communication-Efficient Algorithms ( http://arxiv.org/abs/2001.08877v1 )

ライセンス: Link先を確認
T. Tony Cai, Hongji Wei(参考訳) 本稿では,ガウス平均の分散推定を,決定理論の枠組みによる通信制約下で検討する。 単変量と多変量の両方の設定において,通信コストと統計的精度のトレードオフを特徴付ける収束の最小値を確立する。 通信効率と統計的に最適な手順が開発されている。 不定値の場合、最適なレートは、各ローカルマシンが少なくとも1ビットしか持たない限り、全体の通信予算にのみ依存する。 しかし、多変量の場合、ミニマックスレートはローカルマシン間の通信予算の特定の割り当てに依存する。 ガウス平均の最適推定は、従来の設定では比較的単純なものであるが、最適な手続き設計と下限引数の両方の観点から、通信制約下では極めて関与している。 本論文で開発された手法は, 独立した興味を持つことができる。 重要なステップは、極小推定問題を局所化と洗練の2段階に分解することである。 この臨界分解は、下界解析と最適手順設計の両方のためのフレームワークを提供する。

We study distributed estimation of a Gaussian mean under communication constraints in a decision theoretical framework. Minimax rates of convergence, which characterize the tradeoff between the communication costs and statistical accuracy, are established in both the univariate and multivariate settings. Communication-efficient and statistically optimal procedures are developed. In the univariate case, the optimal rate depends only on the total communication budget, so long as each local machine has at least one bit. However, in the multivariate case, the minimax rate depends on the specific allocations of the communication budgets among the local machines. Although optimal estimation of a Gaussian mean is relatively simple in the conventional setting, it is quite involved under the communication constraints, both in terms of the optimal procedure design and lower bound argument. The techniques developed in this paper can be of independent interest. An essential step is the decomposition of the minimax estimation problem into two stages, localization and refinement. This critical decomposition provides a framework for both the lower bound analysis and optimal procedure design.
翻訳日:2023-01-07 05:17:14 公開日:2020-01-24
# ファストグランド・トゥルート生成を用いた植物幹の分節化

Plant Stem Segmentation Using Fast Ground Truth Generation ( http://arxiv.org/abs/2001.08854v1 )

ライセンス: Link先を確認
Changye Yang, Sriram Baireddy, Yuhao Chen, Enyu Cai, Denise Caldwell, Val\'erian M\'eline, Anjali S. Iyer-Pascuzzi, Edward J. Delp(参考訳) 環境ストレスに対する反応を理解するには, 正確な表現型植物ウィルティングが重要である。 植物の形状の分析は、ワイルティングの程度を正確に定量化するために用いられる可能性がある。 植物形状解析は、反りの間一貫した基準点として機能する茎を位置決めすることで強化することができる。 本稿では,深層学習がトマトの茎を正確に分割できることを示す。 また,深層学習アプローチのためのトレーニングデータセット作成に必要なリソースを劇的に削減する制御点ベースの基底真理法を提案する。 実験の結果,本提案手法と深層学習に基づくstemセグメンテーションの両方の有効性が示された。

Accurately phenotyping plant wilting is important for understanding responses to environmental stress. Analysis of the shape of plants can potentially be used to accurately quantify the degree of wilting. Plant shape analysis can be enhanced by locating the stem, which serves as a consistent reference point during wilting. In this paper, we show that deep learning methods can accurately segment tomato plant stems. We also propose a control-point-based ground truth method that drastically reduces the resources needed to create a training dataset for a deep learning approach. Experimental results show the viability of both our proposed ground truth approach and deep learning based stem segmentation.
翻訳日:2023-01-07 05:16:49 公開日:2020-01-24
# 画像検索高速化のためのプログレッシブローカルフィルタプルーニング

Progressive Local Filter Pruning for Image Retrieval Acceleration ( http://arxiv.org/abs/2001.08878v1 )

ライセンス: Link先を確認
Xiaodong Wang, Zhedong Zheng, Yang He, Fei Yan, Zhiqiang Zeng, Yi Yang(参考訳) 本稿では,画像検索高速化のためのネットワークプルーニングについて述べる。 画像検索は、識別的特徴学習においてターゲットとなるが、実際の実践において考慮すべきモデル推論の高速化には、ほとんど注意が払わない。 画像検索モデルのプルーニングの課題は、中間レベルの機能は可能な限り保存されるべきである。 このような検索と分類モデルの異なる要求により、従来の刈り取り手法はタスクに適さない。 そこで本研究では,画像検索高速化のためのプログレッシブ・ローカル・フィルタ・プルーニング(PLFP)手法を提案する。 具体的には,各フィルタの局所的な幾何学的性質を分析し,隣接するフィルタに置き換えられるものを選択する。 そして, フィルタ重みを徐々に変化させることにより, フィルタを徐々にプルーピングする。 このように、モデルの表現能力は保存される。 これを検証するために,オックスフォード5kとパリ6Kの2つの広く利用されている画像検索データセットと,マーケット1501という1人の再識別データセットを用いて,本手法の評価を行った。 提案手法は,従来のプルーニング法よりも優れた性能を示し,画像検索における提案手法の有効性を示唆する。

This paper focuses on network pruning for image retrieval acceleration. Prevailing image retrieval works target at the discriminative feature learning, while little attention is paid to how to accelerate the model inference, which should be taken into consideration in real-world practice. The challenge of pruning image retrieval models is that the middle-level feature should be preserved as much as possible. Such different requirements of the retrieval and classification model make the traditional pruning methods not that suitable for our task. To solve the problem, we propose a new Progressive Local Filter Pruning (PLFP) method for image retrieval acceleration. Specifically, layer by layer, we analyze the local geometric properties of each filter and select the one that can be replaced by the neighbors. Then we progressively prune the filter by gradually changing the filter weights. In this way, the representation ability of the model is preserved. To verify this, we evaluate our method on two widely-used image retrieval datasets,i.e., Oxford5k and Paris6K, and one person re-identification dataset,i.e., Market-1501. The proposed method arrives with superior performance to the conventional pruning methods, suggesting the effectiveness of the proposed method for image retrieval.
翻訳日:2023-01-07 05:16:39 公開日:2020-01-24
# 文字非依存フォント識別

Character-independent font identification ( http://arxiv.org/abs/2001.08893v1 )

ライセンス: Link先を確認
Daichi Haraguchi, Shota Harada, Brian Kenji Iwana, Yuto Shinahara, Seiichi Uchida(参考訳) 様々な形や様式のフォントは数え切れないほどある。 さらに、機能に微妙な違いしか持たないフォントも数多く存在する。 このため、フォントの識別は難しい作業である。 本稿では,2文字が同一フォントであるか否かを判定する手法を提案する。 フォントの違いは典型的にはアルファベットのクラスの違いよりも小さいため、これは難しい。 また,本手法は,訓練中の有無にかかわらず,フォントで使用することができる。 これを実現するために、さまざまなフォントイメージペアで訓練された畳み込みニューラルネットワーク(CNN)を用いる。 実験では、ネットワークは様々なフォントの画像ペアで訓練される。 次に,ネットワークでは認識できないフォントの異なるセットでモデルを評価する。 評価は92.27%の精度で行われる。 さらに,文字クラスとフォント識別精度の関係を分析した。

There are a countless number of fonts with various shapes and styles. In addition, there are many fonts that only have subtle differences in features. Due to this, font identification is a difficult task. In this paper, we propose a method of determining if any two characters are from the same font or not. This is difficult due to the difference between fonts typically being smaller than the difference between alphabet classes. Additionally, the proposed method can be used with fonts regardless of whether they exist in the training or not. In order to accomplish this, we use a Convolutional Neural Network (CNN) trained with various font image pairs. In the experiment, the network is trained on image pairs of various fonts. We then evaluate the model on a different set of fonts that are unseen by the network. The evaluation is performed with an accuracy of 92.27%. Moreover, we analyzed the relationship between character classes and font identification accuracy.
翻訳日:2023-01-07 05:16:19 公開日:2020-01-24
# 点雲上の教師付き学習による6次元オブジェクトポス回帰

6D Object Pose Regression via Supervised Learning on Point Clouds ( http://arxiv.org/abs/2001.08942v1 )

ライセンス: Link先を確認
Ge Gao, Mikko Lauri, Yulong Wang, Xiaolin Hu, Jianwei Zhang and Simone Frintrop(参考訳) 本稿では,点雲で表される深度情報から,既知の3次元物体の6自由度ポーズを推定する作業について述べる。 色情報から畳み込みニューラルネットワークによって学習された深い特徴は、オブジェクトのポーズを推測するのに使用される主要な特徴である。 しかし、深度情報には、オブジェクトのポーズを推測する上で重要な、オブジェクト形状の豊富な幾何学的情報が含まれている。 我々は、深度ネットワークと幾何ベースのポーズ改善の両方への入力として、点雲で表される深度情報を使用し、回転と翻訳の回帰のために別々のネットワークを使用する。 我々は、軸角表現が深層学習に適した回転表現であり、測地損失関数を回転回帰に用いていると論じる。 アブレーション研究は、これらの設計選択が四元数表現やl2損失、または同じネットワークで翻訳と回転を後退させるような代替案よりも優れていることを示している。 我々の単純で効果的なアプローチは、YCBビデオデータセットの最先端手法よりも明らかに優れている。 実装とトレーニングされたモデルは、次のように評価可能である。

This paper addresses the task of estimating the 6 degrees of freedom pose of a known 3D object from depth information represented by a point cloud. Deep features learned by convolutional neural networks from color information have been the dominant features to be used for inferring object poses, while depth information receives much less attention. However, depth information contains rich geometric information of the object shape, which is important for inferring the object pose. We use depth information represented by point clouds as the input to both deep networks and geometry-based pose refinement and use separate networks for rotation and translation regression. We argue that the axis-angle representation is a suitable rotation representation for deep learning, and use a geodesic loss function for rotation regression. Ablation studies show that these design choices outperform alternatives such as the quaternion representation and L2 loss, or regressing translation and rotation with the same network. Our simple yet effective approach clearly outperforms state-of-the-art methods on the YCB-video dataset. The implementation and trained model are avaliable at: https://github.com/GeeeG/CloudPose.
翻訳日:2023-01-07 05:16:11 公開日:2020-01-24
# SceneEncoder:学習可能なシーン記述子による点雲のシーン認識セマンティックセマンティックセグメンテーション

SceneEncoder: Scene-Aware Semantic Segmentation of Point Clouds with A Learnable Scene Descriptor ( http://arxiv.org/abs/2001.09087v1 )

ライセンス: Link先を確認
Jiachen Xu, Jingyu Gong, Jie Zhou, Xin Tan, Yuan Xie, Lizhuang Ma(参考訳) 局所的な特徴の他に、グローバルな情報は意味的セグメンテーションにおいて重要な役割を果たすが、最近の研究は通常、意味のあるグローバルな情報を明示的に抽出し、完全に利用することができない。 本稿では,グローバル情報の効果を高めるために,シーン認識型ガイダンスを付加するSceneEncoderモジュールを提案する。 モジュールはシーン記述子を予測し、シーンに存在するオブジェクトのカテゴリを表現し、このシーンに属さないカテゴリをフィルタリングすることでポイントレベルのセマンティックセグメンテーションを直接誘導する。 また,局所領域におけるセグメンテーションノイズを軽減するため,同一ラベルで隣接点を識別する特徴を伝達する領域類似性損失をデザインし,ポイントワイズ特徴の識別能力の向上に繋がる。 提案手法をいくつかの一般的なネットワークに統合し,ベンチマークデータセットScanNetとShapeNetで広範な実験を行う。 その結果,本手法はベースラインの性能を大幅に向上させ,最先端の性能を実現する。

Besides local features, global information plays an essential role in semantic segmentation, while recent works usually fail to explicitly extract the meaningful global information and make full use of it. In this paper, we propose a SceneEncoder module to impose a scene-aware guidance to enhance the effect of global information. The module predicts a scene descriptor, which learns to represent the categories of objects existing in the scene and directly guides the point-level semantic segmentation through filtering out categories not belonging to this scene. Additionally, to alleviate segmentation noise in local region, we design a region similarity loss to propagate distinguishing features to their own neighboring points with the same label, leading to the enhancement of the distinguishing ability of point-wise features. We integrate our methods into several prevailing networks and conduct extensive experiments on benchmark datasets ScanNet and ShapeNet. Results show that our methods greatly improve the performance of baselines and achieve state-of-the-art performance.
翻訳日:2023-01-07 05:15:39 公開日:2020-01-24
# CTスキャンによる病変の強調

Weakly Supervised Lesion Co-segmentation on CT Scans ( http://arxiv.org/abs/2001.09174v1 )

ライセンス: Link先を確認
Vatsal Agarwal, Youbao Tang, Jing Xiao, Ronald M. Summers(参考訳) 医用画像における病変の分画は、腫瘍の大きさの評価と成長の変化のモニタリングに有効なツールである。 しかし、手作業による病変分画時間だけでなく、費用も高く、専門的な放射線科医の知識も必要である。 したがって、多くの病院は、固形腫瘍(RECIST)の反応評価基準と呼ばれる緩い代用に依存している。 これらのアノテーションは正確とは程遠いが、病院全体で広く使われており、画像アーカイブと通信システム(PACS)で見られる。 したがって、これらのアノテーションは、完全な病変分節モデルを訓練するための弱い監督の強固で挑戦的な手段として機能する可能性がある。 そこで本研究では,まず直腸スライスから疑似マスクを生成し,ctスキャンから共通の病変をセグメント化できる注意に基づく畳み込みニューラルネットワークのトレーニングラベルとして用いる,弱教師付き共同セグメンテーションモデルを提案する。 このモデルの検証とテストには、32,735pacsのブックマーク画像を含む広範囲のctスキャン病変データセットであるdeeplesion datasetを利用する。 以上の結果から,Dice係数90.3%の病変の分節に対するコセグメンテーション法の有効性が示唆された。

Lesion segmentation in medical imaging serves as an effective tool for assessing tumor sizes and monitoring changes in growth. However, not only is manual lesion segmentation time-consuming, but it is also expensive and requires expert radiologist knowledge. Therefore many hospitals rely on a loose substitute called response evaluation criteria in solid tumors (RECIST). Although these annotations are far from precise, they are widely used throughout hospitals and are found in their picture archiving and communication systems (PACS). Therefore, these annotations have the potential to serve as a robust yet challenging means of weak supervision for training full lesion segmentation models. In this work, we propose a weakly-supervised co-segmentation model that first generates pseudo-masks from the RECIST slices and uses these as training labels for an attention-based convolutional neural network capable of segmenting common lesions from a pair of CT scans. To validate and test the model, we utilize the DeepLesion dataset, an extensive CT-scan lesion dataset that contains 32,735 PACS bookmarked images. Extensive experimental results demonstrate the efficacy of our co-segmentation approach for lesion segmentation with a mean Dice coefficient of 90.3%.
翻訳日:2023-01-07 05:15:11 公開日:2020-01-24
# ディープニューラルネットワークのメモリ効率向上のための低ランク勾配近似

Low-rank Gradient Approximation For Memory-Efficient On-device Training of Deep Neural Network ( http://arxiv.org/abs/2001.08885v1 )

ライセンス: Link先を確認
Mary Gooneratne, Khe Chai Sim, Petr Zadrazil, Andreas Kabel, Fran\c{c}oise Beaufays, Giovanni Motta(参考訳) モバイルデバイス上で機械学習モデルをトレーニングすることは、モデルのプライバシと精度の両方を改善する可能性がある。 しかし、この目標を達成するための大きな障害の1つは、モバイルデバイスのメモリ制限である。 トレーニングメモリの削減により、自動音声認識(ASR)モデルのような高次元の重量行列を持つモデルをデバイス上でトレーニングすることができる。 本稿では,低ランクパラメータ化を用いた深層ニューラルネットワークの勾配行列の近似手法を提案する。 低ランク勾配近似により、より高度なメモリ集約型最適化技術がデバイス上で実行できる。 実験の結果,adam最適化ではトレーニングメモリを約33.0%削減できることがわかった。 運動量最適化に匹敵するメモリを使用し、ASRパーソナライゼーションタスクにおいて4.5%低い単語エラー率を達成する。

Training machine learning models on mobile devices has the potential of improving both privacy and accuracy of the models. However, one of the major obstacles to achieving this goal is the memory limitation of mobile devices. Reducing training memory enables models with high-dimensional weight matrices, like automatic speech recognition (ASR) models, to be trained on-device. In this paper, we propose approximating the gradient matrices of deep neural networks using a low-rank parameterization as an avenue to save training memory. The low-rank gradient approximation enables more advanced, memory-intensive optimization techniques to be run on device. Our experimental results show that we can reduce the training memory by about 33.0% for Adam optimization. It uses comparable memory to momentum optimization and achieves a 4.5% relative lower word error rate on an ASR personalization task.
翻訳日:2023-01-07 05:07:54 公開日:2020-01-24
# 2次元ハンドポーズ推定のための非パラメトリック構造正規化機

Nonparametric Structure Regularization Machine for 2D Hand Pose Estimation ( http://arxiv.org/abs/2001.08869v1 )

ライセンス: Link先を確認
Yifei Chen, Haoyu Ma, Deying Kong, Xiangyi Yan, Jianbao Wu, Wei Fan, Xiaohui Xie(参考訳) 手ポーズ推定は, 重度調音, 自己閉塞, 器質性が高いため, 身体ポーズ推定よりも困難である。 現在のアプローチでは、2dキーポイントの特徴を学ぶためにconvolutional pose machine (cpm)のような一般的なボディポーズアルゴリズムに依存することが多い。 これらのアルゴリズムは、それらの間の構造的関係を明示的にモデル化することなく、キーポイント位置のみに基づいて訓練されるため、ハンドポーズ推定のユニークな課題に適切に対処できない。 本研究では,2次元ハンドポーズ推定のための非パラメトリック構造正規化機械(nsrm)を提案する。 構造学習は、キーポイント位置から直接計算され、手足の新しい確率的表現と、マスク合成の解剖学的に着想を得た構成戦略によってさらに強化される合成手マスク表現によって導かれる。 我々はOneHand 10kとCMU Panoptic Handという2つの公開データセットについて広範な研究を行っている。 実験の結果,CPMベースラインモデルのポーズ推定精度は,第1データセットでは1.17%,第2データセットでは4.01%向上した。 実装と実験コードはオンラインで無料で利用できる。 ポーズ推定のための構造学習を組み込んだ提案では,追加のトレーニング情報を必要とせず,他のポーズ推定モデルに汎用的なアドオンモジュールとして組み込むことができる。

Hand pose estimation is more challenging than body pose estimation due to severe articulation, self-occlusion and high dexterity of the hand. Current approaches often rely on a popular body pose algorithm, such as the Convolutional Pose Machine (CPM), to learn 2D keypoint features. These algorithms cannot adequately address the unique challenges of hand pose estimation, because they are trained solely based on keypoint positions without seeking to explicitly model structural relationship between them. We propose a novel Nonparametric Structure Regularization Machine (NSRM) for 2D hand pose estimation, adopting a cascade multi-task architecture to learn hand structure and keypoint representations jointly. The structure learning is guided by synthetic hand mask representations, which are directly computed from keypoint positions, and is further strengthened by a novel probabilistic representation of hand limbs and an anatomically inspired composition strategy of mask synthesis. We conduct extensive studies on two public datasets - OneHand 10k and CMU Panoptic Hand. Experimental results demonstrate that explicitly enforcing structure learning consistently improves pose estimation accuracy of CPM baseline models, by 1.17% on the first dataset and 4.01% on the second one. The implementation and experiment code is freely available online. Our proposal of incorporating structural learning to hand pose estimation requires no additional training information, and can be a generic add-on module to other pose estimation models.
翻訳日:2023-01-07 05:06:30 公開日:2020-01-24
# エッジ上の小型・高精度・高速車両リID:SAFRアプローチ

Small, Accurate, and Fast Vehicle Re-ID on the Edge: the SAFR Approach ( http://arxiv.org/abs/2001.08895v1 )

ライセンス: Link先を確認
Abhijit Suprem, Calton Pu, Joao Eduardo Ferreira(参考訳) 本稿では,re-idモデルバックボーンを変更するだけで,クラウド,モバイル,エッジ,組み込みデバイスなどの様々な計算環境において,フレキシブルな車両のre-idに対して,小型で高精度で高速なsafr(re-id)設計を提案する。 最適な設計選択,機能抽出,トレーニングトリック,グローバルアテンション,ローカルアテンションなどを通じて,モデルサイズや速度,さまざまなメモリや計算制約の下でのデプロイメントの精度を多次元的に最適化する,reidモデル設計を作成します。 大規模計算資源を持つクラウド型環境のためのSAFR-Large、いくつかの計算制約のあるモバイルデバイス向けのSAFR-Small、厳しいメモリと計算制約のあるエッジデバイス向けのSAFR-Micro。 SAFR-Largeは、VeRi-776車両のリIDデータセット(関連する作業よりも15%良い)でmAP 81.34で最先端の結果を提供する。 SAFR-Smallは5.2%の性能低下(VeRi-776ではmAP 77.14)を60%以上のモデル圧縮と150%のスピードアップで取引している。 SAFR-Microは、わずか6MBと130MFLOPSの6.8%の精度(VeRi-776のmAP 75.80)で、圧縮95%とSAFR-Largeの33倍の速度で取引されている。

We propose a Small, Accurate, and Fast Re-ID (SAFR) design for flexible vehicle re-id under a variety of compute environments such as cloud, mobile, edge, or embedded devices by only changing the re-id model backbone. Through best-fit design choices, feature extraction, training tricks, global attention, and local attention, we create a reid model design that optimizes multi-dimensionally along model size, speed, & accuracy for deployment under various memory and compute constraints. We present several variations of our flexible SAFR model: SAFR-Large for cloud-type environments with large compute resources, SAFR-Small for mobile devices with some compute constraints, and SAFR-Micro for edge devices with severe memory & compute constraints. SAFR-Large delivers state-of-the-art results with mAP 81.34 on the VeRi-776 vehicle re-id dataset (15% better than related work). SAFR-Small trades a 5.2% drop in performance (mAP 77.14 on VeRi-776) for over 60% model compression and 150% speedup. SAFR-Micro, at only 6MB and 130MFLOPS, trades 6.8% drop in accuracy (mAP 75.80 on VeRi-776) for 95% compression and 33x speedup compared to SAFR-Large.
翻訳日:2023-01-07 05:06:05 公開日:2020-01-24
# スパース半教師付きヘテロジニアス不均一ベイズ解析

Sparse Semi-supervised Heterogeneous Interbattery Bayesian Analysis ( http://arxiv.org/abs/2001.08975v1 )

ライセンス: Link先を確認
Carlos Sevilla-Salcedo, Vanessa G\'omez-Verdejo and Pablo M. Olmos(参考訳) 因子分析(FA)として知られる特徴抽出に対するベイズ的アプローチは、機械学習においてデータの潜在表現を得るために広く研究されている。 これらのベイズモデルの確率と事前の適切な選択により、モデルはデータの性質(不均一性、疎性)に適応し、より代表的な潜在空間を得ることができる。 本稿の目的は、あらゆる問題をモデル化できる一般的なFAフレームワークを提案することである。 そのために、ベイズ間因子分析(bayesian inter-battery factor analysis, bibfa)モデルから始め、異種データや特徴の選択、欠落した値の処理、半教師付き問題などを扱うために、新たな機能によってそれを拡張します。 提案モデルであるsparse semi-supervised hetero interbattery bayesian analysis (sshiba) の性能を4つの異なるシナリオで検証し,その新しさを評価した。

The Bayesian approach to feature extraction, known as factor analysis (FA), has been widely studied in machine learning to obtain a latent representation of the data. An adequate selection of the probabilities and priors of these bayesian models allows the model to better adapt to the data nature (i.e. heterogeneity, sparsity), obtaining a more representative latent space. The objective of this article is to propose a general FA framework capable of modelling any problem. To do so, we start from the Bayesian Inter-Battery Factor Analysis (BIBFA) model, enhancing it with new functionalities to be able to work with heterogeneous data, include feature selection, and handle missing values as well as semi-supervised problems. The performance of the proposed model, Sparse Semi-supervised Heterogeneous Interbattery Bayesian Analysis (SSHIBA) has been tested on 4 different scenarios to evaluate each one of its novelties, showing not only a great versatility and an interpretability gain, but also outperforming most of the state-of-the-art algorithms.
翻訳日:2023-01-07 04:59:43 公開日:2020-01-24
# 単純手法による平滑畳み込みニューラルネットワークの確率的最適化

Stochastic Optimization of Plain Convolutional Neural Networks with Simple methods ( http://arxiv.org/abs/2001.08856v1 )

ライセンス: Link先を確認
Yahia Assiri(参考訳) 畳み込みニューラルネットワークは多くの視覚パターン分類問題において最高の精度を実現している。 しかし、そのような表現を捉えるのに必要なモデル容量のため、しばしば過剰適合に過敏であり、従ってうまく一般化するために適切な正規化が必要である。 本稿では,より優れた性能を得るために協調して機能する正規化手法の組み合わせを提案するとともに,データ拡張,ドロップアウト,カスタマイズした早期停止機能を用いて,MNIST, CIFAR10, CIFAR100, SVHN, STL10の5つの有名なデータセットにモデルを適用して評価し,他の2つのデータセット上で3つの最先端(MNIST, SVHN, STL10)と非常に高い精度を実現した。

Convolutional neural networks have been achieving the best possible accuracies in many visual pattern classification problems. However, due to the model capacity required to capture such representations, they are often oversensitive to overfitting and therefore require proper regularization to generalize well. In this paper, we present a combination of regularization techniques which work together to get better performance, we built plain CNNs, and then we used data augmentation, dropout and customized early stopping function, we tested and evaluated these techniques by applying models on five famous datasets, MNIST, CIFAR10, CIFAR100, SVHN, STL10, and we achieved three state-of-the-art-of (MNIST, SVHN, STL10) and very high-Accuracy on the other two datasets.
翻訳日:2023-01-07 04:58:57 公開日:2020-01-24
# 動的重み付き頂点被覆問題に対するランダム探索ヒューリスティックのランタイム性能

Runtime Performances of Randomized Search Heuristics for the Dynamic Weighted Vertex Cover Problem ( http://arxiv.org/abs/2001.08903v1 )

ライセンス: Link先を確認
Feng Shi, Frank Neumann, Jianxin Wang(参考訳) 進化アルゴリズムのようなランダム化探索ヒューリスティックは動的組合せ最適化問題にしばしば適用される。 本稿では,古典的重み付き頂点被覆問題の動的モデルを提示し,よく研究されているアルゴリズムのランダム化局所探索と (1+1) eaのランタイム性能を分析し,動的変化を伴う問題に対する進化的計算の理論的理解に寄与する。 本研究では,線形計画定式化の双対形式に基づくエッジベース表現を用いて,与えられた重み付きグラフをエッジ編集や重み付け操作で修正する場合に,適応アルゴリズムが2次解を維持する必要があることを想定した実行時間について検討する。 頂点上の重みがグラフのサイズに対して指数関数的に大きいことを考えると、ステップサイズの増大/減少率を制御するために使用される第1/5規則を取り入れたステップサイズ適応戦略が組み込まれている。 本研究の結果から,多項式予測実行時の動的変化に対する2-近似解を3つのアルゴリズムで再計算できることが示されているが,1/5ルールのEAは擬似多項式予測実行を必要とする。

Randomized search heuristics such as evolutionary algorithms are frequently applied to dynamic combinatorial optimization problems. Within this paper, we present a dynamic model of the classic Weighted Vertex Cover problem and analyze the runtime performances of the well-studied algorithms Randomized Local Search and (1+1) EA adapted to it, to contribute to the theoretical understanding of evolutionary computing for problems with dynamic changes. In our investigations, we use an edge-based representation based on the dual form of the Linear Programming formulation for the problem and study the expected runtime that the adapted algorithms require to maintain a 2-approximate solution when the given weighted graph is modified by an edge-editing or weight-editing operation. Considering the weights on the vertices may be exponentially large with respect to the size of the graph, the step size adaption strategy is incorporated, with or without the 1/5-th rule that is employed to control the increasing/decreasing rate of the step size. Our results show that three of the four algorithms presented in the paper can recompute 2-approximate solutions for the studied dynamic changes in polynomial expected runtime, but the (1+1) EA with 1/5-th Rule requires pseudo-polynomial expected runtime.
翻訳日:2023-01-07 04:57:24 公開日:2020-01-24
# 多モード波エネルギー変換器の設計最適化

Design optimisation of a multi-mode wave energy converter ( http://arxiv.org/abs/2001.08966v1 )

ライセンス: Link先を確認
Nataliia Y. Sergiienko, Mehdi Neshat, Leandro S.P. da Silva, Bradley Alexander and Markus Wagner(参考訳) カーネギークリーンエナジーが開発したCETOシステムに類似した波動エネルギー変換器(WEC)を設計最適化として検討する。 このwecはヒーブ、サージ、ピッチの動きモードからパワーを吸収することができ、最適化問題は自明ではない。 WEC力学は、流体力、粘性抵抗、パワー離陸力を考慮したスペクトル領域モデルを用いてシミュレーションされる。 最適化のための設計パラメータは、ブイ半径、ブイ高さ、テザー傾斜角、および制御変数(減衰と剛性)である。 WECの設計は、一方向の不規則波を考慮して、西オーストラリア州のオールバニ試験場での波の気候に最適化されている。 2つの目的関数を考える。 一 年間平均出力の最大化及び (II)所定の海域におけるエネルギーのレベル化コスト(LCoE)の最小化。 lcoe計算は、ブイとアンカー系の質量を含むシステムのかなりの質量に対する生成エネルギーの比として近似される。 6つの異なるヒューリスティック最適化手法を適用し、最もよく知られた進化アルゴリズム、群知能技術、数値最適化手法の性能を評価し比較する。 その結果、そのようなシステムの製造コストを考慮せずにエネルギー生産を最大化することに関心があるなら、ブイは可能な限り大きなもの(半径20m、高さ30m)を造るべきであることが示された。 しかし、もし安いエネルギーを生産するシステムを欲しければ、ブイの半径は約11-14~mで、高さは可能な限り低いはずである。 これらの結果はカーネギークリーンエナジーがceto 6のマルチムーアユニットに選んだ全体的な設計と一致した。 しかし、この研究は彼らには知られていないので、これは設計選択の独立した検証と見なすことができる。

A wave energy converter (WEC) similar to the CETO system developed by Carnegie Clean Energy is considered for design optimisation. This WEC is able to absorb power from heave, surge and pitch motion modes, making the optimisation problem nontrivial. The WEC dynamics is simulated using the spectral-domain model taking into account hydrodynamic forces, viscous drag, and power take-off forces. The design parameters for optimisation include the buoy radius, buoy height, tether inclination angles, and control variables (damping and stiffness). The WEC design is optimised for the wave climate at Albany test site in Western Australia considering unidirectional irregular waves. Two objective functions are considered: (i) maximisation of the annual average power output, and (ii) minimisation of the levelised cost of energy (LCoE) for a given sea site. The LCoE calculation is approximated as a ratio of the produced energy to the significant mass of the system that includes the mass of the buoy and anchor system. Six different heuristic optimisation methods are applied in order to evaluate and compare the performance of the best known evolutionary algorithms, a swarm intelligence technique and a numerical optimisation approach. The results demonstrate that if we are interested in maximising energy production without taking into account the cost of manufacturing such a system, the buoy should be built as large as possible (20 m radius and 30 m height). However, if we want the system that produces cheap energy, then the radius of the buoy should be approximately 11-14~m while the height should be as low as possible. These results coincide with the overall design that Carnegie Clean Energy has selected for its CETO 6 multi-moored unit. However, it should be noted that this study is not informed by them, so this can be seen as an independent validation of the design choices.
翻訳日:2023-01-07 04:57:02 公開日:2020-01-24
# ニューラルネットワークを用いた非線形システム計測による構成データの推定

Estimation for Compositional Data using Measurements from Nonlinear Systems using Artificial Neural Networks ( http://arxiv.org/abs/2001.09040v1 )

ライセンス: Link先を確認
Se Un Park(参考訳) 本研究の目的は、学習セットを用いて元のシステムの逆を推定した後、その出力応答から未知の合成入力を未知のシステムで推定することである。 ニューラルネットワーク(anns)を用いた提案手法は,凸最適化理論が適用できる線形系の最適境界と競合し,非線形系の反転に対して有望な結果を示す。 多数の非線形系を設計し,広範な実験を行った。

Our objective is to estimate the unknown compositional input from its output response through an unknown system after estimating the inverse of the original system with a training set. The proposed methods using artificial neural networks (ANNs) can compete with the optimal bounds for linear systems, where convex optimization theory applies, and demonstrate promising results for nonlinear system inversions. We performed extensive experiments by designing numerous different types of nonlinear systems.
翻訳日:2023-01-07 04:51:03 公開日:2020-01-24
# 原理均質空間としてのCycleGANの核

Kernel of CycleGAN as a Principle homogeneous space ( http://arxiv.org/abs/2001.09061v1 )

ライセンス: Link先を確認
Nikita Moriakov, Jonas Adler, Jonas Teuwen(参考訳) 画像間の不対向変換は、対向的データとサイクル整合性損失の組み合わせを利用してペアデータの必要性を回避するCycleGANの発明により、大きな関心を集めている。 サイクルGAN問題には複数の解が存在することが知られており、本論文の目標は、正確な解の空間を分析し、近似解に対する摂動境界を与えることである。 理論上、正確な解空間は基礎となる確率空間の自己同型に関して不変であり、さらに、自己同型群が正確な解空間上で自由かつ推移的に作用することを示す。 まず, 一般性において「純」サイクルGAN損失ゼロの場合について検討し, その後, アイデンティティ損失項を含む「拡張」サイクルGAN損失の近似解へと解析を拡張した。 これらの結果が適用可能であることを示すために、軽度条件下では非自明な滑らかな自己同型が存在することを示す。 さらに、ニューラルネットワークが予期せぬ結果と望ましくない結果でこれらの自己同型を学習できるという実証的な証拠を提供する。 我々は、CycleGANの損失に対する最適解を見つけることは、画像から画像への変換タスクにおいて想定された結果につながるとは限らないと結論づける。

Unpaired image-to-image translation has attracted significant interest due to the invention of CycleGAN, a method which utilizes a combination of adversarial and cycle consistency losses to avoid the need for paired data. It is known that the CycleGAN problem might admit multiple solutions, and our goal in this paper is to analyze the space of exact solutions and to give perturbation bounds for approximate solutions. We show theoretically that the exact solution space is invariant with respect to automorphisms of the underlying probability spaces, and, furthermore, that the group of automorphisms acts freely and transitively on the space of exact solutions. We examine the case of zero `pure' CycleGAN loss first in its generality, and, subsequently, expand our analysis to approximate solutions for `extended' CycleGAN loss where identity loss term is included. In order to demonstrate that these results are applicable, we show that under mild conditions nontrivial smooth automorphisms exist. Furthermore, we provide empirical evidence that neural networks can learn these automorphisms with unexpected and unwanted results. We conclude that finding optimal solutions to the CycleGAN loss does not necessarily lead to the envisioned result in image-to-image translation tasks and that underlying hidden symmetries can render the result utterly useless.
翻訳日:2023-01-07 04:50:26 公開日:2020-01-24
# メタヒューリスティックスのパフォーマンスについて:異なる視点から

On the Performance of Metaheuristics: A Different Perspective ( http://arxiv.org/abs/2001.08928v1 )

ライセンス: Link先を確認
Hamid Reza Boveiri and Raouf Khayami(参考訳) 現在、我々は、新たに提案された進化的およびスワム知能メタヒューリスティックスに没頭しており、手元にある特定の最適化問題に適用すべき適切なものを選択することは極めて困難である。 一方、これらのメタヒューリスティックのほとんどは、基本的なメタヒューリスティックの変種をわずかに修正しただけである。 例えば、微分進化 (de) またはシャッフルドカエル跳躍 (sfl) は、単に遺伝的アルゴリズム (ga) であり、それぞれ特殊演算子または余分な局所探索を持つ。 したがって、これらの新しく提唱されたメタヒューリスティクスの振る舞いが、祖先の仕様や特性の研究に基づいて調査できるかどうかが心に浮かぶ。 本稿では、遺伝的アルゴリズム(ga)、粒子群最適化(pso)、人工蜂コロニー(abc)、教育学習に基づく最適化(tlbo)、およびcuckoo最適化アルゴリズム(coa)といったいくつかの基本的なメタヒューリスティックスに関する包括的評価研究を行い、それらの性能についてより深い洞察を与え、それらから派生した全てのバリエーションのパフォーマンスと適用可能性をより正確に推定する。 異なる特性を持つ20種類の組合せ最適化ベンチマーク関数について多くの実験が行われており、これらのメタヒューリスティックの中で以下のランキングの他に、abc, pso, tlbo, ga, coa} という基本的な結論が示されている。 加えて、収束の観点からは、pso と abc はそれぞれユニモーダル関数とマルチモーダル関数の収束性が著しく向上し、ga と coa は局所光学に早期収束し、多角化と大域探索を促進するために代替突然変異機構を必要とする場合が多い。

Nowadays, we are immersed in tens of newly-proposed evolutionary and swam-intelligence metaheuristics, which makes it very difficult to choose a proper one to be applied on a specific optimization problem at hand. On the other hand, most of these metaheuristics are nothing but slightly modified variants of the basic metaheuristics. For example, Differential Evolution (DE) or Shuffled Frog Leaping (SFL) are just Genetic Algorithms (GA) with a specialized operator or an extra local search, respectively. Therefore, what comes to the mind is whether the behavior of such newly-proposed metaheuristics can be investigated on the basis of studying the specifications and characteristics of their ancestors. In this paper, a comprehensive evaluation study on some basic metaheuristics i.e. Genetic Algorithm (GA), Particle Swarm Optimization (PSO), Artificial Bee Colony (ABC), Teaching-Learning-Based Optimization (TLBO), and Cuckoo Optimization algorithm (COA) is conducted, which give us a deeper insight into the performance of them so that we will be able to better estimate the performance and applicability of all other variations originated from them. A large number of experiments have been conducted on 20 different combinatorial optimization benchmark functions with different characteristics, and the results reveal to us some fundamental conclusions besides the following ranking order among these metaheuristics, {ABC, PSO, TLBO, GA, COA} i.e. ABC and COA are the best and the worst methods from the performance point of view, respectively. In addition, from the convergence perspective, PSO and ABC have significant better convergence for unimodal and multimodal functions, respectively, while GA and COA have premature convergence to local optima in many cases needing alternative mutation mechanisms to enhance diversification and global search.
翻訳日:2023-01-07 04:50:03 公開日:2020-01-24
# 自律走行における高速物体認識のための時間パルス駆動スパイクニューラルネットワーク

Temporal Pulses Driven Spiking Neural Network for Fast Object Recognition in Autonomous Driving ( http://arxiv.org/abs/2001.09220v1 )

ライセンス: Link先を確認
Wei Wang, Shibo Zhou, Jingxi Li, Xiaohua Li, Junsong Yuan, Zhanpeng Jin(参考訳) 感覚データからの正確なリアルタイム物体認識は、自動運転にとって重要かつ困難な課題である。 この領域ではディープニューラルネットワーク(dnn)がうまく適用されているが、既存の手法のほとんどはlidarセンサーからのパルス信号の前処理に大きく依存しており、計算オーバーヘッドとかなりのレイテンシーをもたらす。 本稿では,スパイキングニューラルネットワーク(SNN)を用いた生時間パルスを用いて,物体認識問題に直接対処する手法を提案する。 提案手法は,LiDARと動的視覚センサ(DVS)から得られた各種データセット(Sim LiDAR,KITTI,DVSバレルなど)を用いて評価し,最先端の手法に匹敵する性能を示した。 自動運転と関連するアプリケーションにおけるSNNの大きな可能性を強調します。 我々の知る限りでは、これはSNNを使って生の時間パルス上で直接物体認識を行う最初の試みである。

Accurate real-time object recognition from sensory data has long been a crucial and challenging task for autonomous driving. Even though deep neural networks (DNNs) have been successfully applied in this area, most existing methods still heavily rely on the pre-processing of the pulse signals derived from LiDAR sensors, and therefore introduce additional computational overhead and considerable latency. In this paper, we propose an approach to address the object recognition problem directly with raw temporal pulses utilizing the spiking neural network (SNN). Being evaluated on various datasets (including Sim LiDAR, KITTI and DVS-barrel) derived from LiDAR and dynamic vision sensor (DVS), our proposed method has shown comparable performance as the state-of-the-art methods, while achieving remarkable time efficiency. It highlights the SNN's great potentials in autonomous driving and related applications. To the best of our knowledge, this is the first attempt to use SNN to directly perform object recognition on raw temporal pulses.
翻訳日:2023-01-07 04:49:07 公開日:2020-01-24
# pairnets: 分割部分空間上の新しい高速浅層ニューラルネットワーク

PairNets: Novel Fast Shallow Artificial Neural Networks on Partitioned Subspaces ( http://arxiv.org/abs/2001.08886v1 )

ライセンス: Link先を確認
Luna M. Zhang(参考訳) 伝統的に、人工知能ニューラルネットワーク(ANN)は、バックプロパゲーションアルゴリズムのような勾配降下アルゴリズムによってゆっくりと訓練される。 トレーニングを高速にするために,高速なハイパーパラメータ最適化を備えた"Pairwise Neural Network"(PairNet)と呼ばれる,浅い4層ANNを開発した。 さらに、各入力の値は複数の間隔に分割され、n-次元空間はMn-次元部分空間に分割される。 M 局所 PairNet は M 分割局所 n-次元部分空間で構築される。 局所ペアネットは、多変量最小二乗法を用いて線形方程式の系を単純に解くことによって、ハイパーパラメータが直接最適化されるため、1つのエポックで非常に高速に訓練される。 3つの回帰問題に対するシミュレーションの結果、PairNetは従来のANNよりもはるかに高速で平均検定平均二乗誤差(MSE)が低く、MSEは2つのケースで低いことが示唆された。 将来の重要な作業は、インテリジェントメソッドと並列コンピューティングメソッドに基づく、より良く高速な最適化アルゴリズムを開発し、分割されたサブスペースとハイパーパラメータの両方を最適化し、ビッグデータマイニングとリアルタイム機械学習のアプリケーションのための高速かつ効果的なペアネットを構築することである。

Traditionally, an artificial neural network (ANN) is trained slowly by a gradient descent algorithm such as the backpropagation algorithm since a large number of hyperparameters of the ANN need to be fine-tuned with many training epochs. To highly speed up training, we created a novel shallow 4-layer ANN called "Pairwise Neural Network" ("PairNet") with high-speed hyperparameter optimization. In addition, a value of each input is partitioned into multiple intervals, and then an n-dimensional space is partitioned into M n-dimensional subspaces. M local PairNets are built in M partitioned local n-dimensional subspaces. A local PairNet is trained very quickly with only one epoch since its hyperparameters are directly optimized one-time via simply solving a system of linear equations by using the multivariate least squares fitting method. Simulation results for three regression problems indicated that the PairNet achieved much higher speeds and lower average testing mean squared errors (MSEs) for the three cases, and lower average training MSEs for two cases than the traditional ANNs. A significant future work is to develop better and faster optimization algorithms based on intelligent methods and parallel computing methods to optimize both partitioned subspaces and hyperparameters to build the fast and effective PairNets for applications in big data mining and real-time machine learning.
翻訳日:2023-01-07 04:48:11 公開日:2020-01-24
# 強化ニューラルネットワークを用いた外乱検出における異なる種類の異常間の薄膜境界の検出

Detection of Thin Boundaries between Different Types of Anomalies in Outlier Detection using Enhanced Neural Networks ( http://arxiv.org/abs/2001.09209v1 )

ライセンス: Link先を確認
Rasoul Kiani, Amin Keshavarzi, and Mahdi Bohlouli(参考訳) 外乱検出は、主に機械学習や人工知能を扱う様々な分野において特に注目を集めている。 強い外れ値として、異常は点、文脈、集合の外れ値に分けられる。 外れ値検出における最も重要な課題は、リモートポイントと自然領域の境界が薄いこと、実データを模倣する新しいデータやノイズの傾向、ラベルなしデータセット、異なるアプリケーションにおける外れ値の定義などである。 これらの課題を考慮し,異なる種類の異常間の細い境界の検出をより良くするために,集合正規異常と集合点異常と呼ばれる新しい種類の異常を定義した。 基本的なドメイン非依存メソッドは、教師なしデータセットと教師なしデータセットの両方でこれらの定義された異常を検出するために導入された。 遺伝的アルゴリズムを用いて多層パーセプトロンニューラルネットワークを強化し、従来の多層パーセプトロンニューラルネットワークで計算されたテストエラーよりも低い精度で新たに定義された異常を検出する。 ベンチマークによる実験結果から, 異常検出プロセスの誤差が, ベースラインと比較された。

Outlier detection has received special attention in various fields, mainly for those dealing with machine learning and artificial intelligence. As strong outliers, anomalies are divided into the point, contextual and collective outliers. The most important challenges in outlier detection include the thin boundary between the remote points and natural area, the tendency of new data and noise to mimic the real data, unlabelled datasets and different definitions for outliers in different applications. Considering the stated challenges, we defined new types of anomalies called Collective Normal Anomaly and Collective Point Anomaly in order to improve a much better detection of the thin boundary between different types of anomalies. Basic domain-independent methods are introduced to detect these defined anomalies in both unsupervised and supervised datasets. The Multi-Layer Perceptron Neural Network is enhanced using the Genetic Algorithm to detect newly defined anomalies with higher precision so as to ensure a test error less than that calculated for the conventional Multi-Layer Perceptron Neural Network. Experimental results on benchmark datasets indicated reduced error of anomaly detection process in comparison to baselines.
翻訳日:2023-01-07 04:40:53 公開日:2020-01-24
# MT-BioNER:ディープ双方向変換器を用いた生体名認識のためのマルチタスク学習

MT-BioNER: Multi-task Learning for Biomedical Named Entity Recognition using Deep Bidirectional Transformers ( http://arxiv.org/abs/2001.08904v1 )

ライセンス: Link先を確認
Muhammad Raza Khan, Morteza Ziyadi and Mohamed AbdelHady(参考訳) Cortana、Alexa、Siriといった会話エージェントは、新たなドメインを追加することで、継続的に機能拡張に取り組んでいる。 新しいドメインのサポートには、ドメイン分類、インテント分類、スロットタグ付け(名前付きエンティティ認識を含む)のための多くのNLUコンポーネントの設計と開発が含まれる。 各コンポーネントは、大量のラベル付きデータでトレーニングした場合のみ、うまく機能する。 第二に、これらのコンポーネントはある程度のモデル圧縮を必要とするリミテッドメモリデバイスにデプロイされる。 第三に、ヘルスドメインのようないくつかのドメインでは、必要なスロットタイプをすべてカバーする単一のトレーニングデータセットを見つけるのは難しい。 上記の問題を克服するために,スロットタグ付けのためのマルチタスクトランスフォーマーベースのニューラルアーキテクチャを提案する。 異なるスロットタイプをカバーする複数のデータセットを用いたスロットタグの訓練をマルチタスク学習問題として検討する。 バイオメディカル領域における実験結果から,提案手法は,(時間とメモリ)効率と有効性の観点から,異なるベンチマークバイオメディカルデータセット上でスロットタグ付けを行うための従来の最先端システムよりも優れていることが示された。 出力スロットタグは会話エージェントが入力発話中のエンティティをよりよく識別するために使用することができる。

Conversational agents such as Cortana, Alexa and Siri are continuously working on increasing their capabilities by adding new domains. The support of a new domain includes the design and development of a number of NLU components for domain classification, intents classification and slots tagging (including named entity recognition). Each component only performs well when trained on a large amount of labeled data. Second, these components are deployed on limited-memory devices which requires some model compression. Third, for some domains such as the health domain, it is hard to find a single training data set that covers all the required slot types. To overcome these mentioned problems, we present a multi-task transformer-based neural architecture for slot tagging. We consider the training of a slot tagger using multiple data sets covering different slot types as a multi-task learning problem. The experimental results on the biomedical domain have shown that the proposed approach outperforms the previous state-of-the-art systems for slot tagging on the different benchmark biomedical datasets in terms of (time and memory) efficiency and effectiveness. The output slot tagger can be used by the conversational agent to better identify entities in the input utterances.
翻訳日:2023-01-07 04:40:02 公開日:2020-01-24
# 理論的に表現力とエッジアウェアグラフ学習

Theoretically Expressive and Edge-aware Graph Learning ( http://arxiv.org/abs/2001.09005v1 )

ライセンス: Link先を確認
Federico Errica, Davide Bacciu, Alessio Micheli(参考訳) この分野における最近の進歩と組み合わせた新しいグラフニューラルネットワークを提案する。 モデルがグラフ同型ネットワークやGated Graph Neural Networkよりも厳密に一般的なことを証明し、同じ関数を近似し、任意のエッジ値を扱うことができることを証明して理論的貢献を与える。 次に,単一ノード情報がどのようにグラフ内を流れるかを示す。

We propose a new Graph Neural Network that combines recent advancements in the field. We give theoretical contributions by proving that the model is strictly more general than the Graph Isomorphism Network and the Gated Graph Neural Network, as it can approximate the same functions and deal with arbitrary edge values. Then, we show how a single node information can flow through the graph unchanged.
翻訳日:2023-01-07 04:39:29 公開日:2020-01-24
# StageNet:健康リスク予測のためのステージ対応ニューラルネットワーク

StageNet: Stage-Aware Neural Networks for Health Risk Prediction ( http://arxiv.org/abs/2001.10054v1 )

ライセンス: Link先を確認
Junyi Gao, Cao Xiao, Yasha Wang, Wen Tang, Lucas M. Glass, Jimeng Sun(参考訳) 深層学習は、特に慢性および進行中の患者の健康リスク予測に成功している。 既存の研究の多くは、患者データから病期情報を抽出し、リスク予測に統合する学習病期ネットワーク(StageNet)モデルに焦点を当てている。 StageNetは、(1)健康ステージの変動を教師なしで抽出するLSTMモジュール、(2)ステージ関連進行パターンをリスク予測に組み込んだステージ適応畳み込みモジュールによって実現されている。 実世界の2つのデータセット上でStageNetを評価し,リスク予測タスクと患者サブタイプタスクにおいて,StageNetが最先端モデルより優れていることを示す。 最高のベースラインモデルと比較して、StageNetは2つの現実世界の患者データセットのリスク予測タスクにおいて、最大12%高いAUPRCを達成する。 stagenetはまた、患者のサブタイプタスクに対して、calinski-harabaszスコア(クラスタ品質指標)を58%以上高めている。

Deep learning has demonstrated success in health risk prediction especially for patients with chronic and progressing conditions. Most existing works focus on learning disease Network (StageNet) model to extract disease stage information from patient data and integrate it into risk prediction. StageNet is enabled by (1) a stage-aware long short-term memory (LSTM) module that extracts health stage variations unsupervisedly; (2) a stage-adaptive convolutional module that incorporates stage-related progression patterns into risk prediction. We evaluate StageNet on two real-world datasets and show that StageNet outperforms state-of-the-art models in risk prediction task and patient subtyping task. Compared to the best baseline model, StageNet achieves up to 12% higher AUPRC for risk prediction task on two real-world patient datasets. StageNet also achieves over 58% higher Calinski-Harabasz score (a cluster quality metric) for a patient subtyping task.
翻訳日:2023-01-07 04:39:12 公開日:2020-01-24