このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20200127となっている論文です。

PDF登録状況(公開日: 20200127)

TitleAuthorsAbstract論文公表日・翻訳日
# Fairness Metrics: 比較分析

Fairness Metrics: A Comparative Analysis ( http://arxiv.org/abs/2001.07864v2 )

ライセンス: Link先を確認
Pratyush Garg, John Villasenor and Virginia Foggo(参考訳) アルゴリズムの公正性は、人工知能に基づくものを含む予測アルゴリズムの利用の増加により、学術的、より広範な文献で大きな注目を集めている。 このトレンドの利点の1つは、アルゴリズムデザイナーとユーザーが選択すべき公正度対策が増えていることだ。 しかしながら、この選択は、異なるフェアネス測度が互いにどのように関連しているか、またそれらが相互に互換性があるか、あるいは相互に排他的であるかを特定するという課題から来る。 本稿では,共通数学的枠組みを用いて,最も広く利用されている公平度指標のいくつかを説明し,それらの関係に関する新しい結果を示す。 ここで提示された結果は、専門家と非スペシャリストの両方をより良い位置に配置し、その適用と目標に最も適したメトリクスを特定するのに役立つ。

Algorithmic fairness is receiving significant attention in the academic and broader literature due to the increasing use of predictive algorithms, including those based on artificial intelligence. One benefit of this trend is that algorithm designers and users have a growing set of fairness measures to choose from. However, this choice comes with the challenge of identifying how the different fairness measures relate to one another, as well as the extent to which they are compatible or mutually exclusive. We describe some of the most widely used fairness metrics using a common mathematical framework and present new results on the relationships among them. The results presented herein can help place both specialists and non-specialists in a better position to identify the metric best suited for their application and goals.
翻訳日:2023-06-06 07:15:27 公開日:2020-01-27
# 双極子対称性を持つ集合SU(3)スピン系の量子相

Quantum phases of collective SU(3) spin systems with bipartite symmetry ( http://arxiv.org/abs/2001.08310v2 )

ライセンス: Link先を確認
D\'avid Jakab, Zolt\'an Zimbor\'as(参考訳) スピン間の交換相互作用を持つ二部集合スピン-1$モデルについて検討する。 各サブシステムではスピン-スピン相互作用は同じ強度であり、サブシステム全体でも同様であるが、サブシステム内とサブシステム間での2つの結合値は異なる。 このようなセットアップは、近年の超低温原子による実験にインスパイアされている。 交換相互作用の $\mathrm{su}(3)$-対称性とサブシステム内の置換対称性を用いて、2つの結合強度のパラメータ空間全体におけるシステムのハミルトニアンを対角化するために表現論的手法を用いることができる。 これらの技術により、基底状態の位相図を明示的に構築し、探索することができる。 位相図は、ギャップとギャップのない位相の両方を含むリッチであることが判明した。 興味深い観察は、5つの相のうちの1つは強い二部対称性の破れであり、つまり基底状態の2つの部分系は$\mathrm{SU}(3)$表現が異なるということである。

We study a bipartite collective spin-$1$ model with exchange interaction between the spins. The bipartite nature of the model manifests itself by the spins being divided into two equal-sized subsystems; within each subsystem the spin-spin interactions are of the same strength, across the subsystems they are also equal, but the two coupling values within and across the subsystem are different. Such a set-up is inspired by recent experiments with ultracold atoms. Using the $\mathrm{SU}(3)$-symmetry of the exchange interaction and the permutation symmetry within the subsystems, we can employ representation theoretic methods to diagonalize the Hamiltonian of the system in the entire parameter space of the two coupling-strengths. These techniques then allow us to explicitly construct and explore the ground-state phase diagram. The phase diagram turns out to be rich containing both gapped and gapless phases. An interesting observation is that one of the five phases features a strong bipartite symmetry breaking, meaning that the two subsystems in the ground states are in different $\mathrm{SU}(3)$ representations.
翻訳日:2023-06-06 07:00:22 公開日:2020-01-27
# 楕円曲線離散対数に対する改良量子回路

Improved quantum circuits for elliptic curve discrete logarithms ( http://arxiv.org/abs/2001.09580v1 )

ライセンス: Link先を確認
Thomas H\"aner and Samuel Jaques and Michael Naehrig and Martin Roetteler and Mathias Soeken(参考訳) 楕円曲線群における離散対数を計算するShorアルゴリズムの最もコストのかかる成分である楕円曲線スカラー乗算のための改良された量子回路を提案する。 ウィンドウ化手法による可逆整数やモジュラー算術などの低レベル成分を最適化し、二元ユークリッドアルゴリズムを再構成することで、従来の量子回路よりもモジュラー反転を改良した。 全体として,より深度が低く,従来の回路よりもT$ゲートが少ないアフィンワイエストラス点加算回路を得る。 これまでの研究は、主に量子ビットの総数を最小化することに重点を置いてきたが、キュービット数、回路深度、$t$-gateカウントなど、さまざまなコスト指標のトレードオフを示す。 最後に、Q#量子プログラミング言語における点加算の完全な実装を提供し、全てのコンポーネントに対する単体テストと自動量子リソース推定を可能にする。

We present improved quantum circuits for elliptic curve scalar multiplication, the most costly component in Shor's algorithm to compute discrete logarithms in elliptic curve groups. We optimize low-level components such as reversible integer and modular arithmetic through windowing techniques and more adaptive placement of uncomputing steps, and improve over previous quantum circuits for modular inversion by reformulating the binary Euclidean algorithm. Overall, we obtain an affine Weierstrass point addition circuit that has lower depth and uses fewer $T$ gates than previous circuits. While previous work mostly focuses on minimizing the total number of qubits, we present various trade-offs between different cost metrics including the number of qubits, circuit depth and $T$-gate count. Finally, we provide a full implementation of point addition in the Q# quantum programming language that allows unit tests and automatic quantum resource estimation for all components.
翻訳日:2023-06-05 11:54:33 公開日:2020-01-27
# 崩壊モデルの現在のテスト:量子力学の限界をどこまで押し上げることができるのか?

Current tests of collapse models: How far can we push the limits of quantum mechanics? ( http://arxiv.org/abs/2001.09788v1 )

ライセンス: Link先を確認
Matteo Carlesso and Angelo Bassi(参考訳) 崩壊モデルでは、量子系の質量と複雑さが増加すると、量子コヒーレンスが徐々に失われる。 我々は、これらのモデルと、量子コヒーレンスの損失予測を検証しようとする現在の試みについてレビューする。

Collapse models implement a progressive loss of quantum coherence when the mass and the complexity of quantum systems increase. We will review such models and the current attempts to test their predicted loss of quantum coherence.
翻訳日:2023-06-05 11:52:31 公開日:2020-01-27
# 2量子量子フーリエ変換と循環対称性による絡み合い

Two-qubit quantum Fourier transform and entanglement protected by circulant symmetry ( http://arxiv.org/abs/2001.09693v1 )

ライセンス: Link先を確認
Peter A. Ivanov and Nikolay V. Vitanov(参考訳) 循環対称性を持つハミルトニアンを用いた2量子ビット量子フーリエ変換(qft)の実現法を提案する。 重要なことに、循環行列の固有ベクトルはフーリエモードであり、循環対称性が保存されている限りハミルトニアン要素の大きさに依存しない。 QFTの実装はスピン積状態からそれぞれの量子フーリエ重ね合わせ状態への断熱遷移に依存する。 イオントラップでは、閉じ込められたイオン間のスピン-スピン相互作用をチューニングすることで、循環対称性を持つハミルトニアンを得ることができる。 現実的な実験資源を用いて非常に高い忠実度が得られることを示す数値的な結果を示す。 また,「ショートカット・トゥ・アディバティティティ」フィールドを用いてゲートを加速する方法について述べる。

We propose a method for the realization of the two-qubit quantum Fourier transform (QFT) using a Hamiltonian which possesses the circulant symmetry. Importantly, the eigenvectors of the circulant matrices are the Fourier modes and do not depend on the magnitude of the Hamiltonian elements as long as the circulant symmetry is preserved. The QFT implementation relies on the adiabatic transition from each of the spin product states to the respective quantum Fourier superposition states. We show that in ion traps one can obtain a Hamiltonian with the circulant symmetry by tuning the spin-spin interaction between the trapped ions. We present numerical results which demonstrate that very high fidelity can be obtained with realistic experimental resources. We also describe how the gate can be accelerated by using a "shortcut-to-adiabaticity" field.
翻訳日:2023-06-05 11:51:45 公開日:2020-01-27
# 2色cwレーザー場における線形極性分子:対称性解析

A linear polar molecule in a two-color cw laser field: a symmetry analysis ( http://arxiv.org/abs/2001.09661v1 )

ライセンス: Link先を確認
David Mellado-Alcedo, Niurka R. Quintero, Rosario Gonz\'alez-F\'erez(参考訳) 2色非共鳴cwレーザー場における線形極性分子の回転ダイナミクスに関する理論的研究を行った。 この場と電気双極子モーメント、分子の偏光性、過分極性との相互作用を体系的に考慮することにより、平均近似が保たない状態において、ハミルトニアンの対称性が配向と配向に及ぼす影響を探索する。 配向とアライメントは位相と場の強さの関数として一定の対称性を満たすことが示されている。 平均的に、1色cwレーザー場は分子の向きを定めておらず、レーザー周波数の奇数かつ偶数個の生成物を持つ2色レーザーは、ヘッド・バース・テールオーダーの閉じ込めを破る必要がある。

A theoretical study of the rotational dynamics of a linear polar molecule in a two-color non-resonant cw laser field is presented. By systematically considering the interactions of this field with the electric dipole moment, polarizability and hyperpolarizability of the molecule, the effect of the symmetries of the Hamiltonian on the orientation and alignment is explored in a regime where the time-average approximation does not hold. It is shown that the alignment and orientation satisfy certain symmetries as a function of the phases and field strengths. On average a one-color cw laser field doest not orient the molecule, being necessary a two-color one having odd and even products of the laser frequency to break the head-versus-tail order confinement.
翻訳日:2023-06-05 11:51:32 公開日:2020-01-27
# 大規模な量子スピードアップには対称性が多すぎるか?

How symmetric is too symmetric for large quantum speedups? ( http://arxiv.org/abs/2001.09642v1 )

ライセンス: Link先を確認
Shalev Ben-David and Supartha Podder(参考訳) ブール関数 $f$ が群アクション $G$ の下で対称であると仮定すると、入力の$n$ビットに作用する。 これは、$f$ が指数関数的な量子スピードアップを持たないことを意味するのだろうか? 関数 $f$ が量子アルゴリズムを悪用するのに十分な構造を持つことができない前に、どれだけリッチでなければならないのかという特性は存在するか? この研究では、この方法で「量子不寛容」なグループアクション$g$を理解するためのいくつかのステップを行います。 十分に推移的な群作用は量子的スピードアップを許容せず、群作用の「十分にシャッフルする」性質は、群作用の下で対称な函数に対する超多項式的スピードアップが欠如していることを示す。 我々の手法はChailloux (2018) による最近の論文によって動機付けられ、$G=S_n$ の場合を扱う。 グラフの隣接行列上で定義されるブール関数$f$(およびグラフの頂点を緩和する対称)は、f$が部分関数であるとしても、そのランダム化と量子的クエリ複雑度の間のパワー6$の関係を持つことを示す。 特に、これはグラフ特性試験の問題は超ポリノミカルな量子スピードアップを持たず、アンバイニス、チャイルドズ、リュー (2011) のオープンな問題を解決したことを意味する。

Suppose a Boolean function $f$ is symmetric under a group action $G$ acting on the $n$ bits of the input. For which $G$ does this mean $f$ does not have an exponential quantum speedup? Is there a characterization of how rich $G$ must be before the function $f$ cannot have enough structure for quantum algorithms to exploit? In this work, we make several steps towards understanding the group actions $G$ which are "quantum intolerant" in this way. We show that sufficiently transitive group actions do not allow a quantum speedup, and that a "well-shuffling" property of group actions -- which happens to be preserved by several natural transformations -- implies a lack of super-polynomial speedups for functions symmetric under the group action. Our techniques are motivated by a recent paper by Chailloux (2018), which deals with the case where $G=S_n$. Our main application is for graph symmetries: we show that any Boolean function $f$ defined on the adjacency matrix of a graph (and symmetric under relabeling the vertices of the graph) has a power $6$ relationship between its randomized and quantum query complexities, even if $f$ is a partial function. In particular, this means no graph property testing problems can have super-polynomial quantum speedups, settling an open problem of Ambainis, Childs, and Liu (2011).
翻訳日:2023-06-05 11:51:05 公開日:2020-01-27
# 1+1)-d u(1)双極子分子の有効ハミルトニアンによる量子リンクモデル

(1+1)-d U(1) Quantum link models from effective Hamiltonians of dipolar molecules ( http://arxiv.org/abs/2001.10002v1 )

ライセンス: Link先を確認
Jiayu Shen, Di Luo, Michael Highman, Bryan K. Clark, Brian DeMarco, Aida X. El-Khadra, Bryce Gadway(参考訳) 格子ゲージ理論の離散バージョンである量子リンクモデルのアナログ量子シミュレータとして双極子分子系を用いる有望なアイデアについて検討する。 量子リンクモデルでは、リンク変数は有限個の自由度と離散値を持つ。 電気双極子-双極子相互作用を持つ双極子分子系の効果的なハミルトニアンを構築し、1+1次元のu(1)量子リンクモデルを記述するターゲットハミルトニアンとマッチングするためにシステムの可変パラメータを使用する。

We study the promising idea of using dipolar molecular systems as analog quantum simulators for quantum link models, which are discrete versions of lattice gauge theories. In a quantum link model the link variables have a finite number of degrees of freedom and discrete values. We construct the effective Hamiltonian of a system of dipolar molecules with electric dipole-dipole interactions, where we use the tunable parameters of the system to match it to the target Hamiltonian describing a U(1) quantum link model in 1+1 dimensions.
翻訳日:2023-06-05 11:42:25 公開日:2020-01-27
# 会話と関係の10の社会的側面

Ten Social Dimensions of Conversations and Relationships ( http://arxiv.org/abs/2001.09954v1 )

ライセンス: Link先を確認
Minje Choi, Luca Maria Aiello, Krisztian Zsolt Varga, Daniele Quercia(参考訳) 社会科学研究の数十年で、人間関係の性質を記述するための概念的な構成要素を提供する10の基本的な次元が特定された。 しかし、これらの概念が日常言語でどの程度表現されているのか、社会的相互作用の観察可能なダイナミクスを形作る上でどのような役割があるのかは明らかではない。 クラウドソーシングを通じて会話テキストに注釈を付け、会話からこの種の対話の存在を検出するnlpツールをトレーニングし、redditユーザが書いた160万のメッセージ、enronコーパスから290万のeメール、映画スクリプトから3万行の対話に適用した。 社会的な次元は,最大0.98 までの auc との会話から純粋に予測可能であり,予測された次元の組み合わせは,人々が楽しませる関係のタイプ(コンフリクト対サポート)と,彼らが形成する現実世界のコミュニティのタイプ(ウィールシー対デプリブド)の両方を示唆する。

Decades of social science research identified ten fundamental dimensions that provide the conceptual building blocks to describe the nature of human relationships. Yet, it is not clear to what extent these concepts are expressed in everyday language and what role they have in shaping observable dynamics of social interactions. After annotating conversational text through crowdsourcing, we trained NLP tools to detect the presence of these types of interaction from conversations, and applied them to 160M messages written by geo-referenced Reddit users, 290k emails from the Enron corpus and 300k lines of dialogue from movie scripts. We show that social dimensions can be predicted purely from conversations with an AUC up to 0.98, and that the combination of the predicted dimensions suggests both the types of relationships people entertain (conflict vs. support) and the types of real-world communities (wealthy vs. deprived) they shape.
翻訳日:2023-06-05 11:41:34 公開日:2020-01-27
# 量子回路における電子熱流と熱ショットノイズ

Electronic heat flow and thermal shot noise in quantum circuits ( http://arxiv.org/abs/2001.09824v1 )

ライセンス: Link先を確認
E. Sivre, H. Duprez, A. Anthore, A. Aassime, F.D. Parmentier, A. Cavanna, A. Ouerghi, U. Gennser, F. Pierre(参考訳) 個々の量子成分をメソスコピック回路に組み立てる際、クーロン相互作用と電荷粒度の間の相互作用は電気インピーダンス組成の古典的な法則を分解する。 ここでは、熱影響を実験的に検討し、電子熱輸送のさらなる量子機構を観察する。 広範に調整可能なテストベッド回路は、1つの電子チャネルに接続されたマイクロスケールの金属ノードと抵抗から構成される。 ノードをジュール散逸で加熱すると、相補的なノイズ測定から、チャネル間の温度差によって誘導される温度と熱ショットノイズの両方を別々に決定する(‘delta-$T$ noise’)。 これにより、熱ショットノイズ予測が直接検証され、電子熱流が明らかにされる。 後者は、電子の分配とクーロン相互作用を含むチャネルからの寄与を示す。 熱的ショットノイズを含む熱電流予測を拡張することで,実験と定量的に一致した。

When assembling individual quantum components into a mesoscopic circuit, the interplay between Coulomb interaction and charge granularity breaks down the classical laws of electrical impedance composition. Here we explore experimentally the thermal consequences, and observe an additional quantum mechanism of electronic heat transport. The investigated, broadly tunable test-bed circuit is composed of a micron-scale metallic node connected to one electronic channel and a resistance. Heating up the node with Joule dissipation, we separately determine, from complementary noise measurements, both its temperature and the thermal shot noise induced by the temperature difference across the channel (`delta-$T$ noise'). The thermal shot noise predictions are thereby directly validated, and the electronic heat flow is revealed. The latter exhibits a contribution from the channel involving the electrons' partitioning together with the Coulomb interaction. Expanding heat current predictions to include the thermal shot noise, we find a quantitative agreement with experiments.
翻訳日:2023-06-05 11:40:38 公開日:2020-01-27
# 二次元量子磁石における価結合固体, 退化次数および創発的so(5)対称性

Valence-bond solids, vestigial order, and emergent SO(5) symmetry in a two-dimensional quantum magnet ( http://arxiv.org/abs/2001.10045v1 )

ライセンス: Link先を確認
Jun Takahashi and Anders W. Sandvik(参考訳) 2次元正方格子上に多体相関したハイゼンベルク型相互作用を持つ量子スピン-1/2モデルを導入し、プラケット価結合固体(PVBS)基底状態が$\mathbb{Z}_4$対称性を破るように設計された。 反強磁性(AFM)状態とPVBS状態の間の量子相転移の詳細な量子モンテカルロ法による研究を行う。 AFMと柱状原子価結合固体の間の連続的な「分解」遷移とは対照的に、一階遷移がある。 AFM-PVBS遷移における共存状態がSO(5)対称性と予期せず関連していることを示し、遷移が分解臨界点に結びついていることを示す。 また、PVBS状態におけるフラクトン特性を持つスピノンの最近の提案の文脈における一階遷移についても論じ、フラクトンシナリオはありそうもないと結論付けた。 さらに、PVBS相の残りの$\mathbb{Z}_2$対称性を破る8倍縮退VBS相の新たなタイプの発見を行う。 PVBS相は中間的な「ベクトル」相と見なすことができ、2段階の離散対称性の破れを記述するための一般グラフ理論のアプローチを開発する。 有限温度では、変動誘起一階遷移を観測し、これは退化相転移の指標である。 また、高T$_{\rm c}$超伝導のSO(5)理論への接続についても言及する。

We introduce a quantum spin-1/2 model with many-body correlated Heisenberg-type interactions on the 2D square lattice, designed to host a plaquette valence-bond solid (PVBS) ground state breaking $\mathbb{Z}_4$ symmetry. We carry out a detailed quantum Monte Carlo study of the quantum phase transition between the antiferromagnetic (AFM) and PVBS states. We find a first-order transition, in contrast to previously studied continuous 'deconfined' transitions between the AFM and columnar valence-bond solids. We show that the coexistence state at the AFM--PVBS transition is unexpectedly associated with SO(5) symmetry, which may indicate that the transition is connected to a deconfined critical point. We also discuss the first-order transition in the context of a recent proposal of spinons with fracton properties in the PVBS state, concluding that the fracton scenario is unlikely. Further, we discover a novel type of eight-fold degenerate VBS phase that breaks the remaining $\mathbb{Z}_2$ symmetry of the PVBS phase. The PVBS phase can then be regarded as an intermediate 'vestigial' phase, and we develop a general graph-theoretic approach to describe the two-stage discrete symmetry breaking. At finite temperature, we observe fluctuation-induced first-order transitions, which are hallmarks of vestigial phase transitions. We also mention possible connections to the SO(5) theory of high-T$_{\rm c}$ superconductivity.
翻訳日:2023-06-05 11:31:50 公開日:2020-01-27
# 時間最適量子制御の一般定式化と特異プロトコルの最適性

A general formulation of time-optimal quantum control and optimality of singular protocols ( http://arxiv.org/abs/2001.00029v2 )

ライセンス: Link先を確認
Hiroaki Wakamura and Tatsuhiko Koike(参考訳) 我々は、ハミルトニアンが任意の制約を受けるとき、量子系の時-最適ユニタリ進化を見つけるための一般的な理論的枠組みを示す。 量子ブラキストロン (Quantum brachistochrone, QB) は変分原理に基づく枠組みであり、その欠点は等式制約のみを扱うことである。 不等式制約は、いくつかの状況では等式制約に還元できるが、特にハミルトニアンにドリフト場が存在する場合、それらが不可能な状況が存在する。 コントロールできないドリフトは、幅広いシステムで見られます。 我々はまず、不等式制約にも対処するため、ポントリャーギンの最大原理(MP)に基づくフレームワークを開発する。 新しいフレームワークはqbを特別なケースとして含み、詳細な対応がなされている。 次に,この枠組みを用いて,ドリフト,特異制御,不等式制約の一般関係について考察する。 特異制御はMPを自明に満足させるもので、最適なプロトコルを決定するのに問題を引き起こす。 第三に、この問題を克服するために、一般化されたルジャンドル・クレブシュ条件を適用することにより、特異プロトコルが最適となるための追加の必要条件を導出する。 特にこの条件は特異制御の物理的意味を明らかにする。 最後に、我々のフレームワークと結果がどのように機能するかを例に示します。

We present a general theoretical framework for finding the time-optimal unitary evolution of the quantum systems when the Hamiltonian is subject to arbitrary constraints. Quantum brachistochrone (QB) is such a framework based on the variational principle, whose drawback is that it deals with equality constraints only. While inequality constraints can be reduced to equality ones in some situations, there are situations where they cannot, especially when a drift field is present in the Hamiltonian. The drift which we cannot control appears in a wide range of systems. We first develop a framework based on Pontryagin's maximum principle (MP) in order to deal with inequality constraints as well. The new framework contains QB as a special case, and their detailed correspondence is given. Second, using this framework, we discuss general relations among the drift, the singular controls, and the inequality constraints. The singular controls are those that satisfy MP trivially so as to cause a trouble in determining the optimal protocol. Third, to overcome this issue, we derive an additional necessary condition for a singular protocol to be optimal by applying the generalized Legendre-Clebsch condition. This condition in particular reveals the physical meaning of singular controls. Finally, we demonstrate how our framework and results work in some examples.
翻訳日:2023-01-16 21:36:48 公開日:2020-01-27
# D波量子アニールを用いた有限入力系のモデル予測制御

Model Predictive Control for Finite Input Systems using the D-Wave Quantum Annealer ( http://arxiv.org/abs/2001.01400v2 )

ライセンス: Link先を確認
Daisuke Inoue, Hiroaki Yoshida(参考訳) D-Wave量子アニールは、大きな関心を集めている新しい計算アーキテクチャとして登場したが、量子アニールのパワーを利用する実用的なアルゴリズムはわずかである。 本稿では,有限個の入力値を持つシステムに対して,量子アニールを用いたモデル予測制御(MPC)アルゴリズムを提案する。 このようなMPC問題は非決定論的多項式時間ハード組合せ問題に分類されるため、従来の計算システムではリアルタイム逐次最適化が難しい。 我々は、元のmpc問題を二元最適化問題に変換し、d-wave量子アニーラによって解くことで、この困難を回避する。 spring-mass-damperシステムの安定化と動的オーディオ量子化という2つの実用的な応用が実証されている。 D-Wave法は従来の模擬焼鈍法よりも優れた性能を示す。 この結果から,動的制御問題に対する量子アニールの新たな応用が示唆された。

The D-Wave quantum annealer has emerged as a novel computational architecture that is attracting significant interest, but there have been only a few practical algorithms exploiting the power of quantum annealers. Here we present a model predictive control (MPC) algorithm using a quantum annealer for a system allowing a finite number of input values. Such an MPC problem is classified as a non-deterministic polynomial-time-hard combinatorial problem, and thus real-time sequential optimization is difficult to obtain with conventional computational systems. We circumvent this difficulty by converting the original MPC problem into a quadratic unconstrained binary optimization problem, which is then solved by the D-Wave quantum annealer. Two practical applications, namely stabilization of a spring-mass-damper system and dynamic audio quantization, are demonstrated. For both, the D-Wave method exhibits better performance than the classical simulated annealing method. Our results suggest new applications of quantum annealers in the direction of dynamic control problems.
翻訳日:2023-01-14 03:16:13 公開日:2020-01-27
# AE-OT-GAN:データ固有の潜伏分布からGANを訓練する

AE-OT-GAN: Training GANs from data specific latent distribution ( http://arxiv.org/abs/2001.03698v2 )

ライセンス: Link先を確認
Dongsheng An, Yang Guo, Min Zhang, Xin Qi, Na Lei, Shing-Tung Yau, and Xianfeng Gu(参考訳) GAN(Generative Adversarial Network)は、現実的かつ鮮明な画像を生成するために優位なモデルであるが、しばしばモード崩壊問題に遭遇し、連続DNNを用いて本質的不連続分布変換マップを近似することによる訓練に固執する。 最近提案されたAE-OTモデルは、半離散最適トランスポート(OT)マップをオートエンコーダの潜在空間で解くことで、不連続なディストリビューション変換マップを明示的に計算することで、この問題に対処する。 本稿では,ae-ot-ganモデルを用いて,高画質画像の生成とモード崩壊/混合問題の克服という2つのモデルの利点を生かして,まず,低次元画像多様体をオートエンコーダ(ae)の訓練により潜在空間に忠実に埋め込む。 次に、潜在多様体上で支持されるla-tent分布に一様分布を前進させる最適なトランスポート(ot)マップを計算する。 最後に、当社のganモデルは、潜在分布から高品質な画像を生成するように訓練され、実験データ分布への分布変換マップが連続的に作成されます。 MNISTデータセットとCifar-10やCelebAのような複雑なデータセットに対する実験は,提案手法の有効性と有効性を示している。

Though generative adversarial networks (GANs) areprominent models to generate realistic and crisp images,they often encounter the mode collapse problems and arehard to train, which comes from approximating the intrinsicdiscontinuous distribution transform map with continuousDNNs. The recently proposed AE-OT model addresses thisproblem by explicitly computing the discontinuous distribu-tion transform map through solving a semi-discrete optimaltransport (OT) map in the latent space of the autoencoder.However the generated images are blurry. In this paper, wepropose the AE-OT-GAN model to utilize the advantages ofthe both models: generate high quality images and at thesame time overcome the mode collapse/mixture problems.Specifically, we first faithfully embed the low dimensionalimage manifold into the latent space by training an autoen-coder (AE). Then we compute the optimal transport (OT)map that pushes forward the uniform distribution to the la-tent distribution supported on the latent manifold. Finally,our GAN model is trained to generate high quality imagesfrom the latent distribution, the distribution transform mapfrom which to the empirical data distribution will be con-tinuous. The paired data between the latent code and thereal images gives us further constriction about the generator.Experiments on simple MNIST dataset and complex datasetslike Cifar-10 and CelebA show the efficacy and efficiency ofour proposed method.
翻訳日:2023-01-12 09:44:37 公開日:2020-01-27
# スパース推定のためのQUBO定式化の導出

Derivation of QUBO formulations for sparse estimation ( http://arxiv.org/abs/2001.03715v2 )

ライセンス: Link先を確認
Tomohiro Yokota, Makiko Konoshima, Hirotaka Tamura, Jun Ohkubo(参考訳) 量子アニーリングなどのIsing型アニーリング手法のスパース推定を実現するために,l1-normの2次非拘束バイナリ最適化(QUBO)法を提案する。 QUBOの定式化は、ReLU型関数のQUBO定式化を導出するために最近用いられているルジャンドル変換とウルフの定理を用いて導出される。 導出法のl1-ノルムケースへの単純な適用により冗長変数が生成できることが示されている。 最後に、冗長変数を除去して簡易なQUBO定式化を得る。

We propose a quadratic unconstrained binary optimization (QUBO) formulation of the l1-norm, which enables us to perform sparse estimation of Ising-type annealing methods such as quantum annealing. The QUBO formulation is derived using the Legendre transformation and the Wolfe theorem, which have recently been employed to derive the QUBO formulations of ReLU-type functions. It is shown that a simple application of the derivation method to the l1-norm case results in a redundant variable. Finally a simplified QUBO formulation is obtained by removing the redundant variable.
翻訳日:2023-01-12 09:25:47 公開日:2020-01-27
# マルチモーダル・ナラティブを用いたディヤド会話における抑うつの検出と可視化

Detecting depression in dyadic conversations with multimodal narratives and visualizations ( http://arxiv.org/abs/2001.04809v2 )

ライセンス: Link先を確認
Joshua Y. Kim, Greyson Y. Kim and Kalina Yacef(参考訳) 会話には幅広いマルチモーダル情報が含まれており、話者の感情や気分についてヒントを与えてくれる。 本稿では,人間による会話の分析を支援するシステムを開発した。 本研究の主な貢献は, 適切なマルチモーダル特徴の同定と, 言語会話書き起こしへの統合である。 本研究では,マルチモーダル情報を広範囲に取り込み,個人の抑うつ状態を予測するための予測スコアを自動生成するシステムについて述べる。 実験の結果,本手法はベースラインモデルよりも優れた性能を示した。 さらに、マルチモーダルナラティブアプローチは、会話分析や心理学など、他の分野からの学習を統合しやすくする。 最後に、この学際的で自動化されたアプローチは、実践者が治療の過程を記録する方法のエミュレートと、会話アナリストが手動で会話を分析する方法のエミュレーションへのステップである。

Conversations contain a wide spectrum of multimodal information that gives us hints about the emotions and moods of the speaker. In this paper, we developed a system that supports humans to analyze conversations. Our main contribution is the identification of appropriate multimodal features and the integration of such features into verbatim conversation transcripts. We demonstrate the ability of our system to take in a wide range of multimodal information and automatically generated a prediction score for the depression state of the individual. Our experiments showed that this approach yielded better performance than the baseline model. Furthermore, the multimodal narrative approach makes it easy to integrate learnings from other disciplines, such as conversational analysis and psychology. Lastly, this interdisciplinary and automated approach is a step towards emulating how practitioners record the course of treatment as well as emulating how conversational analysts have been analyzing conversations by hand.
翻訳日:2023-01-11 22:30:00 公開日:2020-01-27
# 非観測データを用いた関係ネットワークにおける集約特性の推定

Estimating Aggregate Properties In Relational Networks With Unobserved Data ( http://arxiv.org/abs/2001.05617v2 )

ライセンス: Link先を確認
Varun Embar, Sriram Srinivasan, Lise Getoor(参考訳) クラスタ凝集やブリッジノード数といった集約的なネットワーク特性は、ネットワークのコミュニティ構造、影響の広がり、ネットワークの障害へのレジリエンスに関する洞察を得るのに使うことができる。 ネットワークの完全観測時のネットワーク特性の効率的な計算が注目されている(wasserman and faust 1994; cook and holder 2006)が、データ属性が欠けている場合の集約的ネットワーク特性の計算の問題はほとんど注目されていない。 属性の欠如したネットワークに対するこれらのプロパティの計算は、ネットワーク上で推論を実行することを伴う。 統計的リレーショナルラーニング(SRL)とグラフニューラルネットワーク(GNN)は、グラフの欠落した属性を推測するのに適した機械学習アプローチの2つのクラスである。 本稿では,属性の欠如したネットワーク上での集約特性推定におけるこれらの手法の有効性について検討する。 2つのSRLアプローチと3つのGNNを比較した。 これらの手法ではMAPや平均といった点推定を用いてこれらの特性を推定する。 欠落属性に対する合同分布を推定できるsrlベースのアプローチでは、これらの特性を分布上の期待値として推定する。 確率的ソフトロジックに対する期待値を計算するため、我々はSRLアプローチの1つとして、新しいサンプリングフレームワークを導入する。 実験的評価では,3つのベンチマークデータセットを用いて,SRLに基づくアプローチが集約特性の計算と予測精度の両方においてGNNベースのアプローチより優れていることを示した。 具体的には,ジョイント分布上の期待値としての集約特性の推定が,ポイント推定を上回っていることを示す。

Aggregate network properties such as cluster cohesion and the number of bridge nodes can be used to glean insights about a network's community structure, spread of influence and the resilience of the network to faults. Efficiently computing network properties when the network is fully observed has received significant attention (Wasserman and Faust 1994; Cook and Holder 2006), however the problem of computing aggregate network properties when there is missing data attributes has received little attention. Computing these properties for networks with missing attributes involves performing inference over the network. Statistical relational learning (SRL) and graph neural networks (GNNs) are two classes of machine learning approaches well suited for inferring missing attributes in a graph. In this paper, we study the effectiveness of these approaches in estimating aggregate properties on networks with missing attributes. We compare two SRL approaches and three GNNs. For these approaches we estimate these properties using point estimates such as MAP and mean. For SRL-based approaches that can infer a joint distribution over the missing attributes, we also estimate these properties as an expectation over the distribution. To compute the expectation tractably for probabilistic soft logic, one of the SRL approaches that we study, we introduce a novel sampling framework. In the experimental evaluation, using three benchmark datasets, we show that SRL-based approaches tend to outperform GNN-based approaches both in computing aggregate properties and predictive accuracy. Specifically, we show that estimating the aggregate properties as an expectation over the joint distribution outperforms point estimates.
翻訳日:2023-01-10 23:35:39 公開日:2020-01-27
# 強化学習技術に関する調査研究 : 戦略,最近の展開,今後の方向性

A Survey of Reinforcement Learning Techniques: Strategies, Recent Development, and Future Directions ( http://arxiv.org/abs/2001.06921v2 )

ライセンス: Link先を確認
Amit Kumar Mondal(参考訳) 強化学習は、リアルタイム応答を強調する人工知能システムの設計における中核的な要素の1つである。 強化学習は、環境モデルに関する以前の知識があるかどうかに関わらず、任意の環境内で行動を取るシステムに影響を与える。 本稿では,課題,最新の最先端技術の発展,今後の方向性など,様々な側面に着目した強化学習に関する総合的研究を行う。 本論文の基本的な目的は,本分野の新しい研究者や研究者に対して,最新の懸念を考慮し,十分に情報的かつ容易に追従できる強化学習手法の提示のためのフレームワークを提供することである。 まず,強化学習の中核的手法を,容易に理解し,比較可能な方法で紹介した。 最後に,強化学習手法の最近の展開を分析し,考察した。 私の分析では、ほとんどのモデルは特定の推論状態で他のことをチューニングするのではなく、ポリシー値のチューニングに重点を置いています。

Reinforcement learning is one of the core components in designing an artificial intelligent system emphasizing real-time response. Reinforcement learning influences the system to take actions within an arbitrary environment either having previous knowledge about the environment model or not. In this paper, we present a comprehensive study on Reinforcement Learning focusing on various dimensions including challenges, the recent development of different state-of-the-art techniques, and future directions. The fundamental objective of this paper is to provide a framework for the presentation of available methods of reinforcement learning that is informative enough and simple to follow for the new researchers and academics in this domain considering the latest concerns. First, we illustrated the core techniques of reinforcement learning in an easily understandable and comparable way. Finally, we analyzed and depicted the recent developments in reinforcement learning approaches. My analysis pointed out that most of the models focused on tuning policy values rather than tuning other things in a particular state of reasoning.
翻訳日:2023-01-08 10:11:52 公開日:2020-01-27
# CodeReef: ポータブルMLOps、再利用可能な自動化アクション、再現可能なベンチマークのためのオープンプラットフォーム

CodeReef: an open platform for portable MLOps, reusable automation actions and reproducible benchmarking ( http://arxiv.org/abs/2001.07935v2 )

ライセンス: Link先を確認
Grigori Fursin, Herve Guillou and Nicolas Essayan(参考訳) 私たちは、クロスプラットフォームmlops(mlsysops)を可能にするために必要なすべてのコンポーネントを共有するためのオープンなプラットフォームであるcodereefを紹介します。 CodeReefソリューションも導入しています – 非仮想化、ポータブル、カスタマイズ可能、再現可能なアーカイブファイルとしてモデルをパッケージ化し、共有する手段です。 MLパッケージには、すべての依存関係を持つモデルのJSONメタ記述、Python API、CLIアクション、さまざまなプラットフォーム、AIフレームワーク、ライブラリ、コンパイラ、データセットをまたいだモデルの自動ビルド、ベンチマーク、テスト、カスタマイズに必要なポータブルワークフローが含まれている。 最新のMLPerf推論ベンチマークから,Raspberry Pi,Androidスマートフォン,IoTデバイスからデータセンタに至るまで,さまざまなプラットフォームを対象とした,SSD-Mobilenets,TensorFlow,COCOデータセットに基づくオブジェクト検出を自動的に構築,実行,測定するCodeReefソリューションをデモした。 私たちの長期的な目標は、コラボレーションと再現可能なベンチマークに参加し、異なるml/ソフトウェア/ハードウェアスタックを比較し、オンラインcodereefダッシュボードを使用してparetoフロンティアで最も効率的なものを選択するための研究論文とともに、新たな技術をプロダクション対応パッケージとして共有することにあります。

We present CodeReef - an open platform to share all the components necessary to enable cross-platform MLOps (MLSysOps), i.e. automating the deployment of ML models across diverse systems in the most efficient way. We also introduce the CodeReef solution - a way to package and share models as non-virtualized, portable, customizable and reproducible archive files. Such ML packages include JSON meta description of models with all dependencies, Python APIs, CLI actions and portable workflows necessary to automatically build, benchmark, test and customize models across diverse platforms, AI frameworks, libraries, compilers and datasets. We demonstrate several CodeReef solutions to automatically build, run and measure object detection based on SSD-Mobilenets, TensorFlow and COCO dataset from the latest MLPerf inference benchmark across a wide range of platforms from Raspberry Pi, Android phones and IoT devices to data centers. Our long-term goal is to help researchers share their new techniques as production-ready packages along with research papers to participate in collaborative and reproducible benchmarking, compare the different ML/software/hardware stacks and select the most efficient ones on a Pareto frontier using online CodeReef dashboards.
翻訳日:2023-01-07 18:11:58 公開日:2020-01-27
# 2次元ボクセル型ソフトロボットの最適化フレンドリなシミュレータ2D-VSR-Simの設計, 検証, 事例研究

Design, Validation, and Case Studies of 2D-VSR-Sim, an Optimization-friendly Simulator of 2-D Voxel-based Soft Robots ( http://arxiv.org/abs/2001.08617v2 )

ライセンス: Link先を確認
Eric Medvet, Alberto Bartoli, Andrea De Lorenzo, Stefano Seriani(参考訳) voxelベースのソフトロボット(vsrs)は、設計が最適化に適するソフトブロックの集合体である。 本稿では,vsr体と脳の最適化に関する研究を容易にするソフトウェア2d-vsr-simを提案する。 Javaで書かれたこのソフトウェアは、最適化に適した全てのVSRのインターフェースを提供し、センサーの存在、すなわちVSRを制御する環境からのフィードバックを利用する可能性を設計することで考慮する。 機械的観点から2D-VSR-SimでシミュレートできるVSRを実験的に特徴付け,シミュレーションの計算負担について考察する。 最後に, 2D-VSR-Sim を用いて, 過去の重要な研究実験を再現し, 様々な研究課題に対する実験的回答を提供する方法について述べる。

Voxel-based soft robots (VSRs) are aggregations of soft blocks whose design is amenable to optimization. We here present a software, 2D-VSR-Sim, for facilitating research concerning the optimization of VSRs body and brain. The software, written in Java, provides consistent interfaces for all the VSRs aspects suitable for optimization and considers by design the presence of sensing, i.e., the possibility of exploiting the feedback from the environment for controlling the VSR. We experimentally characterize, from a mechanical point of view, the VSRs that can be simulated with 2D-VSR-Sim and we discuss the computational burden of the simulation. Finally, we show how 2D-VSR-Sim can be used to repeat the experiments of significant previous studies and, in perspective, to provide experimental answers to a variety of research questions.
翻訳日:2023-01-07 13:05:36 公開日:2020-01-27
# データベースプロセスにおける知識発見の観点からのネットワーク侵入検出手法の検討

Survey of Network Intrusion Detection Methods from the Perspective of the Knowledge Discovery in Databases Process ( http://arxiv.org/abs/2001.09697v1 )

ライセンス: Link先を確認
Borja Molina-Coronado and Usue Mori and Alexander Mendiburu and Jos\'e Miguel-Alonso(参考訳) 情報・通信システムをターゲットにしたサイバー攻撃の特定は、長年研究コミュニティの焦点となっている。 ネットワーク侵入検出は複雑な問題であり,様々な課題を提起する。 現在多くの攻撃は検出されていないが、接続デバイスの普及と通信技術の進化により新しい攻撃が出現する。 本稿では, 侵入検知器の開発を目的として, ネットワークデータに適用された手法について検討するが, これまでのレビューとは対照的に, データベースにおける知識発見(KDD)プロセスの観点から解析する。 そこで本研究では,データのキャプチャ,準備,変換,データマイニング,評価などに用いる手法について論じる。 また,データマイニングやKDDの領域で用いられる用語に基づいて,これらの手法の背景にある特徴とモチベーションを明らかにし,より適切かつ最新の分類法と侵入検知器の定義を提案する。 評価手順に特に重要視され、異なる検出器を評価し、現在の実ネットワークにおける適用性について議論する。 最後に、この文献レビューの結果、ネットワークセキュリティ分野のさらなる研究のために考慮すべきいくつかのオープンな問題について検討する。

The identification of cyberattacks which target information and communication systems has been a focus of the research community for years. Network intrusion detection is a complex problem which presents a diverse number of challenges. Many attacks currently remain undetected, while newer ones emerge due to the proliferation of connected devices and the evolution of communication technology. In this survey, we review the methods that have been applied to network data with the purpose of developing an intrusion detector, but contrary to previous reviews in the area, we analyze them from the perspective of the Knowledge Discovery in Databases (KDD) process. As such, we discuss the techniques used for the capture, preparation and transformation of the data, as well as, the data mining and evaluation methods. In addition, we also present the characteristics and motivations behind the use of each of these techniques and propose more adequate and up-to-date taxonomies and definitions for intrusion detectors based on the terminology used in the area of data mining and KDD. Special importance is given to the evaluation procedures followed to assess the different detectors, discussing their applicability in current real networks. Finally, as a result of this literature review, we investigate some open issues which will need to be considered for further research in the area of network security.
翻訳日:2023-01-06 08:41:07 公開日:2020-01-27
# プラニングによる効率的で安定なグラフ散乱変換

Efficient and Stable Graph Scattering Transforms via Pruning ( http://arxiv.org/abs/2001.09882v1 )

ライセンス: Link先を確認
Vassilis N. Ioannidis and Siheng Chen and Georgios B. Giannakis(参考訳) グラフ畳み込みネットワーク(gcns)は様々なグラフ学習タスクでよく文書化されているが、その分析はまだ初期段階にある。 グラフ散乱変換(GST)は、グラフデータから特徴を抽出し、一般化と安定性解析に寄与する訓練不要なディープGCNモデルを提供する。 GSTが支払う価格は、層の数によって増加する空間と時間の指数関数的な複雑さである。 これにより、深いアーキテクチャが必要な場合、GSTのデプロイを妨げます。 本研究は,GSTの複雑性の限界に対処し,p)GSTアプローチを効果的に導入する。 得られたプルーニングアルゴリズムは、グラフスペクトルにインスパイアされた基準で導かれ、GSTに関連する指数複雑性を回避しつつ、情報散乱特性をオンザフライで保持する。 また、入力グラフデータやネットワーク構造が乱されるときに、新しいpGSTの安定性を確立する。 さらに, ランダムおよび局所的な信号摂動に対するpGSTの感度を解析および実験的に検討した。 数値実験により、pGSTはベースラインGSTと相容れない性能を示し、計算量を大幅に削減した。 さらに、pGSTは、グラフおよび3Dポイントクラウド分類タスクにおける最先端GCNと同等のパフォーマンスを達成する。 pGSTプルーニングパターンを解析すると、異なるドメインのグラフデータが異なるネットワークアーキテクチャを呼び出し、同時代のGCNの設計選択を導くために、プルーニングアルゴリズムが用いられる可能性があることを示す。

Graph convolutional networks (GCNs) have well-documented performance in various graph learning tasks, but their analysis is still at its infancy. Graph scattering transforms (GSTs) offer training-free deep GCN models that extract features from graph data, and are amenable to generalization and stability analyses. The price paid by GSTs is exponential complexity in space and time that increases with the number of layers. This discourages deployment of GSTs when a deep architecture is needed. The present work addresses the complexity limitation of GSTs by introducing an efficient so-termed pruned (p)GST approach. The resultant pruning algorithm is guided by a graph-spectrum-inspired criterion, and retains informative scattering features on-the-fly while bypassing the exponential complexity associated with GSTs. Stability of the novel pGSTs is also established when the input graph data or the network structure are perturbed. Furthermore, the sensitivity of pGST to random and localized signal perturbations is investigated analytically and experimentally. Numerical tests showcase that pGST performs comparably to the baseline GST at considerable computational savings. Furthermore, pGST achieves comparable performance to state-of-the-art GCNs in graph and 3D point cloud classification tasks. Upon analyzing the pGST pruning patterns, it is shown that graph data in different domains call for different network architectures, and that the pruning algorithm may be employed to guide the design choices for contemporary GCNs.
翻訳日:2023-01-06 08:40:48 公開日:2020-01-27
# 客観的社会選択:補助情報を用いた投票結果の改善

Objective Social Choice: Using Auxiliary Information to Improve Voting Outcomes ( http://arxiv.org/abs/2001.10092v1 )

ライセンス: Link先を確認
Silviu Pitis and Michael R. Zhang(参考訳) 多様な情報源からノイズのある情報を組み合わせて、客観的根拠の真理を推測するにはどうすればよいのか? この頻繁に繰り返される規範的な疑問は、統計学、機械学習、政策決定、日常生活の核心にある。 これは、"combining forecasts"、"meta- analysis"、"ensembling"、"mle approach to voting"などとも呼ばれる。 過去の研究では、騒がしい投票は同一で独立に分散していると仮定されるが、この仮定はしばしば非現実的である。 その代わり、投票は独立だが必ずしも同じ分布ではなく、我々の感性アルゴリズムは各投票のノイズを管理する基礎となるモデルに関連する補助情報にアクセスすることができると仮定する。 In our present work, we: (1) define our problem and argue that it reflects common and socially relevant real world scenarios, (2) propose a multi-arm bandit noise model and count-based auxiliary information set, (3) derive maximum likelihood aggregation rules for ranked and cardinal votes under our noise model, (4) propose, alternatively, to learn an aggregation rule using an order-invariant neural network, and (5) empirically compare our rules to common voting rules and naive experience-weighted modifications. 我々のルールは、補助情報を利用して、素質のベースラインを上回りました。

How should one combine noisy information from diverse sources to make an inference about an objective ground truth? This frequently recurring, normative question lies at the core of statistics, machine learning, policy-making, and everyday life. It has been called "combining forecasts", "meta-analysis", "ensembling", and the "MLE approach to voting", among other names. Past studies typically assume that noisy votes are identically and independently distributed (i.i.d.), but this assumption is often unrealistic. Instead, we assume that votes are independent but not necessarily identically distributed and that our ensembling algorithm has access to certain auxiliary information related to the underlying model governing the noise in each vote. In our present work, we: (1) define our problem and argue that it reflects common and socially relevant real world scenarios, (2) propose a multi-arm bandit noise model and count-based auxiliary information set, (3) derive maximum likelihood aggregation rules for ranked and cardinal votes under our noise model, (4) propose, alternatively, to learn an aggregation rule using an order-invariant neural network, and (5) empirically compare our rules to common voting rules and naive experience-weighted modifications. We find that our rules successfully use auxiliary information to outperform the naive baselines.
翻訳日:2023-01-06 08:40:22 公開日:2020-01-27
# 対流支配層流と乱流の射影モデル秩序低減の安定性について

On the stability of projection-based model order reduction for convection-dominated laminar and turbulent flows ( http://arxiv.org/abs/2001.10110v1 )

ライセンス: Link先を確認
Sebastian Grimberg, Charbel Farhat, Noah Youkilis(参考訳) 流体力学問題に対する射影型非線形モデル秩序の減少に関する文献において、射影型縮退モデル(PROM)は乱流エネルギーカスケードの散逸状態を解決せず、したがって数値的に不安定であると主張することが多い。 この主張に対処する努力は、切断モードの効果をモデル化しようとする試みから、切断された現象を説明するために近似の古典部分空間を豊かにすることまで及んだ。 本論文はこの主張に異議を唱える。 予測に基づくモデル次数削減と半離散化の関係を考察し、3つの関連する流れ問題からの数値的証拠を用いて、乱れや対流支配乱流問題に対するプロムの数値的不安定性が報告されていることのほとんどがガレルキンフレームワークであると主張する。 また,petrov-galerkinフレームワークを用いて,閉包モデルや近似部分空間の調整に頼らずに,対流支配層流の数値的安定なプロムと,数値的に安定で精度の高い乱流問題を構築することができることを示した。 また、このような代替PROMが大きなスピードアップ要因をもたらすことも示している。

In the literature on projection-based nonlinear model order reduction for fluid dynamics problems, it is often claimed that due to modal truncation, a projection-based reduced-order model (PROM) does not resolve the dissipative regime of the turbulent energy cascade and therefore is numerically unstable. Efforts at addressing this claim have ranged from attempting to model the effects of the truncated modes to enriching the classical subspace of approximation in order to account for the truncated phenomena. This paper challenges this claim. Exploring the relationship between projection-based model order reduction and semi-discretization and using numerical evidence from three relevant flow problems, it argues in an orderly manner that the real culprit behind most if not all reported numerical instabilities of PROMs for turbulence and convection-dominated turbulent flow problems is the Galerkin framework that has been used for constructing the PROMs. The paper also shows that alternatively, a Petrov-Galerkin framework can be used to construct numerically stable PROMs for convection-dominated laminar as well as turbulent flow problems that are numerically stable and accurate, without resorting to additional closure models or tailoring of the subspace of approximation. It also shows that such alternative PROMs deliver significant speedup factors.
翻訳日:2023-01-06 08:40:00 公開日:2020-01-27
# 能動学習型粗粒分子シミュレーションによる$\pi$共役ペプチドの自己集合の発見

Discovery of Self-Assembling $\pi$-Conjugated Peptides by Active Learning-Directed Coarse-Grained Molecular Simulation ( http://arxiv.org/abs/2002.01563v1 )

ライセンス: Link先を確認
Kirill Shmilovich, Rachael A. Mansbach, Hythem Sidky, Olivia E. Dunne, Sayak Subhra Panda, John D. Tovar, Andrew L. Ferguson(参考訳) 電子活性有機分子は、エネルギーの収穫と輸送のための新しい軟質物質として大きな期待を寄せている。 オリゴペプチド翼の側面に芳香族コアからなる$\pi$共役オリゴペプチドからなる自己組織化ナノアグリゲーションは、水溶性および生体適合性のある基質内で創発的な光電子特性を提供する。 ナノアグリゲート特性は, コア化学およびペプチド組成の調整によって制御できるが, 配列構造と機能の関係はよく分かっていない。 本研究では,電子的に活性な$\pi$-coresをうまく積み重ねた擬似1Dナノアグリゲートを組み立てることのできる分子を効率よく同定するために,深層表現学習とベイズ最適化を用いた能動学習プロトコル内の粗粒度分子動力学シミュレーションを用いる。 我々はDXXX-OPV3-XXXDオリゴペプチドファミリーを、DがAsp残基であり、OPV3がオリゴフェニルエンビニレンオリゴマー(1,4-distyrylbenzene)であり、20$^3$ = 8,000の可能な全配列で最も優れたXXXトリペプチドを同定する。 この空間のわずか2.3%の直接シミュレーションにより、先行研究で報告されたものよりも優れた集合を示すと予測された分子を同定した。 上位候補のスペクトルクラスタリングは、アセンブリを管理する新しい設計規則を明らかにする。 この研究は、DXXX-OPV3-XXXDアセンブリの新たな理解を確立し、実験のための新しい候補を特定し、他のペプチド系およびペプチド様システムに汎用的に拡張可能な計算設計プラットフォームを提供する。

Electronically-active organic molecules have demonstrated great promise as novel soft materials for energy harvesting and transport. Self-assembled nanoaggregates formed from $\pi$-conjugated oligopeptides composed of an aromatic core flanked by oligopeptide wings offer emergent optoelectronic properties within a water soluble and biocompatible substrate. Nanoaggregate properties can be controlled by tuning core chemistry and peptide composition, but the sequence-structure-function relations remain poorly characterized. In this work, we employ coarse-grained molecular dynamics simulations within an active learning protocol employing deep representational learning and Bayesian optimization to efficiently identify molecules capable of assembling pseudo-1D nanoaggregates with good stacking of the electronically-active $\pi$-cores. We consider the DXXX-OPV3-XXXD oligopeptide family, where D is an Asp residue and OPV3 is an oligophenylene vinylene oligomer (1,4-distyrylbenzene), to identify the top performing XXX tripeptides within all 20$^3$ = 8,000 possible sequences. By direct simulation of only 2.3% of this space, we identify molecules predicted to exhibit superior assembly relative to those reported in prior work. Spectral clustering of the top candidates reveals new design rules governing assembly. This work establishes new understanding of DXXX-OPV3-XXXD assembly, identifies promising new candidates for experimental testing, and presents a computational design platform that can be generically extended to other peptide-based and peptide-like systems.
翻訳日:2023-01-06 08:39:33 公開日:2020-01-27
# 奥行きSTFTに基づく分離畳み込みニューラルネットワーク

Depthwise-STFT based separable Convolutional Neural Networks ( http://arxiv.org/abs/2001.09912v1 )

ライセンス: Link先を確認
Sudhakar Kumawat, Shanmuganathan Raman(参考訳) 本稿では,標準の奥行き方向分離可能な畳み込み層に代わるものとして機能する,奥行き方向分離層と呼ばれる新しい畳み込み層を提案する。 提案した層の構築は、フーリエ係数が画像のエッジなどの重要な特徴を正確に表現できるという事実に着想を得たものである。 入力マップの各位置の2次元局所近傍(例えば3x3)で計算されたフーリエ係数を利用して特徴写像を得る。 フーリエ係数は2次元短項フーリエ変換(STFT)を用いて各位置における2次元局所近傍の複数の固定低周波点で計算される。 異なる周波数点におけるこれらの特徴写像は、訓練可能な点(1x1)畳み込みを用いて線形に結合される。 提案する層は,cifar-10およびcifar-100画像分類データセット上の標準深度分離層ベースモデルよりも,時空間複雑性を低減した。

In this paper, we propose a new convolutional layer called Depthwise-STFT Separable layer that can serve as an alternative to the standard depthwise separable convolutional layer. The construction of the proposed layer is inspired by the fact that the Fourier coefficients can accurately represent important features such as edges in an image. It utilizes the Fourier coefficients computed (channelwise) in the 2D local neighborhood (e.g., 3x3) of each position of the input map to obtain the feature maps. The Fourier coefficients are computed using 2D Short Term Fourier Transform (STFT) at multiple fixed low frequency points in the 2D local neighborhood at each position. These feature maps at different frequency points are then linearly combined using trainable pointwise (1x1) convolutions. We show that the proposed layer outperforms the standard depthwise separable layer-based models on the CIFAR-10 and CIFAR-100 image classification datasets with reduced space-time complexity.
翻訳日:2023-01-06 08:35:33 公開日:2020-01-27
# safenet: 現場からの脅威を評価するための支援的ソリューション

SafeNet: An Assistive Solution to Assess Incoming Threats for Premises ( http://arxiv.org/abs/2002.04405v1 )

ライセンス: Link先を確認
Shahinur Alam, Md Sultan Mahmud, and Mohammed Yeasin(参考訳) 家庭への侵入の脅威(強盗、強盗、銃乱用など)を評価する補助的な解決策は、障害者や障害者の安全を高める。 本稿では,コンテキスト指向の画像記述を生成する統合支援システム「SafeNet」について述べる。 このシステムの重要な機能には、人間の検出と識別、家中の戦略的場所に置かれたカメラから得られたリアルタイムビデオストリームからの画像記述の生成が含まれる。 本稿では,画像記述を生成するために,SafeNetと呼ばれるロバストモデルの開発に注力する。 システムと対話するために、顔画像や友人や家族のビデオからパーソナライズされたプロフィールを作成するダイアログ対応インタフェースを実装した。 計算効率を向上させるために,動作のないフレームをフィルタし,Faster-RCNNを用いて人間の存在を検出し,MTCNN(Multitask Cascaded Convolutional Networks)を用いて顔を抽出する。 次に LBP/FaceNet を用いて人物を識別する。 safenetは、一致が見つかった場合、あるいは「未知」、シーン画像、顔の説明、文脈情報を含むmmsで、画像記述をユーザに送信する。 safenetは、友人/家族/介護者/侵入者/非知人/平均f-score 0.97を識別し、平均f-measure 0.97で10クラスから画像記述を生成する。

An assistive solution to assess incoming threats (e.g., robbery, burglary, gun violence) for homes will enhance the safety of the people with or without disabilities. This paper presents "SafeNet"- an integrated assistive system to generate context-oriented image descriptions to assess incoming threats. The key functionality of the system includes the detection and identification of human and generating image descriptions from the real-time video streams obtained from the cameras placed in strategic locations around the house. In this paper, we focus on developing a robust model called "SafeNet" to generate image descriptions. To interact with the system, we implemented a dialog enabled interface for creating a personalized profile from face images or videos of friends/families. To improve computational efficiency, we apply change detection to filter out frames that do not have any activity and use Faster-RCNN to detect the human presence and extract faces using Multitask Cascaded Convolutional Networks (MTCNN). Subsequently, we apply LBP/FaceNet to identify a person. SafeNet sends image descriptions to the users with an MMS containing a person's name if any match found or as "Unknown", scene image, facial description, and contextual information. SafeNet identifies friends/families/caregiver versus intruders/unknown with an average F-score 0.97 and generates image descriptions from 10 classes with an average F-measure 0.97.
翻訳日:2023-01-06 08:35:20 公開日:2020-01-27
# 音声イベント分類のためのオントロジー対応フレームワーク

An Ontology-Aware Framework for Audio Event Classification ( http://arxiv.org/abs/2001.10048v1 )

ライセンス: Link先を確認
Yiwei Sun and Shabnam Ghaffarzadegan(参考訳) 最近の音声イベント分類の進歩は、しばしば先行情報として利用可能なラベルクラスの構造と関係を無視している。 この構造はオントロジーによって定義でき、分類器でドメイン知識の形式として拡張することができる。 ラベル間の依存関係を捉えるために、フィードフォワードオントロジー層とグラフ畳み込みネットワーク(GCN)の2つのコンポーネントを含むオントロジー対応ニューラルネットワークを提案する。 フィードフォワードオントロジー層は、異なるレベルのオントロジーの間のラベルの依存性を捉える。 一方、gcnは主にオントロジーレベルでラベルの相互依存構造をモデル化している。 このフレームワークは、シングルラベルとマルチラベルオーディオイベント分類タスクのための2つのベンチマークデータセットで評価される。 提案手法は, オントロジー関係の捕捉と探索, 分類性能の向上に有効であることを示す。

Recent advancements in audio event classification often ignore the structure and relation between the label classes available as prior information. This structure can be defined by ontology and augmented in the classifier as a form of domain knowledge. To capture such dependencies between the labels, we propose an ontology-aware neural network containing two components: feed-forward ontology layers and graph convolutional networks (GCN). The feed-forward ontology layers capture the intra-dependencies of labels between different levels of ontology. On the other hand, GCN mainly models inter-dependency structure of labels within an ontology level. The framework is evaluated on two benchmark datasets for single-label and multi-label audio event classification tasks. The results demonstrate the proposed solutions efficacy to capture and explore the ontology relations and improve the classification performance.
翻訳日:2023-01-06 08:34:55 公開日:2020-01-27
# Isabelle/HOLのためのスマート誘導(システム記述)

Smart Induction for Isabelle/HOL (System Description) ( http://arxiv.org/abs/2001.10834v1 )

ライセンス: Link先を確認
Yutaka Nagashima(参考訳) 証明アシスタントは帰納的証明を促進する戦術を提供する。 しかし、誘導戦術にどの引数を渡すかを決めるには、まだ人間の創造性が必要である。 このプロセスを自動化するために,Isabelle/HOL の Smart_induct を提案する。 あらゆる問題領域における帰納的問題として、smart_inductは検索に頼らずに帰納的戦術の有望な引数をリストアップする。 評価の結果,Smart_inductは問題領域間で有用なレコメンデーションを提供することがわかった。

Proof assistants offer tactics to facilitate inductive proofs. However, it still requires human ingenuity to decide what arguments to pass to those induction tactics. To automate this process, we present smart_induct for Isabelle/HOL. Given an inductive problem in any problem domain, smart_induct lists promising arguments for the induct tactic without relying on a search. Our evaluation demonstrated smart_induct produces valuable recommendations across problem domains.
翻訳日:2023-01-06 08:34:28 公開日:2020-01-27
# 音楽グローブ楽器のための機械学習

Machine Learning for a Music Glove Instrument ( http://arxiv.org/abs/2001.09551v1 )

ライセンス: Link先を確認
Joseph Bakarji(参考訳) 感圧、フレキシブル、IMUセンサーを備えた音楽グローブ装置を電気ピアノで訓練し、一連のセンサ入力に基づいて音符シーケンスを学習する。 トレーニングが完了すると、手袋はどんな表面にも使われ、手の動きと最も密接に関連した音符列を生成する。 データは、グローブを着用して電気キーボードで演奏するパフォーマーによって手動で収集される。 特徴空間は、サムアンダー運動のようなキーハンドの動きを説明するように設計されている。 ベイズ的信念ネットワークと共にロジスティック回帰は、あるノートから別のノートへの遷移確率を学ぶために用いられる。 本研究は,デジタル楽器全般に対するデータ駆動アプローチを実証する。

A music glove instrument equipped with force sensitive, flex and IMU sensors is trained on an electric piano to learn note sequences based on a time series of sensor inputs. Once trained, the glove is used on any surface to generate the sequence of notes most closely related to the hand motion. The data is collected manually by a performer wearing the glove and playing on an electric keyboard. The feature space is designed to account for the key hand motion, such as the thumb-under movement. Logistic regression along with bayesian belief networks are used learn the transition probabilities from one note to another. This work demonstrates a data-driven approach for digital musical instruments in general.
翻訳日:2023-01-06 08:34:21 公開日:2020-01-27
# 超音波エントロピーマップと注意誘導U-Netに基づく乳房マスセグメンテーション

Breast mass segmentation based on ultrasonic entropy maps and attention gated U-Net ( http://arxiv.org/abs/2001.10061v1 )

ライセンス: Link先を確認
Michal Byra, Piotr Jarosik, Katarzyna Dobruch-Sobczak, Ziemowit Klimonda, Hanna Piotrzkowska-Wroblewska, Jerzy Litniewski, Andrzej Nowicki(参考訳) 超音波(US)画像における乳房質量分画に対する新しい深層学習手法を提案する。 米国の画像を用いた分割法と比較して,本手法は定量的エントロピーパラメトリックマップに基づいている。 U-Net畳み込みニューラルネットワークを用いて乳腺腫瘤の分画を行った。 アメリカの画像とエントロピーマップは、269個の乳房から収集された生の米国信号に基づいて作成された。 セグメンテーションネットワークは,us画像とエントロピーマップを用いて別々に開発され,81乳房群で評価された。 エントロピーマップに基づいてトレーニングされた注意u-netは平均サイコロスコア0.60(中間071)、us画像を用いたトレーニングモデルでは平均サイコロスコア0.53(中間0.59)を得た。 本研究は,乳房マスセグメンテーションにおけるusパラメトリックマップの定量化の可能性を示す。 その結果, 局所組織散乱特性に関する情報を提供するUSパラメトリックマップは, 通常のUS画像よりも乳房質量分離法の開発に適している可能性が示唆された。

We propose a novel deep learning based approach to breast mass segmentation in ultrasound (US) imaging. In comparison to commonly applied segmentation methods, which use US images, our approach is based on quantitative entropy parametric maps. To segment the breast masses we utilized an attention gated U-Net convolutional neural network. US images and entropy maps were generated based on raw US signals collected from 269 breast masses. The segmentation networks were developed separately using US image and entropy maps, and evaluated on a test set of 81 breast masses. The attention U-Net trained based on entropy maps achieved average Dice score of 0.60 (median 0.71), while for the model trained using US images we obtained average Dice score of 0.53 (median 0.59). Our work presents the feasibility of using quantitative US parametric maps for the breast mass segmentation. The obtained results suggest that US parametric maps, which provide the information about local tissue scattering properties, might be more suitable for the development of breast mass segmentation methods than regular US images.
翻訳日:2023-01-06 08:33:57 公開日:2020-01-27
# YouTubeがYouTubeを訴える? YouTube Thumbnails of Popular Videos を用いた文化分析

Mi YouTube es Su YouTube? Analyzing the Cultures using YouTube Thumbnails of Popular Videos ( http://arxiv.org/abs/2002.00842v1 )

ライセンス: Link先を確認
Songyang Zhang, Tolga Aktas, Jiebo Luo(参考訳) 世界的に有名なビデオ共有サイトであるyoutubeは、プラットフォーム上のトレンドビデオのトップリストを維持している。 大量のユーザーがいるため、研究者はトレンド動画を分析して人の好みを理解することができる。 トレンドビデオは国によって異なる。 このような差異や変更を分析することで、ユーザの好みが場所によってどのように異なるかが分かる。 これまでの研究では、ビデオのメタデータから文化の好みを分析することに重点を置いているが、視覚コンテンツに隠された文化情報は発見されていない。 本研究では,youtubeトレンドビデオのサムネイルを用いて,各国の文化嗜好を考察する。 まず,映像のサムネイル画像を物体検出器を用いて処理する。 収集されたオブジェクト情報は、様々な統計分析に使用される。 特に、地理的位置、動画ジャンル、ユーザーの反応の3つの視点からデータについて検討する。 実験の結果、類似文化のユーザーはYouTubeで同様のビデオを見ることに興味を持っていることがわかった。 本研究は,サムネイルを介した文化選好の発見が,ビデオソーシャルメディア分析に有効なメカニズムであることを示す。

YouTube, a world-famous video sharing website, maintains a list of the top trending videos on the platform. Due to its huge amount of users, it enables researchers to understand people's preference by analyzing the trending videos. Trending videos vary from country to country. By analyzing such differences and changes, we can tell how users' preferences differ over locations. Previous work focuses on analyzing such culture preferences from videos' metadata, while the culture information hidden within the visual content has not been discovered. In this study, we explore culture preferences among countries using the thumbnails of YouTube trending videos. We first process the thumbnail images of the videos using object detectors. The collected object information is then used for various statistical analysis. In particular, we examine the data from three perspectives: geographical locations, video genres and users' reactions. Experimental results indicate that the users from similar cultures shares interests in watching similar videos on YouTube. Our study demonstrates that discovering the culture preference through the thumbnails can be an effective mechanism for video social media analysis.
翻訳日:2023-01-06 08:33:37 公開日:2020-01-27
# 強化学習を用いた有限状態チャネルのフィードバック能力の計算

Computing the Feedback Capacity of Finite State Channels using Reinforcement Learning ( http://arxiv.org/abs/2001.09685v1 )

ライセンス: Link先を確認
Ziv Aharoni, Oron Sabag, Haim Henry Permuter(参考訳) 本稿では,強化学習(RL)を用いたメモリを用いたチャネルのフィードバック能力の計算手法を提案する。 RLでは、逐次的な意思決定環境で収集された累積報酬を最大化する。 これは、基盤となる環境のサンプルを収集し、最適な決定ルールを学ぶためにそれらを使用する。 このアプローチの主な利点は、高次元問題においてもその計算効率である。 したがって、RLは、大きなアルファベットサイズを持つユニフィラー有限状態チャネル(FSC)のフィードバック容量を数値的に推定することができる。 rlアルゴリズムの結果は、チャネルの最適入力分布である最適決定規則の性質に光を当てている。 これらの洞察は、対応する下限と上限を解いて、分析的かつ単一レターのキャパシティ表現に変換することができる。 3進アルファベットで有名なIsingチャネルのフィードバック容量を解析的に解くことで,本手法の有効性を実証する。 また、フィードバック能力を達成するための簡単なコーディングスキームも提供します。

In this paper, we propose a novel method to compute the feedback capacity of channels with memory using reinforcement learning (RL). In RL, one seeks to maximize cumulative rewards collected in a sequential decision-making environment. This is done by collecting samples of the underlying environment and using them to learn the optimal decision rule. The main advantage of this approach is its computational efficiency, even in high dimensional problems. Hence, RL can be used to estimate numerically the feedback capacity of unifilar finite state channels (FSCs) with large alphabet size. The outcome of the RL algorithm sheds light on the properties of the optimal decision rule, which in our case, is the optimal input distribution of the channel. These insights can be converted into analytic, single-letter capacity expressions by solving corresponding lower and upper bounds. We demonstrate the efficiency of this method by analytically solving the feedback capacity of the well-known Ising channel with a ternary alphabet. We also provide a simple coding scheme that achieves the feedback capacity.
翻訳日:2023-01-06 08:33:22 公開日:2020-01-27
# DRMIME:マルチ解像度画像登録のための識別可能な相互情報と行列指数

DRMIME: Differentiable Mutual Information and Matrix Exponential for Multi-Resolution Image Registration ( http://arxiv.org/abs/2001.09865v1 )

ライセンス: Link先を確認
Abhishek Nan, Matthew Tennant, Uriel Rubin and Nilanjan Ray(参考訳) 本研究では,新しい教師なし画像登録アルゴリズムを提案する。 エンドツーエンドで識別可能で、マルチモーダルとモノモーダルの両方に使用することができる。 これは相互情報(MI)を計量として行う。 ここでの新規性は、従来のMIの近似法ではなく、MINEと呼ばれる神経推定器を用いて変換行列計算のために行列指数で補うことである。 これにより、最先端の画像登録ツールボックスで使える標準アルゴリズムと比較して、結果が改善される。

In this work, we present a novel unsupervised image registration algorithm. It is differentiable end-to-end and can be used for both multi-modal and mono-modal registration. This is done using mutual information (MI) as a metric. The novelty here is that rather than using traditional ways of approximating MI, we use a neural estimator called MINE and supplement it with matrix exponential for transformation matrix computation. This leads to improved results as compared to the standard algorithms available out-of-the-box in state-of-the-art image registration toolboxes.
翻訳日:2023-01-06 08:26:17 公開日:2020-01-27
# 航空画像のオープンセットセマンティクスセグメンテーションに向けて

Towards Open-Set Semantic Segmentation of Aerial Images ( http://arxiv.org/abs/2001.10063v1 )

ライセンス: Link先を確認
Caio C. V. da Silva, Keiller Nogueira, Hugo N. Oliveira, Jefersson A. dos Santos(参考訳) 古典的なコンピュータビジョンの手法は可視スペクトル画像に最適化されており、スマートフォンやカメラから取得したグレースケールやrgb色空間で符号化される。 リモートセンシングフィールドで利用される画像のより珍しい源は、衛星画像と空中画像である。 しかし、これらのデータに対するパターン認識手法の開発は、主にこの種の画像が限られており、近年まで軍事目的にのみ使用されていたため、比較的最近のものである。 スペクトル情報を含む航空画像へのアクセスは、主にドローンの低コスト、画像衛星打ち上げコストの安価化、そして新しい公共データセットによって増加している。 通常、リモートセンシングアプリケーションは、閉集合シナリオの分類タスクを厳密にモデル化したコンピュータビジョン技術を用いる。 しかし、実際のタスクがクローズドセットのコンテキストに当てはまることは滅多になく、未知のクラスをしばしば提示し、それらをオープンセットのシナリオとして特徴づける。 本稿では,この課題に着目し,リモートセンシング画像に適用するオープンセットシナリオのための意味セグメンテーション手法を初めて研究し,開発する。 本論文の主な貢献は次のとおりである。 1) オープンセットのセマンティックセグメンテーションにおける関連研究の議論は,これらの技術がオープンセットのリモートセンシングタスクに適応できることを示すものである。 2)オープンセット意味セグメンテーションのための新しい手法の開発と評価。 提案手法は,同じデータセットのクローズド・セット・メソッドと比較して,競合する結果を得た。

Classical and more recently deep computer vision methods are optimized for visible spectrum images, commonly encoded in grayscale or RGB colorspaces acquired from smartphones or cameras. A more uncommon source of images exploited in the remote sensing field are satellite and aerial images. However, the development of pattern recognition approaches for these data is relatively recent, mainly due to the limited availability of this type of images, as until recently they were used exclusively for military purposes. Access to aerial imagery, including spectral information, has been increasing mainly due to the low cost of drones, cheapening of imaging satellite launch costs, and novel public datasets. Usually remote sensing applications employ computer vision techniques strictly modeled for classification tasks in closed set scenarios. However, real-world tasks rarely fit into closed set contexts, frequently presenting previously unknown classes, characterizing them as open set scenarios. Focusing on this problem, this is the first paper to study and develop semantic segmentation techniques for open set scenarios applied to remote sensing images. The main contributions of this paper are: 1) a discussion of related works in open set semantic segmentation, showing evidence that these techniques can be adapted for open set remote sensing tasks; 2) the development and evaluation of a novel approach for open set semantic segmentation. Our method yielded competitive results when compared to closed set methods for the same dataset.
翻訳日:2023-01-06 08:26:09 公開日:2020-01-27
# セマンティックセグメンテーションによる印刷欠陥マッピング

Print Defect Mapping with Semantic Segmentation ( http://arxiv.org/abs/2001.10111v1 )

ライセンス: Link先を確認
Augusto C. Valente, Cristina Wada, Deangela Neves, Deangeli Neves, F\'abio V. M. Perez, Guilherme A. S. Megeto, Marcos H. Cascone, Otavio Gomes, Qian Lin(参考訳) 自動印刷欠陥マッピングの効率性は印刷業界にとって有益であり,このような欠陥が消費者の知覚する印刷品質に直接影響し,手動でマッピングすることはコスト非効率である。 従来の手法は複雑で手作りの特徴工学技術で構成されており、通常は1種類の欠陥だけを対象としている。 本稿では,意味セグメンテーションに基づくアプローチを採用し,印刷欠陥をピクセルレベルでマップする最初のエンドツーエンドフレームワークを提案する。 我々のフレームワークは畳み込みニューラルネットワーク、特にDeepLab-v3+を使用し、印刷画像の欠陥を識別する有望な結果を得る。 2種類の印刷欠陥と印刷スキャン効果を画像処理とコンピュータグラフィックス技術を用いてシミュレーションし,合成学習データを用いる。 従来の手法と比較して,我々のフレームワークは2つの推論戦略が可能である。一方はリアルタイムに近づき,粗い結果が得られ,他方はよりきめ細かな検出によるオフライン処理に重点を置いている。 本モデルは,実画像のデータセット上で評価される。

Efficient automated print defect mapping is valuable to the printing industry since such defects directly influence customer-perceived printer quality and manually mapping them is cost-ineffective. Conventional methods consist of complicated and hand-crafted feature engineering techniques, usually targeting only one type of defect. In this paper, we propose the first end-to-end framework to map print defects at pixel level, adopting an approach based on semantic segmentation. Our framework uses Convolutional Neural Networks, specifically DeepLab-v3+, and achieves promising results in the identification of defects in printed images. We use synthetic training data by simulating two types of print defects and a print-scan effect with image processing and computer graphic techniques. Compared with conventional methods, our framework is versatile, allowing two inference strategies, one being near real-time and providing coarser results, and the other focusing on offline processing with more fine-grained detection. Our model is evaluated on a dataset of real printed images.
翻訳日:2023-01-06 08:25:13 公開日:2020-01-27
# semclinbr --ポルトガル臨床nlpタスクのための多施設・多専門的意味論的コーパス

SemClinBr -- a multi institutional and multi specialty semantically annotated corpus for Portuguese clinical NLP tasks ( http://arxiv.org/abs/2001.10071v1 )

ライセンス: Link先を確認
Lucas Emanuel Silva e Oliveira, Ana Carolina Peters, Adalniza Moura Pucca da Silva, Caroline P. Gebeluca, Yohan Bonescki Gumiel, Lilian Mie Mukai Cintho, Deborah Ribeiro Carvalho, Sadid A. Hasan, Claudia Maria Cabral Moro(参考訳) 電子健康記録(ehr)から患者の情報を抽出することに焦点を当てた大量の研究が、自然言語処理(nlp)アルゴリズムの開発と評価の両方にとって非常に価値のあるリソースである注釈付きコーパス(annotated corpora)の需要の増加につながった。 英語圏外、特にブラジルポルトガル語の多目的臨床コーパスの欠如は、医学的nlp分野における科学的進歩に大きな影響を与えている。 本研究では,複数の専門分野,文書タイプ,機関の臨床テキストを用いた意味的注釈付きコーパスを開発した。 1) 先行研究から得られた共通的な側面と教訓を列挙した調査, (2) 他のアノテーションイニシアチブを再現しガイドできる細粒度アノテーションスキーマ, (3) アノテーション提案機能に着目したwebベースのアノテーションツール,(4) アノテーションの内在的評価と外在的評価について述べる。 この研究の結果、SemClinBrは1000の臨床ノートを持ち、65,117のエンティティと11,263の関連がラベル付けられ、様々な臨床NLPタスクをサポートし、ポルトガル語に対するEHRの二次的使用を促進することができる。

The high volume of research focusing on extracting patient's information from electronic health records (EHR) has led to an increase in the demand for annotated corpora, which are a very valuable resource for both the development and evaluation of natural language processing (NLP) algorithms. The absence of a multi-purpose clinical corpus outside the scope of the English language, especially in Brazilian Portuguese, is glaring and severely impacts scientific progress in the biomedical NLP field. In this study, we developed a semantically annotated corpus using clinical texts from multiple medical specialties, document types, and institutions. We present the following: (1) a survey listing common aspects and lessons learned from previous research, (2) a fine-grained annotation schema which could be replicated and guide other annotation initiatives, (3) a web-based annotation tool focusing on an annotation suggestion feature, and (4) both intrinsic and extrinsic evaluation of the annotations. The result of this work is the SemClinBr, a corpus that has 1,000 clinical notes, labeled with 65,117 entities and 11,263 relations, and can support a variety of clinical NLP tasks and boost the EHR's secondary use for the Portuguese language.
翻訳日:2023-01-06 08:24:39 公開日:2020-01-27
# 軍用航空機の長期飛行計画と保守運用

Long term planning of military aircraft flight and maintenance operations ( http://arxiv.org/abs/2001.09856v1 )

ライセンス: Link先を確認
Franco Peschiera, Olga Batta\"ia, Alain Ha\"it, Nicolas Dupin(参考訳) 本報告では,fmp(flight and maintenance planning)問題を軍用機に導入し,長期計画に適用する。 この問題はこれまで、短期的および中期的な地平線についてのみ研究されてきた。 私たちは、その類似性と相違点を以前の仕事と比較し、複雑さを証明する。 私たちはフランス空軍の艦隊に触発されたシナリオを作ります。 これらのシナリオの問題を解くために、正確な混合整数プログラミング(MIP)モデルを定式化し、これらの状況下での解法の性能を解析する。 高速で実現可能なソリューションを生成するためにヒューリスティックが構築され、いくつかのケースではモデルを温めるのに役立つことが示されている。

We present the Flight and Maintenance Planning (FMP) problem in its military variant and applied to long term planning. The problem has been previously studied for short- and medium-term horizons only. We compare its similarities and differences with previous work and prove its complexity. We generate scenarios inspired by the French Air Force fleet. We formulate an exact Mixed Integer Programming (MIP) model to solve the problem in these scenarios and we analyse the performance of the solving method under these circumstances. A heuristic was built to generate fast feasible solutions, that in some cases were shown to help warm-start the model.
翻訳日:2023-01-06 08:24:17 公開日:2020-01-27
# データサイエンスにおける10の研究課題

Ten Research Challenge Areas in Data Science ( http://arxiv.org/abs/2002.05658v1 )

ライセンス: Link先を確認
Jeannette M. Wing(参考訳) データ科学は、コンピュータ科学、数学、統計学、その他の分野の知識に基づいて構築されているが、データ科学は多くの謎を持ち、解き放つ独特な分野である。 この記事では、データサイエンスを専門分野とするメタ質問から始まり、データサイエンス研究の議題に基づいて10のアイデアを詳述します。

Although data science builds on knowledge from computer science, mathematics, statistics, and other disciplines, data science is a unique field with many mysteries to unlock: challenging scientific questions and pressing questions of societal importance. This article starts with meta-questions about data science as a discipline and then elaborates on ten ideas for the basis of a research agenda for data science.
翻訳日:2023-01-06 08:24:06 公開日:2020-01-27
# ConvNetsを用いたオンライン音声認識のスケールアップ

Scaling Up Online Speech Recognition Using ConvNets ( http://arxiv.org/abs/2001.09727v1 )

ライセンス: Link先を確認
Vineel Pratap, Qiantong Xu, Jacob Kahn, Gilad Avidov, Tatiana Likhomanenko, Awni Hannun, Vitaliy Liptchinsky, Gabriel Synnaeve, Ronan Collobert(参考訳) 我々はTDS(Time-Depth Separable)畳み込みとCTC(Connectionist Temporal Classification)に基づくオンラインエンドツーエンド音声認識システムの設計を行う。 我々は,将来的なコンテキストを制限し,精度を維持しながらレイテンシを低減するため,コアTDSアーキテクチャを改善した。 このシステムは、よく調整されたハイブリッドASRベースラインの3倍のスループットを持ち、レイテンシも低く、単語エラー率も優れている。 また、認識器の効率性には、高度に最適化されたビーム探索デコーダも重要です。 設計選択の影響を示すために、スループット、レイテンシ、正確性を分析し、ユーザ要求に基づいてこれらのメトリクスをどのように調整できるかを議論します。

We design an online end-to-end speech recognition system based on Time-Depth Separable (TDS) convolutions and Connectionist Temporal Classification (CTC). We improve the core TDS architecture in order to limit the future context and hence reduce latency while maintaining accuracy. The system has almost three times the throughput of a well tuned hybrid ASR baseline while also having lower latency and a better word error rate. Also important to the efficiency of the recognizer is our highly optimized beam search decoder. To show the impact of our design choices, we analyze throughput, latency, accuracy, and discuss how these metrics can be tuned based on the user requirements.
翻訳日:2023-01-06 08:23:58 公開日:2020-01-27
# 補助集合生成と共展開によるコーパスベース集合展開の誘導

Guiding Corpus-based Set Expansion by Auxiliary Sets Generation and Co-Expansion ( http://arxiv.org/abs/2001.10106v1 )

ライセンス: Link先を確認
Jiaxin Huang, Yiqing Xie, Yu Meng, Jiaming Shen, Yunyi Zhang and Jiawei Han(参考訳) シードエンティティの小さなセット(例: `usa'', ``russia'')が与えられると、コーパスベースのセット拡張は、与えられたコーパスから同じ意味クラス(この例ではカントリー)を共有する広範なエンティティセットを誘導する。 セット拡張は、Web検索、分類学の構築、クエリ提案など、知識発見における幅広いダウンストリームアプリケーションに恩恵をもたらす。 既存のコーパスベースのセット展開アルゴリズムは、通常、語彙パターンと分布類似性を組み込むことで、与えられた種子をブートストラップする。 しかし、負集合が明示的に提供されていないため、これらの方法は誘導なしで種子集合を自由に広げることによる意味的ドリフトに苦しむ。 本稿では,ユーザの関心のターゲットセットと密接な関係を持つ負の集合として補助集合を自動生成する新しいフレームワーク,Set-CoExpanを提案し,その上で,対象集合と補助集合を比較して識別的特徴を抽出し,互いに異なる複数の結合集合を形成し,意味的ドリフト問題を解消する。 本稿では, 補助集合を生成することにより, 補助集合との境界付近の曖昧な領域に触れることを避けるために, 目標集合の拡張過程を導出することができることを示す。

Given a small set of seed entities (e.g., ``USA'', ``Russia''), corpus-based set expansion is to induce an extensive set of entities which share the same semantic class (Country in this example) from a given corpus. Set expansion benefits a wide range of downstream applications in knowledge discovery, such as web search, taxonomy construction, and query suggestion. Existing corpus-based set expansion algorithms typically bootstrap the given seeds by incorporating lexical patterns and distributional similarity. However, due to no negative sets provided explicitly, these methods suffer from semantic drift caused by expanding the seed set freely without guidance. We propose a new framework, Set-CoExpan, that automatically generates auxiliary sets as negative sets that are closely related to the target set of user's interest, and then performs multiple sets co-expansion that extracts discriminative features by comparing target set with auxiliary sets, to form multiple cohesive sets that are distinctive from one another, thus resolving the semantic drift issue. In this paper we demonstrate that by generating auxiliary sets, we can guide the expansion process of target set to avoid touching those ambiguous areas around the border with auxiliary sets, and we show that Set-CoExpan outperforms strong baseline methods significantly.
翻訳日:2023-01-06 08:18:05 公開日:2020-01-27
# 生体・人工神経ネットワークにおける刺激回避による自己境界の組織化

Neural Autopoiesis: Organizing Self-Boundary by Stimulus Avoidance in Biological and Artificial Neural Networks ( http://arxiv.org/abs/2001.09641v1 )

ライセンス: Link先を確認
Atsushi Masumori, Lana Sinapayen, Norihiro Maruyama, Takeshi Mita, Douglas Bakkum, Urs Frey, Hirokazu Takahashi, and Takashi Ikegami(参考訳) 生物は生き続けるために積極的に維持しなければならない。 オートポエシス(autopoiesis)は生物の研究において重要な概念であり、生体の境界は系自体によって動的に制御された静的ではない。 自己境界の自律的制御を研究するために,生物的および人工的なニューラルネットワークを用いて,環境変化に対する神経ホメオダイナミック応答に着目した。 以前の研究では、スパイクタイティング依存可塑性(stdp)を持つ培養ニューラルネットワークとスパイクニューラルネットワークが、外部からの刺激を避けるために行動を学ぶことが示されている。 本稿では,体外培養ニューロンを用いた実験の結果,ネットワークが刺激を回避できる第2の特質があることが判明した。外部刺激を回避できない行動が得られない場合,制御不能入力を無視するかのように刺激誘発スパイクを減少させる傾向がある。 また,そのような行動は非対称なstdpを持つスパイクニューラルネットワークによって再現されることを示した。 制御不能ニューロンを自己とみなし,制御不能ニューロンを非自己とみなすネットワークにおいて,これらの特性は自己と非自己の自律的規制とみなされると考えられる。 最後に,刺激回避の原理を提唱し,神経オートポエシスを導入する。

Living organisms must actively maintain themselves in order to continue existing. Autopoiesis is a key concept in the study of living organisms, where the boundaries of the organism is not static by dynamically regulated by the system itself. To study the autonomous regulation of self-boundary, we focus on neural homeodynamic responses to environmental changes using both biological and artificial neural networks. Previous studies showed that embodied cultured neural networks and spiking neural networks with spike-timing dependent plasticity (STDP) learn an action as they avoid stimulation from outside. In this paper, as a result of our experiments using embodied cultured neurons, we find that there is also a second property allowing the network to avoid stimulation: if the agent cannot learn an action to avoid the external stimuli, it tends to decrease the stimulus-evoked spikes, as if to ignore the uncontrollable-input. We also show such a behavior is reproduced by spiking neural networks with asymmetric STDP. We consider that these properties are regarded as autonomous regulation of self and non-self for the network, in which a controllable-neuron is regarded as self, and an uncontrollable-neuron is regarded as non-self. Finally, we introduce neural autopoiesis by proposing the principle of stimulus avoidance.
翻訳日:2023-01-06 08:17:42 公開日:2020-01-27
# 選好学習者に対する時間論理式の適応的指導

Adaptive Teaching of Temporal Logic Formulas to Learners with Preferences ( http://arxiv.org/abs/2001.09956v1 )

ライセンス: Link先を確認
Zhe Xu, Yuxin Chen and Ufuk Topcu(参考訳) 機械教育(英: Machine teaching)は、一連の例や実演を通して対象仮説を教えるアルゴリズムフレームワークである。 時間関連タスク仕様に対応可能な新しい表現型仮説クラスである時間論理式に対する機械教育について検討する。 時相論理式を教える文脈において、ミオピック解に対する排他的探索は(タスクの時間スパンに関して)指数関数的な時間を要する。 パラメトリック線形時間論理式を効率的に教える手法を提案する。 具体的には、仮説の集合を排除するために、デモの最小時間長に必要な条件を導出する。 この条件を利用して,整数計画問題の系列を解き明快な指導アルゴリズムを提案する。 さらに,2つの概念により,提案アルゴリズムがほぼ最適性能を持つことを示す。 その結果, 好みに基づくバージョン空間学習者に対して, 前回の結果を厳密に一般化した。 アルゴリズムを様々な学習者タイプ(例えば、異なる選好モデルを持つ学習者)と対話型プロトコル(例えば、バッチ型および適応型)で広範囲に評価した。 その結果,提案アルゴリズムは,学習者の現在の仮説に適応した場合や,オラクルを用いた場合の教育効果が著しく向上することが示唆された。

Machine teaching is an algorithmic framework for teaching a target hypothesis via a sequence of examples or demonstrations. We investigate machine teaching for temporal logic formulas -- a novel and expressive hypothesis class amenable to time-related task specifications. In the context of teaching temporal logic formulas, an exhaustive search even for a myopic solution takes exponential time (with respect to the time span of the task). We propose an efficient approach for teaching parametric linear temporal logic formulas. Concretely, we derive a necessary condition for the minimal time length of a demonstration to eliminate a set of hypotheses. Utilizing this condition, we propose a myopic teaching algorithm by solving a sequence of integer programming problems. We further show that, under two notions of teaching complexity, the proposed algorithm has near-optimal performance. The results strictly generalize the previous results on teaching preference-based version space learners. We evaluate our algorithm extensively under a variety of learner types (i.e., learners with different preference models) and interactive protocols (e.g., batched and adaptive). The results show that the proposed algorithms can efficiently teach a given target temporal logic formula under various settings, and that there are significant gains of teaching efficacy when the teacher adapts to the learner's current hypotheses or uses oracles.
翻訳日:2023-01-06 08:17:20 公開日:2020-01-27
# 出力符号化による群集シーン解析

Crowd Scene Analysis by Output Encoding ( http://arxiv.org/abs/2001.09556v1 )

ライセンス: Link先を確認
Yao Xue, Siming Liu, Yonghui Li, Xueming Qian(参考訳) 群衆シーン分析はその幅広い応用によって注目を集めている。 混雑したシーンの高リスク領域を空間的に特定するためには、正確な群集位置(単に群集数ではなく)を把握することが重要である。 本稿では,小物体の画素座標の検出を信号空間のエンコーディングにおける信号回帰タスクにキャストする,圧縮センシングに基づく出力符号化(csoe)方式を提案する。 CSOEは、大規模な変動なしにターゲットが非常に混雑している状況において、ローカライズ性能を向上させるのに役立つ。 また,人体サイズの変化による群集分析には,適切な受容野の大きさが不可欠である。 画像中のオブジェクトサイズが劇的に変化するときのローカライズ精度を向上させるために、異なる受容フィールドサイズのセットを提供するMDCB(Multiple Dilated Convolution Branchs)を作成する。 また,適切な受容場サイズを有する情報チャネルを適応的に強調することで,スケール変動問題をさらに扱う適応受容場重み付け(arfw)モジュールを開発した。 提案手法の有効性を示す実験により,本手法は4つの主流データセットにまたがって最先端の性能を実現することができる。 さらに, 集団分析作業におけるターゲットサイズ変化問題に対処することが重要であり, 符号化信号空間の回帰として, 群集の局所化をキャストすることは, 群集解析に極めて効果的である。

Crowd scene analysis receives growing attention due to its wide applications. Grasping the accurate crowd location (rather than merely crowd count) is important for spatially identifying high-risk regions in congested scenes. In this paper, we propose a Compressed Sensing based Output Encoding (CSOE) scheme, which casts detecting pixel coordinates of small objects into a task of signal regression in encoding signal space. CSOE helps to boost localization performance in circumstances where targets are highly crowded without huge scale variation. In addition, proper receptive field sizes are crucial for crowd analysis due to human size variations. We create Multiple Dilated Convolution Branches (MDCB) that offers a set of different receptive field sizes, to improve localization accuracy when objects sizes change drastically in an image. Also, we develop an Adaptive Receptive Field Weighting (ARFW) module, which further deals with scale variation issue by adaptively emphasizing informative channels that have proper receptive field size. Experiments demonstrate the effectiveness of the proposed method, which achieves state-of-the-art performance across four mainstream datasets, especially achieves excellent results in highly crowded scenes. More importantly, experiments support our insights that it is crucial to tackle target size variation issue in crowd analysis task, and casting crowd localization as regression in encoding signal space is quite effective for crowd analysis.
翻訳日:2023-01-06 08:17:00 公開日:2020-01-27
# 遠隔センシングシーン分類のための畳み込みニューラルネットワークアーキテクチャ学習

Convolution Neural Network Architecture Learning for Remote Sensing Scene Classification ( http://arxiv.org/abs/2001.09614v1 )

ライセンス: Link先を確認
Jie Chen, Haozhe Huang, Jian Peng, Jiawei Zhu, Li Chen, Wenbo Li, Binyu Sun, Haifeng Li(参考訳) リモートセンシング画像のシーン分類は、リモートセンシング画像を理解するための基本的な課題であるが難しい課題である。 近年、深層学習に基づく手法、特に畳み込みニューラルネットワーク(CNN)に基づく手法は、リモートセンシング画像を理解する大きな可能性を示している。 cnnベースのメソッドは、手動で設計した機能ではなく、データから学んだ機能を利用することで、成功を収める。 CNNの特徴学習手順は主にCNNのアーキテクチャに依存する。 しかし、リモートセンシングシーン分類に使用されるCNNのアーキテクチャのほとんどは、かなりの量のアーキテクチャエンジニアリングスキルとドメイン知識を必要とする手作業で設計されており、特別なデータセットでCNNの最大のポテンシャルを発揮できない可能性がある。 本稿では,リモートセンシングシーン分類のための自動アーキテクチャ学習手法を提案する。 我々はパラメータ空間を設計し、パラメータの集合がcnnの特定のアーキテクチャを表す(つまり、いくつかのパラメータは、畳み込み、プーリング、接続または同一性なし、その他のパラメータはこれらの演算子の接続方法を表す)。 与えられたデータセットのパラメータの最適セットを発見するために,勾配降下によるアーキテクチャ空間の効率的な探索を可能にする学習戦略を導入した。 アーキテクチャジェネレータは最終的にパラメータのセットを実験で使用したcnnにマップします。

Remote sensing image scene classification is a fundamental but challenging task in understanding remote sensing images. Recently, deep learning-based methods, especially convolutional neural network-based (CNN-based) methods have shown enormous potential to understand remote sensing images. CNN-based methods meet with success by utilizing features learned from data rather than features designed manually. The feature-learning procedure of CNN largely depends on the architecture of CNN. However, most of the architectures of CNN used for remote sensing scene classification are still designed by hand which demands a considerable amount of architecture engineering skills and domain knowledge, and it may not play CNN's maximum potential on a special dataset. In this paper, we proposed an automatically architecture learning procedure for remote sensing scene classification. We designed a parameters space in which every set of parameters represents a certain architecture of CNN (i.e., some parameters represent the type of operators used in the architecture such as convolution, pooling, no connection or identity, and the others represent the way how these operators connect). To discover the optimal set of parameters for a given dataset, we introduced a learning strategy which can allow efficient search in the architecture space by means of gradient descent. An architecture generator finally maps the set of parameters into the CNN used in our experiments.
翻訳日:2023-01-06 08:16:36 公開日:2020-01-27
# Counter Visual Attributesによる説明と例

Explaining with Counter Visual Attributes and Examples ( http://arxiv.org/abs/2001.09671v1 )

ライセンス: Link先を確認
Sadaf Gulshad and Arnold Smeulders(参考訳) 本稿では,マルチモーダル情報を利用したニューラルネットワークの決定について説明する。 これは、摂動サンプルが導入されたときに現れる反直感的属性と対視的例である。 サリエンシマップやテキスト,あるいはビジュアルパッチを使って意思決定を解釈する以前の作業とは違って,属性や反属性,例や反例を視覚的説明の一部として使用することを提案する。 人間が視覚的な決定を説明するとき、属性や例を提供することでそうする傾向がある。 そこで本稿では,人間による説明の仕方に触発されて,属性ベースとサンプルベースの説明を提供する。 さらに、人間は、見えないものを説明するためにカウンター属性とカウンターサンプルを追加することで、視覚的な決定を説明する傾向がある。 例では、例をカウンタクラスに分類する際にどの属性値が変化するか観察するために有向摂動を導入する。 これは直感的な反属性と反例を提供する。 粗いデータセットと細かいデータセットの両方を用いた実験では、属性が識別可能で、人間に理解可能な直感的かつ直観的な説明を提供することが示された。

In this paper, we aim to explain the decisions of neural networks by utilizing multimodal information. That is counter-intuitive attributes and counter visual examples which appear when perturbed samples are introduced. Different from previous work on interpreting decisions using saliency maps, text, or visual patches we propose to use attributes and counter-attributes, and examples and counter-examples as part of the visual explanations. When humans explain visual decisions they tend to do so by providing attributes and examples. Hence, inspired by the way of human explanations in this paper we provide attribute-based and example-based explanations. Moreover, humans also tend to explain their visual decisions by adding counter-attributes and counter-examples to explain what is not seen. We introduce directed perturbations in the examples to observe which attribute values change when classifying the examples into the counter classes. This delivers intuitive counter-attributes and counter-examples. Our experiments with both coarse and fine-grained datasets show that attributes provide discriminating and human-understandable intuitive and counter-intuitive explanations.
翻訳日:2023-01-06 08:16:16 公開日:2020-01-27
# インテリジェント自動車用ロバストリアルタイムコンピューティング環境センシングシステム

A Robust Real-Time Computing-based Environment Sensing System for Intelligent Vehicle ( http://arxiv.org/abs/2001.09678v1 )

ライセンス: Link先を確認
Qiwei Xie, Qian Long, Liming Zhang, Zhao Sun(参考訳) インテリジェントな車では、3D環境を感知することが最初の重要なステップだ。 本論文では,低消費電力モバイルプラットフォームを用いたリアルタイム運転支援システムを構築する。 このシステムは、ステレオマッチングアルゴリズムと機械学習に基づく障害物検出アプローチを組み合わせた、リアルタイムのマルチスキーム統合イノベーションシステムであり、モバイルプラットフォームの分散コンピューティング技術とgpuとcpuを活用する。 まず,マルチスケール高速MPV(Multi-Path-Viterbi)ステレオマッチングアルゴリズムを提案する。 次に、単眼と双眼の融合技術に基づく機械学習を適用し、障害物を検出する。 また,zhangのキャリブレーション手法に基づく自動高速キャリブレーション機構も開発した。 最後に、分散コンピューティングと合理的なデータフロープログラミングを適用し、システムの運用効率を確実にする。 実験の結果,商用のリアルタイム駆動アプリケーションで直接使用可能なインテリジェント車両に対して,堅牢で正確なリアルタイム環境認識を実現することができることがわかった。

For intelligent vehicles, sensing the 3D environment is the first but crucial step. In this paper, we build a real-time advanced driver assistance system based on a low-power mobile platform. The system is a real-time multi-scheme integrated innovation system, which combines stereo matching algorithm with machine learning based obstacle detection approach and takes advantage of the distributed computing technology of a mobile platform with GPU and CPUs. First of all, a multi-scale fast MPV (Multi-Path-Viterbi) stereo matching algorithm is proposed, which can generate robust and accurate disparity map. Then a machine learning, which is based on fusion technology of monocular and binocular, is applied to detect the obstacles. We also advance an automatic fast calibration mechanism based on Zhang's calibration method. Finally, the distributed computing and reasonable data flow programming are applied to ensure the operational efficiency of the system. The experimental results show that the system can achieve robust and accurate real-time environment perception for intelligent vehicles, which can be directly used in the commercial real-time intelligent driving applications.
翻訳日:2023-01-06 08:15:58 公開日:2020-01-27
# 共同学習による画像デブラリングにおける雑音処理

Handling noise in image deblurring via joint learning ( http://arxiv.org/abs/2001.09730v1 )

ライセンス: Link先を確認
Si Miao, Yongxin Zhu(参考訳) 現在では、ぼやけた画像がノイズフリーであると仮定し、ノイズのあるぼやけた画像に対して不満足な処理を行うブラインドデブラリング手法が多数存在する。 残念ながら、実際のシーンではノイズが一般的です。 簡単な解決策は、画像がバラバラになる前にデノライゼーションすることだ。 しかし、最先端のデノイザーでさえ、完全にノイズを取り除くことは保証できない。 消音された画像のわずかな残留ノイズは、消泡段階において重要なアーティファクトを引き起こす可能性がある。 この問題に対処するために,denoiserサブネットワークとdebluringサブネットワークからなるカスケードフレームワークを提案する。 従来の方法とは対照的に,2つのサブネットワークを共同でトレーニングする。 共同学習は, 脱臭後の残音が脱臭に及ぼす影響を低減し, 重騒音に対する脱臭の堅牢性を向上させる。 さらに, この手法は, ぼやけたカーネル推定にも有効である。 CelebAデータセットとGOPROデータセットの実験結果から,本手法はいくつかの最先端手法に対して良好に動作することが示された。

Currently, many blind deblurring methods assume blurred images are noise-free and perform unsatisfactorily on the blurry images with noise. Unfortunately, noise is quite common in real scenes. A straightforward solution is to denoise images before deblurring them. However, even state-of-the-art denoisers cannot guarantee to remove noise entirely. Slight residual noise in the denoised images could cause significant artifacts in the deblurring stage. To tackle this problem, we propose a cascaded framework consisting of a denoiser subnetwork and a deblurring subnetwork. In contrast to previous methods, we train the two subnetworks jointly. Joint learning reduces the effect of the residual noise after denoising on deblurring, hence improves the robustness of deblurring to heavy noise. Moreover, our method is also helpful for blur kernel estimation. Experiments on the CelebA dataset and the GOPRO dataset show that our method performs favorably against several state-of-the-art methods.
翻訳日:2023-01-06 08:15:14 公開日:2020-01-27
# 生成型逆ネットワークを用いた画像適応前処理による医用画像再構成

Medical image reconstruction with image-adaptive priors learned by use of generative adversarial networks ( http://arxiv.org/abs/2001.10830v1 )

ライセンス: Link先を確認
Sayantan Bhadra, Weimin Zhou, and Mark A. Anastasio(参考訳) 医用画像再構成は一般的に逆問題である。 このような不正な問題に対処するために、対象物の性質の先行分布は、通常、いくつかのスパース性促進正規化によって取り込まれる。 近年,GAN(Generative Adversarial Network)を用いて推定した画像の事前分布は,これらの画像再構成問題を正規化する上で大きな可能性を示している。 本研究では,画像適応型GAN再構成法を用いて,不完全な医用画像データから高忠実度画像の再構成を行う。 IAGAN法は, 診断に関連があるものの, 従来のスポーシティ・プロモーティング・レギュラー化による再建では過度に再現される可能性があると考えられる。

Medical image reconstruction is typically an ill-posed inverse problem. In order to address such ill-posed problems, the prior distribution of the sought after object property is usually incorporated by means of some sparsity-promoting regularization. Recently, prior distributions for images estimated using generative adversarial networks (GANs) have shown great promise in regularizing some of these image reconstruction problems. In this work, we apply an image-adaptive GAN-based reconstruction method (IAGAN) to reconstruct high fidelity images from incomplete medical imaging data. It is observed that the IAGAN method can potentially recover fine structures in the object that are relevant for medical diagnosis but may be oversmoothed in reconstructions with traditional sparsity-promoting regularization.
翻訳日:2023-01-06 08:08:30 公開日:2020-01-27
# 全体は非剛性部分の総和よりも大きい

The Whole Is Greater Than the Sum of Its Nonrigid Parts ( http://arxiv.org/abs/2001.09650v1 )

ライセンス: Link先を確認
Oshri Halimi, Ido Imanuel, Or Litany, Giovanni Trappolini, Emanuele Rodol\`a, Leonidas Guibas, Ron Kimmel(参考訳) 古代ギリシアの哲学者アリストテレスによると、「全体はその部分の総和よりも大きい」という。 この観察は、20世紀のゲシュタルト心理学派による人間の知覚を説明するために採用された。 ここでは、以前に取得された対象の観察部分について、部分的マッチングと形状完備化の両方を包括的に扱うことができると主張している。 より具体的には、与えられたポーズにおける完全な明瞭な物体の幾何学と、異なるポーズにおける同じ物体の部分的なスキャンを考えると、我々はその部分的な観察から新しいポーズを同時に再構築しながら、部分的なポーズを全体とマッチングする問題に対処する。 私たちのアプローチはデータ駆動であり、推論時に一貫した頂点ラベリングを必要とせずに、siameseオートエンコーダの形式をとります。 本研究は, 合成データと実世界の幾何学データの両方において, 単視変形可能な形状完了と密接な形状対応の応用において, モデルの有効性を実証するものである。

According to Aristotle, a philosopher in Ancient Greece, "the whole is greater than the sum of its parts". This observation was adopted to explain human perception by the Gestalt psychology school of thought in the twentieth century. Here, we claim that observing part of an object which was previously acquired as a whole, one could deal with both partial matching and shape completion in a holistic manner. More specifically, given the geometry of a full, articulated object in a given pose, as well as a partial scan of the same object in a different pose, we address the problem of matching the part to the whole while simultaneously reconstructing the new pose from its partial observation. Our approach is data-driven, and takes the form of a Siamese autoencoder without the requirement of a consistent vertex labeling at inference time; as such, it can be used on unorganized point clouds as well as on triangle meshes. We demonstrate the practical effectiveness of our model in the applications of single-view deformable shape completion and dense shape correspondence, both on synthetic and real-world geometric data, where we outperform prior work on these tasks by a large margin.
翻訳日:2023-01-06 08:08:03 公開日:2020-01-27
# 表面実装技術の自己アライメント効果を考慮したパッシブチップ部品配置の最適化

Optimization of Passive Chip Components Placement with Self-Alignment Effect for Advanced Surface Mounting Technology ( http://arxiv.org/abs/2001.09612v1 )

ライセンス: Link先を確認
Irandokht Parviziomran, Shun Cao, Haeyong Yang, Seungbae Park, and Daehan Won(参考訳) 表面実装技術(SMT)は、電子部品を半田印刷回路基板(PCB)に直接配置し、再フローはんだ付け工程を目的としPCBに永久に取り付ける電子包装において強化された方法である。 リフロー過程の間、沈殿したはんだペーストが溶け始めると、電子部品は最高対称性を達成する方向に移動する。 この動きは、潜在的な不一致を是正できるため、自己調整として知られる。 本研究では, 支持ベクトル回帰 (SVR) とランダムフォレスト回帰 (RFR) を含む2つの機械学習アルゴリズムを提案し, 1) 部品の自己配向, 半田ペースト状態, 配置加工パラメータの関係を診断し, 2) 再フロープロセスに入る前のPCB上の最終成分位置をx, y, 回転方向で予測する。 予測結果に基づいて,初期配置パラメータを最適化する非線形最適化モデル(NLP)を開発した。 その結果、RFRは適合度と誤差の予測モデルにおいて優れる。 理想位置(つまりパッドの中心)からのリフロー後の成分位置から最小ユークリッド距離をモデルの境界について25.57({\mu}m)と概略した6つのサンプルに対して最適化モデルを実行する。

Surface mount technology (SMT) is an enhanced method in electronic packaging in which electronic components are placed directly on soldered printing circuit board (PCB) and are permanently attached on PCB with the aim of reflow soldering process. During reflow process, once deposited solder pastes start melting, electronic components move in a direction that achieve their highest symmetry. This motion is known as self-alignment since can correct potential mounting misalignment. In this study, two noticeable machine learning algorithms, including support vector regression (SVR) and random forest regression (RFR) are proposed as a prediction technique to (1) diagnose the relation among component self-alignment, deposited solder paste status and placement machining parameters, (2) predict the final component position on PCB in x, y, and rotational directions before entering in the reflow process. Based on the prediction result, a non-linear optimization model (NLP) is developed to optimize placement parameters at initial stage. Resultantly, RFR outperforms in terms of prediction model fitness and error. The optimization model is run for 6 samples in which the minimum Euclidean distance from component position after reflow process from ideal position (i.e., the center of pads) is outlined as 25.57 ({\mu}m) regarding defined boundaries in model.
翻訳日:2023-01-06 08:07:43 公開日:2020-01-27
# 表面実装技術におけるリフロー過程における成分シフトのデータ駆動予測モデル

Data-Driven Prediction Model of Components Shift during Reflow Process in Surface Mount Technology ( http://arxiv.org/abs/2001.09619v1 )

ライセンス: Link先を確認
Irandokht Parviziomran, Shun Cao, Krishnaswami Srihari, and Daehan Won(参考訳) 表面実装技術 (SMT) では, ハンダパッドに装着した部品は再流時に移動する。 この機能は自己調整として知られ、溶融はんだペーストの流体力学的挙動の結果である。 この能力は、SMTでは不正確な自己アライメントがオーバーハング、墓石の加工などの欠陥を引き起こすため、他方では、コンポーネントを欲求位置またはその近傍で完全に自己アライメントすることができる。 本研究の目的は、x方向とy方向のリフロー中のコンポーネントの動きと回転を予測できる機械学習モデルを開発することである。 本研究は,(1)自己調整と成分幾何,パッド形状等を含む各種要因との関係を明らかにするために,(1)実験データを用いて,(2)支援ベクトル回帰(svr),ニューラルネットワーク(nn),およびランダムフォレスト回帰(rfr)を用いて,成分移動の距離と方向を予測するための高度な機械学習予測モデルを適用した。 その結果、RFRは、平均適合度99%、99%、96%、平均予測誤差13.47(um)、12.02(um)、および1.52(deg.)で、それぞれx、y、回転方向の成分シフトを予測できる。 この拡張は、最適配置位置を制御し、自己アライメントに起因する本質的な欠陥を最小限に抑えるためのピック・アンド・プレースメント・マシンにおけるパラメータの最適化の将来の能力を提供する。

In surface mount technology (SMT), mounted components on soldered pads are subject to move during reflow process. This capability is known as self-alignment and is the result of fluid dynamic behaviour of molten solder paste. This capability is critical in SMT because inaccurate self-alignment causes defects such as overhanging, tombstoning, etc. while on the other side, it can enable components to be perfectly self-assembled on or near the desire position. The aim of this study is to develop a machine learning model that predicts the components movement during reflow in x and y-directions as well as rotation. Our study is composed of two steps: (1) experimental data are studied to reveal the relationships between self-alignment and various factors including component geometry, pad geometry, etc. (2) advanced machine learning prediction models are applied to predict the distance and the direction of components shift using support vector regression (SVR), neural network (NN), and random forest regression (RFR). As a result, RFR can predict components shift with the average fitness of 99%, 99%, and 96% and with average prediction error of 13.47 (um), 12.02 (um), and 1.52 (deg.) for component shift in x, y, and rotational directions, respectively. This enhancement provides the future capability of the parameters' optimization in the pick and placement machine to control the best placement location and minimize the intrinsic defects caused by the self-alignment.
翻訳日:2023-01-06 08:07:16 公開日:2020-01-27
# リー群上の変分最適化 : 主(一般化)固有値問題の例

Variational Optimization on Lie Groups, with Examples of Leading (Generalized) Eigenvalue Problems ( http://arxiv.org/abs/2001.10006v1 )

ライセンス: Link先を確認
Molei Tao, Tomoki Ohsawa(参考訳) この記事ではリー群上の関数の滑らかな最適化について考察する。 ベクトル空間におけるNAG変分原理(Wibisono et al., 2016)をリー群に一般化することにより、局所最適収束を保証する連続リー-NAGダイナミクスが得られる。 これらはリー群上の勾配流の運動量版に対応する。 特に$\mathsf{SO}(n)$ の場合には、先導的な一般化された固有値問題に対応する目的関数で詳細に研究される: Lie-NAG のダイナミクスは、まず座標で明示され、次に構造保存ファッションで離散化され、忠実なエネルギー挙動(共形シンプレクティック性による)を持つ最適化アルゴリズムがリー群に完全に残される。 確率勾配版も研究されている。 合成データと実用的問題 (LDA for MNIST) に関する数値実験により, 最適化アルゴリズムとして提案手法の有効性が示された(分類法としてではない)。

The article considers smooth optimization of functions on Lie groups. By generalizing NAG variational principle in vector space (Wibisono et al., 2016) to Lie groups, continuous Lie-NAG dynamics which are guaranteed to converge to local optimum are obtained. They correspond to momentum versions of gradient flow on Lie groups. A particular case of $\mathsf{SO}(n)$ is then studied in details, with objective functions corresponding to leading Generalized EigenValue problems: the Lie-NAG dynamics are first made explicit in coordinates, and then discretized in structure preserving fashions, resulting in optimization algorithms with faithful energy behavior (due to conformal symplecticity) and exactly remaining on the Lie group. Stochastic gradient versions are also investigated. Numerical experiments on both synthetic data and practical problem (LDA for MNIST) demonstrate the effectiveness of the proposed methods as optimization algorithms ($not$ as a classification method).
翻訳日:2023-01-06 08:06:47 公開日:2020-01-27
# 意見の距離の定量化に向けて

Towards Quantifying the Distance between Opinions ( http://arxiv.org/abs/2001.09879v1 )

ライセンス: Link先を確認
Saket Gurukar, Deepak Ajwani, Sourav Dutta, Juho Lauri, Srinivasan Parthasarathy, Alessandra Sala(参考訳) 公共政策、ガバナンス、ビジネス戦略における批判的な決定は、構成員(市民、株主など)のニーズや意見をより深く理解することに依存している。 トピックに関する多数の意見を集めるのが容易になった一方で、意見の空間をナビゲートするための自動化ツールが必要である。 このような文脈では、意見の類似性を理解し定量化することが重要である。 テキストの類似性や全体感に基づく測定では,意見間の距離を効果的に把握できないことが多い。 そこで本研究では,ニュアンス的観察を生かした意見間の類似性を捉えるための新しい距離尺度を提案する。 具体的には、教師なしの設定では、既存のアプローチと比較して、調整されたランド指数スコア(最大56倍)とシルエット係数(最大21倍)が大幅に向上する。 同様に、教師付き環境では、我々の意見距離測定は、テキストの類似性、姿勢の類似性、感情の類似性に依存する既存のアプローチに比べて、かなり精度が(最大20%まで)向上する。

Increasingly, critical decisions in public policy, governance, and business strategy rely on a deeper understanding of the needs and opinions of constituent members (e.g. citizens, shareholders). While it has become easier to collect a large number of opinions on a topic, there is a necessity for automated tools to help navigate the space of opinions. In such contexts understanding and quantifying the similarity between opinions is key. We find that measures based solely on text similarity or on overall sentiment often fail to effectively capture the distance between opinions. Thus, we propose a new distance measure for capturing the similarity between opinions that leverages the nuanced observation -- similar opinions express similar sentiment polarity on specific relevant entities-of-interest. Specifically, in an unsupervised setting, our distance measure achieves significantly better Adjusted Rand Index scores (up to 56x) and Silhouette coefficients (up to 21x) compared to existing approaches. Similarly, in a supervised setting, our opinion distance measure achieves considerably better accuracy (up to 20% increase) compared to extant approaches that rely on text similarity, stance similarity, and sentiment similarity
翻訳日:2023-01-06 08:06:18 公開日:2020-01-27
# PMIndia - インドの言語の並列コーパスコレクション

PMIndia -- A Collection of Parallel Corpora of Languages of India ( http://arxiv.org/abs/2001.09907v1 )

ライセンス: Link先を確認
Barry Haddow and Faheem Kirefu(参考訳) 並列テキストは、高品質機械翻訳(MT)システムの構築や、他の多言語NLPアプリケーションのために必要である。 多くの南アジアの言語では、そのようなデータは不足している。 本稿では,インドの主要13言語を英語と組み合わせたパラレル文からなる新しい公開コーパス(PMIndia)について述べる。 コーパスは、各言語ペアに対して最大56000文を含む。 本稿では,2つの異なる自動文アライメント手法の評価を含むコーパスの構築方法について解説し,初期NMTの結果をコーパスに提示する。

Parallel text is required for building high-quality machine translation (MT) systems, as well as for other multilingual NLP applications. For many South Asian languages, such data is in short supply. In this paper, we described a new publicly available corpus (PMIndia) consisting of parallel sentences which pair 13 major languages of India with English. The corpus includes up to 56000 sentences for each language pair. We explain how the corpus was constructed, including an assessment of two different automatic sentence alignment methods, and present some initial NMT results on the corpus.
翻訳日:2023-01-06 08:05:59 公開日:2020-01-27
# 政策蒸留強化学習による長期報酬によるマルチタスク勧告の開発

Developing Multi-Task Recommendations with Long-Term Rewards via Policy Distilled Reinforcement Learning ( http://arxiv.org/abs/2001.09595v1 )

ライセンス: Link先を確認
Xi Liu, Li Li, Ping-Chun Hsieh, Muhe Xie, Yong Ge, Rui Chen(参考訳) オンライン製品やコンテンツの爆発的な成長に伴い、レコメンデーション技術は情報過負荷を克服し、ユーザー体験を改善し、ビジネス収益を高める効果的なツールとして考えられてきた。 近年,複数の関連課題の長期報酬を同時に考慮する新たなデシデラタムが観測されている。 長期報酬の考慮は、ビジネス収益と成長に強く結びついている。 複数のタスクを同時に学習することで、マルチタスク学習における知識共有による個々のタスクのパフォーマンスが向上する。 いくつかの既存の研究は、リコメンデーションにおける長期的な報酬を研究してきたが、主に単一のレコメンデーションタスクに焦点を当てている。 本稿では, 長期のレコメンデーションの報酬に対処し, 複数のレコメンデーションタスクを同時に処理できる, \underline{po}licy \underline{di}stilled \underline{re}commenderを提案する。 この新たなレコメンデーションソリューションは、異なるタスク間で知識共有を確立し、学習モデルのサイズを減らすことができる、深層強化学習と知識蒸留技術の融合に基づいている。 結果のモデルでは、リアルタイムレコメンデーションサービスのパフォーマンス向上と応答遅延の低減が期待されている。 世界最大の商用モバイルゲームプラットフォームの1つであるSamsung Game Launcherと共同で、数億のイベントを含む大規模な実データに関する包括的な実験を行い、私たちのソリューションがいくつかの標準的な評価指標で多くの最先端メソッドより優れていることを示す。

With the explosive growth of online products and content, recommendation techniques have been considered as an effective tool to overcome information overload, improve user experience, and boost business revenue. In recent years, we have observed a new desideratum of considering long-term rewards of multiple related recommendation tasks simultaneously. The consideration of long-term rewards is strongly tied to business revenue and growth. Learning multiple tasks simultaneously could generally improve the performance of individual task due to knowledge sharing in multi-task learning. While a few existing works have studied long-term rewards in recommendations, they mainly focus on a single recommendation task. In this paper, we propose {\it PoDiRe}: a \underline{po}licy \underline{di}stilled \underline{re}commender that can address long-term rewards of recommendations and simultaneously handle multiple recommendation tasks. This novel recommendation solution is based on a marriage of deep reinforcement learning and knowledge distillation techniques, which is able to establish knowledge sharing among different tasks and reduce the size of a learning model. The resulting model is expected to attain better performance and lower response latency for real-time recommendation services. In collaboration with Samsung Game Launcher, one of the world's largest commercial mobile game platforms, we conduct a comprehensive experimental study on large-scale real data with hundreds of millions of events and show that our solution outperforms many state-of-the-art methods in terms of several standard evaluation metrics.
翻訳日:2023-01-06 08:01:06 公開日:2020-01-27
# 機械学習における特徴選択:R\enyi min-entropy vs Shannon entropy

Feature selection in machine learning: R\'enyi min-entropy vs Shannon entropy ( http://arxiv.org/abs/2001.09654v1 )

ライセンス: Link先を確認
Catuscia Palamidessi and Marco Romanelli(参考訳) 特徴選択は、機械学習の文脈において、非常に予測性の高い特徴と、無関係あるいは冗長な機能とを分離するプロセスである。 情報理論はこの課題において有用な概念として認識されており、予測力は特徴とラベルの相互情報という相関関係に由来する。 文学における特徴選択のための多くのアルゴリズムはシャノンエントロピーに基づく相互情報を採用している。 本稿では、代わりにR'enyi min-entropy を用いることの可能性を検討する。 特に,セキュリティとプライバシの分野で最近採用されている条件付きR'enyi min-entropyの概念に基づくアルゴリズムを提案する。 一般に、r\'enyiベースのアルゴリズムが対応するシャノンベースのデータセットよりもうまく機能するデータセットと、状況が逆転するデータセットを構築できるという意味で、2つのアプローチは比較不能であることが証明される。 しかし実際には、実際のデータのデータセットを考えると、R'enyiベースのアルゴリズムは他方よりも優れている傾向にある。 我々は、basehock、semeion、gisetteデータセットについていくつかの実験を行い、これら全てにおいて、r\'enyiベースのアルゴリズムがより良い結果をもたらすことを実際に観察した。

Feature selection, in the context of machine learning, is the process of separating the highly predictive feature from those that might be irrelevant or redundant. Information theory has been recognized as a useful concept for this task, as the prediction power stems from the correlation, i.e., the mutual information, between features and labels. Many algorithms for feature selection in the literature have adopted the Shannon-entropy-based mutual information. In this paper, we explore the possibility of using R\'enyi min-entropy instead. In particular, we propose an algorithm based on a notion of conditional R\'enyi min-entropy that has been recently adopted in the field of security and privacy, and which is strictly related to the Bayes error. We prove that in general the two approaches are incomparable, in the sense that we show that we can construct datasets on which the R\'enyi-based algorithm performs better than the corresponding Shannon-based one, and datasets on which the situation is reversed. In practice, however, when considering datasets of real data, it seems that the R\'enyi-based algorithm tends to outperform the other one. We have effectuate several experiments on the BASEHOCK, SEMEION, and GISETTE datasets, and in all of them we have indeed observed that the R\'enyi-based algorithm gives better results.
翻訳日:2023-01-06 08:00:13 公開日:2020-01-27
# ディープニューラルネットワークを用いた時系列データのマルチラベル予測

Multi-label Prediction in Time Series Data using Deep Neural Networks ( http://arxiv.org/abs/2001.10098v1 )

ライセンス: Link先を確認
Wenyu Zhang, Devesh K. Jha, Emil Laftchiev, Daniel Nikovski(参考訳) 本稿では,多次元時系列データに対するマルチラベル予測故障分類問題に対処する。 フォールト(イベント)検出問題は文献で徹底的に研究されているが、最先端の技術のほとんどは、望ましい将来的な展望で確実に障害(イベント)を予測できない。 これらの問題の最も一般的な設定では、複数の時系列にまたがるデータの1つ以上のサンプルを、有限の既知の集合から複数の同時障害ラベルを割り当てることができ、そのタスクは、所望の時間的地平線上での障害発生の可能性を予測することである。 この種の問題は通常、いくつかのクラスが少数のサンプルで表される強いクラス不均衡を伴う。 重要なことに、障害予測や予測保守といった多くの応用において、最も興味深いのはこれらの稀なクラスである。 そこで本研究では,不均衡なクラスにおける学習をアクセントする新たなコスト関数を持つマルチラベルリカレントニューラルネットワークを用いた一般的なアプローチを提案する。 提案アルゴリズムは、PHM Society Data Challengeの産業プラントデータセットと、人間の活動認識データセットの2つの公開ベンチマークデータセットでテストされている。 結果は,時系列分類のための最先端技術と比較し,f1-score,精度,リコールを用いて評価を行う。

This paper addresses a multi-label predictive fault classification problem for multidimensional time-series data. While fault (event) detection problems have been thoroughly studied in literature, most of the state-of-the-art techniques can't reliably predict faults (events) over a desired future horizon. In the most general setting of these types of problems, one or more samples of data across multiple time series can be assigned several concurrent fault labels from a finite, known set and the task is to predict the possibility of fault occurrence over a desired time horizon. This type of problem is usually accompanied by strong class imbalances where some classes are represented by only a few samples. Importantly, in many applications of the problem such as fault prediction and predictive maintenance, it is exactly these rare classes that are of most interest. To address the problem, this paper proposes a general approach that utilizes a multi-label recurrent neural network with a new cost function that accentuates learning in the imbalanced classes. The proposed algorithm is tested on two public benchmark datasets: an industrial plant dataset from the PHM Society Data Challenge, and a human activity recognition dataset. The results are compared with state-of-the-art techniques for time-series classification and evaluation is performed using the F1-score, precision and recall.
翻訳日:2023-01-06 07:58:00 公開日:2020-01-27
# 協調型マルチエージェント力学系における分散学習に対する後悔限度

Regret Bounds for Decentralized Learning in Cooperative Multi-Agent Dynamical Systems ( http://arxiv.org/abs/2001.10122v1 )

ライセンス: Link先を確認
Seyed Mohammad Asghari, Yi Ouyang, and Ashutosh Nayyar(参考訳) MARL(Multi-Agent Reinforcement Learning)では,エージェント間の動的環境と分散情報により回帰分析が困難である。 マルチエージェント線形量子力学系における分散学習の文脈でこの課題を解決しようとする。 まず,エージェントによって制御される2つのエージェントと2つの動的分離確率線形システムからなる簡単なセットアップから始める。 システムは2次コスト関数を介して結合される。 両方のシステムのダイナミクスが不明で、エージェント間のコミュニケーションが存在しない場合、学習ポリシーが$t$でサブリニアを生成することができないことを示し、ここで$t$がタイムホライズンであることを示す。 1つのシステムのダイナミクスが未知であり、未知のシステムを制御するエージェントから他のエージェントへの一方向通信が存在する場合、補助的な単一エージェントLQ問題の構築に基づくMARLアルゴリズムを提案する。 MARLアルゴリズムの補助的な単一エージェント問題は、2つの学習エージェント間の暗黙の協調機構として機能する。 これにより、エージェントは補助単エージェント問題の後悔の$O(\sqrt{T})$内で後悔を達成することができる。 したがって、単一エージェントLQ後悔に対する既存の結果を用いて、我々のアルゴリズムは$\tilde{O}(\sqrt{T})$ regret boundを提供する。 (ここで$\tilde{o}(\cdot)$定数と対数因子を隠蔽する)。 我々の数値実験は、この境界が実際に一致することを示している。 2エージェント問題から,特定の通信パターンを持つマルチエージェントLQシステムに結果を拡張する。

Regret analysis is challenging in Multi-Agent Reinforcement Learning (MARL) primarily due to the dynamical environments and the decentralized information among agents. We attempt to solve this challenge in the context of decentralized learning in multi-agent linear-quadratic (LQ) dynamical systems. We begin with a simple setup consisting of two agents and two dynamically decoupled stochastic linear systems, each system controlled by an agent. The systems are coupled through a quadratic cost function. When both systems' dynamics are unknown and there is no communication among the agents, we show that no learning policy can generate sub-linear in $T$ regret, where $T$ is the time horizon. When only one system's dynamics are unknown and there is one-directional communication from the agent controlling the unknown system to the other agent, we propose a MARL algorithm based on the construction of an auxiliary single-agent LQ problem. The auxiliary single-agent problem in the proposed MARL algorithm serves as an implicit coordination mechanism among the two learning agents. This allows the agents to achieve a regret within $O(\sqrt{T})$ of the regret of the auxiliary single-agent problem. Consequently, using existing results for single-agent LQ regret, our algorithm provides a $\tilde{O}(\sqrt{T})$ regret bound. (Here $\tilde{O}(\cdot)$ hides constants and logarithmic factors). Our numerical experiments indicate that this bound is matched in practice. From the two-agent problem, we extend our results to multi-agent LQ systems with certain communication patterns.
翻訳日:2023-01-06 07:57:39 公開日:2020-01-27
# 固有成層モデル

Eigen-Stratified Models ( http://arxiv.org/abs/2001.10389v1 )

ライセンス: Link先を確認
Jonathan Tuck, Stephen Boyd(参考訳) 成層モデルは、k$の値を取る選択されたカテゴリの特徴に任意の方法で依存し、他の$n$の特徴に線形に依存する。 特徴値のグラフに対するラプラシアン正則化は、特に低データ環境において、階層化されたモデルの性能を大幅に改善することができる。 laplacian-regularized stratified modelの大きな問題は、モデルのサイズがベースモデルのサイズの1k$倍であることです。 モデルパラメータはグラフラプラシアンのボトム固有ベクトルのわずか数$m$の線形結合である、すなわち、$m$最小固有値に関連するような、追加の制約付き成層モデルである固有成層モデルを定式化することでこの問題に対処する。 固有成層モデルでは、$m$ボトム固有ベクトルと対応する係数を成層モデルパラメータとして格納するだけでよい。 これにより、$m \leq n$ と $m \ll K$ のモデルサイズが減少することがある。 場合によっては、固有成層モデルに暗黙的に追加される正規化により、標準ラプラシアン正規成層モデルよりもサンプル外の性能が向上する。

Stratified models depend in an arbitrary way on a selected categorical feature that takes $K$ values, and depend linearly on the other $n$ features. Laplacian regularization with respect to a graph on the feature values can greatly improve the performance of a stratified model, especially in the low-data regime. A significant issue with Laplacian-regularized stratified models is that the model is $K$ times the size of the base model, which can be quite large. We address this issue by formulating eigen-stratifed models, which are stratified models with an additional constraint that the model parameters are linear combinations of some modest number $m$ of bottom eigenvectors of the graph Laplacian, i.e., those associated with the $m$ smallest eigenvalues. With eigen-stratified models, we only need to store the $m$ bottom eigenvectors and the corresponding coefficients as the stratified model parameters. This leads to a reduction, sometimes large, of model size when $m \leq n$ and $m \ll K$. In some cases, the additional regularization implicit in eigen-stratified models can improve out-of-sample performance over standard Laplacian regularized stratified models.
翻訳日:2023-01-06 07:57:15 公開日:2020-01-27
# 最適変換による不完全データを用いた回帰確率分布の予測

Predicting Regression Probability Distributions with Imperfect Data Through Optimal Transformations ( http://arxiv.org/abs/2001.10102v1 )

ライセンス: Link先を確認
Jerome H. Friedman(参考訳) 回帰分析の目標は、他の(予測器)変数 x の結合値のベクトルが与えられた数値結果変数 y の値を予測することである。 通常、特定の x-ベクトルは、y に対する繰り返し可能な値ではなく、y-値 p(y|x) の確率分布を指定しない。 この分布は位置、スケール、形状を持ち、これらは全て x に依存することができ、x に対して y の可能性のある値を推測する必要がある。 回帰法は通常、訓練データ y-値が、ある良い振る舞いを持つ p(y|x) から完全数値化であると仮定する。 実際のトレーニングデータ y-value は離散的、切り離され、あるいは任意の検閲されることが多い。 最適変換戦略に基づく回帰手順を示し、そのような不完全なトレーニングデータが存在する場合、x の一般関数として p(y|x) の位置、スケール、形状を推定する。 さらに、ソリューションの品質を確認するために検証診断が提示される。

The goal of regression analysis is to predict the value of a numeric outcome variable y given a vector of joint values of other (predictor) variables x. Usually a particular x-vector does not specify a repeatable value for y, but rather a probability distribution of possible y--values, p(y|x). This distribution has a location, scale and shape, all of which can depend on x, and are needed to infer likely values for y given x. Regression methods usually assume that training data y-values are perfect numeric realizations from some well behaived p(y|x). Often actual training data y-values are discrete, truncated and/or arbitrary censored. Regression procedures based on an optimal transformation strategy are presented for estimating location, scale and shape of p(y|x) as general functions of x, in the possible presence of such imperfect training data. In addition, validation diagnostics are presented to ascertain the quality of the solutions.
翻訳日:2023-01-06 07:51:20 公開日:2020-01-27
# 潜伏特徴空間における画像例題学習によるブラックボックス説明

Black Box Explanation by Learning Image Exemplars in the Latent Feature Space ( http://arxiv.org/abs/2002.03746v1 )

ライセンス: Link先を確認
Riccardo Guidotti, Anna Monreale, Stan Matwin, Dino Pedreschi(参考訳) 本稿では,画像分類のためのブラックボックスモデルの決定を説明する手法を提案する。 画像のラベル付けにブラックボックスを使用中,提案手法は,対向オートエンコーダを用いて学習した潜在特徴空間を利用する。 提案手法は,まず潜在特徴空間の例画像を生成し,決定木分類器を学習する。 そして、局所的な決定規則に関する例を選択・復号する。 最後に、exemplarsをクラス内に保持するか、別のクラスに"モーフィング"することで反事実になるように変更する方法をユーザに示す方法で、それらを視覚化する。 画像分類のためのブラックボックス決定システムに焦点を当てているため、例示から得られた説明は、その分類に寄与する画像の領域と、それを別のクラスにプッシュする画像の領域を強調するサリエンシーマップを提供する。 3つのデータセットと2つのブラックボックスモデルに対する実験結果を示す。 提案手法は,最も有用かつ解釈可能な説明を提供するとともに,忠実度,妥当性,一貫性,安定性の観点から既存説明よりも優れていることを示す。

We present an approach to explain the decisions of black box models for image classification. While using the black box to label images, our explanation method exploits the latent feature space learned through an adversarial autoencoder. The proposed method first generates exemplar images in the latent feature space and learns a decision tree classifier. Then, it selects and decodes exemplars respecting local decision rules. Finally, it visualizes them in a manner that shows to the user how the exemplars can be modified to either stay within their class, or to become counter-factuals by "morphing" into another class. Since we focus on black box decision systems for image classification, the explanation obtained from the exemplars also provides a saliency map highlighting the areas of the image that contribute to its classification, and areas of the image that push it into another class. We present the results of an experimental evaluation on three datasets and two black box models. Besides providing the most useful and interpretable explanations, we show that the proposed method outperforms existing explainers in terms of fidelity, relevance, coherence, and stability.
翻訳日:2023-01-06 07:49:53 公開日:2020-01-27
# データセット検索にスキーマラベルを活用する

Leveraging Schema Labels to Enhance Dataset Search ( http://arxiv.org/abs/2001.10112v1 )

ライセンス: Link先を確認
Zhiyu Chen, Haiyan Jia, Jeff Heflin, Brian D. Davison(参考訳) 望ましいデータセットを検索する検索エンジンの能力は、データの共有と再利用に重要である。 既存のデータセット検索エンジンは通常、データセット記述にマッチするクエリに依存する。 しかし、ユーザーは記述テキストと一致する用語を用いてクエリを書くのに十分な事前知識を持っておらず、データセットテーブルの内容に基づいてスキーマラベルを生成する新しいスキーマラベル生成モデルを提案する。 生成したスキーマラベルを、クエリとデータセットメタデータの関連性だけでなく、クエリと生成したスキーマラベルの類似性も考慮した混合ランキングモデルに組み込む。 本手法を実世界のデータセット上で評価するために,データセット検索タスク専用のベンチマークを作成した。 実験により,本手法はベースライン法と比較して,データセット検索タスクの精度とndcgスコアを効果的に改善できることを示した。 また、ウィキペディアテーブルの集合を用いて、スキーマラベルから生成された特徴が、教師なしおよび教師なしのWebテーブル検索タスクも改善可能であることを示す。

A search engine's ability to retrieve desirable datasets is important for data sharing and reuse. Existing dataset search engines typically rely on matching queries to dataset descriptions. However, a user may not have enough prior knowledge to write a query using terms that match with description text.We propose a novel schema label generation model which generates possible schema labels based on dataset table content. We incorporate the generated schema labels into a mixed ranking model which not only considers the relevance between the query and dataset metadata but also the similarity between the query and generated schema labels. To evaluate our method on real-world datasets, we create a new benchmark specifically for the dataset retrieval task. Experiments show that our approach can effectively improve the precision and NDCG scores of the dataset retrieval task compared with baseline methods. We also test on a collection of Wikipedia tables to show that the features generated from schema labels can improve the unsupervised and supervised web table retrieval task as well.
翻訳日:2023-01-06 07:49:34 公開日:2020-01-27
# 構造情報学習機械:観察、連想、最適化、デコード、抽象化からの学習

Structural Information Learning Machinery: Learning from Observing, Associating, Optimizing, Decoding, and Abstracting ( http://arxiv.org/abs/2001.09637v1 )

ライセンス: Link先を確認
Angsheng Li(参考訳) 本稿では,計算理論と情報理論を融合して学習を数学的に定義する「it構造情報学習機械」(略してsilem)のモデルを提案する。 我々のモデルは、学習の本質は情報を得ることであり、情報を得ることは、データ空間に埋め込まれた不確実性を排除することであり、データ空間の不確実性を取り除くことは、最適化問題、すなわち、一般的な木構造法で実現可能な情報最適化問題に還元できることを示している。 構造情報学習マシンの原理と基準は、データポイント間の関係とともに観測されたデータポイントから {\it decoding information} を最大化すること、および構文的 {\it essential structure} の意味論的 {\it interpretation} である。 SiLeMマシンは自然の法則や規則を学ぶ。 It observes the data points of real world, builds the {\it connections} among the observed data and constructs a {\it data space}, for which the principle is to choose the way of connections of data points so that the {\it decoding information} of the data space is maximized, finds the {\it encoding tree} of the data space that minimizes the dynamical uncertainty of the data space, in which the encoding tree is hence referred to as a {\it decoder}, due to the fact that it has already eliminated the maximum amount of uncertainty embedded in the data space, interprets the {\it semantics} of the decoder, an encoding tree, to form a {\it knowledge tree}, extracts the {\it remarkable common features} for both semantical and syntactical features of the modules decoded by a decoder to construct {\it trees of abstractions}, providing the foundations for {\it intuitive reasoning} in the learning when new data are observed.

In the present paper, we propose the model of {\it structural information learning machines} (SiLeM for short), leading to a mathematical definition of learning by merging the theories of computation and information. Our model shows that the essence of learning is {\it to gain information}, that to gain information is {\it to eliminate uncertainty} embedded in a data space, and that to eliminate uncertainty of a data space can be reduced to an optimization problem, that is, an {\it information optimization problem}, which can be realized by a general {\it encoding tree method}. The principle and criterion of the structural information learning machines are maximization of {\it decoding information} from the data points observed together with the relationships among the data points, and semantical {\it interpretation} of syntactical {\it essential structure}, respectively. A SiLeM machine learns the laws or rules of nature. It observes the data points of real world, builds the {\it connections} among the observed data and constructs a {\it data space}, for which the principle is to choose the way of connections of data points so that the {\it decoding information} of the data space is maximized, finds the {\it encoding tree} of the data space that minimizes the dynamical uncertainty of the data space, in which the encoding tree is hence referred to as a {\it decoder}, due to the fact that it has already eliminated the maximum amount of uncertainty embedded in the data space, interprets the {\it semantics} of the decoder, an encoding tree, to form a {\it knowledge tree}, extracts the {\it remarkable common features} for both semantical and syntactical features of the modules decoded by a decoder to construct {\it trees of abstractions}, providing the foundations for {\it intuitive reasoning} in the learning when new data are observed.
翻訳日:2023-01-06 07:49:18 公開日:2020-01-27
# N-gram解析を利用した機械学習マルウェア検出器の解釈

Interpreting Machine Learning Malware Detectors Which Leverage N-gram Analysis ( http://arxiv.org/abs/2001.10916v1 )

ライセンス: Link先を確認
William Briguglio and Sherif Saad(参考訳) サイバー攻撃の検出と防止システムでは、サイバーセキュリティアナリストは常にルールベースや署名ベースの検出と同じくらい解釈可能で理解可能なソリューションを好む。 これは、偽陽性と偽陰性の影響を緩和し制御するためにこれらの解をチューニングし最適化する必要があるためである。 機械学習モデルの解釈は、新しくてオープンな課題である。 しかし、解釈可能な機械学習ソリューションはドメイン固有であることが期待される。 例えば、医療における機械学習モデルの解釈可能なソリューションは、マルウェア検出のソリューションとは異なる。 これはモデルが複雑で、ほとんどのモデルがブラックボックスとして動作するためです。 近年、マルウェア作者がアンチマルウェアシステムをバイパスする能力が増大し、セキュリティ専門家は堅牢な検出システムを構築するために機械学習に目を向けざるを得なくなった。 これらのシステムが業界で頼りになるなら、他の課題の中でも、予測を説明する必要がある。 本研究の目的は,MLベースのマルウェア検出装置に適用した場合の,最先端MLモデルの解釈可能性の評価である。 マルウェア解析領域において,既存の解釈手法の有効性を実際に実証し,評価する。

In cyberattack detection and prevention systems, cybersecurity analysts always prefer solutions that are as interpretable and understandable as rule-based or signature-based detection. This is because of the need to tune and optimize these solutions to mitigate and control the effect of false positives and false negatives. Interpreting machine learning models is a new and open challenge. However, it is expected that an interpretable machine learning solution will be domain-specific. For instance, interpretable solutions for machine learning models in healthcare are different than solutions in malware detection. This is because the models are complex, and most of them work as a black-box. Recently, the increased ability for malware authors to bypass antimalware systems has forced security specialists to look to machine learning for creating robust detection systems. If these systems are to be relied on in the industry, then, among other challenges, they must also explain their predictions. The objective of this paper is to evaluate the current state-of-the-art ML models interpretability techniques when applied to ML-based malware detectors. We demonstrate interpretability techniques in practice and evaluate the effectiveness of existing interpretability techniques in the malware analysis domain.
翻訳日:2023-01-06 07:48:32 公開日:2020-01-27
# iotデータ分類のための機械学習とディープラーニングアルゴリズムの性能解析と比較

Performance Analysis and Comparison of Machine and Deep Learning Algorithms for IoT Data Classification ( http://arxiv.org/abs/2001.09636v1 )

ライセンス: Link先を確認
Meysam Vakili, Mohammad Ghamsari and Masoumeh Rezaei(参考訳) 近年,IoT(Internet of Things,モノのインターネット)が新興技術として成長している。 IoTドメインにおけるネットワーク対応デバイスの数は劇的に増加しており、電子データの大量生産につながっている。 これらのデータは、科学、産業、ビジネス、さらには社会生活など、様々な分野で利用できる貴重な情報を含んでいる。 これらの情報を抽出して分析し、IoTシステムをスマートにするためには、人工知能(AI)の世界に入り、機械学習とディープラーニング技術のパワーを活用することが唯一の選択肢だ。 本稿では,6つのiot関連データセットを用いた分類タスクにおける11のポピュラーマシンおよびディープラーニングアルゴリズムの性能評価を行った。 これらのアルゴリズムは、精度、リコール、f1スコア、精度、実行時間、ROC-AUCスコア、混乱行列など、いくつかのパフォーマンス評価指標に基づいて比較される。 また,開発モデルの収束速度を評価するための実験を行った。 包括的な実験では、すべてのパフォーマンス指標を考慮すると、Random Forestsは他の機械学習モデルよりもパフォーマンスが良く、ANNとCNNはより興味深い結果を得た。

In recent years, the growth of Internet of Things (IoT) as an emerging technology has been unbelievable. The number of networkenabled devices in IoT domains is increasing dramatically, leading to the massive production of electronic data. These data contain valuable information which can be used in various areas, such as science, industry, business and even social life. To extract and analyze this information and make IoT systems smart, the only choice is entering artificial intelligence (AI) world and leveraging the power of machine learning and deep learning techniques. This paper evaluates the performance of 11 popular machine and deep learning algorithms for classification task using six IoT-related datasets. These algorithms are compared according to several performance evaluation metrics including precision, recall, f1-score, accuracy, execution time, ROC-AUC score and confusion matrix. A specific experiment is also conducted to assess the convergence speed of developed models. The comprehensive experiments indicated that, considering all performance metrics, Random Forests performed better than other machine learning models, while among deep learning models, ANN and CNN achieved more interesting results.
翻訳日:2023-01-06 07:41:48 公開日:2020-01-27
# 機械学習による水質サロゲートからの高周波栄養塩濃度の推定

Estimation of high frequency nutrient concentrations from water quality surrogates using machine learning methods ( http://arxiv.org/abs/2001.09695v1 )

ライセンス: Link先を確認
Mar\'ia Castrillo and \'Alvaro L\'opez Garc\'ia(参考訳) 連続した高周波水質モニタリングは水管理を支える重要な課題となっている。 センサ技術の進歩にもかかわらず、特定の変数はその場およびリアルタイムに簡単に、あるいは経済的に監視することはできない。 このような場合、サロゲート測度はデータ駆動モデルを用いて推定することができる。 本研究は, 農耕地や都市における栄養素の濃度を推定するためのサロゲートとして, 機械学習モデル, 特にランダム林を用いた。 結果は、同じ数のサロゲートを用いた線形モデリングと比較され、Root Mean Squared Error (RMSE) の最大60.1%の削減が得られる。 最大7つのサーロゲートセンサーを含むことで得た利益は計算され、それぞれ4つと5つ以上のセンサーを投入することは、エラー改善には値しないことがわかった。

Continuous high frequency water quality monitoring is becoming a critical task to support water management. Despite the advancements in sensor technologies, certain variables cannot be easily and/or economically monitored in-situ and in real time. In these cases, surrogate measures can be used to make estimations by means of data-driven models. In this work, variables that are commonly measured in-situ are used as surrogates to estimate the concentrations of nutrients in a rural catchment and in an urban one, making use of machine learning models, specifically Random Forests. The results are compared with those of linear modelling using the same number of surrogates, obtaining a reduction in the Root Mean Squared Error (RMSE) of up to 60.1%. The profit from including up to seven surrogate sensors was computed, concluding that adding more than 4 and 5 sensors in each of the catchments respectively was not worthy in terms of error improvement.
翻訳日:2023-01-06 07:41:29 公開日:2020-01-27
# DP-CGAN:差分プライベートな合成データとラベル生成

DP-CGAN: Differentially Private Synthetic Data and Label Generation ( http://arxiv.org/abs/2001.09700v1 )

ライセンス: Link先を確認
Reihaneh Torkzadehmahani, Peter Kairouz, Benedict Paten(参考訳) GAN(Generative Adversarial Networks)は、画像を含む合成データを生成するよく知られたモデルの1つであり、特に、公開されていないため、オリジナルの機密データセットを使用できない研究コミュニティにとってである。 この領域における主な課題の1つは、ganモデルのトレーニングに参加する個人のプライバシーを守ることである。 この課題に対処するために,新たなクリッピングおよび摂動戦略に基づく差分プライベート条件gan(dp-cgan)トレーニングフレームワークを導入し,トレーニングデータセットのプライバシを保ちながら,モデルの性能を向上させる。 dp-cganは合成データと対応するラベルの両方を生成し、最近導入されたrenyi differential privacy accountantを利用して使用済みのプライバシー予算を追跡する。 実験の結果,DP-CGANは1桁のエプシロンパラメータを持つMNISTデータセット上で,視覚的かつ実証的に有望な結果を生成できることがわかった。

Generative Adversarial Networks (GANs) are one of the well-known models to generate synthetic data including images, especially for research communities that cannot use original sensitive datasets because they are not publicly accessible. One of the main challenges in this area is to preserve the privacy of individuals who participate in the training of the GAN models. To address this challenge, we introduce a Differentially Private Conditional GAN (DP-CGAN) training framework based on a new clipping and perturbation strategy, which improves the performance of the model while preserving privacy of the training dataset. DP-CGAN generates both synthetic data and corresponding labels and leverages the recently introduced Renyi differential privacy accountant to track the spent privacy budget. The experimental results show that DP-CGAN can generate visually and empirically promising results on the MNIST dataset with a single-digit epsilon parameter in differential privacy.
翻訳日:2023-01-06 07:40:45 公開日:2020-01-27
# 不確実性に基づく生涯学習の変調

Uncertainty-based Modulation for Lifelong Learning ( http://arxiv.org/abs/2001.09822v1 )

ライセンス: Link先を確認
Andrew Brna, Ryan Brown, Patrick Connolly, Stephen Simons, Renee Shimizu, Mario Aguilar-Simon(参考訳) 連続的な生涯学習が可能な知的エージェントのための機械学習アルゴリズムの作成は、動的環境における実生活システム上にデプロイされるアルゴリズムの重要な目的である。 本稿では,stephen grossberg\ による適応共鳴理論の提案を統合し,拡張するヒト脳の神経調節機構に触発されたアルゴリズムを提案する。 具体的には、不確実性の概念に基づいており、自律学習やワンショット学習など、継続的な学習を可能にする一連の神経調節機構を採用している。 アルゴリズムコンポーネントは、破滅的な忘れずに安定した学習を示す一連のベンチマーク実験で評価された。 また,環境やエージェントの行動に制約を課し,学習プロセスを導くクローズドループ方式でこれらのシステムを開発する上で重要な役割を示す。 この目的のために、我々はアルゴリズムを擬似ドローンエージェントに統合した。 実験の結果、このアルゴリズムは新しいタスクの連続学習が可能であり、破滅的な忘れをすることなく、仮想環境において高い分類精度(94%以上)で変化した条件下での学習が可能であった。 このアルゴリズムは、最先端検出および特徴抽出アルゴリズムから高次元入力を受け取り、既存のシステムに柔軟な追加を可能にする。 また、新しい知識を求めるメカニズムをアルゴリズムに付与し、より幅広い神経調節過程を採用することに焦点を当てた今後の開発努力についても述べる。

The creation of machine learning algorithms for intelligent agents capable of continuous, lifelong learning is a critical objective for algorithms being deployed on real-life systems in dynamic environments. Here we present an algorithm inspired by neuromodulatory mechanisms in the human brain that integrates and expands upon Stephen Grossberg\'s ground-breaking Adaptive Resonance Theory proposals. Specifically, it builds on the concept of uncertainty, and employs a series of neuromodulatory mechanisms to enable continuous learning, including self-supervised and one-shot learning. Algorithm components were evaluated in a series of benchmark experiments that demonstrate stable learning without catastrophic forgetting. We also demonstrate the critical role of developing these systems in a closed-loop manner where the environment and the agent\'s behaviors constrain and guide the learning process. To this end, we integrated the algorithm into an embodied simulated drone agent. The experiments show that the algorithm is capable of continuous learning of new tasks and under changed conditions with high classification accuracy (greater than 94 percent) in a virtual environment, without catastrophic forgetting. The algorithm accepts high dimensional inputs from any state-of-the-art detection and feature extraction algorithms, making it a flexible addition to existing systems. We also describe future development efforts focused on imbuing the algorithm with mechanisms to seek out new knowledge as well as employ a broader range of neuromodulatory processes.
翻訳日:2023-01-06 07:40:29 公開日:2020-01-27
# Polygames: ゼロラーニングの改善

Polygames: Improved Zero Learning ( http://arxiv.org/abs/2001.09832v1 )

ライセンス: Link先を確認
Tristan Cazenave, Yen-Chi Chen, Guan-Wei Chen, Shi-Yu Chen, Xian-Dong Chiu, Julien Dehos, Maria Elsa, Qucheng Gong, Hengyuan Hu, Vasil Khalidov, Cheng-Ling Li, Hsin-I Lin, Yu-Jin Lin, Xavier Martinet, Vegard Mella, Jeremy Rapin, Baptiste Roziere, Gabriel Synnaeve, Fabien Teytaud, Olivier Teytaud, Shi-Cheng Ye, Yi-Jun Ye, Shi-Jim Yen, Sergey Zagoruyko(参考訳) deepmindのalphazero以降、zero learningは多くのボードゲームで最先端の手法となった。 完全畳み込み構造(完全連結層を持たない)を用いて改善することができる。 このようなアーキテクチャとグローバルプールを使うことで、ボードサイズに依存しないボットを作成できるのです。 トレーニング中に最高のチェックポイントを追跡し、それに対するトレーニングを行うことで、トレーニングをより堅牢にすることができる。 これらの機能を用いて,ゲームライブラリとチェックポイントを備えたゼロ学習フレームワークであるPolygamesをリリースする。 私たちは19x19のhexゲームで強い人間に勝った。 TAAIコンクールでもいくつかの初優勝を飾った。

Since DeepMind's AlphaZero, Zero learning quickly became the state-of-the-art method for many board games. It can be improved using a fully convolutional structure (no fully connected layer). Using such an architecture plus global pooling, we can create bots independent of the board size. The training can be made more robust by keeping track of the best checkpoints during the training and by training against them. Using these features, we release Polygames, our framework for Zero learning, with its library of games and its checkpoints. We won against strong humans at the game of Hex in 19x19, which was often said to be untractable for zero learning; and in Havannah. We also won several first places at the TAAI competitions.
翻訳日:2023-01-06 07:40:06 公開日:2020-01-27
# ベイズ非パラメトリック共有多列時系列セグメンテーション

Bayesian nonparametric shared multi-sequence time series segmentation ( http://arxiv.org/abs/2001.09886v1 )

ライセンス: Link先を確認
Olga Mikheeva, Ieva Kazlauskaite, Hedvig Kjellstr\"om, Carl Henrik Ek(参考訳) 本稿では,ベイズ非パラメトリックのツールを用いた時系列データのセグメンテーション手法を提案する。 時系列データの時系列セグメンテーションを代表的定常セグメンテーションに分割するタスクについて検討する。 我々はガウス過程 (GP) を用いて、基礎となる定常セグメントの特性に関する知識を課し、非パラメトリック分布を用いて、シーケンスをそのようなセグメントに分割し、セグメント長の事前分布の項で定式化する。 セグメンテーションが与えられた場合、混合成分がGPの共分散関数を用いて記述されるガウス混合モデルの変種と見なすことができる。 そこで本研究では, 合成データに対するモデルの有効性を実証し, 心拍数の表現型を分割し, 心拍記録を健常者および異常者に対応するクラスに分類する。

In this paper, we introduce a method for segmenting time series data using tools from Bayesian nonparametrics. We consider the task of temporal segmentation of a set of time series data into representative stationary segments. We use Gaussian process (GP) priors to impose our knowledge about the characteristics of the underlying stationary segments, and use a nonparametric distribution to partition the sequences into such segments, formulated in terms of a prior distribution on segment length. Given the segmentation, the model can be viewed as a variant of a Gaussian mixture model where the mixture components are described using the covariance function of a GP. We demonstrate the effectiveness of our model on synthetic data as well as on real time-series data of heartbeats where the task is to segment the indicative types of beats and to classify the heartbeat recordings into classes that correspond to healthy and abnormal heart sounds.
翻訳日:2023-01-06 07:39:42 公開日:2020-01-27
# LIBTwinSVM:双サポートベクトルマシンのためのライブラリ

LIBTwinSVM: A Library for Twin Support Vector Machines ( http://arxiv.org/abs/2001.10073v1 )

ライセンス: Link先を確認
Amir M. Mir, Mahdi Rahbar, Jalal A. Nasiri(参考訳) 本稿では,Twin Support Vector Machines (TSVM) 用のフリーで効率的なオープンソースライブラリ LIBTwinSVM について述べる。 本ライブラリは,高速TSVM推定器,モデル選択,可視化,グラフィカルユーザインタフェース(GUI)アプリケーション,Pythonアプリケーションプログラミングインターフェース(API)などの便利な機能セットを提供する。 ベンチマークの結果は,LIBTwinSVMライブラリの大規模分類問題に対する有効性を示している。 LIBTwinSVMライブラリのソースコード、インストールガイド、ドキュメント、使用例はhttps://github.com/mir-am/LIBTwinSVMで公開されている。

This paper presents LIBTwinSVM, a free, efficient, and open source library for Twin Support Vector Machines (TSVMs). Our library provides a set of useful functionalities such as fast TSVMs estimators, model selection, visualization, a graphical user interface (GUI) application, and a Python application programming interface (API). The benchmarks results indicate the effectiveness of the LIBTwinSVM library for large-scale classification problems. The source code of LIBTwinSVM library, installation guide, documentation, and usage examples are available at https://github.com/mir-am/LIBTwinSVM.
翻訳日:2023-01-06 07:39:09 公開日:2020-01-27
# moocのポスト分析、ナレッジトレース、ピアフィードバックで何が起きているのか? レビュー

What's happened in MOOC Posts Analysis, Knowledge Tracing and Peer Feedbacks? A Review ( http://arxiv.org/abs/2001.09830v1 )

ライセンス: Link先を確認
Manikandan Ravikiran(参考訳) 学習管理システム(LMS)と教育データマイニング(EDM)はオンライン教育環境の2つの重要な部分であり、前者は学習内容を管理し、学習活動を組織化(Stone and Zheng, 2014)し、後者はデータ分析にデータマイニング技術を使うことに重点を置いている。 本研究の一環として,欠点と既存のオープン問題を特定することで,EDMの3つの主要な課題の文献レビュー(第2部)と,Blumenfieldチャート(第3部)を提示する。 使用するドキュメントとリソースの統合セットはhttps://github.com/manikandan-ravikiran/cs6460-Surveyで公開されている。 調査のカバレッジ統計とレビューマトリックスは、それぞれ図1と表1に示されています。 Appendix Section 4.1に頭字語拡張が追加される。

Learning Management Systems (LMS) and Educational Data Mining (EDM) are two important parts of online educational environment with the former being a centralised web-based information systems where the learning content is managed and learning activities are organised (Stone and Zheng,2014) and latter focusing on using data mining techniques for the analysis of data so generated. As part of this work, we present a literature review of three major tasks of EDM (See section 2), by identifying shortcomings and existing open problems, and a Blumenfield chart (See section 3). The consolidated set of papers and resources so used are released in https://github.com/manikandan-ravikiran/cs6460-Survey. The coverage statistics and review matrix of the survey are as shown in Figure 1 & Table 1 respectively. Acronym expansions are added in the Appendix Section 4.1.
翻訳日:2023-01-06 07:31:49 公開日:2020-01-27
# 大規模ピアアセスメント改善へのアプローチの体系的レビュー

Systematic Review of Approaches to Improve Peer Assessment at Scale ( http://arxiv.org/abs/2001.10617v1 )

ライセンス: Link先を確認
Manikandan Ravikiran(参考訳) ピアアセスメント(英: Peer Assessment)は、学生による著作の分析とコメントのタスクであり、キャンパスとMOOCの双方において、すべての教育コンポーネントの中核である。 しかし、moocの膨大なスケールとその固有のパーソナライズされたオープンエンド学習では、大規模で成績付けを支援する自動段階付けとツールが非常に重要である。 従来,分類,知識追跡のタスクに関する調査を行ない,初期問題のあるピアアセスメント(PA)の簡単なレビューを行った。 このレビューでは、レビュープロセス自体の改善の観点から、PAについてレビューを続けます。 このレビューの残りはpaの3つの側面に焦点を当てている:自動採点とピア評価ツール(ピアレビュー/自動採点の実施方法のみに注目する)、不正なレビューを扱う戦略、自然言語処理を用いたピアレビューの改善。 使用するドキュメントとリソースの統合セットはhttps://github.com/manikandan-ravikiran/cs6460-Survey-2で公開されている。

Peer Assessment is a task of analysis and commenting on student's writing by peers, is core of all educational components both in campus and in MOOC's. However, with the sheer scale of MOOC's & its inherent personalised open ended learning, automatic grading and tools assisting grading at scale is highly important. Previously we presented survey on tasks of post classification, knowledge tracing and ended with brief review on Peer Assessment (PA), with some initial problems. In this review we shall continue review on PA from perspective of improving the review process itself. As such rest of this review focus on three facets of PA namely Auto grading and Peer Assessment Tools (we shall look only on how peer reviews/auto-grading is carried), strategies to handle Rogue Reviews, Peer Review Improvement using Natural Language Processing. The consolidated set of papers and resources so used are released in https://github.com/manikandan-ravikiran/cs6460-Survey-2.
翻訳日:2023-01-06 07:31:32 公開日:2020-01-27
# ドキュメントとの対話。 文書中心支援の探索

Conversations with Documents. An Exploration of Document-Centered Assistance ( http://arxiv.org/abs/2002.00747v1 )

ライセンス: Link先を確認
Maartje ter Hoeve, Robert Sim, Elnaz Nouri, Adam Fourney, Maarten de Rijke, Ryen W. White(参考訳) 会話アシスタントの役割は、人々の生産性向上に役立っている。 ドキュメント中心の支援(例えば、個人が文書をすばやくレビューするのを助けること)は、ユーザの生産性を大幅に向上させる可能性があるにもかかわらず、顕著な進歩は得られていない。 このタイプの文書中心支援が本論文の焦点である。 1) 文書中心の支援の空間と人々がこのシナリオで期待する能力を理解するための調査を最初に提示する。 2) 利用者が文書の助けを求めながら提示するクエリの種類を調査し, 文書中心の質問がこれらのクエリの大部分を構成することを示す。 (3)それを示す初期学習モデルのセットを提示する。 a) 文書中心の質問を正確に検出し、 (b)そのような質問に答えるための合理的なモデルを構築することができる。 これらの肯定的な結果は、この興味深い新しい問題空間の継続的な研究によってさらに大きな結果が得られることを示唆している。 本研究は,文書との自然な対話によるタスク完了を支援する知的システムの設計に影響を及ぼす。

The role of conversational assistants has become more prevalent in helping people increase their productivity. Document-centered assistance, for example to help an individual quickly review a document, has seen less significant progress, even though it has the potential to tremendously increase a user's productivity. This type of document-centered assistance is the focus of this paper. Our contributions are three-fold: (1) We first present a survey to understand the space of document-centered assistance and the capabilities people expect in this scenario. (2) We investigate the types of queries that users will pose while seeking assistance with documents, and show that document-centered questions form the majority of these queries. (3) We present a set of initial machine learned models that show that (a) we can accurately detect document-centered questions, and (b) we can build reasonably accurate models for answering such questions. These positive results are encouraging, and suggest that even greater results may be attained with continued study of this interesting and novel problem space. Our findings have implications for the design of intelligent systems to support task completion via natural interactions with documents.
翻訳日:2023-01-06 07:31:13 公開日:2020-01-27
# 生涯強化学習システムに関する一考察

Some Insights into Lifelong Reinforcement Learning Systems ( http://arxiv.org/abs/2001.09608v1 )

ライセンス: Link先を確認
Changjian Li(参考訳) 生涯強化学習システムは、生涯にわたって環境との追従的相互作用を通じて学習する能力を持つ学習システムである。 本稿では,従来の強化学習パラダイムが,このような学習システムをモデル化できないことを示すために,いくつかの議論を行う。 生涯強化学習に関するいくつかの知見と、簡易な生涯強化学習システムを提供する。

A lifelong reinforcement learning system is a learning system that has the ability to learn through trail-and-error interaction with the environment over its lifetime. In this paper, I give some arguments to show that the traditional reinforcement learning paradigm fails to model this type of learning system. Some insights into lifelong reinforcement learning are provided, along with a simplistic prototype lifelong reinforcement learning system.
翻訳日:2023-01-06 07:30:23 公開日:2020-01-27
# ディープグラフマッチングコンセンサス

Deep Graph Matching Consensus ( http://arxiv.org/abs/2001.09621v1 )

ライセンス: Link先を確認
Matthias Fey, Jan E. Lenssen, Christopher Morris, Jonathan Masci, Nils M. Kriege(参考訳) この研究は、グラフ間の構造的対応を学習し、精製するための2段階のニューラルアーキテクチャを示す。 まず、グラフニューラルネットワークによって計算された局所ノード埋め込みを用いて、ノード間のソフト対応の初期ランキングを得る。 次に、同期メッセージパッシングネットワークを用いて、ソフト対応を反復的に再ランクし、グラフ間の局所的な近傍で一致したコンセンサスに到達する。 理論的かつ実証的に、我々のメッセージパッシング方式は、対応する地区のコンセンサスをよく計算し、反復的再ランクプロセスの導出に使用されることを示す。 私たちの純粋にローカルで疎結合なアーキテクチャは、グローバルな通信を継続的に回復しながら、大規模な実世界の入力にうまくスケールします。 計算機ビジョンと知識グラフ間のエンティティアライメントの観点から,実世界の課題に対する本手法の実用的効果を実証し,現状を改善した。 ソースコードはhttps://github.com/rusty1s/deep-graph-matching-consensusで入手できます。

This work presents a two-stage neural architecture for learning and refining structural correspondences between graphs. First, we use localized node embeddings computed by a graph neural network to obtain an initial ranking of soft correspondences between nodes. Secondly, we employ synchronous message passing networks to iteratively re-rank the soft correspondences to reach a matching consensus in local neighborhoods between graphs. We show, theoretically and empirically, that our message passing scheme computes a well-founded measure of consensus for corresponding neighborhoods, which is then used to guide the iterative re-ranking process. Our purely local and sparsity-aware architecture scales well to large, real-world inputs while still being able to recover global correspondences consistently. We demonstrate the practical effectiveness of our method on real-world tasks from the fields of computer vision and entity alignment between knowledge graphs, on which we improve upon the current state-of-the-art. Our source code is available under https://github.com/rusty1s/ deep-graph-matching-consensus.
翻訳日:2023-01-06 07:30:16 公開日:2020-01-27
# スパース勾配によるばらつき低減

Variance Reduction with Sparse Gradients ( http://arxiv.org/abs/2001.09623v1 )

ライセンス: Link先を確認
Melih Elibol, Lihua Lei, Michael I. Jordan(参考訳) SVRGやSpiderBoostのような分散還元法では、大きなバッチ勾配と小さなバッチ勾配を混合して確率勾配の分散を低減する。 SGDと比較すると、これらの手法はモデルパラメータに対する更新毎の操作回数を少なくとも2倍にする必要がある。 これらの手法の計算コストを削減するため、新しい空間演算子:ランダムトップk演算子を導入する。 提案手法は,top-k演算子と乱数化座標降下演算子を組み合わせることで,様々な応用で現れる勾配スパーシティを推定することで計算複雑性を低減できる。 この演算子では、大きなバッチ勾配は分散低減以上の利点をもたらす:勾配スパーシティの信頼性の高い推定。 理論的には、我々のアルゴリズムは少なくとも最高のアルゴリズム(SpiderBoost)と同等に優れており、ランダムトップk演算子が勾配の間隔を捕捉するたびにさらに性能が向上する。 このアルゴリズムは画像分類や自然言語処理,スパース行列の分解など,様々なタスクにおいて,SpiderBoostよりも一貫して優れています。 また、簡単な勾配エントロピー計算によってアルゴリズムの背後にある直観を裏付ける実証的な証拠を提供し、各イテレーションにおける勾配スパーシティの定量化に役立てます。

Variance reduction methods such as SVRG and SpiderBoost use a mixture of large and small batch gradients to reduce the variance of stochastic gradients. Compared to SGD, these methods require at least double the number of operations per update to model parameters. To reduce the computational cost of these methods, we introduce a new sparsity operator: The random-top-k operator. Our operator reduces computational complexity by estimating gradient sparsity exhibited in a variety of applications by combining the top-k operator and the randomized coordinate descent operator. With this operator, large batch gradients offer an extra benefit beyond variance reduction: A reliable estimate of gradient sparsity. Theoretically, our algorithm is at least as good as the best algorithm (SpiderBoost), and further excels in performance whenever the random-top-k operator captures gradient sparsity. Empirically, our algorithm consistently outperforms SpiderBoost using various models on various tasks including image classification, natural language processing, and sparse matrix factorization. We also provide empirical evidence to support the intuition behind our algorithm via a simple gradient entropy computation, which serves to quantify gradient sparsity at every iteration.
翻訳日:2023-01-06 07:29:58 公開日:2020-01-27
# aiTPR:画像キャプションのための属性インタラクション-テンソル製品表現

aiTPR: Attribute Interaction-Tensor Product Representation for Image Caption ( http://arxiv.org/abs/2001.09545v1 )

ライセンス: Link先を確認
Chiranjib Sur(参考訳) 地域視覚的特徴は、特徴に基づいて機械の生成能力を高めるが、適切な相互作用の注意力の認識が欠如し、バイアスのある文や非相関的な文や誤情報に終わる。 本稿では,直交結合によりより多くの情報を収集し,物理的実体(テンソル)としてのインタラクションを学習し,キャプションを改善するための便利な方法である属性インタラクションテンソル製品表現(aitpr)を提案する。 未定義の機能空間に機能を追加する以前の研究と比較すると、TPRは相性を維持するのに役立ち、直交性はよく知られた空間を定義するのに役立ちます。 我々は、オブジェクトとその相互作用を定義する新しい概念層を導入し、異なる記述を決定する上で重要な役割を担います。 インタラクション部分はキャプションの品質向上に大きく貢献し、このドメインとMSCOCOデータセットに関する以前の成果よりも優れています。 画像キャプションのための局所的画像特徴と抽象的対話可能性埋め込みを組み合わせるという概念を初めて導入した。

Region visual features enhance the generative capability of the machines based on features, however they lack proper interaction attentional perceptions and thus ends up with biased or uncorrelated sentences or pieces of misinformation. In this work, we propose Attribute Interaction-Tensor Product Representation (aiTPR) which is a convenient way of gathering more information through orthogonal combination and learning the interactions as physical entities (tensors) and improving the captions. Compared to previous works, where features are added up to undefined feature spaces, TPR helps in maintaining sanity in combinations and orthogonality helps in defining familiar spaces. We have introduced a new concept layer that defines the objects and also their interactions that can play a crucial role in determination of different descriptions. The interaction portions have contributed heavily for better caption quality and has out-performed different previous works on this domain and MSCOCO dataset. We introduced, for the first time, the notion of combining regional image features and abstracted interaction likelihood embedding for image captioning.
翻訳日:2023-01-06 07:23:41 公開日:2020-01-27
# 1つの説明がすべてに合わない: 機械学習の透明性のための対話的説明の約束

One Explanation Does Not Fit All: The Promise of Interactive Explanations for Machine Learning Transparency ( http://arxiv.org/abs/2001.09734v1 )

ライセンス: Link先を確認
Kacper Sokol and Peter Flach(参考訳) 機械学習アルゴリズムに基づく予測システムの透明性の必要性は、その産業の急速な拡大の結果として生じる。 ブラックボックスのアルゴリズム予測が人事に影響を与える場合、これらのアルゴリズムの内部動作は精査され、システムエンジニア、システムオペレーター、ケースが決定される個人を含む関連するステークホルダーにその決定が説明されるべきである。 様々な解釈可能性と説明可能性の手法が利用可能であるが、いずれも、関係者が必要とする様々な期待と競合する目標をすべて満たすパナセアではない。 本稿では,ブラックボックスシステムの透明性向上に向けた対話型機械学習の約束について,コントラスト的説明の例を用いて論じる。 具体的には,条件文を対話的に調整し,後続の「もしも」質問により追加説明を抽出し,反事実説明のパーソナライズ方法を示す。 この種のシステムを構築し、デプロイし、提示した経験から、望ましいプロパティと潜在的な制限をリストアップすることができたのです。 インタラクションの媒体、すなわち様々なコミュニケーションチャネルからなるユーザインターフェースをカスタマイズすることは、パーソナライズという印象を与えるかもしれないが、説明自体とその内容の調整がより重要であると主張する。 この目的のためには、説明の幅、範囲、コンテキスト、目的、目的などの特性を考慮し、説明者にその制限と注意点を明示的に通知する必要がある。

The need for transparency of predictive systems based on Machine Learning algorithms arises as a consequence of their ever-increasing proliferation in the industry. Whenever black-box algorithmic predictions influence human affairs, the inner workings of these algorithms should be scrutinised and their decisions explained to the relevant stakeholders, including the system engineers, the system's operators and the individuals whose case is being decided. While a variety of interpretability and explainability methods is available, none of them is a panacea that can satisfy all diverse expectations and competing objectives that might be required by the parties involved. We address this challenge in this paper by discussing the promises of Interactive Machine Learning for improved transparency of black-box systems using the example of contrastive explanations -- a state-of-the-art approach to Interpretable Machine Learning. Specifically, we show how to personalise counterfactual explanations by interactively adjusting their conditional statements and extract additional explanations by asking follow-up "What if?" questions. Our experience in building, deploying and presenting this type of system allowed us to list desired properties as well as potential limitations, which can be used to guide the development of interactive explainers. While customising the medium of interaction, i.e., the user interface comprising of various communication channels, may give an impression of personalisation, we argue that adjusting the explanation itself and its content is more important. To this end, properties such as breadth, scope, context, purpose and target of the explanation have to be considered, in addition to explicitly informing the explainee about its limitations and caveats...
翻訳日:2023-01-06 07:23:04 公開日:2020-01-27
# 修正wasserstein ganを用いた自然逆行性ハイパースペクトル例の生成

Generating Natural Adversarial Hyperspectral examples with a modified Wasserstein GAN ( http://arxiv.org/abs/2001.09993v1 )

ライセンス: Link先を確認
Jean-Christophe Burnel (OBELIX), Kilian Fatras (OBELIX), Nicolas Courty (OBELIX)(参考訳) 逆の例は、分類器の予測を騙す能力のため、ホットなトピックである。 そのような例を作成するには2つの戦略がある。一方は攻撃された分類器の勾配を使い、もう一方はクラス化器の予測にのみアクセスする必要がある。 これは分類器が完全には知られていない場合(ブラックボックスモデル)に特に魅力的である。 本稿では,第2のパラダイムに従って,実データから自然逆例を生成できる新しい手法を提案する。 GAN(Generative Adversarial Networks) [5] に基づいて、真のデータ経験分布を重み付け、分類器にアドリバーシャルな例を生成するよう促す。 本稿では,リモートセンシングデータセット上で逆スペクトルシグネチャを生成することにより,提案手法の概念実証を行う。

Adversarial examples are a hot topic due to their abilities to fool a classifier's prediction. There are two strategies to create such examples, one uses the attacked classifier's gradients, while the other only requires access to the clas-sifier's prediction. This is particularly appealing when the classifier is not full known (black box model). In this paper, we present a new method which is able to generate natural adversarial examples from the true data following the second paradigm. Based on Generative Adversarial Networks (GANs) [5], it reweights the true data empirical distribution to encourage the classifier to generate ad-versarial examples. We provide a proof of concept of our method by generating adversarial hyperspectral signatures on a remote sensing dataset.
翻訳日:2023-01-06 07:22:40 公開日:2020-01-27
# マンモグラフィ画像分類器に対する実用的高速勾配符号攻撃

Practical Fast Gradient Sign Attack against Mammographic Image Classifier ( http://arxiv.org/abs/2001.09610v1 )

ライセンス: Link先を確認
Ibrahim Yilmaz(参考訳) 人工知能(AI)は長年にわたり主要な研究のトピックとなっている。 特に、ディープニューラルネットワーク(DNN)の出現により、これらの研究は非常に成功した。 今日、機械は人間よりも速く正確な判断をすることができる。 機械学習(ML)技術の進歩により、MLは教育、医療、マルウェア検出、自動運転車など、さまざまな分野に利用されている。 このような関心があり、多くの研究が成功したにもかかわらず、mlモデルは相反する攻撃に対して脆弱である。 攻撃者は、ML分類器を騙して彼らの欲求目標を達成するためにクリーンなデータを操作できる。 例えば、良性サンプルを悪意のあるサンプルとして修正したり、悪意のあるサンプルを良性として修正したりできるが、この修正は人間の観察者では認識できない。 これは多くの財政的損失や重傷、死に至る可能性がある。 本稿の背後にあるモチベーションは、この問題を強調し、認識を高めたいということです。 そこで,マンモグラフィ画像分類器の対向攻撃に対するセキュリティギャップを示す。 我々はマンモグラフィー画像を用いてモデルを訓練し、精度でモデル性能を評価する。 その後、元のデータセットを毒殺して、モデルによって誤分類された逆のサンプルを生成します。 次に、構造類似度指数(SSIM)を用いて、クリーン画像と逆画像の類似性を分析する。 最後に、異なる毒素を用いて誤用をいかに成功させるかを示す。

Artificial intelligence (AI) has been a topic of major research for many years. Especially, with the emergence of deep neural network (DNN), these studies have been tremendously successful. Today machines are capable of making faster, more accurate decision than human. Thanks to the great development of machine learning (ML) techniques, ML have been used many different fields such as education, medicine, malware detection, autonomous car etc. In spite of having this degree of interest and much successful research, ML models are still vulnerable to adversarial attacks. Attackers can manipulate clean data in order to fool the ML classifiers to achieve their desire target. For instance; a benign sample can be modified as a malicious sample or a malicious one can be altered as benign while this modification can not be recognized by human observer. This can lead to many financial losses, or serious injuries, even deaths. The motivation behind this paper is that we emphasize this issue and want to raise awareness. Therefore, the security gap of mammographic image classifier against adversarial attack is demonstrated. We use mamographic images to train our model then evaluate our model performance in terms of accuracy. Later on, we poison original dataset and generate adversarial samples that missclassified by the model. We then using structural similarity index (SSIM) analyze similarity between clean images and adversarial images. Finally, we show how successful we are to misuse by using different poisoning factors.
翻訳日:2023-01-06 07:22:27 公開日:2020-01-27
# 畳み込みニューラルネットワークを用いたマルチクラス画像ラベリングと道路条件の分類を用いた近時間地図作成

Near real-time map building with multi-class image set labelling and classification of road conditions using convolutional neural networks ( http://arxiv.org/abs/2001.09947v1 )

ライセンス: Link先を確認
Sheela Ramanna and Cenker Sengoz and Scott Kehler and Dat Pham(参考訳) 天候は交通と道路の安全に影響を与える重要な要因である。 本稿では,北米を横断する道路カメラやハイウェイカメラが撮影した画像のラベル付けに最先端の畳み込みニューラルネットワークを活用する。 道路カメラスナップショットは、複数のディープラーニングフレームワークを用いた実験で、道路条件による画像の分類に使用された。 これらの実験のトレーニングデータには、乾燥、湿潤、雪と氷、貧弱、オフラインというラベルのついた画像が使用された。 実験では、6つの畳み込みニューラルネットワーク(vgg-16, resnet50, xception, inceptionresnetv2, efficientnet-b0, efficientnet-b4)の異なる構成をテストし、この問題に対する適合性を評価した。 各フレームワークの構成について,精度,精度,リコールを測定した。 また、トレーニングセットは、全体のサイズと個々のクラスの大きさの両方で変化した。 最終トレーニングセットには、前述の5つのクラスを使用してラベル付けされた47,000の画像が含まれていた。 EfficientNet-B4フレームワークは90.6%の精度でこの問題に最も適していることが判明したが、EfficientNet-B0は実行時間の半分で90.3%の精度を達成した。 転送学習を用いたVGG-16は, ハードウェアリソースの限られたデータ取得や擬似ラベリングに非常に有用であることが確認された。 EfficientNet-B4フレームワークはその後リアルタイム生産環境に配置され、画像は継続的にリアルタイムで分類される。 分類された画像は、北米の様々なカメラでリアルタイムの道路状況を示す地図を構築するために使用された。 これらのフレームワークの選択と分析は、リアルタイムマップ構築機能のユニークな要件を考慮している。 本稿では,これらのフレームワークを用いた半自動データセットラベリングのプロセスの詳細な解析を行う。

Weather is an important factor affecting transportation and road safety. In this paper, we leverage state-of-the-art convolutional neural networks in labelling images taken by street and highway cameras located across across North America. Road camera snapshots were used in experiments with multiple deep learning frameworks to classify images by road condition. The training data for these experiments used images labelled as dry, wet, snow/ice, poor, and offline. The experiments tested different configurations of six convolutional neural networks (VGG-16, ResNet50, Xception, InceptionResNetV2, EfficientNet-B0 and EfficientNet-B4) to assess their suitability to this problem. The precision, accuracy, and recall were measured for each framework configuration. In addition, the training sets were varied both in overall size and by size of individual classes. The final training set included 47,000 images labelled using the five aforementioned classes. The EfficientNet-B4 framework was found to be most suitable to this problem, achieving validation accuracy of 90.6%, although EfficientNet-B0 achieved an accuracy of 90.3% with half the execution time. It was observed that VGG-16 with transfer learning proved to be very useful for data acquisition and pseudo-labelling with limited hardware resources, throughout this project. The EfficientNet-B4 framework was then placed into a real-time production environment, where images could be classified in real-time on an ongoing basis. The classified images were then used to construct a map showing real-time road conditions at various camera locations across North America. The choice of these frameworks and our analysis take into account unique requirements of real-time map building functions. A detailed analysis of the process of semi-automated dataset labelling using these frameworks is also presented in this paper.
翻訳日:2023-01-06 07:21:53 公開日:2020-01-27
# データ可視化のための解釈可能なモデルの進化のための遺伝的プログラミング

Genetic Programming for Evolving a Front of Interpretable Models for Data Visualisation ( http://arxiv.org/abs/2001.09578v1 )

ライセンス: Link先を確認
Andrew Lensen, Bing Xue, Mengjie Zhang(参考訳) データ視覚化は、ビッグデータ集合を理解するためのデータマイニングの重要なツールである。 最先端手法 t-Distributed Stochastic Neighbour Embedding など,多くの可視化手法が提案されている。 しかしながら、最も強力な視覚化メソッドには大きな制限がある。データセットの本来の機能から視覚化を作成する方法は、完全に不透明である。 多くのドメインは元の機能の観点からデータを理解する必要があるため、理解可能なモデルを使用する強力な視覚化メソッドが必要となる。 本研究では,データセットから高品質な可視化への解釈可能なマッピングを進化させるための遺伝的プログラミング手法GPtSNEを提案する。 多目的アプローチは、視覚的品質とモデルの複雑さの間に異なるトレードオフをもたらす、単一の実行で様々な可視化を生成するように設計されている。 さまざまなデータセットのベースラインメソッドに対するテストは、既存の視覚化方法よりもデータに対する深い洞察を可能にするGP-tSNEの明確な可能性を示している。 さらに、候補フロントの詳細な分析を通じて多目的アプローチの利点をさらに強調し、複数のモデルがどのようにできるかを示す。

Data visualisation is a key tool in data mining for understanding big datasets. Many visualisation methods have been proposed, including the well-regarded state-of-the-art method t-Distributed Stochastic Neighbour Embedding. However, the most powerful visualisation methods have a significant limitation: the manner in which they create their visualisation from the original features of the dataset is completely opaque. Many domains require an understanding of the data in terms of the original features; there is hence a need for powerful visualisation methods which use understandable models. In this work, we propose a genetic programming approach named GPtSNE for evolving interpretable mappings from a dataset to highquality visualisations. A multi-objective approach is designed that produces a variety of visualisations in a single run which give different trade-offs between visual quality and model complexity. Testing against baseline methods on a variety of datasets shows the clear potential of GP-tSNE to allow deeper insight into data than that provided by existing visualisation methods. We further highlight the benefits of a multi-objective approach through an in-depth analysis of a candidate front, which shows how multiple models can
翻訳日:2023-01-06 07:21:21 公開日:2020-01-27
# 分散音声認識のためのスコアベース置換におけるサブモジュールランクアグリゲーション

Submodular Rank Aggregation on Score-based Permutations for Distributed Automatic Speech Recognition ( http://arxiv.org/abs/2001.10529v1 )

ライセンス: Link先を確認
Jun Qi, Chao-Han Huck Yang, Javier Tejedor(参考訳) 分散音声認識(ASR)では、分散ディープニューラルネットワーク(DNN)ベースのモデルの出力を集約する必要がある。 本研究は、制御モードと教師なしモードの両方で分散ASRシステムに使用できるスコアベースの置換に基づいてランクアグリゲーションを設計するためのサブモジュラー関数の使用について研究する。 具体的には,線形構造凸とネスト構造凸関数を設定するためのlovasz bregman divergenceに基づく集計ランク関数を構成する。 このアルゴリズムは確率勾配降下(SGD)に基づいており、よく訓練された凝集モデルを得ることができる。 分散ASRシステムを用いた実験により,Adaboostのような従来の集計手法よりも音声認識精度が高いことがわかった。 コードはオンライン〜\footnote{https://github.com/uwjunqi/Subrank}で入手できる。

Distributed automatic speech recognition (ASR) requires to aggregate outputs of distributed deep neural network (DNN)-based models. This work studies the use of submodular functions to design a rank aggregation on score-based permutations, which can be used for distributed ASR systems in both supervised and unsupervised modes. Specifically, we compose an aggregation rank function based on the Lovasz Bregman divergence for setting up linear structured convex and nested structured concave functions. The algorithm is based on stochastic gradient descent (SGD) and can obtain well-trained aggregation models. Our experiments on the distributed ASR system show that the submodular rank aggregation can obtain higher speech recognition accuracy than traditional aggregation methods like Adaboost. Code is available online~\footnote{https://github.com/uwjunqi/Subrank}.
翻訳日:2023-01-06 07:21:04 公開日:2020-01-27