このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20200205となっている論文です。

PDF登録状況(公開日: 20200205)

TitleAuthorsAbstract論文公表日・翻訳日
# 量子変換の色収差条件下における光偏光量子ビットの精密トモグラフィー

Precise tomography of optical polarization qubits under conditions of chromatic aberration of quantum transformations ( http://arxiv.org/abs/2001.07255v3 )

ライセンス: Link先を確認
B. I. Bantysh, Yu. I. Bogdanov, N. A. Bogdanova, Yu. A. Kuznetsov(参考訳) 本研究では,偏光量子状態測定の適切なモデルを構築するアルゴリズムを提案する。 このモデルは、波面結晶の寄生拡散と有限放射スペクトル帯域による基底変化変換の色収差を考慮したものである。 色収差が測定結果の情報量を削減することを示す。 情報行列手法を用いて、サンプルサイズとスペクトル帯域幅の異なる値に対して、この効果が量子状態再構成忠実度に与える影響を推定する。 また, 高次波板を用いて測定を行った場合においても, 量子トモグラフィの系統的誤差を抑制できるため, 射影計測の標準モデルを上回ることを実証した。

In this work we present an algorithm of building an adequate model of polarizing quantum state measurement. This model takes into account chromatic aberration of the basis change transformation caused by the parasitic dispersion of the wave plates crystal and finite radiation spectral bandwidth. We show that the chromatic aberration reduces the amount of information in the measurements results. Using the information matrix approach we estimate the impact of this effect on the qubit state reconstruction fidelity for different values of sample size and spectral bandwidth. We also demonstrate that our model outperforms the standard model of projective measurements as it could suppress systematic errors of quantum tomography even when one performs the measurements using wave plates of high order.
翻訳日:2023-06-07 06:21:35 公開日:2020-02-05
# 三成分不均質系における極大絡み合い状態

Absolutely maximally entangled states in tripartite heterogeneous systems ( http://arxiv.org/abs/2001.08821v2 )

ライセンス: Link先を確認
Yi Shen and Lin Chen(参考訳) 絶対極大絡み合い状態(AME)は一般に同質系で定義される。 しかし、量子系は実際的な設定で不均一である可能性が高い。 本研究は, ヘテロジニアス系におけるAME状態の構成に注目したものである。 まず,局所次元の高いアメーム状態を構成する基本要素として,既約なアメーム状態の概念を導入する。 次に,局所次元が$l,m,n$,$3\leq l<m<n\leq m+l-1$の3成分不均質系について検討する。 このような異種系におけるAME状態の存在は、マジックソリューションアレイと呼ばれるアレイの種類と関連していることを示す。 さらに、異種系が既約であるAME状態を特定する。 さらに,既存の2つの ame 状態を用いて,複数のパーティの $k$-uniform 状態を構築する手法を提案する。 また,ヘテロジニアスな ame 状態とマルチアイソメトリ行列との接続を構築し,量子ステアリングへの応用を示す。

Absolutely maximally entangled (AME) states are typically defined in homogeneous systems. However, the quantum system is more likely to be heterogeneous in a practical setup. In this work we pay attention to the construction of AME states in tripartite heterogeneous systems. We first introduce the concept of irreducible AME states as the basic elements to construct AME states with high local dimensions. Then we investigate the tripartite heterogeneous systems whose local dimensions are $l,m,n$, with $3\leq l<m<n\leq m+l-1$. We show the existence of AME states in such heterogeneous systems is related to a kind of arrays called magic solution array. We further identify the AME states in which kinds of heterogeneous systems are irreducible. In addition, we propose a method to construct $k$-uniform states of more parties using two existing AME states. We also build the connection between heterogeneous AME states and multi-isometry matrices, and indicate an application in quantum steering.
翻訳日:2023-06-06 04:49:42 公開日:2020-02-05
# ポテンシャル散乱における輪郭と表面積分

Contour and surface integrals in potential scattering ( http://arxiv.org/abs/2001.11217v2 )

ライセンス: Link先を確認
Giampiero Esposito(参考訳) 定常状態に対するSchr\"{o}dinger方程式が、$n$-次元ユークリッド空間における中心ポテンシャルによって記述された系に対して研究されるとき、定常状態の半径部分は、角運動量量子数 $l$ と次元 $n$ の線型結合であるパラメータ $\lambda$ の偶関数である。 したがって、$n=3$の設定なしでは、$\lambda$の複素値、特に$l$をリアルに保ち、$n$を複雑にすることで達成できる。 したがって、このような補助複素化次元の適切な値に対しては、散乱振幅と位相シフトの結果を得ることができ、これは60年のユカウィポテンシャルの値である $\mathbb{r}^3$ に完全同値である。 さらに、$l$と$n$の両方が複素化されると、2つの複素変数の関数の残余から部分波振幅を回復する可能性がある。 したがって、複素角運動量形式はより広い枠組みに組み込むことができ、そこでは散乱振幅と$\mathbb{r}^3$ の歪曲線の間に対応関係が存在する。

When the Schr\"{o}dinger equation for stationary states is studied for a system described by a central potential in $n$-dimensional Euclidean space, the radial part of stationary states is an even function of a parameter $\lambda$ which is a linear combination of angular momentum quantum number $l$ and dimension $n$, i.e., $\lambda=l+{(n-2)\over 2}$. Thus, without setting a priori $n=3$, complex values of $\lambda$ can be achieved, in particular, by keeping $l$ real and complexifying $n$. For suitable values of such an auxiliary complexified dimension, it is therefore possible to obtain results on scattering amplitude and phase shift that are completely equivalent to the results obtained in the sixties for Yukawian potentials in $\mathbb{R}^3$. Moreover, if both $l$ and $n$ are complexified, the possibility arises of recovering the partial wave amplitude from residues of a function of two complex variables. Thus, the complex angular momentum formalism can be imbedded into a broader framework, where a correspondence exists between the scattering amplitude and a skew curve in $\mathbb{R}^3$.
翻訳日:2023-06-05 04:53:47 公開日:2020-02-05
# モジュラ空間における経路積分

Path Integral in Modular Space ( http://arxiv.org/abs/2002.01604v1 )

ライセンス: Link先を確認
Yigit Yargic(参考訳) モジュラー空間はヒルベルト空間の偏極の族であり、アハラノフのモジュラー変数に基づいてリッチな幾何学的構造を持つ。 ここでは、段階的に、モジュラ偏極における量子調和振動子に対するファインマン経路積分を構築する。 このモジュラーパス積分には、新しい作用、巻線モード、アハラノフ・ボーム相などの新しい特徴が与えられている。 そのサドル点は重ね合わせ状態の列であり、量子参照フレームの理解と一致して非古典的な局所性の概念を持つ。 モジュラーパス積分で見られる作用は、コンパクト位相空間上に存在すると理解でき、新しい対称性を持つ。 最後に、ルジャンドル変換に類似した処方則を提案する。これは、様々な物理系のハミルトニアンに対して、同様のモジュラー作用を生成するために一般的に適用することができる。

The modular spaces are a family of polarizations of the Hilbert space that are based on Aharonov's modular variables and carry a rich geometric structure. We construct here, step by step, a Feynman path integral for the quantum harmonic oscillator in a modular polarization. This modular path integral is endowed with novel features such as a new action, winding modes, and an Aharonov-Bohm phase. Its saddle points are sequences of superposition states and they carry a non-classical concept of locality in alignment with the understanding of quantum reference frames. The action found in the modular path integral can be understood as living on a compact phase space and it possesses a new set of symmetries. Finally, we propose a prescription analogous to the Legendre transform, which can be applied generally to the Hamiltonian of a variety of physical systems to produce similar modular actions.
翻訳日:2023-06-04 16:36:38 公開日:2020-02-05
# ナノファイバーの誘導モードにおける単一光子による単一原子のキラル励起

Chiral excitation of a single atom by a single photon in a guided mode of a nanofiber ( http://arxiv.org/abs/2002.01596v1 )

ライセンス: Link先を確認
Fam Le Kien, Sile Nic Chormaic, and Thomas Busch(参考訳) ナノファイバーの誘導モードにおける単一2レベル原子と単一光子プローブパルスの相互作用について検討した。 本研究では, ナノファイバーの旋回面に原子が双極子を回転させ, プローブパルスを繊維横面の原子位置の半径方向に沿って準分極するカイラル相互作用の状況について検討する。 その結果、原子励起確率、光子透過磁束、光子透過確率は、ファイバー軸に沿ったプローブパルスの伝播方向に依存することがわかった。 対照的に、反射フラックスと反射確率はプローブパルスの伝播方向に依存しない。 その結果,原子励起確率の非対称性パラメータは時間的に変化せず,プローブパルス形状に依存しないことがわかった。

We study the interaction between a single two-level atom and a single-photon probe pulse in a guided mode of a nanofiber. We examine the situation of chiral interaction, where the atom has a dipole rotating in the meridional plane of the nanofiber, and the probe pulse is quasilinearly polarized along the radial direction of the atom position in the fiber transverse plane. We show that the atomic excitation probability, the photon transmission flux, and the photon transmission probability depend on the propagation direction of the probe pulse along the fiber axis. In contrast, the reflection flux and the reflection probability do not depend on the propagation direction of the probe pulse. We find that the asymmetry parameter for the atomic excitation probability does not vary in time and does not depend on the probe pulse shape.
翻訳日:2023-06-04 16:35:51 公開日:2020-02-05
# 相関遷移のシグナルとしての量子統計複雑性測度

Quantum Statistical Complexity Measure as a Signalling of Correlation Transitions ( http://arxiv.org/abs/2002.01590v1 )

ライセンス: Link先を確認
Andr\'e T. Ces\'ario and Diego L. B. Ferreira and Tiago Debarba and Fernando Iemini and Thiago O. Maciel and Reinaldo O. Vianna(参考訳) 本稿では, 量子情報理論の文脈において, 統計的複雑性尺度の量子バージョンを導入し, 量子次数-次数遷移のシグナル伝達関数として利用する。 このような遷移が量子相転移や相関分布の急激な変動など、興味深い物理現象を特徴づける可能性について議論する。 我々はこの測度を2つの正確に解けるハミルトンモデル、すなわち1D$量子イジングモデルとハイゼンベルクXXZスピン-1/2$チェーンに適用する。 また、考慮されたモデルに対する1量子ビットおよび2量子ビットの還元状態に対するこの測度を計算し、有限の系サイズに対する量子相転移の挙動をbethe ansatzを用いて熱力学的極限で解析する。

We introduce a quantum version for the statistical complexity measure, in the context of quantum information theory, and use it as a signalling function of quantum order-disorder transitions. We discuss the possibility for such transitions to characterize interesting physical phenomena, as quantum phase transitions, or abrupt variations in the correlation distributions. We apply our measure to two exactly solvable Hamiltonian models, namely: the $1D$-Quantum Ising Model and the Heisenberg XXZ spin-$1/2$ chain. We also compute this measure for one-qubit and two-qubit reduced states for the considered models, and analyse its behaviour across its quantum phase transitions for finite system sizes as well as in the thermodynamic limit by using Bethe ansatz.
翻訳日:2023-06-04 16:35:32 公開日:2020-02-05
# レーザーからの高次元古典的絡み合い光

High-dimensional classically entangled light from a laser ( http://arxiv.org/abs/2002.01585v1 )

ライセンス: Link先を確認
Yijie Shen, Isaac Nape, Xilin Yang, Xing Fu, Mali Gong, Darryl Naidoo, Andrew Forbes(参考訳) ベクトル的に構造化された光は、通信からイメージング、非分離性空間変化の偏光構造による量子ライクな相関の活用など、様々な用途において有効ツールとして出現している。 ソースでのこれらの状態の生成は依然として困難であり、現在はカスタマイズされたレーザーによる2次元ベクトル状態に制限されている。 ここでは、簡単なレーザーキャビティにおける光波双対性を導入し、3自由度と8次元で分離できない有極性マルチパスモードを生成する。 局所的な例として、グリーンベルガー・ホルン・ザイリンガー基底状態(GHZ)の完全な集合をレーザーで生成し、古典光による高次元多部絡み合いを模倣し、新しい射影アプローチで確認する。 我々は、SU(2)対称性基に基づくレーザーの完全な理論的枠組みを提供し、さらなる利用のための豊富なパラメータ空間を明らかにする。 この手法は、特殊な光学素子を持たない従来のレーザーを必要とせず、より高次元に容易にスケール可能で、古典的に絡み合った構造光の状態を作り出すためのシンプルでエレガントなソリューションを提供し、高次元量子システムをシミュレートし拡張するための新しい応用を開拓する。

Vectorially structured light has emerged as an enabling tool in many diverse applications, from communication to imaging, exploiting quantum-like correlations courtesy of a non-separable spatially varying polarization structure. Creating these states at the source remains challenging and is presently limited to two-dimensional vectorial states by customized lasers. Here we invoke ray-wave duality in a simple laser cavity to produce polarization marked multi-path modes that are non-separable in three degrees of freedom and in eight dimensions. As a topical example, we use our laser to produce the complete set of Greenberger-Horne-Zeilinger (GHZ) basis states, mimicking high-dimensional multi-partite entanglement with classical light, which we confirm by a new projection approach. We offer a complete theoretical framework for our laser based on SU(2) symmetry groups, revealing a rich parameter space for further exploitation. Our approach requires only a conventional laser with no special optical elements, is easily scaleable to higher dimensions, and offers a simple but elegant solution for at-the-source creation of classically entangled states of structured light, opening new applications in simulating and enhancing high-dimensional quantum systems.
翻訳日:2023-06-04 16:35:17 公開日:2020-02-05
# 因果ダイヤモンドの共形量子力学

Conformal quantum mechanics of causal diamonds ( http://arxiv.org/abs/2002.01836v1 )

ライセンス: Link先を確認
Michele Arzano(参考訳) ミンコフスキー時空における一般的な放射状共形キリングベクトルは、共形量子力学における時間発展の生成に関連付けられることが示されている。 これらの共形キリングベクトルのうち、ミンコフスキー時空の因果ダイヤモンドを自身にマッピングするクラスを見つける。 そのようなキリングベクトルの流れは、因果ダイアモンド内で有限寿命の加速オブザーバーの世界線を記述する。 静的ダイヤモンド観測者の時間進化は、双曲ハミルトニアンによって支配される共形量子力学における時間進化と等価であり、時間軸の断片のみをカバーする。 これは、ミンコフスキー空間における慣性観測者の真空状態における静的ダイヤモンド観測者が知覚する非ルーフ温度が、共形量子力学の2点関数の挙動から得られることを示している。

It is shown that a general radial conformal Killing vector in Minkowski space-time can be associated to a generator of time evolution in conformal quantum mechanics. Among these conformal Killing vectors one finds a class which maps causal diamonds in Minkowski space-time into themselves. The flow of such Killing vectors describes worldlines of accelerated observers with a finite lifetime within the causal diamond. Time evolution of static diamond observers is equivalent to time evolution in conformal quantum mechanics governed by a hyperbolic Hamiltonian and covering only a segment of the time axis. This indicates that the Unruh temperature perceived by static diamond observers in the vacuum state of inertial observers in Minkowski space can be obtained from the behaviour of the two-point functions of conformal quantum mechanics.
翻訳日:2023-06-04 16:27:36 公開日:2020-02-05
# dhw形式化による準一次元相対論的量子プラズマにおけるzitterbewegung効果の研究

Study Zitterbewegung effect in a Quasi One-dimensional Relativistic Quantum Plasma by DHW formalization ( http://arxiv.org/abs/2002.01819v1 )

ライセンス: Link先を確認
Safura Nematizadeh Juneghani and Babak Shokri(参考訳) Using Dirac equation together with the Wigner distribution function,the trembling motion,known as Zitterbewegung effect,of moving electrons in quasi-one-dimensional relativistic quantum plasma is theoretically investigated.The relativistic Wigner matrix is used to calculate the mean values of the position and velocity operators for a Dirac gas of electrons.It is found that the oscillatory behavior of measurable quantities could be associated with the Zitterbewegung effect which manifests itself as a damping interference pattern stemming from mixing the positive and negative dispersion modes of Dirac particles.

Using Dirac equation together with the Wigner distribution function,the trembling motion,known as Zitterbewegung effect,of moving electrons in quasi-one-dimensional relativistic quantum plasma is theoretically investigated.The relativistic Wigner matrix is used to calculate the mean values of the position and velocity operators for a Dirac gas of electrons.It is found that the oscillatory behavior of measurable quantities could be associated with the Zitterbewegung effect which manifests itself as a damping interference pattern stemming from mixing the positive and negative dispersion modes of Dirac particles.
翻訳日:2023-06-04 16:27:24 公開日:2020-02-05
# 小物質波ソリトンから原子を1つずつ抽出する

Extracting atoms one by one from a small matter-wave soliton ( http://arxiv.org/abs/2002.01767v1 )

ライセンス: Link先を確認
Fatema Hamodi, Lev Khaykovich(参考訳) 小さい1次元物質波ソリトンの励起は、魅力的なボース・ハバード模型の枠組み内で考慮される。 系の初期の固有状態は、ボース=ハバード・ハミルトニアンの正確な対角化によって見出される。 我々はトンネル速度の弱い変調を誘導することにより固有状態間の遷移を駆動し、残りの原子が永続的な外部変調にもかかわらず局所化されている間に単一の原子を抽出できることを示す。 このスキームは、原子数を決定する小さな物質波ソリトンの実験的な実現を示唆する。 さらに、正確な固有状態の知識は、ハミルトニアンの異なる固有状態間の遷移の選択規則の特定を可能にする。 1つの選択規則はシステムの翻訳対称性に関連している。 別のものはヒルベルト空間全体の部分空間にのみ厳密に適用でき、パリティ対称性に関係している。 強く相互作用する極限において、この選択規則はヒルベルト空間全体に与える影響を示す。 系のダイナミクスに関するシグネチャを議論し、超低温原子を用いて実験的に観測する方法を検討する。

Excitations of small one-dimensional matter-wave solitons are considered within a framework of the attractive Bose-Hubbard model. The initial eigenstates of the system are found by exact diagonalization of the Bose-Hubbard Hamiltonian. We drive transitions between the eigenstates by inducing a weak modulation of the tunnelling rate and show that a single atom can be extracted while the remaining atoms stay localized despite the persistent external modulation. This scheme suggests the experimental realization of small matter-wave solitons with deterministic number of atoms. In addition, the knowledge of exact eigenstates allows identification of the selection rules for transitions between the different eigenstates of the Hamiltonian. One selection rule is related to the translation symmetry of the system. Another one is strictly applicable only on a subspace of the total Hilbert space and is related to the parity symmetry. We show that in the strongly interacting limit this selection rule has implications on the entire Hilbert space. We discuss its signatures on the system's dynamics and consider how it can be observed experimentally with ultracold atoms.
翻訳日:2023-06-04 16:27:16 公開日:2020-02-05
# 量子平衡の現代概念は、ゆらぎ緩和ダイナミクスを除外しない

Modern Concepts of Quantum Equilibration Do Not Rule Out Strange Relaxation Dynamics ( http://arxiv.org/abs/2002.01710v1 )

ライセンス: Link先を確認
Lars Knipschild and Jochen Gemmer(参考訳) 閉量子系における緩和および/または平衡のパズルを明らかにするために、多くの重要な概念が導入された。 これらの概念はすべてハミルトニアンの特定の条件に依存しており、オブザーバブルは$a$であり、初期状態は$\rho$またはそれらの組み合わせである。 数値的な証明と分析により、平衡の条件を満たし、「定型」期待値ダイナミクスを生成する数組の対 h,a$ が存在し、これはすべての初期状態のほとんどに対して $\langle a(t)\rangle \propto f(t)$ となる。 注目すべきことに、$f(t)$の制限は存在するが、熱緩和に関してかなり悪または「不安定」な$f(t)$を除外しない。

Numerous pivotal concepts have been introduced to clarify the puzzle of relaxation and/or equilibration in closed quantum systems. All of these concepts rely in some way on specific conditions on Hamiltonians $H$, observables $A$, and initial states $\rho$ or combinations thereof. We numerically demonstrate and analytically argue that there is a multitude of pairs $H,A$ that meet said conditions for equilibration and generate some "typical" expectation value dynamics which means, $\langle A(t)\rangle \propto f(t)$ approximately holds for the vast majority of all initial states. Remarkably we find that, while restrictions on the $f(t)$ exist, they do not at all exclude $f(t)$ that are rather adverse or "strange" regarding thermal relaxation.
翻訳日:2023-06-04 16:26:06 公開日:2020-02-05
# 量子ネットワークにおけるステアリング情報

Steering information in quantum network ( http://arxiv.org/abs/2002.01669v1 )

ライセンス: Link先を確認
N. Metwally(参考訳) 本稿では、量子ネットワークの1つのメンバーが、他のメンバーの状態を符号化した情報を操れる可能性について検討する。 これらのメンバーは直接または間接的なつながりを持っていると仮定される。 その結果, チャネルの強度の小さい値で操舵能力が増加することがわかった。 直接相互作用ノード間の絡み合いの程度は非相互作用ノードに対して表示されているものよりも小さいが、直接相互作用ノードと非直接ノードのメンバを操る可能性はほぼ同じである。

In this contribution, we investigate the possibility that one member of a quantum network can steer the information that encoded in the state of other member. It is assumed that, these members have a direct or indirect connections. We show that, the steerability increases at small values of the channel' strength. Although, the degree of entanglement between the direct interacted nodes is smaller than that displayed for the non-interacted nodes, the possibilities of steering a member of the direct interacted nodes and the non-direct nodes are almost similar.
翻訳日:2023-06-04 16:25:48 公開日:2020-02-05
# 光ナノファイバーを介する516.6nmにおける$^{87}$Rb $5S_{1/2}$から4D_{3/2}$の電気四極子転移の観察

Observation of the $^{87}$Rb $5S_{1/2}$ to $4D_{3/2}$ electric quadrupole transition at 516.6 nm mediated via an optical nanofibre ( http://arxiv.org/abs/2002.01658v1 )

ライセンス: Link先を確認
Tridib Ray, Ratnesh K. Gupta, Vandna Gokhroo, Jesse L. Everett, Thomas Nieddu, Krishnapriya S. Rajasree and S\'ile Nic Chormaic(参考訳) 光ナノファイバーで導かれる光は、繊維表面から伸びる非常に急勾配の電界勾配を持つことができる。 これは近くの量子エミッターで電気四極子遷移を駆動するために利用することができる。 本稿では,レーザー冷却した$^{87}$Rb原子中の5S_{1/2}$$$\rightarrow$4D_{3/2}$4D_{3/2}$電気四極子遷移を,原子雲に埋め込まれた光ナノファイバーを介して伝播するレーザーパワーのわずか$\mu$Wで観測した。 この研究は、原子物理学における光学ナノファイバーの応用範囲を広げ、より基本的な試験を含む。

Light guided by an optical nanofibre can have a very steep evanescent field gradient extending from the fibre surface. This can be exploited to drive electric quadrupole transitions in nearby quantum emitters. In this paper, we report on the observation of the $5S_{1/2}$ $\rightarrow$ $4D_{3/2}$ electric quadrupole transition at 516.6 nm (in vacuum) in laser-cooled $^{87}$Rb atoms using only a few $\mu$W of laser power propagating through an optical nanofibre embedded in the atom cloud. This work extends the range of applications for optical nanofibres in atomic physics to include more fundamental tests.
翻訳日:2023-06-04 16:25:40 公開日:2020-02-05
# 固有状態熱化仮説は熱化を示唆するか?

Does the Eigenstate Thermalization Hypothesis Imply Thermalization? ( http://arxiv.org/abs/2002.01857v1 )

ライセンス: Link先を確認
Oleg Inozemcev and Igor Volovich(参考訳) 固有状態熱化仮説(ETH)について述べる。 ETHの一般的な定式化は、観測可能な多くの天体量子系の熱化を必ずしも含まないことを示す。 熱化を得るためには、ETH-アンザッツの正準分布やマイクロカノニカル分布を仮定する必要がある。 より一般に、他の平均は、対応する平衡状態につながる一般化されたETH-アンザッツで仮定することができる。

Eigenstate thermalization hypothesis (ETH) is discussed. We show that one common formulation of ETH does not necessarily imply thermalization of an observable of isolated many body quantum system. To get thermalization one has to postulate the canonical or microcanonical distribution in the ETH-ansatz. More generally, any other average can be postulated in the generalized ETH-ansatz which leads to a corresponding equilibration condition.
翻訳日:2023-06-04 16:18:06 公開日:2020-02-05
# 有限貯留層間の量子輸送

Quantum transport between finite reservoirs ( http://arxiv.org/abs/2002.01845v1 )

ライセンス: Link先を確認
Giulio Amato, Heinz-Peter Breuer, Sandro Wimberger, Alberto Rodr\'iguez and Andreas Buchleitner(参考訳) 2つの有限貯水池の間のポテンシャルバイアスによって駆動されると、量子系の粒子電流はコヒーレントを介して初期負荷から進化し、その後準安定相が続き、最終的に平衡によって消失する。 我々は、関連する異なる時間スケールを完全に説明できる理論を定式化し、最終的に平衡への収束を制御する崩壊率のパラメータ依存性を特定する。 我々の定式化は、系内を流れるマクロ電流と内部電流の全体粒子数保存と基本一貫性を保証する。 さらに, フェルミオン粒子またはボソニック粒子のコンダクタンスに対する明確なインプリントを確立する。

When driven by a potential bias between two finite reservoirs, the particle current across a quantum system evolves from an initial loading through a coherent, followed by a metastable phase, and ultimately fades away upon equilibration. We formulate a theory which fully accounts for the associated, distinct time scales, and identifies the parameter dependence of the decay rate which ultimately controls the convergence towards equilibrium. Our formalism guarantees total particle number conservation and fundamental consistency between macroscopic and internal currents flowing in the system. We furthermore establish a clear imprint of the fermionic or bosonic particle character on the resulting conductance.
翻訳日:2023-06-04 16:18:00 公開日:2020-02-05
# 安定化器による多部ベルの不等式の構成

Constructing Multipartite Bell inequalities from stabilizers ( http://arxiv.org/abs/2002.01843v1 )

ライセンス: Link先を確認
Qi Zhao and You Zhou(参考訳) 自己テスト特性を持つベルの不等式は、基本的および実用的両方の応用を持つ量子情報分野において重要な役割を担っている。 しかし、ベルの不等式と多元状態の自己テスト性を見いだすことは一般的に困難であり、実際には既知の候補は多くない。 本研究では,一般安定化状態によって最大に侵害される安定化状態からベルの不等式を構築するための体系的枠組みを提案する。 構成したベルの不等式が本質的にデバイスに依存しない安定化器状態の自己検証が可能であることを示し、この安定化器がデバイスに依存した方法でその状態を一意に決定できる場合に限る。 これにより、デバイス非依存とデバイス依存の検証方法のギャップが埋められる。 我々のフレームワークは自己テスト安定化状態に対するベルの不等式を多数提供できる。 このうちベルの不等式は、(1) 量子的および古典的境界の定数比を持つベルの不等式の族を2N相関式で表し、(2) N+1相関式を用いて全ての前のロバストネス自己検定境界で改善した単対不等式は、多部系における実現には効率的かつ適している。 我々のフレームワークは、従来の検証手法からより実りの多いマルチパーティイトベルの不等式を誘発するだけでなく、その実践的応用の道を開くことができる。

Bell inequality with self-testing property has played an important role in quantum information field with both fundamental and practical applications. However, it is generally challenging to find Bell inequalities with self-testing property for multipartite states and actually there are not many known candidates. In this work, we propose a systematical framework to construct Bell inequalities from stabilizers which are maximally violated by general stabilizer states, with two observables for each local party. We show that the constructed Bell inequalities can self-test any stabilizer state which is essentially device-independent, if and only if these stabilizers can uniquely determine the state in a device-dependent manner. This bridges the gap between device-independent and device-dependent verification methods. Our framework can provide plenty of Bell inequalities for self-testing stabilizer states. Among them, we give two families of Bell inequalities with different advantages: (1) a family of Bell inequalities with a constant ratio of quantum and classical bounds using 2N correlations, (2) Single pair inequalities improving on all previous robustness self-testing bounds using N+1 correlations, which are both efficient and suitable for realizations in multipartite systems. Our framework can not only inspire more fruitful multipartite Bell inequalities from conventional verification methods, but also pave the way for their practical applications.
翻訳日:2023-06-04 16:17:51 公開日:2020-02-05
# カシミール力、因果性、グルジ模型

The Casimir force, causality and the Gurzhi model ( http://arxiv.org/abs/2002.01841v1 )

ライセンス: Link先を確認
G. L. Klimchitskaya, V. M. Mostepanenko, Kailiang Yu, and L. M. Woods(参考訳) 2つの金属板間のカシミール力を計算するために、電子-フォノン相互作用と電子-電子相互作用を考慮したGurzhiモデルと呼ばれる拡張ドルーデモデルを適用する。 gurzhiモデルの誘電誘電誘電率は複素周波数の上部半平面に第1次極を持ち、因果原理に違反するが、光学データによる屈折の複素指数の実験的誘電率と組み合わせて、制限された周波数間隔で使用できることを示した。 低周波でのauのグルジ誘電率の虚部は、単純なドルーデモデルよりも光学データによって与えられる誘電率とよりよく一致している。 2つのauプレート間のカシミール圧力は、グルジ、ドルードおよびプラズマモデルアプローチを用いて計算され、光学データと単純なドルードおよびプラズマモデルを考慮して計算される。 カシミール圧力に対する電子-電子散乱の寄与を推定する。 2つの正確な実験の計測データと比較すると、グルジモデルがカシミールパズルを解けないことが示されるが、結果はこの根本的な問題のさらなる解明を示唆している。

An extended Drude model, termed as the Gurzhi model, which takes into account the electron-phonon and electron-electron interactions, is applied to calculate the Casimir force between two metallic plates. It is shown that although the dielectric permittivity of the Gurzhi model has a first order pole in the upper half-plane of complex frequencies and, thus, violates the causality principle, it can be used in a restricted frequency interval in combination with the experimental permittivity determined by the optical data for the complex index of refraction. The imaginary part of the Gurzhi dielectric permittivity of Au at low frequencies demonstrates better agreement with the permittivity given by the optical data than the simple Drude model. The Casimir pressure between two Au plates is computed using the Gurzhi, Drude and plasma model approaches, taking into account the optical data, as well as with the simple Drude and plasma models. The contribution of the electron-electron scattering to the Casimir pressure is estimated. Although a comparison with the measurement data of two precise experiments show that the Gurzhi model does not resolve the Casimir puzzle, the obtained results suggest further clarification of this fundamental problem.
翻訳日:2023-06-04 16:17:23 公開日:2020-02-05
# フィンランドの女性はソフトウェアエンジニアリングの役割に応募できないのか? 調査データの予備分析

What prevents Finnish women from applying to software engineering roles? A preliminary analysis of survey data ( http://arxiv.org/abs/2002.01840v1 )

ライセンス: Link先を確認
Annika Wolff, Antti Knutas, Paula Savolainen(参考訳) フィンランドは男女平等の実績が良い国だと考えられている。 統計では、フィンランドは他の多くの国と比較して職場の平等性が良いという考え方を支持しているが、改善すべき領域は多い。 本稿では,ソフトウェア工学の役割を得る上で女性が直面する問題に焦点をあてる。 我々は252人の調査データについて予備分析を行った。 これらは主に、ソフトウェア産業における平等と多様性の向上を目的としたmimmit koodaaイニシアチブに参加することで、プログラミングの役割獲得に関心を示した女性である。 この調査は、初期の経験が後のキャリア選択にどんな影響を及ぼすか、そして技術関連のキャリアを追求するために必要な有効性と自信の感情を理解することを求めた。 これらの最初の発見は、女性の自己効力感やソフトウェア工学に対する態度が初期の経験によって形成されていることを示している。 よりネガティブな経験は、この分野への関心を表明しながらも、将来ソフトウェアエンジニアリングの役割に取り組む可能性を減らす。

Finland is considered a country with a good track record in gender equality. Whilst statistics support the notion that Finland is performing well compared to many other countries in terms of workplace equality, there are still many areas for improvement. This paper focuses on the problems that some women face in obtaining software engineering roles. We report a preliminary analysis of survey data from 252 respondents. These are mainly women who have shown an interest in gaining programming roles by joining the Mimmit koodaa initiative, which aims to increase equality and diversity within the software industry. The survey sought to understand what early experiences may influence later career choices and feelings of efficacy and confidence needed to pursue technology-related careers. These initial findings reveal that women's feelings of computing self-efficacy and attitudes towards software engineering are shaped by early experiences. More negative experiences decrease the likelihood of working in software engineering roles in the future, despite expressing an interest in the field.
翻訳日:2023-06-04 16:17:03 公開日:2020-02-05
# 与えられたエネルギースペクトルに関連するポテンシャル関数の構成

Construction of potential functions associated with a given energy spectrum ( http://arxiv.org/abs/2002.03803v1 )

ライセンス: Link先を確認
A. D. Alhaidari(参考訳) エネルギーおよび物理パラメータにおける直交多項式に基づく量子力学の定式化を用いて,与えられたエネルギースペクトルに対応する可解問題に対するポテンシャル関数のクラスを与える手法を提案する。 本研究では、連続双対ハーン多項式に付随する連続エネルギースペクトルと離散エネルギースペクトルの混合による問題のクラスを研究する。 これには1次元対数ポテンシャルと3次元クーロンプラス線形ポテンシャルが含まれる。

Using a formulation of quantum mechanics based on orthogonal polynomials in the energy and physical parameters, we present a method that gives the class of potential functions for exactly solvable problems corresponding to a given energy spectrum. In this work, we study the class of problems with a mix of continuous and discrete energy spectrum that are associated with the continuous dual Hahn polynomial. These include the one-dimensional logarithmic potential and the three-dimensional Coulomb plus linear potential.
翻訳日:2023-06-04 16:08:40 公開日:2020-02-05
# 量子場理論のための固定点量子回路

Fixed-Point Quantum Circuits for Quantum Field Theories ( http://arxiv.org/abs/2002.02018v1 )

ライセンス: Link先を確認
Natalie Klco and Martin J. Savage(参考訳) 正規化群の概念と有効演算子は、デジタル量子デバイス上の非相互作用スカラー場理論の基底状態を作成するための局所化ユニタリを効率的に決定するために用いられる。 これらの方法では、小さな空間体積の古典的に計算された基底状態は、古典的ではない量子レジスタで基底状態を作成する演算子を決定するために、スカラー場の理論と相互作用するためにも用いられる。 相関関数の指数関数的減衰とデジタル化アーティファクトの二重指数的抑制により、導出量子回路は、近距離の量子デバイスに既に関係していることが期待される。

Renormalization group ideas and effective operators are used to efficiently determine localized unitaries for preparing the ground states of non-interacting scalar field theories on digital quantum devices. With these methods, classically computed ground states in a small spatial volume can be used to determine operators for preparing the ground state in a beyond-classical quantum register, even for interacting scalar field theories. Due to the exponential decay of correlation functions and the double exponential suppression of digitization artifacts, the derived quantum circuits are expected to be relevant already for near-term quantum devices.
翻訳日:2023-06-04 16:07:58 公開日:2020-02-05
# ワイル関係を用いたスピン-ボソン相互作用の非摂動解析

A non-perturbative analysis of spin-boson interactions using the Weyl relations ( http://arxiv.org/abs/2002.01994v1 )

ライセンス: Link先を確認
Jos\'e de Ram\'on and Eduardo Martin-Martinez(参考訳) 本研究では,これらの相互作用が時間内に強く局所化される場合,ボゾン環境と繰り返し相互作用する2レベル量子系の力学の非摂動解析を行う。 我々はワイル関係を用いて、問題の非摂動性にもかかわらずスピンの結果として生じる状態の閉式を得る。 さらに,2段階系の力学において,環境の量子力学的特徴が果たす役割について,力学における可視性とメモリ効果について検討し,結論を導いた。

We perform a non-perturbative analysis of the dynamics of a two-level quantum system subjected to repeated interactions with a bosonic environment when these interactions are intense and localized in time. We use the Weyl relations to obtain a closed expression for the resulting state of the spin despite the non-perturbative nature of the problem. Furthermore, we study divisibility and memory effects in the dynamics and draw conclusions about the role that the quantum-mechanical features of the environment play on the dynamics of the two-level system.
翻訳日:2023-06-04 16:07:28 公開日:2020-02-05
# 強磁性ヘテロ構造におけるスピン軌道トルクの微視的起源:第一原理アプローチ

Microscopic Origin of Spin-Orbit Torque in Ferromagnetic Heterostructures: A First Principles Approach ( http://arxiv.org/abs/2002.01983v1 )

ライセンス: Link先を確認
Farzad Mahfouzi, Rahul Mishra, Po-Hao Chang, Hyunsoo Yang, Nicholas Kioussis(参考訳) 本稿では,通常の金属(nm)/強磁性(fm)ヘテロ構造におけるスピン軌道トルク(sot)の起源を解明する, {\it ab initio} に基づく理論的枠組みを提案する。 SOTは2つのコントリビューション、すなわち {\it spin-Hall} と {\it spin-orbital} 成分に分解される。 私たちはそれを見つける。 i)} Field-Like (FL) SOT はスピン軌道成分と {\it によって支配される (ii) 両成分は厚膜Ptの限界に匹敵する減衰様トルクに寄与する。 DL-SOTへのスピン軌道成分の寄与は、強いSOC結合強度を持つNMに対してのみ存在する。 FL-SOTは非平衡スピン分解軌道モーメントの蓄積によって表現できることを示した。 Pt/Co二層膜における実験的に報告された酸素誘起のFL-SOTの符号反転は、界面NM原子上での多数スピン軌道モーメントの蓄積の顕著な減少に起因する。

We present an {\it ab initio}-based theoretical framework which elucidates the origin of the spin-orbit torque (SOT) in Normal-Metal(NM)/Ferromagnet(FM) heterostructures. The SOT is decomposed into two contributions, namely, {\it spin-Hall} and the {\it spin-orbital} components. We find that {\it (i)} the Field-Like (FL) SOT is dominated by the spin-orbital component and {\it (ii)} both components contribute to the damping-like torque with comparable magnitude in the limit of thick Pt film. The contribution of the spin-orbital component to the DL-SOT is present only for NMs with strong SOC coupling strength. We demonstrate that the FL-SOT can be expressed in terms of the non-equilibrium spin-resolved orbital moment accumulation. The calculations reveal that the experimentally reported oxygen-induced sign-reversal of the FL-SOT in Pt/Co bilayers is due to the significant reduction of the majority-spin orbital moment accumulation on the interfacial NM atoms.
翻訳日:2023-06-04 16:07:21 公開日:2020-02-05
# 非エルミート量子系における時間依存性

Time-dependence in non-Hermitian quantum systems ( http://arxiv.org/abs/2002.01977v1 )

ライセンス: Link先を確認
Thomas Frith(参考訳) 非エルミート量子力学において、明示的な時間依存性の一貫性と一貫した枠組みを提案する。 非エルミート量子力学の領域は過去20年間で急速に成長している。 これは、$\mathcal{pt}$-symmetric non-hermitian 系が実エネルギー固有値とユニタリ時間発展を示すという事実によって導かれる。 歴史的に、非エルミート量子力学の世界への時間の導入は概念的に難しい問題であり、ハミルトニアンが観測不能になることが要求された。 我々は,新しい観測可能なエネルギー演算子を導入することでこの問題を解決し,この設定においてその意図がなぜ必要かつ自然な進歩なのかを説明する。 時間の導入によって、$\mathcal{PT}$-対称性が自然に壊れるパラメータの体系が理解できるようになった。 通常、時間非依存の環境では、エネルギー固有値は複雑になり、波動関数は漸近的に非有界である。 時間依存的な設定では、この壊れた対称性を修正でき、自然に壊れた$\mathcal{PT}$レジームを解析できる。 2\times2$行列モデルから始まり、高次元行列モデルと無限ヒルベルト空間を持つ結合調和振動子系へと拡張する。 さらに,このフレームワークを用いて時間依存の準厳密解モデルの解析を行う。 本論文ではエントロピーの「永遠の命」について述べる。 通常、環境に結合した絡み合った量子系では、エントロピーは急速にゼロに崩壊する。 しかし、自然に壊れた状態では、エントロピーは漸近的に非ゼロ値に崩壊する。 我々は時間に依存しない非エルミート的ハミルトニアンのdarbouxおよびdarboux/crum変換のためのエレガントなフレームワークを作成する。

We present a coherent and consistent framework for explicit time-dependence in non-Hermitian quantum mechanics. The area of non-Hermitian quantum mechanics has been growing rapidly over the past twenty years. This has been driven by the fact that $\mathcal{PT}$-symmetric non-Hermitian systems exhibit real energy eigenvalues and unitary time evolution. Historically, the introduction of time into the world of non-Hermitian quantum mechanics has been a conceptually difficult problem to address, as it requires the Hamiltonian to become unobservable. We solve this issue with the introduction of a new observable energy operator and explain why its instigation is a necessary and natural progression in this setting. For the first time, the introduction of time has allowed us to make sense of the parameter regime in which the $\mathcal{PT}$-symmetry is spontaneously broken. Ordinarily, in the time-independent setting, the energy eigenvalues become complex and the wave functions are asymptotically unbounded. We demonstrate that in the time-dependent setting this broken symmetry can be mended and analysis on the spontaneously broken $\mathcal{PT}$ regime is indeed possible. We provide many examples of this mending on a wide range of different systems, beginning with a $2\times2$ matrix model and extending to higher dimensional matrix models and coupled harmonic oscillator systems with infinite Hilbert space. Furthermore, we use the framework to perform analysis on time-dependent quasi-exactly solvable models. We present the "eternal life" of entropy in this thesis. Ordinarily, for entangled quantum systems coupled to the environments, the entropy decays rapidly to zero. However, in the spontaneously broken regime, we find the entropy decays asymptotically to a non-zero value. We create an elegant framework for Darboux and Darboux/Crum transformations for time-dependent non-Hermitian Hamiltonians.
翻訳日:2023-06-04 16:07:02 公開日:2020-02-05
# スピンキラリティと超伝導量子ビットの3体相互作用の合成

Synthesizing three-body interaction of spin chirality with superconducting qubits ( http://arxiv.org/abs/2002.01951v1 )

ライセンス: Link先を確認
Wuxin Liu, Wei Feng, Wenhui Ren, Da-Wei Wang, and Haohua Wang(参考訳) 超伝導量子ビットは、マイクロファブリケーションの性質によって得られる柔軟性と拡張性のため、量子多体系の中心にある複雑な力学の量子シミュレーションのための競合プラットフォームを提供する。 しかし、マルチキュービットデバイスでは、量子ビット間のカップリングの物理的形式は電気(キャパシタ)か磁場(インダクタ)のいずれかであり、関連する二次場エネルギーはハミルトニアンにおける2体相互作用のみが直接実現可能であると判断する。 本稿では,フロッケ工学に基づく超伝導回路における3体スピンキラリティー相互作用を実験的に合成する。 コンデンサを介して接続された量子ビットの共振周波数を周期的に変調することにより、量子ビット-量子カップリングを動的にオン/オフし、さらに3量子ループにおける励起のキラルフローを生成することができる。 この結果は、量子シミュレーションタスクにおける自由度を拡大する可能性があるマルチキュービット超伝導デバイスにおける工学的および多体相互作用へのステップである。

Superconducting qubits provide a competitive platform for quantum simulation of complex dynamics that lies at the heart of quantum many-body systems, because of the flexibility and scalability afforded by the nature of microfabrication. However, in a multiqubit device, the physical form of couplings between qubits is either an electric (capacitor) or magnetic field (inductor), and the associated quadratic field energy determines that only two-body interaction in the Hamiltonian can be directly realized. Here we propose and experimentally synthesize the three-body spin-chirality interaction in a superconducting circuit based on Floquet engineering. By periodically modulating the resonant frequencies of the qubits connected with each other via capacitors, we can dynamically turn on and off qubit-qubit couplings, and further create chiral flows of the excitations in the three-qubit circular loop. Our result is a step toward engineering dynamical and many-body interactions in multiqubit superconducting devices, which potentially expands the degree of freedom in quantum simulation tasks.
翻訳日:2023-06-04 16:06:27 公開日:2020-02-05
# 超流動遷移における2次元ボース気体の音波伝搬

Sound propagation in a two-dimensional Bose gas across the superfluid transition ( http://arxiv.org/abs/2002.01942v1 )

ライセンス: Link先を確認
Vijay Pal Singh and Ludwig Mathey(参考訳) Physの最近の実験に触発された。 Rev. Lett. 121, 145301 (2018) において, 超流動-熱転移の2次元ボース気体中の音伝搬を古典場力学を用いて検討した。 遷移温度以下ではボゴリューボフモードと非ボゴリューボフモードが、その上には通常の音モードと拡散モードが、力学構造因子から決定される。 実験手法のシミュレーションは, 測定速度と一致し, 測定値の遷移温度以下でボゴリボフモードを検出することを示す。 遷移の上方では、低密度または弱い相互作用の通常の音モードや、高密度または強い相互作用の拡散モードを検出する。 重要な観測として,非ボゴリボフモードがボゴリボフモードよりも高い速度を持つ弱い結合状態について,流体力学のシナリオとは対照的に論じる。 両モードを同時に検出するステップパルス密度摂動により,この状態を検出することを提案する。

Motivated by recent experiments in Phys. Rev. Lett. 121, 145301 (2018), we study sound propagation in a two-dimensional (2D) Bose gas across the superfluid-thermal transition using classical field dynamics. Below the transition temperature we find a Bogoliubov and a non-Bogoliubov mode, above it we find the normal sound mode and the diffusive mode, as we determine from the dynamical structure factor. Our simulations of the experimental procedure agree with the measured velocities, and show that below the transition temperature the measurements detect the Bogoliubov mode. Above the transition, they either detect the normal sound mode for low densities or weak interactions, or the diffusive mode for high densities or strong interactions. As a key observation, we discuss the weak coupling regime in which the non-Bogoliubov mode has a higher velocity than the Bogoliubov mode, in contrast to a hydrodynamic scenario. We propose to detect this regime via step-pulse density perturbation, which simultaneously detects both sound modes
翻訳日:2023-06-04 16:06:04 公開日:2020-02-05
# 人工知能と分散レジャー技術の収束について:スコーピングのレビューと今後の研究動向

On the Convergence of Artificial Intelligence and Distributed Ledger Technology: A Scoping Review and Future Research Agenda ( http://arxiv.org/abs/2001.11017v2 )

ライセンス: Link先を確認
Konstantin D. Pandl, Scott Thiebes, Manuel Schmidt-Kraepelin, Ali Sunyaev(参考訳) 人工知能(AI)と分散Ledger Technology(DLT)の開発は、現在、アカデミックと実践において活発に議論されている。 aiはデータを処理して、以前は人間にしかできなかったタスクを実行する。 DLTは、不確実な環境で参加者のグループ間でデータに関するコンセンサスを生み出す可能性がある。 近年の研究では、どちらの技術も同じシステムでも使われている。 例えば、セキュアな分散台帳の設計や、複数のノードに分散したアライアンス学習システムの作成などだ。 これは、過去に情報技術における大きなイノベーションの道を開いた技術的収束につながる可能性がある。 これまでの作業では、AIとDLTの統合による潜在的なメリットをいくつか挙げているが、いずれのテクノロジの現実的な統合ケースを記述するための限定的な理論的フレームワークのみを提供している。 我々は,先行研究に関する体系的な文献レビューを行い,将来的な研究機会を厳格に提供して貢献することを目指している。 この研究は、AIやDLTの研究者が現在の分野における限界を克服し、実践者が両方の技術の収束とともにシステムを開発するのに役立つ。

Developments in Artificial Intelligence (AI) and Distributed Ledger Technology (DLT) currently lead to lively debates in academia and practice. AI processes data to perform tasks that were previously thought possible only for humans. DLT has the potential to create consensus over data among a group of participants in uncertain environments. In recent research, both technologies are used in similar and even the same systems. Examples include the design of secure distributed ledgers or the creation of allied learning systems distributed across multiple nodes. This can lead to technological convergence, which in the past, has paved the way for major innovations in information technology. Previous work highlights several potential benefits of the convergence of AI and DLT but only provides a limited theoretical framework to describe upcoming real-world integration cases of both technologies. We aim to contribute by conducting a systematic literature review on previous work and providing rigorously derived future research opportunities. This work helps researchers active in AI or DLT to overcome current limitations in their field, and practitioners to develop systems along with the convergence of both technologies.
翻訳日:2023-01-05 21:29:02 公開日:2020-02-05
# NOMAを用いた省エネルギーマルチUAV型ランダムアクセスIoTネットワークのための制約付き深層強化学習

Constrained Deep Reinforcement Learning for Energy Sustainable Multi-UAV based Random Access IoT Networks with NOMA ( http://arxiv.org/abs/2002.00073v2 )

ライセンス: Link先を確認
Sami Khairy, Prasanna Balaprakash, Lin X. Cai, Yu Cheng(参考訳) 本論文では,太陽熱による無人航空機(UAV)がIoTデバイスからリモートサーバにデータを中継する無線IoTネットワークの大規模チャネルアクセスを改善するために,非直交多重アクセス(Noma)技術を適用する。 具体的には、IoTデバイスは、アダプティブな$p$パーセンスタンススロットのAlohaプロトコルを使用して共有無線チャネルにアクセスし、ソーラーパワーのUAVは、継承干渉キャンセル(SIC)を採用して、IoTデバイスから複数の受信データをデコードしてアクセス効率を向上させる。 エネルギー持続可能なキャパシティ最適化ネットワークを実現するため,複数のエネルギー制約を伴う確率的制御問題として,動的マルチUAV高度制御とIoTデバイスのマルチセル無線チャネルアクセス管理の連立問題を考察した。 最適制御ポリシを学習するために,まず,この問題をCMDP (Constrained Markov Decision Process) として定式化し,ラグランジアン原始双対ポリシー最適化に基づくオンラインモデル自由制約深層強化学習 (CDRL) アルゴリズムを提案する。 大規模なシミュレーションにより,提案アルゴリズムはUAV間の協調政策を学習し,UAVのエネルギー持続可能性を維持しながら,UAVの高度とチャネルアクセス確率を動的に制御し,最大長期ネットワーク容量を達成することができることを示した。 提案アルゴリズムは、エネルギーコストを考慮に入れた報酬形成によるDeep RLベースのソリューションよりも優れており、実現可能なDRLベースのソリューションよりも82.4\%高く、エネルギー制約のないシステムよりもわずか6.47\%低い時間平均システム容量を実現している。

In this paper, we apply the Non-Orthogonal Multiple Access (NOMA) technique to improve the massive channel access of a wireless IoT network where solar-powered Unmanned Aerial Vehicles (UAVs) relay data from IoT devices to remote servers. Specifically, IoT devices contend for accessing the shared wireless channel using an adaptive $p$-persistent slotted Aloha protocol; and the solar-powered UAVs adopt Successive Interference Cancellation (SIC) to decode multiple received data from IoT devices to improve access efficiency. To enable an energy-sustainable capacity-optimal network, we study the joint problem of dynamic multi-UAV altitude control and multi-cell wireless channel access management of IoT devices as a stochastic control problem with multiple energy constraints. To learn an optimal control policy, we first formulate this problem as a Constrained Markov Decision Process (CMDP), and propose an online model-free Constrained Deep Reinforcement Learning (CDRL) algorithm based on Lagrangian primal-dual policy optimization to solve the CMDP. Extensive simulations demonstrate that our proposed algorithm learns a cooperative policy among UAVs in which the altitude of UAVs and channel access probability of IoT devices are dynamically and jointly controlled to attain the maximal long-term network capacity while maintaining energy sustainability of UAVs. The proposed algorithm outperforms Deep RL based solutions with reward shaping to account for energy costs, and achieves a temporal average system capacity which is $82.4\%$ higher than that of a feasible DRL based solution, and only $6.47\%$ lower compared to that of the energy-constraint-free system.
翻訳日:2023-01-05 07:04:57 公開日:2020-02-05
# ヒューマンロボットインタラクションにおけるパーソナリティのレビュー

A Review of Personality in Human Robot Interactions ( http://arxiv.org/abs/2001.11777v2 )

ライセンス: Link先を確認
Lionel P. Robert, Rasha Alahmad, Connor Esterwood, Sangmi Kim, Sangseok You, Qiaoning Zhang(参考訳) 人間のロボットの相互作用の質を理解する上で、パーソナリティは重要な要素であると認識されている。 それにもかかわらず、この分野の研究は断片化され、コヒーレントな枠組みが欠如している。 これによって、私たちが知っていることを理解し、知らないことを識別することが難しくなります。 その結果、人間とロボットの相互作用における個性に関する知識は、組織やより広い社会におけるロボットの展開に及ばなかった。 この欠点に対処するため,本稿では83の論文と84の異なる研究をレビューし,ロボットのパーソナリティ研究の現状について述べる。 本論は,(1)主要なテーマ研究分野に注目し,(2)文献のギャップを特定し,(3)文献から主要な結論を導き,提示し,(4)今後の研究へのガイダンスを提供する。

Personality has been identified as a vital factor in understanding the quality of human robot interactions. Despite this the research in this area remains fragmented and lacks a coherent framework. This makes it difficult to understand what we know and identify what we do not. As a result our knowledge of personality in human robot interactions has not kept pace with the deployment of robots in organizations or in our broader society. To address this shortcoming, this paper reviews 83 articles and 84 separate studies to assess the current state of human robot personality research. This review: (1) highlights major thematic research areas, (2) identifies gaps in the literature, (3) derives and presents major conclusions from the literature and (4) offers guidance for future research.
翻訳日:2023-01-05 06:56:12 公開日:2020-02-05
# 人間中心の説明可能なAI:リフレクティブ・ソシオ技術的アプローチに向けて

Human-centered Explainable AI: Towards a Reflective Sociotechnical Approach ( http://arxiv.org/abs/2002.01092v2 )

ライセンス: Link先を確認
Upol Ehsan and Mark O. Riedl(参考訳) 説明-ポストホックの解釈可能性の一形態-AIが複雑で敏感な社会技術システムを拡大し続け、システムにアクセスできるようにするための道具的役割を果たす。 本稿では,人間を技術設計の中心に据えるアプローチとして,Human-centered Explainable AI(HCXAI)を紹介する。 それは、価値の相互作用、対人的ダイナミクス、そしてAIシステムの社会的に位置する性質を考慮し、人間の「誰」が誰であるかを包括的に理解する。 特に、我々は社会学的アプローチの反映を提唱する。 HCXAIは、技術的進歩と人的要因の理解が共進化していることを示す非技術者のための説明システムである。 このケーススタディに基づいて,人間の「誰」の理解をさらに深め,人間とコンピュータの相互作用の1対1を超えて拡張する,オープンリサーチの質問を提示する。 最後に,HCXAIパラダイムをクリティカル・テクニカル・プラクティスの観点で実践し,価値に敏感なデザインや参加型デザインといったHCIの戦略を補完することで,知的盲点を理解するだけでなく,新たなデザインや研究空間を開放することも提案する。

Explanations--a form of post-hoc interpretability--play an instrumental role in making systems accessible as AI continues to proliferate complex and sensitive sociotechnical systems. In this paper, we introduce Human-centered Explainable AI (HCXAI) as an approach that puts the human at the center of technology design. It develops a holistic understanding of "who" the human is by considering the interplay of values, interpersonal dynamics, and the socially situated nature of AI systems. In particular, we advocate for a reflective sociotechnical approach. We illustrate HCXAI through a case study of an explanation system for non-technical end-users that shows how technical advancements and the understanding of human factors co-evolve. Building on the case study, we lay out open research questions pertaining to further refining our understanding of "who" the human is and extending beyond 1-to-1 human-computer interactions. Finally, we propose that a reflective HCXAI paradigm-mediated through the perspective of Critical Technical Practice and supplemented with strategies from HCI, such as value-sensitive design and participatory design--not only helps us understand our intellectual blind spots, but it can also open up new design and research spaces.
翻訳日:2023-01-04 03:27:06 公開日:2020-02-05
# 潜時正規化ガウス混合生成対向ネットワークによる音響異常検出

Acoustic anomaly detection via latent regularized gaussian mixture generative adversarial networks ( http://arxiv.org/abs/2002.01107v2 )

ライセンス: Link先を確認
Chengwei Chen and Pan Chen and Lingyu Yang and Jinyuan Mo and Haichuan Song and Yuan Xie and Lizhuang Ma(参考訳) 音響異常検出は、異常な音響信号を正常な信号と区別することを目的としている。 クラス不均衡の問題と異常な事例の欠如に悩まされる。 さらに、トレーニング目的のために、あらゆる種類の異常または未知のサンプルを収集することは、実用的で時間を要する。 本稿では,半教師あり学習の枠組みに基づいて,新しいガウス混合生成逆ネットワーク (gmgan) を提案し,その基礎となる構造はスペクトログラム再構成空間で捉えられるだけでなく,潜在表現の空間でも識別的に制限できることを示した。 実験により,本モデルは従来の手法よりも明らかに優れており,DCASEデータセットの最先端結果が得られることが示された。

Acoustic anomaly detection aims at distinguishing abnormal acoustic signals from the normal ones. It suffers from the class imbalance issue and the lacking in the abnormal instances. In addition, collecting all kinds of abnormal or unknown samples for training purpose is impractical and timeconsuming. In this paper, a novel Gaussian Mixture Generative Adversarial Network (GMGAN) is proposed under semi-supervised learning framework, in which the underlying structure of training data is not only captured in spectrogram reconstruction space, but also can be further restricted in the space of latent representation in a discriminant manner. Experiments show that our model has clear superiority over previous methods, and achieves the state-of-the-art results on DCASE dataset.
翻訳日:2023-01-04 03:01:35 公開日:2020-02-05
# 深部埋め込み特徴を用いたマルチチャネル音声分離のための空間的・スペクトル的深部注意融合

Spatial and spectral deep attention fusion for multi-channel speech separation using deep embedding features ( http://arxiv.org/abs/2002.01626v1 )

ライセンス: Link先を確認
Cunhang Fan, Bin Liu, Jianhua Tao, Jiangyan Yi, and Zhengqi Wen(参考訳) マルチチャネルディープクラスタリング(MDC)は、音声分離に優れた性能を得た。 しかし、MDCは空間的特徴を付加情報としてのみ適用する。 したがって、空間的特徴とスペクトル的特徴の相互関係を知ることは困難である。 さらに、mdcのトレーニング目標は、実際の分離ソースではなく、埋め込みベクトルで定義されており、分離性能を損なう可能性がある。 本研究では,スペクトル特性と空間特性の重み付けを動的に制御し,それらを深く結合する深層注意融合法を提案する。 さらに、MDCのトレーニング目標問題を解決するために、実際の分離されたソースをトレーニング目標として使用する。 具体的には,深層クラスタリングネットワークを用いて深層埋め込み機能を抽出する。 教師なしのK平均クラスタリングを使ってバイナリマスクを推定する代わりに、他の教師付きネットワークを使用して、これらの深い埋め込み特徴からソフトマスクを学習する。 実験はwsj0-2mixデータセットの空間的残響バージョンを用いて行った。 実験の結果,提案手法はMDCベースラインよりも優れ,オラクル理想のバイナリマスク(IBM)よりも優れていた。

Multi-channel deep clustering (MDC) has acquired a good performance for speech separation. However, MDC only applies the spatial features as the additional information. So it is difficult to learn mutual relationship between spatial and spectral features. Besides, the training objective of MDC is defined at embedding vectors, rather than real separated sources, which may damage the separation performance. In this work, we propose a deep attention fusion method to dynamically control the weights of the spectral and spatial features and combine them deeply. In addition, to solve the training objective problem of MDC, the real separated sources are used as the training objectives. Specifically, we apply the deep clustering network to extract deep embedding features. Instead of using the unsupervised K-means clustering to estimate binary masks, another supervised network is utilized to learn soft masks from these deep embedding features. Our experiments are conducted on a spatialized reverberant version of WSJ0-2mix dataset. Experimental results show that the proposed method outperforms MDC baseline and even better than the oracle ideal binary mask (IBM).
翻訳日:2023-01-03 22:05:58 公開日:2020-02-05
# あなたがどこから来るのか知っている。ソーシャルメディアソースがaiモデルのパフォーマンスに与える影響について

I Know Where You Are Coming From: On the Impact of Social Media Sources on AI Model Performance ( http://arxiv.org/abs/2002.01726v1 )

ライセンス: Link先を確認
Qi Yang, Aleksandr Farseev, Andrey Filchenkov(参考訳) 今日では、ソーシャルネットワークは人間の日常生活において重要な役割を担い、余暇な時間消費とは無関係である。 実際、友人や同僚とのインスタントコミュニケーションは、私たちの日々のやりとりの重要な要素となり、複数の新しいソーシャルネットワークタイプの出現をもたらしています。 このようなネットワークに参加することで、個人はさまざまな視点から活動を記述する複数のデータポイントを生成し、例えば、パーソナライズされたレコメンデーションやユーザープロファイリングといったアプリケーションにさらに利用することができる。 しかし、異なるソーシャルメディアネットワークが機械学習モデルのパフォーマンスに与える影響は、まだ包括的に研究されていない。 特に、複数のソーシャルネットワークからのマルチモーダルデータのモデリングに関する文献は、比較的スパースであり、この予備研究でこのトピックを深く掘り下げるきっかけとなった。 特に本研究では,異なるソーシャルネットワークのマルチモーダルデータを用いた学習において,異なる機械学習モデルの性能について検討する。 最初の実験結果から,ソーシャルネットワークの選択がパフォーマンスに影響を与え,適切なデータソースの選択が重要であることが明らかとなった。

Nowadays, social networks play a crucial role in human everyday life and no longer purely associated with spare time spending. In fact, instant communication with friends and colleagues has become an essential component of our daily interaction giving a raise of multiple new social network types emergence. By participating in such networks, individuals generate a multitude of data points that describe their activities from different perspectives and, for example, can be further used for applications such as personalized recommendation or user profiling. However, the impact of the different social media networks on machine learning model performance has not been studied comprehensively yet. Particularly, the literature on modeling multi-modal data from multiple social networks is relatively sparse, which had inspired us to take a deeper dive into the topic in this preliminary study. Specifically, in this work, we will study the performance of different machine learning models when being learned on multi-modal data from different social networks. Our initial experimental results reveal that social network choice impacts the performance and the proper selection of data source is crucial.
翻訳日:2023-01-03 22:05:41 公開日:2020-02-05
# Sparse Kernel-based Occupancy Mapping を用いた未知環境における自律ナビゲーション

Autonomous Navigation in Unknown Environments using Sparse Kernel-based Occupancy Mapping ( http://arxiv.org/abs/2002.01921v1 )

ライセンス: Link先を確認
Thai Duong, Nikhil Das, Michael Yip, Nikolay Atanasov(参考訳) 本稿では,未知環境内を走行する自律ロボットのリアルタイム占有マッピングと衝突点検について述べる。 本稿では,カーネルパーセプトロン分類器の決定境界によって占有空間と自由空間を分離する新しいマップ表現を提案する。 我々は,構成空間における障害物境界を表現するために,サポートベクトルの集合をごくわずかに維持するオンライントレーニングアルゴリズムを開発した。 また,分割線形および分割多項ロボット軌道の完全な衝突チェックを可能にする条件を導出する。 未知環境におけるアッカーマン駆動ロボットの自律走行におけるマッピングと衝突検出アルゴリズムの有効性を実証する。

This paper focuses on real-time occupancy mapping and collision checking onboard an autonomous robot navigating in an unknown environment. We propose a new map representation, in which occupied and free space are separated by the decision boundary of a kernel perceptron classifier. We develop an online training algorithm that maintains a very sparse set of support vectors to represent obstacle boundaries in configuration space. We also derive conditions that allow complete (without sampling) collision-checking for piecewise-linear and piecewise-polynomial robot trajectories. We demonstrate the effectiveness of our mapping and collision checking algorithms for autonomous navigation of an Ackermann-drive robot in unknown environments.
翻訳日:2023-01-03 22:05:25 公開日:2020-02-05
# 肺癌再発予測のための画像とゲノムのマルチモーダル融合

Multimodal fusion of imaging and genomics for lung cancer recurrence prediction ( http://arxiv.org/abs/2002.01982v1 )

ライセンス: Link先を確認
Vaishnavi Subramanian, Minh N. Do, Tanveer Syeda-Mahmood(参考訳) 早期の肺癌は再発率が高い。 肺癌患者の術後再発の予測は伝統的にゲノム画像や放射線画像の単一のモダリティ情報を用いて行われている。 本課題におけるマルチモーダル融合の可能性について検討する。 また,ct画像とゲノミクスを組み合わせることで,線形cox比例ハザードモデルと弾性ネットの正則化による再発予測が向上することを示した。 我々は,130例の非小細胞肺癌(NSCLC)放射線ゲノミクスデータセットについて検討し,一致指数値の10%までの増加を観察した。 マルチ層パーセプトロンやビジュアルクエクション応答融合モジュールなど、ニューラルネットワークの文献から非線形メソッドを採用することは、パフォーマンスを一貫して改善することはなかった。 これは、より大規模なマルチモーダルデータセットと融合技術が必要であることを示している。

Lung cancer has a high rate of recurrence in early-stage patients. Predicting the post-surgical recurrence in lung cancer patients has traditionally been approached using single modality information of genomics or radiology images. We investigate the potential of multimodal fusion for this task. By combining computed tomography (CT) images and genomics, we demonstrate improved prediction of recurrence using linear Cox proportional hazards models with elastic net regularization. We work on a recent non-small cell lung cancer (NSCLC) radiogenomics dataset of 130 patients and observe an increase in concordance-index values of up to 10%. Employing non-linear methods from the neural network literature, such as multi-layer perceptrons and visual-question answering fusion modules, did not improve performance consistently. This indicates the need for larger multimodal datasets and fusion techniques better adapted to this biological setting.
翻訳日:2023-01-03 22:05:14 公開日:2020-02-05
# アクティブラーニングコストパフォーマンストレードオフにおけるr\'{e}nyiエントロピー境界

R\'{e}nyi Entropy Bounds on the Active Learning Cost-Performance Tradeoff ( http://arxiv.org/abs/2002.02025v1 )

ライセンス: Link先を確認
Vahid Jamali, Antonia Tulino, Jaime Llorca, and Elza Erkip(参考訳) 機械学習の最も顕著な分野の一つである半教師付き分類は、分類精度を最大化するために、しばしば豊富なラベル付きデータの統計的知識と、しばしば制限されたラベル付きデータの統計的知識を組み合わせる方法を研究する。 この文脈では、ラベル付け対象のデータを積極的に選択するプロセスは、アクティブラーニングと呼ばれる。 本稿では,ラベル付きデータを用いた半教師付き分類の最適方針の非漸近的解析を開始する。 一般的なベイズ分類モデルを考えると,ラベルクエリ予算(ラベル付きデータ項目数)と全体分類精度によって引き起こされる費用対効果のトレードオフから,共同最適化されたアクティブラーニングと半教師付き分類ポリシーを初めて評価する。 R'enyi Entropyの最近の成果を活用して、このようなアクティブな学習コストパフォーマンストレードオフに関する厳密な情報理論境界を導出する。

Semi-supervised classification, one of the most prominent fields in machine learning, studies how to combine the statistical knowledge of the often abundant unlabeled data with the often limited labeled data in order to maximize overall classification accuracy. In this context, the process of actively choosing the data to be labeled is referred to as active learning. In this paper, we initiate the non-asymptotic analysis of the optimal policy for semi-supervised classification with actively obtained labeled data. Considering a general Bayesian classification model, we provide the first characterization of the jointly optimal active learning and semi-supervised classification policy, in terms of the cost-performance tradeoff driven by the label query budget (number of data items to be labeled) and overall classification accuracy. Leveraging recent results on the R\'enyi Entropy, we derive tight information-theoretic bounds on such active learning cost-performance tradeoff.
翻訳日:2023-01-03 22:04:59 公開日:2020-02-05
# パッシブWiFiセンシングとデータマイニングによる社会イベントにおける集団行動の理解

Understanding Crowd Behaviors in a Social Event by Passive WiFi Sensing and Data Mining ( http://arxiv.org/abs/2002.04401v1 )

ライセンス: Link先を確認
Yuren Zhou, Billy Pik Lik Lau, Zann Koh, Chau Yuen, Benny Kai Kiat Ng(参考訳) 大規模な社会イベントにおける群衆の行動を理解することは、イベント管理に不可欠である。 モバイル端末から送信されたWiFiプローブリクエストを収集するパッシブWiFiセンシングは、自由な干渉、より大きなカバレッジ、低コスト、人々の動きに関する情報といった観点から、人やカメラと比較して、群衆を監視するためのより良い方法を提供する。 しかし、既存の研究では、収集されたデータの徹底的な分析と採掘に十分な注意が払われていない。 特に、機械学習のパワーは十分に活用されていない。 そこで本稿では,統計,可視化,教師なし機械学習の活用により,収集したプローブ要求を完全に分析し,大規模社会イベントにおける群集行動に関連する3種類のパターンを抽出する総合的データ分析フレームワークを提案する。 まず、プローブ要求からモバイルデバイスの軌跡を抽出して分析し、群衆の動きの空間的パターンを明らかにする。 階層的な凝集クラスタリングは、異なる場所間の相互接続を見つけるために採用されている。 次に,k-means と k-shape のクラスタリングアルゴリズムを用いて,群衆の時間的訪問パターンを日と場所によって抽出する。 最後に、時間と組み合わせることで、軌跡が時空間パターンに変換され、時間とともに軌道の長さが変化し、群集の動きの全体的傾向が変化することを示す。 提案するデータ分析フレームワークは,大規模なソーシャルイベントで収集された実世界データを用いて,十分に実証されている。 その結果,受動型wifiセンサのネットワークから収集したデータから包括的なパターンを抽出できることがわかった。

Understanding crowd behaviors in a large social event is crucial for event management. Passive WiFi sensing, by collecting WiFi probe requests sent from mobile devices, provides a better way to monitor crowds compared with people counters and cameras in terms of free interference, larger coverage, lower cost, and more information on people's movement. In existing studies, however, not enough attention has been paid to the thorough analysis and mining of collected data. Especially, the power of machine learning has not been fully exploited. In this paper, therefore, we propose a comprehensive data analysis framework to fully analyze the collected probe requests to extract three types of patterns related to crowd behaviors in a large social event, with the help of statistics, visualization, and unsupervised machine learning. First, trajectories of the mobile devices are extracted from probe requests and analyzed to reveal the spatial patterns of the crowds' movement. Hierarchical agglomerative clustering is adopted to find the interconnections between different locations. Next, k-means and k-shape clustering algorithms are applied to extract temporal visiting patterns of the crowds by days and locations, respectively. Finally, by combining with time, trajectories are transformed into spatiotemporal patterns, which reveal how trajectory duration changes over the length and how the overall trends of crowd movement change over time. The proposed data analysis framework is fully demonstrated using real-world data collected in a large social event. Results show that one can extract comprehensive patterns from data collected by a network of passive WiFi sensors.
翻訳日:2023-01-03 22:04:28 公開日:2020-02-05
# 複数の画像スケールを用いたカスケード深層ニューラルネットワークによる脳腫瘍の分節化

Brain Tumor Segmentation by Cascaded Deep Neural Networks Using Multiple Image Scales ( http://arxiv.org/abs/2002.01975v1 )

ライセンス: Link先を確認
Zahra Sobhaninia, Safiyeh Rezaei, Nader Karimi, Ali Emami, Shadrokh Samavi(参考訳) 頭蓋内腫瘍は、通常制御不能に増殖する細胞群である。 4件のうち1件は脳腫瘍によるものである。 脳腫瘍の早期発見と評価は、MRI(MRI)によって行われる重要な予防医療段階である。 この目的のために多くのセグメンテーション技術が存在する。 低セグメンテーション精度は既存の手法の主な欠点である。 本稿では,MR画像における腫瘍のセグメンテーションの精度を高めるための深層学習手法を提案する。 カスケードアプローチは、ローカルビューとグローバルビューの両方を誘導し、ネットワークがより高い精度に達するのを助けるために、複数のスケールの画像で使用される。 実験の結果,複数のスケールと2つのカスケードネットワークの利用が有利であることが判明した。

Intracranial tumors are groups of cells that usually grow uncontrollably. One out of four cancer deaths is due to brain tumors. Early detection and evaluation of brain tumors is an essential preventive medical step that is performed by magnetic resonance imaging (MRI). Many segmentation techniques exist for this purpose. Low segmentation accuracy is the main drawback of existing methods. In this paper, we use a deep learning method to boost the accuracy of tumor segmentation in MR images. Cascade approach is used with multiple scales of images to induce both local and global views and help the network to reach higher accuracies. Our experimental results show that using multiple scales and the utilization of two cascade networks is advantageous.
翻訳日:2023-01-03 21:58:27 公開日:2020-02-05
# グラフの階層における知識表現と更新

Knowledge representation and update in hierarchies of graphs ( http://arxiv.org/abs/2002.01766v1 )

ライセンス: Link先を確認
Russ Harmer and Eugenia Oshurko(参考訳) 数学理論は、対象の任意の対の間のすべての経路が等しくなければならない圏内の対象の有向非巡回階層の形で知識を表現するために提示される。 知識が更新される条件は、階層内のオブジェクトのSesqui-pushout書き換えの形で、全ての必要なパス平等を維持するために、階層の他の部分へ伝播することができる:いくつかの書き換えは矢印の方向で前方に伝播されなければならないが、他のものは矢印の方向に対して後方に伝播されなければならない、そして階層の正確な形式によっては、ある種の構成条件も必要である。 この理論の実装は、ノードとエッジに属性を持つ(単純な)有向グラフのためのReGraph Pythonライブラリにおいて、2つの重要なユースケースの文脈で議論される。

A mathematical theory is presented for the representation of knowledge in the form of a directed acyclic hierarchy of objects in a category where all paths between any given pair of objects are required to be equal. The conditions under which knowledge update, in the form of the sesqui-pushout rewriting of an object in a hierarchy, can be propagated to the rest of the hierarchy, in order to maintain all required path equalities, are analysed: some rewrites must be propagated forwards, in the direction of the arrows, while others must be propagated backwards, against the direction of the arrows, and, depending on the precise form of the hierarchy, certain composability conditions may also be necessary. The implementation of this theory, in the ReGraph Python library for (simple) directed graphs with attributes on nodes and edges, is then discussed in the context of two significant use cases.
翻訳日:2023-01-03 21:58:10 公開日:2020-02-05
# 地震発生時の半パラメトリックベイズ予測

Semiparametric Bayesian Forecasting of Spatial Earthquake Occurrences ( http://arxiv.org/abs/2002.01706v1 )

ライセンス: Link先を確認
Aleksandar A. Kolev, Gordon J. Ross(参考訳) 自励するホークス過程は時間と空間にクラスターする事象をモデル化するために用いられ、エピデミック型余震系列(ETAS)モデルの名称で地震学で広く研究されている。 ETASフレームワークでは、地理的領域における主震の発生は不均一な空間点過程を辿ると仮定し、その後、余震は別個のトリガカーネルを介してモデル化される。 ETASモデルのこれまでの研究は、確率関数の複雑さと適切な主衝撃分布を推定することの難しさにより、モデルパラメータの点推定に頼っていた。 推定の不確実性を考慮するために,空間主衝撃過程の捕捉に先立って非パラメトリックディリクレ過程の混合を用いるETASモデルのベイズ的完全定式化を提案する。 結果モデルの直接推論は,主ショックおよびトリガー過程のパラメータの強い相関関係から問題となるため,より効率的な推論を行うために補助的な潜在変数ルーチンを用いる。

Self-exciting Hawkes processes are used to model events which cluster in time and space, and have been widely studied in seismology under the name of the Epidemic Type Aftershock Sequence (ETAS) model. In the ETAS framework, the occurrence of the mainshock earthquakes in a geographical region is assumed to follow an inhomogeneous spatial point process, and aftershock events are then modelled via a separate triggering kernel. Most previous studies of the ETAS model have relied on point estimates of the model parameters due to the complexity of the likelihood function, and the difficulty in estimating an appropriate mainshock distribution. In order to take estimation uncertainty into account, we instead propose a fully Bayesian formulation of the ETAS model which uses a nonparametric Dirichlet process mixture prior to capture the spatial mainshock process. Direct inference for the resulting model is problematic due to the strong correlation of the parameters for the mainshock and triggering processes, so we instead use an auxiliary latent variable routine to perform efficient inference.
翻訳日:2023-01-03 21:57:42 公開日:2020-02-05
# 安全な自律のための部分的に観察可能なゲーム

Partially Observable Games for Secure Autonomy ( http://arxiv.org/abs/2002.01969v1 )

ライセンス: Link先を確認
Mohamadreza Ahmadi, Arun A. Viswanathan, Michel D. Ingham, Kymie Tan, and Aaron D. Ames(参考訳) 自律性とサイバー防衛における技術開発努力は、過去10年間、互いに独立して進化してきた。 本稿では,この2つの異なる領域をひとつのフレームワークに統合する取り組みについて報告する。 そこで本稿では,不確実性の下での高レベルの自律ミッション計画と,不完全情報に基づく対角的決定の両方を捉えるために,2人のプレイヤーによる部分的に観測可能な確率的ゲームフォーマリズムを提案する。 自律型意思決定とサイバーアドバイザリーの両方において,そのようなゲームに対する準最適戦略の合成が有限メモリの仮定の下で可能であることを示す。 次に,提案フレームワークの有効性を評価する実験台について述べる。

Technology development efforts in autonomy and cyber-defense have been evolving independently of each other, over the past decade. In this paper, we report our ongoing effort to integrate these two presently distinct areas into a single framework. To this end, we propose the two-player partially observable stochastic game formalism to capture both high-level autonomous mission planning under uncertainty and adversarial decision making subject to imperfect information. We show that synthesizing sub-optimal strategies for such games is possible under finite-memory assumptions for both the autonomous decision maker and the cyber-adversary. We then describe an experimental testbed to evaluate the efficacy of the proposed framework.
翻訳日:2023-01-03 21:57:13 公開日:2020-02-05
# クリックとビデオの表現学習によるmoocsにおける数週間のドロップアウト予測

Dropout Prediction over Weeks in MOOCs by Learning Representations of Clicks and Videos ( http://arxiv.org/abs/2002.01955v1 )

ライセンス: Link先を確認
Byungsoo Jeon, Namyong Park(参考訳) 本稿では,MOOCのドロップアウト予測における重要な課題,すなわちクリックストリームデータから意味のある表現を構築することについて述べる。 私たちの知識では,様々な特徴抽出手法が広く研究されてきたが,教育内容(ビデオなど)のモデル化や,学習者の行動(クリックストリームなど)との関連については,先行研究は行われていない。 このギャップを埋めるために,動画の表現と動画とクリックの相関関係を学習する手法を考案する。 その結果,ビデオのモデリングとクリックとの相関は,ドロップアウト予測において統計的に有意な改善をもたらすことが示された。

This paper addresses a key challenge in MOOC dropout prediction, namely to build meaningful representations from clickstream data. While a variety of feature extraction techniques have been explored extensively for such purposes, to our knowledge, no prior works have explored modeling of educational content (e.g. video) and their correlation with the learner's behavior (e.g. clickstream) in this context. We bridge this gap by devising a method to learn representation for videos and the correlation between videos and clicks. The results indicate that modeling videos and their correlation with clicks bring statistically significant improvements in predicting dropout.
翻訳日:2023-01-03 21:56:19 公開日:2020-02-05
# 軌道予測のための確率的区間交通モデル学習

Learning Probabilistic Intersection Traffic Models for Trajectory Prediction ( http://arxiv.org/abs/2002.01965v1 )

ライセンス: Link先を確認
Andrew Patterson, Aditya Gahlawat, Naira Hovakimyan(参考訳) 自律エージェントは、他の車両と安全に相互作用し、都市環境に組み込むことができる必要がある。 これらのエージェントの安全性は、再計画と衝突回避のために他の車両の将来の軌道と衝突を予測する能力に依存する。 衝突を予測するために必要な情報は、特定の環境で以前に観測された車両軌跡から学習でき、交通モデルを生成する。 学習したトラフィックモデルは、この環境で使われている任意の軌道推定方法に事前知識として組み込むことができる。 本研究は,交差点における車両挙動の定量化に使用されるガウス過程に基づく確率的交通モデルを提案する。 ガウス過程モデル(英語版)は平均的な車両軌道の見積もりを提供し、また交点における車両の異なる経路間のばらつきを捉えている。 この方法は時系列位置軌跡のセットで示される。 これらの軌道は、データソース処理によって生じる可能性のあるオブジェクト認識エラーとミスフレームを取り除いて再構成される。 交差点交通モデルを作成するために、再構成された軌道は、そのソースと目的地レーンに基づいてクラスタ化される。 各クラスタに対して、クラスタの平均的な振る舞いと分散をキャプチャするために、ガウスのプロセスモデルが作成されます。 ガウスモデルの適用性を示すために、テスト軌道は部分的観測のみで分類される。 性能は、車両軌道を正しく分類するために必要な観測回数によって定量化される。 交差トラヒックモデリング計算と分類手順の両方が時間化される。 これらの時間は結果として示され、適切な時間でモデルを構築することができ、分類手順をオンラインアプリケーションに利用できることを示す。

Autonomous agents must be able to safely interact with other vehicles to integrate into urban environments. The safety of these agents is dependent on their ability to predict collisions with other vehicles' future trajectories for replanning and collision avoidance. The information needed to predict collisions can be learned from previously observed vehicle trajectories in a specific environment, generating a traffic model. The learned traffic model can then be incorporated as prior knowledge into any trajectory estimation method being used in this environment. This work presents a Gaussian process based probabilistic traffic model that is used to quantify vehicle behaviors in an intersection. The Gaussian process model provides estimates for the average vehicle trajectory, while also capturing the variance between the different paths a vehicle may take in the intersection. The method is demonstrated on a set of time-series position trajectories. These trajectories are reconstructed by removing object recognition errors and missed frames that may occur due to data source processing. To create the intersection traffic model, the reconstructed trajectories are clustered based on their source and destination lanes. For each cluster, a Gaussian process model is created to capture the average behavior and the variance of the cluster. To show the applicability of the Gaussian model, the test trajectories are classified with only partial observations. Performance is quantified by the number of observations required to correctly classify the vehicle trajectory. Both the intersection traffic modeling computations and the classification procedure are timed. These times are presented as results and demonstrate that the model can be constructed in a reasonable amount of time and the classification procedure can be used for online applications.
翻訳日:2023-01-03 21:56:06 公開日:2020-02-05
# 手動操作の自律学習における触覚力の有用性はタスク依存である

The utility of tactile force to autonomous learning of in-hand manipulation is task-dependent ( http://arxiv.org/abs/2002.02418v1 )

ライセンス: Link先を確認
Romina Mir, Ali Marjaninejad, Francisco J. Valero-Cuevas(参考訳) 触覚センサは操作タスクの学習と実行に使用できる情報を提供する。 しかし、異なるタスクは、異なるレベルの感覚情報を必要とする可能性がある。 本稿では,3指腱を用いた手指操作の自律学習における触覚情報の役割について検討する。 同じ学習アルゴリズム(近方針最適化、ppo)の2つの操作タスク(球を回転剛性で水平軸回りに回転させる)と触覚センシングの3レベル(無感知、1次元正常力、3次元力ベクトル)を学習する能力を比較した。 驚くべきことに、最近の操作作業とは対照的に、1次元の力センシングは、通常の力がタスクに関係しているかどうかを理由として、センシングなしよりも学習率を常に向上させたわけではない。 それでも、3次元力センシングは感覚入力の次元性を増大させるが、アルゴリズムの収束を妨げ、学習速度が向上し、性能が向上した。 一般に、感覚入力はタスクに関係のある場合にのみ学習に有用であり、重力に対して手作業で操作する3次元力センシングの場合と結論づける。 さらに,3次元力覚の有効性は,高次元感覚入力による追加の計算コストを相殺することができる。

Tactile sensors provide information that can be used to learn and execute manipulation tasks. Different tasks, however, might require different levels of sensory information; which in turn likely affect learning rates and performance. This paper evaluates the role of tactile information on autonomous learning of manipulation with a simulated 3-finger tendon-driven hand. We compare the ability of the same learning algorithm (Proximal Policy Optimization, PPO) to learn two manipulation tasks (rolling a ball about the horizontal axis with and without rotational stiffness) with three levels of tactile sensing: no sensing, 1D normal force, and 3D force vector. Surprisingly, and contrary to recent work on manipulation, adding 1D force-sensing did not always improve learning rates compared to no sensing---likely due to whether or not normal force is relevant to the task. Nonetheless, even though 3D force-sensing increases the dimensionality of the sensory input---which would in general hamper algorithm convergence---it resulted in faster learning rates and better performance. We conclude that, in general, sensory input is useful to learning only when it is relevant to the task---as is the case of 3D force-sensing for in-hand manipulation against gravity. Moreover, the utility of 3D force-sensing can even offset the added computational cost of learning with higher-dimensional sensory input.
翻訳日:2023-01-03 21:55:43 公開日:2020-02-05
# ノイズ脳MRI画像のための並列3DPIFCMアルゴリズム

Parallel 3DPIFCM Algorithm for Noisy Brain MRI Images ( http://arxiv.org/abs/2002.01981v1 )

ライセンス: Link先を確認
Arie Agranonik, Maya Herman, Mark Last(参考訳) 本稿では,GPU上でCUDAを用いて並列環境で3DPIFCMと呼ばれる[1]で開発したアルゴリズムを実装した。 前報ではノイズを考慮した最適なアルゴリズムパラメータを求めるために粒子群最適化を用いた3dpifcmを導入した。 このアルゴリズムは,成人脳のMRI画像に対して,FCM (Fuzzy C-Means), IFCMPSO (Improved Fuzzy C-Means with Particle Swarm Optimization), GAIFCM (Genetic Algorithm Improved Fuzzy C-Means) と比較して,術式分割精度を向上した。 遺伝的アルゴリズムやPSO(Particle Swarm Optimization)を1台のマシンで最適化する場合,臨床応用に長い実行時間を要した。 そこで本論文では,アルゴリズムの一部を抽出し,GPU上でカーネルとして実行することにより,3DPIFCMの実行を高速化することを目的としている。 このアルゴリズムはNVIDIAのCUDA[13]フレームワークを使って実装され、64GBのRAM、8コア、3072のSPコアと12GBのGPUメモリを備えたTITAN X GPUを含むサーバー上で実行された。 その結果,並列版のアルゴリズムは,従来のシーケンシャルバージョンよりも最大27倍高速であり,gaifcmアルゴリズムより68倍高速であることがわかった。 並列バージョンの高速化は、GPUにおけるコアの活用性の向上により、画像のサイズが大きくなるにつれて増加することを示す。 また、IFCMPSOやGAIFCMといった他の汎用モデルと比較して、Brainweb実験では最大5倍のスピードアップを示す。

In this paper we implemented the algorithm we developed in [1] called 3DPIFCM in a parallel environment by using CUDA on a GPU. In our previous work we introduced 3DPIFCM which performs segmentation of images in noisy conditions and uses particle swarm optimization for finding the optimal algorithm parameters to account for noise. This algorithm achieved state of the art segmentation accuracy when compared to FCM (Fuzzy C-Means), IFCMPSO (Improved Fuzzy C-Means with Particle Swarm Optimization), GAIFCM (Genetic Algorithm Improved Fuzzy C-Means) on noisy MRI images of an adult Brain. When using a genetic algorithm or PSO (Particle Swarm Optimization) on a single machine for optimization we witnessed long execution times for practical clinical usage. Therefore, in the current paper our goal was to speed up the execution of 3DPIFCM by taking out parts of the algorithm and executing them as kernels on a GPU. The algorithm was implemented using the CUDA [13] framework from NVIDIA and experiments where performed on a server containing 64GB RAM , 8 cores and a TITAN X GPU with 3072 SP cores and 12GB of GPU memory. Our results show that the parallel version of the algorithm performs up to 27x faster than the original sequential version and 68x faster than GAIFCM algorithm. We show that the speedup of the parallel version increases as we increase the size of the image due to better utilization of cores in the GPU. Also, we show a speedup of up to 5x in our Brainweb experiment compared to other generic variants such as IFCMPSO and GAIFCM.
翻訳日:2023-01-03 21:55:20 公開日:2020-02-05
# 2次元ハンドポース推定のための回転不変混合グラフモデルネットワーク

Rotation-invariant Mixed Graphical Model Network for 2D Hand Pose Estimation ( http://arxiv.org/abs/2002.02033v1 )

ライセンス: Link先を確認
Deying Kong, Haoyu Ma, Yifei Chen, Xiaohui Xie(参考訳) 本稿では,単眼のrgb画像から2次元手ポーズ推定問題を解くために,回転不変型混合グラフィカルモデルネットワーク (r-mgmn) という新しいアーキテクチャを提案する。 回転ネットを統合することにより、R-MGMNは画像中の手の回転に不変である。 グラフィックモデルのプールも用意されており、入力イメージを条件付けして、グラフィカルモデルの組み合わせを選択できる。 各グラフィカルモデル上では、信念伝播が別々に行われ、手のキーポイント位置の信頼度マップとして取られる一連の限界分布を生成する。 最終信頼度マップは、これらの信頼度マップをまとめることで得られる。 2つのパブリックハンドポーズデータセット上でR-MGMNを評価する。 実験の結果,本モデルは2次元手ポーズ推定において顕著なマージンで広く用いられている最先端のアルゴリズムよりも優れていた。

In this paper, we propose a new architecture named Rotation-invariant Mixed Graphical Model Network (R-MGMN) to solve the problem of 2D hand pose estimation from a monocular RGB image. By integrating a rotation net, the R-MGMN is invariant to rotations of the hand in the image. It also has a pool of graphical models, from which a combination of graphical models could be selected, conditioning on the input image. Belief propagation is performed on each graphical model separately, generating a set of marginal distributions, which are taken as the confidence maps of hand keypoint positions. Final confidence maps are obtained by aggregating these confidence maps together. We evaluate the R-MGMN on two public hand pose datasets. Experiment results show our model outperforms the state-of-the-art algorithm which is widely used in 2D hand pose estimation by a noticeable margin.
翻訳日:2023-01-03 21:48:05 公開日:2020-02-05
# UNCC バイオメディカルセマンティック質問応答システム BioASQ: Task-7B, Phase-B

UNCC Biomedical Semantic Question Answering Systems. BioASQ: Task-7B, Phase-B ( http://arxiv.org/abs/2002.01984v1 )

ライセンス: Link先を確認
Sai Krishna Telukuntla, Aditya Kapri and Wlodek Zadrozny(参考訳) 本稿では,2019年,7年,BioASQコンペティションへの応募について詳述する。 本稿では,タスク7b,フェーズB,実行解答タスクを提案する。 これらの質問回答(QA)タスクには、Factoid、Yes/No、List Type Questioningなどがある。 本システムは文脈単語埋め込みモデルに基づいている。 我々は,BioBERTを用いたバイオメディカル質問応答タスクのために微調整された変換器(BERT)に基づく双方向エンコーダ表現を用いた。 第3のテストバッチセットでは,本システムはファクトイド質問応答タスクにおいて最も高いmrrスコアを得た。 また,リスト型質問応答タスクでは,第4テストバッチセットのリコールスコアが最も高かった。 当社の詳細なアプローチに加えて,提案の成果を提示するとともに,現在のアプローチの欠点と今後の実験でそれらを改善する方法を強調します。

In this paper, we detail our submission to the 2019, 7th year, BioASQ competition. We present our approach for Task-7b, Phase B, Exact Answering Task. These Question Answering (QA) tasks include Factoid, Yes/No, List Type Question answering. Our system is based on a contextual word embedding model. We have used a Bidirectional Encoder Representations from Transformers(BERT) based system, fined tuned for biomedical question answering task using BioBERT. In the third test batch set, our system achieved the highest MRR score for Factoid Question Answering task. Also, for List type question answering task our system achieved the highest recall score in the fourth test batch set. Along with our detailed approach, we present the results for our submissions, and also highlight identified downsides for our current approach and ways to improve them in our future experiments.
翻訳日:2023-01-03 21:47:50 公開日:2020-02-05
# 産業の予測保守に関する調査研究 4.0

A Survey on Predictive Maintenance for Industry 4.0 ( http://arxiv.org/abs/2002.08224v1 )

ライセンス: Link先を確認
Christian Krupitzer (1), Tim Wagenhals (2), Marwin Z\"ufle (1), Veronika Lesch (1), Dominik Sch\"afer (3), Amin Mozaffarin (4), Janick Edinger (2), Christian Becker (2), Samuel Kounev (1) ((1) University of W\"urzburg, W\"urzburg, Germany, (2) University of Mannheim, Mannheim, Germany, (3) Syntax Systems GmbH, Weinheim, Germany, (4) MOZYS Engineering GmbH, W\"urzburg)(参考訳) 2016年のフォルクスワーゲンの生産問題は、週に最大4億ユーロの売り上げに劇的な損失をもたらした。 この例は、企業の労働生産施設の経済的影響を示している。 特に、インダストリアル4.0とインダストリアルIoTのインテリジェントでコネクテッドマシンのデータ駆動ドメインでは、従来の静的メンテナンススケジュールは時代遅れのようだ。 本稿では,産業4.0の予測保守における技術の現状について調査する。 本稿では, 構造的リテラト調査に基づき, 産業4.0の文脈における予測保守の分類と最近の展開について考察する。

Production issues at Volkswagen in 2016 lead to dramatic losses in sales of up to 400 million Euros per week. This example shows the huge financial impact of a working production facility for companies. Especially in the data-driven domains of Industry 4.0 and Industrial IoT with intelligent, connected machines, a conventional, static maintenance schedule seems to be old-fashioned. In this paper, we present a survey on the current state of the art in predictive maintenance for Industry 4.0. Based on a structured literate survey, we present a classification of predictive maintenance in the context of Industry 4.0 and discuss recent developments in this area.
翻訳日:2023-01-03 21:47:39 公開日:2020-02-05
# AIフェアネスとユーティリティの共同最適化:人間中心のアプローチ

Joint Optimization of AI Fairness and Utility: A Human-Centered Approach ( http://arxiv.org/abs/2002.01621v1 )

ライセンス: Link先を確認
Yunfeng Zhang, Rachel K. E. Bellamy, Kush R. Varshney(参考訳) 今日では、公正性が重要な関心事である多くの高度な意思決定アプリケーションで、AIがますます使われています。 すでに、AIが偏見を受け、疑わしい、不公平な決定を下す例がたくさんある。 ai研究コミュニティは、望ましくないバイアスを計測し軽減するための多くの方法を提案しているが、人間の政策立案者からのインプットを含むものは少ない。 異なる公平性基準を同時に満たせない場合があり、公平性を達成するにはモデルの正確性などの他の目的を犠牲にする必要があるため、これらの目的のトレードオフの作り方に対する人間の政策立案者の選好を入手し、遵守することが重要であると主張する。 本稿では,このような嗜好を誘発し,その嗜好に応じてaiモデルを最適化するためのフレームワークと例示手法を提案する。

Today, AI is increasingly being used in many high-stakes decision-making applications in which fairness is an important concern. Already, there are many examples of AI being biased and making questionable and unfair decisions. The AI research community has proposed many methods to measure and mitigate unwanted biases, but few of them involve inputs from human policy makers. We argue that because different fairness criteria sometimes cannot be simultaneously satisfied, and because achieving fairness often requires sacrificing other objectives such as model accuracy, it is key to acquire and adhere to human policy makers' preferences on how to make the tradeoff among these objectives. In this paper, we propose a framework and some exemplar methods for eliciting such preferences and for optimizing an AI model according to these preferences.
翻訳日:2023-01-03 21:47:29 公開日:2020-02-05
# 効率的なアルゴリズム解であるポッツモデルハミルトンによる教師なしコミュニティ検出とデジタル病理学への応用

Unsupervised Community Detection with a Potts Model Hamiltonian, an Efficient Algorithmic Solution, and Applications in Digital Pathology ( http://arxiv.org/abs/2002.01599v1 )

ライセンス: Link先を確認
Brendon Lutnick, Wen Dong, Zohar Nussinov, and Pinaki Sarder(参考訳) ポッツモデルハミルトニアンを用いた大きな画像の教師なしセグメンテーションは、セグメンテーションが小さなクラスタに感度をスケールする分解パラメータによって制御されるという点でユニークである。 ここで、入力画像はまずグラフとしてモデル化され、次にグラフと各セグメントで定義されるハミルトニアンコスト関数を最小化することでセグメント化される。 しかし、この最適化の閉形式解は存在せず、従来の反復的アルゴリズム解法を用いて入力長を2次的にスケールする。 したがって、ポッツモデルセグメンテーションは正確なセグメンテーションを与えるが、教師なし学習技術として完全には利用されない。 本稿では,各色特徴に基づく入力画像画素の高速統計的ダウンサンプリングと,画素とセグメントの関係を考慮したポッツモデルエネルギーを最小化する新しい反復的手法を提案する。 この方法は一般化可能であり、画像画素テクスチャの特徴や空間的特徴に拡張することができる。 提案手法は高効率であり,Pottsモデルに基づく画像セグメンテーションの既存手法よりも優れていることを示す。 特に腎疾患における腎糸球体微小環境のセグメンテーションにおいて,医用顕微鏡画像のセグメンテーションに本法の応用を実証した。 本手法は画像セグメンテーションに限らず,個々の特徴を持つ任意のデータセットに対して任意の画像/データセグメンテーション/クラスタリングタスクに拡張可能である。

Unsupervised segmentation of large images using a Potts model Hamiltonian is unique in that segmentation is governed by a resolution parameter which scales the sensitivity to small clusters. Here, the input image is first modeled as a graph, which is then segmented by minimizing a Hamiltonian cost function defined on the graph and the respective segments. However, there exists no closed form solution of this optimization, and using previous iterative algorithmic solution techniques, the problem scales quadratically in the Input Length. Therefore, while Potts model segmentation gives accurate segmentation, it is grossly underutilized as an unsupervised learning technique. We propose a fast statistical down-sampling of input image pixels based on the respective color features, and a new iterative method to minimize the Potts model energy considering pixel to segment relationship. This method is generalizable and can be extended for image pixel texture features as well as spatial features. We demonstrate that this new method is highly efficient, and outperforms existing methods for Potts model based image segmentation. We demonstrate the application of our method in medical microscopy image segmentation; particularly, in segmenting renal glomerular micro-environment in renal pathology. Our method is not limited to image segmentation, and can be extended to any image/data segmentation/clustering task for arbitrary datasets with discrete features.
翻訳日:2023-01-03 21:46:18 公開日:2020-02-05
# 確率リアプノフ関数と量子化器除去を用いた粒子群最適化の収束解析

Convergence analysis of particle swarm optimization using stochastic Lyapunov functions and quantifier elimination ( http://arxiv.org/abs/2002.01673v1 )

ライセンス: Link先を確認
Maximilian Gerwien, Rick Vo{\ss}winkel, and Hendrik Richter(参考訳) 本稿では, 確率的リアプノフ関数を適用し, 量子化子除去による収束集合を求めることにより, 粒子群安定性の理論的な側面について議論する。 本稿では,この手法を用いて,リアプノフ法を用いてPSOの既知安定領域の再評価と拡張を行う手法を提案する。

This paper adds to the discussion about theoretical aspects of particle swarm stability by proposing to employ stochastic Lyapunov functions and to determine the convergence set by quantifier elimination. We present a computational procedure and show that this approach leads to reevaluation and extension of previously know stability regions for PSO using a Lyapunov approach under stagnation assumptions.
翻訳日:2023-01-03 21:39:37 公開日:2020-02-05
# CHAIN:深部畳み込みニューラルネットワークの概念調和階層的推論解釈

CHAIN: Concept-harmonized Hierarchical Inference Interpretation of Deep Convolutional Neural Networks ( http://arxiv.org/abs/2002.01660v1 )

ライセンス: Link先を確認
Dan Wang, Xinrui Cui, and Z. Jane Wang(参考訳) ネットワークの大きな成功により、内部ネットワーク機構、特にネット決定ロジックの解釈に対する需要が増大するのを目撃する。 この課題に対処するために、概念調和型階層推論(CHAIN)を提案し、ネット意思決定プロセスの解釈を行う。 ネット決定を解釈するために、提案手法は、ネット決定を階層的に高い意味レベルから低い意味レベルまで視覚概念に導出できるCHAIN解釈を示す。 そこで本研究では,3つのモデル,すなわち概念調和モデル,階層型推論モデル,概念調和型階層型推論モデルを提案する。 まず、概念調和モデルにおいて、高レベルから低レベルまでの視覚的概念は、深層から浅層までのネットユニットと整合する。 第二に、階層的推論モデルでは、深層の概念は浅い層の単位に分解される。 最後に、概念調和階層推論モデルにおいて、深層の概念はその浅層の概念から推測される。 数回のラウンドの後、概念調和階層推論は、最高意味レベルから最低意味レベルまで後方に行われる。 最後に、ネット意思決定は、人間の意思決定に匹敵する概念調和階層推論の一形態として説明される。 一方、特徴学習のためのネット層構造は階層的な視覚概念に基づいて説明できる。 定量的および定性的な実験では、CHAINのインスタンスレベルとクラスレベルでの有効性を示す。

With the great success of networks, it witnesses the increasing demand for the interpretation of the internal network mechanism, especially for the net decision-making logic. To tackle the challenge, the Concept-harmonized HierArchical INference (CHAIN) is proposed to interpret the net decision-making process. For net-decisions being interpreted, the proposed method presents the CHAIN interpretation in which the net decision can be hierarchically deduced into visual concepts from high to low semantic levels. To achieve it, we propose three models sequentially, i.e., the concept harmonizing model, the hierarchical inference model, and the concept-harmonized hierarchical inference model. Firstly, in the concept harmonizing model, visual concepts from high to low semantic-levels are aligned with net-units from deep to shallow layers. Secondly, in the hierarchical inference model, the concept in a deep layer is disassembled into units in shallow layers. Finally, in the concept-harmonized hierarchical inference model, a deep-layer concept is inferred from its shallow-layer concepts. After several rounds, the concept-harmonized hierarchical inference is conducted backward from the highest semantic level to the lowest semantic level. Finally, net decision-making is explained as a form of concept-harmonized hierarchical inference, which is comparable to human decision-making. Meanwhile, the net layer structure for feature learning can be explained based on the hierarchical visual concepts. In quantitative and qualitative experiments, we demonstrate the effectiveness of CHAIN at the instance and class levels.
翻訳日:2023-01-03 21:37:36 公開日:2020-02-05
# 道路アドレスと街路画像からの樹木のジオコーディング

Geocoding of trees from street addresses and street-level images ( http://arxiv.org/abs/2002.01708v1 )

ライセンス: Link先を確認
Daniel Laumer, Nico Lang, Natalie van Doorn, Oisin Mac Aodha, Pietro Perona, Jan Dirk Wegner(参考訳) 本研究では,ストリートレベルのパノラマ画像を用いた地理的座標を用いた古いツリー在庫の更新手法と,ツリーインスタンスマッチングのためのグローバル最適化フレームワークを提案する。 2000年代初めまでは、新しい在庫はGPSを使うのに対し、通りの住所を使って記録されていた。 本手法は, 古い在庫を地理的座標で再現し, 新たな在庫と接続し, 樹死などの長期研究を容易にする。 この問題に挑戦しているのは、ストリートアドレスごとに異なる木数、画像内の異なる木インスタンスの異種な外観、複数の画像やオクルージョンから見るとあいまいな木の位置である。 この課題を解決するために、我々は (i)ディープラーニングを用いたgoogleストリートビューパノラマにおける木の検出 (ii)ツリー毎のマルチビュー検出を単一の表現にまとめる。 (3)大域的最適化手法により,街路アドレス毎の木々が検出された。 米国カリフォルニア州5都市で5万本以上の樹木を実験した結果,大規模な街路樹の生態系サービス価値の長期的研究の出発点である街路樹の38%に地理的座標を割り当てることが可能であることが判明した。

We introduce an approach for updating older tree inventories with geographic coordinates using street-level panorama images and a global optimization framework for tree instance matching. Geolocations of trees in inventories until the early 2000s where recorded using street addresses whereas newer inventories use GPS. Our method retrofits older inventories with geographic coordinates to allow connecting them with newer inventories to facilitate long-term studies on tree mortality etc. What makes this problem challenging is the different number of trees per street address, the heterogeneous appearance of different tree instances in the images, ambiguous tree positions if viewed from multiple images and occlusions. To solve this assignment problem, we (i) detect trees in Google street-view panoramas using deep learning, (ii) combine multi-view detections per tree into a single representation, (iii) and match detected trees with given trees per street address with a global optimization approach. Experiments for > 50000 trees in 5 cities in California, USA, show that we are able to assign geographic coordinates to 38 % of the street trees, which is a good starting point for long-term studies on the ecosystem services value of street trees at large scale.
翻訳日:2023-01-03 21:37:14 公開日:2020-02-05
# ConvNetの空間情報依存性の分析

Analyzing the Dependency of ConvNets on Spatial Information ( http://arxiv.org/abs/2002.01827v1 )

ライセンス: Link先を確認
Yue Fan, Yongqin Xian, Max Maria Losch, Bernt Schiele(参考訳) 直感的には、画像分類は空間情報を用いて利益を得るべきである。 しかし最近の研究は、これが標準のCNNで過大評価されていることを示唆している。 本稿では,封筒を押下し,空間情報への依存度を高めることを目的とする。 本稿では,空間シャッフルとgap+fcを提案し,トレーニングとテストの両面で空間情報を破壊する。 興味深いことに、少ない性能低下で後層から空間情報を削除することは可能であり、後層の空間情報は良好な性能のために必要ではない。 例えば、VGG-16のテスト精度は0.03%と2.66%しか低下せず、それぞれCIFAR100の最後の30%と53%の層から空間情報が完全に除去されている。 広範囲なCNNアーキテクチャ(VGG16、ResNet50、ResNet152)を持つ複数のオブジェクト認識データセット(CIFAR100、Small-ImageNet、ImageNet)の評価は、全体的な一貫したパターンを示している。

Intuitively, image classification should profit from using spatial information. Recent work, however, suggests that this might be overrated in standard CNNs. In this paper, we are pushing the envelope and aim to further investigate the reliance on spatial information. We propose spatial shuffling and GAP+FC to destroy spatial information during both training and testing phases. Interestingly, we observe that spatial information can be deleted from later layers with small performance drops, which indicates spatial information at later layers is not necessary for good performance. For example, test accuracy of VGG-16 only drops by 0.03% and 2.66% with spatial information completely removed from the last 30% and 53% layers on CIFAR100, respectively. Evaluation on several object recognition datasets (CIFAR100, Small-ImageNet, ImageNet) with a wide range of CNN architectures (VGG16, ResNet50, ResNet152) shows an overall consistent pattern.
翻訳日:2023-01-03 21:36:55 公開日:2020-02-05
# トランスフォーマネットワークを用いたボコーダフリーエンドツーエンド音声変換

Vocoder-free End-to-End Voice Conversion with Transformer Network ( http://arxiv.org/abs/2002.03808v1 )

ライセンス: Link先を確認
June-Woo Kim, Ho-Young Jung, Minho Lee(参考訳) メル周波数フィルタバンク(MFB)に基づく手法は,MFBが特徴量が少ないため,生スペクトルと比較して学習音声の利点がある。 しかし、MFBアプローチによる音声生成には、トレーニングプロセスに膨大な計算コストを必要とするボコーダが必要となる。 MFBやvocoderのような追加のプレ/ポスト処理は、実際の人間の音声を他人に変換するのに必須ではない。 生のスペクトルと位相のみを使用して、明瞭な発音で異なるスタイルの音声を生成することができる。 そこで本研究では,生のスペクトルを用いた現実的な音声を並列に変換する手法を提案する。 CNN層やRNN層を持たないトランスフォーマーモデルアーキテクチャは,学習を高速化し,従来のRNNの逐次計算の制限を解消した。 本稿では,トランスネットワークを用いたヴォコーダフリーのエンドツーエンド音声変換手法を提案する。 提案する変換モデルは、音声認識のための話者適応にも使用できる。 本手法はmfbとvocoderを使わずに音源音声を目標音声に変換することができる。 変換されたマグニチュードと位相を乗じることで、音声認識に適合したmfbを得ることができる。 我々は, 自然性, 類似性, 明瞭度などの指標を用いて, tidigitsデータセット上で音声変換実験を行った。

Mel-frequency filter bank (MFB) based approaches have the advantage of learning speech compared to raw spectrum since MFB has less feature size. However, speech generator with MFB approaches require additional vocoder that needs a huge amount of computation expense for training process. The additional pre/post processing such as MFB and vocoder is not essential to convert real human speech to others. It is possible to only use the raw spectrum along with the phase to generate different style of voices with clear pronunciation. In this regard, we propose a fast and effective approach to convert realistic voices using raw spectrum in a parallel manner. Our transformer-based model architecture which does not have any CNN or RNN layers has shown the advantage of learning fast and solved the limitation of sequential computation of conventional RNN. In this paper, we introduce a vocoder-free end-to-end voice conversion method using transformer network. The presented conversion model can also be used in speaker adaptation for speech recognition. Our approach can convert the source voice to a target voice without using MFB and vocoder. We can get an adapted MFB for speech recognition by multiplying the converted magnitude with phase. We perform our voice conversion experiments on TIDIGITS dataset using the metrics such as naturalness, similarity, and clarity with mean opinion score, respectively.
翻訳日:2023-01-03 21:30:58 公開日:2020-02-05
# 機械教育の知覚をクラウドソーシングする

Crowdsourcing the Perception of Machine Teaching ( http://arxiv.org/abs/2002.01618v1 )

ライセンス: Link先を確認
Jonggi Hong, Kyungjun Lee, June Xu, Hernisa Kacorri(参考訳) 教育可能なインターフェースは、関連するトレーニング例を明示的に提供することにより、エンドユーザに、独自の特徴と環境に機械学習システムをチューニングする権限を与えることができる。 制御を容易にする一方で、その効果は専門知識や誤解の欠如によって妨げられる。 ユーザがamazon mechanical turkにモバイル教育可能なテストベッドを配置することで,機械教育への関与を概念化し,経験し,反映する方法について検討する。 パフォーマンスベースの支払いスキームを使用して、Mechanical Turkers (N = 100) は、環境で数枚のスナップショットを撮って、堅牢な認識モデルをリアルタイムでトレーニング、テスト、再トレーニングするために呼び出される。 参加者は、大きさ、視点、位置、照明によらず、人間が物体を認識する方法と平行して描いた例に多様性を取り入れている。 彼らの誤解の多くは、一貫性と推論のモデル能力に関連している。 テストのバリエーションやエッジケースが限られているため、ほとんどの場合、2回目のトレーニングでは戦略を変更しない。

Teachable interfaces can empower end-users to attune machine learning systems to their idiosyncratic characteristics and environment by explicitly providing pertinent training examples. While facilitating control, their effectiveness can be hindered by the lack of expertise or misconceptions. We investigate how users may conceptualize, experience, and reflect on their engagement in machine teaching by deploying a mobile teachable testbed in Amazon Mechanical Turk. Using a performance-based payment scheme, Mechanical Turkers (N = 100) are called to train, test, and re-train a robust recognition model in real-time with a few snapshots taken in their environment. We find that participants incorporate diversity in their examples drawing from parallels to how humans recognize objects independent of size, viewpoint, location, and illumination. Many of their misconceptions relate to consistency and model capabilities for reasoning. With limited variation and edge cases in testing, the majority of them do not change strategies on a second training attempt.
翻訳日:2023-01-03 21:30:41 公開日:2020-02-05
# CONVINCE: エッジでのコラボレーティブなクロスカメラビデオ分析

CONVINCE: Collaborative Cross-Camera Video Analytics at the Edge ( http://arxiv.org/abs/2002.03797v1 )

ライセンス: Link先を確認
Hannaneh Barahouei Pasandi, Tamer Nadeem(参考訳) 現在、ビデオカメラは、都市、工業、農業などの物理的場所を監視するために密集している。 現在のシステムでは、各カメラノードはそのフィードを個別にクラウドサーバーに送る。 しかし、このアプローチは計算コストの上昇、巨大なデータを分析するための大きな帯域幅の要求、プライバシの懸念など、いくつかのハードルに苦しむ。 密配置では、ビデオノードは典型的には大きな時空間相関を示す。 本稿では,これらの障害を克服するために,ネットワークカメラを集合体として見るための新しいアプローチであるCONVINCEを導入し,カメラ間の協調的なビデオ分析パイプラインを実現する。 CONVINCEは,1)カメラ間の時空間相関を利用して冗長フレームをインテリジェントに除去することにより,計算コストと帯域幅の要求を低減し,2)関連カメラ間の協調的な知識共有を可能にすることで,視覚アルゴリズムの精度を向上させることを目的とする。 本研究では,すべての記録フレームの約$\sim$25\%を送信することにより,オブジェクト識別精度が$\sim$91\%となることを示す。

Today, video cameras are deployed in dense for monitoring physical places e.g., city, industrial, or agricultural sites. In the current systems, each camera node sends its feed to a cloud server individually. However, this approach suffers from several hurdles including higher computation cost, large bandwidth requirement for analyzing the enormous data, and privacy concerns. In dense deployment, video nodes typically demonstrate a significant spatio-temporal correlation. To overcome these obstacles in current approaches, this paper introduces CONVINCE, a new approach to look at the network cameras as a collective entity that enables collaborative video analytics pipeline among cameras. CONVINCE aims at 1) reducing the computation cost and bandwidth requirements by leveraging spatio-temporal correlations among cameras in eliminating redundant frames intelligently, and ii) improving vision algorithms' accuracy by enabling collaborative knowledge sharing among relevant cameras. Our results demonstrate that CONVINCE achieves an object identification accuracy of $\sim$91\%, by transmitting only about $\sim$25\% of all the recorded frames.
翻訳日:2023-01-03 21:29:48 公開日:2020-02-05
# FRSign: 自律列車用の大規模交通光データセット

FRSign: A Large-Scale Traffic Light Dataset for Autonomous Trains ( http://arxiv.org/abs/2002.05665v1 )

ライセンス: Link先を確認
Jeanine Harb, Nicolas R\'eb\'ena, Rapha\"el Chosidow, Gr\'egoire Roblin, Roman Potarusov and Hatem Hajri(参考訳) 自動運転の分野では、自動運転車のデータセットをオープンソース化するための取り組みが数多く行われてきたが、列車などの代替交通手段についてはずっと少ない。 本稿では,視覚に基づく鉄道信号の検出と認識のための大規模かつ正確なデータセットFRSignを導入することにより,このギャップを埋めることを目的とする。 我々の録音はフランスで選択された走行列車で行われ、注意深い注釈の恩恵を受けた。 この論文は、取得したデータの10%に相当する図式データセットをオープンソースとして公開している。 6種類のフランスの鉄道信号機とその色の組み合わせを描写した10万枚以上の画像と、日付、時間、センサーパラメータ、バウンディングボックスなどの取得に関する関連情報が含まれている。 このデータセットはオープンソースのアドレス \url{https://frsign.irt-systemx.fr} で公開されている。 データセットのさまざまな特性を比較し,分析し,その変動性を表す指標を提供する。 また、自動運転車と比較して、自律列車に関する特定の課題や特異性についても論じる。

In the realm of autonomous transportation, there have been many initiatives for open-sourcing self-driving cars datasets, but much less for alternative methods of transportation such as trains. In this paper, we aim to bridge the gap by introducing FRSign, a large-scale and accurate dataset for vision-based railway traffic light detection and recognition. Our recordings were made on selected running trains in France and benefited from carefully hand-labeled annotations. An illustrative dataset which corresponds to ten percent of the acquired data to date is published in open source with the paper. It contains more than 100,000 images illustrating six types of French railway traffic lights and their possible color combinations, together with the relevant information regarding their acquisition such as date, time, sensor parameters, and bounding boxes. This dataset is published in open-source at the address \url{https://frsign.irt-systemx.fr}. We compare, analyze various properties of the dataset and provide metrics to express its variability. We also discuss specific challenges and particularities related to autonomous trains in comparison to autonomous cars.
翻訳日:2023-01-03 21:29:28 公開日:2020-02-05
# 逆指数ラドン変換の再検討

Revisit to the Inverse Exponential Radon Transform ( http://arxiv.org/abs/2002.01622v1 )

ライセンス: Link先を確認
Jason You(参考訳) この再訪は、過去30年間に数学的関心と核医学エミッションイメージングのような医学的応用の両方から研究されてきた逆指数ラドン変換の解析方法に関する調査である。 古典的な反転公式の導出は、逆減衰ラドン変換のために開発された最近の議論によるものである。 この導出により指数パラメータは複素定数となり、磁気共鳴イメージングやテンソル場イメージングといった他の応用にも有用である。 このサーベイには、有限ヒルベルト変換を用いて180度データからの正確な再構成を扱う新しい手法も含まれている。 2つの重要な課題に対して特別な治療がなされている。 1つは半スキャンや切り離しスキャンデータなどの部分的測定から正確な再構成であり、もう1つは発散ビームデータからの復元である。 再構成における雑音伝搬は、数学的推論よりもよりヒューリスティックな議論に触発される。 いくつかの古典的再構成アルゴリズムの数値化を含む。 結論として、今後のさらなる調査について、いくつかのトピックについて論じる。

This revisit gives a survey on the analytical methods for the inverse exponential Radon transform which has been investigated in the past three decades from both mathematical interests and medical applications such as nuclear medicine emission imaging. The derivation of the classical inversion formula is through the recent argument developed for the inverse attenuated Radon transform. That derivation allows the exponential parameter to be a complex constant, which is useful to other applications such as magnetic resonance imaging and tensor field imaging. The survey also includes the new technique of using the finite Hilbert transform to handle the exact reconstruction from 180 degree data. Special treatment has been paid on two practically important subjects. One is the exact reconstruction from partial measurements such as half-scan and truncated-scan data, and the other is the reconstruction from diverging-beam data. The noise propagation in the reconstruction is touched upon with more heuristic discussions than mathematical inference. The numerical realizations of several classical reconstruction algorithms are included. In the conclusion, several topics are discussed for more investigations in the future.
翻訳日:2023-01-03 21:28:36 公開日:2020-02-05
# ポインタネットワークを用いた不連続成分解析

Discontinuous Constituent Parsing with Pointer Networks ( http://arxiv.org/abs/2002.01824v1 )

ライセンス: Link先を確認
Daniel Fern\'andez-Gonz\'alez and Carlos G\'omez-Rodr\'iguez(参考訳) 計算言語学やNLPで使用される最も複雑な構文表現の1つは、不連続な構成木であり、ドイツ語のような言語の文法的現象を表現するのに不可欠である。 係り受け解析の最近の進歩は、ポインタネットワークが文中の単語間の構文関係を効率的に解析することに優れていることを示している。 この種のシーケンシャル・トゥ・シーケンスモデルは、非射影的依存性木を構築する際に際立った精度を発揮するが、その可能性はより難しいタスクで証明されていない。 本稿では,ポインタネットワークを用いて,パート・オブ・スパイチのタグ情報を必要とせずとも,これまでで最も正確な不連続な構成表現を生成できる新しいニューラルネットワークアーキテクチャを提案する。 そのため、不連続な構成構造を拡張非射影的依存構造として内部的にモデル化する。 提案手法は, NEGRA と TIGER の2つのベンチマークにおいて, 最先端の成果を得られた。

One of the most complex syntactic representations used in computational linguistics and NLP are discontinuous constituent trees, crucial for representing all grammatical phenomena of languages such as German. Recent advances in dependency parsing have shown that Pointer Networks excel in efficiently parsing syntactic relations between words in a sentence. This kind of sequence-to-sequence models achieve outstanding accuracies in building non-projective dependency trees, but its potential has not been proved yet on a more difficult task. We propose a novel neural network architecture that, by means of Pointer Networks, is able to generate the most accurate discontinuous constituent representations to date, even without the need of Part-of-Speech tagging information. To do so, we internally model discontinuous constituent structures as augmented non-projective dependency structures. The proposed approach achieves state-of-the-art results on the two widely-used NEGRA and TIGER benchmarks, outperforming previous work by a wide margin.
翻訳日:2023-01-03 21:28:23 公開日:2020-02-05
# ディープニューラルネットワークの意思決定境界を理解する:実証的研究

Understanding the Decision Boundary of Deep Neural Networks: An Empirical Study ( http://arxiv.org/abs/2002.01810v1 )

ライセンス: Link先を確認
David Mickisch, Felix Assion, Florens Gre{\ss}ner, Wiebke G\"unther, Mariele Motta(参考訳) 多くの画像分類タスクにおいて顕著な性能を達成したにもかかわらず、最先端機械学習(ML)分類器は小さな入力摂動に弱いままである。 特に、敵対的な例の存在は、自律運転や疾患検出など、安全およびセキュリティクリティカルな環境におけるMLモデルのデプロイに関する懸念を提起する。 ここ数年、敵国と汚職の堅牢性を改善するために、多くの防衛手法が公表されてきた。 しかし、提案された措置は非常に限られた範囲に留まった。 この限定的な進歩は、ディープニューラルネットワークにおける決定境界と決定領域の理解の欠如による部分もある。 そこで本研究では、決定境界に対するデータポイントの最小距離と、このマージンが深層ニューラルネットワークのトレーニングによってどのように進化するかを考察する。 mnist,fashion-mnist,cifar-10について実験を行った結果,決定境界は訓練後に自然画像に近づいた。 この現象は、分類器が既に低いトレーニングとテストエラー率を得る訓練の後期にも残っています。 一方、敵対的訓練は、決定境界のこの望ましくない収束を防ぐ可能性を秘めているように見える。

Despite achieving remarkable performance on many image classification tasks, state-of-the-art machine learning (ML) classifiers remain vulnerable to small input perturbations. Especially, the existence of adversarial examples raises concerns about the deployment of ML models in safety- and security-critical environments, like autonomous driving and disease detection. Over the last few years, numerous defense methods have been published with the goal of improving adversarial as well as corruption robustness. However, the proposed measures succeeded only to a very limited extent. This limited progress is partly due to the lack of understanding of the decision boundary and decision regions of deep neural networks. Therefore, we study the minimum distance of data points to the decision boundary and how this margin evolves over the training of a deep neural network. By conducting experiments on MNIST, FASHION-MNIST, and CIFAR-10, we observe that the decision boundary moves closer to natural images over training. This phenomenon even remains intact in the late epochs of training, where the classifier already obtains low training and test error rates. On the other hand, adversarial training appears to have the potential to prevent this undesired convergence of the decision boundary.
翻訳日:2023-01-03 21:21:36 公開日:2020-02-05
# 深層学習による環境騒音相関による分散曲線の抽出

Extracting dispersion curves from ambient noise correlations using deep learning ( http://arxiv.org/abs/2002.02040v1 )

ライセンス: Link先を確認
Xiaotian Zhang, Zhe Jia, Zachary E. Ross, and Robert W. Clayton(参考訳) 表面波の分散曲線の位相を分類する機械学習手法を提案する。 受信機のアレイで観測される表面の標準FTAN分析を画像に変換し、各画素を基本モード、第1オーバトン、ノイズに分類する。 我々は、教師付き学習目標を持つ畳み込みニューラルネットワーク(u-net)アーキテクチャを使用し、転送学習を組み込む。 トレーニングはまず粗い構造を学ぶために合成データを用いて行われ、続いて人間の分類に基づいて実際のデータの約10%を用いてネットワークを微調整する。 その結果,機械の分類は人間の選別フェーズとほぼ同一であることが判明した。 一度に複数の画像を処理できるように拡張しても、パフォーマンスは改善されなかった。 開発した手法は,大規模分散曲線データセットの自動処理をファシリエートする。

We present a machine-learning approach to classifying the phases of surface wave dispersion curves. Standard FTAN analysis of surfaces observed on an array of receivers is converted to an image, of which, each pixel is classified as fundamental mode, first overtone, or noise. We use a convolutional neural network (U-net) architecture with a supervised learning objective and incorporate transfer learning. The training is initially performed with synthetic data to learn coarse structure, followed by fine-tuning of the network using approximately 10% of the real data based on human classification. The results show that the machine classification is nearly identical to the human picked phases. Expanding the method to process multiple images at once did not improve the performance. The developed technique will faciliate automated processing of large dispersion curve datasets.
翻訳日:2023-01-03 21:20:33 公開日:2020-02-05
# 可変条件における校正性能向上のための話者検証バックエンド

A Speaker Verification Backend for Improved Calibration Performance across Varying Conditions ( http://arxiv.org/abs/2002.03802v1 )

ライセンス: Link先を確認
Luciana Ferrer and Mitchell McLaren(参考訳) 近年の研究では,訓練条件に対する各種のミスマッチを含むほとんどの試験条件において,箱外キャリブレーション性能が良好である話者検証のための識別バックエンドを提案する。 このバックエンドは、キャリブレーションステージを含むほとんどの現在の話者認証システムで使用される標準のPLDAベースのバックエンドプロセスを模倣する。 バックエンドのすべてのパラメータは、話者検証タスクのバイナリクロスエントロピーを最適化するために共同で訓練される。 キャリブレーションステージのパラメータを信号の条件を表すベクトルの関数とし、条件ラベルを予測するために訓練されたモデルを用いて抽出することにより、キャリブレーションロバスト性を実現する。 本研究では,キャリブレーションパラメータの計算に用いるベクトルを,条件予測モデルを必要とせずにバックエンド内で推定する,このバックエンドの簡易バージョンを提案する。 本手法は,従来の提案手法と類似した性能を提供するが,実装が簡単で,トレーニングデータに対する要件も少ないことを示す。 さらに,初期化の影響,キャリブレーションパラメータの計算に使用されるベクトルの性質,ランダムシードとトレーニングエポックの数が性能に与える影響など,手法のさまざまな側面の分析を行った。 また,提案手法とtbc(trial-based calibration)法との比較を行った。 提案手法は,標準的なPLDAベースラインに匹敵する,TBCよりも数桁高速に動作可能であることを示す。

In a recent work, we presented a discriminative backend for speaker verification that achieved good out-of-the-box calibration performance on most tested conditions containing varying levels of mismatch to the training conditions. This backend mimics the standard PLDA-based backend process used in most current speaker verification systems, including the calibration stage. All parameters of the backend are jointly trained to optimize the binary cross-entropy for the speaker verification task. Calibration robustness is achieved by making the parameters of the calibration stage a function of vectors representing the conditions of the signal, which are extracted using a model trained to predict condition labels. In this work, we propose a simplified version of this backend where the vectors used to compute the calibration parameters are estimated within the backend, without the need for a condition prediction model. We show that this simplified method provides similar performance to the previously proposed method while being simpler to implement, and having less requirements on the training data. Further, we provide an analysis of different aspects of the method including the effect of initialization, the nature of the vectors used to compute the calibration parameters, and the effect that the random seed and the number of training epochs has on performance. We also compare the proposed method with the trial-based calibration (TBC) method that, to our knowledge, was the state-of-the-art for achieving good calibration across varying conditions. We show that the proposed method outperforms TBC while also being several orders of magnitude faster to run, comparable to the standard PLDA baseline.
翻訳日:2023-01-03 21:19:16 公開日:2020-02-05
# 明示的特徴マップとしてのNested Barycentric Coordinate System

Nested Barycentric Coordinate System as an Explicit Feature Map ( http://arxiv.org/abs/2002.01999v1 )

ライセンス: Link先を確認
Lee-Ad Gottlieb, Eran Kaufman, Aryeh Kontorovich, Gabriel Nivasch, and Ofir Pele(参考訳) 本稿では,試料サイズが周囲寸法を大きく超えるような設定に特に適した新しい埋め込み手法を提案する。 この手法は,空間を簡素に分割し,簡素な重心座標に対応する特徴にデータ点を埋め込むことで構成する。 次に、単純性から得られるリッチな特徴空間で線形分類器を訓練する。 決定境界は非常に非線形であるが、各単純系内で線形である(従って分割線形全体である)。 さらに,任意の凸体を近似することができる。 我々は経験的マージンと新しいハイブリッドサンプル圧縮技術に基づく一般化境界を与える。 実験により,本手法は一般的なカーネルの埋め込み方法よりも優れた性能を示した。

We propose a new embedding method which is particularly well-suited for settings where the sample size greatly exceeds the ambient dimension. Our technique consists of partitioning the space into simplices and then embedding the data points into features corresponding to the simplices' barycentric coordinates. We then train a linear classifier in the rich feature space obtained from the simplices. The decision boundary may be highly non-linear, though it is linear within each simplex (and hence piecewise-linear overall). Further, our method can approximate any convex body. We give generalization bounds based on empirical margin and a novel hybrid sample compression technique. An extensive empirical evaluation shows that our method consistently outperforms a range of popular kernel embedding methods.
翻訳日:2023-01-03 21:12:28 公開日:2020-02-05
# 進化的アルゴリズムによる最大エントロピー分布の探索

Exploring Maximum Entropy Distributions with Evolutionary Algorithms ( http://arxiv.org/abs/2002.01973v1 )

ライセンス: Link先を確認
Raul Rojas(参考訳) 本稿では,与えられた制約の集合に対する最大エントロピー確率分布を数値的に発展させる方法について述べる。 進化的アルゴリズムは、よく知られた分析結果の近似を得ることができるが、より柔軟であり、閉じた公式が容易に記述できない分布を見つけることができる。 数値的アプローチは有限区間の分布を扱う。 制約された問題のラグランジアンを直接最適化することで、あるいは制約を満たす分布の部分集合間のエントロピーを最適化することによって、手順を実行する方法が2つあることを示す。 漸進的進化戦略は、制約のある問題を2つの方法のいずれかで解くと、一様、指数、ガウス、対数正規、ラプラスなどの分布を容易に得ることができる。 混合(キメラ)分布の解も見つかる。 分布の多くが対称で連続である理由を説明するが、いくつかはそうではない。

This paper shows how to evolve numerically the maximum entropy probability distributions for a given set of constraints, which is a variational calculus problem. An evolutionary algorithm can obtain approximations to some well-known analytical results, but is even more flexible and can find distributions for which a closed formula cannot be readily stated. The numerical approach handles distributions over finite intervals. We show that there are two ways of conducting the procedure: by direct optimization of the Lagrangian of the constrained problem, or by optimizing the entropy among the subset of distributions which fulfill the constraints. An incremental evolutionary strategy easily obtains the uniform, the exponential, the Gaussian, the log-normal, the Laplace, among other distributions, once the constrained problem is solved with any of the two methods. Solutions for mixed ("chimera") distributions can be also found. We explain why many of the distributions are symmetrical and continuous, but some are not.
翻訳日:2023-01-03 21:11:59 公開日:2020-02-05
# ゴースト-VLADプールを用いたインドの言語識別

Identification of Indian Languages using Ghost-VLAD pooling ( http://arxiv.org/abs/2002.01664v1 )

ライセンス: Link先を確認
Krishna D N, Ankita Patil, M.S.P Raj, Sai Prasad H S, Prabhu Aashish Garapati(参考訳) 本研究では,インド語を考慮し,言語識別のための新たなプール戦略を提案する。 本手法は,任意の可変長音声に対して,頑健な言語認識のための発話レベル特徴を得る。 我々は、ghostvladアプローチを用いて、時間毎に局所フレームレベルの特徴を集約することにより、任意の可変長入力オーディオに対して発話レベル特徴ベクトルを生成する。 生成した特徴ベクトルは非常に優れた言語識別機能を備えており、言語識別タスクにおける技術結果の取得に役立っている。 7つのインド語で635hrsの音声データについて実験を行った。 本手法は,f1-scoreにおける1.88%の絶対的改善により,art x-vector [11]法の以前の状態を上回り,ホールドアウトテストデータで98.43%のf1-scoreを達成した。 我々は,システムと様々なプール手法を比較し,GhostVLADが最適なプール手法であることを示す。 また,Ghost-VLADプーリングを用いた発話レベルの埋め込みを可視化し,優れた言語識別機能を持つ埋め込みを生成することを示す。

In this work, we propose a new pooling strategy for language identification by considering Indian languages. The idea is to obtain utterance level features for any variable length audio for robust language recognition. We use the GhostVLAD approach to generate an utterance level feature vector for any variable length input audio by aggregating the local frame level features across time. The generated feature vector is shown to have very good language discriminative features and helps in getting state of the art results for language identification task. We conduct our experiments on 635Hrs of audio data for 7 Indian languages. Our method outperforms the previous state of the art x-vector [11] method by an absolute improvement of 1.88% in F1-score and achieves 98.43% F1-score on the held-out test data. We compare our system with various pooling approaches and show that GhostVLAD is the best pooling approach for this task. We also provide visualization of the utterance level embeddings generated using Ghost-VLAD pooling and show that this method creates embeddings which has very good language discriminative features.
翻訳日:2023-01-03 21:11:44 公開日:2020-02-05
# ドメイン特化業務文書情報抽出のためのBERTの迅速適応

Rapid Adaptation of BERT for Information Extraction on Domain-Specific Business Documents ( http://arxiv.org/abs/2002.01861v1 )

ライセンス: Link先を確認
Ruixue Zhang, Wei Yang, Luyun Lin, Zhengkai Tu, Yuqing Xie, Zihang Fu, Yuhao Xie, Luchen Tan, Kun Xiong, Jimmy Lin(参考訳) 契約、ステートメント、書類などのビジネス文書から重要なコンテンツ要素を自動的に抽出する技術は、ビジネス操作をより効率的にする可能性がある。 この問題はシーケンスラベリングタスクとして定式化することができ、規制申請と不動産リース契約の2種類のビジネス文書へのBERTの適用を実証する。 この問題には「標準」な情報抽出タスクよりも容易な側面と、それをより困難にする他の側面があるが、バランスをとると、少量の注釈付きデータ(100文書未満)が妥当な正確性を達成するのに十分であることが分かる。 当社のモデルをエンドツーエンドのクラウドプラットフォームに統合することで,使いやすいアノテーションインターフェースと,ドキュメントのアップロードやモデルのアウトプットの検査が可能な推論インターフェースの両方を提供します。

Techniques for automatically extracting important content elements from business documents such as contracts, statements, and filings have the potential to make business operations more efficient. This problem can be formulated as a sequence labeling task, and we demonstrate the adaption of BERT to two types of business documents: regulatory filings and property lease agreements. There are aspects of this problem that make it easier than "standard" information extraction tasks and other aspects that make it more difficult, but on balance we find that modest amounts of annotated data (less than 100 documents) are sufficient to achieve reasonable accuracy. We integrate our models into an end-to-end cloud platform that provides both an easy-to-use annotation interface as well as an inference interface that allows users to upload documents and inspect model outputs.
翻訳日:2023-01-03 21:11:25 公開日:2020-02-05
# 絡み合った短期表現による連続メロディ生成と構造条件

Continuous Melody Generation via Disentangled Short-Term Representations and Structural Conditions ( http://arxiv.org/abs/2002.02393v1 )

ライセンス: Link先を確認
Ke Chen, Gus Xia, Shlomo Dubnov(参考訳) 自動音楽生成(automatic music generation)は、音楽の計算的創造性と意味分析を組み合わせて自動機械即興を生成する学際的な研究テーマである。 このようなシステムの重要な特性は、ユーザが生成した音楽の条件と所望の特性を指定できるようにすることである。 本論文では,ユーザが指定したシンボリックシナリオと過去の音楽コンテキストを組み合わせたメロディー合成モデルの設計を行った。 和音の張力と分解能の低次元表現を提供する和音関数の観点から、外部音楽の質を表す手動ラベル付きベクトルを加える。 本モデルでは,8拍音列を基本単位として長い旋律を生成でき,リズムパターン構造を他の歌と共有できる。 モデルには2つのステージがあり、第1ステージが条件付き変分オートエンコーダ(c-vae)を採用してノートシーケンスと潜在表現の間の単射を構築、第2ステージは構造条件が長い短期記憶ネットワーク(lstm)を採用して将来の旋律を書く。 さらに,C-VAEによるアンタングル化手法を利用して,リズムパターンの条件付けとは別に,ピッチ輪郭情報に基づくメロディ生成を実現する。 最後に,リズムの定量的分析と主観的聞き取り調査を用いて,提案モデルを評価する。 その結果,本モデルが生成する音楽は,顕著な繰り返し構造,豊かな動機,安定したリズムパターンを有する傾向が示唆された。 意味的シナリオ仕様条件と組み合わさった不整合表現から、より長い構造的フレーズを生成する能力は、我々のモデルの幅広い応用を示している。

Automatic music generation is an interdisciplinary research topic that combines computational creativity and semantic analysis of music to create automatic machine improvisations. An important property of such a system is allowing the user to specify conditions and desired properties of the generated music. In this paper we designed a model for composing melodies given a user specified symbolic scenario combined with a previous music context. We add manual labeled vectors denoting external music quality in terms of chord function that provides a low dimensional representation of the harmonic tension and resolution. Our model is capable of generating long melodies by regarding 8-beat note sequences as basic units, and shares consistent rhythm pattern structure with another specific song. The model contains two stages and requires separate training where the first stage adopts a Conditional Variational Autoencoder (C-VAE) to build a bijection between note sequences and their latent representations, and the second stage adopts long short-term memory networks (LSTM) with structural conditions to continue writing future melodies. We further exploit the disentanglement technique via C-VAE to allow melody generation based on pitch contour information separately from conditioning on rhythm patterns. Finally, we evaluate the proposed model using quantitative analysis of rhythm and the subjective listening study. Results show that the music generated by our model tends to have salient repetition structures, rich motives, and stable rhythm patterns. The ability to generate longer and more structural phrases from disentangled representations combined with semantic scenario specification conditions shows a broad application of our model.
翻訳日:2023-01-03 21:10:33 公開日:2020-02-05
# ML4H Abstract Track 2019

ML4H Abstract Track 2019 ( http://arxiv.org/abs/2002.01584v1 )

ライセンス: Link先を確認
Matthew B.A. McDermott (1), Emily Alsentzer (1 and 2), Sam Finlayson (1 and 2), Michael Oberst (1), Fabian Falck (3), Tristan Naumann (4), Brett K. Beaulieu-Jones (2), Adrian V. Dalca (2 and 1) ((1) Massachusetts Institute of Technology, (2) Harvard Medical School, (3) Carnegie Mellon University, (4) Microsoft Research)(参考訳) NeurIPS 2019でのML4H(Machine Learning for Health)ワークショップで受け入れられた抽象化のコレクション。 このインデックスは完全ではなく、一部の抽象概念がインクルージョンのオプトアウトを選択したためである。

A collection of the accepted abstracts for the Machine Learning for Health (ML4H) workshop at NeurIPS 2019. This index is not complete, as some accepted abstracts chose to opt-out of inclusion.
翻訳日:2023-01-03 21:03:52 公開日:2020-02-05
# 線形SVMのためのサブサンプルランダム化アダマール変換の改良

Improved Subsampled Randomized Hadamard Transform for Linear SVM ( http://arxiv.org/abs/2002.01628v1 )

ライセンス: Link先を確認
Zijian Lei and Liang Lan(参考訳) srht(subsampled randomized hadamard transform)は、d$-dimensional データを $r$-dimensional space (r \ll d$) または $o(dlog(d))$ time に効率的に投影できる一般的なランダム投影法であり、機械学習における高次元の課題に対処するために広く使われている。 SRHT は入力データ行列 $\mathbf{X} \in \mathbb{R}^{n \times d}$ by Randomized Walsh-Hadamard Transform で回転させ、その後、回転行列上の一様カラムサンプリングを行う。 SRHTの利点にもかかわらず、SRHTの1つの制限は、与えられたデータセットの特定の特性を考慮せずに新しい低次元埋め込みを生成することである。 したがって、このデータ非依存のランダムプロジェクション手法は、特定の機械学習タスク、例えば分類に使用する場合、劣等で不安定な性能をもたらす可能性がある。 この制限を克服するために、線形SVM分類の文脈において、ランダムプロジェクションにSRHTを用いることの効果を分析する。 そこで本研究では,一様サンプリングSRHTではなく,効率的な低次元埋め込みを実現するために,重要サンプリングと決定論的トップ・ドルサンプリングを提案する。 また,新しい教師付き非一様サンプリング法を提案した。 実験により,提案手法は6つの実生活データセット上のSRHTや他のランダムプロジェクション手法よりも高い分類精度が得られることが示された。

Subsampled Randomized Hadamard Transform (SRHT), a popular random projection method that can efficiently project a $d$-dimensional data into $r$-dimensional space ($r \ll d$) in $O(dlog(d))$ time, has been widely used to address the challenge of high-dimensionality in machine learning. SRHT works by rotating the input data matrix $\mathbf{X} \in \mathbb{R}^{n \times d}$ by Randomized Walsh-Hadamard Transform followed with a subsequent uniform column sampling on the rotated matrix. Despite the advantages of SRHT, one limitation of SRHT is that it generates the new low-dimensional embedding without considering any specific properties of a given dataset. Therefore, this data-independent random projection method may result in inferior and unstable performance when used for a particular machine learning task, e.g., classification. To overcome this limitation, we analyze the effect of using SRHT for random projection in the context of linear SVM classification. Based on our analysis, we propose importance sampling and deterministic top-$r$ sampling to produce effective low-dimensional embedding instead of uniform sampling SRHT. In addition, we also proposed a new supervised non-uniform sampling method. Our experimental results have demonstrated that our proposed methods can achieve higher classification accuracies than SRHT and other random projection methods on six real-life datasets.
翻訳日:2023-01-03 21:03:22 公開日:2020-02-05
# マルコフ決定プロセスはデータに適合するか:逐次意思決定におけるマルコフ特性のテスト

Does the Markov Decision Process Fit the Data: Testing for the Markov Property in Sequential Decision Making ( http://arxiv.org/abs/2002.01751v1 )

ライセンス: Link先を確認
Chengchun Shi, Runzhe Wan, Rui Song, Wenbin Lu, Ling Leng(参考訳) マルコフ仮定(MA)は、強化学習の実証的妥当性の基礎である。 本稿では,MAを逐次意思決定でテストするための新しいフォワード・バックワード学習手法を提案する。 提案試験では, 観測データの連立分布にパラメトリック形式を仮定せず, 高次マルコフ決定過程や部分的に観測可能なMDPにおいて, 最適方針を特定する上で重要な役割を担っている。 人工データセットとモバイルヘルス研究の実際のデータ例に本テストを適用し,その有用性を示す。

The Markov assumption (MA) is fundamental to the empirical validity of reinforcement learning. In this paper, we propose a novel Forward-Backward Learning procedure to test MA in sequential decision making. The proposed test does not assume any parametric form on the joint distribution of the observed data and plays an important role for identifying the optimal policy in high-order Markov decision processes and partially observable MDPs. We apply our test to both synthetic datasets and a real data example from mobile health studies to illustrate its usefulness.
翻訳日:2023-01-03 21:02:04 公開日:2020-02-05
# オンラインパッシブ攻撃型全エラーレート最小化

Online Passive-Aggressive Total-Error-Rate Minimization ( http://arxiv.org/abs/2002.01771v1 )

ライセンス: Link先を確認
Se-In Jang(参考訳) オンライン受動的学習(pa)と全エラーレート最小化(ter)をバイナリ分類に活用した新しいオンライン学習アルゴリズムを提案する。 PA学習は、大きなマージントレーニングだけでなく、非分離データを扱う能力も確立している。 一方、TER学習は、近似分類誤差に基づく目的関数を最小化する。 そこで,これらの特性を組み合わせたオンラインパターアルゴリズムを提案する。 さらに,データ不均衡問題に対処する能力を向上させるために,重み付きパターアルゴリズムを提案する。 実験の結果,実世界のデータセットにおいて,既存の最先端オンライン学習アルゴリズムよりも効率と有効性で優れた性能が得られることがわかった。

We provide a new online learning algorithm which utilizes online passive-aggressive learning (PA) and total-error-rate minimization (TER) for binary classification. The PA learning establishes not only large margin training but also the capacity to handle non-separable data. The TER learning on the other hand minimizes an approximated classification error based objective function. We propose an online PATER algorithm which combines those useful properties. In addition, we also present a weighted PATER algorithm to improve the ability to cope with data imbalance problems. Experimental results demonstrate that the proposed PATER algorithms achieves better performances in terms of efficiency and effectiveness than the existing state-of-the-art online learning algorithms in real-world data sets.
翻訳日:2023-01-03 21:01:36 公開日:2020-02-05
# ワッサーシュタイン指数核

Wasserstein Exponential Kernels ( http://arxiv.org/abs/2002.01878v1 )

ライセンス: Link先を確認
Henri De Plaen, Micha\"el Fanuel and Johan A. K. Suykens(参考訳) カーネルメソッドの文脈では、データポイント間の類似性は、ユークリッド距離によってしばしば定義されるカーネル関数によって符号化される。 近年、確率分布間のワッサーシュタイン距離など、最適輸送理論に依存する他の距離は、異なる機械学習技術に対する実践的妥当性を示している。 本稿では,正規化ワッサーシュタイン距離によって定義される指数核の利用について検討し,その正の定性について論じる。 より具体的には、wasserstein機能マップを定義し、形状や画像を含む教師付き学習問題に対する関心を示す。 経験的に、ワッサーシュタイン二乗指数核はユークリッド距離を用いた類似の分類器と比較して、小さな訓練された形状の集合に対してより小さな分類誤差をもたらす。

In the context of kernel methods, the similarity between data points is encoded by the kernel function which is often defined thanks to the Euclidean distance, a common example being the squared exponential kernel. Recently, other distances relying on optimal transport theory - such as the Wasserstein distance between probability distributions - have shown their practical relevance for different machine learning techniques. In this paper, we study the use of exponential kernels defined thanks to the regularized Wasserstein distance and discuss their positive definiteness. More specifically, we define Wasserstein feature maps and illustrate their interest for supervised learning problems involving shapes and images. Empirically, Wasserstein squared exponential kernels are shown to yield smaller classification errors on small training sets of shapes, compared to analogous classifiers using Euclidean distances.
翻訳日:2023-01-03 21:01:24 公開日:2020-02-05
# 細粒度都市流動推定

Fine-Grained Urban Flow Inference ( http://arxiv.org/abs/2002.02318v1 )

ライセンス: Link先を確認
Kun Ouyang, Yuxuan Liang, Ye Liu, Zekun Tong, Sijie Ruan, Yu Zheng, and David S. Rosenblum(参考訳) 都市流モニタリングシステムにおけるモニタリング装置のユビキタス展開は、メンテナンスと運用に大きなコストを発生させる。 データの正確性と粒度の低下を防止しつつ、デプロイされたデバイス数を減らす技術が必要となる。 本稿では,粒度の粗い観測に基づいて,都市全体の実時間および細粒の群集流を推定する手法を提案する。 この課題は、粗大な都市流と細粒度の都市流の空間的相関と、外部影響の複雑さである。 これらの課題に対処するため,2つの主要部分からなるUrbanFMというモデルを開発した。 1) 特徴抽出モジュールと新しい分布アップサンプリングモジュールを用いた粗粒度入力から細粒度フロー分布を生成する推論ネットワーク。 2)外部要因の影響を考慮した一般核融合サブネットにより、さらなる性能向上を図る。 この構造は小規模なアップサンプリングに優れた効果と効率をもたらす。 しかし,UrbanFMのシングルパスアップサンプリングは高いアップスケーリング速度では不十分である。 そこで本研究では,従来のタスクを複数のサブタスクに分解することで,細粒度の都市流れを段階的に推定するカスケードモデルであるUrbanPyについて述べる。 UrbanFMと比較して、このような拡張された構造は大規模推論タスクに好適な性能を示す。

The ubiquitous deployment of monitoring devices in urban flow monitoring systems induces a significant cost for maintenance and operation. A technique is required to reduce the number of deployed devices, while preventing the degeneration of data accuracy and granularity. In this paper, we present an approach for inferring the real-time and fine-grained crowd flows throughout a city based on coarse-grained observations. This task exhibits two challenges: the spatial correlations between coarse- and fine-grained urban flows, and the complexities of external impacts. To tackle these issues, we develop a model entitled UrbanFM which consists of two major parts: 1) an inference network to generate fine-grained flow distributions from coarse-grained inputs that uses a feature extraction module and a novel distributional upsampling module; 2) a general fusion subnet to further boost the performance by considering the influence of different external factors. This structure provides outstanding effectiveness and efficiency for small scale upsampling. However, the single-pass upsampling used by UrbanFM is insufficient at higher upscaling rates. Therefore, we further present UrbanPy, a cascading model for progressive inference of fine-grained urban flows by decomposing the original tasks into multiple subtasks. Compared to UrbanFM, such an enhanced structure demonstrates favorable performance for larger-scale inference tasks.
翻訳日:2023-01-03 20:54:38 公開日:2020-02-05
# 無脊椎動物の自動識別とバイオマス推定

Automatic image-based identification and biomass estimation of invertebrates ( http://arxiv.org/abs/2002.03807v1 )

ライセンス: Link先を確認
Johanna \"Arje, Claus Melvad, Mads Rosenh{\o}j Jeppesen, Sigurd Agerskov Madsen, Jenni Raitoharju, Maria Strandg{\aa}rd Rasmussen, Alexandros Iosifidis, Ville Tirronen, Kristian Meissner, Moncef Gabbouj, Toke Thomas H{\o}ye(参考訳) 生物コミュニティが環境変化にどう反応するかを理解することは、生態学と生態系管理の重要な課題である。 昆虫の個体数の明らかな減少は、より多くの生物モニタリングを必要とするが、時間を要する分類と分類は、昆虫の標本の処理量に強い制限をもたらす。 これは、無脊椎動物の多様性を完全にマップする努力の規模に影響を与える。 コンピュータビジョンの最近の進歩を踏まえ,人間の専門家によるソートと識別の標準的な手動アプローチを,自動画像ベース技術に置き換えることを提案する。 本稿では,無脊椎動物識別,バイオマス推定,サンプル分類のプロセスを自動化するロボット対応画像認識装置について述べる。 我々は,このイメージング装置を用いて,陸生節足動物種の総合画像データベースを作成する。 このデータベースを用いて分類精度、すなわち、マシンが撮影した画像から標本の種識別をどの程度正確に予測できるかをテストする。 また,カメラの設定(撮影時間と露光時間)に対する分類精度の感度をテストし,最適な画質を追求した。 分類タスクには最先端のResnet-50とInceptionV3 CNNを使用する。 最初のデータセットの結果は非常に有望である($\overline{ACC}=0.980$)。 このシステムは一般であり、他の無脊椎動物のグループにも容易に利用できる。 その結果,無脊椎動物の存在量,多様性,バイオマスの空間的および時間的変動に関するデータの生成が促進された。

Understanding how biological communities respond to environmental changes is a key challenge in ecology and ecosystem management. The apparent decline of insect populations necessitates more biomonitoring but the time-consuming sorting and identification of taxa pose strong limitations on how many insect samples can be processed. In turn, this affects the scale of efforts to map invertebrate diversity altogether. Given recent advances in computer vision, we propose to replace the standard manual approach of human expert-based sorting and identification with an automatic image-based technology. We describe a robot-enabled image-based identification machine, which can automate the process of invertebrate identification, biomass estimation and sample sorting. We use the imaging device to generate a comprehensive image database of terrestrial arthropod species. We use this database to test the classification accuracy i.e. how well the species identity of a specimen can be predicted from images taken by the machine. We also test sensitivity of the classification accuracy to the camera settings (aperture and exposure time) in order to move forward with the best possible image quality. We use state-of-the-art Resnet-50 and InceptionV3 CNNs for the classification task. The results for the initial dataset are very promising ($\overline{ACC}=0.980$). The system is general and can easily be used for other groups of invertebrates as well. As such, our results pave the way for generating more data on spatial and temporal variation in invertebrate abundance, diversity and biomass.
翻訳日:2023-01-03 20:54:20 公開日:2020-02-05
# multi-fusion chinese wordnet (mcw) : 機械学習と手動修正の複合化

Multi-Fusion Chinese WordNet (MCW) : Compound of Machine Learning and Manual Correction ( http://arxiv.org/abs/2002.01761v1 )

ライセンス: Link先を確認
Mingchen Li and Zili Zhou and Yanna Wang(参考訳) Princeton WordNet (PWN) は認知言語学に基づく語彙意味ネットワークであり、自然言語処理の発展を促進する。 PWNに基づいて、構文と意味論の問題を解決するために5つの中国語のワーネットが開発された。 その中には、northeast university chinese wordnet (new)、sinica bilingual ontological wordnet (bow)、southeast university chinese wordnet (sew)、taiwan university chinese wordnet (cwn)、china open wordnet (cow)がある。 これらを用いて,これらの単語ネットワークの精度とカバレッジが低く,PWNのセマンティックネットワークを完全に表現できないことがわかった。 そこで我々は、これらの欠点を補うために、Multi-Fusion Chinese Wordnet(MCW)という新しい中国語のワードネットを作ることにした。 鍵となるアイデアは、オックスフォードバイリンガル辞書と新華バイリンガル辞書の助けを借りてSEWを拡張し、修正することだ。 具体的には、修正に機械学習と手動調整を使いました。 作業を支援するために2つの基準が策定された。 関連度計算,単語の類似度,単語感覚の曖昧さの3つの課題について,補題の正確性の比較を行った。 その結果,mcwは,本手法によるカバレッジと精度の恩恵を受けることができた。 しかし、特に補題では改善の余地がある。 将来的には,MCWの精度を向上し,その概念を拡大していく。

Princeton WordNet (PWN) is a lexicon-semantic network based on cognitive linguistics, which promotes the development of natural language processing. Based on PWN, five Chinese wordnets have been developed to solve the problems of syntax and semantics. They include: Northeastern University Chinese WordNet (NEW), Sinica Bilingual Ontological WordNet (BOW), Southeast University Chinese WordNet (SEW), Taiwan University Chinese WordNet (CWN), Chinese Open WordNet (COW). By using them, we found that these word networks have low accuracy and coverage, and cannot completely portray the semantic network of PWN. So we decided to make a new Chinese wordnet called Multi-Fusion Chinese Wordnet (MCW) to make up those shortcomings. The key idea is to extend the SEW with the help of Oxford bilingual dictionary and Xinhua bilingual dictionary, and then correct it. More specifically, we used machine learning and manual adjustment in our corrections. Two standards were formulated to help our work. We conducted experiments on three tasks including relatedness calculation, word similarity and word sense disambiguation for the comparison of lemma's accuracy, at the same time, coverage also was compared. The results indicate that MCW can benefit from coverage and accuracy via our method. However, it still has room for improvement, especially with lemmas. In the future, we will continue to enhance the accuracy of MCW and expand the concepts in it.
翻訳日:2023-01-03 20:53:59 公開日:2020-02-05
# FunLinesによる創造性刺激 : ヘッドラインにおける風力発生の事例研究

Stimulating Creativity with FunLines: A Case Study of Humor Generation in Headlines ( http://arxiv.org/abs/2002.02031v1 )

ライセンス: Link先を確認
Nabil Hossain, John Krumm, Tanvir Sajed and Henry Kautz(参考訳) ユーモアのような創造的なテキストのデータセットを構築することは、非常に難しい。 FunLinesは、プレイヤーがニュースの見出しを編集して面白くし、他のプレイヤーが編集した見出しの面白さを評価する競争ゲームだ。 FunLinesはユーモア生成プロセスを面白く、インタラクティブで、コラボレーティブで、報奨と教育を提供し、プレイヤーのエンゲージメントを維持し、従来のクラウドソーシングのアプローチと比べて非常に低コストでユーモアデータを提供する。 FunLinesは有益なパフォーマンスフィードバックを提供し、ユーモアの生成と評価においてプレイヤーが時間とともに良くなるのを助ける。 これにより、生成されたデータセットの品質をさらに向上できる。 このデータの有効性を,以前のベンチマークを上回ったユーモア分類モデルのトレーニングによって示し,このデータセットを一般に公開する。

Building datasets of creative text, such as humor, is quite challenging. We introduce FunLines, a competitive game where players edit news headlines to make them funny, and where they rate the funniness of headlines edited by others. FunLines makes the humor generation process fun, interactive, collaborative, rewarding and educational, keeping players engaged and providing humor data at a very low cost compared to traditional crowdsourcing approaches. FunLines offers useful performance feedback, assisting players in getting better over time at generating and assessing humor, as our analysis shows. This helps to further increase the quality of the generated dataset. We show the effectiveness of this data by training humor classification models that outperform a previous benchmark, and we release this dataset to the public.
翻訳日:2023-01-03 20:53:29 公開日:2020-02-05
# 事前学習としてのパース

Parsing as Pretraining ( http://arxiv.org/abs/2002.01685v1 )

ライセンス: Link先を確認
David Vilares and Michalina Strzyz and Anders S{\o}gaard and Carlos G\'omez-Rodr\'iguez(参考訳) 最近の分析では、言語モデリングのために事前学習されたエンコーダは、特定の形態素合成構造をキャプチャすることが示唆されている。 しかし、ワードベクトルの探索フレームワークは、構成や依存性解析といった標準設定の結果をまだ報告していない。 本稿では,この問題に対処し,事前学習アーキテクチャのみに依存する完全な構文解析を行うとともに,復号化を行わない。 まず、コンストラクタと依存性解析をシーケンスタグとしてキャストする。 次に、単一のフィードフォワード層を使用して、線形木をエンコードするラベルにワードベクトルを直接マッピングします。 これは次のように使われる。 (i)事前訓練されたエンコーダで構文モデリングにどこまで到達できるか、そして (ii)異なる単語ベクトルの構文感受性(トレーニング中の事前学習ネットワークの重み付けを凍結することで)について光を当てた。 評価にはブラケットF1スコアとLASを用い、長さと依存性の変位を示す表現間の深度差を解析する。 PTB(93.5%)とEN-EWT UD(78.8%)の既存のシーケンスタギング・パーサーを上回る結果となった。

Recent analyses suggest that encoders pretrained for language modeling capture certain morpho-syntactic structure. However, probing frameworks for word vectors still do not report results on standard setups such as constituent and dependency parsing. This paper addresses this problem and does full parsing (on English) relying only on pretraining architectures -- and no decoding. We first cast constituent and dependency parsing as sequence tagging. We then use a single feed-forward layer to directly map word vectors to labels that encode a linearized tree. This is used to: (i) see how far we can reach on syntax modelling with just pretrained encoders, and (ii) shed some light about the syntax-sensitivity of different word vectors (by freezing the weights of the pretraining network during training). For evaluation, we use bracketing F1-score and LAS, and analyze in-depth differences across representations for span lengths and dependency displacements. The overall results surpass existing sequence tagging parsers on the PTB (93.5%) and end-to-end EN-EWT UD (78.8%).
翻訳日:2023-01-03 20:53:16 公開日:2020-02-05
# 言語モデルの事前学習と微調整対象の調整

Aligning the Pretraining and Finetuning Objectives of Language Models ( http://arxiv.org/abs/2002.02000v1 )

ライセンス: Link先を確認
Nuo Wang Pierse, Jingwen Lu(参考訳) 言語モデル学習における事前学習目標を微調整目標に明示的に整合させることにより、微調整タスクの性能が大幅に向上し、必要な微調整例の最小量を削減できることを実証する。 客観的アライメントから得られるパフォーマンスマージンにより、トレーニングデータが少ないタスクに対して、より小さなサイズの言語モデルを構築することができます。 これらの主張の実証的証拠として、関心のタグ付けや頭字語検出タスクに客観的なアライメントを適用する。 客観的アライメントでは、3つのトランスフォーマー言語モデルによる768 by 3と512の精度が83.9%/82.5%に達し、タスク毎に200の微調整例しか使用していない頭字語検出では73.8%/70.2%、客観的アライメントのない3モデルでは+4.8%/+3.4%、+9.9%/+6.3%に達した。 何百ものトレーニング例かそれ以下の"いくつかの例学習"が存在する場合、微調整の小さな言語モデルに名前を付けます。 実際には、客観的アライメントによって実現されるサンプル学習は、人間のラベル付けコストを節約するだけでなく、よりリアルタイムなアプリケーションで言語モデルを活用することができる。

We demonstrate that explicitly aligning the pretraining objectives to the finetuning objectives in language model training significantly improves the finetuning task performance and reduces the minimum amount of finetuning examples required. The performance margin gained from objective alignment allows us to build language models with smaller sizes for tasks with less available training data. We provide empirical evidence of these claims by applying objective alignment to concept-of-interest tagging and acronym detection tasks. We found that, with objective alignment, our 768 by 3 and 512 by 3 transformer language models can reach accuracy of 83.9%/82.5% for concept-of-interest tagging and 73.8%/70.2% for acronym detection using only 200 finetuning examples per task, outperforming the 768 by 3 model pretrained without objective alignment by +4.8%/+3.4% and +9.9%/+6.3%. We name finetuning small language models in the presence of hundreds of training examples or less "Few Example learning". In practice, Few Example Learning enabled by objective alignment not only saves human labeling costs, but also makes it possible to leverage language models in more real-time applications.
翻訳日:2023-01-03 20:52:35 公開日:2020-02-05
# 聞き耳が正しければ:アクティブリスニングスキルを備えたインタビューボットの構築と評価

If I Hear You Correctly: Building and Evaluating Interview Chatbots with Active Listening Skills ( http://arxiv.org/abs/2002.01862v1 )

ライセンス: Link先を確認
Ziang Xiao, Michelle X. Zhou, Wenxi Chen, Huahai Yang, Changyan Chi(参考訳) インタビューチャットボットは、テキストベースの会話にユーザーを巻き込み、自分の見解や意見を引き出す。 しかし、オープンエンドの質問に対するユーザーのフリーテキスト応答を処理し、魅力的なユーザー体験を提供する効果的なインタビューチャットボットを構築することは困難である。 最初のステップとして、公開可能な実用的なAI技術による効果的なインタビューチャットボットの実現可能性と有効性について検討している。 実現可能性を示すために、私たちは、アクティブリスニングスキルのサブセットを持つインタビューチャットボットを可能にするためにスコープされたプロトタイプを構築しました。 プロトタイプの有効性を評価するため,206名のユーザを対象に,4つの一般的なインタビュートピックに対して,インタビューチャットボットとアクティブリスニングスキルの有無を比較した。 本研究は, 効果的なインタビューチャットボット, ハイブリッドチャットボットプラットフォーム, インタビュータスク以外の共感型チャットボットを構築する上での実践的設計上の意義を示す。

Interview chatbots engage users in a text-based conversation to draw out their views and opinions. It is, however, challenging to build effective interview chatbots that can handle user free-text responses to open-ended questions and deliver engaging user experience. As the first step, we are investigating the feasibility and effectiveness of using publicly available, practical AI technologies to build effective interview chatbots. To demonstrate feasibility, we built a prototype scoped to enable interview chatbots with a subset of active listening skills - the abilities to comprehend a user's input and respond properly. To evaluate the effectiveness of our prototype, we compared the performance of interview chatbots with or without active listening skills on four common interview topics in a live evaluation with 206 users. Our work presents practical design implications for building effective interview chatbots, hybrid chatbot platforms, and empathetic chatbots beyond interview tasks.
翻訳日:2023-01-03 20:52:06 公開日:2020-02-05
# 解釈可能な多層表現学習によるMOOCにおける週ごとの降雨予測

Dropout Prediction over Weeks in MOOCs via Interpretable Multi-Layer Representation Learning ( http://arxiv.org/abs/2002.01598v1 )

ライセンス: Link先を確認
Byungsoo Jeon, Namyong Park, Seojin Bang(参考訳) 大規模オープンオンラインコース(MOOC)はオンライン学習の人気のあるプラットフォームとなっている。 MOOCは、生徒が自分のペースで勉強できるが、この柔軟性により、生徒がクラスから脱落しやすくなる。 本稿では,次の週のクリックストリームデータから,学習者が次の週以内に退学するかどうかを予測することを目的とする。 そこで本研究では,非教師付きで低レベルのクリックストリームから学習し,解釈可能な結果を生成し,手動の特徴工学を回避する,分岐境界(BB)アルゴリズムに基づく多層表現学習ソリューションを提案する。 courseraデータを用いた実験では、単純なモデルがより複雑なタスク固有のモデルと同等に振る舞うことができる表現を学習し、bbアルゴリズムがどのように解釈可能な結果を得るかを示す。 観察した限界の分析では,今後の方向性について検討する。

Massive Open Online Courses (MOOCs) have become popular platforms for online learning. While MOOCs enable students to study at their own pace, this flexibility makes it easy for students to drop out of class. In this paper, our goal is to predict if a learner is going to drop out within the next week, given clickstream data for the current week. To this end, we present a multi-layer representation learning solution based on branch and bound (BB) algorithm, which learns from low-level clickstreams in an unsupervised manner, produces interpretable results, and avoids manual feature engineering. In experiments on Coursera data, we show that our model learns a representation that allows a simple model to perform similarly well to more complex, task-specific models, and how the BB algorithm enables interpretable results. In our analysis of the observed limitations, we discuss promising future directions.
翻訳日:2023-01-03 20:51:48 公開日:2020-02-05
# ルート指示からランドマークグラフへ

From Route Instructions to Landmark Graphs ( http://arxiv.org/abs/2002.02012v1 )

ライセンス: Link先を確認
Christopher M Cervantes(参考訳) ランドマークは人々の操作方法の中心だが、ほとんどのナビゲーション技術はそれらの表現にそれらを組み込んでいない。 ランドマークグラフ生成タスク(自然言語からランドマークベースの空間表現を生成する)を提案し、これらのグラフを生成するための完全なエンドツーエンドのニューラルアプローチを提案する。 提案手法は,SAIL経路指示データセットと,収集した実世界の配送指示セットに基づいて評価し,我々の作業と関連するロボットナビゲーションタスクの両方において,高品質な結果が得られることを示す。

Landmarks are central to how people navigate, but most navigation technologies do not incorporate them into their representations. We propose the landmark graph generation task (creating landmark-based spatial representations from natural language) and introduce a fully end-to-end neural approach to generate these graphs. We evaluate our models on the SAIL route instruction dataset, as well as on a small set of real-world delivery instructions that we collected, and we show that our approach yields high quality results on both our task and the related robotic navigation task.
翻訳日:2023-01-03 20:51:34 公開日:2020-02-05
# 目標指向マルチタスクbertベースの対話状態トラッカ

Goal-Oriented Multi-Task BERT-Based Dialogue State Tracker ( http://arxiv.org/abs/2002.02450v1 )

ライセンス: Link先を確認
Pavel Gulyaev, Eugenia Elistratova, Vasily Konovalov, Yuri Kuratov, Leonid Pugachev, Mikhail Burtsev(参考訳) 対話状態追跡(DST)は、AlexaやSiriといったバーチャルアシスタントの中核的なコンポーネントである。 さまざまなタスクを達成するために、これらのアシスタントはますます多くのサービスやAPIをサポートする必要がある。 8th Dialogue System Technology ChallengeのSchema-Guided State Tracking Trackは、目に見えないサービスのDST問題を強調した。 主催者はマルチドメイン会話を備えたスキーマガイドダイアログ(SGD)データセットを導入し、ゼロショット対話状態追跡モデルをリリースした。 本稿では,理解型質問応答システムのためのアーキテクチャに着想を得た,目標指向のマルチタスクbertベースの対話状態トラッカ(golomb)を提案する。 モデルでは、スロットとサービスの記述とスロットの可能な値で対話履歴を"クエリ"する。 これにより、マルチドメイン対話におけるスロット値の転送が可能になり、未確認のスロットタイプにスケールすることができる。 本モデルでは,SGDデータセットで53.97%の目標精度を達成し,ベースラインモデルを上回った。

Dialogue State Tracking (DST) is a core component of virtual assistants such as Alexa or Siri. To accomplish various tasks, these assistants need to support an increasing number of services and APIs. The Schema-Guided State Tracking track of the 8th Dialogue System Technology Challenge highlighted the DST problem for unseen services. The organizers introduced the Schema-Guided Dialogue (SGD) dataset with multi-domain conversations and released a zero-shot dialogue state tracking model. In this work, we propose a GOaL-Oriented Multi-task BERT-based dialogue state tracker (GOLOMB) inspired by architectures for reading comprehension question answering systems. The model "queries" dialogue history with descriptions of slots and services as well as possible values of slots. This allows to transfer slot values in multi-domain dialogues and have a capability to scale to unseen slot types. Our model achieves a joint goal accuracy of 53.97% on the SGD dataset, outperforming the baseline model.
翻訳日:2023-01-03 20:44:11 公開日:2020-02-05
# 未知の未知の探索的機械学習

Exploratory Machine Learning with Unknown Unknowns ( http://arxiv.org/abs/2002.01605v1 )

ライセンス: Link先を確認
Yu-Jie Zhang and Peng Zhao and Zhi-Hua Zhou(参考訳) 従来の教師付き学習では、トレーニングデータセットは既知のラベルセットから接地ラベルで与えられ、学習されたモデルは未知のインスタンスを既知のラベルに分類する。 本稿では,他のラベルと誤認識されたトレーニングデータセットに未知のクラスが存在するという新たな問題設定について検討する。 未知の未知を,不完全に認識されたラベル空間が不十分な特徴情報のためにトレーニングデータセットに悪影響があるという事実に分類する。 そこで本研究では,未知のラベルを発見できる機能空間を積極的に拡張することにより,学習データセットを調査し,検討する探索型機械学習を提案する。 提案手法は, 拒絶モデル, 特徴獲得, モデルカスケードの3成分からなる。 有効性は、合成データセットと実データセットの両方で検証される。

In conventional supervised learning, a training dataset is given with ground-truth labels from a known label set, and the learned model will classify unseen instances to the known labels. In this paper, we study a new problem setting in which there are unknown classes in the training dataset misperceived as other labels, and thus their existence appears unknown from the given supervision. We attribute the unknown unknowns to the fact that the training dataset is badly advised by the incompletely perceived label space due to the insufficient feature information. To this end, we propose the exploratory machine learning, which examines and investigates the training dataset by actively augmenting the feature space to discover potentially unknown labels. Our approach consists of three ingredients including rejection model, feature acquisition, and model cascade. The effectiveness is validated on both synthetic and real datasets.
翻訳日:2023-01-03 20:43:41 公開日:2020-02-05
# 因果推論に関する調査

A Survey on Causal Inference ( http://arxiv.org/abs/2002.02770v1 )

ライセンス: Link先を確認
Liuyi Yao, Zhixuan Chu, Sheng Li, Yaliang Li, Jing Gao, Aidong Zhang(参考訳) 因果推論は、統計学、計算機科学、教育、公共政策、経済学など、何十年もの間、多くの分野にわたる重要な研究テーマである。 近年, 観測データから因果効果を推定する手法が, ランダム化試験と比較して, 大量のデータと低予算要求により, 魅力的な研究方向となっている。 急速に発達した機械学習領域を取り入れた観測データに対する様々な因果効果推定手法が誕生した。 本稿では,既知の因果推論フレームワークの1つである潜在的帰結フレームワークに基づいて,因果推論手法の包括的レビューを行う。 メソッドは、潜在的な結果フレームワークの3つの仮定すべてを必要とするかどうかによって、2つのカテゴリに分けられる。 各カテゴリについて,従来の統計手法と最近の機械学習強化手法を比較し,比較した。 広告、レコメンデーション、医療などの応用を含む、これらの方法の正当な応用も提示されている。 さらに、一般的に使用されるベンチマークデータセットとオープンソースコードも要約されており、研究者や実践者が因果推論メソッドを探索し、評価し、適用することができる。

Causal inference is a critical research topic across many domains, such as statistics, computer science, education, public policy and economics, for decades. Nowadays, estimating causal effect from observational data has become an appealing research direction owing to the large amount of available data and low budget requirement, compared with randomized controlled trials. Embraced with the rapidly developed machine learning area, various causal effect estimation methods for observational data have sprung up. In this survey, we provide a comprehensive review of causal inference methods under the potential outcome framework, one of the well known causal inference framework. The methods are divided into two categories depending on whether they require all three assumptions of the potential outcome framework or not. For each category, both the traditional statistical methods and the recent machine learning enhanced methods are discussed and compared. The plausible applications of these methods are also presented, including the applications in advertising, recommendation, medicine and so on. Moreover, the commonly used benchmark datasets as well as the open-source codes are also summarized, which facilitate researchers and practitioners to explore, evaluate and apply the causal inference methods.
翻訳日:2023-01-03 20:43:12 公開日:2020-02-05
# 領域適応のためのエントロピー最小化と多様性最大化

Entropy Minimization vs. Diversity Maximization for Domain Adaptation ( http://arxiv.org/abs/2002.01690v1 )

ライセンス: Link先を確認
Xiaofu Wu, Suofei hang, Quan Zhou, Zhen Yang, Chunming Zhao, Longin Jan Latecki(参考訳) エントロピー最小化はunsupervised domain adaptation (uda) で広く使われている。 しかし、既存の研究はエントロピーの最小化が崩壊した自明な解にしかならないことを示した。 本稿では,多様性の最大化をさらに導入して,自明な解を避けることを提案する。 UDAの最小目標リスクを達成するために,多様性の最大化とエントロピーの最小化との厳密なバランスをとるべきであることを示す。 提案する最小エントロピー多様性最大化(medm)は,逆学習を使わずに確率的勾配降下によって直接実装できる。 実証的な証拠は、MEDMが4つの一般的なドメイン適応データセットで最先端の手法より優れていることを示している。

Entropy minimization has been widely used in unsupervised domain adaptation (UDA). However, existing works reveal that entropy minimization only may result into collapsed trivial solutions. In this paper, we propose to avoid trivial solutions by further introducing diversity maximization. In order to achieve the possible minimum target risk for UDA, we show that diversity maximization should be elaborately balanced with entropy minimization, the degree of which can be finely controlled with the use of deep embedded validation in an unsupervised manner. The proposed minimal-entropy diversity maximization (MEDM) can be directly implemented by stochastic gradient descent without use of adversarial learning. Empirical evidence demonstrates that MEDM outperforms the state-of-the-art methods on four popular domain adaptation datasets.
翻訳日:2023-01-03 20:42:55 公開日:2020-02-05
# 符号付きグラフカットを用いた近接保存バイナリコード

Proximity Preserving Binary Code using Signed Graph-Cut ( http://arxiv.org/abs/2002.01793v1 )

ライセンス: Link先を確認
Inbal Lav, Shai Avidan, Yoram Singer, Yacov Hel-Or(参考訳) 我々は,データポイント間の類似性と類似性を学習し,コンパクトで親和性の高いバイナリコードを生成する,近接保存コード(ppc)と呼ばれるバイナリ埋め込みフレームワークを導入する。 このコードは、最寄りの探索に高速でメモリ効率の良い近似を適用するために使用できる。 私たちのフレームワークは柔軟で、データポイント間で異なる近接定義を可能にします。 符号のないグラフ分割に基づいてバイナリコードを抽出する従来の手法とは対照的に、我々のシステムは正と負のグラフ重みを組み込むことで、データの魅力と反発力をモデル化する。 提案したフレームワークは、NPハード(NP-hard)として知られる符号付きグラフの最小カットを見つけることに起因している。 効率の良い近似を提供し,コードビットをビット後に構築することで優れた結果を得る。 提案手法は, 精度と複雑さの両方において, 一般的なスペクトル法よりも優れていることを示す。 したがって、これは符号付きグラフカットに変換できる他の多くの問題に有用である。

We introduce a binary embedding framework, called Proximity Preserving Code (PPC), which learns similarity and dissimilarity between data points to create a compact and affinity-preserving binary code. This code can be used to apply fast and memory-efficient approximation to nearest-neighbor searches. Our framework is flexible, enabling different proximity definitions between data points. In contrast to previous methods that extract binary codes based on unsigned graph partitioning, our system models the attractive and repulsive forces in the data by incorporating positive and negative graph weights. The proposed framework is shown to boil down to finding the minimal cut of a signed graph, a problem known to be NP-hard. We offer an efficient approximation and achieve superior results by constructing the code bit after bit. We show that the proposed approximation is superior to the commonly used spectral methods with respect to both accuracy and complexity. Thus, it is useful for many other problems that can be translated into signed graph cut.
翻訳日:2023-01-03 20:42:43 公開日:2020-02-05