このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20221223となっている論文です。

PDF登録状況(公開日: 20221223)

TitleAuthorsAbstract論文公表日・翻訳日
# binary-coupling sparse syk: 量子カオスとホログラフィの改良モデル

Binary-coupling sparse SYK: an improved model of quantum chaos and holography ( http://arxiv.org/abs/2208.12098v3 )

ライセンス: Link先を確認
Masaki Tezuka, Onur Oktay, Enrico Rinaldi, Masanori Hanada, and Franco Nori(参考訳) Sachdev-Ye-Kitaevモデル(SYK)のスパースバージョンは、障害パラメータ数を減らしながら、オリジナルのSYKモデルの本質的な特徴を再現する。 本稿では,二元結合型スパースシックモデル(sparse syk model)と呼ばれるモデルをさらに単純化する手法を提案する。 我々は、ガウス型のような連続分布からサンプリングされるのではなく、非零結合を$\pm 1$と設定した。 二項結合モデルはスペクトルに強い相関関係を示し、これは元のSYKモデルの重要な特徴であり、非ゼロ項の数に関してより効率的にランダム行列普遍性の迅速なオンセットをもたらす。 このモデルは、単純さとスケーリング特性のため、量子カオス挙動とホログラフィック金属のアナログ量子シミュレーションやデジタル量子シミュレーションに適している。

The sparse version of the Sachdev-Ye-Kitaev (SYK) model reproduces essential features of the original SYK model while reducing the number of disorder parameters. In this paper, we propose a further simplification of the model which we call the binary-coupling sparse SYK model. We set the nonzero couplings to be $\pm 1$, rather than being sampled from a continuous distribution such as Gaussian. Remarkably, this simplification turns out to be an improvement: the binary-coupling model exhibits strong correlations in the spectrum, which is the important feature of the original SYK model that leads to the quick onset of the random-matrix universality, more efficiently in terms of the number of nonzero terms. This model is better suited for analog or digital quantum simulations of quantum chaotic behavior and holographic metals due to its simplicity and scaling properties.
翻訳日:2023-01-29 21:14:33 公開日:2022-12-23
# 非定数曲率空間上の量子非線形振動子のシャノン情報エントロピー

Shannon information entropy for a quantum nonlinear oscillator on a space of non-constant curvature ( http://arxiv.org/abs/2209.05293v2 )

ライセンス: Link先を確認
Angel Ballesteros and Ivan Gutierrez-Sagredo(参考訳) いわゆるダルブックスIII発振器は、非定常負曲率を持つ放射対称空間上で定義される、正確に解ける$N$次元非線形発振器である。 この発振器は、基底空間の曲率に直接関係する非負パラメータ $\lambda$ の観点から、通常の$N$次元調和発振器の滑らかな(超)可積分変形と解釈することができる。 本稿では,darboux iii発振器の量子バージョンに対するシャノン情報エントロピーの詳細な研究を行い,エントロピーと曲率の相互作用を解析した。 特に、位置空間におけるシャノンエントロピーの解析結果は、$N$-次元の場合で見られ、$N$-次元高調波発振器の量子状態の既知の結果は、消滅曲率$\lambda \to 0$の極限で回復される。 しかし、ダルブックスIII波動関数のフーリエ変換は正確には計算できないため、運動量空間における情報エントロピーの解析的研究が妨げられる。 しかし, 1 次元の場合と 3 次元の場合の両方で後者を数値的に計算し, 負曲率の絶対値(より大きい$\lambda$パラメータ)を増大させることで, 位置空間における情報エントロピーが増大し, 運動量空間では小さくなることがわかった。 この結果は、明示的に示されるこの量子非線形振動子の波動関数の拡散特性と確かに一致する。 すべての励起状態において、そのような全エントロピーは$\lambda$で減少するが、基底状態では、総エントロピーは$\lambda$が消えると最小化され、対応する不確実性関係は常に満たされる。

The so-called Darboux III oscillator is an exactly solvable $N$-dimensional nonlinear oscillator defined on a radially symmetric space with non-constant negative curvature. This oscillator can be interpreted as a smooth (super)integrable deformation of the usual $N$-dimensional harmonic oscillator in terms of a non-negative parameter $\lambda$ which is directly related to the curvature of the underlying space. In this paper, a detailed study of the Shannon information entropy for the quantum version of the Darboux III oscillator is presented, and the interplay between entropy and curvature is analysed. In particular, analytical results for the Shannon entropy in the position space can be found in the $N$-dimensional case, and the known results for the quantum states of the $N$-dimensional harmonic oscillator are recovered in the limit of vanishing curvature $\lambda \to 0$. However, the Fourier transform of the Darboux III wave functions cannot be computed in exact form, thus preventing the analytical study of the information entropy in momentum space. Nevertheless, we have computed the latter numerically both in the one and three-dimensional cases and we have found that by increasing the absolute value of the negative curvature (through a larger $\lambda$ parameter) the information entropy in position space increases, while in momentum space it becomes smaller. This result is indeed consistent with the spreading properties of the wave functions of this quantum nonlinear oscillator, which are explicitly shown. The sum of the entropies in position and momentum spaces has been also analysed in terms of the curvature: for all excited states such total entropy decreases with $\lambda$, but for the ground state the total entropy is minimised when $\lambda$ vanishes, and the corresponding uncertainty relation is always fulfilled.
翻訳日:2023-01-26 22:11:06 公開日:2022-12-23
# 量子理論はフラウチャー=レンナーのゲダンケン実験において自分自身の使用を一貫して記述することができる

Quantum theory can consistently describe the use of itself in Frauchiger-Renner's Gedankenexperiment ( http://arxiv.org/abs/2209.08968v2 )

ライセンス: Link先を確認
Ehsan Erfani Maharati, Mohsen Sarbishaei, Ali Ahanj(参考訳) 理論物理学は量子力学の出現以来多くの課題に直面してきた。 近年、フラウチャーとレンナーはノーゴー定理を提唱し、量子力学をより議論を呼んでいる。 しかし、我々の視点では、証明のプロセスは疑わしいように見える。 そこで本稿では,その証明手法の有効性について論じる。 本稿では,Frauchiger や Renner の Gedankenexperiment のような問題において,属性量子状態がいかに正しく記述できるかを明らかにするための簡単な思考実験を提案する。 次のステップでは、量子状態の正しい形の助けを借りて、no-go定理の証明に誤りが生じていることが示される。 最終的に、ハーディのパラドックスから助けを得て、ノーゴー定理の妥当性を貸すために証明を変更するアプローチがあるかどうかを調査する。

Theoretical physics has faced many challenges since the advent of quantum mechanics. Recently, Frauchiger and Renner have presented a no-go theorem, which makes quantum mechanics more controversial. However, from our perspective, the process of proving appears questionable. Therefore, we discuss the validity of their proof approach in this letter. Here, we propose a simple thought experiment that clarifies how correctly the attributed quantum state can be written in problems similar to Frauchiger and Renner's Gedankenexperiment. In the next step, with the help of the correct form of the quantum state, it is demonstrated that a fallacy occurred in the proof of the no-go theorem, which means it cannot be valid because of the wrong proof. Ultimately, getting help from Hardy's paradox, we investigate whether there is an approach to modify their proof in order to lend the no-go theorem validity.
翻訳日:2023-01-26 02:12:45 公開日:2022-12-23
# 量子ラチェット状態による光ハーベスティング

Light-harvesting enhanced by quantum ratchet states ( http://arxiv.org/abs/2209.09978v2 )

ライセンス: Link先を確認
Nicholas Werren, William M. Brown, Erik M. Gauger(参考訳) バイオインスパイアされたリングシステムは、光子吸収を許容しながら放射崩壊から保護される非局在化された励起子状態を可能にする「光ラッチェティング」の利点を探求するために光回路であると考える。 本研究では,アンテナから関連するトラップ部位へ,エキシトンを不整合あるいは整合的に抽出した場合に,ラッチングアンテナの性能がシステムサイズとどのようにスケールするかを検討する。 どちらの場合も、振動モードとの結合が一般的に強いと仮定できる現実的なシステムをより密にモデル化するために、ポーラロンフレームに移動する。 本研究では, 幾何配置, 抽出機構, 振動結合強度の相互作用に対する予測性能の多面的, ニュアンス的依存性を見いだした。 一部の体制は、サイトごとに抽出された電力の大幅な性能向上を支持している。

We consider bio-inspired ring systems as photovoltaic circuits to explore the advantage of `optical ratcheting', a process whereby the arrangement of coupled optical dipoles enables delocalised excitonic states that are protected against radiative decay whilst permitting the absorption of further photons. We explore how the performance of a ratcheting antenna scales with system size when excitons are incoherently or coherently extracted from the antenna to an associated trap site. In both instances we also move to the polaron frame in order to more closely model realistic systems where the coupling to vibrational modes can generally be assumed to be strong. We find a multifaceted and nuanced dependence of the predicted performance on an interplay between geometrical arrangement, extraction mechanism, and vibrational coupling strength. Certain regimes support substantial performance improvements in the power extracted per site.
翻訳日:2023-01-25 20:58:26 公開日:2022-12-23
# 島を越えて:自由確率的アプローチ

Beyond islands: A free probabilistic approach ( http://arxiv.org/abs/2209.10546v2 )

ライセンス: Link先を確認
Jinzhao Wang(参考訳) 重力経路積分を全制御で実装可能なペニントン・シェンカー・スタンフォード・ヤンモデル(pssy)の文脈において,任意のバルク放射線状態の細粒度放射エントロピーを計算するための自由確率的提案を行う。 我々は, レプリカ・トリックの重力経路積分が, 重力セクターと物質セクターのスペクトル間の自由乗法的畳み込みに相似していることを観察した。 畳み込み公式は、島式が適用されない場合であっても、放射エントロピーを正確に計算する。 これはまた、この重力レプリカのトリックを可溶性ハウスドルフモーメント問題として正当化するのに役立ちます。 次に,自由調和解析を用いて自由畳み込み式をどのように評価するかを考察し,分離可能なサンプル共分散行列スペクトルを解く新しい自由確率的処理を与える。 自由畳み込み公式は、競合する量子極端曲面で符号化された量子情報は有限フォン・ノイマン代数において自由確率変数としてモデル化できることを示唆している。 自由確率とランダム行列理論の密接な関係を用いて、PSSYモデルは、本質的にはペイジのモデルの一般化であるランダム行列モデルとして記述できることを示す。 島式は、一発のエントロピーによって特徴づけられる体制において、畳み込みが分解されるときにのみ適用可能であることが示される。 さらに, 畳み込み公式を, 相対エントロピーの観点から一般化エントロピー公式に再構成できることを示した。

We give a free probabilistic proposal to compute the fine-grained radiation entropy for an arbitrary bulk radiation state, in the context of the Penington-Shenker-Stanford-Yang (PSSY) model where the gravitational path integral can be implemented with full control. We observe that the replica trick gravitational path integral is combinatorially matching the free multiplicative convolution between the spectra of the gravitational sector and the matter sector respectively. The convolution formula computes the radiation entropy accurately even in cases when the island formula fails to apply. It also helps to justify this gravitational replica trick as a soluble Hausdorff moment problem. We then work out how the free convolution formula can be evaluated using free harmonic analysis, which also gives a new free probabilistic treatment of resolving the separable sample covariance matrix spectrum. The free convolution formula suggests that the quantum information encoded in competing quantum extremal surfaces can be modelled as free random variables in a finite von Neumann algebra. Using the close tie between free probability and random matrix theory, we show that the PSSY model can be described as a random matrix model that is essentially a generalization of Page's model. It is then manifest that the island formula is only applicable when the convolution factorizes in regimes characterized by the one-shot entropies. We further show that the convolution formula can be reorganized to a generalized entropy formula in terms of the relative entropy.
翻訳日:2023-01-25 20:37:11 公開日:2022-12-23
# 散逸自由フェルミオン系における対数絡み合いスケーリング

Logarithmic entanglement scaling in dissipative free-fermion systems ( http://arxiv.org/abs/2209.11706v3 )

ライセンス: Link先を確認
Antonio D'Abbruzzo, Vincenzo Alba, Davide Rossini(参考訳) 局所熱浴の存在下での1次元自由フェルミオン系における量子情報の拡散について検討する。 我々は、リンドブラッド作用素が閉系のボゴリューボフ作用素の項で書かれており、したがって空間において非局所であるという意味で、システム-バス相互作用を記述するために非局所リンドブラッドマスター方程式を用いる。 定常状態を記述する統計的アンサンブルは、浴場のフェルミ・ディラック分布の凸結合によって記述される。 自由フェルミオン分散の特異性のため、定常状態の相互情報はシステムパラメータの関数として特異性を示す。 相互情報は総体的に面積則を満たすが、特異点においてサブシステムサイズの関数として対数スケーリングを示す。 フィッシャー・ハートウィッヒの定理を用いて、浴槽のパラメータに依存する対数スケーリングのプレファクターを導出し、効果的な「集中電荷」の役割を担っている。 これは、基底状態の絡み合いスケーリングを規定する中央電荷によって上限される。 我々は,パラダイム的強結合鎖とキタエフ鎖の数値的な検証を行う。

We study the quantum information spreading in one-dimensional free-fermion systems in the presence of localized thermal baths. We employ a nonlocal Lindblad master equation to describe the system-bath interaction, in the sense that the Lindblad operators are written in terms of the Bogoliubov operators of the closed system, and hence are nonlocal in space. The statistical ensemble describing the steady state is written in terms of a convex combination of the Fermi-Dirac distributions of the baths. Due to the singularity of the free-fermion dispersion, the steady-state mutual information exhibits singularities as a function of the system parameters. While the mutual information generically satisfies an area law, at the singular points it exhibits logarithmic scaling as a function of subsystem size. By employing the Fisher-Hartwig theorem, we derive the prefactor of the logarithmic scaling, which depends on the parameters of the baths and plays the role of an effective "central charge". This is upper bounded by the central charge governing ground-state entanglement scaling. We provide numerical checks of our results in the paradigmatic tight-binding chain and the Kitaev chain.
翻訳日:2023-01-25 10:06:46 公開日:2022-12-23
# ストレンジコリケータによる位相秩序を保護したサブシステム対称性の検出

Detecting Subsystem Symmetry Protected Topological Order Through Strange Correlators ( http://arxiv.org/abs/2209.12917v3 )

ライセンス: Link先を確認
Chengkang Zhou, Meng-Yuan Li, Zheng Yan, Peng Ye and Zi Yang Meng(参考訳) 我々は,2次元サブシステム対称性保護トポロジカル位相(SSPT)を検出するために,奇妙な相関器を用いている。 具体的には、一様磁場の存在下での2次元クラスターモデルにおける効率的な奇妙な相関子を解析的に構築し、量子アニーリング法でプロジェクター量子モンテカルロシミュレーションを行う。 ストレンジコリエータはsspt相における長距離相関を示し、そこから低磁場におけるsspt相と高磁場における自明な常磁性相の間の位相相転移を特徴づけるストレンジオーダーパラメータを定義する。 そこで,SSPT位相の1次元物理境界における完全局所零モードの検出は,周期的境界条件を持つ局所作用素のバルク相関測定に変換された。 また、2次元クラスターモデルにおけるSSPT次数を保護するサブシステム対称性の空間異方性の性質に本質的に遡ることができる奇妙な相関器の興味深い空間異方性も見いだす。 したがって、奇妙な相関子をシミュレートすることにより、SSPT相の容易かつ効率的な検出に関する最初の非バイアスの大規模量子モンテカルロシミュレーションを提供し、相互作用するトポロジカル相の微妙で基本的な性質の研究の道を開く。

We employ strange correlators to detect 2D subsystem symmetry-protected topological (SSPT) phases which are nontrivial topological phases protected by subsystem symmetries. Specifically, we analytically construct efficient strange correlators in the 2D cluster model in the presence of a uniform magnetic field and then perform the projector Quantum Monte Carlo simulation within the quantum annealing scheme. We find that strange correlators show the long-range correlation in the SSPT phase, from which we define strange order parameters to characterize the topological phase transition between the SSPT phase at low fields and the trivial paramagnetic phase at high fields. Thus, the detection of the fully localized zero modes on the 1D physical boundary of SSPT phase has been transformed into the bulk correlation measurement about the local operators with the periodic boundary condition. We also find interesting spatial anisotropy of a strange correlator, which can be intrinsically traced back to the nature of spatial anisotropy of subsystem symmetries that protect SSPT order in the 2D cluster model. By simulating strange correlators, we, therefore, provide the first unbiased large-scale quantum Monte Carlo simulation on the easy and efficient detection in the SSPT phase and open the avenue of the investigation of the subtle yet fundamental nature of the novel interacting topological phases.
翻訳日:2023-01-25 02:54:21 公開日:2022-12-23
# 一重項量子ビット鎖における離散時間結晶の実現に及ぼす漏れの影響

Effects of leakage on the realization of a discrete time crystal in a chain of singlet-triplet qubits ( http://arxiv.org/abs/2209.15008v3 )

ライセンス: Link先を確認
Robert E. Throckmorton and S. Das Sarma(参考訳) 半導体量子ドット線形配列における離散時間結晶(dtc)を一重項(st)キュービットのチェーンとして動作させる能力に対するリークの影響について考察する。 このシステムは、効果的な磁場印加を伴うイジングモデルと、計算サブスペースから漏れを生じさせる追加項を実現する。 これらのリーク条件がない場合、このモデルは理論上6量子ビットと8量子ビットの広いパラメータ構造上のDTC位相を実現し、8量子ビットの場合の広いパラメータ範囲を実現する。 次に、漏洩項を再導入し、システムが一様磁場を受けるのみの場合、dtc相が全く同じパラメータの範囲で消滅することを発見し、漏洩を抑制することはない。 しかし,DTCの位相を復元することは,システムにqubitからqubitに交互に磁場を印加することで,漏洩を抑制することができる。 したがって、リークはST量子ビットの連鎖におけるDTC相の実現にとって深刻な問題であるが、決して克服不可能であることを示す。 我々の研究は、小さな系の安定DTCを示す実験は、現在存在する量子ドットスピン量子ビットで実現可能であることを示唆している。

We consider the effects of leakage on the ability to realize a discrete time crystal (DTC) in a semiconductor quantum dot linear array being operated as a chain of singlet-triplet (ST) qubits. This system realizes an Ising model with an effective applied magnetic field, plus additional terms that can cause leakage out of the computational subspace. We demonstrate that, in the absence of these leakage terms, this model theoretically realizes a DTC phase over a broad parameter regime for six and eight qubits, with a broader parameter range for the eight-qubit case. We then reintroduce the leakage terms and find that the DTC phase disappears entirely over the same parameter range if the system is only subject to a uniform magnetic field, which does not suppress leakage. However, we find that the DTC phase can be restored if the system is instead subject to a magnetic field that alternates from qubit to qubit, which suppresses leakage. We thus show that leakage is a serious problem for the realization of a DTC phase in a chain of ST qubits, but is by no means insurmountable. Our work suggests that experiments manifesting small-system stable DTC should be feasible with currently existing quantum dot spin qubits.
翻訳日:2023-01-24 10:04:39 公開日:2022-12-23
# 真正三部絡みの突然死

Sudden Death of Genuine Tripartite Entanglement ( http://arxiv.org/abs/2210.01854v3 )

ライセンス: Link先を確認
Songbo Xie and Daniel Younis and Joseph H. Eberly(参考訳) ここでは、有限時間後、非解析的エンドステージ (Yu and Eberly, Phys. Rev. 93, 140404 (2004)) へと導く、珍しいがシュリンガーに基づくデコヒーレンス過程の絡み合いのダイナミクスを考察する。 この突然の終端は、個々の量子ビット自体が、その絡み合いとは対照的に、決定論的にスムーズに解析的に進化し続けるにもかかわらず起こる。 しかし、詳細は謎のままである。 最も重要な未知の要素は、ESD到着の速度を制御できるかどうかである。 実際、ESDは、初期状態が適切であれば、デコヒーレンス時間$T_1$または$T_2$のごく一部の後にほぼ瞬時に発生する。 ここでは、解析不能な絡み合いを持つことが確実な初期条件を最終段階として公開することの課題に対処する。 我々は、新たに発見された3ビットの真の絡み合い尺度(Xie and Eberly, Phys. Rev. Lett. 127, 040403 (2021)]の助けを借りて、この問題に対処する。

Here we examine the entanglement dynamics of an unusual but Schr\"odinger-based decoherence process that leads, after a finite time, to a non-analytic end-stage [Yu and Eberly, Phys. Rev. Lett. 93, 140404 (2004)]. This abrupt ending occurs even though the individual qubits themselves, in contrast to their entanglement, continue to evolve deterministically smoothly and analytically. However, many details remain a mystery. The most important unknown element is whether the speed of ESD arrival can be controlled. In fact, ESD can occur almost instantaneously, certainly after only a small fraction of the decoherence time $T_1$ or $T_2$, if the initial state is appropriate. Here we address the challenge to expose the initial conditions that are certain to have non-analytic vanishing entanglement at any moment as their end stage. We address this challenge with the assistance of a newly discovered 3-qubit genuine entanglement measure [Xie and Eberly, Phys. Rev. Lett. 127, 040403 (2021)].
翻訳日:2023-01-23 21:52:53 公開日:2022-12-23
# dirac-fock基底状態の新しい定義

A new definition of the Dirac-Fock ground state ( http://arxiv.org/abs/2211.10196v2 )

ライセンス: Link先を確認
Eric S\'er\'e (CEREMADE)(参考訳) dirac-fock(df)モデルは、相対論的効果が原子や分子で無視できない場合にhartree-fock(hf)近似を置き換える。 ディラック作用素は下から有界ではないので、基底状態の概念はこのモデルでは明らかではなく、文献でいくつかの定義が提案されている。 我々は,HF に対するリーブの緩和的変動原理に着想を得た DF エネルギーの基底状態に対する新しい定義を与える。 我々の定義と存在証明は以前のdfの著作よりも単純で自然なものであるが、非相対論的の場合よりも技術的なものである。 まず、ある非線形不動点方程式を満たす物理的に許容される密度行列の集合を構築する必要がある。 そして、基底状態はこの集合上のDFエネルギーの最小値として見出される。

The Dirac-Fock (DF) model replaces the Hartree-Fock (HF) approximation when relativistic effects cannot be neglected in atoms and molecules. Since the Dirac operator is not bounded from below, the notion of ground state is not obvious in this model, and several definitions have been proposed in the literature. We give a new definition for the ground state of the DF energy, inspired of Lieb's relaxed variational principle for HF. Our definition and existence proof are simpler and more natural than in previous works on DF, but remains more technical than in the nonrelativistic case. One first needs to construct a set of physically admissible density matrices that satisfy a certain nonlinear fixed-point equation: we do this by introducing an iterative procedure, described in an abstract context. Then the ground state is found as a minimizer of the DF energy on this set.
翻訳日:2023-01-18 04:23:13 公開日:2022-12-23
# 非可換積分法による量子非対称トップの波動関数の計算

Calculation of the wave functions of a quantum asymmetric top using the noncommutative integration method ( http://arxiv.org/abs/2211.14812v2 )

ライセンス: Link先を確認
A. I. Breev and D. M. Gitman(参考訳) 本研究では、線形微分方程式の非可換積分法を用いて、オイラー角における量子非対称トップに対するシュロディンガー方程式に対する解の完全な集合を得る。 シュラディンガー方程式の非可換還元はラメ方程式につながることが示されている。 結果として得られる解の集合は、回転群の共役表現の軌道の幾何学に関連する複素パラメータのラメ多項式によって決定される。 非対称トップのスペクトルは、解が回転群の特別な既約な$\lambda$-表現に関して不変であるという条件から得られる。

In this work, using the noncommutative integration method of linear differential equations, we obtain a complete set of solutions to the Schrodinger equation for a quantum asymmetric top in Euler angles. It is shown that the noncommutative reduction of the Schrodinger equation leads to the Lame equation. The resulting set of solutions is determined by the Lame polynomials in a complex parameter, which is related to the geometry of the orbits of the coadjoint representation of the rotation group. The spectrum of an asymmetric top is obtained from the condition that the solutions are invariant with respect to a special irreducible $\lambda$-representation of the rotation group.
翻訳日:2023-01-17 15:23:49 公開日:2022-12-23
# 統計マヨラナ境界状態分光法

Statistical Majorana Bound State Spectroscopy ( http://arxiv.org/abs/2211.15296v2 )

ライセンス: Link先を確認
Alexander Ziesen, Alexander Altland, Reinhold Egger, and Fabian Hassler(参考訳) マヨラナ境界状態(MBS)の検出のためのトンネル分光データは、真のMBSを低いAndreev境界状態と誤解釈する傾向があるとしてしばしば批判されている。 本稿では,単一ショット計測をシステムパラメータの異なるシーケンスに拡張することにより,この曖昧さを解消するプロトコルを提案する。 このようなサンプリングは,現在の実験プラットフォームでは適度な努力しか必要とせず,アンドレエフ側葉の統計を解決し,マヨラナ中心ピークの有無を示す説得力のある証拠となる。

Tunnel spectroscopy data for the detection of Majorana bound states (MBS) is often criticized for its proneness to misinterpretation of genuine MBS with low-lying Andreev bound states. Here, we suggest a protocol removing this ambiguity by extending single shot measurements to sequences performed at varying system parameters. We demonstrate how such sampling, which we argue requires only moderate effort for current experimental platforms, resolves the statistics of Andreev side lobes, thus providing compelling evidence for the presence or absence of a Majorana center peak.
翻訳日:2023-01-17 15:09:42 公開日:2022-12-23
# 量子コンピューティングにおける学生の強みと困難

Investigating students' strengths and difficulties in quantum computing ( http://arxiv.org/abs/2212.03726v2 )

ライセンス: Link先を確認
Tunde Kushimo and Beth Thacker(参考訳) 量子コンピューティングは、情報理論、計算機科学、数学、量子物理学から情報を根本的に新しい方法で処理するエキサイティングな分野である。 実用的な量子コンピュータを開発し、量子労働力を増やすための競争が進行中である。 これは、量子コンピューティングプログラム、コース、カリキュラムの開発と、次世代の量子情報科学者の教育を支援するためのエビデンスに基づく教育材料の開発と相まって行う必要がある。 量子コンピューティングの入門コースを大学生に導入し,入門コースを受講した学生の量子コンピューティングにおける強みと難易度について検討した。 我々のゴールは、学生が理解し易いトピックと理解し難いトピックを理解しながら、量子コンピューティング教育の改善に貢献することである。 我々は,学生の強みと難しさを明らかにするために,一連のインタビューを行った。 我々は、これらのインタビューの結果と、量子コンピューティング入門コースを教えるためのエビデンスベース教材の開発に関する初期研究について報告する。

Quantum Computing is an exciting field that draws from information theory, computer science, mathematics, and quantum physics to process information in fundamentally new ways. There is an ongoing race to develop practical quantum computers and increase the quantum workforce. This needs to be accompanied by the development of quantum computing programs, courses, and curricula coupled with the development of evidence-based pedagogical materials to support the education of the next generation of quantum information scientists. We introduced an introductory course in quantum computing to undergraduate students and investigated the strengths and difficulties of these students in quantum computing after taking the introductory course. Our goal is to contribute to the improvement of quantum computing education while understanding the topics that the students find easy to comprehend and the topics that are difficult to comprehend. We conducted a series of interviews to identify these strengths and difficulties in the students. We report on the results of these interviews and our initial work on the development of evidence-based materials for teaching an introductory course in quantum computing.
翻訳日:2023-01-09 22:30:10 公開日:2022-12-23
# オイラー問題の量子バージョン:幾何学的視点

Quantum version of the Euler's problem: a geometric perspective ( http://arxiv.org/abs/2212.03903v2 )

ライセンス: Link先を確認
Karol Zyczkowski(参考訳) 36ドルの士官の古典的組合せ問題には解決法がなく、階数6のグラエコ・ラティン正方形は存在しない。 量子的なセットアップで動作し、古典的オブジェクトの重ね合わせを可能にし、絡み合った状態を認めると状況は変化する。 本研究では,最近発見されたオイラー問題の量子版に対する解を幾何学的観点から解析する。 より大きな空間に埋め込まれた非可換多様体の概念を想起する。 この性質は、そのような多様体の任意の2つのコピー、つまり球面上の2つの大円が交わることを意味する。 大きさ 6 の量子グレイコ・ラテン正方形の存在は、d=6 の4つの部分系の最大絡み合った状態と等価であり、複素射影空間 ${C}P^{36\times 36 -1}$ に埋め込まれた 3 つの多様体 U(36)/U(1) の最大絡み合った状態の3つのコピーが、ある時点で同時に交わることを意味する。

The classical combinatorial problem of $36$ officers has no solution, as there are no Graeco-Latin squares of order six. The situation changes if one works in a quantum setup and allows for superpositions of classical objects and admits entangled states. We analyze the recently found solution to the quantum version of the Euler's problem from a geometric point of view. The notion of a non-displaceable manifold embedded in a larger space is recalled. This property implies that any two copies of such a manifold, like two great circles on a sphere, do intersect. Existence of a quantum Graeco-Latin square of size six, equivalent to a maximally entangled state of four subsystems with d=6 levels each, implies that three copies of the manifold U(36)/U(1) of maximally entangled states of the $36\times 36$ system, embedded in the complex projective space ${C}P^{36\times 36 -1}$, do intersect simultaneously at a certain point.
翻訳日:2023-01-09 16:53:23 公開日:2022-12-23
# アハロノフ-ボーム型効果によって捕捉された粒子のエントロピー情報

Entropic information of a particle trapped by the Aharonov-Bohm-type effect ( http://arxiv.org/abs/2212.09208v2 )

ライセンス: Link先を確認
N. Ali, C. A. S. Almeida, C. O. Edet, F. C. E. Lima, and A. R. P. Lima(参考訳) 本稿では、シャノンの公式を用いて、アハロノフ・ボーム型効果によって捕捉された粒子の量子情報エントロピーを研究する。 量子情報研究には、量子系の固有状態、すなわち量子系の固有状態を調べる必要がある。 e. 量子状態の波動関数とエネルギー。 転位欠陥によるAharonov-Bohm型効果の存在下で, 粒子は筒状の箱に閉じ込められていると仮定した。 量子情報エントロピーの解析により、転位が固有状態や量子情報に影響を与えることが明らかとなった。

In this research article, we use the Shannon's formalism to investigate the quantum information entropy of a particle trapped by the Aharonov-Bohm-type effect. For quantum information study, it is necessary to investigate the eigenstates of the quantum system, i. e., the wave functions and energies of the quantum states. We assumed that the particle is in principle, confined in a cylindrical box in the presence of an Aharonov-Bohm-type effect due to dislocation defect. Analysis of the quantum information entropy, reveals that the dislocation influences the eigenstates and, consequently, the quantum information of the system.
翻訳日:2023-01-09 08:38:37 公開日:2022-12-23
# テンソルネットワークを用いた変分量子アルゴリズム

Tensor Network Assisted Variational Quantum Algorithm ( http://arxiv.org/abs/2212.10421v2 )

ライセンス: Link先を確認
Junxiang Huang, Wenhao He, Yukun Zhang, Yusen Wu, Bujiao Wu, Xiao Yuan(参考訳) 短期量子デバイスは一般に浅い回路深度を持ち、ノイズやデコヒーレンスにより表現性が制限される。 ここでは、古典的テンソルネットワークオペレータを量子回路に結合し、より深い回路を物理的に実現することなく、回路表現率を効果的に増加させるテンソルネットワーク支援パラメータ化量子回路を紹介する。 本稿では,より浅い量子回路を用いた量子多体問題の解法として,テンソルネットワークを用いた変分量子アルゴリズムの枠組みを提案する。 ユニタリ行列積作用素とユニタリ木テンソルネットワークの2つの例を考察し、どちらも効率的に実装できることを実証する。 テンソルネットワークの助けを借りて,表現性が大幅に向上することを示す。 本研究では,16キュービットまでの2次元イジングモデルと1次元時間結晶ハミルトニアンモデルについて実験を行った。 数値計算の結果,提案手法は浅量子回路による従来の手法よりも優れていた。

Near-term quantum devices generally have shallow circuit depth and hence limited expressivity due to noise and decoherence. Here we introduce tensor network assisted parameterized quantum circuits, concatenating a classical tensor network operator to a quantum circuit and hence effectively increasing the circuit expressivity without physically realizing a deeper circuit. We propose a framework of tensor network assisted variational quantum algorithms, allowing the solution of quantum many-body problems with shallower quantum circuits. We consider two examples of unitary matrix product operators and unitary tree tensor networks and demonstrate that they can both be efficiently implemented. We numerically show that the expressivity is greatly enhanced with the assistance of tensor networks. We test our method for 2D Ising models and 1D time crystal Hamiltonian models with up to 16 qubits. The numerical results show that our method consistently outperforms the conventional approach with shallow quantum circuits.
翻訳日:2023-01-09 08:09:33 公開日:2022-12-23
# クロスドメインショッピングと株価動向分析

Cross-Domain Shopping and Stock Trend Analysis ( http://arxiv.org/abs/2212.14689v1 )

ライセンス: Link先を確認
Aditya Pandey, Haseeba Fathiya, Nivedita Patel(参考訳) 本稿では,株価,株価,Twitterの株価,およびeコマースサイトにおけるユーザの行動の関係を識別・分析することを目的としたドメイン間トレンド分析を提案する。 この分析は、米国のストックデータセット、ストックツイートデータセット、eコマース行動データセットの3つのデータセットに基づいている。 この分析はHadoop、Hive、Tableauを使用して行われ、効率よくスケーラブルな処理と大規模なデータセットの可視化を可能にする。 分析には、twitterの感情(ポジティブなツイートとネガティブなツイート)の傾向分析と、ツイートの感情と株価の相関関係、株価の傾向とショッピング行動の相関関係、さまざまな時間のスライスに基づくデータの理解を含む相関分析が含まれている。 データセットのさまざまな特徴を時間をかけて比較することで、さまざまなカテゴリのユーザ行動と市場を駆動する要因について、洞察を得たいと思っています。 この分析の結果は、企業や投資家に意思決定を知らせる貴重な洞察を与えることができる。 我々は,本分析がこれらのトピックのさらなる研究および調査の出発点となると信じている。

This paper presents a cross-domain trend analysis that aims to identify and analyze the relationships between stock prices, stock news on Twitter, and users' behaviors on e-commerce websites. The analysis is based on three datasets: a US stock dataset, a stock tweets dataset, and an e-commerce behavior dataset. The analysis is performed using Hadoop, Hive, and Tableau, allowing for efficient and scalable processing and visualizing large datasets. The analysis includes trend analysis of Twitter sentiment (positive and negative tweets) and correlation analysis, including the correlation between tweet sentiment and stocks, the correlation between stock trends and shopping behavior, and the understanding of data based on different slices of time. By comparing different features from the datasets over time, we hope to gain insight into the factors that drive user behavior as well as the market in different categories. The results of this analysis can provide valuable insights for businesses and investors to inform decision-making. We believe that our analysis can serve as a valuable starting point for further research and investigation into these topics.
翻訳日:2023-01-09 07:17:22 公開日:2022-12-23
# 量子重力におけるボルン則の超越

Beyond the Born rule in quantum gravity ( http://arxiv.org/abs/2212.12175v1 )

ライセンス: Link先を確認
Antony Valentini(参考訳) 我々は最近、量子重力における確率の新しい理解を開発した。 本稿では,この新しいアプローチの概要とその意義について述べる。 量子物理学のパイロット波定式化(de Broglie-Bohm pilot-wave formulation)を採用すると、量子重力の基本レベルにおけるボルン則は存在しないと論じる。 代わりに、宇宙は、確率密度 $p\neq\left\vert \psi\right\vert ^{2}$ の量子非平衡の永久状態にある。 ボルン規則への動的緩和は、初期宇宙が半古典的あるいはシュルジャンガー近似(schr\"{o}dinger approximation)に出現した後にのみ起こり、古典時空背景上の非重力系に対して、時間依存で正規化可能な波動関数$\psi$ を持つ。 この方法では、確率密度 $\rho$ は$\left\vert \psi\right\vert ^{2}$(粗粒度で)に緩和することができる。 したがって、重力のパイロット波理論は原始量子非平衡の仮説を支持し、ビッグバンの直後にボルン則への緩和が行われる。 また,schr\"{o}dinger近似に対する量子重力補正により,以前の平衡状態 (\rho=\left\vert \psi\vert ^{2}$) から量子非平衡 $\rho\neq\left\vert \psi\vert ^{2}$ を生成できることを示した。 このような効果は非常に小さく、実際に観察することは困難である。

We have recently developed a new understanding of probability in quantum gravity. In this paper we provide an overview of this new approach and its implications. Adopting the de Broglie-Bohm pilot-wave formulation of quantum physics, we argue that there is no Born rule at the fundamental level of quantum gravity with a non-normalisable Wheeler-DeWitt wave functional $\Psi$. Instead the universe is in a perpetual state of quantum nonequilibrium with a probability density $P\neq\left\vert \Psi\right\vert ^{2}$. Dynamical relaxation to the Born rule can occur only after the early universe has emerged into a semiclassical or Schr\"{o}dinger approximation, with a time-dependent and normalisable wave functional $\psi$, for non-gravitational systems on a classical spacetime background. In that regime the probability density $\rho$ can relax towards $\left\vert \psi\right\vert ^{2}$ (on a coarse-grained level). Thus the pilot-wave theory of gravitation supports the hypothesis of primordial quantum nonequilibrium, with relaxation to the Born rule taking place soon after the big bang. We also show that quantum-gravitational corrections to the Schr\"{o}dinger approximation allow quantum nonequilibrium $\rho\neq\left\vert \psi\right\vert ^{2}$ to be created from a prior equilibrium ($\rho=\left\vert \psi\right\vert ^{2}$) state. Such effects are very tiny and difficult to observe in practice.
翻訳日:2023-01-09 07:17:04 公開日:2022-12-23
# 分子生物学のための量子コンピューティング

Quantum Computing for Molecular Biology ( http://arxiv.org/abs/2212.12220v1 )

ライセンス: Link先を確認
Alberto Baiardi, Matthias Christandl, and Markus Reiher(参考訳) 分子生物学と生化学は、その性質上量子力学である分子構造とその相互作用の観点から、生体の微視的過程を解釈する。 これらの相互作用の理論的基礎は非常に確立されているが、関連する量子力学方程式の計算解は非常に難しい。 しかし、生物学における分子機能の多くは、電子と核の相互作用が原子の相互作用をモデル化する効果的な古典的な代理ポテンシャルにマッピングされた古典力学で理解することができる。 これらのポテンシャルの単純な数学的構造は計算上の大きな利点をもたらすが、これは全ての量子相関と相互作用の厳密な多粒子の性質が省略されるコストが伴う。 本研究では,分子生物学の量子基盤の実用的有用性を量子計算がいかに前進するかを,生体分子のシミュレーションに計算の利点を提供することによって議論する。 この文脈で生体分子の電子構造に関する典型的な量子力学的問題を論じるだけでなく、古典的な問題(タンパク質の折り畳みや薬物設計など)や、バイオインフォマティクスのデータ駆動的アプローチや、それらが量子シミュレーションや量子計算に許容される程度についても考察する。

Molecular biology and biochemistry interpret microscopic processes in the living world in terms of molecular structures and their interactions, which are quantum mechanical by their very nature. Whereas the theoretical foundations of these interactions are very well established, the computational solution of the relevant quantum mechanical equations is very hard. However, much of molecular function in biology can be understood in terms of classical mechanics, where the interactions of electrons and nuclei have been mapped onto effective classical surrogate potentials that model the interaction of atoms or even larger entities. The simple mathematical structure of these potentials offers huge computational advantages; however, this comes at the cost that all quantum correlations and the rigorous many-particle nature of the interactions are omitted. In this work, we discuss how quantum computation may advance the practical usefulness of the quantum foundations of molecular biology by offering computational advantages for simulations of biomolecules. We not only discuss typical quantum mechanical problems of the electronic structure of biomolecules in this context, but also consider the dominating classical problems (such as protein folding and drug design) as well as data-driven approaches of bioinformatics and the degree to which they might become amenable to quantum simulation and quantum computation.
翻訳日:2023-01-09 07:16:37 公開日:2022-12-23
# 超非コロニブル関数の物理的実現

Physical Realization of a Hyper Unclonable Function ( http://arxiv.org/abs/2301.02147v1 )

ライセンス: Link先を確認
Sara Nocentini, Ulrich R\"uhrmair, Mauro Barni, Diederik S. Wiersma, and Francesco Riboli(参考訳) 障害のあるフォトニック構造は、従来のデジタルセキュリティ手法の限界を克服し、将来の量子コンピュータによる攻撃に対して暗号プロトコルを免疫できる物理オブジェクトである物理的非拘束関数(PUF)の実現のための有望な材料である。 PUFの制限は、これまでのところ、物理的な構成が固定されているか、永久に修正できるだけであり、そのためデバイスごとに1つのトークンしか許可していないことである。 この限界を克服するために, 光変換性高分子による再構成可能な構造を創りだすことにより, 回転不能な関数自体の物理的構造を可逆的に再構成できることを示した。 我々は、この新しい概念であるHyper PUFまたはHPUFを、多数の物理的非拘束関数を1つのデバイスと同一デバイス内で同時に共存させることで定義する。 構造の物理的変換は可逆的かつ空間的に制御された方法で全操作的に行われる。 私たちの新しい技術は、大量の情報を含むより複雑なキーを生成するセキュリティを大幅に強化します。 同時に、単一の暗号化デバイス上に複数のクライアントを提供するような新しいアプリケーションや、データの量子セキュア認証の実践的な実装などが可能になる。

Disordered photonic structures are promising materials for the realization of physical unclonable functions (PUF), physical objects that can overcome the limitations of conventional digital security methods and that enable cryptographic protocols immune against attacks by future quantum computers. One PUF limitation, so far, has been that their physical configuration is either fixed or can only be permanently modified, and hence allowing only one token per device. We show that it is possible to overcome this limitation by creating a reconfigurable structure made by light-transformable polymers, in which the physical structure of the unclonable function itself can be reversibly reconfigured. We term this novel concept Hyper PUF or HPUF in that it allows a large number of physical unclonable functions to co-exist simultaneously within one and the same device. The physical transformation of the structure is done all-optically in a reversible and spatially controlled fashion. Our novel technology provides a massive enhancement in security generating more complex keys containing a larger amount of information. At the same time, it allows for new applications, for example serving multiple clients on a single encryption device and the practical implementation of quantum secure authentication of data.
翻訳日:2023-01-09 07:15:36 公開日:2022-12-23
# 量子デバイステストのためのコンパクトで汎用的な極低温プローブステーション

A compact and versatile cryogenic probe station for quantum device testing ( http://arxiv.org/abs/2212.12369v1 )

ライセンス: Link先を確認
Mathieu de Kruijf, Simon Geyer, Toni Berger, Matthias Mergenthaler, Floris Braakman, Richard J. Warburton, and Andreas V. Kuhlmann(参考訳) 低温電気特性測定からの迅速なフィードバックは、スケーラブルな量子コンピューティング技術の発展の鍵となる。 室温では、高スループットデバイステストはプローブベースのソリューションで行われ、電気プローブは統計データを取得するためのデバイスに繰り返し配置される。 本研究では, 室温から2$\,$K以下まで操作可能なプローブステーションを提案する。 その小さなサイズは、磁石による標準的な低温測定装置と互換性がある。 様々な電子機器を試すことができる。 本稿では,シリコンフィン電界効果トランジスタを量子ドットスピン量子ビットのホストとして特徴付けることにより,プローブの性能を実証する。 このようなツールは、設計・ファブリケーション・測定サイクルを大幅に加速し、スケーラブルな量子回路を構築するためのプロセス最適化に重要なフィードバックを提供する。

Fast feedback from cryogenic electrical characterization measurements is key for the development of scalable quantum computing technology. At room temperature, high-throughput device testing is accomplished with a probe-based solution, where electrical probes are repeatedly positioned onto devices for acquiring statistical data. In this work we present a probe station that can be operated from room temperature down to below 2$\,$K. Its small size makes it compatible with standard cryogenic measurement setups with a magnet. A large variety of electronic devices can be tested. Here, we demonstrate the performance of the prober by characterizing silicon fin field-effect transistors as a host for quantum dot spin qubits. Such a tool can massively accelerate the design-fabrication-measurement cycle and provide important feedback for process optimization towards building scalable quantum circuits.
翻訳日:2023-01-09 07:08:29 公開日:2022-12-23
# 量子格子モデルにおける創発的時空

Emergent Spacetime in Quantum Lattice Models ( http://arxiv.org/abs/2212.12548v1 )

ライセンス: Link先を確認
Matthew D. Horner(参考訳) 多くの量子格子モデルは、その連続体極限に創発的な相対論的記述を持つ。 有名な例はグラフェンであり、その連続極限はミンコフスキー時空上のディラック方程式によって記述される。 連続体極限は、モデルを記述するための幾何学的可観測性の辞書を提供するだけでなく、それ以外は解析的に難解なモデルを解くことができる。 本稿では,この相対論的記述の量子格子モデルに対する新しい特徴について検討する。 特に,創発的曲面時空を生成し,この創発的挙動を明らかにする格子レベルでの観測可能性を特定し,実験室での相対論的効果をシミュレートする方法を実証する。 まず、エッジを持つシステムであるカーボンナノチューブについて研究を行い、システムのエッジに支持されたバルク状態を可能にするディラック方程式の興味深い特徴を試すことができた。 次に、ミンコフスキー時空上でマヨラナスピノルを記述する連続極限を持つ北エフのハニカムモデルを研究する。 このモデルの連続体極限において非自明な計量を生成する方法と、マヨルダナコリエータ、マヨルダナゼロモード、スピン密度といった格子観測量におけるこの計量とそれに対応する曲率の効果をどのように観測するかを示す。 また、格子レベルでの格子欠陥と$\mathbb{z}_2$ゲージ場が連続体極限においてキラルゲージ場を生成できることを議論し、その断熱同値を明らかにする。 最後に、1D XYモデルのカイラルな修正について論じ、モデルが相互作用し、非自明な位相図を導入する。 これは、ブラックホールの内側と外側が異なる相にある連続体限界においてブラックホール計量を生成することが分かる。 そして、このモデルを焼成することで、ホーキング放射をシミュレートできることを示した。

Many quantum lattice models have an emergent relativistic description in their continuum limit. The celebrated example is graphene, whose continuum limit is described by the Dirac equation on a Minkowski spacetime. Not only does the continuum limit provide us with a dictionary of geometric observables to describe the models with, but it also allows one to solve models that were otherwise analytically intractable. In this thesis, we investigate novel features of this relativistic description for a range of quantum lattice models. In particular, we demonstrate how to generate emergent curved spacetimes and identify observables at the lattice level which reveal this emergent behaviour, allowing one to simulate relativistic effects in the laboratory. We first study carbon nanotubes, a system with an edge, which allows us to test the interesting feature of the Dirac equation that it allows for bulk states with support on the edges of the system. We then study Kitaev's honeycomb model which has a continuum limit describing Majorana spinors on a Minkowski spacetime. We show how to generate a non-trivial metric in the continuum limit of this model and how to observe the effects of this metric and its corresponding curvature in the lattice observables, such as Majorana correlators, Majorana zero modes and the spin densities. We also discuss how lattice defects and $\mathbb{Z}_2$ gauge fields at the lattice level can generate chiral gauge fields in the continuum limit and we reveal their adiabatic equivalence. Finally, we discuss a chiral modification of the 1D XY model which makes the model interacting and introduces a non-trivial phase diagram. We see that this generates a black hole metric in the continuum limit, where the inside and outside of the black hole are in different phases. We then demonstrate that by quenching this model we can simulate Hawking radiation.
翻訳日:2023-01-09 07:08:17 公開日:2022-12-23
# 独立ベルヌーイ試行の平均成功確率に関する単純ブエーラー-最適信頼区間

Simple Buehler-optimal confidence intervals on the average success probability of independent Bernoulli trials ( http://arxiv.org/abs/2212.12558v1 )

ライセンス: Link先を確認
Jean-Daniel Bancal, Pavel Sekatski(参考訳) 片側信頼区間は、非正則ベルヌーイパラメータの平均に対して示される。 これらの信頼区間はベルヌーイゲームが獲得した総数、ラウンド数、信頼レベルの分析関数として表される。 これらの境界の厳密性、すなわち最も厳密な単調区間として、すべての信頼度レベルに対して証明される。 また、すべての信頼レベルに有効な単純な区間も、厳密性保証を備える。 最後に,提案する信頼区間の逐次サンプリングへの適用について述べる。

One-sided confidence intervals are presented for the average of non-identical Bernoulli parameters. These confidence intervals are expressed as analytical functions of the total number of Bernoulli games won, the number of rounds and the confidence level. Tightness of these bounds in the sense of Buehler, i.e. as the strictest possible monotonic intervals, is demonstrated for all confidence levels. A simple interval valid for all confidence levels is also provided with a tightness guarantee. Finally, an application of the proposed confidence intervals to sequential sampling is discussed.
翻訳日:2023-01-09 07:07:48 公開日:2022-12-23
# 計測に基づく量子計算のためのグラフ状態の効率的な代数表現

An efficient algebraic representation for graph states for measurement-based quantum computing ( http://arxiv.org/abs/2212.12102v1 )

ライセンス: Link先を確認
Sebastiano Corli, Enrico Prati(参考訳) グラフ状態は測定に基づく計算の主要な計算ブロックであり、ゲートモデルアーキテクチャにおける誤り訂正に有用なツールである。 グラフ状態は、安定作用素のアーベル群に対する固有ベクトルである量子状態のクラスを形成する。 それらは、高結合ノードの存在を含むグラフ構造から生じる位相的性質をハブ(hubs)と呼ぶ。 ハブノードから,安定器群の生成器を通してグラフ状態を効率的に表現する方法を実証する。 リングと恒星トポロジーを表現し、安定化器の数がそれぞれ n から n/2 に減少し、それぞれ n から 1 に減少する例を示す。 グラフ状態は安定化群の部分群によって生成できることを実証する。 したがって、安定化器の数を少なくしてグラフ状態を操作する代数的枠組みを提供する。

Graph states are the main computational building blocks of measurement-based computation and a useful tool for error correction in the gate model architecture. The graph states form a class of quantum states which are eigenvectors for the abelian group of stabilizer operators. They own topological properties, arising from their graph structure, including the presence of highly connected nodes, called hubs. Starting from hub nodes, we demonstrate how to efficiently express a graph state through the generators of the stabilizer group. We provide examples by expressing the ring and the star topology, for which the number of stabilizers reduces from n to n/2, and from n to 1, respectively. We demonstrate that the graph states can be generated by a subgroup of the stabilizer group. Therefore, we provide an algebraic framework to manipulate the graph states with a reduced number of stabilizers.
翻訳日:2023-01-09 06:58:32 公開日:2022-12-23
# 磁場をもつ二層グラフェンの連続スペクトルにおける安定欠陥状態

Stable defect states in the continuous spectrum of bilayer graphene with magnetic field ( http://arxiv.org/abs/2212.12125v1 )

ライセンス: Link先を確認
Stephen P. Shipman and Jorge Villalobos(参考訳) aa積層二層グラフェンの密結合モデルにおいて, 垂直磁場の強さの変動に関して, 連続スペクトル領域内の拘束欠陥状態が安定に存在できることが示されている。 これは、層間カップリングと互換性のある欠陥を作成し、ホフシュタッター・バタフライとして知られるパターンで不規則に変化する連続スペクトルの影響から境界状態を保護することによって達成される。

In a tight-binding model of AA-stacked bilayer graphene, it is demonstrated that a bound defect state within the region of continuous spectrum can exist stably with respect to variations in the strength of a perpendicular magnetic field. This is accomplished by creating a defect that is compatible with the interlayer coupling, thereby shielding the bound state from the effects of the continuous spectrum, which varies erratically in a pattern known as the Hofstadter butterfly.
翻訳日:2023-01-09 06:58:20 公開日:2022-12-23
# 基底状態多様体における$^{14}\mathrm{nv}$と$^{15}\mathrm{nv}$の温度感度

Temperature Sensitivity of $^{14}\mathrm{NV}$ and $^{15}\mathrm{NV}$ Ground State Manifolds ( http://arxiv.org/abs/2212.12169v1 )

ライセンス: Link先を確認
Sean Lourette, Andrey Jarmola, Victor M. Acosta, A. Glen Birdwell, Dmitry Budker, Marcus W. Doherty, Tony Ivanov, Vladimir S. Malinovsky(参考訳) 我々は、77Kから400Kの温度で2つの窒素同位体(^{14}\mathrm{NV}$と$^{15}\mathrm{NV}$)のダイヤモンド中の窒素空孔(NV)中心の基底状態における電子および核スピン遷移周波数を測定した。 結合パラメータ $Q$ (for $^{14}\mathrm{NV}$), $D$, $A_{||}$, $A_{\perp}$, $\gamma_e/\gamma_n$ と、両同位体の温度依存性を抽出する。 室温付近の$m_s = 0$スピン多様体内の核スピン遷移の温度依存性は、$^{14}\mathrm{nv}$ (|m_i=-1> \leftrightarrow |m_i=+1>$) と$^{15}\mathrm{nv}$ (|m_i=-1/2> \leftrightarrow |m_i=+1/2>$) である。 ゼロフィールド分割パラメータ$D$を$^{14}\mathrm{NV}$と$^{15}\mathrm{NV}$の間の同位体シフトを$\sim$120kHzとする。 残留横磁場は核スピン遷移周波数、特に$^{15}\mathrm{nv}$をシフトするために観測される。 我々は,環境因子に対する感度を大幅に低減した核スピン型ダイヤモンド量子センサの開発に関連するパラメータのセットを精度良く決定した。

We measure electron and nuclear spin transition frequencies in the ground state of nitrogen-vacancy (NV) centers in diamond for two nitrogen isotopes ($^{14}\mathrm{NV}$ and $^{15}\mathrm{NV}$) over temperatures ranging from 77 K to 400 K. Measurements are performed using Ramsey interferometry and direct optical readout of the nuclear and electron spins. We extract coupling parameters $Q$ (for $^{14}\mathrm{NV}$), $D$, $A_{||}$, $A_{\perp}$, $\gamma_e/\gamma_n$, and their temperature dependences for both isotopes. The temperature dependences of the nuclear-spin transitions within the $m_s = 0$ spin manifold near room temperature are found to be +0.52(1) ppm/K for $^{14}\mathrm{NV}$ ($|m_I=-1> \leftrightarrow |m_I=+1>$) and -1.1(1) ppm/K for $^{15}\mathrm{NV}$ ($|m_I=-1/2> \leftrightarrow |m_I=+1/2>$). An isotopic shift in the zero-field splitting parameter $D$ between $^{14}\mathrm{NV}$ and $^{15}\mathrm{NV}$ is measured to be $\sim$ 120 kHz. Residual transverse magnetic fields are observed to shift the nuclear spin transition frequencies, especially for $^{15}\mathrm{NV}$. We have precisely determined the set of parameters relevant for the development of nuclear-spin-based diamond quantum sensors with greatly reduced sensitivity to environmental factors.
翻訳日:2023-01-09 06:58:11 公開日:2022-12-23
# 超伝導非線形非対称誘導素子を有する移動波パラメトリック増幅器におけるアナログブラックホールソリトン

Analogue black-white hole solitons in travelling wave parametric amplifiers with superconducting nonlinear asymmetric inductive elements ( http://arxiv.org/abs/2212.12234v1 )

ライセンス: Link先を確認
Haruna Katayama, Noriyuki Hatakenaka, Toshiyuki Fujii, Miles P. Blencowe(参考訳) 非線形非対称インダクティブ素子 (snails) を含む既存の進行波パラメトリック増幅器 (twpa) によるアナログ黒白色ホールソリトンの実現を提案する。 本研究では,SNAIL間の位相差座標のダイナミクスを連続体近似におけるKdV (Krteweg-de Vries) あるいは修正KdV (Krteweg-de Vries) 方程式によって記述し,外部磁束バイアスに依存して孤立波解を許容することを示した。 また、kdv由来のソリトンを、元の離散要素回路方程式を数値解いて検証する。 m)kdv方程式に対するソリトン解は、twpaで伝播するプローブマイクロ波の速度を空間的に変調し、アナログブラックホール-ブラックホール事象ホライズン対を効果的に実現する。

We propose an analogue black-white hole soliton realization using existing travelling wave parametric amplifier (TWPA) setups comprising superconducting nonlinear asymmetric inductive elements (SNAILs). We show that the dynamics in terms of the phase difference coordinate across a SNAIL is described by the Korteweg-de Vries (KdV) or modified Korteweg-de Vries (mKdV) equations in the continuum approximation, depending on the external magnetic flux bias, which admit solitary wave solutions. We also validate the KdV-derived solitons by numerically solving the original, discrete element circuit equations. Soliton solutions to the (m)KdV equation spatially modulate the velocity for probe microwaves propagating in the TWPA, resulting in the effective realization of analogue black hole-white hole event horizon pairs.
翻訳日:2023-01-09 06:57:23 公開日:2022-12-23
# 散逸一般化流体力学方程式とその数値解法

The dissipative Generalized Hydrodynamic equations and their numerical solution ( http://arxiv.org/abs/2212.12349v1 )

ライセンス: Link先を確認
Frederik M{\o}ller, Nicolas Besse, Igor E. Mazets, Hans-Peter Stimming, Norbert J. Mauser(参考訳) 一般化力学(GHD)は、超低温原子やスピン鎖のような量子物理学における一次元可積分系を記述するモデルを指す。 数学的には、GHDは運動型の非線形方程式に対応しており、主な未知の統計分布関数 $f(t,z,\theta)$ は1次元の位置変数 $z$ と1次元の「運動的」変数 $\theta$ で構成された位相空間に存在し、「ラピディティ」と呼ばれる波動ベクトルである。 ghd方程式の2つの重要な特徴は、第一にアドベクション項における非局所結合と非線形結合、第二に保存された量の無限集合である。 これを超えるために、GHD方程式の右辺を非局所・非線形拡散作用素あるいはボルツマン型衝突積分で補足することで得られる散逸GHD方程式を考える。 本稿では,これらの方程式を効率的に解くための新しい高次数値解法について述べる。 特に, 逐次時間微分が帰納的手続きによって得られるアドベクション場に対する高次時間テイラー級数展開を用いて, 随伴部分(いわゆるヴラソフ方程式)を解くための新しい逆半ラグランジアン法を考案する。 このadvectionフィールドの高次時間近似は、アダムス・モールトン半ラグランジアンスキームと比較される新しい暗黙的/探索的ランジュ・クッタ半ラグランジアン法を設計するために用いられる。 拡散・衝突演算子によって構成される音源項の解法について,文献の異なる数値法を用いて比較する。

Generalized Hydrodynamics (GHD) stands for a model that describes one-dimensional integrable systems in quantum physics, such as ultra-cold atoms or spin chains. Mathematically, GHD corresponds to nonlinear equations of kinetic type, where the main unknown, a statistical distribution function $f(t,z,\theta)$, lives in a phase space which is constituted by a one-dimensional position variable $z$, and a one-dimensional "kinetic" variable $\theta$, actually a wave-vector, called "rapidity". Two key features of GHD equations are first a non-local and nonlinear coupling in the advection term, and second an infinite set of conserved quantities, which prevent the system from thermalizing. To go beyond this, we consider the dissipative GHD equations, which are obtained by supplementing the right-hand side of the GHD equations with a non-local and nonlinear diffusion operator or a Boltzmann-type collision integral. In this paper, we deal with new high-order numerical methods to efficiently solve these kinetic equations. In particular, we devise novel backward semi-Lagrangian methods for solving the advective part (the so-called Vlasov equation) by using a high-order time-Taylor series expansion for the advection fields, whose successive time derivatives are obtained by a recursive procedure. This high-order temporal approximation of the advection fields are used to design new implicit/explicit Runge-Kutta semi-Lagrangian methods, which are compared to Adams-Moulton semi-Lagrangian schemes. For solving the source terms, constituted by the diffusion and collision operators, we use and compare different numerical methods of the literature.
翻訳日:2023-01-09 06:57:05 公開日:2022-12-23
# ブラックホール複雑化・非破壊・安定化型熱機械

Black Hole complexity, unscrambling, and stabilizer thermal machines ( http://arxiv.org/abs/2212.11337v2 )

ライセンス: Link先を確認
Salvatore F.E. Oliviero, Lorenzo Leone, Seth Lloyd and Alioscia Hamma(参考訳) ブラックホールは自然界で最も神秘的な物体である。 それらは、ローカルな相関関係を破壊し、システム全体に情報を広めるため、情報の最速のスクランブラであると考えられている。 ブラックホールの内部ダイナミクスの完全な知識[arxiv:1710.03363]を考えると、この情報を明らかにすることは可能である。 本研究は、ホーキング放射を観測することにより、未知のブラックホールから効率的に情報を復号できることを示す。 驚くべきことに、ブラックホールはクリフォード・デコーダを認めている: スクランブル・ユニタリの突出性は、たとえ指数関数的に複雑であっても、完全にカオスでない限り、効率的に記述することができる。 これは、全ての余分な複雑さをエントロピーとして記述でき、非カオスブラックホールの場合、冷蔵庫のように効率的に押し飛ばすことができるためである。 このエントロピーは熱揺らぎではなく、スクランブラーの非安定化挙動に起因する。

Black holes are the most mysterious objects in nature. They are believed to be the fastest scrambler of information, as they destroy local correlations and spread information throughout the system. Unscrambling this information is possible, given perfect knowledge of the black hole internal dynamics[arXiv:1710.03363]. This work shows that information can be efficiently decoded from an unknown black hole by observing the outgoing Hawking radiation. Surprisingly, black holes admit Clifford decoders: the salient properties of a scrambling unitary can be efficiently described even if exponentially complex, as long as it is not fully chaotic. This is possible because all the redundant complexity can be described as an entropy, and for non-chaotic black holes it can be efficiently pushed away, just like in a refrigerator. This entropy is not due to thermal fluctuations but to the non-stabilizer behavior of the scrambler.
翻訳日:2023-01-09 06:39:14 公開日:2022-12-23
# パルス単一光子源によるクロック同期

Clock synchronization with pulsed single photon sources ( http://arxiv.org/abs/2212.12589v1 )

ライセンス: Link先を確認
Christopher Spiess and Fabian Steinlechner(参考訳) フォトニック量子技術は、正確な時間分解による光検出イベントの同定を必要とする。 空間的分離とドリフト時間参照を持つ分散量子ネットワークでは、高精度化は特に困難である。 本稿では,単一光子を時間伝達に使用する最近の進歩と,単一光子源をパルス化する高速後処理方式の活用と定量化について述べる。 平均根平均正方形同期ジッタは3.0psであり、安定性は超安定クロックを持つシステムと同等である(1秒積分時間では54ps)。 本アルゴリズムは, 水晶振動子からのクロック不完全性を補償し, 低信号のシナリオに優れ, 量子通信ネットワークが同時にデータを伝送することを可能にする。

Photonic quantum technology requires precise, time-resolved identification of photodetection events. In distributed quantum networks with spatially separated and drifting time references, achieving high precision is particularly challenging. Here we build on recent advances of using single-photons for time transfer and employ and quantify a fast postprocessing scheme designed to pulsed single-photon sources. We achieve an average root mean square synchronization jitter of 3.0 ps and a stability comparable to systems with ultra-stable clocks (54 ps at 1 second integration time, in terms of Allan time deviation). Our algorithm compensates substantial clock imperfections from crystal oscillators, is superior for low signal scenarios, and allows the quantum communication networks to transmit data simultaneously to time transfer.
翻訳日:2023-01-09 06:22:17 公開日:2022-12-23
# 宇宙には独自の質量があるのか?

Does the Universe have its own mass? ( http://arxiv.org/abs/2212.12599v1 )

ライセンス: Link先を確認
Natalia Gorobey, Alexander Lukyanenko, and A. V. Goltsev(参考訳) 前述した世界史の量子重力理論の定式化の枠組みの中で、宇宙は独自の質量を持つことが示唆された。 この量は相対論的力学における粒子の質量に類似している。 宇宙の質量は重力制約のゼロではない値の分布であり、基本的な動的変数の初期条件の結果、時間とともに変化する。 重力のユークリッド量子論の定式化は、宇宙自身の質量の源となる初期状態を決定するためにも提案されている。 通常の物質とは無関係であるため、自身の質量の分布は空間の幾何学に影響を与え、専用の参照枠を形成する。 選択された参照系の存在は、量子重力リンク系の対応する修正によって考慮される。 ウィーラー・ド・ウィット方程式のそのような修正の変種は、重力制約の作用素表現であり、宇宙の状態とともに空間上のスピノル場の分布の形で基準系のパラメータを決定する。

Within the framework of the previously proposed formulation of the quantum theory of gravity in terms of world histories, it was suggested that the universe has its own mass. This quantity is analogous to the mass of a particle in relativistic mechanics. The mass of the universe is a distribution of non-zero values of gravitational constraints, which arises and changes in time as a consequence of the initial conditions for fundamental dynamic variables. A formulation of the Euclidean quantum theory of gravity is also proposed to determine the initial state, which can be the source of the universe's own mass. Being unrelated to ordinary matter, the distribution of its own mass affects the geometry of space and forms a dedicated frame of reference. The existence of selected reference systems is taken into account by the corresponding modification of the system of quantum gravitational links. A variant of such a modification of the Wheeler-De Witt equation is the operator representation of gravitational constraints, which, together with the state of the universe, determines the parameters of the reference system in the form of a distribution of the spinor field on a spatial section.
翻訳日:2023-01-09 06:22:03 公開日:2022-12-23
# 非エルミートSSHモデルにおける局在化と位相遷移

Localization and topological transitions in non-Hermitian SSH models ( http://arxiv.org/abs/2212.12288v1 )

ライセンス: Link先を確認
X. Q. Sun and C. S. Liu(参考訳) 複素準周期ホッピングと非相互ホッピングによって非ハーミティティーが導入された非エルミティアンSSHモデルの局所化と位相遷移について検討する。 解析形式のエネルギーの巻数とリャプノフ指数を求め、遷移点を特徴づける。 開境界条件の下では、境界局在とアンダーソン局在との競合により、2つの非局在化遷移が見つかる。 2番目の遷移は巻数によって特徴づけられるが、2つの非局在化遷移はすべて位相遷移を伴わない。 第2の非局在化遷移は、周期境界の場合と類似する境界位置の欠如により、準周期ホッピングによって支配される。 さらに, 現場における非エルミティシティおよび非エルミティアン皮膚効果は境界局在と位相遷移に起因している。 しかし、非エルミート皮膚効果はアンダーソン局在を増強する。 以上の解析は,エネルギーギャップと参加率の逆を数値的に計算して検証する。

We study the localization and topological transitions of non-Hermitian SSH models, where the non-Hermiticities are introduced by the complex quasiperiodic hopping and the nonreciprocal hopping. The winding numbers of energy and the Lyapunov exponents in analytic form are obtained to characterize the transition points. Under the open boundary condition, two delocalization transitions are found due to the competition between the boundary localization and the Anderson localization. Although the second transition can be characterized by the winding numbers, all the two delocalization transitions don't accompany the topological transition. The second delocalization transition is dominated by the quasiperiodic hopping due to the lack of boundary locations which is similar to the periodic boundary case. Furthermore, the on-site non-Hermiticity and non-Hermitian skin effect are detrimental to the boundary localization and topological transitions. However, the non-Hermitian skin effect enhances the Anderson localizations. The above analyses are verified by calculating the energy gap and the inverse of the participation ratio numerically.
翻訳日:2023-01-09 06:13:51 公開日:2022-12-23
# 量子確率の奇性について

On the strangeness of quantum probabilities ( http://arxiv.org/abs/2212.12304v1 )

ライセンス: Link先を確認
Marcello Poletti(参考訳) ここでは、「量子力学の奇妙な性質」で表現された考え方を続けて、この哲学的展望が測定問題を解く鍵としてどのように使われるのかをより具体的に示そうとする。 このような変化が量子力学の根底にある原理と一致する理論をいかに生み出すかを示すことによって、非決定性の概念が古典的確率理論にどのように実質的な変化をもたらすかを決定する問題に対処する。

Here we continue with the ideas expressed in "On the strangeness of quantum mechanics" aiming to demonstrate more concretely how this philosophical outlook might be used as a key for resolving the measurement problem. We will address in detail the problem of determining how the concept of undecidability leads to substantial changes to classical theory of probability by showing how such changes produce a theory that coincides with the principles underlying quantum mechanics.
翻訳日:2023-01-09 06:13:36 公開日:2022-12-23
# 非エルミタン系のダイナミクスによる例外点の検出

Detecting Exceptional Point through Dynamics in Non-Hermitian Systems ( http://arxiv.org/abs/2212.12403v1 )

ライセンス: Link先を確認
Keshav Das Agarwal, Tanoy Kanti Konar, Leela Ganesh Chandra Lakkaraju, Aditi Sen De(参考訳) 非エルミート回転時間反転(RT)対称スピンモデルには、2つの異なる位相があり、全スペクトルが実数である非破壊相と複素固有スペクトルを含む破壊相があり、これは例外点と呼ばれる遷移点を示す。 本稿では,初期状態と最終状態の重なり合いであるLoschmidtエコーの短時間時間平均と長時間時間平均,および対応する速度関数が平衡シナリオで知られている例外点を忠実に予測できることを報告する。 特に、初期状態がアンブロウト相で作成され、システムが破断相またはアンブロウト相にクエンチされた場合、そのレート関数と平均ロスシュミットエコーが、一様および交互の磁場を有する近距離xyモデルにおいて破断相またはアンブロウト相で発生したクエンチとを区別できることを解析的に示すことにより、例外点を示す。 さらに,非エルミートXYZモデルのような,数値的にしか解けない磁場を持つモデルにおいても,そのような量で例外点を識別できることを示す。

Non-Hermitian rotation-time reversal (RT)-symmetric spin models possess two distinct phases, the unbroken phase in which the entire spectrum is real and the broken phase which contains complex eigenspectra, thereby indicating a transition point, referred to as an exceptional point. We report that the dynamical quantities, namely short and long time average of Loschmidt echo which is the overlap between the initial and the final states, and the corresponding rate function, can faithfully predict the exceptional point known in the equilibrium scenario. In particular, when the initial state is prepared in the unbroken phase and the system is either quenched to the broken or unbroken phase, we analytically demonstrate that the rate function and the average Loschmidt echo can distinguish between the quench occurred in the broken or the unbroken phase for the nearest-neighbor XY model with uniform and alternating magnetic fields, thereby indicating the exceptional point. Furthermore, we exhibit that such quantities are capable of identifying the exceptional point even in models like the non-Hermitian XYZ model with magnetic field which can only be solved numerically.
翻訳日:2023-01-09 06:13:29 公開日:2022-12-23
# 高速光アドレス化のためのマルチスケールアーキテクチャと大規模量子ビットアレイの制御

Multi-scale architecture for fast optical addressing and control of large scale qubit arrays ( http://arxiv.org/abs/2212.12428v1 )

ライセンス: Link先を確認
T. M. Graham, E. Oh, and M. Saffman(参考訳) 本稿では,高速偏向器(光偏向器など)と比較的遅い空間光変調器を組み合わせることで,大きな配列内の粒子の量子状態の高速サイト選択制御手法を提案する。 場所選択型量子状態操作における空間光変調器の使用は、高速かつ連続的な量子ゲートを阻止する遅い遷移時間のために制限されている。 空間光変調器を複数のセグメントに分割し、それら間の遷移に高速偏向器を用いることにより、単一の空間光変調器フルフレーム設定で実行可能なゲート数を増加させることにより、スキャナー遷移間の平均時間増分を大幅に削減することができる。 構成1では空間光変調器の各セグメントが全量子ビット配列に対応し、構成2では空間光変調器の各セグメントはサブアレイと、全量子ビット配列に対してサブアレイとなる追加の高速偏向器位置に対応している。 これらのハイブリッドスキャナーを用いて、SLM単独の使用より数十倍から数百倍高速な量子ビットアドレッシング率を算出する。

We present a technique for rapid site-selective control of the quantum state of particles in a large array using a combination of a fast deflector (e.g. an acousto-optic deflector) and a relatively slow spatial light modulator. The use of spatial light modulators for site-selective quantum state manipulation has been limited due to slow transition times preventing rapid, consecutive quantum gates. By partitioning the spatial light modulator into multiple segments, and using a fast deflector to transition between them, it is possible to substantially reduce the average time increment between scanner transitions by increasing the number of gates that can be performed for a single spatial light modulator full frame setting. We analyze the performance of this device in two different configurations: in configuration 1, each segment of the spatial light modulator addresses the full qubit array; in configuration 2, each segment of the spatial light modulator addresses a sub-array and an additional fast deflector positions that sub-array with respect to the full qubit array. With these hybrid scanners we calculate qubit addressing rates that are tens to hundreds of times faster than using an SLM alone.
翻訳日:2023-01-09 06:12:54 公開日:2022-12-23
# トロッタ化ユニタリ結合クラスターの3重励起への拡張

Extension of the Trotterized Unitary Coupled Cluster to Triple Excitations ( http://arxiv.org/abs/2212.12462v1 )

ライセンス: Link先を確認
Mohammad Haidar, Marko J. Ran\v{c}i\'c, Yvon Maday, Jean-Philip Piquemal(参考訳) 量子コンピュータ上での変分量子固有解法(VQE)分子シミュレーションの利用により、Trotterized Unitary Coupled Cluster Single and Double (UCCSD) ansatzは近年関心を集めている。 しかし、分子のサイズが大きくなると、UCCSDは十分な精度を達成できないため、興味が薄くなる。 したがって、高次励起を含むと、UCCの相関効果の欠如を回復する必要がある。 本書では,UCCSDTを導入したトリプルT励起を付加することにより,Trotterized UCCアプローチを拡張した。 また、スピンと軌道の対称性も含む。 実際、これらは後に不要な回路励起を減少させ、より大きな分子に取り組める最適化プロセスを加速させるのに役立つ。 最初の数値実験(12-14 qubits)では、UCCSDTは標準UCCSDに対して少なくとも2桁の精度で全体の精度を向上することを示した。 全体として、UCCSDTアンザッツは化学的精度に達し、CCSD(T)の古典的な量子化学法と競合することが示されている。

The Trotterized Unitary Coupled Cluster Single and Double (UCCSD) ansatz has recently attracted interest due to its use in Variation Quantum Eigensolver (VQE) molecular simulations on quantum computers. However, when the size of molecules increases, UCCSD becomes less interesting as it cannot achieve sufficient accuracy. Including higher-order excitations is therefore mandatory to recover the UCC's missing correlation effects. In this Letter, we extend the Trotterized UCC approach via the addition of (true) Triple T excitations introducing UCCSDT. We also include both spin and orbital symmetries. Indeed, in practice, these later help to reduce unnecessarily circuit excitations and thus accelerate the optimization process enabling to tackle larger molecules. Our initial numerical tests (12-14 qubits) show that UCCSDT improves the overall accuracy by at least two-orders of magnitudes with respect to standard UCCSD. Overall, the UCCSDT ansatz is shown to reach chemical accuracy and to be competitive with the CCSD(T) gold-standard classical method of quantum chemistry.
翻訳日:2023-01-09 06:12:28 公開日:2022-12-23
# リング状rydberg原子網における励起の制御

Controlled flow of excitations in a ring-shaped network of Rydberg atoms ( http://arxiv.org/abs/2212.12490v1 )

ライセンス: Link先を確認
Francesco Perciavalle, Davide Rossini, Tobias Haug, Oliver Morsch, Luigi Amico(参考訳) 高励起リドバーグ原子は量子シミュレーションと情報処理のための強力なプラットフォームである。 ここでは、Rydberg励起のキラル電流を研究するための原子環ネットワークを提案する。 電流はラマンスキームによってインプリントされた位相パターンによって制御され、デファージングが存在する場合でも持続することができる。 ライドバーグ状態のラビカップリングと双極子-双極子相互作用の相互作用によって、電流は著しく異なる特徴を示す。 励起は時間に特徴的なピークを示す速度で伝播し、それは相互作用と原子の数の普遍的な関数であることが分かる。 クエンチの時間平均電流は基底電流と同様の挙動を示す。 この分析は、原子ネットワークにおける情報伝達のための新しい方法の開発方法である。

Highly excited Rydberg atoms are a powerful platform for quantum simulation and information processing. Here, we propose atomic ring networks to study chiral currents of Rydberg excitations. The currents are controlled by a phase pattern imprinted via a Raman scheme and can persist even in the presence of dephasing. Depending on the interplay between the Rabi coupling of Rydberg states and the dipole-dipole atom interaction, the current shows markedly different features. The excitations propagate with a velocity displaying a characteristic peak in time, that is found to be a universal function of interaction and number of atoms. We find that the time-averaged current in a quench behaves similar to the ground-state current. This analysis paves the way for the development of new methods to transport information in atomic networks.
翻訳日:2023-01-09 06:12:11 公開日:2022-12-23
# キャビティ強化および歪調整したGaAs量子ドットに基づく絡み合った光子の源

A source of entangled photons based on a cavity-enhanced and strain-tuned GaAs quantum dot ( http://arxiv.org/abs/2212.12506v1 )

ライセンス: Link先を確認
Michele B. Rota, Tobias M. Krieger, Quirin Buchinger, Mattia Beccaceci, Julia Neuwirth, H\^elio Huet, Nikola Horov\'a, Gabriele Lovicu, Giuseppe Ronco, Saimon F. Covre da Silva, Giorgio Pettinari, Magdalena Mocza{\l}a-Dusanowska, Christoph Kohlberger, Santanu Manna, Sandra Stroj, Julia Freund, Xueyong Yuan, Christian Schneider, Miroslav Je\v{z}ek, Sven H\"ofling, Francesco Basso Basset, Tobias Huber-Loyola, Armando Rastelli and Rinaldo Trotta(参考訳) エンタングル光子の高性能源は量子ネットワークの実現において重要な要素である。 この役割を期待できる全ての候補の中で、半導体量子ドットが最も有望である。 理想的なソースの要件をすべて満たしているが、これまでは1つのデバイスで同時に動作しなかった。 本研究では, 絡み合った光子を伝送する装置のコンセプト実証実験を行い, 高い絡み合い率, 低多重光子放出確率, 高輝度, 調整可能な発光エネルギーを示す。 この溶液は1ガリウムのヒ素量子ドットに基づいており、円ブラッグ共振器に埋め込まれ、ひずみチューニングが可能なマイクロマシド多軸圧電アクチュエータに組み込まれている。 この装置は、エンタングルメント交換やリモートソースとの量子テレポーテーション、パラメトリックダウンコンバージョン源の速度を超えるエンタングルメントベースの量子鍵分布などの高度な量子通信実験への道を開く。

A high-performance source of entangled photons is a key element in the realization of quantum networks. Among all the possible candidates for the role, semiconductor quantum dots are one of the most promising. They fulfil all the requirements for an ideal source but, until now, never simultaneously on a single device. In this work, we show a proof-of-concept demonstration of a device that delivers entangled photons, with high entanglement fidelity, low multiphoton emission probability, high brightness, and tuneable emission energy. Our solution is based on a single gallium arsenide quantum dot, embedded in a circular Bragg resonator and integrated onto a micromachined multiaxial piezoelectric actuator allowing for strain tuning. This device paves the way for advanced quantum communication experiments such as entanglement swapping and quantum teleportation with remote sources and entanglement-based quantum key distribution surpassing the rates of parametric down-conversion sources.
翻訳日:2023-01-09 06:11:56 公開日:2022-12-23
# 極深度場を持つ量子相関光場顕微鏡

Quantum correlation light-field microscope with extreme depth of field ( http://arxiv.org/abs/2212.12582v1 )

ライセンス: Link先を確認
Yingwen Zhang, Duncan England, Antony Orth, Ebrahim Karimi, Benjamin Sussman(参考訳) 光電場顕微鏡(英: light-field microscope, lfm)は、試料から放出される光の位置と角の情報を同時に捉えることにより、試料の体積情報を単一ショットで得る3次元顕微鏡技術である。 従来のLFM設計では位置と角分解能のトレードオフが必要であり、電界深度(DOF)の増大やその逆のために分解力を犠牲にする必要があった。 本研究では,空間-時間交叉光子対の強い相関を利用して,このトレードオフを必要としない LFM の設計を実証する。 ここで、対からの1つの光子を用いて、光子の位置情報がカメラによって直接キャプチャされるサンプルを照らす。 2つの光子の強い運動量/角反相関により、異なるカメラ上のその絡み合ったパートナーの角度を測定することにより、照明光子の角情報を推定することができる。 5$\mu$m の解答力は、従来の LFM の設計よりも桁違いに大きい$\sim500$$\mu$m の DOF で維持可能であることを示す。 極端に、100$\mu$mの解く力では、ほぼ無限のdofを達成することができる。

Light-field microscopy (LFM) is a 3D microscopy technique whereby volumetric information of a sample is gained in a single shot by simultaneously capturing both position and angular information of light emanating from a sample. Conventional LFM designs require a trade-off between position and angular resolution, requiring one to sacrifice resolving power for increased depth of field (DOF) or vice versa. In this work, we demonstrate a LFM design that does not require this trade-off by utilizing the inherent strong correlation between spatial-temporal entangled photon pairs. Here, one photon from the pair is used to illuminate a sample from which the position information of the photon is captured directly by a camera. By virtue of the strong momentum/angular anti-correlation between the two photons, the angular information of the illumination photon can then be inferred by measuring the angle of its entangled partner on a different camera. We demonstrate that a resolving power of 5$\mu$m can be maintained with a DOF of $\sim500$$\mu$m, over an order of magnitude larger compared to conventional LFM designs. In the extreme, at a resolving power of 100$\mu$m, it is possible to achieve near infinite DOF
翻訳日:2023-01-09 06:11:27 公開日:2022-12-23
# 空洞量子光学のためのフォノン遮蔽フォトニック結晶ミラー膜

Phononically shielded photonic-crystal mirror membranes for cavity quantum optomechanics ( http://arxiv.org/abs/2212.12148v1 )

ライセンス: Link先を確認
Georg Enzian, Zihua Wang, Anders Simonsen, Jonas Mathiassen, Toke Vibel, Yeghishe Tsaturyan, Alexander Tagantsev, Albert Schliesser, Eugene S. Polzik(参考訳) 高い機械的品質を特徴とする反射性サブ波長薄膜共振器を提案し,そのキャビティ光学への応用性について検討した。 2dフォトニックとフォノニックの結晶パターンを組み合わせるためにデザインされ製造された85.5〜\text{nm}$ のシリコン-窒化膜は、室温で最大99.89〜$%の反射率と2.9 \times 10^7$の機械的品質係数に達する。 膜が1つの終端ミラーを形成するファブリペロ型光学キャビティを構築した。 キャビティ伝送における光ビーム形状は、理論予測と一致する単純なガウスモード形状からのスターク偏差を示す。 室温からmkモード温度への光機械的サイドバンド冷却を示す。 高いキャビティパワーでは、光機械的に誘起される光ビスタビリティが観察される。 実証された装置は、光機械センシングや空洞量子光学の基礎研究に好適な低光レベルで高い協力力に達する可能性を有し、室温から機械的運動の量子基底状態への冷却要件を満たしている。

We present a highly reflective, sub-wavelength-thick membrane resonator featuring high mechanical quality factor and discuss its applicability for cavity optomechanics. The $88.5~\text{nm}$ thin stoichiometric silicon-nitride membrane, designed and fabricated to combine 2D-photonic and phononic crystal patterns, reaches reflectivities up to $99.89~\%$ and a mechanical quality factor of $2.9 \times 10^7$ at room temperature. We construct a Fabry-Perot-type optical cavity, with the membrane forming one terminating mirror. The optical beam shape in cavity transmission shows a stark deviation from a simple Gaussian mode-shape, consistent with theoretical predictions. We demonstrate optomechanical sideband cooling to mK-mode temperatures, starting from room temperature. At higher intracavity powers we observe an optomechanically induced optical bistability. The demonstrated device has potential to reach high cooperativities at low light levels desirable for e.g. optomechanical sensing and squeezing applications or fundamental studies in cavity quantum optomechanics, and meets the requirements for cooling to the quantum ground state of mechanical motion from room temperature.
翻訳日:2023-01-09 06:02:40 公開日:2022-12-23
# LNOI方向カプラにおけるHong-Ou-Mandel干渉の実証

Demonstration of Hong-Ou-Mandel interference in an LNOI directional coupler ( http://arxiv.org/abs/2212.12261v1 )

ライセンス: Link先を確認
Silia Babel, Laura Bollmers, Marcello Massaro, Kai Hong Luo, Michael Stefszky, Federico Pegoraro, Philip Held, Harald Herrmann, Christof Eigner, Benjamin Brecht, Laura Padberg, and Christine Silberhorn(参考訳) 単一光子間の干渉は多くの量子光学実験や量子通信や計算などの量子技術への応用において鍵となる。 通信波長でシステムを運用し、安定性、コンパクト性、スケーラビリティを向上させるためにこれらのアプリケーションのセットアップを統合することが有利である。 集積量子光学のための新しい有望な材料プラットフォームは、絶縁体上のニオブ酸リチウム(LNOI)である。 そこで本研究では,LNOI方向結合器において,工学的パラメトリックダウンコンバージョン源からの通信光子間のHong-Ou-Mandel(HOM)干渉を検知する。 カプラは家庭で設計・製造され、完璧なバランスの取れたビーム分割を提供する。 93.5+/-0.7)%の生のHOM可視性を得た。 これはLNOIにおけるより洗練された量子実験の基礎を成す

Interference between single photons is key for many quantum optics experiments and applications in quantum technologies, such as quantum communication or computation. It is advantageous to operate the systems at telecommunication wavelengths and to integrate the setups for these applications in order to improve stability, compactness and scalability. A new promising material platform for integrated quantum optics is lithium niobate on insulator (LNOI). Here, we realise Hong-Ou-Mandel (HOM) interference between telecom photons from an engineered parametric down-conversion source in an LNOI directional coupler. The coupler has been designed and fabricated in house and provides close to perfect balanced beam splitting. We obtain a raw HOM visibility of (93.5+/-0.7)%, limited mainly by the source performance and in good agreement with off-chip measurements. This lays the foundation for more sophisticated quantum experiments in LNOI
翻訳日:2023-01-09 06:02:17 公開日:2022-12-23
# 相互作用クエンチ下における量子サンバーストモデル:絡み合いと初期状態コヒーレンスの役割

Quantum sunburst model under interaction quench: entanglement and role of initial state coherence ( http://arxiv.org/abs/2212.12276v1 )

ライセンス: Link先を確認
Akash Mitra and Shashi C. L. Srivastava(参考訳) 我々は,分離された二成分量子系sunburstモデルの非平衡ダイナミクスを相互作用クエンチ下で研究する。 このモデルのプリクエンチ極限は2つの非相互作用可積分系であり、一方は横イジング連鎖であり、もう一方は有限個の孤立量子ビットである。 相互作用強度の関数として、スペクトル変動特性はポアソンからウィグナー・ダイソン統計量へと変化する。 エンタングルメントエントロピーを熱化のアプローチや熱処理後の力学の欠如を研究するプローブとして選択した。 近可積分限界では、予想通り、線形エントロピーは振動挙動を示し、カオス限界では飽和する。 時間発展生成器のカオス性とともに、熱化の性質を決定する上で初期状態の一貫性が果たす役割の重要性を示す。 さらに, イジングリングを無秩序xxzモデルに置き換え, 多体局所化相に配置することで, これらの発見が一般的であることを示した。

We study the non-equilibrium dynamics of an isolated bi-partite quantum system, sunburst model, under interaction quench. The pre-quench limit of this model is two non-interacting integrable systems, one a transverse Ising chain while the other is finite number of isolated qubits. As a function of interaction strength, the spectral fluctuation properties goes from Poisson to Wigner-Dyson statistics. We chose entanglement entropy as a probe to study approach to thermalization or lack of it in post-quench dynamics. In near integrable limit, as expected, the linear entropy displays oscillatory behaviour while in chaotic limit, it saturates. Along with the chaotic nature of the time evolution generator, we show the importance of the role played by coherence of initial state in deciding the nature of thermalization. We further show that these findings are general by replacing Ising ring by disordered XXZ model with disorder strength putting it in many-body localized phase.
翻訳日:2023-01-09 06:02:05 公開日:2022-12-23
# qedによるschr\"odinger方程式の導出

Derivation of the Schr\"odinger equation from QED ( http://arxiv.org/abs/2212.13103v1 )

ライセンス: Link先を確認
Spyros Efthimiades(参考訳) Schr\\odinger方程式は、電子波動関数と電子ポテンシャルを関連づける。 その創発的なレベルでは、シュリンガー方程式は量子物理学の原理として仮定されるか、ヒューリスティックに得られる。 しかし、schr\"odinger方程式は qed の基礎から得られる低エネルギー条件である。 電磁結合定数の小さい値のため、低エネルギー相互作用において、電位は中間光子交換の寄与を正確に表している。 すると、電子波動関数の支配的な項は、全エネルギー関係を満たすことによりシュル=オディンガー方程式、ポーリ方程式、ディラック方程式を満たす平面(ただし自由ではない)波の重ね合わせであることが分かる。 さらに、シュリンガー方程式の運動エネルギー項と考えられるものは相互作用する電子の運動エネルギーを表すものではないことを示す。 我々はschr\"odinger方程式のダイナミクスを解析・明らかにする。

The Schr\"odinger equation relates the electron wavefunction and the electric potential, which are emergent physical quantities. At that emergent level, the Schr\"odinger equation is either postulated as a principle of quantum physics or obtained heuristically. However, the Schr\"odinger equation is a low energy condition we can derive from the foundations of QED. Due to the small value of the electromagnetic coupling constant, we show that, in low energy interactions, the electric potential accurately represents the contributions of the intermediate photon exchanges. Then, we see that the dominant term of the electron wavefunction is a superposition of plane (but not free) waves which, by fulfilling the total energy relations, satisfies the Schr\"odinger, Pauli, and Dirac equations. Furthermore, we show that what is considered the kinetic energy term of the Schr\"odinger equation does not represent the kinetic energy of the interacting electron. We analyze and clarify the dynamics of the Schr\"odinger equation.
翻訳日:2023-01-09 05:37:00 公開日:2022-12-23
# 散逸性環境における連続可変量子テレポーテーション:ノイズチャネル前後における非ガウス演算の比較

Continuous variable quantum teleportation in a dissipative environment: Comparison of non-Gaussian operations before and after noisy channel ( http://arxiv.org/abs/2212.13133v1 )

ライセンス: Link先を確認
Chandan Kumar, Mohak Sharma, and Shikhar Arora(参考訳) 本研究では,非ガウス演算,すなわち光子減算,加算,触媒作用をノイズチャネルとの相互作用の前後で行う場合,連続可変量子テレポーテーションの相対的な利点について検討する。 我々は,2つの異なる戦略を用いて,未知のコヒーレントおよび圧縮真空状態の伝送のための資源状態を生成する。 i)雑音チャネルとの相互作用前のTMSV状態における非ガウス演算の実装 (ii)tmsv状態とノイズチャネルの相互作用後の非ガウス演算の実装 その結果,非ガウシアン動作のタイプ,tmsv状態の初期スクイーズ,ノイズチャネルを特徴付けるパラメータによって,どちらの戦略も他の戦略よりも有益であることがわかった。 この戦略は、様々な非ゲージ連続変数量子情報処理タスクの効率を効果的に改善するために利用できる。

We explore the relative advantages in continuous-variable quantum teleportation when non-Gaussian operations, namely, photon subtraction, addition, and catalysis, are performed before and after interaction with a noisy channel. We generate the resource state for teleporting unknown coherent and squeezed vacuum states using two distinct strategies: (i) Implementation of non-Gaussian operations on TMSV state before interaction with noisy channel, (ii) Implementation of non-Gaussian operations after interaction of TMSV state with noisy channel. The results show that either of the two strategies could be beneficial than the other depending on the type of the non-Gaussian operation, initial squeezing of the TMSV state, and the parameters characterizing the noisy channel. This strategy can be utilized to effectively improve the efficiency of various non-Gaussian continuous variable quantum information processing tasks.
翻訳日:2023-01-09 05:36:43 公開日:2022-12-23
# モーメントと累積成分を用いた統計的信号推定法の拡張:ニューラルネットワークを用いたパルス状波形のパターン変化認識への応用

Extended method for Statistical Signal Characterization using moments and cumulants: Application to recognition of pattern alterations in pulse-like waveforms employing Artificial Neural Networks ( http://arxiv.org/abs/2212.14783v1 )

ライセンス: Link先を確認
G. H. Bustos and H. H. Segnorile(参考訳) 本稿では,ニューラルネットワークを用いたパターン認識タスクにおいて,前処理信号の段階として適用可能な波形の特徴を特徴付ける統計的手法を提案する。 このような手順は、波形、その微分、およびその積分から30パラメータのモーメントと累積を計測することに基づいている。 本手法は,文献に存在する統計的信号特性評価法の拡張として提示される。 テスト手法として,周波数スペクトルの変化や変形によりパルス様信号とそれ自身を区別する手法を用いた。 認識タスクは、Sinc-, Gaussian-, Chirp-pulseウェーブフォームで訓練された単一フィードフォワードバックプロパゲーションネットワークによって実行された。 これらの例で得られた結果から,提案手法はパターン認識に有効なツールであると考えられる。 特に、メモリや計算能力に制限のある組み込みシステムでは、高速前処理ステージとして使用できる。

We propose a statistical procedure to characterize and extract features from a waveform that can be applied as a pre-processing signal stage in a pattern recognition task using Artificial Neural Networks. Such a procedure is based on measuring a 30-parameters set of moments and cumulants from the waveform, its derivative, and its integral. The technique is presented as an extension of the Statistical Signal Characterization method existing in the literature. As a testing methodology, we used the procedure to distinguish a pulse-like signal from different versions of itself with frequency spectrum alterations or deformations. The recognition task was performed by single feed-forward back-propagation networks trained for the case Sinc-, Gaussian-, and Chirp-pulse waveform. Because of the success obtained in these examples, we can conclude that the proposed extended statistical signal characterization method is an effective tool for pattern-recognition applications. In particular, we can use it as a fast pre-processing stage in embedded systems with limited memory or computational capability.
翻訳日:2023-01-09 05:35:31 公開日:2022-12-23
# 大量IoTネットワークにおけるGrant-free NOMAの活動検出

Activity Detection for Grant-Free NOMA in Massive IoT Networks ( http://arxiv.org/abs/2301.01274v1 )

ライセンス: Link先を確認
Mehrtash Mehrabi, Mostafa Mohammadkarimi and Masoud Ardakani(参考訳) 近年,IoT(Internet of Things,モノのインターネット)ネットワークにおいて,時間と帯域の両方を節約し,低レイテンシでメッセージを送信するための助成金のない伝送パラダイムが導入されている。 まず、基地局(bs)における各装置のメッセージを正確に復号するために、各送信フレームにおけるアクティブデバイスを特定する必要がある。 本研究ではまず, しきい値比較問題として, アクティビティ検出の問題について検討する。 アクティビティ検出誤差を最小化するための最適なしきい値を見つけるための誤差の確率を解析し,アクティビティ検出手法の凸性を示す。 そこで本研究では,cnn(convolutional neural network)-activity detection(ad)と呼ばれる深層学習に基づく手法を提案する。 より実用的なものにするために、IoTデバイスの未知かつ時間的に変化する活動率について検討する。 シミュレーションにより,提案手法は既存の非ベイジアングリード法と比較して高い性能が得られることを確認した。 これは、既存の手法がIoTデバイスのアクティビティーレートを知る必要がある一方で、我々の手法は未知の時間変化のアクティビティーレートでも機能する。

Recently, grant-free transmission paradigm has been introduced for massive Internet of Things (IoT) networks to save both time and bandwidth and transmit the message with low latency. In order to accurately decode the message of each device at the base station (BS), first, the active devices at each transmission frame must be identified. In this work, first we investigate the problem of activity detection as a threshold comparing problem. We show the convexity of the activity detection method through analyzing its probability of error which makes it possible to find the optimal threshold for minimizing the activity detection error. Consequently, to achieve an optimum solution, we propose a deep learning (DL)-based method called convolutional neural network (CNN)-activity detection (AD). In order to make it more practical, we consider unknown and time-varying activity rate for the IoT devices. Our simulations verify that our proposed CNN-AD method can achieve higher performance compared to the existing non-Bayesian greedy-based methods. This is while existing methods need to know the activity rate of IoT devices, while our method works for unknown and even time-varying activity rates
翻訳日:2023-01-09 05:35:04 公開日:2022-12-23
# 相互作用するビームの焦点面が異なる自発的パラメトリックダウン変換の空間的・時間的特性

Spatial and temporal characteristics of spontaneous parametric down-conversion with varying focal planes of interacting beams ( http://arxiv.org/abs/2212.12571v1 )

ライセンス: Link先を確認
Richard Bernecker, Baghdasar Baghdasaryan, Stephan Fritzsche(参考訳) 自然パラメトリックダウンコンバージョン(SPDC)は、絡み合った光子対を作るために広く用いられるプロセスである。 SPDCでは、2階非線形結晶をコヒーレントレーザービームで励起して光子対を生成する。 光子対は通常単モードファイバー(SMF)によって検出され、ガウスモードの光子のみが収集される。 収集モードは典型的なガウスパラメータ、すなわちビームウエストと焦点面の位置を持つ。 光子の収集効率は、両方のパラメータの選択に大きく依存する。 検出モードと比較してポンプビームの正確な焦点平面位置を実実験で決定することは困難である。 通常、理論的および実験的研究は、ポンプと生成されたビームの焦点面の位置が結晶の中心にあると仮定する。 ビーム焦点平面の変位は期待結果からのずれを生じさせ、smfへの結合効率は増大または低下する。 本研究では、焦点平面の可変位置を考察し、焦点平面のシフトが光子対の空間的および時間的性質にどのように影響するかを検討する。 本研究では,焦点面の正確な位置に関する知識が不可欠であるSPDCアレンジメントと,焦点面の変位が実験結果に大きく寄与しないシナリオについて述べる。 これらの結果はSPDC実験において高い効率を達成することに特に関心がある。

Spontaneous parametric down-conversion (SPDC) is a widely used process to prepare entangled photon pairs. In SPDC, a second-order nonlinear crystal is pumped by a coherent laser beam to generate photon pairs. The photon pairs are usually detected by single-mode fibers (SMF), where only photons in a Gaussian mode can be collected. The collection modes possess typical Gaussian parameters, namely a beam waist and a focal plane position. The collection efficiency of photons highly depends on the choice of both parameters. The exact focal plane position of the pump beam relative to those of the detection modes is difficult to determine in a real experiment. Usually, theoretical and experimental studies assume that the focal plane positions of the pump and the generated beams are positioned in the center of the crystal. The displacement of beam focal planes can lead to deviations from expected results and the coupling efficiency into SMF can increase or decrease. In this work, we consider variable positions of focal planes and investigate how shifts of these focal planes influence the spatial and temporal properties of photon pairs. We present SPDC arrangements, in which the knowledge of the exact position of the focal planes is essential, as well as scenarios, where focal plane displacements do not contribute significantly to experimental outcomes. These findings are of particular interest for achieving higher efficiency in SPDC experiments.
翻訳日:2023-01-09 05:28:39 公開日:2022-12-23
# 組合せ最適化問題に対する量子優位性

Quantum advantage for combinatorial optimization problems, Simplified ( http://arxiv.org/abs/2212.12572v1 )

ライセンス: Link先を確認
Mario Szegedy(参考訳) 我々は、多くのNP最適化問題に対する近似解法において、フォールトトレラント量子コンピュータは古典的コンピュータよりも最適であることを示した。 しかし、この観察は実際には何も与えない。

We observe that fault-tolerant quantum computers have an optimal advantage over classical computers in approximating solutions to many NP optimization problems. This observation however gives nothing in practice.
翻訳日:2023-01-09 05:28:20 公開日:2022-12-23
# 原子源干渉計のためのロバスト最適化パルススキーム

Robust Optimized Pulse Schemes for Atomic Fountain Interferometry ( http://arxiv.org/abs/2212.12602v1 )

ライセンス: Link先を確認
Michael H. Goerz and Vladimir S. Malinovsky(参考訳) 原子の初期速度の変動と最適なパルス振幅からの偏差に関する原子泉干渉計のロバスト性について検討した。 運動量空間における干渉計の運動力学を最大分離した20進数k$で数値シミュレーションし、初期速度分布のばらつきとレーザー場振幅の値に依存する期待信号コントラストをマッピングする。 本稿では, 急速断熱経路に基づく励振方式により, 一連のRabiパルスからなる一般的な方式と比較して, 期待信号のコントラストを著しく向上させることを示す。 パルス振幅と速度のアンサンブル平均で良好に動作するパルスの分割と交換を最適制御理論を用いて同定することにより、ロバスト性のさらなる向上を示す。 本研究は,原子泉干渉計の今後の実装を大幅に向上させる最適制御の可能性を示すものである。

The robustness of an atomic fountain interferometer with respect to variations in the initial velocity of the atoms and deviations from the optimal pulse amplitude is examined. We numerically simulate the dynamics of an interferometer in momentum space with a maximum separation of $20 \hbar k$ and map out the expected signal contrast depending on the variance of the initial velocity distribution and the value of the laser field amplitude. We show that an excitation scheme based on rapid adiabatic passage significantly enhances the expected signal contrast compared to the commonly used scheme consisting of a series of Rabi pulses. We demonstrate further substantial increase of the robustness by using optimal control theory to identify splitting and swapping pulses that perform well on an ensemble average of pulse amplitudes and velocities. Our results demonstrate the ability of optimal control to significantly enhance future implementations of atomic fountain interferometry.
翻訳日:2023-01-09 05:28:14 公開日:2022-12-23
# キャリアとサイドバンド相互作用を超えたトラップイオン

Trapped ions beyond carrier and sideband interactions ( http://arxiv.org/abs/2212.12612v1 )

ライセンス: Link先を確認
T. Tassis and F. L. Semi\~ao(参考訳) 電磁放射によって駆動される閉じ込められたイオンは、これまでで最も発達した量子技術の一つである。 シナリオは、原理実証実験から量子情報ユニットのオンチップ統合まで幅広い。 ほとんどの場合、これらのシステムは、イオンと放射のカップリング定数の大きさがトラップと電子遷移周波数よりもずっと小さい状態で動作している。 この状態は、回転波近似の妥当性に基づく単純な有効ハミルトニアンの使用を可能にする。 しかし、新しいトラップとキャビティの設計により、トラップ周波数とイオン放射結合定数が共振する状態が許されている。 これにより、イオンから光子や他の量子操作への高速な量子ゲートと状態移動のための新しい場所が開く。 しかし、理論的な側面から見ると、弱い駆動シナリオを超えるモデルや応用については、まだよく分かっていない。 本研究は、より強い運転のシナリオにおける2つの主要な結果を示す。 まず,動作ウィグナー関数を再構成し,より強力な駆動レーザに拡張するための既知のプロトコルを再検討する。 この拡張は、元々のプロトコルは弱い駆動にのみ有効なハミルトン多様体を使用するため、自明ではない。 実験的な再建法は一般にデコヒーレンスによって妨げられるため、より強固なフィールドや高速な操作の使用が望ましい。 次に,より強固な駆動の解析的処理を可能にするモデルを示し,従来のモデルでは一般的ではない非共振相互作用にうまく機能することを示す。

Trapped ions driven by electromagnetic radiation constitute one of the most developed quantum technologies to date. The scenarios range from proof-of-principle experiments to on-chip integration for quantum information units. In most cases, these systems have operated in a regime where the magnitude of the ion-radiation coupling constant is much smaller than the trap and electronic transition frequencies. This regime allows the use of simple effective Hamiltonians based on the validity of the rotating wave approximation. However, novel trap and cavity designs now permit regimes in which the trap frequency and the ion-radiation coupling constant are commensurate. This opens up new venues for faster quantum gates and state transfers from the ion to a photon, and other quantum operations. From the theoretical side, however, there is not yet much known in terms of models and applications that go beyond the weak driving scenario. In this work, we will present two main results in the scenario of stronger drivings. First, we revisit a known protocol to reconstruct the motional Wigner function and expand it to stronger driving lasers. This extension is not trivial because the original protocol makes use of effective Hamiltonians valid only for weak drivings. The use of stronger fields or faster operations is desirable since experimental reconstruction methods of that kind are usually hindered by decoherence. We then present a model that allows the analytical treatment of stronger drivings and that works well for non-resonant interactions, which are generally out of the reach of the previous models.
翻訳日:2023-01-09 05:28:00 公開日:2022-12-23
# ディック量子電池の充電の強化学習最適化

Reinforcement learning optimization of the charging of a Dicke quantum battery ( http://arxiv.org/abs/2212.12397v1 )

ライセンス: Link先を確認
Paolo Andrea Erdman, Gian Marcello Andolina, Vittorio Giovannetti, Frank No\'e(参考訳) 量子電池(Quantum Battery)は、量子力学が支配するエネルギー貯蔵装置で、集団効果によって高い充電性能を約束する。 ディッケ電池は実験可能なため、共通の光子モードと結合した2段階のシステムで構成されており、量子電池の最も有望な設計の1つである。 ここでは、ディック電池の充電過程を最適化するために強化学習を用い、抽出可能なエネルギー(エルゴトロピー)と量子力学的エネルギーゆらぎ(チャージ精度)の両方を標準充電戦略により大幅に改善できることを示す。

Quantum batteries are energy-storing devices, governed by quantum mechanics, that promise high charging performance thanks to collective effects. Due to its experimental feasibility, the Dicke battery - which comprises $N$ two-level systems coupled to a common photon mode - is one of the most promising designs for quantum batteries. Here, we use reinforcement learning to optimize the charging process of a Dicke battery, showing that both the extractable energy (ergotropy) and quantum mechanical energy fluctuations (charging precision) can be greatly improved with respect to standard charging strategies.
翻訳日:2023-01-09 05:19:19 公開日:2022-12-23
# 現実的な変分ベイズ量子論のための一軸ねじれの最適化

Optimizing one-axis twists for realistic variational Bayesian quantum metrology ( http://arxiv.org/abs/2212.12461v1 )

ライセンス: Link先を確認
Tyler G. Thurtell and Akimasa Miyake(参考訳) 変分ベイズ量子メトロロジーは、状態準備(またはエンコーディング)と測定(またはデコード)の手順の両方を最適化し、事前情報を考慮したセンシングにおける量子優位への有望な道である。 実用上の優位性のためには,各種パラメトリケーションプロトコルの有効性や,空間的相関ノイズなどの複雑な雑音の影響に対するロバスト性を理解することが重要である。 まず,任意の軸方向のツイスト・アンサットと呼ばれるパラメトリド符号化・復号プロトコルを新たに提案し,目標推定誤差を達成するのに必要な1軸のツイスト数を大幅に削減できることを示す。 第2に, 実測時空を実測する多項式サイズのテンソルネットワークアルゴリズムを導入し, 現実的な雑音レベル下での浅層深度アンサーゼに対して量子的優位性が持続することを示した。

Variational Bayesian quantum metrology is a promising avenue toward quantum advantage in sensing which optimizes both the state preparation (or encoding) and measurement (or decoding) procedures and takes prior information into account. For the sake of practical advantage, it is important to understand how effective various parametrized protocols are as well as how robust they are to the effects of complex noise, such as spatially correlated noise. First, we propose a new family of parametrized encoding and decoding protocols called arbitrary-axis twist ansatzes, and show that it can lead to a substantial reduction in the number of one-axis twists needed to achieve a target estimation error. Second, we introduce a polynomial-size tensor network algorithm to analyze practical variational metrology beyond the symmetric subspace of a collective spin, and find that quantum advantage persists for shallow-depth ansatzes under realistic noise level.
翻訳日:2023-01-09 05:18:34 公開日:2022-12-23
# ququintsを用いた一般化トッフォリゲート分解:quditsを用いたgroverのアルゴリズムの実現に向けて

Generalized Toffoli gate decomposition using ququints: Towards realizing Grover's algorithm with qudits ( http://arxiv.org/abs/2212.12505v1 )

ライセンス: Link先を確認
Anastasiia S. Nikolaeva, Evgeniy O. Kiktenko, Aleksey K. Fedorov(参考訳) 古典ビットの量子対する量子ビットは量子情報処理の基本的な情報単位として使用されるが、基礎となる物理情報担体(例えば原子やイオン)はより複雑なマルチレベル状態の符号化を認めている。 近年,量子プロセッサのさらなるスケーリング方法としてquditエンコーディングを用いるという考えに注目が集まっている。 本研究では,5段階量子系上の一般化された toffoli ゲート,いわゆる ququints の効率的な分解法を提案する。 基本2ビット演算は制御相ゲートのバージョンである。 提案された$N$-qubit Toffoli ゲート分解は、補助量子ビットを使わずに$O(N)$漸近深さを持つ。 次に、Grover のアルゴリズムに結果を適用し、提案した分解によるqudit ベースのアプローチのかなりの利点を示す。 この結果は、様々な物理プラットフォームに基づく量子プロセッサに適用できると期待している。

Qubits, which are quantum counterparts of classical bits, are used as basic information units for quantum information processing, whereas underlying physical information carriers, e.g. (artificial) atoms or ions, admit encoding of more complex multilevel states -- qudits. Recently, significant attention is paid to the idea of using qudit encoding as a way for further scaling quantum processors. In this work, we present an efficient decomposition of the generalized Toffoli gate on the five-level quantum systems, so-called ququints, that uses ququints' space as the space of two qubits with a joint ancillary state. The basic two-qubit operation that we use is a version of controlled-phase gate. The proposed $N$-qubit Toffoli gate decomposition has $O(N)$ asymptotic depth using no ancillary qubits. We then apply our results for Grover's algorithm, where we indicate on the sizable advantage of the using qudit-based approach with the proposed decomposition. We expect that our results are applicable for quantum processors based on various physical platforms.
翻訳日:2023-01-09 05:18:16 公開日:2022-12-23
# 頻繁な量子計測による微視的ノイズのセンシング

Sensing microscopic noise events by frequent quantum measurements ( http://arxiv.org/abs/2212.12530v1 )

ライセンス: Link先を確認
Salvatore Virz\`i, Laura T. Knoll, Alessio Avella, Fabrizio Piacentini, Stefano Gherardini, Marco Gramegna, Gershon Kurizki, Abraham G. Kofman, Ivo Pietro Degiovanni, Marco Genovese, and Filippo Caruso(参考訳) 連続量子変数に影響を及ぼす微視的ノイズイベントを解き明かす一般的な方法を提案し,実験的に実証する。 このような解法は、連続変数と結合した離散変数の頻繁な測定によって達成される。 実験的実現は、ノイズチャネルを横断する光子を含む。 そこでは、光子空間波束との結合が確率的雑音にさらされる偏光が、量子ゼノ状態において頻繁に測定される。 この測定は偏光状態を保存するだけでなく、チャネルから発生する光子を空間的に解決した検出から完全なノイズ統計を記録することを可能にする。 この方法では、量子ノイズセンサやロバストな情報キャリアとして光子を用いることが可能である。

We propose and experimentally demonstrate a general method allowing us to unravel microscopic noise events that affect a continuous quantum variable. Such unraveling is achieved by frequent measurements of a discrete variable coupled to the continuous one. The experimental realization involves photons traversing a noisy channel. There, their polarization, whose coupling to the photons spatial wavepacket is subjected to stochastic noise, is frequently measured in the quantum Zeno regime. The measurements not only preserve the polarization state, but also enable the recording of the full noise statistics from the spatially-resolved detection of the photons emerging from the channel. This method proves the possibility of employing photons as quantum noise sensors and robust carriers of information.
翻訳日:2023-01-09 05:17:19 公開日:2022-12-23
# 高次元ステアリング認証の完全階層化

Complete hierarchy for high-dimensional steering certification ( http://arxiv.org/abs/2212.12544v1 )

ライセンス: Link先を確認
Carlos de Gois, Martin Pl\'avala, Ren\'e Schwonnek, Otfried G\"uhne(参考訳) 高次元の量子ステアリングは、片面のデバイスを特徴付けないエンタングルメントの次元性の試験と見なすことができる。 そのため、高次元の絡み合いを利用する量子情報プロトコルにおいて重要な構成要素である。 近年実験的に観察されているが、高次元ステアリング現象は一般的な認証手順を欠いている。 ステアリングシナリオにおける絡み合いの寸法を証明するための必要かつ十分な条件を提供する。 これらの条件は半定値プログラムの階層的に記述され、ステアリング次元のロバスト性を用いて現象の定量化にも用いられる。 本手法の実用性を示すために, 互いに偏りのないベースで測定した最大絡み合い状態を用いたステアリングシナリオにおいて, 絡み合いの寸法を特徴付ける。 提案手法は, 高次元エンタングルメントを実験的に証明するために必要な雑音の頑健性に, はるかに強い拘束力を与える。

High-dimensional quantum steering can be seen as a test for the dimensionality of entanglement, where the devices at one side are not characterized. As such, it is an important component in quantum informational protocols that make use of high-dimensional entanglement. Although it has been recently observed experimentally, the phenomenon of high-dimensional steering is lacking a general certification procedure. We provide necessary and sufficient conditions to certify the entanglement dimension in a steering scenario. These conditions are stated in terms of a hierarchy of semidefinite programs, which can also be used to quantify the phenomenon using the steering dimension robustness. To demonstrate the practical viability of our method, we characterize the dimensionality of entanglement in steering scenarios prepared with maximally entangled states measured in mutually unbiased bases. Our methods give significantly stronger bounds on the noise robustness necessary to experimentally certify high-dimensional entanglement.
翻訳日:2023-01-09 05:17:09 公開日:2022-12-23
# 一様加速粒子検出器による相互情報収集

Mutual information harvested by uniformly accelerated particle detectors ( http://arxiv.org/abs/2212.12546v1 )

ライセンス: Link先を確認
Manar Naeem and Kensuke Gallock-Yoshimura and Robert B. Mann(参考訳) 2つの粒子検出器の相互情報収集プロトコルについて検討する。 一つの検出器が熱浴に浸入しているかのように応答するのに対し、2つの加速検出器間の量子相互情報が熱浴中の2つの慣性検出器と異なる挙動を示す。 これは、1つの一様加速検出器の軌道に沿ってワイトマン関数が熱浴の検出器と同じであるのに対し、同じケースの2つの検出器はワイトマン関数が異なるためである。

We investigate the mutual information harvesting protocol for two uniformly accelerated particle detectors. We numerically show that, while a single detector responds as if it is immersed in a thermal bath, the quantum mutual information between two accelerating detectors behaves differently than that of two inertial detectors in a thermal bath. This is due to the fact that while the Wightman function along the trajectory of a single uniformly accelerating detector is the same as that of as a detector in a thermal bath, a pair of detectors in the same respective cases will have different Wightman functions.
翻訳日:2023-01-09 05:16:54 公開日:2022-12-23
# 振動する硬壁球形トラップにおける粒子の量子幾何位相の影響

Effects of quantum geometric phase of a particle in an oscillating hard-wall spherical trap ( http://arxiv.org/abs/2212.12557v1 )

ライセンス: Link先を確認
Reza Moazzemi and Seyed Mahdi Fazeli(参考訳) まず, 井戸の半径が単調に増加する(または減少する)とき, 移動壁を持つ球状無限ポテンシャルの粒子の状態の幾何位相を求める。 第二に、半径が振動に変わるとき。 後者の場合、シュロディンガー方程式を解き、その解をおよそ発見する。 我々は, 幾何学的位相の効果を顕示するアコースト光学的ケースにおいて, 可能な実状況の遷移速度を求める。 入射光子間のエネルギーギャップと幾何位相による2レベルのエネルギー差が振動周波数の整数倍に等しい場合、吸収あるいは放射ピークが現れることを示す。

We obtain the geometric phase for states of a particle in a spherical infinite potential well with a moving wall in two different cases; First, when the radius of the well increases (or decreases) monotonically. Second, when the radius changes oscillatory. In the latter case, we have solved the Schrodinger equation and found its solutions approximately. {We obtain the transition rate for the possible real situation in an acousto-optic case which can reveal the effect of the geometric phase. We show that the absorption or radiation peaks will appear if the energy gap between the incident photon and the modified energy difference of two levels by the geometric phase, is equal to the integer multiple of oscillation frequency.
翻訳日:2023-01-09 05:16:45 公開日:2022-12-23
# 離散時間量子ウォークによる多成分高次元量子状態工学

Multipartite High-dimensional Quantum State Engineering via Discrete Time Quantum Walk ( http://arxiv.org/abs/2212.12164v1 )

ライセンス: Link先を確認
Junhong Nie, Meng Li, Xiaoming Sun(参考訳) 量子状態工学、すなわち任意の量子状態の生成と制御は、量子情報や計算に広く応用されているため、ますます注目を集めている。 しかし、理論上の一般的な方法はなく、既存のスキームも選択した実験プラットフォームに大きく依存している。 この原稿では、任意の量子状態の工学的タスクのための2つのスキームを$c$-partite $d$-dimensional systemで与え、どちらも2^c$-dimensional time-および position-dependent coinによる離散時間量子ウォークに基づいている。 最初の手順は$d$-stepの量子ウォークで、$d$のコインは非identityで、2番目の手順は$o(d)$-stepの量子ウォークで、$o(\log d)$のコインは非identityである。 一般化されたベル状態の具体的な例は、我々が提案した最初のスキームを実証するために与えられる。 また, システム内の粒子が互いに遠く離れている場合, 長距離量子通信のコストを削減するために, これらのスキームをどのように利用するかを示す。 さらに、第1のスキームを適用して量子情報処理の基本課題の一つである量子状態準備問題に代替的なアプローチを与えることができる。 我々は,回路の大きさと深さを漸近的に一致させる量子状態工学的手法を用いて,量子状態準備のための回路を設計する。

Quantum state engineering, namely the generation and control of arbitrary quantum states, is drawing more and more attention due to its wide applications in quantum information and computation. However, there is no general method in theory, and the existing schemes also depend heavily on the selected experimental platform. In this manuscript, we give two schemes for the engineering task of arbitrary quantum state in $c$-partite $d$-dimensional system, both of which are based on discrete-time quantum walk with a $2^c$-dimensional time- and position-dependent coin. The first procedure is a $d$-step quantum walk where all the $d$ coins are non-identity, while the second procedure is an $O(d)$-step quantum walk where only $O(\log d)$ coins are non-identity. A concrete example of preparing generalized Bell states is given to demonstrate the first scheme we proposed. We also show how these schemes can be used to reduce the cost of long-distance quantum communication when the particles involved in the system are far away from each other. Furthermore, the first scheme can be applied to give an alternative approach to the quantum state preparation problem which is one of the fundamental tasks of quantum information processing. We design circuits for quantum state preparation with the help of our quantum state engineering scheme that match the best current result in both size and depth of the circuit asymptotically.
翻訳日:2023-01-09 05:09:58 公開日:2022-12-23
# スペクトル安定化性

Spectral stabilizability ( http://arxiv.org/abs/2212.12245v1 )

ライセンス: Link先を確認
Tomasz Linowski, {\L}ukasz Rudnicki, Clemens Gneiting(参考訳) デコヒーレンスは、信頼できる量子技術を実現するための大きな障害である。 純粋にコヒーレントな手段によってデコヒーレンスを抑えることができる状態、すなわち、散逸によって引き起こされる崩壊を適切な制御によって完全に補償できる安定化可能な状態は、脆弱な量子資源の搾取を最適化し、この目的のためにコヒーレントな制御の究極の限界を理解するのに役立つ。 本研究では,一般密度演算子とガウス状態の共分散行列パラメータ化の両方に対して,対象状態の固有分解に基づく安定化条件を開発する。 従来の安定化性条件とは異なり、これらのスペクトル条件は必要かつ十分であり、一般的には使いやすく、適用範囲を広げる。 本手法は, 局所散逸の存在下でのGHZおよびW状態の安定化や, 集合減衰下での収縮熱状態の安定化など, 多数の模範的オープンシステムシナリオに対して, 上界の安定化性に関するスペクトル的アプローチを用いる。

Decoherence represents a major obstacle towards realizing reliable quantum technologies. Identifying states that can be uphold against decoherence by purely coherent means, i.e., stabilizable states, for which the dissipation-induced decay can be completely compensated by suitable control Hamiltonians, can help to optimize the exploitation of fragile quantum resources and to understand the ultimate limits of coherent control for this purpose. In this work, we develop conditions for stabilizability based on the target state's eigendecomposition, both for general density operators and for the covariance matrix parameterization of Gaussian states. Unlike previous conditions for stabilizability, these spectral conditions are both necessary and sufficient and are typically easier to use, extending their scope of applicability. To demonstrate its viability, we use the spectral approach to derive upper bounds on stabilizability for a number of exemplary open system scenarios, including stabilization of generalized GHZ and W states in the presence of local dissipation and stabilization of squeezed thermal states under collective damping.
翻訳日:2023-01-09 05:09:32 公開日:2022-12-23
# 相空間と水素原子における一般化力学理論

Generalized dynamical theories in phase space and the hydrogen atom ( http://arxiv.org/abs/2212.12267v1 )

ライセンス: Link先を確認
Martin Pl\'avala and Matthias Kleinmann(参考訳) 量子理論の成功は、幅広い物理系をモデル化し、対応する予測を抽出する能力に基づいている。 量子モデルは実験的実験とその後の改良の対象であるが、量子論の言語自体は一般に固定化されている。 しかし、量子論は全ての確率論のクラスの中で明確な例であり、量子論の言語の基本的な実験的検証を可能にする洞察である。 しかし、一般的な確率論では具体的な物理系を記述できないため、徹底的なテストは理解できない。 確率論の位相空間の定式化は力学を含むよう拡張でき、安定で離散エネルギーレベルを持ち、ゼーマン効果を含み、共鳴レーザーによる励起を一貫して予測し、ラザフォード散乱を示す非量子水素様系を記述することができることを示す。 我々の構成は、量子論の言語が特定の選択であり、他の確率論的理論も測定可能な予測をもたらすことを示した。

The success of quantum theory is founded on the ability to model a wide range of physical systems and extract corresponding predictions. While the quantum models are subject to experimental tests and subsequent refinements, the language of quantum theory itself is generally taken as fixed. But quantum theory is only a distinct instance within the class of all probabilistic theories, an insight that enables rudimentary experimental tests of the language of quantum theory. However, thorough tests are inconceivable because general probabilistic theories cannot describe concrete physical systems. We show that the phase-space formulation of probabilistic theories can be extended to include dynamics and that it can describe a nonquantum hydrogen-like system which is stable, has discrete energy levels, includes the Zeeman effect, consistently predicts excitations by a resonant laser, and exhibits Rutherford scattering. Our construction demonstrates that the language of quantum theory is a specific choice and that other probabilistic theories also lead to measurable predictions.
翻訳日:2023-01-09 05:09:11 公開日:2022-12-23
# 調和ポテンシャルを用いた量子系の計測に基づくフィードバック制御

Measurement-based Feedback Control of a Quantum System in a Harmonic Potential ( http://arxiv.org/abs/2212.12292v1 )

ライセンス: Link先を確認
Amy Rouillard, Anirudh Reddy, Humairah Bassa, Shamik Maharaj, Lajos Diosi and Thomas Konrad(参考訳) 1つの空間次元における1つの量子粒子の測定に基づくフィードバック制御の定式化を提案する。 粒子の位置と運動量の任意の線形結合を連続的に監視し、測定信号に比例したフィードバックを用いてシステムを制御する。 我々は、フィードバックマスター方程式を導出し、任意のポテンシャルに対する定常解を計算する一般的なアプローチについて論じる。 量子高調波発振器や自由粒子では、測定された観測量とその共役運動量を同時に減衰させるフィードバックと、測定によって引き起こされるノイズの補償を用いて、システムを冷却して定義することが可能であることを示す。 さらに,システムのハミルトニアンに対して観測可能な観測値に,適切なフィードバックが二次項を付加することを示す。 調和ポテンシャルの特別な場合については、基底状態まで冷却できる系の厳密なダイナミクスを記述する。 さらに, 任意のポテンシャルを持つ系を冷却する可能性について, 粒子が電位の特性長さスケールよりも小さい間隔で局在するのに十分な強度であることから議論する。

We present a formulation of measurement-based feedback control of a single quantum particle in one spatial dimension. An arbitrary linear combination of the position and momentum of the particle is continuously monitored, and feedback proportional to the measured signal is used to control the system. We derive a feedback master equation and discuss a general approach to computing the steady-state solutions for arbitrary potentials. For a quantum harmonic oscillator or a free particle, we show that it is possible to cool and confine the system using feedback that simultaneously damps the measured observable and its conjugate momentum, as well as compensates for noise introduced by the measurement. In addition, we demonstrate that appropriate feedback adds a quadratic term in the measured observable to the Hamiltonian of the system. For the particular case of the harmonic potential, we describe the exact dynamics of the system that can be cooled to the ground state. Moreover, we provide an argument for the possibility to cool systems with arbitrary potentials provided that the measurement is strong enough to localise the particle on an interval smaller than the characteristic length scale of the potential.
翻訳日:2023-01-09 05:08:55 公開日:2022-12-23
# NMRによるスピン系の動的トンネルの研究

NMR investigations of Dynamical Tunneling in Spin Systems ( http://arxiv.org/abs/2212.12350v1 )

ライセンス: Link先を確認
V. R. Krithika, M. S. Santhanam, and T. S. Mahesh(参考訳) カオスハミルトニアン系において、動的トンネル(英: dynamical tunneling)とは、カオスゾーンによって分離された対称性に関連する正則領域に対応する古典的極限を持つ状態間の量子トンネルのことである。 通常の量子トンネル法では、低エネルギーの量子粒子が古典的に禁止された領域を横切ることで、高いポテンシャルエネルギーの物理的障壁を越えて侵入し、最終的に別の領域に逃げ込む。 同様のシナリオでは、閉正則領域内の古典粒子は位相空間の他の領域への脱出から動的に束縛されるが、量子レジームトンネルでは動的障壁を抜け出すことができる。 ここでは、スピン系における動的トンネルの実験的実現を核磁気共鳴(NMR)アーキテクチャを用いて報告する。 特に,スピン-1およびスピン-3/2系の量子キックトップにおける2量子および3量子NMRレジスタを用いた動的トンネルについて検討した。 角運動量演算子成分の時間依存期待値を抽出することにより、様々な初期状態に対するサイズ依存トンネル挙動を体系的に検討する。 さらに, トンネル振動に対する劣化雑音の悪影響をモニタリングすることにより, 動的トンネル化の実現における量子コヒーレンスの重要性を主張する。

In chaotic Hamiltonian systems, dynamical tunneling refers to quantum tunneling between states whose classical limit correspond to symmetry-related regular regions separated by a chaotic zone. In the usual quantum tunneling, a low-energy quantum particle penetrates across a physical barrier of higher potential energy, by traversing a classically forbidden region, and finally escapes into another region. In a similar scenario, a classical particle inside a closed regular region is dynamically bound from escaping to other regions of the phase space, whereas in the quantum regime tunneling permits escape through dynamical barrier. Here, an experimental realization of dynamical tunneling in spin systems is reported using nuclear magnetic resonance (NMR) architecture. In particular, dynamical tunneling in quantum kicked tops of spin-1 and spin-3/2 systems using two- and three-qubit NMR registers is investigated. By extracting time-dependent expectation values of the angular momentum operator components, size-dependent tunneling behaviour for various initial states is systematically investigated. Further, by monitoring the adverse effects of dephasing noise on the tunneling oscillations, we assert the importance of quantum coherence in enabling dynamical tunneling.
翻訳日:2023-01-09 05:08:37 公開日:2022-12-23
# 基底変化に対する量子速度限界

Quantum Speed Limit for Change of Basis ( http://arxiv.org/abs/2212.12352v1 )

ライセンス: Link先を確認
Moein Naseri, Chiara Macchiavello, Dagmar Bru\ss, Pawe{\l} Horodecki, and Alexander Streltsov(参考訳) 量子速度制限は、ある量子状態を別の量子状態に変換するのに必要な時間に究極の境界を与える。 ここでは、量子速度制限の概念を量子状態の集合に拡張し、状態の基底をバイアスのない状態に変換する時間を調べる。 我々は、次元が 5 より小さい系に対して厳密な境界を提供し、マルチキュービット系とヒルベルト空間次元に対する一般境界を$d$とする。 2量子ビットシステムでは、最速変換が2つのアダマールと1つのキュービットを同時にスワップすることを示す。 さらに、クトリット系では、進化時間は偏りのない基底の特定のタイプに依存することをさらに証明する。 また,コヒーレンス生成の速度制限についても検討し,ユニタリ進化と一定量のコヒーレンスを確立するための最小限の時間を与える。

Quantum speed limits provide ultimate bounds on the time required to transform one quantum state into another. Here, we extend the notion of quantum speed limits to collections of quantum states, investigating the time for converting a basis of states into an unbiased one. We provide tight bounds for systems of dimension smaller than 5, and general bounds for multi-qubit systems and Hilbert space dimension $d$. For two-qubit systems, we show that the fastest transformation implements two Hadamards and a swap of the qubits simultaneously. We further prove that for qutrit systems the evolution time depends on the particular type of the unbiased basis. We also investigate speed limits for coherence generation, providing the minimal time to establish a certain amount of coherence with a unitary evolution.
翻訳日:2023-01-09 05:08:20 公開日:2022-12-23
# スピン-1/2等方性ハイゼンベルククラスター中の量子傷

Quantum scars in spin-1/2 isotropic Heisenberg clusters ( http://arxiv.org/abs/2212.12362v1 )

ライセンス: Link先を確認
G. Zhang and Z. Song(参考訳) スピン-1/2$等方性ハイゼンベルククラスターにおける固有状態のエネルギー準位と塔の統計量に及ぼす外部場の影響について検討した。 一方向の一様場が存在する場合、システムのsu($2$)対称性は、ほぼ全スペクトルが同じレベルの間隔を持つ多数の塔からなることを許す。 有限クラスタ上の厳密な対角化は、ポアソンからウィグナー・ダイソン(WD)の分布を平均レベル間隔比の異なる値で計算し、積分性から非可積分性への遷移を示すことを示している。 しかし、3つのタイプのクラスターでは、最も大きな塔は対称性がほぼ破れており、量子の傷を負っていることが判明した。 驚くべきことに、非熱状態はgreenberger-horn-zeilinger (ghz) とw状態であり、この状態は再生の特徴を維持しつつ、ネール状態は動的過程において急速に崩壊する。 我々の発見は、有限サイズの量子スピンクラスターにおける熱化に無害な量子情報処理の可能性を明らかにする。

We investigate the influence of the external fields on the statistics of energy levels and towers of eigenstates in spin-$1/2$ isotropic Heisenberg clusters, including chain, ladder, square and triangular lattices. In the presence of uniform field in one direction, the SU($2$) symmetry of the system allows that almost whole spectrum consists of a large number of towers with identical level spacing. Exact diagonalization on finite clusters shows that random transverse fields in other two directions drive the level statistics from Poisson to Wigner-Dyson (WD) distributions with different values of mean level spacing ratio, indicating the transition from integrability to non-integrability. However, for the three types of clusters, it is found that the largest tower still hold approximately even the symmetry is broken, resulting to a quantum scar. Remarkably, the non-thermalized states cover the Greenberger-Horn-Zeilinger (GHZ) and W states, which maintain the feature of revival while a Neel state decays fast in the dynamic processes. Our finding reveals the possibility of quantum information processing that is immune to the thermalization in finite size quantum spin clusters.
翻訳日:2023-01-09 05:08:06 公開日:2022-12-23
# 超伝導量子プロセッサ上のサブ線形資源による整数の分解

Factoring integers with sublinear resources on a superconducting quantum processor ( http://arxiv.org/abs/2212.12372v1 )

ライセンス: Link先を確認
Bao Yan, Ziqi Tan, Shijie Wei, Haocong Jiang, Weilong Wang, Hong Wang, Lan Luo, Qianheng Duan, Yiting Liu, Wenhao Shi, Yangyang Fei, Xiangdong Meng, Yu Han, Zheng Shan, Jiachen Chen, Xuhao Zhu, Chuanyu Zhang, Feitong Jin, Hekang Li, Chao Song, Zhen Wang, Zhi Ma, H. Wang, Gui-Lu Long(参考訳) shorのアルゴリズムは、公開鍵暗号システムに基づく情報セキュリティに真剣に挑戦している。 しかし、広く使われているRSA-2048スキームを破るためには、数百万の物理量子ビットが必要である。 本稿では,古典格子削減法と量子近似最適化アルゴリズム(QAOA)を組み合わせた整数分解のための普遍量子アルゴリズムについて報告する。 必要となるキュービットの数はO(logN/loglog N)であり、これは整数$N$のビット長のサブ線形であり、現在までで最もクビットを節約する分解アルゴリズムである。 量子デバイス上で最大となる10個の超伝導量子ビットで最大48ビットの整数を分解して実験的にアルゴリズムを示す。 372の物理量子ビットと数千の深さを持つ量子回路は、我々のアルゴリズムを用いてRSA-2048に挑戦する必要があると推定する。 本研究は、現在の雑音量子コンピュータの応用を早めることに大きな期待を示し、現実的な暗号的意義を持つ大きな整数を分解する方法を定めている。

Shor's algorithm has seriously challenged information security based on public key cryptosystems. However, to break the widely used RSA-2048 scheme, one needs millions of physical qubits, which is far beyond current technical capabilities. Here, we report a universal quantum algorithm for integer factorization by combining the classical lattice reduction with a quantum approximate optimization algorithm (QAOA). The number of qubits required is O(logN/loglog N), which is sublinear in the bit length of the integer $N$, making it the most qubit-saving factorization algorithm to date. We demonstrate the algorithm experimentally by factoring integers up to 48 bits with 10 superconducting qubits, the largest integer factored on a quantum device. We estimate that a quantum circuit with 372 physical qubits and a depth of thousands is necessary to challenge RSA-2048 using our algorithm. Our study shows great promise in expediting the application of current noisy quantum computers, and paves the way to factor large integers of realistic cryptographic significance.
翻訳日:2023-01-09 05:07:41 公開日:2022-12-23
# 熱方程式の変分量子アルゴリズムの深さ解析

Depths analysis of variational quantum algorithms for heat equation ( http://arxiv.org/abs/2212.12375v1 )

ライセンス: Link先を確認
N. M. Guseynov, A. A. Zhukov, W. V. Pogosov, A.V. Lebedev(参考訳) 変分量子アルゴリズムは偏微分方程式を解くための有望なツールである。 数値解の標準的なアプローチは有限差分スキームであり、線形代数問題に還元することができる。 量子コンピュータ上での熱方程式を解くための3つの方法を考える。 直接変分法を用いて、研究中の問題の解となる基底状態を用いて、ハミルトニアンの期待値を最小限に抑える。 通常、ハミルトニアン分解におけるポーリ積の指数関数数は量子速度を上げることができない。 ハダマールテストに基づくアプローチはこの問題を解くが、実行されたシミュレーションは、アンサッツ回路が量子ビット数に対して多項式深さを持つことを明らかに証明していない。 ansatz木アプローチは行列の明示的な形式を活用し、古典的なアルゴリズムよりも優位に立つことができる。 最大$n=8$ qubitsの数値シミュレーションでは、この手法が指数関数的なスピードアップを示している。

Variational quantum algorithms are a promising tool for solving partial differential equations. The standard approach for its numerical solution are finite difference schemes, which can be reduced to the linear algebra problem. We consider three approaches to solve the heat equation on a quantum computer. Using the direct variational method we minimize the expectation value of a Hamiltonian with its ground state being the solution of the problem under study. Typically, an exponential number of Pauli products in the Hamiltonian decomposition does not allow for the quantum speed up to be achieved. The Hadamard test based approach solves this problem, however, the performed simulations do not evidently prove that the Ansatz circuit has a polynomial depth with respect to the number of qubits. The ansatz tree approach exploits an explicit form of the matrix what makes it possible to achieve an advantage over classical algorithms. In our numerical simulations with up to $n=8$ qubits, this method reveals the exponential speed up.
翻訳日:2023-01-09 05:07:23 公開日:2022-12-23
# 準カオス量子スクランブラのための効率的なデコーダの学習

Learning efficient decoders for quasi-chaotic quantum scramblers ( http://arxiv.org/abs/2212.11338v2 )

ライセンス: Link先を確認
Lorenzo Leone, Salvatore F.E. Oliviero, Seth Lloyd and Alioscia Hamma(参考訳) 量子情報のスクランブルは、ランダム化とベンチマークプロトコル、量子カオスの開始、ブラックホール物理学の根底にある重要な特徴である。 この情報を解き放つことは、scrambler[arXiv:1710.03363]の完全な知識によって可能である。 従来のスクランブラーの知識がなくても,効率的なデコーダの構築を可能にする学習アルゴリズムにより,スクランブル情報を検索できることを示す。 驚くべきことに、デコーダは古典的コンピュータ上でクリフォード演算子として効率的に表現できるという意味では古典的である。 古典的なデコーダは、完全な量子カオスがなければ、古典的なコンピュータでは効率的にシミュレートできないランダムなユニタリによってスクランブルされた情報の1つを忠実に検索できる。 この結果は、量子ユニタリのサルエント性質を古典形式に学習することができ、量子カオスの意味に新しい光を当てることを示している。

Scrambling of quantum information is an important feature at the root of randomization and benchmarking protocols, the onset of quantum chaos, and black-hole physics. Unscrambling this information is possible given perfect knowledge of the scrambler[arXiv:1710.03363]. We show that one can retrieve the scrambled information even without any previous knowledge of the scrambler, by a learning algorithm that allows the building of an efficient decoder. Remarkably, the decoder is classical in the sense that it can be efficiently represented on a classical computer as a Clifford operator. It is striking that a classical decoder can retrieve with fidelity one all the information scrambled by a random unitary that cannot be efficiently simulated on a classical computer, as long as there is no full-fledged quantum chaos. This result shows that one can learn the salient properties of quantum unitaries in a classical form, and sheds a new light on the meaning of quantum chaos.
翻訳日:2023-01-09 04:42:44 公開日:2022-12-23
# クロスドメイン消費者レビュー分析

Cross-Domain Consumer Review Analysis ( http://arxiv.org/abs/2212.13916v1 )

ライセンス: Link先を確認
Aditya Pandey, Kunal Joshi(参考訳) この論文は、amazon、yelp、steam、imdbの4つの人気のあるレビューデータセットについて、クロスドメインレビュー分析を行う。 この分析はhadoopとsparkを使って行われ、大規模なデータセットの効率的でスケーラブルな処理を可能にする。 これら4つのオンラインフォーラムのレビューを1200万件近く調べることで、今後数年間のセールスと顧客感情の興味深いトレンドを明らかにしたいと考えています。 分析には、レビュー数とその時間的分布についての研究に加えて、アップボイト、作成時間、評価、感情など、さまざまなレビュー属性の関係について調べる。 さまざまなドメインのレビューを比較することで、さまざまな製品カテゴリにおける顧客満足度とエンゲージメントを促進する要因に関する洞察を得たいと考えています。

The paper presents a cross-domain review analysis on four popular review datasets: Amazon, Yelp, Steam, IMDb. The analysis is performed using Hadoop and Spark, which allows for efficient and scalable processing of large datasets. By examining close to 12 million reviews from these four online forums, we hope to uncover interesting trends in sales and customer sentiment over the years. Our analysis will include a study of the number of reviews and their distribution over time, as well as an examination of the relationship between various review attributes such as upvotes, creation time, rating, and sentiment. By comparing the reviews across different domains, we hope to gain insight into the factors that drive customer satisfaction and engagement in different product categories.
翻訳日:2023-01-01 14:17:03 公開日:2022-12-23
# センサによる人間活動認識におけるLSTMの簡易かつ驚くほど効果的な訓練方法

Simple Yet Surprisingly Effective Training Strategies for LSTMs in Sensor-Based Human Activity Recognition ( http://arxiv.org/abs/2212.13918v1 )

ライセンス: Link先を確認
Shuai Shao, Yu Guan, Xin Guan, Paolo Missier, Thomas Ploetz(参考訳) HAR(Human Activity Recognition)は、モバイルおよびウェアラブルコンピューティングにおける中核研究分野の一つである。 CNNのようなディープラーニング(DL)技術の適用により、周期的あるいは静的な活動(歩行、嘘、サイクリングなど)を認識することが、よく研究されている問題となっている。 しかし、依然として大きな課題は散発的活動認識(sar)の問題であり、興味のある活動は周期的ではなく、しばしば大量の無関係な背景活動と比較した場合に発生する頻度が低くなる。 近年の研究では,非周期的な振る舞いをモデル化するための逐次DLモデル(LSTMなど)が大きな可能性を示唆し,SARのためのLSTMトレーニング戦略について検討した。 具体的には,2つのSARシナリオに対して,遅延モデルと逆モデルという2つの単純かつ効果的なLSTM変種を提案する。 時間クリティカルなSARのために、遅延モデルは、事前に定義された遅延間隔を文脈情報として効果的に利用し、性能を向上させる。 通常のSARタスクでは,2番目の逆モデルでは時系列からパターンを逆の方法で学習することが可能で,前向きモデル(LSTM)と相補的であり,両者を組み合わせることで性能が向上する。 これら2つのLSTM変種は非常に実用的であり、LSTM基本を変更せずに訓練戦略とみなすことができる。 また,さらに精度を向上させるためのlstmトレーニング戦略についても検討した。 我々は,2つのSARデータセットと1つの非SARデータセットを用いてモデル評価を行い,提案手法の有効性を実証した。

Human Activity Recognition (HAR) is one of the core research areas in mobile and wearable computing. With the application of deep learning (DL) techniques such as CNN, recognizing periodic or static activities (e.g, walking, lying, cycling, etc.) has become a well studied problem. What remains a major challenge though is the sporadic activity recognition (SAR) problem, where activities of interest tend to be non periodic, and occur less frequently when compared with the often large amount of irrelevant background activities. Recent works suggested that sequential DL models (such as LSTMs) have great potential for modeling nonperiodic behaviours, and in this paper we studied some LSTM training strategies for SAR. Specifically, we proposed two simple yet effective LSTM variants, namely delay model and inverse model, for two SAR scenarios (with and without time critical requirement). For time critical SAR, the delay model can effectively exploit predefined delay intervals (within tolerance) in form of contextual information for improved performance. For regular SAR task, the second proposed, inverse model can learn patterns from the time series in an inverse manner, which can be complementary to the forward model (i.e.,LSTM), and combining both can boost the performance. These two LSTM variants are very practical, and they can be deemed as training strategies without alteration of the LSTM fundamentals. We also studied some additional LSTM training strategies, which can further improve the accuracy. We evaluated our models on two SAR and one non-SAR datasets, and the promising results demonstrated the effectiveness of our approaches in HAR applications.
翻訳日:2023-01-01 14:16:51 公開日:2022-12-23
# xfbd: 集中型ビル被害データセットと分析

xFBD: Focused Building Damage Dataset and Analysis ( http://arxiv.org/abs/2212.13876v1 )

ライセンス: Link先を確認
Dennis Melamed, Cameron Johnson, Chen Zhao, Russell Blue, Philip Morrone, Anthony Hoogs, Brian Clipp(参考訳) xView2コンペティションとxBDデータセットは、ビルの損傷検出のオーバーヘッドを大幅に向上させたが、コンペティションのピクセルレベルスコアは、建物の密集したクラスタや非形式的なコンテキストを持つ領域でのソリューションパフォーマンスを低下させる可能性がある。 我々は,災害復旧のための建物の自動被害評価を,当初のxView2コンペティションに補助的課題を提案することで進める。 この新たな課題は、損傷がxBDよりも局所的で制限された場合のソリューションパフォーマンスを示す新しいデータセットとメトリクスである。 本課題は,建物の環境に過度に依存することなく,個々の建物とその被害レベルを識別できるネットワークの能力を測定することである。 この課題に成功する方法は、元のxView2ソリューションよりもきめ細かい、正確な損傷情報を提供する。 xView2ネットワークの性能は、新しい限定的/局所的な損傷検出タスクで著しく低下した。 一般的な失敗の原因は、(1)建築物とその分類がうまく分離されていないこと、(2)その場合、周囲の建物や他の損傷状況によって分類が強く偏っていることである。 そこで、私たちは、オブジェクトの独立性と分離性をテストするために、オブジェクトレベルの評価指標 https://gitlab.kitware.com/dennis.melamed/xfbdを追加して、データセットの拡張バージョンをリリースしました。 また,建物損傷予測の独立性と分離性を向上させる新しいベースラインモデルの実験を行った。 結果から,損傷検出は完全解決された問題ではなく,データセットの拡張やメトリクスの使用と構築を他の人に依頼した。

The xView2 competition and xBD dataset spurred significant advancements in overhead building damage detection, but the competition's pixel level scoring can lead to reduced solution performance in areas with tight clusters of buildings or uninformative context. We seek to advance automatic building damage assessment for disaster relief by proposing an auxiliary challenge to the original xView2 competition. This new challenge involves a new dataset and metrics indicating solution performance when damage is more local and limited than in xBD. Our challenge measures a network's ability to identify individual buildings and their damage level without excessive reliance on the buildings' surroundings. Methods that succeed on this challenge will provide more fine-grained, precise damage information than original xView2 solutions. The best-performing xView2 networks' performances dropped noticeably in our new limited/local damage detection task. The common causes of failure observed are that (1) building objects and their classifications are not separated well, and (2) when they are, the classification is strongly biased by surrounding buildings and other damage context. Thus, we release our augmented version of the dataset with additional object-level scoring metrics https://gitlab.kitware.com/dennis.melamed/xfbd to test independence and separability of building objects, alongside the pixel-level performance metrics of the original competition. We also experiment with new baseline models which improve independence and separability of building damage predictions. Our results indicate that building damage detection is not a fully-solved problem, and we invite others to use and build on our dataset augmentations and metrics.
翻訳日:2023-01-01 14:08:11 公開日:2022-12-23
# シンボリックとサブシンボリックを組み合わせたサイバー攻撃の検出, 説明, フィルタリング

Detection, Explanation and Filtering of Cyber Attacks Combining Symbolic and Sub-Symbolic Methods ( http://arxiv.org/abs/2212.13991v1 )

ライセンス: Link先を確認
Anna Himmelhuber, Dominik Dold, Stephan Grimm, Sonja Zillner, Thomas Runkler(参考訳) グラフ構造化データの機械学習(ml)は最近、サイバーセキュリティ領域における侵入検出のコンテキストに対する関心が深まっている。 監視ツールによって生成されるデータの量の増加と、より高度な攻撃により、これらのMLメソッドは勢いを増している。 知識グラフとその対応する学習技術であるグラフニューラルネットワーク(GNN)は、人間の理解可能な語彙を使って複数のドメインからデータをシームレスに統合する能力を持ち、サイバーセキュリティドメインに応用されている。 しかし、他のコネクショナリストモデルと同様に、GNNは意思決定において透明性を欠いている。 これは特に重要であり、サイバーセキュリティドメインには多くの偽陽性のアラートがあり、ドメインの専門家がトリアージを行う必要があり、多くの人的権限を必要とする。 そこで,我々は,ドメイン知識を取り入れたサイバーセキュリティ分野において,シンボル的およびサブシンボル的手法を組み合わせることで,信頼管理を強化するために,GNNのための説明可能なAI(XAI)に取り組んでいる。 産業デモシステムでの説明を生成することによって,このアプローチを実験した。 提案手法は,様々なシナリオに対するアラートに対する直感的な説明を生成する。 説明はアラートに関する深い洞察を提供するだけでなく、偽陽性の警告を66%、忠実度メトリックを含めると93%減少させる。

Machine learning (ML) on graph-structured data has recently received deepened interest in the context of intrusion detection in the cybersecurity domain. Due to the increasing amounts of data generated by monitoring tools as well as more and more sophisticated attacks, these ML methods are gaining traction. Knowledge graphs and their corresponding learning techniques such as Graph Neural Networks (GNNs) with their ability to seamlessly integrate data from multiple domains using human-understandable vocabularies, are finding application in the cybersecurity domain. However, similar to other connectionist models, GNNs are lacking transparency in their decision making. This is especially important as there tend to be a high number of false positive alerts in the cybersecurity domain, such that triage needs to be done by domain experts, requiring a lot of man power. Therefore, we are addressing Explainable AI (XAI) for GNNs to enhance trust management by exploring combining symbolic and sub-symbolic methods in the area of cybersecurity that incorporate domain knowledge. We experimented with this approach by generating explanations in an industrial demonstrator system. The proposed method is shown to produce intuitive explanations for alerts for a diverse range of scenarios. Not only do the explanations provide deeper insights into the alerts, but they also lead to a reduction of false positive alerts by 66% and by 93% when including the fidelity metric.
翻訳日:2023-01-01 14:06:23 公開日:2022-12-23
# ディープラーニングを用いたハイブリッドエネルギーパッケージの新しいSOC推定法

A Novel SOC Estimation for Hybrid Energy Pack using Deep Learning ( http://arxiv.org/abs/2212.12607v1 )

ライセンス: Link先を確認
Chigozie Uzochukwu Udeogu(参考訳) 電気自動車(EV)のハイブリッドエネルギー貯蔵システム(HESS)における複合エネルギー貯蔵装置の充電状態(SOC)の推定は、EVの性能向上に不可欠である。 EVの複雑で可変な充電および放電電流は、正確なSOC推定を困難にしている。 本稿では,非線形自己回帰型外因性入力ニューラルネットワーク(NARXNN)に基づくリチウムイオン電池・スーパーキャパシタHESS EVの深層学習に基づくSOC推定手法を提案する。 NARXNNは、電気自動車のリチウムイオン電池とスーパーキャパシタの複雑な非線形挙動を捉え、克服するために使用される。 その結果,SOC推定精度は平均91.5%向上し,誤差値は0.1%以下であり,消費時間を11.4%削減した。 したがって,提案手法の有効性とロバスト性を検証した。

Estimating the state of charge (SOC) of compound energy storage devices in the hybrid energy storage system (HESS) of electric vehicles (EVs) is vital in improving the performance of the EV. The complex and variable charging and discharging current of EVs makes an accurate SOC estimation a challenge. This paper proposes a novel deep learning-based SOC estimation method for lithium-ion battery-supercapacitor HESS EV based on the nonlinear autoregressive with exogenous inputs neural network (NARXNN). The NARXNN is utilized to capture and overcome the complex nonlinear behaviors of lithium-ion batteries and supercapacitors in EVs. The results show that the proposed method improved the SOC estimation accuracy by 91.5% on average with error values below 0.1% and reduced consumption time by 11.4%. Hence validating both the effectiveness and robustness of the proposed method.
翻訳日:2022-12-27 15:45:01 公開日:2022-12-23
# 学習に基づくマルチエージェント意思決定手法

A learning-based approach to multi-agent decision-making ( http://arxiv.org/abs/2212.12561v1 )

ライセンス: Link先を確認
Filippo Fabiani, Alberto Bemporad(参考訳) 本稿では,対話エージェントの集団が保持する個人情報を再構築し,基礎となるマルチエージェントインタラクションプロセスの正確な結果を予測するための学習に基づく手法を提案する。 本稿では,学習手順を具備した外部観測者に対して,個別のアクション・アクション・マッピングによるクエリ作成とエージェントの反応の観察を可能とし,その集合的固定点が定常プロファイルに対応するシナリオを想定する。 スマートクエリプロセスを用いて、反復的にデータを収集し、パラメトリック推定を更新することにより、提案手法の漸近特性を評価するのに十分な条件を確立し、収束が発生した場合、定常動作プロファイルにのみ対応できるようにした。 この事実は2つの大きな結果をもたらします 一 外部の観察者がその予測タスクを成功させることができる行動対応マッピングの局所的実行代行を学習すること。 二 定型プロファイルの存在が保証されないような仮定を定め、従って、確立された十分な条件は、当該望まれるプロファイルの存在の証明書としても機能する。 典型的な競合型マルチエージェント制御と意思決定問題を含む広範な数値シミュレーションにより,提案手法の有効性が示された。

We propose a learning-based methodology to reconstruct private information held by a population of interacting agents in order to predict an exact outcome of the underlying multi-agent interaction process, here identified as a stationary action profile. We envision a scenario where an external observer, endowed with a learning procedure, is allowed to make queries and observe the agents' reactions through private action-reaction mappings, whose collective fixed point corresponds to a stationary profile. By adopting a smart query process to iteratively collect sensible data and update parametric estimates, we establish sufficient conditions to assess the asymptotic properties of the proposed learning-based methodology so that, if convergence happens, it can only be towards a stationary action profile. This fact yields two main consequences: i) learning locally-exact surrogates of the action-reaction mappings allows the external observer to succeed in its prediction task, and ii) working with assumptions so general that a stationary profile is not even guaranteed to exist, the established sufficient conditions hence act also as certificates for the existence of such a desirable profile. Extensive numerical simulations involving typical competitive multi-agent control and decision making problems illustrate the practical effectiveness of the proposed learning-based approach.
翻訳日:2022-12-27 15:42:58 公開日:2022-12-23
# SuperGF:ビジュアルローカライゼーションのためのローカル機能とグローバル機能の統合

SuperGF: Unifying Local and Global Features for Visual Localization ( http://arxiv.org/abs/2212.13105v1 )

ライセンス: Link先を確認
Wenzheng Song, Ran Yan, Boshu Lei, Takayuki Okatani(参考訳) 高度な視覚的ローカライゼーション技術は、画像検索の課題と、階層的ローカライゼーションのような6自由度カメラのポーズ推定を含む。 したがって、入力画像からグローバルおよびローカルな特徴を抽出する必要がある。 従来は、組み合わせパイプラインやマルチタスク蒸留など、資源集約的あるいは精度の低下手段によって実現されてきた。 本研究では,視覚的局所化のための局所的特徴とグローバルな特徴を効果的に統一し,局所化精度と計算効率のトレードオフを高めるSuperGFという手法を提案する。 具体的には、SuperGFは、画像マッチング固有の局所的特徴を直接操作し、検索のためのグローバルな特徴を生成するトランスフォーマーベースの集約モデルである。 提案手法の精度と効率の両面から実験的評価を行い,他の手法に対する利点を実証した。 また,高密度でスパースな学習ベースや手作りの記述子など,様々なローカル特徴を用いたSuperGFの実装も提供する。

Advanced visual localization techniques encompass image retrieval challenges and 6 Degree-of-Freedom (DoF) camera pose estimation, such as hierarchical localization. Thus, they must extract global and local features from input images. Previous methods have achieved this through resource-intensive or accuracy-reducing means, such as combinatorial pipelines or multi-task distillation. In this study, we present a novel method called SuperGF, which effectively unifies local and global features for visual localization, leading to a higher trade-off between localization accuracy and computational efficiency. Specifically, SuperGF is a transformer-based aggregation model that operates directly on image-matching-specific local features and generates global features for retrieval. We conduct experimental evaluations of our method in terms of both accuracy and efficiency, demonstrating its advantages over other methods. We also provide implementations of SuperGF using various types of local features, including dense and sparse learning-based or hand-crafted descriptors.
翻訳日:2022-12-27 14:41:25 公開日:2022-12-23
# 薬物発見の科学を前進させるためにaiがどう変えるべきか

On How AI Needs to Change to Advance the Science of Drug Discovery ( http://arxiv.org/abs/2212.12560v1 )

ライセンス: Link先を確認
Kieran Didi and Matej Ze\v{c}evi\'c(参考訳) ai for scienceに関する研究は、タンパク質構造予測のような長年の課題にもかかわらず、過去10年間のディープラーニングモデルの台頭以来、大きな成功を収めている。 しかし、この迅速な開発は必然的にその欠陥を明白にした -- 特に原因と影響の関係を理解することが重要である推論の領域において。 そのような領域の1つは薬物発見であり、そのような理解は散発的な相関に悩まされるデータを理解するために必要である。 突発性は、生命科学におけるデータ量の増加が続いている傾向によって悪化するだけであり、それによって研究者は病気の生物学を理解し、より良い治療を行う能力を制限する。 したがって、AIによる薬物発見の科学を前進させるためには、因果関係の言語における重要な問題を定式化する必要がある。 本稿では,因果的薬物発見を因果的推論における薬物発見の過程を基盤としたモデル作成手法として提示する。

Research around AI for Science has seen significant success since the rise of deep learning models over the past decade, even with longstanding challenges such as protein structure prediction. However, this fast development inevitably made their flaws apparent -- especially in domains of reasoning where understanding the cause-effect relationship is important. One such domain is drug discovery, in which such understanding is required to make sense of data otherwise plagued by spurious correlations. Said spuriousness only becomes worse with the ongoing trend of ever-increasing amounts of data in the life sciences and thereby restricts researchers in their ability to understand disease biology and create better therapeutics. Therefore, to advance the science of drug discovery with AI it is becoming necessary to formulate the key problems in the language of causality, which allows the explication of modelling assumptions needed for identifying true cause-effect relationships. In this attention paper, we present causal drug discovery as the craft of creating models that ground the process of drug discovery in causal reasoning.
翻訳日:2022-12-27 14:24:32 公開日:2022-12-23
# 連続因果抽象化

Continual Causal Abstractions ( http://arxiv.org/abs/2212.12575v1 )

ライセンス: Link先を確認
Matej Ze\v{c}evi\'c and Moritz Willig and Jonas Seng and Florian Peter Busch(参考訳) 本稿では,今後の研究の方向性として,因果的抽象化の継続的な更新について論じる。 重要なアイデアは、既存のレベルの因果抽象を、観察されたデータの履歴と一致し、与えられたタスクの解決により効果的である異なる詳細レベルに修正することである。

This short paper discusses continually updated causal abstractions as a potential direction of future research. The key idea is to revise the existing level of causal abstraction to a different level of detail that is both consistent with the history of observed data and more effective in solving a given task.
翻訳日:2022-12-27 14:24:06 公開日:2022-12-23
# マニフォールドニューラルネットワークの収束率

A Convergence Rate for Manifold Neural Networks ( http://arxiv.org/abs/2212.12606v1 )

ライセンス: Link先を確認
Joyce Chew and Deanna Needell and Michael Perlmutter(参考訳) 幾何深層学習の急速に発展する分野は、グラフや多様体のような非ユークリッド領域でそのようなデータを解析するためのニューラルネットワークアーキテクチャの開発を目指している。 Z. Wang, L. Ruiz, A. Ribeiroの最近の研究は、ラプラスベルトラミ作用素のスペクトル分解を用いて多様体ニューラルネットワークを構築する方法を紹介している。 さらに,本研究では,多様体が未知かつ有限個のサンプル点しかアクセスできない場合に,そのようなニューラルネットワークを実装するための数値スキームを提案する。 著者らは、データ駆動グラフの構築に依存するこのスキームは、標本点の数が無限になるにつれて連続限界に収束することを示した。 ここでは、多様体の内在次元に依存するが、周囲次元とは独立な収束率を確立することにより、この結果の上に構築する。 また,収束速度は,ネットワークの深さと各層で使用されるフィルタ数にどのように依存するかについても検討した。

High-dimensional data arises in numerous applications, and the rapidly developing field of geometric deep learning seeks to develop neural network architectures to analyze such data in non-Euclidean domains, such as graphs and manifolds. Recent work by Z. Wang, L. Ruiz, and A. Ribeiro has introduced a method for constructing manifold neural networks using the spectral decomposition of the Laplace Beltrami operator. Moreover, in this work, the authors provide a numerical scheme for implementing such neural networks when the manifold is unknown and one only has access to finitely many sample points. The authors show that this scheme, which relies upon building a data-driven graph, converges to the continuum limit as the number of sample points tends to infinity. Here, we build upon this result by establishing a rate of convergence that depends on the intrinsic dimension of the manifold but is independent of the ambient dimension. We also discuss how the rate of convergence depends on the depth of the network and the number of filters used in each layer.
翻訳日:2022-12-27 14:17:02 公開日:2022-12-23
# ニューラルトランジッションに基づくライブラリー非推奨のパース

Neural Transition-based Parsing of Library Deprecations ( http://arxiv.org/abs/2212.12584v1 )

ライセンス: Link先を確認
Petr Babkin, Nacho Navarro, Salwa Alamir, Sameena Shah(参考訳) 本稿では,オープンソースライブラリの非推奨api利用を,リリースノートを解析して修正するためのコード更新の自動化という課題に取り組む。 まず、WebクローラサービスがWebから非推奨のドキュメンテーションを検索し、次に特別に構築されたパーザがそれらのテキストドキュメントを木構造表現に処理し、最後に、クライアントIDEプラグインが指定されたコードベースで非推奨のライブラリの使用を特定および修正します。 特に本論文の焦点は解析要素である。 古典的特徴設計による分類器とニューラルネットワークエンコーダという2つの変種に新しいトランジッションベースのパーサを導入する。 提案手法の有効性を確認するために,pythonデータサイエンスライブラリ7つから426個のapiの非推奨を収集,ラベル付けし,非自明なニューラルマシン翻訳ベースラインよりも決定的に優れる手法を実証した。

This paper tackles the challenging problem of automating code updates to fix deprecated API usages of open source libraries by analyzing their release notes. Our system employs a three-tier architecture: first, a web crawler service retrieves deprecation documentation from the web; then a specially built parser processes those text documents into tree-structured representations; finally, a client IDE plugin locates and fixes identified deprecated usages of libraries in a given codebase. The focus of this paper in particular is the parsing component. We introduce a novel transition-based parser in two variants: based on a classical feature engineered classifier and a neural tree encoder. To confirm the effectiveness of our method, we gathered and labeled a set of 426 API deprecations from 7 well-known Python data science libraries, and demonstrated our approach decisively outperforms a non-trivial neural machine translation baseline.
翻訳日:2022-12-27 14:15:55 公開日:2022-12-23
# 説明可能性を超えたニューラルネットワーク:シーケンスモチーフの選択的推論

Neural Networks beyond explainability: Selective inference for sequence motifs ( http://arxiv.org/abs/2212.12542v1 )

ライセンス: Link先を確認
Antoine Villi\'e, Philippe Veber, Yohann de Castro, Laurent Jacob(参考訳) 過去10年間、ニューラルネットワークは、特に規制ゲノム学の文脈において、生物学的配列から予測することに成功した。 ディープラーニングの他の分野と同様に、トレーニングされたネットワークによる予測を説明するシーケンスモチーフなどの特徴を抽出するツールが考案されている。 ここでは、説明可能な機械学習を超えて、抽出した特徴と予測表現型との関連性をテストするための選択推論手法SEISMを導入する。 特に、一層畳み込みネットワークのトレーニングが、ある連想スコアを最大化するモチーフの選択と形式的に同等であるかについて議論する。 我々は、この選択を無限集合から大きくても有限な格子に量子化することで、既存のサンプリングベース選択推論手法を適用する。 最後に、特定のパラメータの選択の下でサンプリングすることは、選択推論に一般的に使用される複合ヌル仮説を特徴付けるのに十分であることを示す。 キャリブレーション, パワー, スピードの観点から本手法の挙動を解説し, より単純なデータ分割戦略でその電力/速度トレードオフについて議論する。 seismは、制御ゲノミクスで使用されるニューラルネットワークのより簡単な分析と、ゲノムワイドアソシエーション研究(gwas)のためのより強力な方法への道を開く。

Over the past decade, neural networks have been successful at making predictions from biological sequences, especially in the context of regulatory genomics. As in other fields of deep learning, tools have been devised to extract features such as sequence motifs that can explain the predictions made by a trained network. Here we intend to go beyond explainable machine learning and introduce SEISM, a selective inference procedure to test the association between these extracted features and the predicted phenotype. In particular, we discuss how training a one-layer convolutional network is formally equivalent to selecting motifs maximizing some association score. We adapt existing sampling-based selective inference procedures by quantizing this selection over an infinite set to a large but finite grid. Finally, we show that sampling under a specific choice of parameters is sufficient to characterize the composite null hypothesis typically used for selective inference-a result that goes well beyond our particular framework. We illustrate the behavior of our method in terms of calibration, power and speed and discuss its power/speed trade-off with a simpler data-split strategy. SEISM paves the way to an easier analysis of neural networks used in regulatory genomics, and to more powerful methods for genome wide association studies (GWAS).
翻訳日:2022-12-27 14:06:41 公開日:2022-12-23
# AUCに基づく公正制約を考慮したAUC最適化のための確率的手法

Stochastic Methods for AUC Optimization subject to AUC-based Fairness Constraints ( http://arxiv.org/abs/2212.12603v1 )

ライセンス: Link先を確認
Yao Yao, Qihang Lin, Tianbao Yang(参考訳) 機械学習がハイテイクな意思決定にますます使われるようになるにつれ、不公平なAIシステムを避けることが、保護された人口に対する差別的な決定につながる。 公平な予測モデルを得るための直接的なアプローチは、フェアネス制約に基づく予測性能を最適化することでモデルを訓練することであり、フェアネスに対するパフォーマンスのトレードオフ時にパレート効率を達成する。 ROC曲線(AUC)の下の領域に基づく尺度は, しきい値に依存せず, バランスの取れていないデータに対して有効であることから, 最近出現している。 本研究では、AUCに基づくフェアネス制約のクラスを対象とするAUC最適化問題として、フェアネスを考慮した機械学習モデルのトレーニング問題を定式化する。 この問題をmin-max制約付きmin-max最適化問題として再構成することができ、この問題の特殊構造のために設計された新しいブレグマン分岐に基づく確率的一階法によって解くことができる。 公平度指標の異なる実世界データに対する提案手法の有効性を数値的に示す。

As machine learning being used increasingly in making high-stakes decisions, an arising challenge is to avoid unfair AI systems that lead to discriminatory decisions for protected population. A direct approach for obtaining a fair predictive model is to train the model through optimizing its prediction performance subject to fairness constraints, which achieves Pareto efficiency when trading off performance against fairness. Among various fairness metrics, the ones based on the area under the ROC curve (AUC) are emerging recently because they are threshold-agnostic and effective for unbalanced data. In this work, we formulate the training problem of a fairness-aware machine learning model as an AUC optimization problem subject to a class of AUC-based fairness constraints. This problem can be reformulated as a min-max optimization problem with min-max constraints, which we solve by stochastic first-order methods based on a new Bregman divergence designed for the special structure of the problem. We numerically demonstrate the effectiveness of our approach on real-world data under different fairness metrics.
翻訳日:2022-12-27 14:06:21 公開日:2022-12-23
# 地上および空中の収集プラットフォームにおける熱画像統合と物体検出手法の評価

Assessing thermal imagery integration into object detection methods on ground-based and air-based collection platforms ( http://arxiv.org/abs/2212.12616v1 )

ライセンス: Link先を確認
James Gallagher, Edward Oughton(参考訳) 無人航空機システム(UAS)に通常デプロイされる物体検出モデルは、赤緑色(RGB)画像を用いた可視光スペクトル中の物体の識別に重点を置いている。 しかし、オブジェクト検出機械学習(ML)モデルの性能を高めるために、熱長波赤外線(LWIR)画像とRGBを融合することへの関心が高まっている。 現在、LWIR MLモデルは、特に地上プラットフォームと空中プラットフォームの両方で研究の注目を集めておらず、LWIR、RGB、LWIR-RGB融合オブジェクト検出モデルを評価するベースラインパフォーマンス指標が欠如している。 そこで本研究では,このような量的指標を文献に貢献する。 その結果、地上混合RGB-LWIRモデルは、RGBまたはLWIRアプローチよりも優れた性能を示し、98.4%のmAPを達成した。 さらに、RGB-LWIRのブレンドモデルは、昼と夜の両方で機能する唯一のオブジェクト検出モデルであり、優れた操作機能を提供する。 本研究は、地上および地上プラットフォームから収集したRGB, LWIR, RGB-LWIR融合画像用の12,600枚のラベル付きトレーニングデータセットを新たに提供し、さらに多スペクトル機械駆動物体検出研究を可能にする。

Object detection models commonly deployed on uncrewed aerial systems (UAS) focus on identifying objects in the visible spectrum using Red-Green-Blue (RGB) imagery. However, there is growing interest in fusing RGB with thermal long wave infrared (LWIR) images to increase the performance of object detection machine learning (ML) models. Currently LWIR ML models have received less research attention, especially for both ground- and air-based platforms, leading to a lack of baseline performance metrics evaluating LWIR, RGB and LWIR-RGB fused object detection models. Therefore, this research contributes such quantitative metrics to the literature .The results found that the ground-based blended RGB-LWIR model exhibited superior performance compared to the RGB or LWIR approaches, achieving a mAP of 98.4%. Additionally, the blended RGB-LWIR model was also the only object detection model to work in both day and night conditions, providing superior operational capabilities. This research additionally contributes a novel labelled training dataset of 12,600 images for RGB, LWIR, and RGB-LWIR fused imagery, collected from ground-based and air-based platforms, enabling further multispectral machine-driven object detection research.
翻訳日:2022-12-27 13:59:16 公開日:2022-12-23
# ゼロサム情報ゲームにおけるゲームツリーへの適応

Adapting to game trees in zero-sum imperfect information games ( http://arxiv.org/abs/2212.12567v1 )

ライセンス: Link先を確認
C\^ome Fiegel, Pierre M\'enard, Tadashi Kozuno, R\'emi Munos, Vianney Perchet, Michal Valko(参考訳) 不完全な情報ゲーム(IIG)は、各プレイヤーが現在の遊技状態を部分的に観察するゲームである。 我々は,軌道フィードバックを伴うセルフプレイによるゼロサムiigにおける$\epsilon$-optimal戦略の学習法について検討する。 問題に依存しない下界 $\mathcal{O}(H(A_{\mathcal{X}}+B_{\mathcal{Y}}))/\epsilon^2)$ をこれらの戦略を高い確率で学習するために必要な実現数に対して与え、$H$ はゲームの長さ、$A_{\mathcal{X}}$ と $B_{\mathcal{Y}}$ は2人のプレイヤーのアクションの総数である。 また、この設定のための正規化リーダー(ftrl)アルゴリズムを2つ提案する: この下限に一致するが、正規化を定義するために事前に情報集合構造の知識を必要とする balanced-ftrl と、観察に漸進的に正規化を適応させることで、この要件を満たさずにプレイする$\mathcal{o}(h^2(a_{\mathcal{x}}+b_{\mathcal{y}})/\epsilon^2)$ である。

Imperfect information games (IIG) are games in which each player only partially observes the current game state. We study how to learn $\epsilon$-optimal strategies in a zero-sum IIG through self-play with trajectory feedback. We give a problem-independent lower bound $\mathcal{O}(H(A_{\mathcal{X}}+B_{\mathcal{Y}})/\epsilon^2)$ on the required number of realizations to learn these strategies with high probability, where $H$ is the length of the game, $A_{\mathcal{X}}$ and $B_{\mathcal{Y}}$ are the total number of actions for the two players. We also propose two Follow the Regularize leader (FTRL) algorithms for this setting: Balanced-FTRL which matches this lower bound, but requires the knowledge of the information set structure beforehand to define the regularization; and Adaptive-FTRL which needs $\mathcal{O}(H^2(A_{\mathcal{X}}+B_{\mathcal{Y}})/\epsilon^2)$ plays without this requirement by progressively adapting the regularization to the observations.
翻訳日:2022-12-27 13:49:00 公開日:2022-12-23
# 拡散モデルはデータ多様体の次元をひそかに知っている

Your diffusion model secretly knows the dimension of the data manifold ( http://arxiv.org/abs/2212.12611v1 )

ライセンス: Link先を確認
Georgios Batzolis, Jan Stanczuk, Carola-Bibiane Sch\"onlieb(参考訳) 本研究では,訓練された拡散モデルを用いてデータ多様体の次元を推定する新しいフレームワークを提案する。 訓練された拡散モデルは、劣化のレベルが異なるため、ターゲット分布のノイズ分解バージョンのログ密度の勾配を近似する。 データが高次元の環境空間に埋め込まれた多様体の周りに集中すると、腐敗のレベルが減少すると、スコア関数は多様体に向けられ、この方向が最大ラキシブル増加の方向となる。 したがって、小さなレベルの腐敗に対して、拡散モデルはデータ多様体の正規バンドルの近似へのアクセスを提供する。 これにより、接空間の次元を推定できるので、データ多様体の内在次元を推定することができる。 制御実験では,PPCAなどの次元検出の線形手法よりも優れていた。

In this work, we propose a novel framework for estimating the dimension of the data manifold using a trained diffusion model. A trained diffusion model approximates the gradient of the log density of a noise-corrupted version of the target distribution for varying levels of corruption. If the data concentrates around a manifold embedded in the high-dimensional ambient space, then as the level of corruption decreases, the score function points towards the manifold, as this direction becomes the direction of maximum likelihood increase. Therefore, for small levels of corruption, the diffusion model provides us with access to an approximation of the normal bundle of the data manifold. This allows us to estimate the dimension of the tangent space, thus, the intrinsic dimension of the data manifold. Our method outperforms linear methods for dimensionality detection such as PPCA in controlled experiments.
翻訳日:2022-12-27 13:48:27 公開日:2022-12-23
# 画像データの真珠因果階層:複雑さと課題

Pearl Causal Hierarchy on Image Data: Intricacies & Challenges ( http://arxiv.org/abs/2212.12570v1 )

ライセンス: Link先を確認
Matej Ze\v{c}evi\'c and Moritz Willig and Devendra Singh Dhami and Kristian Kersting(参考訳) 多くの研究者は、AI/ML研究の知的システムという究極の目標の足掛かりとして、パールの因果関係に関する反事実理論を支持している。 他の拡大するサブフィールドと同様に、忍耐は両方の分野から概念を統合するための大きな進歩には時間がかかるが、基礎的真理のベンチマークの欠如やコンピュータビジョンのような古典的問題に対する統一的な視点といった主要な課題は研究運動の勢いを阻害しているように見える。 本研究は, パール因果関係(Pearl Causal Hierarchy, PCH)を画像データ上でどのように理解できるかを, いくつかの複雑さに関する洞察を提供することによって実証する。

Many researchers have voiced their support towards Pearl's counterfactual theory of causation as a stepping stone for AI/ML research's ultimate goal of intelligent systems. As in any other growing subfield, patience seems to be a virtue since significant progress on integrating notions from both fields takes time, yet, major challenges such as the lack of ground truth benchmarks or a unified perspective on classical problems such as computer vision seem to hinder the momentum of the research movement. This present work exemplifies how the Pearl Causal Hierarchy (PCH) can be understood on image data by providing insights on several intricacies but also challenges that naturally arise when applying key concepts from Pearlian causality to the study of image data.
翻訳日:2022-12-27 13:41:12 公開日:2022-12-23
# 空間モデリングの概観:注意から進化へ

A Close Look at Spatial Modeling: From Attention to Convolution ( http://arxiv.org/abs/2212.12552v1 )

ライセンス: Link先を確認
Xu Ma, Huan Wang, Can Qin, Kunpeng Li, Xingchen Zhao, Jie Fu, Yun Fu(参考訳) ビジョントランスフォーマーは最近、洞察に富んだアーキテクチャ設計とアテンションメカニズムのために、多くのビジョンタスクに対して大きな約束をしました。 トランスフォーマーの自己注意応答を再考することにより,2つの興味深い問題を経験的に観察する。 まず、Vision Transformersは深い層でクエリ非関連な振る舞いを示し、アテンションマップはクエリパッチの位置(ヘッド非関連)に関わらず、グローバルスコープでほぼ一貫したコンテキストを示す。 第二に、注意マップは本質的に疎外であり、注意重みを左右するトークンはほとんどなく、ConvNetsからの知識の導入は、注意を円滑にし、パフォーマンスを高めるだろう。 上述の観察により、自己意図の定式化を一般化し、クエリ非関連なグローバルコンテキストを直接抽象化し、グローバルコンテキストを畳み込みにさらに統合する。 結果として得られたモデルであるFCViT(Fully Convolutional Vision Transformer)は、純粋に畳み込み層で構成され、動的特性、重み付け、短距離特徴モデリングなど、注意機構と畳み込みの両方の利点をしっかりと継承する。 実験結果はfcvitの有効性を示す。 FCViT-S12は14M未満のパラメータを持つため、ImageNet-1K上でのResT-Liteの精度は3.7%向上した。 FCViTを大規模モデルにスケールする場合、パラメータがさらに少ない従来のConvNeXtよりもパフォーマンスがよい。 FCViTベースのモデルは、オブジェクト検出、インスタンスセグメンテーション、セマンティックセグメンテーションといった下流タスクへの有望な転送可能性を示す。 コードとモデルは、https://github.com/ma-xu/fcvitで利用可能である。

Vision Transformers have shown great promise recently for many vision tasks due to the insightful architecture design and attention mechanism. By revisiting the self-attention responses in Transformers, we empirically observe two interesting issues. First, Vision Transformers present a queryirrelevant behavior at deep layers, where the attention maps exhibit nearly consistent contexts in global scope, regardless of the query patch position (also head-irrelevant). Second, the attention maps are intrinsically sparse, few tokens dominate the attention weights; introducing the knowledge from ConvNets would largely smooth the attention and enhance the performance. Motivated by above observations, we generalize self-attention formulation to abstract a queryirrelevant global context directly and further integrate the global context into convolutions. The resulting model, a Fully Convolutional Vision Transformer (i.e., FCViT), purely consists of convolutional layers and firmly inherits the merits of both attention mechanism and convolutions, including dynamic property, weight sharing, and short- and long-range feature modeling, etc. Experimental results demonstrate the effectiveness of FCViT. With less than 14M parameters, our FCViT-S12 outperforms related work ResT-Lite by 3.7% top1 accuracy on ImageNet-1K. When scaling FCViT to larger models, we still perform better than previous state-of-the-art ConvNeXt with even fewer parameters. FCViT-based models also demonstrate promising transferability to downstream tasks, like object detection, instance segmentation, and semantic segmentation. Codes and models are made available at: https://github.com/ma-xu/FCViT.
翻訳日:2022-12-27 13:30:07 公開日:2022-12-23
# トリプルトマッチングによる高速イベントベース光フロー推定

Fast Event-based Optical Flow Estimation by Triplet Matching ( http://arxiv.org/abs/2212.12218v1 )

ライセンス: Link先を確認
Shintaro Shiba and Yoshimitsu Aoki and Guillermo Gallego(参考訳) イベントカメラは、従来のカメラ(低レイテンシ、高ダイナミックレンジ、低電力など)よりも優れたバイオインスパイアされた新しいセンサーである。 イベントのパケットを扱う光フロー推定法は、精度のために速度をトレードオフするが、event-by-event (incremental) 法は強い仮定を持ち、フィールドの進捗を定量化する共通のベンチマークではテストされていない。 資源制約デバイスへの応用に向けて、高速で軽量で高精度な光フローアルゴリズムを開発することが重要である。 本研究は神経科学の知見を活用し,三重項マッチングに基づく新しい光フロー推定法を提案する。 公開ベンチマークにおける実験は、パケットベースのアルゴリズムと同等の結果を持つ複雑なシーンを扱う能力を示している。 さらに,提案手法は,推定に3つのイベントしか必要とせず,標準cpu上での最速実行時間(10khz以下)を実現する。 我々は,実世界のシナリオにおけるリアルタイム・インクリメンタルな動き推定手法と応用への扉を開くことを願っている。

Event cameras are novel bio-inspired sensors that offer advantages over traditional cameras (low latency, high dynamic range, low power, etc.). Optical flow estimation methods that work on packets of events trade off speed for accuracy, while event-by-event (incremental) methods have strong assumptions and have not been tested on common benchmarks that quantify progress in the field. Towards applications on resource-constrained devices, it is important to develop optical flow algorithms that are fast, light-weight and accurate. This work leverages insights from neuroscience, and proposes a novel optical flow estimation scheme based on triplet matching. The experiments on publicly available benchmarks demonstrate its capability to handle complex scenes with comparable results as prior packet-based algorithms. In addition, the proposed method achieves the fastest execution time (> 10 kHz) on standard CPUs as it requires only three events in estimation. We hope that our research opens the door to real-time, incremental motion estimation methods and applications in real-world scenarios.
翻訳日:2022-12-26 17:25:04 公開日:2022-12-23
# ベイズ脳の構成的説明のための数学的基礎

Mathematical Foundations for a Compositional Account of the Bayesian Brain ( http://arxiv.org/abs/2212.12538v1 )

ライセンス: Link先を確認
Toby St Clere Smithe(参考訳) この論文は、活発な推論とベイズ脳の構成的説明に向けた最初のステップを報告している。 具体的には、現代応用圏理論のツールを用いて、近似推論のための関手的意味論を提供する。 そのために、ベイズレンズの新しい概念である「シンタクティック」側で定義し、ベイズレンズの更新が構成レンズパターンに従って構成されることを示す。 ベイズレンズを用い,合成ゲーム理論に着想を得て統計ゲームのカテゴリを定義し,それらを統計推論の様々な問題を分類する。 一般開放力学系(特に決定論的、確率的、ランダム、離散的、連続時間)を多項式関手(英語版)のある種のコラージュとして新たに定式化し、モノイドのオピデックス付き圏(あるいは、一般化多項式関手(英語版)の多元圏(英語版)(multicategories for multicategories of generalized polynomial functors)にまとめる。 レンズを制御する動的システムと、我々の関門意味論のターゲットを提供するシステムである、シリアのモノイド双圏を定義するために、これらのオピニッジ付きカテゴリを使用する。 そこで我々は, 予測符号化ニューラルネットワークの双方向構成構造を自由エネルギー原理で説明し, 大脳皮質の双方向性に公式な数学的基盤を与える関手を構築した。 その過程で、線形回路図の多重カテゴリの代数を用いて、レートコードニューラルネットワークを構成する方法を説明し、その後、レンズと多項式関手によってこれを仮定することを示す。 カテゴリー理論は多くの計算神経科学者や認知科学者には馴染みがないため、我々は、我々が使用する全てのカテゴリー理論の構造と結果を明確にし、詳細で、親しみやすい説明をすることに努めてきた。

This dissertation reports some first steps towards a compositional account of active inference and the Bayesian brain. Specifically, we use the tools of contemporary applied category theory to supply functorial semantics for approximate inference. To do so, we define on the `syntactic' side the new notion of Bayesian lens and show that Bayesian updating composes according to the compositional lens pattern. Using Bayesian lenses, and inspired by compositional game theory, we define categories of statistical games and use them to classify various problems of statistical inference. On the `semantic' side, we present a new formalization of general open dynamical systems (particularly: deterministic, stochastic, and random; and discrete- and continuous-time) as certain coalgebras of polynomial functors, which we show collect into monoidal opindexed categories (or, alternatively, into algebras for multicategories of generalized polynomial functors). We use these opindexed categories to define monoidal bicategories of cilia: dynamical systems which control lenses, and which supply the target for our functorial semantics. Accordingly, we construct functors which explain the bidirectional compositional structure of predictive coding neural circuits under the free energy principle, thereby giving a formal mathematical underpinning to the bidirectionality observed in the cortex. Along the way, we explain how to compose rate-coded neural circuits using an algebra for a multicategory of linear circuit diagrams, showing subsequently that this is subsumed by lenses and polynomial functors. Because category theory is unfamiliar to many computational neuroscientists and cognitive scientists, we have made a particular effort to give clear, detailed, and approachable expositions of all the category-theoretic structures and results of which we make use.
翻訳日:2022-12-26 17:24:48 公開日:2022-12-23
# プロファイル押出金型形状最適化のための強化学習の検討

Investigation of reinforcement learning for shape optimization of profile extrusion dies ( http://arxiv.org/abs/2212.12207v1 )

ライセンス: Link先を確認
Clemens Fricke and Daniel Wolff and Marco Kemmerling and Stefanie Elgeti(参考訳) プロファイル押出し(profile extrusion)は、溶融ポリマーからプラスチックのプロファイルを作るための連続的な製造プロセスである。 特に興味深いのは、溶融をプレスして所望の形状となるダイスの設計である。 しかし、ダイ出口における不均質な速度分布や押出物内部の残留応力により、製造部の最終形状はしばしば所望の形状から逸脱する。 これらの偏差を避けるために、ダイの形状は計算的に最適化することができ、古典的最適化アプローチを用いて文献で既に研究されている。 形状最適化の分野における新しいアプローチは、学習に基づく最適化アルゴリズムとして強化学習(RL)を活用することである。 rlはエージェントと環境の試行錯誤の相互作用に基づいている。 各アクションに対して、エージェントは報奨を受け、環境の次の状態について通知される。 従来のグラデーションベースや進化型といった、単一の問題に対する最適化アルゴリズムよりも優れているとは限りませんが、エージェントが1つの問題に集中するのではなく最適な形状を生成するためのより一般的な戦略を学ぶため、同様の最適化タスクを繰り返す場合、rl技術は特にうまく機能することが期待されます。 本研究では,このアプローチを2つの2次元テストケースに適用して検討する。 フローチャネル幾何は、いわゆる自由形式変形(Free-Form deformation)を用いてRLエージェントによって修正することができ、計算メッシュを変換スプラインに埋め込む方法により、制御点位置に基づいて操作される。 特に,訓練中の複数の環境を利用して,異なるエージェントがトレーニングの進行と壁時間の削減に与える影響について検討した。

Profile extrusion is a continuous production process for manufacturing plastic profiles from molten polymer. Especially interesting is the design of the die, through which the melt is pressed to attain the desired shape. However, due to an inhomogeneous velocity distribution at the die exit or residual stresses inside the extrudate, the final shape of the manufactured part often deviates from the desired one. To avoid these deviations, the shape of the die can be computationally optimized, which has already been investigated in the literature using classical optimization approaches. A new approach in the field of shape optimization is the utilization of Reinforcement Learning (RL) as a learning-based optimization algorithm. RL is based on trial-and-error interactions of an agent with an environment. For each action, the agent is rewarded and informed about the subsequent state of the environment. While not necessarily superior to classical, e.g., gradient-based or evolutionary, optimization algorithms for one single problem, RL techniques are expected to perform especially well when similar optimization tasks are repeated since the agent learns a more general strategy for generating optimal shapes instead of concentrating on just one single problem. In this work, we investigate this approach by applying it to two 2D test cases. The flow-channel geometry can be modified by the RL agent using so-called Free-Form Deformation, a method where the computational mesh is embedded into a transformation spline, which is then manipulated based on the control-point positions. In particular, we investigate the impact of utilizing different agents on the training progress and the potential of wall time saving by utilizing multiple environments during training.
翻訳日:2022-12-26 17:24:16 公開日:2022-12-23
# クープマンオートエンコーダの固有値初期化と正規化

Eigenvalue initialisation and regularisation for Koopman autoencoders ( http://arxiv.org/abs/2212.12086v1 )

ライセンス: Link先を確認
Jack W. Miller, Charles O'Neill, Navid C. Constantinou, and Omri Azencot(参考訳) ニューラルネットワークのパラメータ行列の規則化は、深層モデルのトレーニングにおいてユビキタスである。 典型的な正規化アプローチでは、小さなランダム値を使ってウェイトを初期化し、ウェイトをペナライズしてスパーシティを促進する。 しかし、これらの広く使われている手法は特定のシナリオでは効果が低い可能性がある。 本稿では、エンコーダ、koopman演算子層、デコーダを含むkoopmanオートエンコーダモデルについて検討する。 これらのモデルは、解釈可能なダイナミクスと物理に関連した制約を組み込む能力で、物理学関連の問題に取り組むために設計され、研究されている。 しかし、既存の作業の大部分は標準の正規化プラクティスを採用している。 本研究では,物理関連設定に適した初期化とペナルティ方式により,クープマンオートエンコーダの強化を図る。 具体的には、特定の固有値分布から初期koopman演算子をサンプリングする"eigeninit"初期化スキームを提案する。 さらに,トレーニング中にkoopman演算子の固有値にペナルティを与える"eigenloss"ペナルティスキームを提案する。 これらのスキームは,2つの合成データ,すなわち駆動振子とシリンダーを過ぎる流れ,および海洋表面温度とサイクロン風場という実世界の問題に対して有効であることを示す。 これらのデータセットでは、eigenlossとeigeninitが収束率を最大5倍に向上させ、累積長期予測誤差を最大3倍に減少させることがわかった。 このような発見は、他の物理学関連のディープラーニングアプローチにおいて、帰納的バイアスとして同様のスキームを組み込むことの有用性を指摘する。

Regularising the parameter matrices of neural networks is ubiquitous in training deep models. Typical regularisation approaches suggest initialising weights using small random values, and to penalise weights to promote sparsity. However, these widely used techniques may be less effective in certain scenarios. Here, we study the Koopman autoencoder model which includes an encoder, a Koopman operator layer, and a decoder. These models have been designed and dedicated to tackle physics-related problems with interpretable dynamics and an ability to incorporate physics-related constraints. However, the majority of existing work employs standard regularisation practices. In our work, we take a step toward augmenting Koopman autoencoders with initialisation and penalty schemes tailored for physics-related settings. Specifically, we propose the "eigeninit" initialisation scheme that samples initial Koopman operators from specific eigenvalue distributions. In addition, we suggest the "eigenloss" penalty scheme that penalises the eigenvalues of the Koopman operator during training. We demonstrate the utility of these schemes on two synthetic data sets: a driven pendulum and flow past a cylinder; and two real-world problems: ocean surface temperatures and cyclone wind fields. We find on these datasets that eigenloss and eigeninit improves the convergence rate by up to a factor of 5, and that they reduce the cumulative long-term prediction error by up to a factor of 3. Such a finding points to the utility of incorporating similar schemes as an inductive bias in other physics-related deep learning approaches.
翻訳日:2022-12-26 17:21:18 公開日:2022-12-23
# 機械学習モデルによる舌癌患者の生存予測

Predicting Survival of Tongue Cancer Patients by Machine Learning Models ( http://arxiv.org/abs/2212.12114v1 )

ライセンス: Link先を確認
Angelos Vasilopoulos and Nan Miles Xi(参考訳) 舌癌は口と喉に発生する一般的な口腔悪性腫瘍である。 診断、治療、管理の改善に多くの努力が費やされてきた。 舌癌に対する外科的切除、化学療法、放射線療法が主要な治療である。 患者の生存は治療効果を決定する。 これまでの研究では、臨床変数と人口統計変数の間の複雑で非線形な関係を無視して、記述統計に基づく特定の生存率とリスク要因を特定してきた。 本研究では、5つの最先端機械学習モデルと臨床データを用いて治療後の舌癌患者の生存率を予測する。 5倍のクロスバリデーション,ブートストラップ解析,置換特性の重要さをモデル性能の推定・解釈に適用した。 本法で同定された予後因子は過去の臨床研究と一致している。 本手法は正確かつ解釈可能であり,舌癌治療および管理における追加的エビデンスとして有用である。

Tongue cancer is a common oral cavity malignancy that originates in the mouth and throat. Much effort has been invested in improving its diagnosis, treatment, and management. Surgical removal, chemotherapy, and radiation therapy remain the major treatment for tongue cancer. The survival of patients determines the treatment effect. Previous studies have identified certain survival and risk factors based on descriptive statistics, ignoring the complex, nonlinear relationship among clinical and demographic variables. In this study, we utilize five cutting-edge machine learning models and clinical data to predict the survival of tongue cancer patients after treatment. Five-fold cross-validation, bootstrap analysis, and permutation feature importance are applied to estimate and interpret model performance. The prognostic factors identified by our method are consistent with previous clinical studies. Our method is accurate, interpretable, and thus useable as additional evidence in tongue cancer treatment and management.
翻訳日:2022-12-26 17:20:51 公開日:2022-12-23
# Autothrottle: SLOがターゲットとするマイクロサービスからCPUをハーベスティングするための実践的なフレームワーク

Autothrottle: A Practical Framework for Harvesting CPUs from SLO-Targeted Microservices ( http://arxiv.org/abs/2212.12180v1 )

ライセンス: Link先を確認
Zibo Wang, Pinghe Li, Chieh-Jan Mike Liang, Feng Wu, Francis Y. Yan(参考訳) クラウドネイティブアプリケーションの分散サービス(あるいはマイクロサービス)の数が増えるにつれて、リソース管理は難しくなる。 当社のゴールは、アプリケーション遅延SLOを満足しながら割り当てるCPUリソースの量を継続的に最小化することです。 これまでの取り組みでは、シンプルなヒューリスティックスと高度なMLベースの手法が提案されていたが、実践的なリソースマネージャは、人的労力と運用オーバーヘッドを最小限に抑えて、多様なアプリケーションのためにCPUリソースを正確にスケールする必要があると信じている。 私たちは、実用的なポリシーによって解決可能なサブプロイムまで、組織的にリソース管理を分割できますか? CPUスロットルベースのパフォーマンスターゲットの概念に基づいて、SLOフィードバックとリソース制御のメカニズムを分離し、2レベルフレームワークであるAutothrottleを実装します。 グローバルレベルでの軽量な学習コントローラと、ローカルレベルでのマイクロサービス単位のアジャイルを組み合わせたものだ。 短期および21日間の運用ワークロードトレースを備えた3つのマイクロサービスアプリケーション上でAutothrottleを評価する。 実証的な結果によると、Autothrottleの優れたCPUコアは、レイテンシSLOを維持しながら、アプリケーション全体で最高のパフォーマンスのベースラインよりも最大26.21%節約している。

As the number of distributed services (or microservices) of cloud-native applications grows, resource management becomes a challenging task. These applications tend to be user-facing and latency-sensitive, and our goal is to continuously minimize the amount of CPU resources allocated while still satisfying the application latency SLO. Although previous efforts have proposed simple heuristics and sophisticated ML-based techniques, we believe that a practical resource manager should accurately scale CPU resources for diverse applications, with minimum human efforts and operation overheads. To this end, we ask: can we systematically break resource management down to subproblems solvable by practical policies? Based on the notion of CPU-throttle-based performance target, we decouple the mechanisms of SLO feedback and resource control, and implement a two-level framework -- Autothrottle. It combines a lightweight learned controller at the global level, and agile per-microservice controllers at the local level. We evaluate Autothrottle on three microservice applications, with both short-term and 21-day production workload traces. Empirical results show Autothrottle's superior CPU core savings up to 26.21% over the best-performing baselines across applications, while maintaining the latency SLO.
翻訳日:2022-12-26 17:20:40 公開日:2022-12-23
# 不均質環境下でのフェデレーション学習のための深い展開に基づく重み付き平均化

Deep Unfolding-based Weighted Averaging for Federated Learning under Heterogeneous Environments ( http://arxiv.org/abs/2212.12191v1 )

ライセンス: Link先を確認
Ayano Nakai-Kasai and Tadashi Wadayama(参考訳) フェデレーション学習(federated learning)は、モデル更新を複数のクライアントで反復し、中央サーバで更新を集約する、協調型モデルトレーニング手法である。 参加するクライアントのデバイスおよび統計的不均一性は、サーバのアグリゲーションフェーズにおいて、クライアント毎の適切な重み付けを割り当てるようにパフォーマンス劣化を引き起こす。 本稿では,不均一性に適応する重みの学習に深層展開を用い,一様テストデータに高精度なモデルを与える。 数値実験の結果,提案手法の高性能化と学習重量の解釈挙動が示唆された。

Federated learning is a collaborative model training method by iterating model updates at multiple clients and aggregation of the updates at a central server. Device and statistical heterogeneity of the participating clients cause performance degradation so that an appropriate weight should be assigned per client in the server's aggregation phase. This paper employs deep unfolding to learn the weights that adapt to the heterogeneity, which gives the model with high accuracy on uniform test data. The results of numerical experiments indicate the high performance of the proposed method and the interpretable behavior of the learned weights.
翻訳日:2022-12-26 17:20:17 公開日:2022-12-23
# 連続時間動的ノード表現学習のためのPiecewise-Velocityモデル

Piecewise-Velocity Model for Learning Continuous-time Dynamic Node Representations ( http://arxiv.org/abs/2212.12345v1 )

ライセンス: Link先を確認
Abdulkadir \c{C}elikkanat and Nikolaos Nakis and Morten M{\o}rup(参考訳) ネットワークは多くの分野で必須かつユビキタスな構造となり、ソーシャルネットワークにおける友情や、生物学的グラフにおけるタンパク質相互作用など、さまざまなエンティティ間の相互作用をモデル化している。 大きな課題は、これらのシステムの構造とダイナミクスを理解することである。 ネットワークは時間とともに進化するが、既存のグラフ表現学習法は静的ネットワークのみを対象としている。 動的ネットワークのモデリングのためのアプローチが開発されているが、ホモフィリーや推移性といった顕著なネットワーク特性を明示的に考慮しつつ、低次元における正確なネットワーク特性と可視化を提供する効率的な連続時間動的グラフ表現学習手法が欠如している。 本稿では,連続時間動的ネットワークの表現のためのPiecewise-Velocity Model (PiVeM)を提案する。 ノードの時間的進化を、定数なノード固有速度を持つ潜在距離モデルに基づいて分割線形補間によって近似する動的埋め込みを学習する。 このモデルは、イベントの数に不変なスケーラブルな推論を持つ関連するポアソン過程の確率を解析的に抽出可能な表現を可能にする。 さらに,コミュニティ構造,時間的平滑性,およびネットワークダイナミクスを特徴付けるために最適に学習された不連続(非相関)潜在埋め込み次元に対するダイナミクス会計に先立って,スケーラブルなクロネッカー構造ガウス過程を課す。 超低次元空間において、PiVeMはネットワーク構造と力学をうまく表現できることを示す。 リンク予測などの下流タスクでは、関連する最先端メソッドよりも優れています。 まとめると、PiVeMは容易に解釈可能な動的ネットワークの可視化とキャラクタリゼーションを可能にし、時間進化ネットワークの本質的なダイナミクスの理解をさらに改善することができる。

Networks have become indispensable and ubiquitous structures in many fields to model the interactions among different entities, such as friendship in social networks or protein interactions in biological graphs. A major challenge is to understand the structure and dynamics of these systems. Although networks evolve through time, most existing graph representation learning methods target only static networks. Whereas approaches have been developed for the modeling of dynamic networks, there is a lack of efficient continuous time dynamic graph representation learning methods that can provide accurate network characterization and visualization in low dimensions while explicitly accounting for prominent network characteristics such as homophily and transitivity. In this paper, we propose the Piecewise-Velocity Model (PiVeM) for the representation of continuous-time dynamic networks. It learns dynamic embeddings in which the temporal evolution of nodes is approximated by piecewise linear interpolations based on a latent distance model with piecewise constant node-specific velocities. The model allows for analytically tractable expressions of the associated Poisson process likelihood with scalable inference invariant to the number of events. We further impose a scalable Kronecker structured Gaussian Process prior to the dynamics accounting for community structure, temporal smoothness, and disentangled (uncorrelated) latent embedding dimensions optimally learned to characterize the network dynamics. We show that PiVeM can successfully represent network structure and dynamics in ultra-low two-dimensional spaces. It outperforms relevant state-of-art methods in downstream tasks such as link prediction. In summary, PiVeM enables easily interpretable dynamic network visualizations and characterizations that can further improve our understanding of the intrinsic dynamics of time-evolving networks.
翻訳日:2022-12-26 17:20:06 公開日:2022-12-23
# hac-net:高精度タンパク質結合親和性予測のための注意型畳み込みニューラルネットワーク

HAC-Net: A Hybrid Attention-Based Convolutional Neural Network for Highly Accurate Protein-Ligand Binding Affinity Prediction ( http://arxiv.org/abs/2212.12440v1 )

ライセンス: Link先を確認
Gregory W. Kyro, Rafael I. Brent, Victor S. Batista(参考訳) 画像検出とグラフ理論から深層学習の概念を適用することで、タンパク質-リガンド結合親和性予測が大幅に進歩し、薬物の発見とタンパク質工学の両方に多大な影響がもたらされた。 本研究では,チャネルワイズを利用した3次元畳み込みニューラルネットワークと,ノード特徴のアグリゲーションを利用した2つのグラフ畳み込みネットワークからなる,新しいディープラーニングアーキテクチャを設計することによって,これらの進歩の上に構築する。 HAC-Net(Hybrid Attention-Based Convolutional Neural Network)は、PDBbind v.2016コアセットの最先端の結果を得る。 タンパク質構造,タンパク質配列,リガンド拡張結合性フィンガープリントの差異を最大化する複数のトレインテストスプリットを用いて,本モデルの一般化性を検討した。 さらに、トレーニングおよびテストセットにおいて、SMILES文字列間の類似性の遮断を施した10倍のクロスバリデーションを行い、低品質データ上でのHAC-Netの性能を評価する。 我々は,このモデルを,構造に基づく生体分子特性予測に関連する幅広い教師付き学習問題に拡張できると考えている。 私たちのソフトウェアはすべて、https://github.com/gregory-kyro/hac-net/でオープンソースとして利用できます。

Applying deep learning concepts from image detection and graph theory has greatly advanced protein-ligand binding affinity prediction, a challenge with enormous ramifications for both drug discovery and protein engineering. We build upon these advances by designing a novel deep learning architecture consisting of a 3-dimensional convolutional neural network utilizing channel-wise attention and two graph convolutional networks utilizing attention-based aggregation of node features. HAC-Net (Hybrid Attention-Based Convolutional Neural Network) obtains state-of-the-art results on the PDBbind v.2016 core set, the most widely recognized benchmark in the field. We extensively assess the generalizability of our model using multiple train-test splits, each of which maximizes differences between either protein structures, protein sequences, or ligand extended-connectivity fingerprints. Furthermore, we perform 10-fold cross-validation with a similarity cutoff between SMILES strings of ligands in the training and test sets, and also evaluate the performance of HAC-Net on lower-quality data. We envision that this model can be extended to a broad range of supervised learning problems related to structure-based biomolecular property prediction. All of our software is available as open source at https://github.com/gregory-kyro/HAC-Net/.
翻訳日:2022-12-26 17:19:40 公開日:2022-12-23
# パーソナライズされたサブグラフ選択によるリンク予測のためのグラフニューラルネットワーク

Bring Your Own View: Graph Neural Networks for Link Prediction with Personalized Subgraph Selection ( http://arxiv.org/abs/2212.12488v1 )

ライセンス: Link先を確認
Qiaoyu Tan, Xin Zhang, Ninghao Liu, Daochen Zha, Li Li, Rui Chen, Soo-Hyun Choi, Xia Hu(参考訳) グラフニューラルネットワーク(GNN)はリンク予測(GNNLP)タスクにおいて顕著な成功を収めている。 既存の取り組みは、まずデータセット全体のサブグラフを事前に定義し、次にGNNを用いてエッジ表現をエンコードする。 GNNLP法の優位性はアドホック部分グラフに大きく依存している。 実世界のグラフにおけるノード接続は複雑であるため、1つの共有サブグラフはすべてのエッジに制限される。 したがって、サブグラフの選択は異なるエッジにパーソナライズされるべきである。 しかしながら、潜在的な選択空間が指数関数的にエッジのスケールに成長するため、パーソナライズされたサブグラフ選択の実行は自明ではない。 さらに、リンク予測シナリオのトレーニング中に推論エッジが利用できないため、選択プロセスはインダクティブでなければならない。 このギャップを埋めるために,gnnlpを行う際,各エッジに対して最適なサブグラフを自動的に,個人的,帰納的に識別するプラグイン・アンド・プレイフレームワークとして,パーソナライズされたサブグラフセレクタ(ps2)を導入する。 PS2は二段階最適化問題としてインスタンス化され、効率よく解ける。 GNNLPモデルをPS2と組み合わせることで、まずエッジの最適な部分グラフを識別し、次にサンプル化された部分グラフを用いて推論モデルのトレーニングに焦点を合わせることで、GNNLPトレーニングに対する新たな角度を提案する。 GNNLPバックボーン(GCN, GraphSage, NGCF, LightGCN, SEAL)と多種多様なベンチマーク(Planetoid, OGB, Recommendation データセット)にまたがって提案手法の有効性を総合的に検証した。 我々のコードは \url{https://github.com/qiaoyu-tan/PS2} で公開されている。

Graph neural networks (GNNs) have received remarkable success in link prediction (GNNLP) tasks. Existing efforts first predefine the subgraph for the whole dataset and then apply GNNs to encode edge representations by leveraging the neighborhood structure induced by the fixed subgraph. The prominence of GNNLP methods significantly relies on the adhoc subgraph. Since node connectivity in real-world graphs is complex, one shared subgraph is limited for all edges. Thus, the choices of subgraphs should be personalized to different edges. However, performing personalized subgraph selection is nontrivial since the potential selection space grows exponentially to the scale of edges. Besides, the inference edges are not available during training in link prediction scenarios, so the selection process needs to be inductive. To bridge the gap, we introduce a Personalized Subgraph Selector (PS2) as a plug-and-play framework to automatically, personally, and inductively identify optimal subgraphs for different edges when performing GNNLP. PS2 is instantiated as a bi-level optimization problem that can be efficiently solved differently. Coupling GNNLP models with PS2, we suggest a brand-new angle towards GNNLP training: by first identifying the optimal subgraphs for edges; and then focusing on training the inference model by using the sampled subgraphs. Comprehensive experiments endorse the effectiveness of our proposed method across various GNNLP backbones (GCN, GraphSage, NGCF, LightGCN, and SEAL) and diverse benchmarks (Planetoid, OGB, and Recommendation datasets). Our code is publicly available at \url{https://github.com/qiaoyu-tan/PS2}
翻訳日:2022-12-26 17:19:16 公開日:2022-12-23
# NARS vs. 強化学習: ONA vs. Q-Learning

NARS vs. Reinforcement learning: ONA vs. Q-Learning ( http://arxiv.org/abs/2212.12517v1 )

ライセンス: Link先を確認
Ali Beikmohammadi(参考訳) 現実的なシナリオの1つは、タスクを行うための最適なアクションのシーケンスを取ることです。 強化学習は、機械学習コミュニティでこの種のタスクを扱うための最もよく知られているアプローチである。 適切な代替品を見つけることは、常に興味深く、すぐに使える問題だ。 そこで本プロジェクトでは, NARS の能力について検討し, NARS が RL の代替となる可能性を持っているかどうかという疑問に答える。 特に、オープンaiジムで開発されたいくつかの環境で、q$-learningとonaを比較しています。 実験のソースコードは以下のリンクで公開されている。 \url{https://github.com/AliBeikmohammadi/OpenNARS-for-Applications/tree/master/misc/Python}。

One of the realistic scenarios is taking a sequence of optimal actions to do a task. Reinforcement learning is the most well-known approach to deal with this kind of task in the machine learning community. Finding a suitable alternative could always be an interesting and out-of-the-box matter. Therefore, in this project, we are looking to investigate the capability of NARS and answer the question of whether NARS has the potential to be a substitute for RL or not. Particularly, we are making a comparison between $Q$-Learning and ONA on some environments developed by an Open AI gym. The source code for the experiments is publicly available in the following link: \url{https://github.com/AliBeikmohammadi/OpenNARS-for-Applications/tree/master/misc/Python}.
翻訳日:2022-12-26 17:12:35 公開日:2022-12-23
# 事前制約付き分類器を用いた移動学習のための一般化境界

Generalization Bounds for Transfer Learning with Pretrained Classifiers ( http://arxiv.org/abs/2212.12532v1 )

ライセンス: Link先を確認
Tomer Galanti, Andr\'as Gy\"orgy, Marcus Hutter(参考訳) 本研究では,新しいクラスに移動可能な分類の表現を基礎モデルで学習する能力について検討する。 論文の最近の結果は、多くのクラスで単一の分類子によって学習される表現は、そのような問題のために設計された特別な目的のアルゴリズムによって学習される表現を持つ、少数の学習問題と競合していることを示している。 本稿では,同クラスに属するサンプルの特徴埋め込みがクラス平均に集中する傾向にある深層分類網のトレーニング力学を参考に,クラス変数の崩壊という概念に基づいて,この現象を説明する。 より具体的には、各クラスから少数のランダムサンプルから学習したセンターを用いて、最寄りのクラス中心分類器の分類誤差である学習特徴マップの少数ショット誤差を調べる。 本研究は,データに現れるクラスが分布から独立して選択されることを前提として,トレーニングデータから未確認テストデータに数ショットエラーが一般化されることを示し,ソースクラスの平均的な数ショットエラーを用いて,新しいクラス(同じ分布から選択された)に対して期待される数ショットエラーの上限を提供する。 さらに, 学習データの最小ショット誤差は, クラス特徴量変動の程度を用いて上限を上回ることができることを示した。 これは基盤モデルが、限られたデータでも新しい下流タスクに転送可能な機能マップを提供することができることを示唆している。

We study the ability of foundation models to learn representations for classification that are transferable to new, unseen classes. Recent results in the literature show that representations learned by a single classifier over many classes are competitive on few-shot learning problems with representations learned by special-purpose algorithms designed for such problems. We offer an explanation for this phenomenon based on the concept of class-features variability collapse, which refers to the training dynamics of deep classification networks where the feature embeddings of samples belonging to the same class tend to concentrate around their class means. More specifically, we examine the few-shot error of the learned feature map, which is the classification error of the nearest class-center classifier using centers learned from a small number of random samples from each class. Assuming that the classes appearing in the data are selected independently from a distribution, we show that the few-shot error generalizes from the training data to unseen test data, and we provide an upper bound on the expected few-shot error for new classes (selected from the same distribution) using the average few-shot error for the source classes. Additionally, we show that the few-shot error on the training data can be upper bounded using the degree of class-features variability collapse. This suggests that foundation models can provide feature maps that are transferable to new downstream tasks even with limited data available.
翻訳日:2022-12-26 17:12:24 公開日:2022-12-23
# 自動車システムのセキュリティと解釈可能性

Security and Interpretability in Automotive Systems ( http://arxiv.org/abs/2212.12101v1 )

ライセンス: Link先を確認
Shailja Thakur(参考訳) 送信者認証機構がないため、CAN(Controller Area Network)はセキュリティ上の脅威に対して脆弱である。 例えば、攻撃者はバス上のECU(Electronic Control Unit)を偽装し、偽造されたECUの識別子と無防備にメッセージを送信することができる。 この論文では、電子制御ユニット(ECU)の消費電力測定と分類モデルを用いて、ECUの送信状態を決定する送信者認証手法を示す。 実環境設定における手法の評価は,この手法が幅広い操作条件に適用され,精度が高いことを示す。 機械学習ベースのセキュリティコントロールの重要な課題は、偽陽性の可能性だ。 偽陽性の警告はオペレーターのパニックを引き起こし、誤った反応を引き起こし、長期的にはアラーム疲労を引き起こす。 このような状況下で信頼できる意思決定を行うには、異常なモデル行動の原因を知ることが不可欠である。 しかし、これらのモデルのブラックボックスの性質は解釈不能である。 そこで本論文では,(1)対象クラスに対する感度に基づいて個々の入力に重みを割り当てるタイプイメージと時系列の入力に関する説明手法について検討し,(2)生成モデルを用いて入力の感度領域を再構成することにより説明のバリエーションを定量化する。 要約すると、この論文 (https://uwspace.uwaterloo.ca/handle/10012/18134) は、安全で透明で信頼性の高い意思決定が不可欠である他の環境でも適用可能な、自動車システムのセキュリティと解釈可能性に取り組む方法を提示している。

The lack of any sender authentication mechanism in place makes CAN (Controller Area Network) vulnerable to security threats. For instance, an attacker can impersonate an ECU (Electronic Control Unit) on the bus and send spoofed messages unobtrusively with the identifier of the impersonated ECU. To address the insecure nature of the system, this thesis demonstrates a sender authentication technique that uses power consumption measurements of the electronic control units (ECUs) and a classification model to determine the transmitting states of the ECUs. The method's evaluation in real-world settings shows that the technique applies in a broad range of operating conditions and achieves good accuracy. A key challenge of machine learning-based security controls is the potential of false positives. A false-positive alert may induce panic in operators, lead to incorrect reactions, and in the long run cause alarm fatigue. For reliable decision-making in such a circumstance, knowing the cause for unusual model behavior is essential. But, the black-box nature of these models makes them uninterpretable. Therefore, another contribution of this thesis explores explanation techniques for inputs of type image and time series that (1) assign weights to individual inputs based on their sensitivity toward the target class, (2) and quantify the variations in the explanation by reconstructing the sensitive regions of the inputs using a generative model. In summary, this thesis (https://uwspace.uwaterloo.ca/handle/10012/18134) presents methods for addressing the security and interpretability in automotive systems, which can also be applied in other settings where safe, transparent, and reliable decision-making is crucial.
翻訳日:2022-12-26 17:11:42 公開日:2022-12-23
# 戸外空間におけるブラインドナビゲーション手法の実装

Implementation of a Blind navigation method in outdoors/indoors areas ( http://arxiv.org/abs/2212.12185v1 )

ライセンス: Link先を確認
Mohammad Javadian Farzaneh, Hossein Mahvash Mohammadi(参考訳) WHO統計によると、多くの人は視覚障害に悩まされており、その数は年々増えている。 彼らが抱える最も重要なニーズの1つは、安全にナビゲートできることであり、研究者が様々なナビゲーションシステムを作成し改善しようとしている理由である。 本稿では,単眼カメラを用いた視覚スラムとヨーロの概念に基づくナビゲーション概念を提案する。 ORB-SLAMアルゴリズムを用いて、我々の概念は、盲人がよく使う事前定義された経路からマップを作成する。 視覚障害者は、自分の環境に興味を持ち、そしてもちろん、それらを適切に誘導するため、システムに障害物検出が追加された。 前述のように、視覚障害者には安全なナビゲーションが不可欠です。 この部分は、障害物距離推定、経路偏差検出、および単眼カメラによる次のステップ予測という3つのステップから構成される。

Based on WHO statistics, many individuals are suffering from visual problems, and their number is increasing yearly. One of the most critical needs they have is the ability to navigate safely, which is why researchers are trying to create and improve various navigation systems. This paper provides a navigation concept based on the visual slam and Yolo concepts using monocular cameras. Using the ORB-SLAM algorithm, our concept creates a map from a predefined route that a blind person most uses. Since visually impaired people are curious about their environment and, of course, to guide them properly, obstacle detection has been added to the system. As mentioned earlier, safe navigation is vital for visually impaired people, so our concept has a path-following part. This part consists of three steps: obstacle distance estimation, path deviation detection, and next-step prediction, done by monocular cameras.
翻訳日:2022-12-26 17:10:55 公開日:2022-12-23
# CTからのCOVID-19分離改善のための集団的知能戦略

Collective Intelligent Strategy for Improved Segmentation of COVID-19 from CT ( http://arxiv.org/abs/2212.12264v1 )

ライセンス: Link先を確認
Surochita Pal Das, Sushmita Mitra and B. Uma Shankar(参考訳) 新型コロナウイルスの感染拡大により、迅速かつ正確な自動検出技術の設計が不可欠となった。 深層学習とイメージングを用いて,肺におけるcovid-19感染症の診断を行う新しい非侵襲的ツールを提案する。 LOPO(Leave-One-Patient-Out)トレーニングを用いたEAMC(Ensembling Attention-based Multi-scaled Convolution Network)は、重症度の評価とともに、感染部位のアウトライン化において高い感度と精度を示す。 Attentionモジュールはコンテキストと複数のスケールのローカル情報を組み合わせて正確なセグメンテーションを行う。 アンサンブル学習は、異なる基底分類器を通して決定の不均一性を統合する。 EAMCの優位性は、4つの公開可能な新型コロナウイルスデータセットに対する既存の最先端の学習モデルと比較することで確立されている。 この結果は、パンデミックのような患者に過大評価されている医療従事者に支援的インテリジェンスを提供するための深層学習の関連性が示唆されている。 その臨床的意義は、遠隔地で専門的な医療を欠く患者に低コストな意思決定を提供することにおいて、前例のない範囲にある。

The devastation caused by the coronavirus pandemic makes it imperative to design automated techniques for a fast and accurate detection. We propose a novel non-invasive tool, using deep learning and imaging, for delineating COVID-19 infection in lungs. The Ensembling Attention-based Multi-scaled Convolution network (EAMC), employing Leave-One-Patient-Out (LOPO) training, exhibits high sensitivity and precision in outlining infected regions along with assessment of severity. The Attention module combines contextual with local information, at multiple scales, for accurate segmentation. Ensemble learning integrates heterogeneity of decision through different base classifiers. The superiority of EAMC, even with severe class imbalance, is established through comparison with existing state-of-the-art learning models over four publicly-available COVID-19 datasets. The results are suggestive of the relevance of deep learning in providing assistive intelligence to medical practitioners, when they are overburdened with patients as in pandemics. Its clinical significance lies in its unprecedented scope in providing low-cost decision-making for patients lacking specialized healthcare at remote locations.
翻訳日:2022-12-26 17:10:40 公開日:2022-12-23
# 画像の逆問題に対する後方変動に基づく誤差定量化

Posterior-Variance-Based Error Quantification for Inverse Problems in Imaging ( http://arxiv.org/abs/2212.12499v1 )

ライセンス: Link先を確認
Dominik Narnhofer and Andreas Habring and Martin Holler and Thomas Pock(参考訳) 本研究では,逆画像問題のベイズ正規化における画素誤り境界を求める手法を提案する。 提案手法では, 後方分散の予測と共形予測の手法を用いて, 基礎となるデータ分布を仮定することなく, 誤差境界のカバレッジ保証を得る。 これは一般にベイズ正規化のアプローチ、例えば前者の具体的な選択の独立性に適用できる。 また、後部からの近似サンプリングのみが可能な場合にも、カバレッジ保証を得ることができる。 特に、提案されたフレームワークは、学習済みの事前をブラックボックス方式で組み込むことができる。 基礎となる分布に関する仮定のない保証されたカバレッジは、誤差境界の大きさが一般には、事前に未知であるため、達成可能である。 しかしながら、本論文で示された複数の正則化手法による実験は、実際に得られた誤差境界がかなり厳密であることを確認した。 数値実験を実現するために,非スムース分布からサンプリングする新しいプライマル・デュアル・ランジュバン法も紹介されている。

In this work, a method for obtaining pixel-wise error bounds in Bayesian regularization of inverse imaging problems is introduced. The proposed method employs estimates of the posterior variance together with techniques from conformal prediction in order to obtain coverage guarantees for the error bounds, without making any assumption on the underlying data distribution. It is generally applicable to Bayesian regularization approaches, independent, e.g., of the concrete choice of the prior. Furthermore, the coverage guarantees can also be obtained in case only approximate sampling from the posterior is possible. With this in particular, the proposed framework is able to incorporate any learned prior in a black-box manner. Guaranteed coverage without assumptions on the underlying distributions is only achievable since the magnitude of the error bounds is, in general, unknown in advance. Nevertheless, experiments with multiple regularization approaches presented in the paper confirm that in practice, the obtained error bounds are rather tight. For realizing the numerical experiments, also a novel primal-dual Langevin algorithm for sampling from non-smooth distributions is introduced in this work.
翻訳日:2022-12-26 17:10:20 公開日:2022-12-23
# コンピュータの倫理設計:半導体からIoT、人工知能へ

Ethical Design of Computers: From Semiconductors to IoT and Artificial Intelligence ( http://arxiv.org/abs/2212.12508v1 )

ライセンス: Link先を確認
Sudeep Pasricha, Marilyn Wolf(参考訳) 今日のコンピューティングシステムは、私たちのプロフェッショナル、社会的、プライベートな生活に密に統合されています。 このコンピューティングの普及による重要な影響は、コンピューティング専門家が考慮すべき倫理的意味を持つ可能性があることである。 ほとんどの実世界のシナリオでは、コンピューティングシステムの設計と使用における技術的な選択が倫理的な観点からどのように見えるかは、すぐには明らかではない。 この記事では、半導体チップ設計における倫理的課題、IoTアプリケーション、およびこれらのシステムの設計プロセス、ツール、ハードウェア・ソフトウェアスタックにおける人工知能の利用の増加に関する展望を提供する。

Computing systems are tightly integrated today into our professional, social, and private lives. An important consequence of this growing ubiquity of computing is that it can have significant ethical implications of which computing professionals should take account. In most real-world scenarios, it is not immediately obvious how particular technical choices during the design and use of computing systems could be viewed from an ethical perspective. This article provides a perspective on the ethical challenges within semiconductor chip design, IoT applications, and the increasing use of artificial intelligence in the design processes, tools, and hardware-software stacks of these systems.
翻訳日:2022-12-26 17:10:04 公開日:2022-12-23
# アンサンブル分類と証拠理論を用いた異常検出

Anomaly Detection using Ensemble Classification and Evidence Theory ( http://arxiv.org/abs/2212.12092v1 )

ライセンス: Link先を確認
Fernando Ar\'evalo, Tahasanul Ibrahim, Christian Alison M. Piolo, Andreas Schwung(参考訳) マルチクラスのアンサンブル分類は、研究コミュニティ内で広く研究の焦点となっている。 クラウドサービスの普及により、大規模な機械学習モデルのデプロイが容易になった。 また、生産における一般的な問題を特定する能力から、産業セクターの注目を集めている。 しかしながら、アンサンブル分類器には、分類器プールの適切な選択と効果的な訓練、多クラス分類のための適切なアーキテクチャの定義、アンサンブル分類器の不確かさの定量化といった課題がある。 アンサンブル分類器の堅牢性と有効性は、学習過程だけでなく、分類器のプールの選択にも関係している。 したがって、分類器のプールの選択と訓練手順が重要な役割を果たす。 ensemble)分類器は、教師付きトレーニングで使用されたクラスを検出するために学習する。 しかし、未知の条件でデータを注入する場合、訓練された分類器は、訓練中に学んだクラスを予測する。 この目的のために,学習能力を評価するために,個人とアンサンブルの分類器の不確実性を用いた。 本稿では,アンサンブル分類とエビデンス理論を用いた新しい検出手法を提案する。 固体アンサンブル分類器を構築するためのプール選択戦略が提示される。 マルチクラスアンサンブル分類のためのアーキテクチャと,個別分類器とアンサンブル分類器の不確かさを定量化するアプローチを提案する。 我々は異常検出手法に不確実性を用いる。 最後に、ベンチマークテネシー・イーストマンを用いてアンサンブル分類器の予測と異常検出能力をテストする実験を行った。

Multi-class ensemble classification remains a popular focus of investigation within the research community. The popularization of cloud services has sped up their adoption due to the ease of deploying large-scale machine-learning models. It has also drawn the attention of the industrial sector because of its ability to identify common problems in production. However, there are challenges to conform an ensemble classifier, namely a proper selection and effective training of the pool of classifiers, the definition of a proper architecture for multi-class classification, and uncertainty quantification of the ensemble classifier. The robustness and effectiveness of the ensemble classifier lie in the selection of the pool of classifiers, as well as in the learning process. Hence, the selection and the training procedure of the pool of classifiers play a crucial role. An (ensemble) classifier learns to detect the classes that were used during the supervised training. However, when injecting data with unknown conditions, the trained classifier will intend to predict the classes learned during the training. To this end, the uncertainty of the individual and ensemble classifier could be used to assess the learning capability. We present a novel approach for novel detection using ensemble classification and evidence theory. A pool selection strategy is presented to build a solid ensemble classifier. We present an architecture for multi-class ensemble classification and an approach to quantify the uncertainty of the individual classifiers and the ensemble classifier. We use uncertainty for the anomaly detection approach. Finally, we use the benchmark Tennessee Eastman to perform experiments to test the ensemble classifier's prediction and anomaly detection capabilities.
翻訳日:2022-12-26 17:03:47 公開日:2022-12-23
# IoTネットワークにおける異常検出のためのグラスマン多様体上のフェデレーションPCA

Federated PCA on Grassmann Manifold for Anomaly Detection in IoT Networks ( http://arxiv.org/abs/2212.12121v1 )

ライセンス: Link先を確認
Tung-Anh Nguyen, Jiayu He, Long Tan Le, Wei Bao and Nguyen H. Tran(参考訳) IoT(Internet of Things)の時代において、ほとんどのIoTデバイス固有のセキュリティ脆弱性のため、ネットワーク全体の異常検出は、IoTネットワーク監視の重要な部分である。 主成分分析(PCA)は、異常検出のための正常かつ悪意のある動作に対応する2つの非結合部分空間にネットワークトラフィックを分離するために提案されている。 しかし、デバイスのコンピューティングリソースのプライバシに関する懸念と制限は、PCAの実用性を損なう。 異常検出のための正常なネットワーク動作の結合プロファイルを集約するためにIoTデバイスをコーディネートする,PCAベースのGrassmannian最適化フレームワークを提案する。 まず、プライバシ保護のためのフェデレーションPCAフレームワークを導入し、さまざまなIoTデバイスのトラフィックのプロファイルを同時にキャプチャする。 次に,グラスマン多様体上の乗数勾配に基づく学習の交互方向法について検討し,高速なトレーニングと限られた計算資源を用いた遅延検出の欠如を保証する。 NSL-KDDデータセットにおける実験結果から,本手法がベースラインアプローチより優れていることが示された。 最後に、グラスマン多様体アルゴリズムはiot異常検出に高度に適応しており、システムの解析時間を劇的に削減できることを示した。 我々の知る限りでは、IoTネットワークの要件を満たす異常検出のための最初のフェデレーションPCAアルゴリズムである。

In the era of Internet of Things (IoT), network-wide anomaly detection is a crucial part of monitoring IoT networks due to the inherent security vulnerabilities of most IoT devices. Principal Components Analysis (PCA) has been proposed to separate network traffics into two disjoint subspaces corresponding to normal and malicious behaviors for anomaly detection. However, the privacy concerns and limitations of devices' computing resources compromise the practical effectiveness of PCA. We propose a federated PCA-based Grassmannian optimization framework that coordinates IoT devices to aggregate a joint profile of normal network behaviors for anomaly detection. First, we introduce a privacy-preserving federated PCA framework to simultaneously capture the profile of various IoT devices' traffic. Then, we investigate the alternating direction method of multipliers gradient-based learning on the Grassmann manifold to guarantee fast training and the absence of detecting latency using limited computational resources. Empirical results on the NSL-KDD dataset demonstrate that our method outperforms baseline approaches. Finally, we show that the Grassmann manifold algorithm is highly adapted for IoT anomaly detection, which permits drastically reducing the analysis time of the system. To the best of our knowledge, this is the first federated PCA algorithm for anomaly detection meeting the requirements of IoT networks.
翻訳日:2022-12-26 17:03:26 公開日:2022-12-23
# DAS: アクティベーションスコアの廃止によるニューラルアーキテクチャ検索

DAS: Neural Architecture Search via Distinguishing Activation Score ( http://arxiv.org/abs/2212.12132v1 )

ライセンス: Link先を確認
Yuqiao Liu, Haipeng Li, Yanan Sun, Shuaicheng Liu(参考訳) ニューラルアーキテクチャサーチ(NAS)は、特定のタスクに対して優れたアーキテクチャを探索する自動手法である。 NASは多くの分野において人間設計アーキテクチャを超えるが、高い計算コストのアーキテクチャ評価が開発を妨げる。 可能な解決策は、トレーニングなしでアーキテクチャの初期段階でメトリクスを直接評価することである。 nas without training (wot)スコアは、アクティベーション層で異なる入力を識別する能力を通じて、アーキテクチャの最終的なトレーニングされた精度を推定する指標である。 しかしながら、wotスコアはアトミックメトリックではなく、アーキテクチャの基本的な指標を表すものではない。 この論文の貢献は3つある。 まず、wotをネットワークの識別能力とアクティベーションユニットの数を表す2つのアトミックメトリックに分離し、das(distinguishing activation score)と呼ばれるより良い組み合わせルールを探索する。 分離の正当性を理論的に証明し,ルールの有効性を実験的に確認した。 第2に,実用的な探索条件を満たすために,dasの予測精度を向上させるため,高速訓練戦略を提案する。 高速トレーニング戦略と組み合わせてDASを使用すると、さらなる改善がもたらされる。 第3に,既存のデータセットにおけるアーキテクチャのトレーニング状態がないというギャップを埋める,darts-training-bench(dtb)というデータセットを提案する。 提案手法は,nas-bench-101,ネットワーク設計空間,提案するdtbに対して1.04$\times$1.56$\times$改善を行った。

Neural Architecture Search (NAS) is an automatic technique that can search for well-performed architectures for a specific task. Although NAS surpasses human-designed architecture in many fields, the high computational cost of architecture evaluation it requires hinders its development. A feasible solution is to directly evaluate some metrics in the initial stage of the architecture without any training. NAS without training (WOT) score is such a metric, which estimates the final trained accuracy of the architecture through the ability to distinguish different inputs in the activation layer. However, WOT score is not an atomic metric, meaning that it does not represent a fundamental indicator of the architecture. The contributions of this paper are in three folds. First, we decouple WOT into two atomic metrics which represent the distinguishing ability of the network and the number of activation units, and explore better combination rules named (Distinguishing Activation Score) DAS. We prove the correctness of decoupling theoretically and confirmed the effectiveness of the rules experimentally. Second, in order to improve the prediction accuracy of DAS to meet practical search requirements, we propose a fast training strategy. When DAS is used in combination with the fast training strategy, it yields more improvements. Third, we propose a dataset called Darts-training-bench (DTB), which fills the gap that no training states of architecture in existing datasets. Our proposed method has 1.04$\times$ - 1.56$\times$ improvements on NAS-Bench-101, Network Design Spaces, and the proposed DTB.
翻訳日:2022-12-26 17:03:06 公開日:2022-12-23
# 隠れ表現共有によるグラフフェデレーション学習

Graph Federated Learning with Hidden Representation Sharing ( http://arxiv.org/abs/2212.12158v1 )

ライセンス: Link先を確認
Shuang Wu, Mingxuan Zhang, Yuantong Li, Carl Yang, Pan Li(参考訳) グラフ上での学習(log)は、各クライアントがローカルデータに不足している場合、マルチクライアントシステムで広く使われ、複数のクライアントは、高品質のモデルを学ぶために生のデータを共有する必要がある。 ひとつのシナリオは、履歴データに制限のあるクライアントに対してアイテムを推奨し、ソーシャルネットワーク内の他のクライアントと同様の好みを共有することである。 一方で、クライアントのデータプライバシ保護の要求が増大していることから、fl(federated learning)が広く採用されている。 LoGとFLの潜在的なデータ共有の対立は未解決であり、双方の利益を得る方法は有望な問題である。 本稿では,まず,マルチクライアントシステムにおいてログとflを統一するグラフフェデレーション学習(gfl)問題を定式化し,その解としてデータプライバシを保護するために,隣人の生データの代わりに隠れ表現を共有することを提案する。 GFLの偏り勾配問題を克服するために,非凸対象下での勾配推定法とその収束解析を提案する。 実験では,本手法をグラフ上の分類タスクで評価する。 我々の実験は我々の理論と実践のよい一致を示している。

Learning on Graphs (LoG) is widely used in multi-client systems when each client has insufficient local data, and multiple clients have to share their raw data to learn a model of good quality. One scenario is to recommend items to clients with limited historical data and sharing similar preferences with other clients in a social network. On the other hand, due to the increasing demands for the protection of clients' data privacy, Federated Learning (FL) has been widely adopted: FL requires models to be trained in a multi-client system and restricts sharing of raw data among clients. The underlying potential data-sharing conflict between LoG and FL is under-explored and how to benefit from both sides is a promising problem. In this work, we first formulate the Graph Federated Learning (GFL) problem that unifies LoG and FL in multi-client systems and then propose sharing hidden representation instead of the raw data of neighbors to protect data privacy as a solution. To overcome the biased gradient problem in GFL, we provide a gradient estimation method and its convergence analysis under the non-convex objective. In experiments, we evaluate our method in classification tasks on graphs. Our experiment shows a good match between our theory and the practice.
翻訳日:2022-12-26 17:02:37 公開日:2022-12-23
# 周りを見ろ! 不動産評価のための隣接関係グラフ学習フレームワーク

Look Around! A Neighbor Relation Graph Learning Framework for Real Estate Appraisal ( http://arxiv.org/abs/2212.12190v1 )

ライセンス: Link先を確認
Chih-Chia Li, Wei-Yao Wang, Wei-Wei Du, Wen-Chih Peng(参考訳) 不動産鑑定は、市場における不動産価値評価を目的とした都市アプリケーションにとって重要な課題である。 伝統的な手法はドメイン知識に基づいて評価を行うが、手作り設計の努力に悩まされる。 近年,資産価値を見積もる際に,不動産取引を考慮に入れて評価プロセスを自動化する手法が開発されている。 しかし、既存の手法は不動産そのもののみを考慮し、プロパティ間の関係を無視している。 さらに、隣人の情報を自然に集約しても、トランザクション間の関係をモデル化できない。 これらの制約に対処するため、ターゲット取引と周辺住民の関係を注意機構に組み込むことにより、新しい近隣関係グラフ学習フレームワーク(ReGram)を提案する。 コミュニティ間の影響をモデル化するために、環境情報と各取引の過去の価格を他のコミュニティから統合する。 さらに、異なる領域のターゲットトランザクションは類似点や特徴の相違点を共有しているため、入力関連カーネル重みに基づくターゲットトランザクションの異なる分布をモデル化する動的アダプタを導入する。 さまざまなシナリオによる現実世界のデータセットに関する広範な実験は、regramが最先端のメソッドを堅牢に上回っていることを示している。 さらに,ReGramの各成分の有効性を検討するため,包括的アブレーション試験を行った。

Real estate appraisal is a crucial issue for urban applications, which aims to value the properties on the market. Traditional methods perform appraisal based on the domain knowledge, but suffer from the efforts of hand-crafted design. Recently, several methods have been developed to automatize the valuation process by taking the property trading transaction into account when estimating the property value. However, existing methods only consider the real estate itself, ignoring the relation between the properties. Moreover, naively aggregating the information of neighbors fails to model the relationships between the transactions. To tackle these limitations, we propose a novel Neighbor Relation Graph Learning Framework (ReGram) by incorporating the relation between target transaction and surrounding neighbors with the attention mechanism. To model the influence between communities, we integrate the environmental information and the past price of each transaction from other communities. Moreover, since the target transactions in different regions share some similarities and differences of characteristics, we introduce a dynamic adapter to model the different distributions of the target transactions based on the input-related kernel weights. Extensive experiments on the real-world dataset with various scenarios demonstrate that ReGram robustly outperforms the state-of-the-art methods. Furthermore, comprehensive ablation studies were conducted to examine the effectiveness of each component in ReGram.
翻訳日:2022-12-26 17:02:15 公開日:2022-12-23
# 勾配降下アルゴリズムにおける各ハイパーパラメータの最適化値の探索

Exploring the Optimized Value of Each Hyperparameter in Various Gradient Descent Algorithms ( http://arxiv.org/abs/2212.12279v1 )

ライセンス: Link先を確認
Abel C. H. Chen(参考訳) 近年,高精度または低誤差の深層学習モデルのパラメータ最適化に,勾配降下法,モーメント付き勾配降下法,適応勾配法(AdaGrad),ルート平均二乗伝搬法(RMSProp),適応モーメント推定法(Adam)など,様々な勾配降下法が適用されている。 これらの最適化アルゴリズムは、学習率や運動量係数などを含む複数のハイパーパラメータの値を設定する必要があるかもしれない。 さらに、収束速度と解の精度はハイパーパラメータの値に影響される可能性がある。 そこで本研究では,各対象関数の平均誤差を,様々な勾配降下アルゴリズムに基づいて解析する数学的モデルを提案する。 さらに、各ハイパーパラメータの適切な値は平均誤差を最小化することで決定できる。 ハイパーパラメータ値設定の原理はモデル最適化の分析結果に基づいて一般化された。 実験の結果,提案手法により高効率収束と低誤差が得られることがわかった。

In the recent years, various gradient descent algorithms including the methods of gradient descent, gradient descent with momentum, adaptive gradient (AdaGrad), root-mean-square propagation (RMSProp) and adaptive moment estimation (Adam) have been applied to the parameter optimization of several deep learning models with higher accuracies or lower errors. These optimization algorithms may need to set the values of several hyperparameters which include a learning rate, momentum coefficients, etc. Furthermore, the convergence speed and solution accuracy may be influenced by the values of hyperparameters. Therefore, this study proposes an analytical framework to use mathematical models for analyzing the mean error of each objective function based on various gradient descent algorithms. Moreover, the suitable value of each hyperparameter could be determined by minimizing the mean error. The principles of hyperparameter value setting have been generalized based on analysis results for model optimization. The experimental results show that higher efficiency convergences and lower errors can be obtained by the proposed method.
翻訳日:2022-12-26 17:01:55 公開日:2022-12-23
# モジュラリティによるルール学習

Rule Learning by Modularity ( http://arxiv.org/abs/2212.12335v1 )

ライセンス: Link先を確認
Albert N\"ossig, Tobias Hell and Georg Moser(参考訳) 本稿では,(確率的な)機械学習における最先端の手法とルール学習における従来の手法を組み合わせて,膨大なデータセットの分類のための効率的かつスケーラブルなアルゴリズムを提供するモジュール方式を提案する。 MNIST, Fashion-MNIST, IMDB の大規模データ集合に対する我々のアプローチの評価は別として, 説明可能な歯科用紙幣分類に関する新たな結果を示す。 後者のケーススタディは、ドイツで多様なサービスを提供する保険会社であるAllianz Private Krankenversicherungs-Aktiengesellschaftとの産業協力に由来する。

In this paper, we present a modular methodology that combines state-of-the-art methods in (stochastic) machine learning with traditional methods in rule learning to provide efficient and scalable algorithms for the classification of vast data sets, while remaining explainable. Apart from evaluating our approach on the common large scale data sets MNIST, Fashion-MNIST and IMDB, we present novel results on explainable classifications of dental bills. The latter case study stems from an industrial collaboration with Allianz Private Krankenversicherungs-Aktiengesellschaft which is an insurance company offering diverse services in Germany.
翻訳日:2022-12-26 17:01:37 公開日:2022-12-23
# 分類性能におけるスケーリング手法の選択

The choice of scaling technique matters for classification performance ( http://arxiv.org/abs/2212.12343v1 )

ライセンス: Link先を確認
Lucas B.V. de Amorim, George D.C. Cavalcanti and Rafael M.O. Cruz(参考訳) データセットのスケーリング、あるいは正規化は、機械学習パイプラインにおいて不可欠な前処理ステップである。 属性のスケールを、すべて同じ範囲内で異なるように調整することを目的としている。 この変換は分類モデルの性能を向上させることが知られているが、いくつかのスケーリング手法があるため、この選択は一般的に慎重に行われていない。 本稿では,モノリシックモデルとアンサンブルモデル間の20の分類アルゴリズムの性能に対する5つのスケーリング手法の影響を比較検討し,不均衡比の異なる82の公開データセットに適用する。 その結果,スケーリング手法の選択は分類性能に重要であり,最も優れたスケーリング手法と最悪のスケーリング手法との性能差は,ほとんどの場合,関連性があり統計的に重要であることがわかった。 また、不適切なテクニックを選択することは、データのスケーリングを全く行わないよりも、分類性能に有害であることも示している。 また,異なるスケーリング手法を考慮に入れたアンサンブルモデルの性能変動が,ベースモデルによって予測される傾向があることを示す。 最後に,スケーリング手法の選択に対するモデルの感度と,その性能との関係について考察し,異なるモデル展開シナリオにおける適用性について考察する。 この論文における実験の完全な結果とソースコードは、githubリポジトリで入手できる。 \footnote{https://github.com/amorimlb/scaling\_matters}

Dataset scaling, also known as normalization, is an essential preprocessing step in a machine learning pipeline. It is aimed at adjusting attributes scales in a way that they all vary within the same range. This transformation is known to improve the performance of classification models, but there are several scaling techniques to choose from, and this choice is not generally done carefully. In this paper, we execute a broad experiment comparing the impact of 5 scaling techniques on the performances of 20 classification algorithms among monolithic and ensemble models, applying them to 82 publicly available datasets with varying imbalance ratios. Results show that the choice of scaling technique matters for classification performance, and the performance difference between the best and the worst scaling technique is relevant and statistically significant in most cases. They also indicate that choosing an inadequate technique can be more detrimental to classification performance than not scaling the data at all. We also show how the performance variation of an ensemble model, considering different scaling techniques, tends to be dictated by that of its base model. Finally, we discuss the relationship between a model's sensitivity to the choice of scaling technique and its performance and provide insights into its applicability on different model deployment scenarios. Full results and source code for the experiments in this paper are available in a GitHub repository.\footnote{https://github.com/amorimlb/scaling\_matters}
翻訳日:2022-12-26 17:01:24 公開日:2022-12-23
# リレーショナルローカル説明

Relational Local Explanations ( http://arxiv.org/abs/2212.12374v1 )

ライセンス: Link先を確認
Vadim Borisov and Gjergji Kasneci(参考訳) 機械学習モデルに対する既存のポストホックな説明アプローチの大部分は、視覚データとテキストデータで自然に発生する特徴間の変数間関係のような重要な特徴を無視して、変数毎の特徴帰属スコアを生成する。 そこで我々は,入力変数間の関係解析に基づく新しいモデル非依存・置換型特徴帰属アルゴリズムを開発した。 その結果、マシンラーニングのモデル決定とデータに対して、より広い洞察を得ることができるようになりました。 このタイプの局所的説明は、局所的特徴間の相互関係の影響を計測し、説明のもう一つの重要な側面を提供する。 画像およびテキストデータモダリティを含む設定を用いたフレームワークの実験的評価は,その有効性と妥当性を示している。

The majority of existing post-hoc explanation approaches for machine learning models produce independent per-variable feature attribution scores, ignoring a critical characteristic, such as the inter-variable relationship between features that naturally occurs in visual and textual data. In response, we develop a novel model-agnostic and permutation-based feature attribution algorithm based on the relational analysis between input variables. As a result, we are able to gain a broader insight into machine learning model decisions and data. This type of local explanation measures the effects of interrelationships between local features, which provides another critical aspect of explanations. Experimental evaluations of our framework using setups involving both image and text data modalities demonstrate its effectiveness and validity.
翻訳日:2022-12-26 17:01:03 公開日:2022-12-23
# K平均クラスタリングにおけるMM原理を用いた不完全データ処理

Using MM principles to deal with incomplete data in K-means clustering ( http://arxiv.org/abs/2212.12379v1 )

ライセンス: Link先を確認
Ali Beikmohammadi(参考訳) 多くのクラスタリングアルゴリズムの中で、K平均クラスタリングアルゴリズムは単純なアルゴリズムと高速収束のために広く使われている。 しかし、このアルゴリズムは不完全なデータに悩まされており、一部のサンプルはいくつかの属性を見逃している。 この問題を解決するために、主にMM原理を用いてデータの対称性を復元し、K平均がうまく動作するようにします。 アルゴリズムの擬似コードを与え,標準データセットを用いて実験検証を行う。 実験のソースコードは以下のリンクで公開されている。 \url{https://github.com/AliBeikmohammadi/MM-Optimization/blob/main/mini-project/MM%20K-means.ipynb}。

Among many clustering algorithms, the K-means clustering algorithm is widely used because of its simple algorithm and fast convergence. However, this algorithm suffers from incomplete data, where some samples have missed some of their attributes. To solve this problem, we mainly apply MM principles to restore the symmetry of the data, so that K-means could work well. We give the pseudo-code of the algorithm and use the standard datasets for experimental verification. The source code for the experiments is publicly available in the following link: \url{https://github.com/AliBeikmohammadi/MM-Optimization/blob/main/mini-project/MM%20K-means.ipynb}.
翻訳日:2022-12-26 17:00:50 公開日:2022-12-23
# 衛星ポーズ推定における領域ギャップの橋渡し--幾何学的制約に基づく自己学習アプローチ

Bridging the Domain Gap in Satellite Pose Estimation: a Self-Training Approach based on Geometrical Constraints ( http://arxiv.org/abs/2212.12103v1 )

ライセンス: Link先を確認
Zi Wang, Minglin Chen, Yulan Guo, Zhang Li, Qifeng Yu(参考訳) 近年,衛星ポーズ推定における教師なし領域適応が注目され,深層モデルのトレーニングに要するアノテーションコストの軽減が図られている。 そこで本研究では,ドメインに依存しない幾何学的制約に基づく自己学習フレームワークを提案する。 具体的には、ニューラルネットワークを使って衛星の2Dキーポイントを予測し、PnPを使ってポーズを推定する。 対象サンプルのポーズは、タスクを最小化問題として定式化する潜在変数とみなされる。 さらに,衛星をスパースキーポイントとして抽象化することで生じる情報損失問題に対処するために,きめ細かいセグメンテーションを利用する。 最後に,擬似ラベル生成とネットワークトレーニングという2つのステップで,最小化問題を反復的に解く。 実験の結果,本手法は対象領域によく適合することがわかった。 さらに,第2回国際衛星ポース推定コンペティションのサンランプ作業において,本手法が第1位となった。

Recently, unsupervised domain adaptation in satellite pose estimation has gained increasing attention, aiming at alleviating the annotation cost for training deep models. To this end, we propose a self-training framework based on the domain-agnostic geometrical constraints. Specifically, we train a neural network to predict the 2D keypoints of a satellite and then use PnP to estimate the pose. The poses of target samples are regarded as latent variables to formulate the task as a minimization problem. Furthermore, we leverage fine-grained segmentation to tackle the information loss issue caused by abstracting the satellite as sparse keypoints. Finally, we iteratively solve the minimization problem in two steps: pseudo-label generation and network training. Experimental results show that our method adapts well to the target domain. Moreover, our method won the 1st place on the sunlamp task of the second international Satellite Pose Estimation Competition.
翻訳日:2022-12-26 16:55:44 公開日:2022-12-23
# 正確な位置マッチングはデジタル病理学におけるDense Contrastive Learningを改善する

Precise Location Matching Improves Dense Contrastive Learning in Digital Pathology ( http://arxiv.org/abs/2212.12105v1 )

ライセンス: Link先を確認
Jingwei Zhang, Saarthak Kapse, Ke Ma, Prateek Prasanna, Maria Vakalopoulou, Joel Saltz, Dimitris Samaras(参考訳) 分節や病理組織の検出といった複雑な予測タスクは、デジタル病理ワークフローにおいて重要な臨床的価値を持っている。 しかし、大きなコホートに密集した注釈を得るのは通常退屈で高価である。 コントラスト学習(CL)は、バックボーンネットワークを事前訓練するために大量のラベルのないデータを活用するためにしばしば用いられる。 密接な予測のためにCLを高めるために、事前学習における密接なマッチング目的のバリエーションを提案する研究もある。 しかし, 組織像に既存の密集マッチング戦略を用いることで, 不正確な一対の密集特徴の分散を強制し, 不正確であることを示す。 そこで本研究では,幾何変換間の重なり情報を利用する高精度な位置情報マッチング機構を提案する。 2つの事前学習データセット(TCGA-BRCA, NCT-CRC-HE)と3つの下流データセット(GlaS, CRAG, BCSS)に対する大規模な実験は、セマンティックおよびインスタンスセグメンテーションタスクにおける我々の手法の優位性を強調している。 本手法は, 従来の密マッチング手法よりも, 検出平均精度が7.2%, 事例分割作業平均精度が5.6%に向上する。 さらに、MoCo-v2、VICRegL、ConCLの3つの一般的なコントラスト学習フレームワークにおけるマッチング機構を用いて、検出の平均精度を0.7%から5.2%に改善し、セグメンテーションの平均精度を0.7%から4.0%に改善し、その一般化可能性を示す。

Dense prediction tasks such as segmentation and detection of pathological entities hold crucial clinical value in the digital pathology workflow. However, obtaining dense annotations on large cohorts is usually tedious and expensive. Contrastive learning (CL) is thus often employed to leverage large volumes of unlabeled data to pre-train the backbone network. To boost CL for dense prediction, some studies have proposed variations of dense matching objectives in pre-training. However, our analysis shows that employing existing dense matching strategies on histopathology images enforces invariance among incorrect pairs of dense features and, thus, is imprecise. To address this, we propose a precise location-based matching mechanism that utilizes the overlapping information between geometric transformations to precisely match regions in two augmentations. Extensive experiments on two pretraining datasets (TCGA-BRCA, NCT-CRC-HE) and three downstream datasets (GlaS, CRAG, BCSS) highlight the superiority of our method in semantic and instance segmentation tasks. Our method outperforms previous dense matching methods by up to 7.2 % in average precision for detection and 5.6 % in average precision for instance segmentation tasks. Additionally, by using our matching mechanism in the three popular contrastive learning frameworks, MoCo-v2, VICRegL and ConCL, the average precision in detection is improved by 0.7 % to 5.2 % and the average precision in segmentation is improved by 0.7 % to 4.0 %, demonstrating its generalizability.
翻訳日:2022-12-26 16:55:30 公開日:2022-12-23
# オープン語彙オブジェクト検出のための検出とセグメントの学習

Learning to Detect and Segment for Open Vocabulary Object Detection ( http://arxiv.org/abs/2212.12130v1 )

ライセンス: Link先を確認
Tao Wang and Nan Li(参考訳) オープンボキャブラリのオブジェクト検出は,最近開発された視覚言語事前学習モデルによって,意味カテゴリーのみを持つ新規なオブジェクトの認識を支援することで,大きく進歩している。 先行研究は、主にオブジェクト提案分類への知識伝達に焦点をあて、クラスに依存しないボックスとマスク予測を採用する。 本研究では,オープン語彙設定のためのボックス回帰とマスクセグメンテーションをより一般化する,原理的動的ネットワーク設計であるCondHeadを提案する。 中心となる考え方は、セマンティック埋め込みに基づいてネットワークヘッドを条件付きパラメータ化することで、新しいカテゴリをよりよく検出するために、クラス固有の知識でモデルが導かれることである。 特に、condheadは、動的に集約されたヘッドと動的に生成されたヘッドの2つのネットワークヘッドからなる。 前者は条件付き集約された静的なヘッドでインスタンス化され、これらのヘッドはエキスパートとして最適化され、洗練された予測を学ぶことが期待されている。 後者は動的に生成されたパラメータでインスタンス化し、一般的なクラス固有の情報をエンコードする。 このような条件付き設計により、検出モデルは意味埋め込みによって橋渡しされ、強い一般化可能なクラスワイズボックスとマスク予測を提供する。 提案手法は,最先端のオープンボキャブラリオブジェクト検出手法に非常に小さなオーバーヘッドで大幅な改善をもたらす。例えば,新しいカテゴリのAPを3.0で検出し,計算量はわずか1.1%に留まる。

Open vocabulary object detection has been greatly advanced by the recent development of vision-language pretrained model, which helps recognize novel objects with only semantic categories. The prior works mainly focus on knowledge transferring to the object proposal classification and employ class-agnostic box and mask prediction. In this work, we propose CondHead, a principled dynamic network design to better generalize the box regression and mask segmentation for open vocabulary setting. The core idea is to conditionally parameterize the network heads on semantic embedding and thus the model is guided with class-specific knowledge to better detect novel categories. Specifically, CondHead is composed of two streams of network heads, the dynamically aggregated head and the dynamically generated head. The former is instantiated with a set of static heads that are conditionally aggregated, these heads are optimized as experts and are expected to learn sophisticated prediction. The latter is instantiated with dynamically generated parameters and encodes general class-specific information. With such a conditional design, the detection model is bridged by the semantic embedding to offer strongly generalizable class-wise box and mask prediction. Our method brings significant improvement to the state-of-the-art open vocabulary object detection methods with very minor overhead, e.g., it surpasses a RegionClip model by 3.0 detection AP on novel categories, with only 1.1% more computation.
翻訳日:2022-12-26 16:54:59 公開日:2022-12-23
# オープンワールドにおける人間の活動認識

Human Activity Recognition in an Open World ( http://arxiv.org/abs/2212.12141v1 )

ライセンス: Link先を確認
Derek S. Prijatelj (1), Samuel Grieggs (1), Jin Huang (1), Dawei Du (2), Ameya Shringi (2), Christopher Funk (2), Adam Kaufman (3), Eric Robertson (3), Walter J. Scheirer (1) ((1) University of Notre Dame, (2) Kitware, (3) PAR Government)(参考訳) 認識に基づくヒューマンアクティビティ認識(HAR)における新規性の管理は、時間とともにタスクパフォーマンスを改善し、先行したサンプル以外のソリューションの一般化を保証するために、現実的な設定において重要である。 HARの新規性は、未確認サンプル、アクティビティ、オブジェクト、環境、センサーの変更などとして現れます。 新規性は、新しいクラスや新しい機能のようなタスク関連性や、ノイズやぼやけ、歪んだビデオ記録のようなニュアンスな新規性をもたらすタスク関連性がある。 HARを最適に実行するには、アルゴリズム的解法はニュアンス・ノベルティに寛容でなければならない。 本論文 1)HARにおける新規性の定義を分類タスクにおける新規性の定義に基づいて定式化する。 2は、インクリメンタルなオープンワールドラーニング(OWL)プロトコルを提案し、それをKineeticsデータセットに適用し、新しいベンチマークKOWL-718を生成する。 3)新奇性導入時の最新のharモデルの性能について分析する。 OWLプロトコルを再現し、今後のKineticsのアップデートを変更するためのコンテナ化およびパッケージ化されたパイプラインを提供する。 実験解析では, 様々な条件下で異なるモデルがどのように振る舞うかについて, 速度論的-avaでアノテートしたアブレーション研究を含む。 KOWL-718ベンチマークを使って実験を再現するためのアルゴリズムとしてのこのプロトコルは、https://github.com/prijatelj/ Human-active-recognition-an-open-worldでコードとコンテナとともに公開される。 コードは、Kineticsデータセットのさまざまなアノテーションとサブセットをインクリメンタルなオープンワールドな方法で分析するために使用され、Kineticsのさらなるアップデートがリリースされるにつれて拡張される。

Managing novelty in perception-based human activity recognition (HAR) is critical in realistic settings to improve task performance over time and ensure solution generalization outside of prior seen samples. Novelty manifests in HAR as unseen samples, activities, objects, environments, and sensor changes, among other ways. Novelty may be task-relevant, such as a new class or new features, or task-irrelevant resulting in nuisance novelty, such as never before seen noise, blur, or distorted video recordings. To perform HAR optimally, algorithmic solutions must be tolerant to nuisance novelty, and learn over time in the face of novelty. This paper 1) formalizes the definition of novelty in HAR building upon the prior definition of novelty in classification tasks, 2) proposes an incremental open world learning (OWL) protocol and applies it to the Kinetics datasets to generate a new benchmark KOWL-718, 3) analyzes the performance of current state-of-the-art HAR models when novelty is introduced over time, 4) provides a containerized and packaged pipeline for reproducing the OWL protocol and for modifying for any future updates to Kinetics. The experimental analysis includes an ablation study of how the different models perform under various conditions as annotated by Kinetics-AVA. The protocol as an algorithm for reproducing experiments using the KOWL-718 benchmark will be publicly released with code and containers at https://github.com/prijatelj/human-activity-recognition-in-an-open-world. The code may be used to analyze different annotations and subsets of the Kinetics datasets in an incremental open world fashion, as well as be extended as further updates to Kinetics are released.
翻訳日:2022-12-26 16:54:33 公開日:2022-12-23
# PanoViT:単一パノラマ画像からのルームレイアウト推定用視覚変換器

PanoViT: Vision Transformer for Room Layout Estimation from a Single Panoramic Image ( http://arxiv.org/abs/2212.12156v1 )

ライセンス: Link先を確認
Weichao Shen, Yuan Dong, Zonghao Chen, Zhengyi Zhao, Yang Gao, and Zhu Liu(参考訳) 本論文では,パノラマ画像から部屋のレイアウトを推定するパノラマ視覚変換器パノViTを提案する。 cnnモデルと比較すると,パノラマ画像からグローバル情報を学習し,複雑な部屋レイアウトの推定に熟練している。 視線画像と正方形画像の差を考慮すると,パノラマ画像処理のための新しい再帰的位置埋め込みとパッチサンプリング法を設計する。 グローバルな情報の抽出に加えて、パノラマ画像の局所的な幾何学的特徴を抽出する周波数領域エッジ拡張モジュールと3Dロスも備えている。 実験結果から,提案手法は室内配置予測精度において最先端の手法より優れていることが示された。

In this paper, we propose PanoViT, a panorama vision transformer to estimate the room layout from a single panoramic image. Compared to CNN models, our PanoViT is more proficient in learning global information from the panoramic image for the estimation of complex room layouts. Considering the difference between a perspective image and an equirectangular image, we design a novel recurrent position embedding and a patch sampling method for the processing of panoramic images. In addition to extracting global information, PanoViT also includes a frequency-domain edge enhancement module and a 3D loss to extract local geometric features in a panoramic image. Experimental results on several datasets demonstrate that our method outperforms state-of-the-art solutions in room layout prediction accuracy.
翻訳日:2022-12-26 16:54:04 公開日:2022-12-23
# 360{\deg}全方位画像における有向物体検出のためのマルチプロジェクションフュージョン・リファインメントネットワーク

Multi-Projection Fusion and Refinement Network for Salient Object Detection in 360{\deg} Omnidirectional Image ( http://arxiv.org/abs/2212.12378v1 )

ライセンス: Link先を確認
Runmin Cong, Ke Huang, Jianjun Lei, Yao Zhao, Qingming Huang, and Sam Kwong(参考訳) 局所物体検出(SOD)は、画像中の最も視覚的に魅力的な物体を決定することを目的としている。 仮想現実技術の発展により、360{\deg}の全方位画像が広く使われるようになったが、360{\deg}全方位画像におけるsodタスクは、その厳しい歪みと複雑なシーンのためにほとんど研究されていない。 本稿では,360{\deg}全方位画像中の有向物体を検出するマルチプロジェクション・フュージョン・リファインメント・ネットワーク(MPFR-Net)を提案する。 既存の方法と異なり、等価投影画像と対応する4つの立方体展開画像を同時に入力としてネットワークに埋め込み、立方体展開画像が等角投影画像の補足情報を提供するだけでなく、立方体地図投影のオブジェクト整合性を確保する。 これら2つのプロジェクションモードをフル活用するために、動的重み付け融合(DWF)モジュールは、異なるプロジェクションの特徴を相互および内部の特徴の観点から相補的および動的に適応的に統合するように設計されている。 さらに、エンコーダとデコーダの機能間のインタラクションの方法を完全に探求するために、Filtration and Refinement (FR)モジュールは、機能自体と機能の間の冗長な情報を抑制するように設計されている。 2つの全方向データセットにおける実験結果から,提案手法が定性的および定量的に最先端手法よりも優れていることが示された。

Salient object detection (SOD) aims to determine the most visually attractive objects in an image. With the development of virtual reality technology, 360{\deg} omnidirectional image has been widely used, but the SOD task in 360{\deg} omnidirectional image is seldom studied due to its severe distortions and complex scenes. In this paper, we propose a Multi-Projection Fusion and Refinement Network (MPFR-Net) to detect the salient objects in 360{\deg} omnidirectional image. Different from the existing methods, the equirectangular projection image and four corresponding cube-unfolding images are embedded into the network simultaneously as inputs, where the cube-unfolding images not only provide supplementary information for equirectangular projection image, but also ensure the object integrity of the cube-map projection. In order to make full use of these two projection modes, a Dynamic Weighting Fusion (DWF) module is designed to adaptively integrate the features of different projections in a complementary and dynamic manner from the perspective of inter and intra features. Furthermore, in order to fully explore the way of interaction between encoder and decoder features, a Filtration and Refinement (FR) module is designed to suppress the redundant information between the feature itself and the feature. Experimental results on two omnidirectional datasets demonstrate that the proposed approach outperforms the state-of-the-art methods both qualitatively and quantitatively.
翻訳日:2022-12-26 16:53:27 公開日:2022-12-23
# グラフ優先とグラフリファインメントによる物体の検出

Detecting Objects with Graph Priors and Graph Refinement ( http://arxiv.org/abs/2212.12395v1 )

ライセンス: Link先を確認
Aritra Bhowmik, Martin R. Oswald, Yu Wang, Nora Baka, Cees G. M. Snoek(参考訳) 本論文の目的は,相互関係を利用して物体を検出することである。 事前に定義されたラベル付きグラフ構造に頼るのではなく、オブジェクト共起統計からグラフを推測する。 本論文の重要なアイデアは,初期クラス予測と共起の関数としてオブジェクト関係をモデル化し,画像のグラフ表現を生成し,分類と境界ボックス回帰を改善することである。 また,エネルギーモデルを用いてオブジェクト相関結合分布を学習する。 この分布からサンプリングすると、画像の洗練されたグラフ表現が生成され、検出性能が向上する。 Visual Genome と MS-COCO データセットの実験では,本手法が検出不能でエンドツーエンドのトレーニングが可能で,まれなオブジェクトクラスに特に有用であることが示されている。 さらに、DeTRやFaster-RCNNのようなオブジェクト検出器よりも一貫した改善と、オブジェクト相互関係をモデル化する最先端の手法を確立します。

The goal of this paper is to detect objects by exploiting their interrelationships. Rather than relying on predefined and labeled graph structures, we infer a graph prior from object co-occurrence statistics. The key idea of our paper is to model object relations as a function of initial class predictions and co-occurrence priors to generate a graph representation of an image for improved classification and bounding box regression. We additionally learn the object-relation joint distribution via energy based modeling. Sampling from this distribution generates a refined graph representation of the image which in turn produces improved detection performance. Experiments on the Visual Genome and MS-COCO datasets demonstrate our method is detector agnostic, end-to-end trainable, and especially beneficial for rare object classes. What is more, we establish a consistent improvement over object detectors like DETR and Faster-RCNN, as well as state-of-the-art methods modeling object interrelationships.
翻訳日:2022-12-26 16:52:57 公開日:2022-12-23
# プッシュ・ザ・バウンダリ:3次元点雲のセマンティックセグメンテーションのための境界認識特徴伝搬

Push-the-Boundary: Boundary-aware Feature Propagation for Semantic Segmentation of 3D Point Clouds ( http://arxiv.org/abs/2212.12402v1 )

ライセンス: Link先を確認
Shenglan Du, Nail Ibrahimli, Jantien Stoter, Julian Kooij, Liangliang Nan(参考訳) フィードフォワード完全畳み込みニューラルネットワークは現在、3Dポイントクラウドのセマンティックセグメンテーションを支配している。 その大きな成功にもかかわらず、低レベル層での局所的な情報の喪失に苦しみ、正確なシーンのセグメンテーションと正確なオブジェクト境界のデライン化に重大な挑戦をした。 以前の作業では、後処理によってこの問題に対処するか、ネットワークの機能的エンコーディングを暗黙的に改善するためにオブジェクト境界を共同で学習する。 これらのアプローチは、しばしば元のアーキテクチャに組み込むのが難しい追加モジュールを必要とする。 オブジェクト境界近傍のセグメンテーションを改善するために,境界認識特徴伝播機構を提案する。 このメカニズムは、境界を元の場所に明示的に導くことを目的としたマルチタスク学習フレームワークを活用することで実現される。 1つの共有エンコーダで、我々のネットワーク出力は (i)境界ローカライゼーション (ii)対象物の内部を向いた方向の予測、及び (iii)3つの並列ストリームにおける意味セグメンテーション。 予測された境界と方向は融合し、学習した特徴を伝播させ、セグメンテーションを洗練させる。 我々は,s3disおよびsensaturbanデータセットの様々なベースライン法に対する広範囲な実験を行い,提案手法が境界誤差を低減し一貫した改善をもたらすことを示す。 私たちのコードはhttps://github.com/shenglandu/pushboundaryで利用可能です。

Feedforward fully convolutional neural networks currently dominate in semantic segmentation of 3D point clouds. Despite their great success, they suffer from the loss of local information at low-level layers, posing significant challenges to accurate scene segmentation and precise object boundary delineation. Prior works either address this issue by post-processing or jointly learn object boundaries to implicitly improve feature encoding of the networks. These approaches often require additional modules which are difficult to integrate into the original architecture. To improve the segmentation near object boundaries, we propose a boundary-aware feature propagation mechanism. This mechanism is achieved by exploiting a multi-task learning framework that aims to explicitly guide the boundaries to their original locations. With one shared encoder, our network outputs (i) boundary localization, (ii) prediction of directions pointing to the object's interior, and (iii) semantic segmentation, in three parallel streams. The predicted boundaries and directions are fused to propagate the learned features to refine the segmentation. We conduct extensive experiments on the S3DIS and SensatUrban datasets against various baseline methods, demonstrating that our proposed approach yields consistent improvements by reducing boundary errors. Our code is available at https://github.com/shenglandu/PushBoundary.
翻訳日:2022-12-26 16:52:42 公開日:2022-12-23
# 半教師付き学習と粗い意図検出による顧客サービス対話システムの構築

Discovering Customer-Service Dialog System with Semi-Supervised Learning and Coarse-to-Fine Intent Detection ( http://arxiv.org/abs/2212.12363v1 )

ライセンス: Link先を確認
Zhitong Yang, Xing Ma, Anqi Liu, Zheyu Zhang(参考訳) タスク指向ダイアログ(TOD)は,マルチターン会話による特定の目標達成を支援することを目的としている。 近年,大規模な事前学習モデルにより良好な結果が得られた。 しかし、ラベル付きデータの不足は、大規模にTODシステムの効率的な開発を妨げる。 本研究では,教師/学生のパラダイムに基づく弱教師付きデータセットを構築した。 さらに,モジュール型対話システムを構築し,ユーザ意図検出のための粒度分類を統合した。 実験により,提案手法は高い成功率で対話目標に達し,より一貫性のある応答を生成できることを示した。

Task-oriented dialog(TOD) aims to assist users in achieving specific goals through multi-turn conversation. Recently, good results have been obtained based on large pre-trained models. However, the labeled-data scarcity hinders the efficient development of TOD systems at scale. In this work, we constructed a weakly supervised dataset based on a teacher/student paradigm that leverages a large collection of unlabelled dialogues. Furthermore, we built a modular dialogue system and integrated coarse-to-fine grained classification for user intent detection. Experiments show that our method can reach the dialog goal with a higher success rate and generate more coherent responses.
翻訳日:2022-12-26 16:46:22 公開日:2022-12-23
# ソーシャルメディアからの片頭痛報告のための汎用自然言語処理フレームワーク

Generalizable Natural Language Processing Framework for Migraine Reporting from Social Media ( http://arxiv.org/abs/2212.12454v1 )

ライセンス: Link先を確認
Yuting Guo, Swati Rajwal, Sahithi Lakamana, Chia-Chun Chiang, Paul C. Menell, Adnan H. Shahid, Yi-Chieh Chen, Nikita Chhabra, Wan-Ju Chao, Chieh-Ju Chao, Todd J. Schwedt, Imon Banerjee, Abeed Sarker(参考訳) 片頭痛は高い評価と神経障害である。 しかし、実際の環境での情報偏頭痛管理は、従来の健康情報ソースに限られる可能性がある。 本稿では, (i)偏頭痛に関連するおしゃべりがソーシャルメディア(twitter及びreddit)で利用可能であることを確認する。 (ii)自己申告片頭痛関連投稿を自動的に検出するプラットフォーム非依存のテキスト分類システムの開発、及び (iii)この問題を研究するためのソーシャルメディアの有用性を評価するために、自己報告投稿の分析を行う。 5750のtwitter投稿と302のreddit投稿を手動で注釈した。 われわれのシステムはTwitterで0.90点、Redditで0.93点を記録した。 我々の「移行コホート」が投稿した情報から、片頭痛治療と関連する患者の感情に関する多くの関連情報が明らかになった。 本研究は,ソーシャルメディアデータを用いた片頭痛関連情報の詳細な分析を行う基盤となる。

Migraine is a high-prevalence and disabling neurological disorder. However, information migraine management in real-world settings could be limited to traditional health information sources. In this paper, we (i) verify that there is substantial migraine-related chatter available on social media (Twitter and Reddit), self-reported by migraine sufferers; (ii) develop a platform-independent text classification system for automatically detecting self-reported migraine-related posts, and (iii) conduct analyses of the self-reported posts to assess the utility of social media for studying this problem. We manually annotated 5750 Twitter posts and 302 Reddit posts. Our system achieved an F1 score of 0.90 on Twitter and 0.93 on Reddit. Analysis of information posted by our 'migraine cohort' revealed the presence of a plethora of relevant information about migraine therapies and patient sentiments associated with them. Our study forms the foundation for conducting an in-depth analysis of migraine-related information using social media data.
翻訳日:2022-12-26 16:46:16 公開日:2022-12-23
# ファンフィクションのコンテンツ評価分類

Content Rating Classification for Fan Fiction ( http://arxiv.org/abs/2212.12496v1 )

ライセンス: Link先を確認
Yu Qiao and James Pope(参考訳) コンテンツ評価は、様々なメディア製品の適合性を決定することができる。 近年のファンフィクションの出現により、ファンフィクションのコンテンツ評価の重大な問題が浮上した。 ファンフィクションのコンテンツレーティングが自主的に行われるか、あるいは規制によって必要とされるかは、コンテンツレーティングの分類を自動化する必要がある。 問題は、ファンフィクションのテキストを取得し、適切なコンテンツ評価を決定することだ。 オンライン書籍などの他のドメインの手法は試みられているが、ファンフィクションには適用されていない。 そこで本研究では,自然言語処理手法として従来型および深層学習法を提案し,コンテンツ評価を自動的に決定する。 これらの手法は,複数分類の精度が低いことを示す。 次に,問題を二分分類問題として扱うと精度が向上することを示す。 最後に, 自己注釈のアプローチが, 分類結果の制限を誤ったラベルに導いたことを確信し, 示唆する。

Content ratings can enable audiences to determine the suitability of various media products. With the recent advent of fan fiction, the critical issue of fan fiction content ratings has emerged. Whether fan fiction content ratings are done voluntarily or required by regulation, there is the need to automate the content rating classification. The problem is to take fan fiction text and determine the appropriate content rating. Methods for other domains, such as online books, have been attempted though none have been applied to fan fiction. We propose natural language processing techniques, including traditional and deep learning methods, to automatically determine the content rating. We show that these methods produce poor accuracy results for multi-classification. We then demonstrate that treating the problem as a binary classification problem produces better accuracy. Finally, we believe and provide some evidence that the current approach of self-annotating has led to incorrect labels limiting classification results.
翻訳日:2022-12-26 16:46:03 公開日:2022-12-23
# MicroBERT:パラメータ削減とマルチタスク学習による低リソース単言語BERTの効果的学習

MicroBERT: Effective Training of Low-resource Monolingual BERTs through Parameter Reduction and Multitask Learning ( http://arxiv.org/abs/2212.12510v1 )

ライセンス: Link先を確認
Luke Gessler, Amir Zeldes(参考訳) トランスフォーマー言語モデル(TLM)は、ほとんどのNLPタスクには必須であるが、必要な事前学習データが多いため、低リソース言語では作成が困難である。 本研究では,tlmサイズを大幅に削減し,2つの言語的リッチな教師付きタスク (part-of-speech taggingとdependency parse) によるマスク型言語モデリング目標を補完する,低リソース環境での一言語tlmを訓練するための2つの手法について検討した。 7つの多様な言語から得られた結果から,私たちのモデルであるMicroBERTは,典型的なモノリンガルなTLM事前学習手法と比較して,下流タスク評価において顕著な改善を達成できることが示された。 具体的には,マルチリンガルベースラインであるmBERTに比べて,パーサLASが最大18%,NER F1が11%,パラメータ数が1%未満である。 我々は、TLMパラメータ数を減らし、ラベル付きデータを用いて低リソースのTLMを事前訓練することで、大きな品質上の利点が得られると結論付け、場合によってはマルチランガルアプローチよりも優れたモデルを生成する。

Transformer language models (TLMs) are critical for most NLP tasks, but they are difficult to create for low-resource languages because of how much pretraining data they require. In this work, we investigate two techniques for training monolingual TLMs in a low-resource setting: greatly reducing TLM size, and complementing the masked language modeling objective with two linguistically rich supervised tasks (part-of-speech tagging and dependency parsing). Results from 7 diverse languages indicate that our model, MicroBERT, is able to produce marked improvements in downstream task evaluations relative to a typical monolingual TLM pretraining approach. Specifically, we find that monolingual MicroBERT models achieve gains of up to 18% for parser LAS and 11% for NER F1 compared to a multilingual baseline, mBERT, while having less than 1% of its parameter count. We conclude reducing TLM parameter count and using labeled data for pretraining low-resource TLMs can yield large quality benefits and in some cases produce models that outperform multilingual approaches.
翻訳日:2022-12-26 16:45:50 公開日:2022-12-23
# HiTSKT:セッション認識知識追跡のための階層型トランスフォーマーモデル

HiTSKT: A Hierarchical Transformer Model for Session-Aware Knowledge Tracing ( http://arxiv.org/abs/2212.12139v1 )

ライセンス: Link先を確認
Fucai Ke, Weiqing Wang, Weicong Tan, Lan Du, Yuan Jin, Yujin Huang and Hongzhi Yin(参考訳) 知識追跡(KT)は、学生の学習履歴を活用して、事前に定義された一連のスキルに基づいて熟達レベルを推定することを目的としており、それに対応する将来のパフォーマンスを正確に予測できる。 実際には、学生の学習履歴は、単に独立した回答の列であるのではなく、セッションとして知られる一連の集団的な質問に対する回答を含んでいる。 理論的には、これらのセッションの中で、学生の学習力学は非常に異なる。 したがって、KT問題に対処するためには、セッション内外の学生の知識状態のダイナミクスを効果的にモデル化する方法が不可欠である。 既存のKTモデルは、学生の知識状態のセッションシフトを捉えずに、学生の学習記録を単一の継続シーケンスとして扱う。 上記の課題に対処するため,HiTSKTと呼ばれる新しい階層型トランスフォーマーモデルを提案する。セッション内で取得した知識をキャプチャするインタラクション(レベル)エンコーダと,過去のセッション間で取得した知識を要約するセッション(レベル)エンコーダを備える。 現在のセッションにおけるインタラクションを予測するために、知識検索者は、要約された過去の知識と過去のインタラクションの情報とを適切な知識表現に統合する。 これらの表現は、生徒の現在の知識状態を計算するために使われる。 さらに、学生の長期的忘れ行動をセッション全体にわたってモデル化するために、セッションエンコーダにパワーロー・デカイ・アテンションメカニズムを設計し、デプロイすることで、最近のセッションをより強調することができる。 3つの公開データセットに対する大規模な実験は、HiTSKTが6つの最先端KTモデルと比較して、すべてのデータセットで新しい最先端のパフォーマンスを達成することを示した。

Knowledge tracing (KT) aims to leverage students' learning histories to estimate their mastery levels on a set of pre-defined skills, based on which the corresponding future performance can be accurately predicted. In practice, a student's learning history comprises answers to sets of massed questions, each known as a session, rather than merely being a sequence of independent answers. Theoretically, within and across these sessions, students' learning dynamics can be very different. Therefore, how to effectively model the dynamics of students' knowledge states within and across the sessions is crucial for handling the KT problem. Most existing KT models treat student's learning records as a single continuing sequence, without capturing the sessional shift of students' knowledge state. To address the above issue, we propose a novel hierarchical transformer model, named HiTSKT, comprises an interaction(-level) encoder to capture the knowledge a student acquires within a session, and a session(-level) encoder to summarise acquired knowledge across the past sessions. To predict an interaction in the current session, a knowledge retriever integrates the summarised past-session knowledge with the previous interactions' information into proper knowledge representations. These representations are then used to compute the student's current knowledge state. Additionally, to model the student's long-term forgetting behaviour across the sessions, a power-law-decay attention mechanism is designed and deployed in the session encoder, allowing it to emphasize more on the recent sessions. Extensive experiments on three public datasets demonstrate that HiTSKT achieves new state-of-the-art performance on all the datasets compared with six state-of-the-art KT models.
翻訳日:2022-12-26 16:45:07 公開日:2022-12-23
# 連続空間を有する制約付きpomdpのデュアルアセンシングによるオンラインプランニング

Online Planning for Constrained POMDPs with Continuous Spaces through Dual Ascent ( http://arxiv.org/abs/2212.12154v1 )

ライセンス: Link先を確認
Arec Jamgochian, Anthony Corso, Mykel J. Kochenderfer(参考訳) 望ましくない行動に対する罰則による報酬を増大させる代わりに、制限された部分的に観察可能なマルコフ決定プロセス(CPOMDP)は、侵害可能なハード制約価値予算を課すことで安全に計画する。 従来のCPOMDPのオンラインプランニング作業は、離散的な行動空間や観測空間にのみ適用されてきた。 本研究では,連続状態,行動,観察空間に対するオンラインcpomdp計画のためのアルゴリズムを提案する。 我々は,おもちゃと現実世界の安全クリティカルな問題をモデル化した連続CPOMDPに対する提案アルゴリズムの有効性を実証的に比較した。 さらに,コスト制約を報酬にスカラー化する連続無拘束pomdpに対するオンラインソルバの利用と比較し,楽観的コスト伝達の効果について検討した。

Rather than augmenting rewards with penalties for undesired behavior, Constrained Partially Observable Markov Decision Processes (CPOMDPs) plan safely by imposing inviolable hard constraint value budgets. Previous work performing online planning for CPOMDPs has only been applied to discrete action and observation spaces. In this work, we propose algorithms for online CPOMDP planning for continuous state, action, and observation spaces by combining dual ascent with progressive widening. We empirically compare the effectiveness of our proposed algorithms on continuous CPOMDPs that model both toy and real-world safety-critical problems. Additionally, we compare against the use of online solvers for continuous unconstrained POMDPs that scalarize cost constraints into rewards, and investigate the effect of optimistic cost propagation.
翻訳日:2022-12-26 16:44:23 公開日:2022-12-23
# 強化学習を用いたtic tac toeの高次基板状態解決のための一般化エージェント

Generalised agent for solving higher board states of tic tac toe using Reinforcement Learning ( http://arxiv.org/abs/2212.12252v1 )

ライセンス: Link先を確認
Bhavuk Kalra(参考訳) Tic Tac Toeは最も有名なゲームだ。 既に偏りのあるゲームであることが示されており、一方のプレイヤーが引き分けや負けだけを残して勝利する機会が増えており、双方のプレイヤーが最適にプレーすることを前提としている。 この結果、試合のほとんどの試合が引き分けとなった。 tic tac toeボード状態の解決方法に関する最新の研究の大部分は、遺伝的アルゴリズム、ニューラルネットワーク、共進化、進化的プログラミングといった戦略を採用している。 しかし、これらのアプローチは3X3の自明なボード状態を扱うため、一般化されたアルゴリズムが4X4,5X5,6X6および多くの高次状態を解決するための研究はほとんど行われていない。 Min-Maxアルゴリズムが存在するとしても、その再帰的な実装の性質のため、理想的な動きを思いつくには多くの時間がかかる。 この事実を証明するために、このリンク上にサンプルが作成されている。 本研究は,tic tac toeの高次基板状態に対する一般化アルゴリズム(近似法,学習ベース)を提供することにより,短時間で高精度な動作を実現することを目的とした。 また、より高いボード状態に対応するために必要なコード変更は、名目上行われる。 そのアイデアは、tic tac toe gameを適切な学習問題として位置づけることにある。 この研究とその成果は有望であり、トレーニングの各時代において高い引き分け率を得られる。 この研究は、ミネズウィーパー、チェス、goなどの類似のボードゲームに同じアルゴリズムを適用して効率的な戦略を見つけ、結果を比較することを他の研究者に促すかもしれない。

Tic Tac Toe is amongst the most well-known games. It has already been shown that it is a biased game, giving more chances to win for the first player leaving only a draw or a loss as possibilities for the opponent, assuming both the players play optimally. Thus on average majority of the games played result in a draw. The majority of the latest research on how to solve a tic tac toe board state employs strategies such as Genetic Algorithms, Neural Networks, Co-Evolution, and Evolutionary Programming. But these approaches deal with a trivial board state of 3X3 and very little research has been done for a generalized algorithm to solve 4X4,5X5,6X6 and many higher states. Even though an algorithm exists which is Min-Max but it takes a lot of time in coming up with an ideal move due to its recursive nature of implementation. A Sample has been created on this link \url{https://bk-tic-tac-toe.herokuapp.com/} to prove this fact. This is the main problem that this study is aimed at solving i.e providing a generalized algorithm(Approximate method, Learning-Based) for higher board states of tic tac toe to make precise moves in a short period. Also, the code changes needed to accommodate higher board states will be nominal. The idea is to pose the tic tac toe game as a well-posed learning problem. The study and its results are promising, giving a high win to draw ratio with each epoch of training. This study could also be encouraging for other researchers to apply the same algorithm to other similar board games like Minesweeper, Chess, and GO for finding efficient strategies and comparing the results.
翻訳日:2022-12-26 16:44:01 公開日:2022-12-23
# 最適潮流のためのグラフニューラルネットワークによる近方政策最適化

Proximal Policy Optimization with Graph Neural Networks for Optimal Power Flow ( http://arxiv.org/abs/2212.12470v1 )

ライセンス: Link先を確認
\'Angela L\'opez-Cardona and Guillermo Bern\'ardez and Pere Barlet-Ros and Albert Cabellos-Aparicio(参考訳) 最適潮流(optimize power flow、opf)は電力系統分野における非常に伝統的な研究領域であり、発電所の最適運転点を求めており、現実のシナリオでは数分ごとに解く必要がある。 しかし、発電システムに発生する非凸性のため、完全な交流電流最適電力流(ACOPF)のための高速で堅牢な解法がまだ存在しない。 過去数十年間、電力グリッドは電力システムとして知られる典型的な動的で非線形で大規模な制御システムへと進化してきたため、より高速なACOPFソリューションの探索が重要になっている。 グラフニューラルネットワーク(GNN)の出現により、電力ネットワークなどのグラフデータに機械学習(ML)アルゴリズムを自然に使用できるようになった。 一方で、深層強化学習(drl)は複雑な意思決定問題を解決する強力な能力で知られている。 この2つの手法を別々に用いた解法は文献に現れ始めているが、両者の利点を組み合わさってはいない。 本稿では,グラフニューラルネットワークを用いた近似ポリシ最適化アルゴリズムに基づく新しいアーキテクチャを提案する。 目的は最適化問題を解決する方法を学ぶアーキテクチャを設計することであり、同時に、目に見えないシナリオに一般化することができる。 IEEE 30バスシステム上でDRLエージェントを訓練し,そのベースネットワーク上でOPFをトポロジ変更で計算した後,コスト面でDCOPFと比較した。

Optimal Power Flow (OPF) is a very traditional research area within the power systems field that seeks for the optimal operation point of electric power plants, and which needs to be solved every few minutes in real-world scenarios. However, due to the nonconvexities that arise in power generation systems, there is not yet a fast, robust solution technique for the full Alternating Current Optimal Power Flow (ACOPF). In the last decades, power grids have evolved into a typical dynamic, non-linear and large-scale control system, known as the power system, so searching for better and faster ACOPF solutions is becoming crucial. Appearance of Graph Neural Networks (GNN) has allowed the natural use of Machine Learning (ML) algorithms on graph data, such as power networks. On the other hand, Deep Reinforcement Learning (DRL) is known for its powerful capability to solve complex decision-making problems. Although solutions that use these two methods separately are beginning to appear in the literature, none has yet combined the advantages of both. We propose a novel architecture based on the Proximal Policy Optimization algorithm with Graph Neural Networks to solve the Optimal Power Flow. The objective is to design an architecture that learns how to solve the optimization problem and that is at the same time able to generalize to unseen scenarios. We compare our solution with the DCOPF in terms of cost after having trained our DRL agent on IEEE 30 bus system and then computing the OPF on that base network with topology changes
翻訳日:2022-12-26 16:43:34 公開日:2022-12-23
# 個人情報を用いた人-機械インタラクションのためのオフライン強化学習

Offline Reinforcement Learning for Human-Guided Human-Machine Interaction with Private Information ( http://arxiv.org/abs/2212.12167v1 )

ライセンス: Link先を確認
Zuyue Fu, Zhengling Qi, Zhuoran Yang, Zhaoran Wang, Lan Wang(参考訳) 顧客満足度を高めるためにチャットボットを訓練するなど、人間と機械の相互作用に動機づけられ、個人情報を含む人間と機械の相互作用を研究した。 我々は,このインタラクションを,一方のプレイヤー(アリス,人間)が他方のプレイヤー(ボブ,機械)を共通の目標に向かって誘導する2人プレイのターンベースゲームとしてモデル化する。 具体的には、このゲームでオフライン強化学習(rl)にフォーカスし、aliceとbobのポリシーペアを見つけ、事前に収集したオフラインデータセットに基づいて、期待される総報酬を最大化する。 オフライン設定には2つの課題がある。 (i)Bobの個人情報は収集できないため、標準のRLメソッドを使用する場合、バイアスが発生する。 (二)データ収集に使用する行動方針と我々が学習しようとする望ましい方針との分布的ミスマッチ。 共起バイアスに対処するため、Alice の現在の判断のための器用変数として、Bob の以前の動作を扱い、未測定共起の調整を行う。 そこで我々は,この2人のターンベースゲームにおいて,ポリシーペアを評価するための新たなオフ政治評価手法(OPE)を提案する。 分布的ミスマッチに取り組むために,我々は悲観主義の考え方を活用し,我々のope法を用いて,aliceとbobの双方にとって望ましいポリシーペアを見つけるためのオフポリシー学習アルゴリズムを開発した。 最後に,オフラインデータの部分的カバレッジのような穏やかな仮定の下では,本手法で得られたポリシーペアが満足のいく速度で最適なものへと収束することを示す。

Motivated by the human-machine interaction such as training chatbots for improving customer satisfaction, we study human-guided human-machine interaction involving private information. We model this interaction as a two-player turn-based game, where one player (Alice, a human) guides the other player (Bob, a machine) towards a common goal. Specifically, we focus on offline reinforcement learning (RL) in this game, where the goal is to find a policy pair for Alice and Bob that maximizes their expected total rewards based on an offline dataset collected a priori. The offline setting presents two challenges: (i) We cannot collect Bob's private information, leading to a confounding bias when using standard RL methods, and (ii) a distributional mismatch between the behavior policy used to collect data and the desired policy we aim to learn. To tackle the confounding bias, we treat Bob's previous action as an instrumental variable for Alice's current decision making so as to adjust for the unmeasured confounding. We develop a novel identification result and use it to propose a new off-policy evaluation (OPE) method for evaluating policy pairs in this two-player turn-based game. To tackle the distributional mismatch, we leverage the idea of pessimism and use our OPE method to develop an off-policy learning algorithm for finding a desirable policy pair for both Alice and Bob. Finally, we prove that under mild assumptions such as partial coverage of the offline data, the policy pair obtained through our method converges to the optimal one at a satisfactory rate.
翻訳日:2022-12-26 16:37:41 公開日:2022-12-23
# SMC法における統計的距離に基づく決定論的子孫選択

Statistical Distance Based Deterministic Offspring Selection in SMC Methods ( http://arxiv.org/abs/2212.12290v1 )

ライセンス: Link先を確認
Oskar Kviman, Hazal Koptagel, Harald Melin, Jens Lagergren(参考訳) 長年にわたって、シーケンシャル・モンテカルロ(SMC)と等価に、粒子フィルタ(PF)理論は研究者から大きな注目を集めてきた。 しかし,近年,サンプル選択と呼ばれる再サンプリング手法の性能は向上していない。 そこで本研究では,kl(kullback-leibler)の発散を最小化することを目的とした2つの決定論的オフスプリング選択法を提案する。 選択された子孫とジョイント分布との間の統計的距離を減少させることにより、後者がsmcよりも優れた文脈において、最大確率探索よりも優れたヒューリスティック探索手順を得る。 SMCおよび粒子マルコフ連鎖モンテカルロ (pMCMC) では, 提案する子孫選択法は, 文献のベンチマークとしてよく用いられる2つのモデルに対する2つの最先端再サンプリング方式よりも優れ, 好意的に比較できる。

Over the years, sequential Monte Carlo (SMC) and, equivalently, particle filter (PF) theory has gained substantial attention from researchers. However, the performance of the resampling methodology, also known as offspring selection, has not advanced recently. We propose two deterministic offspring selection methods, which strive to minimize the Kullback-Leibler (KL) divergence and the total variation (TV) distance, respectively, between the particle distribution prior and subsequent to the offspring selection. By reducing the statistical distance between the selected offspring and the joint distribution, we obtain a heuristic search procedure that performs superior to a maximum likelihood search in precisely those contexts where the latter performs better than an SMC. For SMC and particle Markov chain Monte Carlo (pMCMC), our proposed offspring selection methods always outperform or compare favorably with the two state-of-the-art resampling schemes on two models commonly used as benchmarks from the literature.
翻訳日:2022-12-26 16:37:13 公開日:2022-12-23
# 物理インフォームドガウス過程回帰は線形PDE解を一般化する

Physics-Informed Gaussian Process Regression Generalizes Linear PDE Solvers ( http://arxiv.org/abs/2212.12474v1 )

ライセンス: Link先を確認
Marvin Pf\"ortner and Ingo Steinwart and Philipp Hennig and Jonathan Wenger(参考訳) 線形偏微分方程式(英: Linear partial differential equation, PDEs)は、熱伝達、電磁気、波動伝播などの物理過程を記述する重要な力学モデルのクラスである。 実際には、離散化に基づく特殊数値法を用いてPDEを解く。 一般に、未知のモデルパラメータの見積もりと、可能であれば初期化の物理的測定を用いる。 このような解法は、しばしばより大きな科学的モデルや下流のアプリケーションによる分析に埋め込まれ、誤りの定量化が重要な役割を果たす。 しかし、パラメータや測定の不確実性を完全に無視することで、古典的pdeソルバは固有近似誤差の一貫した推定を導出できない可能性がある。 本研究では、線形PDEを物理インフォームドガウス過程(GP)回帰として解釈することで、この問題を原理的にアプローチする。 我々の枠組みは、任意の有界線型作用素による観測に対する有限個の直接観測をgpsに条件付けるための広く適用された定理の鍵一般化に基づいている。 この確率論的視点は、(1)固有の離散化誤差の定量化、(2)モデルパラメータの不確かさを解に伝播させ、(3)ノイズ測定の条件を与える。 この定式化の強さを実証し、重み付け残差法、コロケーション、有限体積、擬スペクトル、および有限要素法やスペクトル法のような(一般化)ガレルキン法を含むPDEソルバの中心クラスを厳密に一般化することを証明する。 したがって、このクラスは構造化されたエラー推定と不確定なモデルパラメータと観測を組み込む能力を直接備えることができる。 まとめると、この結果により、モジュラービルディングブロックとしての機械モデルと確率モデルとのシームレスな統合が可能となる。

Linear partial differential equations (PDEs) are an important, widely applied class of mechanistic models, describing physical processes such as heat transfer, electromagnetism, and wave propagation. In practice, specialized numerical methods based on discretization are used to solve PDEs. They generally use an estimate of the unknown model parameters and, if available, physical measurements for initialization. Such solvers are often embedded into larger scientific models or analyses with a downstream application such that error quantification plays a key role. However, by entirely ignoring parameter and measurement uncertainty, classical PDE solvers may fail to produce consistent estimates of their inherent approximation error. In this work, we approach this problem in a principled fashion by interpreting solving linear PDEs as physics-informed Gaussian process (GP) regression. Our framework is based on a key generalization of a widely-applied theorem for conditioning GPs on a finite number of direct observations to observations made via an arbitrary bounded linear operator. Crucially, this probabilistic viewpoint allows to (1) quantify the inherent discretization error; (2) propagate uncertainty about the model parameters to the solution; and (3) condition on noisy measurements. Demonstrating the strength of this formulation, we prove that it strictly generalizes methods of weighted residuals, a central class of PDE solvers including collocation, finite volume, pseudospectral, and (generalized) Galerkin methods such as finite element and spectral methods. This class can thus be directly equipped with a structured error estimate and the capability to incorporate uncertain model parameters and observations. In summary, our results enable the seamless integration of mechanistic models as modular building blocks into probabilistic models.
翻訳日:2022-12-26 16:36:52 公開日:2022-12-23
# より大きなトランスフォーマーベースの言語モデルのsurprisalは、なぜ人間の読書時間に不適合なのだろうか?

Why Does Surprisal From Larger Transformer-Based Language Models Provide a Poorer Fit to Human Reading Times? ( http://arxiv.org/abs/2212.12131v1 )

ライセンス: Link先を確認
Byung-Doh Oh, William Schuler(参考訳) 本研究は,トランスフォーマーをベースとした事前学習型言語モデルにおいて,パラメータが増加し,パープレクシリティが低下する理由について,より詳細な言語学的分析を行った。 まず、回帰分析により、より最近リリースされた5つの GPT-Neo 変種と8つの OPT 変種に対して、パープレキシティと読み取り時間との厳密な単調で正の対数関係が示され、以前の結果は単に GPT-2 (Oh et al., 2022) に限られていた。 その後、残差の解析により、名前の付いたエンティティの読み出し時間の過小評価や、モーダルや接続といった関数語の読み出し時間に対する補償的過小評価など、大きなバリエーションの体系的なずれが明らかになった。 これらの結果から, 大規模変圧器モデルから学習中の「記憶」シーケンスへの適応性は, 人的期待から逸脱し, 事前学習した言語モデルを用いて人間の言語処理を研究する際の注意が必要であることが示唆された。

This work presents a detailed linguistic analysis into why larger Transformer-based pre-trained language models with more parameters and lower perplexity nonetheless yield surprisal estimates that are less predictive of human reading times. First, regression analyses show a strictly monotonic, positive log-linear relationship between perplexity and fit to reading times for the more recently released five GPT-Neo variants and eight OPT variants on two separate datasets, replicating earlier results limited to just GPT-2 (Oh et al., 2022). Subsequently, analysis of residual errors reveals a systematic deviation of the larger variants, such as underpredicting reading times of named entities and making compensatory overpredictions for reading times of function words such as modals and conjunctions. These results suggest that the propensity of larger Transformer-based models to 'memorize' sequences during training makes their surprisal estimates diverge from humanlike expectations, which warrants caution in using pre-trained language models to study human language processing.
翻訳日:2022-12-26 16:35:02 公開日:2022-12-23
# ダビングの実践: 自動ダビングのためのインサイトを用いた人的位置決めの大規模研究

Dubbing in Practice: A Large Scale Study of Human Localization With Insights for Automatic Dubbing ( http://arxiv.org/abs/2212.12137v1 )

ライセンス: Link先を確認
William Brannon, Yogesh Virkar, Brian Thompson(参考訳) 本研究では,54作品から319.57時間のビデオコーパスを生かして,人間がある言語から別の言語にビデオコンテンツをダビングする作業を行う方法について検討する。 これは私たちが知る中で初めての大規模な研究です。 その結果、人間のダビングに関する定性的文献と自動ダビングに関する機械学習文献の両方で一般的な仮定に挑戦し、一般的な強調された等尺性(特徴量長)とリップシンク制約よりも声の自然性と翻訳品質の重要性、そしてより適格な等時性(ティムング)制約の重要性について論じた。 また、翻訳の単語以外のチャネルを通して、音源側の音声が人間のダビングに与える影響も確認し、自動ダビングシステムにおいて、音声の特徴の保存方法や強調/感情といった意味的伝達の研究が必要であることを指摘した。

We investigate how humans perform the task of dubbing video content from one language into another, leveraging a novel corpus of 319.57 hours of video from 54 professionally produced titles. This is the first such large-scale study we are aware of. The results challenge a number of assumptions commonly made in both qualitative literature on human dubbing and machine-learning literature on automatic dubbing, arguing for the importance of vocal naturalness and translation quality over commonly emphasized isometric (character length) and lip-sync constraints, and for a more qualified view of the importance of isochronic (timing) constraints. We also find substantial influence of the source-side audio on human dubs through channels other than the words of the translation, pointing to the need for research on ways to preserve speech characteristics, as well as semantic transfer such as emphasis/emotion, in automatic dubbing systems.
翻訳日:2022-12-26 16:34:37 公開日:2022-12-23
# 文選択によるテキスト生成の強化による質問生成の学習

Learning to Generate Questions by Enhancing Text Generation with Sentence Selection ( http://arxiv.org/abs/2212.12192v1 )

ライセンス: Link先を確認
Do Hoang Thai Duong, Nguyen Hong Son, Hung Le, Minh-Tien Nguyen(参考訳) 回答認識型質問生成問題に対するアプローチを提案する。 強固な事前学習された言語モデルの能力のみに頼るのではなく、文脈内のいくつかの関連文で回答や質問の情報が見つかることを観察する。 それに基づいて,セレクタとジェネレータという2つのモジュールを含むモデルを設計する。 セレクタは、暗黙のローカル情報を提供するために、解答に関する関連文にもっと集中するようにモデルを強制する。 生成器は、セレクタからのローカル情報と、エンコーダによって符号化されたコンテキスト全体からグローバル情報とを暗黙的に組み合わせて質問を生成する。 このモデルは2つのモジュール間の遅延相互作用を活用するために共同で訓練されている。 2つのベンチマークデータセットの実験結果から,質問生成タスクにおいて,我々のモデルは強い事前学習モデルよりも優れていることが示された。 コードも利用可能である(shorturl.at/lV567)。

We introduce an approach for the answer-aware question generation problem. Instead of only relying on the capability of strong pre-trained language models, we observe that the information of answers and questions can be found in some relevant sentences in the context. Based on that, we design a model which includes two modules: a selector and a generator. The selector forces the model to more focus on relevant sentences regarding an answer to provide implicit local information. The generator generates questions by implicitly combining local information from the selector and global information from the whole context encoded by the encoder. The model is trained jointly to take advantage of latent interactions between the two modules. Experimental results on two benchmark datasets show that our model is better than strong pre-trained models for the question generation task. The code is also available (shorturl.at/lV567).
翻訳日:2022-12-26 16:34:16 公開日:2022-12-23
# 説明可能なAIを用いたCNNを用いたベンガル手書きディジット認識

Bengali Handwritten Digit Recognition using CNN with Explainable AI ( http://arxiv.org/abs/2212.12146v1 )

ライセンス: Link先を確認
Md Tanvir Rouf Shawon, Raihan Tanvir, Md. Golam Rabiul Alam(参考訳) 手書き文字認識は近年研究の話題となっている。 光文字認識(ocr)技術を用いて手書きの紙をテキスト検索可能な文書に変換することができれば,その内容を容易に理解でき,手書きの文書を読む必要もない。 英語のOCRは非常に一般的ですが、ベンガル語では、高品質なOCRアプリケーションを見つけるのは非常に困難です。 機械学習とディープラーニングをOCRとマージできれば、この分野に多大な貢献ができます。 様々な研究者がベンガル文字を認識する戦略を提案している。 多くのMLアルゴリズムとディープニューラルネットワークが彼らの研究で使用されたが、モデルの説明は得られていない。 私たちの研究では、さまざまな機械学習アルゴリズムとCNNを使って手書きのベンガル数字を認識しました。 いくつかのMLモデルから許容できる精度を得ており、CNNは素晴らしいテスト精度を与えてくれました。 Grad-CAMは、我々のCNNモデルにおけるXAI手法として使われ、モデルに対する洞察を与え、画像から数字を認識する際の興味の起源を検出するのに役立った。

Handwritten character recognition is a hot topic for research nowadays. If we can convert a handwritten piece of paper into a text-searchable document using the Optical Character Recognition (OCR) technique, we can easily understand the content and do not need to read the handwritten document. OCR in the English language is very common, but in the Bengali language, it is very hard to find a good quality OCR application. If we can merge machine learning and deep learning with OCR, it could be a huge contribution to this field. Various researchers have proposed a number of strategies for recognizing Bengali handwritten characters. A lot of ML algorithms and deep neural networks were used in their work, but the explanations of their models are not available. In our work, we have used various machine learning algorithms and CNN to recognize handwritten Bengali digits. We have got acceptable accuracy from some ML models, and CNN has given us great testing accuracy. Grad-CAM was used as an XAI method on our CNN model, which gave us insights into the model and helped us detect the origin of interest for recognizing a digit from an image.
翻訳日:2022-12-26 16:28:04 公開日:2022-12-23
# DALL-EとFlamingoはお互いに理解しているのか?

Do DALL-E and Flamingo Understand Each Other? ( http://arxiv.org/abs/2212.12249v1 )

ライセンス: Link先を確認
Hang Li, Jindong Gu, Rajat Koner, Sahand Sharifzadeh, Volker Tresp(参考訳) マルチモーダル研究の大きな目標は、画像とテキストの機械的理解を改善することである。 タスクには、画像キャプション、テキストから画像への生成、視覚言語表現学習が含まれる。 これまでの研究は、画像とテキストの関係に焦点を当ててきた。 例えば、キャプションモデルは、その後テキストに変換される画像の意味を理解しようとする。 どのアノテーションが画像コンテンツの深い理解を最善に反映しているか? 同様に、テキストが与えられたとき、テキストの意味を表現できる最良のイメージは何ですか? 本研究では,与えられた画像に対して最適なテキストやキャプションは,その画像に最もよく似た画像を生成するテキストである,と論じる。 同様に、与えられたテキストの最良の画像は、元のテキストと最もよく一致したキャプションの結果となる画像である。 そこで本稿では,テキスト対画像生成モデルと画像対テキスト生成モデルの両方を含む統一フレームワークを提案する。 広範な実験は我々のアプローチを検証する。

A major goal of multimodal research is to improve machine understanding of images and text. Tasks include image captioning, text-to-image generation, and vision-language representation learning. So far, research has focused on the relationships between images and text. For example, captioning models attempt to understand the semantics of images which are then transformed into text. An important question is: which annotation reflects best a deep understanding of image content? Similarly, given a text, what is the best image that can present the semantics of the text? In this work, we argue that the best text or caption for a given image is the text which would generate the image which is the most similar to that image. Likewise, the best image for a given text is the image that results in the caption which is best aligned with the original text. To this end, we propose a unified framework that includes both a text-to-image generative model and an image-to-text generative model. Extensive experiments validate our approach.
翻訳日:2022-12-26 16:27:46 公開日:2022-12-23
# FFNeRV:ビデオ用フローガイドフレームワイズニューラル表現

FFNeRV: Flow-Guided Frame-Wise Neural Representations for Videos ( http://arxiv.org/abs/2212.12294v1 )

ライセンス: Link先を確認
Joo Chan Lee, Daniel Rho, Jong Hwan Ko, Eunbyung Park(参考訳) 座標に基づくあるいは暗黙の神経表現としても知られる神経場は、様々な種類の信号の表現、生成、操作の顕著な能力を示している。 しかし、映像表現では、RGB色に画素ワイド座標をマッピングすると、圧縮性能は比較的低く、収束速度や推論速度は遅い。 近年,時間座標をフレーム全体にマッピングするフレームワイドビデオ表現が,ビデオ表現の代替手法として登場し,圧縮率の向上と符号化速度の向上を実現している。 有望だが、最先端のビデオ圧縮アルゴリズムのパフォーマンスには達していない。 本研究では,標準ビデオコーデックにインスパイアされたビデオのフレーム間の時間的冗長性を利用するために,フレーム毎の表現にフロー情報を組み込む新しい手法であるffnervを提案する。 さらに,一次元時間格子によって実現される完全畳み込み構造を導入し,空間的特徴の連続性を改善する。 実験の結果,ffnervはフレームワイズ表現やニューラルフィールドを用いた手法において,映像圧縮とフレーム補間に最適な性能を示すことがわかった。 さらにモデルサイズを小さくするために,よりコンパクトな畳み込みアーキテクチャをgroupとpointwise畳み込みを用いて考案する。 量子化学習やエントロピー符号化などのモデル圧縮技術により、FFNeRVは広く使われている標準ビデオコーデック(H.264とHEVC)より優れ、最先端のビデオ圧縮アルゴリズムと同等に動作する。

Neural fields, also known as coordinate-based or implicit neural representations, have shown a remarkable capability of representing, generating, and manipulating various forms of signals. For video representations, however, mapping pixel-wise coordinates to RGB colors has shown relatively low compression performance and slow convergence and inference speed. Frame-wise video representation, which maps a temporal coordinate to its entire frame, has recently emerged as an alternative method to represent videos, improving compression rates and encoding speed. While promising, it has still failed to reach the performance of state-of-the-art video compression algorithms. In this work, we propose FFNeRV, a novel method for incorporating flow information into frame-wise representations to exploit the temporal redundancy across the frames in videos inspired by the standard video codecs. Furthermore, we introduce a fully convolutional architecture, enabled by one-dimensional temporal grids, improving the continuity of spatial features. Experimental results show that FFNeRV yields the best performance for video compression and frame interpolation among the methods using frame-wise representations or neural fields. To reduce the model size even further, we devise a more compact convolutional architecture using the group and pointwise convolutions. With model compression techniques, including quantization-aware training and entropy coding, FFNeRV outperforms widely-used standard video codecs (H.264 and HEVC) and performs on par with state-of-the-art video compression algorithms.
翻訳日:2022-12-26 16:27:33 公開日:2022-12-23
# 自己監督型学習における不確実性とロバスト性のベンチマーク

Benchmark for Uncertainty & Robustness in Self-Supervised Learning ( http://arxiv.org/abs/2212.12411v1 )

ライセンス: Link先を確認
Ha Manh Bui and Iliana Maifeld-Carucci(参考訳) 自己監視学習(SSL)は、現実世界のアプリケーション、特に医療や自動運転車などのデータ処理分野において、不可欠である。 ラベル付きデータの欠如に加えて、これらのアプリケーションは分散シフトにも苦しむ。 したがって、SSL方式は、テストデータセットにおける堅牢な一般化と不確実性評価を提供し、そのような高信頼領域における信頼性モデルと見なす必要がある。 しかし、既存のアプローチはしばしばモデルの不確実性を評価することなく一般化に焦点を当てる。 したがって、これらの推定値を改善するためにSSL技術を比較する能力は、自己超越モデルの信頼性の研究に不可欠である。 本稿では Jigsaw Puzzles, Context, Rotation, Geometric Transformations Prediction for vision や BERT や GPT for Language Task など,SSL メソッドのバリエーションについて検討する。 言語モデルの視覚および事前学習のための補助学習においてsslを訓練し、mnist-c、cifar-10-c、cifar-10.1、mnliを含む異なる分布共変量シフトデータセットにおける一般化(内分類精度)と不確実性(予測校正誤差)を評価する。 我々のゴールは、実験から出力されたベンチマークを作成し、信頼性のある機械学習で新しいSSLメソッドの出発点を提供することです。 結果を再現するすべてのソースコードはhttps://github.com/hamanhbui/reliable_ssl_baselinesで入手できる。

Self-Supervised Learning (SSL) is crucial for real-world applications, especially in data-hungry domains such as healthcare and self-driving cars. In addition to a lack of labeled data, these applications also suffer from distributional shifts. Therefore, an SSL method should provide robust generalization and uncertainty estimation in the test dataset to be considered a reliable model in such high-stakes domains. However, existing approaches often focus on generalization, without evaluating the model's uncertainty. The ability to compare SSL techniques for improving these estimates is therefore critical for research on the reliability of self-supervision models. In this paper, we explore variants of SSL methods, including Jigsaw Puzzles, Context, Rotation, Geometric Transformations Prediction for vision, as well as BERT and GPT for language tasks. We train SSL in auxiliary learning for vision and pre-training for language model, then evaluate the generalization (in-out classification accuracy) and uncertainty (expected calibration error) across different distribution covariate shift datasets, including MNIST-C, CIFAR-10-C, CIFAR-10.1, and MNLI. Our goal is to create a benchmark with outputs from experiments, providing a starting point for new SSL methods in Reliable Machine Learning. All source code to reproduce results is available at https://github.com/hamanhbui/reliable_ssl_baselines.
翻訳日:2022-12-26 16:27:05 公開日:2022-12-23
# hxtorch.snn: BrainScaleS-2による機械学習によるスパイキングニューラルネットワークモデリング

hxtorch.snn: Machine-learning-inspired Spiking Neural Network Modeling on BrainScaleS-2 ( http://arxiv.org/abs/2212.12210v1 )

ライセンス: Link先を確認
Philipp Spilger, Elias Arnold, Luca Blessing, Christian Mauch, Christian Pehle, Eric M\"uller, Johannes Schemmel(参考訳) ニューロモルフィックシステムは実験の設計と最適化をサポートするためにユーザフレンドリーなソフトウェアを必要とする。 本稿では,brainscales-2ニューロモルフィックシステムのための機械学習ベースのモデリングフレームワークの開発により,このニーズに対処した。 この作業は、brainscales-2のマトリクス乗算モードにフォーカスするか、完全に自動化されていない以前の作業よりも改善されている。 私たちのフレームワークはhxtorch.snnと呼ばれ、完全に自動化されたハードウェア実験ワークフローにおける自動微分のサポートを含む、PyTorch内のスパイクニューラルネットワークのループトレーニングを可能にする。 さらにhxtorch.snnは、ハードウェア上でのエミュレーションとソフトウェアでのシミュレートの間のシームレスな遷移を促進する。 我々は,BrainScaleS-2ハードウェアシステムから,代理勾配と密集した膜観察を用いて,Yin-Yangデータセットを用いた分類タスクにおけるhxtorch.snnの機能を示す。

Neuromorphic systems require user-friendly software to support the design and optimization of experiments. In this work, we address this need by presenting our development of a machine learning-based modeling framework for the BrainScaleS-2 neuromorphic system. This work represents an improvement over previous efforts, which either focused on the matrix-multiplication mode of BrainScaleS-2 or lacked full automation. Our framework, called hxtorch.snn, enables the hardware-in-the-loop training of spiking neural networks within PyTorch, including support for auto differentiation in a fully-automated hardware experiment workflow. In addition, hxtorch.snn facilitates seamless transitions between emulating on hardware and simulating in software. We demonstrate the capabilities of hxtorch.snn on a classification task using the Yin-Yang dataset employing a gradient-based approach with surrogate gradients and densely sampled membrane observations from the BrainScaleS-2 hardware system.
翻訳日:2022-12-26 16:26:41 公開日:2022-12-23
# 差動成長型ニューラルガスの容量研究

Capacity Studies for a Differential Growing Neural Gas ( http://arxiv.org/abs/2212.12319v1 )

ライセンス: Link先を確認
P. Levi, P. Gelhausen, G. Peters(参考訳) 2019年、カーデルスとピーターズは、オートアソシアティブメモリセル (AMC) \cite{Kerdels_Peters_2019} をモデル化するための計算効率の良い方法として、DGNGネットワークアーキテクチャに基づくグリッドセルモデル(GCM)を提案した。 計算神経科学の分野における応用の可能性に関して、DGNGアーキテクチャの重要な特徴は、入力信号を処理し、一意に区別し、従って入力空間の有効な表現を得る能力を指す「textit{capacity}」である。 本研究では,Fashion-MNISTデータセット上での2層DGNGグリッドセルモデルの容量を評価する。 この研究の焦点は、ネットワークパラメータとスケーリング特性との関係において、キャパシティ特性の理解を改善するための、レイヤサイズの変化である。 また、パラメータ議論と画素/セグメント変動法による可算性チェックを提供する。 結論として、DGNGモデルは入力空間の有意義かつ妥当な表現を得ることができ、中程度の層でもFashion-MNISTデータセットの複雑さに対応することができる。

In 2019 Kerdels and Peters proposed a grid cell model (GCM) based on a Differential Growing Neural Gas (DGNG) network architecture as a computationally efficient way to model an Autoassociative Memory Cell (AMC) \cite{Kerdels_Peters_2019}. An important feature of the DGNG architecture with respect to possible applications in the field of computational neuroscience is its \textit{capacity} refering to its capability to process and uniquely distinguish input signals and therefore obtain a valid representation of the input space. This study evaluates the capacity of a two layered DGNG grid cell model on the Fashion-MNIST dataset. The focus on the study lies on the variation of layer sizes to improve the understanding of capacity properties in relation to network parameters as well as its scaling properties. Additionally, parameter discussions and a plausability check with a pixel/segment variation method are provided. It is concluded, that the DGNG model is able to obtain a meaningful and plausible representation of the input space and to cope with the complexity of the Fashion-MNIST dataset even at moderate layer sizes.
翻訳日:2022-12-26 16:26:26 公開日:2022-12-23
# スケーラブルな物理的一貫性のあるニューラルネットワークに向けて:データ駆動型マルチゾーンサーマルビルディングモデルへの応用

Towards Scalable Physically Consistent Neural Networks: an Application to Data-driven Multi-zone Thermal Building Models ( http://arxiv.org/abs/2212.12380v1 )

ライセンス: Link先を確認
Loris Di Natale, Bratislav Svetozarevic, Philipp Heer, and Colin Neil Jones(参考訳) 収集されるデータが増えるにつれて、データ駆動モデリングの手法が近年人気が高まっている。 物理的に健全であるが、古典的なグレーボックスモデルはしばしば識別とスケールが困難であり、その正確さは表現力の制限によって妨げられる可能性がある。 一方で、現在ではニューラルネットワーク(nns)に依存する古典的なブラックボックス法は、データから統計的パターンを導出することで、大規模でも印象的なパフォーマンスを達成していることが多い。 しかし、それらは基礎となる物理法則に完全に従わないままであり、現実世界の物理システムに対する決定がそれらに基づく場合、破滅的な失敗につながる可能性がある。 物理的に一貫性のあるニューラルネットワーク(PCNN)は最近、前述の問題に対処するために開発された。 そこで本研究では,PCNNを用いて建築温度動態をモデル化し,従来のグレーボックス法とブラックボックス法とを徹底的に比較する。 より正確には、3つの異なるpcnn拡張を設計し、アーキテクチャのモジュラリティと柔軟性を例示し、その物理的一貫性を正式に証明します。 実例では,PCNNは最先端の精度を達成でき,制約構造にもかかわらず従来のNNモデルよりも優れていた。 さらに、我々の調査は、完全に物理に依存しないまま、NNが優れたパフォーマンスを達成していることを示す明確なイラストを提供している。 この性能は計算複雑性のコストがかかるが、pcnnは他の物理的に一貫性のある手法と比較して17-35%の精度向上を示し、最先端の性能を持つスケーラブルな物理的一貫性モデルへの道を開く。

With more and more data being collected, data-driven modeling methods have been gaining in popularity in recent years. While physically sound, classical gray-box models are often cumbersome to identify and scale, and their accuracy might be hindered by their limited expressiveness. On the other hand, classical black-box methods, typically relying on Neural Networks (NNs) nowadays, often achieve impressive performance, even at scale, by deriving statistical patterns from data. However, they remain completely oblivious to the underlying physical laws, which may lead to potentially catastrophic failures if decisions for real-world physical systems are based on them. Physically Consistent Neural Networks (PCNNs) were recently developed to address these aforementioned issues, ensuring physical consistency while still leveraging NNs to attain state-of-the-art accuracy. In this work, we scale PCNNs to model building temperature dynamics and propose a thorough comparison with classical gray-box and black-box methods. More precisely, we design three distinct PCNN extensions, thereby exemplifying the modularity and flexibility of the architecture, and formally prove their physical consistency. In the presented case study, PCNNs are shown to achieve state-of-the-art accuracy, even outperforming classical NN-based models despite their constrained structure. Our investigations furthermore provide a clear illustration of NNs achieving seemingly good performance while remaining completely physics-agnostic, which can be misleading in practice. While this performance comes at the cost of computational complexity, PCNNs on the other hand show accuracy improvements of 17-35% compared to all other physically consistent methods, paving the way for scalable physically consistent models with state-of-the-art performance.
翻訳日:2022-12-26 16:25:30 公開日:2022-12-23
# 先行地図誘導サイクルGANによる水中画像の未ペア化

Unpaired Overwater Image Defogging Using Prior Map Guided CycleGAN ( http://arxiv.org/abs/2212.12116v1 )

ライセンス: Link先を確認
Yaozong Mo, Chaofeng Li, Wenqi Ren, Shaopeng Shang, Wenwu Wang, and Xiao-jun Wu(参考訳) 深層学習に基づく手法は、画像デファイングにおいて大きなパフォーマンスを達成した。 しかし、既存の手法は主に陸地用として開発されており、水面には空と水の大きな広がりがあるため、水面霧画像の処理には不適当である。 本研究では, オーバーウォーターシーンによる画像のデグイングのための先行マップガイドサイクロン (PG-CycleGAN) を提案する。 画像中の水上の物体の回収を促進するために、暗チャンネルを反転するように事前マップを設計し、空を抑えて物体を強調するためにmin-max正規化を使用するネットワークに対して、2つの損失関数を利用する。 しかし、未整備のトレーニングセットのため、ネットワークは霧から霧のない画像への制約の少ないドメインマッピングを学習し、アーティファクトと詳細の喪失につながる可能性がある。 そこで本稿では,UIM(Upscaling Inception Module)とLong-range Residual Residual Coarse-to-fine framework(LRC)を提案する。 定性的,定量的な比較実験により,提案手法は最先端の教師付き,半教師付き,そして教師なしのデフォッギングアプローチよりも優れていることが示された。

Deep learning-based methods have achieved significant performance for image defogging. However, existing methods are mainly developed for land scenes and perform poorly when dealing with overwater foggy images, since overwater scenes typically contain large expanses of sky and water. In this work, we propose a Prior map Guided CycleGAN (PG-CycleGAN) for defogging of images with overwater scenes. To promote the recovery of the objects on water in the image, two loss functions are exploited for the network where a prior map is designed to invert the dark channel and the min-max normalization is used to suppress the sky and emphasize objects. However, due to the unpaired training set, the network may learn an under-constrained domain mapping from foggy to fog-free image, leading to artifacts and loss of details. Thus, we propose an intuitive Upscaling Inception Module (UIM) and a Long-range Residual Coarse-to-fine framework (LRC) to mitigate this issue. Extensive experiments on qualitative and quantitative comparisons demonstrate that the proposed method outperforms the state-of-the-art supervised, semi-supervised, and unsupervised defogging approaches.
翻訳日:2022-12-26 16:18:57 公開日:2022-12-23
# EndoBoost:実世界の大腸内視鏡におけるコンピュータ支援ポリープ検出における偽陽性抑制のためのプラグアンドプレイモジュール(データセット)

EndoBoost: a plug-and-play module for false positive suppression during computer-aided polyp detection in real-world colonoscopy (with dataset) ( http://arxiv.org/abs/2212.12204v1 )

ライセンス: Link先を確認
Haoran Wang, Yan Zhu, Wenzheng Qin, Yizhe Zhang, Pinghong Zhou, Quanlin Li, Shuo Wang and Zhijian Song(参考訳) 深層学習を用いたコンピュータ支援検出システムの進歩は,内視鏡画像解析における新たなスコープを開拓した。 しかし、クローズドデータセットで開発された学習ベースモデルは、複雑な臨床環境における未知の異常の影響を受けやすい。 特にポリープ検出の偽陽性率は臨床において依然として大きな課題である。 本研究では,fppd-13データセットをリリースし,実際の大腸内視鏡検査におけるコンピュータ支援ポリープ検出中に典型的な偽陽性の分類と実世界の事例を提供する。 さらに,ポリープ検出モデルに挿入して偽陽性予測をフィルタリングする,ポストホックモジュールのEndoBoostを提案する。 これは、ポリープ多様体の正規化フローによる生成学習と密度推定による偽陽性の否定によって実現される。 教師付き分類と比較して、この異常検出パラダイムは、オープンワールド環境でのデータ効率と堅牢性を向上させる。 広範な実験は、ふりかえりと将来の検証の両方において有望な偽陽性抑制を示している。 さらに、リリースされたデータセットは、確立された検出システムで「ストレス」テストを行うために使用することができ、堅牢で信頼性の高いコンピュータ支援内視鏡画像解析へのさらなる研究を奨励している。 データセットとコードはhttp://endoboost.miccai.cloud.comで公開される。

The advance of computer-aided detection systems using deep learning opened a new scope in endoscopic image analysis. However, the learning-based models developed on closed datasets are susceptible to unknown anomalies in complex clinical environments. In particular, the high false positive rate of polyp detection remains a major challenge in clinical practice. In this work, we release the FPPD-13 dataset, which provides a taxonomy and real-world cases of typical false positives during computer-aided polyp detection in real-world colonoscopy. We further propose a post-hoc module EndoBoost, which can be plugged into generic polyp detection models to filter out false positive predictions. This is realized by generative learning of the polyp manifold with normalizing flows and rejecting false positives through density estimation. Compared to supervised classification, this anomaly detection paradigm achieves better data efficiency and robustness in open-world settings. Extensive experiments demonstrate a promising false positive suppression in both retrospective and prospective validation. In addition, the released dataset can be used to perform 'stress' tests on established detection systems and encourages further research toward robust and reliable computer-aided endoscopic image analysis. The dataset and code will be publicly available at http://endoboost.miccai.cloud.
翻訳日:2022-12-26 16:18:34 公開日:2022-12-23
# 空中画像からの線形特徴分割

Linear features segmentation from aerial images ( http://arxiv.org/abs/2212.12327v1 )

ライセンス: Link先を確認
Zhipeng Chang, Siddharth Jha, Yunfei Xia(参考訳) リモートセンシング技術の急速な発展は、空中画像からオブジェクトを正確にローカライズ、分類、分割する能力により、大きな注目を集めている。 これらの技術は、高解像度のカメラやセンサーを装備した無人航空機(UAV)で広く使われている。 このデータは、都市、町、地形の監視や検査など、様々な用途に有用である。 本論文では,U-NetやSegNetといった深層学習モデルを用いて,道路交通の分岐線を航空画像から分類・分断する手法を提案する。 注釈付きデータはこれらのモデルを訓練するために使用され、航空画像の分類と分類には、ダッシュラインと非ダッシュラインの2つのクラスが使用される。 しかし,深層学習モデルでは,木や影による絵の描写不良や閉塞などにより,破断線を識別できない場合がある。 この問題に対処するため,セグメント化出力にミスラインを追加する手法を提案した。 また,道路のディジタル可視化のためのCADファイルを構築するために,都市計画者が利用できるセグメント化出力から,各流域のx座標とy座標を抽出した。

The rapid development of remote sensing technologies have gained significant attention due to their ability to accurately localize, classify, and segment objects from aerial images. These technologies are commonly used in unmanned aerial vehicles (UAVs) equipped with high-resolution cameras or sensors to capture data over large areas. This data is useful for various applications, such as monitoring and inspecting cities, towns, and terrains. In this paper, we presented a method for classifying and segmenting city road traffic dashed lines from aerial images using deep learning models such as U-Net and SegNet. The annotated data is used to train these models, which are then used to classify and segment the aerial image into two classes: dashed lines and non-dashed lines. However, the deep learning model may not be able to identify all dashed lines due to poor painting or occlusion by trees or shadows. To address this issue, we proposed a method to add missed lines to the segmentation output. We also extracted the x and y coordinates of each dashed line from the segmentation output, which can be used by city planners to construct a CAD file for digital visualization of the roads.
翻訳日:2022-12-26 16:17:56 公開日:2022-12-23
# 怠け者および富裕層におけるネットワークの分散制限行動の開始

The Onset of Variance-Limited Behavior for Networks in the Lazy and Rich Regimes ( http://arxiv.org/abs/2212.12147v1 )

ライセンス: Link先を確認
Alexander Atanasov, Blake Bordelon, Sabarish Sainathan, Cengiz Pehlevan(参考訳) 小さなトレーニングセットサイズが$P$の場合、広いニューラルネットワークの一般化誤差は、カーネルまたは平均フィールド/フィーチャーラーニングシステムにおいて無限幅ニューラルネットワーク(NN)の誤差によってよく近似される。 しかし、臨界サンプルサイズが$P^*$になると、有限幅ネットワークの一般化は無限幅ネットワークのそれよりも悪くなる。 本研究では、無限幅の挙動からこの分散制限状態への遷移をサンプルサイズ$P$とネットワーク幅$N$の関数として経験的に研究する。 有限サイズ効果は、ReLUネットワークによる多項式回帰に対して$P^* \sim \sqrt{N}$の順序で非常に小さなデータセットサイズに関係する。 NNの最終的なニューラルネットワークカーネル(NTK)の分散に基づく議論を用いて、これらの効果の源泉について論じる。 この移行は、機能学習の強化やネットワーク平均化によって、より大きな$p$にプッシュすることができる。 最終的なNTKによる回帰学習曲線は,NN学習曲線の正確な近似であることがわかった。 これを使って,$p^* \sim \sqrt{n}$ scalingを示すトイモデルと,機能学習による$p$依存のメリットを提供します。

For small training set sizes $P$, the generalization error of wide neural networks is well-approximated by the error of an infinite width neural network (NN), either in the kernel or mean-field/feature-learning regime. However, after a critical sample size $P^*$, we empirically find the finite-width network generalization becomes worse than that of the infinite width network. In this work, we empirically study the transition from infinite-width behavior to this variance limited regime as a function of sample size $P$ and network width $N$. We find that finite-size effects can become relevant for very small dataset sizes on the order of $P^* \sim \sqrt{N}$ for polynomial regression with ReLU networks. We discuss the source of these effects using an argument based on the variance of the NN's final neural tangent kernel (NTK). This transition can be pushed to larger $P$ by enhancing feature learning or by ensemble averaging the networks. We find that the learning curve for regression with the final NTK is an accurate approximation of the NN learning curve. Using this, we provide a toy model which also exhibits $P^* \sim \sqrt{N}$ scaling and has $P$-dependent benefits from feature learning.
翻訳日:2022-12-26 16:16:54 公開日:2022-12-23
# k-meansのelbow criterionの使用をやめて、代わりにクラスタの数を選択する方法

Stop using the elbow criterion for k-means and how to choose the number of clusters instead ( http://arxiv.org/abs/2212.12189v1 )

ライセンス: Link先を確認
Erich Schubert(参考訳) k-meansクラスタリングを使用する場合、大きな課題はパラメータk、クラスタ数を選択する方法だ。 この書簡では、共通のヒューリスティックである"elbow method"から不十分な結論を引き出すのは非常に容易であることを指摘したい。 より優れた代替案は長い間文学で知られてきましたが、私たちはこれらの簡単なオプションのいくつかに注意を向けたいと思っています。 この手紙は、理論的なサポートが不足しているため、肘法を全面的に使わないよう呼びかけるものであり、私たちは、教育者がメソッドの問題(クラスに導入した場合)を議論するよう促し、代わりに代替法を教えるように促し、研究者や審査員は肘法から引き出された結論を拒絶すべきである。

A major challenge when using k-means clustering often is how to choose the parameter k, the number of clusters. In this letter, we want to point out that it is very easy to draw poor conclusions from a common heuristic, the "elbow method". Better alternatives have been known in literature for a long time, and we want to draw attention to some of these easy to use options, that often perform better. This letter is a call to stop using the elbow method altogether, because it severely lacks theoretic support, and we want to encourage educators to discuss the problems of the method -- if introducing it in class at all -- and teach alternatives instead, while researchers and reviewers should reject conclusions drawn from the elbow method.
翻訳日:2022-12-26 16:16:32 公開日:2022-12-23
# 医学者のための機械学習入門:データデルージュの生存ガイド

Introduction to Machine Learning for Physicians: A Survival Guide for Data Deluge ( http://arxiv.org/abs/2212.12303v1 )

ライセンス: Link先を確認
Ri\v{c}ards Marcinkevi\v{c}s, Ece Ozkan, Julia E. Vogt(参考訳) 現代の多くの研究分野は、大規模で、しばしば非構造化され、不完全なデータセットの収集と分析にますます依存している。 その結果、この‘データデルージュ’を活用できる機械学習や人工知能アプリケーションへの関心が高まっている。 この幅広い非技術的概要は、医学的および生物学的応用に特に焦点をあてた機械学習の穏やかな紹介を提供する。 機械学習アルゴリズムの一般的なタイプと、解決可能な典型的なタスクを説明し、基礎を医療の具体的な例で示します。 最後に、機械学習による医療のオープンな課題、限界、潜在的な影響について展望を提供する。

Many modern research fields increasingly rely on collecting and analysing massive, often unstructured, and unwieldy datasets. Consequently, there is growing interest in machine learning and artificial intelligence applications that can harness this `data deluge'. This broad nontechnical overview provides a gentle introduction to machine learning with a specific focus on medical and biological applications. We explain the common types of machine learning algorithms and typical tasks that can be solved, illustrating the basics with concrete examples from healthcare. Lastly, we provide an outlook on open challenges, limitations, and potential impacts of machine-learning-powered medicine.
翻訳日:2022-12-26 16:16:17 公開日:2022-12-23
# ReLUネットワークからスパイクニューラルネットワークへの厳密なマッピング

An Exact Mapping From ReLU Networks to Spiking Neural Networks ( http://arxiv.org/abs/2212.12522v1 )

ライセンス: Link先を確認
Ana Stanojevic, Stanis{\l}aw Wo\'zniak, Guillaume Bellec, Giovanni Cherubini, Angeliki Pantazi, Wulfram Gerstner(参考訳) deep spiking neural networks (snns)は、低消費電力の人工知能を約束する。 しかし、深いSNNをゼロからトレーニングしたり、深い人工知能ニューラルネットワークをパフォーマンスを失うことなくSNNに変換することは困難である。 本稿では,整流線形単位(relus)を持つネットワークから,ニューロンに1つのスパイクを発生させるsnへの正確なマッピングを提案する。 構成的証明として,畳み込み層,バッチ正規化,最大プール層を有する任意の多層ReLUネットワークが,一部のトレーニングセットで高い性能を示すように訓練されたと仮定する。 さらに、トレーニング中に使用される入力データの代表例と、トレーニングされたreluネットワークの正確なパラメータ(重みとバイアス)へのアクセスが可能であると仮定する。 ディープReLUネットワークからSNNへのマッピングは、CIFAR10、CIFAR100、ImageNetライクなデータセットPlaces365、PASSの精度をゼロに低下させる。 より一般的には、任意の深部ReLUネットワークが、パフォーマンスを失うことなく、エネルギー効率のよい単一スパイクニューラルネットワークに置き換えられることを示す。

Deep spiking neural networks (SNNs) offer the promise of low-power artificial intelligence. However, training deep SNNs from scratch or converting deep artificial neural networks to SNNs without loss of performance has been a challenge. Here we propose an exact mapping from a network with Rectified Linear Units (ReLUs) to an SNN that fires exactly one spike per neuron. For our constructive proof, we assume that an arbitrary multi-layer ReLU network with or without convolutional layers, batch normalization and max pooling layers was trained to high performance on some training set. Furthermore, we assume that we have access to a representative example of input data used during training and to the exact parameters (weights and biases) of the trained ReLU network. The mapping from deep ReLU networks to SNNs causes zero percent drop in accuracy on CIFAR10, CIFAR100 and the ImageNet-like data sets Places365 and PASS. More generally our work shows that an arbitrary deep ReLU network can be replaced by an energy-efficient single-spike neural network without any loss of performance.
翻訳日:2022-12-26 16:10:13 公開日:2022-12-23
# Pruned Datasetを用いたサルカズム検出のためのファインタニング

Finetuning for Sarcasm Detection with a Pruned Dataset ( http://arxiv.org/abs/2212.12213v1 )

ライセンス: Link先を確認
Ishita Goyal, Priyank Bhandia, Sanjana Dulam(参考訳) 皮肉(英: sarcasm)は皮肉の一形態であり、しばしばユーモラスな、またはモック的な方法で、真の意味と反対または反対の何かを言うか書くことを伴う。 人をモックしたり、何かをモックしたり、ユーモアや面白がったりするのによく用いられる。 サルカズムは通常、音声、表情、その他の非言語コミュニケーションのトーンを通じて伝達されるが、皮肉やユーモアと関連づけられる特定の単語やフレーズの使用によっても示される。 サルカスムの検出は文脈や非言語的手がかりに依存するため困難である。 文化的に特有で主観的で曖昧であることもある。 本研究では,Abaskohi et alで提示されたRoBERTaによるサルカズム検出モデルを微調整する。 [2022]iSarcasmデータセット(Oprea and Magdy [2019])の最先端(Hercog et al. [2022])の0.02 F1以内に到達する。 このパフォーマンスは、Self Annotated Reddit Corpus (SARC) (Khodak et al. [2017])の刈り取ったバージョンでiSarcasmを増強することで達成される。 我々の刈り取られたバージョンは、最先端モデルのトレーニングに使われるSARCのサブセットの100倍小さい。

Sarcasm is a form of irony that involves saying or writing something that is opposite or opposite to what one really means, often in a humorous or mocking way. It is often used to mock or mock someone or something, or to be humorous or amusing. Sarcasm is usually conveyed through tone of voice, facial expressions, or other forms of nonverbal communication, but it can also be indicated by the use of certain words or phrases that are typically associated with irony or humor. Sarcasm detection is difficult because it relies on context and non-verbal cues. It can also be culturally specific, subjective and ambiguous. In this work, we fine-tune the RoBERTa based sarcasm detection model presented in Abaskohi et al. [2022] to get to within 0.02 F1 of the state-of-the-art (Hercog et al. [2022]) on the iSarcasm dataset (Oprea and Magdy [2019]). This performance is achieved by augmenting iSarcasm with a pruned version of the Self Annotated Reddit Corpus (SARC) (Khodak et al. [2017]). Our pruned version is 100 times smaller than the subset of SARC used to train the state-of-the-art model.
翻訳日:2022-12-26 16:09:56 公開日:2022-12-23
# 判断の前提からキーポイントへ

From Judgement's Premises Towards Key Points ( http://arxiv.org/abs/2212.12238v1 )

ライセンス: Link先を確認
Oren Sultan, Rayen Dhahri, Yauheni Mardan, Tobias Eder, Georg Groh(参考訳) キーポイント分析(kpa)は、nlpにおいて比較的新しいタスクであり、テキストの集合からトピックに対する議論的キーポイント(kps)を抽出し、異なる引数への近さを分類することで要約と分類を組み合わせる。 本研究では,法律領域に着目し,判断文から派生した前提からkpsを識別・抽出する手法を開発した。 第1の方法は,既存の最先端手法への適応であり,他の2つはスクラッチから開発した新しい手法である。 提案手法とそれらの出力の例,およびそれらの比較について述べる。 結果の完全な評価はマッチングタスクで行われます -- 生成されたKPと引数(前提)の一致です。

Key Point Analysis(KPA) is a relatively new task in NLP that combines summarization and classification by extracting argumentative key points (KPs) for a topic from a collection of texts and categorizing their closeness to the different arguments. In our work, we focus on the legal domain and develop methods that identify and extract KPs from premises derived from texts of judgments. The first method is an adaptation to an existing state-of-the-art method, and the two others are new methods that we developed from scratch. We present our methods and examples of their outputs, as well a comparison between them. The full evaluation of our results is done in the matching task -- match between the generated KPs to arguments (premises).
翻訳日:2022-12-26 16:09:33 公開日:2022-12-23
# 神経崩壊による深部モデルの原理的かつ効率的な伝達学習

Principled and Efficient Transfer Learning of Deep Models via Neural Collapse ( http://arxiv.org/abs/2212.12206v1 )

ライセンス: Link先を確認
Xiao Li, Sheng Liu, Jinxin Zhou, Xinyu Lu, Carlos Fernandez-Granda, Zhihui Zhu, Qing Qu(参考訳) モデルのサイズが拡大し、ラベル付きトレーニングデータの可用性が限られているため、転校学習は多くの科学や工学領域で人気が高まっている。 分類問題では、この研究は、ニューラルネットワークの最後の層の特徴と分類器が満たされる、神経崩壊(NC)と呼ばれる興味深い現象を通じて、伝達学習の謎を掘り下げる。 (i)特徴のクラス内変動はゼロに崩壊し、 (ii)クラス間特徴手段は最大かつ等分される。 NCのレンズを通して、転写学習の知見は以下の通りである。 (i)事前訓練の際には、クラス内変動性の崩壊(ある程度)を防止し、入力データの本質的構造を良好に保ち、モデル転送性を向上させること。 (2) 下流タスクの微調整モデルにおいて、下流データでよりNCの高い機能を得ると、与えられたタスクに対するテスト精度が向上する。 以上の結果は,モデルの事前学習において広く用いられているヒューリスティック(データ拡張,投影ヘッド,自己教師付き学習など)の多くを損なうだけでなく,より効率的かつ原理的な下流タスクの微調整手法にもつながる。

With the ever-growing model size and the limited availability of labeled training data, transfer learning has become an increasingly popular approach in many science and engineering domains. For classification problems, this work delves into the mystery of transfer learning through an intriguing phenomenon termed neural collapse (NC), where the last-layer features and classifiers of learned deep networks satisfy: (i) the within-class variability of the features collapses to zero, and (ii) the between-class feature means are maximally and equally separated. Through the lens of NC, our findings for transfer learning are the following: (i) when pre-training models, preventing intra-class variability collapse (to a certain extent) better preserves the intrinsic structures of the input data, so that it leads to better model transferability; (ii) when fine-tuning models on downstream tasks, obtaining features with more NC on downstream data results in better test accuracy on the given task. The above results not only demystify many widely used heuristics in model pre-training (e.g., data augmentation, projection head, self-supervised learning), but also leads to more efficient and principled fine-tuning method on downstream tasks that we demonstrate through extensive experimental results.
翻訳日:2022-12-26 16:08:23 公開日:2022-12-23
# 小さなデータセットによる画像分類:概要とベンチマーク

Image Classification with Small Datasets: Overview and Benchmark ( http://arxiv.org/abs/2212.12478v1 )

ライセンス: Link先を確認
L. Brigato, B. Barz, L. Iocchi, and J. Denzler(参考訳) 近年,小さなデータセットを用いた画像分類が活発に研究されている。 しかしながら、この領域の研究はまだ初期段階にあるため、信頼性と真実の進歩を保証するための2つの重要な要素が欠落している。 この記事は両方の問題を扱っている。 まず,過去の研究を体系的に整理し,結びつけて,現在断片化され分散しているコミュニティを集約する。 第2に,アプローチの客観的比較を可能にする共通ベンチマークを提案する。 さまざまなドメイン(自然画像、医療画像、衛星データなど)とデータタイプ(rgb、grayscale、multispectral)にまたがる5つのデータセットで構成される。 このベンチマークを用いて、標準のクロスエントロピーベースラインと、有名な会場で2017年から2021年にかけて発行された10の既存手法を再評価する。 驚いたことに、ホールドアウト検証データに対する徹底的なハイパーパラメータチューニングは、非常に競争力のあるベースラインとなり、長年にわたるパフォーマンスの停滞を強調している。 実際、2019年までさかのぼる単一の特殊なメソッドだけが、ベンチマークで明らかに勝利し、ベースライン分類器を上回っています。

Image classification with small datasets has been an active research area in the recent past. However, as research in this scope is still in its infancy, two key ingredients are missing for ensuring reliable and truthful progress: a systematic and extensive overview of the state of the art, and a common benchmark to allow for objective comparisons between published methods. This article addresses both issues. First, we systematically organize and connect past studies to consolidate a community that is currently fragmented and scattered. Second, we propose a common benchmark that allows for an objective comparison of approaches. It consists of five datasets spanning various domains (e.g., natural images, medical imagery, satellite data) and data types (RGB, grayscale, multispectral). We use this benchmark to re-evaluate the standard cross-entropy baseline and ten existing methods published between 2017 and 2021 at renowned venues. Surprisingly, we find that thorough hyper-parameter tuning on held-out validation data results in a highly competitive baseline and highlights a stunted growth of performance over the years. Indeed, only a single specialized method dating back to 2019 clearly wins our benchmark and outperforms the baseline classifier.
翻訳日:2022-12-26 16:08:00 公開日:2022-12-23
# A-NeSI:確率論的ニューロシンボリック推論のためのスケーラブル近似法

A-NeSI: A Scalable Approximate Method for Probabilistic Neurosymbolic Inference ( http://arxiv.org/abs/2212.12393v1 )

ライセンス: Link先を確認
Emile van Krieken, Thiviyan Thanapalasingam, Jakub M. Tomczak, Frank van Harmelen, Annette ten Teije(参考訳) ニューラルネットワークとシンボリック推論を組み合わせた問題について検討する。 近年、DeepProbLogのような確率的ニューロシンボリックラーニング(PNL)フレームワークが指数時間正確な推論を行い、PNLソリューションのスケーラビリティを制限している。 本稿では、ニューラルネットワークを用いてスケーラブルな近似推論を行うPNLの新しいフレームワークであるA-NeSIを紹介する。 A-NeSI 1) 確率論理のセマンティクスを変更することなく,多項式時間で近似推論を行う。 2) 背景知識が生成したデータを用いて訓練する。 3)予測の象徴的な説明をすることができる。 4) 安全クリティカルなアプリケーションで不可欠な、テスト時の論理的な制約の満足度を保証できる。 実験の結果,A-NeSIはMNISTAddベンチマークを15桁まで拡張する最初のエンドツーエンド手法であることがわかった。 最後に,A-NeSIは性能上のペナルティを伴わずに,説明可能性と安全性を実現することを示す。

We study the problem of combining neural networks with symbolic reasoning. Recently introduced frameworks for Probabilistic Neurosymbolic Learning (PNL), such as DeepProbLog, perform exponential-time exact inference, limiting the scalability of PNL solutions. We introduce Approximate Neurosymbolic Inference (A-NeSI): a new framework for PNL that uses neural networks for scalable approximate inference. A-NeSI 1) performs approximate inference in polynomial time without changing the semantics of probabilistic logics; 2) is trained using data generated by the background knowledge; 3) can generate symbolic explanations of predictions; and 4) can guarantee the satisfaction of logical constraints at test time, which is vital in safety-critical applications. Our experiments show that A-NeSI is the first end-to-end method to scale the Multi-digit MNISTAdd benchmark to sums of 15 MNIST digits, up from 4 in competing systems. Finally, our experiments show that A-NeSI achieves explainability and safety without a penalty in performance.
翻訳日:2022-12-26 16:07:31 公開日:2022-12-23
# 会話推薦のための不完全知識グラフ上の変分推論

Variational Reasoning over Incomplete Knowledge Graphs for Conversational Recommendation ( http://arxiv.org/abs/2212.11868v2 )

ライセンス: Link先を確認
Xiaoyu Zhang, Xin Xin, Dongdong Li, Wenxuan Liu, Pengjie Ren, Zhumin Chen, Jun Ma, Zhaochun Ren(参考訳) 会話レコメンデータシステム(CRS)は、しばしば外部知識グラフ(KG)を使用して、リッチな意味情報を導入し、自然言語対話を通じて関連する項目を推薦する。 しかし、既存のCRSで使用される元のKGは、しばしば不完全でスパースであり、推奨の推論能力を制限する。 さらに、対話の文脈を利用してKGの知識を動的に洗練し、より良い推薦を行う研究はほとんどない。 上記の問題に対処するため、不完全KGs会話レコメンダ(VRICR)に対する変分推論を提案する。 提案手法は,crssに自然に付随する大規模対話コーパスを組み込んで不完全kgsを強化し,対話コンテキストに基づいた動的知識推論を行うことである。 具体的には、適応的知識グラフのカテゴリ先行を持つ潜在変数として、KGの対話特化部分グラフを示す。 本稿では,対話固有の部分グラフの後方分布を近似する変分ベイズ法を提案する。これは,欠落したエンティティ関係の再構成に対話コーパスを利用するだけでなく,対話コンテキストに基づいて知識を動的に選択する。 最後に、対話特有のサブグラフにレコメンデーションとレスポンスをデコードする。 2つのベンチマークCRSデータセットで実験を行う。 提案手法の有効性を実験的に検証した。

Conversational recommender systems (CRSs) often utilize external knowledge graphs (KGs) to introduce rich semantic information and recommend relevant items through natural language dialogues. However, original KGs employed in existing CRSs are often incomplete and sparse, which limits the reasoning capability in recommendation. Moreover, only few of existing studies exploit the dialogue context to dynamically refine knowledge from KGs for better recommendation. To address the above issues, we propose the Variational Reasoning over Incomplete KGs Conversational Recommender (VRICR). Our key idea is to incorporate the large dialogue corpus naturally accompanied with CRSs to enhance the incomplete KGs; and perform dynamic knowledge reasoning conditioned on the dialogue context. Specifically, we denote the dialogue-specific subgraphs of KGs as latent variables with categorical priors for adaptive knowledge graphs refactor. We propose a variational Bayesian method to approximate posterior distributions over dialogue-specific subgraphs, which not only leverages the dialogue corpus for restructuring missing entity relations but also dynamically selects knowledge based on the dialogue context. Finally, we infuse the dialogue-specific subgraphs to decode the recommendation and responses. We conduct experiments on two benchmark CRSs datasets. Experimental results confirm the effectiveness of our proposed method.
翻訳日:2022-12-26 13:57:59 公開日:2022-12-23
# SLGTformer:手話認識のための注意に基づくアプローチ

SLGTformer: An Attention-Based Approach to Sign Language Recognition ( http://arxiv.org/abs/2212.10746v2 )

ライセンス: Link先を確認
Neil Song, Yu Xiang(参考訳) 手話は聴覚障がい者やミュート人のコミュニケーションの手段として好まれるが、どんな言語と同様、習得が困難であり、難聴者や話すことができない者にとって重要な障壁である。 人の正面の外観全体が特定の意味を指示し、伝達する。 しかし、この正面の外観は人体ポーズの時間的シーケンスとして定量化することができ、骨格キーポイントの時空間ダイナミクスの学習を通じて手話認識につながる。 本稿では,手話グラフ時間変換器(slgtformer)を用いて,分離されたグラフと時間的自己注意に基づく手話認識の新たなアプローチを提案する。 SLGTformerは空間グラフと時間ウィンドウに分割して時空間ポーズシーケンスを分解する。 SLGTformerは、新しいLearnerable Graph Relative Positional Encodings(LGRPE)を利用して、人間の骨格のグラフ近傍コンテキストで空間的自己注意を導く。 時間的次元を風内および風間力学としてモデル化することにより,局所的グループ化された時間的注意(LTA)とグローバルなサブサンプリングされた時間的注意(GSTA)の組み合わせとして,TTSA(Temporal Twin Self-Attention)を導入する。 WLASLデータセットにおけるSLGTformerの有効性を実証し、キーポイントのモダリティに対するアンサンブルのないアプローチで最先端のパフォーマンスを実現する。 コードはhttps://github.com/neilsong/sltで入手できる。

Sign language is the preferred method of communication of deaf or mute people, but similar to any language, it is difficult to learn and represents a significant barrier for those who are hard of hearing or unable to speak. A person's entire frontal appearance dictates and conveys specific meaning. However, this frontal appearance can be quantified as a temporal sequence of human body pose, leading to Sign Language Recognition through the learning of spatiotemporal dynamics of skeleton keypoints. We propose a novel, attention-based approach to Sign Language Recognition exclusively built upon decoupled graph and temporal self-attention: the Sign Language Graph Time Transformer (SLGTformer). SLGTformer first deconstructs spatiotemporal pose sequences separately into spatial graphs and temporal windows. SLGTformer then leverages novel Learnable Graph Relative Positional Encodings (LGRPE) to guide spatial self-attention with the graph neighborhood context of the human skeleton. By modeling the temporal dimension as intra- and inter-window dynamics, we introduce Temporal Twin Self-Attention (TTSA) as the combination of locally-grouped temporal attention (LTA) and global sub-sampled temporal attention (GSTA). We demonstrate the effectiveness of SLGTformer on the World-Level American Sign Language (WLASL) dataset, achieving state-of-the-art performance with an ensemble-free approach on the keypoint modality. The code is available at https://github.com/neilsong/slt
翻訳日:2022-12-26 13:57:37 公開日:2022-12-23
# ddcolor:デュアルデコーダによるフォトリアリスティック・セマンティックアウェア画像のカラー化に向けて

DDColor: Towards Photo-Realistic and Semantic-Aware Image Colorization via Dual Decoders ( http://arxiv.org/abs/2212.11613v2 )

ライセンス: Link先を確認
Xiaoyang Kang, Tao Yang, Wenqi Ouyang, Peiran Ren, Lingzhi Li, Xuansong Xie(参考訳) 画像の自動着色は特に難しい問題である。 問題の高い病気とマルチモーダル不確実性のため、ディープニューラルネットワークを直接トレーニングすることは、通常、誤った意味的色と低い色豊かさをもたらす。 既存のトランスフォーマーベースのメソッドは、より良い結果を提供できるが、手作りのデータセットレベルの経験的分散に強く依存する。 本研究では,画像のカラー化のためのデュアルデコーダを用いた新しいエンドツーエンド手法DDColorを提案する。 具体的には、マルチスケール画像デコーダとトランスフォーマーベースのカラーデコーダを設計する。 前者は画像の空間分解能を回復し、後者はクロスアテンションによって意味表現と色問合せの相関を確立する。 2つのデコーダは、マルチスケールの視覚的特徴を活用して意味認識色埋め込みを学ぶために組み込まれている。 この2つのデコーダの助けを借りて,提案手法は意味的に一貫性があり,視覚的に有理な色化結果を生成することに成功した。 さらに、生成した結果の色豊かさをさらに向上するために、単純だが効果的な色度損失を導入する。 提案したDDColorは,既存の最先端技術よりも定量的かつ定性的に優れた性能を発揮することを示す。 コードはhttps://github.com/piddnad/DDColor.comで公開される。

Automatic image colorization is a particularly challenging problem. Due to the high illness of the problem and multi-modal uncertainty, directly training a deep neural network usually leads to incorrect semantic colors and low color richness. Existing transformer-based methods can deliver better results but highly depend on hand-crafted dataset-level empirical distribution priors. In this work, we propose DDColor, a new end-to-end method with dual decoders, for image colorization. More specifically, we design a multi-scale image decoder and a transformer-based color decoder. The former manages to restore the spatial resolution of the image, while the latter establishes the correlation between semantic representations and color queries via cross-attention. The two decoders incorporate to learn semantic-aware color embedding by leveraging the multi-scale visual features. With the help of these two decoders, our method succeeds in producing semantically consistent and visually plausible colorization results without any additional priors. In addition, a simple but effective colorfulness loss is introduced to further improve the color richness of generated results. Our extensive experiments demonstrate that the proposed DDColor achieves significantly superior performance to existing state-of-the-art works both quantitatively and qualitatively. Codes will be made publicly available at https://github.com/piddnad/DDColor.
翻訳日:2022-12-26 13:57:12 公開日:2022-12-23
# UnICLAM:Unified and Interpretable Medical Vision Question Answeringのための逆マスキングを用いたコントラスト表現学習

UnICLAM:Contrastive Representation Learning with Adversarial Masking for Unified and Interpretable Medical Vision Question Answering ( http://arxiv.org/abs/2212.10729v2 )

ライセンス: Link先を確認
Chenlu Zhan, Peng Peng, Hongsen Wang, Tao Chen, Hongwei Wang(参考訳) medical visual question answering (medical-vqa) は、放射線画像に関する臨床質問に答えることを目的としており、医師の意思決定を支援する。 しかしながら、現在のメディカル-VQAモデルは、視覚とテクスチャエンコーダを2つの別々の空間に配置することで、間接的なセマンティックアライメントをもたらす。 本稿では,コントラスト表現学習と逆マスキングを併用した統一的で解釈可能な医療vqaモデルuniclamを提案する。 具体的には,アライメントされた画像テキスト表現を学習するために,まず,ソフトパラメータの漸進的共有戦略を用いて,統一されたデュアルストリーム事前学習構造を確立する。 技術的に、提案手法は視覚とテクスチャエンコーダが同じ空間に近づくことの制約を学習し、レイヤーの数が増えるにつれて徐々にゆるめられる。 さらに、統合された意味表現を把握するために、対向的なマスキングデータ拡張を視覚とテキストの対照的な表現学習に統一的に拡張する。 具体的には、エンコーダトレーニングはオリジナルとマスキングのサンプル間の距離を最小化するが、逆マスキングモジュールは逆の学習を継続し、逆に距離を最大化する。 さらに,より直感的に対向マスク強化モデルについて検討し,高い性能と効率で潜在的なアンテホック解釈性を向上させる。 VQA-RADとSLAKEの公開ベンチマークの実験結果は、UnICLAMが既存の11の最先端の医療VQAモデルより優れていることを示している。 さらに, 心不全の診断におけるUnICLAMの有用性についても検討し, 臨床診断におけるUnICLAMの適応性能が良好であることが確認された。

Medical Visual Question Answering (Medical-VQA) aims to to answer clinical questions regarding radiology images, assisting doctors with decision-making options. Nevertheless, current Medical-VQA models learn cross-modal representations through residing vision and texture encoders in dual separate spaces, which lead to indirect semantic alignment. In this paper, we propose UnICLAM, a Unified and Interpretable Medical-VQA model through Contrastive Representation Learning with Adversarial Masking. Specifically, to learn an aligned image-text representation, we first establish a unified dual-stream pre-training structure with the gradually soft-parameter sharing strategy. Technically, the proposed strategy learns a constraint for the vision and texture encoders to be close in a same space, which is gradually loosened as the higher number of layers. Moreover, for grasping the unified semantic representation, we extend the adversarial masking data augmentation to the contrastive representation learning of vision and text in a unified manner. Concretely, while the encoder training minimizes the distance between original and masking samples, the adversarial masking module keeps adversarial learning to conversely maximize the distance. Furthermore, we also intuitively take a further exploration to the unified adversarial masking augmentation model, which improves the potential ante-hoc interpretability with remarkable performance and efficiency. Experimental results on VQA-RAD and SLAKE public benchmarks demonstrate that UnICLAM outperforms existing 11 state-of-the-art Medical-VQA models. More importantly, we make an additional discussion about the performance of UnICLAM in diagnosing heart failure, verifying that UnICLAM exhibits superior few-shot adaption performance in practical disease diagnosis.
翻訳日:2022-12-26 13:52:38 公開日:2022-12-23
# DaDe: ストリーミング知覚のための遅延適応型検出器

DaDe: Delay-adaptive Detector for Streaming Perception ( http://arxiv.org/abs/2212.11558v2 )

ライセンス: Link先を確認
Wonwoo Jo, Kyungshin Lee, Jaewon Baik, Sangsun Lee, Dongho Choi, Hyunkyoo Park(参考訳) 低レイテンシでの環境認識は、自動運転において重要である。 リアルタイム環境では、処理が終了すると周囲環境が変化する。 現在の検出モデルは、処理後に発生する環境の変化を扱うことができない。 リアルタイム映像認識のレイテンシと精度を評価するために,ストリーム認識を提案する。 しかし、ハードウェアリソースの制限、高温、その他の要因により、現実世界のアプリケーションで追加の問題が発生する。 本研究では,処理遅延をリアルタイムに反映し,最も合理的な結果が得られるモデルを開発した。 提案する機能キューと機能選択モジュールを組み込むことで,計算コストを伴わずに特定の時間ステップを予測することができる。 本手法はArgoverse-HDデータセットで検証する。 遅延時には、様々な環境で現在の最先端メソッド(2022.12)よりも高いパフォーマンスを達成する。 コードはhttps://github.com/danjos95/DADEで入手できる。

Recognizing the surrounding environment at low latency is critical in autonomous driving. In real-time environment, surrounding environment changes when processing is over. Current detection models are incapable of dealing with changes in the environment that occur after processing. Streaming perception is proposed to assess the latency and accuracy of real-time video perception. However, additional problems arise in real-world applications due to limited hardware resources, high temperatures, and other factors. In this study, we develop a model that can reflect processing delays in real time and produce the most reasonable results. By incorporating the proposed feature queue and feature select module, the system gains the ability to forecast specific time steps without any additional computational costs. Our method is tested on the Argoverse-HD dataset. It achieves higher performance than the current state-of-the-art methods(2022.12) in various environments when delayed . The code is available at https://github.com/danjos95/DADE
翻訳日:2022-12-26 13:52:06 公開日:2022-12-23
# 医用画像異常検出のための2次元および3次元ネットワークの組込み

Joint Embedding of 2D and 3D Networks for Medical Image Anomaly Detection ( http://arxiv.org/abs/2212.10939v2 )

ライセンス: Link先を確認
Inha Kang, Jinah Park(参考訳) 医療画像における基礎的真理データを得るには,現場の専門家からの注釈を必要とするため困難である。 また、教師付き学習で訓練すると、ラベルに含まれるケースのみを検出する。 実際、私たちは医療画像を調べながら、名前付きケース以外の可能性についてもオープンにしたいと考えています。 その結果、正常な画像のみを用いて正常な特徴を学習することで異常を検出・局所化できる異常検出の必要性が出現した。 医用画像データを用いて、異常検出タスクのための自己教師付き学習の2次元または3次元ネットワークを設計できる。 人体の3次元構造を学習する3Dネットワークは, 3次元画像異常検出において優れた性能を示すが, メモリ問題のため, より深い層に積み重ねることはできない。 2Dネットワークは特徴検出に有利であるが、3Dコンテキスト情報がない。 本稿では,3次元ネットワークの強度と2次元ネットワークの強度をジョイント埋め込みにより組み合わせる手法を開発した。 また,ネットワークが効率的に学習できるように,自己教師付き学習のプリタスクを提案する。 提案手法は,soma法と比較して分類処理と分割処理の両方において優れた性能が得られることを示す。

Obtaining ground truth data in medical imaging has difficulties due to the fact that it requires a lot of annotating time from the experts in the field. Also, when trained with supervised learning, it detects only the cases included in the labels. In real practice, we want to also open to other possibilities than the named cases while examining the medical images. As a solution, the need for anomaly detection that can detect and localize abnormalities by learning the normal characteristics using only normal images is emerging. With medical image data, we can design either 2D or 3D networks of self-supervised learning for anomaly detection task. Although 3D networks, which learns 3D structures of the human body, show good performance in 3D medical image anomaly detection, they cannot be stacked in deeper layers due to memory problems. While 2D networks have advantage in feature detection, they lack 3D context information. In this paper, we develop a method for combining the strength of the 3D network and the strength of the 2D network through joint embedding. We also propose the pretask of self-supervised learning to make it possible for the networks to learn efficiently. Through the experiments, we show that the proposed method achieves better performance in both classification and segmentation tasks compared to the SoTA method.
翻訳日:2022-12-26 13:51:54 公開日:2022-12-23