このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20200302となっている論文です。

PDF登録状況(公開日: 20200302)

TitleAuthorsAbstract論文公表日・翻訳日
# 米広告主、コロナウイルスのバンドワゴンに飛び乗る-政治・ニュース・ビジネス

Advertisers Jump on Coronavirus Bandwagon: Politics, News, and Business ( http://arxiv.org/abs/2003.00923v1 )

ライセンス: Link先を確認
Yelena Mejova and Kyriaki Kalimeri(参考訳) ソーシャルメディアの時代において、災害や疫病は、物理的な世界での破壊や苦悩だけでなく、何十億ものインターネットユーザーに情報や意見、予測、アドバイスの拡散を促している。 2019-2020年の新型コロナウイルス感染症(COVID-19)は例外ではなく、世界保健機関(WHO)は偽ニュースの「偽ニュース」を警告している。 本研究では,米国最大のソーシャルメディアプラットフォームであるFacebookで宣伝された広告を通じて,新型コロナウイルスの流行に関する代替の物語を考察する。 新しいFacebook Ads Libraryを使って、私たちは、ニュースメディア、政治、ビジネスと並んで、公衆衛生および非営利団体の広告主を見つけ、新型コロナウイルスを彼らのメッセージとアジェンダに組み込む。 我々は、政治的攻撃、寄付の勧誘、事業促進、株式市場の助言、動物の権利キャンペーンに使用されるウイルスを見つける。 このうち、バイオウィープソンの陰謀説から政治家による検証不能な主張まで、複数の誤情報の例が見つかっている。 私たちはこのデータセットをコミュニティに公開することで、広告ドメインが公衆衛生コミュニケーションと一般の談話における品質管理の重要な部分になることを願っています。

In the age of social media, disasters and epidemics usher not only a devastation and affliction in the physical world, but also prompt a deluge of information, opinions, prognoses and advice to billions of internet users. The coronavirus epidemic of 2019-2020, or COVID-19, is no exception, with the World Health Organization warning of a possible "infodemic" of fake news. In this study, we examine the alternative narratives around the coronavirus outbreak through advertisements promoted on Facebook, the largest social media platform in the US. Using the new Facebook Ads Library, we discover advertisers from public health and non-profit sectors, alongside those from news media, politics, and business, incorporating coronavirus into their messaging and agenda. We find the virus used in political attacks, donation solicitations, business promotion, stock market advice, and animal rights campaigning. Among these, we find several instances of possible misinformation, ranging from bioweapons conspiracy theories to unverifiable claims by politicians. As we make the dataset available to the community, we hope the advertising domain will become an important part of quality control for public health communication and public discourse in general.
翻訳日:2023-05-31 12:33:54 公開日:2020-03-02
# 3次パラメトリックダウンコンバージョンプロセスから放出される6光子絡み状態について

On six-photon entangled state emitted from a single third-order parametric down-conversion process ( http://arxiv.org/abs/2003.00797v1 )

ライセンス: Link先を確認
Ying-Qiu He, Dong Ding, Ting Gao, Fengli Yan(参考訳) 1つの3次パラメトリックダウンコンバージョンプロセスから放出される6光子絡み合い状態を考える。 弱非線形性の系では、双ビームの6光子対称状態を解析できる対称性検出器を提案する。 対称性検出器をカスケードすることにより、任意のツインビーム6光子の対称状態から所望の6光子の絡み合った状態を浄化できることが示される。 線形光学を用いて、3次パラメトリックダウンコンバージョンプロセスから多モード光子絡み状態のクラスを探索する実りあるスキームを提案する。 さらに、線形光学と弱い非線形性に基づく6光子偏光絡みグリーンベルガー・ホーネ・ザイリンガー状態を生成する方法を提案する。

We consider six-photon entangled state emitted from a single third-order parametric down-conversion process. In the regime of weak nonlinearities, we present a symmetry detector which is capable of analyzing the twin-beam six-photon symmetric states. By cascading the symmetry detectors, as an application, it is shown that one can purify the desired six-photon entangled state from an arbitrary twin-beam six-photon symmetric state. With linear optics we propose a fruitful scheme for exploring a class of multimode-photon entangled states from third-order parametric down-conversion process. Furthermore, we provide a method to generate the six-photon polarization entangled Greenberger-Horne-Zeilinger state based on linear optics and weak nonlinearities.
翻訳日:2023-05-31 12:33:36 公開日:2020-03-02
# カシミール力による真空ギャップの伝熱について

On the heat transfer across a vacuum gap mediated by Casimir force ( http://arxiv.org/abs/2003.00760v1 )

ライセンス: Link先を確認
Svend-Age Biehs, Achim Kittel, Philippe Ben-Abdallah(参考訳) 実験に関する最近の報告の後、量子揺らぎによる2つの固体間の真空ギャップを通してのフォノン熱伝達が測定されたと主張されている。 ここでは, この機構を理論的に解析し, カシミール力駆動熱流束は, 任意の分離距離における2つの固体間の近接場熱流束よりも少なくとも15桁小さいことを実証する。 さらに, カシミール力駆動熱流束へのアクセスを許さない振動モードの仮想温度の指標として, 報告された測定値がそれ以上ではない, という説得力のある議論を与える。

Following a recent report on experiments it has been claimed that a phonon heat transfer through a vacuum gap between two solids due to quantum fluctuations had been measured. Here we make a theoretical analyzis of this mechanism and demonstrate that the Casimir force driven heat flux is at least 15 orders of magnitude smaller than the near-field heat flux between two solids at any given separating distance. Moreover, we provide compelling arguments that the measures reported are no more and no less a measure of the virtual temperatures of vibrating modes which does not allow an access to the Casimir force driven heat flux.
翻訳日:2023-05-31 12:32:25 公開日:2020-03-02
# シリコン回路量子電気力学のためのスプリットゲートキャビティ結合器

Split-Gate Cavity Coupler for Silicon Circuit Quantum Electrodynamics ( http://arxiv.org/abs/2003.01088v1 )

ライセンス: Link先を確認
F. Borjans, X. Croot, S. Putz, X. Mi, S. M. Quinn, A. Pan, J. Kerckhoff, E. J. Pritchett, C. A. Jackson, L. F. Edge, R. S. Ross, T. D. Ladd, M. G. Borselli, M. F. Gyure, and J. R. Petta(参考訳) コヒーレント電荷-光子とスピン-光子カップリングは、シリコン二重量子ドット(DQD)で最近達成されている。 本稿では,複数のdqdを同一マイクロ波共振器に結合可能な多用途スプリットゲートキャビティ結合器を示す。 レベルデチューニングの関数としてのキャビティ透過の測定は、電荷キャビティ結合率$g_c/2\pi$ = 58 MHz、電荷デコヒーレンス率$\gamma_c/2\pi$ = 36 MHz、キャビティ崩壊率$\kappa/2\pi$ = 1.2 MHzとなる。 電荷空洞結合速度はデバイスシミュレーションとよく一致している。 我々の結合技術は、複数のDQDを同一キャビティモードに同時結合できるように拡張することができ、マイクロ波光子を用いた半導体量子ビットの長距離結合への扉を開くことができる。

Coherent charge-photon and spin-photon coupling has recently been achieved in silicon double quantum dots (DQD). Here we demonstrate a versatile split-gate cavity-coupler that allows more than one DQD to be coupled to the same microwave cavity. Measurements of the cavity transmission as a function of level detuning yield a charge cavity coupling rate $g_c/2\pi$ = 58 MHz, charge decoherence rate $\gamma_c/2\pi$ = 36 MHz, and cavity decay rate $\kappa/2\pi$ = 1.2 MHz. The charge cavity coupling rate is in good agreement with device simulations. Our coupling technique can be extended to enable simultaneous coupling of multiple DQDs to the same cavity mode, opening the door to long-range coupling of semiconductor qubits using microwave frequency photons.
翻訳日:2023-05-31 12:24:39 公開日:2020-03-02
# 分数量子力学から量子宇宙論へ:序論

From Fractional Quantum Mechanics to Quantum Cosmology: An Overture ( http://arxiv.org/abs/2003.01070v1 )

ライセンス: Link先を確認
P.V. Moniz and S. Jalalzadeh(参考訳) 分数計算は2世紀ほど前のものであるが、その発展は受け入れられず、物理学の応用プログラムが始まったのは前世紀になってからである。 量子物理学に関して言えば、それに対応する文献が相反する一連の論文を生み出したのは過去10年ほど前である。 このような文脈において、この写本は、単純に、主にヒューリスティックで予期せぬプレゼンテーションを通じて、分数量子力学から宇宙論的な設定への拡張を通じて提案することを目的としている。 より具体的には、分数計算の歴史的概要を概説することから始める。 このモチベーションに続いて、分数量子力学の(非常に)簡潔な評価が提示されるが、詳細(数学的な性質の)は文学的な用法として残されている。 その後、量子宇宙論における分数計算の応用が導入され、分数計算の進歩が議論として役立つならば、(ライプニッツから引用するために)有益な結果も引き出されることになる。 特に、ミニ超空間共分散問題や分数微分問題など、運用フレームワークに影響を及ぼす可能性のあるさまざまな困難について論じる。 調査の例は、非常に単純なモデルによって提供される。 具体的には、最小の分数計算要素では、標準宇宙論の平坦性問題を調べる特別なツールがあるかもしれないと推測する。 まとめると、分数量子宇宙論の主題は、いくつかの課題によって構成されるオープンプログラムの観点からのみ実現されたものである。

Fractional calculus is a couple of centuries old, but its development has been less embraced and it was only within the last century that a program of applications for physics started. Regarding quantum physics, it has been only in the previous decade or so that the corresponding literature resulted in a set of defying papers. In such a context, this manuscript constitutes a cordial invitation, whose purpose is simply to suggest, mostly through a heuristic and unpretentious presentation, the extension of fractional quantum mechanics to cosmological settings. Being more specific, we start by outlining a historical summary of fractional calculus. Then, following this motivation, a (very) brief appraisal of fractional quantum mechanics is presented, but where details (namely those of a mathematical nature) are left for literature perusing. Subsequently, the application of fractional calculus in quantum cosmology is introduced, advocating it as worthy to consider: if the progress of fractional calculus serves as an argument, indeed useful consequences will also be drawn (to cite from Leibnitz). In particular, we discuss different difficulties that may affect the operational framework to employ, namely the issues of minisuperspace covariance and fractional derivatives, for instance. An example of investigation is provided by means of a very simple model. Concretely, we restrict ourselves to speculate that with minimal fractional calculus elements, we may have a peculiar tool to inspect the flatness problem of standard cosmology. In summary, the subject of fractional quantum cosmology is herewith proposed, merely realized in terms of an open program constituted by several challenges.
翻訳日:2023-05-31 12:24:07 公開日:2020-03-02
# マルチモードスピンボソンモデルにおける連想記憶の挙動のシグネチャ

Signatures of associative memory behavior in a multi-mode spin-boson model ( http://arxiv.org/abs/2003.01004v1 )

ライセンス: Link先を確認
Eliana Fiorelli, Matteo Marcuzzi, Pietro Rotondo, Federico Carollo, and Igor Lesanovsky(参考訳) スピンボーソンモデルは、キャビティ内の原子やイオン鎖の振動など、様々な物理系を記述することができる。 平衡において、これらの系は弱いスピン-ボソン相互作用から強いスピン-ボソン相互作用に切り替える際の行動に急激な変化を呈することが多い。 これは通常、"ダーク"から"超ラジアン"相への遷移で現れる。 しかし、これらのモデルの平衡外物理学を理解することは極めて困難であり、さらに強いスピン-ボーソンカップリングについても同様である。 ここでは,非平衡な強く相互作用するスピンボソン系が,アルファベットの文字などのパターン認識を許容する連想記憶の基本特性を模倣できることを示す。 スピンとボーソンのカップリングでパターンを符号化し,連想記憶モデルにおけるパターン検索の観点からスピンのダイナミクスを考察する。 我々は、2つの相、すなわち「常磁性」と「強磁性」の相、およびこれらの状態間の交差挙動を同定する。 強磁性」相はパターン検索を連想させる。 ホップフィールド連想メモリの熱力学との類似性と相違を強調し、強結合スピンボーソン系において実際に「機械学習行動」の要素が出現することを示す。

Spin-boson models can describe a variety of physical systems, such as atoms in a cavity or vibrating ion chains. In equilibrium these systems often feature a radical change in their behavior when switching from weak to strong spin-boson interaction. This usually manifests in a transition from a "dark" to a "superradiant" phase. However, understanding the out-of-equilibrium physics of these models is extremely challenging, and even more so for strong spin-boson coupling. Here we show that non-equilibrium strongly interacting spin-boson systems can mimic some fundamental properties of an associative memory - a system which permits the recognition of patterns, such as letters of an alphabet. Patterns are encoded in the couplings between spins and bosons, and we discuss the dynamics of the spins from the perspective of pattern retrieval in associative memory models. We identify two phases, a "paramagnetic" and a "ferromagnetic" one, and a crossover behavior between these regimes. The "ferromagnetic" phase is reminiscent of pattern retrieval. We highlight similarities and differences with the thermal dynamics of a Hopfield associative memory and show that indeed elements of "machine learning behavior" emerge in strongly coupled spin-boson systems.
翻訳日:2023-05-31 12:21:42 公開日:2020-03-02
# 光ツイーザにおけるフォトニック結晶導波路と原子配列の統合

The integration of photonic crystal waveguides with atom arrays in optical tweezers ( http://arxiv.org/abs/2003.01236v1 )

ライセンス: Link先を確認
X. Luan, J. -B. B\'eguin, A. P. Burgers, Z. Qin, S. -P. Yu, H. J. Kimble(参考訳) ナノフォトニクスと低温原子の統合は、量子情報科学の様々な応用と量子多体物理学の探求により、近年、関心が高まっている。 例えば、分散工学フォトニック結晶導波路(pcws)は、誘導モード光との相互作用による超低温中性原子の安定トラップと検出を可能にするだけでなく、原子間の強い光子相互作用や、光子間の原子間相互作用の物理学を探求する可能性も持つ。 1次元および2次元ナノフォトニック格子中の原子と光子を含む様々な理論的機会が分析されているが、pcwsと超低温原子の実験的統合は大きな課題である。 本稿では、光と物質の強い量子相互作用を1次元と2次元のpcwの光子に強く結合した単一原子トウェザーアレイによって達成することを目的として、現在の実験の進展に対するいくつかの重要な障壁を克服する先進的な装置について述べる。 主な技術進歩は、pcwの誘導モードと誘導モードからの光の効率的な自由空間結合、小さなガラス真空セル内のシリコンチップのケイ酸塩結合、フォトニック結晶導波路の近傍への単一原子トウェザーアレイの決定論的機械的配信である。

Integrating nanophotonics and cold atoms has drawn increasing interest in recent years due to diverse applications in quantum information science and the exploration of quantum many-body physics. For example, dispersion-engineered photonic crystal waveguides (PCWs) permit not only stable trapping and probing of ultracold neutral atoms via interactions with guided-mode light, but also the possibility to explore the physics of strong, photon-mediated interactions between atoms, as well as atom-mediated interactions between photons. While diverse theoretical opportunities involving atoms and photons in 1-D and 2-D nanophotonic lattices have been analyzed, a grand challenge remains the experimental integration of PCWs with ultracold atoms. Here we describe an advanced apparatus that overcomes several significant barriers to current experimental progress with the goal of achieving strong quantum interactions of light and matter by way of single-atom tweezer arrays strongly coupled to photons in 1-D and 2-D PCWs. Principal technical advances relate to efficient free-space coupling of light to and from guided modes of PCWs, silicate bonding of silicon chips within small glass vacuum cells, and deterministic, mechanical delivery of single-atom tweezer arrays to the near fields of photonic crystal waveguides.
翻訳日:2023-05-31 12:15:34 公開日:2020-03-02
# 2つのリモートメカニカル共振器間の高速かつ効率的な決定論的量子状態伝達

Fast and efficient deterministic quantum state transfer between two remote mechanical resonators ( http://arxiv.org/abs/2003.01175v1 )

ライセンス: Link先を確認
Mojtaba Rezaei, Kurosh Javidan, Hamidreza Ramezani, and Mehdi Abdi(参考訳) 長距離量子通信における決定論的量子状態伝達の主な課題は、通信チャネルにおける伝送損失である。 この制限を克服するために、ここでは断熱定理を用いて、2つの遠隔機械的モードの間の損失のない進化経路を求める。 2つのノードと中間光チャネルモード間の効果的な結合強度を断熱的に変化させることで、減衰するファイバモードから分離した量子状態転移の伝達経路を設計できる。 提案手法を用いることで,高効率な量子状態転移が得られることを示す。 さらに, 断熱過程の遅い性質を回避し, 機械的減衰や騒音に対する感度と駆動パルスの強度を回避すべく, 提案する量子状態伝達のための断熱通路プロトコルのショートカットを開発した。 その結果, 結合強度の小さい値であっても, 断熱へのショートカットは効率的かつ高速な量子状態伝達を提供することがわかった。 長距離量子通信のためのプロトコルの性能は、数百メートル離れた2つの遠隔機械共振器間の量子状態の転送に効率的であることを示す。

The main challenge in deterministic quantum state transfer in long-distance quantum communications is the transmission losses in the communication channel. To overcome this limitation, here we use the adiabatic theorem and find a lossless evolution path between two remote mechanical modes. By adiabatic variation of the effective coupling strengths between the two nodes and the intermediate optical channel modes, we engineer a transmission path for the quantum state transfer that is decoupled from the decaying fiber modes. Using our proposed method we show that one obtains a quantum state transfer with high efficiency. Furthermore, to bypass the slow nature of the adiabatic process and its sensitivity to the mechanical damping and noise as well as the strength of the driving pulses, we develop the shortcut to adiabatic passage protocol for our proposed quantum state transfer. Our results show that the shortcut to adiabaticity provides an efficient and fast quantum state transfer even for small values of the coupling strength. We show that the performance of our protocol for long-distance quantum communications remains efficient for transferring the quantum states between two remote mechanical resonators being hundred meters apart.
翻訳日:2023-05-31 12:15:10 公開日:2020-03-02
# 2つの結合半導体InAs量子ドットにおける量子相関ダイナミクス

Quantum Correlations Dynamics In Two Coupled Semiconductor InAs Quantum Dots ( http://arxiv.org/abs/2003.01158v1 )

ライセンス: Link先を確認
H. Ait Mansour, F-Z. Siyouri, M. Faqir, and M. El Baz(参考訳) 本研究では,2つの半導体量子ドット内の2つの励起量子ビット間の量子不協和と共起のダイナミクスについて検討した。 マルコフ環境と非マルコフ環境の両方における無次元時間と温度に対するそれらの挙動を探索する。 さらに,これらの相関関係に対する外部電界効果とf-ホルスター相互作用効果を解析した。 量子相関量は電場とf\"オースター相互作用の変動に強く影響されているが、これらの2つのパラメータの変動の下では、その非マルコフ挙動は依然として保存されている。 さらに, 温度と無次元時間の値が大きい場合, 消滅するコンカレンスとは異なり, 非ゼロ不協和音が観測可能であることを示す。

We investigate the dynamics of quantum discord and concurrence between two excitonic qubits placed inside two coupled semiconductor quantum dots independently interacting with dephasing reservoirs. We explore their behavior against the dimensionless time and the temperature in both Markovian and non-Markovian environments. Moreover, we analyze the external electric field effects and the F\"orster interaction effects on these correlations. We show that, although the quantum correlations amount is strongly influenced by the variation of the electric field and the F\"orster interaction, their non-Markovian behavior is still preserved under the variation of these two parameters. Furthermore, we show that for large values of temperature and dimensionless time, unlike concurrence which vanishes, nonzero discord can still be observed.
翻訳日:2023-05-31 12:14:22 公開日:2020-03-02
# 最大速度量子回路

Maximum velocity quantum circuits ( http://arxiv.org/abs/2003.01133v1 )

ライセンス: Link先を確認
Pieter W. Claeys, Austen Lamacraft(参考訳) 我々は、局所的なユニタリ量子回路と最大蝶の速度$v_{B} = 1$で支配される時間進化を持つ量子格子モデルの2つのクラスにおける、時間外相関器(OTOC)の長期限界を考える。 転送行列法を用いて,光円錐上および内部におけるotocの長期値の解析結果を示す。 まず,光円錐から指数関数的減衰を示し,減衰率と時間値の両方を相関関数のそれと関係づける,可積分および非可積分キックイジングモデルを含む,多様なエルゴーディティのレベルを持つ「二重ユニタリ」回路を考える。 第二に、積分可能な蹴りイジングモデルに似たキックxyモデルのクラスを考え、再び$v_{b}=1$を満たし、最大バタフライ速度はデュアルユニタリ回路に限らないことを強調する。

We consider the long-time limit of out-of-time-order correlators (OTOCs) in two classes of quantum lattice models with time evolution governed by local unitary quantum circuits and maximal butterfly velocity $v_{B} = 1$. Using a transfer matrix approach, we present analytic results for the long-time value of the OTOC on and inside the light cone. First, we consider `dual-unitary' circuits with various levels of ergodicity, including the integrable and non-integrable kicked Ising model, where we show exponential decay away from the light cone and relate both the decay rate and the long-time value to those of the correlation functions. Second, we consider a class of kicked XY models similar to the integrable kicked Ising model, again satisfying $v_{B}=1$, highlighting that maximal butterfly velocity is not exclusive to dual-unitary circuits.
翻訳日:2023-05-31 12:13:39 公開日:2020-03-02
# ガウス除去による量子回路のシミュレーションの改善

Improved Simulation of Quantum Circuits by Fewer Gaussian Eliminations ( http://arxiv.org/abs/2003.01130v1 )

ライセンス: Link先を確認
Lucas Kocia and Mohan Sarovar(参考訳) ゲートマジック状態を用いた量子回路の強力なシミュレーションのコストは、その上限値のt=1$, $t=2$, $t=3$, $t=6$に対して奇数素量子値を持つ非自明な還元を示す。 これは qubits の以前の数値境界と一致する。 シミュレーションコストは、t \times t$行列のガウス除去を必要とする項の数によって定義され、安定化器内積の計算や二次ガウス和の評価によるシミュレーション手法のコストをキャプチャする。 以前の量子ビットの数値検索では$t=7$以上の収束はできなかった。 我々は、これらの非自明な還元を$>10^{10^4}$で探索した空間を効果的に増やし、境界を qutrits に対して $t=14$ に拡張する。 これは、ウィグナー・ワイル・モヤル形式(wigner-weyl-moyal formalism)を用いて代数的に境界を見つけることで達成される。 これは${3^{\sim 0.482t}}$ という$3^{\sim 0.469t}} の12ドルのマジック状態から、${3^{\sim 0.482t}} の$ 6 ドルのマジック状態から得られるバウンドを改善する。

We show that the cost of strong simulation of quantum circuits using $t$ $T$ gate magic states exhibits non-trivial reductions on its upper bound for $t=1$, $t=2$, $t=3$, and $t=6$ with odd-prime-qudits. This agrees with previous numerical bounds found for qubits. We define simulation cost by the number of terms that require Gaussian elimination of a $t \times t$ matrix and so capture the cost of simulation methods that proceed by computing stabilizer inner products or evaluating quadratic Gauss sums. Prior numerical searchs for qubits were unable to converge beyond $t=7$. We effectively increase the space searched for these non-trivial reductions by $>10^{10^4}$ and extend the bounds to $t=14$ for qutrits. This is accomplished by using the Wigner-Weyl-Moyal formalism to algebraically find bounds instead of relying on numerics. We find a new reduction in the upper bound from the $12$-qutrit magic state of ${3^{\sim 0.469t}}$, which improves on the bound obtained from the $6$-qutrit magic state of ${3^{\sim 0.482t}}$.
翻訳日:2023-05-31 12:13:21 公開日:2020-03-02
# 固体スピンセンサのキャビティ量子電気力学的読み出し

Cavity quantum electrodynamic readout of a solid-state spin sensor ( http://arxiv.org/abs/2003.01104v1 )

ライセンス: Link先を確認
Erik R. Eisenach, John F. Barry, Michael F. O'Keeffe, Jennifer M. Schloss, Matthew H. Steinecker, Dirk R. Englund, and Danielle A. Braje(参考訳) 堅牢で高忠実な読み出しは、量子デバイスのパフォーマンスの中心である。 特に量子センシング、量子情報、基礎物理学のテストに急速に採用されていることを考えると、読み出しの貧弱さは、固体スピン欠陥に基づくデバイスにとってますます緊急の課題である。 固体のスピン欠陥は、原子系や低温系で利用できる再現性と精度を、コンパクト性や操作条件の範囲において大きな利点と組み合わせている。 しかし、特定のシステムの実験的な進歩にもかかわらず、固体スピンセンサーには普遍的で高忠実な読み出し技術がない。 ここでは, 極低温回路共振器量子電磁力学でよく用いられる同様の手法に基づいて, 誘電体マイクロ波共振器への強い結合により, 窒素空孔(nv)中心の高忠実性, 室温読み出しを実証する。 この強い集団相互作用により、スピンアンサンブルのマイクロ波遷移を直接観測することができ、従来の蛍光読み出しの光子ショットノイズの限界を克服することができる。 この手法を磁気計測に応用し,ジョンソン-ナイキスト系のノイズ限界に接近する磁気感度を示す。 この読み出し技術は、マイクロ波領域に共鳴を示す多くの常磁性スピン系に有効である。 以上の結果から, 固体スピンセンサの均一な読み出し精度を実現するために, アンサンブルサイズ, スピン共振ライン幅の低減, キャビティ品質因子の改善などを行った。

Robust, high-fidelity readout is central to quantum device performance. Overcoming poor readout is an increasingly urgent challenge for devices based on solid-state spin defects, particularly given their rapid adoption in quantum sensing, quantum information, and tests of fundamental physics. Spin defects in solids combine the repeatability and precision available to atomic and cryogenic systems with substantial advantages in compactness and range of operating conditions. However, in spite of experimental progress in specific systems, solid-state spin sensors still lack a universal, high-fidelity readout technique. Here we demonstrate high-fidelity, room-temperature readout of an ensemble of nitrogen-vacancy (NV) centers via strong coupling to a dielectric microwave cavity, building on similar techniques commonly applied in cryogenic circuit cavity quantum electrodynamics. This strong collective interaction allows the spin ensemble's microwave transition to be probed directly, thereby overcoming the optical photon shot noise limitations of conventional fluorescence readout. Applying this technique to magnetometry, we show magnetic sensitivity approaching the Johnson-Nyquist noise limit of the system. This readout technique is viable for the many paramagnetic spin systems that exhibit resonances in the microwave domain. Our results pave a clear path to achieve unity readout fidelity of solid-state spin sensors through increased ensemble size, reduced spin-resonance linewidth, or improved cavity quality factor.
翻訳日:2023-05-31 12:12:54 公開日:2020-03-02
# クロック状態キュービット用高忠実度光シフトゲート

A high fidelity light-shift gate for clock-state qubits ( http://arxiv.org/abs/2003.01102v1 )

ライセンス: Link先を確認
C. H. Baldwin, B. J. Bjork, M. Foss-Feig, J. P. Gaebler, D. Hayes, M. G. Kokish, C. Langer, J. A. Sedlacek, D. Stack, G. Vittorini(参考訳) 現在までに、2つの量子ビット間の最も忠実度の高い量子論理ゲートは、閉じ込められたイオン中の幾何相ゲートのバリエーションで達成されており、2つの主要な変種はモルマー-ソレンセンゲートと光シフト(LS)ゲートである。 これらのアプローチにはそれぞれの利点と課題があります。 例えば、後者は技術的に単純で、光学位相に感受性がないが、クロック状態の量子ビットで直接動作するようにはなされていない。 細い(双極子禁止)光遷移からデチューンする小さな(\sim {\rm MHz}$)デチューンを用いることで、超微細なクロック状態に直接LSゲートを動作させ、可視波長でモデストレーザーパワーを使用する99.74(4)\%のゲート忠実度を達成することができる。 現在のゲートの不純物は技術的ノイズによって支配されているようで、理論的モデリングは99.99ドル以上のゲート忠実性への道筋を示唆している。

To date, the highest fidelity quantum logic gates between two qubits have been achieved with variations on the geometric-phase gate in trapped ions, with the two leading variants being the Molmer-Sorensen gate and the light-shift (LS) gate. Both of these approaches have their respective advantages and challenges. For example, the latter is technically simpler and is natively insensitive to optical phases, but it has not been made to work directly on a clock-state qubit. We present a new technique for implementing the LS gate that combines the best features of these two approaches: By using a small ($\sim {\rm MHz}$) detuning from a narrow (dipole-forbidden) optical transition, we are able to operate an LS gate directly on hyperfine clock states, achieving gate fidelities of $99.74(4)\%$ using modest laser power at visible wavelengths. Current gate infidelities appear to be dominated by technical noise, and theoretical modeling suggests a path towards gate fidelity above $99.99\%$.
翻訳日:2023-05-31 12:12:29 公開日:2020-03-02
# 複合パルスによるドライブノイズ耐性光スイッチング

Drive-noise tolerant optical switching inspired by composite pulses ( http://arxiv.org/abs/2004.00986v1 )

ライセンス: Link先を確認
J.F.F. Bulmer, J.A. Jones, I.A. Walmsley(参考訳) マフ-ツェンダー干渉計の電気光学変調器は、集積フォトニクスにおける光スイッチの一般的な構成である。高いスイッチング速度で動作する場合の課題は、電子駆動信号からのノイズがスイッチング性能に影響を与えることである。ヴァン・カンペンハウトのマッハ-ツェンダー格子スイッチング装置に着想を得た。 複合パルスとして知られる核磁気共鳴の分野から,スイッチのオン・オフ状態とオン・オフ状態の両方で駆動ノイズに対する保護を提供するスイッチを,スイッチング光モードで符号化された位相情報と強度情報の両方に対して提示する。

Electro-optic modulators within Mach--Zehnder interferometers are a common construction for optical switches in integrated photonics. A challenge faced when operating at high switching speeds is that noise from the electronic drive signals will effect switching performance. Inspired by the Mach--Zehnder lattice switching devices of Van Campenhout et al. [Opt. Express, 17, 23793 (2009)] and techniques from the field of Nuclear Magnetic Resonance known as composite pulses, we present switches which offer protection against drive-noise in both the on and off state of the switch for both the phase and intensity information encoded in the switched optical mode.
翻訳日:2023-05-31 12:03:22 公開日:2020-03-02
# ビジネス(ミス)ジェネレーティブAIのユースケース

Business (mis)Use Cases of Generative AI ( http://arxiv.org/abs/2003.07679v1 )

ライセンス: Link先を確認
Stephanie Houde, Vera Liao, Jacquelyn Martino, Michael Muller, David Piorkowski, John Richards, Justin Weisz, Yunfeng Zhang(参考訳) Generative AIは、トレーニングデータから新しいデータを生成することを学ぶ機械学習技術のクラスである。 ディープフェイクやメディアおよびアート関連の生成AIのブレークスルーは、最近人々の注意と想像を惹きつけたが、全体的な領域はビジネス利用の初期段階にある。 さらに、大規模な悪用に対する生成aiの可能性についてはほとんど知られていない。 AIエンジニアと共同創造デザインフィクションを用いて、ビジネス誤用事例の妥当性と重大性を探る。

Generative AI is a class of machine learning technology that learns to generate new data from training data. While deep fakes and media-and art-related generative AI breakthroughs have recently caught people's attention and imagination, the overall area is in its infancy for business use. Further, little is known about generative AI's potential for malicious misuse at large scale. Using co-creation design fictions with AI engineers, we explore the plausibility and severity of business misuse cases.
翻訳日:2023-05-31 12:02:17 公開日:2020-03-02
# ソフトスネークロボットにおけるディープニューラルネットワークとcpg制御によるロコモト学習

Learning to Locomote with Deep Neural-Network and CPG-based Control in a Soft Snake Robot ( http://arxiv.org/abs/2001.04059v2 )

ライセンス: Link先を確認
Xuan Liu, Renato Gasoto, Cagdas Onal, Jie Fu(参考訳) 本稿では,ソフトロボットヘビの新しい移動制御法を提案する。 生物ヘビにインスパイアされた制御アーキテクチャは, 目標変化を伴う適応目標追跡動作を実現するための深層強化学習(RL)モジュールと, 安定かつ多様な移動パターンを生成するための松岡発振器を用いた中央パターン生成(CPG)システムとから構成される。 rlモジュールは脊椎動物の中脳に位置する運動領域を類似させ、ロボットからの状態フィードバックを受けてcpgシステムへの入力を制御している。 その後、cpgシステムの出力は、ソフトスネークロボットの空気圧アクチュエータへの圧力入力に変換される。 松岡発振器の発振周波数と波振幅を異なる時間スケールで独立に制御できることから,最適性とデータ効率で測定した学習性能を向上させるために,オプション批判の枠組みをさらに適応させる。 提案する制御器の性能はシミュレーションと実際のソフトスネークロボットの両方で実験的に検証される。

In this paper, we present a new locomotion control method for soft robot snakes. Inspired by biological snakes, our control architecture is composed of two key modules: A deep reinforcement learning (RL) module for achieving adaptive goal-tracking behaviors with changing goals, and a central pattern generator (CPG) system with Matsuoka oscillators for generating stable and diverse locomotion patterns. The two modules are interconnected into a closed-loop system: The RL module, analogizing the locomotion region located in the midbrain of vertebrate animals, regulates the input to the CPG system given state feedback from the robot. The output of the CPG system is then translated into pressure inputs to pneumatic actuators of the soft snake robot. Based on the fact that the oscillation frequency and wave amplitude of the Matsuoka oscillator can be independently controlled under different time scales, we further adapt the option-critic framework to improve the learning performance measured by optimality and data efficiency. The performance of the proposed controller is experimentally validated with both simulated and real soft snake robots.
翻訳日:2023-01-11 23:16:26 公開日:2020-03-02
# Mat\'ern kernel RKHSにおける関数の帯域最適化

Bandit optimisation of functions in the Mat\'ern kernel RKHS ( http://arxiv.org/abs/2001.10396v2 )

ライセンス: Link先を確認
David Janz, David R. Burt, Javier Gonz\'alez(参考訳) 雑音帯域のフィードバックを受ける領域 $[0,1]^d$ 上で滑らか性パラメータ $\nu$ を持つ mat\'ern 核の再生核ヒルベルト空間 (rkhs) における関数の最適化の問題を考える。 我々の貢献である$\pi$-GP-UCBアルゴリズムは、すべての$\nu>1$と$d \geq 1$に対して保証されたサブ線形後悔を伴う最初の実践的アプローチである。 実験による検証では、前任のGP-UCBに比べて性能が向上し、計算精度が大幅に向上した。

We consider the problem of optimising functions in the reproducing kernel Hilbert space (RKHS) of a Mat\'ern kernel with smoothness parameter $\nu$ over the domain $[0,1]^d$ under noisy bandit feedback. Our contribution, the $\pi$-GP-UCB algorithm, is the first practical approach with guaranteed sublinear regret for all $\nu>1$ and $d \geq 1$. Empirical validation suggests better performance and drastically improved computational scalablity compared with its predecessor, Improved GP-UCB.
翻訳日:2023-01-06 02:05:07 公開日:2020-03-02
# 公正な相関クラスタリング

Fair Correlation Clustering ( http://arxiv.org/abs/2002.02274v2 )

ライセンス: Link先を確認
Sara Ahmadian, Alessandro Epasto, Ravi Kumar, Mohammad Mahdian(参考訳) 本稿では,正当性制約下での相関クラスタリングについて検討する。 近年,$k$-medianおよび$k$-centerクラスタリングのフェア変種が研究され,fairlet decompositionと呼ばれる概念を用いた近似アルゴリズムが提案されている。 数種類のフェアネス制約の下でフェア相関クラスタリングを行う近似アルゴリズムを求める。 その結果,新たな組合せ最適化問題を導入して,相関クラスタリングのためのフェアレット分解を得ることができた。 我々は$k$-medianコストに類似したコストでフェアレット分解を定義し、これにより幅広いフェアネス制約に対する近似アルゴリズムを得ることができる。 我々は,実グラフ上でのアルゴリズムの詳細な解析によって理論的結果を補完し,相関クラスタリングに対する公平な解は,最先端のアルゴリズム(unfair)に比べて少ないコストで得られることを示した。

In this paper, we study correlation clustering under fairness constraints. Fair variants of $k$-median and $k$-center clustering have been studied recently, and approximation algorithms using a notion called fairlet decomposition have been proposed. We obtain approximation algorithms for fair correlation clustering under several important types of fairness constraints. Our results hinge on obtaining a fairlet decomposition for correlation clustering by introducing a novel combinatorial optimization problem. We define a fairlet decomposition with cost similar to the $k$-median cost and this allows us to obtain approximation algorithms for a wide range of fairness constraints. We complement our theoretical results with an in-depth analysis of our algorithms on real graphs where we show that fair solutions to correlation clustering can be obtained with limited increase in cost compared to the state-of-the-art (unfair) algorithms.
翻訳日:2023-01-03 09:33:16 公開日:2020-03-02
# Deep Gated Networks:ディープラーニングのトレーニングと一般化を理解するためのフレームワーク

Deep Gated Networks: A framework to understand training and generalisation in deep learning ( http://arxiv.org/abs/2002.03996v2 )

ライセンス: Link先を確認
Chandrashekar Lakshminarayanan and Amit Vikram Singh(参考訳) ReLU活性化によるディープニューラルネットワーク(DNN)の訓練と一般化における(確率的)勾配降下(SGD)の役割を理解することが、近年のオブジェクト研究である。 本稿では,ReLUアクティベーションを伴うDNNに関する洞察を得るために,ディープゲートネットワーク(DGN)をフレームワークとして利用する。 DGNでは、単一ニューロンユニットは、プレアクティベーション入力(内積に等しく、層と前層の重みが出力する)と、[0,1]$に属するゲーティング値と、前アクティベーション入力とゲーティング値の乗算に等しい2つの成分を有する。 ReLUアクティベーションを持つ標準DNNはDGNの特別な場合であり、前アクティベーション入力が正か負かに基づいてゲーティング値が1/0$である。 我々はDGNのいくつかの変種を理論的に分析・実験し、それぞれの変種はReLUアクティベーションを持つDNNにおける訓練または一般化の特定の側面を理解するのに適している。 私たちの理論は2つの疑問に光を当てる 一 訓練の助けになるところまで深度を増すこと 二 ポイントを超えて深度を増すことが 訓練を損なう理由 また,ゲート適応,すなわち,学習過程におけるゲーティング値の変化が一般化の鍵となることを示す実験的な証拠も提示する。

Understanding the role of (stochastic) gradient descent (SGD) in the training and generalisation of deep neural networks (DNNs) with ReLU activation has been the object study in the recent past. In this paper, we make use of deep gated networks (DGNs) as a framework to obtain insights about DNNs with ReLU activation. In DGNs, a single neuronal unit has two components namely the pre-activation input (equal to the inner product the weights of the layer and the previous layer outputs), and a gating value which belongs to $[0,1]$ and the output of the neuronal unit is equal to the multiplication of pre-activation input and the gating value. The standard DNN with ReLU activation, is a special case of the DGNs, wherein the gating value is $1/0$ based on whether or not the pre-activation input is positive or negative. We theoretically analyse and experiment with several variants of DGNs, each variant suited to understand a particular aspect of either training or generalisation in DNNs with ReLU activation. Our theory throws light on two questions namely i) why increasing depth till a point helps in training and ii) why increasing depth beyond a point hurts training? We also present experimental evidence to show that gate adaptation, i.e., the change of gating value through the course of training is key for generalisation.
翻訳日:2023-01-02 07:23:03 公開日:2020-03-02
# 生成ネットワークの圧縮学習

Compressive Learning of Generative Networks ( http://arxiv.org/abs/2002.05095v2 )

ライセンス: Link先を確認
Vincent Schellekens and Laurent Jacques(参考訳) 生成ネットワークは、サンプリングした複雑な密度を印象的な精度で暗黙的に近似する。 しかし、現代のデータセットの膨大な規模のため、このトレーニングプロセスはしばしば計算コストがかかる。 我々は,1回のスケッチベクトルとして1回のパスで圧縮することで,大規模データセットの計算負担を軽減することで,最近の圧縮学習の枠組みに生成ネットワークトレーニングを取り入れた。 次に、最大平均離散度を近似したコスト関数を提案するが、このスケッチしか必要とせず、時間とメモリ効率を最適化する。

Generative networks implicitly approximate complex densities from their sampling with impressive accuracy. However, because of the enormous scale of modern datasets, this training process is often computationally expensive. We cast generative network training into the recent framework of compressive learning: we reduce the computational burden of large-scale datasets by first harshly compressing them in a single pass as a single sketch vector. We then propose a cost function, which approximates the Maximum Mean Discrepancy metric, but requires only this sketch, which makes it time- and memory-efficient to optimize.
翻訳日:2023-01-01 19:21:15 公開日:2020-03-02
# CausalML: Causal Machine Learning用のPythonパッケージ

CausalML: Python Package for Causal Machine Learning ( http://arxiv.org/abs/2002.11631v2 )

ライセンス: Link先を確認
Huigang Chen, Totte Harinen, Jeong-Yoon Lee, Mike Yung, Zhenyu Zhao(参考訳) CausalMLは因果推論と機械学習に関連するアルゴリズムのPython実装である。 近年,因果推論と機械学習を組み合わせたアルゴリズムがトレンドとなっている。 このパッケージは、Pythonでこの分野のメソッドのコレクションを作成することによって、方法論と実践的アプリケーションに関する理論的作業のギャップを埋めようとしている。 本稿では,このパッケージのキーコンセプト,スコープ,ユースケースを紹介する。

CausalML is a Python implementation of algorithms related to causal inference and machine learning. Algorithms combining causal inference and machine learning have been a trending topic in recent years. This package tries to bridge the gap between theoretical work on methodology and practical applications by making a collection of methods in this field available in Python. This paper introduces the key concepts, scope, and use cases of this package.
翻訳日:2022-12-28 21:18:45 公開日:2020-03-02
# ストロークリハビリテーション評価のための機械学習に基づく意思決定支援システムの可能性

Opportunities of a Machine Learning-based Decision Support System for Stroke Rehabilitation Assessment ( http://arxiv.org/abs/2002.12261v2 )

ライセンス: Link先を確認
Min Hun Lee, Daniel P. Siewiorek, Asim Smailagic, Alexandre Bernardino, and Sergi Berm\'udez i Badia(参考訳) 患者の適切な介入を決定するにはリハビリテーション評価が不可欠である。 しかし、現在の評価の実践は主にセラピストの経験に依存しており、セラピストの可用性に限界があるため、しばしば評価が行われる。 本稿では,患者の機能的能力を評価するためのセラピストのニーズを明らかにする(例えば,運動動作の定量的情報を用いた評価の代替的視点)。 その結果、強化学習を用いて評価の健全な特徴を識別し、運動の質を評価し、患者固有の分析を要約する知的意思決定支援システムを開発した。 本システムの評価には15例の患者から7名のセラピストが参加し,3回のエクササイズを行った。 評価の結果,従来のシステムよりも,より有用な情報を提示し,セラピストの評価を0.6600から0.7108F1スコア(p <0.05$)に大幅に向上させることができた。 我々は,人間と機械の協調的意思決定システムを開発する上で,文脈に関連があり,健全な情報提示と適応の重要性について論じる。

Rehabilitation assessment is critical to determine an adequate intervention for a patient. However, the current practices of assessment mainly rely on therapist's experience, and assessment is infrequently executed due to the limited availability of a therapist. In this paper, we identified the needs of therapists to assess patient's functional abilities (e.g. alternative perspective on assessment with quantitative information on patient's exercise motions). As a result, we developed an intelligent decision support system that can identify salient features of assessment using reinforcement learning to assess the quality of motion and summarize patient specific analysis. We evaluated this system with seven therapists using the dataset from 15 patient performing three exercises. The evaluation demonstrates that our system is preferred over a traditional system without analysis while presenting more useful information and significantly increasing the agreement over therapists' evaluation from 0.6600 to 0.7108 F1-scores ($p <0.05$). We discuss the importance of presenting contextually relevant and salient information and adaptation to develop a human and machine collaborative decision making system.
翻訳日:2022-12-28 08:07:05 公開日:2020-03-02
# RP-DNN:ソーシャルメディアにおける早期噂検出のためのつぶやきレベルの伝搬コンテキストに基づくディープニューラルネットワーク

RP-DNN: A Tweet level propagation context based deep neural networks for early rumor detection in Social Media ( http://arxiv.org/abs/2002.12683v2 )

ライセンス: Link先を確認
Jie Gao, Sooji Han, Xingyi Song, Fabio Ciravegna(参考訳) ソーシャルメディアプラットフォームの初期の噂検出(erd)は、限定的で不完全でうるさい情報がある場合、非常に困難である。 既存のメソッドの多くは、特定のイベントに関連するポストの収集と、ユーザー生成コンテンツのみに依存するイベントレベルの検出に主に取り組んできた。 これらは、イベントが展開し広まる前に、ごく初期の噂ソースを検出するのに適していない。 本稿では,メッセージレベルでのEDRの課題に対処する。 本稿では,タスク固有のキャラクタベース双方向言語モデルとlstm(stacked long short-term memory)ネットワークを組み合わせた,入力ソースツイートのテキスト内容と社会的・時間的コンテキストを表現するハイブリッドニューラルネットワークアーキテクチャを提案する。 多層アテンションモデルを用いて、複数のコンテキスト入力に対する注意コンテキスト埋め込みを共同学習する。 実験では、7つの公開実生活の噂イベントデータセットに対して,LOO-CV (strentent leave-out-out cross-validation) の評価設定を適用した。 当社のモデルでは,12件以上のイベントと2,967件の噂を網羅する大規模拡張データ上での未知の噂を検出するために,最先端(SoA)性能を実現している。 提案モデルの各成分の相対的寄与を理解するためにアブレーション研究を行った。

Early rumor detection (ERD) on social media platform is very challenging when limited, incomplete and noisy information is available. Most of the existing methods have largely worked on event-level detection that requires the collection of posts relevant to a specific event and relied only on user-generated content. They are not appropriate to detect rumor sources in the very early stages, before an event unfolds and becomes widespread. In this paper, we address the task of ERD at the message level. We present a novel hybrid neural network architecture, which combines a task-specific character-based bidirectional language model and stacked Long Short-Term Memory (LSTM) networks to represent textual contents and social-temporal contexts of input source tweets, for modelling propagation patterns of rumors in the early stages of their development. We apply multi-layered attention models to jointly learn attentive context embeddings over multiple context inputs. Our experiments employ a stringent leave-one-out cross-validation (LOO-CV) evaluation setup on seven publicly available real-life rumor event data sets. Our models achieve state-of-the-art(SoA) performance for detecting unseen rumors on large augmented data which covers more than 12 events and 2,967 rumors. An ablation study is conducted to understand the relative contribution of each component of our proposed model.
翻訳日:2022-12-28 02:40:42 公開日:2020-03-02
# 画像残差によるパッチ攻撃の検出

Detecting Patch Adversarial Attacks with Image Residuals ( http://arxiv.org/abs/2002.12504v2 )

ライセンス: Link先を確認
Marius Arvinte, Ahmed Tewfik, Sriram Vishwanath(参考訳) 画像残差に基づく逆サンプル検出アルゴリズムを導入し,特にパッチベースの攻撃を防ぐために設計した。 画像残差は、入力画像と識別版との差として取得され、識別器は、クリーンサンプルと逆サンプルとを区別するように訓練される。 より正確には、ウェーブレットドメインアルゴリズムを用いて画像にノイズを与え、得られた残差が敵の攻撃に対するデジタル指紋として働くことを示す。 物理的敵の限界をエミュレートするため,本手法は,攻撃対象が検出方式について十分な知識を持つ設定を含む,局所的(パッチベースの)敵攻撃に対するアプローチの性能を評価する。 提案手法は,従来認識されていなかったより強力な攻撃に一般化し,アダプティブアタックの成功率(逆に計算労力を増加させる)を低減できることを示す。

We introduce an adversarial sample detection algorithm based on image residuals, specifically designed to guard against patch-based attacks. The image residual is obtained as the difference between an input image and a denoised version of it, and a discriminator is trained to distinguish between clean and adversarial samples. More precisely, we use a wavelet domain algorithm for denoising images and demonstrate that the obtained residuals act as a digital fingerprint for adversarial attacks. To emulate the limitations of a physical adversary, we evaluate the performance of our approach against localized (patch-based) adversarial attacks, including in settings where the adversary has complete knowledge about the detection scheme. Our results show that the proposed detection method generalizes to previously unseen, stronger attacks and that it is able to reduce the success rate (conversely, increase the computational effort) of an adaptive attacker.
翻訳日:2022-12-28 02:40:21 公開日:2020-03-02
# 色濃度に対する多相合成法

A Multi-Hypothesis Approach to Color Constancy ( http://arxiv.org/abs/2002.12896v2 )

ライセンス: Link先を確認
Daniel Hernandez-Juarez and Sarah Parisot and Benjamin Busam and Ales Leonardis and Gregory Slabaugh and Steven McDonagh(参考訳) 現代のアプローチでは、カラーコンステンシー問題をカメラ固有の照度マッピングの学習として捉えている。 高い精度はカメラ固有のデータで達成できるが、これらのモデルはカメラのスペクトル感度に依存し、新しいデバイスにはあまり一般化されない。 さらに、回帰法は問題の性質が不明確であるため、可視照度解の潜在的な曖昧さを明示的に考慮しない点推定を生成する。 本稿では,色相のあいまいさを自然に扱うベイズ的枠組みを提案する。 まず、データ駆動方式で候補シーン照度のセットを選択し、対象画像に適用して修正画像のセットを生成する。 第2に、補正画像毎に、光源が無彩色である可能性がカメラ非依存のCNNを用いて推定する。 最後に,提案手法は生成した後続確率分布から最終照明推定値を明示的に学習する。 確率推定器はカメラ非依存の質問に答えることを学び、教師付き学習タスクから照度推定を分離することで、効果的なマルチカメラトレーニングを可能にする。 提案手法を広範に評価し,新たなセンサ一般化のためのベンチマークを再学習せずに設定した。 提案手法は,リアルタイム実行を維持しつつ,複数の公開データセット(最大11%の中央値角誤差改善)に対して最先端の精度を提供する。

Contemporary approaches frame the color constancy problem as learning camera specific illuminant mappings. While high accuracy can be achieved on camera specific data, these models depend on camera spectral sensitivity and typically exhibit poor generalisation to new devices. Additionally, regression methods produce point estimates that do not explicitly account for potential ambiguities among plausible illuminant solutions, due to the ill-posed nature of the problem. We propose a Bayesian framework that naturally handles color constancy ambiguity via a multi-hypothesis strategy. Firstly, we select a set of candidate scene illuminants in a data-driven fashion and apply them to a target image to generate of set of corrected images. Secondly, we estimate, for each corrected image, the likelihood of the light source being achromatic using a camera-agnostic CNN. Finally, our method explicitly learns a final illumination estimate from the generated posterior probability distribution. Our likelihood estimator learns to answer a camera-agnostic question and thus enables effective multi-camera training by disentangling illuminant estimation from the supervised learning task. We extensively evaluate our proposed approach and additionally set a benchmark for novel sensor generalisation without re-training. Our method provides state-of-the-art accuracy on multiple public datasets (up to 11% median angular error improvement) while maintaining real-time execution.
翻訳日:2022-12-28 02:31:33 公開日:2020-03-02
# 未知目的のロバスト最適化のための混合戦略

Mixed Strategies for Robust Optimization of Unknown Objectives ( http://arxiv.org/abs/2002.12613v2 )

ライセンス: Link先を確認
Pier Giuseppe Sessa, Ilija Bogunovic, Maryam Kamgarpour, Andreas Krause(参考訳) そこでは,不確実パラメータの最悪の実現に対して,未知の目的関数を最適化することが目的である。 そこで我々は,未知の目的をノイズ点評価から逐次学習する,新しいサンプル効率アルゴリズムGP-MROを設計する。 GP-MROは、最悪のケースで期待される目標値を最大化する、堅牢でランダムな混合戦略の発見を目指している。 これを実現するために、オンライン学習のテクニックとガウス過程の非パラメトリック信頼境界を組み合わせる。 GP-MROが興味のある異なるGPカーネルに対して,頑健な準最適混合戦略を発見するのに必要なサンプル数を特徴付ける。 我々は,合成データセットおよび自律走行車両の軌道計画タスクにおけるアルゴリズムの性能を実験的に実証する。 GP-MROの混合戦略は全体の性能を著しく改善するが,本シミュレーションでは頑健な決定論的戦略が過度に保守的であることを示す。

We consider robust optimization problems, where the goal is to optimize an unknown objective function against the worst-case realization of an uncertain parameter. For this setting, we design a novel sample-efficient algorithm GP-MRO, which sequentially learns about the unknown objective from noisy point evaluations. GP-MRO seeks to discover a robust and randomized mixed strategy, that maximizes the worst-case expected objective value. To achieve this, it combines techniques from online learning with nonparametric confidence bounds from Gaussian processes. Our theoretical results characterize the number of samples required by GP-MRO to discover a robust near-optimal mixed strategy for different GP kernels of interest. We experimentally demonstrate the performance of our algorithm on synthetic datasets and on human-assisted trajectory planning tasks for autonomous vehicles. In our simulations, we show that robust deterministic strategies can be overly conservative, while the mixed strategies found by GP-MRO significantly improve the overall performance.
翻訳日:2022-12-28 01:27:54 公開日:2020-03-02
# モデルレス強化学習による連続空間MDPの形式的制御器合成

Formal Controller Synthesis for Continuous-Space MDPs via Model-Free Reinforcement Learning ( http://arxiv.org/abs/2003.00712v1 )

ライセンス: Link先を確認
Abolfazl Lavaei, Fabio Somenzi, Sadegh Soudjani, Ashutosh Trivedi, and Majid Zamani(参考訳) 連続空間マルコフ決定プロセス(MDP)のポリシーを合成する新しい強化学習手法を提案する。 このスキームにより、有限状態抽象を明示的に構築することなく、有限空間 MDP に対してモデルフリーで既成の強化学習アルゴリズムを適用し、対応する連続空間 MDP の最適戦略を計算することができる。 提案手法は, 有限の MDP を未知の遷移確率で抽象化し, 抽象的 MDP 上での戦略を合成し, 最適性を近似した具体的な連続空間 MDP 上で結果のマッピングを行う。 システムに対する関心の性質は、構文的に共安全な線形時間論理(scLTL)として知られる線形時間論理の断片に属し、合成要求は与えられた有界時間地平線内での満足の確率を最大化することである。 本稿の重要な貢献は,有限個のMDP上での強化学習に古典的な収束結果を活用することであり,確率的近接性保証を提供しながら,未知の連続空間MDPに対する満足度を最大化するための制御戦略を提供する。 オートマタベースの報酬関数は、しばしばスパースであり、学習をスピードアップするための密集した報酬を生成するために、新しいポテンシャルベースの報酬シェーピング技術を提案する。 提案手法の有効性は,BMW 320i車の室内温度の調節,道路交通セルの制御,および7次元非線形モデルの3つの物理ベンチマークに適用することによって実証された。

A novel reinforcement learning scheme to synthesize policies for continuous-space Markov decision processes (MDPs) is proposed. This scheme enables one to apply model-free, off-the-shelf reinforcement learning algorithms for finite MDPs to compute optimal strategies for the corresponding continuous-space MDPs without explicitly constructing the finite-state abstraction. The proposed approach is based on abstracting the system with a finite MDP (without constructing it explicitly) with unknown transition probabilities, synthesizing strategies over the abstract MDP, and then mapping the results back over the concrete continuous-space MDP with approximate optimality guarantees. The properties of interest for the system belong to a fragment of linear temporal logic, known as syntactically co-safe linear temporal logic (scLTL), and the synthesis requirement is to maximize the probability of satisfaction within a given bounded time horizon. A key contribution of the paper is to leverage the classical convergence results for reinforcement learning on finite MDPs and provide control strategies maximizing the probability of satisfaction over unknown, continuous-space MDPs while providing probabilistic closeness guarantees. Automata-based reward functions are often sparse; we present a novel potential-based reward shaping technique to produce dense rewards to speed up learning. The effectiveness of the proposed approach is demonstrated by applying it to three physical benchmarks concerning the regulation of a room's temperature, control of a road traffic cell, and of a 7-dimensional nonlinear model of a BMW 320i car.
翻訳日:2022-12-27 06:07:08 公開日:2020-03-02
# ネットワーク干渉による処理効果推定のためのほぼ整合性

Almost-Matching-Exactly for Treatment Effect Estimation under Network Interference ( http://arxiv.org/abs/2003.00964v1 )

ライセンス: Link先を確認
M. Usaid Awan, Marco Morucci, Vittorio Orlandi, Sudeepa Roy, Cynthia Rudin, Alexander Volfovsky(参考訳) 本研究では,観測ネットワーク上でユニットが接続されているランダム化実験から直接処理効果を回収し,エッジを共有するユニット同士の結果に影響を及ぼす可能性のあるマッチング手法を提案する。 ランダム化実験における従来の治療効果推定器は偏りがあり、この設定では誤りやすい。 本手法は, 近傍グラフ内の一意部分グラフの個数にほぼ一致する。 私たちが構築するマッチは解釈可能で高品質です。 本手法は,追加単位レベルの共変量情報に対応するために容易に拡張できる。 本研究では,本手法が既存の手法よりも有意義かつ解釈可能な結果が得られることを実証的に示す。

We propose a matching method that recovers direct treatment effects from randomized experiments where units are connected in an observed network, and units that share edges can potentially influence each others' outcomes. Traditional treatment effect estimators for randomized experiments are biased and error prone in this setting. Our method matches units almost exactly on counts of unique subgraphs within their neighborhood graphs. The matches that we construct are interpretable and high-quality. Our method can be extended easily to accommodate additional unit-level covariate information. We show empirically that our method performs better than other existing methodologies for this problem, while producing meaningful, interpretable results.
翻訳日:2022-12-27 06:01:27 公開日:2020-03-02
# psf-net:地上光学望遠鏡のための非パラメトリック点拡散関数モデル

PSF--NET: A Non-parametric Point Spread Function Model for Ground Based Optical Telescopes ( http://arxiv.org/abs/2003.00615v1 )

ライセンス: Link先を確認
Peng Jia, Xuebo Wu, Yi Huang, Bojun Cai, Dongmei Cai(参考訳) 地上の光学望遠鏡は大気の乱流による収差に深刻な影響を受けている。 これらの収差の理解は、機器設計と画像復元の手法開発において重要である。 点拡散関数は光学系全体の性能を反映できるため,大気乱流による収差を記述するために点拡散関数を用いるのが適切である。 同じ形状の大気乱流によって引き起こされる点拡散関数が同じ多様体空間に属することを仮定し、非パラメトリック点拡散関数 -psf-net を提案する。 PSF-NETは周期畳み込みニューラルネットワーク構造を持ち、同じ形状の大気乱流によって誘導されるPSFの多様体空間の統計的表現である。 シミュレーションおよび実観測データを用いてPSF-NETを検証したところ、よく訓練されたPSF-NETは、同じプロファイルで大気乱流によってぼやけた短い露光画像を復元できることがわかった。 さらに,psf-netの解釈特性を解析するために,統計平均psfと見なすことのできるpsf-netのインパルス応答を用いた。 統計的平均PSFの変動は,大気乱流プロファイルの変動によって引き起こされ,大気乱流プロファイルの差が大きくなるにつれて,統計平均PSFの差も増加することがわかった。 この論文で提案したPSF-NETは、大気乱流誘起収差を解析する新しい方法を提供し、地上型光学望遠鏡の新しい観測方法の開発に有用である。

Ground based optical telescopes are seriously affected by atmospheric turbulence induced aberrations. Understanding properties of these aberrations is important both for instruments design and image restoration methods development. Because the point spread function can reflect performance of the whole optic system, it is appropriate to use the point spread function to describe atmospheric turbulence induced aberrations. Assuming point spread functions induced by the atmospheric turbulence with the same profile belong to the same manifold space, we propose a non-parametric point spread function -- PSF-NET. The PSF-NET has a cycle convolutional neural network structure and is a statistical representation of the manifold space of PSFs induced by the atmospheric turbulence with the same profile. Testing the PSF-NET with simulated and real observation data, we find that a well trained PSF--NET can restore any short exposure images blurred by atmospheric turbulence with the same profile. Besides, we further use the impulse response of the PSF-NET, which can be viewed as the statistical mean PSF, to analyze interpretation properties of the PSF-NET. We find that variations of statistical mean PSFs are caused by variations of the atmospheric turbulence profile: as the difference of the atmospheric turbulence profile increases, the difference between statistical mean PSFs also increases. The PSF-NET proposed in this paper provides a new way to analyze atmospheric turbulence induced aberrations, which would be benefit to develop new observation methods for ground based optical telescopes.
翻訳日:2022-12-27 05:59:37 公開日:2020-03-02
# マンモグラム画像分類のための教師なし領域適応:モデル一般化のためのプロトタイプツール

Unsupervised Domain Adaptation for Mammogram Image Classification: A Promising Tool for Model Generalization ( http://arxiv.org/abs/2003.01111v1 )

ライセンス: Link先を確認
Yu Zhang, Gongbo Liang, Nathan Jacobs, Xiaoqin Wang(参考訳) 一般化は、深層学習モデルの医療画像への応用における重要な課題の1つである。 公開データセットでトレーニングされたそのようなモデルは、患者集団と画像デバイス構成の違いにより、実世界の臨床データではうまく機能しないことが多い。 また、手動による臨床画像の注釈も高価である。 本研究では,追加の手動アノテーションを使わずにモデルの一般化能力を向上させるために,cycle-ganを用いた教師なしドメイン適応(uda)手法を提案する。

Generalization is one of the key challenges in the clinical validation and application of deep learning models to medical images. Studies have shown that such models trained on publicly available datasets often do not work well on real-world clinical data due to the differences in patient population and image device configurations. Also, manually annotating clinical images is expensive. In this work, we propose an unsupervised domain adaptation (UDA) method using Cycle-GAN to improve the generalization ability of the model without using any additional manual annotations.
翻訳日:2022-12-27 05:59:12 公開日:2020-03-02
# 造影剤を使わずに造影ctアンギオグラフィーを生成できる深層学習法

A Deep learning Approach to Generate Contrast-Enhanced Computerised Tomography Angiography without the Use of Intravenous Contrast Agents ( http://arxiv.org/abs/2003.01223v1 )

ライセンス: Link先を確認
Anirudh Chandrashekar, Ashok Handa, Natesh Shivakumar, Pierfrancesco Lapolla, Vicente Grau, Regent Lee(参考訳) 造影CT (Contrast-enhanced Computed Tomography angiograms, CTAs) は心血管造影で血管構造の非侵襲的観察に広く用いられている。 しかし、コントラスト剤は、注射部位の合併症と、コントラスト誘発性腎症(CIN)や腎不全につながる腎毒性と関連している。 非コントラストctから得られた生データは血液や他の軟組織成分を識別するのに十分な情報を含むと仮定した。 深層学習法を用いて軟組織成分間の微妙さを定義し, 造影剤を使わずに造影CTAをシミュレートした。 非コントラスト像とcta像を併用した26例を臨床研究からランダムに選択した。 10例 (n = 100) のaaa内の非コントラスト軸方向スライスをルーメン, 光内血栓, 界面位置におけるhounsfield unit (hu) 分布から採取した。 これらの領域におけるHUのサンプリングでは,すべての領域間で有意な差異(p<0.001)がみられ,これらの領域間での放射線学的シグネチャの内在的差異が確認された。 大きなトレーニングデータセットを生成するために、トレーニングセット(n=13)から一対の軸スライスを追加して、合計23,551枚の2d画像を生成する。 この非コントラストコントラスト(nc2c)変換タスクのために,2次元サイクル生成逆ネットワーク(cyclegan)を訓練した。 コントラスト画像との比較により, サイクルガン出力の精度を評価した。 このパイプラインは、非コントラストCT画像において、視覚的に非コヒーレントな軟組織領域を区別することができる。 非コントラスト画像から生成されたCTAは、地上の真実と強く類似している。 本稿では,CT画像処理におけるジェネレーティブ・アドバイサル・ネットワークの新たな応用について述べる。 これは造影CT画像を必要とする臨床経路を妨害する可能性がある。

Contrast-enhanced computed tomography angiograms (CTAs) are widely used in cardiovascular imaging to obtain a non-invasive view of arterial structures. However, contrast agents are associated with complications at the injection site as well as renal toxicity leading to contrast-induced nephropathy (CIN) and renal failure. We hypothesised that the raw data acquired from a non-contrast CT contains sufficient information to differentiate blood and other soft tissue components. We utilised deep learning methods to define the subtleties between soft tissue components in order to simulate contrast enhanced CTAs without contrast agents. Twenty-six patients with paired non-contrast and CTA images were randomly selected from an approved clinical study. Non-contrast axial slices within the AAA from 10 patients (n = 100) were sampled for the underlying Hounsfield unit (HU) distribution at the lumen, intra-luminal thrombus and interface locations. Sampling of HUs in these regions revealed significant differences between all regions (p<0.001 for all comparisons), confirming the intrinsic differences in the radiomic signatures between these regions. To generate a large training dataset, paired axial slices from the training set (n=13) were augmented to produce a total of 23,551 2-D images. We trained a 2-D Cycle Generative Adversarial Network (cycleGAN) for this non-contrast to contrast (NC2C) transformation task. The accuracy of the cycleGAN output was assessed by comparison to the contrast image. This pipeline is able to differentiate between visually incoherent soft tissue regions in non-contrast CT images. The CTAs generated from the non-contrast images bear strong resemblance to the ground truth. Here we describe a novel application of Generative Adversarial Network for CT image processing. This is poised to disrupt clinical pathways requiring contrast enhanced CT imaging.
翻訳日:2022-12-27 05:59:01 公開日:2020-03-02
# ロボットマインドリーディングと信頼の問題

Robot Mindreading and the Problem of Trust ( http://arxiv.org/abs/2003.01238v1 )

ライセンス: Link先を確認
Andr\'es P\'aez(参考訳) 本稿では,ロボットに対する信念,願望,意図の帰属に関する3つの疑問を提起する。 1つ目は、人間が実際にロボットのマインドリードに携わっているかどうかです。 ロボットマインドリーダーはロボットに対する信頼を育んでいるのだろうか? どちらの質問も経験的であり、利用可能な証拠が不十分であることを示します。 開発者とエンジニアは、透明性を高めるという彼らの目標の観点から、ロボットマインドリードを促進するべきか? ここでの心配は、ロボットをもっとマインドリーなものにすることで、自動決定プロセスを理解するプロジェクトを捨てようとしていることです。 心を読みやすくする機能は、自動決定を決定する要因を、これまで以上に不透明にする傾向がある。 そして、不透明性を取り除く現在の戦略は、心の可読性を高めるものではない。 論文の最後の部分は、この明らかなトレードオフを分析するさまざまな方法について論じており、ロボットが意図する使用に必要な信頼のレベルに関連する実用的要因に依存する許容可能な不透明さのレベルを採用する必要があることを示唆している。

This paper raises three questions regarding the attribution of beliefs, desires, and intentions to robots. The first one is whether humans in fact engage in robot mindreading. If they do, this raises a second question: does robot mindreading foster trust towards robots? Both of these questions are empirical, and I show that the available evidence is insufficient to answer them. Now, if we assume that the answer to both questions is affirmative, a third and more important question arises: should developers and engineers promote robot mindreading in view of their stated goal of enhancing transparency? My worry here is that by attempting to make robots more mind-readable, they are abandoning the project of understanding automatic decision processes. Features that enhance mind-readability are prone to make the factors that determine automatic decisions even more opaque than they already are. And current strategies to eliminate opacity do not enhance mind-readability. The last part of the paper discusses different ways to analyze this apparent trade-off and suggests that a possible solution must adopt tolerable degrees of opacity that depend on pragmatic factors connected to the level of trust required for the intended uses of the robot.
翻訳日:2022-12-27 05:51:22 公開日:2020-03-02
# 時間差法によるリスク回避学習

Risk-Averse Learning by Temporal Difference Methods ( http://arxiv.org/abs/2003.00780v1 )

ライセンス: Link先を確認
Umit Kose and Andrzej Ruszczynski(参考訳) 動的リスク尺度による性能評価による強化学習の検討を行った。 予測されたリスク-逆動的プログラミング方程式を構築し,その性質について検討する。 次に,時間差の手法のリスク逆対応を提案し,それらの収束を確率 1 で証明する。 また,複雑な交通問題についても実証研究を行った。

We consider reinforcement learning with performance evaluated by a dynamic risk measure. We construct a projected risk-averse dynamic programming equation and study its properties. Then we propose risk-averse counterparts of the methods of temporal differences and we prove their convergence with probability one. We also perform an empirical study on a complex transportation problem.
翻訳日:2022-12-27 05:50:21 公開日:2020-03-02
# 自発トレッドミル歩行指導時の歩行事象関連脳電位の解析-技術動向と使用法

Analysis of Gait-Event-related Brain Potentials During Instructed And Spontaneous Treadmill Walking -- Technical Affordances and used Methods ( http://arxiv.org/abs/2003.00783v1 )

ライセンス: Link先を確認
Cornelia Herbert, Jan Nachtsheim, Michael Munz(参考訳) ヒトの歩行の理解を深め、歩行リハビリテーションの新たな展開を容易にするために、非侵襲的脳波(eeg)によるヒトの歩行の神経的相関が近年研究されている。 特に、歩行関連事象関連脳電位(gERP)は、歩行制御における皮質脳領域の機能的役割に関する情報を提供する。 本研究の目的は、トレッドミル歩行時の歩行関連ERPの時間依存性解析のための実験的および技術的解決の可能性を探ることである。 歩行と脳波データの同期記録のためのソリューション(HW/SW)を開発した。 このソリューションは、カスタムメイドのUSB同期インターフェース、時間同期モジュール、およびデータマージモジュールで構成されており、歩行関連ERPの分析や人工ニューラルネットワークのトレーニングのための歩行マーカーの時間依存性抽出のための記録装置の時間同期を可能にする。 本原稿では,歩行解析用統合圧板(zebris fdm-t)とアクチキャップ非ワイヤレス32チャンネルeeg-system(brain products gmbh)を備えたトレッドミルを用いて,ハードウェアとソフトウェアコンポーネントを試験した。 開発したソリューションの有用性と妥当性は、パイロット実験(n = 3人、n=3人、平均年齢=22.75歳)で検証された。 歩行関連ERPの解析のために,検出した歩行マーカーに基づいて脳波データを分割解析した。 最後に、脳波周期を用いて、歩行相の分類器としてディープラーニングニューラルネットワークを訓練した。 本試験の結果は,予備的ではあるが,歩行関連脳波解析の適用可能性を支持するものである。 .

To improve the understanding of human gait and to facilitate novel developments in gait rehabilitation, the neural correlates of human gait as measured by means of non-invasive electroencephalography (EEG) have been investigated recently. Particularly, gait-related event-related brain potentials (gERPs) may provide information about the functional role of cortical brain regions in human gait control. The purpose of this paper is to explore possible experimental and technical solutions for time-sensitive analysis of human gait-related ERPs during spontaneous and instructed treadmill walking. A solution (HW/SW) for synchronous recording of gait- and EEG data was developed, tested and piloted. The solution consists of a custom-made USB synchronization interface, a time-synchronization module and a data merging module, allowing temporal synchronization of recording devices for time-sensitive extraction of gait markers for analysis of gait-related ERPs and for the training of artificial neural networks. In the present manuscript, the hardware and software components were tested with the following devices: A treadmill with an integrated pressure plate for gait analysis (zebris FDM-T) and an Acticap non-wireless 32-channel EEG-system (Brain Products GmbH). The usability and validity of the developed solution was tested in a pilot study (n = 3 healthy participants, n=3 females, mean age = 22.75 years). Recorded EEG data was segmented and analyzed according to the detected gait markers for the analysis of gait-related ERPs. Finally, EEG periods were used to train a deep learning artificial neural network as classifier of gait phases. The results obtained in this pilot study, although preliminary, support the feasibility of the solution for the application of gait-related EEG analysis..
翻訳日:2022-12-27 05:50:17 公開日:2020-03-02
# 都市環境における自動車型車両の高速経路計画のための自己教師あり学習手法

A Self-Supervised Learning Approach to Rapid Path Planning for Car-Like Vehicles Maneuvering in Urban Environment ( http://arxiv.org/abs/2003.00946v1 )

ライセンス: Link先を確認
Piotr Kicki, Tomasz Gawron, Piotr Skrzypczy\'nski(参考訳) 自動運転車の効率的な経路プランナーは、特に都市交通を操るときに遭遇する狭い空間において、強力なキネマティック制約に対処し、都市交通シナリオが極めてダイナミックであるため、迅速な計画を可能にする必要がある。 最先端の計画アルゴリズムはそのような困難なケースを高い計算コストで処理し、しばしば非決定論的結果をもたらす。 しかし、同じまたは同様の環境で得られる過去の計画経験を活用して、実行可能なローカルパスを迅速に生成することができる。 実際の交通シナリオでは,教師あり学習が問題となるが,本論文では,勾配に基づく自己教師あり学習アルゴリズムを用いて,実現可能な経路を予測するニューラルネットワークを用いた経路計画手法を提案する。 このアプローチは過去に得られた経験を強く活用し、操舵角度が制限された車のような車両の実行可能な操縦計画を迅速に得る。 このような手法の有効性は計算実験によって確認されている。

An efficient path planner for autonomous car-like vehicles should handle the strong kinematic constraints, particularly in confined spaces commonly encountered while maneuvering in city traffic, and should enable rapid planning, as the city traffic scenarios are highly dynamic. State-of-the-art planning algorithms handle such difficult cases at high computational cost, often yielding non-deterministic results. However, feasible local paths can be quickly generated leveraging the past planning experience gained in the same or similar environment. While learning through supervised training is problematic for real traffic scenarios, we introduce in this paper a novel neural network-based method for path planning, which employs a gradient-based self-supervised learning algorithm to predict feasible paths. This approach strongly exploits the experience gained in the past and rapidly yields feasible maneuver plans for car-like vehicles with limited steering-angle. The effectiveness of such an approach has been confirmed by computational experiments.
翻訳日:2022-12-27 05:49:32 公開日:2020-03-02
# Argumentation Semantics の特徴論理と基礎的性質の存在について

On the Existence of Characterization Logics and Fundamental Properties of Argumentation Semantics ( http://arxiv.org/abs/2003.00767v1 )

ライセンス: Link先を確認
Ringo Baumann(参考訳) 既存の論理形式が多種多様であることを考えると、特定の目的、例えば特定のアプリケーションに関連する知識を表現したり、その形式を問題解決のモデリングツールとして使うために、最も適切なものを選ぶことが最も重要である。 論理形式主義の性質の認識、言い換えれば、その基本的な本質的な性質は不可欠であり、情報的選択の基礎を提供する。 この論文では、抽象的議論の領域における存在と一意性、表現性、置換可能性、検証可能性といった特性と同様に、特徴論理の存在を考察する。

Given the large variety of existing logical formalisms it is of utmost importance to select the most adequate one for a specific purpose, e.g. for representing the knowledge relevant for a particular application or for using the formalism as a modeling tool for problem solving. Awareness of the nature of a logical formalism, in other words, of its fundamental intrinsic properties, is indispensable and provides the basis of an informed choice. In this treatise we consider the existence characterization logics as well as properties like existence and uniqueness, expressibility, replaceability and verifiability in the realm of abstract argumentation
翻訳日:2022-12-27 05:43:47 公開日:2020-03-02
# 複数の倫理理論を持つ人工モラルエージェントの装備に向けて

Toward equipping Artificial Moral Agents with multiple ethical theories ( http://arxiv.org/abs/2003.00935v1 )

ライセンス: Link先を確認
George Rautenbach and C. Maria Keet(参考訳) 人工道徳エージェント (Artificial Moral Agents, AMA) は、コンピュータ科学の分野であり、人間の行動に類似した道徳的な決定を下す自律機械を作ることを目的としている。 研究者はそのような機械を作る理論的方法を提案したが、哲学者はこれらの機械がどのように振る舞うべきか、あるいは存在すべきかどうかを議論した。 現在理論化されたAMAの内、すべての研究と設計は、基礎として特定された規範的倫理理論のいずれかで行われてきた。 これは、AMAの機能能力と万能性を狭め、その結果、限られた数の人々が同意する道徳的な結果をもたらすためである(それによって、AMAの道徳的能力は人間的な意味で損なわれる)。 解決策として、amaが推論中に使用する人々やビジネスの倫理観をシリアライズするために使用できる一般的な規範的倫理理論のための3層モデルを設計します。 4つの特定の倫理的規範(カンティアニズム、神聖な命令理論、実用主義、エゴ主義)をモデル化し、規範的モデリングの概念実証として評価した。 さらに、全てのモデルはコンピュータ化のサポートの証明としてXML/XSDにシリアライズされた。

Artificial Moral Agents (AMA's) is a field in computer science with the purpose of creating autonomous machines that can make moral decisions akin to how humans do. Researchers have proposed theoretical means of creating such machines, while philosophers have made arguments as to how these machines ought to behave, or whether they should even exist. Of the currently theorised AMA's, all research and design has been done with either none or at most one specified normative ethical theory as basis. This is problematic because it narrows down the AMA's functional ability and versatility which in turn causes moral outcomes that a limited number of people agree with (thereby undermining an AMA's ability to be moral in a human sense). As solution we design a three-layer model for general normative ethical theories that can be used to serialise the ethical views of people and businesses for an AMA to use during reasoning. Four specific ethical norms (Kantianism, divine command theory, utilitarianism, and egoism) were modelled and evaluated as proof of concept for normative modelling. Furthermore, all models were serialised to XML/XSD as proof of support for computerisation.
翻訳日:2022-12-27 05:43:38 公開日:2020-03-02
# 事象連鎖における外因性および内因性因子の発見に関する統計物理学

The statistical physics of discovering exogenous and endogenous factors in a chain of events ( http://arxiv.org/abs/2003.00659v1 )

ライセンス: Link先を確認
Shinsuke Koyama and Shigeru Shinomoto(参考訳) 事象の発生は環境変化の対象となるだけでなく、システム内で発生した事象によっても促進される。 本稿では,一連の事象発生時間から,そのような外生的・内生的要因を推定する手法を開発した。 この分析は、不均一なポアソン過程と、それぞれ外因性変動と内因性連鎖反応機構を表すホークス過程を組み合わせたモデルを用いて行われる。 このモデルは、統計物理学と経路積分法を利用する自由エネルギーを最小化することで与えられたデータセットに適合する。 事象発生の過程は確率的であるため、パラメータ推定は必然的にエラーを伴い、究極的には外因性および内因性因子は最適な推定器でも捕捉できない。 それぞれの因子が検出されるかどうかによって分類された4つのレジームを得た。 ソーシャルネットワーキングサービスにおけるリアルタイムの議論に分析手法を適用し, 推定外因性因子と内因性因子がそれぞれ第1のコメントと後続のコメントに近接していることが観察された。 本手法は汎用的で,様々なデータに適用可能であり,任意のイベント時間を解析可能なアプリケーションプログラムを提供する。

Event occurrence is not only subject to the environmental changes, but is also facilitated by the events that have occurred in a system. Here, we develop a method for estimating such extrinsic and intrinsic factors from a single series of event-occurrence times. The analysis is performed using a model that combines the inhomogeneous Poisson process and the Hawkes process, which represent exogenous fluctuations and endogenous chain-reaction mechanisms, respectively. The model is fit to a given dataset by minimizing the free energy, for which statistical physics and a path-integral method are utilized. Because the process of event occurrence is stochastic, parameter estimation is inevitably accompanied by errors, and it can ultimately occur that exogenous and endogenous factors cannot be captured even with the best estimator. We obtained four regimes categorized according to whether respective factors are detected. By applying the analytical method to real time series of debate in a social-networking service, we have observed that the estimated exogenous and endogenous factors are close to the first comments and the follow-up comments, respectively. This method is general and applicable to a variety of data, and we have provided an application program, by which anyone can analyze any series of event times.
翻訳日:2022-12-27 05:43:16 公開日:2020-03-02
# gpuアクセラレーションによるモバイルマルチビュースタイル転送

GPU-Accelerated Mobile Multi-view Style Transfer ( http://arxiv.org/abs/2003.00706v1 )

ライセンス: Link先を確認
Puneet Kohli, Saravana Gunaseelan, Jason Orozco, Yiwen Hua, Edward Li, and Nicolas Dahlquist(参考訳) 2018年に販売されたスマートフォンの60%は複数のリアカメラを備えており、3d写真のような幅広い3d対応アプリケーションを可能にしている。 3Dフォトプラットフォーム(Facebook 3Dフォト、Holopixなど)の成功は、安定したユーザー生成コンテンツの流入に依存している。 これらのプラットフォームは、従来の写真プラットフォームと同様に、コンテンツ作成を容易にするシンプルな画像操作ツールを提供しなければならない。 GPU技術の最近の進歩によって推進された芸術的ニューラルスタイルの転送は、従来の写真を強化するツールのひとつだ。 しかし,マルチビューシナリオへの単一ビューのニューラルスタイルのトランスファーは視覚的に矛盾する結果となり,モバイルデバイスでは極めて遅い。 モバイルプラットフォーム上でのオンデマンドパフォーマンスとビュー間のスタイル整合性を実現するために,GPUによるマルチビュースタイル転送パイプラインを提案する。 我々のパイプラインはモジュラーであり、立体画像対から高品質な深度とパララックス効果を生み出す。

An estimated 60% of smartphones sold in 2018 were equipped with multiple rear cameras, enabling a wide variety of 3D-enabled applications such as 3D Photos. The success of 3D Photo platforms (Facebook 3D Photo, Holopix, etc) depend on a steady influx of user generated content. These platforms must provide simple image manipulation tools to facilitate content creation, akin to traditional photo platforms. Artistic neural style transfer, propelled by recent advancements in GPU technology, is one such tool for enhancing traditional photos. However, naively extrapolating single-view neural style transfer to the multi-view scenario produces visually inconsistent results and is prohibitively slow on mobile devices. We present a GPU-accelerated multi-view style transfer pipeline which enforces style consistency between views with on-demand performance on mobile platforms. Our pipeline is modular and creates high quality depth and parallax effects from a stereoscopic image pair.
翻訳日:2022-12-27 05:42:07 公開日:2020-03-02
# 映像ストリームにおける視覚言語モデルとオントロジーシステムによるロボット内状況と人間の操作課題の理解

Understanding Contexts Inside Robot and Human Manipulation Tasks through a Vision-Language Model and Ontology System in a Video Stream ( http://arxiv.org/abs/2003.01163v1 )

ライセンス: Link先を確認
Chen Jiang, Masood Dehghan, Martin Jagersand(参考訳) 水を注ぐなどの日常生活における操作タスクは、特殊な操作コンテキストで意図的に展開される。 日常生活活動(ADL)における文脈的知識を時間とともに処理できることは、知的ロボットが様々な操作動作をスムーズに移行するために不可欠な操作意図を理解するのに役立つ。 本稿では,操作の意図する概念をモデル化するために,ロボットと人間の操作の両方に対して厳密に制約された知識領域の下で,操作の概念と関係を分類学的な方法でオントロジー系に格納するビジョンデータセットを提案する。 さらに,視覚注意と常識知識に満ちた進化する知識グラフの組み合わせを生成する手法を提案する。 本手法は実世界のカメラストリームと連動し,オントロジーシステムと注意に基づく視覚言語モデルと融合する。 実験の結果,提案手法はロボットと人間の両方を対象とした対象操作手順の進化をうまく表現できることがわかった。 提案手法により,ロボットはリアルタイム映像を視聴することで,人間の意図的な動作を模倣することができる。 我々は,人間-ロボットインタラクションにおける実世界のロボットインテリジェンスのために,この手法をさらに発展させることを目指している。

Manipulation tasks in daily life, such as pouring water, unfold intentionally under specialized manipulation contexts. Being able to process contextual knowledge in these Activities of Daily Living (ADLs) over time can help us understand manipulation intentions, which are essential for an intelligent robot to transition smoothly between various manipulation actions. In this paper, to model the intended concepts of manipulation, we present a vision dataset under a strictly constrained knowledge domain for both robot and human manipulations, where manipulation concepts and relations are stored by an ontology system in a taxonomic manner. Furthermore, we propose a scheme to generate a combination of visual attentions and an evolving knowledge graph filled with commonsense knowledge. Our scheme works with real-world camera streams and fuses an attention-based Vision-Language model with the ontology system. The experimental results demonstrate that the proposed scheme can successfully represent the evolution of an intended object manipulation procedure for both robots and humans. The proposed scheme allows the robot to mimic human-like intentional behaviors by watching real-time videos. We aim to develop this scheme further for real-world robot intelligence in Human-Robot Interaction.
翻訳日:2022-12-27 05:41:23 公開日:2020-03-02
# ビデオオブジェクト検出のためのPlug & Play Convolutional Regression Tracker

Plug & Play Convolutional Regression Tracker for Video Object Detection ( http://arxiv.org/abs/2003.00981v1 )

ライセンス: Link先を確認
Ye Lyu, Michael Ying Yang, George Vosselman, Gui-Song Xia(参考訳) ビデオオブジェクト検出ターゲットは、オブジェクトのバウンディングボックスを同時にローカライズし、所定のビデオ内のクラスを識別する。 ビデオオブジェクト検出の課題のひとつは、ビデオ全体のすべてのオブジェクトを一貫して検出することである。 一部のフレームではオブジェクトの外観が悪化する可能性があるため、他のフレームの特徴や検出は予測を強化するために一般的に使用される。 本稿では,映像物体検出タスクのためのプラグ・アンド・プレイ・スケール適応畳み込み回帰トラッカを提案する。 トラッカーは検出器の機能を再利用するので、検出ネットワークに対する非常に軽量なインクリメントである。 ネットワーク全体が、標準オブジェクト検出器に近い速度で動作します。 新しいビデオオブジェクト検出パイプラインの設計により、画像オブジェクト検出器はパラメータを変更することなく、容易に効率的なビデオオブジェクト検出器に変換できる。 大規模なImageNet VIDデータセットで性能を評価する。 当社のPlug & Play設計では、画像検出器のmAPスコアを5%程度改善し、速度低下は少ない。

Video object detection targets to simultaneously localize the bounding boxes of the objects and identify their classes in a given video. One challenge for video object detection is to consistently detect all objects across the whole video. As the appearance of objects may deteriorate in some frames, features or detections from the other frames are commonly used to enhance the prediction. In this paper, we propose a Plug & Play scale-adaptive convolutional regression tracker for the video object detection task, which could be easily and compatibly implanted into the current state-of-the-art detection networks. As the tracker reuses the features from the detector, it is a very light-weighted increment to the detection network. The whole network performs at the speed close to a standard object detector. With our new video object detection pipeline design, image object detectors can be easily turned into efficient video object detectors without modifying any parameters. The performance is evaluated on the large-scale ImageNet VID dataset. Our Plug & Play design improves mAP score for the image detector by around 5% with only little speed drop.
翻訳日:2022-12-27 05:33:28 公開日:2020-03-02
# DEEVA: エネルギー産業における生産現場の安全性と安全性に対処するディープラーニングとIoTベースのコンピュータビジョンシステム

DEEVA: A Deep Learning and IoT Based Computer Vision System to Address Safety and Security of Production Sites in Energy Industry ( http://arxiv.org/abs/2003.01196v1 )

ライセンス: Link先を確認
Nimish M. Awalgaonkar, Haining Zheng, Christopher S. Gurciullo(参考訳) 異なる生産・建設現場における安全・セキュリティ関連のニーズに対応するため、労働者、車両、機器の存在を正確に検知し、コンピュータビジョンベースの監視システム(CVSS)の不可欠な部分を形成する。 従来のCVSSシステムは、異なるコンピュータビジョンとパターン認識アルゴリズムの使用に重点を置いており、機能や小さなデータセットの手作業による抽出に依存しており、その使用は低い精度、専門知識の必要性、高い計算コストのために制限されている。 本論文の目的は,シーン分類,シーンのオブジェクト検出,セマンティックセグメンテーション,シーンキャプションなど,コンピュータビジョンに関連するさまざまな問題に対処するための,実用的な包括的深層学習とIoTベースのソリューションを,現場の意思決定者に提供することである。 私たちの全体的な目標は、このサイトで何が起きているのか、そして監視に特化した人材の必要性を最小化する自動的なやり方で何が起きているのかという中心的な問題に対処することです。 我々は,シーン分類,オブジェクト検出,意味セグメンテーション,シーンのキャプションを階層的アプローチで処理するために,deeva(deep exxonmobil eye for video analysis)パッケージを開発した。 その結果,retinanetオブジェクト検出器を用いたトランスファー学習は,作業者の存在,車両・建設機器の種類,安全関連物体を高い精度(90%以上)で検出できることがわかった。 ディープラーニングが機能やiotテクノロジを自動的に抽出して、大量のリアルタイム画像を自動キャプチャ、転送、処理することで、このフレームワークは、セキュリティや安全性の監視、生産性評価、今後の意思決定といった、オープンエンドの課題に対処するためのインテリジェントな監視システムを開発する上で、重要なステップになります。

When it comes to addressing the safety/security related needs at different production/construction sites, accurate detection of the presence of workers, vehicles, equipment important and formed an integral part of computer vision-based surveillance systems (CVSS). Traditional CVSS systems focus on the use of different computer vision and pattern recognition algorithms overly reliant on manual extraction of features and small datasets, limiting their usage because of low accuracy, need for expert knowledge and high computational costs. The main objective of this paper is to provide decision makers at sites with a practical yet comprehensive deep learning and IoT based solution to tackle various computer vision related problems such as scene classification, object detection in scenes, semantic segmentation, scene captioning etc. Our overarching goal is to address the central question of What is happening at this site and where is it happening in an automated fashion minimizing the need for human resources dedicated to surveillance. We developed Deep ExxonMobil Eye for Video Analysis (DEEVA) package to handle scene classification, object detection, semantic segmentation and captioning of scenes in a hierarchical approach. The results reveal that transfer learning with the RetinaNet object detector is able to detect the presence of workers, different types of vehicles/construction equipment, safety related objects at a high level of accuracy (above 90%). With the help of deep learning to automatically extract features and IoT technology to automatic capture, transfer and process vast amount of realtime images, this framework is an important step towards the development of intelligent surveillance systems aimed at addressing myriads of open ended problems in the realm of security/safety monitoring, productivity assessments and future decision making.
翻訳日:2022-12-27 05:33:13 公開日:2020-03-02
# point-gnn:3次元物体検出のためのグラフニューラルネットワーク

Point-GNN: Graph Neural Network for 3D Object Detection in a Point Cloud ( http://arxiv.org/abs/2003.01251v1 )

ライセンス: Link先を確認
Weijing Shi and Ragunathan (Raj) Rajkumar(参考訳) 本稿では,LiDAR点雲から物体を検出するグラフニューラルネットワークを提案する。 この目的に向けて、点雲を固定半径のneighborsグラフに効率的にエンコードする。 我々は、グラフの各頂点が属する対象のカテゴリと形状を予測するために、Point-GNNというグラフニューラルネットワークを設計する。 Point-GNNでは、翻訳のばらつきを低減する自動登録機構を提案し、また複数の頂点からの検出を正確に組み合わせるボックスマージとスコアリング操作を設計する。 KITTIベンチマーク実験により,提案手法は点雲のみを用いて先行精度を達成し,核融合に基づくアルゴリズムを超越できることを示した。 本研究は,3次元物体検出のための新しいアプローチとしてグラフニューラルネットワークを用いる可能性を示す。 コードはhttps://github.com/WeijingShi/Point-GNNで入手できる。

In this paper, we propose a graph neural network to detect objects from a LiDAR point cloud. Towards this end, we encode the point cloud efficiently in a fixed radius near-neighbors graph. We design a graph neural network, named Point-GNN, to predict the category and shape of the object that each vertex in the graph belongs to. In Point-GNN, we propose an auto-registration mechanism to reduce translation variance, and also design a box merging and scoring operation to combine detections from multiple vertices accurately. Our experiments on the KITTI benchmark show the proposed approach achieves leading accuracy using the point cloud alone and can even surpass fusion-based algorithms. Our results demonstrate the potential of using the graph neural network as a new approach for 3D object detection. The code is available https://github.com/WeijingShi/Point-GNN.
翻訳日:2022-12-27 05:32:19 公開日:2020-03-02
# 複素損失関数の自動微分法

A scheme for automatic differentiation of complex loss functions ( http://arxiv.org/abs/2003.04295v1 )

ライセンス: Link先を確認
Chu Guo, Dario Poletti(参考訳) 実関数では、自動微分は勾配を効率的に計算するために使われる標準的なアルゴリズムであり、様々なニューラルネットワークフレームワークに統合されている。 しかし、機械学習における複雑な関数の使用の最近の進歩や、自動微分の確立された有用性にもかかわらず、複雑な関数に対する自動微分のサポートは、実関数ほど十分に確立され、普及していない。 本研究では,実関数に対する現在のスキームの相反する一般化である複素関数の自動微分を実装するための,効率的かつシームレスなスキームを提案する。 このスキームは、複雑な数を使用するニューラルネットワークの実装を著しく単純化することができる。

For a real function, automatic differentiation is such a standard algorithm used to efficiently compute its gradient, that it is integrated in various neural network frameworks. However, despite the recent advances in using complex functions in machine learning and the well-established usefulness of automatic differentiation, the support of automatic differentiation for complex functions is not as well-established and widespread as for real functions. In this work we propose an efficient and seamless scheme to implement automatic differentiation for complex functions, which is a compatible generalization of the current scheme for real functions. This scheme can significantly simplify the implementation of neural networks which use complex numbers.
翻訳日:2022-12-27 05:32:06 公開日:2020-03-02
# UFTR: チケットルーティングのための統一フレームワーク

UFTR: A Unified Framework for Ticket Routing ( http://arxiv.org/abs/2003.00703v1 )

ライセンス: Link先を確認
Jianglei Han, Jing Li, Aixin Sun(参考訳) 今日、企業は顧客サービスのタイムリーかつ効果的なデリバリに対する需要が増えている。 これにより、正式にチケットルーティング問題と呼ばれる、堅牢で正確な自動化ソリューションの必要性が生じる。 このタスクは、未解決のサービスインシデント、すなわち"ticket"を適切なサービス専門家のグループにマッチさせることです。 既存の研究では、タスクを2つの独立した部分問題(初期グループ割り当てとグループ間転送)に分割する。 しかし,本研究では両サブプロブレムをエンドツーエンドモデリング手法を用いて共同で扱う。 まず,関連する機能を明らかにするために,50万枚のアーカイブチケットの事前解析を行った。 次に,4種類の機能(チケット,グループ,インタラクションから派生した)を用いた,チケットルーティングのための統一フレームワークuftrを考案した。 実験では,UFTRを用いて2つのランキングモデルを実装した。 私たちのモデルは、3つのルーティングメトリクスでベースラインを上回ります。 さらに, ポストホック解析により, チケット代入とグループ代入の関係を捉える特徴が, この優れた性能に大きく寄与することが明らかとなった。 簡単に言うと,uftrは,グループ割当問題とグループ転送問題との従来未発表の相互関係を考慮し,チケットルーティング問題に対する優れた解決策であることを示す。

Corporations today face increasing demands for the timely and effective delivery of customer service. This creates the need for a robust and accurate automated solution to what is formally known as the ticket routing problem. This task is to match each unresolved service incident, or "ticket", to the right group of service experts. Existing studies divide the task into two independent subproblems - initial group assignment and inter-group transfer. However, our study addresses both subproblems jointly using an end-to-end modeling approach. We first performed a preliminary analysis of half a million archived tickets to uncover relevant features. Then, we devised the UFTR, a Unified Framework for Ticket Routing using four types of features (derived from tickets, groups, and their interactions). In our experiments, we implemented two ranking models with the UFTR. Our models outperform baselines on three routing metrics. Furthermore, a post-hoc analysis reveals that this superior performance can largely be attributed to the features that capture the associations between ticket assignment and group assignment. In short, our results demonstrate that the UFTR is a superior solution to the ticket routing problem because it takes into account previously unexploited interrelationships between the group assignment and group transfer problems.
翻訳日:2022-12-27 05:31:56 公開日:2020-03-02
# 画像キャプションとマルチタスク学習を用いた問合せ修正の推薦

Using Image Captions and Multitask Learning for Recommending Query Reformulations ( http://arxiv.org/abs/2003.00708v1 )

ライセンス: Link先を確認
Gaurav Verma, Vishwa Vinay, Sahil Bansal, Shashank Oberoi, Makkunda Sharma, Prakhar Gupta(参考訳) 対話型検索セッションは複数のクエリを含むことが多く、ユーザが元の結果に応じて以前のクエリの修正版を提出する。 我々は,商用画像検索エンジンのクエリレコメンデーションエクスペリエンスの向上を目指している。 提案手法では,セッションコンテキストをキャプチャする生成に基づくシーケンス・ツー・シーケンスモデルと,結果のランク付けを同時に最適化するマルチタスクアーキテクチャを用いて,関連文献からの最先端のプラクティスを取り入れた。 この設定は、セッション内での後続のクエリを使用するのではなく、クリックした画像のキャプションをターゲットとして、そのようなモデルの学習を駆動することによって拡張する。 これらのキャプションは言語的に豊かになる傾向があるため、リフォーム機構はより記述的なクエリを構築する助けになると考えられる。 また,2次ランキングタスクにペアワイズロスを用いることにより,生成した再編成がより多様であることを示す。

Interactive search sessions often contain multiple queries, where the user submits a reformulated version of the previous query in response to the original results. We aim to enhance the query recommendation experience for a commercial image search engine. Our proposed methodology incorporates current state-of-the-art practices from relevant literature -- the use of generation-based sequence-to-sequence models that capture session context, and a multitask architecture that simultaneously optimizes the ranking of results. We extend this setup by driving the learning of such a model with captions of clicked images as the target, instead of using the subsequent query within the session. Since these captions tend to be linguistically richer, the reformulation mechanism can be seen as assistance to construct more descriptive queries. In addition, via the use of a pairwise loss for the secondary ranking task, we show that the generated reformulations are more diverse.
翻訳日:2022-12-27 05:31:39 公開日:2020-03-02
# a-tvsnet:マルチビューステレオ深度推定のための集約型2視点ステレオネットワーク

A-TVSNet: Aggregated Two-View Stereo Network for Multi-View Stereo Depth Estimation ( http://arxiv.org/abs/2003.00711v1 )

ライセンス: Link先を確認
Sizhang Dai, Weibing Huang(参考訳) マルチビューステレオ(MVS)画像から深度マップを推定する学習ネットワークを提案する。 提案するネットワークは3つのサブネットワークで構成される。 1)非構造ステレオ画像対からの初期深度マップ推定のためのベースネットワーク 2)測光情報と幾何学情報の両方を活用した新しい改良ネットワーク 3)異なるステレオ画像ペア間の効率的な情報交換と統合を可能にする多視点アグリゲーションフレームワーク。 A-TVSNetと呼ばれる提案ネットワークは、様々なMVSデータセットで評価され、競合するアプローチよりも優れた高品質の深度マップを作成する能力を示している。 私たちのコードはhttps://github.com/daiszh/a-tvsnetで利用可能です。

We propose a learning-based network for depth map estimation from multi-view stereo (MVS) images. Our proposed network consists of three sub-networks: 1) a base network for initial depth map estimation from an unstructured stereo image pair, 2) a novel refinement network that leverages both photometric and geometric information, and 3) an attentional multi-view aggregation framework that enables efficient information exchange and integration among different stereo image pairs. The proposed network, called A-TVSNet, is evaluated on various MVS datasets and shows the ability to produce high quality depth map that outperforms competing approaches. Our code is available at https://github.com/daiszh/A-TVSNet.
翻訳日:2022-12-27 05:24:45 公開日:2020-03-02
# 消費者端末における非拘束パルププリント認識に向けて:文献レビュー

Towards Unconstrained Palmprint Recognition on Consumer Devices: a Literature Review ( http://arxiv.org/abs/2003.00737v1 )

ライセンス: Link先を確認
Adrian-S. Ungureanu, Saqib Salahuddin and Peter Corcoran(参考訳) バイオメトリックな手のひらプリントは、ほとんど使われていないが、指紋や顔の生体認証よりもいくつかの利点がある。 ハンドヘルドとウェアラブルの消費者デバイスにおける最近の画像機能の改善は、手のひらプリントの使用に対する関心を再び高めている。 本研究の目的は,利害関係抽出手法,特徴抽出手法,マッチングアルゴリズムを含むパームプリント認識の最先端手法の包括的レビューと,利用可能なパームプリントデータセットの概観を提供することであり,パームプリント認識分野における最新のトレンドと研究ダイナミクスを理解することにある。

As a biometric palmprints have been largely under-utilized, but they offer some advantages over fingerprints and facial biometrics. Recent improvements in imaging capabilities on handheld and wearable consumer devices have re-awakened interest in the use fo palmprints. The aim of this paper is to provide a comprehensive review of state-of-the-art methods for palmprint recognition including Region of Interest extraction methods, feature extraction approaches and matching algorithms along with overview of available palmprint datasets in order to understand the latest trends and research dynamics in the palmprint recognition field.
翻訳日:2022-12-27 05:24:35 公開日:2020-03-02
# 行動データとLSTM-ResNet分類器を用いたインテリジェント車の識別

Identity Recognition in Intelligent Cars with Behavioral Data and LSTM-ResNet Classifier ( http://arxiv.org/abs/2003.00770v1 )

ライセンス: Link先を確認
Michael Hammann, Maximilian Kraus, Sina Shafaei, Alois Knoll(参考訳) 自動車キャビンにおけるアイデンティティ認識は、現在では重要な課題であり、インテリジェントカーのパーソナライズから、ドライバーの身体的および行動的ニーズへの適合、安全性と安全性の向上まで、幅広いアプリケーションを提供しています。 しかし、公表されたアプローチの性能と適用性はシリーズ車両での使用には適しておらず、改善する必要がある。 本稿では,時系列分類(tsc)とディープニューラルネットワークを用いたカーキャビンにおける人物識別について検討する。 モデルへの入力にはガスとブレーキペダル圧を使用します。 このデータは日常の運転時に容易に収集できる。 我々の分類器はメモリ要件がほとんどなく、入力データの事前処理を必要としないため、Intel i5-3210Mプロセッサのみをトレーニングすることができた。 我々の分類手法はLSTMとResNetの組み合わせに基づいている。 nudrive のサブセット上でトレーニングされたネットワークは、それぞれ 35.9 % と 53.85 % の精度でトレーニングされた resnet と lstm モデルを上回る。 最終的な精度は、NUDriveの10ドライバサブセットで79.49%、UTDriveの5ドライバサブセットで96.90%に達する。

Identity recognition in a car cabin is a critical task nowadays and offers a great field of applications ranging from personalizing intelligent cars to suit drivers physical and behavioral needs to increasing safety and security. However, the performance and applicability of published approaches are still not suitable for use in series cars and need to be improved. In this paper, we investigate Human Identity Recognition in a car cabin with Time Series Classification (TSC) and deep neural networks. We use gas and brake pedal pressure as input to our models. This data is easily collectable during driving in everyday situations. Since our classifiers have very little memory requirements and do not require any input data preproccesing, we were able to train on one Intel i5-3210M processor only. Our classification approach is based on a combination of LSTM and ResNet. The network trained on a subset of NUDrive outperforms the ResNet and LSTM models trained solely by 35.9 % and 53.85 % accuracy respectively. We reach a final accuracy of 79.49 % on a 10-drivers subset of NUDrive and 96.90 % on a 5-drivers subset of UTDrive.
翻訳日:2022-12-27 05:23:57 公開日:2020-03-02
# センサシフトによる模倣学習と意思決定のための因果伝達

Causal Transfer for Imitation Learning and Decision Making under Sensor-shift ( http://arxiv.org/abs/2003.00806v1 )

ライセンス: Link先を確認
Jalal Etesami and Philipp Geiger(参考訳) デモンストレーションから学ぶこと(LfD)は、AIエージェントを訓練するための効率的なパラダイムである。 しかし、大きな問題は、違いがあるときに起こります。 (a)デモ参加者自身の感覚入力。 b) デモ参加者を観察するセンサーと c) 訓練中のエージェントの感覚入力。 本稿では,(1)実証者の行動の効果を推定し,(2)模倣学習を行う2つの共通LfDタスクに対して,そのような「センサシフト」の下での伝達学習のための因果モデルに基づくフレームワークを提案する。 まず,人口レベルでは,センサ特性の事前知識と合わせて,適切なメカニズム(行動効果と実証者ポリシー)を特定・伝達できるかどうかを厳密に分析する。 これらのメカニズムを推測するアルゴリズムを開発しました 次に, 計算が容易で, 有限データから推定し, 厳密解よりも解釈しやすいいくつかのプロキシ手法と, 厳密解との密接性に関する理論的境界について紹介する。 シミュレーションと半実世界のデータの2つの方法を検証する。

Learning from demonstrations (LfD) is an efficient paradigm to train AI agents. But major issues arise when there are differences between (a) the demonstrator's own sensory input, (b) our sensors that observe the demonstrator and (c) the sensory input of the agent we train. In this paper, we propose a causal model-based framework for transfer learning under such "sensor-shifts", for two common LfD tasks: (1) inferring the effect of the demonstrator's actions and (2) imitation learning. First we rigorously analyze, on the population-level, to what extent the relevant underlying mechanisms (the action effects and the demonstrator policy) can be identified and transferred from the available observations together with prior knowledge of sensor characteristics. And we device an algorithm to infer these mechanisms. Then we introduce several proxy methods which are easier to calculate, estimate from finite data and interpret than the exact solutions, alongside theoretical bounds on their closeness to the exact ones. We validate our two main methods on simulated and semi-real world data.
翻訳日:2022-12-27 05:16:51 公開日:2020-03-02
# 知識強化ニューラルモデルを用いた情報豊富な論理テキスト生成に向けて

Towards information-rich, logical text generation with knowledge-enhanced neural models ( http://arxiv.org/abs/2003.00814v1 )

ライセンス: Link先を確認
Hao Wang, Bin Guo, Wei Wu, Zhiwen Yu(参考訳) テキスト生成システムは、ディープラーニング技術によって多大な進歩を遂げ、私たちの生活に広く応用されてきた。 しかし、既存のエンド・ツー・エンドのニューラルモデルは、背景知識で入力コンテキストを接地できないため、非形式的で汎用的なテキストを生成する傾向に苦しむ。 この問題を解決するために、多くの研究者は、外部知識をテキスト生成システム、すなわち知識エンハンステキスト生成に組み合わせることを検討し始めた。 知識の課題は、大規模知識ベースから適切な知識を選択する方法、抽出された知識の読み書き方法、知識を生成プロセスに統合する方法など、テキスト生成を強化した。 本調査では,知識向上型テキスト生成システムの総合的なレビューを行い,これらの課題の解決に向けた研究の進展を要約し,オープンな課題と研究方向性を提案する。

Text generation system has made massive promising progress contributed by deep learning techniques and has been widely applied in our life. However, existing end-to-end neural models suffer from the problem of tending to generate uninformative and generic text because they cannot ground input context with background knowledge. In order to solve this problem, many researchers begin to consider combining external knowledge in text generation systems, namely knowledge-enhanced text generation. The challenges of knowledge enhanced text generation including how to select the appropriate knowledge from large-scale knowledge bases, how to read and understand extracted knowledge, and how to integrate knowledge into generation process. This survey gives a comprehensive review of knowledge-enhanced text generation systems, summarizes research progress to solving these challenges and proposes some open issues and research directions.
翻訳日:2022-12-27 05:16:34 公開日:2020-03-02
# 正規決定過程の学習と解法

Learning and Solving Regular Decision Processes ( http://arxiv.org/abs/2003.01008v1 )

ライセンス: Link先を確認
Eden Abadi, Ronen I. Brafman(参考訳) RDP(Regular Decision Processs)は、非マルコフ力学と報酬を用いてMDPを拡張するモデルである。 非マルコフ的挙動は、歴史の通常の性質に依存することに制限される。 これらは有限トレース上の線形動的論理の正規表現や公式を用いて指定することができる。 完全に指定された RDP は、それらを適切な MDP にコンパイルすることで解決できる。 データからRCPを学ぶことは、未解決の問題であり、本論文に焦点をあてる。 提案手法は,各状態-作用対に対する分布と期待報酬を出力するMealy Machinesを用いて,RDPの新たな表現に頼っている。 この表現に基づいて,自動学習技術と履歴クラスタリングを組み合わせることで,このようなMealyマシンを学習し,MCTSを適応させることで解決する。 このアプローチを実証的に評価し,実現可能性を示した。

Regular Decision Processes (RDPs) are a recently introduced model that extends MDPs with non-Markovian dynamics and rewards. The non-Markovian behavior is restricted to depend on regular properties of the history. These can be specified using regular expressions or formulas in linear dynamic logic over finite traces. Fully specified RDPs can be solved by compiling them into an appropriate MDP. Learning RDPs from data is a challenging problem that has yet to be addressed, on which we focus in this paper. Our approach rests on a new representation for RDPs using Mealy Machines that emit a distribution and an expected reward for each state-action pair. Building on this representation, we combine automata learning techniques with history clustering to learn such a Mealy machine and solve it by adapting MCTS to it. We empirically evaluate this approach, demonstrating its feasibility.
翻訳日:2022-12-27 05:16:20 公開日:2020-03-02
# bard: 解析的推論を支援するベイズネットワークの集団推定のための構造化手法

BARD: A structured technique for group elicitation of Bayesian networks to support analytic reasoning ( http://arxiv.org/abs/2003.01207v1 )

ライセンス: Link先を確認
Ann E. Nicholson, Kevin B. Korb, Erik P. Nyberg, Michael Wybrow, Ingrid Zukerman, Steven Mascaro, Shreshth Thakur, Abraham Oshni Alvandi, Jeff Riley, Ross Pearson, Shane Morris, Matthieu Herrmann, A.K.M. Azad, Fergus Bolger, Ulrike Hahn, and David Lagnado(参考訳) 多くの複雑な現実の状況において、問題解決と意思決定は因果関係と不確実性に関する効果的な推論を必要とする。 しかし、このような場合の人間の推論は混乱と誤りを招きやすい。 ベイジアンネットワーク(英: bayesian networks、bns)は、不確定な状況をモデル化し、確率的かつ因果的推論と意思決定を支援する人工知能技術である。 しかし、これまでBNの方法論とソフトウェアは、かなりの事前トレーニングを必要とし、モデル構築プロセスに関するガイダンスを提供しておらず、BNを共同で構築することをサポートしていません。 BARD (Bayesian ARgumentation via Delphi) is both a methodology and an expert system that utilises (1) BNs as the underlying structured representations for better argument analysis, (2) a multi-user web-based software platform and Delphi-style social processes to assist with collaboration, and (3) short, high-quality e-courses on demand, a highly structured process to guide BN construction, and a variety of helpful tools to assist in building and reasoning with BNs, including an automated explanation tool to assist effective report writing. その結果、BNの専門知識を持たないグループが問題の理解と分析を行い、その根底にある確率的因果構造のモデルを構築し、因果モデルによる検証と推論を行い、それを分析レポートの作成に使用する、エンドツーエンドのオンラインプラットフォームが実現した。 最初の実験結果は、BARDが問題解決、推論、コラボレーションを支援することを示している。

In many complex, real-world situations, problem solving and decision making require effective reasoning about causation and uncertainty. However, human reasoning in these cases is prone to confusion and error. Bayesian networks (BNs) are an artificial intelligence technology that models uncertain situations, supporting probabilistic and causal reasoning and decision making. However, to date, BN methodologies and software require significant upfront training, do not provide much guidance on the model building process, and do not support collaboratively building BNs. BARD (Bayesian ARgumentation via Delphi) is both a methodology and an expert system that utilises (1) BNs as the underlying structured representations for better argument analysis, (2) a multi-user web-based software platform and Delphi-style social processes to assist with collaboration, and (3) short, high-quality e-courses on demand, a highly structured process to guide BN construction, and a variety of helpful tools to assist in building and reasoning with BNs, including an automated explanation tool to assist effective report writing. The result is an end-to-end online platform, with associated online training, for groups without prior BN expertise to understand and analyse a problem, build a model of its underlying probabilistic causal structure, validate and reason with the causal model, and use it to produce a written analytic report. Initial experimental results demonstrate that BARD aids in problem solving, reasoning and collaboration.
翻訳日:2022-12-27 05:16:05 公開日:2020-03-02
# 高度物体検出のためのグローバルコンテキストアウェアプログレッシブアグリゲーションネットワーク

Global Context-Aware Progressive Aggregation Network for Salient Object Detection ( http://arxiv.org/abs/2003.00651v1 )

ライセンス: Link先を確認
Zuyao Chen, Qianqian Xu, Runmin Cong, Qingming Huang(参考訳) ディープ畳み込みニューラルネットワークは、健全なオブジェクト検出において、効果的で包括的な機能を学ぶ方法が重要な役割を果たす、競争的なパフォーマンスを実現している。 以前の作業の多くは、主にマルチレベル機能統合を採用していたが、異なる機能間のギャップは無視していた。 さらに、トップダウン経路を通過する際に高レベルの特徴を希釈するプロセスも存在する。 これらの問題を解決するため、我々はGCPANetという新しいネットワークを提案し、プログレッシブ・コンテクスト・アグリゲーション(FIA)モジュールを通じて低レベルな外観特徴、高レベルなセマンティック特徴、グローバルなコンテキスト特徴を効果的に統合し、教師付き方法でサリエンシ・マップを生成する。 さらに、ヘッドアテンション(HA)モジュールは、空間的及びチャネル的注意を生かして情報冗長性を低減し、トップレイヤの特徴を高めるために使用され、セルフリファインメント(SR)モジュールは入力特徴をさらに洗練・高めるために使用される。 さらに,グローバル・コンテキスト・フロー(gcf)モジュールの設計を行い,異なる段階のグローバル・コンテキスト情報を生成する。 6つのベンチマークデータセットにおける実験結果は、提案手法が定量的および定性的に最先端手法よりも優れていることを示している。

Deep convolutional neural networks have achieved competitive performance in salient object detection, in which how to learn effective and comprehensive features plays a critical role. Most of the previous works mainly adopted multiple level feature integration yet ignored the gap between different features. Besides, there also exists a dilution process of high-level features as they passed on the top-down pathway. To remedy these issues, we propose a novel network named GCPANet to effectively integrate low-level appearance features, high-level semantic features, and global context features through some progressive context-aware Feature Interweaved Aggregation (FIA) modules and generate the saliency map in a supervised way. Moreover, a Head Attention (HA) module is used to reduce information redundancy and enhance the top layers features by leveraging the spatial and channel-wise attention, and the Self Refinement (SR) module is utilized to further refine and heighten the input features. Furthermore, we design the Global Context Flow (GCF) module to generate the global context information at different stages, which aims to learn the relationship among different salient regions and alleviate the dilution effect of high-level features. Experimental results on six benchmark datasets demonstrate that the proposed approach outperforms the state-of-the-art methods both quantitatively and qualitatively.
翻訳日:2022-12-27 05:14:33 公開日:2020-03-02
# 対称特性推定のための一般フレームワーク

A General Framework for Symmetric Property Estimation ( http://arxiv.org/abs/2003.00844v1 )

ライセンス: Link先を確認
Moses Charikar, Kirankumar Shiragur, Aaron Sidford(参考訳) 本稿では,分布の対称性を推定するための一般的な枠組みについて述べる。 幅広い対称特性のクラスに対して、経験的推定が機能する容易な領域と、より複雑な推定が必要となる難しい領域を特定する。 この難しい領域におけるプロファイル最大可能性 (PML) 分布 \cite{ADOS16} の概算計算により、PMLに基づく従来の普遍的推定手法よりも広いパラメータ体系における多くの特性に対して最適なサンプル複雑性を持つ対称特性推定フレームワークが得られることを示す。 これらの擬似PML分布に基づくアルゴリズムもより実用的なものである。

In this paper we provide a general framework for estimating symmetric properties of distributions from i.i.d. samples. For a broad class of symmetric properties we identify the easy region where empirical estimation works and the difficult region where more complex estimators are required. We show that by approximately computing the profile maximum likelihood (PML) distribution \cite{ADOS16} in this difficult region we obtain a symmetric property estimation framework that is sample complexity optimal for many properties in a broader parameter regime than previous universal estimation approaches based on PML. The resulting algorithms based on these pseudo PML distributions are also more practical.
翻訳日:2022-12-27 05:06:42 公開日:2020-03-02
# 生成逆変換器を用いたスタイル例誘導テキスト生成

Style Example-Guided Text Generation using Generative Adversarial Transformers ( http://arxiv.org/abs/2003.00674v1 )

ライセンス: Link先を確認
Kuo-Hao Zeng and Mohammad Shoeybi and Ming-Yu Liu(参考訳) 本稿では,文脈文とスタイル参照例に基づいて文文を生成する言語生成モデルフレームワークを提案する。 このフレームワークはスタイルエンコーダとテキストデコーダで構成されている。 スタイルエンコーダは、参照例からスタイルコードを抽出し、テキストデコーダは、スタイルコードとコンテキストとに基づいてテキストを生成する。 フレームワークをトレーニングするための新しい客観的関数を提案する。 また、異なるネットワーク設計の選択肢についても検討する。 多様なテキストスタイルのデータセットを新たに収集し,提案手法の有効性を検証するために,強いベースラインとの比較実験を行った。 コードとデータセットは公開時にリリースされる。

We introduce a language generative model framework for generating a styled paragraph based on a context sentence and a style reference example. The framework consists of a style encoder and a texts decoder. The style encoder extracts a style code from the reference example, and the text decoder generates texts based on the style code and the context. We propose a novel objective function to train our framework. We also investigate different network design choices. We conduct extensive experimental validation with comparison to strong baselines to validate the effectiveness of the proposed framework using a newly collected dataset with diverse text styles. Both code and dataset will be released upon publication.
翻訳日:2022-12-27 05:05:54 公開日:2020-03-02
# 発声音声における一次トラックと副トラックの同定

Identification of primary and collateral tracks in stuttered speech ( http://arxiv.org/abs/2003.01018v1 )

ライセンス: Link先を確認
Rachid Riad, Anne-Catherine Bachoud-L\'evi, Frank Rudzicz, Emmanuel Dupoux(参考訳) 診断に焦点を当てた臨床的な視点と、これらのイベントをモデル化し下流タスクで検出することを目的とした自然言語処理(nlp)の視点である。 さらに、以前の研究では、入力された特徴がテキストか音声かによって異なるメトリクスを使用しており、異なるコントリビューションを比較するのが難しい。 そこで本研究では,臨床およびNLPの視点に触発された拡散検出のための新しい評価フレームワークと,一次トラックと副トラックを区別する \cite{clark 1996using} の性能理論を紹介する。 半指向型面接のコーパスから,新しい強制整合型不流動データセットを導入し,テキストに基づく特徴量(単語とスパン情報)と音声ベース(音響韻律情報)のパフォーマンスを直接比較したベースライン結果を提案する。 最後に、単語ベースのスパン機能にインスパイアされた新しい音声機能を紹介する。 そこで本研究では,これらの特徴を用いることで,音声に基づく予測のベースラインを上回っていることを実験的に示す。

Disfluent speech has been previously addressed from two main perspectives: the clinical perspective focusing on diagnostic, and the Natural Language Processing (NLP) perspective aiming at modeling these events and detect them for downstream tasks. In addition, previous works often used different metrics depending on whether the input features are text or speech, making it difficult to compare the different contributions. Here, we introduce a new evaluation framework for disfluency detection inspired by the clinical and NLP perspective together with the theory of performance from \cite{clark1996using} which distinguishes between primary and collateral tracks. We introduce a novel forced-aligned disfluency dataset from a corpus of semi-directed interviews, and present baseline results directly comparing the performance of text-based features (word and span information) and speech-based (acoustic-prosodic information). Finally, we introduce new audio features inspired by the word-based span features. We show experimentally that using these features outperformed the baselines for speech-based predictions on the present dataset.
翻訳日:2022-12-27 05:05:44 公開日:2020-03-02
# Permutohedral-GCN:グローバルな関心を持つグラフ畳み込みネットワーク

Permutohedral-GCN: Graph Convolutional Networks with Global Attention ( http://arxiv.org/abs/2003.00635v1 )

ライセンス: Link先を確認
Hesham Mostafa, Marcel Nassar(参考訳) グラフ畳み込みネットワーク(GCN)は、グラフ内の隣人から機能を集約することで、ノードの特徴ベクトルを更新する。 これにより、遠方のノードからの潜在的有用な貢献は無視される。 このような有用な遠方からのコントリビューションを特定することは、スケーラビリティの問題(多くのノードがコントリビューションする可能性がある)と過剰なスムース化(あまりにも多くのノードから機能を収集する)のため、難しい。 我々は,グラフ内の他のノードに対して,ノードが選択的に特徴に接し,集約できるグローバルアテンション機構を導入する。 注意係数は学習可能なノード埋め込み間のユークリッド距離に依存し,得られた注意に基づくグローバルアグリゲーションスキームは高次元ガウスフィルタと類似していることを示す。 これにより、注意に基づくグローバルアグリゲーションスキームを実装するために効率的な近似ガウスフィルタ技術を利用することができる。 ペルムトヘドラル格子に基づく近似フィルタリング法を用いることで,提案する大域集約スキームの時間複雑性はノード数に比例して増大する。 得られたGCNはPermutohedral-GCNと呼ばれ、識別可能であり、エンドツーエンドで訓練され、いくつかのノード分類ベンチマークで技術性能の状態を達成している。

Graph convolutional networks (GCNs) update a node's feature vector by aggregating features from its neighbors in the graph. This ignores potentially useful contributions from distant nodes. Identifying such useful distant contributions is challenging due to scalability issues (too many nodes can potentially contribute) and oversmoothing (aggregating features from too many nodes risks swamping out relevant information and may result in nodes having different labels but indistinguishable features). We introduce a global attention mechanism where a node can selectively attend to, and aggregate features from, any other node in the graph. The attention coefficients depend on the Euclidean distance between learnable node embeddings, and we show that the resulting attention-based global aggregation scheme is analogous to high-dimensional Gaussian filtering. This makes it possible to use efficient approximate Gaussian filtering techniques to implement our attention-based global aggregation scheme. By employing an approximate filtering method based on the permutohedral lattice, the time complexity of our proposed global aggregation scheme only grows linearly with the number of nodes. The resulting GCNs, which we term permutohedral-GCNs, are differentiable and trained end-to-end, and they achieve state of the art performance on several node classification benchmarks.
翻訳日:2022-12-27 05:05:25 公開日:2020-03-02
# Ted Talk Ratingにおけるバイアスの検出と軽減

Detection and Mitigation of Bias in Ted Talk Ratings ( http://arxiv.org/abs/2003.00683v1 )

ライセンス: Link先を確認
Rupam Acharyya, Shouman Das, Ankani Chattoraj, Oishani Sengupta, Md Iftekar Tanveer(参考訳) 非バイアスデータ収集は、人工知能モデルの公平性を保証するために不可欠である。 暗黙的バイアス(英: implicit bias)とは、特定のグループのメンバーに所定の特性を属性付けし、データ収集プロセスに通知する行動条件付けの形式である。 本稿では,ソーシャルおよびプロフェッショナルのパフォーマンスを評価する多彩なソーシャルプラットフォームであるtedtalksの視聴者評価における暗黙のバイアスを定量化し,敏感な属性間で異なるバイアスの相関関係を示す。 これらのビデオの視聴者評価は、話者の能力とスキルを純粋に反映するべきであるが、我々の評価は、人種や性別に対する圧倒的で圧倒的な偏見の存在を示している。 本稿では,AIにおける不公平性を取り除く上で重要なバイアスの検出と緩和戦略を提案する。

Unbiased data collection is essential to guaranteeing fairness in artificial intelligence models. Implicit bias, a form of behavioral conditioning that leads us to attribute predetermined characteristics to members of certain groups and informs the data collection process. This paper quantifies implicit bias in viewer ratings of TEDTalks, a diverse social platform assessing social and professional performance, in order to present the correlations of different kinds of bias across sensitive attributes. Although the viewer ratings of these videos should purely reflect the speaker's competence and skill, our analysis of the ratings demonstrates the presence of overwhelming and predominant implicit bias with respect to race and gender. In our paper, we present strategies to detect and mitigate bias that are critical to removing unfairness in AI.
翻訳日:2022-12-27 05:05:04 公開日:2020-03-02
# AIにおける科学的インスピレーションのための一般的なフレームワーク

A general framework for scientifically inspired explanations in AI ( http://arxiv.org/abs/2003.00749v1 )

ライセンス: Link先を確認
David Tuckey, Alessandra Russo, Krysia Broda(参考訳) ディープラーニングの成功の増加と、そうしたシステムがライフクリティカルなアプリケーションでどのように予測するかを正当化する重要な必要性に応えて、AIの説明可能性がコンピュータサイエンスコミュニティで注目を集めている。 AIにおける説明可能性の焦点は、入力データと予測結果の関係を探索したり、より単純な解釈可能なモデルを抽出することによって、機械学習システムがどのように機能するかについての洞察を得ることにある。 哲学と社会科学の文献調査を通じて、著者はこれらの生成された説明と人間による説明の間に鋭い違いを強調し、AIの現在の説明は、専門家でないユーザーに効果的な情報伝達を可能にする人間の相互作用の複雑さを考慮していないと主張した。 本稿では,AIシステムの説明を実装可能な汎用フレームワークの理論的基盤として,科学的説明の構造概念をインスタンス化する。 このフレームワークは、AIシステムの"メンタルモデル"を構築するためのツールを提供することを目的としている。 ニューラルネットワークとprologソルバという2つの非常に異なる例を通じて、このフレームワークをどのように利用できるかを説明し、両方の例の可能な実装を提供する。

Explainability in AI is gaining attention in the computer science community in response to the increasing success of deep learning and the important need of justifying how such systems make predictions in life-critical applications. The focus of explainability in AI has predominantly been on trying to gain insights into how machine learning systems function by exploring relationships between input data and predicted outcomes or by extracting simpler interpretable models. Through literature surveys of philosophy and social science, authors have highlighted the sharp difference between these generated explanations and human-made explanations and claimed that current explanations in AI do not take into account the complexity of human interaction to allow for effective information passing to not-expert users. In this paper we instantiate the concept of structure of scientific explanation as the theoretical underpinning for a general framework in which explanations for AI systems can be implemented. This framework aims to provide the tools to build a "mental-model" of any AI system so that the interaction with the user can provide information on demand and be closer to the nature of human-made explanations. We illustrate how we can utilize this framework through two very different examples: an artificial neural network and a Prolog solver and we provide a possible implementation for both examples.
翻訳日:2022-12-27 05:04:49 公開日:2020-03-02
# ミリ波多重接続シナリオにおける学習型リンクスケジューリング

Learning-Based Link Scheduling in Millimeter-wave Multi-connectivity Scenarios ( http://arxiv.org/abs/2003.02651v1 )

ライセンス: Link先を確認
Cristian Tatino, Nikolaos Pappas, Ilaria Malanchini, Lutz Ewe, and Di Yuan(参考訳) ミリ波周波数範囲に対する信頼性の高い通信とシームレスな接続を実現するための,有望なソリューションとして,マルチコネクションが登場している。 このような高い周波数でのブロック感度のため、複数のセルとの接続はスループットと信頼性の観点からネットワーク性能を劇的に向上させることができる。 しかし、コネクションのオーバー・アン・プロビジョンといった非効率なリンクスケジューリングは、高い干渉とエネルギー消費につながるか、満足できないユーザのQoS(Quality of Service)要件につながる可能性がある。 本稿では,コミュニケーションの中断を回避しつつ,ユーザのqos要件を満たすために最適なリンクスケジューリングを予測できる学習ベースのソリューションを提案する。 さらに,提案手法を2つのベースライン手法と,完全チャネル知識を前提としたジェニー支援リンクスケジューリングと比較した。 学習に基づく解法が最適に近づき,ベースライン法より優れていることを示す。

Multi-connectivity is emerging as a promising solution to provide reliable communications and seamless connectivity for the millimeter-wave frequency range. Due to the blockage sensitivity at such high frequencies, connectivity with multiple cells can drastically increase the network performance in terms of throughput and reliability. However, an inefficient link scheduling, i.e., over and under-provisioning of connections, can lead either to high interference and energy consumption or to unsatisfied user's quality of service (QoS) requirements. In this work, we present a learning-based solution that is able to learn and then to predict the optimal link scheduling to satisfy users' QoS requirements while avoiding communication interruptions. Moreover, we compare the proposed approach with two base line methods and the genie-aided link scheduling that assumes perfect channel knowledge. We show that the learning-based solution approaches the optimum and outperforms the base line methods.
翻訳日:2022-12-27 04:59:42 公開日:2020-03-02
# BCIにおける脳波表現学習のためのマルチスケールニューラルネットワーク

Multi-Scale Neural network for EEG Representation Learning in BCI ( http://arxiv.org/abs/2003.02657v1 )

ライセンス: Link先を確認
Wonjun Ko, Eunjin Jeon, Seungwoo Jeong, and Heung-Il Suk(参考訳) 近年のディープラーニングの進歩は、脳-コンピュータインタフェースの研究に方法論的および実践的な影響を与えた。 様々な深層ネットワークアーキテクチャの中で、畳み込みニューラルネットワークは時空間脳波信号表現学習に適している。 文献に記載されている既存のCNNベースの手法のほとんどは、繰り返し非線形演算を伴う逐次的な抽象レベルでの特徴を抽出し、分類のための密結合層を含む。 しかし、神経生理学の研究により、脳波信号が様々な周波数成分の情報を伝達していることが判明した。 脳波におけるこれらの多重周波数特性をよりよく反映するために,複数の周波数/時間領域で特徴表現を発見し,電極,すなわち空間表現間の関係を抽出し,対象意図/条件識別を行う,新しい深層マルチスケールニューラルネットワークを提案する。 さらに,脳波信号を完全に時空間情報で表現することにより,単一パラダイムのBCIに主眼を置いている既存の手法とは対照的に,能動BCIと受動BCIの両方において多様なパラダイムに利用することができる。 提案手法の有効性を示すため,BCIデータセットの様々なパラダイムについて実験を行った。 実験の結果,提案手法は同等の最先端手法に対して評価した場合に性能改善が得られた。 さらに,PSD曲線や関連スコア検査などの異なる手法を用いて,マルチスケールの脳波情報取得能力,学習空間フィルタを探索するアクティベーションパターンマップ,表現された特徴を可視化するt-SNEプロットなどを用いて,提案手法を解析した。 最後に,実世界問題に対する本手法の適用を実証した。

Recent advances in deep learning have had a methodological and practical impact on brain-computer interface research. Among the various deep network architectures, convolutional neural networks have been well suited for spatio-spectral-temporal electroencephalogram signal representation learning. Most of the existing CNN-based methods described in the literature extract features at a sequential level of abstraction with repetitive nonlinear operations and involve densely connected layers for classification. However, studies in neurophysiology have revealed that EEG signals carry information in different ranges of frequency components. To better reflect these multi-frequency properties in EEGs, we propose a novel deep multi-scale neural network that discovers feature representations in multiple frequency/time ranges and extracts relationships among electrodes, i.e., spatial representations, for subject intention/condition identification. Furthermore, by completely representing EEG signals with spatio-spectral-temporal information, the proposed method can be utilized for diverse paradigms in both active and passive BCIs, contrary to existing methods that are primarily focused on single-paradigm BCIs. To demonstrate the validity of our proposed method, we conducted experiments on various paradigms of active/passive BCI datasets. Our experimental results demonstrated that the proposed method achieved performance improvements when judged against comparable state-of-the-art methods. Additionally, we analyzed the proposed method using different techniques, such as PSD curves and relevance score inspection to validate the multi-scale EEG signal information capturing ability, activation pattern maps for investigating the learned spatial filters, and t-SNE plotting for visualizing represented features. Finally, we also demonstrated our method's application to real-world problems.
翻訳日:2022-12-27 04:59:27 公開日:2020-03-02
# ML4Chem: 化学と材料科学のための機械学習パッケージ

ML4Chem: A Machine Learning Package for Chemistry and Materials Science ( http://arxiv.org/abs/2003.13388v1 )

ライセンス: Link先を確認
Muammar El Khatib, Wibe A de Jong(参考訳) ML4Chemは、化学と材料科学のためのオープンソースの機械学習ライブラリである。 マシンラーニングモデルとパイプラインの開発とデプロイのための拡張可能なプラットフォームを提供し、非専門家および専門家ユーザを対象としている。 ML4Chemはユーザエクスペリエンスの設計に従い、データ準備から推論までに必要なツールを提供する。 ここでは、原子中心モデルの実装、デプロイ、再現性のためのアトミックモジュールを紹介する。 このモジュールは、データ、成果化、モデル、モデルの最適化、推論、視覚化の6つのコアビルディングブロックで構成されている。 ニューラルネットワークとカーネルリッジ回帰アルゴリズムを用いた実演で、それらの機能と使いやすさを示す。

ML4Chem is an open-source machine learning library for chemistry and materials science. It provides an extendable platform to develop and deploy machine learning models and pipelines and is targeted to the non-expert and expert users. ML4Chem follows user-experience design and offers the needed tools to go from data preparation to inference. Here we introduce its atomistic module for the implementation, deployment, and reproducibility of atom-centered models. This module is composed of six core building blocks: data, featurization, models, model optimization, inference, and visualization. We present their functionality and easiness of use with demonstrations utilizing neural networks and kernel ridge regression algorithms.
翻訳日:2022-12-27 04:58:58 公開日:2020-03-02
# 逆学習によるニューロモルフィック事象とカラー画像のマッチング

Matching Neuromorphic Events and Color Images via Adversarial Learning ( http://arxiv.org/abs/2003.00636v1 )

ライセンス: Link先を確認
Fang Xu, Shijie Lin, Wen Yang, Lei Yu, Dengxin Dai, Gui-song Xia(参考訳) イベントカメラは、高ダイナミックレンジ、低レイテンシ、低消費電力、低メモリ使用率など、従来のフレームベースのカメラと相補的な特性を有する。 シーンのダイナミックスのみをキャプチャし、ほぼ「連続的な」動きをキャプチャできる。 しかし、シーン全体の外観を反映したフレームベースのカメラとは違い、イベントカメラはテクスチャや色などの詳細な特徴を排除している。 両方のモダリティの利点を活かすため、各種のマシンビジョンタスクにイベントカメラとフレームベースのカメラを組み合わせる。 次に、ニューロモルフィック事象とカラー画像の相互マッチングが不可欠かつ重要な役割を果たす。 本稿では,クロスモーダルマッチングタスクを活用すべく,イベントベース画像検索(ebir)問題を提案する。 クエリとして特定のオブジェクトを表すイベントストリームが与えられると、目的は同じオブジェクトを含むカラーイメージを取得することである。 この問題は、ニューロモルフィック事象とカラー画像の間に大きなモダリティギャップが存在するため、難しい。 我々は,神経形態的イベントカラー画像特徴学習(ecfl)を提案することで,ebir問題に対処する。 特に、対立学習を用いて、ニューロモルフィック事象とカラーイメージを共通の埋め込み空間に共同でモデル化する。 また,EBIR問題の発展を促進するため,コミュニティN-UKbenchとEC180データセットにも貢献する。 提案手法は,2つの異なるモダリティをリンクする効果的なモダリティ不変表現の学習に優れていることを示す。

The event camera has appealing properties: high dynamic range, low latency, low power consumption and low memory usage, and thus provides complementariness to conventional frame-based cameras. It only captures the dynamics of a scene and is able to capture almost "continuous" motion. However, different from frame-based camera that reflects the whole appearance as scenes are, the event camera casts away the detailed characteristics of objects, such as texture and color. To take advantages of both modalities, the event camera and frame-based camera are combined together for various machine vision tasks. Then the cross-modal matching between neuromorphic events and color images plays a vital and essential role. In this paper, we propose the Event-Based Image Retrieval (EBIR) problem to exploit the cross-modal matching task. Given an event stream depicting a particular object as query, the aim is to retrieve color images containing the same object. This problem is challenging because there exists a large modality gap between neuromorphic events and color images. We address the EBIR problem by proposing neuromorphic Events-Color image Feature Learning (ECFL). Particularly, the adversarial learning is employed to jointly model neuromorphic events and color images into a common embedding space. We also contribute to the community N-UKbench and EC180 dataset to promote the development of EBIR problem. Extensive experiments on our datasets show that the proposed method is superior in learning effective modality-invariant representation to link two different modalities.
翻訳日:2022-12-27 04:58:50 公開日:2020-03-02
# MVP:大規模ロボットナビゲーションのための統一運動と視覚的自己監督学習

MVP: Unified Motion and Visual Self-Supervised Learning for Large-Scale Robotic Navigation ( http://arxiv.org/abs/2003.00667v1 )

ライセンス: Link先を確認
Marvin Chanc\'an, Michael Milford(参考訳) 自律的なナビゲーションは、実環境における動きと局所的な視覚の両方から生まれる。 しかしながら、最も成功したロボットモーション推定手法(VO、SLAM、SfMなど)と視覚システム(CNN、視覚的位置認識-VPRなど)は、マッピングとローカライゼーションタスクに別々に使用されることが多い。 逆に、最近のビジュアルナビゲーションのための強化学習(RL)に基づく手法は、GPSデータ受信の品質に依存しており、大規模な環境において、複数の月空間のトラバーサルをまたいで直接真理として使用する場合、信頼性が低い可能性がある。 本稿では,大規模かつ目標駆動型ナビゲーションタスクにおいて,これらの2つのセンサモードを統一する,MVPと呼ばれる新しい動き認識手法を提案する。 MVPに基づく手法はより高速に学習でき、視覚のみのナビゲーション方法よりも、極端な環境変化とGPSデータの両方に対して正確で堅牢である。 MVPは、VPRを用いて得られたコンパクトな画像表現を時間的に組み込んでおり、VOや最適化レーダーオドメトリー(RO)のものに限らず、最適化された動き推定データを用いて、RLによる自己監督ナビゲーションポリシーを効率的に学習する。 オックスフォード・ロボカー・アンド・ノルドランド鉄道という2つの大規模な実世界のデータセットにおいて,新しいcitylearnフレームワークを用いて,天気(曇り,夜,雪,日光,雨,雲など)と季節(冬,春,秋,夏など)の条件について評価を行った。 実験の結果,GPSデータのないOxford RobotCarデータセットのトラバーサルでは,VOとROを用いてMVPが53%,93%のナビゲーション成功率を達成でき,視力のみの手法では7%であった。 さらに,rl成功率と動作推定精度とのトレードオフについて報告する。

Autonomous navigation emerges from both motion and local visual perception in real-world environments. However, most successful robotic motion estimation methods (e.g. VO, SLAM, SfM) and vision systems (e.g. CNN, visual place recognition-VPR) are often separately used for mapping and localization tasks. Conversely, recent reinforcement learning (RL) based methods for visual navigation rely on the quality of GPS data reception, which may not be reliable when directly using it as ground truth across multiple, month-spaced traversals in large environments. In this paper, we propose a novel motion and visual perception approach, dubbed MVP, that unifies these two sensor modalities for large-scale, target-driven navigation tasks. Our MVP-based method can learn faster, and is more accurate and robust to both extreme environmental changes and poor GPS data than corresponding vision-only navigation methods. MVP temporally incorporates compact image representations, obtained using VPR, with optimized motion estimation data, including but not limited to those from VO or optimized radar odometry (RO), to efficiently learn self-supervised navigation policies via RL. We evaluate our method on two large real-world datasets, Oxford Robotcar and Nordland Railway, over a range of weather (e.g. overcast, night, snow, sun, rain, clouds) and seasonal (e.g. winter, spring, fall, summer) conditions using the new CityLearn framework; an interactive environment for efficiently training navigation agents. Our experimental results, on traversals of the Oxford RobotCar dataset with no GPS data, show that MVP can achieve 53% and 93% navigation success rate using VO and RO, respectively, compared to 7% for a vision-only method. We additionally report a trade-off between the RL success rate and the motion estimation precision.
翻訳日:2022-12-27 04:58:26 公開日:2020-03-02
# アノテーションプロセスの同定による正・未ラベルデータからの学習

Learning from Positive and Unlabeled Data by Identifying the Annotation Process ( http://arxiv.org/abs/2003.01067v1 )

ライセンス: Link先を確認
Naji Shajarisales, Peter Spirtes, Kun Zhang(参考訳) バイナリ分類では、Learning from Positive and Unlabeled data (LePU)は半教師付き学習であるが、ラベル付き要素は1つのクラスのみである。 LePUの研究の大部分は、アノテーション付き例の選択プロセスと、Selected Completely At Random (SCAR) と呼ばれるアノテーション付きクラスの特徴の間のある種の独立性に依存している。 しかし、アノテーションプロセスはデータ収集の重要な部分であり、多くの場合、自然にデータの特定の特徴(画像の強度や画像で検出されるオブジェクトのサイズなど)に依存する。 アノテーションプロセスのモデルに制約がなければ、LePU問題における分類結果は非常に一般的ではない。 そのため、適切な柔軟な制約が必要です。 この作業では、SCARよりもより柔軟で現実的なアノテーションプロセスモデルを導入し、さらに重要なのは、挑戦的なLePU問題に対する解決策を提供します。 理論的には,データ生成過程の制約を考慮し,アノテーションプロセスの性質と分類関数の識別可能性を確立する。 また、シミュレーションデータと実データの両方で実験結果が得られたモデルパラメータを学習するための推論アルゴリズムを提案する。 また,将来の研究のためのベンチマークデータセットとして,新しい実世界のデータセットforlepuを提案する。

In binary classification, Learning from Positive and Unlabeled data (LePU) is semi-supervised learning but with labeled elements from only one class. Most of the research on LePU relies on some form of independence between the selection process of annotated examples and the features of the annotated class, known as the Selected Completely At Random (SCAR) assumption. Yet the annotation process is an important part of the data collection, and in many cases it naturally depends on certain features of the data (e.g., the intensity of an image and the size of the object to be detected in the image). Without any constraints on the model for the annotation process, classification results in the LePU problem will be highly non-unique. So proper, flexible constraints are needed. In this work we incorporate more flexible and realistic models for the annotation process than SCAR, and more importantly, offer a solution for the challenging LePU problem. On the theory side, we establish the identifiability of the properties of the annotation process and the classification function, in light of the considered constraints on the data-generating process. We also propose an inference algorithm to learn the parameters of the model, with successful experimental results on both simulated and real data. We also propose a novel real-world dataset forLePU, as a benchmark dataset for future studies.
翻訳日:2022-12-27 04:49:40 公開日:2020-03-02
# 局所線形制御のための予測符号化

Predictive Coding for Locally-Linear Control ( http://arxiv.org/abs/2003.01086v1 )

ライセンス: Link先を確認
Rui Shu, Tung Nguyen, Yinlam Chow, Tuan Pham, Khoat Than, Mohammad Ghavamzadeh, Stefano Ermon, Hung H. Bui(参考訳) 高次元観測と未知のダイナミクスは、多くの実世界の意思決定タスクに最適な制御を適用する際に大きな課題である。 Learning Controllable Embedding (LCE)フレームワークは、観測結果を低次元の潜伏空間に埋め込み、潜伏力学を推定し、潜伏空間で直接制御を行うことによって、これらの課題に対処する。 学習された潜伏ダイナミクスが次の観測の予測を確実にするため、既存のLCEアプローチはすべて観測空間に復号し、次の観測予測を明示的に実行します。 本稿では,新しい情報理論lce手法を提案し,その理論上,明示的な次観測予測を予測符号化に置き換えることができることを示す。 次に, 予測符号を用いて, 潜在ダイナミクスが局所線形制御に適合するデコーダフリーlceモデルを開発した。 ベンチマークタスクに関する広範な実験により,本モデルが最先端のlceベースラインと比較して優れた性能をもたらす制御可能な潜在空間を確実に学習できることが確認された。

High-dimensional observations and unknown dynamics are major challenges when applying optimal control to many real-world decision making tasks. The Learning Controllable Embedding (LCE) framework addresses these challenges by embedding the observations into a lower dimensional latent space, estimating the latent dynamics, and then performing control directly in the latent space. To ensure the learned latent dynamics are predictive of next-observations, all existing LCE approaches decode back into the observation space and explicitly perform next-observation prediction---a challenging high-dimensional task that furthermore introduces a large number of nuisance parameters (i.e., the decoder) which are discarded during control. In this paper, we propose a novel information-theoretic LCE approach and show theoretically that explicit next-observation prediction can be replaced with predictive coding. We then use predictive coding to develop a decoder-free LCE model whose latent dynamics are amenable to locally-linear control. Extensive experiments on benchmark tasks show that our model reliably learns a controllable latent space that leads to superior performance when compared with state-of-the-art LCE baselines.
翻訳日:2022-12-27 04:49:20 公開日:2020-03-02
# 深部線形ResNetのグローバル収束について

On the Global Convergence of Training Deep Linear ResNets ( http://arxiv.org/abs/2003.01094v1 )

ライセンス: Link先を確認
Difan Zou and Philip M. Long and Quanquan Gu(参考訳) 本研究では,l$-hidden-layer linear residual network (resnets) の学習のための勾配降下 (gd) と確率勾配降下 (sgd) の収束について検討した。 入力層と出力層に一定の線形変換を施したディープ残差ネットワークのトレーニングを行う場合、GDとSGDはいずれも、隠れた重みをゼロに初期化することで、トレーニング損失の最小限に収束できることを示す。 さらに、適切なガウス的ランダムな線形変換に特化する場合、GDとSGDは十分に広い線形ResNetを適切に最適化する。 標準ディープリニアネットワークトレーニングのためのgdのグローバル収束結果(du & hu 2019)と比較すると、ニューラルネットワーク幅の条件は、トレーニングデータの共分散行列の条件数を表す$o(\kappa l)$でシャープになる。 さらに、修正されたid入力と出力変換を提案し、$(d+k)$-wideニューラルネットワークは、それぞれ$d,k$が入出力次元であるgd/sgdのグローバル収束を保証するのに十分であることを示す。

We study the convergence of gradient descent (GD) and stochastic gradient descent (SGD) for training $L$-hidden-layer linear residual networks (ResNets). We prove that for training deep residual networks with certain linear transformations at input and output layers, which are fixed throughout training, both GD and SGD with zero initialization on all hidden weights can converge to the global minimum of the training loss. Moreover, when specializing to appropriate Gaussian random linear transformations, GD and SGD provably optimize wide enough deep linear ResNets. Compared with the global convergence result of GD for training standard deep linear networks (Du & Hu 2019), our condition on the neural network width is sharper by a factor of $O(\kappa L)$, where $\kappa$ denotes the condition number of the covariance matrix of the training data. We further propose a modified identity input and output transformations, and show that a $(d+k)$-wide neural network is sufficient to guarantee the global convergence of GD/SGD, where $d,k$ are the input and output dimensions respectively.
翻訳日:2022-12-27 04:49:00 公開日:2020-03-02
# fMRIデータを用いた自閉症スペクトラム障害検出のための説明可能かつスケーラブルな機械学習アルゴリズム

Explainable and Scalable Machine-Learning Algorithms for Detection of Autism Spectrum Disorder using fMRI Data ( http://arxiv.org/abs/2003.01541v1 )

ライセンス: Link先を確認
Taban Eslami, Joseph S. Raiker and Fahad Saeed(参考訳) 自閉症スペクトラム障害(asd)の診断は困難な問題であり、純粋に症状学の行動記述(dsm-5/icd-10)に基づいており、様々な状況(家庭、学校など)で障害を持つ子供を監視するために情報提供者が必要である。 多くの制限(例えば、情報的不一致、アセスメントガイドラインの遵守の欠如、情報的偏見)が、現在の診断プラクティスには過度、過度、過度、または誤診をもたらす可能性がある。 神経画像技術の進歩は、障害のより客観的な評価に向けて重要なステップを提供している。 以前の研究では、ASD患者から収集された構造的および機能的磁気共鳴画像(MRI)データが、局所的および大局的に異なる特徴と脳の時間的神経パターンを区別しているという強い証拠が示されていた。 提案した深層学習モデル ASD-DiagNet は神経型スキャンから ASD の脳スキャンの分類に一貫した精度を示す。 ASDバイオマーカーをMRIデータセットから分離することのできる、従来の機械学習およびディープラーニング技術を初めて統合しました。 我々の手法はAuto-ASD-Networkと呼ばれ、ディープラーニングとサポートベクトルマシン(SVM)を組み合わせて、ニューロタイプスキャンからASDスキャンを分類する。 このような解釈可能なモデルは、神経科学者の知識発見や臨床医の透過的分析につながるディープラーニング技術による決定を説明するのに役立つだろう。

Diagnosing Autism Spectrum Disorder (ASD) is a challenging problem, and is based purely on behavioral descriptions of symptomology (DSM-5/ICD-10), and requires informants to observe children with disorder across different settings (e.g. home, school). Numerous limitations (e.g., informant discrepancies, lack of adherence to assessment guidelines, informant biases) to current diagnostic practices have the potential to result in over-, under-, or misdiagnosis of the disorder. Advances in neuroimaging technologies are providing a critical step towards a more objective assessment of the disorder. Prior research provides strong evidence that structural and functional magnetic resonance imaging (MRI) data collected from individuals with ASD exhibit distinguishing characteristics that differ in local and global spatial, and temporal neural-patterns of the brain. Our proposed deep-learning model ASD-DiagNet exhibits consistently high accuracy for classification of ASD brain scans from neurotypical scans. We have for the first time integrated traditional machine-learning and deep-learning techniques that allows us to isolate ASD biomarkers from MRI data sets. Our method, called Auto-ASD-Network, uses a combination of deep-learning and Support Vector Machines (SVM) to classify ASD scans from neurotypical scans. Such interpretable models would help explain the decisions made by deep-learning techniques leading to knowledge discovery for neuroscientists, and transparent analysis for clinicians.
翻訳日:2022-12-27 04:47:50 公開日:2020-03-02
# 空を学習する:uavの効率的な3d配置

Learning in the Sky: An Efficient 3D Placement of UAVs ( http://arxiv.org/abs/2003.02650v1 )

ライセンス: Link先を確認
Atefeh Hajijamali Arani, M. Mahdi Azari, William Melek, and Safieddin Safavi-Naeini(参考訳) 航空基地局としての無人航空機(UAV)の配備は、様々な交通需要に対応する高速で柔軟なソリューションを提供することができる。 UAVの展開を適切に活用するためには、その効率的な配置が最重要であり、環境の変化にインテリジェントに適応する必要がある。 本稿では,地上のセルネットワークをダウンリンクで支援するUAVの3次元展開のための学習機構を提案する。 この問題は、満足度のあるUAV間の非協調ゲームとしてモデル化されている。 この問題を解決するために,不満足なUAVが学習アルゴリズムに基づいて位置情報を更新する,低複雑性アルゴリズムを用いる。 シミュレーションの結果,提案したUAV配置アルゴリズムは,最適化ベースラインアルゴリズムと比較して,スループットおよびドロップユーザ数において,それぞれ52%,74%の大幅な性能向上を達成していることがわかった。

Deployment of unmanned aerial vehicles (UAVs) as aerial base stations can deliver a fast and flexible solution for serving varying traffic demand. In order to adequately benefit of UAVs deployment, their efficient placement is of utmost importance, and requires to intelligently adapt to the environment changes. In this paper, we propose a learning-based mechanism for the three-dimensional deployment of UAVs assisting terrestrial cellular networks in the downlink. The problem is modeled as a non-cooperative game among UAVs in satisfaction form. To solve the game, we utilize a low complexity algorithm, in which unsatisfied UAVs update their locations based on a learning algorithm. Simulation results reveal that the proposed UAV placement algorithm yields significant performance gains up to about 52% and 74% in terms of throughput and the number of dropped users, respectively, compared to an optimized baseline algorithm.
翻訳日:2022-12-27 04:47:07 公開日:2020-03-02
# VAE/WGANによる顔画像のシームレス・アイデンティティ置換のための画像表現学習

VAE/WGAN-Based Image Representation Learning For Pose-Preserving Seamless Identity Replacement In Facial Images ( http://arxiv.org/abs/2003.00641v1 )

ライセンス: Link先を確認
Hiroki Kawai, Jiawei Chen, Prakash Ishwar, Janusz Konrad(参考訳) 本稿では,同一性に不変だが頭部情報を保持する顔画像から潜在表現を学習するために,wassersteinの損失に基づくvgan(variational generative adversarial network)を提案する。 これにより、入力画像と同一の頭部ポーズを持つ現実的な顔画像の合成が容易になるが、同一性が異なる。 このネットワークの1つのアプリケーションはプライバシに敏感なシナリオであり、イメージ内のアイデンティティ置換後、ヘッドポーズのようなユーティリティを回復することができる。 3つの脅威シナリオで実施した合成および実顔画像データセットの広範な実験検証により、提案ネットワークが入力画像の頭部の姿勢を保存し、入力idをマスクし、望ましいアイデンティティの高品質なリアルな顔画像を合成する能力が確認された。 また,我々のネットワークは,ポーズ保存型アイデンティティモーフィングとアイデンティティ保存型ポーズモーフィングの実行に使用できることを示した。 提案手法は, 定量化および合成画像品質の観点から, 最新の最先端手法を改良する。

We present a novel variational generative adversarial network (VGAN) based on Wasserstein loss to learn a latent representation from a face image that is invariant to identity but preserves head-pose information. This facilitates synthesis of a realistic face image with the same head pose as a given input image, but with a different identity. One application of this network is in privacy-sensitive scenarios; after identity replacement in an image, utility, such as head pose, can still be recovered. Extensive experimental validation on synthetic and real human-face image datasets performed under 3 threat scenarios confirms the ability of the proposed network to preserve head pose of the input image, mask the input identity, and synthesize a good-quality realistic face image of a desired identity. We also show that our network can be used to perform pose-preserving identity morphing and identity-preserving pose morphing. The proposed method improves over a recent state-of-the-art method in terms of quantitative metrics as well as synthesized image quality.
翻訳日:2022-12-27 04:41:09 公開日:2020-03-02
# Net2Net変換を用いたエネルギー効率・ロバスト累積学習

Energy-efficient and Robust Cumulative Training with Net2Net Transformation ( http://arxiv.org/abs/2003.01204v1 )

ライセンス: Link先を確認
Aosong Feng, and Priyadarshini Panda(参考訳) ディープラーニングは、いくつかのコンピュータビジョンタスクで最先端の精度を達成している。 しかし、そのような深層ニューラルネットワークのトレーニングに関連する計算とエネルギーの要求は非常に高い。 本稿では,net2netトランスフォーメーションを用いた累積学習戦略を提案する。スクラッチからトレーニングしたモデルと比較して,大きな精度損失を伴わずに計算効率のトレーニングを実現する。 まず、元のデータセットの小さなサブセット上で小さなネットワーク(より少ないパラメータで)をトレーニングし、その後、net2net変換を使用して徐々にネットワークを拡張して、データセットのより大きなサブセットで段階的にトレーニングします。 Net2Netによるこの漸進的なトレーニング戦略は、前回の小さなネットワークから次の大きなネットワークに知識を転送する関数保存変換を利用する。 実験の結果, ゼロからのトレーニングと比較して, 累積トレーニングは, 等精度でVGG19を用いてTinyImageNetをトレーニングする際の計算複雑性を約2倍削減することがわかった。 トレーニング効率の他に,Net2Net拡張中にプルーニングを実行して,スクラッチによる従来のトレーニングと比較して,最適構成(約0.4倍低い推論計算複雑性)の最終的なネットワークを得ることが可能である。 また,累積学習から得られた最終ネットワークにより,一般化性能と雑音ロバスト性が向上することを示す。 さらに,累積的net2net拡張によって生成された全ネットワークからの相互推論により,逆入力検出が改善されることを示す。

Deep learning has achieved state-of-the-art accuracies on several computer vision tasks. However, the computational and energy requirements associated with training such deep neural networks can be quite high. In this paper, we propose a cumulative training strategy with Net2Net transformation that achieves training computational efficiency without incurring large accuracy loss, in comparison to a model trained from scratch. We achieve this by first training a small network (with lesser parameters) on a small subset of the original dataset, and then gradually expanding the network using Net2Net transformation to train incrementally on larger subsets of the dataset. This incremental training strategy with Net2Net utilizes function-preserving transformations that transfers knowledge from each previous small network to the next larger network, thereby, reducing the overall training complexity. Our experiments demonstrate that compared with training from scratch, cumulative training yields ~2x reduction in computational complexity for training TinyImageNet using VGG19 at iso-accuracy. Besides training efficiency, a key advantage of our cumulative training strategy is that we can perform pruning during Net2Net expansion to obtain a final network with optimal configuration (~0.4x lower inference compute complexity) compared to conventional training from scratch. We also demonstrate that the final network obtained from cumulative training yields better generalization performance and noise robustness. Further, we show that mutual inference from all the networks created with cumulative Net2Net expansion enables improved adversarial input detection.
翻訳日:2022-12-27 04:40:49 公開日:2020-03-02
# 機械知による赤血球の細胞力学に基づく計算分類 : 形態レオロジーマーカーへの応用

Cell Mechanics Based Computational Classification of Red Blood Cells Via Machine Intelligence Applied to Morpho-Rheological Markers ( http://arxiv.org/abs/2003.00009v1 )

ライセンス: Link先を確認
Yan Ge, Philipp Rosendahl, Claudio Dur\'an, Nicole T\"opfner, Sara Ciucci, Jochen Guck, and Carlo Vittorio Cannistraci(参考訳) 蛍光セルラベリングは医学的な研究で広く用いられているが、その欠点の一部は避けられないものであり、蛍光プローブやプローブは機能的な変化を誘導する。 したがって、細胞を分類するためのラベルフリーな方法論の需要と開発が強く、その精度医療への影響が重要となる。 この目的のために、単一細胞の多次元生体物理特性を得るために、セルメカニカル・フェノタイピングのための高スループット技術が提案されている。 本研究の目的は,リアルタイム変形性と蛍光サイトメトリー(rt-fdc)により得られた形態学的マーカーにのみ適用される非教師なし機械学習手法が,成熟赤血球からラベルなしの赤血球を識別する難しい課題に対処できるかどうかを検討することである。 特に貧血や白血病などの骨髄疾患では血液中の小胞体(細胞量と細胞量)の性状が重要であるため,この問題に焦点をあてた。 提案手法は, 成熟赤血球からレチキュロサイトを分類する上で, ラベルフリーで有望な成果を報告し, 単一細胞の計算分類のための高スループットな形態素レオロジー法の開発を前進させるものである。 また,提案手法は,既存のセルラベル技術と統合するための補完的手法でもある。

Despite fluorescent cell-labelling being widely employed in biomedical studies, some of its drawbacks are inevitable, with unsuitable fluorescent probes or probes inducing a functional change being the main limitations. Consequently, the demand for and development of label-free methodologies to classify cells is strong and its impact on precision medicine is relevant. Towards this end, high-throughput techniques for cell mechanical phenotyping have been proposed to get a multidimensional biophysical characterization of single cells. With this motivation, our goal here is to investigate the extent to which an unsupervised machine learning methodology, which is applied exclusively on morpho-rheological markers obtained by real-time deformability and fluorescence cytometry (RT-FDC), can address the difficult task of providing label-free discrimination of reticulocytes from mature red blood cells. We focused on this problem, since the characterization of reticulocytes (their percentage and cellular features) in the blood is vital in multiple human disease conditions, especially bone-marrow disorders such as anemia and leukemia. Our approach reports promising label-free results in the classification of reticulocytes from mature red blood cells, and it represents a step forward in the development of high-throughput morpho-rheological-based methodologies for the computational categorization of single cells. Besides, our methodology can be an alternative but also a complementary method to integrate with existing cell-labelling techniques.
翻訳日:2022-12-27 04:40:05 公開日:2020-03-02
# カーネル hilbert $c^*$-modules の正規直交系による解析とその応用

Analysis via Orthonormal Systems in Reproducing Kernel Hilbert $C^*$-Modules and Applications ( http://arxiv.org/abs/2003.00738v1 )

ライセンス: Link先を確認
Yuka Hashimoto, Isao Ishikawa, Masahiro Ikeda, Fuyuta Komura, Takeshi Katsura, Yoshinobu Kawahara(参考訳) カーネル手法は、再生カーネルヒルベルト空間(RKHS)の特性を用いて学習タスクを解く機械学習において最も一般的な手法の一つである。 本稿では、ベクトル値RKHS(vv-RKHS)よりもRKHSの別の一般化であるHilbert $C^*$-module(RKHM)を再現した新しいデータ解析フレームワークを提案する。 RKHMsを用いて解析することで、vv-RKHSよりも明確に変数間の構造を扱うことができる。 ヒルベルト$C^*$-加群における正則系の構成に関する理論的妥当性を示し、RKHMにおける正則化のための具体的な手順とそれらの数値計算における理論的性質を導出する。 さらに、RKHMカーネルの主成分分析とペロン・フロベニウス作用素を用いた力学系の解析を一般化する。 また,本手法の実証性能を実世界の合成データを用いて検討した。

Kernel methods have been among the most popular techniques in machine learning, where learning tasks are solved using the property of reproducing kernel Hilbert space (RKHS). In this paper, we propose a novel data analysis framework with reproducing kernel Hilbert $C^*$-module (RKHM), which is another generalization of RKHS than vector-valued RKHS (vv-RKHS). Analysis with RKHMs enables us to deal with structures among variables more explicitly than vv-RKHS. We show the theoretical validity for the construction of orthonormal systems in Hilbert $C^*$-modules, and derive concrete procedures for orthonormalization in RKHMs with those theoretical properties in numerical computations. Moreover, we apply those to generalize with RKHM kernel principal component analysis and the analysis of dynamical systems with Perron-Frobenius operators. The empirical performance of our methods is also investigated by using synthetic and real-world data.
翻訳日:2022-12-27 04:38:54 公開日:2020-03-02
# 確率的メタポリシーを用いたロボットナビゲーションのロバストポリシー探索

Robust Policy Search for Robot Navigation with Stochastic Meta-Policies ( http://arxiv.org/abs/2003.01000v1 )

ライセンス: Link先を確認
Javier Garcia-Barcos, Ruben Martinez-Cantin(参考訳) ベイズ最適化は、最適な位置に関する情報を集めるためにクエリを慎重に選択する効率的な非線形最適化手法である。 したがって、政策検索の文脈では、アクティブポリシー検索(active policy search)と呼ばれる。 サンプル効率に対するベイズ最適化の主な要素は確率的代理モデルと最適決定ヒューリスティックである。 本研究では、ポリシー探索アルゴリズムの様々な問題に対して堅牢性を提供するためにそれらを利用する。 複数の方法を組み合わせて、それらの相互作用が部品の総和よりもどのように機能するかを示す。 まず、入力ノイズに対処し、安全かつ繰り返し可能なポリシーを提供するために、無意味ベイズ最適化の改良版を使用する。 そして、ミスモデリングエラーに対処し、探索を改善するために、クエリ選択と適応カーネルに確率的メタポリティシーを使用します。 提案アルゴリズムを,ロボットアームによるオブジェクトのプッシュやローバーによる経路探索など,いくつかの最適化ベンチマークやロボットタスクにおいて,以前の結果と比較した。

Bayesian optimization is an efficient nonlinear optimization method where the queries are carefully selected to gather information about the optimum location. Thus, in the context of policy search, it has been called active policy search. The main ingredients of Bayesian optimization for sample efficiency are the probabilistic surrogate model and the optimal decision heuristics. In this work, we exploit those to provide robustness to different issues for policy search algorithms. We combine several methods and show how their interaction works better than the sum of the parts. First, to deal with input noise and provide a safe and repeatable policy we use an improved version of unscented Bayesian optimization. Then, to deal with mismodeling errors and improve exploration we use stochastic meta-policies for query selection and an adaptive kernel. We compare the proposed algorithm with previous results in several optimization benchmarks and robot tasks, such as pushing objects with a robot arm, or path finding with a rover.
翻訳日:2022-12-27 04:31:17 公開日:2020-03-02
# 証明可能な保証による半パラメトリック非線形2部グラフ表現学習

Semiparametric Nonlinear Bipartite Graph Representation Learning with Provable Guarantees ( http://arxiv.org/abs/2003.01013v1 )

ライセンス: Link先を確認
Sen Na, Yuwei Luo, Zhuoran Yang, Zhaoran Wang, Mladen Kolar(参考訳) グラフ表現学習は機械学習においてユビキタスなタスクであり、各頂点を低次元ベクトル空間に埋め込むことが目的である。 半パラメトリック指数族分布におけるパラメータの統計的推定問題として両部グラフを考察し,その表現学習問題を定式化する。 二部グラフは半パラメトリック指数族分布によって生成され、そのパラメトリック成分は2つの1層ニューラルネットワークの出力の近接によって与えられるが、非パラメトリック(ノイサンス)成分は基底測度である。 ニューラルネットワークは、入力および出力埋め込みベクトルとして高次元の特徴を取る。 この設定では、表現学習問題は重み行列の回復と等価である。 推定の主な課題は、活性化関数の非線形性と分布の非パラメトリックニュアンス成分から生じる。 これらの課題を克服するために,ランク次分解手法に基づく擬似類似目的を提案し,その局所幾何学に着目する。 提案手法は, 地中真理付近で強い凸性を示すため, 勾配降下法が線形収束率を達成できることを示す。 さらに、この問題のサンプル複雑性は、パラメトリックガウスモデルと一致する次元(対数因子まで)において線形であることが証明される。 しかしながら、我々の推定値は指数関数族内の任意のモデル誤特定に対して頑健であり、広範な実験で検証される。

Graph representation learning is a ubiquitous task in machine learning where the goal is to embed each vertex into a low-dimensional vector space. We consider the bipartite graph and formalize its representation learning problem as a statistical estimation problem of parameters in a semiparametric exponential family distribution. The bipartite graph is assumed to be generated by a semiparametric exponential family distribution, whose parametric component is given by the proximity of outputs of two one-layer neural networks, while nonparametric (nuisance) component is the base measure. Neural networks take high-dimensional features as inputs and output embedding vectors. In this setting, the representation learning problem is equivalent to recovering the weight matrices. The main challenges of estimation arise from the nonlinearity of activation functions and the nonparametric nuisance component of the distribution. To overcome these challenges, we propose a pseudo-likelihood objective based on the rank-order decomposition technique and focus on its local geometry. We show that the proposed objective is strongly convex in a neighborhood around the ground truth, so that a gradient descent-based method achieves linear convergence rate. Moreover, we prove that the sample complexity of the problem is linear in dimensions (up to logarithmic factors), which is consistent with parametric Gaussian models. However, our estimator is robust to any model misspecification within the exponential family, which is validated in extensive experiments.
翻訳日:2022-12-27 04:31:02 公開日:2020-03-02
# ガウス過程政策最適化

Gaussian Process Policy Optimization ( http://arxiv.org/abs/2003.01074v1 )

ライセンス: Link先を確認
Ashish Rao, Bidipta Sarkar, and Tejas Narayanan(参考訳) 本研究では,ベイズ的パラメータ空間探索法を応用したアクター批判型モデルレス強化学習アルゴリズムを提案する。 ガウス過程は、ポリシーのパラメータからポリシーの期待された回帰を学ぶために用いられる。 本システムは, ガウス過程が与える期待する改善獲得関数を表すボーナス項と, 近似ポリシ最適化'クラッピング'損失関数からなる新しい代理損失関数に基づいて, 勾配降下を用いたパラメータの更新により訓練を行う。 この新しい手法は、MuJoCo物理エンジンを用いてロボットの移動をシミュレートする環境において、現在のアルゴリズムを実証的に上回っている。

We propose a novel actor-critic, model-free reinforcement learning algorithm which employs a Bayesian method of parameter space exploration to solve environments. A Gaussian process is used to learn the expected return of a policy given the policy's parameters. The system is trained by updating the parameters using gradient descent on a new surrogate loss function consisting of the Proximal Policy Optimization 'Clipped' loss function and a bonus term representing the expected improvement acquisition function given by the Gaussian process. This new method is shown to be comparable to and at times empirically outperform current algorithms on environments that simulate robotic locomotion using the MuJoCo physics engine.
翻訳日:2022-12-27 04:30:40 公開日:2020-03-02
# ドメイン間およびマルチ出力ガウスプロセスのためのフレームワーク

A Framework for Interdomain and Multioutput Gaussian Processes ( http://arxiv.org/abs/2003.01115v1 )

ライセンス: Link先を確認
Mark van der Wilk, Vincent Dutordoir, ST John, Artem Artemev, Vincent Adam, and James Hensman(参考訳) 大規模問題におけるガウス過程(GP)の使用の障害の一つとして、ディープラーニングシステムにおけるコンポーネントとして、モデルや推論の小さなバリエーションに対して、導出や実装を行う必要がある。 GPの実用性を改善するには、ニューラルネットワークコミュニティに見られるように、迅速な実装とテストを可能にするモジュールシステムが必要です。 本稿では,ドメイン間近似と複数出力を組み合わせたGPのスケーラブルな近似推定のための数学的およびソフトウェアフレームワークを提案する。 GPflowで実装された我々のフレームワークは、多くの既存のマルチアウトプットモデルと、より最近の畳み込み構造に統一されたインターフェースを提供する。 これにより、GPを用いたディープモデルの作成が簡単になり、このアプローチへのさらなる関心が高まることを期待します。

One obstacle to the use of Gaussian processes (GPs) in large-scale problems, and as a component in deep learning system, is the need for bespoke derivations and implementations for small variations in the model or inference. In order to improve the utility of GPs we need a modular system that allows rapid implementation and testing, as seen in the neural network community. We present a mathematical and software framework for scalable approximate inference in GPs, which combines interdomain approximations and multiple outputs. Our framework, implemented in GPflow, provides a unified interface for many existing multioutput models, as well as more recent convolutional structures. This simplifies the creation of deep models with GPs, and we hope that this work will encourage more interest in this approach.
翻訳日:2022-12-27 04:30:27 公開日:2020-03-02
# レギュレット最小化によるオンラインAgnostic Boosting

Online Agnostic Boosting via Regret Minimization ( http://arxiv.org/abs/2003.01150v1 )

ライセンス: Link先を確認
Nataly Brukhim, Xinyi Chen, Elad Hazan, Shay Moran(参考訳) Boostingは、弱い学習ルールを集約するというアイデアに基づいて、広く使われている機械学習アプローチである。 統計的学習においては、多くのブースティング手法が実現可能な設定と不可知な設定の両方に存在するが、オンライン学習では実現可能な場合のみ存在する。 この研究で我々は、最初の無知なオンラインブースティングアルゴリズムを提供する。つまり、極端に不愉快な保証しか持たない弱い学習者を考えると、我々のアルゴリズムはそれをサブリニアな後悔を伴う強い学習者へと押し上げる。 提案アルゴリズムは,任意のオンライン凸最適化器をオンラインブースターに効率よく変換するオンライン凸最適化への抽象的(かつ単純な)還元に基づく。 さらに、この削減は、統計的およびオンライン実現可能な設定にまで拡張され、統計/オンラインと不可知/実現可能なブーピングの4つのケースを統一する。

Boosting is a widely used machine learning approach based on the idea of aggregating weak learning rules. While in statistical learning numerous boosting methods exist both in the realizable and agnostic settings, in online learning they exist only in the realizable case. In this work we provide the first agnostic online boosting algorithm; that is, given a weak learner with only marginally-better-than-trivial regret guarantees, our algorithm boosts it to a strong learner with sublinear regret. Our algorithm is based on an abstract (and simple) reduction to online convex optimization, which efficiently converts an arbitrary online convex optimizer to an online booster. Moreover, this reduction extends to the statistical as well as the online realizable settings, thus unifying the 4 cases of statistical/online and agnostic/realizable boosting.
翻訳日:2022-12-27 04:30:14 公開日:2020-03-02
# スコアベース生成モデルによる置換不変グラフ生成

Permutation Invariant Graph Generation via Score-Based Generative Modeling ( http://arxiv.org/abs/2003.00638v1 )

ライセンス: Link先を確認
Chenhao Niu, Yang Song, Jiaming Song, Shengjia Zhao, Aditya Grover, Stefano Ermon(参考訳) グラフ構造データの生成モデルを学習することは、グラフが離散的で組合せ的であり、基礎となるデータ分布がノードの順序に不変であるため困難である。 しかし、既存のグラフ生成モデルは、選択された順序に不変ではないため、学習された分布に好ましくないバイアスをもたらす可能性がある。 このような問題に対処するため,近年のスコアベース生成モデルを用いて,グラフモデリングにおける置換不変手法を提案する。 特に、入力グラフにおけるデータ分布の勾配(すなわちスコア関数)をモデル化するために、置換同変多チャンネルグラフニューラルネットワークを設計する。 この勾配の置換同変モデルはグラフの置換不変分布を暗黙的に定義する。 我々はこのグラフニューラルネットワークをスコアマッチングでトレーニングし、そこからアンニールランゲヴィン力学を用いてサンプルを得る。 実験では、まず、離散グラフアルゴリズムの学習におけるこの新しいアーキテクチャの能力を示す。 グラフ生成では、我々の学習アプローチはベンチマークデータセット上の既存のモデルよりも良い、あるいは同等の結果を得る。

Learning generative models for graph-structured data is challenging because graphs are discrete, combinatorial, and the underlying data distribution is invariant to the ordering of nodes. However, most of the existing generative models for graphs are not invariant to the chosen ordering, which might lead to an undesirable bias in the learned distribution. To address this difficulty, we propose a permutation invariant approach to modeling graphs, using the recent framework of score-based generative modeling. In particular, we design a permutation equivariant, multi-channel graph neural network to model the gradient of the data distribution at the input graph (a.k.a., the score function). This permutation equivariant model of gradients implicitly defines a permutation invariant distribution for graphs. We train this graph neural network with score matching and sample from it with annealed Langevin dynamics. In our experiments, we first demonstrate the capacity of this new architecture in learning discrete graph algorithms. For graph generation, we find that our learning approach achieves better or comparable results to existing models on benchmark datasets.
翻訳日:2022-12-27 04:23:39 公開日:2020-03-02
# EHR死亡予測のための不確かさグラフ付き確率列モデル

Uncertainty-Gated Stochastic Sequential Model for EHR Mortality Prediction ( http://arxiv.org/abs/2003.00655v1 )

ライセンス: Link先を確認
Eunji Jun, Ahmad Wisnu Mulyadi, Jaehun Choi, Heung-Il Suk(参考訳) 電子健康記録(EHR)は、非定常、異質、ノイズ、スパースデータとして特徴付けられるため、その内部に存在する規則性やパターンを学ぶことは困難である。 特に、主に多くの不足値によって引き起こされるスパース性は、二次計算問題の定義を通じて、主目的タスクの解を決定するために利用可能なすべてのサンプルをよりよく利用しようと試みた研究者の注目を集めている。 方法論的には、決定的あるいは確率的な既存の手法は、欠落した値を暗示するために異なる仮定を適用している。 しかし、一度不足した値がインプットされると、既存のほとんどのメソッドは下流タスクのモデリングにおいて、インプットされた値の忠実さや信頼性を考慮しない。 必然的に、不適切な変数の誤ったあるいは不適切な命令は、モデリングの困難や劣化した性能を引き起こす可能性がある。 本研究では,新しい変動リカレントネットワークを提案する。 (i)不確実性を表すための欠落変数の分布を推定する。 二 繰り返し(時間の経過に伴う不確かさの伝播)におけるインプット値のばらつきに基づいて明示的に忠実さを適用して隠蔽状態を更新すること。 (iii) 病院内死亡の可能性を予測する。 モデルがこれらの手順を単一のストリームで実行し、すべてのネットワークパラメータをエンドツーエンドで共同で学習できることは注目に値する。 実験で検討した死亡率予測のための他の最先端手法との比較と性能評価を行い,mime-iiiとphysionet challenge 2012の公開データセットを用いて本手法の有効性を検証した。 また,推定された推定値の不確かさをよく表わしたモデルの挙動を同定し,計算されたmaeと不確実性との間に高い相関関係を示した。

Electronic health records (EHR) are characterized as non-stationary, heterogeneous, noisy, and sparse data; therefore, it is challenging to learn the regularities or patterns inherent within them. In particular, sparseness caused mostly by many missing values has attracted the attention of researchers, who have attempted to find a better use of all available samples for determining the solution of a primary target task through the defining a secondary imputation problem. Methodologically, existing methods, either deterministic or stochastic, have applied different assumptions to impute missing values. However, once the missing values are imputed, most existing methods do not consider the fidelity or confidence of the imputed values in the modeling of downstream tasks. Undoubtedly, an erroneous or improper imputation of missing variables can cause difficulties in modeling as well as a degraded performance. In this study, we present a novel variational recurrent network that (i) estimates the distribution of missing variables allowing to represent uncertainty in the imputed values, (ii) updates hidden states by explicitly applying fidelity based on a variance of the imputed values during a recurrence (i.e., uncertainty propagation over time), and (iii) predicts the possibility of in-hospital mortality. It is noteworthy that our model can conduct these procedures in a single stream and learn all network parameters jointly in an end-to-end manner. We validated the effectiveness of our method using the public datasets of MIMIC-III and PhysioNet challenge 2012 by comparing with and outperforming other state-of-the-art methods for mortality prediction considered in our experiments. In addition, we identified the behavior of the model that well represented the uncertainties for the imputed estimates, which indicated a high correlation between the calculated MAE and the uncertainty.
翻訳日:2022-12-27 04:22:19 公開日:2020-03-02
# 長期短期試料蒸留

Long Short-Term Sample Distillation ( http://arxiv.org/abs/2003.00739v1 )

ライセンス: Link先を確認
Liang Jiang, Zujie Wen, Zhongping Liang, Yafang Wang, Gerard de Melo, Zhe Li, Liangzhuang Ma, Jiaxing Zhang, Xiaolong Li, Yuan Qi(参考訳) 過去10年間で、より深いニューラルネットワークのトレーニングが大幅に進歩しました。 教員養成パラダイムの最近の進歩により、過去のトレーニング更新に関する情報は、その後のトレーニングステップにおける指導の源泉として期待が持たれている。 本論文では,従来のトレーニングプロセスの複数フェーズを同時に活用して,後続のトレーニング更新をニューラルネットワークに誘導し,単一の世代パスで効率よく進行させる,Long Short-Term Sample Distillationを提案する。 長期間の試料蒸留では、各試料の監視信号は、長期の信号と短期の信号の2つの部分に分けられる。 長期教師は、教師と生徒の差異を安定的に保証するために、いくつかの時代のスナップショットを描いているが、短期教師は、より高品質な更新を可能にするという目標により、より最新の手掛かりを与えている。 さらに、各サンプルの教師はユニークであり、モデル全体が非常に多様な教師セットから学習される。 視覚とnlpタスクの包括的実験結果から,この新しいトレーニング手法の有効性が示された。

In the past decade, there has been substantial progress at training increasingly deep neural networks. Recent advances within the teacher--student training paradigm have established that information about past training updates show promise as a source of guidance during subsequent training steps. Based on this notion, in this paper, we propose Long Short-Term Sample Distillation, a novel training policy that simultaneously leverages multiple phases of the previous training process to guide the later training updates to a neural network, while efficiently proceeding in just one single generation pass. With Long Short-Term Sample Distillation, the supervision signal for each sample is decomposed into two parts: a long-term signal and a short-term one. The long-term teacher draws on snapshots from several epochs ago in order to provide steadfast guidance and to guarantee teacher--student differences, while the short-term one yields more up-to-date cues with the goal of enabling higher-quality updates. Moreover, the teachers for each sample are unique, such that, overall, the model learns from a very diverse set of teachers. Comprehensive experimental results across a range of vision and NLP tasks demonstrate the effectiveness of this new training method.
翻訳日:2022-12-27 04:13:23 公開日:2020-03-02
# 顔格子を用いたフィードフォワードニューラルネットワークの到達可能性解析

Reachability Analysis for Feed-Forward Neural Networks using Face Lattices ( http://arxiv.org/abs/2003.01226v1 )

ライセンス: Link先を確認
Xiaodong Yang, Hoang-Dung Tran, Weiming Xiang, Taylor Johnson(参考訳) ディープニューラルネットワークは、複雑で実用的な問題に対処するための効果的なアプローチとして広く応用されてきた。 しかしながら、最も根本的なオープンな問題の1つは、行動の安全性を分析するための正式な方法の欠如である。 そこで本研究では,ニューラルネットワークの正確な到達可能集合を入力集合に計算する並列化手法を提案する。 本手法は現在,reluアクティベーション機能を備えたフィードフォワードニューラルネットワークに焦点を当てている。 ポリトープに基づくアプローチの主な課題の1つは、中間のポリトープとニューロンからの超平面との交点を特定することである。 そこで本研究では,完全組合せ構造である面格子を持つポリトープを構成する新しい手法を提案する。 提案手法の正しさと性能は,ACAS Xuネットワークや他のベンチマークの安全性を検証することによって評価する。 Reluplex, Marabou, NNVといった最先端の手法と比較して, 本手法は高い効率性を示す。 さらに,提案手法では,出力セットが与えられた入力セットの完全な構成が可能であり,安全違反につながる任意の入力を追跡できる。

Deep neural networks have been widely applied as an effective approach to handle complex and practical problems. However, one of the most fundamental open problems is the lack of formal methods to analyze the safety of their behaviors. To address this challenge, we propose a parallelizable technique to compute exact reachable sets of a neural network to an input set. Our method currently focuses on feed-forward neural networks with ReLU activation functions. One of the primary challenges for polytope-based approaches is identifying the intersection between intermediate polytopes and hyperplanes from neurons. In this regard, we present a new approach to construct the polytopes with the face lattice, a complete combinatorial structure. The correctness and performance of our methodology are evaluated by verifying the safety of ACAS Xu networks and other benchmarks. Compared to state-of-the-art methods such as Reluplex, Marabou, and NNV, our approach exhibits a significantly higher efficiency. Additionally, our approach is capable of constructing the complete input set given an output set, so that any input that leads to safety violation can be tracked.
翻訳日:2022-12-27 04:11:44 公開日:2020-03-02
# R2D2-GANを用いた無限解像度画像生成

Unlimited Resolution Image Generation with R2D2-GANs ( http://arxiv.org/abs/2003.01063v1 )

ライセンス: Link先を確認
Marija Jegorova, Antti Ilari Karjalainen, Jose Vazquez, Timothy M. Hospedales(参考訳) 本稿では,任意の解像度の高品質画像を生成するための新しいシミュレーション手法を提案する。 この方法は、全期間のミッションで収集されたものと同等の大きさのソナースキャンを合成し、任意の大きさのトラック解像度で合成することができる。 本モデルでは,gans(generative adversarial network)ベースのアーキテクチャを,生成画像の連続性を容易にする条件付き再帰的設定に拡張する。 生成されたデータは連続的でリアルに見え、EdgeTechのような高解像度のソナーの取得速度よりも少なくとも2倍高速に生成される。 海底地形は、使用者が完全に制御することができる。 視覚的評価テストは、人間がシミュレーション画像と実像を区別できないことを示す。 さらに,実データがない場合には,R2D2-GANが生成する合成データによる学習から,自律認識システムが大きな恩恵を受ける可能性が示唆された。

In this paper we present a novel simulation technique for generating high quality images of any predefined resolution. This method can be used to synthesize sonar scans of size equivalent to those collected during a full-length mission, with across track resolutions of any chosen magnitude. In essence, our model extends Generative Adversarial Networks (GANs) based architecture into a conditional recursive setting, that facilitates the continuity of the generated images. The data produced is continuous, realistically-looking, and can also be generated at least two times faster than the real speed of acquisition for the sonars with higher resolutions, such as EdgeTech. The seabed topography can be fully controlled by the user. The visual assessment tests demonstrate that humans cannot distinguish the simulated images from real. Moreover, experimental results suggest that in the absence of real data the autonomous recognition systems can benefit greatly from training with the synthetic data, produced by the R2D2-GANs.
翻訳日:2022-12-27 04:04:37 公開日:2020-03-02
# randomnet: マルチモーダル学習のための完全自動ニューラルアーキテクチャ設計に向けて

RandomNet: Towards Fully Automatic Neural Architecture Design for Multimodal Learning ( http://arxiv.org/abs/2003.01181v1 )

ライセンス: Link先を確認
Stefano Alletto, Shenyang Huang, Vincent Francois-Lavet, Yohei Nakata and Guillaume Rabusseau(参考訳) ほぼ全てのニューラルアーキテクチャ探索法は、それが発見したモデル構造のパフォーマンス(すなわちテスト精度)の観点から評価される。 優れたAutoMLアプローチのための唯一の指標になるべきだろうか? そこで本稿では,AutoML問題の中核である,これらの手法を現実のシナリオに展開するために必要な人的介入の量を評価するための,一連の基準を提案する。 提案する評価チェックリストに基づいて,完全自動マルチモーダルニューラルネットワーク探索におけるランダム探索戦略の有効性について検討する。 従来の手作業による特徴抽出手法と比較すると,提案手法は人間の監督を最小限に抑えながら,大きな探索空間から各モダリティを選択する。 提案するランダム探索戦略がav-mnistデータセットの最先端に近く,完全に自動化された設計プロセスにおいて望ましい特性を満たしながら実現可能であることを示す。

Almost all neural architecture search methods are evaluated in terms of performance (i.e. test accuracy) of the model structures that it finds. Should it be the only metric for a good autoML approach? To examine aspects beyond performance, we propose a set of criteria aimed at evaluating the core of autoML problem: the amount of human intervention required to deploy these methods into real world scenarios. Based on our proposed evaluation checklist, we study the effectiveness of a random search strategy for fully automated multimodal neural architecture search. Compared to traditional methods that rely on manually crafted feature extractors, our method selects each modality from a large search space with minimal human supervision. We show that our proposed random search strategy performs close to the state of the art on the AV-MNIST dataset while meeting the desirable characteristics for a fully automated design process.
翻訳日:2022-12-27 04:04:24 公開日:2020-03-02
# 医用画像における視覚的質問応答に関する質問中心モデル

A Question-Centric Model for Visual Question Answering in Medical Imaging ( http://arxiv.org/abs/2003.08760v1 )

ライセンス: Link先を確認
Minh H. Vu, Tommy L\"ofstedt, Tufve Nyholm, Raphael Sznitman(参考訳) 深層学習法は様々な医用画像解析タスクの実行に極めて効果的であることが証明されている。 臨床ルーチンで使用される可能性があるため、透明性の欠如は数少ない弱点の1つであり、彼らの行動や障害モードに対する懸念を提起している。 モデル動作を推論するほとんどの研究は、予測の不確かさを推定し、入力画像空間におけるモデルサポートを視覚化する間接戦略に焦点を当てているが、その画像内容に関する予測モデルを明示的に照会する能力は、トレーニングされたモデルの振舞いを決定するより直接的な方法を提供する。 そこで本研究では,文字による質問によって画像に質問をすることができる,新たな視覚的質問応答手法を提案する。 様々な医用および自然画像データセットにおける実験により、画像と質問の特徴を新しい方法で融合させることにより、提案手法が現在の手法と同等以上の精度が得られることを示した。

Deep learning methods have proven extremely effective at performing a variety of medical image analysis tasks. With their potential use in clinical routine, their lack of transparency has however been one of their few weak points, raising concerns regarding their behavior and failure modes. While most research to infer model behavior has focused on indirect strategies that estimate prediction uncertainties and visualize model support in the input image space, the ability to explicitly query a prediction model regarding its image content offers a more direct way to determine the behavior of trained models. To this end, we present a novel Visual Question Answering approach that allows an image to be queried by means of a written question. Experiments on a variety of medical and natural image datasets show that by fusing image and question features in a novel way, the proposed approach achieves an equal or higher accuracy compared to current methods.
翻訳日:2022-12-27 04:03:59 公開日:2020-03-02
# Q-Learningによる適応構造ハイパーパラメータ構成

Adaptive Structural Hyper-Parameter Configuration by Q-Learning ( http://arxiv.org/abs/2003.00863v1 )

ライセンス: Link先を確認
Haotian Zhang, Jianyong Sun and Zongben Xu(参考訳) 進化的アルゴリズムのためのハイパーパラメータのチューニングは、計算知能において重要な問題である。 進化的アルゴリズムの性能は、その操作戦略設計だけでなく、ハイパーパラメータにも依存する。 超パラメータは2次元構造、数値、時間不変、時間不変に分類できる。 特に、既存の研究における構造的ハイパーパラメータは通常、時間不変パラメータや時間不変パラメータのハンドメイドスケジューリングのために前もって調整される。 本稿では,構造ハイパーパラメータのチューニングを強化学習問題としてモデル化する最初の試みを行い,cec 2018ウィナーアルゴリズムの計算資源割り当てを制御する構造ハイパーパラメータをq-learningによりチューニングする。 CEC 2018テスト関数の勝者アルゴリズムに対して実験結果が好適であった。

Tuning hyper-parameters for evolutionary algorithms is an important issue in computational intelligence. Performance of an evolutionary algorithm depends not only on its operation strategy design, but also on its hyper-parameters. Hyper-parameters can be categorized in two dimensions as structural/numerical and time-invariant/time-variant. Particularly, structural hyper-parameters in existing studies are usually tuned in advance for time-invariant parameters, or with hand-crafted scheduling for time-invariant parameters. In this paper, we make the first attempt to model the tuning of structural hyper-parameters as a reinforcement learning problem, and present to tune the structural hyper-parameter which controls computational resource allocation in the CEC 2018 winner algorithm by Q-learning. Experimental results show favorably against the winner algorithm on the CEC 2018 test functions.
翻訳日:2022-12-27 04:03:42 公開日:2020-03-02
# ランダムウォークを用いた進化的画像遷移と絵画

Evolutionary Image Transition and Painting Using Random Walks ( http://arxiv.org/abs/2003.01517v1 )

ライセンス: Link先を確認
Aneta Neumann, Bradley Alexander, Frank Neumann(参考訳) 本稿では,ランダムウォークアルゴリズムが進化的画像遷移にどのように役立つかを示す。 我々は,一様かつ偏りのあるランダムウォークに基づいて異なる突然変異演算子を設計し,ベースライン突然変異演算子との組み合わせが視覚効果や芸術的特徴の観点から興味深い画像遷移プロセスにどのようにつながるかを検討する。 特徴量に基づく解析を用いて, 異なる特徴量に対する進化的画像遷移挙動を調査し, 画像遷移過程中に構築した画像を評価する。 その後,偏りのあるランダムウォークアプローチの修正が進化的画像描画にどのように役立つかを検討する。 本稿では,ランダムウォークのバイアスに影響を与えるパラメータによってバイアス付きランダムウォークを制御し,異なる芸術的絵画効果を生み出す進化的イメージペインティング手法を提案する。

We present a study demonstrating how random walk algorithms can be used for evolutionary image transition. We design different mutation operators based on uniform and biased random walks and study how their combination with a baseline mutation operator can lead to interesting image transition processes in terms of visual effects and artistic features. Using feature-based analysis we investigate the evolutionary image transition behaviour with respect to different features and evaluate the images constructed during the image transition process. Afterwards, we investigate how modifications of our biased random walk approaches can be used for evolutionary image painting. We introduce an evolutionary image painting approach whose underlying biased random walk can be controlled by a parameter influencing the bias of the random walk and thereby creating different artistic painting effects.
翻訳日:2022-12-27 04:03:30 公開日:2020-03-02
# バックプロパゲーションを有するスパイクニューラルネットワークにおけるスパイキング空間の訓練

Explicitly Trained Spiking Sparsity in Spiking Neural Networks with Backpropagation ( http://arxiv.org/abs/2003.01250v1 )

ライセンス: Link先を確認
Jason M. Allred, Steven J. Spencer, Gopalakrishnan Srinivasan, Kaushik Roy(参考訳) スパイキングニューラルネットワーク(snn)は、スパースなイベント駆動計算によって生じる潜在的エネルギー効率のために研究されている。 近年の多くの研究は、不連続なニューロンスパイクに対する勾配の近似や発射イベントによって、ディープスパイキングニューラルネットワーク(SNN)の効果的なバックプロパゲーションを実証している。 これらのサーロゲート勾配スパイキングバックプロパゲーションアルゴリズムの有益な副作用は、スパイクが追加計算をトリガし、勾配計算において直接的に考慮される可能性があることである。 本稿では,損失関数のスパイク数と従来の誤差損失を明示的に含み,逆伝播学習アルゴリズムが重みパラメータを精度とスパイク間隔の両方で最適化する原因となることを示す。 オーバーパラメータ化ニューラルネットワークの既存の理論に支えられているように、効果的に等価な精度の解状態が多数存在する。 このようにして、この多目的最適化プロセスにおけるトレーニング中の2つの損失目標の適切な重み付けは、精度を損なうことなく、スパイキングスパーシティを改善することができる。 さらに, 模擬焼鈍による損失重み付け手法を探索し, トレーニング時間の増加とともに疎みの重み付け量を増加させる。 我々のCifar-10データセットの予備的な結果は、等精度でスパイク活性を最大70.1%減少させ、分類精度の1%のトレードオフを許せば、精度で訓練された同等のSNNと最大73.3%のスパイク活性を減少させる。

Spiking Neural Networks (SNNs) are being explored for their potential energy efficiency resulting from sparse, event-driven computations. Many recent works have demonstrated effective backpropagation for deep Spiking Neural Networks (SNNs) by approximating gradients over discontinuous neuron spikes or firing events. A beneficial side-effect of these surrogate gradient spiking backpropagation algorithms is that the spikes, which trigger additional computations, may now themselves be directly considered in the gradient calculations. We propose an explicit inclusion of spike counts in the loss function, along with a traditional error loss, causing the backpropagation learning algorithms to optimize weight parameters for both accuracy and spiking sparsity. As supported by existing theory of over-parameterized neural networks, there are many solution states with effectively equivalent accuracy. As such, appropriate weighting of the two loss goals during training in this multi-objective optimization process can yield an improvement in spiking sparsity without a significant loss of accuracy. We additionally explore a simulated annealing-inspired loss weighting technique to increase the weighting for sparsity as training time increases. Our preliminary results on the Cifar-10 dataset show up to 70.1% reduction in spiking activity with iso-accuracy compared to an equivalent SNN trained only for accuracy and up to 73.3% reduction in spiking activity if allowed a trade-off of 1% reduction in classification accuracy.
翻訳日:2022-12-27 04:03:14 公開日:2020-03-02
# Transformer++

Transformer++ ( http://arxiv.org/abs/2003.04974v1 )

ライセンス: Link先を確認
Prakhar Thapak and Prodip Hore(参考訳) 近年の注意機構の進歩により、機械翻訳タスクの繰り返しニューラルネットワークとその変種が置き換えられている。 注意機構を用いた変圧器は、シーケンスモデリングにおける最先端結果のみを達成する。 アテンション機構に基づくニューラルマシン翻訳は並列化可能であり、反復型ニューラルネットワークよりも文中の単語間の長距離依存性を扱う問題に対処する。 注目されている重要な概念の1つは、3つの行列、クエリ、キー、値を学ぶことである。 複数クエリ、キー、値行列は、Transformerでマルチヘッドと呼ばれる埋め込み次元の異なる部分空間に焦点を当てて同時に学習することができる。 我々は、単語間の依存関係は、単語の依存関係を直接モデル化するよりも、中間的な文脈でよりよく学習できると主張している。 これは、特定の依存関係の性質や、マルチヘッドのセルフアテンションを使用してグローバルにモデル化することが難しいパターンの欠如によって起こりうる。 本研究では,コンボリューションを用いたマルチヘッドのコンテキストから依存関係を学習する新しい手法を提案する。 この新たな多面的注意と伝統的な形式は、WMT 2014の英語-ドイツ語/英語-フランス語の翻訳タスクにおいて、Transformerよりも優れた結果をもたらす。 また、エンコーダのトレーニング中にposタグとner情報を学習するためのフレームワークを導入し、wmt 2014の英語対ドイツ語、44.6 bleu、wmt 2014の英語対フランス語翻訳タスクにおける既存のベストよりも優れた、既存のベストである32.1 bleuよりも優れた32.1 bleuの新たな最先端を達成する結果をさらに向上させる。 これをTransformer++と呼びます。

Recent advancements in attention mechanisms have replaced recurrent neural networks and its variants for machine translation tasks. Transformer using attention mechanism solely achieved state-of-the-art results in sequence modeling. Neural machine translation based on the attention mechanism is parallelizable and addresses the problem of handling long-range dependencies among words in sentences more effectively than recurrent neural networks. One of the key concepts in attention is to learn three matrices, query, key, and value, where global dependencies among words are learned through linearly projecting word embeddings through these matrices. Multiple query, key, value matrices can be learned simultaneously focusing on a different subspace of the embedded dimension, which is called multi-head in Transformer. We argue that certain dependencies among words could be learned better through an intermediate context than directly modeling word-word dependencies. This could happen due to the nature of certain dependencies or lack of patterns that lend them difficult to be modeled globally using multi-head self-attention. In this work, we propose a new way of learning dependencies through a context in multi-head using convolution. This new form of multi-head attention along with the traditional form achieves better results than Transformer on the WMT 2014 English-to-German and English-to-French translation tasks. We also introduce a framework to learn POS tagging and NER information during the training of encoder which further improves results achieving a new state-of-the-art of 32.1 BLEU, better than existing best by 1.4 BLEU, on the WMT 2014 English-to-German and 44.6 BLEU, better than existing best by 1.1 BLEU, on the WMT 2014 English-to-French translation tasks. We call this Transformer++.
翻訳日:2022-12-27 03:56:10 公開日:2020-03-02
# 対話応答提案のためのデュアルエンコーダモデルの解釈可能性に向けて

Toward Interpretability of Dual-Encoder Models for Dialogue Response Suggestions ( http://arxiv.org/abs/2003.04998v1 )

ライセンス: Link先を確認
Yitong Li, Dianqi Li, Sushant Prakash and Peng Wang(参考訳) この研究は、対話における応答提案のための一般的なデュアルエンコーダモデルの改善と解釈方法を示す。 本稿では,2つのエンコーダから抽出した単語レベル特徴の上位にアテンション機構を含む注意型二重エンコーダモデルを提案する。 両エンコーダモデルの解釈性を向上させるため,重要でない単語と所望のラベルの相互情報を最小限に抑える新たな正規化損失を設計し,重要でない単語が強調されずに重要な単語が強調されるようにした。 これはモデル解釈性だけでなく、モデルの精度をさらに向上させるのに役立つ。 本稿では,ニューラルネットワークを用いて相互情報を計算する近似法を提案する。 さらに、生単語埋め込みと最終符号化された文脈特徴の間に残層を追加することにより、単語レベルの解釈性はモデルの最終的な予測時に保持される。 提案モデルと既存の2つの公開データセット(PersonaとUbuntu)の対話応答タスクの手法を比較した。 実験では、Recall@1の精度と可視性の観点から、提案モデルの有効性を実証した。

This work shows how to improve and interpret the commonly used dual encoder model for response suggestion in dialogue. We present an attentive dual encoder model that includes an attention mechanism on top of the extracted word-level features from two encoders, one for context and one for label respectively. To improve the interpretability in the dual encoder models, we design a novel regularization loss to minimize the mutual information between unimportant words and desired labels, in addition to the original attention method, so that important words are emphasized while unimportant words are de-emphasized. This can help not only with model interpretability, but can also further improve model accuracy. We propose an approximation method that uses a neural network to calculate the mutual information. Furthermore, by adding a residual layer between raw word embeddings and the final encoded context feature, word-level interpretability is preserved at the final prediction of the model. We compare the proposed model with existing methods for the dialogue response task on two public datasets (Persona and Ubuntu). The experiments demonstrate the effectiveness of the proposed model in terms of better Recall@1 accuracy and visualized interpretability.
翻訳日:2022-12-27 03:55:42 公開日:2020-03-02
# Sparsity Meets Robustness:Feynman-Kac Formalism Principled Robust Deep Neural Netsのためのチャネルプルーニング

Sparsity Meets Robustness: Channel Pruning for the Feynman-Kac Formalism Principled Robust Deep Neural Nets ( http://arxiv.org/abs/2003.00631v1 )

ライセンス: Link先を確認
Thu Dinh, Bao Wang, Andrea L. Bertozzi, and Stanley J. Osher(参考訳) ディープニューラルネット(DNN)圧縮はモバイルデバイスへの適応に不可欠である。 自然に訓練されたDNNを圧縮するアルゴリズムは数多く存在するが、堅牢に訓練されたDNNのための効率的で安定した圧縮アルゴリズムの開発は依然として広く行われている。 本稿では、堅牢で正確なディープラーニングのための効率的なDNN圧縮アルゴリズムとスパースニューラルネットワークの共設計に焦点を当てる。 このような共同設計により、スパーシリティとロバストネスの両方を収容するという目標を前進させることができる。 この目的を念頭に置いて,緩和された拡張ラグランジアンアルゴリズムを活用して,構造化レベルと非構造化レベルの両方において,敵対的に訓練されたdnnの重みを損なう。 ファインマン・カックの形式主義は堅牢でスパースなDNNを基本とし、CIFAR10分類のための敵に訓練されたResNet20のチャネル間隔を少なくとも2倍にし、自然な精度を8.69$\%改善し、ベンチマーク20$でIFGSM攻撃を5.42$\%改善できる。 コードは \url{https://github.com/baowangmath/rvsm-rgsm-admm} で入手できる。

Deep neural nets (DNNs) compression is crucial for adaptation to mobile devices. Though many successful algorithms exist to compress naturally trained DNNs, developing efficient and stable compression algorithms for robustly trained DNNs remains widely open. In this paper, we focus on a co-design of efficient DNN compression algorithms and sparse neural architectures for robust and accurate deep learning. Such a co-design enables us to advance the goal of accommodating both sparsity and robustness. With this objective in mind, we leverage the relaxed augmented Lagrangian based algorithms to prune the weights of adversarially trained DNNs, at both structured and unstructured levels. Using a Feynman-Kac formalism principled robust and sparse DNNs, we can at least double the channel sparsity of the adversarially trained ResNet20 for CIFAR10 classification, meanwhile, improve the natural accuracy by $8.69$\% and the robust accuracy under the benchmark $20$ iterations of IFGSM attack by $5.42$\%. The code is available at \url{https://github.com/BaoWangMath/rvsm-rgsm-admm}.
翻訳日:2022-12-27 03:55:24 公開日:2020-03-02
# バッチ定常分布推定

Batch Stationary Distribution Estimation ( http://arxiv.org/abs/2003.00722v1 )

ライセンス: Link先を確認
Junfeng Wen, Bo Dai, Lihong Li, Dale Schuurmans(参考訳) サンプル化された遷移の集合が与えられたエルゴードマルコフ鎖の定常分布を近似する問題を考える。 古典的なシミュレーションに基づくアプローチは、十分な長さの軌道が定常サンプリングに近似するように、基礎となるプロセスへのアクセスを前提としている。 代わりに、固定されたトランジションセットが事前に収集された代替設定を、別々に、おそらく未知の手順で検討する。 目標はまだ定常分布の性質を推定することであるが、基礎となるシステムへの追加アクセスは行わない。 与えられたデータに対する補正比関数の復元に基づく一貫した推定器を提案する。 特に,一般条件下での確率的一貫した推定を行う変分電力法(VPM)を開発した。 異なるサブフィールドからの既存アプローチを統一することに加え、VPMは待ち行列、確率微分方程式、後処理MCMC、政治外評価など、様々な問題において、はるかに優れた推定値が得られることも見出した。

We consider the problem of approximating the stationary distribution of an ergodic Markov chain given a set of sampled transitions. Classical simulation-based approaches assume access to the underlying process so that trajectories of sufficient length can be gathered to approximate stationary sampling. Instead, we consider an alternative setting where a fixed set of transitions has been collected beforehand, by a separate, possibly unknown procedure. The goal is still to estimate properties of the stationary distribution, but without additional access to the underlying system. We propose a consistent estimator that is based on recovering a correction ratio function over the given data. In particular, we develop a variational power method (VPM) that provides provably consistent estimates under general conditions. In addition to unifying a number of existing approaches from different subfields, we also find that VPM yields significantly better estimates across a range of problems, including queueing, stochastic differential equations, post-processing MCMC, and off-policy evaluation.
翻訳日:2022-12-27 03:54:57 公開日:2020-03-02
# EvoNet: 動的グラフの進化を予測するニューラルネットワーク

EvoNet: A Neural Network for Predicting the Evolution of Dynamic Graphs ( http://arxiv.org/abs/2003.00842v1 )

ライセンス: Link先を確認
Changmin Wu, Giannis Nikolentzos, Michalis Vazirgiannis(参考訳) 近年,グラフのような構造化データのためのニューラルネットワークが広く研究されている。 これまで、研究活動の大部分は静的グラフに重点を置いてきた。 しかし、ほとんどの実世界のネットワークは、トポロジーが時間とともに変化する傾向があるため、動的である。 動的グラフの進化を予測することは、グラフマイニングの領域において重要な課題である。 現実的な重要性にもかかわらず、この課題は、主に挑戦的な性質のために、これまで深く調査されていない。 本稿では,動的グラフの進化を予測するモデルを提案する。 具体的には、動的グラフの時間的進化パターンを捉えるために、グラフニューラルネットワークと繰り返しアーキテクチャを使用します。 次に、次のステップでグラフのトポロジーを予測し、そのトポロジーに対応するグラフインスタンスを構成する生成モデルを用いる。 提案手法は,ネットワークの進化にともなう複数の人工データセットと実世界のデータセットを用いて評価する。 その結果,提案モデルの有効性が示された。

Neural networks for structured data like graphs have been studied extensively in recent years. To date, the bulk of research activity has focused mainly on static graphs. However, most real-world networks are dynamic since their topology tends to change over time. Predicting the evolution of dynamic graphs is a task of high significance in the area of graph mining. Despite its practical importance, the task has not been explored in depth so far, mainly due to its challenging nature. In this paper, we propose a model that predicts the evolution of dynamic graphs. Specifically, we use a graph neural network along with a recurrent architecture to capture the temporal evolution patterns of dynamic graphs. Then, we employ a generative model which predicts the topology of the graph at the next time step and constructs a graph instance that corresponds to that topology. We evaluate the proposed model on several artificial datasets following common network evolving dynamics, as well as on real-world datasets. Results demonstrate the effectiveness of the proposed model.
翻訳日:2022-12-27 03:54:41 公開日:2020-03-02
# プライバシ保証による高忠実度合成データセットの生成

Generating Higher-Fidelity Synthetic Datasets with Privacy Guarantees ( http://arxiv.org/abs/2003.00997v1 )

ライセンス: Link先を確認
Aleksei Triastcyn, Boi Faltings(参考訳) 本稿では,データアノテーションやインスペクションといった一般的な機械学習開発タスクにおいて,実データをサンプルで置換することで,ユーザのプライバシを高める問題を検討する。 ベイズ微分プライバシーを厳密な理論保証を実現する手段として利用し、より優れたプライバシー利用トレードオフを提供する。 本手法は,先行研究に比べて忠実度の高いサンプルを生成できることを実証し,(1)微妙なデータ誤りやバイアスの検出を可能にし,(2)人工サンプルで直接トレーニングする場合の精度を高めることで,実際のデータラベリングの必要性を低減できることを示した。

This paper considers the problem of enhancing user privacy in common machine learning development tasks, such as data annotation and inspection, by substituting the real data with samples form a generative adversarial network. We propose employing Bayesian differential privacy as the means to achieve a rigorous theoretical guarantee while providing a better privacy-utility trade-off. We demonstrate experimentally that our approach produces higher-fidelity samples, compared to prior work, allowing to (1) detect more subtle data errors and biases, and (2) reduce the need for real data labelling by achieving high accuracy when training directly on artificial samples.
翻訳日:2022-12-27 03:54:13 公開日:2020-03-02