このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20200603となっている論文です。

PDF登録状況(公開日: 20200603)

TitleAuthorsAbstract論文公表日・翻訳日
# 超強光子相互作用の理論的手法

Theoretical methods for ultrastrong light-matter interactions ( http://arxiv.org/abs/2001.08715v2 )

ライセンス: Link先を確認
Alexandre Le Boit\'e(参考訳) 本稿では,光間相互作用の強度が光子周波数に匹敵する超強結合状態における空洞量子電磁力学を理解するために,過去10年間に開発された理論的手法を概説する。 基本的な量子光学効果が豊富な現象論をもたらすことに加えて、この理論は重要な理論的課題を提起する。 最も重要なことの1つは、光-物質相互作用ハミルトニアンの全ての共鳴項を無視する回転波近似の分解である。 したがって、量子光学理論の枠組みの大部分は、この状態における全ての相互作用項を正確に説明するために再検討される必要がある。 本稿では,地盤特性の解析的推定からマスター方程式の固有導出,光検出信号の計算まで,最近の進歩の概要について概説する。 理論の各側面について、この方法の基本原理は量子ラビやスピンボソンモデルのようなパラダイムモデルに説明されている。 この精神において、論文の大部分は、半導体マイクロキャビティや超伝導回路などの超強結合が到達した様々な実験プラットフォームに関する効果的なモデルに特化している。 これらのモデルの妥当性は、超強結合体制におけるゲージ不変性に関する最近の議論を扱った論文の最後の部分で議論されている。

This article reviews theoretical methods developed in the last decade to understand cavity quantum electrodynamics in the ultrastrong-coupling regime, where the strength of the light-matter interaction becomes comparable to the photon frequency. Along with profound modifications of fundamental quantum optical effects giving rise to a rich phenomenology, this regime introduces significant theoretical challenges. One of the most important is the break-down of the rotating-wave approximation which neglects all non-resonant terms in light-matter interaction Hamiltonians. Consequently, a large part of the quantum optical theoretical framework has to be revisited in order to accurately account for all interaction terms in this regime. We give in this article a broad overview of the recent progress, ranging from analytical estimate of ground-state properties to proper derivations of master equations and computation of photodetection signals. For each aspect of the theory, the basic principles of the methods are illustrated on paradigmatic models such as quantum Rabi and spin-boson models. In this spirit, most of the article is devoted to effective models, relevant for the various experimental platforms in which the ultrastrong coupling has been reached, such as semiconductor microcavities and superconducting circuits. The validity of these models is discussed in the last part of the article, where we address recent debates on fundamental issues related to gauge invariance in the ultrastrong-coupling regime.
翻訳日:2023-06-06 04:47:50 公開日:2020-06-03
# 古典光学におけるマルチパス波動粒子双対

Multipath Wave-Particle Duality in Classical Optics ( http://arxiv.org/abs/2003.04585v2 )

ライセンス: Link先を確認
Bibhash Paul, Sammi Kamal, Tabish Qureshi(参考訳) 古典光学では、2ビームの光干渉による干渉の可視性は、2つのビームの光コヒーレンスと関連していることが知られている。 この相互コヒーレンスを用いて波動粒子双対関係を導出することができる。 古典光学における波動粒子双対性の問題は、より一般的なマルチパス干渉の文脈で解析される。 干渉の可視性と経路識別性の新たな定義が導入され、マルチパス干渉の双対関係が導かれる。 可視性は新しい多点光コヒーレンス関数と関連があることが示されている。

It is well known that in classical optics, the visibility of interference, in a two-beam light interference, is related to the optical coherence of the two beams. A wave-particle duality relation can be derived using this mutual coherence. The issue of wave-particle duality in classical optics is analyzed here, in the more general context of multipath interference. New definitions of interference visibility and path distinguishability have been introduced, which lead to a duality relation for multipath interference. The visibility is shown to be related to a new multi-point optical coherence function.
翻訳日:2023-05-30 01:15:57 公開日:2020-06-03
# 量子可読化のためのフェムトテスラ直流SQUID設計

A femto-Tesla DC SQUID design for quantum-ready readouts ( http://arxiv.org/abs/2003.07702v2 )

ライセンス: Link先を確認
Ilya Sochnikov, Donovan Davino, Beena Kalisky(参考訳) 直流超電導QUantum Interference Devices (SQUID) の現在の用途には、量子材料の物性を調べるための量子ビット読み取りとセンサーがある。 我々は,femto-teslaの範囲において最先端の感度を持つ,特定の読み出し要求に合わせて容易に調整可能な,かなりユニークなグラディメトリック・ニオブ・イカデザインを提案する。 このセンサーは、精密に最適化された入力コイルを備えた分数イカの次世代であり、寄生共鳴やその他の有害な効果を抑制するためのあらゆる手段の組み合わせである。 提案手法は,良好な撮像核および波長可変プローブ用ピックアップループの実用的有用性と,望ましくないインダクタンス低減のための分数化手法を組み合わせたものである。 さらに,これらの平面センサの小型次元をモデル化した。 これらの特徴は、材料研究と、効率的な診断と量子デバイス読み取りのための低温走査型量子イメージング装置の一部として、少量の磁場の検出に高い関連性を持つ。 この原稿は、新しいフレキシブルコンパクトDC SQUID設計の導入とともに、DC SQUID最適化に関する潜在的な一般的な誤解を明らかにすることで、量子コンピューティング技術に取り組む科学者や技術者に恩恵を与える。

Among some of the current uses of the DC Superconducting QUantum Interference Devices (SQUIDs) are qubit-readouts and sensors for probing properties of quantum materials. We present a rather unique gradiometric niobium SQUID design with state-of-the-art sensitivity in the femto-Tesla range which can be easily tuned to specific readout requirements. The sensor is a next generation of the fractional SQUIDs with tightly optimized input coil and a combination of all measures known for restraining parasitic resonances and other detrimental effects. Our design combines the practical usefulness of well-defined pickup loops for superior imaging kernel and tunable-probing applications with the fractionalization approach to reduce undesired inductances. In addition, our modeling predicts small dimensions for these planar sensors. These features make them of high relevance for material studies and for detection of magnetic fields in small volumes, e.g. as part of a cryogenic scanning quantum imaging apparatus for efficient diagnostics and quantum device readouts. This manuscript will benefit scientists and engineers working on quantum computing technologies by clarifying potential general misconceptions about DC SQUID optimization alongside the introduction of the novel flexible compact DC SQUID design.
翻訳日:2023-05-28 22:21:17 公開日:2020-06-03
# 調節可能な二次結合から生じる原子の自己組織化

Atomic self-organization emerging from tunable quadrature coupling ( http://arxiv.org/abs/2004.03346v4 )

ライセンス: Link先を確認
Jingtao Fan, Gang Chen, Suotang Jia(参考訳) 最近の放散誘起構造不安定性の実験的観察は、定常力学と非定常力学の競合機構を探求する新たな機会となる(Science 366, 1496 (2019))。 この研究において、空洞場の2つの直交二次体は、ホウ素-アインシュタイン凝縮(BEC)の2つの異なるゼーマン状態に結合する。 本稿では,becの2つの密度波自由度をキャビティ場の2つの二次に結合する新しいスキームを提案する。 従来の研究とは大きく異なるため、我々のモデルにおける光物質と物質とのカップリングには、調節可能なカップリング角が与えられる。 均一および自己組織化相とは別に,空洞散逸により動的に不安定な状態が生じる。 興味深いことに、散逸は特定の結合角を定義し、そこで不安定が消える。 さらに、この臨界結合角では、2つの原子密度波のうちの1つが互いに影響を与えずに独立に励起することができる。 また,本システムは低励起モード近似を用いて3レベルモデルにマッピング可能であることも確認した。 しかしながら、この近似の有効性は、特定の系パラメータの散逸特性によって破られ、低励起モード近似が散逸に敏感な物理を捉えるには不十分であることを示している。 我々の研究は、空洞-量子-電気力学系の量子シミュレーションツールボックスを強化し、光-物質相互作用のフロンティアを広げる。

The recent experimental observation of dissipation-induced structural instability provides new opportunities for exploring the competition mechanism between stationary and nonstationary dynamics [Science 366, 1496 (2019)]. In that study, two orthogonal quadratures of cavity field are coupled to two different Zeeman states of a spinor Bose-Einstein condensate (BEC). Here we propose a novel scheme to couple two density-wave degrees of freedom of a BEC to two quadratures of the cavity field. Being drastically different from previous studies, the light-matter quadratures coupling in our model is endowed with a tunable coupling angle. Apart from the uniform and self-organized phases, we unravel a dynamically unstable state induced by the cavity dissipation. Interestingly, the dissipation defines a particular coupling angle, across which the instabilities disappear. Moreover, at this critical coupling angle, one of the two atomic density waves can be independently excited without affecting one another. It is also found that our system can be mapped into a reduced three-level model under the commonly used low-excitation-mode approximation. However, the effectiveness of this approximation is shown to be broken by the dissipation nature for some special system parameters, hinting that the low-excitation-mode approximation is insufficient in capturing some dissipation-sensitive physics. Our work enriches the quantum simulation toolbox in the cavity-quantum-electrodynamics system and broadens the frontiers of light-matter interaction.
翻訳日:2023-05-26 04:08:45 公開日:2020-06-03
# 二重量子ドット回路QEDセットアップにおける創発$\mathcal{PT}$対称性

Emergent $\mathcal{PT}$ symmetry in a double-quantum-dot circuit QED set-up ( http://arxiv.org/abs/2004.07541v2 )

ライセンス: Link先を確認
Archak Purkayastha, Manas Kulkarni, and Yogesh N. Joglekar(参考訳) 過去5年間で、効果的なパリティ時間(\mathcal{PT}$)対称性を持つオープン古典的および量子系は、レーザー、センシング、非相互デバイスの発展を大いに約束している。 しかし、そのような実効的$\mathcal{pt}$-symmetric non-hermitian model がエルミート量子力学からどのように出現するかは、よく分かっていない。 ここで、完全エルミート微視的ハミルトニアン記述から始めると、非エルミートハミルトニアンは二重量子ドット回路qed (dqd-circuit qed) 設定において自然に出現し、$\mathcal{pt}$-symmetric 点に制御的に調整できる。 この効果的なハミルトニアンは、2つの結合回路QEDキャビティと電圧バイアスDQDのダイナミックスを管理する。 また, この解析により, $\mathcal{pt}$ 対称系に対する量子揺らぎの影響も明らかになった。 $\mathcal{PT}$-transition は、キャビティ可観測体の力学と入力出力実験の両方で観測される。 この集合における$\mathcal{pt}$-transition の単純な応用として、損失による増幅と発振の促進が結合したキャビティで観察できることを示した。 従来の2つの局所リンドブラッド方程式との比較により,後者の有用性と限界を明らかにした。 我々の結果は、量子状態における利得媒質を持つ潜在的にスケーラブルな非エルミタン系のオンチップ実現と、その量子技術への応用の道を開くものである。

Open classical and quantum systems with effective parity-time ($\mathcal{PT}$) symmetry, over the past five years, have shown tremendous promise for advances in lasers, sensing, and non-reciprocal devices. And yet, how such effective $\mathcal{PT}$-symmetric non-Hermitian models emerge out of Hermitian quantum mechanics is not well understood. Here, starting from a fully Hermitian microscopic Hamiltonian description, we show that a non-Hermitian Hamiltonian emerges naturally in a double-quantum-dot-circuit-QED (DQD-circuit QED) set-up, which can be controllably tuned to the $\mathcal{PT}$-symmetric point. This effective Hamiltonian governs the dynamics of two coupled circuit-QED cavities with a voltage-biased DQD in one of them. Our analysis also reveals the effect of quantum fluctuations on the $\mathcal{PT}$ symmetric system. The $\mathcal{PT}$-transition is, then, observed both in the dynamics of cavity observables as well as via an input-output experiment. As a simple application of the $\mathcal{PT}$-transition in this set-up, we show that loss-induced enhancement of amplification and lasing can be observed in the coupled cavities. By comparing our results with two conventional local Lindblad equations, we demonstrate the utility and limitations of the latter. Our results pave the way for an on-chip realization of a potentially scalable non-Hermitian system with a gain medium in quantum regime, as well as its potential applications for quantum technology.
翻訳日:2023-05-23 06:59:05 公開日:2020-06-03
# スピノルボース・アインシュタイン凝縮の2次相転移と呼吸ダイナミクスに対する多体効果

Many-body effects on second-order phase transitions in spinor Bose-Einstein condensates and breathing dynamics ( http://arxiv.org/abs/2004.09303v2 )

ライセンス: Link先を確認
K. M. Mittal, S. I. Mistakidis, P. G. Kevrekidis and P. Schmelcher(参考訳) 調和に閉じ込められたスピン-1 ボース気体の基底状態に生じる2階量子相転移の相関効果は、ゼーマン項の変動とともに、トラップ周波数を焼成することによって引き起こされる呼吸ダイナミクスとともに明らかとなる。 強磁性と反強磁性スピンスピンスピン相互作用の両方の粒子間相関の存在下で、関連する磁性相の境界が変化していることが判明した。 最も重要な点は, 反強磁性相と破断軸対称性相の相関誘起収縮が, 単一スピン成分に偏極したボソンの基底状態が有利であることを示唆するものである。 スピノールガスの動的応答に目を向けると、その呼吸周波数は系パラメータとは独立であり、相関関係は参加成分の1体密度におけるフィラメントパターンの形成に繋がることが示された。 フィラメントの数はスピン非依存的な相互作用強度の増加やより小さな粒子数の増加のために大きい。 各フィラメントはコヒーレンスを保ち、抗コヒーレンス作用を示す一方、異なるフィラメントはコヒーレンスの著しい損失を示し、2体相関を示す。 興味深いことに、最初の破断軸対称性フェーズでは、線形ゼーマン項またはクエンチ振幅を介してチューニング可能なスピンフリップダイナミクスが拡張されている。

We unravel the correlation effects of the second-order quantum phase transitions emerging on the ground state of a harmonically trapped spin-1 Bose gas, upon varying the involved Zeeman terms, as well as its breathing dynamics triggered by quenching the trapping frequency. It is found that the boundaries of the associated magnetic phases are altered in the presence of interparticle correlations for both ferromagnetic and anti-ferromagnetic spin-spin interactions, an effect which becomes more prominent in the few-body scenario. Most importantly, we unveil a correlation-induced shrinking of the anti-ferromagnetic and broken-axisymmetry phases implying that ground states with bosons polarized in a single spin-component are favored. Turning to the dynamical response of the spinor gas it is shown that its breathing frequency is independent of the system parameters while correlations lead to the formation of filamentary patterns in the one-body density of the participating components. The number of filaments is larger for increasing spin-independent interaction strengths or for smaller particle numbers. Each filament maintains its coherence and exhibits an anti-correlated behavior while distinct filaments show significant losses of coherence and are two-body correlated. Interestingly, we demonstrate that for an initial broken-axisymmetry phase an enhanced spin-flip dynamics takes place which can be tuned either via the linear Zeeman term or the quench amplitude.
翻訳日:2023-05-23 04:29:04 公開日:2020-06-03
# ボゴリボフ励起の干渉と光の同軸流体における超流動性の証拠への影響

Interferences between Bogoliubov excitations and their impact on the evidence of superfluidity in a paraxial fluid of light ( http://arxiv.org/abs/2005.14328v2 )

ライセンス: Link先を確認
Quentin Fontaine, Pierre-Elie Larr\'e, Giovanni Lerario, Tom Bienaim\'e, Simon Pigeon, Daniele Faccio, Iacopo Carusotto, Elisabeth Giacobino, Alberto Bramati, and Quentin Glorieux(参考訳) 光の同軸流体は、集団励起の量子挙動の研究のための原子ボース・アインシュタイン凝縮や超流動液体の代替プラットフォームである。 この方向の重要なステップは、最近2つの実験で示されたボゴリューボフ分散関係の精密な特徴づけである。 しかし、集合的な超流動の挙動の明確なサインとなるフォノン励起間の干渉は、これまで観測されていない。 ここでは, 解析的, 数値的, 実験的にフォノン相速度を探索することにより, 対向伝播するボゴリューボフ励起間の干渉の存在を観測し, 分散関係の測定に重要な影響を示す。 これらの結果は光超流動のキーサインの証拠であり、光子を用いた量子シミュレーションのための新しい評価ツールを提供する。

Paraxial fluids of light represent an alternative platform to atomic Bose-Einstein condensates and superfluid liquids for the study of the quantum behaviour of collective excitations. A key step in this direction is the precise characterization of the Bogoliubov dispersion relation, as recently shown in two experiments. However, the predicted interferences between the phonon excitations that would be a clear signature of the collective superfluid behaviour have not been observed to date. Here, by analytically, numerically, and experimentally exploring the phonon phase-velocity, we observe the presence of interferences between counter-propagating Bogoliubov excitations and demonstrate their critical impact on the measurement of the dispersion relation. These results are evidence of a key signature of light superfluidity and provide a novel characterization tool for quantum simulations with photons.
翻訳日:2023-05-18 02:41:07 公開日:2020-06-03
# 量子コインスキームの実装

Implementing a Quantum Coin Scheme ( http://arxiv.org/abs/2006.02149v1 )

ライセンス: Link先を確認
Hazel Murray, Jerry Horgan, Joao F. Santos, David Malone, Harun Siljak(参考訳) 量子コンピューティングは、現在の暗号システムを破る力を持ち、オンライン銀行、ショッピング、データストレージ、通信を破壊している。 量子コンピューティングはまた、より強い耐性技術をサポートする力を持っている。 本稿では,量子コンピューティングの能力を利用するDmitry Gavinsky氏が作成したデジタルキャッシュ方式について述べる。 我々はこのスキームを実装する方法を設定することで貢献する。 量子コインの生成と検証の両方のために、代数的ステップを計算ステップに変換する。 これの一環として,古典ビットに格納された情報を量子ビットに格納された情報に変換する手法について述べる。

Quantum computing has the power to break current cryptographic systems, disrupting online banking, shopping, data storage and communications. Quantum computing also has the power to support stronger more resistant technologies. In this paper, we describe a digital cash scheme created by Dmitry Gavinsky, which utilises the capability of quantum computing. We contribute by setting out the methods for implementing this scheme. For both the creation and verification of quantum coins we convert the algebraic steps into computing steps. As part of this, we describe the methods used to convert information stored on classical bits to information stored on quantum bits.
翻訳日:2023-05-17 06:52:08 公開日:2020-06-03
# AiR - 大気汚染を可視化する拡張現実アプリケーション

AiR -- An Augmented Reality Application for Visualizing Air Pollution ( http://arxiv.org/abs/2006.02136v1 )

ライセンス: Link先を確認
Noble Saji Mathews, Sridhar Chimalakonda, Suresh Jain(参考訳) 空気質 (air quality) とは、呼吸する空気中の様々な汚染物質の濃度を表す用語である。 空気の質は世界中で急速に低下しており、大きな懸念の源となっている。 世界中の政府は大気汚染を減らすために様々な対策を講じている。 市民に環境汚染に関する意識をもたらすことは、政府が提案するプログラムが市民の支援を必要としているため、大気汚染の抑制において重要な役割を担っている。 大気質に関する情報は、中央汚染管理委員会(cpcb)のような複数のポータルに存在しているが、これは公衆がアクセス可能な空気質指標を提供する。 しかし、一般大衆の訪問は少ない。 個人の居住する場所での空気質の可視化は、人々の意識を高めるのに役立つだろう。 この視覚化は拡張現実技術を使ってレンダリングできる。 インドにおけるAndroidベースのモバイルデバイスの普及と,空気品質の可視化の重要性を踏まえて,AndroidベースのモバイルアプリケーションとしてAiRを提案する。 AiRは、ユーザのGPSによって検出された局部性、またはユーザの選択した局部性においてCPCBが測定した空気質を考慮し、局部性$(PM_1{}_0,PM_2{}__)に存在する様々な空気汚染物質を可視化する。 {}_5, NO_2, SO_2, CO, O_3 \& NH_3)$ でユーザ周囲に表示する。 AiRはまた、異なる汚染物質、ソース、およびそれらが健康に与える影響について、対話的に認識する。

Air quality is a term used to describe the concentration levels of various pollutants in the air we breathe. The air quality, which is degrading rapidly across the globe, has been a source of great concern. Across the globe, governments are taking various measures to reduce air pollution. Bringing awareness about environmental pollution among the public plays a major role in controlling air pollution, as the programs proposed by governments require the support of the public. Though information on air quality is present on multiple portals such as the Central Pollution Control Board (CPCB), which provides Air Quality Index that could be accessed by the public. However, such portals are scarcely visited by the general public. Visualizing air quality in the location where an individual resides could help in bringing awareness among the public. This visualization could be rendered using Augmented Reality techniques. Considering the widespread usage of Android based mobile devices in India, and the importance of air quality visualization, we present AiR, as an Android based mobile application. AiR considers the air quality measured by CPCB, in a locality that is detected by the user's GPS or in a locality of user's choice, and visualizes various air pollutants present in the locality $(PM_1{}_0, PM_2{}_.{}_5, NO_2, SO_2, CO, O_3 \& NH_3)$ and displays them in the user's surroundings. AiR also creates awareness in an interactive manner about the different pollutants, sources, and their impacts on health.
翻訳日:2023-05-17 06:51:59 公開日:2020-06-03
# 無雑音減衰増幅によるマルチモードCV-QKD

Multi-mode CV-QKD with Noiseless Attenuation and Amplification ( http://arxiv.org/abs/2006.02094v1 )

ライセンス: Link先を確認
Mingjian He, Robert Malaney, Benjamin Burnett(参考訳) 本研究では,衛星間チャネル上でのマルチモード連続可変(cv)量子鍵分布(qkd)の観点から,無ノイズ減衰と無ノイズ増幅について検討する。 送信機と受信機にノイズレス減衰とノイズレス増幅をそれぞれ適用した改良型マルチモードCV-QKDプロトコルを提案する。 その結果,単モードCV-QKDと一致して,受信機に印加した場合のノイズレス増幅動作により,マルチモードCV-QKDの伝送距離とチャネルノイズ耐性が増大することがわかった。 単モードCV-QKDとは異なり、マルチモードCV-QKDでは、ノイズレス増幅によるキーレート改善は、送信機にノイズレス減衰を加えることでさらに強化することができる。

In this work we study the use of noiseless attenuation and noiseless amplification, in terms of multi-mode Continuous-Variable (CV) Quantum Key Distribution (QKD) over satellite-to-ground channels. We propose an improved multi-mode CV-QKD protocol where noiseless attenuation and noiseless amplification operations are applied at the transmitter and the receiver, respectively. Our results show that consistent with single-mode CV-QKD, the noiseless amplification operation, when applied at the receiver, can increase the transmission distance and the channel noise tolerance of multi-mode CV-QKD. Different from single-mode CV-QKD, in multi-mode CV-QKD the key rate improvement offered by noiseless amplification can be further enhanced by adding noiseless attenuation at the transmitter.
翻訳日:2023-05-17 06:51:34 公開日:2020-06-03
# 磁気共鳴による選択的ミクロ組織サイズの非侵襲的定量的イメージング

Non-invasive quantitative imaging of selective microstructure-sizes with magnetic resonance ( http://arxiv.org/abs/2006.02035v1 )

ライセンス: Link先を確認
Milena Capiglioni, Analia Zwick, Pablo Jimenez, Gonzalo A. Alvarez(参考訳) 非侵襲的イメージングにより生体組織の信頼性と定量的な微細構造情報を抽出することは、疾患のメカニズムを理解し、病理の早期診断を可能にする上で、顕著な課題である。 磁気共鳴イメージングは、この目標を追求するために好まれる技術であるが、それでも、in-vivo研究における関連する微細構造の詳細よりもはるかに大きなサイズの解像度を提供する。 組織内の分子拡散のモニタリングは、解像度の限界を克服するための有望なメカニズムである。 しかし、詳細な微細構造情報を得るには、長い測定時間を示す数枚の画像の取得が必要である。 この課題を解決するためのステップとして,磁場勾配を持つ核スピンの動的制御を適宜行うことにより,2つの測定値のみを必要とする手法と,選択的なミクロ構造サイズの画像を生成するための原理実証実験について述べる。 我々は,一般的に用いられる減衰速度よりも磁化"デカイシフト"を利用したスピンエコー配列の微細構造フィルタを設計する。 このアプローチの成果は、現在の技術で実現可能な定量的画像であり、生体組織の組成を定義する微細構造パラメータに基づく豊富な診断情報の解明に向けて前進する。

Extracting reliable and quantitative microstructure information of living tissue by non-invasive imaging is an outstanding challenge for understanding disease mechanisms and allowing early stage diagnosis of pathologies. Magnetic Resonance Imaging is the favorite technique to pursue this goal, but still provides resolution of sizes much larger than the relevant microstructure details on in-vivo studies. Monitoring molecular diffusion within tissues, is a promising mechanism to overcome the resolution limits. However, obtaining detailed microstructure information requires the acquisition of tens of images imposing long measurement times and results to be impractical for in-vivo studies. As a step towards solving this outstanding problem, we here report on a method that only requires two measurements and its proof-of-principle experiments to produce images of selective microstructure sizes by suitable dynamical control of nuclear spins with magnetic field gradients. We design microstructure-size filters with spin-echo sequences that exploit magnetization "decay-shifts" rather than the commonly used decay-rates. The outcomes of this approach are quantitative images that can be performed with current technologies, and advance towards unravelling a wealth of diagnostic information based on microstructure parameters that define the composition of biological tissues.
翻訳日:2023-05-17 06:50:54 公開日:2020-06-03
# チップ上の自己ポンダモーティブ電位による荷電粒子誘導とビーム分割

Charged particle guiding and beam splitting with auto-ponderomotive potentials on a chip ( http://arxiv.org/abs/2006.02381v1 )

ライセンス: Link先を確認
Robert Zimmermann (1), Michael Seidling (1), Peter Hommelhoff (1) ((1) Department Physik, Friedrich-Alexander University Erlangen-Nuremberg (FAU), Erlangen, Germany)(参考訳) 静電光学による荷電粒子ビームの誘導と操作について, ポールトラップに類似した原理に基づいて報告する。 平面基板上に作製された数百個の電極を静電圧で供給し, 荷電粒子の運動を考慮に入れた。 電位の形状と強度は電極のレイアウトと印加電圧によって局所的に調整することができ、精密に設計された有効電位内で荷電粒子ビームを制御できる。 我々は,電子とイオンの多種多様なエネルギー(20から5000ev)と質量(5e-4から131原子質量単位)と電子ビームの分解を,より複雑なビーム操作のための概念実証として示す。 異なる質量を持つ荷電粒子の同時閉じ込めが可能であり、keV系でエネルギーを持つ電子の誘導や、従来の電気力学のポールトラップでは不可能な、高度にカスタマイズ可能なポテンシャルランドスケープの作成が可能である。

We report guiding and manipulation of charged particle beams by means of electrostatic optics based on a principle similar to the electrodynamic Paul trap. We use hundreds of electrodes fabricated on planar substrates and supplied with static voltages to create a ponderomotive potential for charged particles in motion. Shape and strength of the potential can be locally tailored by the electrodes' layout and the applied voltages, enabling the control of charged particle beams within precisely engineered effective potentials. We demonstrate guiding of electrons and ions for a large range of energies (from 20 to 5000 eV) and masses (5E-4 to 131 atomic mass units) as well as electron beam splitting as a proof-of-concept for more complex beam manipulation. Simultaneous confinement of charged particles with different masses is possible, as well as guiding of electrons with energies in the keV regime, and the creation of highly customizable potential landscapes, which is all hard to impossible with conventional electrodynamic Paul traps.
翻訳日:2023-05-17 06:42:08 公開日:2020-06-03
# オープン量子系は時間とともに崩壊する

Open quantum systems decay across time ( http://arxiv.org/abs/2006.02358v1 )

ライセンス: Link先を確認
Juliane Klatt and Chahan Michael Kropf and Stefan Yoshi Buhmann(参考訳) 開量子系の崩壊の説明は、ほとんど常に、引くことのできるいくつかの近似を必要とする。 ここで、我々はまず、半群マルコビアン性、線形応答理論、ウィグナー-ワイスコップ、回転波近似といった、最も広く使われているいくつかの近似の、意味、領域、および相反について再検討する。 第二に、環境に線形に結合した開量子系に対する有効時間依存減衰理論とそれに対応する一般化量子回帰関係を導出する。 この理論はすべての時間スケールをカバーし、マルコフと線形応答の結果を制限ケースとして仮定する。 最後に、我々の理論を量子摩擦現象に適用する。

The description of an open quantum system's decay almost always requires several approximations as to remain tractable. Here, we first revisit the meaning, domain and seeming contradictions of a few of the most widely used of such approximations: semi-group Markovianity, linear response theory, Wigner--Weisskopf and rotating-wave approximation. Secondly, we derive an effective time-dependent decay theory and corresponding generalized quantum regression relations for an open quantum system linearly coupled to an environment. This theory covers all timescales, and subsumes the Markovian and linear-response results as limiting cases. Finally, we apply our theory to the phenomenon of quantum friction.
翻訳日:2023-05-17 06:41:14 公開日:2020-06-03
# フラクタルにおける線形スペクトルデシメーション

Linearized spectral decimation in fractals ( http://arxiv.org/abs/2006.02339v1 )

ライセンス: Link先を確認
Askar A. Iliasov, Mikhail I. Katsnelson, Shengjun Yuan(参考訳) 本稿では,ブロック階層構造を持つフラクタルのエネルギー準位スペクトルについて検討する。 スペクトルデシメーション過程の線形化の観点からスペクトル特性を研究する手法を開発し,それを数値的に検証する。 本手法は, パワーローレベルスペーシング分布, 状態の滑らかな密度, 有効カオスレジームなど, 力学系の理論における自己相似グラフの様々なスペクトル特性の定性的説明を提供する。

In this article we study the energy level spectrum of fractals which have block-hierarchical structures. We develop a method to study the spectral properties in terms of linearization of spectral decimation procedure and verify it numerically. Our approach provides qualitative explanations for various spectral properties of self-similar graphs within the theory of dynamical systems, including power-law level-spacing distribution, smooth density of states and effective chaotic regime.
翻訳日:2023-05-17 06:41:03 公開日:2020-06-03
# 高品質3次元アルミマイクロ波キャビティ

High Quality 3-Dimensional Aluminum Microwave Cavities ( http://arxiv.org/abs/2006.02213v1 )

ライセンス: Link先を確認
M. Kudra, J. Bizn\'arov\'a, F. Roudsari, J. J. Burnett, D. Niepce, S. Gasparinetti, B. Wickman and P. Delsing(参考訳) 超伝導スタブジオメトリーによるアルミニウム製三次元キャビティの内部品質因子の包括的研究を行った。 湿式エッチング,アニーリング,電気化学研磨を併用し,加工品質を向上した。 支配的な損失チャネルは2段階のシステム損失と60:40の割合の未知のソースに分割されている。 純度,共鳴周波数,大きさの異なる17の空洞について検討した。 我々の治療は再現可能なキャビティを生じさせ、そのうち10個はキャビティ内の1つの光子の平均に相当する出力で8000万以上の内部品質因子を示す。 最高の空洞は、内部品質係数が1億1500万光子レベルである。

We present a comprehensive study of internal quality factors in superconducting stub-geometry 3-dimensional cavities made of aluminum. We use wet etching, annealing and electrochemichal polishing to improve the as machined quality factor. We find that the dominant loss channel is split between two-level system loss and an unknown source with 60:40 proportion. A total of 17 cavities of different purity, resonance frequency and size were studied. Our treatment results in reproducible cavities, with ten of them showing internal quality factors above 80 million at a power corresponding to an average of a single photon in the cavity. The best cavity has an internal quality factor of 115 million at single photon level.
翻訳日:2023-05-17 06:39:55 公開日:2020-06-03
# バイオメディカル研究の技術的影響--基礎性と新しさの役割

Technological impact of biomedical research: the role of basicness and novelty ( http://arxiv.org/abs/2006.02472v1 )

ライセンス: Link先を確認
Qing Ke(参考訳) イノベーション研究への継続的な関心は、科学研究から生み出された知識が技術の発展にどのように役立つかを理解することである。 技術移転を促進する科学技術の科学的能力や制度的要因の研究に先行する調査は行われているが、直接的な技術的影響をもたらす科学出版物の本質的特徴についてはほとんど知られていない。 ここでは基本性と新規性という2つの特徴に注目します。 1980年から1999年にかけて発行された380万の論文のコーパスを用いて、基礎科学論文や新しい論文が直接的な技術的影響をもたらす可能性がかなり高いことを見出した。 技術的な影響のある論文に限定するさらなる分析は、基礎科学と新科学がより多くの特許を引用し、より短いタイムラグを経験し、より広い技術分野に影響を及ぼすことを明らかにしている。

An ongoing interest in innovation studies is to understand how knowledge generated from scientific research can be used in the development of technologies. While previous inquiries have devoted to studying the scientific capacity of technologies and institutional factors facilitating technology transfer, little is known about the intrinsic characteristics of scientific publications that gain direct technological impact. Here we focus on two features, namely basicness and novelty. Using a corpus of 3.8 million papers published between 1980 and 1999, we find that basic science papers and novel papers are substantially more likely to achieve direct technological impact. Further analysis that limits to papers with technological impact reveals that basic science and novel science have more patent citations, experience shorter time lag, and have impact in broader technological fields.
翻訳日:2023-05-17 06:34:03 公開日:2020-06-03
# 教師なし学習とテンソルネットワークを用いた量子プロセストモグラフィ

Quantum process tomography with unsupervised learning and tensor networks ( http://arxiv.org/abs/2006.02424v1 )

ライセンス: Link先を確認
Giacomo Torlai, Christopher J. Wood, Atithi Acharya, Giuseppe Carleo, Juan Carrasquilla and Leandro Aolita(参考訳) 量子技術の進歩の驚くべきペースは、量子ハードウェアの特性と検証のための堅牢でスケーラブルな技術を要求する。 量子プロセストモグラフィーは、測定データから未知の量子チャネルを再構築するものであり、量子デバイスを完全に特徴付けるために必須のプリミティブである。 しかし、要求されるデータの指数的スケーリングと古典的な後処理のため、適用範囲は1ビットと2ビットのゲートに限られる。 本稿では、チャネルのテンソルネットワーク表現と教師なし機械学習にインスパイアされたデータ駆動最適化を組み合わせることで、これらの問題に対処する量子プロセストモグラフィーを行う新しい手法を提案する。 提案手法は,最大10量子ビットまでの理想1次元および2次元ランダム量子回路とノイズ5量子ビット回路のための合成データを用いて実証し,単一量子ビット測定サンプルと入力状態の限られたセットのみを用いて0.99以上のプロセスフィダリティを達成する。 我々の結果は最先端以上のもので、現在および短期の量子コンピュータで量子回路をベンチマークするための実用的でタイムリーなツールを提供する。

The impressive pace of advance of quantum technology calls for robust and scalable techniques for the characterization and validation of quantum hardware. Quantum process tomography, the reconstruction of an unknown quantum channel from measurement data, remains the quintessential primitive to completely characterize quantum devices. However, due to the exponential scaling of the required data and classical post-processing, its range of applicability is typically restricted to one- and two-qubit gates. Here, we present a new technique for performing quantum process tomography that addresses these issues by combining a tensor network representation of the channel with a data-driven optimization inspired by unsupervised machine learning. We demonstrate our technique through synthetically generated data for ideal one- and two-dimensional random quantum circuits of up to 10 qubits, and a noisy 5-qubit circuit, reaching process fidelities above 0.99 using only a limited set of single-qubit measurement samples and input states. Our results go far beyond state-of-the-art, providing a practical and timely tool for benchmarking quantum circuits in current and near-term quantum computers.
翻訳日:2023-05-17 06:31:50 公開日:2020-06-03
# Bitcoinブロックチェーンネットワークにおける主要なイベントの全体的影響評価

Assessing Holistic Impacts of Major Events on the Bitcoin Blockchain Network ( http://arxiv.org/abs/2006.02416v1 )

ライセンス: Link先を確認
Anthony Luo and Dianxiang Xu(参考訳) ブロックチェーン技術のパイオニアであるbitcoinは、これまでで最も人気のある暗号通貨だ。 SEC(証券取引委員会)の規制からセキュリティ侵害まで、急激な価格急騰(および急落)と相まって、暗号通貨のダイナミクスに関する理解の欠如があるようだ。 これらの力学は様々な政治、安全保障、金融、規制の出来事に影響されていると考えられている。 本稿では,通常の変動とイベント誘発変化を区別するImpact-Scoreメトリックを導入することで,暗号通貨変動の全体的分析を行う効率的なフレームワークを提案する。 2016年から2018年にかけて、当社のフレームワークを16の世界的なイベントと(Bitcoinトランザクションとユーザ、ブロックチェーンデータ、メモリプールデータとして定義された)Bitcoinブロックチェーンネットワークに適用しました。 その結果,イベントの大部分はネットワーク変更と相関していることがわかった。 我々は、Bitcoinブロックチェーンネットワークのイベントタイプ(金融イベントなど)とサブ構造間の大まかに一般化可能な相関を観察した。 これらの出来事のサブグループは、Bitcoinエコシステムの特定のファセット(例えば活動や手数料)に強い一貫した時間的影響を持つ。 さらに,ネットワーク/サブネットワーク変化のスパイクの大部分を主要なイベントと関連付けることで,プロセスの堅牢性を示す。

As the pioneer of blockchain technology, Bitcoin is the most popular cryptocurrency to date. Given its dramatic price spikes (and crashes) along with the never-ending news from SEC regulations to security breaches, there seems to be a lack of understanding about the dynamics of cryptocurrencies. These dynamics are believed to be affected by various political, security, financial, and regulatory events. In this paper, we present an efficient framework for holistic analysis of cryptocurrency fluctuations by introducing the Impact-Score metric to distinguish event-induced changes from normal variations. We have applied our framework to 16 major worldwide events and the Bitcoin blockchain network (defined as Bitcoin transaction and users, blockchain data, and memory pool data) from 2016-2018. The results show that a majority of the events are correlated with substantial network changes. We observed roughly generalizable correlations between event types (e.g. financial events) and sub-structures of the Bitcoin blockchain network. Subgroups of these events have strongly consistent temporal impacts on specific facets (e.g. activity or fees) of the Bitcoin ecosystem. Furthermore, we demonstrate the robustness of our process by correlating a majority of spikes in network/subnetwork change with major events.
翻訳日:2023-05-17 06:31:29 公開日:2020-06-03
# 有限温度状態による人口移動

Population transfer via a finite temperature state ( http://arxiv.org/abs/2006.02583v1 )

ライセンス: Link先を確認
Wei Huang, Baohua Zhu, Wei Wu, Shan Yin, Wentao Zhang, Chu Guo(参考訳) まず, 温度が有限である温度平衡条件下での共通中間状態による量子集団移動について検討し, 多レベルラマン断熱通路構造を示す。 共通中間状態、すなわち離散的な2レベルスピンとボゾン連続体に対する2つの状況を考える。 どちらの場合も、有限温度が人口移動の効率に強く影響を与えることを示す。 また, 中間状態との強い結合や, 制御パルスの持続時間が有限温度の影響を抑制することを示した。 連続的な場合、熱場をベースとしたチェーンマッピング行列状態のアルゴリズムを適用し、時間依存制御パルスの下で系の時間的発展と連続性を研究する。

We study quantum population transfer via a common intermediate state initially in thermal equilibrium with a finite temperature $T$, exhibiting a multi-level Stimulated Raman adiabatic passage structure. We consider two situations for the common intermediate state, namely a discrete two-level spin and a bosonic continuum. In both cases we show that the finite temperature strongly affects the efficiency of the population transfer. We also show in the discrete case that strong coupling with the intermediate state, or a longer duration of the controlled pulse would suppress the effect of finite temperature. In the continuous case, we adapt the thermofield-based chain-mapping matrix product states algorithm to study the time evolution of the system plus the continuum under time-dependent controlled pulses, which shows a great potential to be used to solve open quantum system problems in quantum optics.
翻訳日:2023-05-17 06:22:41 公開日:2020-06-03
# 静水圧単電子量子ドットにおけるエネルギー準位

Energy levels in a single-electron quantum dot with hydrostatic pressure ( http://arxiv.org/abs/2006.02533v1 )

ライセンス: Link先を確認
H.E. Caicedo-Ortiz, H.O. Casta\~neda F\'ernandez, E. Santiago-Cort\'es and D.A. Mantilla-Sandoval(参考訳) 本稿では,静水圧が電子を持つ量子ドットのエネルギーレベルに及ぼす影響について述べる。 量子ドットは無限ポテンシャル井戸と2次元調和振動子を用いてモデル化され、第二量子化の形式によって解かれる。 静水圧で制御される量子NOTゲートの実装手法を提案する。

In this article we present a study of the effects of hydrostatic pressure on the energy levels of a quantum dot with an electron. A quantum dot is modeled using an infinite potential well and a two-dimensional harmonic oscillator and solved through the formalism of second quantization. A scheme for the implementation of a quantum NOT gate controlled with hydrostatic pressure is proposed.
翻訳日:2023-05-17 06:21:42 公開日:2020-06-03
# 双極子-双極子相互作用による非対称遮断と多重量子ゲート

Asymmetric blockade and multi-qubit gates via dipole-dipole interactions ( http://arxiv.org/abs/2006.02486v1 )

ライセンス: Link先を確認
Jeremy T. Young, Przemyslaw Bienias, Ron Belyansky, Adam M. Kaufman, Alexey V. Gorshkov(参考訳) 強い、調整可能な相互作用のため、ライドバーグ原子は高速な2ビットのエンタングゲートを実現できる。 本研究では,複数の制御キュービットと多数のターゲットキュービットを同時に含むマルチキュービットのrydberg-blockadeゲートに対する,一般的な2量子ビットのrydberg-blockadeゲートの一般化を提案する。 これは、近接するリドバーグ状態の着用に強いマイクロ波場を用いることで達成され、制御対象相互作用は制御対象相互作用や標的標的相互作用よりもはるかに強い非対称的遮断に繋がる。 これらのマルチキュービットゲートの実装は、量子アルゴリズムと状態準備の両方を大幅に単純化することができる。 これを説明するために、25原子のGHZ状態は、誤差が7.8%の3つのゲートしか生成できないことを示す。

Due to their strong and tunable interactions, Rydberg atoms can be used to realize fast two-qubit entangling gates. We propose a generalization of a generic two-qubit Rydberg-blockade gate to multi-qubit Rydberg-blockade gates which involve both many control qubits and many target qubits simultaneously. This is achieved by using strong microwave fields to dress nearby Rydberg states, leading to asymmetric blockade in which control-target interactions are much stronger than control-control and target-target interactions. The implementation of these multi-qubit gates can drastically simplify both quantum algorithms and state preparation. To illustrate this, we show that a 25-atom GHZ state can be created using only three gates with an error of 7.8%.
翻訳日:2023-05-17 06:21:11 公開日:2020-06-03
# 重力に対する光学アナログの量子放出に及ぼす時空間曲率の影響

The influence of spacetime curvature on quantum emission in optical analogues to gravity ( http://arxiv.org/abs/2001.05807v2 )

ライセンス: Link先を確認
Maxime J Jacquet and Friedrich Koenig(参考訳) 湾曲した時空における量子揺らぎは、ブラックホールのホーキング効果のように、量子真空から一対の粒子を放出する。 量子放出に対する曲率の影響を調べるために重力の光学的類似物を用いる。 分散のため、時空曲率は周波数によって異なる。 粒子フラックス,相関,絡み合いを全周波数で解析的に計算する。 地平線は特徴的なスペクトル形状でフラックスを増加させる。 光子数相関は、最大エンタングルメントに近いマルチモードから2モードに遷移する。 量子状態は、曲面時空上の量子場理論の実験室試験におけるモード変換の診断である。

Quantum fluctuations on curved spacetimes cause the emission of pairs of particles from the quantum vacuum, as in the Hawking effect from black holes. We use an optical analogue to gravity to investigate the influence of the curvature on quantum emission. Due to dispersion, the spacetime curvature varies with frequency here. We analytically calculate for all frequencies the particle flux, correlations and entanglement. We find that horizons increase the flux with a characteristic spectral shape. The photon number correlations transition from multi- to two-mode, with close to maximal entanglement. The quantum state is a diagnostic for the mode conversion in laboratory tests of quantum field theory on curved spacetimes.
翻訳日:2023-01-11 01:14:45 公開日:2020-06-03
# エンジニアリングaiシステム:研究課題

Engineering AI Systems: A Research Agenda ( http://arxiv.org/abs/2001.07522v2 )

ライセンス: Link先を確認
Jan Bosch, Ivica Crnkovic, Helena Holmstr\"om Olsson(参考訳) 人工知能(AI)と機械学習(ML)は、業界ではますます広く採用されていますが、数十以上のケーススタディに基づいて、私たちは、システムに産業強度、生産品質のMLモデルをデプロイすることが困難であることが分かりました。 企業は、データ品質、設計方法とプロセス、モデルのパフォーマンス、デプロイメントとコンプライアンスに関する課題を経験します。 我々は、ML/DLコンポーネントを含むシステムの構築と進化には、新しい構造化されたエンジニアリングアプローチが必要であることを知った。 本稿では、企業がmlを採用する際に経験する典型的な進化パターンの概念化と、我々が研究した企業によって経験される重要な問題の概要を提供する。 論文の主なコントリビューションは、MLソリューションに関わる重要なエンジニアリング課題の概要と、研究コミュニティ全体で対処する必要があるオープンアイテムの概要を提供する、AIエンジニアリングのための研究課題である。

Artificial intelligence (AI) and machine learning (ML) are increasingly broadly adopted in industry, However, based on well over a dozen case studies, we have learned that deploying industry-strength, production quality ML models in systems proves to be challenging. Companies experience challenges related to data quality, design methods and processes, performance of models as well as deployment and compliance. We learned that a new, structured engineering approach is required to construct and evolve systems that contain ML/DL components. In this paper, we provide a conceptualization of the typical evolution patterns that companies experience when employing ML as well as an overview of the key problems experienced by the companies that we have studied. The main contribution of the paper is a research agenda for AI engineering that provides an overview of the key engineering challenges surrounding ML solutions and an overview of open items that need to be addressed by the research community at large.
翻訳日:2023-01-10 23:54:52 公開日:2020-06-03
# 機械学習による運動学習のアプローチ : 簡単なレビュー

Machine Learning Approaches For Motor Learning: A Short Review ( http://arxiv.org/abs/2002.04317v4 )

ライセンス: Link先を確認
Baptiste Caramiaux, Jules Fran\c{c}oise, Wanyu Liu, T\'eo Sanchez and Fr\'ed\'eric Bevilacqua(参考訳) 機械学習のアプローチは人間の運動モデリングにかなり応用されているが、運動学習に限られている。 モーターラーニングは、運動の変動を計算しなければならず、アルゴリズムが新しい動きと既知の動きのばらつきを区別できる必要があるため、新しい課題を提起する。 本稿では,運動学習のための既存の機械学習モデルとその適応能力について概説する。 確率モデルにおけるパラメータ適応、ディープニューラルネットワークにおけるトランスファーとメタラーニング、強化学習による計画適応の3つのタイプを同定し、記述する。 そこで本研究では,これらのモデルをモータ学習支援システムの分野に適用するための課題について論じる。

Machine learning approaches have seen considerable applications in human movement modeling, but remain limited for motor learning. Motor learning requires accounting for motor variability, and poses new challenges as the algorithms need to be able to differentiate between new movements and variation of known ones. In this short review, we outline existing machine learning models for motor learning and their adaptation capabilities. We identify and describe three types of adaptation: Parameter adaptation in probabilistic models, Transfer and meta-learning in deep neural networks, and Planning adaptation by reinforcement learning. To conclude, we discuss challenges for applying these models in the domain of motor learning support systems.
翻訳日:2023-01-02 01:56:04 公開日:2020-06-03
# 内部蒸留によるナップサック刈り込み

Knapsack Pruning with Inner Distillation ( http://arxiv.org/abs/2002.08258v3 )

ライセンス: Link先を確認
Yonathan Aflalo and Asaf Noy and Ming Lin and Itamar Friedman and Lihi Zelnik(参考訳) ニューラルネットワークのプルーニングは、オーバーパラメータネットワークの計算コストを削減し、効率を向上する。 一般的なメソッドは$\ell_1$-normスパシフィケーションからNeural Architecture Search (NAS)まで様々である。 本研究では,prunedネットワークの最終精度を最適化し,オーバーパラメータの親ネットワークの内部層から知識を抽出した新しいpruning手法を提案する。 このアプローチを実現するために,ニューロンの重要性とその計算コストのトレードオフを最適化するナップサック問題としてネットワークプルーニングを定式化する。 次に、ネットワークの高レベル構造を維持しながら、ネットワークチャネルをプルークする。 プルーンドネットワークは、内的ネットワーク知識を用いて親ネットワークの監督下で微調整され、内的知識蒸留と呼ばれる技術である。 提案手法は,ResNetバックボーンを用いたImageNet,CIFAR-10,CIFAR-100における最先端のプルーニング結果をもたらす。 スキップリンクによる畳み込みや深度ワイド畳み込みといった複雑なネットワーク構造を創出するために,これらの構造に対応するブロックグループ化手法を提案する。 これにより、EfficientNet-B0 と MobileNetV3 と同じ FLOP を持つが、ImageNet でそれぞれ $1\%$ と $0.3\%$ の精度で、GPU でより高速なランタイムを実現できる。

Neural network pruning reduces the computational cost of an over-parameterized network to improve its efficiency. Popular methods vary from $\ell_1$-norm sparsification to Neural Architecture Search (NAS). In this work, we propose a novel pruning method that optimizes the final accuracy of the pruned network and distills knowledge from the over-parameterized parent network's inner layers. To enable this approach, we formulate the network pruning as a Knapsack Problem which optimizes the trade-off between the importance of neurons and their associated computational cost. Then we prune the network channels while maintaining the high-level structure of the network. The pruned network is fine-tuned under the supervision of the parent network using its inner network knowledge, a technique we refer to as the Inner Knowledge Distillation. Our method leads to state-of-the-art pruning results on ImageNet, CIFAR-10 and CIFAR-100 using ResNet backbones. To prune complex network structures such as convolutions with skip-links and depth-wise convolutions, we propose a block grouping approach to cope with these structures. Through this we produce compact architectures with the same FLOPs as EfficientNet-B0 and MobileNetV3 but with higher accuracy, by $1\%$ and $0.3\%$ respectively on ImageNet, and faster runtime on GPU.
翻訳日:2022-12-30 13:08:26 公開日:2020-06-03
# ニューラルネットワークにおける暗黙的に定義された層

Implicitly Defined Layers in Neural Networks ( http://arxiv.org/abs/2003.01822v2 )

ライセンス: Link先を確認
Qianggong Zhang, Yanyang Gu, Michalkiewicz Mateusz, Mahsa Baktashmotlagh, Anders Eriksson(参考訳) 従来の多層フィードフォワードニューラルネットワークの定式化では、個々の層は明示的に定義される。 本稿では、ニューラルネットワークにおける個々のレイヤの定義が、標準の明示的なレイヤよりもずっとリッチな表現を提供し、エンドツーエンドのトレーニング可能なアーキテクチャの幅広いクラスを可能にすることを実証する。 我々は,このような層の理論解析の多くを暗黙的関数定理によって解決できる,暗黙的に定義された層の一般的な枠組みを提案する。 また,既存の機械学習ライブラリに暗黙的に定義されたレイヤをシームレスに組み込む方法を示す。 特に、バックプロパゲーションに基づくトレーニングで使用する現在の自動微分技術について。 最後に,提案手法の汎用性と妥当性を,有望な結果を伴う多種多様な実例問題に対して示す。

In conventional formulations of multilayer feedforward neural networks, the individual layers are customarily defined by explicit functions. In this paper we demonstrate that defining individual layers in a neural network \emph{implicitly} provide much richer representations over the standard explicit one, consequently enabling a vastly broader class of end-to-end trainable architectures. We present a general framework of implicitly defined layers, where much of the theoretical analysis of such layers can be addressed through the implicit function theorem. We also show how implicitly defined layers can be seamlessly incorporated into existing machine learning libraries. In particular with respect to current automatic differentiation techniques for use in backpropagation based training. Finally, we demonstrate the versatility and relevance of our proposed approach on a number of diverse example problems with promising results.
翻訳日:2022-12-26 23:01:02 公開日:2020-06-03
# 脊髄多発性硬化症病変の自動分節法 : MRIのコントラストをどう一般化するか

Automatic segmentation of spinal multiple sclerosis lesions: How to generalize across MRI contrasts? ( http://arxiv.org/abs/2003.04377v3 )

ライセンス: Link先を確認
Olivier Vincent, Charley Gros, Joseph Paul Cohen, Julien Cohen-Adad(参考訳) 近年の医用画像セグメンテーションの改善にもかかわらず、画像コントラストをまたいで一般化する能力は未解決のままである。 この課題に対処するため、我々は特徴量線形変調(FiLM)を実装し、セグメント化モデル内の物理知識を活用し、各コントラストの特性を学習する。 興味深いことに、高度に最適化されたu-netは、マルチコントラストデータセット (diceスコア0.72) 上で撮影されたものと同等の性能に達しており、異なるコントラストの一般化とは異なる脊髄ms病変のセグメンテーションにボトルネックがあることを示唆している。 このボトルネックは、我々のデータセットのDiceスコアの0.61と推定される、ラター間変動に起因する可能性が高い。

Despite recent improvements in medical image segmentation, the ability to generalize across imaging contrasts remains an open issue. To tackle this challenge, we implement Feature-wise Linear Modulation (FiLM) to leverage physics knowledge within the segmentation model and learn the characteristics of each contrast. Interestingly, a well-optimised U-Net reached the same performance as our FiLMed-Unet on a multi-contrast dataset (0.72 of Dice score), which suggests that there is a bottleneck in spinal MS lesion segmentation different from the generalization across varying contrasts. This bottleneck likely stems from inter-rater variability, which is estimated at 0.61 of Dice score in our dataset.
翻訳日:2022-12-25 08:41:54 公開日:2020-06-03
# GA特徴選択とランダムフォレストに基づくスピッツイド病変診断

Spitzoid Lesions Diagnosis based on GA feature selection and Random Forest ( http://arxiv.org/abs/2003.04745v2 )

ライセンス: Link先を確認
Abir Belaala (LINFI Laboratory, Biskra University), Labib Sadek (Terrissa LINFI Laboratory, Biskra University), Noureddine Zerhouni (FEMTO-ST Institute, CNRS - UFC / ENSMM / UTBM, Automatic Control and Micro-Mechatronic Systems), Christine Devalland (Service of Anatomy and Pathology Cytology)(参考訳) Spitzoid lesions は Spitz Nevus (SN), Atypical Spitz tumors (AST), Spitz Melanomas (SM) に大別された。 これらの病変の正確な診断は、皮膚病理学者にとって最も難しい課題の1つであり、両者の類似性が高いためである。 データマイニング技術は、複雑性が存在するような状況にうまく適用されます。 本研究の目的は、スピッツァード病変の診断を支援する人工知能モデルの開発である。 本研究で提案するシステムを評価するために,splitzoid lesionsデータセットを用いた。 提案システムには3つの段階がある。 第1段階では、無関係な特徴を排除するために、第2段階で不均衡なデータ問題を解決するためにSMOTE法を適用し、遺伝的アルゴリズムを用いて重要な特徴を選択する。 これは後に計算の複雑さを減らし、データマイニングプロセスを高速化する。 第3段階ではランダム森林分類器を用いて2種類の病変(Spitz nevus または非定型Spitz tumors)を判定する。 提案手法の性能は,精度,感度,特異度,G平均,F-測度,ROC,AUCを用いて評価した。 SMOTE-GA-RFモデルとGA-16の特徴は精度0.97, F-measure 0.98, AUC 0.98, G-mean 0.97で良好な成績を示した。

Spitzoid lesions broadly categorized into Spitz Nevus (SN), Atypical Spitz Tumors (AST), and Spitz Melanomas (SM). The accurate diagnosis of these lesions is one of the most challenges for dermapathologists; this is due to the high similarities between them. Data mining techniques are successfully applied to situations like these where complexity exists. This study aims to develop an artificial intelligence model to support the diagnosis of Spitzoid lesions. A private spitzoid lesions dataset have been used to evaluate the system proposed in this study. The proposed system has three stages. In the first stage, SMOTE method applied to solve the imbalance data problem, in the second stage, in order to eliminate irrelevant features; genetic algorithm is used to select significant features. This later reduces the computational complexity and speed up the data mining process. In the third stage, Random forest classifier is employed to make a decision for two different categories of lesions (Spitz nevus or Atypical Spitz Tumors). The performance of our proposed scheme is evaluated using accuracy, sensitivity, specificity, G-mean, F- measure, ROC and AUC. Results obtained with our SMOTE-GA-RF model with GA-based 16 features show a great performance with accuracy 0.97, F-measure 0.98, AUC 0.98, and G-mean 0.97.Results obtained in this study have potential to open new opportunities in diagnosis of spitzoid lesions.
翻訳日:2022-12-24 21:04:36 公開日:2020-06-03
# 原子部分電荷と原子双極子を組み合わせた分子双極子モーメントの予測

Predicting molecular dipole moments by combining atomic partial charges and atomic dipoles ( http://arxiv.org/abs/2003.12437v3 )

ライセンス: Link先を確認
Max Veit, David M. Wilkins, Yang Yang, Robert A. DiStasio Jr., Michele Ceriotti(参考訳) 分子双極子モーメント(分子双極子モーメント、英: molecular dipole moment)は、化学の中心的な量である。 誘導および長距離静電相互作用と同様に、赤外および周波発生スペクトルの予測には不可欠である。 さらに、高レベルの量子力学計算から直接抽出することができ、機械学習(ML)の理想的なターゲットとなる。 局所原子分極は、各原子に(ベクトル)双極子モーメントを割り当てる対称性に適合したガウス過程回帰(sa-gpr)フレームワーク内でキャプチャされ、分子全体の電荷移動は各原子に部分(スカラー)電荷を割り当てることでキャプチャされる。 結果として得られた「MuML」モデルは、QM7bデータセット上の高レベル結合クラスタ理論(CCSD)と密度汎関数理論(DFT)を用いて計算された分子$\boldsymbol{\mu}$を再現する。 組み合わせモデルは、より大きく複雑な分子のショーケースデータセットに適用した場合に優れた転送可能性を示し、計算コストのごく一部でDFTの精度にアプローチする。 また, 予測の不確実性は, 校正委員会モデルを用いて確実に推定できることを示した。 しかし、モデルの最終的な性能は系の詳細に依存し、スカラーモデルは電荷分離によってほぼ完全に生成される大きな分子を記述する際に明らかに優れている。 これらの観察は、$\boldsymbol{\mu}$ に寄与する局所的および非局所的効果を同時に計算することが重要であることを示している。

The molecular dipole moment ($\boldsymbol{\mu}$) is a central quantity in chemistry. It is essential in predicting infrared and sum-frequency generation spectra, as well as induction and long-range electrostatic interactions. Furthermore, it can be extracted directly from high-level quantum mechanical calculations, making it an ideal target for machine learning (ML). In this work, we choose to represent this quantity with a physically inspired ML model that captures two distinct physical effects: local atomic polarization is captured within the symmetry-adapted Gaussian process regression (SA-GPR) framework, which assigns a (vector) dipole moment to each atom, while movement of charge across the entire molecule is captured by assigning a partial (scalar) charge to each atom. The resulting "MuML" models are fitted together to reproduce molecular $\boldsymbol{\mu}$ computed using high-level coupled-cluster theory (CCSD) and density functional theory (DFT) on the QM7b dataset. The combined model shows excellent transferability when applied to a showcase dataset of larger and more complex molecules, approaching the accuracy of DFT at a small fraction of the computational cost. We also demonstrate that the uncertainty in the predictions can be estimated reliably using a calibrated committee model. The ultimate performance of the models depends, however, on the details of the system at hand, with the scalar model being clearly superior when describing large molecules whose dipole is almost entirely generated by charge separation. These observations point to the importance of simultaneously accounting for the local and non-local effects that contribute to $\boldsymbol{\mu}$; further, they define a challenging task to benchmark future models, particularly those aimed at the description of condensed phases.
翻訳日:2022-12-19 05:29:24 公開日:2020-06-03
# 視覚的質問応答における知識ギャップの理解:ギャップ識別とテストへの示唆

Understanding Knowledge Gaps in Visual Question Answering: Implications for Gap Identification and Testing ( http://arxiv.org/abs/2004.03755v2 )

ライセンス: Link先を確認
Goonmeet Bajaj, Bortik Bandyopadhyay, Daniel Schmidt, Pranav Maneriker, Christopher Myers, Srinivasan Parthasarathy(参考訳) 視覚質問応答システム(VQA)は、提示された画像に対応する自然言語質問に応答する。 伝統的なVQAデータセットは通常、オブジェクトの空間情報、オブジェクト属性、一般的なシーン質問に関連する質問を含む。 近年,これらのデータセットのバランスを改善し,記憶された言語特徴や統計的バイアスへのシステムの依存を減らすことの必要性を認識している。 しかし、これらの失敗を定量化し説明するために潜伏パターンが存在するかどうかは不明である。 VQAモデルの性能に関する理解を深めるための最初のステップとして、知識ギャップ(KG)の分類を用いて、質問を1つ以上のタイプのKGでタグ付けする。 各知識ギャップ(KG)は、解像度に到達するために必要な推論能力を記述する。 質問ごとのKGを同定した後、各KGに対する質問の分布のスキューについて検討する。 次に、このスキューを減らすために、ターゲットとした質問生成モデルを導入し、画像の新しいタイプの質問を生成する。 これらの新しい質問は、既存のVQAデータセットに追加することで、質問の多様性を高め、スキューを減らすことができる。

Visual Question Answering (VQA) systems are tasked with answering natural language questions corresponding to a presented image. Traditional VQA datasets typically contain questions related to the spatial information of objects, object attributes, or general scene questions. Recently, researchers have recognized the need to improve the balance of such datasets to reduce the system's dependency on memorized linguistic features and statistical biases, while aiming for enhanced visual understanding. However, it is unclear whether any latent patterns exist to quantify and explain these failures. As an initial step towards better quantifying our understanding of the performance of VQA models, we use a taxonomy of Knowledge Gaps (KGs) to tag questions with one or more types of KGs. Each Knowledge Gap (KG) describes the reasoning abilities needed to arrive at a resolution. After identifying KGs for each question, we examine the skew in the distribution of questions for each KG. We then introduce a targeted question generation model to reduce this skew, which allows us to generate new types of questions for an image. These new questions can be added to existing VQA datasets to increase the diversity of questions and reduce the skew.
翻訳日:2022-12-15 07:51:22 公開日:2020-06-03
# リカレント畳み込みニューラルネットワークは地震の位置を予測するのに役立つ

Recurrent Convolutional Neural Networks help to predict location of Earthquakes ( http://arxiv.org/abs/2004.09140v3 )

ライセンス: Link先を確認
Roman Kail, Alexey Zaytsev, Evgeny Burnaev(参考訳) 地震の中期予測に対する現代のニューラルネットワークアーキテクチャの適用性について検討する。 データに基づく分類モデルは、与えられた瞬間から10~60ドルの日数で10 \times 10$kmの範囲で、閾値を超える規模の地震が起こるかどうかを予測することを目的としています。 我々のディープニューラルネットワークモデルには、地震と空間的依存関係を考慮に入れた畳み込み部の間の時間依存性を考慮に入れた繰り返し部(LSTM)がある。 その結果、ニューラルネットワークに基づくモデルが、地震間の時空間依存性も考慮したベースライン特徴ベースモデルに匹敵することがわかった。 日本の地震に関する歴史的データでは、我々のモデルは、品質指標のROC AUC $0.975$とPR AUC $0.0890$で地震の発生を10ドルから60ドルまで予測し、1.18 \cdot 10^3$で正確な予測を行い、2.09 \cdot 10^3$地震を見逃し、192 \cdot 10^3$誤報を発生させる。 roc auc $0.992$、正確な予測回数は1.19 \cdot 10^3$、地震は2.07 \cdot 10^3$であるが、pr auc $0.00911$、偽アラームの数は1004 \cdot 10^3$である。

We examine the applicability of modern neural network architectures to the midterm prediction of earthquakes. Our data-based classification model aims to predict if an earthquake with the magnitude above a threshold takes place at a given area of size $10 \times 10$ kilometers in $10$-$60$ days from a given moment. Our deep neural network model has a recurrent part (LSTM) that accounts for time dependencies between earthquakes and a convolutional part that accounts for spatial dependencies. Obtained results show that neural networks-based models beat baseline feature-based models that also account for spatio-temporal dependencies between different earthquakes. For historical data on Japan earthquakes our model predicts occurrence of an earthquake in $10$ to $60$ days from a given moment with magnitude $M_c > 5$ with quality metrics ROC AUC $0.975$ and PR AUC $0.0890$, making $1.18 \cdot 10^3$ correct predictions, while missing $2.09 \cdot 10^3$ earthquakes and making $192 \cdot 10^3$ false alarms. The baseline approach has similar ROC AUC $0.992$, number of correct predictions $1.19 \cdot 10^3$, and missing $2.07 \cdot 10^3$ earthquakes, but significantly worse PR AUC $0.00911$, and number of false alarms $1004 \cdot 10^3$.
翻訳日:2022-12-11 17:43:45 公開日:2020-06-03
# 驚くほど単純な防御による敵のハーネスング

Harnessing adversarial examples with a surprisingly simple defense ( http://arxiv.org/abs/2004.13013v3 )

ライセンス: Link先を確認
Ali Borji(参考訳) 敵の例から守るための非常に単純な方法を紹介します。 基本的な考え方は、テスト時にReLU関数の傾きを上げることである。 MNISTとCIFAR-10データセットに対する実験は、未目標と目標設定の両方において、多数の強力な攻撃に対する提案された防御の有効性を示す。 対人防御の状況ほど効果的ではないかもしれないが、このアプローチは対人攻撃を理解し緩和するための洞察を与えることができる。 他の防御と組み合わせて使うこともできる。

I introduce a very simple method to defend against adversarial examples. The basic idea is to raise the slope of the ReLU function at the test time. Experiments over MNIST and CIFAR-10 datasets demonstrate the effectiveness of the proposed defense against a number of strong attacks in both untargeted and targeted settings. While perhaps not as effective as the state of the art adversarial defenses, this approach can provide insights to understand and mitigate adversarial attacks. It can also be used in conjunction with other defenses.
翻訳日:2022-12-09 13:16:58 公開日:2020-06-03
# 画像復元のためのピラミッド注意ネットワーク

Pyramid Attention Networks for Image Restoration ( http://arxiv.org/abs/2004.13824v4 )

ライセンス: Link先を確認
Yiqun Mei, Yuchen Fan, Yulun Zhang, Jiahui Yu, Yuqian Zhou, Ding Liu, Yun Fu, Thomas S. Huang and Humphrey Shi(参考訳) 自己相似性(Self-similarity)とは、画像復元アルゴリズムにおいて、小さいが類似したパターンが異なる場所やスケールで発生する傾向にある画像である。 しかし,近年の深層畳み込みニューラルネットワークによる画像復元手法は,同じスケールでのみ情報を処理する自己認識型ニューラルネットワークを頼りにすることで,自己相似性を最大限に活用するものではない。 そこで本稿では,マルチスケール特徴ピラミッドから長距離特徴対応を捉えた,画像復元のための新しいピラミッドアテンションモジュールを提案する。 ノイズや圧縮加工品などの汚職が粗い画像スケールで劇的に減少するという事実にインスパイアされた我々の注目モジュールは、粗いレベルの「クリーン」対応からクリーンな信号を借りられるように設計されている。 提案されたピラミッドアテンションモジュールは、様々なニューラルネットワークアーキテクチャに柔軟に統合できる汎用的なビルディングブロックである。 その効果は、画像のデノイジング、デモサイシング、圧縮アーティファクトの削減、スーパーレゾリューションなど、複数の画像復元タスクに関する広範囲な実験を通じて検証される。 私たちのpanet(pyramid attention module with simple network backbones)は、精度とビジュアルクオリティに優れて、最先端の成果を生み出すことができます。 私たちのコードはhttps://github.com/SHI-Labs/Pyramid-Attention-Networksで公開されます。

Self-similarity refers to the image prior widely used in image restoration algorithms that small but similar patterns tend to occur at different locations and scales. However, recent advanced deep convolutional neural network based methods for image restoration do not take full advantage of self-similarities by relying on self-attention neural modules that only process information at the same scale. To solve this problem, we present a novel Pyramid Attention module for image restoration, which captures long-range feature correspondences from a multi-scale feature pyramid. Inspired by the fact that corruptions, such as noise or compression artifacts, drop drastically at coarser image scales, our attention module is designed to be able to borrow clean signals from their "clean" correspondences at the coarser levels. The proposed pyramid attention module is a generic building block that can be flexibly integrated into various neural architectures. Its effectiveness is validated through extensive experiments on multiple image restoration tasks: image denoising, demosaicing, compression artifact reduction, and super resolution. Without any bells and whistles, our PANet (pyramid attention module with simple network backbones) can produce state-of-the-art results with superior accuracy and visual quality. Our code will be available at https://github.com/SHI-Labs/Pyramid-Attention-Networks
翻訳日:2022-12-08 21:57:29 公開日:2020-06-03
# GoEmotions: 細かい感情のデータセット

GoEmotions: A Dataset of Fine-Grained Emotions ( http://arxiv.org/abs/2005.00547v2 )

ライセンス: Link先を確認
Dorottya Demszky, Dana Movshovitz-Attias, Jeongwoo Ko, Alan Cowen, Gaurav Nemade and Sujith Ravi(参考訳) 言語で表現される感情を理解するには、共感的なチャットボットの構築から有害なオンライン行動の検出に至るまで、幅広い応用がある。 この領域の進歩は、複数の下流タスクに適応可能な、きめ細かい型付き大規模データセットを使用して改善することができる。 GoEmotionsは、英語で58万件のRedditコメントを手動で注釈付けした最大のデータセットで、27の感情カテゴリまたはニュートラルにラベル付けされている。 主成分分析によってアノテーションの質が向上することを示す。 既存の感情ベンチマークで転送学習実験を行い、データセットが他のドメインや異なる感情分類にうまく一般化していることを示す。 BERTベースのモデルでは、提案した分類法の平均F1スコアは.46であり、改善の余地はたくさんある。

Understanding emotion expressed in language has a wide range of applications, from building empathetic chatbots to detecting harmful online behavior. Advancement in this area can be improved using large-scale datasets with a fine-grained typology, adaptable to multiple downstream tasks. We introduce GoEmotions, the largest manually annotated dataset of 58k English Reddit comments, labeled for 27 emotion categories or Neutral. We demonstrate the high quality of the annotations via Principal Preserved Component Analysis. We conduct transfer learning experiments with existing emotion benchmarks to show that our dataset generalizes well to other domains and different emotion taxonomies. Our BERT-based model achieves an average F1-score of .46 across our proposed taxonomy, leaving much room for improvement.
翻訳日:2022-12-07 23:56:19 公開日:2020-06-03
# リワード学習のためのアクティブな選好に基づくガウス過程回帰

Active Preference-Based Gaussian Process Regression for Reward Learning ( http://arxiv.org/abs/2005.02575v2 )

ライセンス: Link先を確認
Erdem B{\i}y{\i}k, Nicolas Huynh, Mykel J. Kochenderfer, Dorsa Sadigh(参考訳) 報酬関数の設計は、AIとロボット工学において難しい問題である。 人間は通常、ロボットが最適化する必要があるすべての望ましい行動を直接指定するのは難しい。 一般的なアプローチの1つは、専門家による実験から報酬関数を学ぶことである。 しかし、デモから報酬関数を学ぶには、多くの課題がある: いくつかのメソッドは、事前定義された機能セットで線形である報酬関数のような、高度に構造化されたモデルを必要とする。 加えて、人間は高い自由度を持つロボットにデモンストレーションを提供するのに苦労する傾向にあり、あるいは与えられたデモに対する報酬値の定量化さえある。 これらの課題に対処するために、私たちは好みに基づく学習アプローチを提案し、その代替として、人間のフィードバックは軌跡間の比較の形でのみ存在する。 さらに、報酬関数に非常に制約のある構造は想定しない。 代わりに,gaussian process (gp) を用いて報酬関数をモデル化し,人間の好みだけでgpを積極的に見つけるための数学的定式化を提案する。 このアプローチにより,選好ベースの学習フレームワークにおいて,柔軟性の問題とデータ非効率問題の両方に対処できる。 シミュレーションとユーザスタディの結果から,ロボットタスクの表現的報酬関数を効率的に学習できることが示唆された。

Designing reward functions is a challenging problem in AI and robotics. Humans usually have a difficult time directly specifying all the desirable behaviors that a robot needs to optimize. One common approach is to learn reward functions from collected expert demonstrations. However, learning reward functions from demonstrations introduces many challenges: some methods require highly structured models, e.g. reward functions that are linear in some predefined set of features, while others adopt less structured reward functions that on the other hand require tremendous amount of data. In addition, humans tend to have a difficult time providing demonstrations on robots with high degrees of freedom, or even quantifying reward values for given demonstrations. To address these challenges, we present a preference-based learning approach, where as an alternative, the human feedback is only in the form of comparisons between trajectories. Furthermore, we do not assume highly constrained structures on the reward function. Instead, we model the reward function using a Gaussian Process (GP) and propose a mathematical formulation to actively find a GP using only human preferences. Our approach enables us to tackle both inflexibility and data-inefficiency problems within a preference-based learning framework. Our results in simulations and a user study suggest that our approach can efficiently learn expressive reward functions for robotics tasks.
翻訳日:2022-12-06 05:16:01 公開日:2020-06-03
# 自動lstmカスタマイズと共有に基づく大規模交通ネットワークにおける分散細粒度交通速度予測

Distributed Fine-Grained Traffic Speed Prediction for Large-Scale Transportation Networks based on Automatic LSTM Customization and Sharing ( http://arxiv.org/abs/2005.04788v2 )

ライセンス: Link先を確認
Ming-Chang Lee, Jia-Chun Lin, and Ernst Gunnar Gran(参考訳) 過去10年間,交通速度の短期予測は重要な研究課題であり,多くのアプローチが導入されている。 しかし、多数の交通検知器が配備されている大規模交通ネットワークに対して、きめ細かな、正確かつ効率的な交通速予測を提供することは、十分に研究されていない。 本稿では,大規模交通ネットワークを対象とした分散きめ細かな交通速度予測手法であるDistPreを提案する。 DistPreは、詳細なトラフィック速度予測を実現するため、検出器に適切なハイパーパラメータ構成を持つLong Short-Term Memory (LSTM)モデルをカスタマイズする。 このようなカスタマイズプロセスを大規模輸送ネットワークに適用するために、DistPreは計算ノードのクラスタ上でLSTMカスタマイズを行い、訓練されたLSTMモデルを異なる検出器間で共有できるようにする。 検出器が他の検出器と同様のトラフィックパターンを観測した場合、DistPreは検出器ごとにLSTMモデルをカスタマイズするのではなく、既存のLSTMモデルを2つの検出器間で直接共有する。 カリフォルニア州の高速道路i5-nから収集した交通データに基づく実験を行い,distpreの性能評価を行った。 その結果、DistPreは、大規模な交通ネットワークにおいて、時間効率の良いLSTMカスタマイズと正確な交通速度予測を提供することを示した。

Short-term traffic speed prediction has been an important research topic in the past decade, and many approaches have been introduced. However, providing fine-grained, accurate, and efficient traffic-speed prediction for large-scale transportation networks where numerous traffic detectors are deployed has not been well studied. In this paper, we propose DistPre, which is a distributed fine-grained traffic speed prediction scheme for large-scale transportation networks. To achieve fine-grained and accurate traffic-speed prediction, DistPre customizes a Long Short-Term Memory (LSTM) model with an appropriate hyperparameter configuration for a detector. To make such customization process efficient and applicable for large-scale transportation networks, DistPre conducts LSTM customization on a cluster of computation nodes and allows any trained LSTM model to be shared between different detectors. If a detector observes a similar traffic pattern to another one, DistPre directly shares the existing LSTM model between the two detectors rather than customizing an LSTM model per detector. Experiments based on traffic data collected from freeway I5-N in California are conducted to evaluate the performance of DistPre. The results demonstrate that DistPre provides time-efficient LSTM customization and accurate fine-grained traffic-speed prediction for large-scale transportation networks.
翻訳日:2022-12-05 01:39:49 公開日:2020-06-03
# いつ、どうやってロックダウンをリフティングするか? 比較ガウスプロセスを用いた世界的COVID-19シナリオ分析と政策評価

When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and Policy Assessment using Compartmental Gaussian Processes ( http://arxiv.org/abs/2005.08837v2 )

ライセンス: Link先を確認
Zhaozhi Qian, Ahmed M. Alaa, Mihaela van der Schaar(参考訳) 新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、新型コロナウイルスの感染抑制のため、多くの国が前例のないロックダウン措置を講じている。 政府は早急に行動し、早期にロックダウン措置を解除できるかどうかという疑問が公論の中心となっている。 ロックダウン政策の異なるシナリオで新型コロナウイルスの死亡率を予測するデータ駆動モデルは、これらの問題に対処し、将来の政策方針について政府に通知するために不可欠である。 そこで本稿では,グローバル・コンテキストにおける新型コロナウイルスのロックダウン政策の効果を予測するベイズモデルを開発し,各国を個別のデータポイントとして扱い,各国の政策のバリエーションを活用し,国固有の政策効果を学習する。 このモデルでは,2層ガウス法 (gp) を先行して用いた。下位層では,各国の「国別」政策の下で死亡率曲線を捉える「国別・政治別」パラメータを先行平均関数として,区画型セイル (susceptible, exposed, infected, recovered) モデルを用い,上位層は各国で共有され,下位層セイルパラメータを国の特徴とその政策指標の機能として学習する。 私たちのモデルは、seirモデル(bayesian priors)の強固な機械論的基盤と、柔軟なデータ駆動モデリングと機械学習(bayesian posteriors)の勾配に基づく最適化ルーチンを組み合わせたものです。 当モデルと疾病管理センター(cdc)がリストした他のモデルとの比較を行い、新型コロナウイルスの死亡率への影響を強調する様々なロックダウンおよび再開戦略のシナリオ分析を行った。

The coronavirus disease 2019 (COVID-19) global pandemic has led many countries to impose unprecedented lockdown measures in order to slow down the outbreak. Questions on whether governments have acted promptly enough, and whether lockdown measures can be lifted soon have since been central in public discourse. Data-driven models that predict COVID-19 fatalities under different lockdown policy scenarios are essential for addressing these questions and informing governments on future policy directions. To this end, this paper develops a Bayesian model for predicting the effects of COVID-19 lockdown policies in a global context -- we treat each country as a distinct data point, and exploit variations of policies across countries to learn country-specific policy effects. Our model utilizes a two-layer Gaussian process (GP) prior -- the lower layer uses a compartmental SEIR (Susceptible, Exposed, Infected, Recovered) model as a prior mean function with "country-and-policy-specific" parameters that capture fatality curves under "counterfactual" policies within each country, whereas the upper layer is shared across all countries, and learns lower-layer SEIR parameters as a function of a country's features and its policy indicators. Our model combines the solid mechanistic foundations of SEIR models (Bayesian priors) with the flexible data-driven modeling and gradient-based optimization routines of machine learning (Bayesian posteriors) -- i.e., the entire model is trained end-to-end via stochastic variational inference. We compare the projections of COVID-19 fatalities by our model with other models listed by the Center for Disease Control (CDC), and provide scenario analyses for various lockdown and reopening strategies highlighting their impact on COVID-19 fatalities.
翻訳日:2022-12-03 13:46:36 公開日:2020-06-03
# 慣性センサに基づく姿勢推定のためのニューラルネットワークと従来のフィルタ

Neural Networks Versus Conventional Filters for Inertial-Sensor-based Attitude Estimation ( http://arxiv.org/abs/2005.06897v2 )

ライセンス: Link先を確認
Daniel Weber, Clemens G\"uhmann and Thomas Seel(参考訳) 慣性測定単位は、移動物体の姿勢を推定するために一般的に用いられる。 センサ融合問題の解法として, 非線形フィルタ法が多数提案されている。 しかし,多種多様な動的・静的回転・翻訳運動が考慮される場合,加速度計とジャイロスコープ融合重みの状況依存調整の必要性により,到達可能な精度が制限される。 我々は,これらの制限が,ニューラルネットワークによってどの程度克服できるか,従来のフィルタソリューションよりもどれ程のドメイン固有のニューラルネットワークモデルの最適化が必要かを検討する。 マーカベースの光学的基底真理を持つ多様なモーション記録セットは、性能評価と比較に使用される。 提案したニューラルネットワークは、ドメイン固有の最適化を導入する場合にのみ、従来のフィルタよりも優れた性能を示す。 それらは慣性センサに基づくリアルタイム姿勢推定に有望なツールであると結論づけるが、専門家の知識と豊富なデータセットの両方が、最高パフォーマンスを達成するために必要となる。

Inertial measurement units are commonly used to estimate the attitude of moving objects. Numerous nonlinear filter approaches have been proposed for solving the inherent sensor fusion problem. However, when a large range of different dynamic and static rotational and translational motions is considered, the attainable accuracy is limited by the need for situation-dependent adjustment of accelerometer and gyroscope fusion weights. We investigate to what extent these limitations can be overcome by means of artificial neural networks and how much domain-specific optimization of the neural network model is required to outperform the conventional filter solution. A diverse set of motion recordings with a marker-based optical ground truth is used for performance evaluation and comparison. The proposed neural networks are found to outperform the conventional filter across all motions only if domain-specific optimizations are introduced. We conclude that they are a promising tool for inertial-sensor-based real-time attitude estimation, but both expert knowledge and rich datasets are required to achieve top performance.
翻訳日:2022-12-03 04:48:27 公開日:2020-06-03
# 推論による対話状態追跡の再考

Rethinking Dialogue State Tracking with Reasoning ( http://arxiv.org/abs/2005.13129v2 )

ライセンス: Link先を確認
Lizi Liao, Yunshan Ma, Wenqiang Lei, Tat-Seng Chua(参考訳) ユーザの目標をよりよく解釈し、下流のポリシー学習を養うための対話状態の追跡は、対話管理におけるボトルネックである。 一般的には、対話内容を事前に定義されたスロット値ペアのセットに分類したり、対話履歴から異なるスロットの値を生成する問題として扱う。 両者とも、対話で起こる依存関係を考える上で制限があり、推論能力に欠ける。 本稿では, 対話状態の段階的追跡を, バックエンドデータの助けを借りて行うことを提案する。 実験の結果,本手法は多分野にわたる大規模人文対話データセットであるMultiWOZ 2.1の共信精度において,最先端の手法よりも38.6%優れていた。

Tracking dialogue states to better interpret user goals and feed downstream policy learning is a bottleneck in dialogue management. Common practice has been to treat it as a problem of classifying dialogue content into a set of pre-defined slot-value pairs, or generating values for different slots given the dialogue history. Both have limitations on considering dependencies that occur on dialogues, and are lacking of reasoning capabilities. This paper proposes to track dialogue states gradually with reasoning over dialogue turns with the help of the back-end data. Empirical results demonstrate that our method significantly outperforms the state-of-the-art methods by 38.6% in terms of joint belief accuracy for MultiWOZ 2.1, a large-scale human-human dialogue dataset across multiple domains.
翻訳日:2022-11-28 09:07:09 公開日:2020-06-03
# エージェントフューチャーの学習モデルを用いた自動運転車の高速リスク評価

Fast Risk Assessment for Autonomous Vehicles Using Learned Models of Agent Futures ( http://arxiv.org/abs/2005.13458v2 )

ライセンス: Link先を確認
Allen Wang, Xin Huang, Ashkan Jasour, and Brian Williams(参考訳) 本稿では,深層ニューラルネットワーク(dnn)により,他のエージェントの将来を予測する確率的予測が生成される場合に,自律走行車両の軌道のリスクを評価する高速非サンプリング手法を提案する。 提案手法はガウスと非ガウスの混合モデルを含む不確実な予測のための幅広い表現に対処し,エージェントの位置と制御の予測を行う。 エージェント位置のガウス混合モデル(GMM)が学習された場合のリスク評価の問題は,既存の数値手法で任意の精度で迅速に解けることを示す。 エージェント位置の非ガウス混合モデルに対するリスクアセスメントの問題に対処するために,chebyshevの不等式とsos(sums-of-squares)プログラミングを用いたリスクの上限を求める。 これらのアプローチはリスクの上限を決定するためにエージェント位置の統計的モーメントのみを必要とする。 エージェント制御に対してモデルが学習された場合のリスク評価を行うために,制御分布のモーメントを非線形ダイナミクスを通じて位置分布に正確に伝達する多項式環上の木探索に類似した手法であるtreeringを開発した。 提案手法は,Argoverse および CARLA データセット上で訓練された DNN の現実的予測に基づいて実証され,低確率事象の確率を迅速に評価する上で有効であることが示されている。

This paper presents fast non-sampling based methods to assess the risk of trajectories for autonomous vehicles when probabilistic predictions of other agents' futures are generated by deep neural networks (DNNs). The presented methods address a wide range of representations for uncertain predictions including both Gaussian and non-Gaussian mixture models for predictions of both agent positions and controls. We show that the problem of risk assessment when Gaussian mixture models (GMMs) of agent positions are learned can be solved rapidly to arbitrary levels of accuracy with existing numerical methods. To address the problem of risk assessment for non-Gaussian mixture models of agent position, we propose finding upper bounds on risk using Chebyshev's Inequality and sums-of-squares (SOS) programming; they are both of interest as the former is much faster while the latter can be arbitrarily tight. These approaches only require statistical moments of agent positions to determine upper bounds on risk. To perform risk assessment when models are learned for agent controls as opposed to positions, we develop TreeRing, an algorithm analogous to tree search over the ring of polynomials that can be used to exactly propagate moments of control distributions into position distributions through nonlinear dynamics. The presented methods are demonstrated on realistic predictions from DNNs trained on the Argoverse and CARLA datasets and are shown to be effective for rapidly assessing the probability of low probability events.
翻訳日:2022-11-28 08:40:07 公開日:2020-06-03
# 流れの正規化と言うと ベイズネットワークは

You say Normalizing Flows I see Bayesian Networks ( http://arxiv.org/abs/2006.00866v2 )

ライセンス: Link先を確認
Antoine Wehenkel and Gilles Louppe(参考訳) 正規化フローは、複雑な確率分布をモデル化するためのディープニューラルネットワークの重要なファミリーとして出現した。 本稿では,それらの結合層と自己回帰変換層を確率的グラフィカルモデルとして再検討し,各ノードで予め定義された位相と学習可能な密度でベイズネットワークに還元することを示す。 この新たな観点から、3つの結果が得られます。 まず,正規化フローにおける多重変換の積み重ねが独立性仮定を緩和し,モデル分布を絡み合うことを示す。 第2に,アフィン流の深さが3層を超えると,キャパシティの基本的な飛躍が現れることを示す。 第3に,アフィン正規化流れの深さに関係なく,非普遍性を証明する。

Normalizing flows have emerged as an important family of deep neural networks for modelling complex probability distributions. In this note, we revisit their coupling and autoregressive transformation layers as probabilistic graphical models and show that they reduce to Bayesian networks with a pre-defined topology and a learnable density at each node. From this new perspective, we provide three results. First, we show that stacking multiple transformations in a normalizing flow relaxes independence assumptions and entangles the model distribution. Second, we show that a fundamental leap of capacity emerges when the depth of affine flows exceeds 3 transformation layers. Third, we prove the non-universality of the affine normalizing flow, regardless of its depth.
翻訳日:2022-11-26 06:14:10 公開日:2020-06-03
# 社会経済データによる電気自動車の低速充電インフラにおけるエネルギー消費分布の解明

Explaining the distribution of energy consumption at slow charging infrastructure for electric vehicles from socio-economic data ( http://arxiv.org/abs/2006.01672v2 )

ライセンス: Link先を確認
Milan Straka, Rui Carvalho, Gijs van der Poel, \v{L}ubo\v{s} Buzna(参考訳) 本研究では,低速充電インフラを取り巻く環境のどの活動,機能,特性が低速充電インフラで消費される電力分布に影響を及ぼすかを分析するデータ中心の手法を開発した。 基本的な知見を得るため,エネルギー消費の確率分布と充電事象を特徴付ける指標との関係を解析した。 地理空間データセットを収集し,統計手法を用いてデータの前処理を行い,課金インフラストラクチャが動作する空間的コンテキストをモデル化する特徴を作成した。 結果の統計的信頼性を高めるために,レグレッションと可変選択能力を組み合わせたLasso法とともにブートストラップ法を適用した。 選択された回帰係数の統計的分布を評価する。 エネルギー消費と相関する最も影響力のある特徴を同定し,充電インフラの空間的文脈が利用パターンに影響を及ぼすことを示す。 これらの特徴の多くは住民の経済的繁栄に関連している。 特定の種類の充電インフラへの方法論の適用は、例えば使用済みのロールアウト戦略によって選択された特徴の分化を可能にする。 総じて,エネルギーデータへの統計手法の適用を実証し,電力グリッドの充電インフラストラクチャの展開と計画に報知するためにモデルを開発する際に利用可能なエネルギー消費を形作る要因について考察する。

Here, we develop a data-centric approach enabling to analyse which activities, function, and characteristics of the environment surrounding the slow charging infrastructure impact the distribution of the electricity consumed at slow charging infrastructure. To gain a basic insight, we analysed the probabilistic distribution of energy consumption and its relation to indicators characterizing charging events. We collected geospatial datasets and utilizing statistical methods for data pre-processing, we prepared features modelling the spatial context in which the charging infrastructure operates. To enhance the statistical reliability of results, we applied the bootstrap method together with the Lasso method that combines regression with variable selection ability. We evaluate the statistical distributions of the selected regression coefficients. We identified the most influential features correlated with energy consumption, indicating that the spatial context of the charging infrastructure affects its utilization pattern. Many of these features are related to the economic prosperity of residents. Application of the methodology to a specific class of charging infrastructure enables the differentiation of selected features, e.g. by the used rollout strategy. Overall, the paper demonstrates the application of statistical methodologies to energy data and provides insights on factors potentially shaping the energy consumption that could be utilized when developing models to inform charging infrastructure deployment and planning of power grids.
翻訳日:2022-11-26 01:23:36 公開日:2020-06-03
# マルチコンセプト注意をビデオ要約に変換する

Transforming Multi-Concept Attention into Video Summarization ( http://arxiv.org/abs/2006.01410v2 )

ライセンス: Link先を確認
Yen-Ting Liu and Yu-Jhe Li and Yu-Chiang Frank Wang(参考訳) 映像の要約はコンピュータビジョンにおける課題の一つであり、長いビデオ入力でハイライトフレームやショットを特定することを目的としている。 本稿では,複雑な映像データを用いた映像要約のための注意に基づく新しいフレームワークを提案する。 フレーム間の対応にのみ注意を向ける従来の手法とは異なり, 時間的・概念的映像特徴にまたがる情報的領域を多概念ビデオ自己注意(MC-VSA)モデルで同定し, 時間的・空間的多様性を総合的に活用する。 我々のフレームワークでは,ビデオと要約の整合性によってラベル付きデータとラベルなしデータの両方に適用することが可能であり,実世界のアプリケーションに好適である。 2つのベンチマークの大規模かつ完全な実験は、我々のモデルの有効性を定量的かつ定性的に証明し、最先端技術よりもその優位性を確認する。

Video summarization is among challenging tasks in computer vision, which aims at identifying highlight frames or shots over a lengthy video input. In this paper, we propose an novel attention-based framework for video summarization with complex video data. Unlike previous works which only apply attention mechanism on the correspondence between frames, our multi-concept video self-attention (MC-VSA) model is presented to identify informative regions across temporal and concept video features, which jointly exploit context diversity over time and space for summarization purposes. Together with consistency between video and summary enforced in our framework, our model can be applied to both labeled and unlabeled data, making our method preferable to real-world applications. Extensive and complete experiments on two benchmarks demonstrate the effectiveness of our model both quantitatively and qualitatively, and confirms its superiority over the stateof-the-arts.
翻訳日:2022-11-26 00:39:28 公開日:2020-06-03
# 光インザループ:ニューラルネットワークのスケーラブルなトレーニングのためのフォトニクスコプロセッサ

Light-in-the-loop: using a photonics co-processor for scalable training of neural networks ( http://arxiv.org/abs/2006.01475v2 )

ライセンス: Link先を確認
Julien Launay, Iacopo Poli, Kilian M\"uller, Igor Carron, Laurent Daudet, Florent Krzakala, Sylvain Gigan(参考訳) ニューラルネットワークがますます大きくなり、複雑でデータ量が多くなるにつれて、トレーニングコストは急上昇している。 特にリコメンデータシステムや自動運転車のような生涯学習が必要な場合、これはすぐに持続不可能になるかもしれない。 本研究では,デジタル実装ニューラルネットワークの学習フェーズを高速化できる最初の光コプロセッサを提案する。 バックプロパゲーションの代替として直接フィードバックアライメントを頼りに、エラープロジェクションステップを光学的に実行します。 共プロセッサによる光学的ランダムプロジェクションを活用することで、手書き桁認識のためのニューラルネットワークのトレーニングを実演する。

As neural networks grow larger and more complex and data-hungry, training costs are skyrocketing. Especially when lifelong learning is necessary, such as in recommender systems or self-driving cars, this might soon become unsustainable. In this study, we present the first optical co-processor able to accelerate the training phase of digitally-implemented neural networks. We rely on direct feedback alignment as an alternative to backpropagation, and perform the error projection step optically. Leveraging the optical random projections delivered by our co-processor, we demonstrate its use to train a neural network for handwritten digits recognition.
翻訳日:2022-11-25 23:53:32 公開日:2020-06-03
# プライバシ保護機械学習のための分散信頼フレームワーク

A Distributed Trust Framework for Privacy-Preserving Machine Learning ( http://arxiv.org/abs/2006.02456v1 )

ライセンス: Link先を確認
Will Abramson, Adam James Hall, Pavlos Papadopoulos, Nikolaos Pitropakis, William J Buchanan(参考訳) 機械学習モデルをトレーニングする場合、研究者がデータとモデルの両方について十分な知識を持つことは標準的な手順である。 しかし、これはデータ所有者とデータサイエンティストの信頼を欠いている。 データ所有者は、第三者に個人情報のコントロールを放棄することを控えている。 プライバシー保護技術は、学習中にデータが所有者の管理下にあることを保証するために、計算を分散する。 しかし、複数のエージェントに分散したアーキテクチャは、全く新しいセキュリティと信頼の複雑さをもたらす。 これにはデータ中毒やモデル盗難が含まれる。 本稿では,分散エージェント間のピアツーピア信頼を促進するために使用される分散インフラストラクチャについて概説する。 当社のプロトタイプでは,業界ゲートキーパーとガバナンス機関を資格発行者として設定しています。 分散学習ワークフローに参加する前に、悪意のあるアクターは、まず有効な資格情報を交渉しなければならない。 我々は、プライバシ保護機械学習実験中に分散信頼アーキテクチャを確立するために、Hyperledger Aries、分散識別子(DID)、検証クレデンシャル(VC)を使用した概念実証について詳述する。 具体的には、安全で認証されたDID通信チャネルを利用して、メンタルヘルスデータに関連するフェデレーション学習ワークフローを促進する。

When training a machine learning model, it is standard procedure for the researcher to have full knowledge of both the data and model. However, this engenders a lack of trust between data owners and data scientists. Data owners are justifiably reluctant to relinquish control of private information to third parties. Privacy-preserving techniques distribute computation in order to ensure that data remains in the control of the owner while learning takes place. However, architectures distributed amongst multiple agents introduce an entirely new set of security and trust complications. These include data poisoning and model theft. This paper outlines a distributed infrastructure which is used to facilitate peer-to-peer trust between distributed agents; collaboratively performing a privacy-preserving workflow. Our outlined prototype sets industry gatekeepers and governance bodies as credential issuers. Before participating in the distributed learning workflow, malicious actors must first negotiate valid credentials. We detail a proof of concept using Hyperledger Aries, Decentralised Identifiers (DIDs) and Verifiable Credentials (VCs) to establish a distributed trust architecture during a privacy-preserving machine learning experiment. Specifically, we utilise secure and authenticated DID communication channels in order to facilitate a federated learning workflow related to mental health care data.
翻訳日:2022-11-25 18:51:28 公開日:2020-06-03
# 機械学習ライブラリにおける実世界の差分パフォーマンスバグの検出と理解

Detecting and Understanding Real-World Differential Performance Bugs in Machine Learning Libraries ( http://arxiv.org/abs/2006.01991v1 )

ライセンス: Link先を確認
Saeid Tizpaz-Niari and Pavol Cern\'y and Ashutosh Trivedi(参考訳) システムの性能を低下させるエラーのプログラミングは広く行われているが、これらのバグを分析するツールがほとんどない。 そこで本研究では,差分性能解析に基づく手法を提案する。 性能の違いが頑健であることを保証するため(すなわち、大きな入力に対しても保持する)、各クラスがそれぞれのサイズでパラメータ化された類似の入力を持つ入力クラスのパフォーマンスを比較する。 これにより、各クラスは、入力サイズからパフォーマンスまでのパフォーマンス関数で表される。 重要なことに、パフォーマンスバグの修正に簡単に使用できる形式で、なぜパフォーマンスが異なるのか、という説明も提供します。 本手法の主な2つのフェーズはファジィによる発見と決定木分類器による説明であり,それぞれがクラスタリングによってサポートされている。 まず,入力を生成する進化的ファジングアルゴリズムを提案する。 この面倒なタスクにとって、ユニークな課題は、最悪のパフォーマンスを持つ入力クラスが必要なだけでなく、異なるパフォーマンスを示すクラスセットが必要であることです。 我々はクラスタリングを用いて類似の入力クラスをマージし、ファザの効率を大幅に向上させる。 第二に、プログラム入力と内部の差分性能について説明する。 我々は、疑わしいコード領域をローカライズするために、クラスタリングと決定木を用いて識別学習アプローチを適用する。 私たちはそのテクニックを一連のアプリケーションに適用した。 マイクロベンチマークのセットでは,我々のアプローチが,差分性能を特徴付ける入力を見つける際に最先端のファザーよりも優れていることを示す。 ケーススタディのセットでは、人気のある機械学習フレームワークで複数のパフォーマンスバグを発見し、説明します。 この論文で最初に報告された4つのバグは、その後開発者によって修正された。

Programming errors that degrade the performance of systems are widespread, yet there is little tool support for analyzing these bugs. We present a method based on differential performance analysis---we find inputs for which the performance varies widely, despite having the same size. To ensure that the differences in the performance are robust (i.e. hold also for large inputs), we compare the performance of not only single inputs, but of classes of inputs, where each class has similar inputs parameterized by their size. Thus, each class is represented by a performance function from the input size to performance. Importantly, we also provide an explanation for why the performance differs in a form that can be readily used to fix a performance bug. The two main phases in our method are discovery with fuzzing and explanation with decision tree classifiers, each of which is supported by clustering. First, we propose an evolutionary fuzzing algorithm to generate inputs. For this fuzzing task, the unique challenge is that we not only need the input class with the worst performance, but rather a set of classes exhibiting differential performance. We use clustering to merge similar input classes which significantly improves the efficiency of our fuzzer. Second, we explain the differential performance in terms of program inputs and internals. We adapt discriminant learning approaches with clustering and decision trees to localize suspicious code regions. We applied our techniques to a set of applications. On a set of micro-benchmarks, we show that our approach outperforms state-of-the-art fuzzers in finding inputs to characterize the differential performance. On a set of case-studies, we discover and explain multiple performance bugs in popular machine learning frameworks. Four of these bugs, reported first in this paper, have since been fixed by the developers.
翻訳日:2022-11-25 18:49:48 公開日:2020-06-03
# 時相論理公式の学習による多段階課題の解法

Explaining Multi-stage Tasks by Learning Temporal Logic Formulas from Suboptimal Demonstrations ( http://arxiv.org/abs/2006.02411v1 )

ライセンス: Link先を確認
Glen Chou, Necmiye Ozay, Dmitry Berenson(参考訳) 本稿では,連続線形時相論理(ltl)の論理構造と原子命題を学習し,実演から多段階タスクを学習する手法を提案する。 学習者は、ltlの公式を満たしながらコスト関数を最適化し、学習者にとってコスト関数が不確かであるような、成功するが潜在的に最適でないデモンストレーションが与えられる。 提案アルゴリズムでは,実演におけるKKT(Karush-Kuhn-Tucker)最適条件と反例誘導のファルシフィケーション戦略を用いて,LTL公式の原子命題パラメータと論理構造をそれぞれ学習する。 我々は、回収された原子命題集合の保守性に関する理論的保証と、実演と整合したLTL公式の探索における完全性を提供する。 本研究では, 高次元非線形システムにおいて, 7-DOF アームおよび四重項系の多段階タスクを記述した LTL 式を学習し, 正の例から LTL 式を学習するための競合手法よりも優れていることを示す。

We present a method for learning multi-stage tasks from demonstrations by learning the logical structure and atomic propositions of a consistent linear temporal logic (LTL) formula. The learner is given successful but potentially suboptimal demonstrations, where the demonstrator is optimizing a cost function while satisfying the LTL formula, and the cost function is uncertain to the learner. Our algorithm uses the Karush-Kuhn-Tucker (KKT) optimality conditions of the demonstrations together with a counterexample-guided falsification strategy to learn the atomic proposition parameters and logical structure of the LTL formula, respectively. We provide theoretical guarantees on the conservativeness of the recovered atomic proposition sets, as well as completeness in the search for finding an LTL formula consistent with the demonstrations. We evaluate our method on high-dimensional nonlinear systems by learning LTL formulas explaining multi-stage tasks on 7-DOF arm and quadrotor systems and show that it outperforms competing methods for learning LTL formulas from positive examples.
翻訳日:2022-11-25 18:48:53 公開日:2020-06-03
# カイ二乗発散の核化ワッサーシュタイン勾配流としてのSVGD

SVGD as a kernelized Wasserstein gradient flow of the chi-squared divergence ( http://arxiv.org/abs/2006.02509v1 )

ライセンス: Link先を確認
Sinho Chewi, Thibaut Le Gouic, Chen Lu, Tyler Maunu, Philippe Rigollet(参考訳) 一般的なサンプリングアルゴリズムであるStein Variational Gradient Descent (SVGD) は、最適な輸送の幾何学において、クルバック・リーバーの発散の勾配流としてしばしば説明される。 本稿では,svgd をchi-squared 発散の(カーネル化された)勾配流と見なす代わりに,poincar\'e 不等式のような弱条件下での均一な指数的エルゴディシティの強い形態を示す,svgd の新しい視点を紹介する。 この観点から、ターゲット密度に付随するラプラシアン作用素のスペクトル分解から実装できるラプラシアン調整ワッサーシュタイン勾配蛍光(Laplacian Adjusted Wasserstein Gradient Descent,LAWGD)と呼ばれるSVGDの代替案を提案する。 LAWGDは, コンバージェンス保証が強く, 実用性も良好であることを示す。

Stein Variational Gradient Descent (SVGD), a popular sampling algorithm, is often described as the kernelized gradient flow for the Kullback-Leibler divergence in the geometry of optimal transport. We introduce a new perspective on SVGD that instead views SVGD as the (kernelized) gradient flow of the chi-squared divergence which, we show, exhibits a strong form of uniform exponential ergodicity under conditions as weak as a Poincar\'e inequality. This perspective leads us to propose an alternative to SVGD, called Laplacian Adjusted Wasserstein Gradient Descent (LAWGD), that can be implemented from the spectral decomposition of the Laplacian operator associated with the target density. We show that LAWGD exhibits strong convergence guarantees and good practical performance.
翻訳日:2022-11-25 18:47:41 公開日:2020-06-03
# 高次元偏微分方程式に対する時空ディープニューラルネットワーク近似

Space-time deep neural network approximations for high-dimensional partial differential equations ( http://arxiv.org/abs/2006.02199v1 )

ライセンス: Link先を確認
Fabian Hornung, Arnulf Jentzen, Diyora Salimova(参考訳) It is one of the most challenging issues in applied mathematics to approximately solve high-dimensional partial differential equations (PDEs) and most of the numerical approximation methods for PDEs in the scientific literature suffer from the so-called curse of dimensionality in the sense that the number of computational operations employed in the corresponding approximation scheme to obtain an approximation precision $\varepsilon>0$ grows exponentially in the PDE dimension and/or the reciprocal of $\varepsilon$. 近年, 深層学習に基づくPDEの近似法が提案されており, 深部ニューラルネットワーク(DNN)近似は, PDE次元の$d\in\mathbb{N}$と所定精度の$\varepsilon>0$の両方において, 近似DNNを記述するために用いられる実パラメータの数が多項式的に増加するという意味で, 次元性の呪いを克服する能力を持つ可能性が示唆されている。 現在では、DNNがPDEの近似解における次元性の呪いを克服していることを証明することによって、この予想を裏付ける科学文献に厳密な結果がいくつかある。 これらの結果は、DNN が適当な PDE 解を固定時間点 $T>0$ で近似し、コンパクトな立方体 $[a,b]^d$ で空間で近似することで、次元性の呪いを克服することを証明しているが、これらの結果は、次元性の呪いを伴わない DNN で PDE 解全体が $[0,T]\times [a,b]^d$ で近似できるかどうかという疑問に対する答えを与えていない。 この問題を克服するのはまさにこの記事の主題である。 より具体的には、この研究の主な結果は、任意の$a\in\mathbb{R}$, $ b\in (a,\infty)$に対して、あるコルモゴロフ PDE の解が時空領域 $[0,T]\times [a,b]^d$ 上の DNN によって次元の呪いなしで近似できることを証明している。

It is one of the most challenging issues in applied mathematics to approximately solve high-dimensional partial differential equations (PDEs) and most of the numerical approximation methods for PDEs in the scientific literature suffer from the so-called curse of dimensionality in the sense that the number of computational operations employed in the corresponding approximation scheme to obtain an approximation precision $\varepsilon>0$ grows exponentially in the PDE dimension and/or the reciprocal of $\varepsilon$. Recently, certain deep learning based approximation methods for PDEs have been proposed and various numerical simulations for such methods suggest that deep neural network (DNN) approximations might have the capacity to indeed overcome the curse of dimensionality in the sense that the number of real parameters used to describe the approximating DNNs grows at most polynomially in both the PDE dimension $d\in\mathbb{N}$ and the reciprocal of the prescribed accuracy $\varepsilon>0$. There are now also a few rigorous results in the scientific literature which substantiate this conjecture by proving that DNNs overcome the curse of dimensionality in approximating solutions of PDEs. Each of these results establishes that DNNs overcome the curse of dimensionality in approximating suitable PDE solutions at a fixed time point $T>0$ and on a compact cube $[a,b]^d$ in space but none of these results provides an answer to the question whether the entire PDE solution on $[0,T]\times [a,b]^d$ can be approximated by DNNs without the curse of dimensionality. It is precisely the subject of this article to overcome this issue. More specifically, the main result of this work in particular proves for every $a\in\mathbb{R}$, $ b\in (a,\infty)$ that solutions of certain Kolmogorov PDEs can be approximated by DNNs on the space-time region $[0,T]\times [a,b]^d$ without the curse of dimensionality.
翻訳日:2022-11-25 18:46:57 公開日:2020-06-03
# 多次元における凸回帰:最小二乗推定子の準最適性

Convex Regression in Multidimensions: Suboptimality of Least Squares Estimators ( http://arxiv.org/abs/2006.02044v1 )

ライセンス: Link先を確認
Gil Kur, Fuchang Gao, Adityanand Guntuboyina and Bodhisattva Sen(参考訳) 最小二乗推定器 (LSE) は、通常の非パラメトリック回帰モデルにおいて、以下の関数の族ごとに$d \geq 5$ のガウス誤差を持つ二乗誤差損失に準最適であることが示されている。 (i)ポリトープ上の凸関数(固定設計) (ii)ポリトープ(ランダム設計)でサポートされた有界凸関数、及び (iii)任意の凸領域(ランダム設計)でサポートされている凸リプシッツ関数。 これらの族ごとに、lse のリスクは (対数因子による) 順序 $n^{-2/d}$ であることが証明され、minimax のリスクは $n^{-4/(d+4)}$ であり、d \ge 5$ である。 さらに、全凸 LSE に対する収束結果の第一のレート (Worst case と Adaptive) は、すべての$d \geq 1$ に対してポリトープ領域に対して確立される。 凸函数に対するいくつかの新しい計量エントロピーの結果も独立な興味を持つことを示す。

The least squares estimator (LSE) is shown to be suboptimal in squared error loss in the usual nonparametric regression model with Gaussian errors for $d \geq 5$ for each of the following families of functions: (i) convex functions supported on a polytope (in fixed design), (ii) bounded convex functions supported on a polytope (in random design), and (iii) convex Lipschitz functions supported on any convex domain (in random design). For each of these families, the risk of the LSE is proved to be of the order $n^{-2/d}$ (up to logarithmic factors) while the minimax risk is $n^{-4/(d+4)}$, for $d \ge 5$. In addition, the first rate of convergence results (worst case and adaptive) for the full convex LSE are established for polytopal domains for all $d \geq 1$. Some new metric entropy results for convex functions are also proved which are of independent interest.
翻訳日:2022-11-25 18:40:14 公開日:2020-06-03
# 短期降水予測のための運動解析とラグランジアンクープマン演算子解析のハイブリッド方式

Hybrid Scheme of Kinematic Analysis and Lagrangian Koopman Operator Analysis for Short-term Precipitation Forecasting ( http://arxiv.org/abs/2006.02064v1 )

ライセンス: Link先を確認
Shitao Zheng, Takashi Miyamoto, Koyuru Iwanami, Shingo Shimizu and Ryohei Kato(参考訳) 気象ビッグデータの蓄積に伴い、短期降水予測のためのデータ駆動モデルが期待されている。 観測データ中の規則を探索するデータ駆動型スキームであるkoopman operator analysisに注目した。 降水等の対流に伴う現象にこの手法を適用する方法を提案する。 提案手法は,流速場下での対流とラグランジアン座標下での物理量変化の間の現象の時間発展を分解する。 対流はキネマティック解析により推定され、物理量の変化はクープマン作用素解析によって推定される。 提案手法を実際の降水分布データに適用し, 降水の発生と減衰を従来の手法と比較して適切に把握し, 長期にわたって安定な予測が可能であることを示した。

With the accumulation of meteorological big data, data-driven models for short-term precipitation forecasting have shown increasing promise. We focus on Koopman operator analysis, which is a data-driven scheme to discover governing laws in observed data. We propose a method to apply this scheme to phenomena accompanying advection currents such as precipitation. The proposed method decomposes time evolutions of the phenomena between advection currents under a velocity field and changes in physical quantities under Lagrangian coordinates. The advection currents are estimated by kinematic analysis, and the changes in physical quantities are estimated by Koopman operator analysis. The proposed method is applied to actual precipitation distribution data, and the results show that the development and decay of precipitation are properly captured relative to conventional methods and that stable predictions over long periods are possible.
翻訳日:2022-11-25 18:39:10 公開日:2020-06-03
# スマートフォンを用いた屋内位置決めの課題と応用

A review of smartphones based indoor positioning: challenges and applications ( http://arxiv.org/abs/2006.02251v1 )

ライセンス: Link先を確認
Khuong An Nguyen, Zhiyuan Luo, Guang Li, Chris Watkins(参考訳) モバイルデバイスの継続的な普及は、スマートフォンを屋内の位置決めに利用する努力を大いに奨励している。 この記事では、電磁気、慣性、可視光など、最も最近かつ興味深い屋内ナビゲーションシステムについて、ユニークな課題と現実の応用の可能性を強調してレビューする。 スマートフォンセンサーの分類が導入され、レビューのために異なる位置決めシステムを分類する基礎となる。 評価目的に使用する基準のセットを考案する。 各センサ分野において, 最新の, 興味深く, 実践的なシステムについて検討し, オープンな研究課題と潜在的なクライアントの実践性について詳細に検討する。

The continual proliferation of mobile devices has encouraged much effort in using the smartphones for indoor positioning. This article is dedicated to review the most recent and interesting smartphones based indoor navigation systems, ranging from electromagnetic to inertia to visible light ones, with an emphasis on their unique challenges and potential real-world applications. A taxonomy of smartphones sensors will be introduced, which serves as the basis to categorise different positioning systems for reviewing. A set of criteria to be used for the evaluation purpose will be devised. For each sensor category, the most recent, interesting and practical systems will be examined, with detailed discussion on the open research questions for the academics, and the practicality for the potential clients.
翻訳日:2022-11-25 18:38:19 公開日:2020-06-03
# ナビゲーション強化のための講義映像セグメントの視覚的要約

Visual Summarization of Lecture Video Segments for Enhanced Navigation ( http://arxiv.org/abs/2006.02434v1 )

ライセンス: Link先を確認
Mohammad Rajiur Rahman, Jaspal Subhlok and Shishir Shah(参考訳) 講義ビデオは、高等教育にとってますます重要な学習資源である。 しかしながら、講義ビデオで興味のあるコンテンツを簡単に見つけるという課題は、このフォーマットの重要な制限である。 本稿では,ナビゲーション向上のための講義映像セグメントの視覚的要約を提案する。 講義ビデオは、コンテンツのフレーム間類似性に基づいてセグメントに分割される。 ユーザは、各セグメントの1フレームの視覚的およびテキスト的要約を見て、講義ビデオコンテンツをナビゲートする。 本稿では,そのセグメントから抽出した画像間の類似性を計算し,ほとんどの代表画像のサブセットを特定するグラフベースのアルゴリズムを用いて講義映像セグメントの視覚的要約を生成する手法を提案する。 この研究の結果は、実世界の講義ビデオ管理ポータルであるvideopointsに統合されている。 評価のための基礎的真実を収集するために,複数のユーザが手作業で40の講義ビデオセグメントにビジュアル要約を提供する調査を行った。 ユーザーは、他の選択された画像と似ているため、要約のために画像が選択されなかったかどうかも明かした。 要約画像識別のためのグラフベースアルゴリズムは、頻繁に選択された画像を基底真理とし、78%の精度と72%のf1測定値と、94%の精度と72%のf1測定値とを基底真理とする。 アルゴリズム選択された視覚要約画像の98%に対して、少なくとも1人のユーザがその要約画像を選択したり、選択した画像に類似していると考えたりした。 自動生成したサマリーの65%以上が、貧乏から非常に良質な4ポイントスケールで、ユーザによって良いか非常に良いと評価された。 全体として,本論文で紹介した手法は,講義ビデオナビゲーションに有用な高品質な視覚要約を作成できることを示す。

Lecture videos are an increasingly important learning resource for higher education. However, the challenge of quickly finding the content of interest in a lecture video is an important limitation of this format. This paper introduces visual summarization of lecture video segments to enhance navigation. A lecture video is divided into segments based on the frame-to-frame similarity of content. The user navigates the lecture video content by viewing a single frame visual and textual summary of each segment. The paper presents a novel methodology to generate the visual summary of a lecture video segment by computing similarities between images extracted from the segment and employing a graph-based algorithm to identify the subset of most representative images. The results from this research are integrated into a real-world lecture video management portal called Videopoints. To collect ground truth for evaluation, a survey was conducted where multiple users manually provided visual summaries for 40 lecture video segments. The users also stated whether any images were not selected for the summary because they were similar to other selected images. The graph based algorithm for identifying summary images achieves 78% precision and 72% F1-measure with frequently selected images as the ground truth, and 94% precision and 72% F1-measure with the union of all user selected images as the ground truth. For 98% of algorithm selected visual summary images, at least one user also selected that image for their summary or considered it similar to another image they selected. Over 65% of automatically generated summaries were rated as good or very good by the users on a 4-point scale from poor to very good. Overall, the results establish that the methodology introduced in this paper produces good quality visual summaries that are practically useful for lecture video navigation.
翻訳日:2022-11-25 18:30:10 公開日:2020-06-03
# 深層学習を用いた構造および血管造影光コヒーレンストモグラフィによる網膜液量の自動分画

Automated segmentation of retinal fluid volumes from structural and angiographic optical coherence tomography using deep learning ( http://arxiv.org/abs/2006.02569v1 )

ライセンス: Link先を確認
Yukun Guo, Tristan T. Hormel, Honglian Xiong, Jie Wang, Thomas S. Hwang, Yali Jia(参考訳) 目的:光コヒーレンストモグラフィ(oct)ボリュームで体積性網膜液をセグメント化する網膜流体セグメンテーションネットワーク(ref-net)という深層畳み込みニューラルネットワーク(cnn)を提案した。 方法: 臨床糖尿病網膜症(DR)研究51名(網膜浮腫45例,健常6例)から70kHz OCT商用アンジオビューシステム(RTVue-XR; Optovue, Inc.)を用いて3×3mm OCTスキャンを片眼で取得した。 U-Netのような構造を持つCNNが構築され、網膜液の検出と分画が行われた。 ReF-Netの訓練と試験には断面CTと血管造影(OCTA)スキャンが用いられた。 本研究では,OCTAデータを含む網膜液分画の影響について検討した。 容積網膜液はReF-Netの出力を用いて構築することができる。 エリア・アンダー・レシーバー・オペレーティング・キャラクタリスティック・カーブ(AROC), 交差点・オーバー・ユニオン(IoU), F1スコアを算出し, ReF-Netの性能評価を行った。 結果: ReF-Netは網膜液分画において高い精度(F1 = 0.864 +/0.084)を示した。 F1 = 0.892 +/- 0.038) はOCTAと構造OCTの両方からの情報を含むことでさらに改善できる。 ReF-Netはまた、シャドーアーティファクトに対して強い堅牢性を示している。 容積網膜液は2次元領域よりも包括的な情報を提供することができる。 結論: 深層学習に基づく手法では,OCT/OCTAスキャンで網膜液を定量的に分画することができる。 OCTAデータは網膜流体セグメンテーションを改善することができる。 網膜液の体積表現は2次元投影よりも優れている。 翻訳関連性: 深層学習法を用いて網膜液を体積的に分画し, OCTシステムによる糖尿病性黄斑浮腫の診断精度を向上させる可能性がある。

Purpose: We proposed a deep convolutional neural network (CNN), named Retinal Fluid Segmentation Network (ReF-Net) to segment volumetric retinal fluid on optical coherence tomography (OCT) volume. Methods: 3 x 3-mm OCT scans were acquired on one eye by a 70-kHz OCT commercial AngioVue system (RTVue-XR; Optovue, Inc.) from 51 participants in a clinical diabetic retinopathy (DR) study (45 with retinal edema and 6 healthy controls). A CNN with U-Net-like architecture was constructed to detect and segment the retinal fluid. Cross-sectional OCT and angiography (OCTA) scans were used for training and testing ReF-Net. The effect of including OCTA data for retinal fluid segmentation was investigated in this study. Volumetric retinal fluid can be constructed using the output of ReF-Net. Area-under-Receiver-Operating-Characteristic-curve (AROC), intersection-over-union (IoU), and F1-score were calculated to evaluate the performance of ReF-Net. Results: ReF-Net shows high accuracy (F1 = 0.864 +/- 0.084) in retinal fluid segmentation. The performance can be further improved (F1 = 0.892 +/- 0.038) by including information from both OCTA and structural OCT. ReF-Net also shows strong robustness to shadow artifacts. Volumetric retinal fluid can provide more comprehensive information than the 2D area, whether cross-sectional or en face projections. Conclusions: A deep-learning-based method can accurately segment retinal fluid volumetrically on OCT/OCTA scans with strong robustness to shadow artifacts. OCTA data can improve retinal fluid segmentation. Volumetric representations of retinal fluid are superior to 2D projections. Translational Relevance: Using a deep learning method to segment retinal fluid volumetrically has the potential to improve the diagnostic accuracy of diabetic macular edema by OCT systems.
翻訳日:2022-11-25 18:29:41 公開日:2020-06-03
# フォトグラファーのリタッチ予測のための複数生成逆ネットワーク解析

Multiple Generative Adversarial Networks Analysis for Predicting Photographers' Retouching ( http://arxiv.org/abs/2006.02921v1 )

ライセンス: Link先を確認
Marc Bickel, Samuel Dubuis, S\'ebastien Gachoud(参考訳) 誰でも写真を撮れるが、誰もが自分の写真をリタッチしてプロに近い結果が得られるわけではない。 専門家に何千もの写真を再編集するよう依頼することは不可能であるため、専門家の仕事を再現する方法をソフトウェアに教えることを考えました。 本研究の目的は, 深層学習手法, より具体的には, 生成的敵ネットワーク(GAN)を用いて, アーティストのリタッチを模倣し, どのモデルが最良の結果をもたらすかを明らかにすることである。

Anyone can take a photo, but not everybody has the ability to retouch their pictures and obtain result close to professional. Since it is not possible to ask experts to retouch thousands of pictures, we thought about teaching a piece of software how to reproduce the work of those said experts. This study aims to explore the possibility to use deep learning methods and more specifically, generative adversarial networks (GANs), to mimic artists' retouching and find which one of the studied models provides the best results.
翻訳日:2022-11-25 18:29:05 公開日:2020-06-03
# Tangles: クラスタと型のための新しいパラダイム

Tangles: a new paradigm for clusters and types ( http://arxiv.org/abs/2006.01830v1 )

ライセンス: Link先を確認
Reinhard Diestel(参考訳) 従来のクラスタリングは、特定の特性を共有するオブジェクトのグループを識別する。 タングルは、しばしば一緒に起こる品質のグループを識別する。 これにより、行動、政治観、テキスト、ウイルスのタイプを発見、関連付け、構造化することができる。 所望であれば、オブジェクトの直接クラスタリングにも使用することができる。 これらはファジィクラスタに特に適合する精密で定量的なパラダイムを提供するが、それらは集合的に形成されるクラスタへのオブジェクトの“ハード”割り当てを必要としない。 これは、経験科学におけるタングルの適用について準備している本の導入章の草稿です。 このドラフトを早めに投稿する目的は、タングル応用の著者に、数学以外でのタングル応用の基礎となる基本的な原則の一般的な参照を与えることであり、そのため、彼ら自身の論文では、ジェネリックストーリーを毎回繰り返すのではなく、特定のアプリケーションに固有のアイデアに集中することができる。 テキストは、自然科学、社会科学、そして機械学習を含むデータサイエンスにおいて、つるに関する3つの異なる一般的な紹介から始まる。 そして、これら全ての潜在的な応用を包含するタングルの抽象概念の短い非公式な記述を与える。

Traditional clustering identifies groups of objects that share certain qualities. Tangles do the converse: they identify groups of qualities that often occur together. They can thereby discover, relate, and structure types: of behaviour, political views, texts, or viruses. If desired, tangles can also be used for direct clustering of objects. They offer a precise, quantitative paradigm suited particularly to fuzzy clusters, since they do not require any `hard' assignments of objects to the clusters they collectively form. This is a draft of the introductory chapter of a book I am preparing on the application of tangles in the empirical sciences. The purpose of posting this draft early is to give authors of tangle application papers a generic reference for the basic guiding principles underlying tangle applications outside mathematics, so that in their own papers they can concentrate on the ideas specific to their particular application rather than having to repeat the generic story each time. The text starts with three separate generic introductions to tangles in the natural sciences, in the social sciences, and in data science including machine learning. It then gives a short informal description of the abstract notion of tangles that encompasses all these potential applications.
翻訳日:2022-11-25 18:21:48 公開日:2020-06-03
# 連続状態マルコフ決定過程に対するカーネルテイラー値関数近似

Kernel Taylor-Based Value Function Approximation for Continuous-State Markov Decision Processes ( http://arxiv.org/abs/2006.02008v1 )

ライセンス: Link先を確認
Junhong Xu, Kai Yin, Lantao Liu(参考訳) 我々は,連続状態マルコフ決定プロセス(mdps)を解くために,カーネルベースポリシー反復アルゴリズムを提案する。 完全に知られた状態遷移モデルを想定しているほとんどの決定論的な計画フレームワークとは対照的に、そのような強い仮定を排除する方法を設計します。 これを達成するために、まず値関数の2階テイラー展開を適用する。 ベルマン最適性方程式は、遷移モデルの第一モーメントと第二モーメントのみに依存する偏微分方程式によって近似される。 価値関数の核表現を組み合わせることで、有限個の支持状態からなる方程式の線形系としてポリシー評価ステップを表現できる効率的なポリシー反復アルゴリズムを設計する。 提案手法は,簡易かつ現実的な計画シナリオの両方において広範囲なシミュレーションにより検証し,提案手法が複数のベースライン法よりも優れた性能をもたらすことを示す。

We propose a principled kernel-based policy iteration algorithm to solve the continuous-state Markov Decision Processes (MDPs). In contrast to most decision-theoretic planning frameworks, which assume fully known state transition models, we design a method that eliminates such a strong assumption, which is oftentimes extremely difficult to engineer in reality. To achieve this, we first apply the second-order Taylor expansion of the value function. The Bellman optimality equation is then approximated by a partial differential equation, which only relies on the first and second moments of the transition model. By combining the kernel representation of value function, we then design an efficient policy iteration algorithm whose policy evaluation step can be represented as a linear system of equations characterized by a finite set of supporting states. We have validated the proposed method through extensive simulations in both simplified and realistic planning scenarios, and the experiments show that our proposed approach leads to a much superior performance over several baseline methods.
翻訳日:2022-11-25 18:21:32 公開日:2020-06-03
# 整数付き$\mathcal{ALC}$のExpTimeアッパーバウンド(拡張バージョン)

An ExpTime Upper Bound for $\mathcal{ALC}$ with Integers (Extended Version) ( http://arxiv.org/abs/2006.02078v1 )

ライセンス: Link先を確認
Nadia Labai, Magdalena Ortiz, Mantas \v{S}imkus(参考訳) 具体的なドメイン、特に特徴と数値を比較することを可能にするドメインは、長い間、記述論理(dls)の非常に望ましい拡張として認識されてきた。 表現力のあるDLや一般的なTBoxの存在下では、一貫性のような標準的な推論タスクにおいて、最も一般的な決定可能性の結果は、高密度でなければならないいわゆる$\omega$-admissibleドメインである。 整数や自然数にまたがる機能に対するナンセンスなドメインのサポートは、しばしば非常に望ましい拡張として除外されるにもかかわらず、ほとんどオープンのままであった。 非密度領域を持つ$\mathcal{ALC}$のいくつかの拡張の決定性は示されているが、既存の結果は問題の複雑さに基本的な境界を推測できない強力な機械に依存している。 本稿では,機能比較を可能にするリッチ整数領域を持つ$\mathcal{alc}$の拡張について検討し,単一指数時間でオートマトン理論を用いて一貫性を解決できることを証明し,標準$\mathcal{alc}$よりも最悪の場合の複雑性をもたないことを示す。 我々の上限は、文献から知られている具体的なドメインを持つdlsの拡張に適用され、一般的なtboxをサポートし、通常の(必ずしも機能的ではない)役割の経路に沿って値を比較することができる。

Concrete domains, especially those that allow to compare features with numeric values, have long been recognized as a very desirable extension of description logics (DLs), and significant efforts have been invested into adding them to usual DLs while keeping the complexity of reasoning in check. For expressive DLs and in the presence of general TBoxes, for standard reasoning tasks like consistency, the most general decidability results are for the so-called $\omega$-admissible domains, which are required to be dense. Supporting non-dense domains for features that range over integers or natural numbers remained largely open, despite often being singled out as a highly desirable extension. The decidability of some extensions of $\mathcal{ALC}$ with non-dense domains has been shown, but existing results rely on powerful machinery that does not allow to infer any elementary bounds on the complexity of the problem. In this paper, we study an extension of $\mathcal{ALC}$ with a rich integer domain that allows for comparisons (between features, and between features and constants coded in unary), and prove that consistency can be solved using automata-theoretic techniques in single exponential time, and thus has no higher worst-case complexity than standard $\mathcal{ALC}$. Our upper bounds apply to some extensions of DLs with concrete domains known from the literature, support general TBoxes, and allow for comparing values along paths of ordinary (not necessarily functional) roles.
翻訳日:2022-11-25 18:21:17 公開日:2020-06-03
# 制約緩和

Constraint Reductions ( http://arxiv.org/abs/2006.02081v1 )

ライセンス: Link先を確認
Olivier Bailleux (LIB), Yacine Boufkhad (LIAFA)(参考訳) 本論文は, cp 2003 論文 " efficient cnf encoding of boolean cardinality constraints" の解説である。 その文脈を想起した後、一般アーク一貫性(gac)に関する帰納的パワーに関して制約の分類を概説する。

This is a commentary on the CP 2003 paper "Efficient cnf encoding of boolean cardinality constraints". After recalling its context, we outline a classification of Constraints with respect to their deductive power regarding General Arc Consistency (GAC).
翻訳日:2022-11-25 18:20:50 公開日:2020-06-03
# プロセス構成のための混合イニシアティブセマンティックWebフレームワーク

A Mixed Initiative Semantic Web Framework for Process Composition ( http://arxiv.org/abs/2006.02168v1 )

ライセンス: Link先を確認
Jinghai Rao and Dimitar Dimitrov and Paul Hofmann and Norman Sadeh(参考訳) セマンティックweb技術は、ある組織内であれ、複数の組織内であれ、新しい複合プロセスをサポートするために既存のエンタープライズ機能を統合するのに必要な労力を大幅に削減できる。 この領域では、すべての機能が、リッチで正確なアノテーションを備えたセマンティックWebサービスの形でカプセル化されていると仮定しながら、このプロセスを完全に自動化することを目的としている。 この記事では、この仮定はしばしば非現実的であると論じる。 代わりに、アノテーションが不完全で一貫性のない環境において、人間の意思決定と自動化機能を柔軟にインターリーブすることを目的とした、セマンティックwebサービスディスカバリとコンポジションのための混合イニシアティブフレームワークについて説明する。

Semantic Web technologies offer the prospect of significantly reducing the amount of effort required to integrate existing enterprise functionality in support of new composite processes; whether within a given organization or across multiple ones. A significant body of work in this area has aimed to fully automate this process, while assuming that all functionality has already been encapsulated in the form of semantic web services with rich and accurate annotations. In this article, we argue that this assumption is often unrealistic. Instead, we describe a mixed initiative framework for semantic web service discovery and composition that aims at flexibly interleaving human decision making and automated functionality in environments where annotations may be incomplete and even inconsistent.
翻訳日:2022-11-25 18:20:47 公開日:2020-06-03
# 非均一な計測ノイズと異方性カーネルによるガウス過程回帰による自律材料発見

Autonomous Materials Discovery Driven by Gaussian Process Regression with Inhomogeneous Measurement Noise and Anisotropic Kernels ( http://arxiv.org/abs/2006.02489v1 )

ライセンス: Link先を確認
Marcus M. Noack, Gregory S. Doerk, Ruipeng Li, Jason K. Streit, Richard A. Vaia, Kevin G. Yager, Masafumi Fukuto(参考訳) 実験分野の大半は、新しい科学的発見を探すために大規模で高次元のパラメータ空間を探索するという課題に直面している。 材料科学は例外ではなく、物質の性質に影響を与える様々な合成、加工、環境条件が特に広大なパラメータ空間を生み出している。 近年の進歩により、探査プロセスの自動化が進み、材料発見の効率が向上した。 近年、自律実験の手法はより洗練され、多次元のパラメータ空間を人間の介入を最小限に抑え、解釈や大局的な決定に注目する科学者を解放した。 ガウス過程回帰(GPR)技術は多くの実験のクラスを操る方法として登場した。 我々は最近,GPR駆動による意思決定アルゴリズムがシンクロトロンビームラインでの自律的操舵実験に与える影響を実証した。 しかしながら、実験の複雑さのため、GPRは最も基本的な形では使用できないことが多いが、実験の特別な要件を考慮に入れなければならない。 非均質な測定ノイズ(入力依存性または非i.i.d.)と異方性核関数という2つの要求が特に重要であるように思われる。 総合的および実験的なテストは,材料科学における実験における概念と,自律的意思決定プロセスにそれらを含めることによるメリットの両方の重要性を実証する。

A majority of experimental disciplines face the challenge of exploring large and high-dimensional parameter spaces in search of new scientific discoveries. Materials science is no exception; the wide variety of synthesis, processing, and environmental conditions that influence material properties gives rise to particularly vast parameter spaces. Recent advances have led to an increase in efficiency of materials discovery by increasingly automating the exploration processes. Methods for autonomous experimentation have become more sophisticated recently, allowing for multi-dimensional parameter spaces to be explored efficiently and with minimal human intervention, thereby liberating the scientists to focus on interpretations and big-picture decisions. Gaussian process regression (GPR) techniques have emerged as the method of choice for steering many classes of experiments. We have recently demonstrated the positive impact of GPR-driven decision-making algorithms on autonomously steering experiments at a synchrotron beamline. However, due to the complexity of the experiments, GPR often cannot be used in its most basic form, but rather has to be tuned to account for the special requirements of the experiments. Two requirements seem to be of particular importance, namely inhomogeneous measurement noise (input dependent or non-i.i.d.) and anisotropic kernel functions, which are the two concepts that we tackle in this paper. Our synthetic and experimental tests demonstrate the importance of both concepts for experiments in materials science and the benefits that result from including them in the autonomous decision-making process.
翻訳日:2022-11-25 18:20:35 公開日:2020-06-03
# Valid and Adaptive Coverage を用いた分類

Classification with Valid and Adaptive Coverage ( http://arxiv.org/abs/2006.02544v1 )

ライセンス: Link先を確認
Yaniv Romano, Matteo Sesia, Emmanuel J. Cand\`es(参考訳) Conformal Inference, cross-validation+, and the jackknife+は、ほぼすべての機械学習アルゴリズムと組み合わせて、限界カバレッジを保証する予測セットを構築することができるホールドアウト方式である。 本稿では,これらの手法を分類的・非順序対応ラベルに特化して開発し,限界範囲のカバレッジを提供するとともに,他の手法と比較して近似的条件付きカバレッジで良好に機能するという意味で,複雑なデータ分布に適応する。 私たちの貢献の核心は、新しい整合性スコアであり、分類問題に対して強力で直感的であることを明確に示しています。 合成データおよび実データ実験は,提案手法の既存代替案に対する統計的利点と理論保証の実用的価値を実証するものである。

Conformal inference, cross-validation+, and the jackknife+ are hold-out methods that can be combined with virtually any machine learning algorithm to construct prediction sets with guaranteed marginal coverage. In this paper, we develop specialized versions of these techniques for categorical and unordered response labels that, in addition to providing marginal coverage, are also fully adaptive to complex data distributions, in the sense that they perform favorably in terms of approximate conditional coverage compared to alternative methods. The heart of our contribution is a novel conformity score, which we explicitly demonstrate to be powerful and intuitive for classification problems, but whose underlying principle is potentially far more general. Experiments on synthetic and real data demonstrate the practical value of our theoretical guarantees, as well as the statistical advantages of the proposed methods over the existing alternatives.
翻訳日:2022-11-25 18:20:13 公開日:2020-06-03
# ニューラルネットワークと水-気象変数を用いた短期・長期干ばつ予測

Prediction of short and long-term droughts using artificial neural networks and hydro-meteorological variables ( http://arxiv.org/abs/2006.02581v1 )

ライセンス: Link先を確認
Yousef Hassanzadeh, Mohammadvaghef Ghazvinian, Amin Abdi, Saman Baharvand, Ali Jozaghi(参考訳) 干ばつは自然に恐ろしい脅威であり、人間の生活の様々な側面に多くのダメージを与える。 正確な干ばつ予測は、政策立案者が干ばつリスク管理戦略を立案する上で有望なステップだ。 この目的を達成するために、適切なモデルを選択することは、予測アプローチにおいて重要な役割を果たす。 本研究では,イランのタブリズ市で3, 6, 12, 24, 48ヶ月の干ばつを,SPI(Standardized Precipitation Index)を用いて短期および長期の干ばつを予測するために,ANN(Artificial Neural Network)の異なるモデルを用いた。 この目的のために,1992年から2010年の間,降水,風速,相対湿度,日照時間など,計算されたspiと各種水文気象変数の時系列の組み合わせを用いて,アンモデルを訓練した。 モデル性能を比較するために, rmse, 平均絶対誤差 (mae) および相関係数 (cc) などのよく知られた尺度が本研究で活用されている。 その結果,全ての水文-気象変数の応用は,異なる時間スケールでのSPIの予測を著しく改善することがわかった。

Drought is a natural creeping threat with numerous damaging effects in various aspects of human life. Accurate drought prediction is a promising step in helping policy makers to set drought risk management strategies. To fulfill this purpose, choosing appropriate models plays an important role in predicting approach. In this study, different models of Artificial Neural Network (ANN) are employed to predict short and long-term of droughts by using Standardized Precipitation Index (SPI) at different time scales, including 3, 6, 12, 24 and 48 months in Tabriz city, Iran. To this end, different combination of calculated SPI and time series of various hydro-meteorological variables, such as precipitation, wind velocity, relative humidity and sunshine hours for years 1992 to 2010 are used to train the ANN models. In order to compare the models performances, some well-known measures, namely RMSE, Mean Absolute Error (MAE) and Correlation Coefficient (CC) are utilized in the present study. The results illustrate that the application of all hydro-meteorological variables significantly improves the prediction of SPI at different time scales.
翻訳日:2022-11-25 18:19:57 公開日:2020-06-03
# realからsynthetic、backへ:多人数場面理解のためのトレーニングデータの合成

From Real to Synthetic and Back: Synthesizing Training Data for Multi-Person Scene Understanding ( http://arxiv.org/abs/2006.02110v1 )

ライセンス: Link先を確認
Igor Kviatkovsky, Nadav Bhonker and Gerard Medioni(参考訳) 特定のシナリオで対話する複数の人物の自然に見える画像を合成する手法を提案する。 これらの画像は、合成データの利点の恩恵を受ける: 完全に制御可能で、任意の種類の標準またはカスタム定義の基底真理に完全にアノテートされる。 合成ドメイン間ギャップを低減するため、以下のステップからなるパイプラインを導入する。 1)現実世界をモデルにしたコンテキストでシーンを描画する。 2)合成画像上で人間の構文解析モデルを訓練する。 3)本モデルを用いて,実画像のセグメンテーションマップを推定する。 4) 条件生成逆数ネットワーク(cGAN)を訓練し, セグメントマップから実画像への逆写像を学習する。 5) 新たに合成セグメンテーションマップが得られた場合, cGANを用いてリアルな画像を生成する。 パイプラインの例が図2に示されています。 生成されたデータを用いて,uvマッピングと密集深度推定の課題に対して,マルチタスクモデルを訓練する。 我々は、CMU Panoptic Dataset上で、データ生成と訓練されたモデルの価値を定量的かつ質的に示す。

We present a method for synthesizing naturally looking images of multiple people interacting in a specific scenario. These images benefit from the advantages of synthetic data: being fully controllable and fully annotated with any type of standard or custom-defined ground truth. To reduce the synthetic-to-real domain gap, we introduce a pipeline consisting of the following steps: 1) we render scenes in a context modeled after the real world, 2) we train a human parsing model on the synthetic images, 3) we use the model to estimate segmentation maps for real images, 4) we train a conditional generative adversarial network (cGAN) to learn the inverse mapping -- from a segmentation map to a real image, and 5) given new synthetic segmentation maps, we use the cGAN to generate realistic images. An illustration of our pipeline is presented in Figure 2. We use the generated data to train a multi-task model on the challenging tasks of UV mapping and dense depth estimation. We demonstrate the value of the data generation and the trained model, both quantitatively and qualitatively on the CMU Panoptic Dataset.
翻訳日:2022-11-25 18:13:15 公開日:2020-06-03
# 相関型融合によるマルチテンポラルシーン分類とシーン変化検出

Multi-Temporal Scene Classification and Scene Change Detection with Correlation based Fusion ( http://arxiv.org/abs/2006.02176v1 )

ライセンス: Link先を確認
Lixiang Ru, Bo Du and Chen Wu(参考訳) 多時期的景観土地利用カテゴリーの分類と都市部を包含する画像のセマンティックシーンレベルの変化の検出は、土地利用の変遷を直線的に反映することができる。 既存のシーン変化検出法は,バイタイム特徴の時間的相関にほとんど注目せず,小規模シーン変化検出データセットを中心に評価されている。 本研究では,両時間特徴埋め込みにおいて高相関成分を融合させるCorrFusionモジュールを提案する。 まず、両時間入力の深部表現を深部畳み込みネットワークで抽出する。 次に抽出された特徴を低次元空間に投影し、インスタンスレベルの相関を計算する。 CorrFusionモジュールの計算相関に基づいて時間的相互融合を行う。 最終シーン分類はソフトマックス活性化層を用いて行われる。 目的関数において,時間相関を計算するための新しい定式化を導入した。 本論文では,提案モジュールのバックプロパゲーション勾配の詳細な導出についても述べる。 さらに,より大規模なシーン変化検出データセットを示し,このデータセットについて実験を行った。 実験の結果,提案するcorrfusionモジュールは,多時的シーン分類とシーン変化検出結果を大幅に改善できることがわかった。

Classifying multi-temporal scene land-use categories and detecting their semantic scene-level changes for imagery covering urban regions could straightly reflect the land-use transitions. Existing methods for scene change detection rarely focus on the temporal correlation of bi-temporal features, and are mainly evaluated on small scale scene change detection datasets. In this work, we proposed a CorrFusion module that fuses the highly correlated components in bi-temporal feature embeddings. We firstly extracts the deep representations of the bi-temporal inputs with deep convolutional networks. Then the extracted features will be projected into a lower dimension space to computed the instance-level correlation. The cross-temporal fusion will be performed based on the computed correlation in CorrFusion module. The final scene classification are obtained with softmax activation layers. In the objective function, we introduced a new formulation for calculating the temporal correlation. The detailed derivation of backpropagation gradients for the proposed module is also given in this paper. Besides, we presented a much larger scale scene change detection dataset and conducted experiments on this dataset. The experimental results demonstrated that our proposed CorrFusion module could remarkably improve the multi-temporal scene classification and scene change detection results.
翻訳日:2022-11-25 18:12:47 公開日:2020-06-03
# エンコーダ・デコーダ方式による潜在空間の照明推定によるシーンリライト

Scene relighting with illumination estimation in the latent space on an encoder-decoder scheme ( http://arxiv.org/abs/2006.02333v1 )

ライセンス: Link先を確認
Alexandre Pierre Dherse, Martin Nicolas Everaert, Jakub Jan Gwizda{\l}a(参考訳) 2つの画像間で照明条件を転送する画像リライト作業は、写真、撮影、コンピュータグラフィックスの潜在的な応用において、興味深い、そして困難な課題となる。 本報告では,その目標を達成するための手法を提案する。 我々のモデルは、シーン内容、光源位置、色温度の異なる人工的な場所のレンダリングデータセットに基づいて訓練されている。 このデータセットでは,対象場面の潜在空間表現における光条件の推測と置換を目的とした照明推定成分を備えたネットワークを用いた。

The image relighting task of transferring illumination conditions between two images offers an interesting and difficult challenge with potential applications in photography, cinematography and computer graphics. In this report we present methods that we tried to achieve that goal. Our models are trained on a rendered dataset of artificial locations with varied scene content, light source location and color temperature. With this dataset, we used a network with illumination estimation component aiming to infer and replace light conditions in the latent space representation of the concerned scenes.
翻訳日:2022-11-25 18:12:13 公開日:2020-06-03
# グラフ畳み込みネットワークの自己指導型学習

Self-supervised Training of Graph Convolutional Networks ( http://arxiv.org/abs/2006.02380v1 )

ライセンス: Link先を確認
Qikui Zhu, Bo Du, Pingkun Yan(参考訳) グラフ畳み込みニューラルネットワーク(GCN)は、古典的畳み込みニューラルネットワーク(CNN)を直接使用できない非グリッドデータの解析に成功している。 GCNとCNNが共有している類似点は、ネットワークトレーニングに大量のラベル付きデータを必要とすることである。 さらに、GCNは、これらの非グリッドデータ間の関係を定義するために、入力として隣接行列を必要とし、トレーニング、検証、テストデータを含むすべてのデータは通常、トレーニングのために1つのグラフ構造データのみを形成する。 さらに、隣接行列は通常予め定義され静止しており、構築したグラフ構造データにデータ拡張戦略を適用できないため、トレーニングデータの量を増やすことができる。 本稿では,限られた学習データの下での学習能力とモデル性能をさらに向上させるために,入力グラフ構造データ自体から利用可能な情報を活用するための2種類の自己教師型学習戦略を提案する。 提案手法は,Citeseer,Cora,Pubmedの3つの公開引用ネットワークデータセットを持つ2つの代表的なGCNモデルに対して検討した。 実験の結果,提案手法の可搬性とともに一般化能力が示され,機能学習における自己教師付き学習の能力により,gcnsの性能が大幅に向上した。

Graph Convolutional Networks (GCNs) have been successfully applied to analyze non-grid data, where the classical convolutional neural networks (CNNs) cannot be directly used. One similarity shared by GCNs and CNNs is the requirement of massive amount of labeled data for network training. In addition, GCNs need the adjacency matrix as input to define the relationship between those non-grid data, which leads to all of data including training, validation and test data typically forms only one graph structures data for training. Furthermore, the adjacency matrix is usually pre-defined and stationary, which makes the data augmentation strategies cannot be employed on the constructed graph structures data to augment the amount of training data. To further improve the learning capacity and model performance under the limited training data, in this paper, we propose two types of self-supervised learning strategies to exploit available information from the input graph structure data itself. Our proposed self-supervised learning strategies are examined on two representative GCN models with three public citation network datasets - Citeseer, Cora and Pubmed. The experimental results demonstrate the generalization ability as well as the portability of our proposed strategies, which can significantly improve the performance of GCNs with the power of self-supervised learning in improving feature learning.
翻訳日:2022-11-25 18:11:48 公開日:2020-06-03
# DGSAC:密度誘導サンプリングとコンセンサス

DGSAC: Density Guided Sampling and Consensus ( http://arxiv.org/abs/2006.02413v1 )

ライセンス: Link先を確認
Lokender Tiwari and Saket Anand(参考訳) 堅牢な多重モデルフィッティングは、多くのコンピュータビジョンアプリケーションにおいて重要な役割を果たす。 シングルモデルフィッティング問題とは異なり、マルチモデルフィッティングにはさらなる課題がある。 未知数のモデルと不規則なノイズスケールは、一般に利用者が地中またはその他の補助情報を用いて提供する最も重要な2つのモデルである。 モード探索/クラスタリングに基づくアプローチは、生成されたモデル仮説の品質に依存する。 選好分析に基づくガイド付きサンプリングアプローチは顕著なパフォーマンスを示しているが、彼らは時間予算フレームワークで動作し、ユーザーは合理的な推測として時間を提供する。 本稿では,モード探索と時間予算の枠組みから逸脱する。 本稿では,カーネル残留密度 (krd) という概念を提案し,マルチモデルフィッティングパイプラインの各種コンポーネントに適用する。 Kernel Residual Densityは、inlierとoutlierの間の重要な差別化要因として機能する。 我々は、KRDを使用してサンプリングプロセスをガイドし、自動的に停止する。 サンプリングプロセスは、すべてのデータポイントを説明できる一連の仮説を生成すると停止する。 各データポイントに対して説明スコアを維持し、オンザフライで更新する。 本稿では,2つのモデル選択アルゴリズム,最適2次プログラム,および欲求性を提案する。 モード探索手法とは異なり、モデル選択アルゴリズムは、データに存在する各真の構造に対する1つの代表仮説を求める。 我々は, 平面分割, 運動分割, 消滅点推定, 3次元点雲への平面嵌合, 直線, 円環の嵌合など, 様々なタスクにおける手法(DGSAC)の評価を行い, 提案手法の有効性と統一性を示した。

Robust multiple model fitting plays a crucial role in many computer vision applications. Unlike single model fitting problems, the multi-model fitting has additional challenges. The unknown number of models and the inlier noise scale are the two most important of them, which are in general provided by the user using ground-truth or some other auxiliary information. Mode seeking/ clustering-based approaches crucially depend on the quality of model hypotheses generated. While preference analysis based guided sampling approaches have shown remarkable performance, they operate in a time budget framework, and the user provides the time as a reasonable guess. In this paper, we deviate from the mode seeking and time budget framework. We propose a concept called Kernel Residual Density (KRD) and apply it to various components of a multiple-model fitting pipeline. The Kernel Residual Density act as a key differentiator between inliers and outliers. We use KRD to guide and automatically stop the sampling process. The sampling process stops after generating a set of hypotheses that can explain all the data points. An explanation score is maintained for each data point, which is updated on-the-fly. We propose two model selection algorithms, an optimal quadratic program based, and a greedy. Unlike mode seeking approaches, our model selection algorithms seek to find one representative hypothesis for each genuine structure present in the data. We evaluate our method (dubbed as DGSAC) on a wide variety of tasks like planar segmentation, motion segmentation, vanishing point estimation, plane fitting to 3D point cloud, line, and circle fitting, which shows the effectiveness of our method and its unified nature.
翻訳日:2022-11-25 18:11:18 公開日:2020-06-03
# CircleNet:円表現によるアンカーレス検出

CircleNet: Anchor-free Detection with Circle Representation ( http://arxiv.org/abs/2006.02474v1 )

ライセンス: Link先を確認
Haichun Yang, Ruining Deng, Yuzhe Lu, Zheyu Zhu, Ye Chen, Joseph T. Roland, Le Lu, Bennett A. Landman, Agnes B. Fogo, Yuankai Huo(参考訳) 物体検出ネットワークはコンピュータビジョンにおいて強力であるが、生体医学的物体検出に最適化されるとは限らない。 本研究では,球状糸球体検出のための円表現を用いた簡易アンカーフリー検出法circlenetを提案する。 従来のバウンディングボックスに基づく検出方法とは異なり、バウンディングサークル(1)は検出表現の自由度を減少させ、(2)自然回転不変であり、(3)ボール状物体に最適化される。 この表現を可能にする重要なイノベーションは、円検出ヘッドを備えたアンカーフリーフレームワークである。 糸球体検出におけるCircleNetの評価を行った。 CircleNet は 0.598 から 0.647 まで、糸球体検出の平均精度を高める。 もう1つの大きな利点は、CircleNetがバウンディングボックス表現よりも回転整合性が高いことである。

Object detection networks are powerful in computer vision, but not necessarily optimized for biomedical object detection. In this work, we propose CircleNet, a simple anchor-free detection method with circle representation for detection of the ball-shaped glomerulus. Different from the traditional bounding box based detection method, the bounding circle (1) reduces the degrees of freedom of detection representation, (2) is naturally rotation invariant, (3) and optimized for ball-shaped objects. The key innovation to enable this representation is the anchor-free framework with the circle detection head. We evaluate CircleNet in the context of detection of glomerulus. CircleNet increases average precision of the glomerulus detection from 0.598 to 0.647. Another key advantage is that CircleNet achieves better rotation consistency compared with bounding box representations.
翻訳日:2022-11-25 18:10:46 公開日:2020-06-03
# 気象条件下でのロバスト交通信号検出のためのディープラーニングフレームワークDFR-TSD

DFR-TSD: A Deep Learning Based Framework for Robust Traffic Sign Detection Under Challenging Weather Conditions ( http://arxiv.org/abs/2006.02578v1 )

ライセンス: Link先を確認
Sabbir Ahmed, Uday Kamal, Md. Kamrul Hasan(参考訳) ロバスト信号の検出と認識(TSDR)は、自動運転車技術の実現に成功するための最重要課題である。 この課題の重要性は膨大な研究努力につながり、既存の文献では多くの有望な方法が提案されている。 しかし、SOTA(SOTA)手法は、クリーンでチャレンジフリーなデータセットで評価され、野生で捉えたトラフィックイメージを隠蔽する異なる困難条件(CC)に関連した性能劣化を見逃した。 本稿では,CCにおけるTSDR問題について考察し,それに伴う性能劣化に着目した。 これを解決するために、事前拡張を伴う畳み込みニューラルネットワーク(CNN)ベースのTSDRフレームワークを提案する。 我々のモジュラーアプローチは、CNNベースのチャレンジ分類器、Enhance-Net、画像強調のためのエンコーダデコーダCNNアーキテクチャ、署名検出と分類のための2つのCNNアーキテクチャからなる。 そこで本研究では,トラヒックサイン領域(画像全体ではなく)の精度向上に焦点をあてたエンハンスネットのための新しいトレーニングパイプラインを提案する。 提案手法の有効性を評価するために,異なるCC下で撮影されたトラフィックビデオからなるCURE-TSDデータセットを使用した。 本手法は,現在のベンチマークと比較し,総精度が91.1%,リコール率70.71%,精度が7.58%,リコール率が35.90%向上することを実験的に示した。 さらに,本手法とSOTAオブジェクト検出ネットワーク,Faster-RCNN,R-FCNとの比較により,提案手法が大きなマージンで優れていることを示す。

Robust traffic sign detection and recognition (TSDR) is of paramount importance for the successful realization of autonomous vehicle technology. The importance of this task has led to a vast amount of research efforts and many promising methods have been proposed in the existing literature. However, the SOTA (SOTA) methods have been evaluated on clean and challenge-free datasets and overlooked the performance deterioration associated with different challenging conditions (CCs) that obscure the traffic images captured in the wild. In this paper, we look at the TSDR problem under CCs and focus on the performance degradation associated with them. To overcome this, we propose a Convolutional Neural Network (CNN) based TSDR framework with prior enhancement. Our modular approach consists of a CNN-based challenge classifier, Enhance-Net, an encoder-decoder CNN architecture for image enhancement, and two separate CNN architectures for sign-detection and classification. We propose a novel training pipeline for Enhance-Net that focuses on the enhancement of the traffic sign regions (instead of the whole image) in the challenging images subject to their accurate detection. We used CURE-TSD dataset consisting of traffic videos captured under different CCs to evaluate the efficacy of our approach. We experimentally show that our method obtains an overall precision and recall of 91.1% and 70.71% that is 7.58% and 35.90% improvement in precision and recall, respectively, compared to the current benchmark. Furthermore, we compare our approach with SOTA object detection networks, Faster-RCNN and R-FCN, and show that our approach outperforms them by a large margin.
翻訳日:2022-11-25 18:04:47 公開日:2020-06-03
# RODE-Net:データからランダムな正規微分方程式を学習する

RODE-Net: Learning Ordinary Differential Equations with Randomness from Data ( http://arxiv.org/abs/2006.02377v1 )

ライセンス: Link先を確認
Junyu Liu, Zichao Long, Ranran Wang, Jie Sun, Bin Dong(参考訳) ランダム常微分方程式(RODE)、すなわちランダムパラメータを持つODEは、複雑な力学をモデル化するためにしばしば用いられる。 観測データから未知の統治的RODEを特定する方法の多くは、しばしば強い事前知識に依存している。 事前知識の少ないデータから支配方程式を抽出することは、依然として大きな課題である。 本稿では,微分方程式の記号表現とパラメータの分布を同時に組み合わせることで,その課題に対処するディープニューラルネットワーク RODE-Net を提案する。 RODE-Netをトレーニングするために、まず、測定データに基づいて決定論的逆問題の集合を解くことで、シンボルネットワーク \cite{long2019pde} を用いて未知のRODEのパラメータを推定し、生成逆ネットワーク(GAN)を用いてRODEのパラメータの真の分布を推定する。 そして、トレーニングされたGANを正規化として、ODEのパラメータの推定をさらに改善する。 2つのステップは代わりに操作される。 数値計算の結果,rode-netはシミュレーションデータを用いてモデルパラメータの分布を推定でき,信頼性の高い予測が可能となった。 なお、GANはRODE-Netのデータ駆動正規化として機能し、システム識別によく使用される$\ell_1$ベースの正規化よりも効果的である。

Random ordinary differential equations (RODEs), i.e. ODEs with random parameters, are often used to model complex dynamics. Most existing methods to identify unknown governing RODEs from observed data often rely on strong prior knowledge. Extracting the governing equations from data with less prior knowledge remains a great challenge. In this paper, we propose a deep neural network, called RODE-Net, to tackle such challenge by fitting a symbolic expression of the differential equation and the distribution of parameters simultaneously. To train the RODE-Net, we first estimate the parameters of the unknown RODE using the symbolic networks \cite{long2019pde} by solving a set of deterministic inverse problems based on the measured data, and use a generative adversarial network (GAN) to estimate the true distribution of the RODE's parameters. Then, we use the trained GAN as a regularization to further improve the estimation of the ODE's parameters. The two steps are operated alternatively. Numerical results show that the proposed RODE-Net can well estimate the distribution of model parameters using simulated data and can make reliable predictions. It is worth noting that, GAN serves as a data driven regularization in RODE-Net and is more effective than the $\ell_1$ based regularization that is often used in system identifications.
翻訳日:2022-11-25 18:04:15 公開日:2020-06-03
# 最適化可能なスカラー目的値は客観的であってはならず、唯一の目的であってはならない

An optimizable scalar objective value cannot be objective and should not be the sole objective ( http://arxiv.org/abs/2006.02577v1 )

ライセンス: Link先を確認
Isabel Kloumann and Mark Tygert(参考訳) 本稿では,アルゴリズムと計算システムの倫理と道徳について考察し,過去2年間facebook社内で流通してきた。 この論文は、多くのノーベル賞受賞者の業績や、リチャード・ドーキンス、アンドレイ・コルモゴロフ、ヴィルフレド・パレート、ジョン・フォン・ノイマンなどの著名な科学者の業績をレビューしている。 この論文は、そのタイトルにまとめられたような作品に基づいて結論を導き出す。 この論文は、現代の機械学習と人工知能に対する標準的なアプローチは偏見と不公平であり、法律、司法、政治、医学の専門職における長年の伝統が役に立つべきだと論じている。

This paper concerns the ethics and morality of algorithms and computational systems, and has been circulating internally at Facebook for the past couple years. The paper reviews many Nobel laureates' work, as well as the work of other prominent scientists such as Richard Dawkins, Andrei Kolmogorov, Vilfredo Pareto, and John von Neumann. The paper draws conclusions based on such works, as summarized in the title. The paper argues that the standard approach to modern machine learning and artificial intelligence is bound to be biased and unfair, and that longstanding traditions in the professions of law, justice, politics, and medicine should help.
翻訳日:2022-11-25 18:03:52 公開日:2020-06-03
# 手話データ駆動分析のための大規模データマイニング

Towards Large-Scale Data Mining for Data-Driven Analysis of Sign Languages ( http://arxiv.org/abs/2006.02120v1 )

ライセンス: Link先を確認
Boris Mocialov, Graham Turner, Helen Hastie(参考訳) 手話データへのアクセスは十分ではない。 我々は,TikTokやInstagram,YouTubeなどのソーシャルネットワーキングサービスから,品質基準を強制するためにデータフィルタリングを適用し,フィルタリングされたデータのパターンを発見して,分析とモデル化を容易にすることによって,データを収集できることを実証した。 当社のデータ収集パイプラインを用いて,米国手話(asl)とブラジル手話(libras)における歌の解釈を収集し,検討した。 方向と位置音韻パラメータの共依存に着目し,それらの差異と類似性について検討する。

Access to sign language data is far from adequate. We show that it is possible to collect the data from social networking services such as TikTok, Instagram, and YouTube by applying data filtering to enforce quality standards and by discovering patterns in the filtered data, making it easier to analyse and model. Using our data collection pipeline, we collect and examine the interpretation of songs in both the American Sign Language (ASL) and the Brazilian Sign Language (Libras). We explore their differences and similarities by looking at the co-dependence of the orientation and location phonological parameters
翻訳日:2022-11-25 18:03:15 公開日:2020-06-03
# イギリス手話モデリングのためのトランスファー学習

Transfer Learning for British Sign Language Modelling ( http://arxiv.org/abs/2006.02144v1 )

ライセンス: Link先を確認
Boris Mocialov, Graham Turner, Helen Hastie(参考訳) 自動音声認識と音声対話システムは、深層機械学習手法を用いて大きな進歩を遂げている。 これは部分的には計算能力の向上によるものであるが、英語などの共通言語で利用可能な大量のデータによってもたらされる。 逆に、手話を含む少数言語の研究は、データの欠如によって妨げられている。 これにより、トランスファー学習の手法が開発され、1つの言語用に開発されたモデルは、リソースの少ない2番目の言語のモデルの出発点として再利用される。 本稿では,英国手話の言語モデリングにおける微調整と層置換の2つの伝達学習手法について検討する。 本研究は,Penn Treebank corpus の標準英語コーパスを用いて学習した標準LSTMモデルを用いたトランスファーラーニングにおける難易度の向上を示す。

Automatic speech recognition and spoken dialogue systems have made great advances through the use of deep machine learning methods. This is partly due to greater computing power but also through the large amount of data available in common languages, such as English. Conversely, research in minority languages, including sign languages, is hampered by the severe lack of data. This has led to work on transfer learning methods, whereby a model developed for one language is reused as the starting point for a model on a second language, which is less resourced. In this paper, we examine two transfer learning techniques of fine-tuning and layer substitution for language modelling of British Sign Language. Our results show improvement in perplexity when using transfer learning with standard stacked LSTM models, trained initially using a large corpus for standard English from the Penn Treebank corpus
翻訳日:2022-11-25 18:03:04 公開日:2020-06-03
# ウェアラブルセンサを用いたCNNによる歩行・走行速度検出アルゴリズム

CNN-based Speed Detection Algorithm for Walking and Running using Wrist-worn Wearable Sensors ( http://arxiv.org/abs/2006.02348v1 )

ライセンス: Link先を確認
Venkata Devesh Reddy Seethi, Pratool Bharti(参考訳) 近年、スマートウォッチやフィットネストラッカーなどのユビキタスな技術が急増し、人間の身体活動の追跡が絶え間なく行われている。 これらのデバイスにより、一般市民は身体のフィットネスをトラッキングし、健康的なライフスタイルを導くことができる。 様々な運動の中で、歩くことや走ることは、通勤、運動、家事など、人々が日常生活で行う最も一般的なことである。 適切な強度で行えば、歩行とランニングは個人がフィットネスと減量目標を達成するのに十分です。 そのため, 歩行・走行速度を計測し, 消費カロリーを推定し, 痛み, 怪我, 燃え尽きのリスクを防止できることが重要である。 既存のウェアラブル技術ではGPSセンサーを使用して、エネルギー効率が高く、屋内ではうまく動作しない速度を測定する。 本稿では, 加速度センサとジャイロスコープのセンサデータを利用した畳み込みニューラルネットワークに基づくアルゴリズムの設計, 実装, 評価を行い, 高精度な検出を行う。 15ドルの参加者のデータは、トレッドミルで異なる速度で歩いたり走ったりしながら収集された。 当社の速度検出アルゴリズムは、それぞれ70~15ドルの列車-テスト-評価分割と残1の相互評価評価戦略を用いて、4.2\%$と9.8\%$ mape (mean absolute error%) の値を達成した。

In recent years, there have been a surge in ubiquitous technologies such as smartwatches and fitness trackers that can track the human physical activities effortlessly. These devices have enabled common citizens to track their physical fitness and encourage them to lead a healthy lifestyle. Among various exercises, walking and running are the most common ones people do in everyday life, either through commute, exercise, or doing household chores. If done at the right intensity, walking and running are sufficient enough to help individual reach the fitness and weight-loss goals. Therefore, it is important to measure walking/ running speed to estimate the burned calories along with preventing them from the risk of soreness, injury, and burnout. Existing wearable technologies use GPS sensor to measure the speed which is highly energy inefficient and does not work well indoors. In this paper, we design, implement and evaluate a convolutional neural network based algorithm that leverages accelerometer and gyroscope sensory data from the wrist-worn device to detect the speed with high precision. Data from $15$ participants were collected while they were walking/running at different speeds on a treadmill. Our speed detection algorithm achieved $4.2\%$ and $9.8\%$ MAPE (Mean Absolute Error Percentage) value using $70-15-15$ train-test-evaluation split and leave-one-out cross-validation evaluation strategy respectively.
翻訳日:2022-11-25 18:02:34 公開日:2020-06-03
# 条件付き画像合成のためのネストスケール編集

Nested Scale Editing for Conditional Image Synthesis ( http://arxiv.org/abs/2006.02038v1 )

ライセンス: Link先を確認
Lingzhi Zhang, Jiancong Wang, Yinshuang Xu, Jie Min, Tarmily Wen, James C. Gee, Jianbo Shi(参考訳) 本稿では,潜在コード空間における階層化ナビゲーションを実現する画像合成手法を提案する。 ごく少数の部分的あるいは非常に低解像度の画像で、我々のアプローチは、地上の真実に最も近いサンプル画像を生成するという点で、一貫して最先端の画像を生成することができる。 我々は、スケール固有の多様性を拡大しながら、スケール非依存の編集によってこれを達成する。 スケール独立性は、ネストされたスケールの歪み損失によって達成される。 スケール固有の多様性は、プログレッシブな多様化制約を取り入れることで生成される。 我々は、共通の潜在コードを共有することによって、スケールにまたがる意味的永続性を導入する。 共に、画像合成プロセスのより優れた制御を提供する。 提案手法の有効性は,画像出力,画像スーパーレゾリューション,ドメイン間画像変換など,様々なタスクを通じて評価する。

We propose an image synthesis approach that provides stratified navigation in the latent code space. With a tiny amount of partial or very low-resolution image, our approach can consistently out-perform state-of-the-art counterparts in terms of generating the closest sampled image to the ground truth. We achieve this through scale-independent editing while expanding scale-specific diversity. Scale-independence is achieved with a nested scale disentanglement loss. Scale-specific diversity is created by incorporating a progressive diversification constraint. We introduce semantic persistency across the scales by sharing common latent codes. Together they provide better control of the image synthesis process. We evaluate the effectiveness of our proposed approach through various tasks, including image outpainting, image superresolution, and cross-domain image translation.
翻訳日:2022-11-25 18:01:49 公開日:2020-06-03
# PILArNet:高エネルギー物理における粒子イメージング液体アルゴン検出器の公開データセット

PILArNet: Public Dataset for Particle Imaging Liquid Argon Detectors in High Energy Physics ( http://arxiv.org/abs/2006.01993v1 )

ライセンス: Link先を確認
Corey Adams, Kazuhiro Terao, Taritree Wongjirad(参考訳) 機械学習ソリューションの急速な進歩は、しばしばテスト公開データセットの作成と一致している。 このようなデータセットは、問題に対処するための最も大きな障壁であるデータ取得を減らし、異なるソリューションを比較するためのベンチマークも提供する。 さらに、大規模なデータセットを使用して、ハイパフォーマンスな機能ファインダをトレーニングし、その後、最初に定義された問題に対する新しいアプローチで使用される。 高エネルギー物理実験で用いられる粒子検出器のクラスである液体アルゴン時間投射チャンバーを用いて収集したデータの解析の急速な発展を促進するため、我々はPILArNet、最初の2Dおよび3Dオープンデータセットを2つの重要な解析タスクに使用した。 本論文で提示された最初のデータセットは,3つの異なるボリュームサイズでシミュレートおよび記録された30万のサンプルを含む。 データセットは、ボリューム内の模擬粒子の補助情報とともにスパース2Dおよび3Dマトリクス形式で効率よく保存され、公開研究用に利用できる。 本稿では,サンプルの調達に使用されるデータセット,タスク,方法について述べる。

Rapid advancement of machine learning solutions has often coincided with the production of a test public data set. Such datasets reduce the largest barrier to entry for tackling a problem -- procuring data -- while also providing a benchmark to compare different solutions. Furthermore, large datasets have been used to train high-performing feature finders which are then used in new approaches to problems beyond that initially defined. In order to encourage the rapid development in the analysis of data collected using liquid argon time projection chambers, a class of particle detectors used in high energy physics experiments, we have produced the PILArNet, first 2D and 3D open dataset to be used for a couple of key analysis tasks. The initial dataset presented in this paper contains 300,000 samples simulated and recorded in three different volume sizes. The dataset is stored efficiently in sparse 2D and 3D matrix format with auxiliary information about simulated particles in the volume, and is made available for public research use. In this paper we describe the dataset, tasks, and the method used to procure the sample.
翻訳日:2022-11-25 17:54:12 公開日:2020-06-03
# GFPNet:ジェネリックフィットプリミティブにおける形状補完学習のためのディープネットワーク

GFPNet: A Deep Network for Learning Shape Completion in Generic Fitted Primitives ( http://arxiv.org/abs/2006.02098v1 )

ライセンス: Link先を確認
Tiberiu Cocias, Alexandru Razvant and Sorin Grigorescu(参考訳) 本稿では,GP(Generic Primitives)と呼ばれるオブジェクト再構成装置を提案する。 GPは、オブジェクトのクラスの一般化された形状を描いた3次元点雲である。 シーン内のオブジェクトを再構築するには、まずgpを各occludedオブジェクトにフィットさせ、初期生構造を得る。 次に, モデルに基づく変形手法を用いて, gp の表面を閉塞物体の上に折り曲げる。 変形モデルはGFPNetと呼ばれるディープニューラルネットワーク(DNN)の層に符号化される。 ネットワークの目的は、オブジェクトの特異性をシーンからGPで表される生のボリュームに転送することである。 GFPNet は ModelNet および KITTI ベンチマークデータセットの性能評価結果を提供することで, 形状完成手法の状況と競合することを示す。

In this paper, we propose an object reconstruction apparatus that uses the so-called Generic Primitives (GP) to complete shapes. A GP is a 3D point cloud depicting a generalized shape of a class of objects. To reconstruct the objects in a scene we first fit a GP onto each occluded object to obtain an initial raw structure. Secondly, we use a model-based deformation technique to fold the surface of the GP over the occluded object. The deformation model is encoded within the layers of a Deep Neural Network (DNN), coined GFPNet. The objective of the network is to transfer the particularities of the object from the scene to the raw volume represented by the GP. We show that GFPNet competes with state of the art shape completion methods by providing performance results on the ModelNet and KITTI benchmarking datasets.
翻訳日:2022-11-25 17:53:39 公開日:2020-06-03
# 非線形画像登録のためのフレキシブルベイズモデル

Flexible Bayesian Modelling for Nonlinear Image Registration ( http://arxiv.org/abs/2006.02338v1 )

ライセンス: Link先を確認
Mikael Brudfors, Ya\"el Balbastre, Guillaume Flandin, Parashkev Nachev, John Ashburner(参考訳) 本稿では,画像群を共通空間に的確に整列させ,spmソフトウェアに組み込むことを意図した2相性登録アルゴリズムについて述べる。 その考え方は、形状と外観のばらつきを考慮に入れた確率的グラフィカルモデルで推論を行うことである。 結果として得られるフレームワークは一般的で、完全に教師なしです。 このモデルは3次元脳スキャンのサブジェクト間登録で評価される。 ここでのモデルの主な前提は、潜伏した「平均値」の脳を変形させることで個々の解剖を生成できるという仮定である。 この方法は撮像モードとは無関係であり、事前処理なしで適用することができる。 我々は,手動ラベル付きデータセットを用いてアルゴリズムの評価を行う。 このバリデーションでは、従来の最先端のオブジェクト間登録アルゴリズムに対して、妥当なランタイム内で、最先端の結果を得る。 未処理のデータセットでは、オーバーラップスコアの増加は17%以上である。 これらの結果は, 数値解剖学的手法を用いた非線形登録の利点を示す。

We describe a diffeomorphic registration algorithm that allows groups of images to be accurately aligned to a common space, which we intend to incorporate into the SPM software. The idea is to perform inference in a probabilistic graphical model that accounts for variability in both shape and appearance. The resulting framework is general and entirely unsupervised. The model is evaluated at inter-subject registration of 3D human brain scans. Here, the main modeling assumption is that individual anatomies can be generated by deforming a latent 'average' brain. The method is agnostic to imaging modality and can be applied with no prior processing. We evaluate the algorithm using freely available, manually labelled datasets. In this validation we achieve state-of-the-art results, within reasonable runtimes, against previous state-of-the-art widely used, inter-subject registration algorithms. On the unprocessed dataset, the increase in overlap score is over 17%. These results demonstrate the benefits of using informative computational anatomy frameworks for nonlinear registration.
翻訳日:2022-11-25 17:53:24 公開日:2020-06-03
# AlexNetのアンサンブルを用いたファシックドーパミン放出の同定

Phasic dopamine release identification using ensemble of AlexNet ( http://arxiv.org/abs/2006.02536v1 )

ライセンス: Link先を確認
Luca Patarnello, Marco Celin, Loris Nanni(参考訳) ドーパミン(英: Dopamine、DA)は、行動や身体機能に影響を及ぼす有機化学物質である。 高速走査型サイクリックボルタンメトリー(FSCV)は、生体内ドーパミン放出測定に用いられる技術である。 しかし、このような測定結果の分析には顕著な努力が必要だ。 本稿では, ファシックドパミン放出の同定における畳み込みニューラルネットワーク(CNN)の利用について述べる。

Dopamine (DA) is an organic chemical that influences several parts of behaviour and physical functions. Fast-scan cyclic voltammetry (FSCV) is a technique used for in vivo phasic dopamine release measurements. The analysis of such measurements, though, requires notable effort. In this paper, we present the use of convolutional neural networks (CNNs) for the identification of phasic dopamine releases.
翻訳日:2022-11-25 17:53:11 公開日:2020-06-03
# 観測データからロバスト決定ポリシーを学習する

Learning Robust Decision Policies from Observational Data ( http://arxiv.org/abs/2006.02355v1 )

ライセンス: Link先を確認
Muhammad Osama, Dave Zachariah, Peter Stoica(参考訳) 我々は,過去の意思決定の観察データから,特徴と関連する結果の文脈で意思決定ポリシーを学習する問題に対処する。 過去の方針はおそらく不明であり、医学的意思決定支援のような安全クリティカルな応用においては、高いコストで結果のリスクを低減させる強固な政策を学ぶことが重要である。 本稿では,特定のレベルでのコスト分布の尾尾を減らし,また,各決定のコストに統計的に妥当な制約を与える政策の学習方法を提案する。 これらの特性は有限なサンプルで有効であり、観測データ内の異なる決定のための特徴の重なりが不均一あるいは全くない場合であっても、最近の結果に基づいて共形予測を行う。 実データと合成データの両方を用いて,提案手法の性能と統計特性を示す。

We address the problem of learning a decision policy from observational data of past decisions in contexts with features and associated outcomes. The past policy maybe unknown and in safety-critical applications, such as medical decision support, it is of interest to learn robust policies that reduce the risk of outcomes with high costs. In this paper, we develop a method for learning policies that reduce tails of the cost distribution at a specified level and, moreover, provide a statistically valid bound on the cost of each decision. These properties are valid under finite samples -- even in scenarios with uneven or no overlap between features for different decisions in the observed data -- by building on recent results in conformal prediction. The performance and statistical properties of the proposed method are illustrated using both real and synthetic data.
翻訳日:2022-11-25 17:47:11 公開日:2020-06-03
# 浅層ニューラルホーク:ホークス過程の非パラメトリックカーネル推定

Shallow Neural Hawkes: Non-parametric kernel estimation for Hawkes processes ( http://arxiv.org/abs/2006.02460v1 )

ライセンス: Link先を確認
Sobin Joseph, Lekhapriya Dheeraj Kashyap, Shashi Jain(参考訳) 多次元ホークス過程(MHP)は、地震の予測から高周波取引における秩序書のモデリングまで幅広い応用を見出す自己および相互に刺激的な点過程のクラスである。 本論文は2つの主要な貢献を行い,まず,Hawkesプロセスのログ類似度推定のための非バイアス推定器を発見し,確率勾配降下法を有効活用して最大推定を行う。 第2の寄与は、MHPの基盤となるカーネルの非パラメトリック推定のための、特定の単一の隠蔽層ニューラルネットワークを提案することである。 提案手法を合成データと実データの両方で評価し,既存の推定手法と同等あるいは優れた性能を有することを示す。 浅いニューラルネットワークを使用することで、ホークスモデルの解釈可能性に妥協することなく、同時に標準でないホークス励起カーネルを推定する柔軟性が確保できる。

Multi-dimensional Hawkes process (MHP) is a class of self and mutually exciting point processes that find wide range of applications -- from prediction of earthquakes to modelling of order books in high frequency trading. This paper makes two major contributions, we first find an unbiased estimator for the log-likelihood estimator of the Hawkes process to enable efficient use of the stochastic gradient descent method for maximum likelihood estimation. The second contribution is, we propose a specific single hidden layered neural network for the non-parametric estimation of the underlying kernels of the MHP. We evaluate the proposed model on both synthetic and real datasets, and find the method has comparable or better performance than existing estimation methods. The use of shallow neural network ensures that we do not compromise on the interpretability of the Hawkes model, while at the same time have the flexibility to estimate any non-standard Hawkes excitation kernel.
翻訳日:2022-11-25 17:46:04 公開日:2020-06-03
# 作業員数のみに依存する通信オーバーヘッドを持つローカルsgd

Local SGD With a Communication Overhead Depending Only on the Number of Workers ( http://arxiv.org/abs/2006.02582v1 )

ライセンス: Link先を確認
Artin Spiridonoff, Alex Olshevsky and Ioannis Ch. Paschalidis(参考訳) 複数の作業員を並列化することで,確率勾配降下 (sgd) の高速化を検討する。 同じデータセットが、sgdステップと中央サーバとの調整が可能な、n$ workers間で共有されていると仮定します。 残念なことに、これはワーカとサーバ間の多くの通信を必要とする可能性があるため、並列化による利益を劇的に削減することができる。 従来の文献で提案され分析されたローカルSGD法は、機械がそのような通信の間に多くのローカルステップを踏むべきであることを示唆している。 ローカルsgdの初期の分析では、エラーが1/(nt)$に比例するために、t$の局所勾配ステップに対して$\omega ( \sqrt{t} )$の通信が必要であることが示されているが、これは一連の論文で連続的に改善され、最先端の通信には$\omega \left(n \left( \mbox{ polynomial in log } (t) \right) \right)$の通信が必要である。 本稿では,ローカルSGDの新しい解析法を提案する。 分析の結果、ローカルsgdは、1/(nt)$でスケールするエラーを達成でき、固定数の通信は$t$に依存しない:具体的には$\omega(n)$通信のみが必要である。

We consider speeding up stochastic gradient descent (SGD) by parallelizing it across multiple workers. We assume the same data set is shared among $n$ workers, who can take SGD steps and coordinate with a central server. Unfortunately, this could require a lot of communication between the workers and the server, which can dramatically reduce the gains from parallelism. The Local SGD method, proposed and analyzed in the earlier literature, suggests machines should make many local steps between such communications. While the initial analysis of Local SGD showed it needs $\Omega ( \sqrt{T} )$ communications for $T$ local gradient steps in order for the error to scale proportionately to $1/(nT)$, this has been successively improved in a string of papers, with the state-of-the-art requiring $\Omega \left( n \left( \mbox{ polynomial in log } (T) \right) \right)$ communications. In this paper, we give a new analysis of Local SGD. A consequence of our analysis is that Local SGD can achieve an error that scales as $1/(nT)$ with only a fixed number of communications independent of $T$: specifically, only $\Omega(n)$ communications are required.
翻訳日:2022-11-25 17:44:18 公開日:2020-06-03
# XGNN: グラフニューラルネットワークのモデルレベル説明を目指して

XGNN: Towards Model-Level Explanations of Graph Neural Networks ( http://arxiv.org/abs/2006.02587v1 )

ライセンス: Link先を確認
Hao Yuan, Jiliang Tang, Xia Hu, Shuiwang Ji(参考訳) グラフニューラルネットワーク(GNN)は、多くのグラフタスクで有望なパフォーマンスを達成した隣の情報を集約して組み合わせることで、ノードの特徴を学習する。 しかしながら、GNNはブラックボックスとして扱われ、人間の知的な説明が欠けている。 したがって、GNNモデルが説明できない場合、完全に信頼され、特定のアプリケーションドメインで使用されることはできない。 本研究では,モデルレベルでのGNNを解釈するための新しい手法であるXGNNを提案する。 我々のアプローチは、GNNの動作に関する高レベルな洞察と一般的な理解を提供することができる。 特に,生成したグラフパターンがモデルの特定の予測を最大化するようにグラフ生成をトレーニングし,グラフ生成を強化学習タスクとして定式化し,各ステップにおいてグラフ生成器が現在のグラフにエッジを追加する方法を予測して,gnnを説明する。 グラフ生成器は、トレーニングされたgnnの情報に基づいてポリシー勾配方式で訓練される。 さらに、生成されたグラフを有効にするために、いくつかのグラフルールを組み込む。 合成と実世界の両方のデータセットに対する実験結果から,提案手法が学習したGNNの理解と検証に役立つことが示された。 さらに, 実験結果から, 生成したグラフは, 学習したGNNを改善するためのガイダンスを与えることができることがわかった。

Graphs neural networks (GNNs) learn node features by aggregating and combining neighbor information, which have achieved promising performance on many graph tasks. However, GNNs are mostly treated as black-boxes and lack human intelligible explanations. Thus, they cannot be fully trusted and used in certain application domains if GNN models cannot be explained. In this work, we propose a novel approach, known as XGNN, to interpret GNNs at the model-level. Our approach can provide high-level insights and generic understanding of how GNNs work. In particular, we propose to explain GNNs by training a graph generator so that the generated graph patterns maximize a certain prediction of the model.We formulate the graph generation as a reinforcement learning task, where for each step, the graph generator predicts how to add an edge into the current graph. The graph generator is trained via a policy gradient method based on information from the trained GNNs. In addition, we incorporate several graph rules to encourage the generated graphs to be valid. Experimental results on both synthetic and real-world datasets show that our proposed methods help understand and verify the trained GNNs. Furthermore, our experimental results indicate that the generated graphs can provide guidance on how to improve the trained GNNs.
翻訳日:2022-11-25 17:37:22 公開日:2020-06-03
# 確率から回復へ:ベイズ推論における説明的価値の実践

From Probability to Consilience: How Explanatory Values Implement Bayesian Reasoning ( http://arxiv.org/abs/2006.02359v1 )

ライセンス: Link先を確認
Zachary Wojtowicz and Simon DeDeo(参考訳) 認知科学における最近の研究は、説明的価値や次元の多様性を明らかにし、説明がより良くも悪くも判断する。 本稿では,これらの値がどのように適合するかをベイズ語で説明する。 結果として得られた分類学は、人々が心理学、統計学、科学哲学の核となる価値が共通の数学的枠組みからどのように現れるかを示す一連の予測器を提供する。 この枠組みは, 科学的議論作成などの説明的美徳の運用に加えて, 陰謀論, 妄想, 過激主義イデオロギーを推し進める説明的悪徳の再解釈を可能にする。

Recent work in cognitive science has uncovered a diversity of explanatory values, or dimensions along which we judge explanations as better or worse. We propose a Bayesian account of how these values fit together to guide explanation. The resulting taxonomy provides a set of predictors for which explanations people prefer and shows how core values from psychology, statistics, and the philosophy of science emerge from a common mathematical framework. In addition to operationalizing the explanatory virtues associated with, for example, scientific argument-making, this framework also enables us to reinterpret the explanatory vices that drive conspiracy theories, delusions, and extremist ideologies.
翻訳日:2022-11-25 17:36:43 公開日:2020-06-03
# 確率的ニューラルネットワークハードウェアアクセラレーションによる効率的なリガンドベース仮想スクリーニング

Stochastic-based Neural Network hardware acceleration for an efficient ligand-based virtual screening ( http://arxiv.org/abs/2006.02505v1 )

ライセンス: Link先を確認
Christian F. Frasser, Carola de Benito, Vincent Canals, Miquel Roca, Pedro J. Ballester and Josep L. Rossello(参考訳) ANN(Artificial Neural Networks)は、多くの複雑なパターンマッチング問題を解く能力のため、多くの科学技術分野で普及している。 これは、治療対象に生物活性を示す確率が最も高い分子化合物を識別する方法を研究する研究領域であるバーチャルスクリーニングのケースである。 大量の小さな有機化合物と、このような大規模なスクリーニングを行う可能性のある数千のターゲットにより、分子データベースのスクリーニングにおける処理速度とエネルギー効率の両方を向上する研究コミュニティへの関心が高まっている。 本研究では,各分子を1つのエネルギーベースベクトルで記述した分類モデルを提案し,ANNを用いた機械学習システムを提案する。 生化学的類似性を同定する適性について異なるアンが研究されている。 また,ANN実装において,確率計算を用いた高性能・エネルギー効率のハードウェアアクセラレーションプラットフォームを提案する。 このプラットフォームは、巨大な化合物ライブラリーをスクリーニングするときに有用である。 その結果, 提案モデルでは, 主に関連する特性(精度, 速度, エネルギー効率)の点から, 先行する作品に対して良好な改善が得られた。

Artificial Neural Networks (ANN) have been popularized in many science and technological areas due to their capacity to solve many complex pattern matching problems. That is the case of Virtual Screening, a research area that studies how to identify those molecular compounds with the highest probability to present biological activity for a therapeutic target. Due to the vast number of small organic compounds and the thousands of targets for which such large-scale screening can potentially be carried out, there has been an increasing interest in the research community to increase both, processing speed and energy efficiency in the screening of molecular databases. In this work, we present a classification model describing each molecule with a single energy-based vector and propose a machine-learning system based on the use of ANNs. Different ANNs are studied with respect to their suitability to identify biochemical similarities. Also, a high-performance and energy-efficient hardware acceleration platform based on the use of stochastic computing is proposed for the ANN implementation. This platform is of utility when screening vast libraries of compounds. As a result, the proposed model showed appreciable improvements with respect previously published works in terms of the main relevant characteristics (accuracy, speed and energy-efficiency).
翻訳日:2022-11-25 17:36:07 公開日:2020-06-03
# ナレッジグラフ埋め込みに基づく業界4.0標準の展望

Unveiling Relations in the Industry 4.0 Standards Landscape based on Knowledge Graph Embeddings ( http://arxiv.org/abs/2006.04556v1 )

ライセンス: Link先を確認
Ariam Rivas, Irl\'an Grangel-Gonz\'alez, Diego Collarana, Jens Lehmann, Maria-Esther Vidal(参考訳) industry~4.0 (i4.0) の標準規格と標準化フレームワークがスマートファクトリーにおける \emph{empowering interoperability} の目標として提案されている。 これらの標準は、スマートファクトリ内の主要コンポーネント、システム、プロセスの記述と相互作用を可能にします。 フレームワークや標準が増えているため、i4.0標準の展望を自動的に分析するアプローチの必要性が高まっている。 標準化フレームワークは、その機能に従って標準をレイヤとディメンションに分類する。 しかし、同様の標準はフレームワークによって異なる分類が可能で、相互運用の衝突が生じます。 オントロジーとナレッジグラフに依存するセマンティックなアプローチは、標準、それらの間の既知の関係、および既存のフレームワークによる分類を表現するために提案されている。 情報的ではあるが、I4.0のランドスケープの構造的モデリングは相互運用性の問題を検出するための基盤を提供するだけである。 したがって、これらのアプローチで符号化された知識を活用できるグラフベースの分析手法は、標準間の整合を明らかにするために必要である。 本研究では,コミュニティ分析に基づく標準とフレームワークの関連性について検討し,標準間の相互干渉に対処するための知識を明らかにする。 ナレッジグラフを埋め込むことで、既存の関係の意味を生かしたコミュニティを自動的に作成します。 特に,類似の標準,すなわち標準のコミュニティの同定に注目し,それらの特性を分析して未知の関係を検出する。 我々は,知識グラフエンティティの埋め込みモデル群であるTrans$^*$を用いて,I4.0標準の知識グラフに対するアプローチを実証的に評価した。 結果は有望であり,標準間の関係を正確に検出できることを示唆する。

Industry~4.0 (I4.0) standards and standardization frameworks have been proposed with the goal of \emph{empowering interoperability} in smart factories. These standards enable the description and interaction of the main components, systems, and processes inside of a smart factory. Due to the growing number of frameworks and standards, there is an increasing need for approaches that automatically analyze the landscape of I4.0 standards. Standardization frameworks classify standards according to their functions into layers and dimensions. However, similar standards can be classified differently across the frameworks, producing, thus, interoperability conflicts among them. Semantic-based approaches that rely on ontologies and knowledge graphs, have been proposed to represent standards, known relations among them, as well as their classification according to existing frameworks. Albeit informative, the structured modeling of the I4.0 landscape only provides the foundations for detecting interoperability issues. Thus, graph-based analytical methods able to exploit knowledge encoded by these approaches, are required to uncover alignments among standards. We study the relatedness among standards and frameworks based on community analysis to discover knowledge that helps to cope with interoperability conflicts between standards. We use knowledge graph embeddings to automatically create these communities exploiting the meaning of the existing relationships. In particular, we focus on the identification of similar standards, i.e., communities of standards, and analyze their properties to detect unknown relations. We empirically evaluate our approach on a knowledge graph of I4.0 standards using the Trans$^*$ family of embedding models for knowledge graph entities. Our results are promising and suggest that relations among standards can be detected accurately.
翻訳日:2022-11-25 17:35:51 公開日:2020-06-03
# 機械学習による階層的予測調整

Hierarchical forecast reconciliation with machine learning ( http://arxiv.org/abs/2006.02043v1 )

ライセンス: Link先を確認
Evangelos Spiliotis, Mahdi Abolghasemi, Rob J Hyndman, Fotios Petropoulos, Vassilios Assimakopoulos(参考訳) 階層的予測法は、異なる集約レベルでコヒーレントな予測を提供することによって、整合した意思決定を支援するために広く用いられている。 ボトムアップやトップダウンといった従来の階層的予測手法では、特定の集約レベルに注目して予測をアンカーする。 過去数十年間、これらはより正確な予測を生成するために完全な階層からの情報を利用する様々な線形結合アプローチに置き換えられてきた。 しかし,これらの組み合わせ法の性能は,シリーズの特異性とそれらの関係に依存する。 本稿では,これらの制約を3つの重要な方法で扱う機械学習に基づく階層的予測手法を提案する。 まず,提案手法により,ベース予測の非線形結合が可能となり,線形アプローチよりも汎用性が向上した。 第2に、サンプル後予測精度とコヒーレンスの改善目標を構造的に組み合わせる。 最後に, 線形でない性質のため, 本手法では, 各系列とレベルについて, 整合した予測を生成するために, 完全情報を必要とせず, 直接的かつ自動的にベース予測を選択的に組み合わせる。 提案手法は,観光業と小売業の2つの異なるデータセットを用いて,精度とバイアスの両面から評価する。 以上の結果から,提案手法は既存の手法よりも,特に階層を構成する系列が同一のパターンで特徴づけられていない場合,より優れた点予測が得られることが示唆された。

Hierarchical forecasting methods have been widely used to support aligned decision-making by providing coherent forecasts at different aggregation levels. Traditional hierarchical forecasting approaches, such as the bottom-up and top-down methods, focus on a particular aggregation level to anchor the forecasts. During the past decades, these have been replaced by a variety of linear combination approaches that exploit information from the complete hierarchy to produce more accurate forecasts. However, the performance of these combination methods depends on the particularities of the examined series and their relationships. This paper proposes a novel hierarchical forecasting approach based on machine learning that deals with these limitations in three important ways. First, the proposed method allows for a non-linear combination of the base forecasts, thus being more general than the linear approaches. Second, it structurally combines the objectives of improved post-sample empirical forecasting accuracy and coherence. Finally, due to its non-linear nature, our approach selectively combines the base forecasts in a direct and automated way without requiring that the complete information must be used for producing reconciled forecasts for each series and level. The proposed method is evaluated both in terms of accuracy and bias using two different data sets coming from the tourism and retail industries. Our results suggest that the proposed method gives superior point forecasts than existing approaches, especially when the series comprising the hierarchy are not characterized by the same patterns.
翻訳日:2022-11-25 17:35:27 公開日:2020-06-03
# 支持ベクトルマシンの近距離マージンベース一般化境界

Near-Tight Margin-Based Generalization Bounds for Support Vector Machines ( http://arxiv.org/abs/2006.02175v1 )

ライセンス: Link先を確認
Allan Gr{\o}nlund, Lior Kamma, Kasper Green Larsen(参考訳) サポートベクトルマシン(SVM)はバイナリ分類の最も基本的なツールである。 最も単純な定式化では、SVMはデータに対する最大のマージンを用いて2つのクラスのデータを分離する超平面を生成する。 マージンの最大化への焦点は、多くの一般化境界によって動機づけられている。 本稿では,従来の一般化境界をマージンで再検討し,改善する。 さらに, ほぼ一致する下界で束縛された新たな一般化を補完し, マージンの観点からsvmの一般化性能をほぼ確定する。

Support Vector Machines (SVMs) are among the most fundamental tools for binary classification. In its simplest formulation, an SVM produces a hyperplane separating two classes of data using the largest possible margin to the data. The focus on maximizing the margin has been well motivated through numerous generalization bounds. In this paper, we revisit and improve the classic generalization bounds in terms of margins. Furthermore, we complement our new generalization bound by a nearly matching lower bound, thus almost settling the generalization performance of SVMs in terms of margins.
翻訳日:2022-11-25 17:29:09 公開日:2020-06-03
# SimPool: 構造的類似機能を備えたトポロジベースのグラフポーリングを目指して

SimPool: Towards Topology Based Graph Pooling with Structural Similarity Features ( http://arxiv.org/abs/2006.02244v1 )

ライセンス: Link先を確認
Yaniv Shulman(参考訳) グラフのディープラーニング手法は近年急速に進歩しており、グラフデータへの畳み込みニューラルネットワーク(CNN)の一般化に重点を置いている。 CNNは通常、プール層がグリッドをサブサンプリングし、空間的あるいは時間的解像度を交換して特徴次元を増大させるような畳み込み層とプール層の交互に実現される。 グラフの一般化畳み込み演算子は広く研究され、有用であることが証明されているが、グラフのノードが空間的局所性と自然な順序を持たないため、グラフの階層的粗さは依然として困難である。 本稿では,2つの主要な貢献について述べる。1つは,隣接行列に基づく構造的類似性特徴を計算する微分モジュールである。 これらの構造的類似性機能は様々なアルゴリズムで利用することができるが、本論文ではこれらの特徴をDiffPool arXiv:1806.08804で再検討し、SimPoolと呼ばれるプーリング層を提案することに重点を置いている。 これは、グラフの構造的類似性によってネットワーク還元の概念と階層的局所プールの概念を結びつけることで達成される。 実験の結果、エンドツーエンドのグラフニューラルネットワークアーキテクチャの一部として、simpoolは、標準グリッドの局所受容フィールドで動作するcnnで使用されるプール操作を、より機能的にローカルに類似したノードクラスタ割り当てを計算する。 さらに,これらの特徴は,パラメータ数の増加を伴わない帰納的グラフ分類タスクにおいて有用であることを示す。

Deep learning methods for graphs have seen rapid progress in recent years with much focus awarded to generalising Convolutional Neural Networks (CNN) to graph data. CNNs are typically realised by alternating convolutional and pooling layers where the pooling layers subsample the grid and exchange spatial or temporal resolution for increased feature dimensionality. Whereas the generalised convolution operator for graphs has been studied extensively and proven useful, hierarchical coarsening of graphs is still challenging since nodes in graphs have no spatial locality and no natural order. This paper proposes two main contributions, the first is a differential module calculating structural similarity features based on the adjacency matrix. These structural similarity features may be used with various algorithms however in this paper the focus and the second main contribution is on integrating these features with a revisited pooling layer DiffPool arXiv:1806.08804 to propose a pooling layer referred to as SimPool. This is achieved by linking the concept of network reduction by means of structural similarity in graphs with the concept of hierarchical localised pooling. Experimental results demonstrate that as part of an end-to-end Graph Neural Network architecture SimPool calculates node cluster assignments that functionally resemble more to the locality preserving pooling operations used by CNNs that operate on local receptive fields in the standard grid. Furthermore the experimental results demonstrate that these features are useful in inductive graph classification tasks with no increase to the number of parameters.
翻訳日:2022-11-25 17:28:37 公開日:2020-06-03
# 適応的チェックポイント随伴法による神経odeの勾配推定

Adaptive Checkpoint Adjoint Method for Gradient Estimation in Neural ODE ( http://arxiv.org/abs/2006.02493v1 )

ライセンス: Link先を確認
Juntang Zhuang, Nicha Dvornek, Xiaoxiao Li, Sekhar Tatikonda, Xenophon Papademetris, James Duncan(参考訳) ニューラル常微分方程式(ノード)は最近注目を集めているが、ベンチマークタスク(画像分類など)における経験的性能は離散層モデルよりも著しく劣っている。 本稿では,従来の勾配推定手法が不正確であることを示す。副次法は逆モード積分における数値誤差を持つが,直交法はODEソルバを直接バックプロパゲートするが,最適段数を求める際には冗長な深度計算グラフに悩まされる。 自動微分では、前方モードの軌道を逆モードの軌道として記録する軌道チェックポイント戦略を適用し、精度を保証し、acaは浅い計算グラフの冗長成分を削除し、acaは適応ソルバをサポートする。 画像分類タスクでは、アジョイントとナイーブの手法と比較して、ACAはトレーニング時間の半分でエラー率の半分を達成している。 時系列モデリングでは、ACAは競合する手法より優れている。 最後に, 3 体問題の一例として, NODE と ACA が物理知識を組み込んで精度を向上できることを示す。 ACAのPyTorch実装を提供する: \url{https://github.com/juntang-zhuang/torch-ACA}。

Neural ordinary differential equations (NODEs) have recently attracted increasing attention; however, their empirical performance on benchmark tasks (e.g. image classification) are significantly inferior to discrete-layer models. We demonstrate an explanation for their poorer performance is the inaccuracy of existing gradient estimation methods: the adjoint method has numerical errors in reverse-mode integration; the naive method directly back-propagates through ODE solvers, but suffers from a redundantly deep computation graph when searching for the optimal stepsize. We propose the Adaptive Checkpoint Adjoint (ACA) method: in automatic differentiation, ACA applies a trajectory checkpoint strategy which records the forward-mode trajectory as the reverse-mode trajectory to guarantee accuracy; ACA deletes redundant components for shallow computation graphs; and ACA supports adaptive solvers. On image classification tasks, compared with the adjoint and naive method, ACA achieves half the error rate in half the training time; NODE trained with ACA outperforms ResNet in both accuracy and test-retest reliability. On time-series modeling, ACA outperforms competing methods. Finally, in an example of the three-body problem, we show NODE with ACA can incorporate physical knowledge to achieve better accuracy. We provide the PyTorch implementation of ACA: \url{https://github.com/juntang-zhuang/torch-ACA}.
翻訳日:2022-11-25 17:27:20 公開日:2020-06-03
# filtered transfer learningを用いたラベル信頼度分布の学習

Learning across label confidence distributions using Filtered Transfer Learning ( http://arxiv.org/abs/2006.02528v1 )

ライセンス: Link先を確認
Seyed Ali Madani Tonekaboni, Andrew E. Brereton, Zhaleh Safikhani, Andreas Windemuth, Benjamin Haibe-Kains, Stephen MacKinnon(参考訳) ニューラルネットワークモデルのパフォーマンスは、最小レベルの不確実性を持つ大規模なデータセットの可用性に依存している。 Transfer Learning(TL)モデルは、タスク関連の参照データセットを大規模にトレーニングし、タスク固有のデータセットを微調整することで、小さなデータセットサイズの問題を解決するために提案されている。 本研究では,大きな信頼度データセットを持つ雑音データシステムの予測能力を向上させるために,トランスファーラーニング手法を適用した。 本研究では,複数の階層のデータ信頼度を,トランスファー学習環境において別々のタスクとして定義する,フィルタ付き転送学習(ftl)と呼ばれる深層ニューラルネットワーク手法を提案する。 ディープニューラルネットワークは、ラベル信頼度の低いデータポイントを反復的に削除(フィルタリング)し、再トレーニングすることで、階層的プロセスで微調整される。 本報告では, FTLを用いて薬物とタンパク質の相互作用を予測する。 FTLを用いてラベル信頼度分布を段階的に学習すると、単一の信頼範囲でトレーニングされたディープニューラルネットワークモデルよりも高いパフォーマンスが得られることを示す。 このアプローチにより、機械学習コミュニティは、生物学や医学などの分野において、不確実なラベルを持つ大規模なデータセットの恩恵を受けることが期待できる。

Performance of neural network models relies on the availability of large datasets with minimal levels of uncertainty. Transfer Learning (TL) models have been proposed to resolve the issue of small dataset size by letting the model train on a bigger, task-related reference dataset and then fine-tune on a smaller, task-specific dataset. In this work, we apply a transfer learning approach to improve predictive power in noisy data systems with large variable confidence datasets. We propose a deep neural network method called Filtered Transfer Learning (FTL) that defines multiple tiers of data confidence as separate tasks in a transfer learning setting. The deep neural network is fine-tuned in a hierarchical process by iteratively removing (filtering) data points with lower label confidence, and retraining. In this report we use FTL for predicting the interaction of drugs and proteins. We demonstrate that using FTL to learn stepwise, across the label confidence distribution, results in higher performance compared to deep neural network models trained on a single confidence range. We anticipate that this approach will enable the machine learning community to benefit from large datasets with uncertain labels in fields such as biology and medicine.
翻訳日:2022-11-25 17:26:56 公開日:2020-06-03
# Debiased Sinkhorn Barycenters

Debiased Sinkhorn barycenters ( http://arxiv.org/abs/2006.02575v1 )

ライセンス: Link先を確認
Hicham Janati, Marco Cuturi, Alexandre Gramfort(参考訳) 最適輸送におけるエントロピー正則化(ot)は、機械学習におけるwassersteinメトリクスやbarycentersの最近の関心の原動力となっている。 これにより、非正規化されたワッサースタイン距離の幾何学的性質を保ちつつ、シンクホーンのアルゴリズムのおかげで複雑さが著しく低下する。 しかし、エントロピーは固有の滑らかなバイアスをもたらし、例えばぼやけたバリセンタで生じる。 この副作用は、GPUで活用できる並列構造を壊したり、あるいは非正規化OTに戻すといった、ログドメイン安定化Sinkhornのような遅いアルゴリズムをコミュニティで定着させる誘惑を喚起している。 ここでは、このバイアスがエントロピー正則化を定義する基準測度と密に結びついていることを示すとともに、両世界の最善を保った偏りのあるwasserstein barycenterを提案する。 理論的には、単変数ガウス群のエントロピックOTバリ中心がガウス的であり、その分散バイアスを定量化する。 この結果は、エントロピーotの微分可能性と凸性を非有界台を持つ準ゲージ測度に拡張することによって得られる。 経験的に、様々なアプリケーションにおけるぼやけの低減と計算上の優位性を示す。

Entropy regularization in optimal transport (OT) has been the driver of many recent interests for Wasserstein metrics and barycenters in machine learning. It allows to keep the appealing geometrical properties of the unregularized Wasserstein distance while having a significantly lower complexity thanks to Sinkhorn's algorithm. However, entropy brings some inherent smoothing bias, resulting for example in blurred barycenters. This side effect has prompted an increasing temptation in the community to settle for a slower algorithm such as log-domain stabilized Sinkhorn which breaks the parallel structure that can be leveraged on GPUs, or even go back to unregularized OT. Here we show how this bias is tightly linked to the reference measure that defines the entropy regularizer and propose debiased Wasserstein barycenters that preserve the best of both worlds: fast Sinkhorn-like iterations without entropy smoothing. Theoretically, we prove that the entropic OT barycenter of univariate Gaussians is a Gaussian and quantify its variance bias. This result is obtained by extending the differentiability and convexity of entropic OT to sub-Gaussian measures with unbounded supports. Empirically, we illustrate the reduced blurring and the computational advantage on various applications.
翻訳日:2022-11-25 17:26:19 公開日:2020-06-03
# FastONN -- PythonベースのオペレーショナルニューラルネットワークのためのオープンソースGPU実装

FastONN -- Python based open-source GPU implementation for Operational Neural Networks ( http://arxiv.org/abs/2006.02267v1 )

ライセンス: Link先を確認
Junaid Malik, Serkan Kiranyaz and Moncef Gabbouj(参考訳) グリッド構造化データのためのニューラルネットワークの特殊クラスとして、運用ニューラルネットワーク(onns)が最近提案されている。 これにより、異種非線型操作により、広く採用されている畳み込みベースのニューロンモデルを一般化することができる。 この研究は、オペレーショナルニューラルネットワークをトレーニングするための高速GPU対応ライブラリであるFastONNを導入し、オペレーショナルニューロンの新しいベクトル化された定式化に基づいている。 バックプロパゲーションのための自動リバースモード微分を利用すると、FastONNは新しい演算子セットとカスタマイズされた勾配フローを組み込むことで柔軟性を向上させることができる。 さらに、バンドルされた補助モジュールは、さまざまなデータパーティションとカスタマイズされたメトリクスのパフォーマンストラッキングとチェックポイントのためのインターフェースを提供する。

Operational Neural Networks (ONNs) have recently been proposed as a special class of artificial neural networks for grid structured data. They enable heterogenous non-linear operations to generalize the widely adopted convolution-based neuron model. This work introduces a fast GPU-enabled library for training operational neural networks, FastONN, which is based on a novel vectorized formulation of the operational neurons. Leveraging on automatic reverse-mode differentiation for backpropagation, FastONN enables increased flexibility with the incorporation of new operator sets and customized gradient flows. Additionally, bundled auxiliary modules offer interfaces for performance tracking and checkpointing across different data partitions and customized metrics.
翻訳日:2022-11-25 17:19:50 公開日:2020-06-03
# BERT と GPT-2 を用いたCOVID-19 医学研究項目の自動要約

Automatic Text Summarization of COVID-19 Medical Research Articles using BERT and GPT-2 ( http://arxiv.org/abs/2006.01997v1 )

ライセンス: Link先を確認
Virapat Kieuvongngam, Bowen Tan, Yiming Niu(参考訳) 新型コロナウイルス(covid-19)のパンデミックにより、医療コミュニティは新型コロナウイルス関連文献の成長の加速に追随する緊急性が高まっている。 その結果、COVID-19 Open Research Dataset Challengeは学術論文のコーパスをリリースし、研究者と急速に成長する出版物のギャップを埋めるための機械学習アプローチを求めている。 本稿では,このデータセット上でテキスト要約を行うことにより,既存のNLPモデルであるBERTとOpenAI GPT-2の最近の進歩を活用する。 ROUGEスコアと視覚検査を用いて評価を行った。 本モデルは,原文から抽出したキーワードに基づく抽象的・包括的情報を提供する。 我々の研究は、要約がまだ入手できない記事の簡潔な要約を提供することで、医療コミュニティを支援することができる。

With the COVID-19 pandemic, there is a growing urgency for medical community to keep up with the accelerating growth in the new coronavirus-related literature. As a result, the COVID-19 Open Research Dataset Challenge has released a corpus of scholarly articles and is calling for machine learning approaches to help bridging the gap between the researchers and the rapidly growing publications. Here, we take advantage of the recent advances in pre-trained NLP models, BERT and OpenAI GPT-2, to solve this challenge by performing text summarization on this dataset. We evaluate the results using ROUGE scores and visual inspection. Our model provides abstractive and comprehensive information based on keywords extracted from the original articles. Our work can help the the medical community, by providing succinct summaries of articles for which the abstract are not already available.
翻訳日:2022-11-25 17:19:04 公開日:2020-06-03
# ニューラルマシン翻訳のためのノルムに基づくカリキュラム学習

Norm-Based Curriculum Learning for Neural Machine Translation ( http://arxiv.org/abs/2006.02014v1 )

ライセンス: Link先を確認
Xuebo Liu, Houtim Lai, Derek F. Wong, Lidia S. Chao(参考訳) ニューラルネットワーク翻訳(NMT)システムは、特に高リソース設定でトレーニングするのに高価である。 NMTアーキテクチャがより深く、より広くなるにつれて、この問題はますます悪化する。 本稿では,NMTの学習効率を向上させるために,新しい規範に基づくカリキュラム学習手法を提案する。 私たちは、単語埋め込みのノルム(長さまたはモジュール)を尺度として使用します。 1) 文の難しさ 2)モデルの能力,及び 3) 文の重み。 規範に基づく文難易度は、言語的動機づけとモデルに基づく文難易度の両方の利点を生かしている。 簡単に決定でき、学習に依存した特徴を含んでいる。 ノルムベースのモデル能力により、NMTはカリキュラムを完全に自動化された方法で学習し、ノルムベースの文重みはNMTのベクトル表現の学習をさらに強化する。 WMT'14英語とWMT'17中国語の翻訳タスクの実験結果は、BLEUスコア(+1.17/+1.56)とトレーニングスピードアップ(2.22x/3.33x)において、提案手法が強いベースラインを上回っていることを示している。

A neural machine translation (NMT) system is expensive to train, especially with high-resource settings. As the NMT architectures become deeper and wider, this issue gets worse and worse. In this paper, we aim to improve the efficiency of training an NMT by introducing a novel norm-based curriculum learning method. We use the norm (aka length or module) of a word embedding as a measure of 1) the difficulty of the sentence, 2) the competence of the model, and 3) the weight of the sentence. The norm-based sentence difficulty takes the advantages of both linguistically motivated and model-based sentence difficulties. It is easy to determine and contains learning-dependent features. The norm-based model competence makes NMT learn the curriculum in a fully automated way, while the norm-based sentence weight further enhances the learning of the vector representation of the NMT. Experimental results for the WMT'14 English-German and WMT'17 Chinese-English translation tasks demonstrate that the proposed method outperforms strong baselines in terms of BLEU score (+1.17/+1.56) and training speedup (2.22x/3.33x).
翻訳日:2022-11-25 17:18:50 公開日:2020-06-03
# メタ対話政策学習

Meta Dialogue Policy Learning ( http://arxiv.org/abs/2006.02588v1 )

ライセンス: Link先を確認
Yumo Xu, Chenguang Zhu, Baolin Peng and Michael Zeng(参考訳) ダイアログポリシーはエージェントの次のステップアクションを決定するため、対話システムの中心となる。 しかし、少ないデータで新しいドメインに移行する場合、新しい環境との相互作用が不十分なため、ポリシーモデルは適応できない可能性がある。 本稿では,対話行動やスロットといったドメイン間の共有可能な低レベル信号を利用するために,Deep Transferable Q-Network (DTQN)を提案する。 状態と行動表現空間をこれらの低レベルコンポーネントに対応する機能部分空間に分解し、ドメイン間の知識伝達を容易にする。 さらに,メタ学習フレームワークにdtqnを組み込んで,効果的なオフポリシートレーニングと適応を可能にするデュアルリプレイ機構を備えたメタdtqnを紹介する。 実験では、マルチドメイン対話データセットMultiWOZ 2.0において、成功率と対話効率の両面からベースラインモデルより優れている。

Dialog policy determines the next-step actions for agents and hence is central to a dialogue system. However, when migrated to novel domains with little data, a policy model can fail to adapt due to insufficient interactions with the new environment. We propose Deep Transferable Q-Network (DTQN) to utilize shareable low-level signals between domains, such as dialogue acts and slots. We decompose the state and action representation space into feature subspaces corresponding to these low-level components to facilitate cross-domain knowledge transfer. Furthermore, we embed DTQN in a meta-learning framework and introduce Meta-DTQN with a dual-replay mechanism to enable effective off-policy training and adaptation. In experiments, our model outperforms baseline models in terms of both success rate and dialogue efficiency on the multi-domain dialogue dataset MultiWOZ 2.0.
翻訳日:2022-11-25 17:18:10 公開日:2020-06-03
# 因果性とバッチ強化学習:未知領域における計画への補完的アプローチ

Causality and Batch Reinforcement Learning: Complementary Approaches To Planning In Unknown Domains ( http://arxiv.org/abs/2006.02579v1 )

ライセンス: Link先を確認
James Bannon, Brad Windsor, Wenbo Song and Tao Li(参考訳) 強化学習アルゴリズムはオンライン学習環境において大きな成功を収めている。 しかし、これらの成功はアルゴリズムエージェントとその環境の間の低速な相互作用に依存している。 医療や自動運転など、RLが利用できる多くの環境では、初期のトレーニングでほとんどのオンラインRLアルゴリズムが犯した誤りは受け入れがたいコストである。 これらの設定には、いわゆるバッチ設定で動作する強化学習アルゴリズムの開発が必要であり、アルゴリズムは固定的で有限で、いくつかの(おそらく不明な)ポリシーから生成される一連のデータから学ばなければならない。 収集したデータとは異なるポリシーを評価することはオフ・ポリシー・アセスメントと呼ばれ、自然に反事実的疑問を提起する。 本研究では, 因果推論における治療効果の評価とオフポリシー評価が, 同一問題に対する2つのアプローチであることを示す。

Reinforcement learning algorithms have had tremendous successes in online learning settings. However, these successes have relied on low-stakes interactions between the algorithmic agent and its environment. In many settings where RL could be of use, such as health care and autonomous driving, the mistakes made by most online RL algorithms during early training come with unacceptable costs. These settings require developing reinforcement learning algorithms that can operate in the so-called batch setting, where the algorithms must learn from set of data that is fixed, finite, and generated from some (possibly unknown) policy. Evaluating policies different from the one that collected the data is called off-policy evaluation, and naturally poses counter-factual questions. In this project we show how off-policy evaluation and the estimation of treatment effects in causal inference are two approaches to the same problem, and compare recent progress in these two areas.
翻訳日:2022-11-25 17:17:57 公開日:2020-06-03
# CVaRに基づく重み付きフィードバックによる学習

Learning with CVaR-based feedback under potentially heavy tails ( http://arxiv.org/abs/2006.02001v1 )

ライセンス: Link先を確認
Matthew J. Holland, El Mehdi Haress(参考訳) 我々は,cvar (conditional value-at-risk) を最小化しようとする学習アルゴリズムについて検討した。 まず,重み付き確率変数に対するCVaRの汎用的推定法について検討し,実装が容易で,有限分散しか必要としない。 この推定器を手にして,確率的勾配駆動サブプロセスによって生成される候補の中から頑健に選択する新しい学習アルゴリズムを導出する。 本手法では, CVaR境界の高確率化と, 基礎となるCVaR推定器とそれに由来する学習アルゴリズムの実証実験を補完する。

We study learning algorithms that seek to minimize the conditional value-at-risk (CVaR), when all the learner knows is that the losses incurred may be heavy-tailed. We begin by studying a general-purpose estimator of CVaR for potentially heavy-tailed random variables, which is easy to implement in practice, and requires nothing more than finite variance and a distribution function that does not change too fast or slow around just the quantile of interest. With this estimator in hand, we then derive a new learning algorithm which robustly chooses among candidates produced by stochastic gradient-driven sub-processes. For this procedure we provide high-probability excess CVaR bounds, and to complement the theory we conduct empirical tests of the underlying CVaR estimator and the learning algorithm derived from it.
翻訳日:2022-11-25 17:17:40 公開日:2020-06-03
# ガウス混合変分オートエンコーダによるオープンセット認識

Open-Set Recognition with Gaussian Mixture Variational Autoencoders ( http://arxiv.org/abs/2006.02003v1 )

ライセンス: Link先を確認
Alexander Cao, Yuan Luo, Diego Klabjan(参考訳) 推論において、オープンセットの分類は、サンプルをトレーニングから既知のクラスに分類するか、未知のクラスとして拒絶することである。 既存の深層開集合分類器は明示的な閉集合分類器を訓練し、いくつかのケースでは不随意に再構成を利用する。 それとは対照的に,我々はモデルをトレーニングして,相互に再構築を学習し,潜在空間でクラスベースのクラスタリングを行う。 これにより, ガウス混合変分オートエンコーダ(gmvae)は, 解析結果による広範囲な実験により, 平均的なf1改良率29.5%で, より正確かつロバストなオープンセット分類結果が得られる。

In inference, open-set classification is to either classify a sample into a known class from training or reject it as an unknown class. Existing deep open-set classifiers train explicit closed-set classifiers, in some cases disjointly utilizing reconstruction, which we find dilutes the latent representation's ability to distinguish unknown classes. In contrast, we train our model to cooperatively learn reconstruction and perform class-based clustering in the latent space. With this, our Gaussian mixture variational autoencoder (GMVAE) achieves more accurate and robust open-set classification results, with an average F1 improvement of 29.5%, through extensive experiments aided by analytical results.
翻訳日:2022-11-25 17:11:47 公開日:2020-06-03
# CompGuess 何? 接地言語学習のためのマルチタスク評価フレームワーク

CompGuessWhat?!: A Multi-task Evaluation Framework for Grounded Language Learning ( http://arxiv.org/abs/2006.02174v1 )

ライセンス: Link先を確認
Alessandro Suglia, Ioannis Konstas, Andrea Vanzo, Emanuele Bastianelli, Desmond Elliott, Stella Frank and Oliver Lemon(参考訳) グラウンデッド言語学習へのアプローチは、典型的には、学習された隠れた表現の望ましい性質に依存しない単一のタスクベースの最終的なパフォーマンス尺度に焦点を当てている。 これを解決するために,3つのサブタスクによる属性付きグラウンドド言語学習の評価フレームワークGROLLAを提案する。 1) 目標志向の評価 2) 対象属性予測評価,及び 3)ゼロショット評価。 また、新しいデータセットCompGuessWhatを提案します。 このフレームワークの例として、学習された神経表現、特に属性の接地に関する品質を評価する。 この目的のために、オリジナルのGuessWhatを拡張します! 知覚層の上にセマンティック層を含めることによるデータセット。 具体的には、推測に関連付けられたビジュアルジェノミーシーングラフを豊かにします。 抽象属性と位置属性を持つ画像。 診断的分類器を用いることで、現在のモデルは対象属性を符号化するのに十分な表現を学習する(平均44.27のf1)。 加えて、新しいシーンやオブジェクトがゲームプレイに関与している場合(ゼロショット最高の精度50.06%)に十分な堅牢性を持つ戦略や表現を学習しない。

Approaches to Grounded Language Learning typically focus on a single task-based final performance measure that may not depend on desirable properties of the learned hidden representations, such as their ability to predict salient attributes or to generalise to unseen situations. To remedy this, we present GROLLA, an evaluation framework for Grounded Language Learning with Attributes with three sub-tasks: 1) Goal-oriented evaluation; 2) Object attribute prediction evaluation; and 3) Zero-shot evaluation. We also propose a new dataset CompGuessWhat?! as an instance of this framework for evaluating the quality of learned neural representations, in particular concerning attribute grounding. To this end, we extend the original GuessWhat?! dataset by including a semantic layer on top of the perceptual one. Specifically, we enrich the VisualGenome scene graphs associated with the GuessWhat?! images with abstract and situated attributes. By using diagnostic classifiers, we show that current models learn representations that are not expressive enough to encode object attributes (average F1 of 44.27). In addition, they do not learn strategies nor representations that are robust enough to perform well when novel scenes or objects are involved in gameplay (zero-shot best accuracy 50.06%).
翻訳日:2022-11-25 17:10:06 公開日:2020-06-03
# IterefinE:シンボリック知識を用いた反復的KGリファインメント埋め込み

IterefinE: Iterative KG Refinement Embeddings using Symbolic Knowledge ( http://arxiv.org/abs/2006.04509v1 )

ライセンス: Link先を確認
Siddhant Arora, Srikanta Bedathur, Maya Ramanath, Deepak Sharma(参考訳) テキストソースから抽出された知識グラフ(KG)は、しばしばノイズが多く、KGベースの質問応答などの下流アプリケーションタスクでは性能が悪く、最近の活動の多くは、新しい事実を推測するために埋め込みを用いてKGの疎外性に対処することに重点を置いているが、KGリファインメントタスクによるKGのノイズのクリーンアップに関する問題は、あまり研究されていない。 kgリファインメントの最も成功した手法は推論規則とオントロジー上の推論を用いる。 いくつか例外があるが、埋め込みはオントロジ情報を利用せず、KGリファインメントタスクにおけるそれらのパフォーマンスはよく理解されていない。 本稿では, オントロジ情報と推論規則, PSL-KGI と ComplEx や ConvE などの KG 埋め込みを反復的に組み合わせた IterefinE という KG 改良フレームワークを提案する。 その結果、IterefinEは、オントロジ情報を利用して予測の質を向上させるだけでなく、(単純に)より長い推論の連鎖を実行するKG埋め込みのパワーも活用できる。 IterefinEフレームワークは、コトレーニングモードで動作し、私たちがTypeE-Xと呼ぶPSL-KGIから改良されたKGを明示的に型教師型埋め込みする。 KGベンチマークを用いて行った実験では,KGからのノイズのある事実を除去できると同時に,高品質な新たな事実を推し進めることができ,全体の重み付きF1スコアが最大9%向上することがわかった。

Knowledge Graphs (KGs) extracted from text sources are often noisy and lead to poor performance in downstream application tasks such as KG-based question answering.While much of the recent activity is focused on addressing the sparsity of KGs by using embeddings for inferring new facts, the issue of cleaning up of noise in KGs through KG refinement task is not as actively studied. Most successful techniques for KG refinement make use of inference rules and reasoning over ontologies. Barring a few exceptions, embeddings do not make use of ontological information, and their performance in KG refinement task is not well understood. In this paper, we present a KG refinement framework called IterefinE which iteratively combines the two techniques - one which uses ontological information and inferences rules, PSL-KGI, and the KG embeddings such as ComplEx and ConvE which do not. As a result, IterefinE is able to exploit not only the ontological information to improve the quality of predictions, but also the power of KG embeddings which (implicitly) perform longer chains of reasoning. The IterefinE framework, operates in a co-training mode and results in explicit type-supervised embedding of the refined KG from PSL-KGI which we call as TypeE-X. Our experiments over a range of KG benchmarks show that the embeddings that we produce are able to reject noisy facts from KG and at the same time infer higher quality new facts resulting in up to 9% improvement of overall weighted F1 score
翻訳日:2022-11-25 17:09:32 公開日:2020-06-03
# ニューラルネットワークにおけるインテリジェンスの評価

Assessing Intelligence in Artificial Neural Networks ( http://arxiv.org/abs/2006.02909v1 )

ライセンス: Link先を確認
Nicholas J. Schaub, Nathan Hotaling(参考訳) この研究の目的は、ニューラルネットワークのサイズとタスクパフォーマンスのバランスをとるネットワークアーキテクチャを評価するメトリクスを開発することである。 この目的のために、ニューラルネットワークの効率性の概念を導入し、ニューラルネットワークの性能とニューラルネットワークの効率のバランスをとるために、aiq(artificial intelligence quotient)と呼ばれる第2の指標が作成された。 aiqとニューラルネットワークの効率性を調べるため、mnistは完全連結ネットワーク(lenet-300-100)と畳み込みニューラルネットワーク(lenet-5)の2つの単純なニューラルネットワークを訓練した。 aiqが最も高いlenet-5ネットワークは、精度が2.32%低いが、最も精度の高いネットワークよりもパラメータが30,912倍少ない。 バッチ正規化とドロップアウト層の両方で神経効率が向上した。 最後に、高いaIQネットワークは記憶とオーバートレーニング耐性を示し、クラスラベルの75%がランダム化されても92.51%の精度で適切な桁分類を学習することができる。 これらの結果は、ネットワーク性能とサイズをバランスさせる指標として、aIQとニューラル効率が有効であることを示す。

The purpose of this work was to develop of metrics to assess network architectures that balance neural network size and task performance. To this end, the concept of neural efficiency is introduced to measure neural layer utilization, and a second metric called artificial intelligence quotient (aIQ) was created to balance neural network performance and neural network efficiency. To study aIQ and neural efficiency, two simple neural networks were trained on MNIST: a fully connected network (LeNet-300-100) and a convolutional neural network (LeNet-5). The LeNet-5 network with the highest aIQ was 2.32% less accurate but contained 30,912 times fewer parameters than the highest accuracy network. Both batch normalization and dropout layers were found to increase neural efficiency. Finally, high aIQ networks are shown to be memorization and overtraining resistant, capable of learning proper digit classification with an accuracy of 92.51% even when 75% of the class labels are randomized. These results demonstrate the utility of aIQ and neural efficiency as metrics for balancing network performance and size.
翻訳日:2022-11-25 17:09:00 公開日:2020-06-03
# ベイズ最適化とチューニング規則の混合によるDNNハイパーパラメータの自動設定

Automatic Setting of DNN Hyper-Parameters by Mixing Bayesian Optimization and Tuning Rules ( http://arxiv.org/abs/2006.02105v1 )

ライセンス: Link先を確認
Michele Fraccaroli, Evelina Lamma, Fabrizio Riguzzi(参考訳) 深層学習技術はその卓越した成果により、産業や研究環境においてますます重要な役割を担っている。 しかし、設定するハイパーパラメータの数が多ければ、手動で設定した場合のエラーにつながる可能性がある。 最先端のハイパーパラメータチューニング手法は、グリッド探索、ランダム探索、ベイズ最適化である。 最初の2つの方法は、それぞれハイパーパラメータのすべての組み合わせとランダムな組み合わせを試すため、高価である。 ベイズ最適化は、代わりに目的関数のサロゲートモデルを構築し、ガウス過程の回帰を用いてサロゲートの不確かさを定量化し、獲得関数を使用して新しいハイパーパラメータのサンプルの場所を決定する。 この研究はハイパーパラメータ最適化(HPO)の分野に直面する。 目的はディープニューラルネットワークに適用されたベイズ最適化を改善することである。 この目的のために,トレーニングと検証セット上でネットワークの結果を評価し分析するための新しいアルゴリズムを構築し,新しいハイパーパラメータの追加と/またはハイパーパラメータ探索空間の縮小のために一連のチューニングルールを使用する。

Deep learning techniques play an increasingly important role in industrial and research environments due to their outstanding results. However, the large number of hyper-parameters to be set may lead to errors if they are set manually. The state-of-the-art hyper-parameters tuning methods are grid search, random search, and Bayesian Optimization. The first two methods are expensive because they try, respectively, all possible combinations and random combinations of hyper-parameters. Bayesian Optimization, instead, builds a surrogate model of the objective function, quantifies the uncertainty in the surrogate using Gaussian Process Regression and uses an acquisition function to decide where to sample the new set of hyper-parameters. This work faces the field of Hyper-Parameters Optimization (HPO). The aim is to improve Bayesian Optimization applied to Deep Neural Networks. For this goal, we build a new algorithm for evaluating and analyzing the results of the network on the training and validation sets and use a set of tuning rules to add new hyper-parameters and/or to reduce the hyper-parameter search space to select a better combination.
翻訳日:2022-11-25 17:08:43 公開日:2020-06-03