このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。
公開日が20200321となっている論文です。
Title | Authors | Abstract | 論文公表日・翻訳日 |
---|---|---|---|
# 2脚超伝導回路の合成ゲージ場とキラル物理 Synthetic gauge field and chiral physics on two-leg superconducting circuits ( http://arxiv.org/abs/2003.09559v1 ) ライセンス: Link先を確認 | Xin Guan, Yanlin Feng, Zheng-Yuan Xue, Gang Chen, and Suotang Jia | (参考訳) ゲージ場は近代物理学における新しい現象の探索に不可欠である。
しかし, トランスモン量子ビットを用いた2脚超伝導回路の最近のブレークスルー実験では実現されていない [Phys. Rev. Lett. 123, 050502 (2019)]。
ここでは、各キュービットに交流マイクロ波駆動を導入して合成ゲージ場を実現する実験可能な方法を提案する。
特に、ピケット当たりの有効磁束は、駆動相を適切に選択することで独立に調整することができる。
さらに, 単ビットおよび二ビット励起の基底状態キラル電流を求め, マイスナー-渦相転移を求める。
マイスナー相では、磁束が増加するにつれて基底状態のキラル電流が増大し、渦相では減少する。
さらに,システムの初期状態に依存するキラルダイナミクスも明らかにされる。
最後に、キラル電流とダイナミクスの実験的な観測について述べる。
そこで本研究では,ゲージフィールドの相互作用,2脚ホッピング,超伝導回路上の光子の相互作用によって誘導される新しい多体特性を探索する新たな方法を提案する。 Gauge field is essential for exploring novel phenomena in modern physics. However, it has not been realized in the recent breakthrough experiment about two-leg superconducting circuits with transmon qubits [Phys. Rev. Lett. 123, 050502 (2019)]. Here we present an experimentally-feasible method to achieve the synthetic gauge field by introducing ac microwave driving in each qubit. In particular, the effective magnetic flux per plaquette achieved can be tuned independently by properly choosing the driving phases. Moreover, the ground-state chiral currents for the single- and two-qubit excitations are obtained and the Meissner-vortex phase transition is found. In the Meissner phase, the ground-state chiral current increases as the magnetic flux increases, while it decreases in the vortex phase. In addition, the chiral dynamics that depends crucially on the initial state of the system is also revealed. Finally, the possible experimental observations of the chiral current and dynamics are addressed. Therefore, our results provide a new route to explore novel many-body properties induced by the interplay of gauge field, two-leg hoppings and interaction of photons on superconducting circuits. | 翻訳日:2023-05-28 13:45:40 公開日:2020-03-21 |
# 窒化ガリウムの室温単一光子エミッタを用いた量子乱数生成 Quantum random number generator based on room-temperature single-photon emitter in gallium nitride ( http://arxiv.org/abs/2003.09551v1 ) ライセンス: Link先を確認 | Qing Luo, Zedi Cheng, Junkai Fan, Lijuan Tan, Haizhi Song, Guangwei Deng, You Wang and Qiang Zhou | (参考訳) 商業用窒化ガリウムウェハの欠陥からの室温単一光子エミッタを用いて,実時間量子乱数生成装置を実験的に実証した。
単一光子エミッタの輝度のおかげで、生のビット生成速度は1.8mhz、偏りのないビット生成速度はフォン・ノイマンのランダム性抽出手順の後に約420khzである。
以上の結果から,市販の窒化ガリウムウェハは,集積型量子乱数生成装置の開発において大きな可能性を秘めている。 We experimentally demonstrate a real-time quantum random number generator by using a room-temperature single-photon emitter from the defect in a commercial gallium nitride wafer. Thanks to the brightness of our single photon emitter, the raw bit generation rate is ~1.8 MHz, and the unbiased bit generation rate is ~420 kHz after von Neumann's randomness extraction procedure. Our results show that commercial gallium nitride wafer has great potential for the development of integrated high-speed quantum random number generator devices. | 翻訳日:2023-05-28 13:45:21 公開日:2020-03-21 |
# XORゲームにおける量子一方向対古典二方向通信 Quantum one way vs. classical two way communication in XOR games ( http://arxiv.org/abs/2003.09747v1 ) ライセンス: Link先を確認 | Abderram\'an Amr and Ignacio Villanueva | (参考訳) 本稿では,コミュニケーションを支援するxorゲームの設定において,量子資源と古典資源を指数関数的に分離する例を示す。
具体的には、2種類の古典的通信の$O(n)$ビットが1つの通信の$\log n$ qubitsで達成可能な値を達成するために必要となるXORゲームの例を示す。
また、ノルム空間のテンソルノルムの観点から、限られた量の2方向通信を補助するXORゲームの価値のキャラクタリゼーションも見出す。 In this work we give an example of exponential separation between quantum and classical resources in the setting of XOR games assisted with communication. Specifically, we show an example of a XOR game for which $O(n)$ bits of two way classical communication are needed in order to achieve the same value as can be attained with $\log n$ qubits of one way communication. We also find a characterization for the value of a XOR game assisted with a limited amount of two way communication in terms of tensor norms of normed spaces. | 翻訳日:2023-05-28 13:40:03 公開日:2020-03-21 |
# モースポテンシャルVaラプラス変換を持つN-次元Schr\"{o}dinger方程式の解 Solutions of N-dimensional Schr\"{o}dinger Equation with Morse Potential Via Laplace Transforms ( http://arxiv.org/abs/2003.09690v1 ) ライセンス: Link先を確認 | S. Miraboutalebi and L. Rajaei | (参考訳) ラプラス変換法に基づくモースポテンシャルを持つn次元schr\"{o}dinger方程式の解析解について検討した。
結果は、ペケリス近似において、シュル'{o}ディンガー方程式の半径部は1次元の対応する方程式に還元されることを示した。
したがって、その正確な解は、G. Chen, physのラプラス変換法によって得られる。
Lett!
326 (2004) 55。
また, この手法から得られたエネルギースペクトルと2点準有理近似法とニキフォロフ-ウバロフ法によるスペクトルとの比較を行った。 A study is undertaken to investigate an analytical solution for the N-dimensional Schr\"{o}dinger equation with the Morse potential based on the Laplace transformation method. The results show that in the Pekeris approximation, the radial part of the Schr\"{o}dinger equation reduces to the corresponding equation in one dimension. Hence its exact solutions can be obtained by the Laplace transformation method of G. Chen, phys. Lett. A 326 (2004) 55. In addition, a comparison is made between the energy spectrum resulted from this method and the spectra that are obtained from the two-point quasi-rational approximation method and the Nikiforov-Uvarov approach. | 翻訳日:2023-05-28 13:39:46 公開日:2020-03-21 |
# 電子光学における共形変換の一般的な枠組み A general framework for conformal transformations in electron optics ( http://arxiv.org/abs/2003.09635v1 ) ライセンス: Link先を確認 | Gianluca Ruffato, Enzo Rotunno, Vincenzo Grillo | (参考訳) 対数極変換の実装は、最近、荷電物質渦を持つ電子光学の新しい強化を導入し、線形および軌道角運動量(OAM)状態の順にマッピングし、それらを測定する。
その座標変化はホサック変換の一般的な枠組みに属し、最近静電要素によって効率的に実現されている。
このレターでは、調和相要素によって生成される共形変換の一般的な性質であり、したがって電子光学のシナリオにおいて静電気的実装が認められることを示す。
我々は,oam乗算と光学の分割のために最近導入された新しい共形写像である円セクター変換を考察し,ラプラス方程式の一般解をいかに表現するかを考察し,射影多極体と線形電荷分布を持つ位相要素の類似性を示す。
さらに,マルチポール波面のソートを行い,高速かつコンパクトかつ直接的な方法で双極子場の強度と方向を計測する,新規かつ効果的な方法を発見した。 The implementation of log-pol transformation has recently introduced a new boost in electron optics with charged matter vortices, allowing to map conformally between linear and orbital angular momentum (OAM) states and to measure them. That coordinate change belongs to the general framework of Hossack's transformations and it has been recently realized efficiently by means of electrostatic elements. In this letter we show that it is a general property of those conformal transformations to be produced by harmonic phase elements and therefore to admit an electrostatic implementation in the electron optics scenario. We consider a new kind of conformal mapping, the circular-sector transformation, which has been recently introduced for OAM multiplication and division in optics, and discuss how it represents a general solution of Laplace's equation, showing the analogy of the generating phase elements with projected multipole fields and linear charge distributions. Moreover, we demonstrate its capability to perform the sorting of multipole wavefronts, discovering a novel and effective method to measure the strength and orientation of a dipole field in a fast, compact and direct way. | 翻訳日:2023-05-28 13:39:26 公開日:2020-03-21 |
# ランダム媒質中における多体局在転移のエルゴード側異常ダイナミクスと配向高分子のガラス相 Anomalous dynamics in the ergodic side of the Many-Body Localization transition and the glassy phase of Directed Polymers in Random Media ( http://arxiv.org/abs/2003.09629v1 ) ライセンス: Link先を確認 | Giulio Biroli and Marco Tarzia | (参考訳) 多体量子力学の玩具モデルとしてベーテ格子上の非相互作用アンダーソン強結合モデルを用いて、多体局在遷移の前の悪い金属相に現れる不規則に遅いダイナミクスについて、新しい透明な理論的説明を提案する。
ランダム媒質中の有向高分子に多体波動関数の時間的脱相関をマッピングすることにより、小乱れで金属様相を分離する拡張構造の中にガラス転移が存在することを示し、そこでは指数関数的な数の経路上で非局在化が起こる。
この図から現れる亜拡散と非指数緩和の物理的解釈はグリフィスのものと相補的であるが、どちらのシナリオも脱走時の重み付き分布の存在に依存している。
ガラス相の動的進化と配向高分子の脱スピン遷移を関連づけ, エネルギーのようなパラメータが変化するとき, 好ましくは非局在化経路のマクロ的および急激なジャンプを生じさせ, 異なるエネルギーにおける固有状態間の重なり合う相関関数の特異な挙動を生じさせる。
ループのないケイリー木とランダム正規グラフの量子力学を比較することで、ループの効果を議論し、後者のスローダイナミクスと明らかなパワーローが非常に大きなタイムウインドウに広がるが、最終的にMBL遷移で分岐する時間スケールで切り離されることを示す。 Using the non-interacting Anderson tight-binding model on the Bethe lattice as a toy model for the many-body quantum dynamics, we propose a novel and transparent theoretical explanation of the anomalously slow dynamics that emerges in the bad metal phase preceding the Many-Body Localization transition. By mapping the time-decorrelation of many-body wave-functions onto Directed Polymers in Random Media, we show the existence of a glass transition within the extended regime separating a metallic-like phase at small disorder, where delocalization occurs on an exponential number of paths, from a bad metal-like phase at intermediate disorder, where resonances are formed on rare, specific, disorder dependent site orbitals on very distant generations. The physical interpretation of subdiffusion and non-exponential relaxation emerging from this picture is complementary to the Griffiths one, although both scenarios rely on the presence of heavy-tailed distribution of the escape times. We relate the dynamical evolution in the glassy phase to the depinning transition of Directed Polymers, which results in macroscopic and abrupt jumps of the preferred delocalizing paths when a parameter like the energy is varied, and produce a singular behavior of the overlap correlation function between eigenstates at different energies. By comparing the quantum dynamics on loop-less Cayley trees and Random Regular Graphs we discuss the effect of loops, showing that in the latter slow dynamics and apparent power-laws extend on a very large time-window but are eventually cut-off on a time-scale that diverges at the MBL transition. | 翻訳日:2023-05-28 13:39:04 公開日:2020-03-21 |
# 線形量子系における耐故障性コヒーレントH-無限性制御 Fault-tolerant Coherent H-infinity Control for Linear Quantum Systems ( http://arxiv.org/abs/2003.09609v1 ) ライセンス: Link先を確認 | Yanan Liu, Daoyi Dong, Ian R. Petersen, Qing Gao, Steven X. Ding, Shota Yokoyama and Hidehiro Yonezawa | (参考訳) 堅牢性と信頼性は、実用的な量子制御システムを開発するための2つの重要な要件である。
本研究の目的は,閉ループ量子系が耐故障性とH-無限障害減衰性能の両方を有するように,マルコフジャンピング障害に悩まされる線形量子系に対するコヒーレントフィードバックコントローラを設計することである。
本稿ではまず,線形確率量子システムにおける時間不変の場合から時変の場合へ物理的実現条件を拡張した。
フォールトトレラントH-無限性制御問題をリカティ微分方程式の散逸特性と解に関連付けることにより、量子系のH-無限性制御装置は線形行列の不等式(LMI)の集合を解くことによって設計される。
特に、追加のノイズを導入し、対応する入力行列を構築して量子コントローラの物理的実現性を保証するためにアルゴリズムが用いられる。
開発した耐故障性制御戦略の実応用として、量子光学による線形量子システムの例を示し、ポンプ磁場の振幅は異なる値間でランダムに変化する。
量子h-infinityコントローラは, 所望の制御目標を達成するために, 基本的な光学成分を用いて設計, 実装できることが実証された。 Robustness and reliability are two key requirements for developing practical quantum control systems. The purpose of this paper is to design a coherent feedback controller for a class of linear quantum systems suffering from Markovian jumping faults so that the closed-loop quantum system has both fault tolerance and H-infinity disturbance attenuation performance. This paper first extends the physical realization conditions from the time-invariant case to the time-varying case for linear stochastic quantum systems. By relating the fault tolerant H-infinity control problem to the dissipation properties and the solutions of Riccati differential equations, an H-infinity controller for the quantum system is then designed by solving a set of linear matrix inequalities (LMIs). In particular, an algorithm is employed to introduce additional noises and to construct the corresponding input matrices to ensure the physical realizability of the quantum controller. For real applications of the developed fault-tolerant control strategy, we present a linear quantum system example from quantum optics, where the amplitude of the pumping field randomly jumps among different values. It is demonstrated that a quantum H-infinity controller can be designed and implemented using some basic optical components to achieve the desired control goal. | 翻訳日:2023-05-28 13:38:33 公開日:2020-03-21 |
# 粒子交換による貯水池に結合したオープン量子系の励起力学と熱化 Exact dynamics and thermalization of open quantum systems coupled to reservoir through particle exchanges ( http://arxiv.org/abs/2003.09598v1 ) ライセンス: Link先を確認 | Fei-Lei Xiong, Wei-Min Zhang | (参考訳) 本稿では,粒子交換による環境と相互作用する一般開放系の正確なダイナミクスについて検討する。
論文には2つの主な結果が含まれている。
まず,コヒーレント状態表現における伝播関数を生かして,ケルディッシュ非平衡グリーン関数を用いて解を表現した完全マスター方程式を解く。
第二に、力学的な観点からは、オープン量子システムの厳密な熱化過程を提供する。 In this paper, we study the exact dynamics of general open systems interacting with its environment through particle exchanges. The paper includes two main results. First, by taking advantage of the propagating function in the coherent state representation, we solve the exact master equation, whose solution is expressed in terms of the Keldysh nonequilibrium Green functions. Second, in the dynamical perspective, we provide a rigorous thermalization process of open quantum systems. | 翻訳日:2023-05-28 13:38:12 公開日:2020-03-21 |
# ビデオトラッキングにおけるアクティブラーニング Active Learning in Video Tracking ( http://arxiv.org/abs/1912.12557v3 ) ライセンス: Link先を確認 | Sima Behpour | (参考訳) 不確実性サンプリングのようなアクティブな学習手法と確率的予測技術の組み合わせは、画像分類やテキスト分類といった様々な問題で成功している。
より複雑な多変量予測タスクでは、ラベル間の関係はより優れた性能を持つ構造化分類器の設計において重要な役割を果たす。
しかし、計算時間の複雑さは、確率論的手法が能動的学習を効果的に支援することを制限する。
具体的には、構造化支持ベクトルマシンに基づく非確率的手法を二成分マッチングの予測に適用することができるが、条件付き確率場はこれらの構造には難解である。
本稿では,マッチング可能な構造的予測領域を持つアクティブラーニングに対する敵意的アプローチを提案する。
ビデオ内のオブジェクト追跡という,構造化予測の重要な問題に対して,このアプローチをアルゴリズム的に評価する。
提案手法の精度と計算効率が向上することを示す。 Active learning methods, like uncertainty sampling, combined with probabilistic prediction techniques have achieved success in various problems like image classification and text classification. For more complex multivariate prediction tasks, the relationships between labels play an important role in designing structured classifiers with better performance. However, computational time complexity limits prevalent probabilistic methods from effectively supporting active learning. Specifically, while non-probabilistic methods based on structured support vector machines can be tractably applied to predicting bipartite matchings, conditional random fields are intractable for these structures. We propose an adversarial approach for active learning with structured prediction domains that is tractable for matching. We evaluate this approach algorithmically in an important structured prediction problems: object tracking in videos. We demonstrate better accuracy and computational efficiency for our proposed method. | 翻訳日:2023-01-17 07:27:08 公開日:2020-03-21 |
# nmr量子プロセッサを用いた局所計測に基づく階層構造を用いた非局所相関の実験的検出 Experimental Detection of Non-local Correlations using a Local Measurement-Based Hierarchy on an NMR Quantum Processor ( http://arxiv.org/abs/2001.00699v2 ) ライセンス: Link先を確認 | Amandeep Singh, Dileep Singh, Vaishali Gulati, Arvind and Kavita Dorai | (参考訳) 量子系が持つ相関の非局所的性質はベル型不等式違反の実験的な証明によって明らかになる。
最近の研究は、量子システムが実際の実験で持つことができる相関に限界を置いている。
これらの境界は、いくつかの低次元サブシステムからなる複合量子システムに限定された。
より一般的なアプローチでは、自然の量子力学的記述から生じる相関の非局所的性質を明らかにする身体相関がより少ないことが示されている。
このような相関に関するテストは半定値プログラム(SDP)に変換することができる。
本研究では,3つの核スピンを量子ビットとして用いた核磁気共鳴(nmr)ハードウェア上での局所計測に基づく階層の実験的実装について報告する。
このプロトコルは、W状態、GHZ状態、数個のグラフ状態など、真に絡み合った三部構造で実験的にテストされている。
いずれの場合も, モーメント行列の成分に対する線形制約を用いてSDPを定式化するために実験的に測定された相関式を用いた。
その結果,SDPは実験データと一致した半定値の正のモーメント行列が見つからなかった。
これは、観測された相関が分離可能な状態の局所的な測定から生じず、したがって自然界では非局所的であることを示し、テスト中の状態が実際に絡み合っていることを確かめる。 The non-local nature of the correlations possessed by quantum systems may be revealed by experimental demonstrations of the violation of Bell-type inequalities. Recent work has placed bounds on the correlations that quantum systems can possess in an actual experiment. These bounds were limited to a composite quantum system comprising of a few lower-dimensional subsystems. In a more general approach, it has been shown that fewer body correlations can reveal the non-local nature of the correlations arising from a quantum mechanical description of nature. Such tests on the correlations can be transformed to a semi-definite program (SDP). This study reports the experimental implementation of a local measurement-based hierarchy on the nuclear magnetic resonance (NMR) hardware utilizing three nuclear spins as qubits. The protocol has been experimentally tested on genuinely entangled tripartite states such as W state, GHZ state and a few graph states. In all the cases, the experimentally measured correlations were used to formulate the SDP, using linear constraints on the entries of the moment matrix. We observed that for each genuinely entangled state, the SDP failed to find a semi-definite positive moment matrix consistent with the experimental data. This implies that the observed correlations can not arise from local measurements on a separable state and are hence non-local in nature, and also confirms that the states being tested are indeed entangled. | 翻訳日:2023-01-14 17:44:49 公開日:2020-03-21 |
# ヒューマノイドロボットによる姿勢認識とジェスチャー模倣 Human Posture Recognition and Gesture Imitation with a Humanoid Robot ( http://arxiv.org/abs/2002.01779v3 ) ライセンス: Link先を確認 | Amir Aly | (参考訳) 本研究は社会ロボットnaoを用いた静的・動的ジェスチャー解析と模倣のための異なるアプローチを提案する。 This study proposes different approaches for static and dynamic gesture analysis and imitation with the social robot Nao | 翻訳日:2023-01-03 21:45:42 公開日:2020-03-21 |
# GIM:ガウス分離機 GIM: Gaussian Isolation Machines ( http://arxiv.org/abs/2002.02176v2 ) ライセンス: Link先を確認 | Guy Amit, Ishai Rosenberg, Moshe Levy, Ron Bitton, Asaf Shabtai, and Yuval Elovici | (参考訳) 多くの場合、ニューラルネットワーク分類器は、トレーニング分散データの外にある入力データに晒される可能性が高い。
分布の外からのサンプルは、ソフトマックスベースの分類器によって高い確率で既存のクラスに分類されることがある。
従来, 学習分布データと配布外データ(OOD)を区別することを目的とした研究では, 分類法以外の検出器が提案されていた。
我々は,OODデータに遭遇した場合に発生する問題を解くことを目的とした,新しいハイブリッド分類器であるガウス分離機(GIM)を提案する。
GIMはニューラルネットワークに基づいており、ニューラルネットワークの出力空間内のトレーニングされた各クラスに分布を課す新しい損失関数を利用する。
提案されたgimのノベルティは、識別性能と生成能力であり、単一の分類器では一般的に見られない特徴の組み合わせである。
GIMは、画像認識および感情分析ベンチマークデータセットの最先端の分類結果を達成し、OOD入力にも対応できる。 In many cases, neural network classifiers are likely to be exposed to input data that is outside of their training distribution data. Samples from outside the distribution may be classified as an existing class with high probability by softmax-based classifiers; such incorrect classifications affect the performance of the classifiers and the applications/systems that depend on them. Previous research aimed at distinguishing training distribution data from out-of-distribution data (OOD) has proposed detectors that are external to the classification method. We present Gaussian isolation machine (GIM), a novel hybrid (generative-discriminative) classifier aimed at solving the problem arising when OOD data is encountered. The GIM is based on a neural network and utilizes a new loss function that imposes a distribution on each of the trained classes in the neural network's output space, which can be approximated by a Gaussian. The proposed GIM's novelty lies in its discriminative performance and generative capabilities, a combination of characteristics not usually seen in a single classifier. The GIM achieves state-of-the-art classification results on image recognition and sentiment analysis benchmarking datasets and can also deal with OOD inputs. | 翻訳日:2023-01-03 09:53:23 公開日:2020-03-21 |
# 論理制約による注意強化学習 Cautious Reinforcement Learning with Logical Constraints ( http://arxiv.org/abs/2002.12156v2 ) ライセンス: Link先を確認 | Mohammadhosein Hasanbeig, Alessandro Abate, Daniel Kroening | (参考訳) 本稿では,Reinforcement Learning (RL) が学習過程の安全性を確保しつつ,最適制御ポリシの合成を強制する適応型安全なパディングの概念を提案する。
ポリシーは、最大確率の時相論理式として表される目標を満たすために合成される。
学習中にRLエージェントを安全に保つよう強制することは、探索を制限する可能性があるが、提案されたアーキテクチャは、探索における効率的な進捗(目標達成に向けて)と安全性の確保の間のトレードオフを自動的に処理できることを示している。
理論的な保証は、合成されたポリシーの最適性と学習アルゴリズムの収束について利用できる。
提案手法の性能を示す実験結果が得られた。 This paper presents the concept of an adaptive safe padding that forces Reinforcement Learning (RL) to synthesise optimal control policies while ensuring safety during the learning process. Policies are synthesised to satisfy a goal, expressed as a temporal logic formula, with maximal probability. Enforcing the RL agent to stay safe during learning might limit the exploration, however we show that the proposed architecture is able to automatically handle the trade-off between efficient progress in exploration (towards goal satisfaction) and ensuring safety. Theoretical guarantees are available on the optimality of the synthesised policies and on the convergence of the learning algorithm. Experimental results are provided to showcase the performance of the proposed method. | 翻訳日:2022-12-28 13:57:54 公開日:2020-03-21 |
# 最も適切な集中度尺度をどうやって選ぶか? How to choose the most appropriate centrality measure? ( http://arxiv.org/abs/2003.01052v3 ) ライセンス: Link先を確認 | Pavel Chebotarev and Dmitry Gubanov | (参考訳) 本稿では,その尺度が単純なグラフの集合に対してどのように動作するかというユーザの意見に基づいて,最も適切なネットワーク集中度尺度を選択する新しい手法を提案する。
この方法は、1つの候補測度のセットである$\cal f$を形成すること、2いくつかのノードで$\cal f$ですべての測度を区別する十分単純なグラフの列を生成すること、3テストノードの中央性の比較に関する質問を伴うサーベイをコンパイルすること、(4)すべてのユーザー応答に一貫性のある集中度指標を提供する。
開発されたアルゴリズムは、任意の有限集合$\cal f$ の測度に対してこのアプローチを実装することができる。
本稿では,40の集中度尺度のセットの実現について述べる。
カルリングと呼ばれる手法は、ある規範的条件(公理)を満たす尺度のサブセットに関するサーベイをコンパイルすることで、迅速な分析や規範的アプローチと組み合わせることができる。
本研究は,自己整合性あるいはブリッジ公理によって決定される部分集合について行った。 We propose a new method to select the most appropriate network centrality measure based on the user's opinion on how such a measure should work on a set of simple graphs. The method consists in: (1) forming a set $\cal F$ of candidate measures; (2) generating a sequence of sufficiently simple graphs that distinguish all measures in $\cal F$ on some pairs of nodes; (3) compiling a survey with questions on comparing the centrality of test nodes; (4) completing this survey, which provides a centrality measure consistent with all user responses. The developed algorithms make it possible to implement this approach for any finite set $\cal F$ of measures. This paper presents its realization for a set of 40 centrality measures. The proposed method called culling can be used for rapid analysis or combined with a normative approach by compiling a survey on the subset of measures that satisfy certain normative conditions (axioms). In the present study, the latter was done for the subsets determined by the Self-consistency or Bridge axioms. | 翻訳日:2022-12-27 06:05:48 公開日:2020-03-21 |
# GMM-UNIT:Attribute Gaussian Mixture Modelingによる教師なしマルチドメイン・マルチモーダル画像変換 GMM-UNIT: Unsupervised Multi-Domain and Multi-Modal Image-to-Image Translation via Attribute Gaussian Mixture Modeling ( http://arxiv.org/abs/2003.06788v2 ) ライセンス: Link先を確認 | Yahui Liu, Marco De Nadai, Jian Yao, Nicu Sebe, Bruno Lepri, Xavier Alameda-Pineda | (参考訳) unsupervised image-to-image translation (unit)は、非ペアトレーニングイメージを使用して、複数のビジュアルドメイン間のマッピングを学ぶことを目的としている。
最近の研究では、複数のドメインで顕著な成功を収めているが、2つの大きな制限がある。それらは、独立して学習する必要がある複数の2つのドメインマッピングから構築されるか、モード崩壊として知られる低多様性結果を生成する。
これらの制約を克服するために,属性空間にGMMを付加したコンテンツ属性不整合表現に基づくGMM-UNITという手法を提案する。
各GMMコンポーネントはドメインを表しており、この単純な仮定には2つの顕著な利点がある。
まず、ほとんどのマルチドメインおよびマルチモーダルな画像から画像への翻訳タスクに簡単に拡張できる。
第二に、連続的なドメインエンコーディングはドメイン間の補間と、見えないドメインや翻訳への外挿を可能にする。
さらに,GMM-UNITは,教師なし画像・画像翻訳のための統一フレームワークであることを示す。 Unsupervised image-to-image translation (UNIT) aims at learning a mapping between several visual domains by using unpaired training images. Recent studies have shown remarkable success for multiple domains but they suffer from two main limitations: they are either built from several two-domain mappings that are required to be learned independently, or they generate low-diversity results, a problem known as mode collapse. To overcome these limitations, we propose a method named GMM-UNIT, which is based on a content-attribute disentangled representation where the attribute space is fitted with a GMM. Each GMM component represents a domain, and this simple assumption has two prominent advantages. First, it can be easily extended to most multi-domain and multi-modal image-to-image translation tasks. Second, the continuous domain encoding allows for interpolation between domains and for extrapolation to unseen domains and translations. Additionally, we show how GMM-UNIT can be constrained down to different methods in the literature, meaning that GMM-UNIT is a unifying framework for unsupervised image-to-image translation. | 翻訳日:2022-12-23 08:56:29 公開日:2020-03-21 |
# lrc-net:ローカル領域コンテキストの符号化によるポイントクラウドの識別的特徴の学習 LRC-Net: Learning Discriminative Features on Point Clouds by Encoding Local Region Contexts ( http://arxiv.org/abs/2003.08240v2 ) ライセンス: Link先を確認 | Xinhai Liu, Zhizhong Han, Fangzhou Hong, Yu-Shen Liu, Matthias Zwicker | (参考訳) ポイントクラウド上で直接差別的特徴を学習することは、3D形状を理解する上で依然として困難である。
最近の手法では、通常、点雲を局所的な領域集合に分割し、固定サイズのCNNまたはMPPで局所的な特徴を抽出し、最後に、単純な最大プールを用いて各局所的特徴をグローバルな特徴に集約する。
しかし, サンプル点雲における不規則性や空間性のため, 特定特徴を学習する能力を制限する固定サイズフィルタと個々の局所特徴積分のみを用いれば, 局所領域の微細な形状と空間的関係を符号化することは困難である。
そこで本研究では,ローカル領域内およびローカル領域間における細粒度コンテキストを符号化することにより,ポイントクラウド上の識別特徴を学習する,新しいローカル領域コンテキストネットワーク(lrc-net)を提案する。
LRC-Netは2つの主要なモジュールで構成される。
最初のモジュールはintra-region context encodingと呼ばれ、新しい可変サイズの畳み込みフィルタによって各局所領域内の幾何相関をキャプチャするように設計されている。
地域間コンテキスト符号化と呼ばれる第2のモジュールは,空間的類似度尺度に基づいて地域間の空間的関係を統合するために提案される。
実験結果から, LRC-Netは形状分類や形状分割への応用において最先端の手法と競合することが示された。 Learning discriminative feature directly on point clouds is still challenging in the understanding of 3D shapes. Recent methods usually partition point clouds into local region sets, and then extract the local region features with fixed-size CNN or MLP, and finally aggregate all individual local features into a global feature using simple max pooling. However, due to the irregularity and sparsity in sampled point clouds, it is hard to encode the fine-grained geometry of local regions and their spatial relationships when only using the fixed-size filters and individual local feature integration, which limit the ability to learn discriminative features. To address this issue, we present a novel Local-Region-Context Network (LRC-Net), to learn discriminative features on point clouds by encoding the fine-grained contexts inside and among local regions simultaneously. LRC-Net consists of two main modules. The first module, named intra-region context encoding, is designed for capturing the geometric correlation inside each local region by novel variable-size convolution filter. The second module, named inter-region context encoding, is proposed for integrating the spatial relationships among local regions based on spatial similarity measures. Experimental results show that LRC-Net is competitive with state-of-the-art methods in shape classification and shape segmentation applications. | 翻訳日:2022-12-22 12:40:51 公開日:2020-03-21 |
# AQPDBJUTデータセット:BJUTキャンパスにおける画像に基づくPMモニタリング AQPDBJUT Dataset: Picture-Based PM Monitoring in the Campus of BJUT ( http://arxiv.org/abs/2003.08609v2 ) ライセンス: Link先を確認 | Yonghui Zhang (1-4), Ke Gu (1-4) ((1) Engineering Research Center of Intelligent Perception and Autonomous Control, AMinistry of Education, (2) Beijing Key Laboratory of Computational Intelligence and Intelligent System, (3) Beijing Key Laboratory of Computational Intelligence and Intelligent System, (4) Faculty of Information Technology, Beijing University of Technology, China) | (参考訳) 学生の体力の確保は将来の健康に不可欠である。
近年、粒子状物質(PM)の濃度が増加し続けており、学生の健康に深刻な害を与えている。
したがって、キャンパス内のPM濃度を予防し、制御することが非常に必要である。
PM予防とコントロールの源泉として,PMモニタリングのための優れたモデルの開発は極めて緊急であり,大きな課題となっている。
過去の研究で、PMモニタリングにフォトベースの方法が利用できることが判明している。
大学キャンパスにおける既存のPMモニタリング手法の有効性を検証するため,北京工科大学で収集された1500枚の写真を含む新しいデータセットを構築した。
実験によると、最先端の手法はキャンパスでのPMモニタリングには適していない。 Ensuring the students in good physical levels is imperative for their future health. In recent years, the continually growing concentration of Particulate Matter (PM) has done increasingly serious harm to student health. Hence, it is highly required to prevent and control PM concentrations in the campus. As the source of PM prevention and control, developing a good model for PM monitoring is extremely urgent and has posed a big challenge. It has been found in prior works that photobased methods are available for PM monitoring. To verify the effectiveness of existing PM monitoring methods in the campus, we establish a new dataset which includes 1,500 photos collected in the Beijing University of Technology. Experiments show that stated-of-the-art methods are far from ideal for PM monitoring in the campus. | 翻訳日:2022-12-22 04:24:03 公開日:2020-03-21 |
# 顕微鏡映像における動的物体挙動記述のための折り畳み機能 Foldover Features for Dynamic Object Behavior Description in Microscopic Videos ( http://arxiv.org/abs/2003.08628v2 ) ライセンス: Link先を確認 | Xialin Li, Chen Li and Wenwei Zhao | (参考訳) 行動記述は、微少な物体、類似した物体、弱い視覚情報を持つ物体、類似した視覚情報を持つ物体を分析し、顕微鏡ビデオにおける動的物体の識別と分類において基本的な役割を果たす。
この目的のために、動的オブジェクトの振る舞いを記述するために折り畳み機能を提案する。
まず、X、Y、Z方向の微視的ビデオにおいて、各物体の折り畳みをそれぞれ生成する。
そして,X,Y,Z方向の折り曲げ特徴を統計的手法で抽出する。
最後に,提案する折り畳み機能の有効性をテストするために,4種類の分類器を用いた。
実験では,3種類の1374精子を含む折り畳み機能の評価に精子顕微鏡によるビデオデータセットを用い,96.5%の分類精度を得た。 Behavior description is conducive to the analysis of tiny objects, similar objects, objects with weak visual information and objects with similar visual information, playing a fundamental role in the identification and classification of dynamic objects in microscopic videos. To this end, we propose foldover features to describe the behavior of dynamic objects. First, we generate foldover for each object in microscopic videos in X, Y and Z directions, respectively. Then, we extract foldover features from the X, Y and Z directions with statistical methods, respectively. Finally, we use four different classifiers to test the effectiveness of the proposed foldover features. In the experiment, we use a sperm microscopic video dataset to evaluate the proposed foldover features, including three types of 1374 sperms, and obtain the highest classification accuracy of 96.5%. | 翻訳日:2022-12-22 04:23:20 公開日:2020-03-21 |
# 協調型マルチロボット物体操作のための分散強化学習 Distributed Reinforcement Learning for Cooperative Multi-Robot Object Manipulation ( http://arxiv.org/abs/2003.09540v1 ) ライセンス: Link先を確認 | Guohui Ding, Joewie J. Koh, Kelly Merckaert, Bram Vanderborght, Marco M. Nicotra, Christoffer Heckman, Alessandro Roncone, Lijun Chen | (参考訳) 強化学習(RL)を用いた協調型マルチロボットオブジェクト操作タスクについて検討する。
分散近似rl (da-rl) では, 各エージェントが個別の報酬関数をq-ラーニングし, エージェントが二行列のq-値ゲームのnash平衡に基づいてq値を更新するゲーム理論rl (gt-rl) を提案する。
2つの模擬ロボットアームによる協調物体操作の設定における提案手法の有効性を検証する。
本稿では,二つのエージェントの小さなシステムに焦点を当てるが,da-rl と gt-rl は一般のマルチエージェントシステムに適用され,大規模システムへのスケール性が期待できる。 We consider solving a cooperative multi-robot object manipulation task using reinforcement learning (RL). We propose two distributed multi-agent RL approaches: distributed approximate RL (DA-RL), where each agent applies Q-learning with individual reward functions; and game-theoretic RL (GT-RL), where the agents update their Q-values based on the Nash equilibrium of a bimatrix Q-value game. We validate the proposed approaches in the setting of cooperative object manipulation with two simulated robot arms. Although we focus on a small system of two agents in this paper, both DA-RL and GT-RL apply to general multi-agent systems, and are expected to scale well to large systems. | 翻訳日:2022-12-21 13:26:57 公開日:2020-03-21 |
# 家電用人的活動の連続モニタリングのためのRFセンシング RF Sensing for Continuous Monitoring of Human Activities for Home Consumer Applications ( http://arxiv.org/abs/2003.09699v1 ) ライセンス: Link先を確認 | Moeness G. Amin, Arun Ravisankar and Ronny G. Guendel | (参考訳) 屋内モニタリングのためのレーダーは、スマートホーム、生活支援、医療診断の様々な健康と健康の応用をカバーし支援する、研究開発の新たな分野である。
家庭用モニタリングアプリケーションのためのrfセンシングシステムについて報告する。
本システムは,日常生活活動(ADL)を認識し,データ処理とトレーニングアルゴリズムを用いて独特の動作特性を検出する。
また,翻訳動作(アクティブモード)とインプレース動作(レスティングモード)に分類できる様々な人間の活動を継続的に監視する課題についても検討した。
本研究では,レンジドップラーレーダによって提供されるレンジマップを用いて,これら2つのカテゴリ間の遷移時間を求める。
これは、レンジマップ画像内の異なる傾斜の直線を識別するラドン変換を用いて達成される。
活動が重要でないまたは無視できない範囲の時間間隔において、レーダーリターンマイクロドップラーシグネチャのパワーしきい値は、重要でないまたは無視できない範囲の閾値で個々の活動の時間スパンを定義するために使用される。
異なる動作の遷移時間とタイムスパンの両方を見つけることは、混合アクティビティをカバーする時間ウィンドウ上の決定を避けるため、分類の改善につながる。 Radar for indoor monitoring is an emerging area of research and development, covering and supporting different health and wellbeing applications of smart homes, assisted living, and medical diagnosis. We report on a successful RF sensing system for home monitoring applications. The system recognizes Activities of Daily Living(ADL) and detects unique motion characteristics, using data processing and training algorithms. We also examine the challenges of continuously monitoring various human activities which can be categorized into translation motions (active mode) and in-place motions (resting mode). We use the range-map, offered by a range-Doppler radar, to obtain the transition time between these two categories, characterized by changing and constant range values, respectively. This is achieved using the Radon transform that identifies straight lines of different slopes in the range-map image. Over the in-place motion time intervals, where activities have insignificant or negligible range swath, power threshold of the radar return micro-Doppler signatures,which is employed to define the time-spans of individual activities with insignificant or negligible range swath. Finding both the transition times and the time-spans of the different motions leads to improved classifications, as it avoids decisions rendered over time windows covering mixed activities. | 翻訳日:2022-12-21 13:26:19 公開日:2020-03-21 |
# LHCb高速シミュレーションのための生成逆ネットワーク Generative Adversarial Networks for LHCb Fast Simulation ( http://arxiv.org/abs/2003.09762v1 ) ライセンス: Link先を確認 | Fedor Ratnikov | (参考訳) LHCbはCERNのLarge Hadron Colliderで行われている主要な実験の1つである。
物理プログラムの豊かさとLHCbの測定精度の増大により、さらに大きなシミュレーションサンプルが必要になった。
改良されたLHCb検出器がLHC Run 3のデータ収集を開始すると、このニーズはさらに増加するだろう。
今後数年間にモンテカルロシミュレーションイベントの生産を約束する計算資源を考えると、期待されるデータセットサイズに対処するために高速シミュレーション技術の使用が必須となる。
現在コンピュータビジョンや画像処理に広く使われているlhcb生成モデルでは、チェレンコフ検出器の温度計におけるシャワーの発生と高レベル応答を加速するために研究されている。
我々は,このアプローチが高い忠実度と大幅な速度向上をもたらすことを実証し,これらの結果が示唆される可能性について議論する。
また,このアルゴリズムをLHCbシミュレーションソフトウェアに実装し,検証試験を行う。 LHCb is one of the major experiments operating at the Large Hadron Collider at CERN. The richness of the physics program and the increasing precision of the measurements in LHCb lead to the need of ever larger simulated samples. This need will increase further when the upgraded LHCb detector will start collecting data in the LHC Run 3. Given the computing resources pledged for the production of Monte Carlo simulated events in the next years, the use of fast simulation techniques will be mandatory to cope with the expected dataset size. In LHCb generative models, which are nowadays widely used for computer vision and image processing are being investigated in order to accelerate the generation of showers in the calorimeter and high-level responses of Cherenkov detector. We demonstrate that this approach provides high-fidelity results along with a significant speed increase and discuss possible implication of these results. We also present an implementation of this algorithm into LHCb simulation software and validation tests. | 翻訳日:2022-12-21 13:25:57 公開日:2020-03-21 |
# BiCANet:画像セマンティックセグメンテーションのための双方向コンテキスト集約ネットワーク BiCANet: Bi-directional Contextual Aggregating Network for Image Semantic Segmentation ( http://arxiv.org/abs/2003.09669v1 ) ライセンス: Link先を確認 | Quan Zhou, Dechun Cong, Bin Kang, Xiaofu Wu, Baoyu Zheng, Huimin Lu and Longin Jan Latecki | (参考訳) 畳み込みニューラルネットワーク(CNN)における文脈情報の探索は近年,セマンティックセグメンテーションにおいて大きな注目を集めている。
本稿では,セマンティックセグメンテーションのための双方向コンテキスト集約ネットワークBiCANetを提案する。
特徴空間のコンテキストを符号化する従来のアプローチとは異なり、BiCANetは、コンテキスト凝縮プロジェクションブロック(CCPB)、双方向コンテキスト相互作用ブロック(BCIB)、ミューティスケールコンテキスト融合ブロック(MCFB)の3つの部分からなる分類的視点からコンテキストキューを集約する。
より具体的には、CCPBは、中間層から異なる受容場を持つコンテキストキューを凝縮する分割変換マージアーキテクチャを通してカテゴリベースのマッピングを学ぶ。
一方、BCIBはクラスレベルのコンテキスト交換を強化するために高密度のスキップ接続を使用している。
最後に、MCFBは、短距離および長距離空間依存性を調査することによって、マルチスケールのコンテキストキューを統合する。
BiCANetを評価するために,PASCAL VOC,Cityscapes,ADE20Kの3つのセマンティックセグメンテーションデータセットについて広範な実験を行った。
実験の結果,BiCANetはポストプロセッシング手法を使わずに最近の最先端ネットワークよりも優れていた。
特にBiCANetは、PASCAL VOC 2012、Cityscapes、ADE20KでmIoUスコアが86.7%、82.4%、38.66%に達した。 Exploring contextual information in convolution neural networks (CNNs) has gained substantial attention in recent years for semantic segmentation. This paper introduces a Bi-directional Contextual Aggregating Network, called BiCANet, for semantic segmentation. Unlike previous approaches that encode context in feature space, BiCANet aggregates contextual cues from a categorical perspective, which is mainly consist of three parts: contextual condensed projection block (CCPB), bi-directional context interaction block (BCIB), and muti-scale contextual fusion block (MCFB). More specifically, CCPB learns a category-based mapping through a split-transform-merge architecture, which condenses contextual cues with different receptive fields from intermediate layer. BCIB, on the other hand, employs dense skipped-connections to enhance the class-level context exchanging. Finally, MCFB integrates multi-scale contextual cues by investigating short- and long-ranged spatial dependencies. To evaluate BiCANet, we have conducted extensive experiments on three semantic segmentation datasets: PASCAL VOC 2012, Cityscapes, and ADE20K. The experimental results demonstrate that BiCANet outperforms recent state-of-the-art networks without any postprocess techniques. Particularly, BiCANet achieves the mIoU score of 86.7%, 82.4% and 38.66% on PASCAL VOC 2012, Cityscapes and ADE20K testset, respectively. | 翻訳日:2022-12-21 13:16:21 公開日:2020-03-21 |
# Who2com: 学習可能なハンドシェイクコミュニケーションによる協調的知覚 Who2com: Collaborative Perception via Learnable Handshake Communication ( http://arxiv.org/abs/2003.09575v1 ) ライセンス: Link先を確認 | Yen-Cheng Liu, Junjiao Tian, Chih-Yao Ma, Nathan Glaser, Chia-Wen Kuo and Zsolt Kira | (参考訳) 本稿では,ロボットが局所的な観察と隣接エージェントの観察を組み合わせることで,知覚タスクの精度を向上させるための協調的知覚の問題を提案する。
ロボット工学やマルチエージェント強化学習の既存の研究とは違って、セマンティックセグメンテーションのようなシーン理解タスクを最適化するために、学習情報を複数のエージェント間で共有しなければならない問題として定式化する。
ネットワーク通信プロトコルに着想を得て,各ステージに必要な情報をニューラルネットワークが圧縮することを学ぶ多段階ハンドシェイク通信機構を提案する。
具体的には、センサデータを劣化させたターゲットエージェントが圧縮された要求を送信し、他のエージェントが一致するスコアで応答し、ターゲットエージェントが接続する相手を決定する(つまり、情報を受け取る)。
さらに、AirSim-CPデータセットとメトリクスをAirSimシミュレータに基づいて開発し、道路、草原、建物など、さまざまな風景を航空機ロボット群が知覚する。
セマンティックセグメンテーションタスクにおいて、ハンドシェイク通信方式は、分散ベースラインよりも約20%精度が向上し、帯域幅の4分の1を使用した集中型セグメンテーションに匹敵することを示す。 In this paper, we propose the problem of collaborative perception, where robots can combine their local observations with those of neighboring agents in a learnable way to improve accuracy on a perception task. Unlike existing work in robotics and multi-agent reinforcement learning, we formulate the problem as one where learned information must be shared across a set of agents in a bandwidth-sensitive manner to optimize for scene understanding tasks such as semantic segmentation. Inspired by networking communication protocols, we propose a multi-stage handshake communication mechanism where the neural network can learn to compress relevant information needed for each stage. Specifically, a target agent with degraded sensor data sends a compressed request, the other agents respond with matching scores, and the target agent determines who to connect with (i.e., receive information from). We additionally develop the AirSim-CP dataset and metrics based on the AirSim simulator where a group of aerial robots perceive diverse landscapes, such as roads, grasslands, buildings, etc. We show that for the semantic segmentation task, our handshake communication method significantly improves accuracy by approximately 20% over decentralized baselines, and is comparable to centralized ones using a quarter of the bandwidth. | 翻訳日:2022-12-21 13:14:53 公開日:2020-03-21 |
# datalogによる大規模オントロジ推論 Large-scale Ontological Reasoning via Datalog ( http://arxiv.org/abs/2003.09698v1 ) ライセンス: Link先を確認 | Mario Alviano and Marco Manna | (参考訳) OWL 2 上の推論は一般に非常に高価な作業であるため、W3C は優れた計算特性を示すトラクタブルプロファイルを同定した。
OWL 2の多くの断片に対するオントロジー推論は、Datalogクエリの評価に還元することができる。
本稿では,これらのコンパイルのいくつか,特にHhorn-$\mathcal{SHIQ}$ナレッジベース上でのクエリ処理と,Magic Setsアルゴリズムの新バージョンによるDLV2の実装について検討する。 Reasoning over OWL 2 is a very expensive task in general, and therefore the W3C identified tractable profiles exhibiting good computational properties. Ontological reasoning for many fragments of OWL 2 can be reduced to the evaluation of Datalog queries. This paper surveys some of these compilations, and in particular the one addressing queries over Horn-$\mathcal{SHIQ}$ knowledge bases and its implementation in DLV2 enanched by a new version of the Magic Sets algorithm. | 翻訳日:2022-12-21 13:08:29 公開日:2020-03-21 |
# マルチモーダルセンシングによる適応型情報経路計画 Adaptive Informative Path Planning with Multimodal Sensing ( http://arxiv.org/abs/2003.09746v1 ) ライセンス: Link先を確認 | Shushman Choudhury, Nate Gruver, Mykel J. Kochenderfer | (参考訳) アダプティブ・インフォーマティブ・パス・プランニング(AIPP)問題(Adaptive Informative Path Planning)は、未知の部分的に観測可能な環境で資源制約の対象となる情報を取得するエージェントをモデル化する。
AIPPに関する既存の研究は、エージェント運動の結果、世界の観察を表現することに集中している。
我々は、エージェントが何らかのエネルギーを犠牲にして異なるセンサーを選択できる、より一般的な設定を定式化し、また、情報を集めるために環境を横断する。
この問題をAIPPMS (MS for Multimodal Sensing) と呼ぶ。
AIPPMSは、エネルギー露光と情報の両方の観点から、センシングと運動の効果を共同で推論する必要がある。
AIPPMSを部分的に観測可能なマルコフ決定プロセス(POMDP)として、オンライン計画で解決する。
我々のアプローチは、AIPPMSに適した制約実現性とヒューリスティックなロールアウトポリシーを保証するため、部分的に観測可能なモンテカルロ計画フレームワークに基づいている。
シミュレーションされた検索・救助シナリオと,従来のRockSample問題への挑戦的拡張の2つの領域について,本手法の評価を行った。
提案手法は,AIPPMS用に修正された古典的AIPPアルゴリズムと,ランダムなロールアウトポリシを用いたオンライン計画より優れている。 Adaptive Informative Path Planning (AIPP) problems model an agent tasked with obtaining information subject to resource constraints in unknown, partially observable environments. Existing work on AIPP has focused on representing observations about the world as a result of agent movement. We formulate the more general setting where the agent may choose between different sensors at the cost of some energy, in addition to traversing the environment to gather information. We call this problem AIPPMS (MS for Multimodal Sensing). AIPPMS requires reasoning jointly about the effects of sensing and movement in terms of both energy expended and information gained. We frame AIPPMS as a Partially Observable Markov Decision Process (POMDP) and solve it with online planning. Our approach is based on the Partially Observable Monte Carlo Planning framework with modifications to ensure constraint feasibility and a heuristic rollout policy tailored for AIPPMS. We evaluate our method on two domains: a simulated search-and-rescue scenario and a challenging extension to the classic RockSample problem. We find that our approach outperforms a classic AIPP algorithm that is modified for AIPPMS, as well as online planning using a random rollout policy. | 翻訳日:2022-12-21 13:08:19 公開日:2020-03-21 |
# 冷却シュリンキング攻撃:不可避なノイズでトラッカーを盲目にする Cooling-Shrinking Attack: Blinding the Tracker with Imperceptible Noises ( http://arxiv.org/abs/2003.09595v1 ) ライセンス: Link先を確認 | Bin Yan and Dong Wang and Huchuan Lu and Xiaoyun Yang | (参考訳) cnnのadversarial attackは、イメージに不可避な摂動を追加することで、モデルを誤用することを目的としている。
この機能は、ニューラルネットワークを深く理解し、ディープラーニングモデルの堅牢性を改善するのに役立つ。
画像分類器や物体検出装置の攻撃に焦点をあてた研究はいくつかあるが、モデルなしの方法で標的の1つの物体追跡装置を攻撃するための効果的で効率的な手法はいまだに欠けている。
本稿では,シームセRPNをベースとしたトラッカーの冷却収縮攻撃手法を提案する。
効果的で効率的な摂動発生器は、熱マップ上にターゲットが存在するホット領域を同時に冷却し、予測された境界ボックスを縮小させ、追跡対象をトラッカーに見えないように、慎重に設計された逆方向損失で訓練される。
OTB100,VOT2018,LaSOTデータセットに対する多数の実験により,テンプレートや検索領域に小さな摂動を加えることで,最先端のSiameseRPN++トラッカーを効果的に騙すことができることが示された。
また,本手法は高い転送性を有し,DaSiamRPN,DaSiamRPN-UpdateNet,DiMPなどの他のトップパフォーマンストラッカーを騙すことができる。
ソースコードはhttps://github.com/MasterBin-IIAU/CSAで入手できる。 Adversarial attack of CNN aims at deceiving models to misbehave by adding imperceptible perturbations to images. This feature facilitates to understand neural networks deeply and to improve the robustness of deep learning models. Although several works have focused on attacking image classifiers and object detectors, an effective and efficient method for attacking single object trackers of any target in a model-free way remains lacking. In this paper, a cooling-shrinking attack method is proposed to deceive state-of-the-art SiameseRPN-based trackers. An effective and efficient perturbation generator is trained with a carefully designed adversarial loss, which can simultaneously cool hot regions where the target exists on the heatmaps and force the predicted bounding box to shrink, making the tracked target invisible to trackers. Numerous experiments on OTB100, VOT2018, and LaSOT datasets show that our method can effectively fool the state-of-the-art SiameseRPN++ tracker by adding small perturbations to the template or the search regions. Besides, our method has good transferability and is able to deceive other top-performance trackers such as DaSiamRPN, DaSiamRPN-UpdateNet, and DiMP. The source codes are available at https://github.com/MasterBin-IIAU/CSA. | 翻訳日:2022-12-21 13:07:44 公開日:2020-03-21 |
# n次元凸形状のレベル集合表現法とその応用 A level set representation method for N-dimensional convex shape and applications ( http://arxiv.org/abs/2003.09600v1 ) ライセンス: Link先を確認 | Lingfeng li and Shousheng Luo and Xue-Cheng Tai and Jiang Yang | (参考訳) 本研究では, 対象物体の寸法によらず, レベルセットのアプローチを用いて, 凸形状表現の新しい効率的な方法を提案する。
凸性はコンピュータビジョンにおけるオブジェクト補完に非常に有用である。
高次元凸物体の効率的な表現方法を設計することは非常に難しい課題である。
本稿では,対象物の凸性が対応する符号付き距離関数の凸性と同値であることを証明する。
そして、凸関数の第2次条件を用いて、同値な形状凸性を特徴付ける。
本手法を2つの応用に適用する: 凸性前の物体分割と凸殻問題(特に外れ値の場合)である。
どちらのアプリケーションに対しても、関連する問題は3つの制約を持つ一般的な最適化問題として記述できる。
最適化問題に対して,乗算器の交互方向法に基づく効率的なアルゴリズムを提案する。
提案手法とアルゴリズムの有効性と効率を検証するため,数値実験を行った。 In this work, we present a new efficient method for convex shape representation, which is regardless of the dimension of the concerned objects, using level-set approaches. Convexity prior is very useful for object completion in computer vision. It is a very challenging task to design an efficient method for high dimensional convex objects representation. In this paper, we prove that the convexity of the considered object is equivalent to the convexity of the associated signed distance function. Then, the second order condition of convex functions is used to characterize the shape convexity equivalently. We apply this new method to two applications: object segmentation with convexity prior and convex hull problem (especially with outliers). For both applications, the involved problems can be written as a general optimization problem with three constraints. Efficient algorithm based on alternating direction method of multipliers is presented for the optimization problem. Numerical experiments are conducted to verify the effectiveness and efficiency of the proposed representation method and algorithm. | 翻訳日:2022-12-21 13:07:20 公開日:2020-03-21 |
# 幾何学的マッピング可能な画像特徴 Geometrically Mappable Image Features ( http://arxiv.org/abs/2003.09682v1 ) ライセンス: Link先を確認 | Janine Thoma, Danda Pani Paudel, Ajad Chhatkuli, Luc Van Gool | (参考訳) 地図内のエージェントの視覚に基づくローカライゼーションは、ロボット工学とコンピュータビジョンにおいて重要な問題である。
その文脈では、機械学習の最近の進歩により、マッチング可能な画像特徴の学習によるローカライズが人気を集めている。
画像の視覚的な内容を記述する機能には、画像の検索や理解など、幅広い応用がある。
本研究では,画像検索を対象とした画像特徴学習手法を提案する。
検索ベースのローカライゼーションには,メンテナンスや迅速な計算など,いくつかのメリットがある。
しかし、最先端の特徴は、クエリと検索画像間の幾何学的距離を明確に示さない視覚的類似度スコアのみを提供する。
この距離を知ることは、特に参照画像がシーン内でばらばらに分布している場合に、正確なローカライズに非常に望ましい。
そこで本稿では,視覚的に代表的かつ幾何学的に対応可能な画像特徴を学習するための新しい損失関数を提案する。
これは、画像間の特徴と幾何学的距離が直接比例するように学習過程を導くことで達成される。
実験では,我々の特徴は位置推定精度が大幅に向上するだけでなく,参照画像がない場合のクエリシーケンスの軌跡を推定できることを示した。 Vision-based localization of an agent in a map is an important problem in robotics and computer vision. In that context, localization by learning matchable image features is gaining popularity due to recent advances in machine learning. Features that uniquely describe the visual contents of images have a wide range of applications, including image retrieval and understanding. In this work, we propose a method that learns image features targeted for image-retrieval-based localization. Retrieval-based localization has several benefits, such as easy maintenance and quick computation. However, the state-of-the-art features only provide visual similarity scores which do not explicitly reveal the geometric distance between query and retrieved images. Knowing this distance is highly desirable for accurate localization, especially when the reference images are sparsely distributed in the scene. Therefore, we propose a novel loss function for learning image features which are both visually representative and geometrically relatable. This is achieved by guiding the learning process such that the feature and geometric distances between images are directly proportional. In our experiments we show that our features not only offer significantly better localization accuracy, but also allow to estimate the trajectory of a query sequence in absence of the reference images. | 翻訳日:2022-12-21 13:07:06 公開日:2020-03-21 |
# Gated Convolutional Recurrent Neural Networks を用いた映像に基づく人物再同定 Video-based Person Re-Identification using Gated Convolutional Recurrent Neural Networks ( http://arxiv.org/abs/2003.09717v1 ) ライセンス: Link先を確認 | Yang Feng, Yu Wang, Jiebo Luo | (参考訳) ディープニューラルネットワークは、ビデオベースの人物識別問題の解決に成功している。
人身認証のための既存のネットワークは、識別情報を保持する識別的特徴を抽出するように設計されている。
通常、ビデオフレーム全体がニューラルネットワークに入力され、フレーム内のすべての領域が同じように扱われる。
これは、ビデオの背景領域など多くの領域が人間とは関係がないため、亜最適選択であるかもしれない。
さらに、利害関係者は、他人又は他の者によって拘束されることがある。
これらの非関連領域は、人物の再識別を妨げる可能性がある。
本稿では,ディープニューラルネットワークに対する新たなゲーティング機構を提案する。
我々のゲーティングメカニズムは、人物の再識別に役立つ領域を学習し、これらの領域をゲートを通過させる。
無関係な背景領域またはオクルディング領域はゲートによってフィルタリングされる。
各フレームでは、カラーチャネルとオプティカルフローチャネルは全く異なる情報を提供する。
このような情報をよりよく活用するために、色チャネルと光流チャネルを用いて1つのゲートを生成する。
これら2つのゲートを組み合わせることで、より信頼性の高いゲートと新しい融合方式を提供する。
2つの主要なデータセットの実験結果は、提案したゲーティング機構による性能改善を示す。 Deep neural networks have been successfully applied to solving the video-based person re-identification problem with impressive results reported. The existing networks for person re-id are designed to extract discriminative features that preserve the identity information. Usually, whole video frames are fed into the neural networks and all the regions in a frame are equally treated. This may be a suboptimal choice because many regions, e.g., background regions in the video, are not related to the person. Furthermore, the person of interest may be occluded by another person or something else. These unrelated regions may hinder person re-identification. In this paper, we introduce a novel gating mechanism to deep neural networks. Our gating mechanism will learn which regions are helpful for person re-identification and let these regions pass the gate. The unrelated background regions or occluding regions are filtered out by the gate. In each frame, the color channels and optical flow channels provide quite different information. To better leverage such information, we generate one gate using the color channels and another gate using the optical flow channels. These two gates are combined to provide a more reliable gate with a novel fusion method. Experimental results on two major datasets demonstrate the performance improvements due to the proposed gating mechanism. | 翻訳日:2022-12-21 13:06:46 公開日:2020-03-21 |
# Palm-GAN:全変分正規化GANを用いた実写パルムプリント画像の生成 Palm-GAN: Generating Realistic Palmprint Images Using Total-Variation Regularized GAN ( http://arxiv.org/abs/2003.10834v1 ) ライセンス: Link先を確認 | Shervin Minaee, Mehdi Minaei, Amirali Abdolrashidi | (参考訳) リアルなパームプリント(より一般的にバイオメトリックな)画像の生成は、常に興味深い問題であり、同時に挑戦的な問題でもある。
古典統計モデルは、パームプリント画像の複雑なテクスチャ表現を捉えるのに十分ではないため、現実的なパームプリント画像を生成することができない。
本稿では,現実のパームプリント画像を生成することができるgan(generative adversarial networks)に基づくディープラーニングフレームワークを提案する。
モデルがよりリアルなイメージを学ぶのを助けるため、我々は、生成したpalmprint画像のライン接続を強制するロス関数に適切な正規化を追加することを提案した。
これはpalmprintsにとって非常に望ましいものであり、palmの主要線は通常接続されている。
このフレームワークを一般的なパームプリントデータベースに適用し、非常にリアルに見え、このデータベースのサンプルとよく似た画像を生成する。
実験の結果,生成したpalmprint画像は非常にリアルに見え,多様性が良好で,事前分布の異なる部分をキャプチャできることがわかった。
また,提案モデルのfrechetインセプション距離 (fid) を報告し,fidスコアの観点から,本モデルが本当に優れた定量的性能を達成可能であることを示す。 Generating realistic palmprint (more generally biometric) images has always been an interesting and, at the same time, challenging problem. Classical statistical models fail to generate realistic-looking palmprint images, as they are not powerful enough to capture the complicated texture representation of palmprint images. In this work, we present a deep learning framework based on generative adversarial networks (GAN), which is able to generate realistic palmprint images. To help the model learn more realistic images, we proposed to add a suitable regularization to the loss function, which imposes the line connectivity of generated palmprint images. This is very desirable for palmprints, as the principal lines in palm are usually connected. We apply this framework to a popular palmprint databases, and generate images which look very realistic, and similar to the samples in this database. Through experimental results, we show that the generated palmprint images look very realistic, have a good diversity, and are able to capture different parts of the prior distribution. We also report the Frechet Inception distance (FID) of the proposed model, and show that our model is able to achieve really good quantitative performance in terms of FID score. | 翻訳日:2022-12-21 12:59:50 公開日:2020-03-21 |
# ネットワーク制御システムにおける学習 Learning in Networked Control Systems ( http://arxiv.org/abs/2003.09596v1 ) ライセンス: Link先を確認 | Rahul Singh and P. R. Kumar | (参考訳) 我々は、制御情報を含むデータパケットが損失のある無線チャネルを介して送信されるネットワーク制御システム(NCS)の適応制御(学習規則)を設計する。
本稿では,プラントパラメータ推定値$(a_{(\star)},b_{(\star)})$,チャネル信頼性$p_{(\star)}$に対する信頼区間を維持する学習規則であるネットワーク制御系(ucb-ncs)の上位信頼境界を提案し,制御決定をしながら不確実性に直面した楽観主義の原理を利用する。
制御器に$(A_{(\star)},B_{(\star)},p_{(\star)})$が知られている場合のシナリオとの性能差を解析することにより、UCB-NCSの非漸近的な性能保証を提供する。
高い確率で、後悔は、$\tilde{O}\left(C\sqrt{T}\right)$\footnote{Here $\tilde{O}$ hides logarithmic factors. と表すことができる。
ここで$T$はシステムの運用時間の地平線であり、$C$は問題依存定数である。 We design adaptive controller (learning rule) for a networked control system (NCS) in which data packets containing control information are transmitted across a lossy wireless channel. We propose Upper Confidence Bounds for Networked Control Systems (UCB-NCS), a learning rule that maintains confidence intervals for the estimates of plant parameters $(A_{(\star)},B_{(\star)})$, and channel reliability $p_{(\star)}$, and utilizes the principle of optimism in the face of uncertainty while making control decisions. We provide non-asymptotic performance guarantees for UCB-NCS by analyzing its "regret", i.e., performance gap from the scenario when $(A_{(\star)},B_{(\star)},p_{(\star)})$ are known to the controller. We show that with a high probability the regret can be upper-bounded as $\tilde{O}\left(C\sqrt{T}\right)$\footnote{Here $\tilde{O}$ hides logarithmic factors.}, where $T$ is the operating time horizon of the system, and $C$ is a problem dependent constant. | 翻訳日:2022-12-21 12:59:06 公開日:2020-03-21 |
# 経済における深層強化学習法と応用の総合的考察 Comprehensive Review of Deep Reinforcement Learning Methods and Applications in Economics ( http://arxiv.org/abs/2004.01509v1 ) ライセンス: Link先を確認 | Amir Mosavi, Pedram Ghamisi, Yaser Faghan, Puhong Duan | (参考訳) 経済学における深層強化学習(DRL)手法の人気は指数関数的に高まっている。
高度な動的ビジネス環境を扱うための強化学習(RL)や深層学習(DL)まで幅広い能力を通して、DRLは大きな機会を提供します。
DRLの特徴は、高次元問題に適用可能なスケーラビリティと、経済データのノイズおよび非線形パターンとを併用したスケーラビリティである。
本稿ではまず, dl, rl, およびdeep rl法について, 経済学における多様な応用について概観し, 技術の現状について深く考察する。
さらに,drlのアーキテクチャを経済応用に適用し,複雑性,堅牢性,正確性,性能,計算タスク,リスク制約,収益性に注目した。
調査の結果,DRLはリスクパラメータの存在や不確実性が持続する中で,実際の経済問題に直面しつつ,従来のアルゴリズムと比較して優れた性能と精度を提供できることが示された。 The popularity of deep reinforcement learning (DRL) methods in economics have been exponentially increased. DRL through a wide range of capabilities from reinforcement learning (RL) and deep learning (DL) for handling sophisticated dynamic business environments offers vast opportunities. DRL is characterized by scalability with the potential to be applied to high-dimensional problems in conjunction with noisy and nonlinear patterns of economic data. In this work, we first consider a brief review of DL, RL, and deep RL methods in diverse applications in economics providing an in-depth insight into the state of the art. Furthermore, the architecture of DRL applied to economic applications is investigated in order to highlight the complexity, robustness, accuracy, performance, computational tasks, risk constraints, and profitability. The survey results indicate that DRL can provide better performance and higher accuracy as compared to the traditional algorithms while facing real economic problems at the presence of risk parameters and the ever-increasing uncertainties. | 翻訳日:2022-12-21 12:58:45 公開日:2020-03-21 |
# 化合物分離とイディオマティック化合物検出の連成的アプローチ A Joint Approach to Compound Splitting and Idiomatic Compound Detection ( http://arxiv.org/abs/2003.09606v1 ) ライセンス: Link先を確認 | Irina Krotova and Sergey Aksenov and Ekaterina Artemova | (参考訳) 機械翻訳、音声認識、情報検索などの応用は、語彙外語(oov)の源の1つである名詞化合物の効率的な処理を必要とする。
名詞化合物の詳細な処理は、それらをより小さな成分(または根)に分割するだけでなく、慣用的な性質として分離されないべきインスタンスの同定も必要である。
我々は,新たに収集したドイツ語化合物のコーパスを用いて学習したドイツ語に対する名詞化合物分割と慣用化合物検出の2倍の深層学習に基づくアプローチを開発した。
我々の神経名詞複合スプリッターは, サブワードレベルで動作し, 術の現況を約5%上回っている。 Applications such as machine translation, speech recognition, and information retrieval require efficient handling of noun compounds as they are one of the possible sources for out-of-vocabulary (OOV) words. In-depth processing of noun compounds requires not only splitting them into smaller components (or even roots) but also the identification of instances that should remain unsplitted as they are of idiomatic nature. We develop a two-fold deep learning-based approach of noun compound splitting and idiomatic compound detection for the German language that we train using a newly collected corpus of annotated German compounds. Our neural noun compound splitter operates on a sub-word level and outperforms the current state of the art by about 5%. | 翻訳日:2022-12-21 12:58:05 公開日:2020-03-21 |
# マルチストラテジー進化フレームワークを用いた大規模波動ファームの最適化 Optimisation of Large Wave Farms using a Multi-strategy Evolutionary Framework ( http://arxiv.org/abs/2003.09594v1 ) ライセンス: Link先を確認 | Mehdi Neshat, Bradley Alexander, Nataliia Y. Sergiienko, Markus Wagner | (参考訳) 波浪エネルギーは急速に発展し、将来有望な再生可能エネルギー資源である。
本研究の主な目的は、完全潜水三重波エネルギー変換器(WEC)からなる大型波力農場の総利用電力を最大化することである。
大規模農場におけるWEC間の流体力学的相互作用のコスト計算と探索空間の高次元性により, 大規模農場のエネルギー最大化は困難な探索問題である。
この問題に対処するため,我々は,スマート初期化,バイナリ集団に基づく進化アルゴリズム,離散的局所探索,連続的グローバル最適化を組み合わせた,新しいハイブリッドマルチストラテジー進化フレームワークを提案する。
提案手法の性能を評価するために,6つの連続進化アルゴリズム,4つの離散探索手法,3つのハイブリッド最適化手法を含む,多種多様な最適化手法と比較した。
以上の結果から,提案手法は収束速度と農業生産率の点でかなり優れていることがわかった。 Wave energy is a fast-developing and promising renewable energy resource. The primary goal of this research is to maximise the total harnessed power of a large wave farm consisting of fully-submerged three-tether wave energy converters (WECs). Energy maximisation for large farms is a challenging search problem due to the costly calculations of the hydrodynamic interactions between WECs in a large wave farm and the high dimensionality of the search space. To address this problem, we propose a new hybrid multi-strategy evolutionary framework combining smart initialisation, binary population-based evolutionary algorithm, discrete local search and continuous global optimisation. For assessing the performance of the proposed hybrid method, we compare it with a wide variety of state-of-the-art optimisation approaches, including six continuous evolutionary algorithms, four discrete search techniques and three hybrid optimisation methods. The results show that the proposed method performs considerably better in terms of convergence speed and farm output. | 翻訳日:2022-12-21 12:57:51 公開日:2020-03-21 |
# がん治療シミュレーションの開発にむけての新規探索 Novelty search employed into the development of cancer treatment simulations ( http://arxiv.org/abs/2003.11624v1 ) ライセンス: Link先を確認 | Michail-Antisthenis Tsompanas, Larry Bull, Andrew Adamatzky, Igor Balaz | (参考訳) 従来の最適化手法は, 視覚的対象関数のランドスケープのため, 自動探索が局所最適に留まっている場合に妨げられる可能性がある。
その結果,この課題に対処するために,新規検索などのオープンエンド検索手法が提案されている。
目的を見渡す一方で、新しい解決策の発見にプレッシャーをかけることは、実用的な問題においてより良い解決策につながる可能性がある。
腫瘍治療を目的とした薬物デリバリーシステムのシミュレーション設計をPhysicalCellシミュレーターで最適化するために,新規検索を用いた。
有効な腫瘍治療の実際の目的と、可能な解の新規性尺度の両方を含むハイブリッド客観的方程式を用いた。
ハイブリッド方程式の2成分の異なる重みについて検討し, それぞれの重要性を明らかにした。 Conventional optimization methodologies may be hindered when the automated search is stuck into local optima because of a deceptive objective function landscape. Consequently, open ended search methodologies, such as novelty search, have been proposed to tackle this issue. Overlooking the objective, while putting pressure into discovering novel solutions may lead to better solutions in practical problems. Novelty search was employed here to optimize the simulated design of a targeted drug delivery system for tumor treatment under the PhysiCell simulator. A hybrid objective equation was used containing both the actual objective of an effective tumour treatment and the novelty measure of the possible solutions. Different weights of the two components of the hybrid equation were investigated to unveil the significance of each one. | 翻訳日:2022-12-21 12:57:36 公開日:2020-03-21 |
# d数論の基本概念、定義、および方法 Basic concepts, definitions, and methods in D number theory ( http://arxiv.org/abs/2003.09661v1 ) ライセンス: Link先を確認 | Xinyang Deng | (参考訳) デンプスター・シェーファー理論の一般化として、d数論(dnt)は不確定性と不完全性を伴う不確定な情報を扱う枠組みを提供することを目的としている。
これまでの研究ではDNTにいくつかの進歩があったが、体系性が欠如しており、多くの重要な問題がまだ解決されていない。
本稿では,DNTの完全かつ体系的な枠組みを構築する上で,いくつかの重要な側面について考察する。
当初、DNTの非排他性は正式に定義され議論される。
次に、従来の排他的競合再分配(ECR)ルールを拡張して、複数のD数を結合する手法を提案する。
第三に、D数に対する新しい信念と妥当性尺度が定義され、提案した尺度によって多くの望ましい性質が満たされる。
第4に、DNTにおける情報の不完全性を扱う方法を示すために、情報不完全D数値の組み合わせについて研究する。
本稿では, 数学の相対的定義, 性質, 定理, 具体的な例, 応用を今後の研究で検討する。 As a generalization of Dempster-Shafer theory, D number theory (DNT) aims to provide a framework to deal with uncertain information with non-exclusiveness and incompleteness. Although there are some advances on DNT in previous studies, however, they lack of systematicness, and many important issues have not yet been solved. In this paper, several crucial aspects in constructing a perfect and systematic framework of DNT are considered. At first the non-exclusiveness in DNT is formally defined and discussed. Secondly, a method to combine multiple D numbers is proposed by extending previous exclusive conflict redistribution (ECR) rule. Thirdly, a new pair of belief and plausibility measures for D numbers are defined and many desirable properties are satisfied by the proposed measures. Fourthly, the combination of information-incomplete D numbers is studied specially to show how to deal with the incompleteness of information in DNT. In this paper, we mainly give relative math definitions, properties, and theorems, concrete examples and applications will be considered in the future study. | 翻訳日:2022-12-21 12:57:15 公開日:2020-03-21 |
# アダム型アルゴリズムの新たな後悔解析 A new regret analysis for Adam-type algorithms ( http://arxiv.org/abs/2003.09729v1 ) ライセンス: Link先を確認 | Ahmet Alacaoglu, Yura Malitsky, Panayotis Mertikopoulos, Volkan Cevher | (参考訳) 本稿では,Adamとその変種(AMSgrad,AdamNCなど)の理論実践的ギャップに焦点を当てる。
実際には、これらのアルゴリズムは定数の1次モーメントパラメータ$\beta_{1}$(通常$0.9$と$0.99$の間)で使用される。
理論的には、オンライン凸最適化に対する後悔の保証は急速に減少する$\beta_{1}\to0$スケジュールを必要とする。
これは標準分析の成果物であることを示し、さらなる仮定なしに、一定の$\beta_{1}$で最適なデータ依存の後悔境界を導出できる新しいフレームワークを提案する。
また、さまざまなアルゴリズムや設定について、分析の柔軟性も示しています。 In this paper, we focus on a theory-practice gap for Adam and its variants (AMSgrad, AdamNC, etc.). In practice, these algorithms are used with a constant first-order moment parameter $\beta_{1}$ (typically between $0.9$ and $0.99$). In theory, regret guarantees for online convex optimization require a rapidly decaying $\beta_{1}\to0$ schedule. We show that this is an artifact of the standard analysis and propose a novel framework that allows us to derive optimal, data-dependent regret bounds with a constant $\beta_{1}$, without further assumptions. We also demonstrate the flexibility of our analysis on a wide range of different algorithms and settings. | 翻訳日:2022-12-21 12:51:05 公開日:2020-03-21 |
# 局所感性ハッシュによるカーネルリッジ回帰のスケールアップ Scaling up Kernel Ridge Regression via Locality Sensitive Hashing ( http://arxiv.org/abs/2003.09756v1 ) ライセンス: Link先を確認 | Michael Kapralov, Navid Nouri, Ilya Razenshteyn, Ameya Velingker, Amir Zandieh | (参考訳) Rahimi and Recht (2007) のセミナー論文で紹介されたランダム双対特徴は、局所性に敏感なハッシュを用いてカーネル行列を近似する効率的な方法である。
ランダムバイナリ機能はラプラスカーネルを近似する非常に単純で効率的な方法を提供するが、残念ながら多くの重要なカーネルクラス、特にガウスカーネルやマタンカーネルのような滑らかなガウス過程を生成するものには適用されない。
本稿では,ランダムバイナリ機能の単純重み付きバージョンを導入し,対応するカーネル関数が任意の所望の滑らかさのガウス過程を生成することを示す。
重み付きランダムバイナリ機能は対応するカーネル行列のスペクトル近似を提供し、カーネルリッジ回帰の効率的なアルゴリズムをもたらすことを示した。
大規模回帰データセットの実験により,提案手法はランダムなフーリエ特徴量法よりも精度が高いことが示された。 Random binning features, introduced in the seminal paper of Rahimi and Recht (2007), are an efficient method for approximating a kernel matrix using locality sensitive hashing. Random binning features provide a very simple and efficient way of approximating the Laplace kernel but unfortunately do not apply to many important classes of kernels, notably ones that generate smooth Gaussian processes, such as the Gaussian kernel and Matern kernel. In this paper, we introduce a simple weighted version of random binning features and show that the corresponding kernel function generates Gaussian processes of any desired smoothness. We show that our weighted random binning features provide a spectral approximation to the corresponding kernel matrix, leading to efficient algorithms for kernel ridge regression. Experiments on large scale regression datasets show that our method outperforms the accuracy of random Fourier features method. | 翻訳日:2022-12-21 12:50:51 公開日:2020-03-21 |
# ARDA: 機械学習のための自動リレーショナルデータ拡張 ARDA: Automatic Relational Data Augmentation for Machine Learning ( http://arxiv.org/abs/2003.09758v1 ) ライセンス: Link先を確認 | Nadiia Chepurko, Ryan Marcus, Emanuel Zgraggen, Raul Castro Fernandez, Tim Kraska, David Karger | (参考訳) 自動機械学習(\AML)は、予測モデルをトレーニングするプロセスを自動化する一連の技術であり、パフォーマンスを改善し、機械学習をより使いやすくすることを目指している。
最近の多くの研究は、モデル選択、ハイパーパラメータチューニング、機能選択といった機械学習パイプラインの側面に焦点を当てているが、比較的少数の研究が自動データ拡張に焦点を当てている。
自動データ拡張は、最小限の ``human-in-the-loop''' でユーザの予測タスクに関連する新機能を見つけることを伴う。
本稿では,データセットとデータレポジトリを入力として入力するエンドツーエンドシステムである \system を提案し,この拡張データセット上で予測モデルをトレーニングすることにより,パフォーマンスが向上する拡張データセットを出力する。
本システムは,(1)入力の様々な属性に基づいて,入力データとデータを検索し結合するフレームワークと,(2)入力データからノイズや不適切な特徴を抽出する効率的な特徴選択アルゴリズムの2つの特徴を有する。
システムコンポーネントの広範な評価を行い、実世界のデータセット上で特徴選択アルゴリズムをベンチマークする。 Automatic machine learning (\AML) is a family of techniques to automate the process of training predictive models, aiming to both improve performance and make machine learning more accessible. While many recent works have focused on aspects of the machine learning pipeline like model selection, hyperparameter tuning, and feature selection, relatively few works have focused on automatic data augmentation. Automatic data augmentation involves finding new features relevant to the user's predictive task with minimal ``human-in-the-loop'' involvement. We present \system, an end-to-end system that takes as input a dataset and a data repository, and outputs an augmented data set such that training a predictive model on this augmented dataset results in improved performance. Our system has two distinct components: (1) a framework to search and join data with the input data, based on various attributes of the input, and (2) an efficient feature selection algorithm that prunes out noisy or irrelevant features from the resulting join. We perform an extensive empirical evaluation of different system components and benchmark our feature selection algorithm on real-world datasets. | 翻訳日:2022-12-21 12:50:36 公開日:2020-03-21 |
# よりスマートな駐車: バンクーバーの駐車効率の低下をAIで識別する Smarter Parking: Using AI to Identify Parking Inefficiencies in Vancouver ( http://arxiv.org/abs/2003.09761v1 ) ライセンス: Link先を確認 | Devon Graham, Satish Kumar Sarraf, Taylor Lundy, Ali MohammadMehr, Sara Uppal, Tae Yoon Lee, Hedayat Zarkoob, Scott Duke Kominers, Kevin Leyton-Brown | (参考訳) 路上の駐車は便利だが、多くの欠点がある: 路上のスポットは、交通車線、交通車線、自転車道、パークレットなどの他の道路利用の犠牲になる; 駐車場を探しているドライバーは、交通渋滞と温室効果ガス排出に大きく寄与する; 安全は、スポットを探しているドライバーが他の道路利用者よりも注意をそらすこと、駐車中の車を降りる人がサイクリストに危険をもたらすことによる。
これらの社会的コストは、路上駐車場が近く、余剰容量があるときに支払う価値はないかもしれない。
バンクーバーのダウンタウンでそれがどこにあるかを調べるために、私たちは人工知能技術を使って、市内の目的地に駐車するドライバーの駐車時間と出発時間の両方を見積もった。
路上駐車において,(1)駐車メーターと監査データに基づくブロック・バイ・ブロック駐車の深層学習モデルを構築し,(2)路上駐車を探索するドライバーのシミュレーションを行った。
オフストリート駐車場では,運転者が元の目的地から最寄りの市営オフストリートロットまで運転する時間を計算シミュレーションし,交通量や交通量に基づく場所の待ち行列を作成した。
最後に、どちらのケースでも、ドライバーが駐車場から元の目的地まで歩くのにかかる時間を計算しました。
バンクーバーの中心街の中心部の各ブロックと1日の各時間における目的地の時間推定を比較した。
私たちは、オフ・ストリートが街路の捜索よりもドライバーの時間を節約する多くのエリアを見つけ、さらに、オフ・ストリートの駐車にかかる時間コストが小さい場所を見つけました。
このような地域を特定することで、市はその交通目的に合わせて、コミュニティフレンドリーな用途に価値ある縁地を再利用できる。 On-street parking is convenient, but has many disadvantages: on-street spots come at the expense of other road uses such as traffic lanes, transit lanes, bike lanes, or parklets; drivers looking for parking contribute substantially to traffic congestion and hence to greenhouse gas emissions; safety is reduced both due to the fact that drivers looking for spots are more distracted than other road users and that people exiting parked cars pose a risk to cyclists. These social costs may not be worth paying when off-street parking lots are nearby and have surplus capacity. To see where this might be true in downtown Vancouver, we used artificial intelligence techniques to estimate the amount of time it would take drivers to both park on and off street for destinations throughout the city. For on-street parking, we developed (1) a deep-learning model of block-by-block parking availability based on data from parking meters and audits and (2) a computational simulation of drivers searching for an on-street spot. For off-street parking, we developed a computational simulation of the time it would take drivers drive from their original destination to the nearest city-owned off-street lot and then to queue for a spot based on traffic and lot occupancy data. Finally, in both cases we also computed the time it would take the driver to walk from their parking spot to their original destination. We compared these time estimates for destinations in each block of Vancouver's downtown core and each hour of the day. We found many areas where off street would actually save drivers time over searching the streets for a spot, and many more where the time cost for parking off street was small. The identification of such areas provides an opportunity for the city to repurpose valuable curbside space for community-friendly uses more in line with its transportation goals. | 翻訳日:2022-12-21 12:50:19 公開日:2020-03-21 |
# Prob2Vec:適応的チューニングにおける問題検索のための数学的意味埋め込み Prob2Vec: Mathematical Semantic Embedding for Problem Retrieval in Adaptive Tutoring ( http://arxiv.org/abs/2003.10838v1 ) ライセンス: Link先を確認 | Du Su, Ali Yekkehkhany, Yi Lu, Wenmiao Lu | (参考訳) 適応学習における問題検索のための埋め込み手法の新たな応用を提案する。
目的は、数学的概念が類似した問題を解くことである。
第一に、文章のように、チュータリングに役立つ問題は、基礎となる概念に関して全く同じではない。
その代わり、良い問題は概念を革新的な方法で混合し、その関係の連続性を表示する。
第二に、人間が十分なトレーニングセットで一致した類似度スコアを決定することは困難である。
本稿では,抽象化と組込みステップからなる階層型問題埋め込みアルゴリズムProb2Vecを提案する。
prob2vecは問題類似性テストにおいて96.88\%の精度を達成している。
Prob2Vecは、人間が取得する時間と労力を必要とする問題と、非常にきめ細かい違いを区別できるのが興味深い。
さらに、不均衡なトレーニングデータセットを持つ概念ラベリングのサブ問題は、それ自体が興味深い。
次元の爆発に苦しむマルチラベル問題であり,その改善法を提案する。
不均衡なトレーニングデータセットを用いて、分類のための偽陰性および正の比率を劇的に低減する新しい負事前学習アルゴリズムを提案する。 We propose a new application of embedding techniques for problem retrieval in adaptive tutoring. The objective is to retrieve problems whose mathematical concepts are similar. There are two challenges: First, like sentences, problems helpful to tutoring are never exactly the same in terms of the underlying concepts. Instead, good problems mix concepts in innovative ways, while still displaying continuity in their relationships. Second, it is difficult for humans to determine a similarity score that is consistent across a large enough training set. We propose a hierarchical problem embedding algorithm, called Prob2Vec, that consists of abstraction and embedding steps. Prob2Vec achieves 96.88\% accuracy on a problem similarity test, in contrast to 75\% from directly applying state-of-the-art sentence embedding methods. It is interesting that Prob2Vec is able to distinguish very fine-grained differences among problems, an ability humans need time and effort to acquire. In addition, the sub-problem of concept labeling with imbalanced training data set is interesting in its own right. It is a multi-label problem suffering from dimensionality explosion, which we propose ways to ameliorate. We propose the novel negative pre-training algorithm that dramatically reduces false negative and positive ratios for classification, using an imbalanced training data set. | 翻訳日:2022-12-21 12:49:34 公開日:2020-03-21 |
# AWD-LSTMによるスマートコントラクトの脆弱性のマルチクラス分類と自然言語処理による事前学習エンコーダ Multi-Class classification of vulnerabilities in Smart Contracts using AWD-LSTM, with pre-trained encoder inspired from natural language processing ( http://arxiv.org/abs/2004.00362v1 ) ライセンス: Link先を確認 | Ajay K. Gogineni, S. Swayamjyoti, Devadatta Sahoo, Kisor K. Sahu, Raj kishore | (参考訳) スマートコントラクトの脆弱性検出と安全性は,その不変性から極めて重要である。
oyenteやmaianといったシンボリックツールは通常、スマートコントラクトの脆弱性予測に使用される。
これらのツールは計算コストが高いため、通常、事前に定義された呼び出し深度まで脆弱性を検出するために使用される。
これらのツールは、呼び出し深度が増加するにつれて検索時間を増やす必要がある。
スマートコントラクトの数は指数関数的に増加しているため、これらの従来のツールを使ってコントラクトを分析するのは難しい。
最近、long short term memory(lstm)と呼ばれる機械学習技術がバイナリ分類、すなわちスマートコントラクトが脆弱かどうかを予測するために使用されている。
この手法は、呼び出し深度が増加するにつれて、ほぼ一定の探索時間を必要とする。
本稿では, 自殺, 性欲, 欲欲, または正常な分類において, スマートコントラクトを分類するマルチクラス分類について述べる。
我々はLSTMの変種であるAWD-LSTM(AWD-LSTM)を用いて分類を行った。
我々は、通常の契約に対して異なるopcodeの組み合わせのみを考慮して、クラス不均衡(他のカテゴリと比較して多数の通常の契約)を削減した。
重み付き平均Fbetaスコアは90.0%に達した。
したがって、このようなテクニックは多数のスマートコントラクトを分析し、それらのコントラクトのセキュリティを改善するのに役立ちます。 Vulnerability detection and safety of smart contracts are of paramount importance because of their immutable nature. Symbolic tools like OYENTE and MAIAN are typically used for vulnerability prediction in smart contracts. As these tools are computationally expensive, they are typically used to detect vulnerabilities until some predefined invocation depth. These tools require more search time as the invocation depth increases. Since the number of smart contracts is increasing exponentially, it is difficult to analyze the contracts using these traditional tools. Recently a machine learning technique called Long Short Term Memory (LSTM) has been used for binary classification, i.e., to predict whether a smart contract is vulnerable or not. This technique requires nearly constant search time as the invocation depth increases. In the present article, we have shown a multi-class classification, where we classify a smart contract in Suicidal, Prodigal, Greedy, or Normal categories. We used Average Stochastic Gradient Descent Weight-Dropped LSTM (AWD-LSTM), which is a variant of LSTM, to perform classification. We reduced the class imbalance (a large number of normal contracts as compared to other categories) by considering only the distinct opcode combination for normal contracts. We have achieved a weighted average Fbeta score of 90.0%. Hence, such techniques can be used to analyze a large number of smart contracts and help to improve the security of these contracts. | 翻訳日:2022-12-21 12:48:47 公開日:2020-03-21 |
# DP-Net: 動的プログラミングガイドによるディープニューラルネットワーク圧縮 DP-Net: Dynamic Programming Guided Deep Neural Network Compression ( http://arxiv.org/abs/2003.09615v1 ) ライセンス: Link先を確認 | Dingcheng Yang, Wenjian Yu, Ao Zhou, Haoyuan Mu, Gary Yao, Xiaoyi Wang | (参考訳) 本研究では,ディープニューラルネットワーク(DNN)を圧縮するための効果的なスキーム(DP-Net)を提案する。
これには、ウェイト量子化の最適解を得るための新しい動的プログラミング(DP)ベースのアルゴリズムと、クラスタリングに優しいDNNを訓練するための最適化プロセスが含まれる。
実験の結果、DP-Netは最先端の圧縮よりも精度を保ちながら大きな圧縮を可能にすることがわかった。
Wide ResNet上で最大の77X圧縮比は、DP-Netと他の圧縮技術を組み合わせることで達成される。
さらにdp-netを拡張してロバストなdnnモデルを精度損失なく圧縮する。
最後に、DP-Netで推論計算を高速化するカスタムアクセラレータをFPGA上に設計する。 In this work, we propose an effective scheme (called DP-Net) for compressing the deep neural networks (DNNs). It includes a novel dynamic programming (DP) based algorithm to obtain the optimal solution of weight quantization and an optimization process to train a clustering-friendly DNN. Experiments showed that the DP-Net allows larger compression than the state-of-the-art counterparts while preserving accuracy. The largest 77X compression ratio on Wide ResNet is achieved by combining DP-Net with other compression techniques. Furthermore, the DP-Net is extended for compressing a robust DNN model with negligible accuracy loss. At last, a custom accelerator is designed on FPGA to speed up the inference computation with DP-Net. | 翻訳日:2022-12-21 12:42:32 公開日:2020-03-21 |
# グラフ上の確率的デュアルネットワークアーキテクチャ検索 Probabilistic Dual Network Architecture Search on Graphs ( http://arxiv.org/abs/2003.09676v1 ) ライセンス: Link先を確認 | Yiren Zhao, Duo Wang, Xitong Gao, Robert Mullins, Pietro Lio, Mateja Jamnik | (参考訳) グラフニューラルネットワーク(GNN)のための最初の差別化可能なネットワークアーキテクチャ探索(NAS)を提案する。
GNNは幅広いタスクで有望なパフォーマンスを示すが、大量のアーキテクチャエンジニアリングを必要とする。
まず、グラフは本質的に非ユークリッドで洗練されたデータ構造であり、異なるデータセットにわたるGNNアーキテクチャの適応性が低い。
第二に、典型的なグラフブロックはアグリゲーションやアテンションなどの多くの異なるコンポーネントを含み、大きな組合せ探索空間を生成する。
これらの問題に対処するため、GNNのための確率的デュアルネットワークアーキテクチャ探索(PDNAS)フレームワークを提案する。
PDNASは単一のグラフブロック(マイクロアーキテクチャ)内の操作を最適化するだけでなく、これらのブロックを相互に接続する方法(マクロアーキテクチャ)も検討する。
デュアルアーキテクチャ(マイクロアーキテクチャとマルコアーキテクチャ)の最適化により、PDNASは他のグラフNAS法と比較してパフォーマンスが良く、多様なデータセット上でより深いGNNを見つけることができる。
さらに、アーキテクチャパラメータの更新に完全に勾配に基づく探索手法を用い、これが最初の微分可能なグラフNAS法となる。
例えば、PPIデータセットでは、PDNASが既存の手設計のGNNとNASの結果より優れており、PDNASはF1スコアの1.67と0.17を上回ります。 We present the first differentiable Network Architecture Search (NAS) for Graph Neural Networks (GNNs). GNNs show promising performance on a wide range of tasks, but require a large amount of architecture engineering. First, graphs are inherently a non-Euclidean and sophisticated data structure, leading to poor adaptivity of GNN architectures across different datasets. Second, a typical graph block contains numerous different components, such as aggregation and attention, generating a large combinatorial search space. To counter these problems, we propose a Probabilistic Dual Network Architecture Search (PDNAS) framework for GNNs. PDNAS not only optimises the operations within a single graph block (micro-architecture), but also considers how these blocks should be connected to each other (macro-architecture). The dual architecture (micro- and marco-architectures) optimisation allows PDNAS to find deeper GNNs on diverse datasets with better performance compared to other graph NAS methods. Moreover, we use a fully gradient-based search approach to update architectural parameters, making it the first differentiable graph NAS method. PDNAS outperforms existing hand-designed GNNs and NAS results, for example, on the PPI dataset, PDNAS beats its best competitors by 1.67 and 0.17 in F1 scores. | 翻訳日:2022-12-21 12:42:20 公開日:2020-03-21 |
# 回帰のための変分オートエンコーダを用いた学習型サイバー物理システムの逆例検出 Detecting Adversarial Examples in Learning-Enabled Cyber-Physical Systems using Variational Autoencoder for Regression ( http://arxiv.org/abs/2003.10804v1 ) ライセンス: Link先を確認 | Feiyang Cai and Jiani Li and Xenofon Koutsoukos | (参考訳) 学習可能なコンポーネント(LEC)は、環境の不確実性や変動に対処し、自律性を高めることができるため、サイバー物理システム(CPS)で広く使われている。
しかし、ディープニューラルネットワーク(DNN)のようなLECは堅牢ではなく、逆の例によってモデルが誤った予測をする可能性があることが示されている。
本稿では,CPSの回帰に使用されるLCCの逆例を効率よく検出する問題を考察する。
提案手法は帰納的共形予測に基づいて,変分オートエンコーダに基づく回帰モデルを用いる。
このアーキテクチャは、入力とニューラルネットワークの予測の両方を考慮して、より一般的に、分散の例を検出することができる。
本稿では,DNNを用いて障害物までの距離を推定する,オープンソースの自動運転車シミュレータに実装された高度な緊急ブレーキシステムを用いた手法を実証する。
シミュレーションの結果,提案手法は検出遅延の短い逆例を効果的に検出できることがわかった。 Learning-enabled components (LECs) are widely used in cyber-physical systems (CPS) since they can handle the uncertainty and variability of the environment and increase the level of autonomy. However, it has been shown that LECs such as deep neural networks (DNN) are not robust and adversarial examples can cause the model to make a false prediction. The paper considers the problem of efficiently detecting adversarial examples in LECs used for regression in CPS. The proposed approach is based on inductive conformal prediction and uses a regression model based on variational autoencoder. The architecture allows to take into consideration both the input and the neural network prediction for detecting adversarial, and more generally, out-of-distribution examples. We demonstrate the method using an advanced emergency braking system implemented in an open source simulator for self-driving cars where a DNN is used to estimate the distance to an obstacle. The simulation results show that the method can effectively detect adversarial examples with a short detection delay. | 翻訳日:2022-12-21 12:41:14 公開日:2020-03-21 |
# がん治療の最適化への差分進化の利用 Utilizing Differential Evolution into optimizing targeted cancer treatments ( http://arxiv.org/abs/2003.11623v1 ) ライセンス: Link先を確認 | Michail-Antisthenis Tsompanas, Larry Bull, Andrew Adamatzky, Igor Balaz | (参考訳) 進化可能ながん治療シミュレータの開発に向けて, 実数値問題におけるこの手法の多様性の高効率化を動機として, 差分進化の研究が検討された。
de/rand/1 (de/rand/1) という基本的な de アルゴリズムは、物理細胞シミュレータ上で腫瘍治療のための標的薬物デリバリーシステムのシミュレーション設計を最適化するために用いられた。
提案手法は、事前定義された世代数の後、局所的なミニマから逃れることができなかった標準的な遺伝的アルゴリズムよりも効率的であることが判明した。
標準的なEAを上回り、すべての世代にわたって、人口の多様性を高く保っているという事実が、DEの重要な属性である。
この研究は、がん腫瘍をターゲットとした標的薬のデリバリーシステムを設計、開発、評価する、より広い適用可能性プラットフォームで進行中の研究に組み込まれる。 Working towards the development of an evolvable cancer treatment simulator, the investigation of Differential Evolution was considered, motivated by the high efficiency of variations of this technique in real-valued problems. A basic DE algorithm, namely "DE/rand/1" was used to optimize the simulated design of a targeted drug delivery system for tumor treatment on PhysiCell simulator. The suggested approach proved to be more efficient than a standard genetic algorithm, which was not able to escape local minima after a predefined number of generations. The key attribute of DE that enables it to outperform standard EAs, is the fact that it keeps the diversity of the population high, throughout all the generations. This work will be incorporated with ongoing research in a more wide applicability platform that will design, develop and evaluate targeted drug delivery systems aiming cancer tumours. | 翻訳日:2022-12-21 12:40:27 公開日:2020-03-21 |
# 自律型uavナビゲーション: ddpgに基づく深層強化学習アプローチ Autonomous UAV Navigation: A DDPG-based Deep Reinforcement Learning Approach ( http://arxiv.org/abs/2003.10923v1 ) ライセンス: Link先を確認 | Omar Bouhamed, Hakim Ghazzai, Hichem Besbes and Yehia Massoud | (参考訳) 本稿では,深部強化学習を用いた自律型UAV経路計画フレームワークを提案する。
本研究の目的は,空飛ぶ移動体として自力で訓練されたUAVを用いて,所定の3次元都市部において空間分布の移動や静的な目標に到達することである。
このアプローチでは、連続的な行動空間を持つDeep Deterministic Policy Gradient (DDPG) が、UAVに障害物を通り抜けるか、あるいは越えて、割り当てられた目標に到達するよう訓練するように設計されている。
衝突をペナルティ化しながら、UAVと目的地を分離する距離を最小限に抑えるために、カスタマイズされた報酬関数が開発された。
数値シミュレーションは、環境学習におけるUAVの挙動と、選択したシナリオに対する自律的に軌道を決定する。 In this paper, we propose an autonomous UAV path planning framework using deep reinforcement learning approach. The objective is to employ a self-trained UAV as a flying mobile unit to reach spatially distributed moving or static targets in a given three dimensional urban area. In this approach, a Deep Deterministic Policy Gradient (DDPG) with continuous action space is designed to train the UAV to navigate through or over the obstacles to reach its assigned target. A customized reward function is developed to minimize the distance separating the UAV and its destination while penalizing collisions. Numerical simulations investigate the behavior of the UAV in learning the environment and autonomously determining trajectories for different selected scenarios. | 翻訳日:2022-12-21 12:40:13 公開日:2020-03-21 |
# 光トモグラフィにおける逆問題に対するディープラーニングの応用 Applications of Deep Learning for Ill-Posed Inverse Problems Within Optical Tomography ( http://arxiv.org/abs/2003.09647v1 ) ライセンス: Link先を確認 | Adam Peace | (参考訳) 生の計測データからノイズ画像の再構成を取り巻く医療画像の発達が問題視されている。
前方の問題は、地上の真理画像から生計測データを生成することであるが、逆の問題は、これらの画像の計測データからの再構成である。
医療画像の場合、MRI用の逆フーリエ変換のような古典的な逆ラドン変換は、測定データからクリーンなイメージを回復するのにうまく機能する。
残念なことに、アンダーサンプルデータが非常に一般的であるX線CTでは、忠実で使用可能な画像を解決するためにこれ以上のものが必要である。
本稿では,X線CTの逆問題に対する古典的解法の歴史を考察するとともに,教師付き深層学習を利用した手法の現状分析を行った。
最後に、将来研究のためのいくつかの可能な道を提供する。 Increasingly in medical imaging has emerged an issue surrounding the reconstruction of noisy images from raw measurement data. Where the forward problem is the generation of raw measurement data from a ground truth image, the inverse problem is the reconstruction of those images from the measurement data. In most cases with medical imaging, classical inverse Radon transforms, such as an inverse Fourier transform for MRI, work well for recovering clean images from the measured data. Unfortunately in the case of X-Ray CT, where undersampled data is very common, more than this is needed to resolve faithful and usable images. In this paper, we explore the history of classical methods for solving the inverse problem for X-Ray CT, followed by an analysis of the state of the art methods that utilize supervised deep learning. Finally, we will provide some possible avenues for research in the future. | 翻訳日:2022-12-21 12:39:20 公開日:2020-03-21 |
# 監視された機械学習アルゴリズムを用いた薬物レビューの感性分析 Sentiment Analysis in Drug Reviews using Supervised Machine Learning Algorithms ( http://arxiv.org/abs/2003.11643v1 ) ライセンス: Link先を確認 | Sairamvinay Vijayaraghavan, Debraj Basu | (参考訳) 感性分析は自然言語処理において重要なアルゴリズムであり、あるテキスト内で感情を検出するために使用される。
本プロジェクトでは,テキスト形式でレビューされた各種薬剤のレビュー分析に取り組み,また1~10の尺度で評価した。
このデータセットは、トレーニングとテストの2つのデータセット(75-25\%のスプリット)を持つUCI機械学習レポジトリから取得しました。
薬の格付けは, 陽性(7~10), 陰性(1~4), 中性(4〜7)の3種類に分類した。
同様の症状に属する薬物に対する複数のレビューがあり、異なる条件のレビューが薬物の評価にどう影響するかを調査することにした。
本研究の目的は,テキストレビューを用いて評価のクラスを予測する教師付き機械学習分類アルゴリズムの実装である。
主に、TFIDF(Term Frequency Inverse Document Frequency)やCV(Count Vectors)といった異なる埋め込みを実装した。
我々は、データセット内の"Birth Control"、"Depression"、"Pain"といった最も一般的な条件でモデルをトレーニングし、テストデータセットを予測しながら良い結果を得た。 Sentiment Analysis is an important algorithm in Natural Language Processing which is used to detect sentiment within some text. In our project, we had chosen to work on analyzing reviews of various drugs which have been reviewed in form of texts and have also been given a rating on a scale from 1-10. We had obtained this data set from the UCI machine learning repository which had 2 data sets: train and test (split as 75-25\%). We had split the number rating for the drug into three classes in general: positive (7-10), negative (1-4) or neutral(4-7). There are multiple reviews for the drugs that belong to a similar condition and we decided to investigate how the reviews for different conditions use different words impact the ratings of the drugs. Our intention was mainly to implement supervised machine learning classification algorithms that predict the class of the rating using the textual review. We had primarily implemented different embeddings such as Term Frequency Inverse Document Frequency (TFIDF) and the Count Vectors (CV). We had trained models on the most popular conditions such as "Birth Control", "Depression" and "Pain" within the data set and obtained good results while predicting the test data sets. | 翻訳日:2022-12-21 10:17:07 公開日:2020-03-21 |
# 不完全な知識を持つ教師の力と限界を理解する Understanding the Power and Limitations of Teaching with Imperfect Knowledge ( http://arxiv.org/abs/2003.09712v1 ) ライセンス: Link先を確認 | Rati Devidze, Farnam Mansouri, Luis Haug, Yuxin Chen, Adish Singla | (参考訳) 機械教育は、教師と生徒/学習者の相互作用を研究し、教師が特定のタスクを学ぶための訓練例を選択する。
典型的な前提は、教師はタスクについて完全な知識を持っているということだ - この知識は、望ましい学習目標を知ること、学習者が使用するタスクの正確な表現を持つこと、学習者の学習力学を捉えるパラメータを知ることである。
教育における機械教育の現実的な応用に触発されて、教師の知識が限定的かつ騒々しく設定されていることを考える。
最適学習セットを構築する際に,不完全な知識が対応する機械教育問題に対する教師の解決にどう影響するかを示すことで,この問題に答える。
実世界のアプリケーションのための堅牢な教育アルゴリズムの設計に重要な意味を持つ。 Machine teaching studies the interaction between a teacher and a student/learner where the teacher selects training examples for the learner to learn a specific task. The typical assumption is that the teacher has perfect knowledge of the task---this knowledge comprises knowing the desired learning target, having the exact task representation used by the learner, and knowing the parameters capturing the learning dynamics of the learner. Inspired by real-world applications of machine teaching in education, we consider the setting where teacher's knowledge is limited and noisy, and the key research question we study is the following: When does a teacher succeed or fail in effectively teaching a learner using its imperfect knowledge? We answer this question by showing connections to how imperfect knowledge affects the teacher's solution of the corresponding machine teaching problem when constructing optimal teaching sets. Our results have important implications for designing robust teaching algorithms for real-world applications. | 翻訳日:2022-12-21 10:15:44 公開日:2020-03-21 |
# オンラインソーシャルネットワークにおける時間的文脈を考慮した深層信頼予測に向けて Towards Time-Aware Context-Aware Deep Trust Prediction in Online Social Networks ( http://arxiv.org/abs/2003.09543v1 ) ライセンス: Link先を確認 | Seyed Mohssen Ghafari | (参考訳) 信頼は、情報ソースが信頼できるか、誰と共有すべきか、誰から情報を受け入れるべきかを決定する尺度として定義できる。
ソーシャルスパマー検出、フェイクニュース検出、リツイート行動検出、レコメンデーションシステムなど、オンラインソーシャルネットワーク(OSN)への信頼のためのいくつかのアプリケーションがある。
信頼予測は、現在接続されていない2人のユーザー間の新しい信頼関係を予測するプロセスである。
信頼の応用においては、ユーザ間の信頼関係を予測する必要がある。
このプロセスは、ユーザ特定信頼関係の疎結合、信頼の文脈認識、時間とともに信頼価値の変化など、多くの課題に直面します。
本論文では,osnsにおける対信頼予測モデルにおける最先端の分析を行う。
本稿では,この領域における3つの課題と,それに対応する新しい信頼予測手法について論じる。
まず,ユーザの性格特性を付加的な情報として組み込んだ低ランクなユーザ表現を提案する。
次に,文脈認識型信頼予測モデルを提案する。
最後に,信頼関係の時間依存性を考慮して,動的深層信頼予測手法を提案する。
我々は,5つのペアワイズ信頼予測手法を設計,実装し,OSNから収集した実世界のデータセットを用いて評価する。
実験の結果,提案手法の有効性が,他の最先端のペアワイズ信頼予測モデルと比較された。 Trust can be defined as a measure to determine which source of information is reliable and with whom we should share or from whom we should accept information. There are several applications for trust in Online Social Networks (OSNs), including social spammer detection, fake news detection, retweet behaviour detection and recommender systems. Trust prediction is the process of predicting a new trust relation between two users who are not currently connected. In applications of trust, trust relations among users need to be predicted. This process faces many challenges, such as the sparsity of user-specified trust relations, the context-awareness of trust and changes in trust values over time. In this dissertation, we analyse the state-of-the-art in pair-wise trust prediction models in OSNs. We discuss three main challenges in this domain and present novel trust prediction approaches to address them. We first focus on proposing a low-rank representation of users that incorporates users' personality traits as additional information. Then, we propose a set of context-aware trust prediction models. Finally, by considering the time-dependency of trust relations, we propose a dynamic deep trust prediction approach. We design and implement five pair-wise trust prediction approaches and evaluate them with real-world datasets collected from OSNs. The experimental results demonstrate the effectiveness of our approaches compared to other state-of-the-art pair-wise trust prediction models. | 翻訳日:2022-12-21 10:14:52 公開日:2020-03-21 |
# モノトニック性回復のためのブラックボックス法 Black-box Methods for Restoring Monotonicity ( http://arxiv.org/abs/2003.09554v1 ) ライセンス: Link先を確認 | Evangelia Gergatsouli, Brendan Lucier, Christos Tzamos | (参考訳) 多くの実用的な応用において、ヒューリスティックあるいは近似アルゴリズムは、手元のタスクを効率的に解くために用いられる。
しかし、それらの解は最適解の自然な単調性をしばしば満たさない。
本研究では,興味のあるパラメータの単調性を復元できるアルゴリズムを開発する。
具体的には、(非単調な)多次元実数値関数へのオラクルアクセスを$f$とすると、関数の期待値を少なくとも$\varepsilon$で下げながら単調性を取り戻すアルゴリズムを提供する。
要求されるクエリの数は、1/\varepsilon$で最大対数であり、パラメータ数で指数関数である。
また、この指数依存が必要であることを示す下限を与える。
最後に、$k$-marginal monotonicityの弱い性質を復元するための改善されたクエリ複雑性境界を得る。
この性質の下では、関数 $f$ のすべての $k$-次元射影は単調である必要がある。
取得したクエリの複雑さは指数関数的に$k$でスケールします。 In many practical applications, heuristic or approximation algorithms are used to efficiently solve the task at hand. However their solutions frequently do not satisfy natural monotonicity properties of optimal solutions. In this work we develop algorithms that are able to restore monotonicity in the parameters of interest. Specifically, given oracle access to a (possibly non-monotone) multi-dimensional real-valued function $f$, we provide an algorithm that restores monotonicity while degrading the expected value of the function by at most $\varepsilon$. The number of queries required is at most logarithmic in $1/\varepsilon$ and exponential in the number of parameters. We also give a lower bound showing that this exponential dependence is necessary. Finally, we obtain improved query complexity bounds for restoring the weaker property of $k$-marginal monotonicity. Under this property, every $k$-dimensional projection of the function $f$ is required to be monotone. The query complexity we obtain only scales exponentially with $k$. | 翻訳日:2022-12-21 10:14:32 公開日:2020-03-21 |