このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20230118となっている論文です。

PDF登録状況(公開日: 20230118)

TitleAuthorsAbstract論文公表日・翻訳日
# 相互作用する準周期系における雪崩安定性遷移

Avalanche stability transition in interacting quasiperiodic systems ( http://arxiv.org/abs/2207.05051v2 )

ライセンス: Link先を確認
Yi-Ting Tu, DinhDuy Vu, Sankar Das Sarma(参考訳) 1次元準周期相互作用系をマルコフ浴に結合し,多体局所化相の雪崩不安定性を数値的に検討し,乱れ強度$w>8$の無秩序準周期系よりも疑似ランダム準周期系において多くの身体局在 (mbl) が安定であることが判明した。 我々は、実空間 RG の議論をさらに発展させ、雪崩不安定の観点から準周期とランダム MBL の詳細な比較を行い、両者は異なる普遍性クラスに属すると結論付ける。

Coupling a 1D quasiperiodic interacting system to a Markovian bath, we study the avalanche instability of the many body localized phase numerically, finding that many body localization (MBL) is more stable in pseudorandom quasiperiodic systems than the corresponding randomly disordered systems for a disorder strength $W>8$, potentially up to arbitrarily large system sizes. We support our conclusion by additionally developing real space RG arguments, and provide a detailed comparison between quasiperiodic and random MBL from the avalanche instability perspective, concluding that the two belong to different universality classes.
翻訳日:2023-02-05 12:13:21 公開日:2023-01-18
# 超伝導量子ハードウェア上の全連結スピンモデルの有限サイズ臨界性

Finite-size criticality in fully connected spin models on superconducting quantum hardware ( http://arxiv.org/abs/2208.02731v2 )

ライセンス: Link先を確認
Michele Grossi, Oriel Kiss, Francesco De Luca, Carlo Zollo, Ian Gremese, and Antonio Mandarino(参考訳) 多体系における集団行動の出現は、物質の異なる相を分離する量子臨界性に責任を持つ。 磁場中の相互作用するスピン系は、量子相転移を研究するために異なるアプローチをテストすることができる。 本研究では,量子アルゴリズムが提供する新たな資源を活用し,全連結スピン$-1/2$モデルの量子臨界挙動を検出する。 内部異方性パラメータ $\gamma,$ に依存する適切なハミルトニアンを定義することで、格子が完全連結グラフであるスピンモデルの3つのパラダイム的例を調べることができる。 超伝導トランスモン量子ビット上で動作する変分アルゴリズムを用いて有限サイズ系の臨界挙動を検出する手法を提案する。 我々は,第1励起状態と基底状態のエネルギーギャップ,系の易軸に沿った磁化,スピンスピン相関を評価した。 最後に、古典的シミュレーションが重要なリソースを必要とし始めるような次元を持つシステムにおいて、実際の量子デバイス上でそのようなアプローチをスケールする可能性について論じる。

The emergence of a collective behavior in a many-body system is responsible of the quantum criticality separating different phases of matter. Interacting spin systems in a magnetic field offer a tantalizing opportunity to test different approaches to study quantum phase transitions. In this work, we exploit the new resources offered by quantum algorithms to detect the quantum critical behaviour of fully connected spin$-1/2$ models. We define a suitable Hamiltonian depending on an internal anisotropy parameter $\gamma,$ that allows us to examine three paradigmatic examples of spin models, whose lattice is a fully connected graph. We propose a method based on variational algorithms run on superconducting transmon qubits to detect the critical behavior for systems of finite size. We evaluate the energy gap between the first excited state and the ground state, the magnetization along the easy-axis of the system, and the spin-spin correlations. We finally report a discussion about the feasibility of scaling such approach on a real quantum device for a system having a dimension such that classical simulations start requiring significant resources.
翻訳日:2023-02-02 07:23:11 公開日:2023-01-18
# 回転乱流における速度成分推定のための生成逆ネットワーク

Generative Adversarial Networks to infer velocity components in rotating turbulent flows ( http://arxiv.org/abs/2301.07541v1 )

ライセンス: Link先を確認
Tianyi Li, Michele Buzzicotti, Luca Biferale and Fabio Bonaccorso(参考訳) 回転乱流の二次元スナップショットに対する推定問題について検討した。 本稿では,線形拡張固有直交分解法 (epod) 法, 非線形畳み込みニューラルネットワーク (cnn) および生成逆ネットワーク法 (gan) の, 点的および統計的再構成能力の系統的定量的評価を行う。 2つ目の測定から1つの速度成分を推定する重要なタスクを攻撃し、 (I) 両方の成分が回転軸に直交する平面に配置され、 (II) そのうちの1つは回転軸に平行である2つのケースについて検討した。 EPOD法は両者の相関関係が強い前例にのみ有効であり,CNNとGANはポイントワイドと統計的再構成の両方においてEPOD法よりも優れていた。 例えば(II)、入力と出力データの相関が弱い場合には、すべてのメソッドがポイントワイズ情報を忠実に再構築することができない。 この場合、統計的な意味では、GANのみがフィールドを再構築することができる。 予測と基底真理の間のl2空間距離に基づく標準検証ツールとウェーブレット分解を用いたより洗練されたマルチスケール解析の両方を用いて解析を行った。 統計的検証は、確率密度関数、スペクトル特性、多スケール平坦性の間の標準jensen-shannon発散に基づいている。

Inference problems for two-dimensional snapshots of rotating turbulent flows are studied. We perform a systematic quantitative benchmark of point-wise and statistical reconstruction capabilities of the linear Extended Proper Orthogonal Decomposition (EPOD) method, a non-linear Convolutional Neural Network (CNN) and a Generative Adversarial Network (GAN). We attack the important task of inferring one velocity component out of the measurement of a second one, and two cases are studied: (I) both components lay in the plane orthogonal to the rotation axis and (II) one of the two is parallel to the rotation axis. We show that EPOD method works well only for the former case where both components are strongly correlated, while CNN and GAN always outperform EPOD both concerning point-wise and statistical reconstructions. For case (II), when the input and output data are weakly correlated, all methods fail to reconstruct faithfully the point-wise information. In this case, only GAN is able to reconstruct the field in a statistical sense. The analysis is performed using both standard validation tools based on L2 spatial distance between the prediction and the ground truth and more sophisticated multi-scale analysis using wavelet decomposition. Statistical validation is based on standard Jensen-Shannon divergence between the probability density functions, spectral properties and multi-scale flatness.
翻訳日:2023-01-29 14:09:28 公開日:2023-01-18
# 物理インフォームドニューラルネットワークを用いた温度のみの測定からレイリー・ベナード流の再構成

Reconstructing Rayleigh-Benard flows out of temperature-only measurements using Physics-Informed Neural Networks ( http://arxiv.org/abs/2301.07769v1 )

ライセンス: Link先を確認
Patricio Clark Di Leoni, Lokahith Agasthya, Michele Buzzicotti, Luca Biferale(参考訳) 温度情報のみを用いて乱流レイリー・ベナード流を再構成する物理情報ニューラルネットワーク(PINN)の機能について検討する。 種々の低域通過フィルタ情報と乱流強度において, 復元の質を定量的に解析する。 我々は,古典的方程式情報同化法であるnudgingを用いて得られた結果と比較した。 低レイリー数では、ピンはニュジングで達成されたものと同等の精度で再構築することができる。 高レイリー数の場合、ピンはヌージングよりも優れており、温度のデータが空間密度と時間密度で提供される場合に限り、十分な速度場の再構成が可能となる。 データがスパースになると、ピンズ性能は低下し、ポイントツーポイントのエラーセンスだけでなく、確率密度関数やエネルギースペクトルに見られるような統計的な意味でのナジングにも逆らう。

We investigate the capabilities of Physics-Informed Neural Networks (PINNs) to reconstruct turbulent Rayleigh-Benard flows using only temperature information. We perform a quantitative analysis of the quality of the reconstructions at various amounts of low-passed-filtered information and turbulent intensities. We compare our results with those obtained via nudging, a classical equation-informed data assimilation technique. At low Rayleigh numbers, PINNs are able to reconstruct with high precision, comparable to the one achieved with nudging. At high Rayleigh numbers, PINNs outperform nudging and are able to achieve satisfactory reconstruction of the velocity fields only when data for temperature is provided with high spatial and temporal density. When data becomes sparse, the PINNs performance worsens, not only in a point-to-point error sense but also, and contrary to nudging, in a statistical sense, as can be seen in the probability density functions and energy spectra.
翻訳日:2023-01-29 13:57:34 公開日:2023-01-18
# 不確実性を考慮した意思決定とリスク管理問題について

On solving decision and risk management problems subject to uncertainty ( http://arxiv.org/abs/2301.10244v1 )

ライセンス: Link先を確認
Alexander Gutfraind(参考訳) 不確実性は意思決定とリスク管理において広範囲にわたる課題であり、通常は定量化とモデリングによって研究される。 興味深いことに、エンジニアや他の意思決定者は通常、堅牢性の導入や意思決定ヒューリスティックスの導入といった戦略の不確実性を管理する。 そこで本論文は,このような戦略を体系的に理解し,その適用範囲を判断し,それを活用するためのフレームワークを開発することを目的とする。 本論文は,100の意思決定問題のデータセットをレビューした結果,多くの決定問題に重要な特性,すなわち解法戦略を可能にする性質が認められ,14の特性が発見された。 したがって、アナリストはまず特定の問題でこれらの特性を見つけ出し、その戦略を活用できる。 多目的最適化法は、投資決定を定量的に行うために用いられる。 決定問題の分析的複雑さは、重要な特性のいくつが利用できるかを評価することによっても評価できる。 全体として、重要な性質に照らして、不確実性の下の複雑な問題はしばしば驚くほど扱いやすいように見える。

Uncertainty is a pervasive challenge in decision and risk management and it is usually studied by quantification and modeling. Interestingly, engineers and other decision makers usually manage uncertainty with strategies such as incorporating robustness, or by employing decision heuristics. The focus of this paper is then to develop a systematic understanding of such strategies, determine their range of application, and develop a framework to better employ them. Based on a review of a dataset of 100 decision problems, this paper found that many decision problems have pivotal properties, i.e. properties that enable solution strategies, and finds 14 such properties. Therefore, an analyst can first find these properties in a given problem, and then utilize the strategies they enable. Multi-objective optimization methods could be used to make investment decisions quantitatively. The analytical complexity of decision problems can also be scored by evaluating how many of the pivotal properties are available. Overall, we find that in the light of pivotal properties, complex problems under uncertainty frequently appear surprisingly tractable.
翻訳日:2023-01-29 13:21:04 公開日:2023-01-18
# 同時頂点埋め込みとコミュニティ検出のためのグラフエンコーダアンサンブル

Graph Encoder Ensemble for Simultaneous Vertex Embedding and Community Detection ( http://arxiv.org/abs/2301.11290v1 )

ライセンス: Link先を確認
Cencheng Shen, Youngser Park, Carey E. Priebe(参考訳) 本稿では, 頂点埋め込み, コミュニティ検出, コミュニティサイズ決定を同時に実現する新しい, 計算効率の良い手法を提案する。 正規化された1ホットグラフエンコーダと新しいランクベースのクラスタサイズ尺度を利用することで,提案したグラフエンコーダアンサンブルアルゴリズムは,様々なシミュレーションや実データ実験を通じて優れた数値性能を実現する。

In this paper we propose a novel and computationally efficient method to simultaneously achieve vertex embedding, community detection, and community size determination. By utilizing a normalized one-hot graph encoder and a new rank-based cluster size measure, the proposed graph encoder ensemble algorithm achieves excellent numerical performance throughout a variety of simulations and real data experiments.
翻訳日:2023-01-29 13:13:20 公開日:2023-01-18
# 磁気同位体効果 : 量子生物学における可能性試験場

Magnetic isotope effects: a potential testing ground for quantum biology ( http://arxiv.org/abs/2301.08554v1 )

ライセンス: Link先を確認
Hadi Zadeh-Haghighi and Christoph Simon(参考訳) 鳥類の磁気受容のような生物学における磁気センシングの考えられる1つの説明は、ラジカル対を含む特定の化学反応のスピンダイナミクスに基づいている。 ラジカルペアは、麻酔、多動性、神経新生、概日時計リズム、微小管組み立てなどにおいても重要な役割を果たしていることが示唆されている。 したがって、そのようなモデルの信頼性を調査することは重要である。 一つの方法として、異なる核スピンによる同位体効果がある。 ここでは、生物学におけるスピン関連同位体効果に関する論文を概説する。 同位体効果の研究は、量子生物学にとって興味深い道のりかもしれない。

One possible explanation for magnetosensing in biology, such as avian magnetoreception, is based on the spin dynamics of certain chemical reactions that involve radical pairs. Radical pairs have been suggested to also play a role in anesthesia, hyperactivity, neurogenesis, circadian clock rhythm, microtubule assembly, etc. It thus seems critical to probe the credibility of such models. One way to do so is through isotope effects with different nuclear spins. Here we briefly review the papers involving spin-related isotope effects in biology. We suggest studying isotope effects can be an interesting avenue for quantum biology.
翻訳日:2023-01-23 13:22:33 公開日:2023-01-18
# 手のひらの中のnerf:ノベルビュー合成によるロボティクスの補正強化

NeRF in the Palm of Your Hand: Corrective Augmentation for Robotics via Novel-View Synthesis ( http://arxiv.org/abs/2301.08556v1 )

ライセンス: Link先を確認
Allan Zhou, Moo Jin Kim, Lirui Wang, Pete Florence, Chelsea Finn(参考訳) エキスパートデモは、視覚ロボット操作のポリシーを訓練するための豊富な監督の源であるが、模倣学習の方法は、リアクティブなクローズドループの振る舞いを学ぶために、多くのデモンストレーションや高価なオンライン専門家の監督を必要とすることが多い。 本研究では,SPARTN(Synthetic Perturbations for Augmenting Robot Trajectories via NeRF)を導入した。 提案手法はニューラルレイディアンス場(NeRF)を利用して視覚的実演に補正ノイズを合成し,NeRFを用いて摂動視点を生成し,同時に補正動作を計算する。 これは専門的な監督や環境相互作用を必要とせず、NeRFの幾何学的情報をリアルタイムの反応性RGBのみのポリシーに蒸留する。 シミュレーションされた6-DoF視覚的把握ベンチマークでは、SPARTNは再現学習よりも成功率を2.8$\times$で改善し、オンラインの監視方法よりも優れている。 さらに、RGBオンリーとRGB-D成功率のギャップを埋め、これまでの奥行きセンサーの必要性をなくす。 実世界の6-DoFロボットグルーピング実験では,従来のディープベース手法では困難であった物体を含む,絶対的な成功率を平均22.5\%向上させる。 結果は \url{https://bland.website/spartn} を参照。

Expert demonstrations are a rich source of supervision for training visual robotic manipulation policies, but imitation learning methods often require either a large number of demonstrations or expensive online expert supervision to learn reactive closed-loop behaviors. In this work, we introduce SPARTN (Synthetic Perturbations for Augmenting Robot Trajectories via NeRF): a fully-offline data augmentation scheme for improving robot policies that use eye-in-hand cameras. Our approach leverages neural radiance fields (NeRFs) to synthetically inject corrective noise into visual demonstrations, using NeRFs to generate perturbed viewpoints while simultaneously calculating the corrective actions. This requires no additional expert supervision or environment interaction, and distills the geometric information in NeRFs into a real-time reactive RGB-only policy. In a simulated 6-DoF visual grasping benchmark, SPARTN improves success rates by 2.8$\times$ over imitation learning without the corrective augmentations and even outperforms some methods that use online supervision. It additionally closes the gap between RGB-only and RGB-D success rates, eliminating the previous need for depth sensors. In real-world 6-DoF robotic grasping experiments from limited human demonstrations, our method improves absolute success rates by $22.5\%$ on average, including objects that are traditionally challenging for depth-based methods. See video results at \url{https://bland.website/spartn}.
翻訳日:2023-01-23 13:10:19 公開日:2023-01-18
# 量子宇宙学的重力波?

Quantum cosmological gravitational waves? ( http://arxiv.org/abs/2211.00182v3 )

ライセンス: Link先を確認
Amaury Micheli and Patrick Peter(参考訳) 一般相対性理論とその宇宙論的解は、我々のフリードマン・レマ・ニットル・ロバートソン・ウォーカー膨張宇宙上に進化する摂動のテンソルモードの存在を予測する。 ゲージ不変であり、必ずしも他の量子源と結合するわけではないため、純粋な重力を表すものと見なすことができる。 実際に量子化されていることを示す曖昧な証拠は、重力の量子的性質の疑わしい証明を与える。 このレビューでは、この結論につながる様々な理論的な問題を概説する。

General relativity and its cosmological solution predicts the existence of tensor modes of perturbations evolving on top of our Friedman-Lema\^itre-Robertson-Walker expanding Universe. Being gauge invariant and not necessarily coupled to other quantum sources, they can be seen as representing pure gravity. Unambiguously showing they are indeed to be quantised would thus provide an unquestionable proof of the quantum nature of gravitation. This review will present a summary of the various theoretical issues that could lead to this conclusion.
翻訳日:2023-01-20 21:58:01 公開日:2023-01-18
# 2つの静的絡み合ったUnruh-DeWitt検出器の自然絡み込みリーク

Spontaneous entanglement leakage of two static entangled Unruh-DeWitt detectors ( http://arxiv.org/abs/2211.00383v2 )

ライセンス: Link先を確認
Dipankar Barman, Angshuman Choudhury, Bhushan Kad, Bibhas Ranjan Majhi(参考訳) 2つの絡み合った2レベルのUnruh-DeWitt検出器は、少なくとも一方が環境量子場から孤立していないときに自然にゆるい絡みを持つ。 検出器と環境の間の永遠の相互作用のために、検出器の出口状態からの自然放出と磁場の真空変動がこの負の効果に影響を与える。 その結果、2つの絡み合った量子ビットは、ブラックホールの地平線に向かって自由落下するときに通信が減ることが示唆された。

Two entangled two-level Unruh-DeWitt detectors, which are in rest, spontaneously loose entanglement when at least any one of them is not isolated from the environment quantum fields. For eternal interaction between the detectors and environment, the spontaneous emission from the detectors' exited states and vacuum fluctuations of field influence this negative effect. Consequently, it suggests that two entangled qubits become less communicated during their free-fall towards the black hole horizon.
翻訳日:2023-01-20 19:35:35 公開日:2023-01-18
# 二次ネットにおけるカタパルトダイナミクスと相転移

Catapult Dynamics and Phase Transitions in Quadratic Nets ( http://arxiv.org/abs/2301.07737v1 )

ライセンス: Link先を確認
David Meltzer, Junyu Liu(参考訳) 勾配降下で訓練されたニューラルネットワークは、学習率の関数として非自明な位相遷移を受けることができる。 Lewkowycz et al., 2020)では、広範囲のニューラルネットが超臨界学習率のカタパルト相を示し、トレーニング損失は早期に指数関数的に増加し、急速に小さな値に減少することがわかった。 この段階では、ニューラル・タンジェント・カーネル(NTK)の最高固有値も大きな進化を遂げる。 この研究において、カタパルト相が二次モデルと2層相同性ニューラルネットを含む大きな種類のモデルに存在することが証明される。 そこで本研究では,一定範囲の学習率において,損失が大きいと重み規範が減少することを示す。 また,この理論的に導かれた範囲を超えて学習率を実証的に研究し,超臨界学習率で訓練されたreluネットの活性化マップが学習率を増加させるにつれて希薄化していくことを示した。

Neural networks trained with gradient descent can undergo non-trivial phase transitions as a function of the learning rate. In (Lewkowycz et al., 2020) it was discovered that wide neural nets can exhibit a catapult phase for super-critical learning rates, where the training loss grows exponentially quickly at early times before rapidly decreasing to a small value. During this phase the top eigenvalue of the neural tangent kernel (NTK) also undergoes significant evolution. In this work, we will prove that the catapult phase exists in a large class of models, including quadratic models and two-layer, homogenous neural nets. To do this, we show that for a certain range of learning rates the weight norm decreases whenever the loss becomes large. We also empirically study learning rates beyond this theoretically derived range and show that the activation map of ReLU nets trained with super-critical learning rates becomes increasingly sparse as we increase the learning rate.
翻訳日:2023-01-20 16:21:41 公開日:2023-01-18
# D適応による学習時間自由学習

Learning-Rate-Free Learning by D-Adaptation ( http://arxiv.org/abs/2301.07733v1 )

ライセンス: Link先を確認
Aaron Defazio and Konstantin Mishchenko(参考訳) 凸リプシッツ関数の勾配降下速度は、学習率の選択に大きく依存する。 最適収束率を達成するために学習率を設定するには、初期点から解集合までの距離Dを知る必要がある。 本研究では,逆追跡や行探索を伴わない単一ループ法について述べる。これは,D$の知識を必要としないが,漸近的に凸リプシッツ関数の複雑性クラスに対する収束率の最適値を達成する。 本手法は,収束率に乗算的ログ係数を付加することなく,このクラスで最初のパラメータフリー手法である。 本手法のSGDおよびAdam変種に対する広範な実験を行い,大規模ビジョンや言語問題を含む12以上の機械学習問題に対して手作業による学習率を自動的にマッチングする手法を提案する。 提案手法は実用的で効率的であり,各ステップに付加的な関数値や勾配評価を必要としない。 オープンソース実装が利用可能である(https://github.com/facebookresearch/dadaptation)。

The speed of gradient descent for convex Lipschitz functions is highly dependent on the choice of learning rate. Setting the learning rate to achieve the optimal convergence rate requires knowing the distance D from the initial point to the solution set. In this work, we describe a single-loop method, with no back-tracking or line searches, which does not require knowledge of $D$ yet asymptotically achieves the optimal rate of convergence for the complexity class of convex Lipschitz functions. Our approach is the first parameter-free method for this class without additional multiplicative log factors in the convergence rate. We present extensive experiments for SGD and Adam variants of our method, where the method automatically matches hand-tuned learning rates across more than a dozen diverse machine learning problems, including large-scale vision and language problems. Our method is practical, efficient and requires no additional function value or gradient evaluations each step. An open-source implementation is available (https://github.com/facebookresearch/dadaptation).
翻訳日:2023-01-20 16:21:23 公開日:2023-01-18
# stateQIP = statePSPACE

stateQIP = statePSPACE ( http://arxiv.org/abs/2301.07730v1 )

ライセンス: Link先を確認
Tony Metger, Henry Yuen(参考訳) 複雑性理論は伝統的に古典的な計算問題を解くことの難しさを研究する。 量子設定において、異なる複雑性の概念、すなわちある量子状態を物理的に準備する複雑さを考えることも自然である。 空間一様多項式空間量子回路で生成可能な状態を含む状態PSPACEと、全能不信頼な量子証明器と相互作用することによって多項式時間量子検証器が生成できる状態を含む状態QIPの関係について検討する。 後者のクラスは、最近Rosenhal and Yuen (ITCS 2022) によって導入され、 statePSPACE $\subseteq$ stateQIP が証明された。 我々の主な結果は、逆包含状態 QIP $\subseteq$ statePSPACE であり、2つのクラスの等式を確立し、ジャイナ等の有名なQIP = PSPACE定理に類似した自然な状態複素性を与える(J. ACM 2011)。 これを証明するために,指数関数的に大きなPSPACE計算可能な半定値プログラム(SDP)を解く多項式空間量子アルゴリズムを開発した。 我々のSDPソルバは量子アルゴリズムの最近のブロック符号化技術に依存しており、これらの手法が複雑性理論にも有用であることを示す。 同様の手法を用いて、一般的な量子対話プロトコルの最適証明戦略を量子多項式空間に実装できることを示した。 我々は、uhlmannの定理のアルゴリズム版を研究し、uhlmann変換を実装する複雑さの上限を確立することによってこれを証明する。

Complexity theory traditionally studies the hardness of solving classical computational problems. In the quantum setting, it is also natural to consider a different notion of complexity, namely the complexity of physically preparing a certain quantum state. We study the relation between two such state complexity classes: statePSPACE, which contains states that can be generated by space-uniform polynomial-space quantum circuits, and stateQIP, which contains states that a polynomial-time quantum verifier can generate by interacting with an all-powerful untrusted quantum prover. The latter class was recently introduced by Rosenthal and Yuen (ITCS 2022), who proved that statePSPACE $\subseteq$ stateQIP. Our main result is the reverse inclusion, stateQIP $\subseteq$ statePSPACE, thereby establishing equality of the two classes and providing a natural state-complexity analogue to the celebrated QIP = PSPACE theorem of Jain, et al. (J. ACM 2011). To prove this, we develop a polynomial-space quantum algorithm for solving exponentially large "PSPACE-computable" semidefinite programs (SDPs), which also prepares an optimiser encoded in a quantum state. Our SDP solver relies on recent block-encoding techniques from quantum algorithms, demonstrating that these techniques are also useful for complexity theory. Using similar techniques, we also show that optimal prover strategies for general quantum interactive protocols can be implemented in quantum polynomial space. We prove this by studying an algorithmic version of Uhlmann's theorem and establishing an upper bound on the complexity of implementing Uhlmann transformations.
翻訳日:2023-01-20 16:21:07 公開日:2023-01-18
# 量子化学波動関数の絡み合いを低減する階層的クリフォード変換

Hierarchical Clifford transformations to reduce entanglement in quantum chemistry wavefunctions ( http://arxiv.org/abs/2301.07726v1 )

ライセンス: Link先を確認
Ryan V. Mishmash, Tanvi P. Gujarati, Mario Motta, Huanchen Zhai, Garnet Kin-Lic Chan, Antonio Mezzacapo(参考訳) 多体物理学と化学の計算手法の性能は、問題のキャスティングに使用される基底の選択に大きく依存するので、より優れた基底と類似性変換の探索はこの分野の進歩に重要である。 これまでのところ、このタスクのために理論的量子情報からのツールが徹底的に検討されていない。 ここでは、量子化学ハミルトニアンに対して計算可能なクリフォード類似性変換を効率よく提示し、対応する分子基底状態における絡み合いを減らした基底を公開する。 これらの変換は、truncated molecular Hamiltonian の階層のブロック対角化によって構成され、元の問題の全スペクトルを保存する。 ここで導入された基底は、基底状態特性のより効率的な古典的および量子的な計算を可能にする。 まず,分子基底状態における二部体の絡み合いを標準問題表現と比較して体系的に減少させる。 この絡み合い低減は、密度行列再正規化群に基づくような古典的な数値法に影響を及ぼす。 そこで我々は,新しい基底構造を利用する変分量子アルゴリズムを開発し,階層的クリフォード変換を用いると,再び改良された結果を示す。

The performance of computational methods for many-body physics and chemistry is strongly dependent on the choice of basis used to cast the problem; hence, the search for better bases and similarity transformations is important for progress in the field. So far, tools from theoretical quantum information have been not thoroughly explored for this task. Here we take a step in this direction by presenting efficiently computable Clifford similarity transformations for quantum chemistry Hamiltonians, which expose bases with reduced entanglement in the corresponding molecular ground states. These transformations are constructed via block diagonalization of a hierarchy of truncated molecular Hamiltonians, preserving the full spectrum of the original problem. We show that the bases introduced here allow for more efficient classical and quantum computation of ground state properties. First, we find a systematic reduction of bipartite entanglement in molecular ground states as compared to standard problem representations. This entanglement reduction has implications in classical numerical methods such as ones based on the density matrix renormalization group. Then, we develop variational quantum algorithms that exploit the structure in the new bases, showing again improved results when the hierarchical Clifford transformations are used.
翻訳日:2023-01-20 16:20:35 公開日:2023-01-18
# 量子セルオートマトンにおけるスクランブル

Scrambling in quantum cellular automata ( http://arxiv.org/abs/2301.07722v1 )

ライセンス: Link先を確認
Brian Kent, Sarah Racz, Sanjit Shashi(参考訳) スクランブルは多体系上の量子情報の非局在化であり、全ての量子カオス力学の基礎となる。 離散量子セルオートマトンを古典的シミュレート可能なスクランブルの玩具モデルとして採用する。 これらのオートマトンがエルゴード性、すなわち量子スカーリングを損なうのを観察する。 また、スクランブルの時間スケールは局所ヒルベルト空間次元と一致し、特定の組合せパターンに従うことが分かる。 次に,半古典的カオス系がよりエルゴード的であることを証明し,半古典的限界においてスカーリングがほとんど抑制されることを示す。

Scrambling is the delocalization of quantum information over a many-body system and underlies all quantum-chaotic dynamics. We employ discrete quantum cellular automata as classically simulable toy models of scrambling. We observe that these automata break ergodicity, i.e. they exhibit quantum scarring. We also find that the time-scale of scrambling rises with the local Hilbert-space dimension and obeys a specific combinatorial pattern. We then show that scarring is mostly suppressed in a semiclassical limit, demonstrating that semiclassical-chaotic systems are more ergodic.
翻訳日:2023-01-20 16:20:16 公開日:2023-01-18
# 動的物質を含む2+1$d格子ゲージ理論における無秩序局在

Disorder-Free Localization in $2+1$D Lattice Gauge Theories with Dynamical Matter ( http://arxiv.org/abs/2301.07720v1 )

ライセンス: Link先を確認
Jesse Osborne, Ian P. McCulloch, Jad C. Halimeh(参考訳) 乱れのない局在 (dfl) は、1+1ドルの格子ゲージ理論 (lgts) において強いエルゴード性が破られるメカニズムとして確立されており、クエンチェの力学的な物質は、多くのゲージ超選択セクタにまたがる均質な初期状態から始まっている。 それでも、動的物質の存在下での2+1ドルのDFLの運命は、より高次元の多体局在の不安定性に照らして大きな関心を抱いている。 無限行列積状態計算を用いて、DFL は 2+1$D LGT で存続することを示すが、一般的には 1+1$D よりも発音が小さく、初期状態の物質構成に大きく依存する。 適切なマター構成を通じて、1+1$d と 2+1$d のケースを関連付けて比較することができ、私たちの設定における dfl の強みの主な要素はmatter の \textit{propagation directionality} であることを示している。 以上の結果から,DFLは空間次元の増大に伴い弱められるが,初期状態における物質の伝播方向を最小化することにより,後者とは独立にすることができる。

Disorder-free localization (DFL) has been established as a mechanism of strong ergodicity breaking in $1+1$D lattice gauge theories (LGTs) with dynamical matter for quenches starting in homogeneous initial states that span an extensive number of gauge superselection sectors. Nevertheless, the fate of DFL in $2+1$D in the presence of dynamical matter has hitherto remained an open question of great interest in light of the instability of quenched-disorder many-body localization in higher spatial dimensions. Using infinite matrix product state calculations, we show that DFL survives in $2+1$D LGTs, albeit it is generally less pronounced than in $1+1$D, and highly depends on the matter configuration of the initial state. Through suitable matter configurations, we are able to relate and compare the $1+1$D and $2+1$D cases, showing that the main ingredient for the strength of DFL in our setup is the \textit{propagation directionality} of matter. Our results suggest that, generically, DFL is weakened with increasing spatial dimension, although it can be made independent of the latter by minimizing the propagation directionality of matter in the initial state.
翻訳日:2023-01-20 16:20:07 公開日:2023-01-18
# 冷間原子量子シミュレータにおける閉じ込め下でのエルゴディディティ破壊

Ergodicity Breaking Under Confinement in Cold-Atom Quantum Simulators ( http://arxiv.org/abs/2301.07717v1 )

ライセンス: Link先を確認
Jean-Yves Desaules, Guo-Xian Su, Ian P. McCulloch, Bing Yang, Zlatko Papi\'c, Jad C. Halimeh(参考訳) 合成量子物質デバイスにおけるゲージ理論の量子シミュレーションは、過去10年間に多くの牽引力を獲得し、様々な異種量子多体現象の観測が可能となった。 本研究では、スピン=1/2$量子リンクの1+1$D量子電磁力学のトポロジカルな$\theta$-angleによる定式化について考察する。 このシステムを、質量とスタガーの磁化項を持つPXPモデルに正確にマッピングすることで、閉じ込めと量子多体散乱とヒルベルト空間の断片化というエルゴーディック的パラダイムの間の興味深い相互作用を示す。 このモデルのリッチな動的位相図をマッピングし、質量$\mu$の小さな値でエルゴード相を発見し、ポテンシャル$\chi$を精算し、大きな$\mu$に対する創発的な可積分相と、両方のパラメータの大きな値に対する断片化相を求める。 また、後者は多数の効果的なモデルに繋がる共鳴をホストしていることを示す。 本研究は,現在のコールド原子装置で直接アクセス可能な実験プローブを提案する。

The quantum simulation of gauge theories on synthetic quantum matter devices has gained a lot of traction in the last decade, making possible the observation of a range of exotic quantum many-body phenomena. In this work, we consider the spin-$1/2$ quantum link formulation of $1+1$D quantum electrodynamics with a topological $\theta$-angle, which can be used to tune a confinement-deconfinement transition. Exactly mapping this system onto a PXP model with mass and staggered magnetization terms, we show an intriguing interplay between confinement and the ergodicity-breaking paradigms of quantum many-body scarring and Hilbert-space fragmentation. We map out the rich dynamical phase diagram of this model, finding an ergodic phase at small values of the mass $\mu$ and confining potential $\chi$, an emergent integrable phase for large $\mu$, and a fragmented phase for large values of both parameters. We also show that the latter hosts resonances that lead to a vast array of effective models. We propose experimental probes of our findings, which can be directly accessed in current cold-atom setups.
翻訳日:2023-01-20 16:19:46 公開日:2023-01-18
# 一般化政策改善優先順位付けによるサンプル効率の良い多目的学習

Sample-Efficient Multi-Objective Learning via Generalized Policy Improvement Prioritization ( http://arxiv.org/abs/2301.07784v1 )

ライセンス: Link先を確認
Lucas N. Alegre and Ana L. C. Bazzan and Diederik M. Roijers and Ann Now\'e and Bruno C. da Silva(参考訳) 多目的強化学習(MORL)アルゴリズムは、エージェントが報酬関数に対して異なる好み(おそらく矛盾する)を持つ可能性のあるシーケンシャルな決定問題に対処する。 このようなアルゴリズムは、しばしば(特定のエージェントの好みに最適化された)一連のポリシーを学習し、後に新しい好みで問題を解決するために使用できる。 本稿では,一般政策改善法(gpi)を用いて,サンプル効率のよい学習法を定式化した優先順位付けスキームを定義する新しいアルゴリズムを提案する。 彼らはエージェントができるアクティブラーニング戦略を実装している (i)各瞬間に訓練すべき最も有望な選好/目的を特定し、所定のモール問題をより迅速に解くこと。 (2)新しいDynaスタイルのMORL手法を用いて,特定のエージェント選好のポリシーを学ぶ際に,どの経験が最も重要かを特定する。 我々のアルゴリズムは、有限ステップで常に最適解に収束することが保証されており、エージェントが制限され、潜在的に最適でないポリシーを特定できるならば、$\epsilon$-optimal Solution(有界な$\epsilon$)が保証される。 また,本手法が学習中の部分解の品質を単調に改善することを示す。 最後に,本手法が学習を通じて計算した部分解から得られる最大効用損失(最適解に関して)を特徴付ける境界を導入する。 実験により,本手法は離散状態空間と連続状態空間の両方において,多目的課題に対する挑戦において最先端のモールアルゴリズムを上回ることを示した。

Multi-objective reinforcement learning (MORL) algorithms tackle sequential decision problems where agents may have different preferences over (possibly conflicting) reward functions. Such algorithms often learn a set of policies (each optimized for a particular agent preference) that can later be used to solve problems with novel preferences. We introduce a novel algorithm that uses Generalized Policy Improvement (GPI) to define principled, formally-derived prioritization schemes that improve sample-efficient learning. They implement active-learning strategies by which the agent can (i) identify the most promising preferences/objectives to train on at each moment, to more rapidly solve a given MORL problem; and (ii) identify which previous experiences are most relevant when learning a policy for a particular agent preference, via a novel Dyna-style MORL method. We prove our algorithm is guaranteed to always converge to an optimal solution in a finite number of steps, or an $\epsilon$-optimal solution (for a bounded $\epsilon$) if the agent is limited and can only identify possibly sub-optimal policies. We also prove that our method monotonically improves the quality of its partial solutions while learning. Finally, we introduce a bound that characterizes the maximum utility loss (with respect to the optimal solution) incurred by the partial solutions computed by our method throughout learning. We empirically show that our method outperforms state-of-the-art MORL algorithms in challenging multi-objective tasks, both with discrete and continuous state spaces.
翻訳日:2023-01-20 16:12:27 公開日:2023-01-18
# モデルイントロスペクションによる神経機械翻訳における幻覚の理解と検出

Understanding and Detecting Hallucinations in Neural Machine Translation via Model Introspection ( http://arxiv.org/abs/2301.07779v1 )

ライセンス: Link先を確認
Weijia Xu, Sweta Agrawal, Eleftheria Briakou, Marianna J. Martindale, Marine Carpuat(参考訳) ニューラルシーケンス生成モデルは、ソーステキストとは無関係な出力を生成することで「幻覚」することが知られている。 これらの幻覚は潜在的に有害であるが、どのような状況でどのように影響を和らげるかは不明だ。 本研究は,まず,ソース摂動によって生成される非幻覚出力と対比幻覚生成における生成に対する相対的トークン寄与を分析し,幻覚の内部モデル症状を同定する。 そこで,これらの症状は,手作業による英語とドイツ語の翻訳テストベッド上で,品質評価や大規模事前学習モデルに基づいて,モデルフリーベースラインと強力な分類器の両方に優れる軽量幻覚検出器を設計することにより,自然幻覚の指標となることを示す。

Neural sequence generation models are known to "hallucinate", by producing outputs that are unrelated to the source text. These hallucinations are potentially harmful, yet it remains unclear in what conditions they arise and how to mitigate their impact. In this work, we first identify internal model symptoms of hallucinations by analyzing the relative token contributions to the generation in contrastive hallucinated vs. non-hallucinated outputs generated via source perturbations. We then show that these symptoms are reliable indicators of natural hallucinations, by using them to design a lightweight hallucination detector which outperforms both model-free baselines and strong classifiers based on quality estimation or large pre-trained models on manually annotated English-Chinese and German-English translation test beds.
翻訳日:2023-01-20 16:11:58 公開日:2023-01-18
# 典型的な量子エンタングルメントの対称性分類

Symmetry Classification of Typical Quantum Entanglement ( http://arxiv.org/abs/2301.07778v1 )

ライセンス: Link先を確認
Yuhan Liu, Jonah Kudler-Flam, Kohei Kawabata(参考訳) 典型的な量子状態の絡み合いエントロピー、またはページ曲線は、量子多体系や量子重力において重要な役割を果たす。 しかし、対称性の役割はほとんど不明である。 ここでは、時間反転、電荷共役、カイラル変換の10倍の基本対称性クラスに基づいて、自由フェルミオンの典型的な量子エンタングルメントの分類、あるいは同値な対称性を持つ二次sachdev-ye-kitaevモデルを確立する。 ランダム行列理論の解析的および数値計算により、平均エンタングルメントエントロピーに対する体積法則の寄与はロバストであり、対称性の影響を受けていないことを示す。 逆に、絡み合いのエントロピーの平均と分散の定数項が、各対称性クラスに固有の10倍の普遍値をもたらすことを明らかにする。 これらの定数項は、時間反転対称性による絡み合いスペクトルの大域的スケーリングと、キラルあるいは粒子ホール対称性による絡み合いスペクトルの中心における特異ピークの組み合わせに由来する。

Entanglement entropy of typical quantum states, also known as the Page curve, plays an important role in quantum many-body systems and quantum gravity. However, the role of symmetry has remained largely unclear. Here, we establish the classification of typical quantum entanglement for free fermions, or equivalently the quadratic Sachdev-Ye-Kitaev model with symmetry, on the basis of the tenfold fundamental symmetry classes of time reversal, charge conjugation, and chiral transformation. Through both analytical and numerical calculations of random matrix theory, we show that the volume-law contribution to average entanglement entropy is robust and remains unaffected by symmetry. Conversely, we uncover that the constant terms of the average and variance of entanglement entropy yield tenfold universal values unique to each symmetry class. These constant terms originate from the combination of a global scaling of the entanglement spectrum due to time-reversal symmetry and a singular peak at the center of the entanglement spectrum due to chiral or particle-hole symmetry.
翻訳日:2023-01-20 16:11:42 公開日:2023-01-18
# ポストカーボン・直流炭素捕獲システムと統合されたマルチエネルギーシステムのリアルタイムスケジューリング戦略のための自動強化学習

Automated deep reinforcement learning for real-time scheduling strategy of multi-energy system integrated with post-carbon and direct-air carbon captured system ( http://arxiv.org/abs/2301.07768v1 )

ライセンス: Link先を確認
Tobi Michael Alabi, Nathan P. Lawrence, Lin Lu, Zaiyue Yang, R. Bhushan Gopaluni(参考訳) 二酸化炭素除去技術 (CDRT) を応用した炭素回収法は, 深部脱炭酸への代替であり, 顕著なアプローチである。 しかし、大きなエネルギー需要とCDRTが効果的に管理されない場合の経済的影響が主な障害となっている。 そこで本研究では,CDRTと組み合わされたマルチエネルギーシステムのリアルタイムスケジューリングのために,自動ハイパーパラメータ選択機能と統合された新しい深部強化学習エージェント(DRL)を提案する。 ポストカーボンキャプチャシステム(PCCS)とダイレクトエアキャプチャシステム(DACS)はCDRTと考えられている。 様々な可能な構成を、アリゾナ州の地区のリアルタイムマルチエネルギーデータと、製造業者のカタログとパイロットプロジェクト文書からのCDRTパラメータを用いて評価する。 シミュレーションの結果,最大エントロピー特性により最適化ソフトアクタ・レビュー (sac) アルゴリズムがtd3アルゴリズムを上回っていることを確認した。 次に, 最適化したハイパーパラメータ値を用いて, 検討したケーススタディ数と等価な4種類のsacエージェントを訓練し, 評価のためにリアルタイムに配置した。 その結果,提案するdrlエージェントはプロシューマーの多エネルギー需要を満たし,特定の制約を満たさずに経済的にcdrtエネルギー需要をスケジュールできることがわかった。 また、提案するdrlエージェントはルールベースのスケジューリングを23.65%上回った。 しかし,PCCSおよび固体吸着DACSを用いた構成は,高CO2吸蔵率38.54,低CO2放出指標値2.53,廃熱利用によるCDRコスト36.5%削減,選択した吸着剤の高吸収容量化など,最も適した構成と考えられる。 しかし、CDRTの採用は現在の炭素価格で経済的に不可能である。 最後に,CDRTの炭素価格が400-450USD/tonと,政策立案者による税制インセンティブが付与されることを実証した。

The carbon-capturing process with the aid of CO2 removal technology (CDRT) has been recognised as an alternative and a prominent approach to deep decarbonisation. However, the main hindrance is the enormous energy demand and the economic implication of CDRT if not effectively managed. Hence, a novel deep reinforcement learning agent (DRL), integrated with an automated hyperparameter selection feature, is proposed in this study for the real-time scheduling of a multi-energy system coupled with CDRT. Post-carbon capture systems (PCCS) and direct-air capture systems (DACS) are considered CDRT. Various possible configurations are evaluated using real-time multi-energy data of a district in Arizona and CDRT parameters from manufacturers' catalogues and pilot project documentation. The simulation results validate that an optimised soft-actor critic (SAC) algorithm outperformed the TD3 algorithm due to its maximum entropy feature. We then trained four (4) SAC agents, equivalent to the number of considered case studies, using optimised hyperparameter values and deployed them in real time for evaluation. The results show that the proposed DRL agent can meet the prosumers' multi-energy demand and schedule the CDRT energy demand economically without specified constraints violation. Also, the proposed DRL agent outperformed rule-based scheduling by 23.65%. However, the configuration with PCCS and solid-sorbent DACS is considered the most suitable configuration with a high CO2 captured-released ratio of 38.54, low CO2 released indicator value of 2.53, and a 36.5% reduction in CDR cost due to waste heat utilisation and high absorption capacity of the selected sorbent. However, the adoption of CDRT is not economically viable at the current carbon price. Finally, we showed that CDRT would be attractive at a carbon price of 400-450USD/ton with the provision of tax incentives by the policymakers.
翻訳日:2023-01-20 16:11:25 公開日:2023-01-18
# 人間の意思決定システムにおける観察の逐次処理

Sequential Processing of Observations in Human Decision-Making Systems ( http://arxiv.org/abs/2301.07767v1 )

ライセンス: Link先を確認
Nandan Sriranga, Baocheng Geng, Pramod K. Varshney(参考訳) 本研究では,人間の意思決定者グループに関わる二元仮説テスト問題について考察する。 人間の行動の性質から、人間の意思決定者は、ランダムな時間の長さまで連続的に関心の現象を観察する。 人間は、現象を観測するのをやめるまで、信念モデルを使ってログのような比率を蓄積する。 信念モデルは、人間の意思決定者の異なる時点における観察に対する認識を特徴づけるために用いられる。 グローバルな意思決定者が機械であるときのバイナリ仮説テストの問題に対するグローバルな意思決定者は、人間の決定のために異なる重み付けの椅子・バルシュニールールを使用して人間の決定を融合させ、その重みは人間がそれぞれの決定に到達するために使った観測数によって決定される。

In this work, we consider a binary hypothesis testing problem involving a group of human decision-makers. Due to the nature of human behavior, each human decision-maker observes the phenomenon of interest sequentially up to a random length of time. The humans use a belief model to accumulate the log-likelihood ratios until they cease observing the phenomenon. The belief model is used to characterize the perception of the human decision-maker towards observations at different instants of time, i.e some decision-makers may assign greater importance to observations that were observed earlier, rather than later and vice-versa. The global decision-maker for a binary hypothesis testing problem when the global decision-maker is a machine, fuses the human decisions using the Chair-Varshney rule with different weights for the human decisions, where the weights are determined by the number of observations that were used by the humans to arrive at their respective decisions.
翻訳日:2023-01-20 16:10:53 公開日:2023-01-18
# 位相次数の三分割における絡み合い:図式的アプローチ

Entanglement in tripartitions of topological orders: a diagrammatic approach ( http://arxiv.org/abs/2301.07763v1 )

ライセンス: Link先を確認
Ramanjit Sohal, Shinsei Ryu(参考訳) 近年の研究では、三成分の絡み合いの測度は、二成分の絡み合いが敏感でない位相的に順序付けられた位相を特徴付けるデータを探索できることが示されている。 これらの観測に動機づけられ、エノン図式によるボソニック位相秩序の三分法において、反射エントロピーと対数ネガティビティ、混合状態絡み合い測度を計算した。 3つの部分領域が三分節と四分節で交わる三分節を考える。 前者の場合、アベリア順序と非アベリア順序を区別する負性への寄与を見出す一方、後者では、反射エントロピーに対する明確な普遍的な寄与を見出す。 最後に、反射エントロピーと反射エントロピーの差として定義されたマルコフギャップが消滅しないようなエノン三量体を挿入する構成に対して、負のエントロピーと反射エントロピーが$F$-シンボルに敏感であることを示す。

Recent studies have demonstrated that measures of tripartite entanglement can probe data characterizing topologically ordered phases to which bipartite entanglement is insensitive. Motivated by these observations, we compute the reflected entropy and logarithmic negativity, a mixed state entanglement measure, in tripartitions of bosonic topological orders using the anyon diagrammatic formalism. We consider tripartitions in which three subregions meet at trijunctions and tetrajunctions. In the former case, we find a contribution to the negativity which distinguishes between Abelian and non-Abelian order while in the latter, we find a distinct universal contribution to the reflected entropy. Finally, we demonstrate that the negativity and reflected entropy are sensitive to the $F$-symbols for configurations in which we insert an anyon trimer, for which the Markov gap, defined as the difference between the reflected entropy and mutual information, is also found to be non-vanishing.
翻訳日:2023-01-20 16:10:39 公開日:2023-01-18
# 量子エミッタの同心性ナノリングの光学特性

Optical Properties of Concentric Nanorings of Quantum Emitters ( http://arxiv.org/abs/2301.07756v1 )

ライセンス: Link先を確認
Verena Scheil, Raphael Holzinger, Maria Moreno-Cardoner, Helmut Ritsch(参考訳) サブ波長空間の双極子結合量子エミッタのリングは、1次元の鎖やランダムなエミッタの集まりと比較して、異常な光学特性を持つ。 強い3次元サブ波長の磁場閉じ込めを特徴とする光共振器と同様、極端にラジアントな集団固有モードが出現する。 自然光収穫複合体によく見られる構造に動機づけられ、これらの研究を同心多環ジオメトリーの積み重ねに拡張した。 二重環は、単一環の場合と比較してより広いエネルギーバンド上で、より暗く、より密集した集団励起状態を構築することができると予測する。 これにより弱磁場吸収と低損失励起エネルギー輸送が促進される。 自然のlh2アンテナに現れる3つの環の特定の形状について、下部の二重環構造と高エネルギーの青色シフト単環との結合は、分子の実際のサイズにとって非常に重要な値であることを示す。 これにより、3つの環全てから重要な寄与を持つ集合励起が、効率的で高速な結合間輸送のための重要な要素となる。 このような形状はサブ波長の弱磁場アンテナの設計に有用であることが証明される。

A ring of sub-wavelength spaced dipole-coupled quantum emitters features extraordinary optical properties when compared to a one-dimensional chain or a random collection of emitters. One finds the emergence of extremely subradiant collective eigenmodes similar to an optical resonator, which feature strong 3D sub-wavelength field confinement. Motivated by structures commonly appearing in natural light harvesting complexes, we extend these studies to stacked concentric multi-ring geometries. We predict that double rings allow to engineer significantly darker and better confined collective excitation states over a broader energy band compared to the single ring case. These potentially enhance weak field absorption and low loss excitation energy transport. For the specific geometry of the three rings appearing in the natural LH2 antenna we show that the coupling between the lower double ring structure and the higher energy blue shifted single ring is very close to a critical value for the actual size of the molecule. This creates collective excitations with significant contributions from all three rings as a vital ingredient for efficient and fast coherent inter-ring transport. Such a geometry thus should prove useful for the design of sub-wavelength weak field antennas.
翻訳日:2023-01-20 16:10:19 公開日:2023-01-18
# シリコンにおける単一光子エミッタのパーセル増強

Purcell enhancement of single photon emitters in silicon ( http://arxiv.org/abs/2301.07753v1 )

ライセンス: Link先を確認
Andreas Gritsch, Alexander Ulanowski, Andreas Reiserer(参考訳) 通信光子と結合した個々のスピンは、コヒーレントで効率的なスピン光子インターフェースを大規模に構築できると、分散量子情報処理にユニークな期待を与える。 我々は、エルビウムドーパントをナノフォトニックシリコン共振器に統合して、そのようなインタフェースを実装した。 0.1ghzのスペクトル拡散線幅を持つ個々のエミッタのスピン分解励起を実現する。 共振駆動時に60倍のPurcell拡張で光ラビ振動と単一光子放射を観測する。 我々の結果は量子ネットワークのための有望な新しいプラットフォームを確立する。

Individual spins that are coupled to telecommunication photons offer unique promise for distributed quantum information processing once a coherent and efficient spin-photon interface can be fabricated at scale. We implement such an interface by integrating erbium dopants into a nanophotonic silicon resonator. We achieve spin-resolved excitation of individual emitters with < 0.1 GHz spectral diffusion linewidth. Upon resonant driving, we observe optical Rabi oscillations and single-photon emission with a 60-fold Purcell enhancement. Our results establish a promising new platform for quantum networks.
翻訳日:2023-01-20 16:09:59 公開日:2023-01-18
# 量子力学の時空スケーリング限界におけるトポロジー

Topology in the space-time scaling limit of quantum dynamics ( http://arxiv.org/abs/2301.07752v1 )

ライセンス: Link先を確認
Lorenzo Rossi, Jan Carl Budich, Fabrizio Dolcini(参考訳) 本研究では,量子クエンチ力学の時空スケーリング限界におけるトポロジーの役割について検討する。 そこで,局所ユニタリ変換に依拠する標準的な位相的特徴付けが不明確になる一方で,時間依存ベリー相においてトポロジーの新たな動的概念が自然にどのように現れるかを示す。 具体的には, 局所的に見えない一定磁束の存在は, トポロジカルに定量化された台地が, 焼成ライス・ミールモデルの時空スケーリング限界を特徴づけるベリー相の動的階段挙動によって明らかにされる。 これらのベリー相のジャンプは、直流電流演算子のバンド間要素と関連していることも示されている。 有限系の予測現象を観測するための実験プラットフォームについて概説する。

We investigate the role of topology in the space-time scaling limit of quantum quench dynamics, where both time and system size tend to infinity at a constant ratio. There, while the standard topological characterization relying on local unitary transformations becomes ill defined, we show how a novel dynamical notion of topology naturally arises in the time-dependent Berry phase. Specifically, we find that the presence of a locally invisible constant magnetic flux is revealed by a dynamical staircase behavior of the Berry phase, whose topologically quantized plateaus characterize the space-time scaling limit of a quenched Rice-Mele model. These jumps in the Berry phase are also shown to be related to the interband elements of the DC current operator. We outline possible experimental platforms for observing the predicted phenomena in finite systems.
翻訳日:2023-01-20 16:09:53 公開日:2023-01-18
# CycleGANを使って機械学習のためのリアルなSTEM画像を生成する

Using CycleGANs to Generate Realistic STEM Images for Machine Learning ( http://arxiv.org/abs/2301.07743v1 )

ライセンス: Link先を確認
Abid Khan, Chia-Hao Lee, Pinshane Y. Huang, and Bryan K. Clark(参考訳) 電子顕微鏡における自動化と機械学習(ML)の台頭は、大量の原子分解能データの自律的な収集と処理を可能にすることによって、材料研究に革命をもたらす可能性がある。 しかし、大きな課題は、実験条件の異なる大規模データセットに確実かつ迅速に一般化できるMLモデルを開発することである。 この課題を克服するために, 実験データから学習した現実的で複雑な空間周波数情報を用いてシミュレーションデータを補完する新しい相互空間判別器(cyclegan)を開発した。 これにより、CycleGANは実際の実験データからほぼ区別できない画像を生成すると同時に、さらなるMLアプリケーションのためのラベルを提供することができる。 本手法は,450万原子の大規模データセットにおいて単一原子欠陥を同定するためにfcn(完全畳み込みネットワーク)を訓練し,収差補正走査透過電子顕微鏡(stem)で自動取得により収集した。 本手法は, レンズ収差, ノイズ, 局所汚染などの動的に変化する実験変数を手動で最小限の介入で調整できる高度適応性FCNを実現する。 これは、顕微鏡ビッグデータを活用するための完全に自律的なアプローチを構築するための重要なステップである。

The rise of automation and machine learning (ML) in electron microscopy has the potential to revolutionize materials research by enabling the autonomous collection and processing of vast amounts of atomic resolution data. However, a major challenge is developing ML models that can reliably and rapidly generalize to large data sets with varying experimental conditions. To overcome this challenge, we develop a cycle generative adversarial network (CycleGAN) that introduces a novel reciprocal space discriminator to augment simulated data with realistic, complex spatial frequency information learned from experimental data. This enables the CycleGAN to generate nearly indistinguishable images from real experimental data, while also providing labels for further ML applications. We demonstrate the effectiveness of this approach by training a fully convolutional network (FCN) to identify single atom defects in a large data set of 4.5 million atoms, which we collected using automated acquisition in an aberration-corrected scanning transmission electron microscope (STEM). Our approach yields highly adaptable FCNs that can adjust to dynamically changing experimental variables, such as lens aberrations, noise, and local contamination, with minimal manual intervention. This represents a significant step towards building fully autonomous approaches for harnessing microscopy big data.
翻訳日:2023-01-20 16:09:38 公開日:2023-01-18
# 位相絶縁体-グラフェンヘテロ構造における電磁結合と輸送

Electromagnetic coupling and transport in a topological insulator-graphene hetero-structure ( http://arxiv.org/abs/2301.07813v1 )

ライセンス: Link先を確認
Daniel A. Bonilla, Jorge David Casta\~no-Yepes, A. Mart\'in-Ruiz, Enrique Mu\~noz(参考訳) 異なる材料からなるヘテロ構造間の電磁結合は、新しい現象の発見と新しいデバイスへの潜在的な応用の両方の観点から非常に興味深い。 本研究では、トポロジカル絶縁体(TI)スラブと単一グラフェン層からなるヘテロ構造の電磁結合について検討し、後者はイオン化不純物の希薄な濃度を示す。 我々は、TIの磁化分極性(MEP)のトポロジカル効果と、その相対誘電率が、低温でも有限温度でもグラフェンの電気伝導率に及ぼす影響を調べた。

The electromagnetic coupling between hetero-structures made of different materials is of great interest, both from the perspective of discovering new phenomena, as well as for its potential applications in novel devices. In this work, we study the electromagnetic coupling of a hetero-structure made of a topological insulator (TI) slab and a single graphene layer, where the later presents a diluted concentration of ionized impurities. We explore the topological effects of the magneto-electric polarizability (MEP) of the TI, as well as its relative dielectric permittivity on the electrical conductivity in graphene at low but finite temperatures.
翻訳日:2023-01-20 16:03:55 公開日:2023-01-18
# ヒト視覚セグメンテーションにおける不確かさの測定

Measuring uncertainty in human visual segmentation ( http://arxiv.org/abs/2301.07807v1 )

ライセンス: Link先を確認
Jonathan Vacher, Claire Launay, Pascal Mamassian, Ruben Coen-Cagli(参考訳) 視覚刺激を特徴群と視覚対象群に分割することは視覚機能の中心である。 古典的な心理学的手法は人間の知覚的セグメンテーションの多くの規則を明らかにするのに役立ち、機械学習の最近の進歩は成功したアルゴリズムを生み出した。 しかし、知覚的セグメンテーションマップを計測し、モデルを定量的に比較するためのよく制御されたパラダイムが欠如しているため、人間のセグメンテーションの計算論理はいまだに不明である。 本稿では,画像が与えられた場合,複数の画素に基づく同値な判定を計測し,下層のセグメンテーションマップをモデルベースで再構成する手法を提案する。 再建はいくつかの実験的な操作に対して堅牢であり、個々の参加者の多様性を捉えている。 自然画像と複合テクスチャのヒトセグメンテーションにおけるアプローチの有効性を実証する。 画像の不確実性は測定された人間の変動に影響を及ぼし、被験者が異なる視覚的特徴の量に影響を及ぼすことを示す。 任意の推定セグメンテーションアルゴリズムを挿入して再構成を行うことができるため、我々のパラダイムは知覚理論の定量的テストとセグメンテーションアルゴリズムの新しいベンチマークを提供する。

Segmenting visual stimuli into distinct groups of features and visual objects is central to visual function. Classical psychophysical methods have helped uncover many rules of human perceptual segmentation, and recent progress in machine learning has produced successful algorithms. Yet, the computational logic of human segmentation remains unclear, partially because we lack well-controlled paradigms to measure perceptual segmentation maps and compare models quantitatively. Here we propose a new, integrated approach: given an image, we measure multiple pixel-based same-different judgments and perform model--based reconstruction of the underlying segmentation map. The reconstruction is robust to several experimental manipulations and captures the variability of individual participants. We demonstrate the validity of the approach on human segmentation of natural images and composite textures. We show that image uncertainty affects measured human variability, and it influences how participants weigh different visual features. Because any putative segmentation algorithm can be inserted to perform the reconstruction, our paradigm affords quantitative tests of theories of perception as well as new benchmarks for segmentation algorithms.
翻訳日:2023-01-20 16:03:42 公開日:2023-01-18
# 連合型自動分化

Federated Automatic Differentiation ( http://arxiv.org/abs/2301.07806v1 )

ライセンス: Link先を確認
Keith Rush, Zachary Charles, and Zachary Garrett(参考訳) フェデレートラーニング(FL)は、データプライバシを保持しながら、中央サーバのオーケストレーションの下で異種クライアント間で学習するための一般的なフレームワークである。 FLメソッドは、損失関数の勾配を純粋に局所的に(例えば、各クライアントで完全に、またはサーバで完全に)計算することが多い。 連合型自動微分(FAD)フレームワークを提案する。 1)クライアントとサーバ間の通信だけでなく、クライアントとサーバの計算を含む関数の計算デリバティブを可能にする。 2) 既存の連合技術と互換性のある運用を行う。 言い換えれば、FADは通信境界を越えてデリバティブを計算する。 従来のADと類似して、FADは様々な蓄積モードを用いて実装され、異なる計算通信トレードオフとシステム要件が導入された。 さらに,これらのFADの様々なモードの下で,連合計算の幅広いクラスが閉じられていることを示し,特に,プライバシ保存プリミティブを用いて元の計算を実装できれば,その微分はこれらのプリミティブのみを用いて計算できることを示す。 次に、FADを用いてアルゴリズム自体のコンポーネントを動的に学習するアルゴリズムを作成する方法を示す。 特に、FedAvgスタイルのアルゴリズムは、FADを使用してサーバ最適化ステップを自動調整したり、FADを用いてクライアント間の重み付け平均計算の重み付けスキームを学習することで、性能を著しく向上させることができることを示す。

Federated learning (FL) is a general framework for learning across heterogeneous clients while preserving data privacy, under the orchestration of a central server. FL methods often compute gradients of loss functions purely locally (ie. entirely at each client, or entirely at the server), typically using automatic differentiation (AD) techniques. We propose a federated automatic differentiation (FAD) framework that 1) enables computing derivatives of functions involving client and server computation as well as communication between them and 2) operates in a manner compatible with existing federated technology. In other words, FAD computes derivatives across communication boundaries. We show, in analogy with traditional AD, that FAD may be implemented using various accumulation modes, which introduce distinct computation-communication trade-offs and systems requirements. Further, we show that a broad class of federated computations is closed under these various modes of FAD, implying in particular that if the original computation can be implemented using privacy-preserving primitives, its derivative may be computed using only these same primitives. We then show how FAD can be used to create algorithms that dynamically learn components of the algorithm itself. In particular, we show that FedAvg-style algorithms can exhibit significantly improved performance by using FAD to adjust the server optimization step automatically, or by using FAD to learn weighting schemes for computing weighted averages across clients.
翻訳日:2023-01-20 16:03:22 公開日:2023-01-18
# 変圧器型カメラリンクモデルと時空間情報を用いたマルチターゲットマルチカメラ車両追跡

Multi-target multi-camera vehicle tracking using transformer-based camera link model and spatial-temporal information ( http://arxiv.org/abs/2301.07805v1 )

ライセンス: Link先を確認
Hsiang-Wei Huang, Jenq-Neng Hwang(参考訳) 車両のマルチターゲット・マルチカメラ・トラッキング(mtmct)、すなわち複数のカメラで車両を追跡することは、スマートシティとインテリジェントな交通システムを開発する上で重要な応用である。 車両のMTMCTの主な課題は、同一車両のクラス内変動と、異なる車両間のクラス間類似性、そして、大きな検索空間の下で異なるカメラ間で同じ車両を正確に関連付ける方法である。 MTMCTの従来の方法は、通常、クロスカメラアソシエーションを行うために軌道の階層的クラスタリングを使用する。 しかし、探索空間は巨大であり、空間的・時間的情報を考慮に入れない。 本稿では,クロスカメラ追跡を行うために,空間的および時間的フィルタリングを用いたトランスベースカメラリンクモデルを提案する。 nvidia cityflow v2データセットで73.68%のidf1を達成し、マルチターゲットマルチカメラトラッキングにおけるカメラリンクモデルの有効性を示した。

Multi-target multi-camera tracking (MTMCT) of vehicles, i.e. tracking vehicles across multiple cameras, is a crucial application for the development of smart city and intelligent traffic system. The main challenges of MTMCT of vehicles include the intra-class variability of the same vehicle and inter-class similarity between different vehicles and how to associate the same vehicle accurately across different cameras under large search space. Previous methods for MTMCT usually use hierarchical clustering of trajectories to conduct cross camera association. However, the search space can be large and does not take spatial and temporal information into consideration. In this paper, we proposed a transformer-based camera link model with spatial and temporal filtering to conduct cross camera tracking. Achieving 73.68% IDF1 on the Nvidia Cityflow V2 dataset test set, showing the effectiveness of our camera link model on multi-target multi-camera tracking.
翻訳日:2023-01-20 16:02:56 公開日:2023-01-18
# 弱磁場を有する超電導量子ビットにおける1/f$フラックスノイズの進化

Evolution of $1/f$ Flux Noise in Superconducting Qubits with Weak Magnetic Fields ( http://arxiv.org/abs/2301.07804v1 )

ライセンス: Link先を確認
David A. Rower, Lamia Ateshian, Lauren H. Li, Max Hays, Dolev Bluvstein, Leon Ding, Bharath Kannan, Aziza Almanakly, Jochen Braum\"uller, David K. Kim, Alexander Melville, Bethany M. Niedzielski, Mollie E. Schwartz, Jonilyn L. Yoder, Terry P. Orlando, Joel I-Jan Wang, Simon Gustavsson, Jeffrey A. Grover, Kyle Serniak, Riccardo Comin, William D. Oliver(参考訳) 超伝導回路における1/f$の磁束ノイズの微視的発生は、実験と理論の広範な研究にもかかわらず、数十年間、公然と議論されてきた。 量子情報のための超伝導装置の最近の進歩は、量子ビットデコヒーレンスの源を緩和する必要性を強調し、基礎となるノイズメカニズムの理解に新たな関心を喚起している。 表面スピンへのフラックスノイズに起因するコンセンサスが現れたが、そのアイデンティティと相互作用機構は未だ不明であり、さらなる研究が進められている。 ここでは、静電容量の強い磁束量子ビット(表面スピンのゼーマン分割がデバイス温度以下にある)に弱い面内磁場を印加し、磁束-ノイズ制限量子ビットの強調を調べ、1/f$ノイズの背後にある力学に光を当てる未熟なトレンドを明らかにする。 特に、B=100~\text{G}$までの場におけるスピン-エチョ(ラムゼー)純粋退化時間の拡張(抑圧)を観察する。 直接雑音分光法により,1/f$から約ローレンツ周波数依存性の10Hz以下への遷移と,磁場の増加に伴う1MHz以上の雑音の低減が観察される。 これらの傾向は磁場を伴うスピンクラスターサイズの増加と定性的に一致していることが示唆された。 これらの結果は超伝導回路における1/f$の磁束ノイズの完全な微視的理論を知らせる助けとなる。

The microscopic origin of $1/f$ magnetic flux noise in superconducting circuits has remained an open question for several decades despite extensive experimental and theoretical investigation. Recent progress in superconducting devices for quantum information has highlighted the need to mitigate sources of qubit decoherence, driving a renewed interest in understanding the underlying noise mechanism(s). Though a consensus has emerged attributing flux noise to surface spins, their identity and interaction mechanisms remain unclear, prompting further study. Here we apply weak in-plane magnetic fields to a capacitively-shunted flux qubit (where the Zeeman splitting of surface spins lies below the device temperature) and study the flux-noise-limited qubit dephasing, revealing previously unexplored trends that may shed light on the dynamics behind the emergent $1/f$ noise. Notably, we observe an enhancement (suppression) of the spin-echo (Ramsey) pure dephasing time in fields up to $B=100~\text{G}$. With direct noise spectroscopy, we further observe a transition from a $1/f$ to approximately Lorentzian frequency dependence below 10 Hz and a reduction of the noise above 1 MHz with increasing magnetic field. We suggest that these trends are qualitatively consistent with an increase of spin cluster sizes with magnetic field. These results should help to inform a complete microscopic theory of $1/f$ flux noise in superconducting circuits.
翻訳日:2023-01-20 16:02:39 公開日:2023-01-18
# 相対性理論の量子原理」は完全か?

Is "Quantum principle of relativity'' complete? ( http://arxiv.org/abs/2301.07802v1 )

ライセンス: Link先を確認
Ryszard Horodecki(参考訳) Dragan and Ekert in the paper New (英語) J. Phys textbf{22} 033038 (2021) はガリレオの相対性理論に基づく '`quantum principle of relativity' (QPR)' を提示し、これは超光度$G_S$とサブルミナル$G_s$の両方の観測者のファミリーを包含し、それらが同じ基盤で検討されていると主張している。 ''. ここでは,自然の普遍定数 (universal constants of nature: planck's constant $\hslash$ and speed of light $c$) の下でのハイゼンベルクの基本的な物理理論モデルの分類の文脈において,qprについて論じる。 特に、上述の結論は、$G_S$ と $G_s$ の両方の枝を連結する数学的コヒーレントな形式主義が存在しないという意味で、超光分枝と準光分枝の両方が分離可能であるとして過大評価される。

Dragan and Ekert in the paper New. J. Phys. \textbf{22} 033038 (2021) presented ``quantum principle of relativity'' (QPR) based on Galileo's principle of relativity, which involves both superluminal $G_S$ and subluminal $G_s$ families of observers and argue that then they are considered on the same footing it ``implies the emergence of non-deterministic dynamics, together with complex probability amplitudes and multiple trajectories.''. Here I discuss QPR in the context of Heisenberg's classification of the fundamental physical theoretical models under the role universal constants of nature: Planck's constant $\hslash$ and speed of light $c$. In particular I point out that the above conclusion is overestimated as both the superluminal and subluminal branches are separable in the sense that there is no mathematical coherent formalism that connect both branches of $G_S$ and $G_s$ together.
翻訳日:2023-01-20 16:02:14 公開日:2023-01-18
# 部分反射境界の存在下でのスカラー粒子の量子ブラウン運動

Quantum Brownian motion of a scalar particle in the presence of a partially reflecting boundary ( http://arxiv.org/abs/2301.07800v1 )

ライセンス: Link先を確認
C. C. H. Ribeiro and V. A. De Lorenci(参考訳) 1+1次元モデルにおいて, ドリュード様の感受性を示す媒体の存在下での実マスレススカラー場の第2の量子化について検討した。 この場に印字されたばらつきのないスカラー荷電粒子の真空揺らぎの変化は、従来の処理で現れるばらつきの起源が理想的な境界条件の仮定であることを解明する。 以上の結果から, 分散媒体内のフィールドモードの有効質量に起因する分散曲線の振動が確認された。 また, ミラー上におけるフィールドモードの不完全な反射に起因する現象である完全ミラー限界と比較して, 粒子に対する媒体の影響が遅れることが判明した。 本研究はスカラー場に焦点をあてるが,電磁相互作用に基づくモデルの理解には有用である。

The second quantization of a real massless scalar field in the presence of a material medium described by a Drude-like susceptibility is here examined in a 1+1 dimensional model. The modified vacuum fluctuations of this field imprint divergence-free velocity dispersions on a scalar-charged particle, thus elucidating that the origin of divergences that appear in previous treatments is the assumption of idealized boundary conditions. Among the findings there is an oscillation on the dispersion curves caused by the effective mass of the field modes inside the dispersive medium. Additionally, it is found that the effects of the medium on the particle are delayed when compared to the perfect mirror limit, a phenomenon attributed to the imperfect reflection of field modes on the mirror. Although the study focus on a scalar field, the findings are valuable for understanding models based on electromagnetic interaction.
翻訳日:2023-01-20 16:01:37 公開日:2023-01-18
# 生涯学習システム評価のためのドメインに依存しないアプローチ

A Domain-Agnostic Approach for Characterization of Lifelong Learning Systems ( http://arxiv.org/abs/2301.07799v1 )

ライセンス: Link先を確認
Megan M. Baker, Alexander New, Mario Aguilar-Simon, Ziad Al-Halah, S\'ebastien M. R. Arnold, Ese Ben-Iwhiwhu, Andrew P. Brna, Ethan Brooks, Ryan C. Brown, Zachary Daniels, Anurag Daram, Fabien Delattre, Ryan Dellana, Eric Eaton, Haotian Fu, Kristen Grauman, Jesse Hostetler, Shariq Iqbal, Cassandra Kent, Nicholas Ketz, Soheil Kolouri, George Konidaris, Dhireesha Kudithipudi, Erik Learned-Miller, Seungwon Lee, Michael L. Littman, Sandeep Madireddy, Jorge A. Mendez, Eric Q. Nguyen, Christine D. Piatko, Praveen K. Pilly, Aswin Raghavan, Abrar Rahman, Santhosh Kumar Ramakrishnan, Neale Ratzlaff, Andrea Soltoggio, Peter Stone, Indranil Sur, Zhipeng Tang, Saket Tiwari, Kyle Vedder, Felix Wang, Zifan Xu, Angel Yanguas-Gil, Harel Yedidsion, Shangqun Yu, Gautam K. Vallabha(参考訳) 近年の機械学習技術の進歩にもかかわらず、最先端のシステムは"現実世界"のイベントに対して堅牢性に欠けており、デプロイされたシステムで遭遇する入力分布やタスクは、元のトレーニングコンテキストに制限されず、デプロイ中に新しいディストリビューションやタスクに適応する必要がある。 この重要なギャップは、"生涯学習"システムの開発を通じて対処できるかもしれない。 1)継続的学習 2)移転及び適応、及び 3) スケーラビリティ。 残念なことに、これらの能力を改善する努力は、通常、個々の能力がシステムの他の側面に与える影響を考慮せずに、独立して評価される研究領域として扱われる。 代わりに、一連のメトリクスと評価フレームワークを使用して、特定のドメインやシステム技術に依存しない原則的な方法で生涯学習を評価する、全体論的アプローチを提案する。 5つのケーススタディを通して、このメトリクススイートが、多様な複雑な生涯学習システムの開発に役立てることができることを示す。 提案する一連のメトリクスは,生涯学習システム開発におけるパフォーマンストレードオフを定量化する。安定性と可塑性のジレンマが広く議論されていることと,サンプルの効率的かつロバストな学習との間に新たに提案された関係性について紹介する。 さらに,生涯学習システムの継続的な発展を指導し,今後の進歩を評価するために,メトリクスの定式化と利用を推奨する。

Despite the advancement of machine learning techniques in recent years, state-of-the-art systems lack robustness to "real world" events, where the input distributions and tasks encountered by the deployed systems will not be limited to the original training context, and systems will instead need to adapt to novel distributions and tasks while deployed. This critical gap may be addressed through the development of "Lifelong Learning" systems that are capable of 1) Continuous Learning, 2) Transfer and Adaptation, and 3) Scalability. Unfortunately, efforts to improve these capabilities are typically treated as distinct areas of research that are assessed independently, without regard to the impact of each separate capability on other aspects of the system. We instead propose a holistic approach, using a suite of metrics and an evaluation framework to assess Lifelong Learning in a principled way that is agnostic to specific domains or system techniques. Through five case studies, we show that this suite of metrics can inform the development of varied and complex Lifelong Learning systems. We highlight how the proposed suite of metrics quantifies performance trade-offs present during Lifelong Learning system development - both the widely discussed Stability-Plasticity dilemma and the newly proposed relationship between Sample Efficient and Robust Learning. Further, we make recommendations for the formulation and use of metrics to guide the continuing development of Lifelong Learning systems and assess their progress in the future.
翻訳日:2023-01-20 16:01:25 公開日:2023-01-18
# HCE:不均一圧縮ニューラルネットワークアンサンブルによる性能と効率の向上

HCE: Improving Performance and Efficiency with Heterogeneously Compressed Neural Network Ensemble ( http://arxiv.org/abs/2301.07794v1 )

ライセンス: Link先を確認
Jingchi Zhang, Huanrui Yang and Hai Li(参考訳) 深層ニューラルネットワーク(DNN)モデルの精度と一般化性をさらに向上させる手段として、アンサンブル学習は、深層学習研究において注目を集めている。 近年のアンサンブルトレーニング手法では,同じモデルアーキテクチャを持つ複数のサブモデルの異なるトレーニングアルゴリズムや設定を探索し,アンサンブルモデルのメモリと計算コストに大きな負担を与える。 一方、ヒューリスティックに誘導された多様性は、大幅なパフォーマンス向上にはつながりません。 モデルアーキテクチャにおける本質的な多様性を探索し,効率的なDNNアンサンブルを構築する手法を提案する。 我々は,pruning と quantization の両者が,小さな精度低下を犠牲にして効率的なモデルアーキテクチャへと導く一方で,決定境界における異なる行動をもたらす,興味深い観察を行う。 そこで本研究では,事前学習したdnnモデルを用いて,pruned および quantized 変種を用いた効率的なアンサンブルを構築するための不均質圧縮アンサンブル (hce) を提案する。 HCEアンサンブルの性能をさらに向上させるために,多様性を考慮した学習目標を提案する。 実験結果から,HCEは従来のDNNアンサンブル訓練法と従来のモデル圧縮法と比較して,効率・精度トレードオフの大幅な改善を実現していることがわかった。

Ensemble learning has gain attention in resent deep learning research as a way to further boost the accuracy and generalizability of deep neural network (DNN) models. Recent ensemble training method explores different training algorithms or settings on multiple sub-models with the same model architecture, which lead to significant burden on memory and computation cost of the ensemble model. Meanwhile, the heurtsically induced diversity may not lead to significant performance gain. We propose a new prespective on exploring the intrinsic diversity within a model architecture to build efficient DNN ensemble. We make an intriguing observation that pruning and quantization, while both leading to efficient model architecture at the cost of small accuracy drop, leads to distinct behavior in the decision boundary. To this end, we propose Heterogeneously Compressed Ensemble (HCE), where we build an efficient ensemble with the pruned and quantized variants from a pretrained DNN model. An diversity-aware training objective is proposed to further boost the performance of the HCE ensemble. Experiemnt result shows that HCE achieves significant improvement in the efficiency-accuracy tradeoff comparing to both traditional DNN ensemble training methods and previous model compression methods.
翻訳日:2023-01-20 16:01:01 公開日:2023-01-18
# 金融ネットワークのための時間的モチーフ:Mercuri、JPMC、Venmoプラットフォームに関する研究

Temporal Motifs for Financial Networks: A Study on Mercari, JPMC, and Venmo Platforms ( http://arxiv.org/abs/2301.07791v1 )

ライセンス: Link先を確認
Penghang Liu, Rupam Acharyya, Robert E. Tillman, Shunya Kimura, Naoki Masuda, Ahmet Erdem Sar{\i}y\"uce(参考訳) 個人間の金融取引のダイナミクスを理解することは、不正検出などの様々な応用において極めて重要である。 金融取引ネットワークの重要な側面は時間性である。 トランザクションの順序と繰り返しは、グラフ構造内で考慮された時に新しい洞察を提供する。 短時間で相互に相互作用するノードの集合として定義される時間的モチーフは、この文脈において有望なツールである。 本研究では,mercariにおける取引,j.p. morgan chaseが生成した合成ネットワークでの支払い,venmoユーザ間の支払いと友情という,3つのユニークな時間的金融ネットワークについて検討した。 本稿では,MercuriおよびJ.P. Morgan Chaseネットワークにおける不正検出問題について考察する。 時間モチーフは,単純なグラフ特徴を考慮した従来の手法よりも優れた性能を示す。 venmoネットワークでは,友人関係の予測,ベンダの識別,時間サイクルの分析という3つの課題について,金融関係と社会関係の相互作用を調査した。 友情の予測では、時間的モチーフはjaccardやadamic-adarといった一般的なヒューリスティックよりも優れた結果をもたらす。 また、精度の高いベンダーを特定し、時間周期のような珍しいモチーフで興味深いパターンを観察します。 この研究から得られた分析、データセット、教訓は、将来の金融取引ネットワークの研究に有用であると考えています。

Understanding the dynamics of financial transactions among people is critically important for various applications such as fraud detection. One important aspect of financial transaction networks is temporality. The order and repetition of transactions can offer new insights when considered within the graph structure. Temporal motifs, defined as a set of nodes that interact with each other in a short time period, are a promising tool in this context. In this work, we study three unique temporal financial networks: transactions in Mercari, an online marketplace, payments in a synthetic network generated by J.P. Morgan Chase, and payments and friendships among Venmo users. We consider the fraud detection problem on the Mercari and J.P. Morgan Chase networks, for which the ground truth is available. We show that temporal motifs offer superior performance than a previous method that considers simple graph features. For the Venmo network, we investigate the interplay between financial and social relations on three tasks: friendship prediction, vendor identification, and analysis of temporal cycles. For friendship prediction, temporal motifs yield better results than general heuristics, such as Jaccard and Adamic-Adar measures. We are also able to identify vendors with high accuracy and observe interesting patterns in rare motifs, like temporal cycles. We believe that the analysis, datasets, and lessons from this work will be beneficial for future research on financial transaction networks.
翻訳日:2023-01-20 16:00:38 公開日:2023-01-18
# 解点の追加による2次元バーガース方程式の物理情報ニューラルネットワークの拡張

Augmenting a Physics-Informed Neural Network for the 2D Burgers Equation by Addition of Solution Data Points ( http://arxiv.org/abs/2301.07824v1 )

ライセンス: Link先を確認
Marlon Sproesser Mathias, Wesley Pereira de Almeida, Marcel Rodrigues de Barros, Jefferson Fialho Coelho, Lucas Palmiro de Freitas, Felipe Marino Moreno, Caio Fabricio Deberaldini Netto, Fabio Gagliardi Cozman, Anna Helena Reali Costa, Eduardo Aoun Tannuri, Edson Satoshi Gomi, Marcelo Dottori(参考訳) 二次元バーガース方程式の解法として物理情報ニューラルネットワーク(PINN)を実装した。 この種のモデルは、以前の解の知識を使わずに訓練することができ、代わりに物理領域の点における系の制御方程式の評価に依存する。 トレーニング中に既知のソリューションでポイントを使用することもできる。 本稿では, 異なる数量の定式評価点と既知の解点で訓練されたピンを比較する。 既知解点と純粋に訓練されたモデルと、支配方程式を用いたモデルを比較して、基礎となる物理学の全体的観測性の改善を観察する。 また,各点数の変化が結果のモデルにどう影響するかについても検討する。 最後に、トレーニング中の支配方程式の追加は、既知の解点数が限られている状況において特に重要となる追加データに頼ることなく、モデル全体の性能を改善する手段を提供するかもしれないと論じる。

We implement a Physics-Informed Neural Network (PINN) for solving the two-dimensional Burgers equations. This type of model can be trained with no previous knowledge of the solution; instead, it relies on evaluating the governing equations of the system in points of the physical domain. It is also possible to use points with a known solution during training. In this paper, we compare PINNs trained with different amounts of governing equation evaluation points and known solution points. Comparing models that were trained purely with known solution points to those that have also used the governing equations, we observe an improvement in the overall observance of the underlying physics in the latter. We also investigate how changing the number of each type of point affects the resulting models differently. Finally, we argue that the addition of the governing equations during training may provide a way to improve the overall performance of the model without relying on additional data, which is especially important for situations where the number of known solution points is limited.
翻訳日:2023-01-20 15:51:44 公開日:2023-01-18
# 逆問題に対する深層学習における解釈因子化としてのSVDの出現

Emergence of the SVD as an interpretable factorization in deep learning for inverse problems ( http://arxiv.org/abs/2301.07820v1 )

ライセンス: Link先を確認
Shashank Sule, Richard G. Spencer and Wojciech Czaja(参考訳) 雑音信号からのパラメータ推定のためのニューラルネットワーク(NN)における重み行列特異値分解(SVD)の出現を示す。 SVDは、NNs \cite{amey2021neural}における解釈可能性に対処する手法であるデクラムブル変換の初期適用の結果、自然に現れる。 雑音パラメータ推定問題のクラスでは、SVDが信号モデルを記憶する手段となる可能性がある。 線形条件と非線形条件の両方から得られた経験的証拠で理論的知見を裏付ける。 また, 意味的発達の数学的理論であるsaxe2019mathematical} とニューラルネットワークの解釈可能性との関係を明らかにした。

We demonstrate the emergence of weight matrix singular value decomposition (SVD) in interpreting neural networks (NNs) for parameter estimation from noisy signals. The SVD appears naturally as a consequence of initial application of a descrambling transform - a recently-developed technique for addressing interpretability in NNs \cite{amey2021neural}. We find that within the class of noisy parameter estimation problems, the SVD may be the means by which networks memorize the signal model. We substantiate our theoretical findings with empirical evidence from both linear and non-linear settings. Our results also illuminate the connections between a mathematical theory of semantic development \cite{saxe2019mathematical} and neural network interpretability.
翻訳日:2023-01-20 15:51:28 公開日:2023-01-18
# 量子センシングとシミュレーションのための可変密度と長コヒーレンスを有するPECVD成長ダイヤモンドの2次元スピン系

Two-dimensional spin systems in PECVD-grown diamond with tunable density and long coherence for enhanced quantum sensing and simulation ( http://arxiv.org/abs/2211.02282v2 )

ライセンス: Link先を確認
Lillian B. Hughes, Zhiran Zhang, Chang Jin, Simon A. Meynell, Bingtian Ye, Weijie Wu, Zilin Wang, Emily J. Davis, Thomas E. Mates, Norman Y. Yao, Kunal Mukherjee, and Ania C. Bleszynski Jayich(参考訳) 波長可変密度と次元の縮小を備えたスピン系は、量子センシングとシミュレーションの多くの進歩を可能にする。 窒素空洞 (NV) センターや置換窒素 (P1) センターのようなダイヤモンドの欠陥は、特に固体プラットフォームを探索する上で有望である。 しかし、コヒーレントな2次元スピンシステムを制御し、密度、深さ閉じ込め、コヒーレンスといった特性を特徴付ける能力は、優れた材料課題である。 プラズマ濃縮化学気相蒸着(PECVD)エピタキシャル成長中にデルタドーピングを用いてダイヤモンド中の2次元窒素およびNV層を高密度化(\gtrsim$1 ppm$\cdot$nm)する手法を提案する。 2次イオン質量分析法(sims)のような従来の材料技術と、p1層とnv層の密度と寸法を特徴付けるnvスピンデコヒーレンスに基づく測定を併用した。 p1密度は5~10ppm$\cdot$nm、nv密度は1~3.5ppm$\cdot$nmで電子照射量によって調整され、スピン層の深さは1.6nmまで閉じ込められている。 また、P1とNVの高比(最大0.74)と、再現的に長いNVコヒーレンス時間も観察し、エンジニアリングされたP1とNVスピン浴との双極子相互作用に支配されている。

Systems of spins engineered with tunable density and reduced dimensionality enable a number of advancements in quantum sensing and simulation. Defects in diamond, such as nitrogen-vacancy (NV) centers and substitutional nitrogen (P1 centers), are particularly promising solid-state platforms to explore. However, the ability to controllably create coherent, two-dimensional spin systems and characterize their properties, such as density, depth confinement, and coherence is an outstanding materials challenge. We present a refined approach to engineer dense ($\gtrsim$1 ppm$\cdot$nm), 2D nitrogen and NV layers in diamond using delta-doping during plasma-enhanced chemical vapor deposition (PECVD) epitaxial growth. We employ both traditional materials techniques, e.g. secondary ion mass spectrometry (SIMS), alongside NV spin decoherence-based measurements to characterize the density and dimensionality of the P1 and NV layers. We find P1 densities of 5-10 ppm$\cdot$nm, NV densities between 1 and 3.5 ppm$\cdot$nm tuned via electron irradiation dosage, and depth confinement of the spin layer down to 1.6 nm. We also observe high (up to 0.74) ratios of P1 to NV centers and reproducibly long NV coherence times, dominated by dipolar interactions with the engineered P1 and NV spin baths.
翻訳日:2023-01-20 09:12:51 公開日:2023-01-18
# 説明付きAI意思決定における人間直観の役割の理解

Understanding the Role of Human Intuition on Reliance in Human-AI Decision-Making with Explanations ( http://arxiv.org/abs/2301.07255v1 )

ライセンス: Link先を確認
Valerie Chen, Q. Vera Liao, Jennifer Wortman Vaughan, Gagan Bansal(参考訳) AIの説明はしばしば、人間とAIの意思決定を改善する方法として言及される。 しかし、実証的研究は、説明の有効性の一貫性のある証拠を見出せず、逆にAIシステムが間違っている場合、過度な信頼性を高めることができることを示唆している。 多くの要因がAIサポートに依存する可能性があるが、意思決定者が自身の直感(ドメイン知識、事前タスクエクスペリエンス、パターン認識に基づく)をAIシステムが提供する情報と組み合わせて、AI予測をいつオーバーライドするかを決定することが重要な要素である。 我々は、意思決定者の直感がAIの予測と説明の使用にどのように影響するか、そして最終的にAIに依存するタイミングを選択するために、2つの予測タスクのための2つの説明タイプ(機能と例に基づく)で、思考アラウドと混合メソッドの研究を行う。 結果から,AIの予測と説明に関する推論に関わる3つの直観,すなわちタスク結果,特徴,AIの限界に関する直観を抽出した。 これらに基づいて、意思決定者が自身の直感を適用し、AI予測を上書きする3つの観察経路を要約する。 筆者らは,(1)特徴に基づく説明が参加者の判断結果を改善せず,AIに対する信頼度を高めなかった理由,(2)特徴に基づく説明よりも意思決定者のパフォーマンスを向上し,補完的な人間-AIのパフォーマンスを実現した事例に基づく説明を,これらの経路を用いて説明している。 全体として、私たちの研究は、意思決定者がAIに適切に依存するための直感を効果的に適用するのに役立つAI意思決定支援システムと説明方法のさらなる発展に向けた方向性を特定します。

AI explanations are often mentioned as a way to improve human-AI decision-making. Yet, empirical studies have not found consistent evidence of explanations' effectiveness and, on the contrary, suggest that they can increase overreliance when the AI system is wrong. While many factors may affect reliance on AI support, one important factor is how decision-makers reconcile their own intuition -- which may be based on domain knowledge, prior task experience, or pattern recognition -- with the information provided by the AI system to determine when to override AI predictions. We conduct a think-aloud, mixed-methods study with two explanation types (feature- and example-based) for two prediction tasks to explore how decision-makers' intuition affects their use of AI predictions and explanations, and ultimately their choice of when to rely on AI. Our results identify three types of intuition involved in reasoning about AI predictions and explanations: intuition about the task outcome, features, and AI limitations. Building on these, we summarize three observed pathways for decision-makers to apply their own intuition and override AI predictions. We use these pathways to explain why (1) the feature-based explanations we used did not improve participants' decision outcomes and increased their overreliance on AI, and (2) the example-based explanations we used improved decision-makers' performance over feature-based explanations and helped achieve complementary human-AI performance. Overall, our work identifies directions for further development of AI decision-support systems and explanation methods that help decision-makers effectively apply their intuition to achieve appropriate reliance on AI.
翻訳日:2023-01-19 17:13:52 公開日:2023-01-18
# 条件状態トモグラフィによる非破壊的量子フィードバック制御

No-Collapse Accurate Quantum Feedback Control via Conditional State Tomography ( http://arxiv.org/abs/2301.07254v1 )

ライセンス: Link先を確認
Sangkha Borah and Bijita Sarma(参考訳) 測定に基づくフィードバック制御(mbfc)プロトコルの有効性は、測定ノイズの存在によって妨げられ、ノイズの連続測定記録から量子システムの基盤となるダイナミクスを正確に推測する能力が損なわれる。 この制限を回避するために, 雑音測定データを用いながら, 量子系の全密度行列を含む条件付きダイナミクスのノイズフリーモニタリングを実現する, 実時間確率的状態推定手法を提案する。 これにより、測定ノイズによる制約を緩和することで、量子システムの効果的な制御につながる正確なMBFC戦略の開発が可能になり、様々なフィードバック量子制御シナリオに潜在的な応用が期待できる。 このアプローチは機械学習ベースの制御において特に重要であり、AIコントローラは、フル密度行列を含むオブザーバブルの任意の条件平均でトレーニングして、制御戦略を迅速かつ正確に学習することができる。

The effectiveness of measurement-based feedback control (MBFC) protocols is hindered by the presence of measurement noise, which impairs the ability to accurately infer the underlying dynamics of a quantum system from noisy continuous measurement records. To circumvent this limitation, a real-time stochastic state estimation approach is proposed in this work, that enables noise-free monitoring of the conditional dynamics, including the full density matrix of the quantum system, despite using noisy measurement data. This, in turn, enables the development of precise MBFC strategies that leads to effective control of quantum systems by essentially mitigating the constraints imposed by measurement noise, and has potential applications in various feedback quantum control scenarios. This approach is particularly important for machine learning-based control, where the AI controller can be trained with arbitrary conditional averages of observables, including the full density matrix, to quickly and accurately learn control strategies.
翻訳日:2023-01-19 17:13:18 公開日:2023-01-18
# Infinite Tailは最適な空間探索に勝てない

No Infinite Tail Beats Optimal Spatial Search ( http://arxiv.org/abs/2301.07251v1 )

ライセンス: Link先を確認
Weichen Xie and Christino Tamon(参考訳) Farhi and Gutmann (Physical Review A, 57(4):2403, 1998) は、グロバー探索(空間探索とも呼ばれる)の連続時間アナログが全グラフ上で最適であることを証明した。 この結果は、無限に長い経路(または尾)が存在する場合でも、完全グラフにおいて空間探索が最適であることを示して拡張する。 後者を有限量子系との限定的かつ非自明な相互作用を持つ外部量子系と考えると、空間探索はコヒーレントな無限一次元プローブに対して頑健であることが示唆される。 さらに, 探索アルゴリズムは, 尾部が存在するか否かを知る必要がなく, かつ, 尾部がどこに取り付けられているかを知ることで, {\em oblivious} であることを示す。

Farhi and Gutmann (Physical Review A, 57(4):2403, 1998) proved that a continuous-time analogue of Grover search (also called spatial search) is optimal on the complete graphs. We extend this result by showing that spatial search remains optimal in a complete graph even in the presence of an infinitely long path (or tail). If we view the latter as an external quantum system that has a limited but nontrivial interaction with our finite quantum system, this suggests that spatial search is robust against a coherent infinite one-dimensional probe. Moreover, we show that the search algorithm is {\em oblivious} in that it does not need to know whether the tail is present or not, and if so, where it is attached to.
翻訳日:2023-01-19 17:13:03 公開日:2023-01-18
# Tailor: リソース効率の良い推論のためのスキップ接続の変更

Tailor: Altering Skip Connections for Resource-Efficient Inference ( http://arxiv.org/abs/2301.07247v1 )

ライセンス: Link先を確認
Olivia Weng, Gabriel Marcano, Vladimir Loncar, Alireza Khodamoradi, Nojan Sheybani, Farinaz Koushanfar, Kristof Denolf, Javier Mauricio Duarte, Ryan Kastner(参考訳) ディープニューラルネットワークは、トレーニング収束を改善するためにスキップ接続を使用する。 しかし、これらのスキップ接続はハードウェアでコストがかかり、追加のバッファが必要となり、オンチップとオフチップのメモリ使用量と帯域幅要件が増加する。 本稿では,ハードウェア・ソフトウェア・コード署名アプローチに取り組み,スキップ接続をハードウェアに最適化できることを示す。 ネットワークが学習するためにはネットワークのスキップ接続が必要であるが、その接続は後に削除または短縮され、精度の低下を最小限に抑えることなく、よりハードウェア効率の良い実装を提供することができる。 ハードウェアアウェアトレーニングアルゴリズムは、ハードウェアコストを下げるために、完全にトレーニングされたネットワークのスキップ接続を徐々に削除または短縮する。 最適化されたハードウェア設計により、BRAMでは最大34%、FFでは13%、LUTでは16%のリソース利用率が向上した。

Deep neural networks use skip connections to improve training convergence. However, these skip connections are costly in hardware, requiring extra buffers and increasing on- and off-chip memory utilization and bandwidth requirements. In this paper, we show that skip connections can be optimized for hardware when tackled with a hardware-software codesign approach. We argue that while a network's skip connections are needed for the network to learn, they can later be removed or shortened to provide a more hardware efficient implementation with minimal to no accuracy loss. We introduce Tailor, a codesign tool whose hardware-aware training algorithm gradually removes or shortens a fully trained network's skip connections to lower their hardware cost. The optimized hardware designs improve resource utilization by up to 34% for BRAMs, 13% for FFs, and 16% for LUTs.
翻訳日:2023-01-19 17:12:51 公開日:2023-01-18
# アニーリングマシン用連続変数の効率的な相関に基づく離散化

Efficient correlation-based discretization of continuous variables for annealing machines ( http://arxiv.org/abs/2301.07244v1 )

ライセンス: Link先を確認
Yuki Furue, Makiko Konoshima, Hirotaka Tamura, Jun Ohkubo(参考訳) 組合せ最適化問題に特化したアニーリングマシンが開発されており、これらのマシンを使用するサービスを提供している企業もある。 このような特殊なマシンはバイナリ変数のみを処理でき、入力形式はquadratic unconstrained binary optimization (qubo) である。 したがって、連続変数の問題を解くためには離散化が必要である。 しかし、このようなマシンではバイナリ変数の数に厳しい制約がある。 前の研究における単純な二進展開は、多くの二進変数を必要とするが、制約のため、qubo定式化におけるそのような変数の数を減らす必要がある。 連続変数の相関を用いた離散化法を提案する。 提案手法は,予測精度を著しく低下させることなく,QUBOの定式化に必要なバイナリ変数数を削減できることを示す。

Annealing machines specialized for combinatorial optimization problems have been developed, and some companies offer services to use those machines. Such specialized machines can only handle binary variables, and their input format is the quadratic unconstrained binary optimization (QUBO) formulation. Therefore, discretization is necessary to solve problems with continuous variables. However, there is a severe constraint on the number of binary variables with such machines. Although the simple binary expansion in the previous research requires many binary variables, we need to reduce the number of such variables in the QUBO formulation due to the constraint. We propose a discretization method that involves using correlations of continuous variables. We numerically show that the proposed method reduces the number of necessary binary variables in the QUBO formulation without a significant loss in prediction accuracy.
翻訳日:2023-01-19 17:12:34 公開日:2023-01-18
# 可算武装バンディット問題の複雑性解析

Complexity Analysis of a Countable-armed Bandit Problem ( http://arxiv.org/abs/2301.07243v1 )

ライセンス: Link先を確認
Anand Kalvit and Assaf Zeevi(参考訳) 確率的多腕バンディット問題(英語版)(mab) は ``large'' の作用空間に動機づけられ、それぞれ異なる平均的な報酬によって特徴づけられる、正確に$k$ のアームタイプを含むアームの集団によって与えられる。 意思決定者は、報酬分布の統計的性質や、異なる腕型の個体群分布に偏りがなく、また、プレー後の腕の種類も観察できない。 我々は,play $n$ の地平線上で予想される累積的後悔を最小化する古典的な問題を研究し,$\mathcal{o}\left( \log n \right)$ のレート最適有限時間インスタンス依存的後悔を達成するアルゴリズムを提案する。 また、インスタンスに依存しない(minimax)後悔は$K=2$であるときに$\tilde{\mathcal{O}}\left( \sqrt{n} \right)$であることを示す。 問題に対する後悔の順序と複雑さは、古典的MAB問題と大きな類似性を示しているが、アルゴリズム設計における性能境界と健全な側面は、それらを研究するのに必要な分析ツールとともに複雑さを決定する主要なプリミティブとは全く異なる。

We consider a stochastic multi-armed bandit (MAB) problem motivated by ``large'' action spaces, and endowed with a population of arms containing exactly $K$ arm-types, each characterized by a distinct mean reward. The decision maker is oblivious to the statistical properties of reward distributions as well as the population-level distribution of different arm-types, and is precluded also from observing the type of an arm after play. We study the classical problem of minimizing the expected cumulative regret over a horizon of play $n$, and propose algorithms that achieve a rate-optimal finite-time instance-dependent regret of $\mathcal{O}\left( \log n \right)$. We also show that the instance-independent (minimax) regret is $\tilde{\mathcal{O}}\left( \sqrt{n} \right)$ when $K=2$. While the order of regret and complexity of the problem suggests a great degree of similarity to the classical MAB problem, properties of the performance bounds and salient aspects of algorithm design are quite distinct from the latter, as are the key primitives that determine complexity along with the analysis tools needed to study them.
翻訳日:2023-01-19 17:12:21 公開日:2023-01-18
# セマンティック視覚損失を用いた効果的なエンドツーエンド視覚言語

Effective End-to-End Vision Language Pretraining with Semantic Visual Loss ( http://arxiv.org/abs/2301.07236v1 )

ライセンス: Link先を確認
Xiaofeng Yang, Fayao Liu, Guosheng Lin(参考訳) 現在の視覚言語事前学習モデルは、物体検出器から抽出された領域視覚特徴を用いた手法によって支配されている。 優れた性能のため、抽出プロセスパイプラインは推論速度を著しく制限し、したがって実際のユースケースを制限する。 しかし、原画像画素から視覚言語モデルを訓練することは困難であり、原画像画素は地域特性よりも事前知識がはるかに少ない。 本稿では,視覚言語モデルの学習を支援するために,補助的な視覚前訓練タスクをどのように活用するかを体系的に研究する。 3種類の視覚的損失を導入し、より高速な収束と精度の向上を実現した。 リージョン機能モデルと比較して、私たちのエンドツーエンドモデルは、下流タスクで同様のあるいはより良いパフォーマンスを実現し、推論中に10倍以上高速に動作します。 提案手法は,他のエンドツーエンドモデルと比較して,事前学習中のGPU時間のうち10%しか事前トレーニングを行ない,同様の,あるいはより良い性能を実現することができる。

Current vision language pretraining models are dominated by methods using region visual features extracted from object detectors. Given their good performance, the extract-then-process pipeline significantly restricts the inference speed and therefore limits their real-world use cases. However, training vision language models from raw image pixels is difficult, as the raw image pixels give much less prior knowledge than region features. In this paper, we systematically study how to leverage auxiliary visual pretraining tasks to help training end-to-end vision language models. We introduce three types of visual losses that enable much faster convergence and better finetuning accuracy. Compared with region feature models, our end-to-end models could achieve similar or better performance on downstream tasks and run more than 10 times faster during inference. Compared with other end-to-end models, our proposed method could achieve similar or better performance when pretrained for only 10% of the pretraining GPU hours.
翻訳日:2023-01-19 17:11:59 公開日:2023-01-18
# タグ付きMRIにおける深部非教師付き位相ベース3次元非圧縮性運動推定

Deep Unsupervised Phase-based 3D Incompressible Motion Estimation in Tagged-MRI ( http://arxiv.org/abs/2301.07234v1 )

ライセンス: Link先を確認
Zhangxing Bian, Fangxu Xing, Jinglun Yu, Muhan Shao, Yihao Liu, Aaron Carass, Jonghye Woo, Jerry L. Prince(参考訳) タグ付きMRI(Tagged magnetic resonance imaging)は、変形組織の詳細な動きを観察し定量化するために何十年も使われてきた。 しかし, この手法は, タグフェーディングや大きな動き, 長時間の計算時間, 微分同相非圧縮性流れ場獲得の困難といった課題に直面している。 そこで本稿では,タグ付きmriのための教師なし位相に基づく3次元運動推定手法を提案する。 2つの重要なイノベーションを紹介します まず、調和位相入力に正弦波変換を適用し、エンドツーエンドのトレーニングを可能にし、位相補間の必要性を回避する。 第二に, 生体組織を変形させるための非圧縮性流れ場を促すジャコビアン決定式に基づく学習目標を提案する。 本手法は, 高精度で密度が高く, ほぼ微分可能で非圧縮な3次元運動場を効率的に推定する。 この方法の有効性は、発話中の人間の舌の動きを用いて評価され、正常なコントロールと舌郭清を行った患者の両方を含む。 提案手法は既存の手法よりも優れており,また,タグフェージングに対する速度,頑健性,舌の動きが向上していることを示す。

Tagged magnetic resonance imaging (MRI) has been used for decades to observe and quantify the detailed motion of deforming tissue. However, this technique faces several challenges such as tag fading, large motion, long computation times, and difficulties in obtaining diffeomorphic incompressible flow fields. To address these issues, this paper presents a novel unsupervised phase-based 3D motion estimation technique for tagged MRI. We introduce two key innovations. First, we apply a sinusoidal transformation to the harmonic phase input, which enables end-to-end training and avoids the need for phase interpolation. Second, we propose a Jacobian determinant-based learning objective to encourage incompressible flow fields for deforming biological tissues. Our method efficiently estimates 3D motion fields that are accurate, dense, and approximately diffeomorphic and incompressible. The efficacy of the method is assessed using human tongue motion during speech, and includes both healthy controls and patients that have undergone glossectomy. We show that the method outperforms existing approaches, and also exhibits improvements in speed, robustness to tag fading, and large tongue motion.
翻訳日:2023-01-19 17:11:43 公開日:2023-01-18
# シンメトリゼーションによる量子コンピュータの性能向上

Enhancing quantum computer performance via symmetrization ( http://arxiv.org/abs/2301.07233v1 )

ライセンス: Link先を確認
Andrii Maksymov, Jason Nguyen, Yunseong Nam, Igor Markov(参考訳) 大規模量子コンピュータは、そうでなければ解決できないいくつかの重要な問題を解決することを約束する。 しかし、現代の量子技術は制御誤差やクビットデコヒーレンスなどの様々な不完全性に悩まされ、その潜在的な効用を阻害する。 量子誤差補正のオーバーヘッドは、短期的な量子コンピュータには大きすぎるが、特定のデバイス不完全に対処するエラー緩和戦略は、デバイスが改善するにつれて関連性を失う可能性がある。 量子コンピュータの性能を高品質な量子ビットで向上するために,対称性と非線形アグリゲーションに基づく戦略を導入する。 商用のトラップイオン量子コンピュータでは、量子ビットやゲートオーバヘッドなしで、複数の実用的なアルゴリズムのパフォーマンスを100倍向上させる。

Large quantum computers promise to solve some critical problems not solvable otherwise. However, modern quantum technologies suffer various imperfections such as control errors and qubit decoherence, inhibiting their potential utility. The overheads of quantum error correction are too great for near-term quantum computers, whereas error-mitigation strategies that address specific device imperfections may lose relevance as devices improve. To enhance the performance of quantum computers with high-quality qubits, we introduce a strategy based on symmetrization and nonlinear aggregation. On a commercial trapped-ion quantum computer, it improves performance of multiple practical algorithms by 100x with no qubit or gate overhead.
翻訳日:2023-01-19 17:11:23 公開日:2023-01-18
# キラル性誘起光子によるスピン軌道結合

Chirality-induced emergent spin-orbit coupling with photons ( http://arxiv.org/abs/2301.07231v1 )

ライセンス: Link先を確認
Jonah S. Peter, Stefan Ostermann, Susanne F. Yelin(参考訳) キラリティ(英: Chirality)は、ミラー対称性の欠如を表す幾何学的性質である。 キラル系は自然界においてユビキタスであり、位相物質や複雑な生体分子で観察される非相互相互作用と関連している。 本稿では、双極子結合型量子エミッタのキラル配置が、時間反転対称性を損なうことなく、フォトニックスピン励起の一方向輸送を促進することを実証する。 このスピン選択輸送は、カイラル幾何学によって誘導される普遍的な創発的スピン軌道結合から生じ、その結果、非自明なトポロジーとなる。 また,集団散逸が動態に与える影響についても検討し,多体コヒーレンスがヘリシティ依存性光子放出を引き起こすことを発見した。 新興量子技術への応用と、自然界におけるスピン選択光子輸送の役割について論じる。

Chirality, or handedness, is a geometrical property denoting a lack of mirror symmetry. Chiral systems are ubiquitous in nature and are associated with the non-reciprocal interactions observed in topological materials and complex biomolecules, among other phenomena. In this paper, we demonstrate that chiral arrangements of dipole-coupled quantum emitters can facilitate the unidirectional transport of photonic spin excitations without breaking time-reversal symmetry. We show that this spin-selective transport stems from a universal emergent spin-orbit coupling induced by the chiral geometry, which in turn, results in a nontrivial topology. We also examine the effects of collective dissipation on the dynamics and find that many-body coherences lead to helicity-dependent photon emission: an effect we call helical superradiance. Applications to emerging quantum technologies as well as the potential role of spin-selective photon transport in nature are discussed.
翻訳日:2023-01-19 17:11:12 公開日:2023-01-18
# エンド・ツー・エンド複合システムにおける因果異常の検出とランキング

Detecting and Ranking Causal Anomalies in End-to-End Complex System ( http://arxiv.org/abs/2301.07281v1 )

ライセンス: Link先を確認
Ching Chang, Cheng-Han Yeh, Wen-Chih Peng(参考訳) 技術の急速な発展に伴い、大規模工場の自動監視システムがますます重要になっている。 大量のセンサデータを収集することで、異常を見つける多くの方法を得ることができる。 自動監視システムの本当の核となる価値は、問題の原因を特定し追跡することだと考えています。 因果異常を発見する最も有名な方法はRCAであるが、無視できない問題が数多くある。 彼らは自己回帰的外因性(arx)モデルを使用して時間不変相関ネットワークをマシンプロファイルとして作成し、このプロファイルを使用して障害伝播と呼ばれる手法による因果異常を追跡した。 機械の動作をARXが確立した相関ネットワークを用いて記述する際には,(1)状態の多様性を考慮せず,(2)異なる時間ラグとの相関を別々に考慮しない,という2つの大きな問題がある。 そこで本研究では,上記の問題を完全に解決する,エンドツーエンドシステム(rcae2e)におけるランキング因果異常と呼ばれる枠組みを提案する。 実験では,合成データと実世界の大規模光電ファクトリーデータを用いて,手法仮説の正確性と存在を検証する。

With the rapid development of technology, the automated monitoring systems of large-scale factories are becoming more and more important. By collecting a large amount of machine sensor data, we can have many ways to find anomalies. We believe that the real core value of an automated monitoring system is to identify and track the cause of the problem. The most famous method for finding causal anomalies is RCA, but there are many problems that cannot be ignored. They used the AutoRegressive eXogenous (ARX) model to create a time-invariant correlation network as a machine profile, and then use this profile to track the causal anomalies by means of a method called fault propagation. There are two major problems in describing the behavior of a machine by using the correlation network established by ARX: (1) It does not take into account the diversity of states (2) It does not separately consider the correlations with different time-lag. Based on these problems, we propose a framework called Ranking Causal Anomalies in End-to-End System (RCAE2E), which completely solves the problems mentioned above. In the experimental part, we use synthetic data and real-world large-scale photoelectric factory data to verify the correctness and existence of our method hypothesis.
翻訳日:2023-01-19 17:05:39 公開日:2023-01-18
# sensorx2car: 道路シナリオにおける自動運転のためのセンサツーカーキャリブレーション

SensorX2car: Sensors-to-car calibration for autonomous driving in road scenarios ( http://arxiv.org/abs/2301.07279v1 )

ライセンス: Link先を確認
Guohang Yan, Zhaotong Luo, Zhuochun Liu and Yikang Li(参考訳) 自律運転システムにおけるセンサの性能は、センサキャリブレーションの品質によって根本的に制限される。 センサーは、意味のある位置化と環境認識を提供する前に、車体フレームに対して十分に位置決めされなければならない。 しかし,センサ間の過渡パラメータを校正するためのオンライン手法が多数提案されているが,センサと車両座標系の校正に着目した研究は少ない。 そこで本研究では,道路シーンにおけるセンサ対車座標のオンライン校正を行うための校正ツールボックスであるsensorx2carを提案する。 IMU (Inertial Measurement Unit)、GNSS (Global Navigation Satellite System)、LiDAR (Light Detection and Ranging)、カメラ、ミリ波レーダーである。 本研究では,各センサの回転を車体に調整する手法を設計する。 実世界のシミュレーション実験により,提案手法の精度と一般化能力を示す。 一方、関連するコードはコミュニティに利益をもたらすためにオープンソース化されている。 私たちの知る限りでは、sensorx2carは最初のオープンソースのセンサーから車へのキャリブレーションツールボックスです。 コードはhttps://github.com/OpenCalib/SensorX2carで入手できる。

The performance of sensors in the autonomous driving system is fundamentally limited by the quality of sensor calibration. Sensors must be well-located with respect to the car-body frame before they can provide meaningful localization and environmental perception. However, while many online methods are proposed to calibrate the extrinsic parameters between sensors, few studies focus on the calibration between sensor and vehicle coordinate system. To this end, we present SensorX2car, a calibration toolbox for the online calibration of sensor-to-car coordinate systems in road scenes. It contains four commonly used sensors: IMU (Inertial Measurement Unit), GNSS (Global Navigation Satellite System), LiDAR (Light Detection and Ranging), Camera, and millimeter-wave Radar. We design a method for each sensor respectively and mainly calibrate its rotation to the car-body. Real-world and simulated experiments demonstrate the accuracy and generalization capabilities of the proposed method. Meanwhile, the related codes have been open-sourced to benefit the community. To the best of our knowledge, SensorX2car is the first open-source sensor-to-car calibration toolbox. The code is available at https://github.com/OpenCalib/SensorX2car.
翻訳日:2023-01-19 17:05:09 公開日:2023-01-18
# 畳み込み畳み込み分布のためのデータスライニング

Data thinning for convolution-closed distributions ( http://arxiv.org/abs/2301.07276v1 )

ライセンス: Link先を確認
Anna Neufeld, Ameer Dharamshi, Lucy L. Gao, and Daniela Witten(参考訳) 本稿では,観測を元の観測値に等しい2つ以上の独立した部分に分割し,パラメータの(既知の)スケーリングまで,元の観測値と同じ分布をたどる新しい手法であるデータスライニングを提案する。 この提案は非常に一般的であり、ガウス分布、ポアソン分布、負二項分布、ガンマ分布、二項分布を含む「畳み込み閉分布」から得られる任意の観察に適用することができる。 これはスピリットに似ていますが、データフィッション(data fission)として知られる最近の提案とは別物で、より簡単に適用できます。 データシンキングには、モデル選択、評価、推論のための多くのアプリケーションがある。 例えば、データスライニングによるクロスバリデーションは、サンプル分割によるクロスバリデーションの"使用"アプローチの、特に後者が適用できない教師なしの環境では、魅力的な代替手段を提供する。 シミュレーションおよび単一セルRNAシークエンシングデータへの応用において、k平均クラスタリングや主成分分析などの教師なし学習手法の結果を検証するために、データスライニングが利用可能であることを示す。

We propose data thinning, a new approach for splitting an observation into two or more independent parts that sum to the original observation, and that follow the same distribution as the original observation, up to a (known) scaling of a parameter. This proposal is very general, and can be applied to any observation drawn from a "convolution closed" distribution, a class that includes the Gaussian, Poisson, negative binomial, Gamma, and binomial distributions, among others. It is similar in spirit to -- but distinct from, and more easily applicable than -- a recent proposal known as data fission. Data thinning has a number of applications to model selection, evaluation, and inference. For instance, cross-validation via data thinning provides an attractive alternative to the "usual" approach of cross-validation via sample splitting, especially in unsupervised settings in which the latter is not applicable. In simulations and in an application to single-cell RNA-sequencing data, we show that data thinning can be used to validate the results of unsupervised learning approaches, such as k-means clustering and principal components analysis.
翻訳日:2023-01-19 17:04:51 公開日:2023-01-18
# 深層分布強化学習のためのスパイクニューラルネットワークのマルチコンパートメントニューロンと集団符号化

Multi-compartment Neuron and Population Encoding improved Spiking Neural Network for Deep Distributional Reinforcement Learning ( http://arxiv.org/abs/2301.07275v1 )

ライセンス: Link先を確認
Yinqian Sun, Yi Zeng, Feifei Zhao and Zhuoya Zhao(参考訳) 脳内の二進スパイクによる情報処理に触発されて、スパイキングニューラルネットワーク(snn)はエネルギー消費が著しく減少し、マルチスケールの生物学的特性を取り込むのにより適している。 snnの基本情報処理ユニットであるスパイキングニューロンは、lif点ニューロンのみを考慮し、生物学的ニューロンの多成分構造特性を考慮しないほとんどのsnsにおいてしばしば単純化される。 これにより、SNNの計算能力と学習能力が制限される。 本稿では,生体インスパイアマルチコンパートメントニューロン(mcn)モデルと集団符号化法を組み合わせた脳インスパイアsnベースの深層分布強化学習アルゴリズムを提案する。 提案するマルチコンパートメントニューロンは、生体ニューロンに近い計算能力を達成するために、根尖樹状体、基底樹状体、体性計算区画の構造と機能を構築した。 さらに,スパイキングニューロン集団符号化に基づく暗黙的な分数埋め込み法を提案する。 我々は,Atariゲーム上で実験を行い,実験結果から,本モデルの性能が,Vanilla ANNベースのFQFモデルとANN-SNN変換方式のSpike-FQFモデルを上回ることを示した。 アブレーション実験により,SNNに基づく深部分布強化学習を実現する上で,提案したマルチコンパートメントニューラルモデルと擬似集団スパイク表現が重要な役割を果たすことが示された。

Inspired by the information processing with binary spikes in the brain, the spiking neural networks (SNNs) exhibit significant low energy consumption and are more suitable for incorporating multi-scale biological characteristics. Spiking Neurons, as the basic information processing unit of SNNs, are often simplified in most SNNs which only consider LIF point neuron and do not take into account the multi-compartmental structural properties of biological neurons. This limits the computational and learning capabilities of SNNs. In this paper, we proposed a brain-inspired SNN-based deep distributional reinforcement learning algorithm with combination of bio-inspired multi-compartment neuron (MCN) model and population coding method. The proposed multi-compartment neuron built the structure and function of apical dendritic, basal dendritic, and somatic computing compartments to achieve the computational power close to that of biological neurons. Besides, we present an implicit fractional embedding method based on spiking neuron population encoding. We tested our model on Atari games, and the experiment results show that the performance of our model surpasses the vanilla ANN-based FQF model and ANN-SNN conversion method based Spiking-FQF models. The ablation experiments show that the proposed multi-compartment neural model and quantile fraction implicit population spike representation play an important role in realizing SNN-based deep distributional reinforcement learning.
翻訳日:2023-01-19 17:04:31 公開日:2023-01-18
# 深層辞書学習のための変分オートエンコーダに基づく非負行列分解モデル

A variational autoencoder-based nonnegative matrix factorisation model for deep dictionary learning ( http://arxiv.org/abs/2301.07272v1 )

ライセンス: Link先を確認
Hong-Bo Xie, Caoyuan Li, Shuliang Wang, Richard Yi Da Xu and Kerrie Mengersen(参考訳) 非負行列分解(NMF)を用いた辞書の構築は、信号処理や機械学習に広く応用されている。 深層学習の進歩に伴い、深層ニューラルネットワーク、すなわち深層特徴の辞書を用いたコンパクトで堅牢な辞書の訓練が提案されている。 本研究では,変分オートエンコーダ(VAE)を用いて非負の辞書学習を行う確率的生成モデルを提案する。 既存のvaeモデルとは対照的に、ガンマ分布に従う潜在変数を持つ統計的枠組みでモデルを作成し、非負の辞書を保証する新しい損失関数を設計した。 我々は、潜伏変数を反復的に更新するために、アクセプション・リジェクションサンプリングのパラメータ化手法を採用する。 VAE-NMFから学んだ辞書を2つの信号処理タスク、すなわち、音声の増強と筋シナジーの抽出に適用する。 実験の結果, VAE-NMFは最先端の手法と比較して, 潜時非負の辞書の学習に優れていた。

Construction of dictionaries using nonnegative matrix factorisation (NMF) has extensive applications in signal processing and machine learning. With the advances in deep learning, training compact and robust dictionaries using deep neural networks, i.e., dictionaries of deep features, has been proposed. In this study, we propose a probabilistic generative model which employs a variational autoencoder (VAE) to perform nonnegative dictionary learning. In contrast to the existing VAE models, we cast the model under a statistical framework with latent variables obeying a Gamma distribution and design a new loss function to guarantee the nonnegative dictionaries. We adopt an acceptance-rejection sampling reparameterization trick to update the latent variables iteratively. We apply the dictionaries learned from VAE-NMF to two signal processing tasks, i.e., enhancement of speech and extraction of muscle synergies. Experimental results demonstrate that VAE-NMF performs better in learning the latent nonnegative dictionaries in comparison with state-of-the-art methods.
翻訳日:2023-01-19 17:04:06 公開日:2023-01-18
# ACQ: 注意補正による生成的データフリー量子化の改善

ACQ: Improving Generative Data-free Quantization Via Attention Correction ( http://arxiv.org/abs/2301.07266v1 )

ライセンス: Link先を確認
Jixing Li, Xiaozhou Guo, Benzhe Dai, Guoliang Gong, Min Jin, Gang Chen, Wenyu Mao and Huaxiang Lu(参考訳) データフリー量子化は、真のサンプルにアクセスすることなくモデル量子化を実現することを目的としている。 データプライバシを含むアプリケーション指向のコンテキストにおいて重要である。 ノイズベクトルをジェネレータを介して合成サンプルに変換することは、生成データ自由量子化と呼ばれる一般的なデータ自由量子化法である。 しかし, 合成試料と真正試料の間には, 注意の相違がある。 これは常に無視され、量子化性能を制限する。 第一に、同じクラスの合成サンプルは均質な注意を向けやすいため、量子化ネットワークは限られた注意モードしか学習できない。 第2に、evalモードとトレーニングモードの合成サンプルは異なる注意を払っている。 したがって、バッチ正規化統計マッチングは不正確な傾向にある。 本稿では, 合成試料の注目を集めるためにACQを提案する。 階級内注目の均質化に関して、注目中心位置条件生成器を確立する。 注目センター整合損失により制限され、注目センター位置を発電機の条件入力として扱い、合成サンプルを誘導し、多様な注意を得る。 さらに, 同一条件下での合成試料の対向損失を設計し, 発生元が過度に注意を払わないようにし, モード崩壊を引き起こす可能性がある。 異なるネットワークモードでの合成サンプルの注意の類似性を改善するために, 正確なbn統計マッチングを保証する一貫性ペナルティを導入する。 実験の結果,ACQは合成試料の注意問題を効果的に改善することが示された。 様々なトレーニング設定の下で、ACQは最高の量子化性能を達成する。 Resnet18とResnet50の4ビット量子化では、ACQはそれぞれ67.55%と72.23%の精度に達する。

Data-free quantization aims to achieve model quantization without accessing any authentic sample. It is significant in an application-oriented context involving data privacy. Converting noise vectors into synthetic samples through a generator is a popular data-free quantization method, which is called generative data-free quantization. However, there is a difference in attention between synthetic samples and authentic samples. This is always ignored and restricts the quantization performance. First, since synthetic samples of the same class are prone to have homogenous attention, the quantized network can only learn limited modes of attention. Second, synthetic samples in eval mode and training mode exhibit different attention. Hence, the batch-normalization statistics matching tends to be inaccurate. ACQ is proposed in this paper to fix the attention of synthetic samples. An attention center position-condition generator is established regarding the homogenization of intra-class attention. Restricted by the attention center matching loss, the attention center position is treated as the generator's condition input to guide synthetic samples in obtaining diverse attention. Moreover, we design adversarial loss of paired synthetic samples under the same condition to prevent the generator from paying overmuch attention to the condition, which may result in mode collapse. To improve the attention similarity of synthetic samples in different network modes, we introduce a consistency penalty to guarantee accurate BN statistics matching. The experimental results demonstrate that ACQ effectively improves the attention problems of synthetic samples. Under various training settings, ACQ achieves the best quantization performance. For the 4-bit quantization of Resnet18 and Resnet50, ACQ reaches 67.55% and 72.23% accuracy, respectively.
翻訳日:2023-01-19 17:03:49 公開日:2023-01-18
# ArsoNISQ: 短期アーキテクチャにおける量子アルゴリズムの解析

ArsoNISQ: Analyzing Quantum Algorithms on Near-Term Architectures ( http://arxiv.org/abs/2301.07264v1 )

ライセンス: Link先を確認
Sebastian Brandhofer, Simon Devitt, Ilia Polian(参考訳) スケーラブルで完全にエラー修正された量子コンピューティングは、数年から数十年先にあるが、ノイズの多い中間スケール量子コンピューティング(NISQ)にはかなりの関心がある。 本稿では、与えられた量子アルゴリズム計算の許容誤差率、すなわち量子回路、および、成功基準とNISQコンピュータを与えられた計算の成功確率を決定するArsoNISQフレームワークを紹介する。 ArsoNISQは、パウリ誤差モデルに従って誤差を受ける量子回路のシミュレーションに基づいている。 arsonisqは、一連の量子アルゴリズムで評価され、量子スピードアップを発生させるか、あるいはnisqコンピューティングに関係がある。 最近の文献では楽観的な期待にもかかわらず、本評価では本質的ロバスト性を持つ量子アルゴリズム、すなわち1つの誤りを平均で許容するアルゴリズムは観測されなかった。 しかし、評価の結果、量子回路のサイズは許容誤差率の上限を設定し、同様の大きさの量子回路の許容誤差率の違いを定量化した。 したがって、このフレームワークは量子アルゴリズム開発者が実装を改善し、適切なNISQコンピューティングプラットフォームを選択するのを支援することができる。 結果から量子アドバンテージ理論を推定すると、より大きな量子コンピュータの誤差率は大幅に減少するか、または量子エラー補正がほとんどの評価されたアルゴリズムに適用される必要があることが示唆される。

While scalable, fully error corrected quantum computing is years or even decades away, there is considerable interest in noisy intermediate-scale quantum computing (NISQ). In this paper, we introduce the ArsoNISQ framework that determines the tolerable error rate of a given quantum algorithm computation, i.e. quantum circuits, and the success probability of the computation given a success criterion and a NISQ computer. ArsoNISQ is based on simulations of quantum circuits subject to errors according to the Pauli error model. ArsoNISQ was evaluated on a set of quantum algorithms that can incur a quantum speedup or are otherwise relevant to NISQ computing. Despite optimistic expectations in recent literature, we did not observe quantum algorithms with intrinsic robustness, i.e. algorithms that tolerate one error on average, in this evaluation. The evaluation demonstrated, however, that the quantum circuit size sets an upper bound for its tolerable error rate and quantified the difference in tolerate error rates for quantum circuits of similar sizes. Thus, the framework can assist quantum algorithm developers in improving their implementation and selecting a suitable NISQ computing platform. Extrapolating the results into the quantum advantage regime suggests that the error rate of larger quantum computers must decrease substantially or active quantum error correction will need to be deployed for most of the evaluated algorithms.
翻訳日:2023-01-19 17:03:27 公開日:2023-01-18
# 変分量子固有解法アルゴリズムの誤差解析

Error Analysis of the Variational Quantum Eigensolver Algorithm ( http://arxiv.org/abs/2301.07263v1 )

ライセンス: Link先を確認
Sebastian Brandhofer, Simon Devitt, Ilia Polian(参考訳) 変分量子アルゴリズムは、短期量子コンピューティングアプリケーションにおいて最も研究されている応用の1つである。 ノイズの多い中間規模量子(NISQ)システムでは、今後5年間で期待されるノイズの多い量子コンピュータ上で十分なアルゴリズムを十分に実行することが可能であり、大量の研究作業と膨大な民間部門の資金の両方を駆動している。 したがって,ノイズの有無で正しい解答に収束する上で,変分アルゴリズムが有効かどうかを理解することが重要である。 変動量子固有解法(VQE)とその個々の量子サブルーチンについて包括的な研究を行う。 漸近的境界の上に構築することで、量子処理呼び出し中に単一エラーが発生した場合、VQEアルゴリズムは事実上崩壊することを示す。 本稿では,資源コストのかかる誤り訂正プロトコルを使わずに任意の変分型アルゴリズムを実行できる状況における,この結果の意義について論じる。

Variational quantum algorithms have been one of the most intensively studied applications for near-term quantum computing applications. The noisy intermediate-scale quantum (NISQ) regime, where small enough algorithms can be run successfully on noisy quantum computers expected during the next 5 years, is driving both a large amount of research work and a significant amount of private sector funding. Therefore, it is important to understand whether variational algorithms are effective at successfully converging to the correct answer in presence of noise. We perform a comprehensive study of the variational quantum eigensolver (VQE) and its individual quantum subroutines. Building on asymptotic bounds, we show through explicit simulation that the VQE algorithm effectively collapses already when single errors occur during a quantum processing call. We discuss the significant implications of this result in the context of being able to run any variational type algorithm without resource expensive error correction protocols.
翻訳日:2023-01-19 17:03:05 公開日:2023-01-18
# 非対称スイッチング素子を有する多重擬決定性光子源

Multiplexed Pseudo-Deterministic Photon Source with Asymmetric Switching Elements ( http://arxiv.org/abs/2301.07258v1 )

ライセンス: Link先を確認
Sebastian Brandhofer, Casey R. Myers, Simon J. Devitt, Ilia Polian(参考訳) 信頼できる高品質の単一光子の信頼性と決定論的生産は、離散変数光量子技術の重要な要素である。 単一光子に基づく完全誤り補正量子コンピューティングシステムでは、光子源は1ghz [1] を超える速度で信頼できる光子の流れを生成する必要があると推定される。 低確率ソースとスイッチングネットワークが組み合わされ、生産イベントを出力にルーティングするフォトン多重化は潜在的な解決策であるが、超低損失率の単一フォトンスイッチングは非常に高速である。 本稿では, スイッチング素子の特異特性について検討し, サーマルパッドなどの共通スイッチング素子の汎用的な一方向特性を利用した新しい設計を提案する。 基本的な時間的多重化装置に複数のスイッチを導入することで、より速い速度でポンピングされる多重化ソースの遅いスイッチング要素を使うことができる。 我々はこの設計を複数の誤差チャネルでモデル化し, 集積フォトニックチップセット内の光導波路の固有損失率によって予測性能が制限されることを示した。

The reliable, deterministic production of trustworthy high-quality single photons is a critical component of discrete variable, optical quantum technology. For single-photon based fully error-corrected quantum computing systems, it is estimated that photon sources will be required to produce a reliable stream of photons at rates exceeding 1 GHz [1]. Photon multiplexing, where low probability sources are combined with switching networks to route successful production events to an output, are a potential solution but requires extremely fast single photon switching with ultra-low loss rates. In this paper we examine the specific properties of the switching elements and present a new design that exploits the general one-way properties of common switching elements such as thermal pads. By introducing multiple switches to a basic, temporal multiplexing device, we are able to use slow switching elements in a multiplexed source being pumped at much faster rates. We model this design under multiple error channels and show that anticipated performance is now limited by the intrinsic loss rate of the optical waveguides within integrated photonic chipsets.
翻訳日:2023-01-19 17:02:49 公開日:2023-01-18
# JT重力の代数と状態

Algebras and States in JT Gravity ( http://arxiv.org/abs/2301.07257v1 )

ライセンス: Link先を確認
Geoff Penington and Edward Witten(参考訳) 正準量子化されたJT重力における境界可観測物の代数を、物質の有無で解析する。 物質がなければ、この代数は可換であり、ADMハミルトニアンによって生成される。 バルク量子場理論と結合した後、それは自明な中心を持つタイプ II$_\infty$ の非常に非可換代数となる。 その結果、境界代数上の密度行列とエントロピーは、それぞれ再スケーリングまたはシフトに対して一意的に定義される。 この代数的エントロピーの定義はユークリッド経路積分を用いて計算される通常の複製トリック定義と一致することを示す。 特定の質量のブラックホールへの$\O(1)$ゆらぎに焦点を当てた以前の議論とは異なり、このタイプII$_\infty$代数は全ての温度やエネルギーで状態を記述する。 我々はまた、時空ワームホールの役割も考慮している。 境界代数と可換なワームホールに関連する作用素を定義することができるが、これは命令的方法で失敗する。 この理論の規制版では、ワームホールとトポロジーの変化を摂動的に組み込むことができる。 ベイビー宇宙状態を含むヒルベルト空間 $\H_\bulk$ は、境界観測者にとってアクセス可能な状態空間 $\H_\bdry$ よりもはるかに大きい。 しかし境界観察者にとって、$\h_\bulk$ 上のすべての純または混合状態は$\h_\bdry$ の純状態と同値である。

We analyze the algebra of boundary observables in canonically quantised JT gravity with or without matter. In the absence of matter, this algebra is commutative, generated by the ADM Hamiltonian. After coupling to a bulk quantum field theory, it becomes a highly noncommutative algebra of Type II$_\infty$ with a trivial center. As a result, density matrices and entropies on the boundary algebra are uniquely defined up to, respectively, a rescaling or shift. We show that this algebraic definition of entropy agrees with the usual replica trick definition computed using Euclidean path integrals. Unlike in previous arguments that focused on $\O(1)$ fluctuations to a black hole of specified mass, this Type II$_\infty$ algebra describes states at all temperatures or energies. We also consider the role of spacetime wormholes. One can try to define operators associated with wormholes that commute with the boundary algebra, but this fails in an instructive way. In a regulated version of the theory, wormholes and topology change can be incorporated perturbatively. The bulk Hilbert space $\H_\bulk$ that includes baby universe states is then much bigger than the space of states $\H_\bdry$ accessible to a boundary observer. However, to a boundary observer, every pure or mixed state on $\H_\bulk$ is equivalent to some pure state in $\H_\bdry$.
翻訳日:2023-01-19 17:02:30 公開日:2023-01-18
# PTA-Det:3次元物体検出のための点雲と画像の関連付け

PTA-Det: Point Transformer Associating Point cloud and Image for 3D Object Detection ( http://arxiv.org/abs/2301.07301v1 )

ライセンス: Link先を確認
Rui Wan, Tianyun Zhao, Wei Zhao(参考訳) 自動運転では、マルチモーダルデータに基づく3次元物体検出は、車両周辺の複雑な環境に対して必須のアプローチとなっている。 マルチモーダル検出において、LiDARとカメラは同時にキャプチャとモデリングに使用される。 しかし、LiDAR点とカメラ画像の固有の相違により、物体検出のためのデータの融合は一連の問題に遭遇する。 多くのマルチモーダル検出法は、lidarのみの方法よりもさらに悪い。 本研究では,マルチモーダル検出の性能向上を目的としたPTA-Det法を提案する。 pta-detと共に、テクスチャや意味的特徴を含む画像情報を疑似ポイントで変換できる疑似ポイントクラウド生成ネットワークが提案されている。 その後、トランスベースポイント融合遷移(pft)モジュールを介して、画像からのライダーポイントと擬似ポイントの特徴を統一されたポイントベース表現の下で深く融合することができる。 これらのモジュールの組み合わせは、モダリティ間の機能融合における大きな障害を克服し、提案生成のための補完的かつ差別的な表現を実現する。 KITTIデータセットの大規模な実験は、PTA-Detが競合する結果を達成し、その有効性を支持することを示している。

In autonomous driving, 3D object detection based on multi-modal data has become an indispensable approach when facing complex environments around the vehicle. During multi-modal detection, LiDAR and camera are simultaneously applied for capturing and modeling. However, due to the intrinsic discrepancies between the LiDAR point and camera image, the fusion of the data for object detection encounters a series of problems. Most multi-modal detection methods perform even worse than LiDAR-only methods. In this investigation, we propose a method named PTA-Det to improve the performance of multi-modal detection. Accompanied by PTA-Det, a Pseudo Point Cloud Generation Network is proposed, which can convert image information including texture and semantic features by pseudo points. Thereafter, through a transformer-based Point Fusion Transition (PFT) module, the features of LiDAR points and pseudo points from image can be deeply fused under a unified point-based representation. The combination of these modules can conquer the major obstacle in feature fusion across modalities and realizes a complementary and discriminative representation for proposal generation. Extensive experiments on the KITTI dataset show the PTA-Det achieves a competitive result and support its effectiveness.
翻訳日:2023-01-19 16:55:25 公開日:2023-01-18
# 量子力学における特異ポテンシャルの非局在化

Nonlocalization of singular potentials in quantum dynamics ( http://arxiv.org/abs/2301.07298v1 )

ライセンス: Link先を確認
Sihong Shao, Lili Su(参考訳) 非局所モデリングはますます注目を集め、科学計算において着実に強力になっている。 本稿では,量子科学における点電荷間の相互作用をモデル化するためによく用いられる特異ポテンシャルを扱う際に,第一原理非局所モデルであるウィグナー関数が優れていることを示す。 ウィグナー方程式の非局所的な性質は、特異ポテンシャルを弱あるいは特異性のないウィグナー核に変換するために完全に利用されており、したがって非常に正確な数値近似が達成可能であるので、特異ポテンシャルが局所シュリンガー方程式で考慮されるときにはほとんど設計されない。 ディラックデルタ関数、対数、および逆パワーポテンシャルを考える。 これらの特異ポテンシャルの下の数値収束ウィグナー関数は、演算子分割スペクトル法を用いて得られ、多くの興味深い量子挙動を示す。

Nonlocal modeling has drawn more and more attention and becomes steadily more powerful in scientific computing. In this paper, we demonstrate the superiority of a first-principle nonlocal model -- Wigner function -- in treating singular potentials which are often used to model the interaction between point charges in quantum science. The nonlocal nature of the Wigner equation is fully exploited to convert the singular potential into the Wigner kernel with weak or even no singularity, and thus highly accurate numerical approximations are achievable, which are hardly designed when the singular potential is taken into account in the local Schr\"odinger equation. The Dirac delta function, the logarithmic, and the inverse power potentials are considered. Numerically converged Wigner functions under all these singular potentials are obtained with an operator splitting spectral method, and display many interesting quantum behaviors as well.
翻訳日:2023-01-19 16:55:04 公開日:2023-01-18
# 現実に直面する物理の両義性について

On the ontological ambiguity of Physics facing Reality ( http://arxiv.org/abs/2301.07297v1 )

ライセンス: Link先を確認
J.E. Horvath, R. Rosas Fernandes and T.E. Idiart (Departamento de Astronomia, IAG-USP, S\~ao Paulo SP, Brazil)(参考訳) 本稿では,ミクロ物理量子リアリティの存在とマクロ物理古典的存在との間の現代物理学における矛盾する立場について論じる。 哲学におけるいくつかの基本的な概念について議論した後、特にベルの定理違反の確認後、量子力学の結果の状況を再考し、マイクロ世界とマクロ世界の間に緊張を生じさせることの重要性について論じる。

We discuss in this work the contradictory position in modern Physics between the existence of a microphysical quantum Reality and macrophysical classical one. After discussing some basic concepts in Philosophy, we revisit the situation of Quantum Mechanics results, particularly after the confirmation of violations of Bell's Theorem, and its significance to create a tension between the micro and the macro world, which is very fundamental and unsolved.
翻訳日:2023-01-19 16:54:50 公開日:2023-01-18
# 多言語微調整と継続事前学習による新しいアンダーリソース言語に対する多言語音声表現モデルの適用

Adapting Multilingual Speech Representation Model for a New, Underresourced Language through Multilingual Fine-tuning and Continued Pretraining ( http://arxiv.org/abs/2301.07295v1 )

ライセンス: Link先を確認
Karol Nowakowski, Michal Ptaszynski, Kyoko Murasaki, Jagna Nieuwa\.zny(参考訳) 近年,大規模多言語テキストや音声データによる自己教師付き事前学習を通じて学習されたニューラルモデルは,特に関連言語からの比較的大量のデータが利用可能である場合に,低リソース言語に対して有望な結果を示した。 この技術は、音声の書き起こしなど、言語ドキュメントプロジェクトで実行されるタスクを促進する可能性があるが、新しい言語毎にスクラッチから多言語モデルを事前学習することは、非常に非現実的だろう。 新しい言語に既存の多言語wav2vec 2.0モデルを適用する可能性について検討し、危惧言語であるアイヌのフィールドワークデータに着目した。 具体的には (i)微調整における類似言語のデータ活用の可能性について検討する。 (ii)対象言語データの事前学習により、モデルの性能が向上できるかどうかを検証する。 その結果, 継続事前学習はwav2vec 2.0モデルを新しい言語に適応させる最も効果的な手法であり, エラー率を著しく低下させることがわかった。 さらに、関連する音声種類や類似した音韻特性を有する非関連言語に事前学習されたモデルが利用可能であれば、その言語からの付加データを用いた多言語微調整は、対象言語にラベル付きデータが少ない場合に音声認識性能に正の影響を与える可能性がある。

In recent years, neural models learned through self-supervised pretraining on large scale multilingual text or speech data have exhibited promising results for underresourced languages, especially when a relatively large amount of data from related language(s) is available. While the technology has a potential for facilitating tasks carried out in language documentation projects, such as speech transcription, pretraining a multilingual model from scratch for every new language would be highly impractical. We investigate the possibility for adapting an existing multilingual wav2vec 2.0 model for a new language, focusing on actual fieldwork data from a critically endangered tongue: Ainu. Specifically, we (i) examine the feasibility of leveraging data from similar languages also in fine-tuning; (ii) verify whether the model's performance can be improved by further pretraining on target language data. Our results show that continued pretraining is the most effective method to adapt a wav2vec 2.0 model for a new language and leads to considerable reduction in error rates. Furthermore, we find that if a model pretrained on a related speech variety or an unrelated language with similar phonological characteristics is available, multilingual fine-tuning using additional data from that language can have positive impact on speech recognition performance when there is very little labeled data in the target language.
翻訳日:2023-01-19 16:54:43 公開日:2023-01-18
# 自己学習の強化

Enhancing Self-Training Methods ( http://arxiv.org/abs/2301.07294v1 )

ライセンス: Link先を確認
Aswathnarayan Radhakrishnan, Jim Davis, Zachary Rabin, Benjamin Lewis, Matthew Scherreik, Roman Ilin(参考訳) 半教師付き学習アプローチはラベル付きデータの小さなセットとラベル付きデータの大きなセットを訓練する。 セルフトレーニング(self-training)は、教師モデルが教師に与えた誤った擬似ラベルを教師モデルが繰り返し過小評価する場合に発生する「確認バイアス(confirmation bias)」の問題に苦しむ半教師学習アプローチである。 このバイアスは、自己学習イテレーションにおける擬似ラベル精度の改善を妨げ、わずか数回のイテレーションの後、モデルパフォーマンスが不必要に飽和する。 本稿では,確認バイアスの影響を軽減するために,自己学習パイプラインを改善するための複数の機能強化について述べる。 既存の自己学習設計選択よりもパフォーマンス向上を示す複数のデータセットに対する拡張を評価した。 最後に,ラベルなしデータ(ラベル付きデータでは見られないクラスを含む)のオープンセットへの拡張可能性についても検討した。

Semi-supervised learning approaches train on small sets of labeled data along with large sets of unlabeled data. Self-training is a semi-supervised teacher-student approach that often suffers from the problem of "confirmation bias" that occurs when the student model repeatedly overfits to incorrect pseudo-labels given by the teacher model for the unlabeled data. This bias impedes improvements in pseudo-label accuracy across self-training iterations, leading to unwanted saturation in model performance after just a few iterations. In this work, we describe multiple enhancements to improve the self-training pipeline to mitigate the effect of confirmation bias. We evaluate our enhancements over multiple datasets showing performance gains over existing self-training design choices. Finally, we also study the extendability of our enhanced approach to Open Set unlabeled data (containing classes not seen in labeled data).
翻訳日:2023-01-19 16:54:19 公開日:2023-01-18
# 連続測定における量子多体ダイナミクスの局在特性

Localization Properties in Disordered Quantum Many-Body Dynamics under Continuous Measurement ( http://arxiv.org/abs/2301.07290v1 )

ライセンス: Link先を確認
Kazuki Yamamoto, Ryusuke Hamazaki(参考訳) 量子軌道法に基づく乱れ量子多体系における連続監視力学とそれに伴う測定誘起相転移の局在特性について検討した。 ランダムな量子軌道間の忠実性を計算することで、乱れと測定が互いに異なる力学特性をもたらすことが証明されるが、両者とも絡み合いの広がりを抑制する力を持っている。 特に, 測度が弱い大規模不規則系では, 定常値に飽和する前に, 忠実度が異常なパワーロー減衰を示すことを解明する。 さらに,ポストセレクションに頼らずに連続的に監視される動的力学において,量子軌道の物理量にアクセスする方法を提案する。 このスキームは実験のコストを大幅に削減することを示した。 この結果は, 連続測定対象の超低温原子で試験でき, エンタングルメントエントロピーの定常特性から理解できない局所化の動的性質を研究するための道を開くことができる。

We study localization properties of continuously monitored dynamics and associated measurement-induced phase transitions in disordered quantum many-body systems on the basis of the quantum trajectory approach. By calculating the fidelity between random quantum trajectories, we demonstrate that the disorder and the measurement can lead to dynamical properties distinct from each other, although both have a power to suppress the entanglement spreading. In particular, in the large-disorder regime with weak measurement, we elucidate that the fidelity exhibits an anomalous power-law decay before saturating to the steady-state value. Furthermore, we propose a general method to access physical quantities for quantum trajectories in continuously monitored dynamics without resorting to postselection. It is demonstrated that this scheme drastically reduces the cost of experiments. Our results can be tested in ultracold atoms subject to continuous measurement and open the avenue to study dynamical properties of localization, which cannot be understood from the stationary properties of the entanglement entropy.
翻訳日:2023-01-19 16:54:05 公開日:2023-01-18
# データ拡張と血管再建のための超音波画像の再構成

Reslicing Ultrasound Images for Data Augmentation and Vessel Reconstruction ( http://arxiv.org/abs/2301.07286v1 )

ライセンス: Link先を確認
Cecilia Morales, Jason Yao, Tejas Rane, Robert Edman, Howie Choset, Artur Dubrawski(参考訳) ロボットガイドカテーテル挿入は、医療従事者が使用できない状況で緊急医療を提供する可能性がある。 しかし、この技術には、身体の解剖学的ランドマークの正確かつ信頼性の高いセグメント化が必要である。 超音波イメージングモードの場合、セグメンテーションモデルの大量のトレーニングデータを取得するのに時間がかかり、費用がかかる。 本稿では,2次元追跡画像から再構成した3Dボリュームをスライスした超音波画像に対する弱い監視データ拡張手法であるRESUS(Relicing of UltraSound Images)を紹介する。 この手法により、超音波画像の物理的制約により生体内で容易に得られない視野を生成し、これらの拡張超音波画像を用いて意味セグメンテーションモデルを訓練することができる。 resusは,非提示画像を用いた訓練よりも統計的に有意な改善を達成し,血管再建による質的改善を強調する。

Robot-guided catheter insertion has the potential to deliver urgent medical care in situations where medical personnel are unavailable. However, this technique requires accurate and reliable segmentation of anatomical landmarks in the body. For the ultrasound imaging modality, obtaining large amounts of training data for a segmentation model is time-consuming and expensive. This paper introduces RESUS (RESlicing of UltraSound Images), a weak supervision data augmentation technique for ultrasound images based on slicing reconstructed 3D volumes from tracked 2D images. This technique allows us to generate views which cannot be easily obtained in vivo due to physical constraints of ultrasound imaging, and use these augmented ultrasound images to train a semantic segmentation model. We demonstrate that RESUS achieves statistically significant improvement over training with non-augmented images and highlight qualitative improvements through vessel reconstruction.
翻訳日:2023-01-19 16:53:49 公開日:2023-01-18
# 新しいスケール不変, 微分可能, 効率的, スケーラブルな正則化器

A Novel, Scale-Invariant, Differentiable, Efficient, Scalable Regularizer ( http://arxiv.org/abs/2301.07285v1 )

ライセンス: Link先を確認
Hovig Tigran Bayandorian(参考訳) l_{0}$, $l_{1}$, $l_{2}$-norm正規化のような$l_{p}$-norm正則化スキームと、重量減衰やグループラッソのような$l_{p}$-norm正則化テクニックは、分離されたモデル重みに反則する量を計算する。 本稿では,$L_{p}$-normに基づいていない新しい正規化器について述べる。 L_{p}$-norm-based regularizationとは対照的に、この正規化器は重み行列内の重みの空間配置に関係している。 この正規化子は損失関数の加法語であり、微分可能で単純で高速で計算しやすく、スケール不変であり、簡単な量の追加メモリを必要とし、容易に並列化できる。 経験的に、この方法は与えられた精度のレベルでゼロでないモデルパラメータの数を約1桁改善する。

$L_{p}$-norm regularization schemes such as $L_{0}$, $L_{1}$, and $L_{2}$-norm regularization and $L_{p}$-norm-based regularization techniques such as weight decay and group LASSO compute a quantity which de pends on model weights considered in isolation from one another. This paper describes a novel regularizer which is not based on an $L_{p}$-norm. In contrast with $L_{p}$-norm-based regularization, this regularizer is concerned with the spatial arrangement of weights within a weight matrix. This regularizer is an additive term for the loss function and is differentiable, simple and fast to compute, scale-invariant, requires a trivial amount of additional memory, and can easily be parallelized. Empirically this method yields approximately a one order-of-magnitude improvement in the number of nonzero model parameters at a given level of accuracy.
翻訳日:2023-01-19 16:53:38 公開日:2023-01-18
# 回帰環境下での分割学習に対するラベル推論攻撃

Label Inference Attack against Split Learning under Regression Setting ( http://arxiv.org/abs/2301.07284v1 )

ライセンス: Link先を確認
Shangyu Xie, Xin Yang, Yuanshun Yao, Tianyi Liu, Taiqing Wang and Jiankai Sun(参考訳) 垂直フェデレートラーニング(vFL)における重要なビルディングブロックとして、スプリットラーニング(SL)は、データサンプルの特徴を一方が保持し、それに対応するラベルを他方が保持する2つのモデルのトレーニングコラボレーションにおいて、その実践を実証した。 共有情報は、プライベートな生データやラベルではなく、埋め込みベクトルと勾配のみであることを考えると、そのような方法はプライベートであると主張する。 しかし、最近の研究によって、プライベートレーベルは勾配によって漏洩する可能性があることが示されている。 これらの既存の攻撃は、プライベートラベルが離散的な分類設定下でのみ機能する。 本研究では,プライベートラベルを(分類における離散ラベルではなく)連続数とする回帰モデルのシナリオにおいて,漏洩についてさらに検討する。 これにより、非バウンド出力範囲による連続ラベルの推測が困難になる。 この制限に対処するために、回帰設定下でラベルを効果的に推測できるモデルトレーニング特性の側面において、勾配情報と余分な学習正規化目標を統合した新しい学習ベースアタックを提案する。 各種データセットおよびモデルに関する包括的実験により,提案した攻撃の有効性を実証した。 vFLフレームワークをよりセキュアにするための今後の分析の道を開いたいと考えています。

As a crucial building block in vertical Federated Learning (vFL), Split Learning (SL) has demonstrated its practice in the two-party model training collaboration, where one party holds the features of data samples and another party holds the corresponding labels. Such method is claimed to be private considering the shared information is only the embedding vectors and gradients instead of private raw data and labels. However, some recent works have shown that the private labels could be leaked by the gradients. These existing attack only works under the classification setting where the private labels are discrete. In this work, we step further to study the leakage in the scenario of the regression model, where the private labels are continuous numbers (instead of discrete labels in classification). This makes previous attacks harder to infer the continuous labels due to the unbounded output range. To address the limitation, we propose a novel learning-based attack that integrates gradient information and extra learning regularization objectives in aspects of model training properties, which can infer the labels under regression settings effectively. The comprehensive experiments on various datasets and models have demonstrated the effectiveness of our proposed attack. We hope our work can pave the way for future analyses that make the vFL framework more secure.
翻訳日:2023-01-19 16:53:21 公開日:2023-01-18
# 画像データを用いたポイントクラウドセグメンテーションネットワークの自己監督事前学習のためのコントラスト学習

Contrastive Learning for Self-Supervised Pre-Training of Point Cloud Segmentation Networks With Image Data ( http://arxiv.org/abs/2301.07283v1 )

ライセンス: Link先を確認
Andrej Janda, Brandon Wagstaff, Edwin G. Ng, and Jonathan Kelly(参考訳) ラベルが不足しコストがかかる場合、教師付きトレーニングに必要なアノテーションの量を減らすことが不可欠です。 この削減は、3Dデータセットを含むセマンティックセグメンテーションタスクにおいて特に重要である。 ラベルのないデータに対する自己教師付き事前トレーニングは、手動アノテーションの量を減らす方法のひとつだ。 以前の作業では、ポイントクラウドのみによる事前トレーニングに重点を置いていた。 便利ではあるが、このアプローチは2つ以上の登録ビューを必要とすることが多い。 本研究では,まず自己教師付き画像特徴を学習し,その特徴を用いて3次元モデルを訓練することで,画像とポイントクラウドのモダリティを組み合わせる。 多くの3dデータセットにしばしば含まれる画像データを組み込むことで、事前学習方法はシーンのスキャンを1回だけ必要とし、ローカライズ情報が利用できない場合に適用できる。 当社の事前トレーニングアプローチは、単一のスキャンを使用しても、他のマルチスキャン、ポイントクラウドのみの方法と同等のパフォーマンスを実現しています。

Reducing the quantity of annotations required for supervised training is vital when labels are scarce and costly. This reduction is particularly important for semantic segmentation tasks involving 3D datasets, which are often significantly smaller and more challenging to annotate than their image-based counterparts. Self-supervised pre-training on unlabelled data is one way to reduce the amount of manual annotations needed. Previous work has focused on pre-training with point clouds exclusively. While useful, this approach often requires two or more registered views. In the present work, we combine image and point cloud modalities by first learning self-supervised image features and then using these features to train a 3D model. By incorporating image data, which is often included in many 3D datasets, our pre-training method only requires a single scan of a scene and can be applied to cases where localization information is unavailable. We demonstrate that our pre-training approach, despite using single scans, achieves comparable performance to other multi-scan, point cloud-only methods.
翻訳日:2023-01-19 16:52:59 公開日:2023-01-18
# スピン環境における初期系環境相関の役割

The role of initial system-environment correlations with a spin environment ( http://arxiv.org/abs/2301.07332v1 )

ライセンス: Link先を確認
Ali Raza Mirza, Mah Noor Jamil, Adam Zaman Chaudhry(参考訳) オープン量子システムは、その理解が現代の量子技術の実装において不可欠であるため、大きな関心を集めている。 それらの力学の研究において、初期システム環境相関の役割は一般的に無視される。 そこで本研究では,スピン環境と相互作用する1つの2レベル系の完全可解モデルと,適切なユニタリ操作により初期系状態を設定する。 初期系環境相関を考慮しながら任意の系環境結合強度のダイナミクスを正確に解くことにより,初期相関の効果は一般に非常に重要かつ非自明であることを示す。 また,初期システム環境相関の重要性をさらに強調するため,共振環境と相互作用する2つの2レベルシステム間の絡み合いのダイナミクスについて検討する。

Open quantum systems are a subject of immense interest as their understanding is crucial in the implementation of modern quantum technologies. In the study of their dynamics, the role of the initial system-environment correlations is commonly ignored. In this work, to gain insights into the role of these correlations, we solve an exactly solvable model of a single two-level system interacting with a spin environment, with the initial system state prepared by a suitable unitary operation. By solving the dynamics exactly for arbitrary system-environment coupling strength while taking into account the initial system-environment correlations, we show that the effect of the initial correlations is, in general, very significant and non-trivial. To further highlight the importance of the initial system-environment correlations, we also extend our study to investigate the dynamics of the entanglement between two two-level systems interacting with a common spin environment.
翻訳日:2023-01-19 16:47:45 公開日:2023-01-18
# FPANet:フレームレベルのポストアライメントを用いた周波数ベースのビデオデモ

FPANet: Frequency-based Video Demoireing using Frame-level Post Alignment ( http://arxiv.org/abs/2301.07330v1 )

ライセンス: Link先を確認
Gyeongrok Oh, Heon Gu, Sangpil Kim, Jinkyu Kim(参考訳) 重なり合うギルドパターン間の干渉はモアレパターンを生成し、通常のデジタルカメラによってデジタルディスプレイ装置の画面をキャプチャする画像の視覚的品質を低下させる。 このようなモアレパターンの除去は、様々なサイズと色歪の複雑なパターンのために困難である。 既存のアプローチは主に空間領域におけるフィルタリングに重点を置いており、大規模なモアレパターンの除去に失敗した。 本稿では、周波数領域と空間領域の両方でフィルタを学習し、モアレパターンの様々なサイズを除去して復元品質を向上させるFPANetと呼ばれる新しいモデルを提案する。 さらに,複数の連続したフレームを学習し,フレーム不変なコンテンツ特徴を抽出し,品質の高い時間整合画像を出力する。 提案手法の有効性を実証し,PSNR, SSIM, LPIPS, FVD, FSIMなどの画像・映像品質指標を用いて, ESDNet, VDmoire, MBCNN, WDNet, UNet, DMCNNといった最先端の手法よりも優れていることを示す。

Interference between overlapping gird patterns creates moire patterns, degrading the visual quality of an image that captures a screen of a digital display device by an ordinary digital camera. Removing such moire patterns is challenging due to their complex patterns of diverse sizes and color distortions. Existing approaches mainly focus on filtering out in the spatial domain, failing to remove a large-scale moire pattern. In this paper, we propose a novel model called FPANet that learns filters in both frequency and spatial domains, improving the restoration quality by removing various sizes of moire patterns. To further enhance, our model takes multiple consecutive frames, learning to extract frame-invariant content features and outputting better quality temporally consistent images. We demonstrate the effectiveness of our proposed method with a publicly available large-scale dataset, observing that ours outperforms the state-of-the-art approaches, including ESDNet, VDmoire, MBCNN, WDNet, UNet, and DMCNN, in terms of the image and video quality metrics, such as PSNR, SSIM, LPIPS, FVD, and FSIM.
翻訳日:2023-01-19 16:47:30 公開日:2023-01-18
# 光流から脱落する深部動的シーン

Deep Dynamic Scene Deblurring from Optical Flow ( http://arxiv.org/abs/2301.07329v1 )

ライセンス: Link先を確認
Jiawei Zhang, Jinshan Pan, Daoye Wang, Shangchen Zhou, Xing Wei, Furong Zhao, Jianbo Liu, and Jimmy Ren(参考訳) デブロアリングは、視覚的により快適な写真を提供し、写真をより便利にするだけでなく、対物検出やトラッキングの性能を向上させることができる。 しかし,画像からダイナミックなシーンのぼやけを取り除くことは,一様でないシーンのぼやけを数学的にモデル化することが難しいため,非自明な作業である。 いくつかの手法は、まず1つまたは複数の画像を用いて光学フローを推定し(これはぼやけたカーネルの近似として扱われる)、その後、シャープな画像を再構成するために非ブリンドデブラリングアルゴリズムを採用する。 しかし、これらの手法はエンドツーエンドの方法では訓練できず、通常は計算コストがかかる。 本稿では,マルチスケール空間変動型リカレントニューラルネットワーク(RNN)を用いて,動的シーンのぼかしを取り除く光学的流れを探索する。 フローネットを用いて2つの連続画像から異なるスケールで光流を推定する。 推定された光学フローはRNNの重量を異なるスケールで提供し、RNNが特徴空間のぼやけを取り除くのに役立つ。 最後に,難解な特徴から鮮明な画像を復元する畳み込みニューラルネットワーク(CNN)を開発した。 ベンチマークデータセットにおける定量的・質的評価は,提案手法が精度,速度,モデルサイズにおいて最先端のアルゴリズムに対して好適であることを示している。

Deblurring can not only provide visually more pleasant pictures and make photography more convenient, but also can improve the performance of objection detection as well as tracking. However, removing dynamic scene blur from images is a non-trivial task as it is difficult to model the non-uniform blur mathematically. Several methods first use single or multiple images to estimate optical flow (which is treated as an approximation of blur kernels) and then adopt non-blind deblurring algorithms to reconstruct the sharp images. However, these methods cannot be trained in an end-to-end manner and are usually computationally expensive. In this paper, we explore optical flow to remove dynamic scene blur by using the multi-scale spatially variant recurrent neural network (RNN). We utilize FlowNets to estimate optical flow from two consecutive images in different scales. The estimated optical flow provides the RNN weights in different scales so that the weights can better help RNNs to remove blur in the feature spaces. Finally, we develop a convolutional neural network (CNN) to restore the sharp images from the deblurred features. Both quantitative and qualitative evaluations on the benchmark datasets demonstrate that the proposed method performs favorably against state-of-the-art algorithms in terms of accuracy, speed, and model size.
翻訳日:2023-01-19 16:47:07 公開日:2023-01-18
# HSTFormer:3次元人物位置推定のための階層型空間時間変換器

HSTFormer: Hierarchical Spatial-Temporal Transformers for 3D Human Pose Estimation ( http://arxiv.org/abs/2301.07322v1 )

ライセンス: Link先を確認
Xiaoye Qian, Youbao Tang, Ning Zhang, Mei Han, Jing Xiao, Ming-Chun Huang, Ruei-Sung Lin(参考訳) トランスフォーマーに基づくアプローチは、2次元ポーズシーケンスから3次元ポーズ推定(HPE)に成功し、最先端(SOTA)性能を達成した。 しかし、現在のSOTAは、異なるレベルの関節の空間的時間的相関を同時にモデル化することは困難である。 これはポーズの時空間的複雑さによる。 ポーズは、様々な関節や身体の一部が空間的に動きながら、一時的に様々な速度で動きます。 したがって、クッキー・カッター変圧器は対応不能であり、"in-the-wild"要件を満たさない。 この問題を軽減するために,階層型空間時間変換器(HSTFormer)を提案する。 HSTFormerは4つのトランスフォーマーエンコーダ(TE)と融合モジュールで構成される。 我々の知る限りでは、HSTFormerは階層的なTEをマルチレベル融合で研究した最初の人です。 3つのデータセット(Human3.6M、MPI-INF-3DHP、HumanEva)の大規模な実験により、HSTFormerは様々なスケールと難易度を持つベンチマーク上で、競争力と一貫性のあるパフォーマンスを達成することが示された。 具体的には、MPI-INF-3DHPデータセットと小規模のHumanEvaデータセットに関する最近のSOTAを、高度に一般化された体系的アプローチで超越している。 コードはhttps://github.com/qianxiaoye825/hstformerで入手できる。

Transformer-based approaches have been successfully proposed for 3D human pose estimation (HPE) from 2D pose sequence and achieved state-of-the-art (SOTA) performance. However, current SOTAs have difficulties in modeling spatial-temporal correlations of joints at different levels simultaneously. This is due to the poses' spatial-temporal complexity. Poses move at various speeds temporarily with various joints and body-parts movement spatially. Hence, a cookie-cutter transformer is non-adaptable and can hardly meet the "in-the-wild" requirement. To mitigate this issue, we propose Hierarchical Spatial-Temporal transFormers (HSTFormer) to capture multi-level joints' spatial-temporal correlations from local to global gradually for accurate 3D HPE. HSTFormer consists of four transformer encoders (TEs) and a fusion module. To the best of our knowledge, HSTFormer is the first to study hierarchical TEs with multi-level fusion. Extensive experiments on three datasets (i.e., Human3.6M, MPI-INF-3DHP, and HumanEva) demonstrate that HSTFormer achieves competitive and consistent performance on benchmarks with various scales and difficulties. Specifically, it surpasses recent SOTAs on the challenging MPI-INF-3DHP dataset and small-scale HumanEva dataset, with a highly generalized systematic approach. The code is available at: https://github.com/qianxiaoye825/HSTFormer.
翻訳日:2023-01-19 16:46:45 公開日:2023-01-18
# 教師なしreidにおけるロバストな知識適応

Robust Knowledge Adaptation for Federated Unsupervised Person ReID ( http://arxiv.org/abs/2301.07320v1 )

ライセンス: Link先を確認
Jianfeng Weng, Kun Hu, Tingting Yao, Jingya Wang, Zhiyong Wang(参考訳) 個人再識別(ReID)は近年,公安の需要の増加により広く研究されている。 しかし、機密性の高い個人情報の収集と処理はプライバシーの懸念を引き起こす。 そのため、異なる団体(団体)間で最小限の機密データを共有することを目的としたPerson ReIDのために、連合学習が検討されている。 しかし、既存のフェデレート学習ベースの人物ReIDメソッドは一般的に、手間と時間を要するデータアノテーションに依存しており、ドメイン間の一貫性を保証することは困難である。 そこで本研究では,Person ReIDに対して,FedUCC(Federated Unsupervised Cluster-Contrastive)学習法を提案する。 FedUCCは粗い方法で3段階のモデリング戦略を導入した。 詳細は、ディープニューラルネットワークを用いて、汎用知識、専門知識、パッチ知識が発見される。 これにより、ネットワーク層の種類とパラメータに基づいて、ローカルドメイン固有の知識を保持しながら、クライアント間での相互知識の共有が可能になる。 8つの公開ベンチマークデータセットの総合的な実験により,提案手法の最先端性能が実証された。

Person Re-identification (ReID) has been extensively studied in recent years due to the increasing demand in public security. However, collecting and dealing with sensitive personal data raises privacy concerns. Therefore, federated learning has been explored for Person ReID, which aims to share minimal sensitive data between different parties (clients). However, existing federated learning based person ReID methods generally rely on laborious and time-consuming data annotations and it is difficult to guarantee cross-domain consistency. Thus, in this work, a federated unsupervised cluster-contrastive (FedUCC) learning method is proposed for Person ReID. FedUCC introduces a three-stage modelling strategy following a coarse-to-fine manner. In detail, generic knowledge, specialized knowledge and patch knowledge are discovered using a deep neural network. This enables the sharing of mutual knowledge among clients while retaining local domain-specific knowledge based on the kinds of network layers and their parameters. Comprehensive experiments on 8 public benchmark datasets demonstrate the state-of-the-art performance of our proposed method.
翻訳日:2023-01-19 16:46:18 公開日:2023-01-18
# 連続学習のための適応的統合知識蒸留と予測不確実性

Adaptively Integrated Knowledge Distillation and Prediction Uncertainty for Continual Learning ( http://arxiv.org/abs/2301.07316v1 )

ライセンス: Link先を確認
Kanghao Chen, Sijia Liu, Ruixuan Wang and Wei-Shi Zheng(参考訳) 現在のディープラーニングモデルは、新しい知識を継続的に学習する場合、古い知識を破滅的に忘れてしまうことが多い。 この問題を軽減する既存の戦略は、古い知識(安定性)と新しい知識(可塑性)のトレードオフをしばしば解決します。 しかしながら、継続的な学習における安定性と可塑性のトレードオフは、モデルパフォーマンスを改善するために動的に変更する必要がある。 本稿では,モデルの安定性と塑性を適応的にバランスさせる2つの新しい手法を提案する。 1つ目は、複数の古い知識を適応的に統合し、それを新しいモデルの各ブロックレベルに転送することである。 2つ目は、モデルトレーニング中に新しい知識を学ぶことの重要性を自然に調整するために、古い知識の予測の不確実性を利用する。 我々の知る限り、モデル予測の不確かさと知識蒸留を連続学習に結びつけるのはこれが初めてである。 さらに,特に古い知識のデータを補うために改良されたカットミックスを適用し,破滅的な忘れ方問題をさらに緩和する。 CIFAR100とImageNetデータセットの大規模評価により,提案手法の有効性が確認された。

Current deep learning models often suffer from catastrophic forgetting of old knowledge when continually learning new knowledge. Existing strategies to alleviate this issue often fix the trade-off between keeping old knowledge (stability) and learning new knowledge (plasticity). However, the stability-plasticity trade-off during continual learning may need to be dynamically changed for better model performance. In this paper, we propose two novel ways to adaptively balance model stability and plasticity. The first one is to adaptively integrate multiple levels of old knowledge and transfer it to each block level in the new model. The second one uses prediction uncertainty of old knowledge to naturally tune the importance of learning new knowledge during model training. To our best knowledge, this is the first time to connect model prediction uncertainty and knowledge distillation for continual learning. In addition, this paper applies a modified CutMix particularly to augment the data for old knowledge, further alleviating the catastrophic forgetting issue. Extensive evaluations on the CIFAR100 and the ImageNet datasets confirmed the effectiveness of the proposed method for continual learning.
翻訳日:2023-01-19 16:46:04 公開日:2023-01-18
# クリップと10億画像データセットの時代における顔認識

Face Recognition in the age of CLIP & Billion image datasets ( http://arxiv.org/abs/2301.07315v1 )

ライセンス: Link先を確認
Aaditya Bhat, Shrey Jain(参考訳) OpenAIが開発したCLIP(Contrastive Language- Image Pre-training)モデルは、画像認識や検索タスクにおいて優れた成果を上げ、ゼロショット性能が強い。 これは、明示的に訓練されていないタスクで効果的に実行できることを意味する。 OpenAI CLIPの成功に触発されて、LAION-5Bと呼ばれる新しい公開データセットが収集され、OpenAI L/14モデルを上回るオープンViT-H/14、ViT-G/14モデルが開発された。 laion-5bデータセットは、検索とサブセット生成のためのwebインターフェースを備えた、ほぼ近い隣接インデックスもリリースした。 本稿では,様々なCLIPモデルの性能をゼロショット顔認識器として評価する。 以上の結果から,CLIPモデルが顔認識タスクで良好に機能することが示唆されるが,CLIPモデルのサイズが大きくなることで必ずしも精度が向上するとは限らない。 さらに,CLIPモデルによるデータ中毒攻撃に対するロバスト性について検討し,その性能を有毒データで検証した。 この分析を通じて,CLIPモデルを用いて構築された検索エンジンの潜在的な影響と誤用を理解することを目指しており,これは意図しない顔認識エンジンとして機能する可能性がある。

CLIP (Contrastive Language-Image Pre-training) models developed by OpenAI have achieved outstanding results on various image recognition and retrieval tasks, displaying strong zero-shot performance. This means that they are able to perform effectively on tasks for which they have not been explicitly trained. Inspired by the success of OpenAI CLIP, a new publicly available dataset called LAION-5B was collected which resulted in the development of open ViT-H/14, ViT-G/14 models that outperform the OpenAI L/14 model. The LAION-5B dataset also released an approximate nearest neighbor index, with a web interface for search & subset creation. In this paper, we evaluate the performance of various CLIP models as zero-shot face recognizers. Our findings show that CLIP models perform well on face recognition tasks, but increasing the size of the CLIP model does not necessarily lead to improved accuracy. Additionally, we investigate the robustness of CLIP models against data poisoning attacks by testing their performance on poisoned data. Through this analysis, we aim to understand the potential consequences and misuse of search engines built using CLIP models, which could potentially function as unintentional face recognition engines.
翻訳日:2023-01-19 16:45:48 公開日:2023-01-18
# PT対称系におけるネーターの定理の拡張と光学装置における実験的実証

Extension of Noether's theorem in PT-symmetric systems and its experimental demonstration in an optical setup ( http://arxiv.org/abs/2301.07314v1 )

ライセンス: Link先を確認
Q. C. Wu, J. L. Zhao, Y. L. Fang, Y. Zhang, D. X. Chen, C. P. Yang, and F. Nori(参考訳) ネーターの定理(英: Noether's theorem)は物理学の基本法則の一つで、物理系の対称性と運動と保存則の定数を関連付ける。 一方、非エルミートパリティ時間(pt)対称系には様々な種類があり、新しい量子特性を示し、関心を集めている。 本研究では、ネーターの定理を、pt対称ハミルトニアン h の固有値が純粋実数から純粋虚数へ変化する重要な pt-対称系のクラスに拡張し、生物直交量子力学に基づく作用素の一般化された期待値を導入する。 時間非依存作用素の一般化期待値は、PT対称性の非破壊状態における標準対称性またはPT対称性の破壊状態におけるカイラル対称性を示すときの運動定数である。 さらに,光学装置を用いたPT-対称単量子系と2量子系におけるネーターの定理の拡張を実験的に検討した。 本実験は, 運動定数の存在を実証し, この運動定数を用いてシステムのPT対称性が壊れているかどうかを判断する。 さらに、量子情報をマスキングする新しい現象がPT対称2量子ビット系で最初に観測される。 この研究は、pt対称性物理学における対称性と保存則の関係を完全に理解するだけでなく、量子情報理論や量子通信プロトコルにも応用できる可能性がある。

Noether's theorem is one of the fundamental laws in physics, relating the symmetry of a physical system to its constant of motion and conservation law. On the other hand, there exist a variety of non-Hermitian parity-time (PT)-symmetric systems, which exhibit novel quantum properties and have attracted increasing interest. In this work, we extend Noether's theorem to a class of significant PT -symmetric systems for which the eigenvalues of the PT-symmetric Hamiltonian H change from purely real numbers to purely imaginary numbers,and introduce a generalized expectation value of an operator based on biorthogonal quantum mechanics. We find that the generalized expectation value of a time-independent operator is a constant of motion when the operator presents a standard symmetry in the PT -symmetry unbroken regime, or a chiral symmetry in the PT-symmetry broken regime. In addition, we experimentally investigate the extended Noether's theorem in PT -symmetric single-qubit and two-qubit systems using an optical setup. Our experiment demonstrates the existence of the constant of motion and reveals how this constant of motion can be used to judge whether the PT -symmetry of a system is broken. Furthermore, a novel phenomenon of masking quantum information is first observed in a PT -symmetric two-qubit system. This study not only contributes to full understanding of the relation between symmetry and conservation law in PT -symmetric physics, but also has potential applications in quantum information theory and quantum communication protocols.
翻訳日:2023-01-19 16:45:29 公開日:2023-01-18
# 雑音認識によるロバスト損失の耐雑音性向上

Improve Noise Tolerance of Robust Loss via Noise-Awareness ( http://arxiv.org/abs/2301.07306v1 )

ライセンス: Link先を確認
Kehui Ding, Jun Shu, Deyu Meng, Zongben Xu(参考訳) ロバスト損失最小化は、雑音ラベルの堅牢な学習問題を扱うための重要な戦略である。 しかし、現在のロバストな損失は必然的に、ノイズラベルを持つ異なるデータセットに対して、手動またはヒューリスティックにクロス検証によってチューニングされるハイパーパラメータを必要とする。 既存のロバストな損失法は通常、すべてのトレーニングサンプルがインスタンスに依存しない共通のハイパーパラメータを共有していると仮定する。 これにより、異なるサンプルの個々のノイズ特性を識別できるようになり、異なるノイズ構造に適応することができない。 上記の問題に対処するため,我々は,インスタンス依存のハイパーパラメータを用いてロバストな損失を組み立て,理論的な保証によりノイズ耐性を向上させることを提案する。 本研究では,高パラメータ予測関数であるNARL-Adjuster(Noth-Aware-Robust-Loss-Adjuster)を適応的に学習するメタ学習手法を提案する。 具体的には, ハイパーパラメータ予測関数と分類器パラメータの相互改善により, 両者を高精度に改善・調整し, 解の一般化が図れるようにした。 4種類のsotaロバスト損失を本アルゴリズムと統合し,提案手法の耐雑音性能と一般化性能の両方において,提案手法の汎用性と有効性を検証した。 一方、明示的なパラメータ化構造により、メタ学習予測関数は、ノイズのあるラベルを持つ未知のデータセットに簡単に転送でき、プラグアンドプレイできる。 具体的には、メタ学習したNARL-Adjusterを、いくつかの実雑音データセットを含む未知のタスクに転送し、従来のハイパーパラメータチューニング戦略よりも優れたパフォーマンスを実現する。

Robust loss minimization is an important strategy for handling robust learning issue on noisy labels. Current robust losses, however, inevitably involve hyperparameters to be tuned for different datasets with noisy labels, manually or heuristically through cross validation, which makes them fairly hard to be generally applied in practice. Existing robust loss methods usually assume that all training samples share common hyperparameters, which are independent of instances. This limits the ability of these methods on distinguishing individual noise properties of different samples, making them hardly adapt to different noise structures. To address above issues, we propose to assemble robust loss with instance-dependent hyperparameters to improve their noise-tolerance with theoretical guarantee. To achieve setting such instance-dependent hyperparameters for robust loss, we propose a meta-learning method capable of adaptively learning a hyperparameter prediction function, called Noise-Aware-Robust-Loss-Adjuster (NARL-Adjuster). Specifically, through mutual amelioration between hyperparameter prediction function and classifier parameters in our method, both of them can be simultaneously finely ameliorated and coordinated to attain solutions with good generalization capability. Four kinds of SOTA robust losses are attempted to be integrated with our algorithm, and experiments substantiate the general availability and effectiveness of the proposed method in both its noise tolerance and generalization performance. Meanwhile, the explicit parameterized structure makes the meta-learned prediction function capable of being readily transferrable and plug-and-play to unseen datasets with noisy labels. Specifically, we transfer our meta-learned NARL-Adjuster to unseen tasks, including several real noisy datasets, and achieve better performance compared with conventional hyperparameter tuning strategy.
翻訳日:2023-01-19 16:45:01 公開日:2023-01-18
# PIRLNav: ObjectNavのイミュレーションとRLファインタニングによる事前トレーニング

PIRLNav: Pretraining with Imitation and RL Finetuning for ObjectNav ( http://arxiv.org/abs/2301.07302v1 )

ライセンス: Link先を確認
Ram Ramrakhya, Dhruv Batra, Erik Wijmans, Abhishek Das(参考訳) 我々は,新しい環境に位置する仮想ロボットに物体への移動を依頼する,オブジェクトのナビゲーションについて研究する。 先行研究では、人間のデモンストレーションのデータセット上の模倣学習(il)が有望な結果をもたらすことが示されている。 しかし、この制限は$-$である。 1)il政策は,訓練が行動を模倣せず,その結果を模倣しているため,新しい州に悪影響を与える。 2) デモの収集は費用がかかる。 一方、強化学習(rl)は微妙にスケーラブルであるが、望ましい行動を達成するには注意深い報酬工学が必要である。 本稿では,人間の実演におけるil前訓練とrl-finetuningの2段階学習方式を提案する。 これによりPIRLNavポリシーが実現され、ObjectNavの最先端技術は60.0%$成功率から65.0%$$+5.0\%$絶対値へと進歩する。 このil$\rightarrow$rlトレーニングレシピを用いて,設計選択の厳密な経験的分析を行う。 まず,人間によるデモンストレーションを,例えば,最短経路 (SP) やタスク非依存フロンティア探索 (FE) といった,デモンストレーションの「自由」(自動生成)ソースに置き換えることができるかを検討する。 IL$\rightarrow$RLはSPとFEの軌道上でIL$\rightarrow$RLより優れており、TRAIN上で同じIL-pretraining成功のために制御されている場合や、IL-pretraining成功がSPまたはFEポリシーに好まれるVALエピソードのサブセットであっても、IL$\rightarrow$RLより優れている。 次に、RLファインタニング性能がIL事前学習データセットのサイズとどのようにスケールするかを検討する。 IL事前トレーニングデータセットのサイズを拡大し、高いIL精度に達すると、RLファインタニングによる改善は小さくなり、最高のIL$\rightarrow$RLポリシーの性能は、ILデモの半分未満で達成できることがわかった。 最後に、objectnavポリシーの障害モードを分析し、さらに改善するためのガイドラインを提示します。

We study ObjectGoal Navigation - where a virtual robot situated in a new environment is asked to navigate to an object. Prior work has shown that imitation learning (IL) on a dataset of human demonstrations achieves promising results. However, this has limitations $-$ 1) IL policies generalize poorly to new states, since the training mimics actions not their consequences, and 2) collecting demonstrations is expensive. On the other hand, reinforcement learning (RL) is trivially scalable, but requires careful reward engineering to achieve desirable behavior. We present a two-stage learning scheme for IL pretraining on human demonstrations followed by RL-finetuning. This leads to a PIRLNav policy that advances the state-of-the-art on ObjectNav from $60.0\%$ success rate to $65.0\%$ ($+5.0\%$ absolute). Using this IL$\rightarrow$RL training recipe, we present a rigorous empirical analysis of design choices. First, we investigate whether human demonstrations can be replaced with `free' (automatically generated) sources of demonstrations, e.g. shortest paths (SP) or task-agnostic frontier exploration (FE) trajectories. We find that IL$\rightarrow$RL on human demonstrations outperforms IL$\rightarrow$RL on SP and FE trajectories, even when controlled for the same IL-pretraining success on TRAIN, and even on a subset of VAL episodes where IL-pretraining success favors the SP or FE policies. Next, we study how RL-finetuning performance scales with the size of the IL pretraining dataset. We find that as we increase the size of the IL-pretraining dataset and get to high IL accuracies, the improvements from RL-finetuning are smaller, and that $90\%$ of the performance of our best IL$\rightarrow$RL policy can be achieved with less than half the number of IL demonstrations. Finally, we analyze failure modes of our ObjectNav policies, and present guidelines for further improving them.
翻訳日:2023-01-19 16:44:30 公開日:2023-01-18
# ViT-AE++:自己教師型医用画像表現のための視覚変換器オートエンコーダの改良

ViT-AE++: Improving Vision Transformer Autoencoder for Self-supervised Medical Image Representations ( http://arxiv.org/abs/2301.07382v1 )

ライセンス: Link先を確認
Chinmay Prabhakar, Hongwei Bran Li, Jiancheng Yang, Suprosana Shit, Benedikt Wiestler, and Bjoern Menze(参考訳) 自己教師付き学習は、アノテーションなしでデータからデータ駆動表現を学ぶことで注目を集めている。 He et al. (2021) による視覚トランスフォーマーベースのオートエンコーダ (ViT-AE) は、パッチマスキング戦略を用いて有意義な潜在空間を学習する。 本稿では,2次元画像と3次元画像の両方をより効果的に表現するために,ViT-AE++(ViT-AE++)の改良に焦点を当てる。 学習段階における表現強化のための2つの新しい損失関数を提案する。 最初の損失項は、構造化された依存関係を考慮し、間接的に表現を改善することで自己再構成を改善することを目的としている。 第2の損失項は、対照的な損失を利用して、2つのランダムにマスキングされたビューから直接表現を最適化する。 独立したコントリビューションとして,VT-AE++をボリューム医療画像の3Dスタイルに拡張した。 自然画像と医用画像の両方においてVT-AE++を広範囲に評価し,バニラVT-AEよりも一貫した改善と,他のコントラスト学習アプローチよりも優位性を示した。

Self-supervised learning has attracted increasing attention as it learns data-driven representation from data without annotations. Vision transformer-based autoencoder (ViT-AE) by He et al. (2021) is a recent self-supervised learning technique that employs a patch-masking strategy to learn a meaningful latent space. In this paper, we focus on improving ViT-AE (nicknamed ViT-AE++) for a more effective representation of both 2D and 3D medical images. We propose two new loss functions to enhance the representation during the training stage. The first loss term aims to improve self-reconstruction by considering the structured dependencies and hence indirectly improving the representation. The second loss term leverages contrastive loss to directly optimize the representation from two randomly masked views. As an independent contribution, we extended ViT-AE++ to a 3D fashion for volumetric medical images. We extensively evaluate ViT-AE++ on both natural images and medical images, demonstrating consistent improvement over vanilla ViT-AE and its superiority over other contrastive learning approaches.
翻訳日:2023-01-19 16:38:09 公開日:2023-01-18
# 大域多相推定のための一般的なプロトコル

A general protocol for global multiphase estimation ( http://arxiv.org/abs/2301.07380v1 )

ライセンス: Link先を確認
Giovanni Chesi, Roberto Rubboli, Alberto Riccardi, Lorenzo Maccone and Chiara Macchiavello(参考訳) グローバルな推定戦略は、事前の知識を使わずに相や相の集合に関する情報を抽出し、代わりに局所的な推定戦略に必要となる。 我々は、ホールボ推定理論に基づく大域的多相プロトコルを考案し、デジタル推定の場合、すなわち、それらと対応する推定子の間の相互情報の観点から位相を推定することに適用する。 単一相のシナリオでは、プロトコルは2つの特定の既知の最適戦略を含んでいる。 2つの位相の同時推定に拡張し,その性能評価を行った。 そして、位相の一般数を同時に推定するときに、精度で最終的なデジタルバウンドを求める。 多相戦略では、独立な単相推定の列に関して一定の量子長所しか存在しないことを示す。 これは近年の類似の結果を拡張し、多相増強の探索に関する論争が解決した。

Global estimation strategies allow to extract information on a phase or a set of phases without any prior knowledge, which is, instead, required for local estimation strategies. We devise a global multiphase protocol based on Holevo's estimation theory and apply it to the case of digital estimation, i.e. we estimate the phases in terms of the mutual information between them and the corresponding estimators. In the single-phase scenario, the protocol encompasses two specific known optimal strategies. We extend them to the simultaneous estimation of two phases and evaluate their performance. Then, we retrieve the ultimate digital bound on precision when a generic number of phases is simultaneously estimated. We show that in the multiphase strategy there is only a constant quantum advantage with respect to a sequence of independent single-phase estimations. This extends a recent similar result, which settled a controversy on the search for the multiphase enhancement.
翻訳日:2023-01-19 16:37:47 公開日:2023-01-18
# 楕円型インタフェース問題を解くディリクレ・ノイマン学習アルゴリズム

Dirichlet-Neumann learning algorithm for solving elliptic interface problems ( http://arxiv.org/abs/2301.07361v1 )

ライセンス: Link先を確認
Qi Sun, Xuejun Xu, and Haotian Yi(参考訳) 重複しない領域分解法は、様々な分野から生じるインタフェース問題を解くのに自然であるが、数値シミュレーションは技術的解析を必要とし、しばしば高品質なグリッドの使用によってのみ利用でき、より複雑な状況での使用を妨げる。 メッシュ生成の負担を解消し,インターフェースジャンプ条件に効果的に取り組むために,高コントラスト係数と不規則なインターフェースを用いたベンチマーク楕円型インタフェース問題を解決するために,ディリクレ・ノイマン学習アルゴリズム(Dirichlet-Neumann learning algorithm)を提案する。 変分原理を用いて,ニューラルネットワーク拡張演算子を用いたdirichlet-neumannアルゴリズムを実現するための手法として,分解された各部分問題に対する境界ペナルティ処理による不一致を評価するための厳密な誤り解析を行う。 提案手法の有効性とロバスト性は, 一連の楕円型インタフェース問題を通じて実験的に実証され, 特に界面に誤ったフラックス予測が存在する場合に, 他の選択肢よりも優れた性能が得られた。

Non-overlapping domain decomposition methods are natural for solving interface problems arising from various disciplines, however, the numerical simulation requires technical analysis and is often available only with the use of high-quality grids, thereby impeding their use in more complicated situations. To remove the burden of mesh generation and to effectively tackle with the interface jump conditions, a novel mesh-free scheme, i.e., Dirichlet-Neumann learning algorithm, is proposed in this work to solve the benchmark elliptic interface problem with high-contrast coefficients as well as irregular interfaces. By resorting to the variational principle, we carry out a rigorous error analysis to evaluate the discrepancy caused by the boundary penalty treatment for each decomposed subproblem, which paves the way for realizing the Dirichlet-Neumann algorithm using neural network extension operators. The effectiveness and robustness of our proposed methods are demonstrated experimentally through a series of elliptic interface problems, achieving better performance over other alternatives especially in the presence of erroneous flux prediction at interface.
翻訳日:2023-01-19 16:37:35 公開日:2023-01-18
# MADAv2: 高度なマルチアンカーベースのアクティブドメイン適応セグメンテーション

MADAv2: Advanced Multi-Anchor Based Active Domain Adaptation Segmentation ( http://arxiv.org/abs/2301.07354v1 )

ライセンス: Link先を確認
Munan Ning, Donghuan Lu, Yujia Xie, Dongdong Chen, Dong Wei, Yefeng Zheng, Yonghong Tian, Shuicheng Yan, Li Yuan(参考訳) 教師なしのドメイン適応は、注釈付きデータの少ないタスクで広く採用されている。 残念なことに、ターゲットドメインの分布をソースドメインに無条件にマッピングすると、ターゲットドメインデータの本質的な構造情報を歪めてしまう可能性があるため、性能は低下する。 この問題に対処するため,まず,セマンティックセグメンテーションタスクに関するドメイン適応を支援するために,アクティブなサンプル選択を提案する。 単一セントロイドの代わりに複数のアンカーを革新的に採用することにより、ソース領域とターゲット領域の両方を、ターゲット領域からより相補的かつ有益なサンプルを選択するマルチモーダル分布として特徴づけることができる。 これらのアクティブなサンプルを手作業でアノテートするワークロードは少ないので、ターゲットドメイン分布の歪みを効果的に軽減することができ、パフォーマンス向上が図れる。 さらに, 長期分布問題を緩和し, さらにセグメンテーション性能を向上させるために, 強力な半教師付きドメイン適応戦略を提案する。 公開データセットで広範な実験を行い,提案手法が最先端手法を大きなマージンで上回り,gta5では71.4%miou,synthiaでは71.8%miouに匹敵する性能を実現することを示した。 それぞれの成分の有効性は、徹底的なアブレーション研究によって検証される。

Unsupervised domain adaption has been widely adopted in tasks with scarce annotated data. Unfortunately, mapping the target-domain distribution to the source-domain unconditionally may distort the essential structural information of the target-domain data, leading to inferior performance. To address this issue, we firstly propose to introduce active sample selection to assist domain adaptation regarding the semantic segmentation task. By innovatively adopting multiple anchors instead of a single centroid, both source and target domains can be better characterized as multimodal distributions, in which way more complementary and informative samples are selected from the target domain. With only a little workload to manually annotate these active samples, the distortion of the target-domain distribution can be effectively alleviated, achieving a large performance gain. In addition, a powerful semi-supervised domain adaptation strategy is proposed to alleviate the long-tail distribution problem and further improve the segmentation performance. Extensive experiments are conducted on public datasets, and the results demonstrate that the proposed approach outperforms state-of-the-art methods by large margins and achieves similar performance to the fully-supervised upperbound, i.e., 71.4% mIoU on GTA5 and 71.8% mIoU on SYNTHIA. The effectiveness of each component is also verified by thorough ablation studies.
翻訳日:2023-01-19 16:37:16 公開日:2023-01-18
# 漸近的および触媒的マトリックスの偏化

Asymptotic and catalytic matrix majorization ( http://arxiv.org/abs/2301.07353v1 )

ライセンス: Link先を確認
Muhammad Usman Farooq and Tobias Fritz and Erkka Haapasalo and Marco Tomamichel(参考訳) 行列の偏化問題は、確率ベクトルの2つのタプルが与えられたとき、一方のタプルを他方に変換する1つの確率行列が存在するかどうかを問う。 Mu と al による開問題を解くと、ある単調(すなわち Renyi divergences の多変量拡大)が2つのタプルの間で厳密に順序付けられている場合、十分に大きな$n$に対して、各入力分布の$n$コピーを対応する出力分布の$n$コピーに取る確率行列が存在することを示す。 モノトンに対する非制限順序を持つ同じ条件は、そのような漸近行列のメジャー化にも必要である。 この結果、各入力分布の1つのコピーを、変化しない触媒の助けを借りて対応する出力分布に大まかに変換するマップも得られる。 任意の誤差で変換が可能であると、そのような触媒行列の偏化に必要かつ十分である条件が見つかる。 著者の1人が最近開発した事前順序付き半環の一般代数的理論に基づいて、その結果を導出する。 これにより、漸近的および触媒的偏化に関する様々な既存の結果と相対的偏化を統一的に回収することができる。

The matrix majorization problem asks, given two tuples of probability vectors, whether there exists a single stochastic matrix transforming one tuple into the other. Solving an open problem due to Mu et al, we show that if certain monotones - namely multivariate extensions of Renyi divergences - are strictly ordered between the two tuples, then for sufficiently large $n$, there exists a stochastic matrix taking $n$ copies of each input distribution to $n$ copies of the corresponding output distribution. The same conditions, with non-strict ordering for the monotones, are also necessary for such asymptotic matrix majorization. Our result also yields a map that approximately converts a single copy of each input distribution to the corresponding output distribution with the help of a catalyst that is returned unchanged. Allowing for transformation with arbitrarily small error, we find conditions that are both necessary and sufficient for such catalytic matrix majorization. We derive our results by building on a general algebraic theory of preordered semirings recently developed by one of the authors. This also allows us to recover various existing results on asymptotic and catalytic majorization as well as relative majorization in a unified manner.
翻訳日:2023-01-19 16:36:53 公開日:2023-01-18
# 位置ゲーム用QBF符号化における暗黙の状態と目標(拡張版)

Implicit State and Goals in QBF Encodings for Positional Games (extended version) ( http://arxiv.org/abs/2301.07345v1 )

ライセンス: Link先を確認
Irfansha Shaik, Valentin Mayer-Eichberger, Jaco van de Pol, Abdallah Saffidine(参考訳) 我々は,Hex や Tic-Tac-Toe のようなメーカブレーカの位置決めゲームにおいて,QBF の簡潔なエンコーディングのボトルネックに対処する。 我々のベースラインは、ボード位置の明示的な変数と勝利構成の明示的な表現を備えたQBF符号化である。 最初の改善は、持ち上げ計画にインスパイアされ、明示的なボード位置の変数を避け、象徴的なボード状態を表す普遍的な量化器を導入した。 2つ目の改善は、勝利した構成を暗黙的に表現し、その構造を利用する。 本論文は,ボードサイズとゲーム深度に応じて,複数のエンコーディングのサイズを評価する。 また、これらのエンコーディングにおけるQBFソルバの性能についても報告する。 Hex インスタンスのテクニックを評価し,Harary の Tic-Tac-Toe に適用する。 特に、人間のhexトーナメントでプレーする19ドル(約1万2000円)のボードに拡張性を研究する。

We address two bottlenecks for concise QBF encodings of maker-breaker positional games, like Hex and Tic-Tac-Toe. Our baseline is a QBF encoding with explicit variables for board positions and an explicit representation of winning configurations. The first improvement is inspired by lifted planning and avoids variables for explicit board positions, introducing a universal quantifier representing a symbolic board state. The second improvement represents the winning configurations implicitly, exploiting their structure. The paper evaluates the size of several encodings, depending on board size and game depth. It also reports the performance of QBF solvers on these encodings. We evaluate the techniques on Hex instances and also apply them to Harary's Tic-Tac-Toe. In particular, we study scalability to 19$\times$19 boards, played in human Hex tournaments.
翻訳日:2023-01-19 16:36:30 公開日:2023-01-18
# KILDST:ガゼッタと話者情報を用いた対話状態追跡のための効果的な知識統合学習

KILDST: Effective Knowledge-Integrated Learning for Dialogue State Tracking using Gazetteer and Speaker Information ( http://arxiv.org/abs/2301.07341v1 )

ライセンス: Link先を確認
Hyungtak Choi, Hyeonmok Ko, Gurpreet Kaur, Lohith Ravuru, Kiranmayi Gandikota, Manisha Jhawar, Simma Dharani, Pranamya Patil(参考訳) 対話状態追跡 (dst) は対話システムの中核研究であり, 注目を集めている。 さらに、ユーザ間の対話から情報を抽出・推薦する会話型aiに向けたステップとして、ユーザ間の対話を扱うことができる新しい問題を定義する必要がある。 そこで我々は,イベントスケジューリング(DST-USERS)に関するユーザ間の対話から,新しいタスクDSTを導入する。 DST-USERSタスクは、ユーザ間の対話状態を理解し、追跡し、誰がスケジュールを提案し、誰が提案スケジュールに同意するかを理解する必要があるため、はるかに難しい。 dst-users researchを容易にするために,スケジュールを計画するユーザ間の対話データセットを開発する。 対話で抽出する必要がある注釈付きスロット値は、日付、時間、場所である。 従来,Machine Reading Comprehension (MRC) や従来のDST技術のような手法は,我々の広範囲な評価において,良い結果を得られなかった。 知識統合学習法を採用することで,優れた結果が得られる。 提案するモデルアーキテクチャは,ガゼッタの特徴と話者情報を効率的に結合する。 スケジュールを計画するユーザ間の対話データセットの評価から,モデルがベースラインモデルより優れていることを示す。

Dialogue State Tracking (DST) is core research in dialogue systems and has received much attention. In addition, it is necessary to define a new problem that can deal with dialogue between users as a step toward the conversational AI that extracts and recommends information from the dialogue between users. So, we introduce a new task - DST from dialogue between users about scheduling an event (DST-USERS). The DST-USERS task is much more challenging since it requires the model to understand and track dialogue states in the dialogue between users and to understand who suggested the schedule and who agreed to the proposed schedule. To facilitate DST-USERS research, we develop dialogue datasets between users that plan a schedule. The annotated slot values which need to be extracted in the dialogue are date, time, and location. Previous approaches, such as Machine Reading Comprehension (MRC) and traditional DST techniques, have not achieved good results in our extensive evaluations. By adopting the knowledge-integrated learning method, we achieve exceptional results. The proposed model architecture combines gazetteer features and speaker information efficiently. Our evaluations of the dialogue datasets between users that plan a schedule show that our model outperforms the baseline model.
翻訳日:2023-01-19 16:36:18 公開日:2023-01-18
# ソフトティーチングアシスタントによる半教師付き意味セグメンテーション

Semi-Supervised Semantic Segmentation via Gentle Teaching Assistant ( http://arxiv.org/abs/2301.07340v1 )

ライセンス: Link先を確認
Ying Jin, Jiaqi Wang, and Dahua Lin(参考訳) 半教師付き意味セグメンテーションは、限定されたラベル付きデータと大量のラベルなしデータでセグメンテーションモデルを訓練することを目的としている。 ラベルなしデータを有効に活用するために、教師と教師の枠組みと共に擬似ラベル付けが半教師付き意味セグメンテーションに広く採用されている。 有効であることが証明されたが、このパラダイムは必然的に存在し、補助訓練データとして扱われる誤った擬似ラベルに悩まされている。 誤った擬似ラベルによるネガティブな影響を軽減するため、私たちは現在のセミスーパービジョンセマンティックセマンティックセマンティクスフレームワークを掘り下げる。 擬似ラベル付きラベル付きラベル付きデータは特徴抽出器における代表的特徴の学習を促進することができるが,マスク予測器を監督することは信頼できない。 そこで本研究では,学生モデルの特徴抽出器とマスク予測器に擬似ラベルが与える影響を解消する新しい枠組みであるジェントル指導アシスタント(GTA-Seg)を提案する。 具体的には,教師教育の枠組みに加えて,教師ネットワークが生成する疑似ラベルから直接学習する指導補助ネットワークを提案する。 指数移動平均(EMA)方式で、特徴抽出器の有益特徴表現知識のみを学生モデルに伝達し、マスク予測器における信頼性の低い擬似ラベルによる負の影響から生徒モデルを保護し、優雅な指導アシスタント(GTA)を作成する。 学生モデルはまた、信頼できるラベル付きデータによって監督され、正確なマスク予測を訓練し、さらに特徴表現を促進する。 ベンチマークデータセットの大規模な実験結果から,本手法が従来手法と競合する性能を示した。 コードはhttps://github.com/Jin-Ying/GTA-Seg.comで入手できる。

Semi-Supervised Semantic Segmentation aims at training the segmentation model with limited labeled data and a large amount of unlabeled data. To effectively leverage the unlabeled data, pseudo labeling, along with the teacher-student framework, is widely adopted in semi-supervised semantic segmentation. Though proved to be effective, this paradigm suffers from incorrect pseudo labels which inevitably exist and are taken as auxiliary training data. To alleviate the negative impact of incorrect pseudo labels, we delve into the current Semi-Supervised Semantic Segmentation frameworks. We argue that the unlabeled data with pseudo labels can facilitate the learning of representative features in the feature extractor, but it is unreliable to supervise the mask predictor. Motivated by this consideration, we propose a novel framework, Gentle Teaching Assistant (GTA-Seg) to disentangle the effects of pseudo labels on feature extractor and mask predictor of the student model. Specifically, in addition to the original teacher-student framework, our method introduces a teaching assistant network which directly learns from pseudo labels generated by the teacher network. The gentle teaching assistant (GTA) is coined gentle since it only transfers the beneficial feature representation knowledge in the feature extractor to the student model in an Exponential Moving Average (EMA) manner, protecting the student model from the negative influences caused by unreliable pseudo labels in the mask predictor. The student model is also supervised by reliable labeled data to train an accurate mask predictor, further facilitating feature representation. Extensive experiment results on benchmark datasets validate that our method shows competitive performance against previous methods. Code is available at https://github.com/Jin-Ying/GTA-Seg.
翻訳日:2023-01-19 16:36:00 公開日:2023-01-18
# ゼロショットセマンティクスセグメンテーションのための擬似ラベルを用いたクラス拡張損失

Class Enhancement Losses with Pseudo Labels for Zero-shot Semantic Segmentation ( http://arxiv.org/abs/2301.07336v1 )

ライセンス: Link先を確認
Son Duy Dao, Hengcan Shi, Dinh Phung, Jianfei Cai(参考訳) 最近のマスク提案モデルは、ゼロショットセマンティックセグメンテーションの性能を大幅に改善した。 しかし、これらのメソッドのトレーニング中に‘バックグラウンド’埋め込みを使用することは問題であり、結果として得られるモデルは、正しいラベルではなく、すべての未発見のクラスをバックグラウンドクラスとして過剰に学習し割り当てる傾向がある。 さらに, テキスト埋め込みのセマンティックな関係を無視し, 目に見えないクラスと密接な関係を持つため, ゼロショット予測に極めて有益であると考えられる。 そこで本稿では,学習中の背景エンベディングを回避し,類似度スコアをランク付けすることで,テキスト埋め込みとマスク提案間の意味的関係を同時に活用する新しいクラス拡張損失を提案する。 そこで本研究では,視覚言語モデルを用いた効果的な擬似ラベル生成パイプラインを提案する。 いくつかのベンチマークデータセットにおける広範囲な実験により,ゼロショットセマンティクスセグメンテーションの総合的性能が得られた。 本手法は柔軟であり,オープン語彙セマンティックセグメンテーション問題にも適用可能である。

Recent mask proposal models have significantly improved the performance of zero-shot semantic segmentation. However, the use of a `background' embedding during training in these methods is problematic as the resulting model tends to over-learn and assign all unseen classes as the background class instead of their correct labels. Furthermore, they ignore the semantic relationship of text embeddings, which arguably can be highly informative for zero-shot prediction as seen classes may have close relationship with unseen classes. To this end, this paper proposes novel class enhancement losses to bypass the use of the background embbedding during training, and simultaneously exploit the semantic relationship between text embeddings and mask proposals by ranking the similarity scores. To further capture the relationship between seen and unseen classes, we propose an effective pseudo label generation pipeline using pretrained vision-language model. Extensive experiments on several benchmark datasets show that our method achieves overall the best performance for zero-shot semantic segmentation. Our method is flexible, and can also be applied to the challenging open-vocabulary semantic segmentation problem.
翻訳日:2023-01-19 16:35:27 公開日:2023-01-18
# 有限射影平面による分子ハミルトニアンの近似最適測定スケジューリング

Almost optimal measurement scheduling of molecular Hamiltonian via finite projective plane ( http://arxiv.org/abs/2301.07335v1 )

ライセンス: Link先を確認
Wataru Inoue and Koki Aoyama and Yusuke Teranishi and Keita Kanno and Yuya O. Nakagawa and Kosuke Mitarai(参考訳) 我々は、量子コンピュータ上の量子化学における分子ハミルトニアンを測定するための効率的でほぼ最適のスキームを提案し、これには2n^2$の異なる測定が必要であり、n$は分子軌道の数である。 ボネット=モンローグらによる以前の提案を改善することで、最先端を実現する。 [phys. rev. x 10, 031064 (2020)] では、先頭の順序で$\frac{17}{6}n^2$スケーリングを示す。 分子ハミルトニアンに含まれる同時測定可能な作用素の集合を構成する有限射影平面に基づく新しい方法を開発した。 各測定は、量子ハードウェア上の量子ビットの線形接続を仮定して、ジョルダン・ウィグナーとパリティ写像の下で、$O(N^2)$1および2量子ビットゲートからなる深さ$O(N)$回路のみを必要とする。 分子ハミルトニアンの期待値の評価は、量子デバイスから量子化学への応用における大きなボトルネックの1つであるため、このような応用を加速することが期待される。

We propose an efficient and almost optimal scheme for measuring molecular Hamiltonians in quantum chemistry on quantum computers, which requires $2N^2$ distinct measurements in the leading order with $N$ being the number of molecular orbitals. It achieves the state-of-the-art by improving a previous proposal by Bonet-Monroig et al. [Phys. Rev. X 10, 031064 (2020)] which exhibits $\frac{17}{6}N^2$ scaling in the leading order. We develop a novel method based on a finite projective plane to construct sets of simultaneously-measurable operators contained in molecular Hamiltonians. Each measurement only requires a depth-$O(N)$ circuit consisting of $O(N^2)$ one- and two-qubit gates under the Jordan-Wigner and parity mapping, assuming the linear connectivity of qubits on quantum hardwares. Because evaluating expectation values of molecular Hamiltonians is one of the major bottlenecks in the applications of quantum devices to quantum chemistry, our finding is expected to accelerate such applications.
翻訳日:2023-01-19 16:35:10 公開日:2023-01-18
# リワードシェアの取引を通じて参加する学習

Learning to Participate through Trading of Reward Shares ( http://arxiv.org/abs/2301.07416v1 )

ライセンス: Link先を確認
Michael K\"olle, Tim Matheis, Philipp Altmann and Kyrill Schmid(参考訳) 自律的なエージェントを協調して行動させることは、私たちの日常生活に人工知能を統合するための重要なステップである。 エージェントに報酬を与えて協力を促進しようとする手法もあるが,本論文では,エージェントが報酬の取得によって他のエージェントのリターンに参加する機会を持つような,株式市場に触発された手法を提案する。 直感的には、エージェントは、他のエージェントの報酬に直接影響を受けるとき、共通の関心に応じて行動することを学ぶことができる。 テストされた一般マルコフゲームによる実証結果から、このメカニズムは社会的ジレンマの状況において、独立に訓練されたエージェント間の協調政策を促進することが示された。 さらに、時間的および空間的に拡張された領域で示されるように、参加は役割の発展とエージェント間のサブタスクの分割につながる可能性がある。

Enabling autonomous agents to act cooperatively is an important step to integrate artificial intelligence in our daily lives. While some methods seek to stimulate cooperation by letting agents give rewards to others, in this paper we propose a method inspired by the stock market, where agents have the opportunity to participate in other agents' returns by acquiring reward shares. Intuitively, an agent may learn to act according to the common interest when being directly affected by the other agents' rewards. The empirical results of the tested general-sum Markov games show that this mechanism promotes cooperative policies among independently trained agents in social dilemma situations. Moreover, as demonstrated in a temporally and spatially extended domain, participation can lead to the development of roles and the division of subtasks between the agents.
翻訳日:2023-01-19 16:29:10 公開日:2023-01-18
# ノイズなしのノイズ画像の表現

Representing Noisy Image Without Denoising ( http://arxiv.org/abs/2301.07409v1 )

ライセンス: Link先を確認
Shuren Qi, Yushu Zhang, Chao Wang, Tao Xiang, Xiaochun Cao, Yong Xiang(参考訳) 人工知能における長年のトピックは、ノイズの多い画像からパターンを効果的に認識することである。 この点において、最近のデータ駆動パラダイムは 1)訓練段階(すなわちデータ増強)にノイズのあるサンプルを追加することにより、表現力の向上 2)逆問題(すなわち画像デノーミング)を解決するために,雑音画像の事前処理を行う。 しかし、これらの手法は一般に非効率なプロセスと不安定な結果を示し、実用的応用を制限している。 本稿では,ノイズの多い画像から直接頑健な表現を導出することを目的とした非学習パラダイムについて検討する。 ここで、ノイズロバスト表現はラドン空間(fmr)における分数次モーメントとして設計され、直交性と回転不変性の有益な性質を持つ。 従来の整数順序法と異なり, 古典的手法を特殊ケースとして取り入れたより汎用的な設計であり, 導入された分数次パラメータは, 古典的手法では利用できない時間周波数解析機能を提供する。 形式的には、FMRを構築するための暗黙の経路と明示的な経路の両方を詳細に議論する。 特に雑音のロバスト性, 回転不変性, 時間周波数識別性において, fmrの特異性と有用性を示すために, 広範なシミュレーション実験と画像セキュリティ応用を行った。

A long-standing topic in artificial intelligence is the effective recognition of patterns from noisy images. In this regard, the recent data-driven paradigm considers 1) improving the representation robustness by adding noisy samples in training phase (i.e., data augmentation) or 2) pre-processing the noisy image by learning to solve the inverse problem (i.e., image denoising). However, such methods generally exhibit inefficient process and unstable result, limiting their practical applications. In this paper, we explore a non-learning paradigm that aims to derive robust representation directly from noisy images, without the denoising as pre-processing. Here, the noise-robust representation is designed as Fractional-order Moments in Radon space (FMR), with also beneficial properties of orthogonality and rotation invariance. Unlike earlier integer-order methods, our work is a more generic design taking such classical methods as special cases, and the introduced fractional-order parameter offers time-frequency analysis capability that is not available in classical methods. Formally, both implicit and explicit paths for constructing the FMR are discussed in detail. Extensive simulation experiments and an image security application are provided to demonstrate the uniqueness and usefulness of our FMR, especially for noise robustness, rotation invariance, and time-frequency discriminability.
翻訳日:2023-01-19 16:28:55 公開日:2023-01-18
# tame: 畳み込みニューラルネットワークの説明マップ生成のための注意機構に基づく特徴融合

TAME: Attention Mechanism Based Feature Fusion for Generating Explanation Maps of Convolutional Neural Networks ( http://arxiv.org/abs/2301.07407v1 )

ライセンス: Link先を確認
Mariano Ntrougkas, Nikolaos Gkalelis, Vasileios Mezaris(参考訳) ニューラルネットワークの明確な‘ブラックボックス’の性質は、説明責任が不可欠であるアプリケーションにおいて、採用の障壁となる。 本稿では,マルチブランチ階層的注意機構を用いた説明マップ生成手法であるtoa(trainable attention mechanism for explanations)を提案する。 TAMEは、アテンションメカニズムを使用して、ターゲットモデルの特徴マップを複数のレイヤから組み合わせて、説明マップに変換する。 注意機構の訓練方法の最適化と対象モデルの特徴マップの選択を合理化することにより、任意の畳み込みニューラルネットワーク(cnn)に容易に適用することができる。 訓練後、説明地図は1つの前方パスで計算できる。 我々は、VGG-16とResNet-50という2つの広く使われているモデルにTAMEを適用する。 また、TAMEアーキテクチャの異なるバリエーションのパフォーマンスを比較した総合的アブレーション研究も提供する。 TAMEソースコードはhttps://github.com/bmezaris/TAMEで公開されている。

The apparent ``black box'' nature of neural networks is a barrier to adoption in applications where explainability is essential. This paper presents TAME (Trainable Attention Mechanism for Explanations), a method for generating explanation maps with a multi-branch hierarchical attention mechanism. TAME combines a target model's feature maps from multiple layers using an attention mechanism, transforming them into an explanation map. TAME can easily be applied to any convolutional neural network (CNN) by streamlining the optimization of the attention mechanism's training method and the selection of target model's feature maps. After training, explanation maps can be computed in a single forward pass. We apply TAME to two widely used models, i.e. VGG-16 and ResNet-50, trained on ImageNet and show improvements over previous top-performing methods. We also provide a comprehensive ablation study comparing the performance of different variations of TAME's architecture. TAME source code is made publicly available at https://github.com/bmezaris/TAME
翻訳日:2023-01-19 16:28:35 公開日:2023-01-18
# HiDAnet:階層的深度認識によるRGB-D能動物体検出

HiDAnet: RGB-D Salient Object Detection via Hierarchical Depth Awareness ( http://arxiv.org/abs/2301.07405v1 )

ライセンス: Link先を確認
Zongwei Wu, Guillaume Allibert, Fabrice Meriaudeau, Chao Ma, and C\'edric Demonceaux(参考訳) RGB-Dサリエンシ検出は、多モードキューを融合してサリエント領域を正確にローカライズすることを目的としている。 既存の作業は、しばしば機能モデリングの注意モジュールを採用しており、セマンティックキューとマージするためにきめ細かい詳細を明示的に活用するメソッドはほとんどない。 したがって、補助的な深度情報にもかかわらず、既存のモデルでは類似の外観を持つがカメラ距離が異なる物体を区別することは依然として困難である。 本稿では,新しい視点から,RGB-Dサリエンシ検出のための階層的深度認識ネットワーク(HiDAnet)を提案する。 我々のモチベーションは、幾何学的先行の多粒性特性がニューラルネットワーク階層とよく相関しているという観察から来ています。 マルチモーダル・マルチレベル融合を実現するために,まず粒度に着目し,rgbの識別力と深さ特性を分離して強化する。 次に,多段核融合と多段核融合のためのクロス二重アテンションモジュールを粗い方法で導入する。 符号化されたマルチモーダル機能は徐々に共有デコーダに集約される。 さらに、階層情報を完全に活用するために、マルチスケールの損失を利用する。 挑戦的なベンチマークデータセットに関する大規模な実験は、我々のHiDAnetが最先端の手法よりも大きなマージンで好適に機能していることを示している。

RGB-D saliency detection aims to fuse multi-modal cues to accurately localize salient regions. Existing works often adopt attention modules for feature modeling, with few methods explicitly leveraging fine-grained details to merge with semantic cues. Thus, despite the auxiliary depth information, it is still challenging for existing models to distinguish objects with similar appearances but at distinct camera distances. In this paper, from a new perspective, we propose a novel Hierarchical Depth Awareness network (HiDAnet) for RGB-D saliency detection. Our motivation comes from the observation that the multi-granularity properties of geometric priors correlate well with the neural network hierarchies. To realize multi-modal and multi-level fusion, we first use a granularity-based attention scheme to strengthen the discriminatory power of RGB and depth features separately. Then we introduce a unified cross dual-attention module for multi-modal and multi-level fusion in a coarse-to-fine manner. The encoded multi-modal features are gradually aggregated into a shared decoder. Further, we exploit a multi-scale loss to take full advantage of the hierarchical information. Extensive experiments on challenging benchmark datasets demonstrate that our HiDAnet performs favorably over the state-of-the-art methods by large margins.
翻訳日:2023-01-19 16:28:20 公開日:2023-01-18
# トポロジカルデータ分析による暗号化ビットの分類

Using Topological Data Analysis to classify Encrypted Bits ( http://arxiv.org/abs/2301.07393v1 )

ライセンス: Link先を確認
Jayati Kaushik and Aaruni Kaushik and Upasana Parashar(参考訳) 暗号化されたビットを異なるクラスに分類するためにトポロジカルデータ解析を適用する方法を提案する。 永続ホモロジーを適用して、暗号化の集合から得られる点雲の位相的特徴を生成する。 この機械学習パイプラインは、従来の機械学習モデルがそのタスクを実行できない場合に、データをうまく分類することができる。 また、このパイプラインは、暗号化されたデータをリアルに分類し、与えられた暗号化されたビットを分類する手法として機能する。

We present a way to apply topological data analysis for classifying encrypted bits into distinct classes. Persistent homology is applied to generate topological features of a point cloud obtained from sets of encryptions. We see that this machine learning pipeline is able to classify our data successfully where classical models of machine learning fail to perform the task. We also see that this pipeline works as a dimensionality reduction method making this approach to classify encrypted data a realistic method to classify the given encryptioned bits.
翻訳日:2023-01-19 16:27:59 公開日:2023-01-18
# 相対論的デジタルツイン:IoTを未来に持ち込む

Relativistic Digital Twin: Bringing the IoT to the Future ( http://arxiv.org/abs/2301.07390v1 )

ライセンス: Link先を確認
Luca Sciullo, Alberto De Marchi, Angelo Trotta, Federico Montori, Luciano Bononi, Marco Di Felice(参考訳) 複雑なIoTエコシステムは、予測分析を実行し、何のシナリオをシミュレートするために、物理資産のDigital Twins(DT)の使用を必要とすることが多い。 DTはIoTデバイスを複製し、行動の変化に時間をかけて適応することができる。 しかし、IoTのDTは一般的に、異なるシナリオにシームレスに適応することが可能になるため、特定のユースケースに合わせて調整される。 さらに、IoTの断片化は、複数のデータフォーマットとIoTネットワークプロトコルの使用を特徴とする異種シナリオでのDTのデプロイ方法に、さらなる課題をもたらす。 本稿では、IoTエンティティの汎用DTを自動的に生成し、実際のオブジェクトを常に観察することで、時間とともに行動モデルを調整するRelativistic Digital Twin(RDT)フレームワークを提案する。 このフレームワークはWeb of Things(WoT)を通じたオブジェクト表現に依存しており、各IoTデバイスとDTに標準化されたインターフェースを提供する。 この目的のために、W3C WoT標準を拡張し、行動モデルの概念を包含し、新しい語彙を通してThing Description (TD)で定義した。 最後に, 室内温度の予測能力を備えた模擬スマートホームシナリオのDTと, 屋外シナリオにおける軌道の予測能力を備えた実世界のドローンのDTの2つの不整合ユースケースに対するRTTフレームワークの評価を行った。

Complex IoT ecosystems often require the usage of Digital Twins (DTs) of their physical assets in order to perform predictive analytics and simulate what-if scenarios. DTs are able to replicate IoT devices and adapt over time to their behavioral changes. However, DTs in IoT are typically tailored to a specific use case, without the possibility to seamlessly adapt to different scenarios. Further, the fragmentation of IoT poses additional challenges on how to deploy DTs in heterogeneous scenarios characterized by the usage of multiple data formats and IoT network protocols. In this paper, we propose the Relativistic Digital Twin (RDT) framework, through which we automatically generate general purpose DTs of IoT entities and tune their behavioral models over time by constantly observing their real counterparts. The framework relies on the object representation via the Web of Things (WoT), to offer a standardized interface to each of the IoT devices as well as to their DTs. To this purpose, we extended the W3C WoT standard in order to encompass the concept of behavioral model and define it in the Thing Description (TD) through a new vocabulary. Finally, we evaluated the RDT framework over two disjoint use cases to assess its correctness and learning performance, i.e. the DT of a simulated smart home scenario with the capability of forecasting the indoor temperature, and the DT of a real-world drone with the capability of forecasting its trajectory in an outdoor scenario.
翻訳日:2023-01-19 16:27:50 公開日:2023-01-18
# 見たり読んだりできるモデルに向けて

Towards Models that Can See and Read ( http://arxiv.org/abs/2301.07389v1 )

ライセンス: Link先を確認
Roy Ganz, Oren Nuriel, Aviad Aberdam, Yair Kittenplon, Shai Mazor, Ron Litman(参考訳) 最も一般的な視覚言語タスクである視覚質問応答(vqa)と画像キャプション(cap)には、画像中のテキストから推論を必要とする類似のシーンテキストバージョンがある。 両者の間に明らかな類似性があるにもかかわらず、両者は独立して扱われ、見るか読むかのどちらかが可能なタスク固有のメソッドが生み出される。 本研究では,この現象の詳細な解析を行い,既存のマルチモーダルアーキテクチャのシーンテキスト理解機能を実現するUnified Text-Non-TextアプローチであるUniTNTを提案する。 具体的には、シーンテキスト情報を付加的なモダリティとして扱い、指定されたモジュールを介して事前訓練されたエンコーダデコーダベースのアーキテクチャと融合する。 徹底的な実験の結果、UniTNTは両方のタスクタイプをうまく扱える最初の単一モデルに導かれることがわかった。 さらに、シーンテキスト理解機能により、VQAおよびCAPにおける視覚言語モデルの性能が最大3.49%向上し、0.7CIDEr向上することを示す。

Visual Question Answering (VQA) and Image Captioning (CAP), which are among the most popular vision-language tasks, have analogous scene-text versions that require reasoning from the text in the image. Despite the obvious resemblance between them, the two are treated independently, yielding task-specific methods that can either see or read, but not both. In this work, we conduct an in-depth analysis of this phenomenon and propose UniTNT, a Unified Text-Non-Text approach, which grants existing multimodal architectures scene-text understanding capabilities. Specifically, we treat scene-text information as an additional modality, fusing it with any pretrained encoder-decoder-based architecture via designated modules. Thorough experiments reveal that UniTNT leads to the first single model that successfully handles both task types. Moreover, we show that scene-text understanding capabilities can boost vision-language models' performance on VQA and CAP by up to 3.49% and 0.7 CIDEr, respectively.
翻訳日:2023-01-19 16:27:26 公開日:2023-01-18
# ボルツマン密度の変形軌道の学習

Learning Deformation Trajectories of Boltzmann Densities ( http://arxiv.org/abs/2301.07388v1 )

ライセンス: Link先を確認
B\'alint M\'at\'e, Fran\c{c}ois Fleuret(参考訳) 本研究では, サンプルの有無ではなく, エネルギー関数の存在下で使用可能な連続正規化フローのトレーニング目標を提案する。 対象エネルギー $f_1$ と一般化ガウス値 $f_0(x) = (|x|/\sigma)^p$ のエネルギー関数とのエネルギー関数の、所定の補間または学習補間 $f_t$ のいずれかに依存する。 これはボルツマン密度$p_t \propto e^{-f_t}$を補間し、この密度の族に沿ってサンプルを輸送する時間依存ベクトル場$V_t$を求める。 具体的には、この条件は$V_t$と$f_t$の間でPDEに変換することができ、このPDEが保持できない量を最小化する。 この目的をガウス混合上の逆KL偏差と円上の$\phi^4$格子場理論と比較する。

We introduce a training objective for continuous normalizing flows that can be used in the absence of samples but in the presence of an energy function. Our method relies on either a prescribed or a learnt interpolation $f_t$ of energy functions between the target energy $f_1$ and the energy function of a generalized Gaussian $f_0(x) = (|x|/\sigma)^p$. This then induces an interpolation of Boltzmann densities $p_t \propto e^{-f_t}$ and we aim to find a time-dependent vector field $V_t$ that transports samples along this family of densities. Concretely, this condition can be translated to a PDE between $V_t$ and $f_t$ and we minimize the amount by which this PDE fails to hold. We compare this objective to the reverse KL-divergence on Gaussian mixtures and on the $\phi^4$ lattice field theory on a circle.
翻訳日:2023-01-19 16:27:09 公開日:2023-01-18
# 膀胱変形の三次元再構築とキャラクタリゼーション

Three-dimensional reconstruction and characterization of bladder deformations ( http://arxiv.org/abs/2301.07385v1 )

ライセンス: Link先を確認
Augustin C. Ogier, Stanislas Rapacchi, Marc-Emmanuel Bellemare(参考訳) 背景と目的: 骨盤床障害は一般的な疾患であり, 骨盤床の動態はよく分かっていないため, 患者のケアは困難である。 今のところ,排便時のストレッチ運動の2次元動的観察はクリニックでのみ可能であり,三次元骨盤器官の機械的欠陥の理解はまだ達成できない。 本研究では, 運動中の非可逆性膀胱変形の3次元表現と, 臓器表面の最大ひずみ領域の位置を合成した3次元表現とを組み合わせ, 完全な3次元表現法を提案する。 方法: 動的膀胱容積の再構築のために, 画像分割法と登録法を, 最新の動的マルチスライスMRIの3つの幾何学的構成と組み合わせた。 結果: 腹腔内強制呼吸運動負荷下での膀胱のリアルタイム3次元変形場を初めて提案した。 強制呼吸運動を行った8名の被験者に対して, 方法の可能性を検討した。 再建ブラジャーの動的体積の平均体積偏差は2.5 %程度であり, 平均距離値0.4 $\pm$0.3 mm, ハウスドルフ距離値2.2 $\pm$1.1 mmの登録精度が高かった。 結論: 迅速な獲得を伴うクリニックへの即時移動が可能な枠組みは, 骨盤底疾患の領域において, 膀胱非可逆変形の適切な3次元+t空間追跡を初めて提供し, 真の進歩を示すものである。 本研究は, 骨盤底病変の重症度を診断支援や術前手術計画においてより正確に評価するために, 空洞充填・排便患者に拡張することを目的としている。

Background and Objective: Pelvic floor disorders are prevalent diseases and patient care remains difficult as the dynamics of the pelvic floor remains poorly known. So far, only 2D dynamic observations of straining exercises at excretion are available in the clinics and the understanding of three-dimensional pelvic organs mechanical defects is not yet achievable. In this context, we proposed a complete methodology for the 3D representation of the non-reversible bladder deformations during exercises, directly combined with synthesized 3D representation of the location of the highest strain areas on the organ surface. Methods: Novel image segmentation and registration approaches have been combined with three geometrical configurations of up-to-date rapid dynamic multi-slices MRI acquisition for the reconstruction of real-time dynamic bladder volumes. Results: For the first time, we proposed real-time 3D deformation fields of the bladder under strain from in-bore forced breathing exercises. The potential of our method was assessed on eight control subjects undergoing forced breathing exercises. We obtained average volume deviation of the reconstructed dynamic volume of bladders around 2.5\% and high registration accuracy with mean distance values of 0.4 $\pm$ 0.3 mm and Hausdorff distance values of 2.2 $\pm$ 1.1 mm. Conclusions: Immediately transferable to the clinics with rapid acquisitions, the proposed framework represents a real advance in the field of pelvic floor disorders as it provides, for the first time, a proper 3D+t spatial tracking of bladder non-reversible deformations. This work is intended to be extended to patients with cavities filling and excretion to better characterize the degree of severity of pelvic floor pathologies for diagnostic assistance or in preoperative surgical planning.
翻訳日:2023-01-19 16:26:50 公開日:2023-01-18
# 非エルミタン真空の量子相転移としてのノークリック限界における測定相転移

Measurement phase transitions in the no-click limit as quantum phase transitions of a non-hermitean vacuum ( http://arxiv.org/abs/2301.07383v1 )

ライセンス: Link先を確認
Caterina Zerba, Alessandro Silva(参考訳) 積分可能な多体非エルミタンハミルトニアンの動的状態の定常状態に生じる動的相転移について検討し、これは確率的シュルンディンガー方程式のノークリック極限として実現できるか、量子回路の時空双対性を用いて検討する。 横磁場イジングチェーンと長距離キタエフ鎖の2つの特定のモデルにおいて、定常状態において生じる絡み合い相転移は、非エルミートハミルトニアンの真空中に生じるのと同じ性質を持つ: 準粒子スペクトルの虚部がガッピングされたときの有界絡みエントロピーと、ギャップレス虚数スペクトルに対する対数成長を観察する。 この観察は、領域ローの定理を非エルミート的ハミルトニアンに一般化する可能性を示唆している。

We study dynamical phase transitions occurring in the stationary state of the dynamics of integrable many-body non-hermitian Hamiltonians, which can be either realized as a no-click limit of a stochastic Schr\"{o}dinger equation or using spacetime duality of quantum circuits. In two specific models, the Transverse Field Ising Chain and the Long Range Kitaev Chain, we observe that the entanglement phase transitions occurring in the stationary state have the same nature as that occurring in the vacuum of the non-hermitian Hamiltonian: bounded entanglement entropy when the imaginary part of the quasi-particle spectrum is gapped and a logarithmic growth for gapless imaginary spectrum. This observation suggests the possibility to generalize the area-law theorem to non-Hermitian Hamiltonians.
翻訳日:2023-01-19 16:26:22 公開日:2023-01-18
# 量子近似最適化アルゴリズム回路における情報スクランブルと絡み合い

Information scrambling and entanglement in quantum approximate optimization algorithm circuits ( http://arxiv.org/abs/2301.07445v1 )

ライセンス: Link先を確認
Chen Qian, Wei-Feng Zhuang, Rui-Cheng Guo, Meng-Jun Hu, Dong E. Liu(参考訳) 最適なパラメータ化量子回路からなる変分量子アルゴリズムは、ノイズのある中間スケール量子(NISQ)時代に量子上の利点を示すことを約束している。 古典的な計算資源とは別に、異なる種類の量子リソースが情報スクランブルや絡み合いといった計算プロセスに寄与している。 特定の問題の複雑性とこれらの問題の解決によって消費される量子資源の関係を特徴づけることは、量子情報処理の文脈でVQAの構造を理解するのに役立つ。 本研究では,組合せ最適化問題を解くことを目的とした量子近似最適化アルゴリズム(QAOA)に焦点を当てる。 本稿では,QAOA回路における情報スクランブルと絡み合いについて検討し,より難しい問題として,QAOA回路が解を得るためにはより多くの量子資源が必要であることを明らかにする。 将来的には、情報スクランブルや計算プロセスにおける絡み合いの蓄積によって、量子多体問題の複雑性のベンチマークに使用できることに留意する。

Variational quantum algorithms, which consist of optimal parameterized quantum circuits, are promising for demonstrating quantum advantages in the noisy intermediate-scale quantum (NISQ) era. Apart from classical computational resources, different kinds of quantum resources have their contributions in the process of computing, such as information scrambling and entanglement. Characterizing the relation between complexity of specific problems and quantum resources consumed by solving these problems is helpful for us to understand the structure of VQAs in the context of quantum information processing. In this work, we focus on the quantum approximate optimization algorithm (QAOA), which aims to solve combinatorial optimization problems. We study information scrambling and entanglement in QAOA circuits respectively, and discover that for a harder problem, more quantum resource is required for the QAOA circuit to obtain the solution. We note that in the future, our results can be used to benchmark complexity of quantum many-body problems by information scrambling or entanglement accumulation in the computing process.
翻訳日:2023-01-19 16:19:48 公開日:2023-01-18
# パルス双対ビームの時空間相関のモデル化

Modeling the space-time correlation of pulsed twin beams ( http://arxiv.org/abs/2301.07441v1 )

ライセンス: Link先を確認
Alessandra Gatti, Ottavia Jedrkiewicz, Enrico Brambilla(参考訳) パラメトリックダウンコンバージョンによって生じる絡み合ったツインビームは、空間と時間におけるマルチモーダルの性質から、画像指向のアプリケーションに好まれるソースである。 しかし、理論的な説明が不十分である。 本研究では,時間消費数値シミュレーションと非現実的な平面波ポンプ理論のギャップを埋めることを目的とした半解析モデルを提案する。 このモデルはパラメトリック・エミッションの角度周波数領域における量子相関とコヒーレンスの研究に使われ、ゲイン$g$が増加するにつれてその大きさの$g^{{1/2}}$の成長を示し、対応する時空分布の収縮を示す。 これらの予測は、全モデル方程式のウィグナー表現で実行される確率的数値シミュレーションの結果と体系的に比較される。

Entangled twin-beams generated by parametric down-conversion are among the favorite sources for imaging-oriented applications, due their multimodal nature in space and time. However, a satisfactory theoretical description is still lacking. In this work we propose a semi-analytic model which aims to bridge the gap between time-consuming numerical simulations and the unrealistic plane-wave pump theory. The model is used to study the quantum correlation and the coherence in the angle-frequency domain of the parametric emission, and demonstrates a $g^{{1/2}} $ growth of their size as the gain $g$ increases, with a corresponding contraction of the space-time distribution. These predictions are systematically compared with the results of stochastic numerical simulations, performed in the Wigner representation, of the full model equations: an excellent agreement is shown even for parameters well outside the expected limit of validity of the model.
翻訳日:2023-01-19 16:19:31 公開日:2023-01-18
# 需要多項式のエルミート行列とユニタリ近似行列

Hermitian and unitary almost-companion matrices of polynomials on demand ( http://arxiv.org/abs/2301.07435v1 )

ライセンス: Link先を確認
L.A. Markovich and A. Migliore and A. Messina(参考訳) 本稿では,標準コンパニオン行列(CM)の非退化特性を緩和することにより,ほぼコンパニオン行列(ACM)の概念を導入する。 すなわち、acm を特性多項式が与えられたモニックで一般に複素多項式と一致する行列として定義する。 cmと比べ、acmの概念に固有の大きな柔軟性により、多項式係数の特定の性質と相まって、望ましい追加条件を満たす便利な行列構造を持つacmを構築することができる。 本研究は, 適当な3次多項式から始まったエルミートとユニタリのacmの構成を実証し, ハミルトンのパラメータ化, 密度, およびクトリットの進化行列など, 物理数学的な問題への応用を示唆する。 ACMは、与えられた多項式の性質を識別し、その根を見つける手段を提供する。 例えば、カルダーノ・ダル・フェロの公式を使わずに、3次複素代数方程式のACMに基づく解を記述する。 また, 1次ACMの特性多項式を表現するために, 多項式の係数に対して必要かつ十分な条件を示す。 提案されたアプローチはより高次複素多項式に一般化することができる。

We introduce the concept of Almost-Companion Matrix (ACM) by relaxing the non-derogatory property of the standard Companion Matrix (CM). That is, we define an ACM as a matrix whose characteristic polynomial coincides with a given monic and generally complex polynomial. The greater flexibility inherent in the ACM concept, compared to CM, allows the construction of ACMs that have convenient matrix structures satisfying desired additional conditions, compatibly with specific properties of the polynomial coefficients. We demonstrate the construction of Hermitian and Unitary ACMs starting from appropriate third degree polynomials, with implications for their use in physical-mathematical problems such as the parameterization of the Hamiltonian, density, or evolution matrix of a qutrit. We show that the ACM provides a means of identifying properties of a given polynomial and finding its roots. For example, we describe the ACM-based solution of cubic complex algebraic equations without resorting to the use of the Cardano-Dal Ferro formulas. We also show the necessary and sufficient conditions on the coefficients of a polynomial for it to represent the characteristic polynomial of a unitary ACM. The presented approach can be generalized to complex polynomials of higher degree.
翻訳日:2023-01-19 16:19:15 公開日:2023-01-18
# DDPEN:サブゴール生成モデルによる軌道最適化

DDPEN: Trajectory Optimisation With Sub Goal Generation Model ( http://arxiv.org/abs/2301.07433v1 )

ライセンス: Link先を確認
Aleksander Gamayunov, Aleksey Postnikov, Gonzalo Ferrer(参考訳) ディファレンシャル・ダイナミック・プログラミング(ddp)は広く使われ、強力な軌道最適化手法であるが、内部構造のため局所的ミニマから除外されていない。 本稿では,DDP ローカル・ミニマを避けるために,DDP ローカル・ミニマを回避するために,ロボットが移動すべき方向を示す最適化基準に使用される追加用語を用いることにより,DDP ローカル・ミニマを避けるための新しいアプローチを提案する。 上記の方向を生成するために,所望の目標位置とともにコストマップの形で環境マップを入力として利用する深層モデルを提案する。 モデルは、目標に導く可能性のある将来の方向を生成し、リアルタイムに実行可能なローカルなミニマを避ける。 モデルは合成データセットに基づいてトレーニングされ、システム全体はGazeboシミュレータで評価される。 本研究では,提案手法により軌道最適化アルゴリズムの局所的最小化を回避でき,様々な凸および非凸の障害物に対して278mの軌道を成功させることを示す。

Differential dynamic programming (DDP) is a widely used and powerful trajectory optimization technique, however, due to its internal structure, it is not exempt from local minima. In this paper, we present Differential Dynamic Programming with Escape Network (DDPEN) - a novel approach to avoid DDP local minima by utilising an additional term used in the optimization criteria pointing towards the direction where robot should move in order to escape local minima. In order to produce the aforementioned directions, we propose to utilize a deep model that takes as an input the map of the environment in the form of a costmap together with the desired goal position. The Model produces possible future directions that will lead to the goal, avoiding local minima which is possible to run in real time conditions. The model is trained on a synthetic dataset and overall the system is evaluated at the Gazebo simulator. In this work we show that our proposed method allows avoiding local minima of trajectory optimization algorithm and successfully execute a trajectory 278 m long with various convex and nonconvex obstacles.
翻訳日:2023-01-19 16:18:56 公開日:2023-01-18
# 鋭い目:人間の視覚特性と同じような働きをするサルエント物体検出器

Sharp Eyes: A Salient Object Detector Working The Same Way as Human Visual Characteristics ( http://arxiv.org/abs/2301.07431v1 )

ライセンス: Link先を確認
Ge Zhu, Jinbao Li and Yahong Guo(参考訳) 現在の手法では、多レベル機能を集約したり、より洗練された塩分マップを得るためにエッジとスケルトンを導入したりしている。 しかし, 対象物が背景と色やテクスチャによく似ている, 乱雑な背景において, 完全正当物を得る方法にはほとんど注意が払わない。 この複雑なシーンに対処するために,まず物体をシーンから分離し,次に人間の視覚的特徴,すなわちまず目を見て焦点を合わせるように細分化するシャープアイネットワーク(SENet)を提案する。 対象物の欠陥を補うためにエッジやスケルトンを直接統合する従来の手法とは異なり,提案手法は拡張されたオブジェクトを利用して完全な予測を得る。 具体的には、SENetは主にターゲット分離(TS)ブラッチと、新しい階層的差分認識(HDA)損失を最小限に抑えてトレーニングされたオブジェクトセグメンテーション(OS)ブランチで構成される。 TSブランチでは,拡張された地中真理の監督により,拡張された境界で塩分濃度特性を生成するフラクタル構造を構築し,前景と背景の細部の違いを拡大することができる。 osブランチでは、まずマルチレベル機能を集約し、相補的なコンポーネントを適応的に選択し、拡張されたバウンダリでサリエンシー機能を集約機能に供給することで、ネットワークが完全な予測を得るためのガイドを行います。 さらに,HDAの損失により,各画素に重みを階層的な境界からの距離に応じて割り当てるサリアントオブジェクトの構造的整合性や局所的詳細性が向上する。 境界領域に類似した硬いピクセルが階層的に注目され、完全性予測の重要性が強調される。 5つのデータセットに関する包括的実験結果から,提案手法が定量的および定性的に最先端手法を上回っていることが示された。

Current methods aggregate multi-level features or introduce edge and skeleton to get more refined saliency maps. However, little attention is paid to how to obtain the complete salient object in cluttered background, where the targets are usually similar in color and texture to the background. To handle this complex scene, we propose a sharp eyes network (SENet) that first seperates the object from scene, and then finely segments it, which is in line with human visual characteristics, i.e., to look first and then focus. Different from previous methods which directly integrate edge or skeleton to supplement the defects of objects, the proposed method aims to utilize the expanded objects to guide the network obtain complete prediction. Specifically, SENet mainly consists of target separation (TS) brach and object segmentation (OS) branch trained by minimizing a new hierarchical difference aware (HDA) loss. In the TS branch, we construct a fractal structure to produce saliency features with expanded boundary via the supervision of expanded ground truth, which can enlarge the detail difference between foreground and background. In the OS branch, we first aggregate multi-level features to adaptively select complementary components, and then feed the saliency features with expanded boundary into aggregated features to guide the network obtain complete prediction. Moreover, we propose the HDA loss to further improve the structural integrity and local details of the salient objects, which assigns weight to each pixel according to its distance from the boundary hierarchically. Hard pixels with similar appearance in border region will be given more attention hierarchically to emphasize their importance in completeness prediction. Comprehensive experimental results on five datasets demonstrate that the proposed approach outperforms the state-of-the-art methods both quantitatively and qualitatively.
翻訳日:2023-01-19 16:18:39 公開日:2023-01-18
# 量子チャネルの最小出力r\'{e}nyiエントロピーの付加性に対する新しい構成的逆例

New constructive counterexamples to additivity of minimum output R\'{e}nyi entropy of quantum channels ( http://arxiv.org/abs/2301.07428v1 )

ライセンス: Link先を確認
Krzysztof Szczygielski, Micha{\l} Studzi\'nski(参考訳) 本稿では、対応する最小出力 r\'{e}nyi エントロピーが加法的でない量子チャネルの新しい族を提案する。 写本の最初の部分では、グルトカらの作品に動機づけられた。 とJ)。 Phys a: 数学。 Theor 43, 425304 (2010) では、反対称空間とその部分空間の拡張に焦点を当てる。 後に、proc で parthasarathy が提案した完全絡み合った部分空間の特別な場合を分析する。 数学 Sci 114, 365-374 (2004). 我々の構成は、$p>2$で十分高い次元で機能する。

In this paper we present new families of quantum channels for which corresponding minimum output R\'{e}nyi entropy is not additive. In the first part of the manuscript, motivated by work of Grudka et. al. (J. Phys. A: Math. Theor. 43, 425304 (2010)), we focus on extensions of the antisymmetric space and its subspaces. Later on we analyze a special case of completely entangled subspace proposed by Parthasarathy in Proc. Math. Sci. 114, 365-374 (2004). Our construction works for every $p>2$ and dimension high enough.
翻訳日:2023-01-19 16:18:04 公開日:2023-01-18
# 効果的な非線形因果探索による合成データ生成

Boosting Synthetic Data Generation with Effective Nonlinear Causal Discovery ( http://arxiv.org/abs/2301.07427v1 )

ライセンス: Link先を確認
Martina Cinquini, Fosca Giannotti, Riccardo Guidotti(参考訳) 合成データ生成は、ソフトウェアテスト、データプライバシ、不均衡学習、人工知能の説明に広く採用されている。 このような状況では、信頼できるデータサンプルを生成することが不可欠である。 データ生成に広く使用されるアプローチの一般的な前提は、機能の独立性である。 しかし、典型的にはデータセットの変数は互いに依存しており、これらの依存関係はデータ生成では考慮されない。 主な問題は変数間の依存関係が通常不明であることだ。 本稿では,変数間の非線形因果関係を探索し,生成時にそれらを利用することのできる表データ用合成データセット生成器を設計する。 非線形因果発見のための最先端の手法は通常非効率である。 パターンマイニングアルゴリズムによって効率的に検索される頻繁なパターンに現れる特徴のうち因果発見を制限することでそれらを強化する。 我々は,提案の妥当性を検証するために,既知の因果関係を持つ合成データセットを生成するフレームワークを設計した。 既知の因果関係を持つ多くの合成および実データセットに関する広範な実験は、提案手法の有効性を示している。

Synthetic data generation has been widely adopted in software testing, data privacy, imbalanced learning, and artificial intelligence explanation. In all such contexts, it is crucial to generate plausible data samples. A common assumption of approaches widely used for data generation is the independence of the features. However, typically, the variables of a dataset depend on one another, and these dependencies are not considered in data generation leading to the creation of implausible records. The main problem is that dependencies among variables are typically unknown. In this paper, we design a synthetic dataset generator for tabular data that can discover nonlinear causalities among the variables and use them at generation time. State-of-the-art methods for nonlinear causal discovery are typically inefficient. We boost them by restricting the causal discovery among the features appearing in the frequent patterns efficiently retrieved by a pattern mining algorithm. We design a framework for generating synthetic datasets with known causalities to validate our proposal. Broad experimentation on many synthetic and real datasets with known causalities shows the effectiveness of the proposed method.
翻訳日:2023-01-19 16:17:52 公開日:2023-01-18
# 畳み込みニューラルネットワークを用いたエキスパートドライバの行動に基づく自律スラローム操作

Autonomous Slalom Maneuver Based on Expert Drivers' Behavior Using Convolutional Neural Network ( http://arxiv.org/abs/2301.07424v1 )

ライセンス: Link先を確認
Shafagh A. Pashaki, Ali Nahvi, Ahmad Ahmadi, Sajad Tavakoli, Shahin Naeemi, Salar H. Shamchi(参考訳) 車線変更と障害物回避は、自動走行車において最も重要なタスクの1つである。 これまで,経路軌跡や強化学習に基づくアルゴリズムが多数提案されてきた。 これらの手法は効率的だが、熟練したドライバーが走行するスムーズな経路を正確に模倣することはできない。 本稿では,畳み込みニューラルネットワーク(CNN)を用いてドライバの動作を模倣する手法を提案する。 まず、運転シミュレーター内の4人の専門家ドライバから収集したデータセットから7つの特徴を抽出する。 その後、これらの機能は1D配列から2D配列に変換され、CNNに注入される。 CNNモデルは所望のハンドル角度を計算し、適応的なPDコントローラに送信する。 そして、制御部は、ステアリングホイールに適切なトルクを付与する。 結果は、CNNモデルがドライバーの挙動を0.83のR2乗法で模倣できることを示している。 また, 提案手法の性能を17回の運転シミュレータで評価し, 全交通円錐を回避した。 いくつかの試験では、提案手法はエキスパートドライバよりもスムーズな操作を行った。

Lane changing and obstacle avoidance are one of the most important tasks in automated cars. To date, many algorithms have been suggested that are generally based on path trajectory or reinforcement learning approaches. Although these methods have been efficient, they are not able to accurately imitate a smooth path traveled by an expert driver. In this paper, a method is presented to mimic drivers' behavior using a convolutional neural network (CNN). First, seven features are extracted from a dataset gathered from four expert drivers in a driving simulator. Then, these features are converted from 1D arrays to 2D arrays and injected into a CNN. The CNN model computes the desired steering wheel angle and sends it to an adaptive PD controller. Finally, the control unit applies proper torque to the steering wheel. Results show that the CNN model can mimic the drivers' behavior with an R2-squared of 0.83. Also, the performance of the presented method was evaluated in the driving simulator for 17 trials, which avoided all traffic cones successfully. In some trials, the presented method performed a smoother maneuver compared to the expert drivers.
翻訳日:2023-01-19 16:17:24 公開日:2023-01-18
# DIRECT: 差別的リワードによるスパースから学び, シフトするリワード

DIRECT: Learning from Sparse and Shifting Rewards using Discriminative Reward Co-Training ( http://arxiv.org/abs/2301.07421v1 )

ライセンス: Link先を確認
Philipp Altmann, Thomy Phan, Fabian Ritz, Thomas Gabor and Claudia Linnhoff-Popien(参考訳) 深層強化学習アルゴリズムの拡張として,識別報酬協調学習(DIRECT)を提案する。 自己模倣学習(sil: self-imitation learning)という概念に基づいて,その帰属によって決定される方針によって生じる有益な軌跡を記憶するための模倣バッファを提案する。 差別者ネットワークは、現在の政策によって生成されたトラジェクトリと、以前の政策によって生成された有益なトラジェクトリとを区別するポリシーとを同時に訓練する。 差別者の評定は、ポリシーを最適化するための報酬信号を構築するために使用される。 事前の経験を補足することで、DIRECTは報酬ランドスケープのより価値の高い領域に向けて政策最適化を補助し、最適な政策を学ぶことができる。 提案手法は,分散環境およびシフト・リワード環境において最先端のアルゴリズムを上回っており,ポリシーに対して代理的な報酬を提供し,価値ある領域に最適化を向けることができる。

We propose discriminative reward co-training (DIRECT) as an extension to deep reinforcement learning algorithms. Building upon the concept of self-imitation learning (SIL), we introduce an imitation buffer to store beneficial trajectories generated by the policy determined by their return. A discriminator network is trained concurrently to the policy to distinguish between trajectories generated by the current policy and beneficial trajectories generated by previous policies. The discriminator's verdict is used to construct a reward signal for optimizing the policy. By interpolating prior experience, DIRECT is able to act as a surrogate, steering policy optimization towards more valuable regions of the reward landscape thus learning an optimal policy. Our results show that DIRECT outperforms state-of-the-art algorithms in sparse- and shifting-reward environments being able to provide a surrogate reward to the policy and direct the optimization towards valuable areas.
翻訳日:2023-01-19 16:17:00 公開日:2023-01-18
# オートエンコーダを用いたGPS軌道の圧縮

Compression of GPS Trajectories using Autoencoders ( http://arxiv.org/abs/2301.07420v1 )

ライセンス: Link先を確認
Michael K\"olle, Steffen Illium, Carsten Hahn, Lorenz Schauer, Johannes Hutter and Claudia Linnhoff-Popien(参考訳) 位置追跡が可能なモバイルデバイスがユビキタスに利用可能になったことで、GPSデータの収集が大幅に増加した。 重要な情報を保存しながら必要なストレージ量を削減するために、いくつかの圧縮手法が開発されている。 本稿では,ゲームと実世界の両方で評価されるgpsトラジェクタを圧縮・再構成するために,lstm-autoencoderに基づく手法を提案する。 様々な圧縮比と軌道長を考慮する。 性能は他の軌道圧縮アルゴリズム、すなわちダグラス・ポーカーと比較される。 総じて、我々のアプローチは離散的なfr\'echet距離と動的時間ゆがみの点でダグラス・パイカーを著しく上回っていることを示している。 さらに,全ての損失点を再構築することにより,提案手法は従来の手法よりも多くの利点をもたらす。

The ubiquitous availability of mobile devices capable of location tracking led to a significant rise in the collection of GPS data. Several compression methods have been developed in order to reduce the amount of storage needed while keeping the important information. In this paper, we present an lstm-autoencoder based approach in order to compress and reconstruct GPS trajectories, which is evaluated on both a gaming and real-world dataset. We consider various compression ratios and trajectory lengths. The performance is compared to other trajectory compression algorithms, i.e., Douglas-Peucker. Overall, the results indicate that our approach outperforms Douglas-Peucker significantly in terms of the discrete Fr\'echet distance and dynamic time warping. Furthermore, by reconstructing every point lossy, the proposed methodology offers multiple advantages over traditional methods.
翻訳日:2023-01-19 16:16:43 公開日:2023-01-18
# ReFresh: グラフニューラルネットワークトレーニングのための安定な履歴埋め込みからのメモリアクセス削減

ReFresh: Reducing Memory Access from Exploiting Stable Historical Embeddings for Graph Neural Network Training ( http://arxiv.org/abs/2301.07482v1 )

ライセンス: Link先を確認
Kezhao Huang, Haitian Jiang, Minjie Wang, Guangxuan Xiao, David Wipf, Xiang Song, Quan Gan, Zengfeng Huang, Jidong Zhai, Zheng Zhang(参考訳) 大きな実世界のグラフ上でグラフニューラルネットワーク(GNN)モデルをトレーニングする際の重要なパフォーマンスボトルネックは、ノード機能をGPUにロードすることだ。 gpuメモリが限られているため、アクセスが遅い代替デバイス(cpuメモリなど)でこれらの機能のストレージを容易にするには、高価なデータ移動が必要である。 さらに、グラフ構造の不規則性は、その問題をさらに悪化させるデータ局所性に寄与する。 したがって、大規模なGNNモデルを効率的に訓練できる既存のフレームワークは、通常、避けられないショートカットのため、かなりの精度の劣化を引き起こす。 これらの制限に対処するため、我々は、GNNノードの埋め込みを保存・再利用するための履歴キャッシュを活用する汎用的なGNNミニバッチトレーニングフレームワークであるReFreshを提案する。 その成功のために、対応するキャッシュポリシーは、相対的に安定でキャッシュ可能な埋め込みを、見積もりエラーとその後の下流精度の損失を減らすために再計算する必要があるものから選択的にスクリーニングするために、勾配ベースと停滞基準を組み合わせて設計されている。 この選択された履歴キャッシュをサポートするための補完的なシステム拡張と組み合わせることで、ReFreshはogbn-papers100MやMAG240Mといったグラフデータセットのトレーニング速度を4.6倍から23.6倍に高速化し、メモリアクセスを64.5%(生のフィーチャーキャッシュよりも85.7%高い)削減し、1%未満の精度でテストできる。

A key performance bottleneck when training graph neural network (GNN) models on large, real-world graphs is loading node features onto a GPU. Due to limited GPU memory, expensive data movement is necessary to facilitate the storage of these features on alternative devices with slower access (e.g. CPU memory). Moreover, the irregularity of graph structures contributes to poor data locality which further exacerbates the problem. Consequently, existing frameworks capable of efficiently training large GNN models usually incur a significant accuracy degradation because of the inevitable shortcuts involved. To address these limitations, we instead propose ReFresh, a general-purpose GNN mini-batch training framework that leverages a historical cache for storing and reusing GNN node embeddings instead of re-computing them through fetching raw features at every iteration. Critical to its success, the corresponding cache policy is designed, using a combination of gradient-based and staleness criteria, to selectively screen those embeddings which are relatively stable and can be cached, from those that need to be re-computed to reduce estimation errors and subsequent downstream accuracy loss. When paired with complementary system enhancements to support this selective historical cache, ReFresh is able to accelerate the training speed on large graph datasets such as ogbn-papers100M and MAG240M by 4.6x up to 23.6x and reduce the memory access by 64.5% (85.7% higher than a raw feature cache), with less than 1% influence on test accuracy.
翻訳日:2023-01-19 16:11:11 公開日:2023-01-18
# 量子コンピュータ上のスレーター行列式と相関状態の効率的な調製のための浅量子回路

Shallow quantum circuits for efficient preparation of Slater determinants and correlated states on a quantum computer ( http://arxiv.org/abs/2301.07477v1 )

ライセンス: Link先を確認
Chong Hian Chee, Adrian M. Mak, Daniel Leykam, Dimitris G. Angelakis(参考訳) 量子アンサーゼの調製は、変分量子固有解法のような多くの量子化学において必要不可欠である。 スレーター行列式やユニタリ結合型クラスターを含む広く使われているアンサットは、パラメータ化されたフェルミイオン励起ゲートを採用しており、後者はシステムサイズ$n$で少なくとも多項式スケールの深い量子回路となる。 本稿では,量子機械学習のために開発されたデータローディング回路法に触発されたフェルミオンアンサッツ状態生成のための代替パラダイムを提案する。 提案手法は,d$-fermion slater 行列式と相関状態の,より浅くスケーラブルでスケーラブルな$o(d\log^2 n)$ 2-qubit ゲート深さ合成を提供する。 これは、キュービットスワップオーバーヘッドなしに平面アーキテクチャ上で実装できるため、短期量子デバイスにおける高精度量子化学研究に必要なより大きな基底セットの使用を可能にするため、特に重要である。

Preparing quantum ansatzes is a necessary prerequisite in many quantum algorithms for quantum chemistry such as the variational quantum eigensolver. Widely-used ansatzes including the Slater determinants and Unitary Coupled Cluster, employ parameterized fermionic excitation gates, with the latter resulting in deep quantum circuits that scale at least polynomially with the system size $N$. Here we propose an alternate paradigm for fermionic ansatz state preparation inspired by data-loading circuits methods developed for quantum machine learning. Our approach provides a shallower, yet scalable $O(d\log^2 N)$ two-qubit gate depth preparation of $d$-fermion Slater determinants and correlated states, a subexponential improvement in gate depth over existing approaches. This is particularly important as it can be implemented on planar architectures without qubit swapping overheads, thereby enabling the use of larger basis sets needed for high-precision quantum chemistry studies on near-term quantum devices.
翻訳日:2023-01-19 16:10:43 公開日:2023-01-18
# odosフィルタと深層学習ネットワークを用いた医用画像の線形オブジェクトセグメンテーション

Curvilinear object segmentation in medical images based on ODoS filter and deep learning network ( http://arxiv.org/abs/2301.07475v1 )

ライセンス: Link先を確認
Yuanyuan Peng, Lin Pan, Pengpeng Luan, Hongbin Tu, Xiong Li(参考訳) 医用画像における線状物体の自動分割は,人間の疾患の診断・評価において重要な役割を担っているが,様々な画像の出現,線状物体とその周辺背景のコントラストの低さ,細く不均一な線状構造,不適切な背景照明など,複雑な分別作業では不確実である。 これらの課題を克服するために,本論文では,スティック(ODoS)フィルタの指向微分に基づく独自のカービリニア構造セグメンテーションフレームワークと,医用画像におけるカービリニアオブジェクトセグメンテーションのためのディープラーニングネットワークを提案する。 現在、多くのディープラーニングモデルでは、深いアーキテクチャを開発し、曲率のあるオブジェクトの構造的特徴の把握を無視することに重点を置いている。 その結果,ODoSフィルタを深層学習ネットワークの一部として組み込んだ新しい手法が提案され,曲線オブジェクトの空間的注意度が向上した。 原画像は様々な画像の出現と複雑な背景照明を記述する主部分と見なされ、多段階戦略は曲率対象とその周囲の背景とのコントラストを強化するために用いられ、ベクトル場は薄くて不均一な曲率構造を識別するために適用される。 次に, 医学画像における線形オブジェクトセグメンテーションのための可変構造特徴を抽出するために, 深層学習フレームワークを用いた。 計算モデルの性能は、公開されているDRIVE、STARE、CHASEDB1データセットを用いた実験で検証された。 実験の結果,提案手法は最先端手法に比べて驚くべき結果が得られた。

Automatic segmentation of curvilinear objects in medical images plays an important role in the diagnosis and evaluation of human diseases, yet it is a challenging uncertainty for the complex segmentation task due to different issues like various image appearance, low contrast between curvilinear objects and their surrounding backgrounds, thin and uneven curvilinear structures, and improper background illumination. To overcome these challenges, we present a unique curvilinear structure segmentation framework based on oriented derivative of stick (ODoS) filter and deep learning network for curvilinear object segmentation in medical images. Currently, a large number of deep learning models emphasis on developing deep architectures and ignore capturing the structural features of curvature objects, which may lead to unsatisfactory results. In consequence, a new approach that incorporates the ODoS filter as part of a deep learning network is presented to improve the spatial attention of curvilinear objects. In which, the original image is considered as principal part to describe various image appearance and complex background illumination, the multi-step strategy is used to enhance contrast between curvilinear objects and their surrounding backgrounds, and the vector field is applied to discriminate thin and uneven curvilinear structures. Subsequently, a deep learning framework is employed to extract varvious structural features for curvilinear object segmentation in medical images. The performance of the computational model was validated in experiments with publicly available DRIVE, STARE and CHASEDB1 datasets. Experimental results indicate that the presented model has yielded surprising results compared with some state-of-the-art methods.
翻訳日:2023-01-19 16:10:23 公開日:2023-01-18
# 機械学習に基づくシステムの脅威,脆弱性,制御:調査と分類

Threats, Vulnerabilities, and Controls of Machine Learning Based Systems: A Survey and Taxonomy ( http://arxiv.org/abs/2301.07474v1 )

ライセンス: Link先を確認
Yusuke Kawamoto and Kazumasa Miyake and Koich Konishi and Yutaka Oiwa(参考訳) 本稿では,mlベースのシステムの脅威,脆弱性,セキュリティ制御に関する知識を体系化する人工知能セキュリティ分類法を提案する。 まず、MLベースのシステムに対する攻撃による被害を分類し、ML固有のセキュリティを定義し、その特性について議論する。 次に、関連するすべての資産と利害関係者を列挙し、ML固有の脅威に対する一般的な分類法を提供する。 そして、最近の文献の広範なレビューを通じて、ML固有の脅威に対する幅広いセキュリティ制御を収集する。 最後に、MLベースのシステムの脆弱性とコントロールを、システムのライフサイクル全体における各脆弱な資産の観点から分類する。

In this article, we propose the Artificial Intelligence Security Taxonomy to systematize the knowledge of threats, vulnerabilities, and security controls of ML-based systems. We first classify the damage caused by attacks against ML-based systems, define ML-specific security, and discuss its characteristics. Next, we enumerate all relevant assets and stakeholders and provide a general taxonomy for ML-specific threats. Then, we collect a wide range of security controls against ML-specific threats through an extensive review of recent literature. Finally, we classify the vulnerabilities and controls of an ML-based system in terms of each vulnerable asset in the system's entire lifecycle.
翻訳日:2023-01-19 16:09:49 公開日:2023-01-18
# ニューラルネットワークにおける離散遅延構造

Discrete Latent Structure in Neural Networks ( http://arxiv.org/abs/2301.07473v1 )

ライセンス: Link先を確認
Vlad Niculae, Caio F. Corro, Nikita Nangia, Tsvetomila Mihaylova, Andr\'e F. T. Martins(参考訳) 自然言語処理、コンピュータビジョン、バイオインフォマティクスなど分野からの多くのデータ型は、木、シーケンス、またはマッチングのような離散的な構成構造によってよく表される。 潜在構造モデルは、そのような表現を抽出するための強力なツールであり、構造バイアスを取り入れ、データに関する洞察を発見し、決定を解釈する方法を提供する。 しかし、ニューラルネットワークは通常、連続的な計算のために設計されているため、効果的なトレーニングは困難である。 このテキストは、連続緩和、代理勾配、確率的推定という、離散的潜在構造を持つ学習のための3つの幅広い戦略を探求する。 私たちのプレゼンテーションは、幅広いモデルの一貫した表記に依存しています。 このように、我々は、潜在構造学習戦略の間に多くの新しいつながりを明らかにし、ほとんどのものが同じ基本構造ブロックの小さな集合で構成されていることを示す。

Many types of data from fields including natural language processing, computer vision, and bioinformatics, are well represented by discrete, compositional structures such as trees, sequences, or matchings. Latent structure models are a powerful tool for learning to extract such representations, offering a way to incorporate structural bias, discover insight about the data, and interpret decisions. However, effective training is challenging, as neural networks are typically designed for continuous computation. This text explores three broad strategies for learning with discrete latent structure: continuous relaxation, surrogate gradients, and probabilistic estimation. Our presentation relies on consistent notations for a wide range of models. As such, we reveal many new connections between latent structure learning strategies, showing how most consist of the same small set of fundamental building blocks, but use them differently, leading to substantially different applicability and properties.
翻訳日:2023-01-19 16:09:42 公開日:2023-01-18
# 論理プログラムの構造的硬さを特徴づける: 周期と到達性が木幅に困難になる理由

Characterizing Structural Hardness of Logic Programs: What makes Cycles and Reachability Hard for Treewidth? ( http://arxiv.org/abs/2301.07472v1 )

ライセンス: Link先を確認
Markus Hecher(参考訳) ASP(Answer Set Programming)は、KRにおけるいくつかの問題に対する問題モデリングおよび解決のフレームワークである。 また、計算複雑性の研究やハードネスとそのソースに関する深い洞察のために、ASPは長年研究者を惹きつけてきた。 これらの研究は、複雑性クラスにおける実りある特徴付け、二分法的な結果の詳細な洞察、および詳細なパラメータ化された複雑性ランドスケープをもたらす。 近年,プログラムの構造密度を計測する測度木幅に対して,正規プログラムのよく知られたクラスの評価は,満足度(SAT)を決定するよりもやや難しいことが期待されている。 しかし、ASP.NETのこの構造的パワーをどのように活用するかは不明だ。 本稿では,aspの構造的パワーを明示的に活用し,木幅をサブリニアに減少させることにより,おそらく大きくは改善されないであろう,satから通常のaspへの新たな還元について述べる。 そして、既存の結果と比較して、依存グラフのサイクル長(sccサイズ)の必要な機能依存性を確立することにより、きめ細かい方法で硬さを特徴付ける。

Answer Set Programming (ASP) is a problem modeling and solving framework for several problems in KR with growing industrial applications. Also for studies of computational complexity and deeper insights into the hardness and its sources, ASP has been attracting researchers for many years. These studies resulted in fruitful characterizations in terms of complexity classes, fine-grained insights in form of dichotomy-style results, as well as detailed parameterized complexity landscapes. Recently, this lead to a novel result establishing that for the measure treewidth, which captures structural density of a program, the evaluation of the well-known class of normal programs is expected to be slightly harder than deciding satisfiability (SAT). However, it is unclear how to utilize this structural power of ASP. This paper deals with a novel reduction from SAT to normal ASP that goes beyond well-known encodings: We explicitly utilize the structural power of ASP, whereby we sublinearly decrease the treewidth, which probably cannot be significantly improved. Then, compared to existing results, this characterizes hardness in a fine-grained way by establishing the required functional dependency of the dependency graph's cycle length (SCC size) on the treewidth.
翻訳日:2023-01-19 16:09:28 公開日:2023-01-18
# セマンティックシーン理解のためのCNN上のモデルベース不正確なグラフマッチング

Model-based inexact graph matching on top of CNNs for semantic scene understanding ( http://arxiv.org/abs/2301.07468v1 )

ライセンス: Link先を確認
J\'er\'emy Chopin and Jean-Baptiste Fasquel and Harold Mouch\`ere and Rozenn Dahyot and Isabelle Bloch(参考訳) セマンティックセグメンテーションのためのディープラーニングベースのパイプラインは、トレーニングに使用される注釈付きイメージで利用できる構造情報を無視することが多い。 本稿では,興味対象の構造知識を強制する新しい後処理モジュールを提案し,ディープラーニングによるセグメンテーション結果を改善する。 この加群は "many-to-one-or-none" グラフマッチングアプローチに対応し、二次代入問題として定式化される。 提案手法は,2次元RGB画像(FASSEG)の顔分割と3次元MRI(IBSR)の脳分割の2つの公開データセット上のCNNベースセグメンテーション(各種CNNバックボーン)と比較した。 評価は2種類の構造情報(距離と方向の関係、この選択は我々の汎用フレームワークのハイパーパラメータ)を用いて行われる。 FASSEGデータから、我々のモジュールはCNNの精度を約6.3%向上させる(ハウスドルフ距離は22.11から20.71に減少する)。 IBSRのデータでは、改善率は51%(ハウスドルフ距離は11.01から5.4に減少)である。 さらに,我々のアプローチは,深層学習手法の性能をしばしば制限する小さなトレーニングデータセットに弾力性があることが示されている。

Deep learning based pipelines for semantic segmentation often ignore structural information available on annotated images used for training. We propose a novel post-processing module enforcing structural knowledge about the objects of interest to improve segmentation results provided by deep learning. This module corresponds to a "many-to-one-or-none" inexact graph matching approach, and is formulated as a quadratic assignment problem. Our approach is compared to a CNN-based segmentation (for various CNN backbones) on two public datasets, one for face segmentation from 2D RGB images (FASSEG), and the other for brain segmentation from 3D MRIs (IBSR). Evaluations are performed using two types of structural information (distances and directional relations, , this choice being a hyper-parameter of our generic framework). On FASSEG data, results show that our module improves accuracy of the CNN by about 6.3% (the Hausdorff distance decreases from 22.11 to 20.71). On IBSR data, the improvement is of 51% (the Hausdorff distance decreases from 11.01 to 5.4). In addition, our approach is shown to be resilient to small training datasets that often limit the performance of deep learning methods: the improvement increases as the size of the training dataset decreases.
翻訳日:2023-01-19 16:09:08 公開日:2023-01-18
# clipter: シーンのテキスト認識で大きな画像を見る

CLIPTER: Looking at the Bigger Picture in Scene Text Recognition ( http://arxiv.org/abs/2301.07464v1 )

ライセンス: Link先を確認
Aviad Aberdam, David Bensa\"id, Alona Golts, Roy Ganz, Oren Nuriel, Royee Tichauer, Shai Mazor, Ron Litman(参考訳) 現場を理解することは、現実世界のシナリオでテキストを読むのに不可欠である。 しかし、現在のシーンテキスト認識装置は、より大きな画像に気付かず、切り抜かれたテキスト画像を操作する。 本研究では,CLIPのような近年の視覚言語モデルの代表的能力を活用し,シーンや画像レベルの情報を提供する。 具体的には、画像全体をリッチに表現し、クロスアテンションを介して認識語レベルの特徴と融合する。 さらに、コンテキストエンリッチ表現に徐々にシフトし、事前学習された認識器を単純に微調整するゲート機構を導入する。 CLIPTER - CLIPテキスト認識というモデル非依存のフレームワークをいくつかの主要なテキスト認識器に実装し、一貫性のあるパフォーマンス向上を示し、複数のベンチマークで最先端の結果を得る。 さらに、詳細な分析により、語彙外単語に対する堅牢性の向上と、低データ体制における一般化の強化が示される。

Understanding the scene is often essential for reading text in real-world scenarios. However, current scene text recognizers operate on cropped text images, unaware of the bigger picture. In this work, we harness the representative power of recent vision-language models, such as CLIP, to provide the crop-based recognizer with scene, image-level information. Specifically, we obtain a rich representation of the entire image and fuse it with the recognizer word-level features via cross-attention. Moreover, a gated mechanism is introduced that gradually shifts to the context-enriched representation, enabling simply fine-tuning a pretrained recognizer. We implement our model-agnostic framework, named CLIPTER - CLIP Text Recognition, on several leading text recognizers and demonstrate consistent performance gains, achieving state-of-the-art results over multiple benchmarks. Furthermore, an in-depth analysis reveals improved robustness to out-of-vocabulary words and enhanced generalization in low-data regimes.
翻訳日:2023-01-19 16:08:44 公開日:2023-01-18
# 時間知覚型ビデオ言語事前学習

Temporal Perceiving Video-Language Pre-training ( http://arxiv.org/abs/2301.07463v1 )

ライセンス: Link先を確認
Fan Ma, Xiaojie Jin, Heng Wang, Jingjia Huang, Linchao Zhu, Jiashi Feng, Yi Yang(参考訳) ビデオ言語事前学習モデルは最近、様々なマルチモーダルダウンストリームタスクを大幅に改善した。 これまでの支配的な著作は主に、モダリティを越えたグローバルな特徴整合を達成するために、対照的な学習を採用する。 しかし、ビデオとテキスト間の局所的な関連はモデル化されておらず、特に特定のクエリテキストに対して時間的ビデオ境界を必要とするタスクにおいて、事前学習モデルの一般化を制限する。 本研究は,テキスト記述による映像の時間的境界を正確に知覚できるように,テキスト・ビデオのローカライゼーションプリテキストタスクを導入して,時間的・意味的アライメントを細粒度に実現している。 具体的には、テキスト記述によってビデオの開始と終了の境界を予測するモーメント検索と、テキストのサブセットとビデオ特徴とをマッチングするテキストローカライゼーションで構成される。 時間境界を生成するために、複数のビデオのフレーム機能は、テキストシーケンスと対話する長いビデオシーケンスに手動でマージされる。 ローカライゼーションタスクでは,細粒度フレーム表現と単語表現を結合し,単一モダリティにおける異なるインスタンスの表現を暗黙的に区別する。 特に,本手法は,テキスト間検索,ビデオ質問応答,ビデオキャプション,時間的行動の定位,時間的モーメント検索など,様々なベンチマークにおいて,最先端のパフォーマンスを著しく向上することを示す。 コードはまもなくリリースされる。

Video-Language Pre-training models have recently significantly improved various multi-modal downstream tasks. Previous dominant works mainly adopt contrastive learning to achieve global feature alignment across modalities. However, the local associations between videos and texts are not modeled, restricting the pre-training models' generality, especially for tasks requiring the temporal video boundary for certain query texts. This work introduces a novel text-video localization pre-text task to enable fine-grained temporal and semantic alignment such that the trained model can accurately perceive temporal boundaries in videos given the text description. Specifically, text-video localization consists of moment retrieval, which predicts start and end boundaries in videos given the text description, and text localization which matches the subset of texts with the video features. To produce temporal boundaries, frame features in several videos are manually merged into a long video sequence that interacts with a text sequence. With the localization task, our method connects the fine-grained frame representations with the word representations and implicitly distinguishes representations of different instances in the single modality. Notably, comprehensive experimental results show that our method significantly improves the state-of-the-art performance on various benchmarks, covering text-to-video retrieval, video question answering, video captioning, temporal action localization and temporal moment retrieval. The code will be released soon.
翻訳日:2023-01-19 16:08:27 公開日:2023-01-18
# 高周波ナノメカニクス, ナノ音響, ナノフォノニクスの展望

Perspectives on high-frequency nanomechanics, nanoacoustics, and nanophononics ( http://arxiv.org/abs/2301.07451v1 )

ライセンス: Link先を確認
Priya, Edson R. Cardozo de Oliveira, and Norberto D. Lanzillotti-Kimura(参考訳) ナノメカニクス、ナノ音響学、ナノフォノニクスは、ナノスケールでの音響フォノンと弾性波の工学と、マグノン、電子、光子などの他の励起との相互作用を指す。 この工学は格子内の原子の相対的な位置に依存する固体特性の操作と制御を可能にする。 高度なナノファブリケーションと新しいキャラクタリゼーション技術は、過去10年間にフィールドの急速な発展を可能にした。 ナノフォニクスの応用例としては、熱管理、超高速データ処理、シミュレーション、センシング、量子技術の発展がある。 このレビューでは、マイルストーンとブレークスルーをいくつか取り上げ、これらの新興分野の有望な経路を特定します。

Nanomechanics, nanoacoustics, and nanophononics refer to the engineering of acoustic phonons and elastic waves at the nanoscale and their interactions with other excitations such as magnons, electrons, and photons. This engineering enables the manipulation and control of solid-state properties that depend on the relative positions of atoms in a lattice. The access to advanced nanofabrication and novel characterization techniques enabled a fast development of the fields over the last decade. The applications of nanophononics include thermal management, ultrafast data processing, simulation, sensing, and the development of quantum technologies. In this review, we cover some of the milestones and breakthroughs, and identify promising pathways of these emerging fields.
翻訳日:2023-01-19 16:08:02 公開日:2023-01-18
# 量子不協和の急激な変化に及ぼす弱測定の影響

Effects of weak measurements on sudden change of quantum discord ( http://arxiv.org/abs/2301.07490v1 )

ライセンス: Link先を確認
Mei Bai, Xiang-Yu Qin, and Xue-Qun Yan(参考訳) 突然の挙動変化を伴う2つの量子不一致の特異なダイナミクスについて検討した。 今日では、環境が量子不協和の突然の変化挙動を引き起こすという文献で広く合意されている。 本研究では, 局所非依存環境下での急激な変化現象を, 弱測定により得られた2量子ビットの不協和性を考慮した検討を行った。 急変現象は弱い測定値下では現れないことが示された。 弱い測定による量子不協和は単調な方法で崩壊し、量子不協和は強い(投影的な)測定のためにのみ突然の変化を示すことを示す。 我々は、環境が突然の変化の主要な役割ではなく、量子相関そのものであると考えている。

We study the peculiar dynamics of two qubits quantum discord with a sudden change in behavior. It is widely agreed in the literature nowadays that environment induce sudden change behavior of quantum discord. We explore the sudden change phenomenon under the action of local-independent environments, considering the discord of two-qubit which is obtained by means of the weak measurements on one of the two-qubit. It is shown that the sudden change phenomenon does not appear under weak measurements. We find that the quantum discord with weak measurements decays in a monotonic fashion, and show that quantum discord might exhibit a sudden change only for the strong (projective) measurement. We believe that environment is not the main role of the sudden change, but the quantum correlation itself is.
翻訳日:2023-01-19 15:59:01 公開日:2023-01-18
# 光の軌道角運動量状態の高感度局所検出のためのモノリシック干渉計

A monolithic interferometer for high-sensitive strictly-local detection of orbital angular momentum states of light ( http://arxiv.org/abs/2301.07489v1 )

ライセンス: Link先を確認
Mirko Siano, Bruno Paroli, Simone Cialdi, Stefano Olivares, Matteo G. A. Paris, Edoardo Suerra, and Marco A. C. Potenza(参考訳) 軌道角運動量を持つ放射の位相電荷を識別する革新的なモノリシック干渉計を提案する。 注目すべきは、我々の方法がウェーブフロント全体のごく一部にしかアクセスできないことだ。 提案されたスキームはモノリシックな複屈折結晶に依存しており、本質的に安定であり、フィードバックや熱ドリフト補償を必要としない。 提案手法の有効性を光子計数法まで証明するために, 実験的検討を行った。

We propose an innovative monolithic interferometer to distinguish the topological charge of radiation carrying orbital angular momentum. Remarkably, our method requires to access only a small portion of the entire wavefront. The proposed scheme relies on a monolithic birefringent crystal, and as such it is intrinsically stable and does not require any feedback or thermal drift compensation. An experimental setup has been realized to prove the effectiveness of the proposed method down to the photon counting regime.
翻訳日:2023-01-19 15:58:49 公開日:2023-01-18
# 学術レコメンダシステムにおけるバイアス:影響, 有病率, 緩和

Biases in Scholarly Recommender Systems: Impact, Prevalence, and Mitigation ( http://arxiv.org/abs/2301.07483v1 )

ライセンス: Link先を確認
Michael F\"arber, Melissa Coutinho, Shuzhou Yuan(参考訳) 出版物、研究者、科学トピックなどの科学分野の数が著しく増加し、科学における関連情報過多により、何百万人もの研究者や科学愛好家にとって学術レコメンデーションシステムの重要性が高まっている。 しかし、これらのシステムには様々なバイアスが伴うことがしばしば見過ごされる。 本稿では,まず,学術推薦システムのバイアスを分解し,その影響と頻度に応じて特徴付ける。 その際,人間によって引き起こされるバイアスと,レコメンダシステムによって引き起こされるバイアスとを区別する。 第二に、学術領域におけるこれらのバイアスを軽減するために使われた手法の概要について述べる。 第3に,研究者や開発者が学術推薦システムにおけるバイアスを軽減し,推薦システムの評価を公平に行うためのフレームワークを提案する。 最後に,学術的バイアスに関連するオープン課題と研究の方向性について論じる。

With the remarkable increase in the number of scientific entities such as publications, researchers, and scientific topics, and the associated information overload in science, academic recommender systems have become increasingly important for millions of researchers and science enthusiasts. However, it is often overlooked that these systems are subject to various biases. In this article, we first break down the biases of academic recommender systems and characterize them according to their impact and prevalence. In doing so, we distinguish between biases originally caused by humans and biases induced by the recommender system. Second, we provide an overview of methods that have been used to mitigate these biases in the scholarly domain. Based on this, third, we present a framework that can be used by researchers and developers to mitigate biases in scholarly recommender systems and to evaluate recommender systems fairly. Finally, we discuss open challenges and possible research directions related to scholarly biases.
翻訳日:2023-01-19 15:58:26 公開日:2023-01-18
# 鏡視下画像における分布外検出のためのマルチスケールフレームワーク

A Multi-Scale Framework for Out-of-Distribution Detection in Dermoscopic Images ( http://arxiv.org/abs/2301.07533v1 )

ライセンス: Link先を確認
Zhongzheng Huang, Tao Wang, Yuanzheng Cai, Lingyu Liang(参考訳) 皮膚画像による皮膚疾患の自動検出は、診断の効率を向上し、医師がより正確な判断を下すのに役立つ。 しかし、従来の皮膚疾患認識システムでは、オフ・オブ・ディストリビューション(OOD)データに対する信頼性が高く、実用アプリケーションでは大きなセキュリティ脆弱性となる可能性がある。 本稿では,分散性皮膚疾患の画像データを検出し,システムのロバスト性を確保するためのマルチスケール検出フレームワークを提案する。 我々のフレームワークはニューラルネットワークの異なる層から特徴を抽出する。 初期層では、出力特徴を良好な分布に近づけるために補正活性化を用い、その後、OODデータを検出するために一級SVMを訓練し、垂直層では、修正活性化後の特徴を計算するために適応文法行列を使用し、最後に、最高の性能を持つ層を選択して正規度スコアを算出する。 皮膚疾患認識における他の最先端手法と比較して,提案手法が優れた性能を発揮することを示す実験を行った。

The automatic detection of skin diseases via dermoscopic images can improve the efficiency in diagnosis and help doctors make more accurate judgments. However, conventional skin disease recognition systems may produce high confidence for out-of-distribution (OOD) data, which may become a major security vulnerability in practical applications. In this paper, we propose a multi-scale detection framework to detect out-of-distribution skin disease image data to ensure the robustness of the system. Our framework extracts features from different layers of the neural network. In the early layers, rectified activation is used to make the output features closer to the well-behaved distribution, and then an one-class SVM is trained to detect OOD data; in the penultimate layer, an adapted Gram matrix is used to calculate the features after rectified activation, and finally the layer with the best performance is chosen to compute a normality score. Experiments show that the proposed framework achieves superior performance when compared with other state-of-the-art methods in the task of skin disease recognition.
翻訳日:2023-01-19 15:52:30 公開日:2023-01-18
# 最適動的レグレット境界

Optimistic Dynamic Regret Bounds ( http://arxiv.org/abs/2301.07530v1 )

ライセンス: Link先を確認
Maxime Haddouche and Benjamin Guedj and Olivier Wintenberger(参考訳) オンライン学習(OL)アルゴリズムはもともと、アウトプットを最良の固定戦略と比較する際の優れたパフォーマンスを保証するために開発された。 動的戦略に関するパフォーマンスに関する問題は現在も活発な研究トピックである。 本研究は,専門家のアドバイスと楽観主義の概念に基づいて,古典的OLアルゴリズムの動的適応を開発する。 また,これらのアドバイスを生成するためのコンストラクティビスト手法を提案し,最終的には提案手法の理論的および実験的保証を提供する。

Online Learning (OL) algorithms have originally been developed to guarantee good performances when comparing their output to the best fixed strategy. The question of performance with respect to dynamic strategies remains an active research topic. We develop in this work dynamic adaptations of classical OL algorithms based on the use of experts' advice and the notion of optimism. We also propose a constructivist method to generate those advices and eventually provide both theoretical and experimental guarantees for our procedures.
翻訳日:2023-01-19 15:51:47 公開日:2023-01-18
# OmniObject3D: 現実的知覚・再構成・生成のための大語彙3Dオブジェクトデータセット

OmniObject3D: Large-Vocabulary 3D Object Dataset for Realistic Perception, Reconstruction and Generation ( http://arxiv.org/abs/2301.07525v1 )

ライセンス: Link先を確認
Tong Wu, Jiarui Zhang, Xiao Fu, Yuxin Wang, Jiawei Ren, Liang Pan, Wayne Wu, Lei Yang, Jiaqi Wang, Chen Qian, Dahua Lin, Ziwei Liu(参考訳) 3Dオブジェクトのモデリングの最近の進歩は、大規模なリアルタイム3Dデータベースがないため、主に合成データセットに依存している。 実世界の3D知覚・再構築・生成を容易にするため,我々は,大規模で高品質な3Dオブジェクト・データセットであるOmniObject3Dを提案する。 OmniObject3Dにはいくつかの魅力的な特性がある。 1)大語彙:190のカテゴリーで6,000個のスキャンされたオブジェクトで構成され、一般的な2Dデータセット(イメージネットやLVISなど)と共通クラスを共有し、一般化可能な3D表現を追求する。 2)リッチアノテーション: 各3Dオブジェクトは2Dと3Dの両方のセンサーでキャプチャされ、テクスチャメッシュ、ポイントクラウド、マルチビューレンダリング画像、複数の実写ビデオを提供する。 3) リアルスキャン: プロのスキャナは、正確な形状とリアルな外観の高品質なオブジェクトスキャンをサポートする。 OmniObject3Dが提供する広大な探査スペースでは、慎重に4つの評価トラックを設定しました。 a)ロバストな3d知覚 b) 新規ビュー合成 c) 神経表面の再構築及び d) 3dオブジェクト生成。 これら4つのベンチマークで広範な研究が行われ、リアルな3dビジョンにおける新しい観察、挑戦、将来の研究の機会が明らかになった。

Recent advances in modeling 3D objects mostly rely on synthetic datasets due to the lack of large-scale realscanned 3D databases. To facilitate the development of 3D perception, reconstruction, and generation in the real world, we propose OmniObject3D, a large vocabulary 3D object dataset with massive high-quality real-scanned 3D objects. OmniObject3D has several appealing properties: 1) Large Vocabulary: It comprises 6,000 scanned objects in 190 daily categories, sharing common classes with popular 2D datasets (e.g., ImageNet and LVIS), benefiting the pursuit of generalizable 3D representations. 2) Rich Annotations: Each 3D object is captured with both 2D and 3D sensors, providing textured meshes, point clouds, multiview rendered images, and multiple real-captured videos. 3) Realistic Scans: The professional scanners support highquality object scans with precise shapes and realistic appearances. With the vast exploration space offered by OmniObject3D, we carefully set up four evaluation tracks: a) robust 3D perception, b) novel-view synthesis, c) neural surface reconstruction, and d) 3D object generation. Extensive studies are performed on these four benchmarks, revealing new observations, challenges, and opportunities for future research in realistic 3D vision.
翻訳日:2023-01-19 15:50:53 公開日:2023-01-18
# graphix-t5: テキストからsqlへのパースのための事前学習されたトランスフォーマーとグラフ認識層を混合する

Graphix-T5: Mixing Pre-Trained Transformers with Graph-Aware Layers for Text-to-SQL Parsing ( http://arxiv.org/abs/2301.07507v1 )

ライセンス: Link先を確認
Jinyang Li, Binyuan Hui, Reynold Cheng, Bowen Qin, Chenhao Ma, Nan Huo, Fei Huang, Wenyu Du, Luo Si, Yongbin Li(参考訳) 自然言語の質問を実行可能なsqlクエリに変換することを目的としたtext-to-sql解析のタスクは、技術的なバックグラウンドを必要とせずに、エンドユーザーがデータベースから重要な情報を効率的に抽出できるため、近年注目を集めている。 テキストからSQLへのパースにおける大きな課題の1つはドメインの一般化である。 近年,テキスト・トゥ・テキスト・トランスフォーマー・モデルであるT5は,テキスト・トゥ・SQL解析に特化していないが,ドメインの一般化を目標とした標準ベンチマークで最先端のパフォーマンスを実現している。 本稿では,テキストからsqlへのパースのための特別なコンポーネントを用いて,事前学習されたt5モデルをさらに強化する方法を検討する。 このようなコンポーネントは、構造豊富なSQLを生成する上で重要な(潜在的にマルチホップ)推論におけるモデルの容量を改善するために、構造的帰納バイアスをテキストからSQLパーサに導入することが期待されている。 そこで,我々は,グラフ認識層によって拡張された標準事前学習トランスフォーマモデルを用いた混合モデルであるgraphix-t5を提案する。 大規模な実験と分析により、SPIDER、Syn、REALISTIC、DKの4つのテキスト-SQLベンチマークにおける GraphIX-T5の有効性が示されている。 GraphIX-T5 は他の T5 ベースのパーサーをはるかに上回り、新しい最先端のパフォーマンスを実現している。 特に、 GraphIX-T5-large はオリジナルの T5-large よりもパフォーマンスが5.7%向上し、EM の精度が6.6%向上した。 これによりT5-3BはEMで1.2%、EXで1.5%向上した。

The task of text-to-SQL parsing, which aims at converting natural language questions into executable SQL queries, has garnered increasing attention in recent years, as it can assist end users in efficiently extracting vital information from databases without the need for technical background. One of the major challenges in text-to-SQL parsing is domain generalization, i.e., how to generalize well to unseen databases. Recently, the pre-trained text-to-text transformer model, namely T5, though not specialized for text-to-SQL parsing, has achieved state-of-the-art performance on standard benchmarks targeting domain generalization. In this work, we explore ways to further augment the pre-trained T5 model with specialized components for text-to-SQL parsing. Such components are expected to introduce structural inductive bias into text-to-SQL parsers thus improving model's capacity on (potentially multi-hop) reasoning, which is critical for generating structure-rich SQLs. To this end, we propose a new architecture GRAPHIX-T5, a mixed model with the standard pre-trained transformer model augmented by some specially-designed graph-aware layers. Extensive experiments and analysis demonstrate the effectiveness of GRAPHIX-T5 across four text-to-SQL benchmarks: SPIDER, SYN, REALISTIC and DK. GRAPHIX-T5 surpass all other T5-based parsers with a significant margin, achieving new state-of-the-art performance. Notably, GRAPHIX-T5-large reach performance superior to the original T5-large by 5.7% on exact match (EM) accuracy and 6.6% on execution accuracy (EX). This even outperforms the T5-3B by 1.2% on EM and 1.5% on EX.
翻訳日:2023-01-19 15:49:53 公開日:2023-01-18
# Gated-ViGAT:新しいフレーム選択ポリシーとゲーティング機構を用いたボトムアップイベント認識と説明

Gated-ViGAT: Efficient Bottom-Up Event Recognition and Explanation Using a New Frame Selection Policy and Gating Mechanism ( http://arxiv.org/abs/2301.07565v1 )

ライセンス: Link先を確認
Nikolaos Gkalelis, Dimitrios Daskalakis, Vasileios Mezaris(参考訳) 本稿では,ボトムアップ(オブジェクト)情報,新しいフレームサンプリングポリシ,ゲーティング機構を利用した,映像イベント認識のための効率的な手法であるgated-vigatを提案する。 具体的には、グラフアテンションネットワーク(gats)の隣接行列(adjacency matrices)から派生した重み付きイングレード(wid)と、ビデオ中のイベントを表す最も有意義なフレームと、同時に多様なフレームを選択する異類似性尺度を用いる。 また、提案するゲーティング機構は、選択されたフレームを順次フェッチし、適切な確信度が得られた場合に早期にコミットする。 このように、ボトムアップ情報抽出に責任を負うネットワークの計算コストの高い分岐によって処理されるフレームはわずかである。 公開可能な2つの大規模ビデオデータセット(minikinetics, activitynet)の実験的評価により、gated-vigatは、優れたイベント認識と説明可能性性能を維持しつつ、以前のアプローチ(vigat)と比較して大きな計算複雑性の低減をもたらすことが示されている。 Gated-ViGATソースコードはhttps://github.com/bmezaris/Gated-ViGATで公開されている。

In this paper, Gated-ViGAT, an efficient approach for video event recognition, utilizing bottom-up (object) information, a new frame sampling policy and a gating mechanism is proposed. Specifically, the frame sampling policy uses weighted in-degrees (WiDs), derived from the adjacency matrices of graph attention networks (GATs), and a dissimilarity measure to select the most salient and at the same time diverse frames representing the event in the video. Additionally, the proposed gating mechanism fetches the selected frames sequentially, and commits early-exiting when an adequately confident decision is achieved. In this way, only a few frames are processed by the computationally expensive branch of our network that is responsible for the bottom-up information extraction. The experimental evaluation on two large, publicly available video datasets (MiniKinetics, ActivityNet) demonstrates that Gated-ViGAT provides a large computational complexity reduction in comparison to our previous approach (ViGAT), while maintaining the excellent event recognition and explainability performance. Gated-ViGAT source code is made publicly available at https://github.com/bmezaris/Gated-ViGAT
翻訳日:2023-01-19 15:43:04 公開日:2023-01-18
# スケーラブルなcirac-zollerマルチキュービットゲートの実現

Realization of Scalable Cirac-Zoller Multi-Qubit Gates ( http://arxiv.org/abs/2301.07564v1 )

ライセンス: Link先を確認
Chao Fang and Ye Wang and Ke Sun and Jungsang Kim(参考訳) 量子コンピューティングにおける普遍性定理は、任意の量子計算タスクは 1 と 2 の量子ビットで動く論理ゲートの有限集合に分解できるという定理である。 しかし、そのような分解の過程は一般に非効率的であり、しばしば指数関数的に多くのゲートが任意の計算タスクを実現する。 実用的なプロセッサ設計は、望まれる回路を実装するために2キュービット以上で動作するマルチキュービットゲートの可用性から大いに恩恵を受ける。 1995年、ciracとzollerは、ゲートが使用する運動モードの基底状態冷却に関する厳密な要件を持つ閉じ込められたイオンシステムにおいて、ネイティブなマルチ量子ビット制御された$z$ゲートを実現する方法を提案した。 別のアプローチであるM\o lmer-S\o rensenゲートは、残留運動励起に対して堅牢であり、多くの高忠実度ゲート実証の基礎となっている。 このゲートは2キュービットを超えておらず、多くのターゲットアルゴリズムを構築する際に追加のオーバーヘッドが発生する。 ここでは, 長鎖イオン鎖の性能向上を活かし, 完全プログラム可能でスケーラブルなシラク・ゾラーゲートを実現する。

The universality theorem in quantum computing states that any quantum computational task can be decomposed into a finite set of logic gates operating on one and two qubits. However, the process of such decomposition is generally inefficient, often leading to exponentially many gates to realize an arbitrary computational task. Practical processor designs benefit greatly from availability of multi-qubit gates that operate on more than two qubits to implement the desired circuit. In 1995, Cirac and Zoller proposed a method to realize native multi-qubit controlled-$Z$ gates in trapped ion systems, which has a stringent requirement on ground-state cooling of the motional modes utilized by the gate. An alternative approach, the M\o lmer-S\o rensen gate, is robust against residual motional excitation and has been a foundation for many high-fidelity gate demonstrations. This gate does not scale well beyond two qubits, incurring additional overhead when used to construct many target algorithms. Here, we take advantage of novel performance benefits of long ion chains to realize fully programmable and scalable high-fidelity Cirac-Zoller gates.
翻訳日:2023-01-19 15:42:40 公開日:2023-01-18
# コントラスト事前学習による数学的質問の包括的理解に向けて

Towards a Holistic Understanding of Mathematical Questions with Contrastive Pre-training ( http://arxiv.org/abs/2301.07558v1 )

ライセンス: Link先を確認
Yuting Ning, Zhenya Huang, Xin Lin, Enhong Chen, Shiwei Tong, Zheng Gong, Shijin Wang(参考訳) 数学的質問を効果的に理解することは重要なタスクであり、難易度推定のような多くの応用に役立つ。 研究者は、人間の注釈の不足(例えばラベル付けの困難など)により、質問表現のための事前学習モデルの設計に多くの注意を払っている。 しかし、一般的な自由形式のテキスト(例えばユーザーコメント)とは異なり、数学的質問は一般に明示的な目的と数学的論理で設計され、公式や関連する数学的知識(例えば関数)といったより複雑な内容で構成されている。 したがって、数学的な問題を表すという問題はいまだ未解決のままである。 そこで本研究では,より類似した目的を持った質問をより近くに持ち込もうとする数学的質問表現,すなわちQuesCoに対する,対照的な事前学習手法を提案する。 具体的には、コンテンツレベルと構造レベルを含む2段階の質問強化を最初に設計し、類似した目的で文字通り多様な質問ペアを生成する。 そこで我々は,知識概念の階層的情報を完全に活用するために,質問間の類似点をきめ細かな方法でランク付けする知識階層対応ランク戦略(KHAR)を提案する。 次に、ランキングの対比学習タスクを採用し、拡張された質問とランク付けされた質問に基づいてモデルを最適化します。 2つの実世界の数学的データセットについて広範な実験を行う。 実験の結果,本モデルの有効性が示された。

Understanding mathematical questions effectively is a crucial task, which can benefit many applications, such as difficulty estimation. Researchers have drawn much attention to designing pre-training models for question representations due to the scarcity of human annotations (e.g., labeling difficulty). However, unlike general free-format texts (e.g., user comments), mathematical questions are generally designed with explicit purposes and mathematical logic, and usually consist of more complex content, such as formulas, and related mathematical knowledge (e.g., Function). Therefore, the problem of holistically representing mathematical questions remains underexplored. To this end, in this paper, we propose a novel contrastive pre-training approach for mathematical question representations, namely QuesCo, which attempts to bring questions with more similar purposes closer. Specifically, we first design two-level question augmentations, including content-level and structure-level, which generate literally diverse question pairs with similar purposes. Then, to fully exploit hierarchical information of knowledge concepts, we propose a knowledge hierarchy-aware rank strategy (KHAR), which ranks the similarities between questions in a fine-grained manner. Next, we adopt a ranking contrastive learning task to optimize our model based on the augmented and ranked questions. We conduct extensive experiments on two real-world mathematical datasets. The experimental results demonstrate the effectiveness of our model.
翻訳日:2023-01-19 15:42:18 公開日:2023-01-18
# 事前学習拡散モデルによる目標画像再構成

Targeted Image Reconstruction by Sampling Pre-trained Diffusion Model ( http://arxiv.org/abs/2301.07557v1 )

ライセンス: Link先を確認
Jiageng Zheng(参考訳) トレーニングされたニューラルネットワークモデルは、トレーニングデータに関する情報を含む。 このようなモデルを考えると、悪意のある当事者はこのモデルにおける「知識」を活用でき、利用可能な情報(モデル反転攻撃として知られる)を印刷する方法を設計することができる。 そのため、そのような攻撃を行う方法を探究し、その重大さを示すことは貴重である。 本研究では,事前学習した拡散モデルを用いて,正確な対象分布を事前に知ることなく,対象クラスのデータポイントを生成する手法を提案する。

A trained neural network model contains information on the training data. Given such a model, malicious parties can leverage the "knowledge" in this model and design ways to print out any usable information (known as model inversion attack). Therefore, it is valuable to explore the ways to conduct a such attack and demonstrate its severity. In this work, we proposed ways to generate a data point of the target class without prior knowledge of the exact target distribution by using a pre-trained diffusion model.
翻訳日:2023-01-19 15:41:56 公開日:2023-01-18
# ガウス量子環境の量子古典的分解:確率的擬似モードモデル

A quantum-classical decomposition of Gaussian quantum environments: a stochastic pseudomode model ( http://arxiv.org/abs/2301.07554v1 )

ライセンス: Link先を確認
Si Luo, Neill Lambert, Mauro Cirio(参考訳) 量子系に線形に結合したガウスボソニック環境の効果は、0温度および古典的確率場における初期ボソニックモードの集合によって特徴づけられる確率的リンドブラッドマスター方程式によってシミュレートできることを示す。 本手法は,完全擬モードモデルと階層的運動方程式に対して多項式と指数カットオフを用いたオーミック環境の手法をそれぞれベンチマークする。 数値的には、モデルはガウス量子環境のシミュレーションに必要な量子資源を最適化する。 有理スペクトル密度のサブセットの場合、全てのパラメータは適合手順を必要とせずに明示的に指定され、モデリング戦略を簡素化する。

We show that the effect of a Gaussian Bosonic environment linearly coupled to a quantum system can be simulated by a stochastic Lindblad master equation characterized by a set of ancillary Bosonic modes initially at zero temperature and classical stochastic fields. We benchmark the method for Ohmic environments with polynomial and exponential cut-offs against the full pseudomode model and the Hierarchical Equation of Motion, respectively. Numerically, the model optimizes the quantum resources required for the simulation of Gaussian quantum environments. For a subset of rational spectral densities, all parameters are explicitly specified without the need of any fitting procedure, thereby simplifying the modeling strategy.
翻訳日:2023-01-19 15:41:48 公開日:2023-01-18
# ロボット作業計画のための論理プログラミング

Logic programming for deliberative robotic task planning ( http://arxiv.org/abs/2301.07550v1 )

ライセンス: Link先を確認
Daniele Meli, Hirenkumar Nakawala, Paolo Fiorini(参考訳) 過去10年間で、生産と日常生活におけるロボットの利用が増加している。 人間を含む様々な環境におけるタスクや相互作用がますます複雑化する中、ロボットは効率的な熟考のためにより高いレベルの自律性を必要とする。 タスクプランニングは、熟考の重要な要素です。 ロボットと環境に関する仕様が与えられた場合、基本操作を所定の目標を満たす構造化計画に組み合わせる。 本稿では,タスク計画問題への論理プログラミングの適用の最近の進歩について調査する。 論理プログラミングは、安全で信頼性の高いロボットの開発を支援する表現力と解釈性の向上など、他のアプローチと比較していくつかの利点がある。 我々は、ドメイン表現の表現性、計算効率、ソフトウェアの実装に基づいて、異なるプランナーとその特定のロボットアプリケーションに適合性を分析する。 このように、私たちはロボットデザイナーがアプリケーションのために最適なツールを選ぶのを支援します。

Over the last decade, the use of robots in production and daily life has increased. With increasingly complex tasks and interaction in different environments including humans, robots are required a higher level of autonomy for efficient deliberation. Task planning is a key element of deliberation. It combines elementary operations into a structured plan to satisfy a prescribed goal, given specifications on the robot and the environment. In this manuscript, we present a survey on recent advances in the application of logic programming to the problem of task planning. Logic programming offers several advantages compared to other approaches, including greater expressivity and interpretability which may aid in the development of safe and reliable robots. We analyze different planners and their suitability for specific robotic applications, based on expressivity in domain representation, computational efficiency and software implementation. In this way, we support the robotic designer in choosing the best tool for his application.
翻訳日:2023-01-19 15:41:37 公開日:2023-01-18
# ケミカルシステムの効率的な量子シミュレーションのための量子ニューラルネットワークによるハードウェア適応型アンサッツ

Quantum Neural Network Inspired Hardware Adaptable Ansatz for Efficient Quantum Simulation of Chemical Systems ( http://arxiv.org/abs/2301.07542v1 )

ライセンス: Link先を確認
Xiongzhi Zeng, Yi Fan, Jie Liu, Zhenyu Li, Jinlong Yang(参考訳) 変分量子固有ソルバは、ノイズの多い中間スケール量子 (nisq) コンピュータ上でschr\"odinger方程式を解く有望な方法であるが、その成功はよく設計された波動関数 ansatz に依存している。 物理的に動機付けられたアンサーゼと比較すると、ハードウェアヒューリスティックアンサーゼは、通常より浅い回路につながるが、NISQデバイスでは深すぎる。 量子ニューラルネットワークにインスパイアされた新しいハードウェアヒューリスティックアンサッツを提案し,現在利用可能な量子コンピュータ上で20以上の原子を持つ化学反応を現実的にシミュレーションするアンシラ量子ビットを導入することにより,回路深さを著しく低減する。 より重要なことに、この新しいansatzの表現性は、回路の深さまたは幅を増加させることで改善することができ、異なるハードウェア環境に適応できる。 これらの結果は、NISQ時代の量子計算の実用的な応用を開発するための新しい道を開いた。

The variational quantum eigensolver is a promising way to solve the Schr\"odinger equation on a noisy intermediate-scale quantum (NISQ) computer, while its success relies on a well-designed wavefunction ansatz. Compared to physically motivated ansatzes, hardware heuristic ansatzes usually lead to a shallower circuit, but it may still be too deep for an NISQ device. Inspired by the quantum neural network, we propose a new hardware heuristic ansatz where the circuit depth can be significantly reduced by introducing ancilla qubits, which makes a practical simulation of a chemical reaction with more than 20 atoms feasible on a currently available quantum computer. More importantly, the expressibility of this new ansatz can be improved by increasing either the depth or the width of the circuit, which makes it adaptable to different hardware environments. These results open a new avenue to develop practical applications of quantum computation in the NISQ era.
翻訳日:2023-01-19 15:41:03 公開日:2023-01-18
# 空間構造型ポンプを用いた4波混合プロセスに基づくヘキサパーティタイトステアリング

Hexapartite steering based on a four-wave-mixing process with a spatially structured pump ( http://arxiv.org/abs/2301.07536v1 )

ライセンス: Link先を確認
Yunyun Liang and Rongguo Yang and Jing Zhang and Tiancai Zhang(参考訳) アインシュタイン・ポドルスキー・ローゼン(epr)ステアリングはより安全な量子通信を実現するために広く研究されている。 4波混合過程における6本の空間分離ビームのステアリング特性について検討した。 全ての (1+i)/(i+1)-モード (i=1,2,3) ステアリングの挙動は、対応する相対的相互作用強度の役割を考慮すると理解できる。 さらに,5つのモードを含むより強力な集合的マルチパーティタイトステアリングは,信頼性の問題が重要である場合に,超セキュアなマルチユーザ量子ネットワークに潜在的な応用が期待できる。 全てのモノガミー関係についてさらに議論することで、我々のモデルに自然に含まれるタイプIVモノガミー関係が条件的に満足していることに気づく。 行列表現は初めてステアリングを表現するために使われ、モノゴミーの関係を直感的に理解するのに非常に有用である。 このコンパクトな位相非感受性スキームで得られる異なるステアリング特性は、異なる種類の量子通信タスクに潜在的に応用できる。

Multipartite Einstein-Podolsky-Rosen (EPR) steering has been widely studied, for realizing safer quantum communication. The steering properties of six spatially separated beams from the four-wave-mixing process with a spatially structured pump are investigated. Behaviors of all (1+i)/(i+1)-mode (i=1,2,3) steerings are understandable, if the role of the corresponding relative interaction strengths are taken into account. Moreover, stronger collective multipartite steerings including five modes also can be obtained in our scheme, which has potential applications in ultra-secure multiuser quantum networks when the issue of trust is critical. By further discussing about all monogamy relations, it is noticed that the type-IV monogamy relations, which are naturally included in our model, are conditionally satisfied. Matrix representation is used to express the steerings for the first time, which is very useful to understand the monogomy relations intuitively. Different steering properties obtained in this compact phase-insensitive scheme have potential applications for different kinds of quantum communication tasks.
翻訳日:2023-01-19 15:40:44 公開日:2023-01-18
# 電力需要分析のための自然言語処理アプリケーションの定量探索

A Quantitative Exploration of Natural Language Processing Applications for Electricity Demand Analysis ( http://arxiv.org/abs/2301.07535v1 )

ライセンス: Link先を確認
Yun Bai, Simon Camal, Andrea Michiorri(参考訳) 電力需要と気象の関係は長い間確立されており、カレンダーや重要なイベントなどの行動・社会的側面とともに、運用・計画の負荷予測の基盤の1つとなっている。 本稿では,ニュースに含まれる社会情報が,エネルギー需要の観点から集団行動の理解にどのように役立つかについて検討する。 全国ニュースから抽出した特徴が日頭電気需要予測に与える影響を分析する実験を通じて実施する。 結果は、カレンダーと気象情報にのみ訓練されたベンチマークモデルと比較される。 実験の結果, ベストパフォーマンスモデルでは, rmse, mae, smapeでは, 標準誤差が4%, 11%, 10%程度減少した。 最も優れた方法は次のとおりである。 単語頻度はcovid-19関連キーワードを、パンデミックや内政に関するニュースを識別する話題分布、国際紛争に関するニュースを識別するグローバル単語埋め込み。 本研究は, 従来の電力需要分析に新たな視点をもたらし, 社会学や経済学における潜在的影響とともに, テキストに含まれる非構造化情報による予測の改善の可能性を確認した。

The relationship between electricity demand and weather has been established for a long time and is one of the cornerstones in load prediction for operation and planning, along with behavioral and social aspects such as calendars or significant events. This paper explores how and why the social information contained in the news can be used better to understand aggregate population behaviour in terms of energy demand. The work is done through experiments analysing the impact of predicting features extracted from national news on day-ahead electric demand prediction. The results are compared to a benchmark model trained exclusively on the calendar and meteorological information. Experimental results showed that the best-performing model reduced the official standard errors around 4%, 11%, and 10% in terms of RMSE, MAE, and SMAPE. The best-performing methods are: word frequency identified COVID-19-related keywords; topic distribution that identified news on the pandemic and internal politics; global word embeddings that identified news about international conflicts. This study brings a new perspective to traditional electricity demand analysis and confirms the feasibility of improving its predictions with unstructured information contained in texts, with potential consequences in sociology and economics.
翻訳日:2023-01-19 15:40:27 公開日:2023-01-18
# 不確実性定量化を用いた物理システムモデリングのための物理情報場理論

Physics-informed Information Field Theory for Modeling Physical Systems with Uncertainty Quantification ( http://arxiv.org/abs/2301.07609v1 )

ライセンス: Link先を確認
Alex Alberts, Ilias Bilionis(参考訳) データ駆動アプローチと物理知識は、システムをモデル化するための強力なテクニックである。 このようなモデルの目標は、測定を既知の物理法則と組み合わせることで、基礎となる分野を効率的に解くことである。 多くのシステムは、欠落パラメータ、ノイズデータ、不完全物理法則などの未知の要素を含むため、これは不確実な定量化問題として広くアプローチされている。 すべての変数を扱う一般的な手法は、一般に後部を近似するために使用される数値スキームに依存しており、そのような離散化に依存しない方法を持つことが望ましい。 情報場理論(IFT)は、必ずしもガウス的ではない分野の統計を行うために必要なツールを提供する。 IFT を物理インフォームド IFT (PIFT) に拡張し,フィールドを記述する物理法則に関する情報を符号化する。 このPIFTから派生した後部は任意の数値スキームとは独立であり、複数のモードをキャプチャできるため、不適切な問題の解が得られる。 Klein-Gordon方程式を含む解析的な例を通して、我々のアプローチを実証する。 次に, 確率勾配ランジュバン力学の変種を開発し, 関節後方からフィールド上およびモデルパラメータ上にサンプルを抽出した。 本手法は, モデル形式誤差の異なる数値例と非線形微分方程式を含む逆問題に適用する。 加算として、後部がモデル形式の不確実性を自動的に定量化できるメートル法を備える。 このため, 数値実験により, この手法は十分なデータが得られる物理の誤った表現に対しても頑健であることがわかった。 本手法は,物理が信頼できない場合に正しく識別できることを数値的に証明し,その場合,フィールドの学習を回帰問題として自動的に扱う。

Data-driven approaches coupled with physical knowledge are powerful techniques to model systems. The goal of such models is to efficiently solve for the underlying field by combining measurements with known physical laws. As many systems contain unknown elements, such as missing parameters, noisy data, or incomplete physical laws, this is widely approached as an uncertainty quantification problem. The common techniques to handle all the variables typically depend on the numerical scheme used to approximate the posterior, and it is desirable to have a method which is independent of any such discretization. Information field theory (IFT) provides the tools necessary to perform statistics over fields that are not necessarily Gaussian. We extend IFT to physics-informed IFT (PIFT) by encoding the functional priors with information about the physical laws which describe the field. The posteriors derived from this PIFT remain independent of any numerical scheme and can capture multiple modes, allowing for the solution of problems which are ill-posed. We demonstrate our approach through an analytical example involving the Klein-Gordon equation. We then develop a variant of stochastic gradient Langevin dynamics to draw samples from the joint posterior over the field and model parameters. We apply our method to numerical examples with various degrees of model-form error and to inverse problems involving nonlinear differential equations. As an addendum, the method is equipped with a metric which allows the posterior to automatically quantify model-form uncertainty. Because of this, our numerical experiments show that the method remains robust to even an incorrect representation of the physics given sufficient data. We numerically demonstrate that the method correctly identifies when the physics cannot be trusted, in which case it automatically treats learning the field as a regression problem.
翻訳日:2023-01-19 15:34:37 公開日:2023-01-18
# オープンエンドタスク空間におけるヒューマン・タイムスケール適応

Human-Timescale Adaptation in an Open-Ended Task Space ( http://arxiv.org/abs/2301.07608v1 )

ライセンス: Link先を確認
Adaptive Agent Team, Jakob Bauer, Kate Baumli, Satinder Baveja, Feryal Behbahani, Avishkar Bhoopchand, Nathalie Bradley-Schmieg, Michael Chang, Natalie Clay, Adrian Collister, Vibhavari Dasagi, Lucy Gonzalez, Karol Gregor, Edward Hughes, Sheleem Kashem, Maria Loks-Thompson, Hannah Openshaw, Jack Parker-Holder, Shreya Pathak, Nicolas Perez-Nieves, Nemanja Rakicevic, Tim Rockt\"aschel, Yannick Schroecker, Jakub Sygnowski, Karl Tuyls, Sarah York, Alexander Zacherl, Lei Zhang(参考訳) 基礎モデルは、教師付きおよび自己教師付き学習問題において顕著な適応性とスケーラビリティを示してきたが、今のところこれらの成功は強化学習(RL)に完全には翻訳されていない。 そこで本研究では,rlエージェントを大規模に訓練することで,人間と同じ速度でオープンエンドな3d問題に適応できる汎用的文脈内学習アルゴリズムが実現できることを実証する。 アダプティブ・エージェント (AdA) は, 仮説駆動探索, 獲得した知識の効率的な活用, および, 一人称のデモンストレーションを成功に導くことができる。 適応は,(1)大規模でスムーズで多様なタスク分布にわたるメタ強化学習,(2)大規模注意に基づくメモリアーキテクチャとしてパラメータ化されたポリシー,(3)エージェントの能力の最前線でタスクを優先する効果的な自動化カリキュラムの3つから生じる。 本稿では,ネットワークサイズ,メモリ長,トレーニングタスク分布の豊かさに関する特徴的スケーリング則を示す。 我々の研究結果は、より大規模で適応的なRLエージェントの基礎を築き上げていると信じている。

Foundation models have shown impressive adaptation and scalability in supervised and self-supervised learning problems, but so far these successes have not fully translated to reinforcement learning (RL). In this work, we demonstrate that training an RL agent at scale leads to a general in-context learning algorithm that can adapt to open-ended novel embodied 3D problems as quickly as humans. In a vast space of held-out environment dynamics, our adaptive agent (AdA) displays on-the-fly hypothesis-driven exploration, efficient exploitation of acquired knowledge, and can successfully be prompted with first-person demonstrations. Adaptation emerges from three ingredients: (1) meta-reinforcement learning across a vast, smooth and diverse task distribution, (2) a policy parameterised as a large-scale attention-based memory architecture, and (3) an effective automated curriculum that prioritises tasks at the frontier of an agent's capabilities. We demonstrate characteristic scaling laws with respect to network size, memory length, and richness of the training task distribution. We believe our results lay the foundation for increasingly general and adaptive RL agents that perform well across ever-larger open-ended domains.
翻訳日:2023-01-19 15:34:10 公開日:2023-01-18
# 強い誘導バイアスは無害補間を確実に防止する

Strong inductive biases provably prevent harmless interpolation ( http://arxiv.org/abs/2301.07605v1 )

ライセンス: Link先を確認
Michael Aerni, Marco Milanta, Konstantin Donhauser, Fanny Yang(参考訳) 古典的知恵は、推定者は良い一般化を達成するためにノイズに適合しないようにすべきであることを示唆している。 対照的に、現代の過パラメータ化モデルでは、補間ノイズにもかかわらず、小さなテスト誤差が生じることがある -- しばしば「良心過剰」あるいは「無害補間」と呼ばれる現象である。 この論文は、補間が無害である程度は、推定子の帰納的バイアスの強さ、すなわち、特定の構造を持つ解をどの程度強く好むかにかかっていると論じている: 強い帰納的バイアスは無害な補間を防ぐが、弱い帰納的バイアスは、うまく一般化するために適切なノイズを必要とする。 我々の主理論的結果は、この現象を反映した高次元カーネル回帰の厳密な非漸近境界を確立し、フィルタサイズは誘導バイアスの強度を調節する。 さらに,フィルタサイズや回転不変性が異なる深層ニューラルネットワークに対して,同様の行動の実証的証拠を提供する。

Classical wisdom suggests that estimators should avoid fitting noise to achieve good generalization. In contrast, modern overparameterized models can yield small test error despite interpolating noise -- a phenomenon often called "benign overfitting" or "harmless interpolation". This paper argues that the degree to which interpolation is harmless hinges upon the strength of an estimator's inductive bias, i.e., how heavily the estimator favors solutions with a certain structure: while strong inductive biases prevent harmless interpolation, weak inductive biases can even require fitting noise to generalize well. Our main theoretical result establishes tight non-asymptotic bounds for high-dimensional kernel regression that reflect this phenomenon for convolutional kernels, where the filter size regulates the strength of the inductive bias. We further provide empirical evidence of the same behavior for deep neural networks with varying filter sizes and rotational invariance.
翻訳日:2023-01-19 15:33:47 公開日:2023-01-18
# チャットGPTはいかに人間専門家に近づいたか? 比較コーパス、評価、および検出

How Close is ChatGPT to Human Experts? Comparison Corpus, Evaluation, and Detection ( http://arxiv.org/abs/2301.07597v1 )

ライセンス: Link先を確認
Biyang Guo, Xin Zhang, Ziyuan Wang, Minqi Jiang, Jinran Nie, Yuxuan Ding, Jianwei Yue, Yupeng Wu(参考訳) ChatGPTの導入は、学術コミュニティと産業コミュニティの両方で広く注目を集めている。 ChatGPTは、幅広い人間の質問に効果的に対応でき、セキュリティと有用性の観点から、従来の公開チャットボットを大幅に上回る、流動的で包括的な回答を提供する。 一方の人々は、ChatGPTがこのような強みをいかに達成できるか、そして人間の専門家からの距離について興味を持っている。 一方、人々は、ChatGPTのような大きな言語モデル(LLM)が偽ニュース、盗作、社会保障問題といった社会にもたらす潜在的なネガティブな影響を懸念し始めている。 本研究では、オープンドメイン、ファイナンシャル、医療、法的、心理的分野の質問に対して、人間の専門家とChatGPTから数万件の比較回答を収集した。 収集したデータセットをHuman ChatGPT Comparison Corpus (HC3)と呼ぶ。 HC3データセットに基づいて,ChatGPTの応答特性,人間専門家の違いとギャップ,LLMの今後の方向性について検討した。 本研究は,ChatGPT生成内容の総合的評価と言語学的分析を行い,多くの興味深い結果が得られた。 その後、ChatGPTや人間によって特定のテキストが生成されるかどうかを効果的に検出する方法に関する広範な実験を行う。 3つの異なる検出システムを構築し,その有効性に影響を与えるいくつかの重要な要因を探索し,異なるシナリオで評価する。 データセット、コード、モデルはすべてhttps://github.com/Hello-SimpleAI/chatgpt-comparison-detectionで公開されている。

The introduction of ChatGPT has garnered widespread attention in both academic and industrial communities. ChatGPT is able to respond effectively to a wide range of human questions, providing fluent and comprehensive answers that significantly surpass previous public chatbots in terms of security and usefulness. On one hand, people are curious about how ChatGPT is able to achieve such strength and how far it is from human experts. On the other hand, people are starting to worry about the potential negative impacts that large language models (LLMs) like ChatGPT could have on society, such as fake news, plagiarism, and social security issues. In this work, we collected tens of thousands of comparison responses from both human experts and ChatGPT, with questions ranging from open-domain, financial, medical, legal, and psychological areas. We call the collected dataset the Human ChatGPT Comparison Corpus (HC3). Based on the HC3 dataset, we study the characteristics of ChatGPT's responses, the differences and gaps from human experts, and future directions for LLMs. We conducted comprehensive human evaluations and linguistic analyses of ChatGPT-generated content compared with that of humans, where many interesting results are revealed. After that, we conduct extensive experiments on how to effectively detect whether a certain text is generated by ChatGPT or humans. We build three different detection systems, explore several key factors that influence their effectiveness, and evaluate them in different scenarios. The dataset, code, and models are all publicly available at https://github.com/Hello-SimpleAI/chatgpt-comparison-detection.
翻訳日:2023-01-19 15:33:30 公開日:2023-01-18
# テキストと3Dポイントクラウドのための共同表現学習

Joint Representation Learning for Text and 3D Point Cloud ( http://arxiv.org/abs/2301.07584v1 )

ライセンス: Link先を確認
Rui Huang, Xuran Pan, Henry Zheng, Haojun Jiang, Zhifeng Xie, Shiji Song, Gao Huang(参考訳) ビジョン言語事前学習(例えばCLIP)の最近の進歩は、ビジョンモデルが言語監督の恩恵を受けることを示した。 言語モダリティを用いたモデルの多くは2次元視覚タスクにおいて大きな成功を収めてきたが、3D-Textデータペア取得の難しさと3Dデータ構造の不規則さのため、テキストによる3Dポイントクラウドの合同表現学習は未探索のままである。 本稿では,言語誘導型3Dポイントクラウドモデルを構築するための新しいText4Pointフレームワークを提案する。 キーとなるアイデアは、ポイントクラウドと言語モダリティを接続するブリッジとして2Dイメージを活用することだ。 提案されたText4Pointは、事前トレーニングと微調整のパラダイムに従っている。 事前学習の段階では、容易に利用可能なRGB-Dデータに基づいて画像と点雲の対応を確立し、コントラスト学習を用いて画像と点雲の表現を整合させる。 clipによって達成された画像やテキストの機能と合わせて、point cloud機能は暗黙的にテキスト埋め込みと一致します。 さらに,テキスト埋め込みをポイントクラウド機能で問合せすることにより,言語情報を3次元表現学習に統合するテキスト問合せモジュールを提案する。 微調整では、2D画像のないラベルセットから情報言語指導の下でタスク固有の3D表現を学習する。 大規模な実験により,本モデルは,ポイントクラウドセマンティックセグメンテーション,インスタンスセグメンテーション,オブジェクト検出など,さまざまなダウンストリームタスクに対して一貫した改善を示す。 コードはここにある。 https://github.com/LeapLabTHU/Text4Point

Recent advancements in vision-language pre-training (e.g. CLIP) have shown that vision models can benefit from language supervision. While many models using language modality have achieved great success on 2D vision tasks, the joint representation learning of 3D point cloud with text remains under-explored due to the difficulty of 3D-Text data pair acquisition and the irregularity of 3D data structure. In this paper, we propose a novel Text4Point framework to construct language-guided 3D point cloud models. The key idea is utilizing 2D images as a bridge to connect the point cloud and the language modalities. The proposed Text4Point follows the pre-training and fine-tuning paradigm. During the pre-training stage, we establish the correspondence of images and point clouds based on the readily available RGB-D data and use contrastive learning to align the image and point cloud representations. Together with the well-aligned image and text features achieved by CLIP, the point cloud features are implicitly aligned with the text embeddings. Further, we propose a Text Querying Module to integrate language information into 3D representation learning by querying text embeddings with point cloud features. For fine-tuning, the model learns task-specific 3D representations under informative language guidance from the label set without 2D images. Extensive experiments demonstrate that our model shows consistent improvement on various downstream tasks, such as point cloud semantic segmentation, instance segmentation, and object detection. The code will be available here: https://github.com/LeapLabTHU/Text4Point
翻訳日:2023-01-19 15:33:05 公開日:2023-01-18
# スポーツにおける高度なコンピュータビジョン技術に関する調査

A Survey of Advanced Computer Vision Techniques for Sports ( http://arxiv.org/abs/2301.07583v1 )

ライセンス: Link先を確認
Tiago Mendes-Neves, Lu\'is Meireles, Jo\~ao Mendes-Moreira(参考訳) コンピュータビジョンの発展はスポーツを含む多くの分野で大きな進歩をもたらしている。 追跡データなどのコンピュータビジョン技術上に構築された多くのアプリケーションは、現在すべてのトップレベルのアナリスト、コーチ、プレーヤにとって必須である。 本稿では,多くのスポーツ関連研究において,物体検出やポス推定などの膨大なデータ収集を支援するコンピュータビジョン技術について調査する。 コンピュータビジョンモデルのみを用いて得られたポーズデータを用いて、撮影速度推定のためのモデルを構築する。 我々のモデルは相関を67%達成する。 ショットスピードを推定する可能性によって、どんなスポーツでも選手のパフォーマンス向上に役立つ新しいメトリクスとレコメンデーションシステムの作成について、より深い研究が可能になる。 提案手法は,多くの技術運動に対して容易に複製可能であり,ビデオデータの入手に限られる。

Computer Vision developments are enabling significant advances in many fields, including sports. Many applications built on top of Computer Vision technologies, such as tracking data, are nowadays essential for every top-level analyst, coach, and even player. In this paper, we survey Computer Vision techniques that can help many sports-related studies gather vast amounts of data, such as Object Detection and Pose Estimation. We provide a use case for such data: building a model for shot speed estimation with pose data obtained using only Computer Vision models. Our model achieves a correlation of 67%. The possibility of estimating shot speeds enables much deeper studies about enabling the creation of new metrics and recommendation systems that will help athletes improve their performance, in any sport. The proposed methodology is easily replicable for many technical movements and is only limited by the availability of video data.
翻訳日:2023-01-19 15:32:37 公開日:2023-01-18
# 画像認識のためのブラインド不変量

Blur Invariants for Image Recognition ( http://arxiv.org/abs/2301.07581v1 )

ライセンス: Link先を確認
Jan Flusser, Matej Lebl, Matteo Pedone, Filip Sroubek, and Jitka Kostkova(参考訳) ぼやけは、取り除くのが難しい画像劣化です。 ぼかしに関する不変性は、ぼかしのないぼかし画像の記述と認識の代替手段を提供する。 本稿では、ブラー不変量に関する元の統一的理論を示す。 以前の全ての試みとは異なり、新しい理論はぼやけ型の事前の知識を必要としない。 不変量は直交射影作用素によってフーリエ領域に構築され、モーメント展開は効率的で安定な計算に使用される。 前述したぼやけた不変量はすべて、このアプローチの特別な場合であることが示されている。 並列アプローチに対する実験的な比較は、提案理論の利点を示している。

Blur is an image degradation that is difficult to remove. Invariants with respect to blur offer an alternative way of a~description and recognition of blurred images without any deblurring. In this paper, we present an original unified theory of blur invariants. Unlike all previous attempts, the new theory does not require any prior knowledge of the blur type. The invariants are constructed in the Fourier domain by means of orthogonal projection operators and moment expansion is used for efficient and stable computation. It is shown that all blur invariants published earlier are just particular cases of this approach. Experimental comparison to concurrent approaches shows the advantages of the proposed theory.
翻訳日:2023-01-19 15:32:24 公開日:2023-01-18
# Synthcity: 異なるデータモダリティにおける合成データの革新的利用を促進する

Synthcity: facilitating innovative use cases of synthetic data in different data modalities ( http://arxiv.org/abs/2301.07573v1 )

ライセンス: Link先を確認
Zhaozhi Qian, Bogdan-Constantin Cebere, Mihaela van der Schaar(参考訳) Synthcityは、静的データ、正規および不規則な時系列、検閲付きデータ、マルチソースデータ、複合データなど、さまざまな表データモダリティにまたがるMLフェアネス、プライバシ、拡張における合成データの革新的なユースケースのためのオープンソースソフトウェアパッケージである。 Synthcityは、人工データにおける最先端の研究とツールへの単一のアクセスポイントを提供する。 また、コミュニティに迅速な実験とプロトタイピングの場、SOTAベンチマークのワンストップショップ、そして研究効果を拡大する機会を提供する。 ライブラリはgithub(https://github.com/vanderschaarlab/synthcity)とpip(https://pypi.org/project/synthcity/)からアクセスできる。 フィードバックを提供し、バグを報告し、コードをコントリビュートすることで、コミュニティを温かく開発活動に参加させます。

Synthcity is an open-source software package for innovative use cases of synthetic data in ML fairness, privacy and augmentation across diverse tabular data modalities, including static data, regular and irregular time series, data with censoring, multi-source data, composite data, and more. Synthcity provides the practitioners with a single access point to cutting edge research and tools in synthetic data. It also offers the community a playground for rapid experimentation and prototyping, a one-stop-shop for SOTA benchmarks, and an opportunity for extending research impact. The library can be accessed on GitHub (https://github.com/vanderschaarlab/synthcity) and pip (https://pypi.org/project/synthcity/). We warmly invite the community to join the development effort by providing feedback, reporting bugs, and contributing code.
翻訳日:2023-01-19 15:32:14 公開日:2023-01-18
# 空孔を有する多孔質およびランダム合金におけるマルチスケール統計量子輸送

Multiscale statistical quantum transport in porous media and random alloys with vacancies ( http://arxiv.org/abs/2301.07569v1 )

ライセンス: Link先を確認
Elham Sharafedini, Hossein Hamzehpour and Mohammad Alidoust(参考訳) 本研究では,多孔質系あるいは非金属粒子と空隙をランダムに分散した金属マトリックスの電荷伝導率を,schr\"{o}dinger方程式とポアソン方程式を組み込んだ多スケール自己整合法を開発した。 合金系内の非金属粒子とクラスターのランダム分布を考慮し,無相関な白色ノイズモンテカルロサンプリングを用いて多数のランダム合金を生成し,電荷コンダクタンスを統計的に評価した。 我々は, ランダム粒子の固有パラメータと密度の関数として, ランダム多孔質および合金系の電気的側面をパラメトリック解析し, 種々の電気的側面について検討した。 その結果, 帯電コンダクタンスが一定である高圧コンダクタンスとは対照的に, 低電圧領域の帯電コンダクタンスは電圧変動に対して非常に非線形な挙動を示すことがわかった。 前者の発見は、量子散乱過程の直接的な結果である。 その結果、電圧差などの実験的に観測可能な量の閾値が明らかとなり、閾値よりも大きい値に対して電荷電流が活性化される。 数値的研究は、残量の関数として1量のしきい値を決定する。 この方法と結果は,このようなランダム合金システムを含む回路素子の設計における今後の実験の指針となる。

We have developed a multi-scale self-consistent method to study the charge conductivity of a porous system or a metallic matrix alloyed by randomly distributed nonmetallic grains and vacancies by incorporating Schr\"{o}dinger's equation and Poisson's equation. To account for the random distribution of the nonmetallic grains and clusters within the alloy system, we have used an uncorrelated white-noise Monte-Carlo sampling to generate numerous random alloys and statistically evaluate the charge conductance. We have performed a parametric study and investigated various electrical aspects of random porous and alloy systems as a function of the inherent parameters and density of the random grains. Our results find that the charge conductance within the low-voltage regime shows a highly nonlinear behavior against voltage variations in stark contrast to the high-voltage regime where the charge conductance is constant. The former finding is a direct consequence of the quantum scattering processes. The results reveal the threshold to the experimentally observable quantities, e.g., voltage difference, so that the charge current is activated for values larger than the threshold. The numerical study determines the threshold of one quantity as a function of the remaining quantities. Our method and results can serve to guide future experiments in designing circuital elements, involving this type of random alloy system.
翻訳日:2023-01-19 15:31:58 公開日:2023-01-18
# alphafold2のタンパク質構造予測における改善点

Beating the Best: Improving on AlphaFold2 at Protein Structure Prediction ( http://arxiv.org/abs/2301.07568v1 )

ライセンス: Link先を確認
Abbi Abdel-Rehim, Oghenejokpeme Orhobor, Hang Lou, Hao Ni and Ross D. King(参考訳) タンパク質構造予測(PSP)問題の目的は、アミノ酸配列からタンパク質の3D構造(確認)を予測することである。 この問題は、ノーブル賞受賞作品『アンフィンセン』がタンパク質のコンフォメーションが配列によって決定されたことを証明して以来、科学の「ホット・ゲイル」であった。 最近の重要なステップは、現在最高のPSP法であるAlphaFold2の開発であった。 AlphaFold2はおそらく、AIの科学への最も高度な応用だ。 AlphaFold2とRosTTAFold(もう一つの印象的なPSPメソッド)はどちらもパブリックドメイン(コードとモデル)で公開されている。 スタック化は、まず複数のベースラインモデルを学習し、次にベースラインレベルモデルの出力を使用してメタモデルを学習し、ベースラインモデルを上回るモデルを形成する、アンサンブル機械学習MLの形式である。 スタックは多くのアプリケーションで成功した。 我々はAlphaFold2とRosTTAFoldを積み重ねてARStack PSP法を開発した。 ARStackはAlphaFold2を大きく上回っている。 二種類の非ホモログタンパク質と、αfold2とrosettafoldのそれに続くタンパク質構造のテストセットを用いて、厳密に実証した。 より高品質な予測手法が公表されるにつれて、アンサンブルメソッドは1つのメソッドよりもますます優れていくだろう。

The goal of Protein Structure Prediction (PSP) problem is to predict a protein's 3D structure (confirmation) from its amino acid sequence. The problem has been a 'holy grail' of science since the Noble prize-winning work of Anfinsen demonstrated that protein conformation was determined by sequence. A recent and important step towards this goal was the development of AlphaFold2, currently the best PSP method. AlphaFold2 is probably the highest profile application of AI to science. Both AlphaFold2 and RoseTTAFold (another impressive PSP method) have been published and placed in the public domain (code & models). Stacking is a form of ensemble machine learning ML in which multiple baseline models are first learnt, then a meta-model is learnt using the outputs of the baseline level model to form a model that outperforms the base models. Stacking has been successful in many applications. We developed the ARStack PSP method by stacking AlphaFold2 and RoseTTAFold. ARStack significantly outperforms AlphaFold2. We rigorously demonstrate this using two sets of non-homologous proteins, and a test set of protein structures published after that of AlphaFold2 and RoseTTAFold. As more high quality prediction methods are published it is likely that ensemble methods will increasingly outperform any single method.
翻訳日:2023-01-19 15:31:37 公開日:2023-01-18
# 二項分類・回帰における損失関数の解析

An Analysis of Loss Functions for Binary Classification and Regression ( http://arxiv.org/abs/2301.07638v1 )

ライセンス: Link先を確認
Jeffrey Buzas(参考訳) 本稿では,二分分類と回帰応用におけるマージン型損失関数と一貫性の関係について検討する。 その結果,二項分類/回帰のマージンに基づく損失関数は,偶数関数で重み付けされたログライクなスコアに相当するスコアを推定できることがわかった。 整合的(一貫性のある)損失関数の簡単な特徴付けが与えられ、指数的損失やロジスティック損失など、異なる損失の直接比較が可能になる。 特徴付けはロジスティックモデルのための新しいHuber型損失関数を構築するために使用される。 マージンと標準ロジスティック回帰残差との単純な関係が導出され、すべてのマージンベースの損失を正方形標準ロジスティック回帰残差の損失関数と見なすことができる。 この関係は指数的およびロジスティックな損失に対する新しい単純な解釈を提供し、指数的損失が外れ値に敏感である理由を理解するのに役立つ。 特に、指数的損失の最小化は、二乗標準ロジスティック回帰残差の和を最小化することと同値であることが示されている。 この関係はまた、AdaBoostアルゴリズムに関する新たな洞察を提供する。

This paper explores connections between margin-based loss functions and consistency in binary classification and regression applications. It is shown that a large class of margin-based loss functions for binary classification/regression result in estimating scores equivalent to log-likelihood scores weighted by an even function. A simple characterization for conformable (consistent) loss functions is given, which allows for straightforward comparison of different losses, including exponential loss, logistic loss, and others. The characterization is used to construct a new Huber-type loss function for the logistic model. A simple relation between the margin and standardized logistic regression residuals is derived, demonstrating that all margin-based loss can be viewed as loss functions of squared standardized logistic regression residuals. The relation provides new, straightforward interpretations for exponential and logistic loss, and aids in understanding why exponential loss is sensitive to outliers. In particular, it is shown that minimizing empirical exponential loss is equivalent to minimizing the sum of squared standardized logistic regression residuals. The relation also provides new insight into the AdaBoost algorithm.
翻訳日:2023-01-19 15:25:28 公開日:2023-01-18
# ベクトルメタバースにおけるAIを活用した効果的な物理仮想シンクロナイゼーション

Generative AI-empowered Effective Physical-Virtual Synchronization in the Vehicular Metaverse ( http://arxiv.org/abs/2301.07636v1 )

ライセンス: Link先を確認
Minrui Xu, Dusit Niyato, Hongliang Zhang, Jiawen Kang, Zehui Xiong, Shiwen Mao, and Zhu Han(参考訳) Metaverseはユビキタス通信とコンピューティングのインフラを通じて物理世界と仮想空間をシームレスにブレンドする。 輸送システムでは、車載メタバースは完全没入型で超現実的な走行体験(例えば、拡張現実ヘッドアップディスプレイ、AR-HUD)を、道路側ユニット(RSU)を介してドライバーや自動運転車(AV)のユーザーに提供することができる。 しかし、リアルタイムおよび没入型サービスのプロビジョニングは、物理的なエンティティと仮想エンティティ、すなわちAVとMetaverse ARレコメンダ(MAR)間の効果的な物理仮想同期を必要とする。 本稿では,車載メタバースのための生成AIを用いた物理仮想同期フレームワークを提案する。 物理-仮想同期では、AVが生成するデジタルツイン(DT)タスクは、将来のルート生成と共にRSUで実行するためにオフロードされる。 仮想と物理の同期において、MARはユーザの好みに基づいた生成AIモデルを通じて、多様で個人的なARレコメンデーションをカスタマイズする。 さらに,リアルタイムかつ効果的なサービス提供のために,マルチタスクによるAVとMARのマッチングと価格設定を行う方式を提案する。 最後に, 特性分析と実験により, 提案するメカニズムは, 50%の社会的余剰を増加させる一方で, 戦略的防御および悪選好自由であることが判明した。

Metaverse seamlessly blends the physical world and virtual space via ubiquitous communication and computing infrastructure. In transportation systems, the vehicular Metaverse can provide a fully-immersive and hyperreal traveling experience (e.g., via augmented reality head-up displays, AR-HUDs) to drivers and users in autonomous vehicles (AVs) via roadside units (RSUs). However, provisioning real-time and immersive services necessitates effective physical-virtual synchronization between physical and virtual entities, i.e., AVs and Metaverse AR recommenders (MARs). In this paper, we propose a generative AI-empowered physical-virtual synchronization framework for the vehicular Metaverse. In physical-to-virtual synchronization, digital twin (DT) tasks generated by AVs are offloaded for execution in RSU with future route generation. In virtual-to-physical synchronization, MARs customize diverse and personal AR recommendations via generative AI models based on user preferences. Furthermore, we propose a multi-task enhanced auction-based mechanism to match and price AVs and MARs for RSUs to provision real-time and effective services. Finally, property analysis and experimental results demonstrate that the proposed mechanism is strategy-proof and adverse-selection free while increasing social surplus by 50%.
翻訳日:2023-01-19 15:25:07 公開日:2023-01-18
# ニューロン群を用いた局所学習

Local Learning with Neuron Groups ( http://arxiv.org/abs/2301.07635v1 )

ライセンス: Link先を確認
Adeetya Patel, Michael Eickenberg, Eugene Belilovsky(参考訳) 従来のディープネットワークトレーニング手法では、すべてのコンポーネントを共同でモノリシックな客観的関数に最適化する。 これは、潜在的な並列化の点で様々な非効率をもたらす可能性がある。 局所学習はモデル並列性に対するアプローチであり、標準のエンドツーエンド学習設定を取り除き、深層ネットワークにおけるモデルコンポーネント間の並列学習を可能にするために、局所目的関数を利用する。 近年の研究では、局所学習の変種が現代の深層ネットワークの効率的な訓練につながることが示されている。 しかしながら、どれだけの計算を分散できるかという点では、これらのアプローチは通常、ネットワーク内のレイヤ数によって制限される。 本研究では,局所学習が階層やモジュールをサブコンポーネントに分割するレベルでどのように局所学習を適用できるかを考察し,局所学習に関連する既存の深度ワイド・モジュラリティに幅ワイド・モジュラリティの概念を追加する。 このようなモデルを効率的に訓練できる地域学習の罰則について検討する。 CIFAR-10, CIFAR-100, Imagenet32データセットを用いた実験により, 局所学習に基づく既存手法に比べて, 幅レベルのモジュラリティの導入が計算上の優位性をもたらすことを示した。 コードはhttps://github.com/adeetyapatel12/gn-dgl。

Traditional deep network training methods optimize a monolithic objective function jointly for all the components. This can lead to various inefficiencies in terms of potential parallelization. Local learning is an approach to model-parallelism that removes the standard end-to-end learning setup and utilizes local objective functions to permit parallel learning amongst model components in a deep network. Recent works have demonstrated that variants of local learning can lead to efficient training of modern deep networks. However, in terms of how much computation can be distributed, these approaches are typically limited by the number of layers in a network. In this work we propose to study how local learning can be applied at the level of splitting layers or modules into sub-components, adding a notion of width-wise modularity to the existing depth-wise modularity associated with local learning. We investigate local-learning penalties that permit such models to be trained efficiently. Our experiments on the CIFAR-10, CIFAR-100, and Imagenet32 datasets demonstrate that introducing width-level modularity can lead to computational advantages over existing methods based on local learning and opens new opportunities for improved model-parallel distributed training. Code is available at: https://github.com/adeetyapatel12/GN-DGL.
翻訳日:2023-01-19 15:24:43 公開日:2023-01-18
# 不均一データセットにおける意味セグメンテーションの訓練

Training Semantic Segmentation on Heterogeneous Datasets ( http://arxiv.org/abs/2301.07634v1 )

ライセンス: Link先を確認
Panagiotis Meletis, Gijs Dubbelman(参考訳) 我々は,従来の単一データセットの均質トレーニングを超えてセマンティックセグメンテーションを探求し,セマンティックセグメンテーションの不均質トレーニング(HTSS)の課題を推し進める。 HTSSは、複数の異種データセット、すなわち競合するラベル空間を持つデータセットと、セマンティックセグメンテーションの観点から異なる(弱い)アノテーションタイプを同時にトレーニングする。 HTSSの定式化は,3方向のセマンティックセグメンテーションを強化する可能性のある,より大きく,これまで探索されていない情報の集約にディープネットワークを公開する。 i) パフォーマンス: 見たデータセットのセグメンテーションメトリクスの増加。 二 一般化:未発見データセットのセグメンテーションメトリクスの改善、及び 三 知識可能性:認識可能な意味概念の数の増加。 これらのhtssの利点を研究するために,fcn標準に準拠した単一ネットワークトレーニングパイプラインにヘテロジニアスデータセットを組み込む統一フレームワークを提案する。 当社のフレームワークは、まず異種データセットをキュレートして共通のフォーマットにし、その後、すべてのデータに対してシングルバックボーンのfcnを同時にトレーニングします。 これを達成するために、意味セグメンテーションと相容れない弱いアノテーションをピクセル単位のラベルに変換し、ラベル空間を普遍的な分類に階層化する。 トレーニングされたHTSSモデルは、幅広いデータセットのパフォーマンス向上と一般化を示し、数百のセマンティッククラスを含む推論ラベル空間を拡張する。

We explore semantic segmentation beyond the conventional, single-dataset homogeneous training and bring forward the problem of Heterogeneous Training of Semantic Segmentation (HTSS). HTSS involves simultaneous training on multiple heterogeneous datasets, i.e. datasets with conflicting label spaces and different (weak) annotation types from the perspective of semantic segmentation. The HTSS formulation exposes deep networks to a larger and previously unexplored aggregation of information that can potentially enhance semantic segmentation in three directions: i) performance: increased segmentation metrics on seen datasets, ii) generalization: improved segmentation metrics on unseen datasets, and iii) knowledgeability: increased number of recognizable semantic concepts. To research these benefits of HTSS, we propose a unified framework, that incorporates heterogeneous datasets in a single-network training pipeline following the established FCN standard. Our framework first curates heterogeneous datasets to bring them into a common format and then trains a single-backbone FCN on all of them simultaneously. To achieve this, it transforms weak annotations, which are incompatible with semantic segmentation, to per-pixel labels, and hierarchizes their label spaces into a universal taxonomy. The trained HTSS models demonstrate performance and generalization gains over a wide range of datasets and extend the inference label space entailing hundreds of semantic classes.
翻訳日:2023-01-19 15:24:21 公開日:2023-01-18
# 否定と述語発明による一般化

Generalisation Through Negation and Predicate Invention ( http://arxiv.org/abs/2301.07629v1 )

ライセンス: Link先を確認
David M. Cerna and Andrew Cropper(参考訳) 少数の例から一般化する能力は、機械学習における基本的な課題である。 この課題に対処するために、否定と述語的発明を組み合わせた帰納論理プログラミング(ILP)アプローチを導入する。 これら2つの特徴を組み合わせることで、ilpシステムは普遍的に定量化されたボディのみの変数でルールを学習することで、よりよい一般化が可能になる。 我々は,N OPIにおいて,否定を伴う正規論理プログラムを学習し,否定を成層化したデータログを含む発明を述語化する手法を実装した。 複数のドメインで実験した結果,予測精度と学習時間の改善が確認された。

The ability to generalise from a small number of examples is a fundamental challenge in machine learning. To tackle this challenge, we introduce an inductive logic programming (ILP) approach that combines negation and predicate invention. Combining these two features allows an ILP system to generalise better by learning rules with universally quantified body-only variables. We implement our idea in N OPI which can learn normal logic programs with negation and predicate invention, including Datalog with stratified negation. Our experimental results on multiple domains show that our approach improves predictive accuracies and learning times.
翻訳日:2023-01-19 15:23:59 公開日:2023-01-18
# Universal Neural-Cracking-Machines:補助データからの自己構成可能なパスワードモデル

Universal Neural-Cracking-Machines: Self-Configurable Password Models from Auxiliary Data ( http://arxiv.org/abs/2301.07628v1 )

ライセンス: Link先を確認
Dario Pasquini, Giuseppe Ateniese and Carmela Troncoso(参考訳) 最初のユニバーサルパスワードモデル -- 事前訓練されたパスワードモデル -- は、任意のパスワード配布に自動的に適応できる。 この結果を達成するために、モデルはターゲットセットからプレーンテキストパスワードにアクセスする必要はない。 代わりに、メールアドレスなどのユーザの補助情報をプロキシ信号として利用して、基盤となるターゲットパスワードの分布を予測する。 このモデルでは、ディープラーニングを使用して、ユーザグループ(例えば、webアプリケーションのユーザ)の補助データとパスワードの相関関係をキャプチャする。 そしてそれらのパターンを利用して、推論時にターゲットコミュニティ用に調整されたパスワードモデルを作成する。 さらなるトレーニングステップ、ターゲットデータ収集、コミュニティのパスワード配布に関する事前知識は不要である。 パスワード強度推定のための新たな最先端を定義するだけでなく、エンドユーザー(例えばシステム管理者)が適切なトレーニングデータを収集し、基礎となるパスワードモデルに適合させる必要なしに、システム用にカスタマイズされたパスワードモデルを自動的に生成できるようにする。 最終的に、当社のフレームワークは、十分に調整されたパスワードモデルのコミュニティへの民主化を可能にし、大規模なパスワードセキュリティソリューションの展開における大きな課題に対処します。

We develop the first universal password model -- a password model that, once pre-trained, can automatically adapt to any password distribution. To achieve this result, the model does not need to access any plaintext passwords from the target set. Instead, it exploits users' auxiliary information, such as email addresses, as a proxy signal to predict the underlying target password distribution. The model uses deep learning to capture the correlation between the auxiliary data of a group of users (e.g., users of a web application) and their passwords. It then exploits those patterns to create a tailored password model for the target community at inference time. No further training steps, targeted data collection, or prior knowledge of the community's password distribution is required. Besides defining a new state-of-the-art for password strength estimation, our model enables any end-user (e.g., system administrators) to autonomously generate tailored password models for their systems without the often unworkable requirement of collecting suitable training data and fitting the underlying password model. Ultimately, our framework enables the democratization of well-calibrated password models to the community, addressing a major challenge in the deployment of password security solutions on a large scale.
翻訳日:2023-01-19 15:23:47 公開日:2023-01-18
# ハイブリッドアンカー分岐に基づく新しいデータセットと2段階ミトーシス核検出法

A novel dataset and a two-stage mitosis nuclei detection method based on hybrid anchor branch ( http://arxiv.org/abs/2301.07627v1 )

ライセンス: Link先を確認
Huadeng Wang, Hao Xu, Bingbing Li, Xipeng Pan, Lingqi Zeng, Rushi Lan, Xiaonan Luo(参考訳) マイトシス検出は計算病理学における課題の一つであり, マイトシスカウントは病理学者にとって重要ながん診断指標である。 しかし、現在の有糸分裂核数は、主観的で時間を要するホットスポットにおける有糸分裂核の数を顕微鏡的に見る病理学者に依存している。 本稿では,ミトーシス検出のための2段階カスケードネットワークFoCasNetを提案する。 第1段階ではm_detと呼ばれる検出ネットワークが提案され、できるだけ多くのミトースを検出する。 第2段階では,第1段階の結果を洗練するために分類ネットワークm_classを提案する。 また、全体的な検出性能を向上させるため、注意機構、正規化方法、ハイブリッドアンカー分岐分類サブネットを導入する。 提案手法は, ICPR 2012 において 0.888 のF1スコアを達成している。 また,本研究チームによって初めてリリースされたgzmhデータセットについて評価を行い,現在広く使用されている複数の古典的検出ネットワークよりも優れた0.563のf1スコアに達した。 本手法の有効性と一般化を確認した。 コードはhttps://github.com/antifen/mitosis-nuclei-detectionで入手できる。

Mitosis detection is one of the challenging problems in computational pathology, and mitotic count is an important index of cancer grading for pathologists. However, current counts of mitotic nuclei rely on pathologists looking microscopically at the number of mitotic nuclei in hot spots, which is subjective and time-consuming. In this paper, we propose a two-stage cascaded network, named FoCasNet, for mitosis detection. In the first stage, a detection network named M_det is proposed to detect as many mitoses as possible. In the second stage, a classification network M_class is proposed to refine the results of the first stage. In addition, the attention mechanism, normalization method, and hybrid anchor branch classification subnet are introduced to improve the overall detection performance. Our method achieves the current highest F1-score of 0.888 on the public dataset ICPR 2012. We also evaluated our method on the GZMH dataset released by our research team for the first time and reached the highest F1-score of 0.563, which is also better than multiple classic detection networks widely used at present. It confirmed the effectiveness and generalization of our method. The code will be available at: https://github.com/antifen/mitosis-nuclei-detection.
翻訳日:2023-01-19 15:23:26 公開日:2023-01-18
# 離散時間結晶を用いた量子プロセッサのキャラクタリゼーション

Characterizing quantum processors using discrete time crystals ( http://arxiv.org/abs/2301.07625v1 )

ライセンス: Link先を確認
Victoria Zhang and Paul D. Nation(参考訳) 本稿では,離散時間結晶を用いた雑音量子プロセッサの性能評価手法を提案する。 理想的な永続振動挙動からの逸脱は、相対量子プロセッサ能力を測定できる数値スコアをもたらす。 我々は、ターゲットシステムの全トポロジをカバーする量子ビットレイアウトの小さなセットを構築し、これらのセットに対して幅広いIBM Quantumプロセッサ上でメトリックを実行する。 複数のプロセッサにまたがるだけでなく、個々のデバイスにまたがる異なる回路レイアウトの間にも、スコアに大きなばらつきがあることが示される。 結果の安定性についても検討した。 以上の結果から,量子システムの真の性能特性の把握には,独立したサブグラフではなく,全デバイスに対する尋問が必要であることが示唆された。 さらに,この結果と他の指標との相違は,ベンチマークが必ずしも量子プロセッサの実際の性能を示すものではないことを示している。 この方法はプラットフォームに依存しず、実装が簡単で、線形チェーンを形成する任意の数の量子ビットに拡張可能であり、同時に個々の量子ビットレベルでデバイスの不適切な領域を識別できる。

We present a method for characterizing the performance of noisy quantum processors using discrete time crystals. Deviations from ideal persistent oscillatory behavior give rise to numerical scores by which relative quantum processor capabilities can be measured. We construct small sets of qubit layouts that cover the full topology of a target system, and execute our metric over these sets on a wide range of IBM Quantum processors. We show that there is a large variability in scores, not only across multiple processors, but between different circuit layouts over individual devices. The stability of results is also examined. Our results suggest that capturing the true performance characteristics of a quantum system requires interrogation over the full device, rather than isolated subgraphs. Moreover, the disagreement between our results and other metrics indicates that benchmarks computed infrequently are not indicative of the real-world performance of a quantum processor. This method is platform agnostic, simple to implement, and scalable to any number of qubits forming a linear-chain, while simultaneously allowing for identifying ill-performing regions of a device at the individual qubit level.
翻訳日:2023-01-19 15:23:10 公開日:2023-01-18
# 予測モニタリングのためのパフォーマンス保存イベントログサンプリング

Performance-Preserving Event Log Sampling for Predictive Monitoring ( http://arxiv.org/abs/2301.07624v1 )

ライセンス: Link先を確認
Mohammadreza Fani Sani, Mozhgan Vazifehdoostirani, Gyunam Park, Marco Pegoraro, Sebastiaan J. van Zelst, Wil M.P. van der Aalst(参考訳) 予測プロセスモニタリングはプロセスマイニングのサブフィールドであり、プロセスインスタンスを実行するケースやイベントの機能を見積もることを目的としている。 このような予測はプロセスステークホルダーにとって重要な関心事である。 しかし、予測監視のための最先端の手法の多くは複雑な機械学習モデルのトレーニングを必要としており、これはしばしば非効率である。 さらに、これらの手法の多くは、現実の多くのアプリケーションでは実現不可能なトレーニングプロセスの繰り返しを必要とするハイパーパラメータ最適化を必要とする。 本稿では,予測モデルのためのサンプリング訓練プロセスインスタンスを可能にするインスタンス選択手順を提案する。 提案手法は,予測精度の信頼性を維持しつつ,次のアクティビティと継続時間予測手法のトレーニング速度を大幅に向上させることができることを示す。

Predictive process monitoring is a subfield of process mining that aims to estimate case or event features for running process instances. Such predictions are of significant interest to the process stakeholders. However, most of the state-of-the-art methods for predictive monitoring require the training of complex machine learning models, which is often inefficient. Moreover, most of these methods require a hyper-parameter optimization that requires several repetitions of the training process which is not feasible in many real-life applications. In this paper, we propose an instance selection procedure that allows sampling training process instances for prediction models. We show that our instance selection procedure allows for a significant increase of training speed for next activity and remaining time prediction methods while maintaining reliable levels of prediction accuracy.
翻訳日:2023-01-19 15:22:53 公開日:2023-01-18
# エッジデバイス用先端車両用サーマルフォワードビジョンシステムの開発, 最適化, 展開

Development, Optimization, and Deployment of Thermal Forward Vision Systems for Advance Vehicular Applications on Edge Devices ( http://arxiv.org/abs/2301.07613v1 )

ライセンス: Link先を確認
Muhammad Ali Farooq, Waseem Shariff, Faisal Khan, Peter Corcoran(参考訳) 本研究では, 気象・厳しい環境条件に対して, エンド・ツー・エンドのYOLO深層学習フレームワークを用いて, スマートフォワードセンシングシステムとして, 熱的小型ヨーロ多クラス物体検出(TTYMOD)システムを提案する。 安全を向上し、運転支援のための認識機能を改善する。 このシステムは、大規模なサーマルパブリックデータセットと、35,000以上の異なるサーマルフレームからなる新たなオープンソースデータセットに基づいて訓練されている。 熱データ上でのYOLO-v5小ネットワークの最適トレーニングと収束のために、確率的純度勾配(SGD)、Adam、および重量減衰を改良したAdamWを含む様々なオプティマイザを用いた。 温度調整された小型建築の性能は,多様で難易度の高い気象・環境条件下での局所的に収集された試験データとともに,一般向けにさらに評価される。 平均平均精度、秒間フレーム、平均推定時間を含む様々な定性的指標を用いて、熱調整ナノネットワークの有効性を定量化する。 実験の結果、ネットワークは平均推算時間/フレーム4ミリ秒で56.4%のベストマップを達成した。 この研究ではさらに、tensorflow lite量子化ツールを用いた小さなネットワーク変種の最適化が組み込まれており、エッジとモバイルデバイスにディープラーニングアーキテクチャをデプロイするのに有用である。 本研究では,Raspberry pi 4コンピューティングボードを用いて,自動車用センサ用サーマルオブジェクト検出ネットワークの最適化版の性能評価を行った。 ソースコード、トレーニングされたモデル、完全な検証/テスト結果はhttps://github.com/MAli-Farooq/Thermal-YOLO-And-Model-Optimization-Using-TensorFlowLiteで公開されている。

In this research work, we have proposed a thermal tiny-YOLO multi-class object detection (TTYMOD) system as a smart forward sensing system that should remain effective in all weather and harsh environmental conditions using an end-to-end YOLO deep learning framework. It provides enhanced safety and improved awareness features for driver assistance. The system is trained on large-scale thermal public datasets as well as newly gathered novel open-sourced dataset comprising of more than 35,000 distinct thermal frames. For optimal training and convergence of YOLO-v5 tiny network variant on thermal data, we have employed different optimizers which include stochastic decent gradient (SGD), Adam, and its variant AdamW which has an improved implementation of weight decay. The performance of thermally tuned tiny architecture is further evaluated on the public as well as locally gathered test data in diversified and challenging weather and environmental conditions. The efficacy of a thermally tuned nano network is quantified using various qualitative metrics which include mean average precision, frames per second rate, and average inference time. Experimental outcomes show that the network achieved the best mAP of 56.4% with an average inference time/ frame of 4 milliseconds. The study further incorporates optimization of tiny network variant using the TensorFlow Lite quantization tool this is beneficial for the deployment of deep learning architectures on the edge and mobile devices. For this study, we have used a raspberry pi 4 computing board for evaluating the real-time feasibility performance of an optimized version of the thermal object detection network for the automotive sensor suite. The source code, trained and optimized models and complete validation/ testing results are publicly available at https://github.com/MAli-Farooq/Thermal-YOLO-And-Model-Optimization-Using-TensorFlowLite.
翻訳日:2023-01-19 15:22:44 公開日:2023-01-18
# 確率バッチを用いた医用画像分割のためのアクティブラーニング

Active learning for medical image segmentation with stochastic batches ( http://arxiv.org/abs/2301.07670v1 )

ライセンス: Link先を確認
M\'elanie Gaillochet, Christian Desrosiers, and Herv\'e Lombaert(参考訳) 学習ベースのアルゴリズムのパフォーマンスは、トレーニングに使用するラベル付きデータ量によって向上する。 しかし、特に医用画像のセグメンテーションでは、手動でデータに注釈をつけるのは面倒で費用がかかる。 手動ラベリングを減らすために、アクティブラーニング(al)は、ラベルなしのセットから最も有益なサンプルをターゲットとし、ラベル付きトレーニングセットに注釈と追加を行う。 一方,能動学習では,医学的画像分割の難しい課題において,能動学習が極めて望ましいにもかかわらず,自然画像の分類や限定的なセグメンテーションに焦点が当てられている。 一方、不確実性に基づくALアプローチは、最適化されたバッチクエリ戦略を提供するが、多様性に基づく手法は計算コストが高い傾向にある。 ランダムサンプリングは, 学習条件やサンプリング条件の相違により, 性能が著しく向上することが証明された。 本研究の目的は,ランダムサンプリングによって提供される多様性と速度を生かして,医用画像のセグメンテーションにおける不確実性に基づくal法の選択を改善することである。 具体的には,ALにおけるサンプリング中の確率的バッチの本来の使用を通じて,サンプルの代わりにバッチレベルでの不確実性を計算することを提案する。 MRI前立腺画像を用いた医用画像のセグメンテーション実験により, 検体選択時の確率的バッチの利点は, トレーニングおよびサンプリング手順のさまざまな変化に対して堅牢であることが示された。

The performance of learning-based algorithms improves with the amount of labelled data used for training. Yet, manually annotating data can be tedious and expensive, especially in medical image segmentation. To reduce manual labelling, active learning (AL) targets the most informative samples from the unlabelled set to annotate and add to the labelled training set. On one hand, most active learning works have focused on the classification or limited segmentation of natural images, despite active learning being highly desirable in the difficult task of medical image segmentation. On the other hand, uncertainty-based AL approaches notoriously offer sub-optimal batch-query strategies, while diversity-based methods tend to be computationally expensive. Over and above methodological hurdles, random sampling has proven an extremely difficult baseline to outperform when varying learning and sampling conditions. This work aims to take advantage of the diversity and speed offered by random sampling to improve the selection of uncertainty-based AL methods for segmenting medical images. More specifically, we propose to compute uncertainty at the level of batches instead of samples through an original use of stochastic batches during sampling in AL. Exhaustive experiments on medical image segmentation, with an illustration on MRI prostate imaging, show that the benefits of stochastic batches during sample selection are robust to a variety of changes in the training and sampling procedures.
翻訳日:2023-01-19 15:16:36 公開日:2023-01-18
# 舞台裏:単一視点再構成のための密度場

Behind the Scenes: Density Fields for Single View Reconstruction ( http://arxiv.org/abs/2301.07668v1 )

ライセンス: Link先を確認
Felix Wimbauer, Nan Yang, Christian Rupprecht, Daniel Cremers(参考訳) 単一の画像から有意義な幾何学的シーン表現を推測することは、コンピュータビジョンにおける根本的な問題である。 従来の深度マップ予測に基づくアプローチは、画像で見える領域のみを推論できる。 現在、neural radiance field(nerfs)はカラーを含む真の3dをキャプチャできるが、単一の画像から生成するには複雑すぎる。 その代替として,単一の画像から暗黙の密度場を予測するニューラルネットワークを提案する。 画像のフラストラム内のすべての位置を体積密度にマッピングする。 我々のネットワークはビデオデータのみから自己監督によって訓練することができる。 暗黙のボリュームに色を保存せず、トレーニング中に利用可能なビューから直接色をサンプリングすることで、私たちのシーン表現はNeRFに比べてかなり複雑になり、ニューラルネットワークをトレーニングして予測することができます。 したがって、深度予測と新しいビュー合成の両方を行うためにボリュームレンダリングを適用することができる。 本実験では,入力画像にオクルードされた領域に対して有意な形状を予測できることを示す。 さらに,深度予測と新しい視点合成のための3つのデータセットに対するアプローチの可能性を示す。

Inferring a meaningful geometric scene representation from a single image is a fundamental problem in computer vision. Approaches based on traditional depth map prediction can only reason about areas that are visible in the image. Currently, neural radiance fields (NeRFs) can capture true 3D including color but are too complex to be generated from a single image. As an alternative, we introduce a neural network that predicts an implicit density field from a single image. It maps every location in the frustum of the image to volumetric density. Our network can be trained through self-supervision from only video data. By not storing color in the implicit volume, but directly sampling color from the available views during training, our scene representation becomes significantly less complex compared to NeRFs, and we can train neural networks to predict it. Thus, we can apply volume rendering to perform both depth prediction and novel view synthesis. In our experiments, we show that our method is able to predict meaningful geometry for regions that are occluded in the input image. Additionally, we demonstrate the potential of our approach on three datasets for depth prediction and novel-view synthesis.
翻訳日:2023-01-19 15:16:14 公開日:2023-01-18
# バッファガスセルを用いたアライメント型光ポンピング磁気センサ

Alignment-based optically pumped magnetometer using a buffer gas cell ( http://arxiv.org/abs/2301.07667v1 )

ライセンス: Link先を確認
L. M. Rushton, L. Elson, A. Meraki, K. Jensen(参考訳) 配向型光ポンピング磁気センサ(OPM)は、fT/sqrt(Hz)範囲で高い感度で振動する磁場を測定することができる。 これまでアライメントベースの磁力計はパラフィン被覆の蒸気電池のみを使用しており、アルカリ蒸気のスピン緩和寿命を延ばしている。 これらの細胞の欠点は、これらの細胞は手ぶらで、そのため時間がかかり、ある程度は信頼できない。 一方、バッファーガスセルはマイクロファブリケーション技術を用いて大量製造することができる。 セシウム(cs)アルカリ気相と窒素(n2)緩衝ガスを含む緩衝ガス気相セルを用いたアライメント型磁力計の最初の実証を行った。 OPMは550°Cで動作し、800Hzの帯域を持つ10kHzの振動磁界に対して325 fT/sqrt(Hz)の感度を実現する。 アライメントベースの磁力計は単一レーザービームを光ポンピングとプローブに使用し、1ビーム形状の頑健さとバッファーガスセルの大量マイクロファブリケーションの可能性から、高周波opmのより迅速な商業化を可能にする可能性がある。

Alignment-based optically pumped magnetometers (OPMs) are capable of measuring oscillating magnetic fields with high sensitivity in the fT/sqrt(Hz) range. Until now, alignment-based magnetometers have only used paraffin-coated vapour cells to extend the spin relaxation lifetimes of the alkali vapour. The drawback of these cells is that they are hand-blown and are therefore time-intensive, and somewhat unreliable, to produce. Buffer gas cells, on the other hand, can be manufactured on a mass scale using microfabrication techniques. We present the first demonstration of an alignment-based magnetometer using a buffer gas vapour cell containing caesium (Cs) alkali vapour and nitrogen (N2) buffer gas. The OPM is operated at 55 degrees C and we achieve a 325 fT/sqrt(Hz) sensitivity to 10 kHz oscillating magnetic fields with an 800 Hz bandwidth. The alignment-based magnetometer uses a single laser beam for optical pumping and probing and could potentially allow for more rapid commercialisation of radio-frequency OPMs, due to the robustness of the one-beam geometry and the potential for mass-scale microfabrication of buffer gas cells.
翻訳日:2023-01-19 15:15:56 公開日:2023-01-18
# DDS: 動的シーングラフ生成ネットワークの分離

DDS: Decoupled Dynamic Scene-Graph Generation Network ( http://arxiv.org/abs/2301.07666v1 )

ライセンス: Link先を確認
A S M Iftekhar, Raphael Ruschel, Satish Kumar, Suya You, B.S. Manjunath(参考訳) シーングラフ生成は、入力データから主観的対象関係三重項を予測することによって、シーン内のオブジェクト間の関係の構造表現を作成する。 しかし,既存の手法では,主に特徴学習に依存しているため,事前に定義されたセット外の三重項の検出性能が低かった。 この問題に対処するため、我々は、抽出された特徴を分離できる2つの独立したブランチからなる、分離された動的シーングラフ生成ネットワークであるddsを提案する。 現在の論文の重要な革新は、オブジェクトの関係を表す特徴を分離することで、新しいオブジェクト-関係の組み合わせの検出を可能にすることである。 ddsモデルは3つのデータセットで評価され、特に未発見の三重項検出において、以前の手法をかなりのマージンで上回っている。

Scene-graph generation involves creating a structural representation of the relationships between objects in a scene by predicting subject-object-relation triplets from input data. However, existing methods show poor performance in detecting triplets outside of a predefined set, primarily due to their reliance on dependent feature learning. To address this issue we propose DDS -- a decoupled dynamic scene-graph generation network -- that consists of two independent branches that can disentangle extracted features. The key innovation of the current paper is the decoupling of the features representing the relationships from those of the objects, which enables the detection of novel object-relationship combinations. The DDS model is evaluated on three datasets and outperforms previous methods by a significant margin, especially in detecting previously unseen triplets.
翻訳日:2023-01-19 15:15:33 公開日:2023-01-18
# log-mel-spectrograms用畳み込みオートエンコーダの再構成能力の検討

An investigation of the reconstruction capacity of stacked convolutional autoencoders for log-mel-spectrograms ( http://arxiv.org/abs/2301.07665v1 )

ライセンス: Link先を確認
Anastasia Natsiou, Luca Longo, Sean O'Leary(参考訳) 音声処理アプリケーションでは、ハイレベルな表現に基づく表現力のある音の生成は高い需要を示す。 これらの表現は音色を操り、創造的な器楽音の合成に影響を与えることができる。 ニューラルネットワークのような現代のアルゴリズムは、楽器の音色圧縮に基づく表現的シンセサイザーの開発に影響を与えた。 教師なしのディープラーニングは、ネットワークを訓練して波形やスペクトログラムから低次元表現へのマッピングを学ぶことで、オーディオ圧縮を実現することができる。 本研究では,重畳畳型オートエンコーダを用いて,各楽器の時間周波数音声表現の圧縮について検討した。 ハイパーパラメータと正規化技術のさらなる探索により、初期設計の性能が向上した。 教師なしの方法で、ネットワークは潜在表現に基づいて単音と調和音を再構成することができる。 また,本研究では,オリジナルと再構成されたサンプルの類似度を測定するための評価基準を導入する。 音声合成のための深部生成モデルの評価は難しい課題である。 本手法は,高調波音の知覚に重要な指標を示すため,生成された周波数の精度に基づく。 この研究は、ニューラルオートエンコーダを用いた音声圧縮実験の加速が期待されている。

In audio processing applications, the generation of expressive sounds based on high-level representations demonstrates a high demand. These representations can be used to manipulate the timbre and influence the synthesis of creative instrumental notes. Modern algorithms, such as neural networks, have inspired the development of expressive synthesizers based on musical instrument timbre compression. Unsupervised deep learning methods can achieve audio compression by training the network to learn a mapping from waveforms or spectrograms to low-dimensional representations. This study investigates the use of stacked convolutional autoencoders for the compression of time-frequency audio representations for a variety of instruments for a single pitch. Further exploration of hyper-parameters and regularization techniques is demonstrated to enhance the performance of the initial design. In an unsupervised manner, the network is able to reconstruct a monophonic and harmonic sound based on latent representations. In addition, we introduce an evaluation metric to measure the similarity between the original and reconstructed samples. Evaluating a deep generative model for the synthesis of sound is a challenging task. Our approach is based on the accuracy of the generated frequencies as it presents a significant metric for the perception of harmonic sounds. This work is expected to accelerate future experiments on audio compression using neural autoencoders.
翻訳日:2023-01-19 15:15:19 公開日:2023-01-18
# 発散自発波動関数崩壊に対する線形摩擦多体方程式について

On the linear friction many-body equation for dissipative spontaneous wavefunction collapse ( http://arxiv.org/abs/2301.07661v1 )

ライセンス: Link先を確認
Giovanni Di Bartolomeo and Matteo Carlesso and Kristian Piscicchia and Catalina Curceanu and Maaneli Derakhshani and Lajos Di\'osi(参考訳) 自然界における基本自発的デコヒーレンスと自発的波動関数の崩壊に関する既存の非相対論的理論の新たな散逸拡張を目的として,多体系に対する最も単純な普遍散逸リンドブラッドマスター方程式を構築し,研究する。 これは、第二量子化された質量密度$\rod$と現在の$\jvo$という用語で書かれるので普遍的であり、物質構造とそのパラメータとは独立している。 電流の線形摩擦を仮定すると、散逸構造は厳密に制約されていることが分かる。 発散性リンドブラッド方程式の一般構造に従うと、最もよく知られた2つの自発波関数崩壊モデル、Di\'osi-Penrose と連続自発局在モデルの発散性拡張を導出し、解析する。

We construct and study the simplest universal dissipative Lindblad master equation for many-body systems with the purpose of a new dissipative extension of existing non-relativistic theories of fundamental spontaneous decoherence and spontaneous wave function collapse in Nature. It is universal as it is written in terms of second-quantized mass density $\rod$ and current $\Jvo$, thus making it independent of the material structure and its parameters. Assuming a linear friction in the current, we find that the dissipative structure is strictly constrained. Following the general structure of our dissipative Lindblad equation, we derive and analyze the dissipative extensions of the two most known spontaneous wave function collapse models, the Di\'osi-Penrose and the Continuous Spontaneous Localization models.
翻訳日:2023-01-19 15:15:02 公開日:2023-01-18
# 合成制御モデルの非パラメトリック識別性と感度解析

Non-parametric identifiability and sensitivity analysis of synthetic control models ( http://arxiv.org/abs/2301.07656v1 )

ライセンス: Link先を確認
Jakob Zeitler and Athanasios Vlontzos and Ciaran M. Gilligan-Lee(参考訳) 原因と効果の関係の定量化は多くの領域において重要な問題である。 金標準の解決策はランダム化制御試験を行うことである。 しかし、多くの場合、このような裁判は行われない。 このような試行がない状態では、特定の仮定により観測データからの介入による因果的影響を定量化するために多くの方法が考案されている。 広く使われている方法は合成制御モデルである。 このようなモデルにおける因果推定の同定性は、様々な仮定から得られているが、基礎となる仮定は、前と後の両方の期間にわたって満たされていると広く暗黙的に仮定されている。 これは、合成制御モデルが事前介入期間にのみ学習できるため、強い仮定である。 本稿では,この課題に対処し,不変因果機構の原理に従うことによって,この仮定を必要とせずに同定可能性を証明する。 さらに, パールの構造因果モデルフレームワークにおいて, 合成制御モデルを定式化し, 研究した。 重要となるのは,非パラメトリック同定可能性に基づく仮定の違反に対する合成制御因果推論の感度分析のための汎用フレームワークを提案することである。 最後に, 広く使用されている線形合成制御フレームワークにおいて, シミュレーションおよび実データに対する感度解析フレームワークの実証実験を行った。

Quantifying cause and effect relationships is an important problem in many domains. The gold standard solution is to conduct a randomised controlled trial. However, in many situations such trials cannot be performed. In the absence of such trials, many methods have been devised to quantify the causal impact of an intervention from observational data given certain assumptions. One widely used method are synthetic control models. While identifiability of the causal estimand in such models has been obtained from a range of assumptions, it is widely and implicitly assumed that the underlying assumptions are satisfied for all time periods both pre- and post-intervention. This is a strong assumption, as synthetic control models can only be learned in pre-intervention period. In this paper we address this challenge, and prove identifiability can be obtained without the need for this assumption, by showing it follows from the principle of invariant causal mechanisms. Moreover, for the first time, we formulate and study synthetic control models in Pearl's structural causal model framework. Importantly, we provide a general framework for sensitivity analysis of synthetic control causal inference to violations of the assumptions underlying non-parametric identifiability. We end by providing an empirical demonstration of our sensitivity analysis framework on simulated and real data in the widely-used linear synthetic control framework.
翻訳日:2023-01-19 15:14:44 公開日:2023-01-18
# hmdo: 変形可能なオブジェクトによるマーカーレスマルチビューハンド操作キャプチャ

HMDO: Markerless Multi-view Hand Manipulation Capture with Deformable Objects ( http://arxiv.org/abs/2301.07652v1 )

ライセンス: Link先を確認
Wei Xie, Zhipeng Yu, Zimeng Zhao, Binghui Zuo, Yangang Wang(参考訳) HMDO(Hand Manipulation with Deformable Objects)と呼ばれる手と手の動きを対話的に記録する最初のマーカーレス変形型相互作用データセットを構築した。 構築したマルチビューキャプチャシステムにより、複数の視点、さまざまなオブジェクト形状、多様なインタラクティブなフォームとの変形可能な相互作用をキャプチャする。 私たちのモチベーションは、手と変形可能なオブジェクトインタラクションデータセットが現在の欠如していることにあります。 主に相互咬合のため、相互作用領域の観察が困難であり、手と物体の視覚的な特徴が絡み合っており、相互作用領域の変形の再構築が困難である。 この課題に取り組むために,我々はキャプチャしたデータをアノテートする手法を提案する。 我々のキーとなる考え方は、オブジェクトのグローバルポーズ推定を導くために、推定手の特徴と協調して、手とオブジェクトの関係を分析することによって、オブジェクトの変形過程を最適化することである。 包括的評価により,手と変形可能な物体の対話動作を高品質に再現することができる。 HMDOは現在、12列以上の21600フレームで構成されている。 将来的には、このデータセットは、変形可能なインタラクションシーンの学習に基づく再構築の研究を促進するだろう。

We construct the first markerless deformable interaction dataset recording interactive motions of the hands and deformable objects, called HMDO (Hand Manipulation with Deformable Objects). With our built multi-view capture system, it captures the deformable interactions with multiple perspectives, various object shapes, and diverse interactive forms. Our motivation is the current lack of hand and deformable object interaction datasets, as 3D hand and deformable object reconstruction is challenging. Mainly due to mutual occlusion, the interaction area is difficult to observe, the visual features between the hand and the object are entangled, and the reconstruction of the interaction area deformation is difficult. To tackle this challenge, we propose a method to annotate our captured data. Our key idea is to collaborate with estimated hand features to guide the object global pose estimation, and then optimize the deformation process of the object by analyzing the relationship between the hand and the object. Through comprehensive evaluation, the proposed method can reconstruct interactive motions of hands and deformable objects with high quality. HMDO currently consists of 21600 frames over 12 sequences. In the future, this dataset could boost the research of learning-based reconstruction of deformable interaction scenes.
翻訳日:2023-01-19 15:14:27 公開日:2023-01-18
# ヒト感情の顔面温熱・血液灌流パターン : 概念実証

Facial Thermal and Blood Perfusion Patterns of Human Emotions: Proof-of-Concept ( http://arxiv.org/abs/2301.07650v1 )

ライセンス: Link先を確認
Victor H. Aristizabal-Tique (1), Marcela Henao-P\'erez (2), Diana Carolina L\'opez-Medina (2), Renato Zambrano-Cruz (3), Gloria D\'iaz-Londo\~nod (4) ((1) School of Engineering - Universidad Cooperativa de Colombia - Medell\'in - Colombia, (2) School of Medicine - Universidad Cooperativa de Colombia - Medell\'in -Colombia, (3) School of Psychology - Universidad Cooperativa de Colombia - Medell\'in - Colombia, (4) School of Science - Universidad Nacional de Colombia - Medell\'in - Colombia)(参考訳) 本研究の目的は, サーモグラフィ画像と血液灌流アルゴリズムを用いて, 概念実証と感情評価の予備的研究を行うことであり, ジュネーブ感情画像データベースのプロトコルに従って, ベースラインと正と負の原子価が得られた。 血液灌流アルゴリズムは熱輸送方程式に基づいている。 額, 眼周, 頬, 鼻, 上唇の平均温度および血流量を測定した。 平均値と基準値の絶対値とパーセンテージ差を算出した。 負の原子価では、ROIでは温度と血液灌流の低下が見られ、その効果は右側よりも左側の方が大きかった。 陽性では, 温度と血流量が増加し, 複雑なパターンがみられた。 鼻の温度と灌流量は両値ともに減少し, 覚醒次元の指標となった。 また, 血液灌流画像では, 血液灌流画像の比率差がサーモグラフィ画像で得られた画像よりも大きかった。 また, 血液灌流画像と血管運動反応は一致しており, 感情の同定において, サーモグラフィ解析よりも優れたバイオマーカーとなる。

The objective of the work was to realize a preliminary study of proof-of-concept to evaluate emotions using thermographic images and blood perfusion algorithm; the images were obtained for baseline and positive and negative valence according to the protocol of the Geneva Affective Picture Database. The blood perfusion algorithm is based on the heat transport equation. The average temperature and blood perfusion in forehead, periorbital eyes, cheeks, nose and upper lips were determined. Absolute and percentage differences between the valences and the baseline were calculated. For negative valence, a decrease in temperature and blood perfusion was observed in the ROIs, and the effect was greater on the left side than on the right side. In positive valence, the temperature and blood perfusion increased in some cases, showing a complex pattern. The temperature and perfusion of the nose was reduced for both valences, which is indicative of the arousal dimension. The blood perfusion images were found to be greater contrast; the percentage differences in the blood perfusion images are greater than those obtained in thermographic images. Moreover, the blood perfusion images, and vasomotor answer are consistent, therefore, they can be a better biomarker than thermographic analysis in identifying emotions.
翻訳日:2023-01-19 15:14:07 公開日:2023-01-18
# レコメンダシステムのためのグラフニューラルネットワークアプローチにおけるバイアス増幅の比較解析

A Comparative Analysis of Bias Amplification in Graph Neural Network Approaches for Recommender Systems ( http://arxiv.org/abs/2301.07639v1 )

ライセンス: Link先を確認
Nikzad Chizari, Niloufar Shoeibi and Mar\'ia N. Moreno-Garc\'ia(参考訳) Recommender Systems(RS)は、ユーザーに対してパーソナライズされたアイテムレコメンデーションを提供し、情報過負荷の問題を克服するのに役立つ。 現在、深層学習に基づく推薦手法は、ユーザとアイテムの複雑な関係を表現し、追加情報を取り込む能力から、マトリックス因子化のような従来の手法に固執している。 これらのデータがグラフ構造を持ち、グラフニューラルネットワーク(gnn)がこれらの構造から学ぶ能力が高いという事実は、レコメンダシステムへの導入の成功につながった。 しかし,これらのアルゴリズムを用いてバイアス増幅問題を調べる必要がある。 バイアスは不公平な判断を下し、社会的失望と環境被害によって会社の評判や財務状態に悪影響を及ぼす可能性がある。 本稿では,GNNアルゴリズムのバイアスに対する振る舞いを,最先端の手法と比較して,文献レビューと分析を通じて包括的に研究することを目的とする。 モデルパフォーマンスへの影響を最小限に抑えながら、この問題に取り組むための適切なソリューションも検討するつもりです。

Recommender Systems (RSs) are used to provide users with personalized item recommendations and help them overcome the problem of information overload. Currently, recommendation methods based on deep learning are gaining ground over traditional methods such as matrix factorization due to their ability to represent the complex relationships between users and items and to incorporate additional information. The fact that these data have a graph structure and the greater capability of Graph Neural Networks (GNNs) to learn from these structures has led to their successful incorporation into recommender systems. However, the bias amplification issue needs to be investigated while using these algorithms. Bias results in unfair decisions, which can negatively affect the company reputation and financial status due to societal disappointment and environmental harm. In this paper, we aim to comprehensively study this problem through a literature review and an analysis of the behavior against biases of different GNN-based algorithms compared to state-of-the-art methods. We also intend to explore appropriate solutions to tackle this issue with the least possible impact on the model performance.
翻訳日:2023-01-19 15:13:46 公開日:2023-01-18
# グレースケールハードマスクリソグラフィーによる炭化ケイ素中の半球状固体浸漬レンズのスケーラブル化

Scalable fabrication of hemispherical solid immersion lenses in silicon carbide through grayscale hard-mask lithography ( http://arxiv.org/abs/2301.07705v1 )

ライセンス: Link先を確認
Christiaan Bekker, Muhammad Junaid Arshad, Pasquale Cilibrizzi, Charalampos Nikolatos, Peter Lomax, Graham S. Wood, Rebecca Cheung, Wolfgang Knolle, Neil Ross, Brian Gerardot, and Cristian Bonato(参考訳) グレースケールリソグラフィは、標準的なリソグラフィと完全に互換性のあるプロセスで、空間的に制御された高さのマイクロメートルの特徴を作成できる。 ここでは、灰色スケールリソグラフィーとハードマスク技術を組み合わせた新しい製造プロトコルを用いて、炭化ケイ素で固体浸漬レンズを実演し、半径5$\mu$mの半球レンズを基板にエッチングできるようにする。 この技術はCMOS技術と高度にスケーラブルで互換性があり、その後のドライエッチングの化学制御により抵抗パターン化後のデバイスアスペクト比を調整できる。 これらの結果は、集束イオンビームミリングに代わる低コスト、高スループット、工業的に関連し、高アスペクト比の丸いミクロ組織を創り出す。

Grayscale lithography allows the creation of micrometer-scale features with spatially-controlled height in a process that is fully compatible with standard lithography. Here, solid immersion lenses are demonstrated in silicon carbide using a novel fabrication protocol combining grayscale lithography and hard-mask techniques to allow nearly hemispherical lenses of 5 $\mu$m radius to be etched into the substrate. The technique is highly scalable and compatible with CMOS technology, and device aspect ratios can be tuned after resist patterning by controlling the chemistry of the subsequent dry etch. These results provide a low-cost, high-throughput and industrially-relevant alternative to focused ion beam milling for the creation of high-aspect-ratio, rounded microstructures.
翻訳日:2023-01-19 15:07:38 公開日:2023-01-18
# 未知空間分布を用いた3次元画像合成の学習

Learning 3D-aware Image Synthesis with Unknown Pose Distribution ( http://arxiv.org/abs/2301.07702v1 )

ライセンス: Link先を確認
Zifan Shi, Yujun Shen, Yinghao Xu, Sida Peng, Yiyi Liao, Sheng Guo, Qifeng Chen, Dit-Yan Yeung(参考訳) 既存の3次元認識画像合成手法は,トレーニングセットで推定される3次元ポーズ分布に大きく依存する。 不正確な推定は、モデルを誤り幾何学の学習に誤用する可能性がある。 本研究は3次元ポーズ先行条件から生成放射場を解放するPoF3Dを提案する。 まず,隠れたコードからポーズを推測できる効率的なポーズ学習器を発電機に装備し,その基礎となる真ポーズ分布を自動的に近似する。 次に、判別器に、ジェネレータの監督下でポーズ分布を学習し、予測されたポーズを条件として実画像と合成画像を区別するタスクを割り当てる。 ポーズフリージェネレータとポーズアウェア判別器とを相反的に共同で訓練する。 いくつかのデータセットにおいて、画像の品質と幾何学的品質の両方に関して、我々のアプローチの性能が、最先端技術と同等であることを確認した。 我々の知る限り、PoF3Dは初めて3Dポーズを使わずに高品質な3D画像合成を学習できる可能性を示した。

Existing methods for 3D-aware image synthesis largely depend on the 3D pose distribution pre-estimated on the training set. An inaccurate estimation may mislead the model into learning faulty geometry. This work proposes PoF3D that frees generative radiance fields from the requirements of 3D pose priors. We first equip the generator with an efficient pose learner, which is able to infer a pose from a latent code, to approximate the underlying true pose distribution automatically. We then assign the discriminator a task to learn pose distribution under the supervision of the generator and to differentiate real and synthesized images with the predicted pose as the condition. The pose-free generator and the pose-aware discriminator are jointly trained in an adversarial manner. Extensive results on a couple of datasets confirm that the performance of our approach, regarding both image quality and geometry quality, is on par with state of the art. To our best knowledge, PoF3D demonstrates the feasibility of learning high-quality 3D-aware image synthesis without using 3D pose priors for the first time.
翻訳日:2023-01-19 15:07:24 公開日:2023-01-18
# attention2minority:salient instance inferenceに基づく複数インスタンス学習によるスライド画像中の小病変の分類

Attention2Minority: A salient instance inference-based multiple instance learning for classifying small lesions in whole slide images ( http://arxiv.org/abs/2301.07700v1 )

ライセンス: Link先を確認
Ziyu Su, Mostafa Rezapour, Usama Sajjad, Metin Nafi Gurcan, Muhammad Khalid Khan Niazi(参考訳) 多発性インスタンス学習(MIL)モデルは、疾患分類問題に対するスライド画像全体(WSI)解析において顕著な成功を収めた。 しかし, ギガピクセルWSI分類問題では, 現在のMILモデルでは, 極めて小さな腫瘍病変を有するWSIを識別できないことが多い。 ミルバッグ内の微小な腫瘍対正常面積比は、小腫瘍病変に対応する領域を適切に重み付けすることを注意機構を阻害する。 この課題を克服するために、WSI分類のための弱教師付きMILモデルであるSiliMIL(SiliMIL)を提案する。 提案手法は最初,通常のWSIの表現を学習し,通常のWSIの表現とすべての入力パッチを比較して,入力されたWSIの健全なインスタンスを推測する。 最後に、注意に基づくMILを用いて、WSIの選択したパッチに基づいてスライドレベルの分類を行う。 以上の結果から,シイミルはwsiの1%未満しか摂取できない腫瘍の症例を正確に同定でき,バッグ内の正常例に対する腫瘍の比率を2~4倍に増やせることを示唆した。 大きな腫瘍の病変に対して等しく機能する点に注意が必要だ。 その結果、SiiMILは最先端のMIL法よりも性能が大幅に向上した。

Multiple instance learning (MIL) models have achieved remarkable success in analyzing whole slide images (WSIs) for disease classification problems. However, with regard to gigapixel WSI classification problems, current MIL models are often incapable of differentiating a WSI with extremely small tumor lesions. This minute tumor-to-normal area ratio in a MIL bag inhibits the attention mechanism from properly weighting the areas corresponding to minor tumor lesions. To overcome this challenge, we propose salient instance inference MIL (SiiMIL), a weakly-supervised MIL model for WSI classification. Our method initially learns representations of normal WSIs, and it then compares the normal WSIs representations with all the input patches to infer the salient instances of the input WSI. Finally, it employs attention-based MIL to perform the slide-level classification based on the selected patches of the WSI. Our experiments imply that SiiMIL can accurately identify tumor instances, which could only take up less than 1% of a WSI, so that the ratio of tumor to normal instances within a bag can increase by two to four times. It is worth mentioning that it performs equally well for large tumor lesions. As a result, SiiMIL achieves a significant improvement in performance over the state-of-the-art MIL methods.
翻訳日:2023-01-19 15:07:07 公開日:2023-01-18
# ロジスティック輸送最適化のための断熱量子コンピューティング

Adiabatic Quantum Computing for Logistic Transport Optimization ( http://arxiv.org/abs/2301.07691v1 )

ライセンス: Link先を確認
Juan Francisco Ari\~no Sales and Ra\'ul Andres Palacios Araos(参考訳) 現在の世界貿易は強く健全なサプライチェーンを基盤としており、ロジスティクスは社会や経済を維持するために重要な資産や商品を生産し供給する上で重要な役割を担っている。 現在の世界の地政学的・衛生的な課題は、サプライチェーンの維持と運営のために輸送機能をチューニングすることに対するロジスティクスの役割をさらに重要視している。 課題は、将来の成長と成長のみであり、輸送最適化に取り組むことは、ビジネス価値と社会的価値の両方を提供する。 最適化問題はユビキタスであり、それらは複雑さのため、通常npハードな問題である。 量子コンピューティングは発展途上分野であり、量子アニーリングアプローチは最適化問題に対する適用性と有用性において非常に有効であることが証明されている。 本研究は,旅行セールスマン問題(Traveing Salesman Problem)として知られる,有名な最適化問題の変種である車両ルーティング問題を扱う。 我々は、古典的および量子的アプローチから見て、最後の1マイルのロジスティックなシナリオアプリケーションから車両最適化問題に取り組み、ハイブリッドソリューションとしても知られる両方を組み合わせたソリューションを提供することを目指している。 最後に、近い将来のビジネスケースシナリオにおけるアプリケーションを考慮した分析と提案の結果について述べる。

Current world trade is based and supported in a strong and healthy supply chain, where logistics play a key role in producing and providing key assets and goods to keep societies and economies going. Current geopolitical and sanitary challenges faced in the entire world have made even more critical the role of logistics and increased demands for tuning transport function to keep the supply chain up and running. The challenge is only increasing and growing for the future, thus tackling transport optimization provides both business and social value. Optimization problems are ubiquitous and they present a challenge due to its complexity, where they're typically NP-hard problems. Quantum Computing is a developing field, and the Quantum Annealing approach has proven to be quite effective in its applicability and usefulness to tackle optimization problems. In this work we treat the Vehicle Routing Problem, which is also a variation of a famous optimization problem known as the Traveling Salesman Problem. We aim to tackle the vehicle optimization problem from the last mile logistic scenario application, with a perspective from the classical and quantum approaches, and providing a solution which combines both, also known as hybrid solution. Finally, we provide the results of the analysis and proposal for the consideration of applications in a near term business case scenario.
翻訳日:2023-01-19 15:06:21 公開日:2023-01-18
# CaRE:高構成ロボットの構成問題の原因を見つける

CaRE: Finding Root Causes of Configuration Issues in Highly-Configurable Robots ( http://arxiv.org/abs/2301.07690v1 )

ライセンス: Link先を確認
Md Abir Hossen, Sonam Kharade, Bradley Schmerl, Javier C\'amara, Jason M. O'Kane, Ellen C. Czaplinski, Katherine A. Dzurilla, David Garlan, Pooyan Jamshidi(参考訳) ロボットシステムは複数のサブシステムを持ち、巨大なコンビネート構成空間を持ち、数百、あるいは数千の可能なソフトウェアやハードウェア構成オプションが非自明に相互作用する。 設定可能なパラメータは特定の目的に合わせて調整できるが、誤って設定された場合には機能障害を引き起こす可能性がある。 このような障害の根本原因を見つけることは、指数関数的に大きな構成空間と、ロボットの構成設定とパフォーマンスの間の依存関係のために難しい。 本稿では,機能障害の根本原因を因果レンズで診断する手法であるCaREを提案し,様々な構成オプションとロボットの性能目標との因果関係を抽象化する。 本研究では, 観測された機能障害の根本原因をCaREを介して発見し, 診断された根本原因を検証し, 物理的ロボット(Husky, Turtlebot3)とシミュレーション(Gazebo)の両方で実験を行った。 さらに,シミュレーション中のロボットから学んだ因果モデル(ガゼボのハスキーシミュレーション)が,異なるプラットフォームにわたる物理ロボットに伝達可能であることを示す(Turtlebot 3)。

Robotic systems have several subsystems that possess a huge combinatorial configuration space and hundreds or even thousands of possible software and hardware configuration options interacting non-trivially. The configurable parameters can be tailored to target specific objectives, but when incorrectly configured, can cause functional faults. Finding the root cause of such faults is challenging due to the exponentially large configuration space and the dependencies between the robot's configuration settings and performance. This paper proposes CaRE, a method for diagnosing the root cause of functional faults through the lens of causality, which abstracts the causal relationships between various configuration options and the robot's performance objectives. We demonstrate CaRE's efficacy by finding the root cause of the observed functional faults via CaRE and validating the diagnosed root cause, conducting experiments in both physical robots (Husky and Turtlebot 3) and in simulation (Gazebo). Furthermore, we demonstrate that the causal models learned from robots in simulation (simulating Husky in Gazebo) are transferable to physical robots across different platforms (Turtlebot 3).
翻訳日:2023-01-19 15:05:58 公開日:2023-01-18
# 中性電流ニュートリノ振動に対する混合状態

Mixed states for neutral current neutrino oscillation ( http://arxiv.org/abs/2301.07689v1 )

ライセンス: Link先を確認
M. M. Ettefaghi and Z. Askaripour Ravari(参考訳) ニュートリノ振動の理論は、z_0$崩壊から生じるニュートリノとアントニュートリノの両方が検出されると、対応する検出器間の振動パターンを観測できると予測する。 この予測は2つの性質に基づいており、ニュートリノ-アンティニュートリノ対はコヒーレントに生成され、検出器で一定の風味で検出される。 本稿では,光ニュートリノと混合するが,非一貫性にかかわるか,あるいは生成・検出過程に分離した質量ニュートリノを考えることにより,この問題を再検討する。 実際、質量が質量の不確かさの上限よりも大きいニュートリノは、コヒーレンス条件(約1kev)と相容れないように扱う必要がある。 ニュートリノ生成過程におけるニュートリノエネルギーよりも質量がはるかに大きい非常に重いニュートリノは分離される。 これらの条件下で、生成したニュートリノ−アンティニュートリノ状態と検出されたニュートリノおよびアンティニュートリノの状態とを混合する。 非一貫性ニュートリノでは振動パターンは観測できず、生成・検出過程において光ニュートリノ質量が無視された場合に標準振動パターンが復元される。 さらに、z_0$崩壊処理は風味に関して盲目的に行われるので、イベントレートにおける振動寄与は、z_0$崩壊幅に依存しない。

The theory of neutrino oscillation predicts that if both neutrino and antineutrino coming from $Z_0$ decay are detected, one can observe an oscillation pattern between the corresponding detectors. This prediction is based on two properties; the neutrino-antineutrino pairs are produced coherently and they are detected with definite flavor in detectors. In this paper, we reanalyze this problem by considering some massive neutrinos which are mixed with light neutrinos but they either participate incoherently or are decoupled in the production and detection processes. In fact, neutrinos whose masses are larger than the upper bound on the mass uncertainty to be compatible with the coherence conditions (we will see it is about 1 keV) must be treated incoherently. Very heavy neutrinos whose masses are much larger than the neutrino energy in the neutrino production process are decoupled. Under these conditions, the created neutrino-antineutrino state as well as the states of detected neutrino and antineutrino is mixed. We see that the oscillation pattern cannot be observed for incoherent neutrinos and the standard oscillation pattern is recovered if the light neutrino masses are ignored in the production and detection processes. Moreover, since the $Z_0$ decay process is performed blindly with respect to flavors, the oscillating contributions in the event rates are independent of the $Z_0$ decay width.
翻訳日:2023-01-19 15:05:31 公開日:2023-01-18
# content-oriented saliency projection による点雲の低参照品質評価

Reduced-Reference Quality Assessment of Point Clouds via Content-Oriented Saliency Projection ( http://arxiv.org/abs/2301.07681v1 )

ライセンス: Link先を確認
Wei Zhou, Guanghui Yue, Ruizeng Zhang, Yipeng Qin, Hantao Liu(参考訳) 多くの高密度な3Dポイントクラウドは、従来の画像やビデオの代わりに視覚オブジェクトを表現するために利用されてきた。 本稿では,ポイントクラウドの知覚的品質を評価するために,コンテンツ指向の sAliency Projection (RR-CAP) に基づく,ポイントクラウドに対する新規かつ効率的な参照品質指標を提案する。 具体的には,参照と歪んだ点雲を,ダウンサンプリング操作で投影された塩分マップに簡易化するための最初の試みを行う。 このプロセスを通じて,大容量の原点雲をエンドユーザに送信して品質評価を行うという課題に対処する。 そして、人間の視覚システム(hvs)の特性により、コンテンツ指向の類似性と統計相関測定を組み合わせることにより、歪んだ点雲の客観的品質スコアを生成する。 最後に、SJTU-PCQAとWPCデータベースについて広範な実験を行った。 実験の結果,提案アルゴリズムは既存の参照基準と非参照品質の指標よりも優れており,最先端のフル参照品質評価手法間の性能差を著しく低減することがわかった。 さらに, アブレーション試験による各技術部品の性能変動について検討した。

Many dense 3D point clouds have been exploited to represent visual objects instead of traditional images or videos. To evaluate the perceptual quality of various point clouds, in this letter, we propose a novel and efficient Reduced-Reference quality metric for point clouds, which is based on Content-oriented sAliency Projection (RR-CAP). Specifically, we make the first attempt to simplify reference and distorted point clouds into projected saliency maps with a downsampling operation. Through this process, we tackle the issue of transmitting large-volume original point clouds to user-ends for quality assessment. Then, motivated by the characteristics of the human visual system (HVS), the objective quality scores of distorted point clouds are produced by combining content-oriented similarity and statistical correlation measurements. Finally, extensive experiments are conducted on SJTU-PCQA and WPC databases. The experimental results demonstrate that our proposed algorithm outperforms existing reduced-reference and no-reference quality metrics, and significantly reduces the performance gap between state-of-the-art full-reference quality assessment methods. In addition, we show the performance variation of each proposed technical component by ablation tests.
翻訳日:2023-01-19 15:05:06 公開日:2023-01-18
# Jaynes-Cummingsモデルがキャビティを分解し、エミッタの自由空間放出率を著しく低下させる

The Jaynes-Cummings model breaks down for cavities that significantly reduces the emitter's free-space emission rate ( http://arxiv.org/abs/2301.07674v1 )

ライセンス: Link先を確認
Martin Blaha, Arno Rauschenbeutel and J\"urgen Volz(参考訳) 単一共振器モードと単一量子エミッタの強い結合は、量子科学と技術における多くの実験と応用の鍵であり、一般にjaynes-cummingsモデルによって記述される。 ここでは、キャビティがエミッタの放出速度を自由空間に大きく変化しない場合にのみ、Jaynes-Cummingsモデルが適用されることを示す。 特に、自由空間減衰チャネルを持たない理想的なエミッタ共振器系に近づくと、Jaynes-Cummingsモデルによる予測はますます間違っている。 我々は、回転波近似の有効範囲内で、すべての規則に適用される正しい理論的記述を提供するハミルトニアンを提案する。 したがって、自由空間モードへの結合を最小化することは多くのキャビティベースのアプリケーションにとって最重要であり、量子プロトコルの開発と最適化には強い光・物質相互作用の正確な記述が不可欠である。

Strong coupling between a single resonator mode and a single quantum emitter is key to a plethora of experiments and applications in quantum science and technology and is commonly described by means of the Jaynes-Cummings model. Here, we show that the Jaynes-Cummings model only applies when cavity does not significantly change the emitter's emission rate into free-space. Most notably, the predictions made by the Jaynes-Cummings model become increasingly wrong when approaching the ideal emitter-resonator systems with no free-space decay channels. We present a Hamiltonian that provides, within the validity range of the rotating wave approximation, a correct theoretical description that applies to all regimes. As minimizing the coupling to free-space modes is paramount for many cavity-based applications, a correct description of strong light-matter interaction is therefore crucial for developing and optimizing quantum protocols.
翻訳日:2023-01-19 15:04:45 公開日:2023-01-18
# OnePose++:CADモデルなしでキーポイントフリーのワンショットオブジェクトポス推定

OnePose++: Keypoint-Free One-Shot Object Pose Estimation without CAD Models ( http://arxiv.org/abs/2301.07673v1 )

ライセンス: Link先を確認
Xingyi He, Jiaming Sun, Yuang Wang, Di Huang, Hujun Bao, Xiaowei Zhou(参考訳) CADモデルを使わずにオブジェクトのポーズ推定を行う新しい手法を提案する。 以前の機能マッチングベースのOnePoseは、CADモデルやオブジェクト固有のトレーニングの必要性を排除したワンショット設定で、有望な結果を示している。 しかし、OnePoseは繰り返し可能な画像キーポイントの検出に依存しているので、低テクスチャオブジェクトで失敗する傾向がある。 繰り返し可能なキーポイント検出の必要性を取り除くために,キーポイントフリーポーズ推定パイプラインを提案する。 検出不要な特徴マッチング法であるLoFTRをベースとして,物体の半密度点クラウドモデルを再構築するキーポイントフリーSfM法を考案した。 オブジェクトポーズ推定のためのクエリ画像が与えられると、2d-3dマッチングネットワークは、画像内のキーポイントを最初に検出することなく、クエリ画像と再構成されたポイントクラウドモデルとの2d-3d対応を直接確立する。 実験により,提案したパイプラインは既存の一発CADモデルフリー手法を大きなマージンで上回り,低テクスチャオブジェクトであってもLINEMOD上のCADモデルベース手法に匹敵する性能を示した。 また、40個の低テクスチャオブジェクトからなる80のシーケンスからなる新しいデータセットを収集し、ワンショットオブジェクトポーズ推定の今後の研究を促進する。 追加資料、コード、データセットはプロジェクトのページで入手できる。

We propose a new method for object pose estimation without CAD models. The previous feature-matching-based method OnePose has shown promising results under a one-shot setting which eliminates the need for CAD models or object-specific training. However, OnePose relies on detecting repeatable image keypoints and is thus prone to failure on low-textured objects. We propose a keypoint-free pose estimation pipeline to remove the need for repeatable keypoint detection. Built upon the detector-free feature matching method LoFTR, we devise a new keypoint-free SfM method to reconstruct a semi-dense point-cloud model for the object. Given a query image for object pose estimation, a 2D-3D matching network directly establishes 2D-3D correspondences between the query image and the reconstructed point-cloud model without first detecting keypoints in the image. Experiments show that the proposed pipeline outperforms existing one-shot CAD-model-free methods by a large margin and is comparable to CAD-model-based methods on LINEMOD even for low-textured objects. We also collect a new dataset composed of 80 sequences of 40 low-textured objects to facilitate future research on one-shot object pose estimation. The supplementary material, code and dataset are available on the project page: https://zju3dv.github.io/onepose_plus_plus/.
翻訳日:2023-01-19 15:04:27 公開日:2023-01-18
# ハイブリッド深層強化学習エージェントによる人間認知のモデル化

Modeling Human Cognition with a Hybrid Deep Reinforcement Learning Agent ( http://arxiv.org/abs/2301.06216v2 )

ライセンス: Link先を確認
Songlin Xu and Xinyu Zhang(参考訳) 人間の認知モデルは、人間の認知行動が外部の刺激の下でどのように機能するかについての洞察を得るのに役立ち、合成データ生成の道を開き、認知制御のための適応的介入設計を支援する。 外部刺激が極めてダイナミックな場合、その刺激が人間の認知行動に与える影響をモデル化するのは困難である。 本稿では,人間の認知能力に及ぼす動的時間圧の影響をシミュレートするために,ドリフト拡散モデルを統合するハイブリッド深部強化学習(HDRL)フレームワークを提案する。 まずN=50のユーザ調査から始め、異なる要因が人間のパフォーマンスにどのように影響するかを調査し、フレームワーク設計における事前の知識を得るのに役立ちます。 この枠組みは, 定量的に人間の認知モデルを改善し, 人間の認知行動の一般的な傾向を定性的に捉えうることを示す。 また、我々のフレームワークは、異なる外部要因が人間の行動にどのように影響するかを探索し、シミュレートするために拡張することもできる。

Human cognition model could help us gain insights in how human cognition behaviors work under external stimuli, pave the way for synthetic data generation, and assist in adaptive intervention design for cognition regulation. When the external stimuli is highly dynamic, it becomes hard to model the effect that how the stimuli influences human cognition behaviors. Here we propose a novel hybrid deep reinforcement learning (HDRL) framework integrating drift-diffusion model to simulate the effect of dynamic time pressure on human cognition performance. We start with a N=50 user study to investigate how different factors may affect human performance, which help us gain prior knowledge in framework design. The evaluation demonstrates that this framework could improve human cognition modeling quantitatively and capture the general trend of human cognition behaviors qualitatively. Our framework could also be extended to explore and simulate how different external factors play a role in human behaviors.
翻訳日:2023-01-19 12:12:52 公開日:2023-01-18
# 1つの光子と$^{40}$ca$^+$イオンの完全なベルベーシス検出による量子テレポーテーション

Quantum teleportation with full Bell-basis detection between a $^{40}$Ca$^+$ ion and a single photon ( http://arxiv.org/abs/2301.06091v2 )

ライセンス: Link先を確認
Elena Arensk\"otter, Stephan Kucera, Omar Elshehy, Max Bergerhoff, Matthias Kreis, J\"urgen Eschner(参考訳) 我々は、単一の閉じ込められた原子と1つの光子の間のインターフェースプロトコルをいくつか提示し、そのうちの1つの閉じ込められた$^{40}$Ca$^+$イオンを1つの光子に量子テレポーテーションする。 適切なベル測定として、テレポーテーションプロトコルは偏光エンタングル対の1つの光子を吸収し、4つのベル状態をすべて識別する。 さらに、ヘラルド吸収によって実現されるプロトコルは、単一光子から単一イオンへの量子状態マッピングと、単一イオンとパートナー光子の絡み合いへの光子対の偏光子絡みの移動を含む。

We present several interface protocols between a single trapped atom and single photons from an entangled-pair source, among them the quantum teleportation of a qubit state from a single trapped $^{40}$Ca$^+$ ion onto a single photon. As appropriate Bell measurement, the teleportation protocol employs heralded absorption of one photon of the polarisation-entangled pair, which allows us to identify all four Bell states. Further protocols enabled by heralded absorption comprise quantum state mapping from a single photon to a single ion and transfer of polarization entanglement of a photon pair to entanglement between a single ion and the partner photon.
翻訳日:2023-01-19 12:12:36 公開日:2023-01-18
# T2M-GPT:離散表現によるテキスト記述からの人間の動きの生成

T2M-GPT: Generating Human Motion from Textual Descriptions with Discrete Representations ( http://arxiv.org/abs/2301.06052v2 )

ライセンス: Link先を確認
Jianrong Zhang, Yangsong Zhang, Xiaodong Cun, Shaoli Huang, Yong Zhang, Hongwei Zhao, Hongtao Lu and Xi Shen(参考訳) 本研究では,Vector Quantized-Variational AutoEncoder (VQ-VAE) とGenerative Pre-trained Transformer (GPT) に基づく簡易かつ必須な条件生成フレームワークについて検討する。 一般的なトレーニングレシピ (EMA と Code Reset) を用いた単純な CNN ベースの VQ-VAE により,高品質な離散表現が得られることを示す。 GPTでは、トレーニング中に簡単な汚職対策を取り入れて、トレーニングテストの相違を緩和する。 その単純さにもかかわらず、我々のT2M-GPTは、最近の拡散ベースのアプローチを含む競合アプローチよりも優れたパフォーマンスを示している。 例えば、現在最大のデータセットであるHumanML3Dでは、テキストと生成されたモーション(R-Precision)の一貫性で同等のパフォーマンスを実現していますが、FID 0.116ではMotionDiffuseの0.630を上回っています。 さらに、HumanML3Dの分析を行い、データセットのサイズが我々のアプローチの限界であることを観察する。 我々の研究は、VQ-VAEが未だに人間のモーション生成の競争的アプローチであることを示唆している。

In this work, we investigate a simple and must-known conditional generative framework based on Vector Quantised-Variational AutoEncoder (VQ-VAE) and Generative Pre-trained Transformer (GPT) for human motion generation from textural descriptions. We show that a simple CNN-based VQ-VAE with commonly used training recipes (EMA and Code Reset) allows us to obtain high-quality discrete representations. For GPT, we incorporate a simple corruption strategy during the training to alleviate training-testing discrepancy. Despite its simplicity, our T2M-GPT shows better performance than competitive approaches, including recent diffusion-based approaches. For example, on HumanML3D, which is currently the largest dataset, we achieve comparable performance on the consistency between text and generated motion (R-Precision), but with FID 0.116 largely outperforming MotionDiffuse of 0.630. Additionally, we conduct analyses on HumanML3D and observe that the dataset size is a limitation of our approach. Our work suggests that VQ-VAE still remains a competitive approach for human motion generation.
翻訳日:2023-01-19 12:12:23 公開日:2023-01-18
# 人工知能のためのシストスコピックメディアコンテンツの概念的枠組みと文書化標準

Conceptual Framework and Documentation Standards of Cystoscopic Media Content for Artificial Intelligence ( http://arxiv.org/abs/2301.05991v2 )

ライセンス: Link先を確認
Okyaz Eminaga, Timothy Jiyong Lee, Jessie Ge, Eugene Shkolyar, Mark Laurie, Jin Long, Lukas Graham Hockman, Joseph C. Liao(参考訳) 背景: 嚢胞内視鏡の臨床資料は、視覚的およびテキスト的材料を含む。 しかし, 定期診療における非効率なデータ管理のため, 教育・研究目的の視覚シストスコープデータの二次的使用は限定的である。 方法: データ管理,アノテーション管理,利用管理という3つの主要なセクションを標準化した方法で嚢胞内視鏡を文書化する,概念的なフレームワークが設計された。 品質管理と根本原因分析のためのスイスチーズモデルが提案された。 FAIR(findable, accessable, interoperable, re-useable)の原則に関して、フレームワークを実装するために必要なインフラストラクチャを定義しました。 FAIR原則の遵守を保証するために、研究プロジェクトと教育プロジェクトのためのデータ共有を実証する2つのシナリオを適用した。 結果: このフレームワークはFAIR原則に従ってうまく実装されました。 このフレームワークから生成された嚢胞内視鏡アトラスを教育用webポータルに提示し,68本の全長質的ビデオとそれに対応する注釈データを,ケース,病変,フレームレベルでの分類問題や分節問題をカバーする人工知能プロジェクトに適用した。 結論:本研究は,視覚文書を標準化した形で保存し,FAIRデータを教育・人工知能研究に活用するための枠組みを提案する。

Background: The clinical documentation of cystoscopy includes visual and textual materials. However, the secondary use of visual cystoscopic data for educational and research purposes remains limited due to inefficient data management in routine clinical practice. Methods: A conceptual framework was designed to document cystoscopy in a standardized manner with three major sections: data management, annotation management, and utilization management. A Swiss-cheese model was proposed for quality control and root cause analyses. We defined the infrastructure required to implement the framework with respect to FAIR (findable, accessible, interoperable, re-usable) principles. We applied two scenarios exemplifying data sharing for research and educational projects to ensure the compliance with FAIR principles. Results: The framework was successfully implemented while following FAIR principles. The cystoscopy atlas produced from the framework could be presented in an educational web portal; a total of 68 full-length qualitative videos and corresponding annotation data were sharable for artificial intelligence projects covering frame classification and segmentation problems at case, lesion and frame levels. Conclusion: Our study shows that the proposed framework facilitates the storage of the visual documentation in a standardized manner and enables FAIR data for education and artificial intelligence research.
翻訳日:2023-01-19 12:12:01 公開日:2023-01-18
# Iquaflowを用いた圧縮衛星画像の物体検出性能の変動

Object Detection performance variation on compressed satellite image datasets with iquaflow ( http://arxiv.org/abs/2301.05892v2 )

ライセンス: Link先を確認
Pau Gall\'es, Katalin Takats and Javier Marin(参考訳) 画像上の予測モデルの最高のパフォーマンスを達成するために、多くの作業が行われました。 これらのモデルのレジリエンスに関する研究は、元の品質を変える修正に苦しむイメージデータセットでトレーニングされている場合、少ない。 しかし、これは業界でしばしば発生する一般的な問題です。 その好例は、多くの画像を撮影している地球観測衛星である。 軌道上の衛星の地球への接続エネルギーと時間には制限があり、慎重に使用する必要がある。 これを緩和するアプローチは、ダウンロードする前にボード上の画像を圧縮する。 圧縮は、画像の意図された使用状況と、このアプリケーションの要件に応じて規制することができる。 本稿では,画像データセットの変更を前提として,画像品質とモデル性能のばらつきを調べるための新しいソフトウェアツール iquaflow を提案する。 さらに、圧縮レベルが異なる公開画像データセットDOTA Xia_2018_CVPR上でのオブジェクト指向物体検出モデルの適用について展示する。 最適圧縮点が発見され、iquaflowの有用性が明らかになる。

A lot of work has been done to reach the best possible performance of predictive models on images. There are fewer studies about the resilience of these models when they are trained on image datasets that suffer modifications altering their original quality. Yet this is a common problem that is often encountered in the industry. A good example of that is with earth observation satellites that are capturing many images. The energy and time of connection to the earth of an orbiting satellite are limited and must be carefully used. An approach to mitigate that is to compress the images on board before downloading. The compression can be regulated depending on the intended usage of the image and the requirements of this application. We present a new software tool with the name iquaflow that is designed to study image quality and model performance variation given an alteration of the image dataset. Furthermore, we do a showcase study about oriented object detection models adoption on a public image dataset DOTA Xia_2018_CVPR given different compression levels. The optimal compression point is found and the usefulness of iquaflow becomes evident.
翻訳日:2023-01-19 12:11:41 公開日:2023-01-18
# 物理・仮想グラフ再構成のための再構成可能なデータグローブ

Reconfigurable Data Glove for Reconstructing Physical and Virtual Grasps ( http://arxiv.org/abs/2301.05821v2 )

ライセンス: Link先を確認
Hangxin Liu, Zeyu Zhang, Ziyuan Jiao, Zhenliang Zhang, Minchen Li, Chenfanfu Jiang, Yixin Zhu, Song-Chun Zhu(参考訳) 我々は、人間の手-物体相互作用の様々なモードをキャプチャする再構成可能なデータグローブの設計を提案する。 ハンドジェスチャをリアルタイムに再構築する統一されたバックボーンデザインを共有することで、再構成可能なデータグローブは3つのモードで動作し、異なる特徴を持つ下流タスクを処理します。 触覚モードでは、グローブシステムは柔らかくて薄いピエゾ抵抗性材料から作られたカスタマイズされた力センサを介して操作力を集約する。 仮想現実感(VR)モードは、物理的に妥当な方法でリアルタイムのインタラクションを可能にし、衝突イベントを検出して安定した把握を決定するためにケージベースのアプローチが考案された。 現状の有限要素法(FEM)シミュレータを利用することで、シミュレーションモードは3次元空間における手と物体の動きと物体の物理的特性(例えば、応力、エネルギー)が時間的操作に合わせてどのように変化するかという、きめ細かい4D操作イベントを収集する。 このグローブシステムは、高忠実度シミュレーションを通じて、操作動作の背後にある観測不可能な物理的および因果的要因を初めて調べる。 一連の実験において、個々のセンサーとシステム全体の観点からデータグローブを特徴付ける。 具体的には,システムの3つのモードを評価する。 (i)手振りと関連力の記録 (ii)vrにおける操作性の向上、及び (iii)各種工具の現実的なシミュレーション効果をそれぞれ生成する。 再構成可能なデータグローブは、物理環境と仮想環境の両方で、きめ細かい人間の把握データを収集し、再構成し、具体化されたaiエージェントの操作スキルを学習する新しい道を開きます。

We present a reconfigurable data glove design to capture different modes of human hand-object interactions, critical for training embodied AI agents for fine manipulation tasks. Sharing a unified backbone design that reconstructs hand gestures in real-time, our reconfigurable data glove operates in three modes for various downstream tasks with distinct features. In the tactile-sensing mode, the glove system aggregates manipulation force via customized force sensors made from a soft and thin piezoresistive material; this design is to minimize interference during complex hand movements. The Virtual Reality (VR) mode enables real-time interaction in a physically plausible fashion; a caging-based approach is devised to determine stable grasps by detecting collision events. Leveraging a state-of-the-art Finite Element Method (FEM) simulator, the simulation mode collects a fine-grained 4D manipulation event: hand and object motions in 3D space and how the object's physical properties (e.g., stress, energy) change in accord with the manipulation in time. Of note, this glove system is the first to look into, through high-fidelity simulation, the unobservable physical and causal factors behind manipulation actions. In a series of experiments, we characterize our data glove in terms of individual sensors and the overall system. Specifically, we evaluate the system's three modes by (i) recording hand gestures and associated forces, (ii) improving manipulation fluency in VR, and (iii) producing realistic simulation effects of various tool uses, respectively. Together, our reconfigurable data glove collects and reconstructs fine-grained human grasp data in both the physical and virtual environments, opening up new avenues to learning manipulation skills for embodied AI agents.
翻訳日:2023-01-19 12:11:28 公開日:2023-01-18
# トレーニングダイナミクスによる座標系mlpのスペクトルバイアスの理解

Understanding the Spectral Bias of Coordinate Based MLPs Via Training Dynamics ( http://arxiv.org/abs/2301.05816v2 )

ライセンス: Link先を確認
John Lazzari, Xiuwen Liu(参考訳) 近年,reluアクティベーションを持つ多層パーセプトロン(mlps)により,重み付けを用いたシーン特性の符号化により,新たなフォトリアリスティックレンダリング技術が実現されている。 これらのモデルでは、重度のスペクトルバイアスのため、信号の高周波成分への収束を可能にするために正弦波符号化が必要とされる。 前回の研究では、ニューラル・タンジェント・カーネル(ntk)とフーリエ解析を用いてこの現象を説明した。 しかし、カーネルレジームは、この振る舞いを誘発するネットワークの特性を露出せず、フーリエ分解はグローバルであり、ネットワークのローカルダイナミクスについての洞察は得られない。 reluネットワーク計算によるスペクトルバイアスの新たな解釈は、密集した環境での制限を露呈すると同時に、学習プロセス中にこの振る舞いがどのように現れるかを明確にする。 本稿では,その活性化領域と勾配降下ダイナミクスを通した座標系MLPのスペクトルバイアスについて,特に勾配混乱を用いた最初の研究を行う。 入力間の混乱をそれらのアクティベーションパターンの特異性に関連付け、表現力に制限がある場合に、より多くの混乱を見出す。 これにより、信号の高周波成分への収束が遅くなり、座標の密度によって拡大される。 さらに, この手法により, スペクトルバイアスが小さくなるにつれて, 活性化領域の特性を解析し, 異なるダイナミクスを見出すことができる。

Recently, multi-layer perceptrons (MLPs) with ReLU activations have enabled new photo-realistic rendering techniques by encoding scene properties using their weights. For these models, termed coordinate based MLPs, sinusoidal encodings are necessary in allowing for convergence to the high frequency components of the signal due to their severe spectral bias. Previous work has explained this phenomenon using Neural Tangent Kernel (NTK) and Fourier analysis. However, the kernel regime does not expose the properties of the network that induce this behavior, and the Fourier decomposition is global, not allowing for insight on the network's local dynamics. A new interpretation of spectral bias directly through ReLU network computations would expose their limitations in dense settings, while providing a clearer explanation as to how this behavior emerges during the learning process. In this paper, we provide the first study of spectral bias in a coordinate based MLP through its activation regions and gradient descent dynamics, specifically using gradient confusion. We relate the confusion between inputs to the distinctiveness of their activation patterns, and find higher amounts of confusion when expressive power is limited. This leads to slower convergence to the high frequency components of the signal, which is magnified by the density of coordinates. Additionally, this method allows us to analyze the properties of the activation regions as spectral bias is reduced, in which we find distinct dynamics.
翻訳日:2023-01-19 12:10:57 公開日:2023-01-18
# 機械翻訳のための大規模言語モデルの提案 : 事例研究

Prompting Large Language Model for Machine Translation: A Case Study ( http://arxiv.org/abs/2301.07069v2 )

ライセンス: Link先を確認
Biao Zhang, Barry Haddow, Alexandra Birch(参考訳) プロンプトの研究は、多くのタスクにわたる教師付きトレーニングをほとんどあるいは全く行わず、優れたパフォーマンスを示している。 しかし、機械翻訳の推進は文学ではいまだに未熟である。 このギャップを埋めるために,翻訳のプロンプト戦略に関する体系的な研究を行い,プロンプトテンプレートとサンプル選択のさまざまな要因を調査した。 さらに,単言語データの利用と,言語間,クロスドメイン,文書間転送学習の実現可能性について検討した。 試験ベッドとしてのglm-130b(zeng et al., 2022)の広範囲実験 1) プロンプト例の個数及び品質は,準最適例を用いて翻訳を退化させる場合に問題となる。 2) 意味的類似性などの素早い例のいくつかの特徴は,その素早い性能とスピアマンの有意な相関を示すが,相関性は十分強くない。 3) ゼロショットプロンプトによる単言語データから構築した擬似並列プロンプト例を用いることで翻訳が向上する。 4) 他の設定で選択したプロンプト例から知識を転送することにより、パフォーマンスの向上を実現する。 最終的に、モデル出力の分析を行い、まだ苦しめられているいくつかの問題について議論する。

Research on prompting has shown excellent performance with little or even no supervised training across many tasks. However, prompting for machine translation is still under-explored in the literature. We fill this gap by offering a systematic study on prompting strategies for translation, examining various factors for prompt template and demonstration example selection. We further explore the use of monolingual data and the feasibility of cross-lingual, cross-domain, and sentence-to-document transfer learning in prompting. Extensive experiments with GLM-130B (Zeng et al., 2022) as the testbed show that 1) the number and the quality of prompt examples matter, where using suboptimal examples degenerates translation; 2) several features of prompt examples, such as semantic similarity, show significant Spearman correlation with their prompting performance; yet, none of the correlations are strong enough; 3) using pseudo parallel prompt examples constructed from monolingual data via zero-shot prompting could improve translation; and 4) improved performance is achievable by transferring knowledge from prompt examples selected in other settings. We finally provide an analysis on the model outputs and discuss several problems that prompting still suffers from.
翻訳日:2023-01-19 12:04:05 公開日:2023-01-18
# 量子貯水池計算におけるノイズの活用

Taking advantage of noise in quantum reservoir computing ( http://arxiv.org/abs/2301.06814v2 )

ライセンス: Link先を確認
L. Domingo and G. Carlo and F. Borondo(参考訳) 量子コンピューティングと量子機械学習が現在直面している最大の課題は、量子デバイスにおけるノイズの存在である。 その結果、引き起こされたエラーの修正や軽減に多大な努力が払われた。 しかし、この2つの分野はノイズの恩恵を受けるだろうか? 驚くべきことに、いくつかの状況下で量子ノイズは、著名な量子機械学習アルゴリズムである量子貯水池コンピューティングの性能を改善するために使用できる。 その結果、特定のノイズタイプは機械学習に有益であるが、他のノイズタイプは修正に優先されるべきであることが示された。 この決定的な結果は、量子デバイスの基礎となる物理メカニズムに新しい光を与え、今日のハードウェアで量子情報処理を成功させるための確かな実践的な処方薬を提供する。

The biggest challenge that quantum computing and quantum machine learning are currently facing is the presence of noise in quantum devices. As a result, big efforts have been put into correcting or mitigating the induced errors. But, can these two fields benefit from noise? Surprisingly, we demonstrate that under some circumstances, quantum noise can be used to improve the performance of quantum reservoir computing, a prominent and recent quantum machine learning algorithm. Our results show that certain noise types can be beneficial to machine learning, while others should be prioritized for correction. This critical result sheds new light into the physical mechanisms underlying quantum devices, providing solid practical prescriptions for a successful implementation of quantum information processing in nowadays hardware.
翻訳日:2023-01-19 12:03:48 公開日:2023-01-18
# トレース距離推定のための高速量子アルゴリズム

Fast Quantum Algorithms for Trace Distance Estimation ( http://arxiv.org/abs/2301.06783v2 )

ライセンス: Link先を確認
Qisheng Wang, Zhicheng Zhang(参考訳) 量子情報処理において、トレース距離は量子状態の区別可能性の基本的な指標である。 しかし、一般にトレース距離の値を推定する効果的な方法は知られていない。 本稿では,混合量子状態のランク$r$間の加算誤差$\varepsilon$内のトレース距離を推定する効率的な量子アルゴリズムを提案する。 具体的には、まず量子状態の浄化を準備する量子回路に対して、$r \cdot \widetilde o(1/\varepsilon^2)$クエリを用いた量子アルゴリズムを提供する。 次に、この量子アルゴリズムを、量子状態認証に適用可能な量子状態のサンプルの$\widetilde o(r^2/\varepsilon^5)$を用いて別のアルゴリズムを得るように修正する。 どちらのアルゴリズムも、クエリ/サンプルの複雑さと同じ量子時間複雑度を持つ。

In quantum information processing, trace distance is a basic metric of distinguishability between quantum states. However, there is no known efficient approach to estimate the value of trace distance in general. In this paper, we propose efficient quantum algorithms for estimating the trace distance within additive error $\varepsilon$ between mixed quantum states of rank $r$. Specifically, we first provide a quantum algorithm using $r \cdot \widetilde O(1/\varepsilon^2)$ queries to the quantum circuits that prepare the purifications of quantum states, which achieves a linear time dependence on the rank $r$. Then, we modify this quantum algorithm to obtain another algorithm using $\widetilde O(r^2/\varepsilon^5)$ samples of quantum states, which can be applied to quantum state certification. Both algorithms have the same quantum time complexities as their query/sample complexities up to a logarithmic factor.
翻訳日:2023-01-19 12:03:37 公開日:2023-01-18
# 加速電子からのunruh放射の測定

Measuring Unruh radiation from accelerated electrons ( http://arxiv.org/abs/2301.06772v2 )

ライセンス: Link先を確認
Gianluca Gregori, Giacomo Marocco, Subir Sarkar, Robert Bingham, Charles Wang(参考訳) 加速電子からの熱unruh放射を検出することは、技術的な困難だけでなく、実験室の観察者が実際に何を見ているのかという概念的な明確さの欠如から、驚くべき課題となった。 我々は、アンルー効果と2レベル原子系の放射の類似性に基づく、より単純なヒューリスティックな記述とともに、現在の解釈の要約を述べる。 本研究では,加速電子からの熱光子が放出されるかどうかを一意的に検証する実験を提案する。

Detecting thermal Unruh radiation from accelerated electrons has presented a formidable challenge due not only to technical difficulties but also for lack of conceptual clarity about what is actually seen by a laboratory observer. We give a summary of the current interpretations along with a simpler heuristic description that draws on the analogy between the Unruh effect and radiation from a two-level atomic system. We propose a possible experiment that can be used to uniquely test whether there is emission of thermal photons from an accelerated electron.
翻訳日:2023-01-19 12:03:20 公開日:2023-01-18
# デジタル双対・複雑工学システムのための演算子学習フレームワーク

Operator Learning Framework for Digital Twin and Complex Engineering Systems ( http://arxiv.org/abs/2301.06701v2 )

ライセンス: Link先を確認
Kazuma Kobayashi, James Daniell, Syed B. Alam(参考訳) 現代の計算技術の進歩と統計解析手法により、機械学習アルゴリズムはエンジニアリングモデリングの重要な部分となっている。 ニューラルネットワーク(neural operator networks, onets)は、偏微分方程式(pdes)に対する解を近似するための"より高速なサロゲート(faster surrogate)"としての新たな機械学習アルゴリズムである。 onets は有限次元入力を無限次元空間に写像する普遍近似定理(universal approximation theorem)を用いる。 onetsは物理システムとデジタルツイン(dt)開発におけるサロゲートモデリングの重要なニッチを占めることが期待されている。 1次元常微分方程式 (ODE) や一般拡散系, 対流拡散系 (Burger) など, 演算子近似のためのオネットを用いた3つのテストケースの評価を行った。 ODEと拡散システムの解は正確で信頼性の高い結果(R2>0.95)を得る一方、バーガーシステムの解はONetアルゴリズムのさらなる改良が必要である。

With modern computational advancements and statistical analysis methods, machine learning algorithms have become a vital part of engineering modeling. Neural Operator Networks (ONets) is an emerging machine learning algorithm as a "faster surrogate" for approximating solutions to partial differential equations (PDEs) due to their ability to approximate mathematical operators versus the direct approximation of Neural Networks (NN). ONets use the Universal Approximation Theorem to map finite-dimensional inputs to infinite-dimensional space using the branch-trunk architecture, which encodes domain and feature information separately before using a dot product to combine the information. ONets are expected to occupy a vital niche for surrogate modeling in physical systems and Digital Twin (DT) development. Three test cases are evaluated using ONets for operator approximation, including a 1-dimensional ordinary differential equations (ODE), general diffusion system, and convection-diffusion (Burger) system. Solutions for ODE and diffusion systems yield accurate and reliable results (R2>0.95), while solutions for Burger systems need further refinement in the ONet algorithm.
翻訳日:2023-01-19 12:03:10 公開日:2023-01-18
# ガウス過程モデルによるアンテナアレイ校正

Antenna Array Calibration Via Gaussian Process Models ( http://arxiv.org/abs/2301.06582v2 )

ライセンス: Link先を確認
Sergey S. Tambovskiy, G\'abor Fodor, Hugo Tullberg(参考訳) アンテナアレイのキャリブレーションは、広範囲の高度なアンテナシステムにわたってビームパターンの忠実性を維持し、時間分割二重化方式におけるチャネル相互性を確保するために必要である。 この分野での継続的な開発にもかかわらず、既存のほとんどのソリューションは特定の無線アーキテクチャに最適化され、標準化された無線通信を必要とする。 通信プロトコルとハードウェアの多様性は、新しいアンテナシステムごとにキャリブレーション手順を設計または更新する必要があるため、問題となるケースを生み出します。 本研究では,関数近似のタスクとしてアンテナ校正を別の方法で定式化し,ベイズ機械学習を用いてそれに対処する。 私たちの貢献は3倍です。 まず,各放射素子, 位置オフセット, アンテナ素子間の相互結合効果に対応する基礎となるハードウェア障害を計測する, 近接場測定に基づくパラメータ空間を定義する。 第二に、ガウス過程回帰は前述の近接場データのスパース集合からモデルを形成するために用いられる。 一度展開すると、学習された非パラメトリックモデルは、システムのビーム形成重量を継続的に変換し、修正されたビームパターンをもたらす。 最後に,ディジタルビームフォーミングアンテナアレイとアナログビームフォーミングアンテナアレイの両方において,この手法の有効性を実証し,動的ハードウェア障害によるリアルタイム動作支援への拡張について考察する。

Antenna array calibration is necessary to maintain the high fidelity of beam patterns across a wide range of advanced antenna systems and to ensure channel reciprocity in time division duplexing schemes. Despite the continuous development in this area, most existing solutions are optimised for specific radio architectures, require standardised over-the-air data transmission, or serve as extensions of conventional methods. The diversity of communication protocols and hardware creates a problematic case, since this diversity requires to design or update the calibration procedures for each new advanced antenna system. In this study, we formulate antenna calibration in an alternative way, namely as a task of functional approximation, and address it via Bayesian machine learning. Our contributions are three-fold. Firstly, we define a parameter space, based on near-field measurements, that captures the underlying hardware impairments corresponding to each radiating element, their positional offsets, as well as the mutual coupling effects between antenna elements. Secondly, Gaussian process regression is used to form models from a sparse set of the aforementioned near-field data. Once deployed, the learned non-parametric models effectively serve to continuously transform the beamforming weights of the system, resulting in corrected beam patterns. Lastly, we demonstrate the viability of the described methodology for both digital and analog beamforming antenna arrays of different scales and discuss its further extension to support real-time operation with dynamic hardware impairments.
翻訳日:2023-01-19 12:02:51 公開日:2023-01-18
# 量子物理学と生物学: 局所波動関数アプローチ

Quantum physics and biology: the local wavefunction approach ( http://arxiv.org/abs/2301.06516v2 )

ライセンス: Link先を確認
George Ellis(参考訳) II 宇宙の線形に進化する波動関数は、私たちの周りのすべての非線形性に導くことができるのか? この提案は先例がないように思える。 私は代わりに、実宇宙において、一般の局所波動関数のみが存在すると主張する。 非局所波動関数はベル実験のような注意深く設計された文脈で起こるが、猫や脳のような同様のマクロな物体には単一波動関数は存在しない。 文脈波動関数の崩壊は、古典的マクロレベルが量子事象と生物学的出現のコンテキストを提供するコペンハーゲン解釈の防御可能なバージョンをもたらす。 複素性は、基底となる線形物理学から論理分岐を生じさせる適応的なモジュラー階層構造によって生じる。 各創発レベルは、基礎となる物理学と一貫して起こる上向きと下向きの因果関係によって因果的に効果的である。 生物学的文脈における量子化学のアプローチはこの局所波動関数像に適合する。

IIs there a single linearly evolving Wave Function of the Universe that is able to lead to all the nonlinearities we see around us? This proposal seems a priori highly implausible. I claim that instead, in the real Universe, generically only local wave functions exist. Non-local wave functions occur for carefully engineered contexts such as Bell experiments, but there is no single wave function for a cat or similar macroscopic objects such as a brain. Contextual wave function collapse leads to a defensible version of the Copenhagen interpretation, where classical macro levels provide the context for quantum events and biological emergence. Complexity arises via adaptive modular hierarchical structures that enable logical branching to emerge from the underlying linear physics. Each emergent level is causally effective because of the confluence of upwards and downwards causation that takes place consistently with the underlying physics. Quantum chemistry approaches in biological contexts fit this local wavefunction picture.
翻訳日:2023-01-19 12:02:28 公開日:2023-01-18
# -検閲と無検閲電気自動車の充電需要のモデル化

- Modelling Difference Between Censored and Uncensored Electric Vehicle Charging Demand ( http://arxiv.org/abs/2301.06418v2 )

ライセンス: Link先を確認
Frederik Boe H\"uttel and Filipe Rodrigues and Francisco C\^amara Pereira(参考訳) 電気自動車の充電需要モデルは、充電記録を入力として、本質的に利用可能な充電器の供給に偏る。 この失われた需要は、記録が総需要のごく一部しか観測せず、すなわち、観測は検閲され、実際の需要はデータが反映するものよりも高い可能性が高いことを意味している。 機械学習モデルは、料金需要を予測する際にこの検閲された需要を考慮せず、将来の拡張や供給管理へのモデルの応用を制限することが多い。 空間次元と時間次元の両方で潜在需要分布を学習する確率論的検閲対応グラフニューラルネットワークを用いて、充電需要をモデル化することで、このギャップに対処する。 デンマークのコペンハーゲンにある車のGPSトラジェクトリを使用して、検閲がどのように発生し、充電と競合サービスによって多くの需要が失われるかを調査します。 検閲は都市全体や時間によって異なり、時間的および時間的モデリングが促進される。 コペンハーゲンのいくつかの地域では、検閲が全体の61%を占めている。 以上の結果から,検閲意識モデルの方が,検閲意識モデルよりも将来需要の予測や不確かさを予測できることがわかった。 この供給管理とインフラ拡張における機械学習モデルの適用領域を拡大するために,充電記録に基づく将来のモデルは検閲を考慮すべきである。

Electric vehicle charging demand models, with charging records as input, will inherently be biased toward the supply of available chargers, as the data do not include demand lost from occupied stations and competitors. This lost demand implies that the records only observe a fraction of the total demand, i.e. the observations are censored, and actual demand is likely higher than what the data reflect. Machine learning models often neglect to account for this censored demand when forecasting the charging demand, which limits models' applications for future expansions and supply management. We address this gap by modelling the charging demand with probabilistic censorship-aware graph neural networks, which learn the latent demand distribution in both the spatial and temporal dimensions. We use GPS trajectories from cars in Copenhagen, Denmark, to study how censoring occurs and much demand is lost due to occupied charging and competing services. We find that censorship varies throughout the city and over time, encouraging spatial and temporal modelling. We find that in some regions of Copenhagen, censorship occurs 61% of the time. Our results show censorship-aware models provide better prediction and uncertainty estimation in actual future demand than censorship-unaware models. Our results suggest that future models based on charging records should account for the censoring to expand the application areas of machine learning models in this supply management and infrastructure expansion.
翻訳日:2023-01-19 12:02:14 公開日:2023-01-18
# 分子タンパク質結合親和性予測を改善するハイブリッド量子古典畳み込みニューラルネットワーク

Hybrid quantum-classical convolutional neural networks to improve molecular protein binding affinity predictions ( http://arxiv.org/abs/2301.06331v2 )

ライセンス: Link先を確認
L. Domingo and M. Djukic and C. Johnson and F. Borondo(参考訳) 薬物発見の主な課題の1つは、標的タンパク質に特異的に強く結合し、他のタンパク質に最小限に結合する分子を見つけることである。 結合親和性を予測することにより、潜在的な化合物の大きなプールから最も有望な候補を特定でき、実験で試される化合物の数を減らすことができる。 近年,大規模データセットで正確な予測を行うために,従来の計算手法よりも精度が向上している。 しかしながら、これらの方法の複雑さと時間を要する性質は、その使用と開発を制限している。 量子機械学習は多くの古典的な機械学習アルゴリズムを改善する可能性を秘めている。 本研究では,古典的ネットワークの複雑性を20%削減しつつ,予測の最適性能を維持したハイブリッド量子古典的畳み込みニューラルネットワークを提案する。 さらに、トレーニングプロセスにおいて最大40%の大幅な時間節約が達成され、薬物発見プロセスの有意義なスピードアップにつながります。

One of the main challenges in drug discovery is to find molecules that bind specifically and strongly to their target protein while having minimal binding to other proteins. By predicting binding affinity, it is possible to identify the most promising candidates from a large pool of potential compounds, reducing the number of compounds that need to be tested experimentally. Recently, deep learning methods have shown superior performance than traditional computational methods for making accurate predictions on large datasets. However, the complexity and time-consuming nature of these methods have limited their usage and development. Quantum machine learning is an emerging technology that has the potential to improve many classical machine learning algorithms. In this work we present a hybrid quantum-classical convolutional neural network, which is able to reduce by 20% the complexity of the classical network while maintaining optimal performance in the predictions. Additionally, it results in a significant time savings of up to 40% in the training process, which means a meaningful speed up of the drug discovery process.
翻訳日:2023-01-19 12:01:53 公開日:2023-01-18
# マルチモダリティは一様性を助ける:マルチモダリティモデルを用いたクロスモーダル・ファウショット学習

Multimodality Helps Unimodality: Cross-Modal Few-Shot Learning with Multimodal Models ( http://arxiv.org/abs/2301.06267v2 )

ライセンス: Link先を確認
Zhiqiu Lin, Samuel Yu, Zhiyi Kuang, Deepak Pathak, Deva Ramanan(参考訳) 少数ショット学習として知られる最小限の命令で新しいタスクを素早く学習する能力は、インテリジェントエージェントの中心的な側面である。 古典的な少数ショットベンチマークでは、単一のモダリティから少数ショットのサンプルを使用するが、そのようなサンプルでは概念クラス全体を特徴付けるには不十分である。 対照的に、人間はクロスモーダル情報を使って新しい概念を効率的に学習する。 この研究で、実際に${\bf visual}$dog classifier by ${\bf read} $ing about dog and ${\bf listen} $ing to them bark. で、より優れた${\bf visual}$dog classifierを構築できることを示した。 そのため、最近のCLIPのようなマルチモーダル基盤モデルは本質的にクロスモーダルであり、異なるモダリティを同じ表現空間にマッピングする。 具体的には,異なるモダリティにまたがる少数の例から学ぶ,単純なクロスモーダル適応手法を提案する。 クラス名を追加のワンショットトレーニングサンプルとして再利用することにより、視覚言語適応のための恥ずかしいほど単純な線形分類器を用いてSOTA結果を得る。 さらに,提案手法は,プレフィックスチューニングやアダプタ,分類器アンサンブルといった既存の手法の恩恵を受けることができることを示す。 最後に、視覚と言語以外のモダリティを検討するために、最初の(知識のある)オーディオビジュアルのマイノリティベンチマークを構築し、クロスモーダルトレーニングを使用して、画像と音声の分類のパフォーマンスを向上させる。

The ability to quickly learn a new task with minimal instruction - known as few-shot learning - is a central aspect of intelligent agents. Classical few-shot benchmarks make use of few-shot samples from a single modality, but such samples may not be sufficient to characterize an entire concept class. In contrast, humans use cross-modal information to learn new concepts efficiently. In this work, we demonstrate that one can indeed build a better ${\bf visual}$ dog classifier by ${\bf read}$ing about dogs and ${\bf listen}$ing to them bark. To do so, we exploit the fact that recent multimodal foundation models such as CLIP are inherently cross-modal, mapping different modalities to the same representation space. Specifically, we propose a simple cross-modal adaptation approach that learns from few-shot examples spanning different modalities. By repurposing class names as additional one-shot training samples, we achieve SOTA results with an embarrassingly simple linear classifier for vision-language adaptation. Furthermore, we show that our approach can benefit existing methods such as prefix tuning, adapters, and classifier ensembling. Finally, to explore other modalities beyond vision and language, we construct the first (to our knowledge) audiovisual few-shot benchmark and use cross-modal training to improve the performance of both image and audio classification.
翻訳日:2023-01-19 12:01:39 公開日:2023-01-18