このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20230120となっている論文です。

PDF登録状況(公開日: 20230120)

TitleAuthorsAbstract論文公表日・翻訳日
# 量子最適制御解の情報理論的限界:雑音チャネルの誤差スケーリング

Information Theoretical Limits for Quantum Optimal Control Solutions: Error Scaling of Noisy Channels ( http://arxiv.org/abs/2006.16113v2 )

ライセンス: Link先を確認
Matthias M. M\"uller, Stefano Gherardini, Tommaso Calarco, Simone Montangero, Filippo Caruso(参考訳) オープン量子システムの正確な操作は、その制御性特性と実装された制御場の情報内容の深い知識を必要とする。 情報と量子最適制御理論のツールを用いて、任意のノイズ発生源に従えばシステムを制御する能力を特徴付ける解析的境界(情報時間境界)を提供する。 さらに,外部雑音場の存在が開量子系ダイナミクスを誘導するので,情報時間境界によって得られる結果は,デコヒーレンス過程を記述するkofman-kurizki universal formulaと非常によく一致していることを示す。 最後に, 量子最適制御のためのドレスチョップランダム基底(dcrab)アルゴリズムを用いて, 雑音パラメータの関数として制御精度のスケーリングを数値的に検証した。

Accurate manipulations of an open quantum system require a deep knowledge of its controllability properties and the information content of the implemented control fields. By using tools of information and quantum optimal control theory, we provide analytical bounds (information-time bounds) to characterize our capability to control the system when subject to arbitrary sources of noise. Moreover, since the presence of an external noise field induces open quantum system dynamics, we also show that the results provided by the information-time bounds are in very good agreement with the Kofman-Kurizki universal formula describing decoherence processes. Finally, we numerically test the scaling of the control accuracy as a function of the noise parameters, by means of the dressed chopped random basis (dCRAB) algorithm for quantum optimal control.
翻訳日:2023-05-12 03:40:10 公開日:2023-01-20
# 量子通信複雑性の直接積定理とデバイス非依存暗号への応用

A direct product theorem for quantum communication complexity with applications to device-independent cryptography ( http://arxiv.org/abs/2106.04299v3 )

ライセンス: Link先を確認
Rahul Jain, Srijita Kundu(参考訳) 我々は、$l$-player 述語 $\mathsf{V}$ の絡み合い支援型対話型量子通信複雑性に対する直積定理を与える。 特に、$l$ プレーヤーの入力セットにまたがる分散 $p$ に対して、$o(\log(\mathrm{eff}^*(\mathsf{v},p))\cdot n)$ という$n$ を計算するためのエンタングル支援量子通信プロトコルの成功確率は、$n$ で指数関数的に低下する。 ここで、$\mathrm{eff}^*(\mathsf{v}, p)$ は laplante, lerays and roland (2014) によって導入された量子効率あるいは分割境界の分散バージョンであり、$p$ に関して$\mathsf{v}$ の1つのコピーを計算する際の分布的量子通信の複雑さに対する下界である。 小型通信のための直接積定理と$\mathrm{eff}^*$に関連する技術を適用することで、デバイスが情報を漏らさないという仮定なしにデバイスに依存しない(di)量子暗号を実行できることを示した。 まず、jain、miller、shi(2020)によって与えられた並列di量子鍵分散プロトコルを分析し、マジックスクエアゲームのn$コピーと互換性のあるデバイスでプロトコルを実行すると、o(n)$のリークがある場合でも、それから$\omega(n)$の鍵を抽出することができることを示した。 第2に、リークを伴うQKDのキーレートが向上するJain、Miller、Shiプロトコルのシーケンシャルバージョンを実行できることを示し、リークを伴うシーケンシャルなDIランダム性拡張を行わせることができる(リークのないDIランダム性拡張を並列に行う方法は不明である)。 第三に、2つの絡み合ったプロバーを持つ量子性証明は漏洩に抵抗する、すなわち、o(n)$ビットを互いに通信する古典的なプレイヤーは、絡み合いを共有することを検証者に納得させることができない。

We give a direct product theorem for the entanglement-assisted interactive quantum communication complexity of an $l$-player predicate $\mathsf{V}$. In particular we show that for a distribution $p$ that is product across the input sets of the $l$ players, the success probability of any entanglement-assisted quantum communication protocol for computing $n$ copies of $\mathsf{V}$, whose communication is $o(\log(\mathrm{eff}^*(\mathsf{V},p))\cdot n)$, goes down exponentially in $n$. Here $\mathrm{eff}^*(\mathsf{V}, p)$ is a distributional version of the quantum efficiency or partition bound introduced by Laplante, Lerays and Roland (2014), which is a lower bound on the distributional quantum communication complexity of computing a single copy of $\mathsf{V}$ with respect to $p$. Applying our direct product theorem for small communication and techniques related to $\mathrm{eff}^*$, we show that it is possible to do device-independent (DI) quantum cryptography without the assumption that devices do not leak any information. First, we analyze the parallel DI quantum key distribution protocol given by Jain, Miller and Shi (2020), and show that when the protocol is carried out with devices that are compatible with $n$ copies of the Magic Square game, it is possible to extract $\Omega(n)$ bits of key from it, even in the presence of $O(n)$ bits of leakage. Second, we show that it is possible to do sequential versions of the Jain, Miller and Shi protocol, which give a better key rate for QKD with leakage, and let us do sequential DI randomness expansion with leakage (it is not known how to do parallel DI randomness expansion even without leakage). Third, we show that proofs of quantumness with two entangled provers are resistant to leakage, i.e., classical players who communicate $O(n)$ bits with each other cannot convince the verifier that they share entanglement.
翻訳日:2023-03-27 06:36:53 公開日:2023-01-20
# 量子可観測物の適応推定

Adaptive estimation of quantum observables ( http://arxiv.org/abs/2110.15339v6 )

ライセンス: Link先を確認
Ariel Shlosberg, Andrew J. Jena, Priyanka Mukhopadhyay, Jan F. Haase, Felix Leditzky, Luca Dellantonio(参考訳) 量子可観測物の正確な推定は科学における重要な課題である。 ハードウェアの進歩により、量子システムの測定がますます要求されるようになり、特に広範囲なサンプリングを必要とする変動プロトコルについてである。 本稿では,予め得られたデータに基づいて推定器を適応的に修正する計測手法を提案する。 私たちがAEQuOと呼ぶアルゴリズムは、観測可能な推定平均と関連する誤差の両方を継続的に監視し、この情報に基づいて次の測定ステップを決定する。 我々は、ポーリ作用素の部分集合における重複関係と非ビット的可換関係の両方を同時に調べることができ、収集情報量を最大化することができる。 aequoには2つの変種がある。小さな問題インスタンスに対して優れたパフォーマンスを持つ欲張りなバケット充填アルゴリズムと、大規模なインスタンスに対してより好適なスケーリングを備えた機械学習ベースのアルゴリズムだ。 これらのサブルーチンによって決定される測定構成は、推定子の誤差を下げるためにさらに後処理される。 我々は化学ハミルトニアンのプロトコルをテストし、aequoは様々なグルーピング手法やランダム化測定に基づく最先端の手法を全て改善し、現在の量子応用や将来の量子応用における測定量を大幅に削減した。

The accurate estimation of quantum observables is a critical task in science. With progress on the hardware, measuring a quantum system will become increasingly demanding, particularly for variational protocols that require extensive sampling. Here, we introduce a measurement scheme that adaptively modifies the estimator based on previously obtained data. Our algorithm, which we call AEQuO, continuously monitors both the estimated average and the associated error of the considered observable, and determines the next measurement step based on this information. We allow both for overlap and non-bitwise commutation relations in the subsets of Pauli operators that are simultaneously probed, thereby maximizing the amount of gathered information. AEQuO comes in two variants: a greedy bucket-filling algorithm with good performance for small problem instances, and a machine learning-based algorithm with more favorable scaling for larger instances. The measurement configuration determined by these subroutines is further post-processed in order to lower the error on the estimator. We test our protocol on chemistry Hamiltonians, for which AEQuO provides error estimates that improve on all state-of-the-art methods based on various grouping techniques or randomized measurements, thus greatly lowering the toll of measurements in current and future quantum applications.
翻訳日:2023-03-10 00:47:08 公開日:2023-01-20
# ボース・アインシュタイン凝縮体の非対称トンネル

Asymmetric Tunneling of Bose-Einstein Condensates ( http://arxiv.org/abs/2110.15298v4 )

ライセンス: Link先を確認
Dustin R. Lindberg, Naceur Gaaloul, Lev Kaplan, Jason R. Williams, Dennis Schlippert, Patrick Boegel, Ernst-Maria Rasel, Denys I. Bondar(参考訳) ランダウは有名な教科書 \textit{quantum mechanics: non relativistic theory} で、1次元の単一粒子系に対して、トンネルの確率は障壁の左または右からの粒子インシデントと同じであると主張した。 このトンネル確率の左右対称性は、ポテンシャル障壁の形状にかかわらず成り立つ。 しかし、例えば複合粒子を観察する場合など、この対称性を破る様々な既知のケースが存在する。 計算(そして最も単純な場合)は、グロス=ピタエフスキー方程式(GPE)によってモデル化されたボース=アインシュタイン凝縮体(BEC)の1Dにおける左-右トンネル対称性の破れを示す。 BECにおける粒子間相互作用のパラメータである$g$の変化により、対称(g=0$)から非対称トンネルへの移行がしきい値現象であることを示す。 提案手法では,実験可能なパラメータを用いて,近い将来にこれらの結果が実証される可能性がある。 この現象の応用として、原子線ダイオード、合成ゲージ場、マクスウェルのデーモン、ブラックホールのアナログを設計することを提案する。

In his celebrated textbook, \textit{Quantum Mechanics: Nonrelativistic Theory}, Landau argued that, for single particle systems in 1D, tunneling probability remains the same for a particle incident from the left or the right of a barrier. This left-right symmetry of tunneling probability holds regardless of the shape of the potential barrier. However, there are a variety of known cases that break this symmetry, e.g. when observing composite particles. We computationally (and analytically, in the simplest case) show this breaking of the left-right tunneling symmetry for Bose-Einstein condensates (BEC) in 1D, modelled by the Gross-Pitaevskii equation (GPE). By varying $g$, the parameter of inter-particle interaction in the BEC, we demonstrate that the transition from symmetric ($g=0$) to asymmetric tunneling is a threshold phenomenon. Our computations employ experimentally feasible parameters such that these results may be experimentally demonstrated in the near future. We conclude by suggesting applications of the phenomena to design atomtronic diodes, synthetic gauge fields, Maxwell's demons, and black-hole analogues.
翻訳日:2023-03-10 00:46:21 公開日:2023-01-20
# 結局、絡み合いの第二法則はない

No second law of entanglement manipulation after all ( http://arxiv.org/abs/2111.02438v3 )

ライセンス: Link先を確認
Ludovico Lami and Bartosz Regula(参考訳) 量子エンタングルメントの理論と熱力学の間に多くの実りある類似が生まれ、熱力学の法則に類似したエンタングルメントの公理的記述の追求を動機付けている。 長年の公然とした問題は、エンタングルメントの真の第二法則を確立することであり、特に、エンタングル系間の全ての変換を制御し、熱力学におけるエントロピーの役割を反映する一意的な関数である。 これまでの有望な証拠とは対照的に、ここではこれは不可能であり、熱力学の第2法則の直接的な対応が確立できないことを示す。 これは、第1原理から絡み合い理論の不可逆性を証明し、絡み合い操作の最も一般的な物理的制約を仮定すると、絡み合い理論はすべての非絡み合い変換において不可逆であることを示す。 さらに, 可逆的エンタングルメント変換は, 特定の尺度に従ってマクロ的に大量のエンタングルメントを生成する必要があることを示すため, 重要なエンタングルメント支出を伴わずに可逆性を除外する。 この結果は、量子エンタングルメント変換と熱力学的過程の根本的な違いだけでなく、他の既知の量子資源と区別する独自のエンタングルメントの性質も示している。

Many fruitful analogies have emerged between the theories of quantum entanglement and thermodynamics, motivating the pursuit of an axiomatic description of entanglement akin to the laws of thermodynamics. A long-standing open problem has been to establish a true second law of entanglement, and in particular a unique function which governs all transformations between entangled systems, mirroring the role of entropy in thermodynamics. Contrary to previous promising evidence, here we show that this is impossible, and no direct counterpart to the second law of thermodynamics can be established. This is accomplished by demonstrating the irreversibility of entanglement theory from first principles -- assuming only the most general microscopic physical constraints of entanglement manipulation, we show that entanglement theory is irreversible under all non-entangling transformations. We furthermore rule out reversibility without significant entanglement expenditure, showing that reversible entanglement transformations require the generation of macroscopically large amounts of entanglement according to certain measures. Our results not only reveal fundamental differences between quantum entanglement transformations and thermodynamic processes, but also showcase a unique property of entanglement which distinguishes it from other known quantum resources.
翻訳日:2023-03-09 06:41:42 公開日:2023-01-20
# サルポックスの検出と予測のためのcnn-based pretrained modelsの比較分析

A Comparative Analysis of CNN-Based Pretrained Models for the Detection and Prediction of Monkeypox ( http://arxiv.org/abs/2302.10277v1 )

ライセンス: Link先を確認
Sourav Saha, Trina Chakraborty, Rejwan Bin Sulaiman, Tithi Paul(参考訳) サルポックス(英: monkeypox)は、convi-19パンデミックの後、医療専門家の間で懸念が高まったまれな疾患である。 ニワトリポックスや麻疹に似た症状のため、サルポックスは早期診断が困難である。 さらに、これは稀な状態であるため、医療従事者の間には知識ギャップがある。 結果として、個々のウイルス感染の初期段階において、病気を対処し、予測するための新しい技術の必要性が急務である。 VGG-16, VGG-19, Restnet50, Inception-V3, Densnet, Xception, MobileNetV2, Alexnet, Lenet, majority Votingなど,複数のCNNベースの事前訓練モデルを用いた。 本研究では,サルポックスとニワトリポックス,モンキーポックスと麻疹,モンキーポックス対正常,モンキーポックス対すべての疾患など,複数のデータセットを組み合わせた。 多数決はモンキーポックス対チキンポックスで97%、xceptionはモンキーポックス対麻疹で79%、mobilenetv2はモンキーポックス対ノーマルで96%、lenetはサルポックス対オールで80%だった。

Monkeypox is a rare disease that raised concern among medical specialists following the convi-19 pandemic. It's concerning since monkeypox is difficult to diagnose early on because of symptoms that are similar to chickenpox and measles. Furthermore, because this is a rare condition, there is a knowledge gap among healthcare professionals. As a result, there is an urgent need for a novel technique to combat and anticipate the disease in the early phases of individual virus infection. Multiple CNN-based pre-trained models, including VGG-16, VGG-19, Restnet50, Inception-V3, Densnet, Xception, MobileNetV2, Alexnet, Lenet, and majority Voting, were employed in classification in this study. For this study, multiple data sets were combined, such as monkeypox vs chickenpox, monkeypox versus measles, monkeypox versus normal, and monkeypox versus all diseases. Majority voting performed 97% in monkeypox vs chickenpox, Xception achieved 79% in monkeypox against measles, MobileNetV2 scored 96% in monkeypox vs normal, and Lenet performed 80% in monkeypox versus all.
翻訳日:2023-02-26 14:26:07 公開日:2023-01-20
# 固定パラメータトラクタブルグラフ問題に対する局所的ジャンプ・アンド・リペア制約処理

Focused Jump-and-Repair Constraint Handling for Fixed-Parameter Tractable Graph Problems Closed Under Induced Subgraphs ( http://arxiv.org/abs/2203.13877v2 )

ライセンス: Link先を確認
Luke Branson and Andrew M. Sutton(参考訳) 補修演算子は制約付き組合せ最適化の制約処理によく使用される。 グラフ問題における不可能な子孫の確率的修復に使用できる,調整されたジャンプ・アンド・リペア操作を備えた (1+1)~EA について検討する。 グラフ全体の候補解を進化させる代わりに、(1+1)~eaがインスタンスのサブセット(誘導部分グラフ)と並行して実現可能な解を開発できるように遺伝子型を拡張します。 提案手法では,古典的な固定パラメータアルゴリズムで使用される反復圧縮過程を確率論的にシミュレートし,NP-hardグラフ問題に対するランダムなFPT性能保証を得る。 k$-vertexcover について、集中ジャンプ・アンド・リペアを用いて (1+1) ea が$o(2^k n^2\log n)$ の反復で $k$-vertex cover を見つけることができることを証明している。 これにより、VertexCover上の進化的アルゴリズムの最もよく知られたパラメータ化境界よりも指数関数的に($k$で)改善される。 トーナメントにおける$k$-FeedbackVertexSet問題に対して、EAが$O(2^kk! n^2\log n)$ iterations in expectation, and for OddCycleTransversal, we prove the optimization time for the EA is $O(3^k k m n^2\log n)$。 後者の2つの問題に対して、これは任意の進化的アルゴリズムの最初のパラメータ化結果を構成する。 本稿では,誘導サブグラフの下で閉じた他のパラメータ化グラフ問題に対するフレームワークの一般化と,具体的なインスタンスクラスにおけるアルゴリズムの振る舞いを説明する実験結果について述べる。

Repair operators are often used for constraint handling in constrained combinatorial optimization. We investigate the (1+1)~EA equipped with a tailored jump-and-repair operation that can be used to probabilistically repair infeasible offspring in graph problems. Instead of evolving candidate solutions to the entire graph, we expand the genotype to allow the (1+1)~EA to develop in parallel a feasible solution together with a growing subset of the instance (an induced subgraph). With this approach, we prove that the EA is able to probabilistically simulate an iterative compression process used in classical fixed-parameter algorithmics to obtain a randomized FPT performance guarantee on three NP-hard graph problems. For $k$-VertexCover, we prove that the (1+1) EA using focused jump-and-repair can find a $k$-vertex cover (if one exists) in $O(2^k n^2\log n)$ iterations in expectation. This leads to an exponential (in $k$) improvement over the best-known parameterized bound for evolutionary algorithms on VertexCover. For the $k$-FeedbackVertexSet problem in tournaments, we prove that the EA finds a feasible feedback set in $O(2^kk!n^2\log n)$ iterations in expectation, and for OddCycleTransversal, we prove the optimization time for the EA is $O(3^k k m n^2\log n)$. For the latter two problems, this constitutes the first parameterized result for any evolutionary algorithm. We discuss how to generalize the framework to other parameterized graph problems closed under induced subgraphs and report experimental results that illustrate the behavior of the algorithm on a concrete instance class.
翻訳日:2023-02-20 20:37:42 公開日:2023-01-20
# ツールキットのように見る: ツールキットがai倫理の仕事をどう考えるか

Seeing Like a Toolkit: How Toolkits Envision the Work of AI Ethics ( http://arxiv.org/abs/2202.08792v2 )

ライセンス: Link先を確認
Richmond Y. Wong, Michael A. Madaio, Nick Merrill(参考訳) 倫理的AI開発を支援するために多くのツールキットが開発されている。 しかしながら、ツールキットは、他のツールと同様に、何をすべきか、どのように行うべきかという前提を設計にエンコードします。 本稿では,27のAI倫理ツールキットの質的分析を行い,倫理的作業がどのように想像されるか,どのように支援されるのかを批判的に検証する。 具体的には,倫理的問題,倫理的作業を行うべき者,倫理的対処に関わる作業慣行をどのように想定するか,などについて論じる。 それらのツールキットのうち、倫理に関する想像上の作業と、その作業にツールキットが提供するサポートのミスマッチを識別する。 特に,倫理的な作業を行う上で,労働力,組織力,組織力のダイナミクスをいかにナビゲートするかに関する指導の欠如を明らかにする。 我々はこれらの欠落を利用して、AI倫理ツールキットの研究者やデザイナーの今後の業績をグラフ化しています。

Numerous toolkits have been developed to support ethical AI development. However, toolkits, like all tools, encode assumptions in their design about what work should be done and how. In this paper, we conduct a qualitative analysis of 27 AI ethics toolkits to critically examine how the work of ethics is imagined and how it is supported by these toolkits. Specifically, we examine the discourses toolkits rely on when talking about ethical issues, who they imagine should do the work of ethics, and how they envision the work practices involved in addressing ethics. Among the toolkits, we identify a mismatch between the imagined work of ethics and the support the toolkits provide for doing that work. In particular, we identify a lack of guidance around how to navigate labor, organizational, and institutional power dynamics as they relate to performing ethical work. We use these omissions to chart future work for researchers and designers of AI ethics toolkits.
翻訳日:2023-02-19 15:02:03 公開日:2023-01-20
# プロトタイプ画像分類における正当性チェックとパッチ可視化の改善

Sanity checks and improvements for patch visualisation in prototype-based image classification ( http://arxiv.org/abs/2302.08508v1 )

ライセンス: Link先を確認
Romain Xu-Darme (LSL, MRIM), Georges Qu\'enot (MRIM), Zakaria Chihani (LSL), Marie-Christine Rousset (SLIDE)(参考訳) 本研究では,プロトタイプをベースとした視覚分類モデルであるProtoPNetとProtoTreeを用いて,ビジュアル化手法の詳細な分析を行う。 2つのきめ細かいデータセット(CUB-200-2011とStanford Cars)を用いて、これらの手法が画像内の関心領域を正しく識別せず、従ってモデル動作を反映しないことを示す。 次に,削除基準を用いて,Smoothgrads や PRP などの塩分濃度法がより忠実な画像パッチを提供することを示す。 また,いくつかのデータセット(例えば CUB-200-2011)で提供されるオブジェクトのセグメンテーションに基づく新しい関連度尺度を提案し,ProtoPNet と ProtoTree が生成した不正確なパッチの可視化により,より忠実な手法を用いることでバイアスを軽減できることを示す。 最後に,同じ可視化方法を共有する他のプロトタイプモデルに対する知見の意義について考察する。

In this work, we perform an in-depth analysis of the visualisation methods implemented in two popular self-explaining models for visual classification based on prototypes - ProtoPNet and ProtoTree. Using two fine-grained datasets (CUB-200-2011 and Stanford Cars), we first show that such methods do not correctly identify the regions of interest inside of the images, and therefore do not reflect the model behaviour. Secondly, using a deletion metric, we demonstrate quantitatively that saliency methods such as Smoothgrads or PRP provide more faithful image patches. We also propose a new relevance metric based on the segmentation of the object provided in some datasets (e.g. CUB-200-2011) and show that the imprecise patch visualisations generated by ProtoPNet and ProtoTree can create a false sense of bias that can be mitigated by the use of more faithful methods. Finally, we discuss the implications of our findings for other prototype-based models sharing the same visualisation method.
翻訳日:2023-02-19 14:26:35 公開日:2023-01-20
# 添加物製造における深層学習の定量的構造評価

Deep-Learning Quantitative Structural Characterization in Additive Manufacturing ( http://arxiv.org/abs/2302.06389v1 )

ライセンス: Link先を確認
Amra Peles, Vincent C. Paquit, Ryan R. Dehoff(参考訳) 精密な組織構造を有する添加物製造部品の製作を加速することを目的として, 添加物製造材料および部品の重要特性の構造解析手法を開発した。 この方法は、画像から画像への翻訳条件付き生成型ニューラルネットワークアーキテクチャに基づくディープラーニングを利用し、エッチングされた光学画像で見えるメルトプール境界や印刷による欠陥を含む、一般的な幾何学的特徴の迅速かつ段階的な予測を可能にする。 これらの構造的詳細は本質的に異質である。 本手法では, 収集した画像のアンサンブルに基づいて, 構造詳細の統計的分布を介して構築した添加物の微細構造を規定する。 本手法の拡張は,添加物製造のリアルタイム制御のために開発された機械学習モデルの人工知能実装に対処するために提案される。

With a goal of accelerating fabrication of additively manufactured components with precise microstructures, we developed a method for structural characterization of key features in additively manufactured materials and parts. The method utilizes deep learning based on an image-to-image translation conditional Generative Adversarial Neural Network architecture and enables fast and incrementally more accurate predictions of the prevalent geometric features, including melt pool boundaries and printing induced defects visible in etched optical images. These structural details are heterogeneous in nature. Our method specifies the microstructure state of an additive built via statistical distribution of structural details, based on an ensemble of collected images. Extensions of the method are proposed to address Artificial Intelligence implementation of developed machine learning model for in real time control of additive manufacturing.
翻訳日:2023-02-19 14:19:34 公開日:2023-01-20
# スパース接続と選択学習を用いたオンラインリアルタイム反復学習

Online Real-Time Recurrent Learning Using Sparse Connections and Selective Learning ( http://arxiv.org/abs/2302.05326v1 )

ライセンス: Link先を確認
Khurram Javed, Haseeb Shah, Rich Sutton, Martha White(参考訳) 感覚観察による状態構築は強化学習エージェントの重要な構成要素である。 状態構築のソリューションのひとつは、リカレントニューラルネットワークを使用することだ。 リカレント学習のための2つの一般的な勾配に基づく手法は、時間によるバックプロパゲーション(BPTT)とリアルタイムリカレント学習(RTRL)である。 BPTTは、勾配計算の前に観測の完全なシーケンスを調べ、オンラインリアルタイム更新には適さない。 rtrlはオンライン更新は可能だが、大規模ネットワークへのスケール性は低い。 本稿ではRTRLをスケーラブルにする2つの制約を提案する。 ネットワークを独立したモジュールに分解するか、再帰的なネットワークを漸進的に学習することにより、RTRLをパラメータ数と線形にスケールできることを示す。 UOROやTrncated-BPTTのような従来のスケーラブルな勾配推定アルゴリズムとは異なり、我々のアルゴリズムは勾配推定にノイズやバイアスを加えない。 代わりに、スケーラブルな学習を達成するために、リカレントネットワークの機能能力を切り離します。 我々は,動物学習に触発されたベンチマークと,アーケード学習環境(ALE)の専門家Rainbow-DQNエージェントの政策評価におけるTrncated-BPTTに対するアプローチの有効性を実証した。

State construction from sensory observations is an important component of a reinforcement learning agent. One solution for state construction is to use recurrent neural networks. Two popular gradient-based methods for recurrent learning are back-propagation through time (BPTT), and real-time recurrent learning (RTRL). BPTT looks at the complete sequence of observations before computing gradients and is unsuitable for online real-time updates. RTRL can do online updates but scales poorly to large networks. In this paper, we propose two constraints that make RTRL scalable. We show that by either decomposing the network into independent modules or learning a recurrent network incrementally, we can make RTRL scale linearly with the number of parameters. Unlike prior scalable gradient estimation algorithms, such as UORO and Truncated-BPTT, our algorithms do not add noise or bias to the gradient estimate. Instead, they trade off the functional capacity of the recurrent network to achieve scalable learning. We demonstrate the effectiveness of our approach over Truncated-BPTT on a benchmark inspired by animal learning and in policy evaluation for expert Rainbow-DQN agents in the Arcade Learning Environment (ALE).
翻訳日:2023-02-19 14:17:16 公開日:2023-01-20
# 拡散モデルによる構造騒音の除去

Removing Structured Noise with Diffusion Models ( http://arxiv.org/abs/2302.05290v1 )

ライセンス: Link先を確認
Tristan S.W. Stevens, Jean-Luc Robert, Faik C. Meral Jason Yu, Jun Seob Shin, Ruud J.G. van Sloun(参考訳) 不適切な逆問題を解決するには、関心のシグナルに関する事前の信念を慎重に定式化し、ノイズ測定にそれらの表現を正確に記述する必要がある。 例えば、疎性に基づく手作り信号の先行は、データ駆動の深層生成モデルに置き換わる傾向にあり、いくつかのグループが最近、最先端のスコアベースの拡散モデルが特に高い性能と柔軟性をもたらすことを示した。 本稿では,拡散モデルを用いた後方サンプリングの強力なパラダイムを,リッチで構造化されたノイズモデルを含むように拡張できることを示す。 そこで本研究では,雑音と信号生成分布の学習スコアを用いた共条件逆拡散法を提案する。 本研究では,構造化雑音を伴う様々な逆問題に対して,正規化フローや逆ネットワークを用いた競合ベースラインよりも高い性能を示す。 これにより、非ガウス測度における逆問題に対する拡散モデリングの新しい機会と関連する実践的応用が開かれる。

Solving ill-posed inverse problems requires careful formulation of prior beliefs over the signals of interest and an accurate description of their manifestation into noisy measurements. Handcrafted signal priors based on e.g. sparsity are increasingly replaced by data-driven deep generative models, and several groups have recently shown that state-of-the-art score-based diffusion models yield particularly strong performance and flexibility. In this paper, we show that the powerful paradigm of posterior sampling with diffusion models can be extended to include rich, structured, noise models. To that end, we propose a joint conditional reverse diffusion process with learned scores for the noise and signal-generating distribution. We demonstrate strong performance gains across various inverse problems with structured noise, outperforming competitive baselines that use normalizing flows and adversarial networks. This opens up new opportunities and relevant practical applications of diffusion modeling for inverse problems in the context of non-Gaussian measurements.
翻訳日:2023-02-19 14:16:09 公開日:2023-01-20
# 社会メタバース:挑戦と解決策

Social Metaverse: Challenges and Solutions ( http://arxiv.org/abs/2301.10221v1 )

ライセンス: Link先を確認
Yuntao Wang, Zhou Su, and Miao Yan(参考訳) ソーシャルメタバース(Social Metaverse)は、ユーザーが遊び、買い物、仕事、社会化するための一連の相互接続された仮想世界を組み合わせたデジタル空間である。 人工知能(AI)の進歩とデータプライバシに関する関心の高まりと並行して、フェデレーション学習(FL)は、プライバシ保護によるAIを活用した社会メタバースへのパラダイムシフトとして推奨されている。 しかしながら、プライバシユーティリティのトレードオフ、学習信頼性、AIモデル盗難といった課題は、実際のメタバースアプリケーションにおけるFLの展開を妨げる。 本稿では,ソーシャルメタバースにおけるプライバシ利用のトレードオフを改善するために,ユーザ/アバター間の広く普及するソーシャル関係を利用して,ソーシャルアウェアな階層的flフレームワーク,すなわちsocialflを前進させる。 次に,ブロックチェーンに基づくアグリゲータフリーなロバストfl機構を,新たなブロック構造とオン/オフチェーンコラボレーションを特徴とするコンセンサスプロトコルによって考案した。 さらに、スマートコントラクトとデジタル透かしに基づいて、AIモデル盗難や社会メタバースの衝突アバターを防止するために、自動フェデレーションAI(FedAI)モデルのオーナシップ証明機構が設計されている。 実験により,提案フレームワークの有効性と有効性が確認された。 最後に,この新興地域での今後の研究の方向性について展望する。

Social metaverse is a shared digital space combining a series of interconnected virtual worlds for users to play, shop, work, and socialize. In parallel with the advances of artificial intelligence (AI) and growing awareness of data privacy concerns, federated learning (FL) is promoted as a paradigm shift towards privacy-preserving AI-empowered social metaverse. However, challenges including privacy-utility tradeoff, learning reliability, and AI model thefts hinder the deployment of FL in real metaverse applications. In this paper, we exploit the pervasive social ties among users/avatars to advance a social-aware hierarchical FL framework, i.e., SocialFL for a better privacy-utility tradeoff in the social metaverse. Then, an aggregator-free robust FL mechanism based on blockchain is devised with a new block structure and an improved consensus protocol featured with on/off-chain collaboration. Furthermore, based on smart contracts and digital watermarks, an automatic federated AI (FedAI) model ownership provenance mechanism is designed to prevent AI model thefts and collusive avatars in social metaverse. Experimental findings validate the feasibility and effectiveness of proposed framework. Finally, we envision promising future research directions in this emerging area.
翻訳日:2023-02-19 13:48:26 公開日:2023-01-20
# The Applies to the RealWorld”: コンピュータサイエンスの課題への倫理の統合に関する学生の視点

"This Applies to the RealWorld": Student Perspectives on Integrating Ethics into a Computer Science Assignment ( http://arxiv.org/abs/2301.08627v1 )

ライセンス: Link先を確認
Julie Jarzemsky, Joshua Paup, Casey Fiesler(参考訳) 大学コンピュータサイエンス(CS)プログラムでは、独立した倫理コースにのみ依存するのではなく、CSクラスに倫理を埋め込む動きが増えている。 一つの戦略は、学生がコードに固有の倫理的な問題を振り返ることを促す課題を作成することである。 このような課題を授業で実施した学生を対象に,新たに導入倫理に基づくCS課題をレビューした学生を対象に,フォーカスグループを実施。 本経験報告では、倫理に基づく課題を設計し、学生にフィードバックを与える過程を記述したケーススタディを提案する。 焦点グループの参加者は、課題に対するフィードバックだけでなく、一般的にコーディング課題への倫理の統合についても共有し、学生の視点からこの研究のメリットと課題を明らかにした。 また,新しい倫理指向の課題概念を学生とともに生み出した。 参加者が最も影響を受けたと感じた技術論争から派生して、さらなるカリキュラム開発の出発点として、アイデアの銀行を作りました。

There is a growing movement in undergraduate computer science (CS) programs to embed ethics across CS classes rather than relying solely on standalone ethics courses. One strategy is creating assignments that encourage students to reflect on ethical issues inherent to the code they write. Building off prior work that has surveyed students after doing such assignments in class, we conducted focus groups with students who reviewed a new introductory ethics-based CS assignment. In this experience report, we present a case study describing our process of designing an ethics-based assignment and proposing the assignment to students for feedback. Participants in our focus groups not only shared feedback on the assignment, but also on the integration of ethics into coding assignments in general, revealing the benefits and challenges of this work from a student perspective. We also generated novel ethics-oriented assignment concepts alongside students. Deriving from tech controversies that participants felt most affected by, we created a bank of ideas as a starting point for further curriculum development.
翻訳日:2023-02-19 13:41:54 公開日:2023-01-20
# Open Accessを超えてオープン性を目指す - 3つのオープンAIコラボレーションによるユーザジャーニー

Towards Openness Beyond Open Access: User Journeys through 3 Open AI Collaboratives ( http://arxiv.org/abs/2301.08488v1 )

ライセンス: Link先を確認
Jennifer Ding, Christopher Akiki, Yacine Jernite, Anne Lee Steele, Temi Popo(参考訳) Open Artificial Intelligence(オープンソースAI)のコラボレーションは、AIをオープンソースな技術企業を超えて開発する方法と、そのプロセスの一部となる方法の代替手段を提供する。 それぞれのコミュニティは、aiに関するさまざまな種類のアクティビティに焦点を当てています – モデルの構築(bigscience workshop)、ツールと作業方法(チューリングの方法)、エコシステム(mozilla festivalのbuilding trustworthy ai working group)です。 まず、分散したボランティア主導のチームを促進するコミュニティ構造を文書化し、各グループを特定の目標に向けて推進するコラボレーションスタイルを比較します。 コミュニティリーダーとのインタビューを通じて、メンバの発見、参加、貢献、参加の方法に関するユーザジャーニーをマップします。 最終的に、この論文は、これらのコラボレーションを通じて生まれたAI作業と労働者の多様性と、AI空間に対するより広いオープンネスの実践方法を強調することを目的としている。

Open Artificial Intelligence (Open source AI) collaboratives offer alternative pathways for how AI can be developed beyond well-resourced technology companies and who can be a part of the process. To understand how and why they work and what additionality they bring to the landscape, we focus on three such communities, each focused on a different kind of activity around AI: building models (BigScience workshop), tools and ways of working (The Turing Way), and ecosystems (Mozilla Festival's Building Trustworthy AI Working Group). First, we document the community structures that facilitate these distributed, volunteer-led teams, comparing the collaboration styles that drive each group towards their specific goals. Through interviews with community leaders, we map user journeys for how members discover, join, contribute, and participate. Ultimately, this paper aims to highlight the diversity of AI work and workers that have come forth through these collaborations and how they offer a broader practice of openness to the AI space.
翻訳日:2023-02-19 13:41:37 公開日:2023-01-20
# SugarChain:ブロックチェーン技術が農業と出会う インドのサトウキビ農業の事例研究と分析

SugarChain: Blockchain technology meets Agriculture -- The case study and analysis of the Indian sugarcane farming ( http://arxiv.org/abs/2301.08405v1 )

ライセンス: Link先を確認
Naresh Kshetri, Chandra Sekhar Bhusal, Dilip Kumar, Devendra Chapagain(参考訳) 私たちの国やアジアだけでなく、農業部門も、新しい技術やイノベーションを使いながら、世界中で遅れを取っています。 農家はいくつかの理由から、製品の正確な価格と補償を受け取っていない。 中間者または中間者は、価格と製品の提供を自分で制御している。 教育の欠如、技術進歩、市場の知識、戦後のプロセス、中間者への関与により、農家は常に実際の給与と努力を奪われている。 ブロックチェーン技術を使うことで、農家は高い信頼性でプロセスを自動化できる。 インド産サトウキビ栽培における事例研究と分析を農家から収集したデータを用いて紹介した。 ケーススタディに基づいて,システムの実装,テスト,結果分析を行った。 私たちの研究の全体的な目的は、農業製品を強調し、動機付けし、ブロックチェーン技術を使って農家に利益を与えることです。

Not only in our country and Asia, but the agriculture sector is also lagging all over the world while using new technologies and innovations. Farmers are not getting the accurate price and compensation of their products because of several reasons. The intermediate persons or say middlemen are controlling the prices and product delivery on their own. Due to lack of education, technological advancement, market knowledge, post-harvesting processes, and middleman involvement, farmers are always deprived of their actual pay and efforts. The use of blockchain technology can help such farmers to automate the process with high trust. We have presented our case study and analysis for the Indian sugarcane farming with data collected from farmers. The system implementation, testing, and result analysis has been shown based on the case study. The overall purpose of our research is to emphasize and motivate the agricultural products and benefit the farmers with the use of blockchain technology.
翻訳日:2023-02-19 13:41:20 公開日:2023-01-20
# ビッグデータスキャナーによる中国のcpi予測

Predicting China's CPI by Scanner Big Data ( http://arxiv.org/abs/2211.16641v2 )

ライセンス: Link先を確認
Zhenkun Zhou and Zikun Song and Tao Ren(参考訳) Scannerのビッグデータは、Consumer Price Index(CPI)を構築する可能性がある。 本研究は、中国Ant Business Alliance(CAA)が提供するスーパーマーケット販売のスキャナーデータを用いて、中国でS-FCPI(Scanner-data Food Consumer Price Index)を構築し、他のマクロ指標、特に中国のCPIによって指標信頼性が検証されている。 それだけでなく、私たちはS-FCPIに基づく複数の機械学習モデルを構築し、数ヶ月でCPIの成長率を定量的に予測し、その方向とレベルを質的に予測します。 予測モデルは、既存の研究における従来の時系列モデルよりもはるかに優れたパフォーマンスを達成する。 この研究は、中国のスキャナービッグデータを使用して価格指数を構築し、予測する方法を開拓する。 S-FCPIは、CPIよりも高頻度で広い範囲の商品価格の変化を反映できるだけでなく、マクロ経済活動の監視、インフレの予測、その他の経済問題を理解するための新たな視点を提供する。

Scanner big data has potential to construct Consumer Price Index (CPI). This work utilizes the scanner data of supermarket retail sales, which are provided by China Ant Business Alliance (CAA), to construct the Scanner-data Food Consumer Price Index (S-FCPI) in China, and the index reliability is verified by other macro indicators, especially by China's CPI. And not only that, we build multiple machine learning models based on S-FCPI to quantitatively predict the CPI growth rate in months, and qualitatively predict those directions and levels. The prediction models achieve much better performance than the traditional time series models in existing research. This work paves the way to construct and predict price indexes through using scanner big data in China. S-FCPI can not only reflect the changes of goods prices in higher frequency and wider geographic dimension than CPI, but also provide a new perspective for monitoring macroeconomic operation, predicting inflation and understanding other economic issues, which is beneficial supplement to China's CPI.
翻訳日:2023-02-19 12:44:07 公開日:2023-01-20
# K-12 AI教育の展望

A Perspective on K-12 AI Education ( http://arxiv.org/abs/2206.03217v2 )

ライセンス: Link先を確認
Nathan Wang, Paul Tonko, Nikil Ragav, Michael Chungyoun, Jonathan Plucker(参考訳) 機械学習(AI)は、さまざまなデータセットをトレーニングすることで、マシンがタスクを実行することを学習することを可能にする。 AI、特にディープラーニングは比較的新しいものだが、すでに医学、生物学、輸送、エンターテイメントなどに大きな影響を与えている。 AIが日々の生活を急速に変化させるにつれて、私たちの社会をAIによる未来に向けて準備することに挑戦しています。 この目的のために重要なステップは、教育を通じてAI対応の労働力を確保することだ。 K-12レベルでAIの基礎を教えることの提唱者は通常、労働力、経済、国家安全保障に利益をもたらす。 この相補的な視点では、学習aiが学生のモチベーションと創造的思考を促進する上で有益である理由と、学習成果を最適化するモジュールベースのアプローチの開発方法について論じる。 我々は、米国と世界中でK-12 AI教育を推進すべく、教育コミュニティのより多くのメンバを興奮させ、参加させたいと思っています。

Artificial intelligence (AI), which enables machines to learn to perform a task by training on diverse datasets, is one of the most revolutionary developments in scientific history. Although AI and especially deep learning is relatively new, it has already had transformative impact on medicine, biology, transportation, entertainment, and beyond. As AI changes our daily lives at an increasingly fast pace, we are challenged with preparing our society for an AI-driven future. To this end, a critical step is to ensure an AI-ready workforce through education. Advocates of beginning instruction of AI basics at the K-12 level typically note benefits to the workforce, economy, and national security. In this complementary perspective, we discuss why learning AI is beneficial for motivating students and promoting creative thinking, and how to develop a module-based approach that optimizes learning outcomes. We hope to excite and engage more members of the education community to join the effort to advance K-12 AI education in the USA and worldwide.
翻訳日:2023-02-14 08:50:14 公開日:2023-01-20
# 命題krom論理プログラムの最小モデルと一様等価性の代数的特徴付け

Algebraic characterizations of least model and uniform equivalence of propositional Krom logic programs ( http://arxiv.org/abs/2302.04664v1 )

ライセンス: Link先を確認
Christian Anti\'c(参考訳) 本研究は、最小モデル意味論に関する同値性の代数的特徴付けと命題krom論理プログラムの一様同値性を提供する。

This research note provides algebraic characterizations of equivalence with respect to the least model semantics, and of uniform equivalence of propositional Krom logic programs.
翻訳日:2023-02-12 13:06:20 公開日:2023-01-20
# 一般化ウッズ・サクソンポテンシャルを持つフラクショナルシュロディンガー方程式

The Fractional Schrodinger Equation with the Generalized Woods-Saxon Potential ( http://arxiv.org/abs/2302.03060v1 )

ライセンス: Link先を確認
M. Abu-Shady and Etido P. Inyang(参考訳) 一般化されたウッズ・サクソンポテンシャル [phys. rev. c 72, 027001 (2005)] の有界状態エネルギー固有値と対応する固有関数を一般化分数微分と分数的ニキフォロフ-ウバロフ(nu)法を用いて分数形式に拡張する。 現在のポテンシャルに対するシュロディンガー方程式の有界状態の解析解は、分数的ヤコビ多項式の項で得られる。 古典的な結果はElfa=Beta=1における結果の特別な場合であることが示されており,分子化学や核物理学において重要な役割を担っている。

The bound state energy eigenvalues and the corresponding eigenfunctions of the generalized Woods-Saxon potential reported in [Phys. Rev. C 72, 027001 (2005)] is extended to the fractional forms using the generalized fractional derivative and the fractional Nikiforov-Uvarov (NU) technique. Analytical solutions of bound states of the Schrodinger equation for the present potential are obtained in the terms of fractional Jacobi polynomials. It is demonstrated that the classical results are a special case of the present results at Elfa=Beta=1 Therefore, the present results play important role in molecular chemistry and nuclear physics.
翻訳日:2023-02-12 13:05:11 公開日:2023-01-20
# 長距離ホッピングと単粒子移動エッジの存在下での多体局在

Incommensurate many-body localization in the presence of long-range hopping and single-particle mobility edge ( http://arxiv.org/abs/2205.15339v2 )

ライセンス: Link先を確認
Ke Huang, DinhDuy Vu, Xiao Li, and S. Das Sarma(参考訳) 準周期的$t_1$-$t_2$モデルにおける多体局在 (MBL) について検討し, 単一粒子移動エッジを導入したnext-nearest-neighbor (NNN) ホッピング$t_2$の役割に着目した。 計算された位相図は、短距離相互作用の強さによって3つの異なる状態に分けることができる。 弱い相互作用(U\ll t_1$)の場合、このモデルは常に非熱的である。 中間相互作用(U\sim t_1$)の場合、このモデルにおける熱-MBL相転移は、既存の実験観測と一致するオーブリー・アンドレ(Aubry-Andre)モデルと質的に同じである。 強い相互作用の$(U\gg t_1)$に対して、NNNホッピングは、AAモデルに存在するヒルベルト空間の断片化を分解するため、質的に新しい物理を生成する。 したがって、NNNホッピングは相互作用が中間的であるが強い相互作用には関係しない。

We study many-body localization (MBL) in the quasiperiodic $t_1$-$t_2$ model, focusing on the role of next-nearest-neighbor (NNN) hopping $t_2$, which introduces a single-particle mobility edge. The calculated phase diagram can be divided into three distinct regimes, depending on the strength of the short-range interaction $U$. For weak interactions ($U\ll t_1$), this model is always nonthermal. For intermediate interactions ($U\sim t_1$), the thermal-MBL phase transition in this model is qualitatively the same as that of the Aubry-Andre (AA) model, which is consistent with existing experimental observations. For strong interactions $(U\gg t_1)$, the NNN hopping produces qualitatively new physics because it breaks down the Hilbert space fragmentation present in the AA model. The NNN hopping is thus irrelevant when the interaction is intermediate but relevant for strong interactions.
翻訳日:2023-02-11 06:36:36 公開日:2023-01-20
# 遠隔制御型絡み合い発生

Remotely Controlled Entanglement Generation ( http://arxiv.org/abs/2206.10686v2 )

ライセンス: Link先を確認
Ferran Riera-S\`abat, Pavel Sekatski and Wolfgang D\"ur(参考訳) 量子制御のない複数の量子ビットのシステムを考える。 システムキュービットへの常にオンの遠隔依存的相互作用を介して、同じ大きさの(局所的に)制御された補助システムを追加することにより、制御された方法で異なるサブシステム間の絡み合いを仲介できることを示す。 制御系の内部状態を変更するだけで、選択したキュービットに選択的に結合でき、最終的にシステム内で異なる種類の絡み合いを生成することができる。 これは量子制御と量子ゲートの代替手段を提供し、自由に相互作用を切り替える能力に依存しず、全ての絡み合いパターンが作成できる局所的に制御された量子スイッチとして機能する。 このようなアプローチは、位置ゆらぎが増大するエラー耐性も提供することを示した。

We consider a system of multiple qubits without any quantum control. We show that one can mediate entanglement between different subsystems in a controlled way by adding a (locally) controlled auxiliary system of the same size that couples via an always-on, distant dependent interaction to the system qubits. Solely by changing the internal state of the control system, one can selectively couple it to selected qubits, and ultimately generate different kinds of entanglement within the system. This provides an alternative way for quantum control and quantum gates that does not rely on the ability to switch interactions on and off at will, and can serve as a locally controlled quantum switch where all entanglement patterns can be created. We demonstrate that such an approach also offers an increased error tolerance w.r.t. position fluctuations.
翻訳日:2023-02-08 12:33:41 公開日:2023-01-20
# 読み出しデータを捨てることなくジョイント弱測定に基づく高精度気象学の品質解析

Quality analysis for precision metrology based on joint weak measurements without discarding readout data ( http://arxiv.org/abs/2207.03668v4 )

ライセンス: Link先を確認
Lupei Qin, Luting Xu and Xin-Qi Li(参考訳) 本稿では,弱値増幅法(weak-value-amplification, wva)手法と密接に比較して,jwm(joint weak measurement)のメトロロジー品質に関する理論的解析を行う。 我々は,jwm法で用いられる差分確率関数は,不確かさ分散とフィッシャー情報(fi)の計算に利用できないことを指摘した。 距離論的精度を達成するために、差分結合確率変数を用いて問題を再構成し、全ての計算を適切に定義する。 我々は、一般に、jwm スキームのメトロロジー的精度は、すべての読み出しが破棄されることなく収集されるにもかかわらず、合計 fi で示される値に到達できないことを明らかにした。 また,技術ノイズの影響を解析した結果,従来の測定値よりも高い精度で測定可能な減音法では,技術的ノイズを除去できないことが明らかとなった。

We present a theoretical analysis for the metrology quality of joint weak measurements (JWM), in close comparison with the weak-value-amplification (WVA) technique. We point out that the difference probability function employed in the JWM scheme cannot be used to calculate the uncertainty variance and Fisher information (FI). In order to carry out the metrological precision, we reformulate the problem in terms of difference-combined stochastic variables, which makes all calculations well defined. We reveal that, in general, the metrological precision of the JWM scheme cannot reach that indicated by the total FI, despite that all the readouts are collected without discarding. We also analyze the effect of technical noise, showing that the technical noise cannot be removed by the subtracting procedure, which yet can be utilized to outperform the conventional measurement, when considering the imaginary WV measurement.
翻訳日:2023-02-06 04:48:05 公開日:2023-01-20
# アンテナチューニングのためのグラフqネットワークを用いたマルチエージェント強化学習

Multi-agent Reinforcement Learning with Graph Q-Networks for Antenna Tuning ( http://arxiv.org/abs/2302.01199v1 )

ライセンス: Link先を確認
Maxime Bouton, Jaeseong Jeong, Jose Outes, Adriano Mendo, Alexandros Nikou(参考訳) 将来のモバイルネットワークには、複雑さとパラメータの増大を伴うアンテナがますます多く含まれると予想されている。 これらのパラメータの最適化は、ネットワークのパフォーマンスを確保するために必要である。 モバイルネットワークの規模は、手動介入や手動戦略を使ってアンテナパラメータの最適化を困難にしている。 強化学習はこの課題に対処するための有望なテクニックだが、既存の手法ではローカル最適化を使って大規模なネットワーク展開にスケールすることが多い。 モバイルネットワーク構成をグローバルに最適化するマルチエージェント強化学習アルゴリズムを提案する。 値分解手法を用いることで,各セル間のネットワーク性能のアドホックな分解に頼るのではなく,大域的な報酬関数からアルゴリズムを訓練することができる。 このアルゴリズムはグラフニューラルネットワークアーキテクチャを使用し、異なるネットワークトポロジに一般化し、協調行動を学ぶ。 本研究では,シミュレーション環境におけるアンテナ傾き調整問題とジョイント傾き・電力制御問題におけるアルゴリズムの性能を実証的に示す。

Future generations of mobile networks are expected to contain more and more antennas with growing complexity and more parameters. Optimizing these parameters is necessary for ensuring the good performance of the network. The scale of mobile networks makes it challenging to optimize antenna parameters using manual intervention or hand-engineered strategies. Reinforcement learning is a promising technique to address this challenge but existing methods often use local optimizations to scale to large network deployments. We propose a new multi-agent reinforcement learning algorithm to optimize mobile network configurations globally. By using a value decomposition approach, our algorithm can be trained from a global reward function instead of relying on an ad-hoc decomposition of the network performance across the different cells. The algorithm uses a graph neural network architecture which generalizes to different network topologies and learns coordination behaviors. We empirically demonstrate the performance of the algorithm on an antenna tilt tuning problem and a joint tilt and power control problem in a simulated environment.
翻訳日:2023-02-05 04:20:37 公開日:2023-01-20
# 強化学習に基づく偏微分方程式の推定

Reinforcement learning-based estimation for partial differential equations ( http://arxiv.org/abs/2302.01189v1 )

ライセンス: Link先を確認
Saviz Mowlavi, Mouhacine Benosman, Saleh Nabi(参考訳) 流体流のような非線形偏微分方程式が支配する系では、カルマンフィルタのような状態推定器の設計は、元の高次元ダイナミクスを計算可能な低次元空間に投影する還元次モデル(rom)に依存している。 しかし、ROMは大きなエラーを起こしやすいため、推定器の性能に悪影響を及ぼす。 本稿では,強化学習によって訓練された非線形政策により,測定を行う補正項が与えられるromベース推定器rl-roeを提案する。 ポリシーの非線形性により、RL-ROEはROMの誤りを効率よく補うことができるが、力学の完全な知識を生かしたままである。 バーガース方程式とナビエ・ストークス方程式を含む例を用いて、訓練されたRL-ROEは、非常に少ないセンサーの限界において、同じROMを用いて設計されたカルマンフィルタよりも優れていることを示す。 さらに、各物理パラメータ値に対応する基準軌跡の高精度な高次元状態推定を、後者の直接的知識なしで得られる。

In systems governed by nonlinear partial differential equations such as fluid flows, the design of state estimators such as Kalman filters relies on a reduced-order model (ROM) that projects the original high-dimensional dynamics onto a computationally tractable low-dimensional space. However, ROMs are prone to large errors, which negatively affects the performance of the estimator. Here, we introduce the reinforcement learning reduced-order estimator (RL-ROE), a ROM-based estimator in which the correction term that takes in the measurements is given by a nonlinear policy trained through reinforcement learning. The nonlinearity of the policy enables the RL-ROE to compensate efficiently for errors of the ROM, while still taking advantage of the imperfect knowledge of the dynamics. Using examples involving the Burgers and Navier-Stokes equations, we show that in the limit of very few sensors, the trained RL-ROE outperforms a Kalman filter designed using the same ROM. Moreover, it yields accurate high-dimensional state estimates for reference trajectories corresponding to various physical parameter values, without direct knowledge of the latter.
翻訳日:2023-02-05 04:20:23 公開日:2023-01-20
# 光パラメトリック増幅によるウィグナー機能トモグラフィ

Wigner Function Tomography via Optical Parametric Amplification ( http://arxiv.org/abs/2207.10030v3 )

ライセンス: Link先を確認
Mahmoud Kalash and Maria V. Chekhova(参考訳) Wigner関数トモグラフィーは,検出損失やノイズに耐性があることを示す。 直接検出により測定した光子数分布から二次分布を再構成するために光パラメトリック増幅を用いる。 この手法をマルチモード圧縮真空からフィルタした単一モードに適用することにより、90 %以上の検出損失にもかかわらず、$-7.5$$\pm$ 0.4 dB、$0.91^{+0.09}_{-0.08}$のスクイーズを示すウィグナー関数を得た。 この方法は、損失を受けやすい明るい非ガウス状態と同様に暗くも適用することができる。 また,この手法は,空間的および時間的多モード量子状態のトモグラフィーに適しており,検出損失耐性を有するため,複数のモードを同時にトモグラフィーできる。 これにより、光学量子情報の強力なツールとなる。

We demonstrate a method of Wigner function tomography that is tolerant to detection loss and noise. The method employs optical parametric amplification to reconstruct quadrature distributions from photon-number distributions measured via direct detection. By applying the method to a single mode filtered from multimode squeezed vacuum, we obtained a Wigner function showing a squeezing of $-7.5$ $\pm$ 0.4 dB and a purity of $0.91^{+0.09}_{-0.08}$ despite more than $90\%$ detection losses. The method can be applied to faint as well as bright non-Gaussian states, which are very susceptible to loss. In addition, our scheme is suitable for the tomography of spatially and temporally multimode quantum states, and being detection loss-tolerant, the method allows for the simultaneous tomography of multiple modes. This makes it a powerful tool for optical quantum information.
翻訳日:2023-02-04 07:58:53 公開日:2023-01-20
# 振幅分布に関する量子アルゴリズム

Few Quantum Algorithms on Amplitude Distribution ( http://arxiv.org/abs/2208.00162v2 )

ライセンス: Link先を確認
Debajyoti Bera and Tharrmashastha Sapv(参考訳) 振幅フィルタリングは、振幅が特定のしきい値より大きい重ね合わせにおける基底状態の同定に関係しており、確率フィルタリングは確率に対して類似して定義される。 qubitsの不足を考えると、この取り組みの焦点はログスペースアルゴリズムを設計することである。 どちらのアルゴリズムも、重ね合わせで各状態の振幅(あるいは後者の問題の確率)を推定し、各推定値と成功時のフラグキュービットを設定するしきい値を比較し、最後にフラグが設定された状態の振幅増幅を行うという類似のパターンに従う。 3つのサブルーチンを設計することで,ごくわずかなキュービットで各ステップを実装する方法を示す。 第1のアルゴリズムは,「よい状態」演算子が誤り確率が小さい場合であっても振幅増幅を行う。ここでは,既知のアルゴリズムの空間複雑性を改善する。第2のアルゴリズムは,振幅ではなく実際に確率を推定する「振幅推定」とほぼ同じ複雑さで「真の振幅推定」を行う。 第3のアルゴリズムは並列(重畳)で振幅推定を行うためであり、各推定分岐が異なるオラクルを含む場合、その計算は困難である。 その報奨として,上記のフィルタリング問題に対するアルゴリズムは,ブール関数の非線形性推定や$k$-distinctnessといった問題に対する空間境界付きクエリの複雑性の上限を直接改善した。

Amplitude filtering is concerned with identifying basis-states in a superposition whose amplitudes are greater than a specified threshold; probability filtering is defined analogously for probabilities. Given the scarcity of qubits, the focus of this work is to design log-space algorithms for them. Both algorithms follow a similar pattern of estimating the amplitude (or, probability for the latter problem) of each state, in superposition, then comparing each estimate against the threshold for setting up a flag qubit upon success, finally followed by amplitude amplification of states in which the flag is set. We show how to implement each step using very few qubits by designing three subroutines. Our first algorithm performs amplitude amplification even when the "good state'' operator has a small probability of being incorrect -- here we improve upon the space complexity of the previously known algorithms. Our second algorithm performs "true amplitude estimation'' in roughly the same complexity as that of "amplitude estimation'', which actually estimates a probability instead of an amplitude. Our third algorithm is for performing amplitude estimation in parallel (superposition) which is difficult when each estimation branch involves different oracles. As an immediate reward, we observed that the above algorithms for the filtering problems directly improved the upper bounds on the space-bounded query complexity of problems such as non-linearity estimation of Boolean functions and $k$-distinctness.
翻訳日:2023-02-02 23:54:38 公開日:2023-01-20
# 量子崩壊モデル:多体局在から傷を伴うカオスへ

A Quantum Breakdown Model: from Many-body Localization to Chaos with Scars ( http://arxiv.org/abs/2208.10509v2 )

ライセンス: Link先を確認
Biao Lian(参考訳) 誘電体の電気分解過程をシミュレーションしたフェルミオンの量子モデルを提案する。 このモデルは、サイトごとに$n$のフェルミオンモードを持つ$m$サイトから成り、保存料金は$q$である。 それは、障害のあるオンサイト化学ポテンシャル$\mu$と、各フェルミオンが1つのサイトを前進する際にさらに2つのフェルミオンを励起するように制限する強度$J$の相互作用を持つ。 障害を持つ$N=3$モデルを示す:$W=0$はヒルベルト空間の断片化を示し、ごく少数のクリロフ部分空間を除いて、完全に解決可能である。 解析解は、$N=3$モデルが多体局所化(MBL)を$M\rightarrow\infty$として示すことを示している。 edは、mblから量子カオスへのクロスオーバーは、わずか$w$で、$m/n$は$$で減少し、永続的なmblは$w$である、と提案している。 W=0$では、正確に解ける多体スカーフラットバンドが多くの電荷$Q$セクターに存在し、熱力学の極限ではゼロではない。 さらに、粒子真空に付加されたフェルミオンの時間発展を計算し、w\ll j$ ならば$\mu/j<1/2$ (\mu/j>1/2$) 、$w\gg j$ では分解(二電)相を示す。

We propose a quantum model of fermions simulating the electrical breakdown process of dielectrics. The model consists of $M$ sites with $N$ fermion modes per site, and has a conserved charge $Q$. It has an on-site chemical potential $\mu$ with disorder $W$, and an interaction of strength $J$ restricting each fermion to excite two more fermions when moving forward by one site. We show the $N=3$ model with disorder $W=0$ show a Hilbert space fragmentation and is exactly solvable except for very few Krylov subspaces. The analytical solution shows that the $N=3$ model exhibits many-body localization (MBL) as $M\rightarrow\infty$, which is stable against $W>0$ as our exact diagonalization (ED) shows. At $N>3$, our ED suggests a MBL to quantum chaos crossover at small $W$ as $M/N$ decreases across $1$, and persistent MBL at large $W$. At $W=0$, an exactly solvable many-body scar flat band exists in many charge $Q$ sectors, which has a nonzero measure in the thermodynamic limit. We further calculate the time evolution of a fermion added to the particle vacuum, which shows a breakdown (dielectric) phase when $\mu/J<1/2$ ($\mu/J>1/2$) if $W\ll J$, and no breakdown if $W\gg J$.
翻訳日:2023-01-30 04:53:20 公開日:2023-01-20
# 2つのスカラー光子の存在下での原子ミラー系の仮想遷移

Virtual transitions in an atom-mirror system in the presence of two scalar photons ( http://arxiv.org/abs/2208.12021v2 )

ライセンス: Link先を確認
Ashmita Das, Soham Sen and Sunandan Gangopadhyay(参考訳) 本研究では,2つのスカラー光子の同時放出による原子ミラー系の仮想遷移について検討する。 単一光子放出のための文献(phys)。 Rev. Lett. 121 (2018) 071301) は、2つの個々の系の遷移確率(例えば、鏡とその逆に対して加速する原子など)が、原子と磁場の周波数の交換の下で等価であることが示される。 このような励起過程の観察的利点に対して、検出可能な確率(p \sim 10^{-2}$)も上記の文献で報告されている。 本論文では、双対光子の放出は、上記の文献で報告されている遷移確率の等価性を破壊すると結論づけている。

We examine the virtual transition of an atom-mirror system with the simultaneous emission of two scalar photons, where the atom and the mirror admit a relative acceleration between them. For the single photon emission, literature (Phys. Rev. Lett. 121 (2018) 071301) dictates that the transition probabilities of two individual systems, such as an atom accelerating with respect to the mirror and its reverse, turn out to be equivalent under the exchange of the frequencies of atom and the field. Addressing the observational merit of such excitation process, a detectable probability ($P \sim 10^{-2}$) is also reported in the above literature. In the present manuscript our finding dictates that the simultaneous emission of dual photon instead of one, destroys the equivalence between the transition probabilities as reported in the above literature.
翻訳日:2023-01-29 21:24:48 公開日:2023-01-20
# サブクアドラティックパワー非線形性を持つ非線形シュル=オディンガーモデルにおける動的カオス

Dynamical chaos in nonlinear Schr\"odinger models with subquadratic power nonlinearity ( http://arxiv.org/abs/2301.10322v1 )

ライセンス: Link先を確認
Alexander V. Milovanov, Alexander Iomin(参考訳) ランダムポテンシャルと二次パワー非線形性を持つ非線形シュリンガー格子のクラスを扱うための解析的手法を考案する。 ダイオファンチン方程式とケイリーグラフへの写像手順を用いて,多項定理に基づく反復アルゴリズムを提案する。 このアルゴリズムに基づき、摂動理論のアプローチを越えて非線形場の漸近的拡散に関するいくつかの厳しい結果を得ることができた。 特に, 拡散過程は, 有限クラスター上の長期トラップ現象とL'evy飛行と整合した格子に沿って長距離ジャンプの両方を含む複雑な顕微鏡構造を有することを示す。 飛行の起源は系内の縮退状態の発生と関連しており、後者はサブクアドラモデルの特徴であると考えられている。 二次パワー非線形性の極限についても論じられ、非局在境界(英語版)(delocalization border)となり、上述の場は確率過程において長距離に広がり、下記のアンダーソンは線形場と同様に局所化される。

We devise an analytical method to deal with a class of nonlinear Schr\"odinger lattices with random potential and subquadratic power nonlinearity. An iteration algorithm is proposed based on multinomial theorem, using Diophantine equations and a mapping procedure onto a Cayley graph. Based on this algorithm, we were able to obtain several hard results pertaining to asymptotic spreading of the nonlinear field beyond a perturbation theory approach. In particular, we show that the spreading process is subdiffusive and has complex microscopic organization involving both long-time trapping phenomena on finite clusters and long-distance jumps along the lattice consistent with L\'evy flights. The origin of the flights is associated with the occurrence of degenerate states in the system; the latter are found to be a characteristic of the subquadratic model. The limit of quadratic power nonlinearity is also discussed and shown to result in a delocalization border, above which the field can spread to long distances on a stochastic process and below which it is Anderson localized similarly to a linear field.
翻訳日:2023-01-29 13:22:27 公開日:2023-01-20
# 一様磁場中における電子放射の角運動量

The angular momentum of electron radiation in a uniform magnetic field ( http://arxiv.org/abs/2301.10320v1 )

ライセンス: Link先を確認
Vladimir Epp and Ulyana Guselnikova(参考訳) 一様磁場中における相対論的電子の渦放射を量子電磁力学によって理論的に研究する。 特定の角運動量を持つ光子の放出確率の正確な表現が見つかる。 この確率の古典漸近値 $\hbar\to 0$ は、対称性のエネルギー-運動量テンソルを用いて古典法によって計算された角運動量密度と一致しない。 角運動量のフラックスは放射方向と一致するが、どちらの場合も同じである。 標準(対称化されていない)エネルギー-運動量テンソルを用いて放射場の角運動量フラックスを発見し、この方法で得られるフラックスが光子放出の確率の古典的限界と一致することを示した。

We study theoretically by means of quantum electrodynamics the vortex radiation of a relativistic electron in a uniform magnetic field. The exact expressions for the probability of emission of a photon with a certain angular momentum are found. The classical asymptotics $\hbar\to 0$ of this probability does not match the angular momentum flux density calculated by the classical method using the symmetrized energy-momentum tensor. Although the flux of angular momentum integrated over the radiation directions is the same in both cases. We found the angular momentum flux of the radiation field using the canonical (not symmetrized) energy-momentum tensor and showed that the flux obtained in this way coincide with the classical limit for the probability of photon emission.
翻訳日:2023-01-29 13:22:02 公開日:2023-01-20
# 金融ニュース記事における新興トレンドの文脈化

Contextualizing Emerging Trends in Financial News Articles ( http://arxiv.org/abs/2301.11318v1 )

ライセンス: Link先を確認
Nhu Khoa Nguyen, Thierry Delahaut, Emanuela Boros, Antoine Doucet and Ga\"el Lejeune(参考訳) 世界的健康危機により、世界中で多くの変化が起きている中で、ニュースの新興トレンドを特定し、探究することが、これまで以上に重要になっている。 しかし、最近の研究の大部分はソーシャルメディアのトレンドの検出に重点を置いており、コンテンツのエンゲージメントと拡散率を測定するのに使える社会的特徴(例えば、Twitter上でのリツイート)の恩恵を受けている。 しかし、短いソーシャルメディアの投稿とは異なり、形式的なテキストデータには、より長く、制限の少ない書き込み形式があり、それゆえより難しい。 本稿では、新型コロナウイルス(covid-19)パンデミック(2019年7月~2020年7月)の開始前後に収集されたmicrosoftに関する金融ニュース記事における、新たなトレンド検出に関する研究に焦点を当てる。 このデータセットをアクセス可能とし、トピックモデリングと項頻度に基づくキーワードのペア間の類似性のダイナミクスを探索するための強力なベースライン(Contextual Leap2Trend)を提案する。 最後に、私たちは、Microsoftに対するパンデミックの影響について、ゴールドスタンダード(Google Trends)と、注目すべき実世界のシナリオを評価します。

Identifying and exploring emerging trends in the news is becoming more essential than ever with many changes occurring worldwide due to the global health crises. However, most of the recent research has focused mainly on detecting trends in social media, thus, benefiting from social features (e.g. likes and retweets on Twitter) which helped the task as they can be used to measure the engagement and diffusion rate of content. Yet, formal text data, unlike short social media posts, comes with a longer, less restricted writing format, and thus, more challenging. In this paper, we focus our study on emerging trends detection in financial news articles about Microsoft, collected before and during the start of the COVID-19 pandemic (July 2019 to July 2020). We make the dataset accessible and propose a strong baseline (Contextual Leap2Trend) for exploring the dynamics of similarities between pairs of keywords based on topic modelling and term frequency. Finally, we evaluate against a gold standard (Google Trends) and present noteworthy real-world scenarios regarding the influence of the pandemic on Microsoft.
翻訳日:2023-01-29 13:13:39 公開日:2023-01-20
# flex-net:フレキシブルバイプレックスネットワークにおけるリソース管理のためのグラフニューラルネットワークアプローチ

Flex-Net: A Graph Neural Network Approach to Resource Management in Flexible Duplex Networks ( http://arxiv.org/abs/2301.11166v1 )

ライセンス: Link先を確認
Tharaka Perera, Saman Atapattu, Yuting Fang, Prathapasinghe Dharmawansa, and Jamie Evans(参考訳) フレキシブル・デュプレックス・ネットワークにより、ユーザーは静的時間スケジューリングなしでアップリンクおよびダウンリンクチャネルを動的に使用でき、ネットワークリソースを効率的に活用することができる。 本研究では,フレキシブル・デュプレックス・ネットワークの和率最大化について検討する。 特に,通信リンクがペアで固定されたネットワークを考える。 対応する組合せ最適化は閉形式解を持たない非決定性多項式(np)ハードである。 この点で、既存のヒューリスティックスは高い計算複雑性を伴い、大規模ネットワークにおけるスケーラビリティの問題を引き起こす。 NPハード無線リソース管理問題におけるグラフニューラルネットワーク(GNN)の最近の成功により、通信方向と送信電力を協調的に最適化する新しいGNNアーキテクチャ、Flex-Netを提案する。 提案されたgnnは、最も一般的に使用される技術に比べて計算の複雑さが低く、最適に近い性能をもたらす。 さらに, 数値計算の結果から, GNNの複雑さ, 拡張性, 一般化能力の面での利点が明らかになった。

Flexible duplex networks allow users to dynamically employ uplink and downlink channels without static time scheduling, thereby utilizing the network resources efficiently. This work investigates the sum-rate maximization of flexible duplex networks. In particular, we consider a network with pairwise-fixed communication links. Corresponding combinatorial optimization is a non-deterministic polynomial (NP)-hard without a closed-form solution. In this respect, the existing heuristics entail high computational complexity, raising a scalability issue in large networks. Motivated by the recent success of Graph Neural Networks (GNNs) in solving NP-hard wireless resource management problems, we propose a novel GNN architecture, named Flex-Net, to jointly optimize the communication direction and transmission power. The proposed GNN produces near-optimal performance meanwhile maintaining a low computational complexity compared to the most commonly used techniques. Furthermore, our numerical results shed light on the advantages of using GNNs in terms of sample complexity, scalability, and generalization capability.
翻訳日:2023-01-29 13:12:33 公開日:2023-01-20
# ファンデルワールスポテンシャルの時間外秩序調整器

Out-of-Time-Order-Correlator for van der Waals potential ( http://arxiv.org/abs/2301.10323v1 )

ライセンス: Link先を確認
Hui Li, Eli Halperin, Reuben R. W. Wang, John L. Bohn(参考訳) 量子-古典対応はしばしば、時間外相関器(OTOC)と呼ばれる量によって動的に定量化される。 カオス系では、OTOCはラプノフ指数の特徴として早期に指数関数的に成長することが期待されているが、可積分系においても指数関数的に成長することがある。 そこで本研究では,一自由度における現実的な二原子分子ポテンシャルのOTOCについて検討し,分子の解離エネルギー付近でOTOCが指数関数的に成長できることを見出した。 さらに、このダイナミクスはポテンシャルの外側の古典的転回点における原子の古典的ダイナミクスと結びついている。 これらの結果は、より複雑な分子の動的カオスを導いて解釈するのに役立ちます。

The quantum-to-classical correspondence is often quantified in dynamics by a quantity referred to as the out-of-time-order correlator (OTOC). In chaotic systems, the OTOC is expected to grow exponentially at early time, characteristic of a Lyapunov exponent, however, exponential growth can also occur for integrable systems. Here we investigate the OTOC for realistic diatomic molecular potentials in one degree of freedom, finding that the OTOC can grow exponentially near the dissociation energy of the moelcule. Further, this dynamics is tied to the classical dynamics of the atoms at the outer classical turning point of the potential. These results should serve to guide and interpret dynamical chaos in more complex molecules.
翻訳日:2023-01-29 13:11:31 公開日:2023-01-20
# 非マルコフ環境における古典的運転支援量子同期

Classical-driving-assisted quantum synchronization in non-Markovian environments ( http://arxiv.org/abs/2209.05960v3 )

ライセンス: Link先を確認
Xing Xiao, Tian-Xiang Lu, Wo-Jun Zhong and Yan-Ling Li(参考訳) 構造化環境に結合した2段階駆動系の量子位相同期について検討し,古典的駆動場により量子位相同期が向上できることを実証する。 位相選好を特徴付けるためにフシミ$Q$関数を使用し、位相図において相内および反相ロック現象を求める。 注目すべきは、古典的な駆動により、マルコフ政権においてTLSが安定な反位相ロックに到達できることである。 しかし,古典的駆動と非マルコフ効果の相乗作用は位相内ロックを著しく向上させることがわかった。 S$関数とその最大値を導入して同期の強さを定量化し、同期領域をスケッチすることにより、同期のパラメータ領域における中空アーノルド舌の典型的なシグネチャを観察する。 空洞化したアーノルド語では、同期領域は舌の内外に存在し、非同期領域は境界線上にのみ存在する。 また, 擬似モード理論を用いて, 上記の結果を直感的に解釈する。

We study the quantum phase synchronization of a driven two-level system (TLS) coupled to a structured environment and demonstrate that quantum synchronization can be enhanced by the classical driving field. We use the Husimi $Q$-function to characterize the phase preference and find the in-phase and anti-phase locking phenomenon in the phase diagram. Remarkably, we show that the classical driving enables a TLS to reach stable anti-phase locking in the Markovian regime. However, we find that the synergistic action of classical driving and non-Markovian effects significantly enhances the in-phase locking. By introducing the $S$-function and its maximal value to quantify the strength of synchronization and sketch the synchronization regions, we observe the typical signatures of the hollowed Arnold tongue in the parameter regions of synchronization. In the hollowed Arnold tongue, the synchronization regions exist both inside and outside the tongue while unsynchronized regions only lie on the boundary line. We also provide an intuitive interpretation of the above results by using the quasimode theory.
翻訳日:2023-01-26 19:26:14 公開日:2023-01-20
# メゾスコピックヘテロ接合における非エルミタンスキン効果による非相反電荷とスピン輸送

Nonreciprocal Charge and Spin Transport Induced by Non-Hermitian Skin Effect in Mesoscopic Heterojunctions ( http://arxiv.org/abs/2209.10164v2 )

ライセンス: Link先を確認
H. Geng, J. Y. Wei, M. H. Zou, L. Sheng, Wei Chen, and D. Y. Xing(参考訳) 様々な物理的システムにおける非エルミタン皮膚効果(NHSE)の追求は、大きな研究の関心を集めている。 非電子系の最近の進歩と比較すると、凝縮物質物理学におけるNHSEの実装はいまだ解明されていない。 ここでは, NHSEは, 2チャネルの電子が互いに向かって移動するメソスコピックヘテロ接合(システム+貯水池)において, 貯水池の電子と非対称結合を持つように設計できることを示す。 これにより、系の電子は前進し、反対方向の電子は不等寿命を持ち、したがって点ギャップスペクトルトポロジーを生じさせる。 したがって、電子固有状態は開放境界条件の下でNHSEを示し、一般化されたブリルアンゾーンの記述と一致する。 このような貯留層工学のnhseは、標準輸送測定によって観測できる非逆電荷電流として自明に現れている。 さらに、このシナリオを非相互スピン輸送によって探究できるスピン解法NHSEに一般化する。 我々の研究は、電子メソスコピックシステムにおけるNHSEの実装と検出のための新しい研究の道を開き、興味深いデバイス応用につながるだろう。

The pursuit of the non-Hermitian skin effect (NHSE) in various physical systems is of great research interest. Compared with recent progress in non-electronic systems, the implementation of the NHSE in condensed matter physics remains elusive. Here, we show that the NHSE can be engineered in the mesoscopic heterojunctions (system plus reservoir) in which electrons in two channels of the system moving towards each other have asymmetric coupling to those of the reservoir. This makes electrons in the system moving forward and in the opposite direction have unequal lifetimes, and so gives rise to a point-gap spectral topology. Accordingly, the electron eigenstates exhibit NHSE under the open boundary condition, consistent with the description of the generalized Brillouin zone. Such a reservoir-engineered NHSE visibly manifests itself as the nonreciprocal charge current that can be probed by the standard transport measurements. Further, we generalize the scenario to the spin-resolved NHSE, which can be probed by the nonreciprocal spin transport. Our work opens a new research avenue for implementing and detecting the NHSE in electronic mesoscopic systems, which will lead to interesting device applications.
翻訳日:2023-01-25 20:55:13 公開日:2023-01-20
# Aharonov-Bohm効果を用いた新しい電磁レンズの原理

A new electromagnetic lensing principle using the Aharonov-Bohm effect ( http://arxiv.org/abs/2301.09980v1 )

ライセンス: Link先を確認
Makoto Tokoro Schreiber, Cathal Cassidy, Menour Saidani, Matthias Wolf(参考訳) 従来の電子顕微鏡で用いられる丸い電磁レンズは、凸焦点レンズとしてのみ機能し、常に正の球面収差係数を持つという基本的な制限がある。 これらの制限は透過電子顕微鏡の光学設計可能性を大幅に制限した。 発散レンズがないため、ビームクロスオーバーが形成され、高角度の強い光線をフィルターするために開口部が使用される必要がある。 既存の電磁レンズの限界は磁場に焦点を合わせる物理学の基礎となっている。 ここでは、Aharonov-Bohm効果を介して古典的な電磁場のない領域において、磁気ベクトルポテンシャルを用いた新しい電磁レンズの概念を理論的および実験的に実証する。 この磁気ベクトル電位レンズは、その焦点長と反対極性の球面収差係数で凸あるいは凹面に調整可能な電磁レンズ化を可能にする。 全体的に、この新しいレンズは従来の電磁および静電レンズの利点を結合し、電子顕微鏡やその他の荷電粒子系のための新しい光学設計の可能性を開く。 より一般に、これらの結果は、単純なフラックス線よりも複雑な位相を考慮すれば、荷電粒子波面が単純なステップシフトを超えてさらに形成できることを示している。

Round electromagnetic lenses used in conventional electron microscopes have fundamental limitations in that they can only act as convex focusing lenses and always have positive spherical aberration coefficients. These limitations severely restrict the optical design possibilities for transmission electron microscopes. Due to the lack of divergent lenses, beam crossovers must be formed and apertures used to filter out the strongly aberrated high-angle rays. The limitations of existing electromagnetic lenses are fundamental to the physics of focusing with magnetic fields. Here, we demonstrate both theoretically and experimentally a new electromagnetic lensing concept using the magnetic vector potential -- in a region free of classical electromagnetic fields, via the Aharonov-Bohm effect. This magnetic vector potential lens allows for electromagnetic lensing which can be tuned to be convex or concave with a spherical aberration coefficient of opposite polarity to its focal length. Overall, this new lens combines the advantages of traditional electromagnetic and electrostatic lenses and opens the possibility for new optical designs for electron microscopes and other charged-particle systems. More generally, these results demonstrate that the Aharonov-Bohm effect can further shape charged particle wavefronts beyond simple step-shifts if more complicated topologies than a simple flux line are considered.
翻訳日:2023-01-25 13:45:56 公開日:2023-01-20
# 解釈可能なTsetlinマシンを用いた早期心室収縮同定

Interpretable Tsetlin Machine-based Premature Ventricular Contraction Identification ( http://arxiv.org/abs/2301.10181v1 )

ライセンス: Link先を確認
Jinbao Zhang, Xuan Zhang, Lei Jiao, Ole-Christoffer Granmo, Yongjun Qian, Fan Pan(参考訳) ニューラルネットワークに基づくモデルでは、心電図の自動解析に広く用いられている。 しかし、このようなブラックボックスモデルは、信頼性と解釈性が不可欠である生理的シグナルを分析するには不十分である。 実際、ecg分析を透明にする方法はまだ未解決の問題です。 本研究では,長期心電図信号の解析による早期心室収縮(PVC)同定のためのTsetlin Machine (TM) アーキテクチャを開発した。 アーキテクチャは論理とルールで直接パターンを記述することで透過的です。 提案手法の精度を検証するため,TM性能と畳み込みニューラルネットワーク(CNN)の性能を比較した。 数値計算の結果,TMはMIT-BIHデータベース上でCNNに匹敵する性能を示した。 解釈可能性を検証するために、TMによってPVCがパターンの確認や無効化を防いでいることを示す説明図を提供する。 これらは医学的知識と互換性があり、医師が容易に理解し、検証することができると論じている。 そこで本研究は, 臨床における心電図解析のための機械学習(ml)の道を開くものと考えられる。

Neural network-based models have found wide use in automatic long-term electrocardiogram (ECG) analysis. However, such black box models are inadequate for analysing physiological signals where credibility and interpretability are crucial. Indeed, how to make ECG analysis transparent is still an open problem. In this study, we develop a Tsetlin machine (TM) based architecture for premature ventricular contraction (PVC) identification by analysing long-term ECG signals. The architecture is transparent by describing patterns directly with logical AND rules. To validate the accuracy of our approach, we compare the TM performance with those of convolutional neural networks (CNNs). Our numerical results demonstrate that TM provides comparable performance with CNNs on the MIT-BIH database. To validate interpretability, we provide explanatory diagrams that show how TM makes the PVC identification from confirming and invalidating patterns. We argue that these are compatible with medical knowledge so that they can be readily understood and verified by a medical doctor. Accordingly, we believe this study paves the way for machine learning (ML) for ECG analysis in clinical practice.
翻訳日:2023-01-25 12:48:09 公開日:2023-01-20
# 自己監督は自然言語を大規模に監視するのに役立たない

Self Supervision Does Not Help Natural Language Supervision at Scale ( http://arxiv.org/abs/2301.07836v2 )

ライセンス: Link先を確認
Floris Weers, Vaishaal Shankar, Angelos Katharopoulos, Yinfei Yang, Tom Gunter(参考訳) 自己監督と自然言語監督は、様々な下流タスクに優れた汎用画像エンコーダを訓練する2つのエキサイティングな方法として登場した。 m3aeやslipのような最近の研究は、これらのアプローチを効果的に組み合わせられることを示唆しているが、最も注目すべきは、小さな事前トレーニングデータセット(<50mサンプル)を使用しており、これらのアプローチで一般的に使用される大規模なレジーム(>100mサンプル)を効果的に反映していないことである。 ここでは、同様のアプローチが、はるかに多くのデータでトレーニングした場合に有効かどうかを検討する。 マスク付きオートエンコーダ,MAE,コントラスト言語イメージ事前トレーニングの2つの方法を組み合わせることで,CLIPは11.3Mイメージテキストペアのコーパスでトレーニングされた場合にはCLIPよりもメリットを提供するが,1.4Bイメージの大規模なコーパスでトレーニングされた場合には,CLIPに対する(一般的なビジョンタスクのスイートで評価された)メリットはほとんどない。 私たちの研究は、大規模な画像テキストトレーニングにおける自己監督の有効性(あるいは欠如)について、必要な明確さを提供します。

Self supervision and natural language supervision have emerged as two exciting ways to train general purpose image encoders which excel at a variety of downstream tasks. Recent works such as M3AE and SLIP have suggested that these approaches can be effectively combined, but most notably their results use small pre-training datasets (<50M samples) and don't effectively reflect the large-scale regime (>100M examples) that is commonly used for these approaches. Here we investigate whether a similar approach can be effective when trained with a much larger amount of data. We find that a combination of two state of the art approaches: masked auto-encoders, MAE and contrastive language image pre-training, CLIP provides a benefit over CLIP when trained on a corpus of 11.3M image-text pairs, but little to no benefit (as evaluated on a suite of common vision tasks) over CLIP when trained on a large corpus of 1.4B images. Our work provides some much needed clarity into the effectiveness (or lack thereof) of self supervision for large-scale image-text training.
翻訳日:2023-01-24 16:52:53 公開日:2023-01-20
# doubleh: 二部グラフニューラルネットワークによるtwitterユーザーのスタンス検出

DoubleH: Twitter User Stance Detection via Bipartite Graph Neural Networks ( http://arxiv.org/abs/2301.08774v1 )

ライセンス: Link先を確認
Chong Zhang, Zhenkun Zhou, Xingyu Peng, Ke Xu(参考訳) ソーシャルメディアの発展と充実を考えると、ソーシャルメディア利用者のスタンスを研究することは困難な問題である。 ソーシャルメディアのユーザーはツイートやリツイートを投稿することでスタンスを表現している。 したがって、ユーザ間の同種関係とユーザとツイート間の異種関係は、姿勢検出タスクに関係している。 近年,グラフニューラルネットワーク(GNN)が急速に発展し,ソーシャルメディア研究に応用されている。 本稿では、2020年アメリカ合衆国大統領選挙の大規模なデータセットをクロールし、ハッシュタグを手動でタグ付けすることで、すべてのユーザーを自動的にラベル付けする。 次に,ユーザのスタンス検出タスクにおいて,均質かつ異質な情報をより有効活用することを目的とした,二成分グラフニューラルネットワークモデルdoublehを提案する。 具体的には,まず,ユーザとつぶやきを含む2種類のノードのリツイート関係に基づく2部グラフを構築する。 次に,ノードの近傍における異種・同種情報を抽出・分離処理することにより,ノードの表現を反復的に更新する。 最後に、ユーザノードの表現は、ユーザの姿勢分類に使用される。 実験により、DoubleHは一般的なベンチマークで最先端の手法よりも優れていることが示された。 さらなる分析は、モデルの情報利用を示し、異なるレイヤ数での安定性と効率を示す。

Given the development and abundance of social media, studying the stance of social media users is a challenging and pressing issue. Social media users express their stance by posting tweets and retweeting. Therefore, the homogeneous relationship between users and the heterogeneous relationship between users and tweets are relevant for the stance detection task. Recently, graph neural networks (GNNs) have developed rapidly and have been applied to social media research. In this paper, we crawl a large-scale dataset of the 2020 US presidential election and automatically label all users by manually tagged hashtags. Subsequently, we propose a bipartite graph neural network model, DoubleH, which aims to better utilize homogeneous and heterogeneous information in user stance detection tasks. Specifically, we first construct a bipartite graph based on posting and retweeting relations for two kinds of nodes, including users and tweets. We then iteratively update the node's representation by extracting and separately processing heterogeneous and homogeneous information in the node's neighbors. Finally, the representations of user nodes are used for user stance classification. Experimental results show that DoubleH outperforms the state-of-the-art methods on popular benchmarks. Further analysis illustrates the model's utilization of information and demonstrates stability and efficiency at different numbers of layers.
翻訳日:2023-01-24 16:44:56 公開日:2023-01-20
# 原子集合における広帯域量子メモリ

Broadband Quantum Memory in Atomic Ensembles ( http://arxiv.org/abs/2301.08772v1 )

ライセンス: Link先を確認
Kai Shinbrough, Donny R. Pearson Jr., Bin Fang, Elizabeth A. Goldschmidt, Virginia O. Lorenz(参考訳) ブロードバンド量子メモリは、新しいフォトニック量子技術の高速動作を可能にするために重要である。 ここでは、原子アンサンブルにおけるブロードバンド量子メモリの実現 -- いわゆる"線形帯域幅ミスマッチ(linewidth-bandwidth mismatch)"問題 -- の中心的な課題と、このタスクを達成するために使用されるさまざまなメモリプロトコルとハードウェアの相対的なメリットについてレビューする。 また、原子アンサンブル量子メモリとその拡張理論を概観し、メモリ効率を最適化し、メモリ感度を特徴づける。 最後に、効率、メモリ寿命、ノイズの3つの主要な指標について、広帯域原子アンサンブル量子メモリの最先端性能について検討する。

Broadband quantum memory is critical to enabling the operation of emerging photonic quantum technology at high speeds. Here we review a central challenge to achieving broadband quantum memory in atomic ensembles -- what we call the 'linewidth-bandwidth mismatch' problem -- and the relative merits of various memory protocols and hardware used for accomplishing this task. We also review the theory underlying atomic ensemble quantum memory and its extensions to optimizing memory efficiency and characterizing memory sensitivity. Finally, we examine the state-of-the-art performance of broadband atomic ensemble quantum memories with respect to three key metrics: efficiency, memory lifetime, and noise.
翻訳日:2023-01-24 16:44:38 公開日:2023-01-20
# 次世代文予測(MeNSP)としてのマッチング : 理科教育における自動スコーリングのためのゼロショットプロンプト学習

Matching Exemplar as Next Sentence Prediction (MeNSP): Zero-shot Prompt Learning for Automatic Scoring in Science Education ( http://arxiv.org/abs/2301.08771v1 )

ライセンス: Link先を確認
Xuansheng Wu, Xinyu He, Tianming Li, Ninghao Liu, Xiaoming Zhai(参考訳) 科学問題に対する学生の回答を自動的に評価するモデルの開発は、科学教育にとって重要である。 しかし、トレーニングモデルに十分な学生反応の収集とラベル付けには時間と費用がかかる。 近年の研究では、事前学習言語モデル(PLM)が、プロンプトを微調整することなく下流タスクに適応できることが示唆されている。 しかし、科学教育においてこのような急進的なアプローチは研究されていない。 学生の反応は自然言語で表されるので、プロンプトを用いた次の文予測タスクとして採点手順を整列することで、コストのかかる微調整段階をスキップすることができる。 本研究では,Matching ExemplarsをNext Sentence Prediction(MeNSP)として,学生の反応を自動的にスコアするゼロショット手法を開発した。 このアプローチはトレーニングサンプルを使用しない。 まず, 科学的議論の3つの評価課題をMeNSPに適用し, 機械・人的評価協定, Cohen's Kappa は 0.30 から 0.57 まで, F1 は 0.54 から 0.81 までについて検討した。 評価を改善するため,我々は,ラベル付き学生応答をランダムに選択するか,モデルを微調整するために手作業で応答を構築するか,など,数ショット設定に研究を展開する。 一方のタスクのパフォーマンスはより多くのサンプルで改善され、コーエンのKappaは0.30から0.38に、F1は0.54から0.59に改善され、他の2つのタスクではスコアのパフォーマンスは改善されない。 また、ランダムに選択した少数のショットは、人間のエキスパートによるアプローチよりも優れていることも分かりました。 本研究は,モデル学習のコストを大幅に削減しながら,学生の反応に対して参照可能な自動得点が得られることを示唆する。 この方法は、理科教育における低学級評価の実践に役立つ。 今後の研究は,理科教育における様々な評価課題におけるmenspの適用可能性をさらに探究し,モデル性能を向上させる必要がある。

Developing models to automatically score students' written responses to science problems is critical for science education. However, collecting and labeling sufficient student responses for training models is time and cost-consuming. Recent studies suggest that pre-trained language models (PLMs) can be adapted to downstream tasks without fine-tuning with prompts. However, no research has employed such a prompt approach in science education. As student responses are presented with natural language, aligning the scoring procedure as the next sentence prediction task using prompts can skip the costly fine-tuning stage. In this study, we developed a zero-shot approach to automatically score student responses via Matching Exemplars as Next Sentence Prediction (MeNSP). This approach employs no training samples. We first apply MeNSP in scoring three assessment tasks of scientific argumentation and found machine-human scoring agreements, Cohen's Kappa ranges from 0.30 to 0.57, and F1 score ranges from 0.54 to 0.81. To improve the performance, we extend our research to the few-shots setting, either randomly selecting labeled student responses or manually constructing responses to fine-tune the models. We find that one task's performance is improved with more samples, Cohen's Kappa from 0.30 to 0.38, and F1 score from 0.54 to 0.59; for the two others, scoring performance is not improved. We also find that randomly selected few-shots perform better than the human expert-crafted approach. This study suggests that MeNSP can yield referable automatic scoring for student responses while significantly reducing the cost of model training. This method can benefit low-stakes classroom assessment practices in science education. Future research should further explore the applicability of the MeNSP in different types of assessment tasks in science education and improve the model performance.
翻訳日:2023-01-24 16:44:25 公開日:2023-01-20
# ニューラルネットワークと映像圧縮のための学習エントロピー符号化パラメータの最適化

Optimized learned entropy coding parameters for practical neural-based image and video compression ( http://arxiv.org/abs/2301.08752v1 )

ライセンス: Link先を確認
Amir Said, Reza Pourreza, Hoang Le(参考訳) ニューラルベースの画像とビデオコーデックは、重みとアクティベーションが低精度整数に量子化されると、はるかに電力効率が向上する。 量子化効果の低減には汎用技術があるが、特定のエントロピー符号化特性が考慮されない場合には大きな損失が発生する。 この研究は、エントロピー符号化がパラメータ量子化によってどのように影響を受けるかを分析し、損失を最小限に抑える方法を提供する。 符号化パラメータの特定の型を学習することで、一様量子化が事実上最適となり、コードメモリ要件の最小化も容易になることを示した。 新しい表現の数学的特性を示し、その有効性は符号化実験によって示され、良い結果がネットワーク出力あたり4~bitsの精度で得られ、事実上8~bitsの損失はないことを示す。

Neural-based image and video codecs are significantly more power-efficient when weights and activations are quantized to low-precision integers. While there are general-purpose techniques for reducing quantization effects, large losses can occur when specific entropy coding properties are not considered. This work analyzes how entropy coding is affected by parameter quantizations, and provides a method to minimize losses. It is shown that, by using a certain type of coding parameters to be learned, uniform quantization becomes practically optimal, also simplifying the minimization of code memory requirements. The mathematical properties of the new representation are presented, and its effectiveness is demonstrated by coding experiments, showing that good results can be obtained with precision as low as 4~bits per network output, and practically no loss with 8~bits.
翻訳日:2023-01-24 16:43:51 公開日:2023-01-20
# セルフトレーニングがデータバックドア中毒をどう許容するか

Towards Understanding How Self-training Tolerates Data Backdoor Poisoning ( http://arxiv.org/abs/2301.08751v1 )

ライセンス: Link先を確認
Soumyadeep Pal, Ren Wang, Yuguang Yao and Sijia Liu(参考訳) モデルトレーニングにおけるバックドアアタックの最近の研究は、少量のトレーニングデータの汚染が、下流のタスクにおいて高いクリーンな精度を維持しながら、有毒なテスト時間データに対する誤った操作予測を生成するのに十分であることを示した。 バックドア攻撃のステルス性は、今日の機械学習パラダイムに多大な防御的課題を課している。 本稿では,バックドア攻撃の軽減を目的としたラベルなしデータによる自己学習の可能性を検討する。 まず,バニラの自己学習がバックドア緩和に有効ではないことを示すためのパイロット研究を行う。 そこで我々は,自己学習型擬似ラベルの段階において,強大だが適切なデータ強化を活用してバックドア攻撃を防御することを提案する。 新たな自己訓練体制は、バックドア攻撃に対する防御に大いに役立つことが分かっています。 この効果は、CIFAR-10の異なるバックドアトリガーの実験と、CIFAR-10と追加の500K TinyImagesデータセットの組み合わせによって実証されている。 最後に,自己教師付き表現学習と自己訓練を組み合わせることによって,バックドア防御のさらなる改善を図る。

Recent studies on backdoor attacks in model training have shown that polluting a small portion of training data is sufficient to produce incorrect manipulated predictions on poisoned test-time data while maintaining high clean accuracy in downstream tasks. The stealthiness of backdoor attacks has imposed tremendous defense challenges in today's machine learning paradigm. In this paper, we explore the potential of self-training via additional unlabeled data for mitigating backdoor attacks. We begin by making a pilot study to show that vanilla self-training is not effective in backdoor mitigation. Spurred by that, we propose to defend the backdoor attacks by leveraging strong but proper data augmentations in the self-training pseudo-labeling stage. We find that the new self-training regime help in defending against backdoor attacks to a great extent. Its effectiveness is demonstrated through experiments for different backdoor triggers on CIFAR-10 and a combination of CIFAR-10 with an additional unlabeled 500K TinyImages dataset. Finally, we explore the direction of combining self-supervised representation learning with self-training for further improvement in backdoor defense.
翻訳日:2023-01-24 16:43:35 公開日:2023-01-20
# 生成モデルのドメイン非依存・多レベル評価

Domain-agnostic and Multi-level Evaluation of Generative Models ( http://arxiv.org/abs/2301.08750v1 )

ライセンス: Link先を確認
Girmaw Abebe Tadesse, Jannis Born, Celia Cintas, William Ogallo, Dmitry Zubarev, Matteo Manica, Komminist Weldemariam(参考訳) 生成モデルの能力は、異なるドメイン(画像、テキスト、グラフ、分子など)で大きく改善されているが、その評価基準は、実用性に制限のある、単純化された量や手作業による検査に基づいている。 そこで本稿では,様々な領域にまたがって適用可能な生成モデル(mpego)の多レベル性能評価のためのフレームワークを提案する。 MPEGOは、サブ機能ベースの低レベル評価からグローバル機能ベースの高レベル評価まで、世代パフォーマンスを階層的に定量化することを目的としている。 MPEGOは、採用されている機能が完全にユーザ駆動であるため、任意に複雑でありながらドメイン/プロブレム固有のものになり得るため、カスタマイズ性が高い(例:実験手順の結果)。 材料発見領域から複数のデータセットにまたがる複数の生成モデルを用いてMPEGOを検証する。 MPEGOにおける中間段階の妥当性を検討するためのアブレーション研究を行った。 結果から,MPEGOはフレキシブルでユーザ主導型,マルチレベルの評価フレームワークであり,生成品質に関する実践的な洞察が得られた。 フレームワーク、ソースコード、実験はhttps://github.com/GT4SD/mpego.comで公開される。

While the capabilities of generative models heavily improved in different domains (images, text, graphs, molecules, etc.), their evaluation metrics largely remain based on simplified quantities or manual inspection with limited practicality. To this end, we propose a framework for Multi-level Performance Evaluation of Generative mOdels (MPEGO), which could be employed across different domains. MPEGO aims to quantify generation performance hierarchically, starting from a sub-feature-based low-level evaluation to a global features-based high-level evaluation. MPEGO offers great customizability as the employed features are entirely user-driven and can thus be highly domain/problem-specific while being arbitrarily complex (e.g., outcomes of experimental procedures). We validate MPEGO using multiple generative models across several datasets from the material discovery domain. An ablation study is conducted to study the plausibility of intermediate steps in MPEGO. Results demonstrate that MPEGO provides a flexible, user-driven, and multi-level evaluation framework, with practical insights on the generation quality. The framework, source code, and experiments will be available at https://github.com/GT4SD/mpego.
翻訳日:2023-01-24 16:43:15 公開日:2023-01-20
# CSwin2SR:超解像圧縮用円形スウィン2SR

CSwin2SR: Circular Swin2SR for Compressed Image Super-Resolution ( http://arxiv.org/abs/2301.08749v1 )

ライセンス: Link先を確認
Honggui Li, Maria Trocan, Mohamad Sawan, Dimitri Galayko(参考訳) クローズドループ負帰還機構は自動制御システムで広く利用され、異常な動的および静的な性能をもたらす。 圧縮画像超解像の現在の方法の再構築能力をさらに向上するために,円形Swin2SR (CSwin2SR) アプローチを提案する。 cswin2srは、初期スーパーレゾリューション再確立のためのシリアルswin2srと、拡張スーパーレゾリューション再確立のための円形swin2srを含む。 シミュレーション実験の結果,提案したCSwin2SRは,超解像回復能力において従来のSwin2SRよりも劇的に優れていた。 DIV2Kテストおよび有効なデータセットでは、PSNRの平均増分は1dB以上であり、関連するSSIMの平均増分は0.006以上である。

Closed-loop negative feedback mechanism is extensively utilized in automatic control systems and brings about extraordinary dynamic and static performance. In order to further improve the reconstruction capability of current methods of compressed image super-resolution, a circular Swin2SR (CSwin2SR) approach is proposed. The CSwin2SR contains a serial Swin2SR for initial super-resolution reestablishment and circular Swin2SR for enhanced super-resolution reestablishment. Simulated experimental results show that the proposed CSwin2SR dramatically outperforms the classical Swin2SR in the capacity of super-resolution recovery. On DIV2K test and valid datasets, the average increment of PSNR is greater than 1dB and the related average increment of SSIM is greater than 0.006.
翻訳日:2023-01-24 16:42:57 公開日:2023-01-20
# ChatGPTは良い翻訳ツールか? 予備的研究

Is ChatGPT A Good Translator? A Preliminary Study ( http://arxiv.org/abs/2301.08745v1 )

ライセンス: Link先を確認
Wenxiang Jiao, Wenxuan Wang, Jen-tse Huang, Xing Wang, Zhaopeng Tu(参考訳) 本報告では,機械翻訳におけるChatGPTの予備評価を行い,翻訳プロンプト,多言語翻訳,翻訳堅牢性について述べる。 chatgptが推奨するプロンプトを使って翻訳能力を起動し、候補プロンプトが一般的にうまく動作し、パフォーマンスの差が小さいことが分かりました。 多数のベンチマークテストセットを評価することで、ChatGPTは、高リソースのヨーロッパ言語で商用翻訳製品(例えばGoogle Translate)と競合するが、低リソースや遠方の言語では遅れていることがわかった。 翻訳の堅牢性については、chatgptは生物医学的抽象やredditコメントの商用システムほど性能は良くないが、音声言語の優れた翻訳者である可能性がある。 スクリプトとデータ:https://github.com/wxjiao/Is-ChatGPT-A-Good-Translator

This report provides a preliminary evaluation of ChatGPT for machine translation, including translation prompt, multilingual translation, and translation robustness. We adopt the prompts advised by ChatGPT to trigger its translation ability and find that the candidate prompts generally work well and show minor performance differences. By evaluating on a number of benchmark test sets, we find that ChatGPT performs competitively with commercial translation products (e.g., Google Translate) on high-resource European languages but lags behind significantly on lowresource or distant languages. As for the translation robustness, ChatGPT does not perform as well as the commercial systems on biomedical abstracts or Reddit comments but is potentially a good translator for spoken language. Scripts and data: https://github.com/wxjiao/Is-ChatGPT-A-Good-Translator
翻訳日:2023-01-24 16:42:41 公開日:2023-01-20
# 古典的ロボティクスに基づく生成データセットを用いたロボットスキル学習:アドバンテージ、デアドバンテージ、今後の改善

Robot Skill Learning Via Classical Robotics-Based Generated Datasets: Advantages, Disadvantages, and Future Improvement ( http://arxiv.org/abs/2301.08794v1 )

ライセンス: Link先を確認
Batu Kaan Oezen(参考訳) 昔ながらのロボット工学の知識から利益を得ず、データ収集の代替手段を探すのはなぜか? 既存のすべての方法を無視する状況は、そのような無駄かもしれない。 本稿では,従来のロボットアルゴリズムを用いて作成したデータセットが,今後の発展の重要な部分であると主張している。 この古典的アルゴリズムはドメイン適応と一般化性に優れており、最も重要な点としてデータセットの収集は非常に容易である。 現在のロボットのスキル学習アプローチは、目に見えない領域では例外的にパフォーマンスが悪く、非常に排他的な大きなデータセットを持っていなければ、敵攻撃に対するパフォーマンスは極めて限定的であることはよく知られている。 我々の実験は、古典的なロボットコードによって作成されたデータセットを使用する最初のステップである。 実験では,古典ロボットを用いた軌道収集の可能性を検討した。 それはいくつかの利点と欠点に対処し、他の将来の開発アイデアを指摘した。

Why do we not profit from our long-existing classical robotics knowledge and look for some alternative way for data collection? The situation ignoring all existing methods might be such a waste. This article argues that a dataset created using a classical robotics algorithm is a crucial part of future development. This developed classic algorithm has a perfect domain adaptation and generalization property, and most importantly, collecting datasets based on them is quite easy. It is well known that current robot skill-learning approaches perform exceptionally badly in the unseen domain, and their performance against adversarial attacks is quite limited as long as they do not have a very exclusive big dataset. Our experiment is the initial steps of using a dataset created by classical robotics codes. Our experiment investigated possible trajectory collection based on classical robotics. It addressed some advantages and disadvantages and pointed out other future development ideas.
翻訳日:2023-01-24 16:35:38 公開日:2023-01-20
# 区分的ガウス過程のアクティブラーニング

Active Learning of Piecewise Gaussian Process Surrogates ( http://arxiv.org/abs/2301.08789v1 )

ライセンス: Link先を確認
Chiwoo Park and Robert Waelder and Bonggwon Kang and Benji Maruyama and Soondo Hong and Robert Gramacy(参考訳) ガウス過程(GP)サロゲートのアクティブラーニングは、物理・コンピュータシミュレーション実験のための実験設計の最適化や、機械学習におけるデータ取得スキームのステアリングに有用である。 本稿では,Jump GPサロゲートを能動的に学習する手法を開発した。 jump gpsは、自律的な材料設計、スマートファクトリーシステムの構成、その他多くのアプリケーションに必要な設計スペースの領域内で連続しているが、不連続である。 我々のアクティブラーニングヒューリスティックは、もともと通常のGP向けに設計された戦略から適切なものであるが、通常のモデルの不確実性とは対照的に、モデルバイアスを付加的に考慮することは、Jump GPコンテキストにおいて不可欠であることを示す。 そこで我々は,Jump GPモデルのバイアスと分散を推定する手法を開発した。 提案手法の利点を示すイラストや証拠は、一連の合成ベンチマークと、複雑さの異なる実シミュレーション実験に基づいて提供されている。

Active learning of Gaussian process (GP) surrogates has been useful for optimizing experimental designs for physical/computer simulation experiments, and for steering data acquisition schemes in machine learning. In this paper, we develop a method for active learning of piecewise, Jump GP surrogates. Jump GPs are continuous within, but discontinuous across, regions of a design space, as required for applications spanning autonomous materials design, configuration of smart factory systems, and many others. Although our active learning heuristics are appropriated from strategies originally designed for ordinary GPs, we demonstrate that additionally accounting for model bias, as opposed to the usual model uncertainty, is essential in the Jump GP context. Toward that end, we develop an estimator for bias and variance of Jump GP models. Illustrations, and evidence of the advantage of our proposed methods, are provided on a suite of synthetic benchmarks, and real-simulation experiments of varying complexity.
翻訳日:2023-01-24 16:35:24 公開日:2023-01-20
# データ制限下での因果推論

Causal Inference under Data Restrictions ( http://arxiv.org/abs/2301.08788v1 )

ライセンス: Link先を確認
Xiaoqing Tan(参考訳) この論文は、不確実性とデータ制限の下での現代的な因果推論に焦点をあて、新調整臨床試験、分散データネットワーク、堅牢な個別化意思決定に応用する。 第1のプロジェクトでは,2次処理結果に対する平均処理効果を,処理後中間応答の非現実的状態に基づいて同定し,推定する手法を提案する。 軽度の仮定の下では、興味のある治療効果を識別することができる。 検閲された結果データに対処するためのアプローチを拡張します。 提案法は, ネオアジュバント臨床試験に応用し, その性能をシミュレーション研究により評価した。 第2のプロジェクトでは,ターゲットサイトにおける条件的平均治療効果の推定精度を向上させるために,対象データを共有することなく,他の潜在的異種サイト由来のモデルを活用し,ツリーベースモデル平均化手法を提案する。 本手法の性能は, 酸素療法が病院生存率に及ぼす影響について検討し, 総合シミュレーションによる裏付けを得た。 第3のプロジェクトでは、決定時に利用できない敏感な変数による個人の最悪の結果を改善するために、敏感な変数を持つ頑健な個別化決定学習フレームワークを提案する。 平均最適目的を用いた既存のほとんどの作業とは異なり、我々は新しく定義された分位または不フィムの最適決定規則を見つけることによって、堅牢な学習フレームワークを提案する。 因果的観点からは、個々の被験者に対する(平均的)公正性の古典的概念を条件的公正性へと一般化する。 提案手法の信頼性は, 合成実験と3つの実データ応用により実証された。

This dissertation focuses on modern causal inference under uncertainty and data restrictions, with applications to neoadjuvant clinical trials, distributed data networks, and robust individualized decision making. In the first project, we propose a method under the principal stratification framework to identify and estimate the average treatment effects on a binary outcome, conditional on the counterfactual status of a post-treatment intermediate response. Under mild assumptions, the treatment effect of interest can be identified. We extend the approach to address censored outcome data. The proposed method is applied to a neoadjuvant clinical trial and its performance is evaluated via simulation studies. In the second project, we propose a tree-based model averaging approach to improve the estimation accuracy of conditional average treatment effects at a target site by leveraging models derived from other potentially heterogeneous sites, without them sharing subject-level data. The performance of this approach is demonstrated by a study of the causal effects of oxygen therapy on hospital survival rates and backed up by comprehensive simulations. In the third project, we propose a robust individualized decision learning framework with sensitive variables to improve the worst-case outcomes of individuals caused by sensitive variables that are unavailable at the time of decision. Unlike most existing work that uses mean-optimal objectives, we propose a robust learning framework by finding a newly defined quantile- or infimum-optimal decision rule. From a causal perspective, we also generalize the classic notion of (average) fairness to conditional fairness for individual subjects. The reliable performance of the proposed method is demonstrated through synthetic experiments and three real-data applications.
翻訳日:2023-01-24 16:35:07 公開日:2023-01-20
# デジタルmem計算機の自己平均化

Self-Averaging of Digital MemComputing Machines ( http://arxiv.org/abs/2301.08787v1 )

ライセンス: Link先を確認
Daniel Primosch, Yuan-Hang Zhang and Massimiliano Di Ventra(参考訳) digital memcomputing machines (dmms) は非量子力学系とメモリを併用して組合せ最適化問題を解決する新しい計算機械である。 本稿では, DMM の解法時間 (TTS) が逆ガウス分布に従うことを示す。 本研究では,この現象の解析的理解と3-SAT問題の解法による数値的証拠を提供する。 問題サイズを持つDMMの自己改善特性は、それらが解決するインスタンスの詳細な特徴に敏感であることを示している。 これは、同じ問題に適用される従来のアルゴリズムとは対照的であり、この物理ベースの計算アプローチの別の利点を示している。

Digital MemComputing machines (DMMs) are a new class of computing machines that employ non-quantum dynamical systems with memory to solve combinatorial optimization problems. Here, we show that the time to solution (TTS) of DMMs follows an inverse Gaussian distribution, with the TTS self-averaging with increasing problem size, irrespective of the problem they solve. We provide both an analytical understanding of this phenomenon and numerical evidence by solving instances of the 3-SAT (satisfiability) problem. The self-averaging property of DMMs with problem size implies that they are increasingly insensitive to the detailed features of the instances they solve. This is in sharp contrast to traditional algorithms applied to the same problems, illustrating another advantage of this physics-based approach to computation.
翻訳日:2023-01-24 16:34:41 公開日:2023-01-20
# 画像キャプションのための視覚意味関連データセット

Visual Semantic Relatedness Dataset for Image Captioning ( http://arxiv.org/abs/2301.08784v1 )

ライセンス: Link先を確認
Ahmed Sabir, Francesc Moreno-Noguer, Llu\'is Padr\'o(参考訳) 現代の画像キャプションシステムは、静的ストーリーの概念を捉えるために画像から知識を抽出することに大きく依存している。 本稿では,画像中のオブジェクトなどのシーンに関する情報とともに,一般公開されているCOCOキャプション(Lin et al., 2014)を拡張したキャプションのためのテキストビジュアルコンテキストデータセットを提案する。 この情報にはテキスト形式があるため、テキスト類似性や意味関係法といったあらゆるnlpタスクを、エンドツーエンドのトレーニング戦略や後処理ベースのアプローチとしてキャプションシステムに活用することができる。

Modern image captioning system relies heavily on extracting knowledge from images to capture the concept of a static story. In this paper, we propose a textual visual context dataset for captioning, in which the publicly available dataset COCO Captions (Lin et al., 2014) has been extended with information about the scene (such as objects in the image). Since this information has a textual form, it can be used to leverage any NLP task, such as text similarity or semantic relation methods, into captioning systems, either as an end-to-end training strategy or a post-processing based approach.
翻訳日:2023-01-24 16:34:27 公開日:2023-01-20
# フレーム化およびイベントビデオソースのための非同期インテンシティ表現

An Asynchronous Intensity Representation for Framed and Event Video Sources ( http://arxiv.org/abs/2301.08783v1 )

ライセンス: Link先を確認
Andrew C. Freeman, Montek Singh, Ketan Mayer-Patel(参考訳) 非同期センシングで人間の視覚システムを模倣するために設計されたニューロモルフィックな"イベント"カメラは、高速かつ高ダイナミックレンジのアプリケーションの新しい領域をアンロックする。 しかし、研究者はしばしば、アプリケーション用のイベントデータのフレーム化された表現に戻すか、特定のカメラのイベントデータタイプのために独自のアプリケーションを構築する。 次世代のビデオシステムの実現,新しいイベントカメラ設計の実現,および従来のアプリケーションにおける非同期ビデオのメリットを探るため,非同期でソースに依存しないビデオ表現の必要性を論じる。 本稿では,フレームデータと非フレームデータの両方に対して,新しい非同期強度表現を提案する。 提案手法は,画素当たりのサンプル数をグリッドベースの表現と比較して大幅に削減できることを示す。 フレームドソースを用いて、同様の画素値の時間平均化による損失を少なく抑えることで、VMAF品質スコアの低下をわずか4.5.5%に抑えながら、表現のサンプルレートを半減できることを示した。 また,時間分解能を2000ドルに抑えつつ,フレーム化およびイベントカメラデータを強調表現に融合・変換する最先端手法よりもレイテンシが低いことを示す。 本稿では,イベントカメラのリアルタイムインテンシティに基づくアプリケーション構築に必要な計算効率と時間的粒度について論じる。

Neuromorphic "event" cameras, designed to mimic the human vision system with asynchronous sensing, unlock a new realm of high-speed and high dynamic range applications. However, researchers often either revert to a framed representation of event data for applications, or build bespoke applications for a particular camera's event data type. To usher in the next era of video systems, accommodate new event camera designs, and explore the benefits to asynchronous video in classical applications, we argue that there is a need for an asynchronous, source-agnostic video representation. In this paper, we introduce a novel, asynchronous intensity representation for both framed and non-framed data sources. We show that our representation can increase intensity precision and greatly reduce the number of samples per pixel compared to grid-based representations. With framed sources, we demonstrate that by permitting a small amount of loss through the temporal averaging of similar pixel values, we can reduce our representational sample rate by more than half, while incurring a drop in VMAF quality score of only 4.5. We also demonstrate lower latency than the state-of-the-art method for fusing and transcoding framed and event camera data to an intensity representation, while maintaining $2000\times$ the temporal resolution. We argue that our method provides the computational efficiency and temporal granularity necessary to build real-time intensity-based applications for event cameras.
翻訳日:2023-01-24 16:34:16 公開日:2023-01-20
# 僧帽弁ヒンジ点座標の推定 --心エコー区分けのためのディープニューラルネット

Estimation of mitral valve hinge point coordinates -- deep neural net for echocardiogram segmentation ( http://arxiv.org/abs/2301.08782v1 )

ライセンス: Link先を確認
Christian Schmidt and Heinrich Martin Overhoff(参考訳) 心臓画像分割は、心血管疾患の診断と治療において強力なツールである。 僧帽弁のような純粋に特徴に基づく解剖学的構造の検出は特に要求される特徴工学のために困難な作業であり、心エコー図において特に困難である。 さらなる注釈付き医療データセットの公開とGPU処理能力の増大により、医療画像セグメンテーションにおけるディープラーニングベースの手法は、ここ数年でより実現可能になった。 そこで本研究では,u-netを用いたディープニューラルネットを用いて第1段階で心室を心エコー図に分割し,第2ステップで僧帽弁ヒンジポイントを抽出する僧帽弁ヒンジポイントの完全自動検出法を提案する。 平均絶対ヒンジ点座標誤差はx- (15-85%ile range: [0.3 mm; 3.15 mm]) と y- coordinate (15-85 percentile range: [0.15 mm; 1.88 mm]) で 0.75 mm である。

Cardiac image segmentation is a powerful tool in regard to diagnostics and treatment of cardiovascular diseases. Purely feature-based detection of anatomical structures like the mitral valve is a laborious task due to specifically required feature engineering and is especially challenging in echocardiograms, because of their inherently low contrast and blurry boundaries between some anatomical structures. With the publication of further annotated medical datasets and the increase in GPU processing power, deep learning-based methods in medical image segmentation became more feasible in the past years. We propose a fully automatic detection method for mitral valve hinge points, which uses a U-Net based deep neural net to segment cardiac chambers in echocardiograms in a first step, and subsequently extracts the mitral valve hinge points from the resulting segmentations in a second step. Results measured with this automatic detection method were compared to reference coordinate values, which with median absolute hinge point coordinate errors of 1.35 mm for the x- (15-85 percentile range: [0.3 mm; 3.15 mm]) and 0.75 mm for the y- coordinate (15-85 percentile range: [0.15 mm; 1.88 mm]).
翻訳日:2023-01-24 16:33:52 公開日:2023-01-20
# GBOSE: 一般化帯域直交半パラメトリック推定

GBOSE: Generalized Bandit Orthogonalized Semiparametric Estimation ( http://arxiv.org/abs/2301.08781v1 )

ライセンス: Link先を確認
Mubarrat Chowdhury, Elkhan Ismayilzada, Khalequzzaman Sayem and Gi-Soo Kim(参考訳) 逐次意思決定シナリオ、すなわち、モバイルヘルスレコメンデーションシステム 収益管理 コンテキストマルチアームのバンディットアルゴリズムは、そのパフォーマンスに注目を集めている。 しかし、既存のアルゴリズムのほとんどは、厳密にパラメトリックな報酬モデルの仮定に基づいて構築されている。 本研究では,既存の半パラメトリックアルゴリズムにおいて,半パラメトリック報酬モデルを用いた新たなアルゴリズムを提案する。 我々の研究は、同じアクションフィルタリング手順に基づいて構築されたアルゴリズムを提案しながら、計算を少なくしながら、特定のステップで2つ以上の腕を含むシナリオに対して明示的な行動選択分布を提供することにより、同様の報酬モデルを用いて、最先端の複雑さの別の代表的アルゴリズムの範囲を広げる。 後悔に対する上界の複雑さを導出し,本手法が一般的な半パラメトリックバンディットアルゴリズムから2本以上の腕を含む場合の優位性を肯定するシミュレーション結果を得る。

In sequential decision-making scenarios i.e., mobile health recommendation systems revenue management contextual multi-armed bandit algorithms have garnered attention for their performance. But most of the existing algorithms are built on the assumption of a strictly parametric reward model mostly linear in nature. In this work we propose a new algorithm with a semi-parametric reward model with state-of-the-art complexity of upper bound on regret amongst existing semi-parametric algorithms. Our work expands the scope of another representative algorithm of state-of-the-art complexity with a similar reward model by proposing an algorithm built upon the same action filtering procedures but provides explicit action selection distribution for scenarios involving more than two arms at a particular time step while requiring fewer computations. We derive the said complexity of the upper bound on regret and present simulation results that affirm our methods superiority out of all prevalent semi-parametric bandit algorithms for cases involving over two arms.
翻訳日:2023-01-24 16:33:31 公開日:2023-01-20
# Split Ways: 分割学習を用いた暗号化データのプライバシ保護トレーニング

Split Ways: Privacy-Preserving Training of Encrypted Data Using Split Learning ( http://arxiv.org/abs/2301.08778v1 )

ライセンス: Link先を確認
Tanveer Khan, Khoa Nguyen, Antonis Michalas(参考訳) Split Learning(SL)は、クライアントとサーバなどの参加者が、クライアントが生データを共有せずに機械学習モデルをトレーニングできるようにする、新たなコラボレーション学習技術である。 この設定では、クライアントは最初、生データに機械学習モデルの一部を適用してアクティベーションマップを生成し、その後、トレーニングプロセスを続けるためにサーバに送信する。 この分野の以前の研究は、アクティベーションマップの再構築がクライアントデータのプライバシリークを引き起こすことを実証した。 それに加えて、SLのプライバシー漏洩を克服する既存の緩和技術は、精度の点で著しく悪化している。 本稿では,準同型暗号化されたデータ上で動作可能なu字型slに基づくプロトコルを構築することにより,これまでの作業を改善する。 より正確には、我々のアプローチでは、クライアントは、サーバに送信する前にアクティベーションマップにホモモルフィック暗号化(HE)を適用します。 これは、他のSLベースの作業と比べてプライバシーの漏洩を減らす重要な改善である。 最後に, パラメータの最適セットを用いて, U字型SLにおけるHEデータを用いたトレーニングは, 平文でのトレーニングに比べて2.65%の精度しか低下しないことを示した。 さらに、生のトレーニングデータプライバシが保存される。

Split Learning (SL) is a new collaborative learning technique that allows participants, e.g. a client and a server, to train machine learning models without the client sharing raw data. In this setting, the client initially applies its part of the machine learning model on the raw data to generate activation maps and then sends them to the server to continue the training process. Previous works in the field demonstrated that reconstructing activation maps could result in privacy leakage of client data. In addition to that, existing mitigation techniques that overcome the privacy leakage of SL prove to be significantly worse in terms of accuracy. In this paper, we improve upon previous works by constructing a protocol based on U-shaped SL that can operate on homomorphically encrypted data. More precisely, in our approach, the client applies Homomorphic Encryption (HE) on the activation maps before sending them to the server, thus protecting user privacy. This is an important improvement that reduces privacy leakage in comparison to other SL-based works. Finally, our results show that, with the optimum set of parameters, training with HE data in the U-shaped SL setting only reduces accuracy by 2.65% compared to training on plaintext. In addition, raw training data privacy is preserved.
翻訳日:2023-01-24 16:33:15 公開日:2023-01-20
# 局所プローブによる量子場の絡み合い構造

Entanglement structure of quantum fields through local probes ( http://arxiv.org/abs/2301.08775v1 )

ライセンス: Link先を確認
Bruno de S. L. Torres, Kelly Wurtz, Jos\'e Polo-G\'omez, Eduardo Mart\'in-Mart\'inez(参考訳) 本稿では、相対論的量子情報における粒子検出器の形式性に着想を得た量子場理論の絡み合い構造を研究する枠組みを提案する。 この枠組みは原則として、UVの発散に遭遇することなく、時空の任意の形の領域間のQFTの絡み合いを忠実に捉え、他のアプローチでよく見られる多くの問題を回避することができる。 また, エンタングルメント収穫の効率の限界も確立し, フィールド理論における時空部分領域間のエンタングルメントの操作的定義の動機付けにも利用することができる。

We present a framework to study the entanglement structure of a quantum field theory inspired by the formalism of particle detectors in relativistic quantum information. This framework can in principle be used to faithfully capture entanglement in a QFT between arbitrary-shaped regions of spacetime without encountering UV divergences, bypassing many of the issues typically present in other approaches. Our results also establish the limits of the efficiency of entanglement harvesting, and may also be used to motivate an operational definition of entanglement between spacetime subregions in field theory.
翻訳日:2023-01-24 16:32:53 公開日:2023-01-20
# テキスト分割による文書要約

Document Summarization with Text Segmentation ( http://arxiv.org/abs/2301.08817v1 )

ライセンス: Link先を確認
Lesly Miculicich and Benjamin Han(参考訳) 本稿では,抽出した要約タスクを改善するために,固有文書セグメント構造を利用する。 2つのテキストセグメンテーションモデルを構築し,その出力予測を抽出要約モデルに導入する最善の方法を見出した。 学術論文のコーパスにおける実験結果から,高精度なセグメンテーション法により抽出的要約の利点が得られた。 特に、改善のほとんどは、最も関連性の高い情報が始めにない場合の文書にあるため、セグメンテーションはリードバイアスの問題を減少させるのに役立つと結論づける。

In this paper, we exploit the innate document segment structure for improving the extractive summarization task. We build two text segmentation models and find the most optimal strategy to introduce their output predictions in an extractive summarization model. Experimental results on a corpus of scientific articles show that extractive summarization benefits from using a highly accurate segmentation method. In particular, most of the improvement is in documents where the most relevant information is not at the beginning thus, we conclude that segmentation helps in reducing the lead bias problem.
翻訳日:2023-01-24 16:27:44 公開日:2023-01-20
# DiffusionCT:CT画像標準化のための潜時拡散モデル

DiffusionCT: Latent Diffusion Model for CT Image Standardization ( http://arxiv.org/abs/2301.08815v1 )

ライセンス: Link先を確認
Md Selim, Jie Zhang, Michael A. Brooks, Ge Wang, Jin Chen(参考訳) CTは早期肺癌の診断,治療,予後に広く用いられている。 CT画像から抽出された特徴は、腫瘍構造と機能における空間的・時間的変動を定量化するために受け入れられている。 しかし、CT画像は、カスタマイズされた取得基準を持つ異なるベンダーのスキャナーを使用して取得されることが多く、結果として同じ患者であってもテクスチャが著しく異なるため、下流の研究には根本的な課題が生じる。 既存のCT画像調和モデルは、限られた性能で教師付きまたは半教師付き技術に依存している。 本稿では,潜時分布を標準分布にマッピングすることで潜時空間に作用する拡散型ct画像標準化モデルについて提案する。 DiffusionCTには、Unetベースのエンコーダデコーダと、そのボトルネック部分に埋め込まれた拡散モデルが組み込まれている。 Unetはまず拡散モデルなしでトレーニングを行い、入力データの潜在表現を学習した。 拡散モデルは次のトレーニングフェーズで訓練される。 訓練されたモデルはすべて、画像の標準化に協力する。 Unetエンコーダから出力された符号化表現は拡散モデルを通過し、拡散モデルはその分布を対象の標準画像領域にマッピングする。 最後に、デコードはその変換された潜在表現を使って標準化された画像を合成する。 実験の結果,DiffusionCTは標準化タスクの性能を著しく向上させることがわかった。

Computed tomography (CT) imaging is a widely used modality for early lung cancer diagnosis, treatment, and prognosis. Features extracted from CT images are now accepted to quantify spatial and temporal variations in tumor architecture and function. However, CT images are often acquired using scanners from different vendors with customized acquisition standards, resulting in significantly different texture features even for the same patient, posing a fundamental challenge to downstream studies. Existing CT image harmonization models rely on supervised or semi-supervised techniques, with limited performance. In this paper, we have proposed a diffusion-based CT image standardization model called DiffusionCT which works on latent space by mapping latent distribution into a standard distribution. DiffusionCT incorporates an Unet-based encoder-decoder and a diffusion model embedded in its bottleneck part. The Unet first trained without the diffusion model to learn the latent representation of the input data. The diffusion model is trained in the next training phase. All the trained models work together on image standardization. The encoded representation outputted from the Unet encoder passes through the diffusion model, and the diffusion model maps the distribution in to target standard image domain. Finally, the decode takes that transformed latent representation to synthesize a standardized image. The experimental results show that DiffusionCT significantly improves the performance of the standardization task.
翻訳日:2023-01-24 16:27:35 公開日:2023-01-20
# 協調マルチエージェント計画における差分プライバシー

Differential Privacy in Cooperative Multiagent Planning ( http://arxiv.org/abs/2301.08811v1 )

ライセンス: Link先を確認
Bo Chen and Calvin Hawkins and Mustafa O. Karabag and Cyrus Neary and Matthew Hale and Ufuk Topcu(参考訳) プライバシを意識したマルチエージェントシステムは、エージェントの機密データを保護すると同時に、エージェントが共通の目的を達成することを保証する必要がある。 この目的に向けて,共同マルチエージェント意思決定問題において,エージェント間コミュニケーションを民営化する枠組みを提案する。 我々は,到達回避目標を持つ協調マルコフゲームとして定式化された逐次意思決定問題について検討する。 我々は,エージェントの伝達する象徴的状態軌跡を民営化するために差分プライバシー機構を適用し,プライバシの強さとチームのパフォーマンスのトレードオフを分析する。 あるレベルのプライバシに関して、このトレードオフはエージェントの状態-アクションプロセス間の全体的相関に依存することが示されている。 相関関係の価値を下げることにより、プライバシーに堅牢なポリシーを合成する。 数値実験により、これらのポリシーの下でのチームのパフォーマンスは、プライベートと非プライベートのコミュニケーション実装を比較すると、わずか3%低下することがわかった。 対照的に、全体の相関を無視し、チームのパフォーマンスのみを最適化するベースラインポリシーを使用する場合、チームのパフォーマンスはおよそ86%低下する。

Privacy-aware multiagent systems must protect agents' sensitive data while simultaneously ensuring that agents accomplish their shared objectives. Towards this goal, we propose a framework to privatize inter-agent communications in cooperative multiagent decision-making problems. We study sequential decision-making problems formulated as cooperative Markov games with reach-avoid objectives. We apply a differential privacy mechanism to privatize agents' communicated symbolic state trajectories, and then we analyze tradeoffs between the strength of privacy and the team's performance. For a given level of privacy, this tradeoff is shown to depend critically upon the total correlation among agents' state-action processes. We synthesize policies that are robust to privacy by reducing the value of the total correlation. Numerical experiments demonstrate that the team's performance under these policies decreases by only 3 percent when comparing private versus non-private implementations of communication. By contrast, the team's performance decreases by roughly 86 percent when using baseline policies that ignore total correlation and only optimize team performance.
翻訳日:2023-01-24 16:27:17 公開日:2023-01-20
# 音素レベルBERTによる音韻予測付きテキスト音声の韻律向上

Phoneme-Level BERT for Enhanced Prosody of Text-to-Speech with Grapheme Predictions ( http://arxiv.org/abs/2301.08810v1 )

ライセンス: Link先を確認
Yinghao Aaron Li, Cong Han, Xilin Jiang, Nima Mesgarani(参考訳) 大規模事前学習言語モデルは、より自然主義的な韻律パターンを生成できるようにすることで、テキスト音声(TTS)モデルの自然性を改善するのに役立つことが示されている。 しかし、これらのモデルは通常、単語レベルまたは超音素レベルであり、音素と共同で訓練されるため、音素のみを必要とする下流のttsタスクでは非効率である。 本研究では,正規マスク付き音素予測とともに対応する音素を予測するためのプレテキストタスクを備えた音素レベルBERT(PL-BERT)を提案する。 主観的評価では,音素レベルのbertエンコーダは,od(out-of-distribution)テキストをベースとするsof-the-art (sota) stylettsと比較して,合成音声の自然性評価の平均評価スコア(mos)を有意に改善した。

Large-scale pre-trained language models have been shown to be helpful in improving the naturalness of text-to-speech (TTS) models by enabling them to produce more naturalistic prosodic patterns. However, these models are usually word-level or sup-phoneme-level and jointly trained with phonemes, making them inefficient for the downstream TTS task where only phonemes are needed. In this work, we propose a phoneme-level BERT (PL-BERT) with a pretext task of predicting the corresponding graphemes along with the regular masked phoneme predictions. Subjective evaluations show that our phoneme-level BERT encoder has significantly improved the mean opinion scores (MOS) of rated naturalness of synthesized speech compared with the state-of-the-art (SOTA) StyleTTS baseline on out-of-distribution (OOD) texts.
翻訳日:2023-01-24 16:27:02 公開日:2023-01-20
# 量子アニール用4軸ネットワーク微小埋め込み

4-clique network minor embedding for quantum annealers ( http://arxiv.org/abs/2301.08807v1 )

ライセンス: Link先を確認
Elijah Pelofske(参考訳) 組合せ最適化問題の解法として量子アニール法を提案する。 現在の量子アニーリングハードウェアは比較的スパースであり、そのため任意に構成された問題をスパースで比較的小さな量子アニーリングプロセッサにマッピングするためにグラフの小さな埋め込みが必要である。 本論文は, 4-clique minor embeddeding と呼ばれる新しいマイナー埋め込み手法を提案する。 これは、論理変数状態を表すために線形連結キュービットの経路を使用する標準的なマイナー埋め込み手法とは対照的である。 ペガサスグラフ接続(ペガサスグラフ接続、ペガサスグラフ接続)は、現在のD-Wave量子アニールのネイティブなハードウェアグラフである。 ペガサス・ハードウエアグラフは多くの四角形を持ち、接続された四角形からなるグラフを構成することができ、その上で問題に小さな埋め込みが可能である。 4-cliqueチェーンは、ハードウェアグラフにqubitを追加使用するコストがかかるが、各チェーン内の結合性が強くなり、チェーン整合性が向上し、チェーン切断が削減される。 この4軸の小さな埋め込み技術は、ペガサスのハードウェアグラフを持つ2つのD-Wave量子アニールプロセッサの実験により、標準線形パスのマイナー埋め込みと比較される。 4-clique minor embeddedsは弱鎖強度を持つ線形経路マイナー埋め込みとは対照的に、無作為な全対全スピングラス問題例を最小化する計算を成功させながら弱鎖強度を用いることができる。 この研究は、非標準のマイナー埋め込みメソッドが有用であることを示している。 将来の量子アニーリングアーキテクチャでは、線形経路の代わりにハードウェアのより密結合した領域に小さな埋め込みを分散することで、小さな埋め込み問題に対するより堅牢な計算が可能になる。

Quantum annealing is a proposed algorithm for computing solutions to combinatorial optimization problems. Current quantum annealing hardware is relatively sparse and therefore requires graph minor embedding in order to map an arbitrarily structured problem onto the sparse, and relatively small, quantum annealing processor. This paper proposes a new minor embedding method called 4-clique minor embedding. This is in contrast to the standard minor embedding technique of using a path of linearly connected qubits in order to represent a logical variable state. The 4-clique minor embedding is possible because of Pegasus graph connectivity, which is the native hardware graph for some of the current D-Wave quantum annealers. The Pegasus hardware graph has many 4-cliques, and it is possible to form a graph composed entirely of paths of connected 4-cliques, on which a problem can be minor embedded. The 4-clique chains come at the cost of additional qubit usage on the hardware graph, but they allow for stronger coupling within each chain thereby increasing chain integrity and reducing chain breaks. This 4-clique minor embedding technique is described in detail, and is compared against the standard linear path minor embedding with some experiments on two D-Wave quantum annealing processors with Pegasus hardware graphs. 4-clique minor embeddings can use weak chain strengths while successfully carrying out the computation of minimizing random all-to-all spin glass problem instances, in contrast to the linear path minor embeddings which have high chain break frequencies for weak chain strengths. This work shows that non standard minor embedding methods could be useful. For future quantum annealing architectures, distributing minor embeddings over more densely connected regions of hardware instead of linear paths may provide more robust computations for minor embedding problems.
翻訳日:2023-01-24 16:26:41 公開日:2023-01-20
# サブ波長エミッタアレイにおける連続体の束縛状態

Bound states in the continuum in subwavelength emitter arrays ( http://arxiv.org/abs/2301.08804v1 )

ライセンス: Link先を確認
Paloma A. Huidobro and Maria Blanco de Paz(参考訳) サブ波長周期を持つエミッタの順序格子は、集合的効果から生じる非典型的な光-物質相互作用をサポートする。 本稿では,2次元格子における放射連続体内のサブラジアント光状態の実現と制御を提案する。 放射状態から完全に切り離された連続体(BIC)のバウンド状態が、エミッタの非ブラバス格子にどのように現れるかを示す。 対称性の破れは、量子情報保存に活用できる寿命を大きく延長した準bicsをもたらす。 一般化された有効偏光性テンソルの解析的導出は、これらの配列の光学的応答の研究を可能にする。 準BICにより、非対称なファノ共鳴と電磁誘導透過窓を持つ反射スペクトルにおいて、豊富な現象論が生じるかについて議論する。 最後に、これらの格子を効率的な光偏光子として働く量子準曲面として利用する。

Ordered lattices of emitters with subwavelength periodicities support unconventional forms of light-matter interactions arising from collective effects. Here, we propose the realization and control of subradiant optical states within the radiation continuum in two-dimensional lattices. We show how bound states in the continuum (BICs) which are completely decoupled from radiative states emerge in non-Bravais lattices of emitters. Symmetry breaking results in quasi-BICs with greatly extended lifetimes, which can be exploited for quantum information storage. The analytical derivation of a generalized effective polarizability tensor allows us to study the optical response of these arrays. We discuss how thanks to the quasi-BICs, a rich phenomenology takes place in the reflectivity spectrum, with asymmetric Fano resonances and an electromagnetically induced transparency window. Finally, we exploit these lattices as quantum metasurfaces acting as efficient light polarizers.
翻訳日:2023-01-24 16:26:12 公開日:2023-01-20
# PCAによる前処理と異なるCNN構造がソノグラムの変形性登録に及ぼす影響

Impact of PCA-based preprocessing and different CNN structures on deformable registration of sonograms ( http://arxiv.org/abs/2301.08802v1 )

ライセンス: Link先を確認
Christian Schmidt and Heinrich Martin Overhoff(参考訳) 中心静脈カテーテル(CVC)は通常、内頸静脈(IJV)などの頸部の大静脈に挿入される。 CVC挿入は、動脈へのずれや頚動脈穿孔などの深刻な合併症を引き起こす可能性がある。 超音波ガイド下にCVCを配置することは、静脈や動脈などの解剖学的ランドマークを確実に検出できる場合、そのような有害事象を減らすのに適切な方法である。 この課題は,患者個人画像と解剖学的にラベル付けされた参照画像との登録によって解決される。 本研究では, 頚部超音波像に対して線形アフィン変換を行い, 続いて非線形変換を行い, より正確な登録を行う。 U-Net構造を持つ畳み込みニューラルネットワーク(CNN)を用いた変形可能な画像登録のための学習ライブラリであるVoxelmorph(VM)が非線形変換に使用された。 患者個人画像の主成分分析(PCA)に基づく事前復号化と, 複雑度が異なる修正ネット構造が登録結果に与える影響を視覚的, 定量的に検討し, 後者は変形と画像類似度の測定値を用いて検討した。 PCAを併用した頚部超音波検査では, 平均変形長が18%から66%に減少した。 さらに、畳み込み層の数を減らすことで、PCA画像と画像の類似性が向上し、元の画像は悪化した。 ネットワークパラメータの大幅な削減にもかかわらず、登録品質の全体的な低下は観測されず、元のネット構造が手前のタスクに大きすぎるという結論に至った。

Central venous catheters (CVC) are commonly inserted into the large veins of the neck, e.g. the internal jugular vein (IJV). CVC insertion may cause serious complications like misplacement into an artery or perforation of cervical vessels. Placing a CVC under sonographic guidance is an appropriate method to reduce such adverse events, if anatomical landmarks like venous and arterial vessels can be detected reliably. This task shall be solved by registration of patient individual images vs. an anatomically labelled reference image. In this work, a linear, affine transformation is performed on cervical sonograms, followed by a non-linear transformation to achieve a more precise registration. Voxelmorph (VM), a learning-based library for deformable image registration using a convolutional neural network (CNN) with U-Net structure was used for non-linear transformation. The impact of principal component analysis (PCA)-based pre-denoising of patient individual images, as well as the impact of modified net structures with differing complexities on registration results were examined visually and quantitatively, the latter using metrics for deformation and image similarity. Using the PCA-approximated cervical sonograms resulted in decreased mean deformation lengths between 18% and 66% compared to their original image counterparts, depending on net structure. In addition, reducing the number of convolutional layers led to improved image similarity with PCA images, while worsening in original images. Despite a large reduction of network parameters, no overall decrease in registration quality was observed, leading to the conclusion that the original net structure is oversized for the task at hand.
翻訳日:2023-01-24 16:25:59 公開日:2023-01-20
# 石油・ガス運転におけるその場水質モニタリング

In-situ Water quality monitoring in Oil and Gas operations ( http://arxiv.org/abs/2301.08800v1 )

ライセンス: Link先を確認
Satish Kumar, Rui Kou, Henry Hill, Jake Lempges, Eric Qian, and Vikram Jayaram(参考訳) 農業から鉱業、エネルギーに至るまで、水質モニタリングは重要な課題である。 石油・ガス事業者が淡水の消費を減らすために活動する中、長期にわたって生鮮・非フレッシュの水資源を積極的に管理することが重要となる。 大規模なモニタリングのためには、多くの場所で手動のサンプリングが時間がかかりすぎて持続不可能になり、多くの分散した池、小さな湖、プレイア、湿地が広い範囲に分散している。 したがって、衛星による環境モニタリングは大きな可能性を秘めている。 既存の衛星ベースの監視研究の多くは、川や海などの大きな水域を監視するためにインデックスベースの手法を使用している。 しかし,小池の観測では,小型水域から受信した反射信号が弱すぎて検出できなかった。 この課題に対処するために, 反射率の弱い水域における汚染レベルを推定できる新しい水質指標(WQEI)モデルを提案する。 私たちの結果は 1)wqeiは,実験室で測定した1200試料の水濁度を示す良質な指標である。 2) 一般に利用可能な衛星データ(LandSat8など)に本手法を適用することにより, 広域で高精度な水質モニタリングを実現することができる。 これは、水面貯水池に蓄えられた水の品質を最適化し、非フレッシュ水の即応性と可用性を高めるためのツールを提供する。

From agriculture to mining, to energy, surface water quality monitoring is an essential task. As oil and gas operators work to reduce the consumption of freshwater, it is increasingly important to actively manage fresh and non-fresh water resources over the long term. For large-scale monitoring, manual sampling at many sites has become too time-consuming and unsustainable, given the sheer number of dispersed ponds, small lakes, playas, and wetlands over a large area. Therefore, satellite-based environmental monitoring presents great potential. Many existing satellite-based monitoring studies utilize index-based methods to monitor large water bodies such as rivers and oceans. However, these existing methods fail when monitoring small ponds-the reflectance signal received from small water bodies is too weak to detect. To address this challenge, we propose a new Water Quality Enhanced Index (WQEI) Model, which is designed to enable users to determine contamination levels in water bodies with weak reflectance patterns. Our results show that 1) WQEI is a good indicator of water turbidity validated with 1200 water samples measured in the laboratory, and 2) by applying our method to commonly available satellite data (e.g. LandSat8), one can achieve high accuracy water quality monitoring efficiently in large regions. This provides a tool for operators to optimize the quality of water stored within surface storage ponds and increasing the readiness and availability of non-fresh water.
翻訳日:2023-01-24 16:25:32 公開日:2023-01-20
# DeepCOVID-Fuse: 胸部X線写真と臨床変数を併用した多モード深層学習モデル

DeepCOVID-Fuse: A Multi-modality Deep Learning Model Fusing Chest X-Radiographs and Clinical Variables to Predict COVID-19 Risk Levels ( http://arxiv.org/abs/2301.08798v1 )

ライセンス: Link先を確認
Yunan Wu, Amil Dravid, Ramsey Michael Wehbe, Aggelos K. Katsaggelos(参考訳) 目的:DeepCOVID-Fuseは、2019年新型コロナウイルス感染症(COVID-19)患者のリスクレベルを予測するディープラーニング融合モデルであり、胸部X線(CXR)と胸部X線(CXR)と臨床変数の完全または部分組み合わせによる事前学習融合モデルの性能を評価する。 材料と方法:2020年2月から2020年4月にかけて, 初期CXR, 臨床変数, 成績(死亡, 挿管, 入院期間, ICU入院)を基準基準として, 逆転写ポリメラーゼ鎖反応 (RT-PCR) 試験結果を収集した。 リスクレベルは結果によって決定された。 融合モデルは1657人の患者(年齢:58.30 +/- 17.74、女性:807)に訓練され、ノースウェスタン記念医療システムから428人の患者(56.41 +/- 17.03; 190)に検証され、1つのホールドアウト病院から439人の患者(56.51 +/- 17.78; 205)に試験された。 実測値, 精度, 精度, リコール値およびF1に対するMcNemar試験と, 受信機動作特性曲線(AUC)の領域に対するDeLong試験を用いて, 実測値および部分変調値に対する事前学習型核融合モデルの性能を比較した。 結果: CXRと臨床変数で訓練されたDeepCOVID-Fuseの精度は0.658であり, AUCは0.842であり, CXRで訓練されたモデルでは0.621, AUCは0.807, 臨床変数では0.440, AUCは0.502であった。 CXRのみを入力とする予訓練核融合モデルでは精度が0.632、AUCが0.813、臨床変数のみが0.539、AUCが0.733となる。 結論: 融合モデルは、トレーニング中に異なるモダリティを越えてより良い特徴表現を学習し、テストでいくつかのモダリティしか使われなくても良い結果を予測する。

Propose: To present DeepCOVID-Fuse, a deep learning fusion model to predict risk levels in patients with confirmed coronavirus disease 2019 (COVID-19) and to evaluate the performance of pre-trained fusion models on full or partial combination of chest x-ray (CXRs) or chest radiograph and clinical variables. Materials and Methods: The initial CXRs, clinical variables and outcomes (i.e., mortality, intubation, hospital length of stay, ICU admission) were collected from February 2020 to April 2020 with reverse-transcription polymerase chain reaction (RT-PCR) test results as the reference standard. The risk level was determined by the outcome. The fusion model was trained on 1657 patients (Age: 58.30 +/- 17.74; Female: 807) and validated on 428 patients (56.41 +/- 17.03; 190) from Northwestern Memorial HealthCare system and was tested on 439 patients (56.51 +/- 17.78; 205) from a single holdout hospital. Performance of pre-trained fusion models on full or partial modalities were compared on the test set using the DeLong test for the area under the receiver operating characteristic curve (AUC) and the McNemar test for accuracy, precision, recall and F1. Results: The accuracy of DeepCOVID-Fuse trained on CXRs and clinical variables is 0.658, with an AUC of 0.842, which significantly outperformed (p < 0.05) models trained only on CXRs with an accuracy of 0.621 and AUC of 0.807 and only on clinical variables with an accuracy of 0.440 and AUC of 0.502. The pre-trained fusion model with only CXRs as input increases accuracy to 0.632 and AUC to 0.813 and with only clinical variables as input increases accuracy to 0.539 and AUC to 0.733. Conclusion: The fusion model learns better feature representations across different modalities during training and achieves good outcome predictions even when only some of the modalities are used in testing.
翻訳日:2023-01-24 16:25:10 公開日:2023-01-20
# アルツハイマー病患者支援のための拡張現実とモノのインターネットの統合の可能性評価

Evaluating the Possibility of Integrating Augmented Reality and Internet of Things Technologies to Help Patients with Alzheimer's Disease ( http://arxiv.org/abs/2301.08795v1 )

ライセンス: Link先を確認
Fatemeh Ghorbani, Mohammad Kia, Mehdi Delrobaei, Quazi Rahman(参考訳) アルツハイマー病(AD)に苦しむ人々とその介護者は、記憶喪失に対処するための異なるアプローチを模索する。 ad患者は独立して生活したいが、介護者からの援助がしばしば必要である。 この状況では、介護者は患者を家に置いておく前に、すべての物にメモを貼ったり、引き出しの中身を取り出して見えるようにすることができる。 本研究では,AD患者を支援することを目的とした,IoT(Internet of Things)とAR(Augmented Reality)の概念を通じて実現されたAAL(Ambient Assisted Living)リアルタイムシステムに関する予備的な結果を報告する。 スマートフォンまたはwindowsアプリケーションでは、介護者が自宅の患者の状態をモニターし、患者が危険にさらされている場合は通知することができる。 第2部では、スマートグラスを使用して、環境中のQRコードを認識し、音声、テキスト、あるいは3次元画像の形でタグに関連する情報を受信することができる。 本研究は,予備的な結果を提示し,そのようなシステムを実装する可能性について検討する。

People suffering from Alzheimer's disease (AD) and their caregivers seek different approaches to cope with memory loss. Although AD patients want to live independently, they often need help from caregivers. In this situation, caregivers may attach notes on every single object or take out the contents of a drawer to make them visible before leaving the patient alone at home. This study reports preliminary results on an Ambient Assisted Living (AAL) real-time system, achieved through the Internet of Things (IoT) and Augmented Reality (AR) concepts, aimed at helping people suffering from AD. The system has two main sections: the smartphone or windows application allows caregivers to monitor patients' status at home and be notified if patients are at risk. The second part allows patients to use smart glasses to recognize QR codes in the environment and receive information related to tags in the form of audio, text, or three-dimensional image. This work presents preliminary results and investigates the possibility of implementing such a system.
翻訳日:2023-01-24 16:24:12 公開日:2023-01-20
# 同じ言葉と異なる意味:放送メディア言語における分極傾向の解釈予測と公開談話に対するグランガー因果関係の影響

Same Words, Different Meanings: Interpretable Predictions of Polarization Trends in Broadcast Media Language and Granger Causal Effects on Public Discourse ( http://arxiv.org/abs/2301.08832v1 )

ライセンス: Link先を確認
Xiaohan Ding, Mike Horning and Eugenia H. Rho(参考訳) 過去10年間のオンラインニュースの成長に伴い、政治談話やニュース消費に関する実証的研究は、フィルターバブルやエコーチャンバーの現象に焦点を当てている。 しかし、近年、研究者はそのような現象の影響に関する限られた証拠を明らかにしており、ニュース視聴者間のパルチザン分離は、オンラインニュースの消費だけでは完全には説明できないし、伝統的なレガシメディアの役割は、現在の出来事に関する公的な言説を二極化させるのにも有益であると主張する者もいる。 本研究では,放送メディア言語とソーシャルメディアの談話の関係を調査することで,オンラインメディアと従来メディアの両方を対象とする分析範囲を広げる。 CNNとFox Newsの10年分のクローズドキャプション(200万の話者ターン)とTwitterのトポロジカル対応の談話を分析して、アメリカの2大放送ネットワーク間のセマンティックポラリゼーションを測定する新しいフレームワークを提供し、これらのアウトレット間のセマンティックポラリゼーションがどのように進化したかを実証する(Study 1)。 2)twitterにおける党派的議論(スタディ) 3)過去10年間にわたって。 以上の結果から,この2つのチャネル間において,特に2016年以降に重要なキーワードが議論され,2020年にはピークが最高となった。 2つの局は、2020年に異なる文脈で同一の話題について議論し、同一のキーワードが文脈的に議論される方法に言語的な重複がほとんどない範囲で議論した。 さらに,このようなメディア言語における党派分断がtwitterにおける意味的極性トレンド(およびその逆)を著しく形成する様子を初めて実証的に示し,オンライン議論がテレビ放送メディアにどのように影響されているかを示す。

With the growth of online news over the past decade, empirical studies on political discourse and news consumption have focused on the phenomenon of filter bubbles and echo chambers. Yet recently, scholars have revealed limited evidence around the impact of such phenomenon, leading some to argue that partisan segregation across news audiences cannot be fully explained by online news consumption alone and that the role of traditional legacy media may be as salient in polarizing public discourse around current events. In this work, we expand the scope of analysis to include both online and more traditional media by investigating the relationship between broadcast news media language and social media discourse. By analyzing a decade's worth of closed captions (2 million speaker turns) from CNN and Fox News along with topically corresponding discourse from Twitter, we provide a novel framework for measuring semantic polarization between America's two major broadcast networks to demonstrate how semantic polarization between these outlets has evolved (Study 1), peaked (Study 2) and influenced partisan discussions on Twitter (Study 3) across the last decade. Our results demonstrate a sharp increase in polarization in how topically important keywords are discussed between the two channels, especially after 2016, with overall highest peaks occurring in 2020. The two stations discuss identical topics in drastically distinct contexts in 2020, to the extent that there is barely any linguistic overlap in how identical keywords are contextually discussed. Further, we demonstrate at scale, how such partisan division in broadcast media language significantly shapes semantic polarity trends on Twitter (and vice-versa), empirically linking for the first time, how online discussions are influenced by televised media.
翻訳日:2023-01-24 16:16:39 公開日:2023-01-20
# 癌遺伝子予測のための説明可能な多層グラフニューラルネットワーク

Explainable Multilayer Graph Neural Network for Cancer Gene Prediction ( http://arxiv.org/abs/2301.08831v1 )

ライセンス: Link先を確認
Michail Chatzianastasis, Michalis Vazirgiannis, Zijun Zhang(参考訳) 癌遺伝子の同定は、がんゲノム研究において重要な問題であるが、難しい問題である。 近年、ディープニューラルネットワークを含むいくつかの計算手法が開発されている。 しかし、これらの手法は多層的な遺伝子-遺伝子相互作用をうまく利用できず、その予測についてはほとんど説明できない。 本研究では,複数の遺伝子-遺伝子相互作用ネットワークとマルチオミクスデータを用いて,がん遺伝子を同定するための多層グラフニューラルネットワーク(emgnn)手法を提案する。 従来のグラフ学習法と比較して、EMGNNは複数のグラフで補完情報を学習し、がん遺伝子を正確に予測した。 提案手法は既存のアプローチを常に上回りながら,その予測に貴重な生物学的洞察を与えている。 新たながん遺伝子予測をさらにリリースし、既知のがんパターンと結びつけ、がん研究の進展を加速することを目指しています。

The identification of cancer genes is a critical, yet challenging problem in cancer genomics research. Recently, several computational methods have been developed to address this issue, including deep neural networks. However, these methods fail to exploit the multilayered gene-gene interactions and provide little to no explanation for their predictions. Results: In this study, we propose an Explainable Multilayer Graph Neural Network (EMGNN) approach to identify cancer genes, by leveraging multiple gene-gene interaction networks and multi-omics data. Compared to conventional graph learning methods, EMGNN learned complementary information in multiple graphs to accurately predict cancer genes. Our method consistently outperforms existing approaches while providing valuable biological insights into its predictions. We further release our novel cancer gene predictions and connect them with known cancer patterns, aiming to accelerate the progress of cancer research
翻訳日:2023-01-24 16:16:00 公開日:2023-01-20
# ベストレスポンスアンサンブルによる利用性最小化による計算平衡

Computing equilibria by minimizing exploitability with best-response ensembles ( http://arxiv.org/abs/2301.08830v1 )

ライセンス: Link先を確認
Carlos Martin, Tuomas Sandholm(参考訳) 本稿では,連続ゲームのナッシュ平衡を近似的に計算する問題について検討する。 このようなゲームは、空間、時間、お金、その他の細かい資源や量を含む多くの状況を自然にモデル化する。 戦略プロファイルのナッシュ均衡への近さの標準的な尺度は、プレーヤが戦略を一方的に変更することでどれだけの利益を得ることができるかを測定する搾取可能性である。 評価可能性の近似を最小化する新しい平衡フィニング法を提案する。 この近似は各プレイヤーにベスト・レスポンス・アンサンブルを用いており、各プレイヤーには複数の候補のベスト・レスポンスを維持できる。 各イテレーションでは、各アンサンブルのベストパフォーマンス要素をグラデーションベースのスキームで使用して、現在の戦略プロファイルを更新する。 戦略プロファイルと最善応答アンサンブルは、それぞれ、近似利用性を最小化し、最大化するために同時に訓練される。 一連のベンチマークゲームの実験では、以前の方法よりも優れていた。

In this paper, we study the problem of computing an approximate Nash equilibrium of a continuous game. Such games naturally model many situations involving space, time, money, and other fine-grained resources or quantities. The standard measure of the closeness of a strategy profile to Nash equilibrium is exploitability, which measures how much utility players can gain from changing their strategy unilaterally. We introduce a new equilibrium-finding method that minimizes an approximation of the exploitability. This approximation employs a best-response ensemble for each player that maintains multiple candidate best responses for that player. In each iteration, the best-performing element of each ensemble is used in a gradient-based scheme to update the current strategy profile. The strategy profile and best-response ensembles are simultaneously trained to minimize and maximize the approximate exploitability, respectively. Experiments on a suite of benchmark games show that it outperforms previous methods.
翻訳日:2023-01-24 16:15:46 公開日:2023-01-20
# メンタルヘルス施設のためのAI対応RPM

AI enabled RPM for Mental Health Facility ( http://arxiv.org/abs/2301.08828v1 )

ライセンス: Link先を確認
Thanveer Shaik, Xiaohui Tao, Niall Higgins, Haoran Xie, Raj Gururajan, Xujuan Zhou(参考訳) メンタルヘルスは、患者のうつ病、ストレスが自己傷につながり、同僚の患者や医療スタッフに脅威をもたらすことを懸念する、医療業界における重要な部分の1つである。 患者とスタッフの双方に対して、攻撃性または扇動性患者を遠隔で監視し、バイタルサインや身体活動を継続的に追跡する必要がある治療環境を提供する。 非侵襲技術を用いた遠隔患者モニタリング(RPM)は、精神医療施設における急性疾患患者の接触のないモニタリングを可能にする。 RPMシステムをAIで実現することで、将来の患者のバイタルサインを予測できる予測環境が解放される。 本稿では,非侵襲デジタル技術RFIDを用いたAI対応RPMシステムフレームワークについて述べる。 検索した時系列データに基づいて、今後3時間にわたって患者の健康的な兆候を示し、身体活動はラベル付き身体活動10に分類する。 この枠組みは、予期せぬ臨床災害を避け、適切な医療介入による予防措置を取るのに役立つ。 本研究は,AI対応RPMシステムを用いた中高年PTSD患者の症例研究である。

Mental healthcare is one of the prominent parts of the healthcare industry with alarming concerns related to patients depression, stress leading to self-harm and threat to fellow patients and medical staff. To provide a therapeutic environment for both patients and staff, aggressive or agitated patients need to be monitored remotely and track their vital signs and physical activities continuously. Remote patient monitoring (RPM) using non-invasive technology could enable contactless monitoring of acutely ill patients in a mental health facility. Enabling the RPM system with AI unlocks a predictive environment in which future vital signs of the patients can be forecasted. This paper discusses an AI-enabled RPM system framework with a non-invasive digital technology RFID using its in-built NCS mechanism to retrieve vital signs and physical actions of patients. Based on the retrieved time series data, future vital signs of patients for the upcoming 3 hours and classify their physical actions into 10 labelled physical activities. This framework assists to avoid any unforeseen clinical disasters and take precautionary measures with medical intervention at right time. A case study of a middle-aged PTSD patient treated with the AI-enabled RPM system is demonstrated in this study.
翻訳日:2023-01-24 16:15:31 公開日:2023-01-20
# 教育フィードバック分析における自然言語処理手法導入の動向と課題

A Review of the Trends and Challenges in Adopting Natural Language Processing Methods for Education Feedback Analysis ( http://arxiv.org/abs/2301.08826v1 )

ライセンス: Link先を確認
Thanveer Shaik, Xiaohui Tao, Yan Li, Christopher Dann, Jacquie Mcdonald, Petrea Redmond, Linda Galligan(参考訳) 人工知能(AI)は多くのビジネスや研究領域にその存在を拡大する急速に成長する研究分野である。 機械学習、ディープラーニング、自然言語処理(NLP)はAIのサブセットであり、データ処理とモデリングのさまざまな領域に取り組む。 本稿では,現在の機会を概説する教育におけるaiの影響について概説する。 教育分野では,学生に提供される既存サービスのメリットとデメリットを明らかにするためには,学生のフィードバックデータが必要である。 AIは、教育インフラ、学習管理システム、教育実践、学習環境の改善領域の特定を支援することができる。 NLP技術は、学生のフィードバックをテキスト形式で分析する上で重要な役割を果たす。 本研究は、センチメントアノテーション、エンティティアノテーション、テキスト要約、トピックモデリングといった教育ドメインアプリケーションに適用可能な、既存のnlp方法論とアプリケーションに焦点を当てます。 教育におけるNLP導入の動向と課題を概観した。 サルカズム、ドメイン固有言語、あいまいさ、アスペクトベースの感情分析といったNLPにおけるコンテキストベースの課題は、それらを克服するために既存の方法論で説明される。 教育におけるNLP導入におけるユーザの意見や課題を伝達するエモティコンの意味と特別な文字を抽出する研究コミュニティのアプローチについて検討する。

Artificial Intelligence (AI) is a fast-growing area of study that stretching its presence to many business and research domains. Machine learning, deep learning, and natural language processing (NLP) are subsets of AI to tackle different areas of data processing and modelling. This review article presents an overview of AI impact on education outlining with current opportunities. In the education domain, student feedback data is crucial to uncover the merits and demerits of existing services provided to students. AI can assist in identifying the areas of improvement in educational infrastructure, learning management systems, teaching practices and study environment. NLP techniques play a vital role in analyzing student feedback in textual format. This research focuses on existing NLP methodologies and applications that could be adapted to educational domain applications like sentiment annotations, entity annotations, text summarization, and topic modelling. Trends and challenges in adopting NLP in education were reviewed and explored. Contextbased challenges in NLP like sarcasm, domain-specific language, ambiguity, and aspect-based sentiment analysis are explained with existing methodologies to overcome them. Research community approaches to extract the semantic meaning of emoticons and special characters in feedback which conveys user opinion and challenges in adopting NLP in education are explored.
翻訳日:2023-01-24 16:15:14 公開日:2023-01-20
# スマートコントラクトのための脆弱性自動検出フレームワーク

An Automated Vulnerability Detection Framework for Smart Contracts ( http://arxiv.org/abs/2301.08824v1 )

ライセンス: Link先を確認
Feng Mi, Chen Zhao, Zhuoyi Wang, Sadaf MD Halim, Xiaodi Li, Zhouxiang Wu, Latifur Khan and Bhavani Thuraisingham(参考訳) さまざまな問題に対する分散ソリューションの提供にブロックチェーン技術が採用されることで、スマートコントラクトがより普及し、何十億ドルもの米国ドルが日々このような技術を通じて交換されている。 一方、スマートコントラクトのさまざまな脆弱性は、攻撃者が数百万ドル相当の暗号通貨を盗むために悪用されている。 したがって、スマートコントラクトの脆弱性の自動検出は重要な研究課題である。 この問題に対する既存のソリューションは、特に脆弱性を検出するために機能や異なるルールを定義する人間の専門家に依存している。 しかし、これはしばしば多くの脆弱性を無視し、新しい脆弱性を検出するのに非効率である。 本研究では,ブロックチェーン上のスマートコントラクトの脆弱性を自動的に検出するフレームワークを提案する。 具体的には,スマートコントラクトのソースコードが公開されていないため,スマートコントラクトのバイトコードから新たな特徴ベクトル生成技術を利用する。 次に、収集したベクトルを新しいメトリック学習ベースディープニューラルネットワーク(DNN)に入力し、検出結果を得る。 大規模ベンチマークの総合的な実験を行い、定量的な結果から提案手法の有効性と有効性を示す。

With the increase of the adoption of blockchain technology in providing decentralized solutions to various problems, smart contracts have become more popular to the point that billions of US Dollars are currently exchanged every day through such technology. Meanwhile, various vulnerabilities in smart contracts have been exploited by attackers to steal cryptocurrencies worth millions of dollars. The automatic detection of smart contract vulnerabilities therefore is an essential research problem. Existing solutions to this problem particularly rely on human experts to define features or different rules to detect vulnerabilities. However, this often causes many vulnerabilities to be ignored, and they are inefficient in detecting new vulnerabilities. In this study, to overcome such challenges, we propose a framework to automatically detect vulnerabilities in smart contracts on the blockchain. More specifically, first, we utilize novel feature vector generation techniques from bytecode of smart contract since the source code of smart contracts are rarely available in public. Next, the collected vectors are fed into our novel metric learning-based deep neural network(DNN) to get the detection result. We conduct comprehensive experiments on large-scale benchmarks, and the quantitative results demonstrate the effectiveness and efficiency of our approach.
翻訳日:2023-01-24 16:14:54 公開日:2023-01-20
# HALOC:小型ニューラルネットワークのためのハードウェア対応低ランク自動圧縮

HALOC: Hardware-Aware Automatic Low-Rank Compression for Compact Neural Networks ( http://arxiv.org/abs/2301.09422v1 )

ライセンス: Link先を確認
Jinqi Xiao, Chengming Zhang, Yu Gong, Miao Yin, Yang Sui, Lizhi Xiang, Dingwen Tao, Bo Yuan(参考訳) 低ランク圧縮は、コンパクトニューラルネットワークモデルを得るための重要なモデル圧縮戦略である。 一般に、ランクの値はモデルの複雑さとモデルの精度を直接決定するので、階層的なランクの適切な選択は非常に重要で望ましい。 これまでは、手動または自動でランクを選択するような低ランク圧縮手法が提案されてきたが、コストのかかる手動試験や不満足な圧縮性能に悩まされている。 加えて、既存の作品はすべてハードウェアを意識した設計ではなく、実世界のハードウェアプラットフォームにおける圧縮モデルの実用性能を制限している。 これらの課題に対処するため,ハードウェア対応の低ランク自動圧縮フレームワークであるHALOCを提案する。 アーキテクチャ検索の観点から、自動階位選択を解釈することにより、適切な階位を微分可能かつハードウェア的に決定するエンド・ツー・エンドのソリューションを開発する。 さらに, ランク空間を効率的に探索し, 潜在的な干渉問題を低減するための設計原理と緩和戦略を提案する。 異なるデータセットとハードウェアプラットフォームにおける実験結果は,提案手法の有効性を示している。 CIFAR-10データセットでは、HALOCは圧縮されていない ResNet-20 と VGG-16 モデルに対して 0.07% と 0.38% の精度向上を可能にし、それぞれ 72.20% と 86.44% の FLOP を削減した。 ImageNetデータセットでは、HALOCはオリジナルのResNet-18モデルよりも0.9%高いトップ1精度を実現し、FLOPは66.16%減少した。 HALOCはまた、計算コストとメモリコストの少ない最先端の自動低ランク圧縮ソリューションよりも0.66%高いトップ1精度の向上を示している。 さらにHALOCは、デスクトップGPU、組み込みGPU、ASICアクセラレータの測定結果によって検証された、さまざまなハードウェアプラットフォーム上での実践的なスピードアップを実証している。

Low-rank compression is an important model compression strategy for obtaining compact neural network models. In general, because the rank values directly determine the model complexity and model accuracy, proper selection of layer-wise rank is very critical and desired. To date, though many low-rank compression approaches, either selecting the ranks in a manual or automatic way, have been proposed, they suffer from costly manual trials or unsatisfied compression performance. In addition, all of the existing works are not designed in a hardware-aware way, limiting the practical performance of the compressed models on real-world hardware platforms. To address these challenges, in this paper we propose HALOC, a hardware-aware automatic low-rank compression framework. By interpreting automatic rank selection from an architecture search perspective, we develop an end-to-end solution to determine the suitable layer-wise ranks in a differentiable and hardware-aware way. We further propose design principles and mitigation strategy to efficiently explore the rank space and reduce the potential interference problem. Experimental results on different datasets and hardware platforms demonstrate the effectiveness of our proposed approach. On CIFAR-10 dataset, HALOC enables 0.07% and 0.38% accuracy increase over the uncompressed ResNet-20 and VGG-16 models with 72.20% and 86.44% fewer FLOPs, respectively. On ImageNet dataset, HALOC achieves 0.9% higher top-1 accuracy than the original ResNet-18 model with 66.16% fewer FLOPs. HALOC also shows 0.66% higher top-1 accuracy increase than the state-of-the-art automatic low-rank compression solution with fewer computational and memory costs. In addition, HALOC demonstrates the practical speedups on different hardware platforms, verified by the measurement results on desktop GPU, embedded GPU and ASIC accelerator.
翻訳日:2023-01-24 13:34:31 公開日:2023-01-20
# SMARTS環境における多元的Deep Deterministic Policy Gradientsとその説明可能性について

On Multi-Agent Deep Deterministic Policy Gradients and their Explainability for SMARTS Environment ( http://arxiv.org/abs/2301.09420v1 )

ライセンス: Link先を確認
Ansh Mittal, Aditya Malte(参考訳) MARL(Multi-Agent RL)は、自律走行文学における複雑な問題の1つで、今日の完全自動運転車のリリースを妨げている。 いくつかのシミュレーターは、自律運転における複数のエージェントによる複雑なシナリオの問題を軽減するために、開始後に反復されている。 このようなシミュレーター--smartsは、協調型マルチエージェント学習の重要性を論じている。 そこで本稿では,政治と政治以外のRLアプローチに基づくMAPPOとMADDPGの2つのアプローチについて論じる。 我々は,この課題に対する最新の結果と比較し,スマート環境におけるwaypointsと連携して,これらのアプローチの説明可能性について議論しながら,改善の潜在的領域について論じる。

Multi-Agent RL or MARL is one of the complex problems in Autonomous Driving literature that hampers the release of fully-autonomous vehicles today. Several simulators have been in iteration after their inception to mitigate the problem of complex scenarios with multiple agents in Autonomous Driving. One such simulator--SMARTS, discusses the importance of cooperative multi-agent learning. For this problem, we discuss two approaches--MAPPO and MADDPG, which are based on-policy and off-policy RL approaches. We compare our results with the state-of-the-art results for this challenge and discuss the potential areas of improvement while discussing the explainability of these approaches in conjunction with waypoints in the SMARTS environment.
翻訳日:2023-01-24 13:34:04 公開日:2023-01-20
# 時間認識変換器を用いたロバストビデオインスタンス分割に向けて

Towards Robust Video Instance Segmentation with Temporal-Aware Transformer ( http://arxiv.org/abs/2301.09416v1 )

ライセンス: Link先を確認
Zhenghao Zhang and Fangtao Shao and Zuozhuo Dai and Siyu Zhu(参考訳) 既存の変圧器をベースとしたビデオインスタンス分割手法は,フレーム毎に独立に抽出されるため,外観変形問題の解決は困難である。 本稿では,時間的情報も重要であり,トランスエンコーダとデコーダの両方において時空間的特徴を集約するタフォーマを提案する。 具体的には、トランスエンコーダにおいて、空間情報と時間情報を動的に統合し、高密度な時空間特徴を得る新しい時空間共同変形型アテンションモジュールを提案する。 変換器デコーダでは,時間的関係を持つフレームレベルボックスクエリを強化するための時間的自己アテンションモジュールを導入する。 さらに、TAFormerはインスタンスレベルのコントラスト損失を採用し、インスタンスクエリの埋め込みの識別可能性を高める。 これにより、視覚的に類似したインスタンスによるトラッキングエラーを低減できる。 実験結果から,TAFormerは空間情報と時間情報を有効利用してコンテキスト認識特徴表現を求め,最先端の手法より優れることがわかった。

Most existing transformer based video instance segmentation methods extract per frame features independently, hence it is challenging to solve the appearance deformation problem. In this paper, we observe the temporal information is important as well and we propose TAFormer to aggregate spatio-temporal features both in transformer encoder and decoder. Specifically, in transformer encoder, we propose a novel spatio-temporal joint multi-scale deformable attention module which dynamically integrates the spatial and temporal information to obtain enriched spatio-temporal features. In transformer decoder, we introduce a temporal self-attention module to enhance the frame level box queries with the temporal relation. Moreover, TAFormer adopts an instance level contrastive loss to increase the discriminability of instance query embeddings. Therefore the tracking error caused by visually similar instances can be decreased. Experimental results show that TAFormer effectively leverages the spatial and temporal information to obtain context-aware feature representation and outperforms state-of-the-art methods.
翻訳日:2023-01-24 13:33:51 公開日:2023-01-20
# eegからのパーキンソン病分類への時系列的アプローチ

A Time Series Approach to Parkinson's Disease Classification from EEG ( http://arxiv.org/abs/2301.09568v1 )

ライセンス: Link先を確認
Amarpal Sahota, Amber Roguski, Matthew W. Jones, Michal Rolinski, Alan Whone, Raul Santos-Rodriguez, Zahraa S. Abdallah(参考訳) まず,帯域パワー係数の7変量列である脳波データに対する新しい表現法を提案する。 具体的には,マルチ解像度表現に基づく時系列分類手法MrSQLを実装した。 これは、ウェイクフルとスリープEEGを含むアーリーステージのParkinsonのデータセットにデプロイされる。 初期の結果は、使用するすべてのEEGデータタイプに対して90%以上の精度で達成されている。 第2に、分類のための高重要性データ型と脳領域を識別するフレームワークを提案する。 私たちのフレームワークを使って、さまざまな脳波データタイプにわたって、パーキンソン病の存在を最も予測する能力を持つ前頭前脳領域であることが分かりました。 このアウトパフォーマンスは、他の12の脳領域(隣り合う左前頭葉と右前頭葉)のうち10と統計的に有意であった。 脳の前頭前野領域は高次認知過程において重要であり,本研究はパーキンソン病の前頭前野の神経機能障害を呈する研究と一致している。

Firstly, we present a novel representation for EEG data, a 7-variate series of band power coefficients, which enables the use of (previously inaccessible) time series classification methods. Specifically, we implement the multi-resolution representation-based time series classification method MrSQL. This is deployed on a challenging early-stage Parkinson's dataset that includes wakeful and sleep EEG. Initial results are promising with over 90% accuracy achieved on all EEG data types used. Secondly, we present a framework that enables high-importance data types and brain regions for classification to be identified. Using our framework, we find that, across different EEG data types, it is the Prefrontal brain region that has the most predictive power for the presence of Parkinson's Disease. This outperformance was statistically significant versus ten of the twelve other brain regions (not significant versus adjacent Left Frontal and Right Frontal regions). The Prefrontal region of the brain is important for higher-order cognitive processes and our results align with studies that have shown neural dysfunction in the prefrontal cortex in Parkinson's Disease.
翻訳日:2023-01-24 12:59:22 公開日:2023-01-20
# D適応による学習時間自由学習

Learning-Rate-Free Learning by D-Adaptation ( http://arxiv.org/abs/2301.07733v2 )

ライセンス: Link先を確認
Aaron Defazio and Konstantin Mishchenko(参考訳) 凸リプシッツ関数の勾配降下速度は、学習率の選択に大きく依存する。 最適収束率を達成するために学習率を設定するには、初期点から解集合までの距離Dを知る必要がある。 本研究では,逆追跡や行探索を伴わない単一ループ法について述べる。これは,D$の知識を必要としないが,漸近的に凸リプシッツ関数の複雑性クラスに対する収束率の最適値を達成する。 本手法は,収束率に乗算的ログ係数を付加することなく,このクラスで最初のパラメータフリー手法である。 本手法のSGDおよびAdam変種に対する広範な実験を行い,大規模ビジョンや言語問題を含む12以上の機械学習問題に対して手作業による学習率を自動的にマッチングする手法を提案する。 提案手法は実用的で効率的であり,各ステップに付加的な関数値や勾配評価を必要としない。 オープンソース実装が利用可能である(https://github.com/facebookresearch/dadaptation)。

The speed of gradient descent for convex Lipschitz functions is highly dependent on the choice of learning rate. Setting the learning rate to achieve the optimal convergence rate requires knowing the distance D from the initial point to the solution set. In this work, we describe a single-loop method, with no back-tracking or line searches, which does not require knowledge of $D$ yet asymptotically achieves the optimal rate of convergence for the complexity class of convex Lipschitz functions. Our approach is the first parameter-free method for this class without additional multiplicative log factors in the convergence rate. We present extensive experiments for SGD and Adam variants of our method, where the method automatically matches hand-tuned learning rates across more than a dozen diverse machine learning problems, including large-scale vision and language problems. Our method is practical, efficient and requires no additional function value or gradient evaluations each step. An open-source implementation is available (https://github.com/facebookresearch/dadaptation).
翻訳日:2023-01-23 14:35:08 公開日:2023-01-20
# Infinite Tailは最適な空間探索に勝てない

No Infinite Tail Beats Optimal Spatial Search ( http://arxiv.org/abs/2301.07251v2 )

ライセンス: Link先を確認
Weichen Xie and Christino Tamon(参考訳) Farhi and Gutmann (Physical Review A, 57(4):2403, 1998) は、グロバー探索(空間探索とも呼ばれる)の連続時間アナログが全グラフ上で最適であることを証明した。 この結果は、無限に長い経路(または尾)が存在する場合でも、完全グラフにおいて空間探索が最適であることを示して拡張する。 後者を有限量子系との限定的かつ非自明な相互作用を持つ外部量子系と考えると、空間探索はコヒーレントな無限一次元プローブに対して頑健であることが示唆される。 さらに, 探索アルゴリズムは, 尾部が存在するか否かを知る必要がなく, かつ, 尾部がどこに取り付けられているかを知ることが困難であることを示す。

Farhi and Gutmann (Physical Review A, 57(4):2403, 1998) proved that a continuous-time analogue of Grover search (also called spatial search) is optimal on the complete graphs. We extend this result by showing that spatial search remains optimal in a complete graph even in the presence of an infinitely long path (or tail). If we view the latter as an external quantum system that has a limited but nontrivial interaction with our finite quantum system, this suggests that spatial search is robust against a coherent infinite one-dimensional probe. Moreover, we show that the search algorithm is oblivious in that it does not need to know whether the tail is present or not, and if so, where it is attached to.
翻訳日:2023-01-23 14:34:52 公開日:2023-01-20
# 量子コンピュータにおける量子多体散乱状態の準備

Preparing quantum many-body scar states on quantum computers ( http://arxiv.org/abs/2301.08226v2 )

ライセンス: Link先を確認
Erik J. Gustafson, Andy C. Y. Li, Abid Khan, Joonho Kim, Doga Murat Kurkcuoglu, M. Sohaib Alam, Peter P. Orth, Armin Rahmani, Thomas Iadecola(参考訳) 量子多体スカー状態は多体系の非常に励起された固有状態であり、同じエネルギー密度の典型的な固有状態と比較して非定型的な絡み合いと相関性を示す。 スカー状態はまた、システムがそれらと有限重なり合う特別な初期状態に準備されるとき、無限に長寿命のコヒーレントダイナミクスを引き起こす。 正確な傷跡状態を持つ多くのモデルが構築されているが、これらのモデルが摂動している際の傷跡固有状態と力学の運命は、古典的な計算手法で研究することは困難である。 本研究では,量子コンピュータを用いてこの問題を研究するための状態準備プロトコルを提案する。 特定のモデルにおける個々の傷痕状態のプロトコルと、コヒーレントなダイナミクスをもたらすそれらの重ね合わせについて述べる。 スカー状態の重畳には, システムサイズ線形深度ユニタリと有限深さ非単項状態準備プロトコルの両方が提案され, 後者は測定とポストセレクションを用いて回路深度を低減している。 個々のスカーレッド固有状態に対して、準ポリリノミアル深度回路を出力する行列積状態と多項式深度アンサッツ回路による変分アプローチに基づいて正確な状態準備アプローチを定式化する。 また、超伝導量子ハードウェアにおける原理状態準備デモも提供する。

Quantum many-body scar states are highly excited eigenstates of many-body systems that exhibit atypical entanglement and correlation properties relative to typical eigenstates at the same energy density. Scar states also give rise to infinitely long-lived coherent dynamics when the system is prepared in a special initial state having finite overlap with them. Many models with exact scar states have been constructed, but the fate of scarred eigenstates and dynamics when these models are perturbed is difficult to study with classical computational techniques. In this work, we propose state preparation protocols that enable the use of quantum computers to study this question. We present protocols both for individual scar states in a particular model, as well as superpositions of them that give rise to coherent dynamics. For superpositions of scar states, we present both a system-size-linear depth unitary and a finite-depth nonunitary state preparation protocol, the latter of which uses measurement and postselection to reduce the circuit depth. For individual scarred eigenstates, we formulate an exact state preparation approach based on matrix product states that yields quasipolynomial-depth circuits, as well as a variational approach with a polynomial-depth ansatz circuit. We also provide proof of principle state-preparation demonstrations on superconducting quantum hardware.
翻訳日:2023-01-23 14:24:28 公開日:2023-01-20
# パラメトリック増幅による捕捉2次元イオン結晶による量子シミュレーションとセンシングの改善に向けて

Towards Improved Quantum Simulations and Sensing with Trapped 2D Ion Crystals via Parametric Amplification ( http://arxiv.org/abs/2301.08195v2 )

ライセンス: Link先を確認
Matt Affolter, Wenchao Ge, Bryce Bullock, Shaun C. Burd, Kevin A. Gilmore, Jennifer F. Lilieholm, Allison L. Carter, John J. Bollinger(参考訳) コヒーレンスの改善は、量子シミュレーションとトラップイオンを用いたセンシング実験における根本的な課題である。 そこで我々は, スピン依存力で得られたイオンの運動パラメトリック励起により, 粒子のコヒーレントなスピン運動結合を増強する2つの異なるプロトコルの潜在的影響を, 実験的に検証し, 評価する。 実験はペニングトラップに閉じ込められた約100ドル^9$Be$^+$イオンの2次元結晶アレイ上で実施される。 中心モード周波数の約2倍のトラッピング電位を変調することにより、運動モードを圧縮し、スピンコヒーレンスを維持しながらスピン-モーションカップリングを増強する。 ストロボスコピックのプロトコルでは、基底状態の運動より下方で5.4 \pm 0.9$ dbの運動を計測し、理論では、最近実証されたプロトコル[science $\textbf{373}$, 673 (2021)]を使用して、小さな変位を測定する感度の10ドルのdbを予測している。 連続的スクイーズプロトコルを用いてパラメトリック結合強度を測定し,正確に測定する。 理論上、このプロトコルは、オフ共鳴光散乱によってシステム内で制限された量子スピンスクイーズを改善するために使用できる。 本研究では, 強いパラメトリック増幅と運動強調のトレードオフを, 中心周波数変動の形で数値的に説明し, 設定時の量子スピンスクイーズを改善する。

Improving coherence is a fundamental challenge in quantum simulation and sensing experiments with trapped ions. Here we discuss, experimentally demonstrate, and estimate the potential impacts of two different protocols that enhance, through motional parametric excitation, the coherent spin-motion coupling of ions obtained with a spin-dependent force. The experiments are performed on 2D crystal arrays of approximately one hundred $^9$Be$^+$ ions confined in a Penning trap. By modulating the trapping potential at close to twice the center-of-mass mode frequency, we squeeze the motional mode and enhance the spin-motion coupling while maintaining spin coherence. With a stroboscopic protocol, we measure $5.4 \pm 0.9$ dB of motional squeezing below the ground-state motion, from which theory predicts a $10$ dB enhancement in the sensitivity for measuring small displacements using a recently demonstrated protocol [Science $\textbf{373}$, 673 (2021)]. With a continuous squeezing protocol, we measure and accurately calibrate the parametric coupling strength. Theory suggests this protocol can be used to improve quantum spin squeezing, limited in our system by off-resonant light scatter. We illustrate numerically the trade-offs between strong parametric amplification and motional dephasing in the form of center-of-mass frequency fluctuations for improving quantum spin squeezing in our set-up.
翻訳日:2023-01-23 14:24:03 公開日:2023-01-20
# 量子古典的適応ゲーティングによる時変量子リカレントニューラルネットワーク

Time-Warping Invariant Quantum Recurrent Neural Networks via Quantum-Classical Adaptive Gating ( http://arxiv.org/abs/2301.08173v2 )

ライセンス: Link先を確認
Ivana Nikoloska, Osvaldo Simeone, Leonardo Banchi, and Petar Veli\v{c}kovi\'c(参考訳) アダプティブゲーティングは、未来を予測するのに必要な過去の情報の保持を容易にするため、古典的なリカレントニューラルネットワーク(rnn)による時間的データ処理において重要な役割を果たす。 本稿では,量子メモリを持つ動的モデルであるquantum recurrent neural networks (qrnns) を基盤として,(古典的)入力-出力列の時間-ウォーピング変換に対する不変性を保持する,新しい時間的データ処理量子モデルを提案する。 TWI-QRNN(Time Warping-invariant QRNN)と呼ばれるこのモデルは、古典的リカレントモデルを介して入力シーケンスの過去のサンプルの関数として、各ステップでパラメータ化されたユニタリ変換を適用するかどうかを選択する量子古典的適応ゲーティング機構でQRNNを拡張する。 twi-qrnnモデルクラスは第一原理から導出され、時制変換をうまく実装する能力は古典力学や量子力学の例で実験的に実証されている。

Adaptive gating plays a key role in temporal data processing via classical recurrent neural networks (RNN), as it facilitates retention of past information necessary to predict the future, providing a mechanism that preserves invariance to time warping transformations. This paper builds on quantum recurrent neural networks (QRNNs), a dynamic model with quantum memory, to introduce a novel class of temporal data processing quantum models that preserve invariance to time-warping transformations of the (classical) input-output sequences. The model, referred to as time warping-invariant QRNN (TWI-QRNN), augments a QRNN with a quantum-classical adaptive gating mechanism that chooses whether to apply a parameterized unitary transformation at each time step as a function of the past samples of the input sequence via a classical recurrent model. The TWI-QRNN model class is derived from first principles, and its capacity to successfully implement time-warping transformations is experimentally demonstrated on examples with classical or quantum dynamics.
翻訳日:2023-01-23 14:23:33 公開日:2023-01-20
# 境界カオス: 厳密な絡み合いダイナミクス

Boundary Chaos: Exact Entanglement Dynamics ( http://arxiv.org/abs/2301.08168v2 )

ライセンス: Link先を確認
Felix Fritzsch, Roopayan Ghosh, Toma\v{z} Prosen(参考訳) 我々は、エルゴードと混合量子多体力学を生成する最小のセットアップにおける絡み合いのダイナミクスを計算する。 これは自由で非相互作用のブリックワーク量子回路から成り、カオスとエルゴディシティは不純物相互作用、すなわち2量子ゲートが系の境界に配置されている。 我々は、初期積状態に対する不純物相互作用を含む連結部分系と、初期局所作用素のいわゆる作用素エンタングルメントエントロピーに関して、従来の二部交絡エントロピーを計算する。 これにより、非常に小さなサブシステムまたは非常に大きなサブシステムに対して、時間とシステムサイズの両方の特定のスケーリング制限の正確な結果を提供する。 不純物相互作用の異なるクラスは、非常に異なる絡み合いダイナミクスをもたらすことを示す。 初期状態のバルクを形成する局所生成状態を保存する不純物ゲートに対して、状態の絡み合いエントロピーは、システムサイズによって設定された周期で持続的なスパイクを示し、エルゴード系の予測線形成長とは対照的に、間の絡み合いを抑制する。 一般不純物に対する作用素絡みの同様のダイナミクスを観察する。 対照的に、部分変換の下でユニタリなT-双対不純物に対しては、状態と作用素の絡み合いエントロピーは、系の幾何学によって許容される最大速度に間に合うように線形に成長する。 あらゆるケースにおける相互作用の集中的な性質は、システムサイズに比例する広範な時間スケールで絡み合いを増大させる。

We compute the dynamics of entanglement in the minimal setup producing ergodic and mixing quantum many-body dynamics, which we previously dubbed {\em boundary chaos}. This consists of a free, non-interacting brickwork quantum circuit, in which chaos and ergodicity is induced by an impurity interaction, i.e., an entangling two-qudit gate, placed at the system's boundary. We compute both the conventional bipartite entanglement entropy with respect to a connected subsystem including the impurity interaction for initial product states as well as the so-called operator entanglement entropy of initial local operators. Thereby we provide exact results in a particular scaling limit of both time and system size going to infinity for either very small or very large subsystems. We show that different classes of impurity interactions lead to very distinct entanglement dynamics. For impurity gates preserving a local product state forming the bulk of the initial state, entanglement entropies of states show persistent spikes with period set by the system size and suppressed entanglement in between, contrary to the expected linear growth in ergodic systems. We observe similar dynamics of operator entanglement for generic impurities. In contrast, for T-dual impurities, which remain unitary under partial transposition, we find entanglement entropies of both states and operators to grow linearly in time with the maximum possible speed allowed by the geometry of the system. The intensive nature of interactions in all cases cause entanglement to grow on extensive time scales proportional to system size.
翻訳日:2023-01-23 14:23:11 公開日:2023-01-20
# 条件付き予測による拡散モデル理解

Understanding the diffusion models by conditional expectations ( http://arxiv.org/abs/2301.07882v2 )

ライセンス: Link先を確認
Yubin Lu, Zhongjian Wang, Guillaume Bal(参考訳) 本稿では,機械学習における拡散モデルの数学的解析について述べる。 逆サンプリングプロセスのドリフト項は、データ分布と前方拡散を伴う条件付き期待値として表される。 トレーニングプロセスは,条件付き期待値に関連する平均2乗残差を最小化することにより,そのようなドリフト関数を求めることを目的としている。 前方拡散のグリーン関数を短時間で近似することにより、DDPMにおける解析平均ドリフト関数とSGMにおけるスコア関数が、低次元多様体など特異データ分布のサンプリングプロセスの最終段階において漸近的に爆発し、ネットワークによって近似することが困難であることを示す。 この難しさを克服するため、特異なデータ分布に対しても、新たな目標関数と関連する損失を導出する。 理論的な知見をいくつかの数値例で示す。

This paper provide several mathematical analyses of the diffusion model in machine learning. The drift term of the backwards sampling process is represented as a conditional expectation involving the data distribution and the forward diffusion. The training process aims to find such a drift function by minimizing the mean-squared residue related to the conditional expectation. Using small-time approximations of the Green's function of the forward diffusion, we show that the analytical mean drift function in DDPM and the score function in SGM asymptotically blow up in the final stages of the sampling process for singular data distributions such as those concentrated on lower-dimensional manifolds, and is therefore difficult to approximate by a network. To overcome this difficulty, we derive a new target function and associated loss, which remains bounded even for singular data distributions. We illustrate the theoretical findings with several numerical examples.
翻訳日:2023-01-23 14:22:44 公開日:2023-01-20
# グループ内フェアネス:グループ間フェアネス向上のためのガイダンス

Within-group fairness: A guidance for more sound between-group fairness ( http://arxiv.org/abs/2301.08375v1 )

ライセンス: Link先を確認
Sara Kim, Kyusang Yu, Yongdai Kim(参考訳) 社会的意思決定に重大な影響を与えるため、aiアルゴリズムは正確であるだけでなく、特定の敏感なグループ(非白人女性など)に不公平をもたらすべきではない。 センシティブなグループ間で公平にトレーニングされたAIモデルを保証するために、さまざまな特別に設計されたAIアルゴリズムが開発された。 本稿では、グループ間公正なAIモデルが同一のセンシティブなグループの個人を不公平に扱うことができるという新たな問題を提起する。 我々は、同じセンシティブなグループと異なるセンシティブなグループのグループに対して、AIモデルが公平であることを要求する、いわゆる内集団フェアネスという新しい概念を導入する。 本研究では,群内フェアネスと群間フェアネスを同時に制御する学習アルゴリズムを開発することにより,群内フェアネスの概念を実現する。 数値解析により,提案した学習アルゴリズムは,グループ間の公正さだけでなく,精度を犠牲にすることなくグループ内公正性を向上することが示された。

As they have a vital effect on social decision-making, AI algorithms not only should be accurate and but also should not pose unfairness against certain sensitive groups (e.g., non-white, women). Various specially designed AI algorithms to ensure trained AI models to be fair between sensitive groups have been developed. In this paper, we raise a new issue that between-group fair AI models could treat individuals in a same sensitive group unfairly. We introduce a new concept of fairness so-called within-group fairness which requires that AI models should be fair for those in a same sensitive group as well as those in different sensitive groups. We materialize the concept of within-group fairness by proposing corresponding mathematical definitions and developing learning algorithms to control within-group fairness and between-group fairness simultaneously. Numerical studies show that the proposed learning algorithms improve within-group fairness without sacrificing accuracy as well as between-group fairness.
翻訳日:2023-01-23 14:08:00 公開日:2023-01-20
# 平均場変分推論のための効率的な二次系列とスパース化手法

An Efficient Quadrature Sequence and Sparsifying Methodology for Mean-Field Variational Inference ( http://arxiv.org/abs/2301.08374v1 )

ライセンス: Link先を確認
Jed A. Duersch(参考訳) 本研究では,高次元平均場変分推論のための準乱数列と関連するスパース化手法を提案する。 列の各反復は、平均場因子が対称であれば、すべての単変数二次函数と単変数立方体を正しく統合する2つの評価点を含む。 より重要なことに、短い部分列に対する平均的な結果が、二次全次数の多変量多項式のより広い空間上の周期的完全性を達成する。 この枠組みは、最初に確率的ブロック平均場二次を考えることで考案され、他の文脈で有用かもしれない。 擬似ランダム列を準ランダム列に置き換えることにより、すべての多変量二次基底関数の半分以上が4つの関数評価と完全に統合され、より長い列に対して精度次元が増加する。 これらの効率的な積分は、ディープラーニングアルゴリズムにおいて頑健なスパース化手法をサポートするために、対角 Hess 近似を含む平均場変動近似に対する支配的な対数後寄与をいかに特徴付けるかを示す。 MNISTのための単純な畳み込みニューラルネットワークに対するこのアプローチの数値的なデモンストレーションでは、96.9%の高いテスト精度を維持し、98.9%のパラメータを10エポックでゼロにトレーニングし、ディープラーニングモデルのストレージとエネルギー要求の両方を削減する可能性がある。

This work proposes a quasirandom sequence of quadratures for high-dimensional mean-field variational inference and a related sparsifying methodology. Each iterate of the sequence contains two evaluations points that combine to correctly integrate all univariate quadratic functions, as well as univariate cubics if the mean-field factors are symmetric. More importantly, averaging results over short subsequences achieves periodic exactness on a much larger space of multivariate polynomials of quadratic total degree. This framework is devised by first considering stochastic blocked mean-field quadratures, which may be useful in other contexts. By replacing pseudorandom sequences with quasirandom sequences, over half of all multivariate quadratic basis functions integrate exactly with only 4 function evaluations, and the exactness dimension increases for longer subsequences. Analysis shows how these efficient integrals characterize the dominant log-posterior contributions to mean-field variational approximations, including diagonal Hessian approximations, to support a robust sparsifying methodology in deep learning algorithms. A numerical demonstration of this approach on a simple Convolutional Neural Network for MNIST retains high test accuracy, 96.9%, while training over 98.9% of parameters to zero in only 10 epochs, bearing potential to reduce both storage and energy requirements for deep learning models.
翻訳日:2023-01-23 14:07:43 公開日:2023-01-20
# 深部MRI再構成のための$k$-spaceサブサンプリング方式について

On Retrospective $k$-space Subsampling schemes For Deep MRI Reconstruction ( http://arxiv.org/abs/2301.08365v1 )

ライセンス: Link先を確認
George Yiasemis, Clara I. S\'anchez, Jan-Jakob Sonke, Jonas Teuwen(参考訳) $\textbf{Purpose:}$ MRI $k$-spaceの取得には時間がかかる。 従来の手法は,近年のDL手法と組み合わせた高速化されたデータを取得することを目的としている。 従来、$k$-スペースのサブサンプリングは直立線軌跡を用いて行われ、DLを用いても不正確な再構成が可能であるが、現代のMRIスキャナーでは非直立線軌跡や非直立線軌跡の多重化が可能である。 本研究は、訓練されたDLモデルにより生成された再構成加速MRIの画質に及ぼす$k$-spaceサブサンプリングスキームの影響について検討する。 $\textbf{Methods:}$ The RecurrentVarNetは、DLベースのMRI再構成アーキテクチャとして使われた。 加速度の異なる3つのデータセットからカーデシアンフルサンプリングされた$k$-space測定を8つの異なるサブサンプリングスキーム(4つのカーデシアン-rectilinear、2つのカーデシアン非rectilinear、2つの非カルテジアン)を用いて遡及的にサブサンプリングした。 実験は2つのフレームワークで実施された: Scheme-specificでは、データセットサブサンプリングスキームペア毎に個別のモデルをトレーニングし、評価し、マルチスキーマでは、データセット毎に、ランダムに8つのスキームにサブサンプルされたデータに基づいてトレーニングし、すべてのスキームでサンプル化されたデータに基づいて評価する。 スキーム固有のrecurrentvarnetsのトレーニングと評価において$\textbf{results:}$は、特に高加速において優れた性能を示したが、マルチスキーム設定では、スキーム特有の実験と比較して、線形サブサンプリングデータの再構成性能が向上した。 $\textbf{Conclusion:}$$ DLベースのMRI再構成アルゴリズムを非直線的にサブサンプル化することで、より忠実な再構築が可能になる。

$\textbf{Purpose:}$ The MRI $k$-space acquisition is time consuming. Traditional techniques aim to acquire accelerated data, which in conjunction with recent DL methods, aid in producing high-fidelity images in truncated times. Conventionally, subsampling the $k$-space is performed by utilizing Cartesian-rectilinear trajectories, which even with the use of DL, provide imprecise reconstructions, though, a plethora of non-rectilinear or non-Cartesian trajectories can be implemented in modern MRI scanners. This work investigates the effect of the $k$-space subsampling scheme on the quality of reconstructed accelerated MRI measurements produced by trained DL models. $\textbf{Methods:}$ The RecurrentVarNet was used as the DL-based MRI-reconstruction architecture. Cartesian fully-sampled multi-coil $k$-space measurements from three datasets with different accelerations were retrospectively subsampled using eight distinct subsampling schemes (four Cartesian-rectilinear, two Cartesian non-rectilinear, two non-Cartesian). Experiments were conducted in two frameworks: Scheme-specific, where a distinct model was trained and evaluated for each dataset-subsampling scheme pair, and multi-scheme, where for each dataset a single model was trained on data randomly subsampled by any of the eight schemes and evaluated on data subsampled by all schemes. $\textbf{Results:}$ In the scheme-specific setting RecurrentVarNets trained and evaluated on non-rectilinearly subsampled data demonstrated superior performance especially for high accelerations, whilst in the multi-scheme setting, reconstruction performance on rectilinearly subsampled data improved when compared to the scheme-specific experiments. $\textbf{Conclusion:}$ Training DL-based MRI reconstruction algorithms on non-rectilinearly subsampled measurements can produce more faithful reconstructions.
翻訳日:2023-01-23 14:07:16 公開日:2023-01-20
# 複雑なネットワーク上での機械学習改善のための隣接行列の順序パターン探索

Exploring ordered patterns in the adjacency matrix for improving machine learning on complex networks ( http://arxiv.org/abs/2301.08364v1 )

ライセンス: Link先を確認
Mariane B. Neiva, Odemir M. Bruno(参考訳) 世界とその力学を理解するための現代的なアプローチとしての複雑なネットワークの利用は、文学において確立されている。 複素ネットワークの1対1表現を提供する隣接行列は、グラフのいくつかのメトリクスを得ることもできる。 しかし、行列内の行と行の置換が同じグラフを表現できるので、この表現が一意であることは必ずしも明らかではない。 この問題に対処するため,提案手法では,複素グラフの隣接行列の要素を特定の順序で並べ替えるソートアルゴリズムを採用している。 結果のソートされた隣接行列は、特徴抽出と機械学習アルゴリズムの入力として使用され、ネットワークを分類する。 その結果, 提案手法は, 合成データや実世界データよりも優れた結果が得られることがわかった。

The use of complex networks as a modern approach to understanding the world and its dynamics is well-established in literature. The adjacency matrix, which provides a one-to-one representation of a complex network, can also yield several metrics of the graph. However, it is not always clear that this representation is unique, as the permutation of lines and rows in the matrix can represent the same graph. To address this issue, the proposed methodology employs a sorting algorithm to rearrange the elements of the adjacency matrix of a complex graph in a specific order. The resulting sorted adjacency matrix is then used as input for feature extraction and machine learning algorithms to classify the networks. The results indicate that the proposed methodology outperforms previous literature results on synthetic and real-world data.
翻訳日:2023-01-23 14:06:33 公開日:2023-01-20
# シーケンス類似性によるシーケンス生成:理論とUAV識別への応用

Sequence Generation via Subsequence Similarity: Theory and Application to UAV Identification ( http://arxiv.org/abs/2301.08403v1 )

ライセンス: Link先を確認
Amir Kazemi, Salar Basiri, Volodymyr Kindratenko, Srinivasa Salapaka(参考訳) 合成シーケンスを生成する能力は、幅広いアプリケーションにとって不可欠であり、ディープラーニングアーキテクチャと生成フレームワークの最近の進歩は、このプロセスを大きく促進した。 特に、無条件ワンショット生成モデルは、単一の画像やビデオなどの内部情報をキャプチャして、類似した内容のサンプルを生成することに焦点を当てた魅力的な研究ラインを構成する。 これらのワンショットモデルの多くは、効率的で非深度なアプローチに移行しているため、データセット全体を拡張するためのワンショット生成モデルの汎用性を検討する。 本研究では,サブシーケンスレベルでの類似度がシーケンスレベルでの類似性にどのように影響するかに着目し,対応するサブシーケンスの類似度に基づいて,実列および生成されたシーケンスの最適輸送に基づく境界を導出する。 単発生成モデルを用いて, 周波数制限信号を用いた無人航空機(uav)の識別問題に適用することにより, 個々のシーケンス近傍からサンプルを採取し, サブシーケンス類似のものを生成し, 本手法の改良を実証する。 UAV識別の文脈では、RFフィンガープリントは正当なデバイスと悪意のあるデバイスを区別する効果的な方法であるが、異種環境やチャネル障害はデータの不足を課し、分類モデルの性能に影響を与える可能性がある。 トレーニングデータセットの低比 (5\%-20\%) のrfデータのシーケンスの強化にサブシーケンス類似性を用いることで、精度、精度、リコール、f1スコアなどのパフォーマンス指標の大幅な改善を実現する。

The ability to generate synthetic sequences is crucial for a wide range of applications, and recent advances in deep learning architectures and generative frameworks have greatly facilitated this process. Particularly, unconditional one-shot generative models constitute an attractive line of research that focuses on capturing the internal information of a single image, video, etc. to generate samples with similar contents. Since many of those one-shot models are shifting toward efficient non-deep and non-adversarial approaches, we examine the versatility of a one-shot generative model for augmenting whole datasets. In this work, we focus on how similarity at the subsequence level affects similarity at the sequence level, and derive bounds on the optimal transport of real and generated sequences based on that of corresponding subsequences. We use a one-shot generative model to sample from the vicinity of individual sequences and generate subsequence-similar ones and demonstrate the improvement of this approach by applying it to the problem of Unmanned Aerial Vehicle (UAV) identification using limited radio-frequency (RF) signals. In the context of UAV identification, RF fingerprinting is an effective method for distinguishing legitimate devices from malicious ones, but heterogenous environments and channel impairments can impose data scarcity and affect the performance of classification models. By using subsequence similarity to augment sequences of RF data with a low ratio (5\%-20\%) of training dataset, we achieve significant improvements in performance metrics such as accuracy, precision, recall, and F1 score.
翻訳日:2023-01-23 13:58:28 公開日:2023-01-20
# 量子チャネルのエントロピー不確かさ関係と強部分付加性

Entropy Uncertainty Relations and Strong Sub-additivity of Quantum Channels ( http://arxiv.org/abs/2301.08402v1 )

ライセンス: Link先を確認
Li Gao, Marius Junge, Nicholas LaRacuente(参考訳) 2つの量子チャネルに対するエントロピーの不確実性関係を証明し、フランクとリーブの仕事を拡張して量子測定を行う。 これは量子エントロピーの一般化された強超付加性(SSA)によって得られる。 ペッツの不等式により、量子相対エントロピーに対する一般化されたSSAも得られる。 特殊な場合として、データ処理の不平等性が改善される。

We prove an entropic uncertainty relation for two quantum channels, extending the work of Frank and Lieb for quantum measurements. This is obtained via a generalized strong super-additivity (SSA) of quantum entropy. Motivated by Petz's algebraic SSA inequality, we also obtain a generalized SSA for quantum relative entropy. As a special case, it gives an improved data processing inequality.
翻訳日:2023-01-23 13:58:00 公開日:2023-01-20
# 円筒形geナノワイヤにおける低エネルギーホールサブバンド分散:ナノワイヤ成長方向の影響

Low-energy hole subband dispersions in a cylindrical Ge nanowire: the effects of the nanowire growth direction ( http://arxiv.org/abs/2301.08400v1 )

ライセンス: Link先を確認
Rui Li and Zi-Qiang Li(参考訳) 孔ガスのサブバンド分散を計算する際の球面近似 $\gamma_{s}=(2\gamma_{2}+3\gamma_{3})/5$ の有効性を検討する。 準縮退摂動理論を用いて、円筒状geナノワイヤ内の現実的ホールサブバンド分散(球面近似なし)を計算する。 現実的な低エネルギーホールサブバンド分散は、球面近似予測を含む二重井戸対交構造を有する。 しかし、現実的なサブバンド分散もナノワイヤ成長方向に依存する。 ナノワイヤ成長方向が(100)結晶面に制限されると、サブバンドパラメータの詳細な成長方向依存性が与えられる。 球面近似はよい近似であり、実結果を特定の成長方向でうまく再現することができる。

We examine the validity of the spherical approximation $\gamma_{s}=(2\gamma_{2}+3\gamma_{3})/5$ in the Luttinger-Kohn Hamiltonian in calculating the subband dispersions of the hole gas. We calculate the realistic hole subband dispersions (without the spherical approximation) in a cylindrical Ge nanowire by using quasi-degenerate perturbation theory. The realistic low-energy hole subband dispersions have a double-well anticrossing structure, that consists with the spherical approximation prediction. However, the realistic subband dispersions are also nanowire growth direction dependent. When the nanowire growth direction is restricted in the (100) crystal plane, the detailed growth direction dependences of the subband parameters are given. We find the spherical approximation is good approximation, it can nicely reproduce the real result in some special growth directions.
翻訳日:2023-01-23 13:57:53 公開日:2023-01-20
# 何時に誰と付き合うべきか? 事象認識型時間グラフニューラルネットワークの欠如

Who Should I Engage with At What Time? A Missing Event Aware Temporal Graph Neural Network ( http://arxiv.org/abs/2301.08399v1 )

ライセンス: Link先を確認
Mingyi Liu, Zhiying Tu, Xiaofei Xu, and Zhongjie Wang(参考訳) 最近、バイオインフォマティクス、知識グラフ、ソーシャルネットワークといった幅広い応用シナリオのために、時間グラフニューラルネットワークが注目されている。 目覚ましい結果をもたらす時間グラフニューラルネットワークもいくつか存在する。 しかし、これらの研究は将来の事象予測に焦点を当て、全ての歴史的事象が観測可能であるという仮定の下で行われる。 現実のアプリケーションでは、イベントは常に観測可能ではなく、イベントタイムの推定は将来のイベントを予測するのと同じくらい重要である。 本稿では,今後何が起こるか,いつ起こるかを予測するために,グラフ構造とイベントのタイミングを一様にモデル化するイベント認識型時間グラフニューラルネットワークMTGNを提案する。MTGNは,観測と欠落の両方の事象のダイナミクスを2つの結合時間点プロセスとしてモデル化し,欠落イベントの効果をネットワークに組み込む。 いくつかの実世界の時間グラフ実験の結果、MTGNは89%、112%の精度で既存の手法よりも優れていた。 コードはhttps://github.com/HIT-ICES/TNNLS-MTGNで見ることができる。

Temporal graph neural network has recently received significant attention due to its wide application scenarios, such as bioinformatics, knowledge graphs, and social networks. There are some temporal graph neural networks that achieve remarkable results. However, these works focus on future event prediction and are performed under the assumption that all historical events are observable. In real-world applications, events are not always observable, and estimating event time is as important as predicting future events. In this paper, we propose MTGN, a missing event-aware temporal graph neural network, which uniformly models evolving graph structure and timing of events to support predicting what will happen in the future and when it will happen.MTGN models the dynamic of both observed and missing events as two coupled temporal point processes, thereby incorporating the effects of missing events into the network. Experimental results on several real-world temporal graphs demonstrate that MTGN significantly outperforms existing methods with up to 89% and 112% more accurate time and link prediction. Code can be found on https://github.com/HIT-ICES/TNNLS-MTGN.
翻訳日:2023-01-23 13:57:41 公開日:2023-01-20
# LSTMニューラルネットワークを用いた脳モデル状態空間再構成

Brain Model State Space Reconstruction Using an LSTM Neural Network ( http://arxiv.org/abs/2301.08391v1 )

ライセンス: Link先を確認
Yueyang Liu, Artemio Soto-Breceda, Yun Zhao, Phillipa Karoly, Mark J. Cook, David B. Grayden, Daniel Schmidt, Levin Kuhlmann1(参考訳) 客観的カルマンフィルタリングは、神経モデルの状態やパラメータ、特に脳波に関連するスケールを追跡するために以前にも適用されてきた。 しかし、このアプローチには初期フィルタ条件を決定するための信頼性の高い方法がなく、状態の分布がガウス的であると仮定する。 本研究では,深層学習手法,特にlstmニューラルネットワークを用いて,脳波記録からニューラルマスモデル(nmms)の状態とパラメータを追跡する代替データ駆動手法を提案する。 アプローチ LSTMフィルタは、幅広いパラメータを用いてニューラルマスモデルによって生成された脳波データに基づいて訓練された。 適切にカスタマイズされた損失関数により、LSTMフィルタはNMMの振る舞いを学ぶことができる。 その結果、入力として与えられたnmmの状態ベクトルとパラメータを出力することができる。 主結果: シミュレーションデータを用いた実験結果から, R2乗約0.99の相関関係が得られ, カルマンフィルタの初期条件が正確でない場合には, 非線形カルマンフィルタよりも精度が高く, ノイズに強いことが確認された。 実世界の応用例として、LSTMフィルタはてんかん発作を含む実際の脳波データにも適用され、発作開始時の接続強度パラメータの変化が明らかになった。 数学的脳モデルの状態ベクトルとパラメータを追跡する意義は、脳のモデリング、監視、イメージング、制御の分野で非常に重要である。 このアプローチは初期状態ベクトルとパラメータを指定する必要はないが、推定される変数の多くは、生理学的実験では直接測定できないため、実際は非常に難しい。 この方法は任意の神経質量モデルを用いて適用することができ、そのため、しばしば測定が難しい脳モデル変数を推定する一般的な、新しい、効率的なアプローチを提供する。

Objective Kalman filtering has previously been applied to track neural model states and parameters, particularly at the scale relevant to EEG. However, this approach lacks a reliable method to determine the initial filter conditions and assumes that the distribution of states remains Gaussian. This study presents an alternative, data-driven method to track the states and parameters of neural mass models (NMMs) from EEG recordings using deep learning techniques, specifically an LSTM neural network. Approach An LSTM filter was trained on simulated EEG data generated by a neural mass model using a wide range of parameters. With an appropriately customised loss function, the LSTM filter can learn the behaviour of NMMs. As a result, it can output the state vector and parameters of NMMs given observation data as the input. Main Results Test results using simulated data yielded correlations with R squared of around 0.99 and verified that the method is robust to noise and can be more accurate than a nonlinear Kalman filter when the initial conditions of the Kalman filter are not accurate. As an example of real-world application, the LSTM filter was also applied to real EEG data that included epileptic seizures, and revealed changes in connectivity strength parameters at the beginnings of seizures. Significance Tracking the state vector and parameters of mathematical brain models is of great importance in the area of brain modelling, monitoring, imaging and control. This approach has no need to specify the initial state vector and parameters, which is very difficult to do in practice because many of the variables being estimated cannot be measured directly in physiological experiments. This method may be applied using any neural mass model and, therefore, provides a general, novel, efficient approach to estimate brain model variables that are often difficult to measure.
翻訳日:2023-01-23 13:57:21 公開日:2023-01-20
# 単発学習のためのオープンセット確率最大化

Open-Set Likelihood Maximization for Few-Shot Learning ( http://arxiv.org/abs/2301.08390v1 )

ライセンス: Link先を確認
Malik Boudiaf, Etienne Bennequin, Myriam Tami, Antoine Toubhans, Pablo Piantanida, C\'eline Hudelot, Ismail Ben Ayed(参考訳) Few-Shot Open-Set Recognition (FSOSR) 問題、すなわち、いくつかのラベル付きサンプルしか持たないクラスのインスタンスを分類すると同時に、既知のクラスに属さないインスタンスを同時に検出する。 提案手法では,推論時に非競合なクエリインスタンスを利用する。 既設のトランスダクティブ法がオープンセットのシナリオでは性能に乏しいという観測に動機づけられ,一般のパラメトリックモデルと並行して,潜在的外れ値の影響を弱める潜在スコアの一般化を提案する。 提案方式では,クエリ集合に対する過密な予測を損なうサポートセットと追加のペナルティからの監督制約を組み込む。 我々は,潜在スコアとパラメトリックモデルが交互に最適化され,相互に利益を得るブロック座標降下を行う。 我々は、結果の定式化を \textit{Open-Set Likelihood Optimization} (OSLO) と呼ぶ。 OSLOは解釈可能で、完全にモジュール化されている。 広範な実験を通じて,本手法は,オープンセット認識の両面において既存の帰納的および帰納的手法,すなわち不規則分類と外れ値検出を上回っていることを示す。

We tackle the Few-Shot Open-Set Recognition (FSOSR) problem, i.e. classifying instances among a set of classes for which we only have a few labeled samples, while simultaneously detecting instances that do not belong to any known class. We explore the popular transductive setting, which leverages the unlabelled query instances at inference. Motivated by the observation that existing transductive methods perform poorly in open-set scenarios, we propose a generalization of the maximum likelihood principle, in which latent scores down-weighing the influence of potential outliers are introduced alongside the usual parametric model. Our formulation embeds supervision constraints from the support set and additional penalties discouraging overconfident predictions on the query set. We proceed with a block-coordinate descent, with the latent scores and parametric model co-optimized alternately, thereby benefiting from each other. We call our resulting formulation \textit{Open-Set Likelihood Optimization} (OSLO). OSLO is interpretable and fully modular; it can be applied on top of any pre-trained model seamlessly. Through extensive experiments, we show that our method surpasses existing inductive and transductive methods on both aspects of open-set recognition, namely inlier classification and outlier detection.
翻訳日:2023-01-23 13:56:57 公開日:2023-01-20
# 振幅減衰雑音下におけるqutritのテレポーテーションにおけるマルチパラメータ推定精度の向上

Improving the precision of multiparameter estimation in the teleportation of qutrit under amplitude damping noise ( http://arxiv.org/abs/2301.08388v1 )

ライセンス: Link先を確認
Yan-Ling Li, Yi-Bo Zeng, Lin Yao, Xing Xiao(参考訳) 量子テレポーテーションの最初の発見以来、未知の量子状態をある相手から別の遠方のパートナーに移すことに専念している。 しかし、リモートセンシングのシナリオでは、人々が本当に気にしているのは、特定のパラメータが持つ情報です。 振幅減衰(AD)雑音下における石英テレポーテーションの枠組みにおけるマルチパラメータ推定の問題について検討した。 特に,弱測定(wm)と環境支援計測(eam)を用いて,adノイズ対策とマルチパラメータ推定精度の向上を目的とした2つの手法を提案する。 量子フィッシャー情報行列(QFIM)の解析式を量子化状態に符号化した2相パラメータを求めることができる。 その結果,EAMのスキームは独立推定精度と同時推定精度の両面でWMよりも優れていた。 注目すべきことに、EAM方式はADノイズによる汚染に対する推定精度を完全に保証することができる。 その理由は、ADノイズの後にEAMが実行されるためである。 これにより、システムと環境の両方から情報を抽出する。 その結果,WMとEMAの手法は遠隔量子センシングに有用であり,ADデコヒーレンスの下での他の量子情報タスクに一般化可能であることがわかった。

Since the initial discovery of quantum teleportation, it is devoted to transferring unknown quantum states from one party to another distant partner. However, in the scenarios of remote sensing, what people truly care about is the information carried by certain parameters. The problem of multiparameter estimation in the framework of qutrit teleportation under amplitude damping (AD) noise is studied. Particularly, two schemes are proposed to battle against AD noise and enhance the precision of multiparameter estimation by utilizing weak measurement (WM) and environment-assisted measurement (EAM). For two-phase parameters encoded in a qutrit state, the analytical formulas of the quantum Fisher information matrix (QFIM) can be obtained. The results prove that the scheme of EAM outperforms the WM one in the improvements of both independent and simultaneous estimation precision. Remarkably, the EAM scheme can completely ensure the estimation precision against the contamination by AD noise. The reason should be attributed to the fact that EAM is carried out after the AD noise. Thus, it extracts information from both the system and the environment. The findings show that the techniques of WM and EAM are helpful for remote quantum sensing and can be generalized to other qutrit-based quantum information tasks under AD decoherence.
翻訳日:2023-01-23 13:56:34 公開日:2023-01-20
# 自閉木キャノピーの骨格抽出のためのオクルージョン推論

Occlusion Reasoning for Skeleton Extraction of Self-Occluded Tree Canopies ( http://arxiv.org/abs/2301.08387v1 )

ライセンス: Link先を確認
Chung Hee Kim, George Kantor(参考訳) 本研究では, 樹木の未保存構造を推定することにより, 自己閉鎖樹冠の骨格を抽出する方法を提案する。 木の骨格は位相構造をコンパクトに記述し、分岐幾何学、位置、階層といった有用な情報を含んでいる。 これは農業操作のための接触操作計画に不可欠であるが、葉、果実、その他の枝による閉塞のために得るのが困難である。 本手法では,インスタンスセグメンテーションネットワークを用いて目に見える幹,枝,小枝を検出する。 次に, 観測された木構造に基づいて, 占有格子の形をしたカスタム3次元ラバースマップを構築し, 最小コストパス探索による閉ざされた骨格の存在を仮定する。 本手法は,合成木データセット上での一連の実験により,高度にオクルードされたシーンにおいてベースラインメソッドよりも優れることを示す。 定性的結果は、フィールドから収集された実際のツリーデータセットにも表示される。

In this work, we present a method to extract the skeleton of a self-occluded tree canopy by estimating the unobserved structures of the tree. A tree skeleton compactly describes the topological structure and contains useful information such as branch geometry, positions and hierarchy. This can be critical to planning contact interactions for agricultural manipulation, yet is difficult to gain due to occlusion by leaves, fruits and other branches. Our method uses an instance segmentation network to detect visible trunk, branches, and twigs. Then, based on the observed tree structures, we build a custom 3D likelihood map in the form of an occupancy grid to hypothesize on the presence of occluded skeletons through a series of minimum cost path searches. We show that our method outperforms baseline methods in highly occluded scenes, demonstrated through a set of experiments on a synthetic tree dataset. Qualitative results are also presented on a real tree dataset collected from the field.
翻訳日:2023-01-23 13:56:15 公開日:2023-01-20
# 非同期学習型分散地形図

Asynchronously Trained Distributed Topographic Maps ( http://arxiv.org/abs/2301.08379v1 )

ライセンス: Link先を確認
Abbas Siddiqui and Dionysios Georgiadis(参考訳) 地形特徴マップはデータの低次元表現であり、空間依存を保存する。 このようなマップを訓練する現在の方法(例えば、自己組織化マップ - SOM、生成地形マップ)は、拡張性を制限する集中制御と同期実行を必要とする。 分散非同期トレーニングによって特徴マップを生成するために,N$の自律ユニットを用いたアルゴリズムを提案する。 単位の自律性は、分散ヒューリスティック探索とカスケード駆動の重み更新スキームの組み合わせによって、時間 \& 空間におけるスパースな相互作用によって達成される。 一 サンプル又は隣人の重量ベクトルを受信したとき、適応し、 二 予め定められた回数に適応した後、その重量ベクトルを隣人に送信すること。 これにより、ベクトル更新は適応の雪崩を引き起こすことができる。 雪崩を統計力学モデルにマッピングすることで,カスケードの統計特性をパラメータ化することができる。 MNISTを用いて,ヒューリスティック探索精度とカスケードパラメータが地図品質に及ぼす影響を実証的に検討した。 また、アルゴリズムの複雑さがシステムサイズ$n$で最大に線形にスケールすることを示す実証的な証拠を提供する。 提案手法は,複数のデータセットにまたがる分類タスクにおいて,同様の手法を両立させる。

Topographic feature maps are low dimensional representations of data, that preserve spatial dependencies. Current methods of training such maps (e.g. self organizing maps - SOM, generative topographic maps) require centralized control and synchronous execution, which restricts scalability. We present an algorithm that uses $N$ autonomous units to generate a feature map by distributed asynchronous training. Unit autonomy is achieved by sparse interaction in time \& space through the combination of a distributed heuristic search, and a cascade-driven weight updating scheme governed by two rules: a unit i) adapts when it receives either a sample, or the weight vector of a neighbor, and ii) broadcasts its weight vector to its neighbors after adapting for a predefined number of times. Thus, a vector update can trigger an avalanche of adaptation. We map avalanching to a statistical mechanics model, which allows us to parametrize the statistical properties of cascading. Using MNIST, we empirically investigate the effect of the heuristic search accuracy and the cascade parameters on map quality. We also provide empirical evidence that algorithm complexity scales at most linearly with system size $N$. The proposed approach is found to perform comparably with similar methods in classification tasks across multiple datasets.
翻訳日:2023-01-23 13:56:01 公開日:2023-01-20
# 強非コヒーレント重力

Strongly incoherent gravity ( http://arxiv.org/abs/2301.08378v1 )

ライセンス: Link先を確認
Daniel Carney, Jacob M. Taylor(参考訳) 自然界におけるほとんどの基本的な相互作用は量子化された場によって媒介されることが知られているが、重力は異なる振る舞いをする可能性がある。 この概念を十分に正確にテストするには一貫したモデルが必要である。 ここでは、任意の二体ポテンシャル $V(r)$ の非絡み合いバージョンが局所的な測定とフィードバック力から生じる理論の明確な例を構築する。 様々な理論が存在するが、我々の構成はより微妙なアプローチに比べて特に強い非一貫性を引き起こす。 にもかかわらず、観測変数の期待値は通常の古典力学に従うが、相互作用は絡み合いを生じない。 ニュートンポテンシャルに適用すると、これはユニタリティーの基本的な損失を伴う非相対論的重力モデルを生成する。 このモデルには自由パラメータのペアが含まれており、そのかなりの範囲は現在の観測では除外されていない。 絡み合い特性をテストする代わりに、原子干渉計のような小さな系の量子コヒーレンスを振動源質量と組み合わせて探すことで、残りのパラメータ空間全体をテストできることを示した。

While most fundamental interactions in nature are known to be mediated by quantized fields, the possibility has been raised that gravity may behave differently. Making this concept precise enough to test requires consistent models. Here we construct an explicit example of a theory where a non-entangling version of an arbitrary two-body potential $V(r)$ arises from local measurements and feedback forces. While a variety of such theories exist, our construction causes particularly strong decoherence compared to more subtle approaches. Regardless, expectation values of observables obey the usual classical dynamics, while the interaction generates no entanglement. Applied to the Newtonian potential, this produces a non-relativistic model of gravity with fundamental loss of unitarity. The model contains a pair of free parameters, a substantial range of which is not excluded by observations to date. As an alternative to testing entanglement properties, we show that the entire remaining parameter space can be tested by looking for loss of quantum coherence in small systems like atom interferometers coupled to oscillating source masses.
翻訳日:2023-01-23 13:55:39 公開日:2023-01-20
# 閉塞予測を用いた多視点特徴マッチングによる無監督光深度推定

Unsupervised Light Field Depth Estimation via Multi-view Feature Matching with Occlusion Prediction ( http://arxiv.org/abs/2301.08433v1 )

ライセンス: Link先を確認
Shansi Zhang, Nan Meng and Edmund Y. Lam(参考訳) 光場(LF)画像からの深さ推定は、いくつかの応用において基本的なステップである。 近年,学習に基づく手法は従来の手法よりも精度と効率が向上している。 しかし、指導訓練に十分な深度ラベルを得ることはコストがかかる。 本稿では,LF画像から深度を推定するための教師なしフレームワークを提案する。 まず,多視点特徴マッチングを行い,より効率的に対応を学習することにより,異なる視点の組み合わせから異質マップを予測できる粗粒度から細かな構造を持つ異質度推定ネットワーク(dispnet)を設計する。 咬合がフォトコンシステンシーを損なう可能性があるため、オクルージョン予測ネットワーク(occnet)を設計、オクルージョンマップをオクルージョン損失の要素的な重み付けとして、オクルージョンマップを予測し、オクルージョン問題を解決し、異種学習を支援する。 本稿では,複数の入力の組み合わせによって推定される不一致マップを用いて,推定誤差に基づく不一致融合戦略を提案し,最終不一致マップを得る。 実験により,本手法は高密度かつスパースなLF画像に対して優れた性能を示し,実世界のLF画像に対してより優れた一般化能力を有することが示された。

Depth estimation from light field (LF) images is a fundamental step for some applications. Recently, learning-based methods have achieved higher accuracy and efficiency than the traditional methods. However, it is costly to obtain sufficient depth labels for supervised training. In this paper, we propose an unsupervised framework to estimate depth from LF images. First, we design a disparity estimation network (DispNet) with a coarse-to-fine structure to predict disparity maps from different view combinations by performing multi-view feature matching to learn the correspondences more effectively. As occlusions may cause the violation of photo-consistency, we design an occlusion prediction network (OccNet) to predict the occlusion maps, which are used as the element-wise weights of photometric loss to solve the occlusion issue and assist the disparity learning. With the disparity maps estimated by multiple input combinations, we propose a disparity fusion strategy based on the estimated errors with effective occlusion handling to obtain the final disparity map. Experimental results demonstrate that our method achieves superior performance on both the dense and sparse LF images, and also has better generalization ability to the real-world LF images.
翻訳日:2023-01-23 13:49:05 公開日:2023-01-20
# CodeBertが学習する特徴 -BERTに基づくソースコード表現学習の実証的研究-

Which Features are Learned by CodeBert: An Empirical Study of the BERT-based Source Code Representation Learning ( http://arxiv.org/abs/2301.08427v1 )

ライセンス: Link先を確認
Lan Zhang, Chen Cao, Zhilong Wang and Peng Liu(参考訳) トランスフォーマー (bert) からの双方向エンコーダ表現は自然言語処理 (nlp) で提案され, 有望な結果が得られた。 最近、BERTをソースコード表現学習に適用し、いくつかの下流タスクについて良いニュースを報告した。 しかし,本稿では,現在の手法ではソースコードの論理を効果的に理解できないことを示す。 ソースコードの表現はプログラマが定義した変数と関数名に大きく依存する。 我々は、予想を実証するために一連の実験を設計、実装し、将来の研究に対する洞察を提供する。

The Bidirectional Encoder Representations from Transformers (BERT) were proposed in the natural language process (NLP) and shows promising results. Recently researchers applied the BERT to source-code representation learning and reported some good news on several downstream tasks. However, in this paper, we illustrated that current methods cannot effectively understand the logic of source codes. The representation of source code heavily relies on the programmer-defined variable and function names. We design and implement a set of experiments to demonstrate our conjecture and provide some insights for future works.
翻訳日:2023-01-23 13:48:45 公開日:2023-01-20
# 動的障害物を有する未知トンネル建設現場における視覚に基づく自律型UAV検査フレームワーク

A vision-based autonomous UAV inspection framework for unknown tunnel construction sites with dynamic obstacles ( http://arxiv.org/abs/2301.08422v1 )

ライセンス: Link先を確認
Zhefan Xu, Baihan Chen, Xiaoyang Zhan, Yumeng Xiu, Christopher Suzuki, Kenji Shimada(参考訳) ドリル・アンド・ブラスト工法によるトンネル建設には,地下破壊箇所を3次元的に計測する必要がある。 検査・測定作業の安全性・コスト・効率を考えると、無人航空機(UAV)のような軽量自律ロボットの配備はより必要で普及している。 以前の作品の多くは、検査視点の決定に事前の地図を使用し、動的な障害を考慮しない。 自律性の最大化を図るため,従来の地図を使わずに動的トンネル環境に対する視覚に基づくUAV検査フレームワークを提案する。 本手法は階層的計画手法を用いて,検査問題を異なるレベルに分解する。 高レベル意思決定者はまず、ロボットのタスクを決定し、目標点を生成する。 そして、中間レベルパスプランナーがウェイポイントパスを見つけ、衝突のない静的軌道を最適化する。 最後に、静的な軌道は、動的障害を避け、ターゲットポイントにナビゲートするために、低レベルのローカルプランナーに送られる。 さらに,我々のフレームワークには,動的障害物を同時に追跡し,RGB-Dカメラに基づく静的障害物を表現できる新しい動的マップモジュールが含まれている。 検査後、ターゲットの3次元形状を生成するためにStructure-from-Motion (SfM)パイプラインを適用する。 私たちの知る限り、未知の動的トンネル環境で自律的な検査が実現されたのはこれが初めてです。 実際のトンネルでの飛行実験は, トンネル掘削面を自律的に検査できることを示すものである。

Tunnel construction using the drill-and-blast method requires the 3D measurement of the excavation front to evaluate underbreak locations. Considering the inspection and measurement task's safety, cost, and efficiency, deploying lightweight autonomous robots, such as unmanned aerial vehicles (UAV), becomes more necessary and popular. Most of the previous works use a prior map for inspection viewpoint determination and do not consider dynamic obstacles. To maximally increase the level of autonomy, this paper proposes a vision-based UAV inspection framework for dynamic tunnel environments without using a prior map. Our approach utilizes a hierarchical planning scheme, decomposing the inspection problem into different levels. The high-level decision maker first determines the task for the robot and generates the target point. Then, the mid-level path planner finds the waypoint path and optimizes the collision-free static trajectory. Finally, the static trajectory will be fed into the low-level local planner to avoid dynamic obstacles and navigate to the target point. Besides, our framework contains a novel dynamic map module that can simultaneously track dynamic obstacles and represent static obstacles based on an RGB-D camera. After inspection, the Structure-from-Motion (SfM) pipeline is applied to generate the 3D shape of the target. To our best knowledge, this is the first time autonomous inspection has been realized in unknown and dynamic tunnel environments. Our flight experiments in a real tunnel prove that our method can autonomously inspect the tunnel excavation front surface.
翻訳日:2023-01-23 13:48:34 公開日:2023-01-20
# FPGAを用いた表面符号のスケーラブル量子誤り補正

Scalable Quantum Error Correction for Surface Codes using FPGA ( http://arxiv.org/abs/2301.08419v1 )

ライセンス: Link先を確認
Namitha Liyanage, Yue Wu, Alexander Deters and Lin Zhong(参考訳) フォールトトレラント量子コンピュータは、現れるよりも早くデコードし、エラーを訂正しなければならない。 エラーの修正が早くなればなるほど、コンピュータはもっと役に立つ仕事をできる。 Union-Find (UF) デコーダは平均時間複雑性が$O(d^3)$よりわずかに高いことを約束している。 並列計算資源を利用してさらなる高速化を行うUFデコーダの分散バージョンについて報告する。 FPGAベースの実装を用いて,この分散UFデコーダが$d$,$O(d^3)$並列コンピューティングリソースに対して,サブ線形平均時間複雑性を有することを実証的に示す。 測定ラウンドあたりの復号時間は、量子エラー復号器として初めて$d$が増加するにつれて減少する。 この実装では、並列コンピューティングリソースをハイブリッドツリーグリッド構造に整理するheliosと呼ばれるスケーラブルなアーキテクチャを採用している。 Xilinxのサイクル精度シミュレータを用いて、15ドルまでのサイクル精度の復号時間と、$p=0.1\%の現象ノイズモデルを示す。 xilinx zc106 fpgaで$d$を7まで実装でき、平均復号時間は1ラウンドあたり120 nsです。 heliosの測定ラウンド毎のデコード時間は$d$で減少するため、heliosはバックログを増加させずに任意の大きな$d$の表面コードをデコードできる。

A fault-tolerant quantum computer must decode and correct errors faster than they appear. The faster errors can be corrected, the more time the computer can do useful work. The Union-Find (UF) decoder is promising with an average time complexity slightly higher than $O(d^3)$. We report a distributed version of the UF decoder that exploits parallel computing resources for further speedup. Using an FPGA-based implementation, we empirically show that this distributed UF decoder has a sublinear average time complexity with regard to $d$, given $O(d^3)$ parallel computing resources. The decoding time per measurement round decreases as $d$ increases, a first time for a quantum error decoder. The implementation employs a scalable architecture called Helios that organizes parallel computing resources into a hybrid tree-grid structure. Using Xilinx's cycle-accurate simulator, we present cycle-accurate decoding time for $d$ up to 15, with the phenomenological noise model with $p=0.1\%$. We are able to implement $d$ up to 7 with a Xilinx ZC106 FPGA, for which an average decoding time is 120 ns per measurement round. Since the decoding time per measurement round of Helios decreases with $d$, Helios can decode a surface code of arbitrarily large $d$ without a growing backlog.
翻訳日:2023-01-23 13:48:10 公開日:2023-01-20
# アクセシブル多言語テキスト解析のための機械翻訳

Machine Translation for Accessible Multi-Language Text Analysis ( http://arxiv.org/abs/2301.08416v1 )

ライセンス: Link先を確認
Edward W. Chew, William D. Weisman, Jingying Huang, Seth Frey(参考訳) 英語は社会研究の国際標準であるが、研究者は世界中のコミュニケーションプロセスに対する学術的洞察の必要性を満たす責任を意識している。 この緊張は、他の分野と同様に計算手法にも当てはまり、英語のテキストのツールの革命的な進歩は、他のほとんどの言語をはるかに遅れている。 本稿では,これらの進歩を活用して,現在すべての計算学者が多言語分析を利用できることを示す。 英訳後の英語学習尺度は,原文で計算した情報源言語尺度と比較して,十分な精度で正確であることを示す。 感情分析、話題分析、単語埋め込みという3つの主要な分析で、スペイン語、中国語、ヒンディー語、アラビア語を含む16以上の言語を対象にしています。 私たちは、元の言語ツイートとその逆翻訳の予測を比較して、この主張を検証する: ソース言語から英語への二重翻訳、そしてソース言語への逆変換。 全体として、Google Translateはシンプルで広くアクセス可能なツールであり、言語やメソッド間のセマンティックコンテンツの保存に有効であることを示唆している。 現代の機械翻訳は、計算学者が人間のコミュニケーションについてより包括的で一般的な主張をするのに役立つ。

English is the international standard of social research, but scholars are increasingly conscious of their responsibility to meet the need for scholarly insight into communication processes globally. This tension is as true in computational methods as any other area, with revolutionary advances in the tools for English language texts leaving most other languages far behind. In this paper, we aim to leverage those very advances to demonstrate that multi-language analysis is currently accessible to all computational scholars. We show that English-trained measures computed after translation to English have adequate-to-excellent accuracy compared to source-language measures computed on original texts. We show this for three major analytics -- sentiment analysis, topic analysis, and word embeddings -- over 16 languages, including Spanish, Chinese, Hindi, and Arabic. We validate this claim by comparing predictions on original language tweets and their backtranslations: double translations from their source language to English and back to the source language. Overall, our results suggest that Google Translate, a simple and widely accessible tool, is effective in preserving semantic content across languages and methods. Modern machine translation can thus help computational scholars make more inclusive and general claims about human communication.
翻訳日:2023-01-23 13:47:46 公開日:2023-01-20
# FG深度:フローガイドによる教師なし単眼深度推定

FG-Depth: Flow-Guided Unsupervised Monocular Depth Estimation ( http://arxiv.org/abs/2301.08414v1 )

ライセンス: Link先を確認
Junyu Zhu, Lina Liu, Yong Liu, Wanlong Li, Feng Wen and Hongbo Zhang(参考訳) 教師なし単分子深度推定の大きなポテンシャルは、アノテーションのコストが低く、教師付き手法と同等の精度で証明されている。 パフォーマンスをさらに向上するために、最近の研究は主により複雑なネットワーク構造の設計と、セマンティックセグメンテーションのような追加の教師付き情報の利用に焦点を当てている。 これらの手法は、対象画像と参照画像との再構成された関係を様々な程度に利用してモデルを最適化する。 しかし、以前の手法では、この画像再構成最適化が局所的なミニマに閉じ込められやすいことが証明された。 本稿では,事前学習したflow-netによる事前知識を用いて最適化を指導する。 また,FG-Depth という単純なフレームワークを用いて,教師なし単分子深度推定のボトルネックを解消できることを示した。 特に,提案する (i)モデルの容量を制限する典型的な測光損失を置き換えるための流れ蒸留損失 (i)トレーニング損失のノイズをもたらす無効な画素を削除するための事前フローベースのマスク。 提案手法は,KITTIとNYU-Depth-v2の両方のデータセットに対して,最先端の結果が得られることを示す。

The great potential of unsupervised monocular depth estimation has been demonstrated by many works due to low annotation cost and impressive accuracy comparable to supervised methods. To further improve the performance, recent works mainly focus on designing more complex network structures and exploiting extra supervised information, e.g., semantic segmentation. These methods optimize the models by exploiting the reconstructed relationship between the target and reference images in varying degrees. However, previous methods prove that this image reconstruction optimization is prone to get trapped in local minima. In this paper, our core idea is to guide the optimization with prior knowledge from pretrained Flow-Net. And we show that the bottleneck of unsupervised monocular depth estimation can be broken with our simple but effective framework named FG-Depth. In particular, we propose (i) a flow distillation loss to replace the typical photometric loss that limits the capacity of the model and (ii) a prior flow based mask to remove invalid pixels that bring the noise in training loss. Extensive experiments demonstrate the effectiveness of each component, and our approach achieves state-of-the-art results on both KITTI and NYU-Depth-v2 datasets.
翻訳日:2023-01-23 13:47:25 公開日:2023-01-20
# ソースフリードメイン適応がラベル伝搬に遭遇する

When Source-Free Domain Adaptation Meets Label Propagation ( http://arxiv.org/abs/2301.08413v1 )

ライセンス: Link先を確認
Chunwei Wu, Guitao Cao, Yan Li, Xidong Xi, Wenming Cao, Hong Wang(参考訳) 対象の分布に適応するために事前訓練されたソースモデルのみを使用するソースフリードメイン適応は、ドメイン適応を達成するためのより一般的なアプローチである。 しかし,対象領域の教師付き情報が欠如していることから,対象特徴の固有構造を正確に把握することは困難である。 この問題に対処するため,ラベル伝搬の観点から効率的な特徴クラスタリングを実現するために,適応局所移動(ALT)と呼ばれる新しい手法を提案する。 ALTは、学習状態の適応しきい値に基づいて、対象データをインナーおよびアウヤサンプルに分割し、データ特性に最も合うようにカスタマイズされた学習戦略を適用する。 具体的には、内部サンプルは比較的凝集した性質によりクラス内構造を学習するために利用される。 低密度の異常サンプルは入力一貫性によって正規化され、基底真理ラベルに対して高い精度を達成する。 これにより、サブ集団間のラベル情報を効果的に伝播させながら、局所クラスタリングによるスプリアスクラスタの形成を防止することができる。 実証的な証拠は、ALTがOffice-31、Office-Home、VisDAの3つの公開ベンチマークで芸術の状態を上回っていることを示している。

Source-free domain adaptation, where only a pre-trained source model is used to adapt to the target distribution, is a more general approach to achieving domain adaptation. However, it can be challenging to capture the inherent structure of the target features accurately due to the lack of supervised information on the target domain. To tackle this problem, we propose a novel approach called Adaptive Local Transfer (ALT) that tries to achieve efficient feature clustering from the perspective of label propagation. ALT divides the target data into inner and outlier samples based on the adaptive threshold of the learning state, and applies a customized learning strategy to best fits the data property. Specifically, inner samples are utilized for learning intra-class structure thanks to their relatively well-clustered properties. The low-density outlier samples are regularized by input consistency to achieve high accuracy with respect to the ground truth labels. In this way, local clustering can be prevented from forming spurious clusters while effectively propagating label information among subpopulations. Empirical evidence demonstrates that ALT outperforms the state of the arts on three public benchmarks: Office-31, Office-Home, and VisDA.
翻訳日:2023-01-23 13:47:04 公開日:2023-01-20
# ベイズ的アプローチによる公正信用スコア

Fair Credit Scorer through Bayesian Approach ( http://arxiv.org/abs/2301.08412v1 )

ライセンス: Link先を確認
Zhuo Zhao(参考訳) 機械学習は現在、信用スコア、自動運転、疾患診断、保険引用といった分野における人々の生活において、ますます重要な役割を担っている。 しかし、これらの領域の多くでは、機械学習モデルは特定の人種、性別、年齢などのサブ集団に対して不公平な行動を行っている。 これらの不公平な行動は、歴史的および社会的要因によるトレーニングデータセットの既往のバイアスを考慮することができる。 本稿では,信用スコアの現実世界への応用に注目し,性別や年齢などの保護属性と家や仕事などの観察可能な特徴入力との相関を解消するために潜在変数を導入することで,公正な予測モデルを構築する。 詳細な実装のために,マルコフ連鎖モンテカルロシミュレーションを含むベイズ法を適用し,提案するフェアモデルの推定を行う。

Machine learning currently plays an increasingly important role in people's lives in areas such as credit scoring, auto-driving, disease diagnosing, and insurance quoting. However, in many of these areas, machine learning models have performed unfair behaviors against some sub-populations, such as some particular groups of race, sex, and age. These unfair behaviors can be on account of the pre-existing bias in the training dataset due to historical and social factors. In this paper, we focus on a real-world application of credit scoring and construct a fair prediction model by introducing latent variables to remove the correlation between protected attributes, such as sex and age, with the observable feature inputs, including house and job. For detailed implementation, we apply Bayesian approaches, including the Markov Chain Monte Carlo simulation, to estimate our proposed fair model.
翻訳日:2023-01-23 13:46:46 公開日:2023-01-20
# アイデンティティマスキングの有効性とジェスチャー認識:マスクを通しての視力増強の効果

Identity masking effectiveness and gesture recognition: Effects of eye enhancement in seeing through the mask ( http://arxiv.org/abs/2301.08408v1 )

ライセンス: Link先を確認
Madeline Rachow, Thomas Karnowski and Alice J. O'Toole(参考訳) 近年開発されたface identity maskingアルゴリズムは、ビデオ録画中の人々のプライバシーを保護することを目的としている。 これらのアルゴリズムは、顔の動作に関する情報を保持しながら、識別を妨げるように設計されている。 重要な課題は、目の領域で微妙な行動を保ちながら、目から敬遠したアイデンティティの手がかりを遮ることである。 顔の動作を識別・保存するために, 視力増強を伴わないキャニーフィルタを用いたアイデンティティマスキングアルゴリズムの有効性について検討した。 実験1と2では,低解像度映像における運転者の顔認証と高分解能顔画像とのマッチング能力について実験を行った。 その結果,いずれのマスキング法も識別に障害があり,視力増強はCannyフィルタマスクの有効性を変えなかった。 実験3では, 動作保存実験を行い, いずれの方法も運転者の行動知覚に有意な干渉は認められなかった。 その結果,低品質ビデオに適用可能な比較的単純なフィルタベースのマスキングアルゴリズムは,行動知覚を損なうことなく,プライバシー保護に使用できることがわかった。

Face identity masking algorithms developed in recent years aim to protect the privacy of people in video recordings. These algorithms are designed to interfere with identification, while preserving information about facial actions. An important challenge is to preserve subtle actions in the eye region, while obscuring the salient identity cues from the eyes. We evaluated the effectiveness of identity-masking algorithms based on Canny filters, applied with and without eye enhancement, for interfering with identification and preserving facial actions. In Experiments 1 and 2, we tested human participants' ability to match the facial identity of a driver in a low resolution video to a high resolution facial image. Results showed that both masking methods impaired identification, and that eye enhancement did not alter the effectiveness of the Canny filter mask. In Experiment 3, we tested action preservation and found that neither method interfered significantly with driver action perception. We conclude that relatively simple, filter-based masking algorithms, which are suitable for application to low quality video, can be used in privacy protection without compromising action perception.
翻訳日:2023-01-23 13:46:32 公開日:2023-01-20
# 並列エッジオフロードによる群集シーンのリアルタイム高分解能歩行者検出

Real-Time High-Resolution Pedestrian Detection in Crowded Scenes via Parallel Edge Offloading ( http://arxiv.org/abs/2301.08406v1 )

ライセンス: Link先を確認
Hao Wang and Hao Bao and Liekang Zeng and Ke Luo and Xu Chen(参考訳) 監視システムにおいて、高密度で小型の歩行者を識別するために、高解像度のカメラが広く展開され、高解像度の画像をキャプチャし、市販の歩行者検出モデルに届ける。 しかし、高い解像度によってもたらされる高い計算集約的なワークロードを考えると、リソース制約のあるカメラは正確な推論をリアルタイムで行えない。 そこで我々は,複数のエッジノードを近接的に利用し,高精度な入力で歩行者検出を高速化するオフロードビデオ解析フレームワークHodeを提案する。 具体的には,高解像度画像を各領域にインテリジェントに分割し,分散エッジノードにオフロードすることで,歩行者検出を並列に行うことができる。 時空間的フローフィルタリング手法は,コンテキスト認識領域分割を可能にするとともに,異種エッジノード間の精度認識負荷バランスを実現するdrlに基づくスケジューリングアルゴリズムである。 現実的なプロトタイプを用いた大規模な評価結果から,Hodeは最大2.01%のスピードアップを達成でき,精度は極めて低い。

To identify dense and small-size pedestrians in surveillance systems, high-resolution cameras are widely deployed, where high-resolution images are captured and delivered to off-the-shelf pedestrian detection models. However, given the highly computation-intensive workload brought by the high resolution, the resource-constrained cameras fail to afford accurate inference in real time. To address that, we propose Hode, an offloaded video analytic framework that utilizes multiple edge nodes in proximity to expedite pedestrian detection with high-resolution inputs. Specifically, Hode can intelligently split high-resolution images into respective regions and then offload them to distributed edge nodes to perform pedestrian detection in parallel. A spatio-temporal flow filtering method is designed to enable context-aware region partitioning, as well as a DRL-based scheduling algorithm to allow accuracy-aware load balance among heterogeneous edge nodes. Extensive evaluation results using realistic prototypes show that Hode can achieve up to 2.01% speedup with very mild accuracy loss.
翻訳日:2023-01-23 13:46:12 公開日:2023-01-20
# 非線形コヒーレント媒質中の量子散乱状態

Quantum Scattering States in a Nonlinear Coherent Medium ( http://arxiv.org/abs/2301.08472v1 )

ライセンス: Link先を確認
Allison Brattley, Hongyi Huang and Kunal K. Das(参考訳) 本研究では,非線型項の正と負の両方の符号に対して,一次元 (1次元) に局在ポテンシャルが存在する場合の2次あるいは2次非線形性をもつコヒーレント媒質中の定常状態の包括的研究を行う。 この記述は非線形シュリンガー方程式(英語版)(NLSE)の項で表され、従って、平均場状態における相互作用する超低温原子や光ファイバにおける光伝搬を含む様々なシステムに適用できる。 解決策の全体像を、潜在的ステップの観点から決定し、矩形障壁や井戸ポテンシャルのソリューションを構築します。 すべての解は、複素値の位相シフトを含むヤコビ楕円関数を用いて表現できることが示されている。 境界条件は直観的に位相空間曲線の交叉として可視化されるが、この解法は水力学図に付随する立方多項式の根に依拠し、境界条件は有界と非有界の両方の解の簡単な分類を提供する。 開境界条件の解をリング上の障壁ポテンシャルの解と比較し,滑らかな障壁に対する数値計算解と矩形障壁の解析解とを定性的に一致させることを示した。 ゆらぎに対するボゴリューボフ方程式に基づく解の安定性解析により、持続的不安定性は鋭い境界で局所化され、境界を越えた平均密度変化とエッジにおける密度の導関数の値との関係によって予測される。 障壁電位によるウェーブパケットの散乱について検討し、任意の瞬間において散乱状態が定常解によってよく説明され、非線形散乱問題に対する我々の結果と方法の適用性を示す。

We present a comprehensive study of stationary states in a coherent medium with a quadratic or Kerr nonlinearity in the presence of localized potentials in one dimension (1D) for both positive and negative signs of the nonlinear term, as well as for barriers and wells. The description is in terms of the nonlinear Schr\"odinger equation (NLSE) and hence applicable to a variety of systems, including interacting ultracold atoms in the mean field regime and light propagation in optical fibers. We determine the full landscape of solutions, in terms of a potential step and build solutions for rectangular barrier and well potentials. It is shown that all the solutions can be expressed in terms of a Jacobi elliptic function with the inclusion of a complex-valued phase shift. Our solution method relies on the roots of a cubic polynomial associated with a hydrodynamic picture, which provides a simple classification of all the solutions, both bounded and unbounded, while the boundary conditions are intuitively visualized as intersections of phase space curves. We compare solutions for open boundary conditions with those for a barrier potential on a ring, and also show that numerically computed solutions for smooth barriers agree qualitatively with analytical solutions for rectangular barriers. A stability analysis of solutions based on the Bogoliubov equations for fluctuations show that persistent instabilities are localized at sharp boundaries, and are predicated by the relation of the mean density change across the boundary to the value of the derivative of the density at the edge. We examine the scattering of a wavepacket by a barrier potential and show that at any instant the scattered states are well described by the stationary solutions we obtain, indicating applications of our results and methods to nonlinear scattering problems.
翻訳日:2023-01-23 13:40:24 公開日:2023-01-20
# 判別器からの自己スーパービジョンによるGANの空間安定性

Spatial Steerability of GANs via Self-Supervision from Discriminator ( http://arxiv.org/abs/2301.08455v1 )

ライセンス: Link先を確認
Jianyuan Wang, Ceyuan Yang, Yinghao Xu, Yujun Shen, Hongdong Li, Bolei Zhou(参考訳) 生成モデルは近年のフォトリアリスティック画像合成に大きな進歩を遂げている。 画像生成プロセスのステアリングと出力のカスタマイズを可能にするため、多くの研究がGANの潜在空間の解釈可能な次元を探索している。 既存の方法は、特定の方向に沿って遅延コードを変更することで、方向や色調などの出力画像の属性を編集する。 しかしながら、これらの手法は通常、事前訓練されたモデルごとに追加のヒューマンアノテーションを必要とし、主にグローバル属性の編集に焦点を当てる。 本研究では,潜在空間における制御可能な方向を探索したり,追加のアノテーションを必要とせずにganの空間制御性を改善するための自己教師あり手法を提案する。 具体的には、空間帰納バイアスとして生成モデルの中間層に符号化されるランダムなガウス熱マップを設計する。 GANモデルをゼロからトレーニングすると同時に、これらのヒートマップは、自己監督的な学習方法で、GANの差別者の関心の高まりに合わせている。 推論中、人間のユーザは空間のヒートマップと直感的に対話して、シーンレイアウトの変更やシーン内の移動オブジェクトなどの出力イメージを編集することができる。 大規模な実験により,提案手法は人間の顔,動物の顔,屋外シーン,複雑な屋内シーンの空間的編集を可能にするだけでなく,合成品質の向上ももたらした。

Generative models make huge progress to the photorealistic image synthesis in recent years. To enable human to steer the image generation process and customize the output, many works explore the interpretable dimensions of the latent space in GANs. Existing methods edit the attributes of the output image such as orientation or color scheme by varying the latent code along certain directions. However, these methods usually require additional human annotations for each pretrained model, and they mostly focus on editing global attributes. In this work, we propose a self-supervised approach to improve the spatial steerability of GANs without searching for steerable directions in the latent space or requiring extra annotations. Specifically, we design randomly sampled Gaussian heatmaps to be encoded into the intermediate layers of generative models as spatial inductive bias. Along with training the GAN model from scratch, these heatmaps are being aligned with the emerging attention of the GAN's discriminator in a self-supervised learning manner. During inference, human users can intuitively interact with the spatial heatmaps to edit the output image, such as varying the scene layout or moving objects in the scene. Extensive experiments show that the proposed method not only enables spatial editing over human faces, animal faces, outdoor scenes, and complicated indoor scenes, but also brings improvement in synthesis quality.
翻訳日:2023-01-23 13:39:54 公開日:2023-01-20
# 説明的概念ドリフトの特徴的関連分析--人間活動認識の事例研究

Feature Relevance Analysis to Explain Concept Drift -- A Case Study in Human Activity Recognition ( http://arxiv.org/abs/2301.08453v1 )

ライセンス: Link先を確認
Pekka Siirtola and Juha R\"oning(参考訳) 本稿では,概念ドリフトの検出と説明について述べる。 ヒューマンアクティビティ認識は、モデル更新プロセスで使用されるラベルの品質が低下し始めるオンラインバッチ学習状況とともに、ケーススタディとして使用される。 ドリフト検出は、ドリフトモデルとモデルとの間に最も関連性の大きい一連の特徴を識別することと、これらの特徴が時間とともにどのように変化するかを監視することに基づいている。 本論文の主結果として,概念ドリフトを検知するだけでなく,概念ドリフトの典型的理由を事前に定義した場合にドリフトの原因を説明するために,特徴関係解析を用いることができないことが示されている。 概念の漂流の理由を説明するため,これらの既定の理由が特徴的関連性にどのように影響するかを考察した。 実際、これらはそれぞれ特徴の関連性にユニークな効果があることが示されており、これらは概念の漂流の理由を説明するために使用できる。

This article studies how to detect and explain concept drift. Human activity recognition is used as a case study together with a online batch learning situation where the quality of the labels used in the model updating process starts to decrease. Drift detection is based on identifying a set of features having the largest relevance difference between the drifting model and a model that is known to be accurate and monitoring how the relevance of these features changes over time. As a main result of this article, it is shown that feature relevance analysis cannot only be used to detect the concept drift but also to explain the reason for the drift when a limited number of typical reasons for the concept drift are predefined. To explain the reason for the concept drift, it is studied how these predefined reasons effect to feature relevance. In fact, it is shown that each of these has an unique effect to features relevance and these can be used to explain the reason for concept drift.
翻訳日:2023-01-23 13:39:35 公開日:2023-01-20
# 有界部分最適性をもつグラフトランスフォーマーを用いたマルチエージェント計画の高速化

Accelerating Multi-Agent Planning Using Graph Transformers with Bounded Suboptimality ( http://arxiv.org/abs/2301.08451v1 )

ライセンス: Link先を確認
Chenning Yu, Qingbiao Li, Sicun Gao, Amanda Prorok(参考訳) 競合ベースの検索は、マルチエージェントパス探索の最も一般的な方法の1つである。 完全かつ最適ではあるが、スケールが良くない。 様々なヒューリスティックを導入して加速する最近の研究が提案されている。 しかし、これらのヒューリスティックが非グリッドベースの問題設定に適用できるかどうかは、その有効性を維持しながら、未解決の問題である。 この研究では、答えがNoになる傾向があることが分かりました。 そこで本研究では,グラフ変換器を設計の高速化のためのヒューリスティック関数として,学習ベースのコンポーネントを提案する。 提案手法は任意の所望の因子で完全かつ有界に最適である。 密度グラフを持つ2つの環境に対して広範な実験を行う。 その結果,提案するグラフトランスフォーマーは,エージェントが比較的少ない問題インスタンスでトレーニングでき,より多数のエージェントに一般化できると同時に,最先端の手法よりも優れた性能が得られることがわかった。

Conflict-Based Search is one of the most popular methods for multi-agent path finding. Though it is complete and optimal, it does not scale well. Recent works have been proposed to accelerate it by introducing various heuristics. However, whether these heuristics can apply to non-grid-based problem settings while maintaining their effectiveness remains an open question. In this work, we find that the answer is prone to be no. To this end, we propose a learning-based component, i.e., the Graph Transformer, as a heuristic function to accelerate the planning. The proposed method is provably complete and bounded-suboptimal with any desired factor. We conduct extensive experiments on two environments with dense graphs. Results show that the proposed Graph Transformer can be trained in problem instances with relatively few agents and generalizes well to a larger number of agents, while achieving better performance than state-of-the-art methods.
翻訳日:2023-01-23 13:39:18 公開日:2023-01-20
# 脳波に基づく視覚認識のための音源なし主題適応

Source-free Subject Adaptation for EEG-based Visual Recognition ( http://arxiv.org/abs/2301.08448v1 )

ライセンス: Link先を確認
Pilhyeon Lee, Seogkyu Jeon, Sunhee Hwang, Minjung Shin, Hyeran Byun(参考訳) 本稿では,脳波に基づく視覚認識の主題適応に焦点を当てた。 情報源の豊富なデータから知識を伝達することにより、脳波サンプルが制限された対象者向けにカスタマイズされた視覚刺激認識システムを構築することを目的としている。 既存のアプローチでは、トレーニング中にソース対象のサンプルがアクセス可能であるシナリオが検討されている。 しかし、プライバシの問題から脳波信号などの生体データにアクセスすることは、しばしば実現不可能で問題となる。 本稿では,対象データを利用できなくし,事前学習したモデルパラメータのみを対象適応として提供する,新規で実践的な課題設定,すなわちソースフリーな対象適応を導入する。 この課題に対処するため、分類器応答を用いて音源からの脳波サンプルをシミュレートする分類器ベースのデータ生成を提案する。 生成したサンプルと対象データを用いて、被験者に依存しない特徴学習を行い、異なる被験者間で共有される共通知識を活用する。 特に,本フレームワークは一般化可能であり,対象に依存しない学習手法を適用できる。 EEG-ImageNet40ベンチマークの実験では、主観非依存学習の選択にかかわらず、我々のモデルは一貫した改善をもたらす。 また,提案手法では,ソースデータに頼らずとも5ショット設定でトップ1テスト精度74.6%の有望な性能を示す。 私たちのコードはhttps://github.com/DeepBCI/Deep-BCI/tree/master/1_Intelligent_BCI/Source_Free_Subject_Adaptation_for _EEGで確認できます。

This paper focuses on subject adaptation for EEG-based visual recognition. It aims at building a visual stimuli recognition system customized for the target subject whose EEG samples are limited, by transferring knowledge from abundant data of source subjects. Existing approaches consider the scenario that samples of source subjects are accessible during training. However, it is often infeasible and problematic to access personal biological data like EEG signals due to privacy issues. In this paper, we introduce a novel and practical problem setup, namely source-free subject adaptation, where the source subject data are unavailable and only the pre-trained model parameters are provided for subject adaptation. To tackle this challenging problem, we propose classifier-based data generation to simulate EEG samples from source subjects using classifier responses. Using the generated samples and target subject data, we perform subject-independent feature learning to exploit the common knowledge shared across different subjects. Notably, our framework is generalizable and can adopt any subject-independent learning method. In the experiments on the EEG-ImageNet40 benchmark, our model brings consistent improvements regardless of the choice of subject-independent learning. Also, our method shows promising performance, recording top-1 test accuracy of 74.6% under the 5-shot setting even without relying on source data. Our code can be found at https://github.com/DeepBCI/Deep-BCI/tree/master/1_Intelligent_BCI/Source_Free_Subject_Adaptation_for _EEG.
翻訳日:2023-01-23 13:39:04 公開日:2023-01-20
# PT-Symmetric Dissipative Kitaev Chainの位相相

Topological Phases in a PT-Symmetric Dissipative Kitaev Chain ( http://arxiv.org/abs/2301.08446v1 )

ライセンス: Link先を確認
Makio Kawasaki and Hideaki Obuse(参考訳) マルコフ量子マスター方程式によって記述された散逸キタエフ連鎖の位相相について検討する。 散逸的時間発展を生み出すリンドブラジアンと非エルミート行列との対応に基づいて、リンドブラジアンは非エルミート位相相で分類される。 リンドブラジアンはオープンシステムの顕著な対称性であるpt対称性を保持しており、全てのバルクモードは共通の寿命を持つことができる。 さらに、開境界条件がシステムに課されると、pt対称性を破るエッジモードが出現し、エッジモードの1つは固有値がゼロとなる。

We study a topological phase in the dissipative Kitaev chain described by the Markovian quantum master equation. Based on the correspondence between Lindbladians, which generate the dissipative time-evolution, and non-Hermitian matrices, Lindbladians are classified in terms of non-Hermitian topological phases. We find out that the Lindbladian retains PT symmetry which is the prominent symmetry of open systems and then all the bulk modes can have a common lifetime. Moreover, when open boundary conditions are imposed on the system, the edge modes which break PT symmetry emerge, and one of the edge modes has a zero eigenvalue.
翻訳日:2023-01-23 13:38:42 公開日:2023-01-20
# DIFAI:StyleGANインバージョンを用いた横顔インペイント

DIFAI: Diverse Facial Inpainting using StyleGAN Inversion ( http://arxiv.org/abs/2301.08443v1 )

ライセンス: Link先を確認
Dongsik Yoon, Jeong-gi Kwak, Yuanming Li, David Han and Hanseok Ko(参考訳) 画像の塗装はコンピュータビジョンの古い問題であり、隠蔽領域を復元し、損傷した画像を完成させる。 顔画像の着色の場合、他の合理的な可能性はあるが、ほとんどの方法はマスク画像ごとに1つの結果だけを生成する。 一つの画像のみを生成することによって生じる潜在的なバイアスや不自然な制約を防止するために,StyleGANの埋め込み空間を利用した多彩な顔塗布のための新しい枠組みを提案する。 本フレームワークでは,pSpエンコーダとSeFaアルゴリズムを用いて,StyleGAN埋め込みのセマンティックコンポーネントを同定し,その領域正規化を適用したSPARNデコーダに供給する。 提案手法がいくつかの最先端手法に勝ることを実証する。

Image inpainting is an old problem in computer vision that restores occluded regions and completes damaged images. In the case of facial image inpainting, most of the methods generate only one result for each masked image, even though there are other reasonable possibilities. To prevent any potential biases and unnatural constraints stemming from generating only one image, we propose a novel framework for diverse facial inpainting exploiting the embedding space of StyleGAN. Our framework employs pSp encoder and SeFa algorithm to identify semantic components of the StyleGAN embeddings and feed them into our proposed SPARN decoder that adopts region normalization for plausible inpainting. We demonstrate that our proposed method outperforms several state-of-the-art methods.
翻訳日:2023-01-23 13:38:30 公開日:2023-01-20
# 深層強化学習のための政策勾配推定バイアスの再検討

Revisiting Estimation Bias in Policy Gradients for Deep Reinforcement Learning ( http://arxiv.org/abs/2301.08442v1 )

ライセンス: Link先を確認
Haoxuan Pan (1 and 2), Deheng Ye (2), Xiaoming Duan (1), Qiang Fu (2), Wei Yang (2), Jianping He (1), Mingfei Sun (3) ((1) Shanghai Jiaotong University, (2) Tencent Inc, (3) The University of Manchester)(参考訳) 本稿では,Deep Reinforcement Learning(DRL)の観点から,MDP(Redissated Episodic Markov decision process)の政策勾配の推定バイアスを再検討する。 この目的は理論的に定式化され、期待されるリターンは時間的地平線上で割引される。 勾配を推定するために用いられる状態分布は、割引係数を考慮していない理論的な定式化とは異なる。 このバイアスの影響に関する既存の議論は、文献の表とソフトマックスのケースに限られていた。 そこで本論文では,政策がパラメータ化されるDRL設定に拡張し,このバイアスが理論的に準最適政策につながることを示す。 次に、なぜ経験的に不正確な実装とシフト状態の分散が有効なのかについて議論する。 このような状態分布シフトにもかかわらず、政策勾配推定バイアスは以下の3つの方法で低減できることを示す。 1) 学習率の少なさ 2)適応学習率に基づく最適化装置,及び 3) KL正則化。 具体的には,Adam や RSMProp の最適化手法など,より少ない学習率,あるいは適応的な学習率によって,政策最適化がバイアスに対して堅牢であることを示す。 さらに、最適化器と最適化正則化との間の接続を描き、KLと逆KLの正則化の両方がこのバイアスを著しく補正できることを示す。 さらに,連続制御タスクに関する広範な実験を行い,解析支援を行う。 本論文は, PGアルゴリズムがDRL設定におけるポリシーをいかに最適化するかを考察し, DRLの実践的問題に対する洞察に寄与する。

We revisit the estimation bias in policy gradients for the discounted episodic Markov decision process (MDP) from Deep Reinforcement Learning (DRL) perspective. The objective is formulated theoretically as the expected returns discounted over the time horizon. One of the major policy gradient biases is the state distribution shift: the state distribution used to estimate the gradients differs from the theoretical formulation in that it does not take into account the discount factor. Existing discussion of the influence of this bias was limited to the tabular and softmax cases in the literature. Therefore, in this paper, we extend it to the DRL setting where the policy is parameterized and demonstrate how this bias can lead to suboptimal policies theoretically. We then discuss why the empirically inaccurate implementations with shifted state distribution can still be effective. We show that, despite such state distribution shift, the policy gradient estimation bias can be reduced in the following three ways: 1) a small learning rate; 2) an adaptive-learning-rate-based optimizer; and 3) KL regularization. Specifically, we show that a smaller learning rate, or, an adaptive learning rate, such as that used by Adam and RSMProp optimizers, makes the policy optimization robust to the bias. We further draw connections between optimizers and the optimization regularization to show that both the KL and the reverse KL regularization can significantly rectify this bias. Moreover, we provide extensive experiments on continuous control tasks to support our analysis. Our paper sheds light on how successful PG algorithms optimize policies in the DRL setting, and contributes insights into the practical issues in DRL.
翻訳日:2023-01-23 13:38:16 公開日:2023-01-20
# 疲労損傷予測問題におけるデータ不足に対する自己教師あり学習

Self-Supervised Learning for Data Scarcity in a Fatigue Damage Prognostic Problem ( http://arxiv.org/abs/2301.08441v1 )

ライセンス: Link先を確認
Anass Akrim, Christian Gogu, Rob Vingerhoeds, Michel Sala\"un(参考訳) PHM(Prognostics and Health Management)のデータの利用が増加し、ディープラーニング(DL)技術はこの応用に多大な関心を寄せられ、しばしばより正確なRemaining Useful Life(RUL)予測を達成している。 しかし、DL技術の大きな課題の1つは、産業システム上で大量のラベル付きデータを取得することの難しさにある。 このようなラベル付きデータの欠如を克服するため,新たな学習手法として,教師なし学習アプローチのサブカテゴリであるセルフ・スーパーバイザード・ラーニング(Self-Supervised Learning)が検討されている。 本稿では,ラベル付きデータが少ないFew-Shots Learningのみを用いたRUL推定に,自己学習型DLモデルが有用かどうかを検討することを目的とする。 本研究では, ひずみゲージデータからの疲労き裂を受けるアルミニウム合金パネル(典型的には航空宇宙構造物)のRULを推定し, 疲労損傷診断問題に対処する。 ひずみデータからなる合成データセットを使用して、データセットサイズが予測性能に与える影響を広範囲に調査する。 その結果、自己教師付き事前学習モデルは、下流RUL予測タスクにおいて非事前学習モデルよりも大幅に優れており、計算コストも少なく、限られたラベル付きデータしか利用できない場合に有望な結果を示す。

With the increasing availability of data for Prognostics and Health Management (PHM), Deep Learning (DL) techniques are now the subject of considerable attention for this application, often achieving more accurate Remaining Useful Life (RUL) predictions. However, one of the major challenges for DL techniques resides in the difficulty of obtaining large amounts of labelled data on industrial systems. To overcome this lack of labelled data, an emerging learning technique is considered in our work: Self-Supervised Learning, a sub-category of unsupervised learning approaches. This paper aims to investigate whether pre-training DL models in a self-supervised way on unlabelled sensors data can be useful for RUL estimation with only Few-Shots Learning, i.e. with scarce labelled data. In this research, a fatigue damage prognostics problem is addressed, through the estimation of the RUL of aluminum alloy panels (typical of aerospace structures) subject to fatigue cracks from strain gauge data. Synthetic datasets composed of strain data are used allowing to extensively investigate the influence of the dataset size on the predictive performance. Results show that the self-supervised pre-trained models are able to significantly outperform the non-pre-trained models in downstream RUL prediction task, and with less computational expense, showing promising results in prognostic tasks when only limited labelled data is available.
翻訳日:2023-01-23 13:37:50 公開日:2023-01-20
# 太陽放射圧下での変換可能な宇宙船の体構成と関節駆動姿勢安定化の最適化

Optimization of body configuration and joint-driven attitude stabilization for transformable spacecrafts under solar radiation pressure ( http://arxiv.org/abs/2301.08435v1 )

ライセンス: Link先を確認
Yuki Kubo, Toshihiro Chujo(参考訳) 太陽セイルは、理論上は太陽放射圧(SRP)を用いた特異なインパルスのため、最も有望な宇宙探査システムの一つである。 近年、一部の研究者は、アクチュアブルジョイントで身体構成を積極的に再構成できる「トランスフォーマブル宇宙船」を提案している。 変換可能な宇宙船は、太陽帆として使用される場合の自由度を制御する高い冗長性のため、軌道と姿勢制御能力を大きく向上することが期待されている。 しかし、その大量の入力は制御に困難をもたらすため、以前の研究者は制御能力を制限するために強い制約を課した。 本稿では,SRPによるトランスフォーマブル宇宙船の姿勢制御技術について述べる。 著者らは, 任意のsrp力とトルクを得るための関節角度最適化と, 関節角度の揺らぎによって駆動される運動量減衰制御の2つの方法を提案している。 提案手法は一般的な形態で定式化され, 平板と薄板で構成された変換可能な太陽帆に適用可能である。 数値シミュレーションにより,提案手法の有効性を確認した。 本論文は, 軌道・姿勢制御能力の大幅な向上が期待できる拡張型推進剤を使わずに, 変換可能な太陽帆の高制御冗長性を実現することに貢献している。

A solar sail is one of the most promising space exploration system because of its theoretically infinite specific impulse using solar radiation pressure (SRP). Recently, some researchers proposed "transformable spacecrafts" that can actively reconfigure their body configurations with actuatable joints. The transformable spacecrafts are expected to greatly enhance orbit and attitude control capability due to its high redundancy in control degree of freedom if they are used as solar sails. However, its large number of input poses difficulties in control, and therefore, previous researchers imposed strong constraints to limit its potential control capabilities. This paper addresses novel attitude control techniques for the transformable spacecrafts under SRP. The authors have constructed two proposed methods; one of those is a joint angle optimization to acquire arbitrary SRP force and torque, and the other is a momentum damping control driven by joint angle actuation. Our proposed methods are formulated in general forms and applicable to any transformable solar sail that consists of flat and thin body components. Validity of the proposed methods are confirmed by numerical simulations. This paper contributes to making most of the high control redundancy of transformable solar sails without consuming any expendable propellants, which is expected to greatly enhance orbit and attitude control capability.
翻訳日:2023-01-23 13:37:23 公開日:2023-01-20
# マルチスペースによるヒューマンモビリティのクラスタリング

Clustering Human Mobility with Multiple Spaces ( http://arxiv.org/abs/2301.08524v1 )

ライセンス: Link先を確認
Haoji Hu, Haowen Lin, Yao-Yi Chiang(参考訳) ヒューマンモビリティクラスタリングは、人間のモビリティ行動(仕事や学校通勤など)を理解する上で重要な問題である。 既存の手法は通常、モビリティ表現の選択または学習とクラスタリングアルゴリズムを表現に適用する2つのステップを含む。 しかし,これらの手法はトラジェクトリにおける厳密な訪問順序に依存しており,複数種類のモビリティ表現を活用できない。 本稿では,モビリティ行動検出のための新しいモビリティクラスタリング手法を提案する。 提案手法は,まず,異なる訪問順序を持つが移動行動に類似した影響を持つサブトラジェクトリを扱うための置換等価演算を含む。 第二に,提案手法は変分オートエンコーダアーキテクチャを用いて,潜在空間と原空間の両方でクラスタリングを同時に行う。 また、1つの潜在空間のバイアスに対処するために、クラスタリング割り当て予測は、異なるエポックで複数の学習された潜在空間を考える。 このようにして、提案手法は正確な結果を生成し、各軌道のクラスタ割り当ての信頼性を推定できる。 実験の結果,提案手法はトラジェクトリからの移動行動検出において,より精度が高く,解釈性も向上した。

Human mobility clustering is an important problem for understanding human mobility behaviors (e.g., work and school commutes). Existing methods typically contain two steps: choosing or learning a mobility representation and applying a clustering algorithm to the representation. However, these methods rely on strict visiting orders in trajectories and cannot take advantage of multiple types of mobility representations. This paper proposes a novel mobility clustering method for mobility behavior detection. First, the proposed method contains a permutation-equivalent operation to handle sub-trajectories that might have different visiting orders but similar impacts on mobility behaviors. Second, the proposed method utilizes a variational autoencoder architecture to simultaneously perform clustering in both latent and original spaces. Also, in order to handle the bias of a single latent space, our clustering assignment prediction considers multiple learned latent spaces at different epochs. This way, the proposed method produces accurate results and can provide reliability estimates of each trajectory's cluster assignment. The experiment shows that the proposed method outperformed state-of-the-art methods in mobility behavior detection from trajectories with better accuracy and more interpretability.
翻訳日:2023-01-23 13:31:20 公開日:2023-01-20
# SGMを用いた定期時間系列生成

Regular Time-series Generation using SGM ( http://arxiv.org/abs/2301.08518v1 )

ライセンス: Link先を確認
Haksoo Lim, Minjung Kim, Sewon Park, Noseong Park(参考訳) スコアベース生成モデル(SGM)は、近年注目されている生成モデルである。 時系列は、例えば、ストックデータ、気候データなど、私たちの日常生活で頻繁に発生する。 特に、時系列予測と分類は機械学習の分野で人気のある研究トピックである。 SGMは、他の生成モデルよりも優れていることも知られている。 その結果,sgmを用いて条件スコア関数を学習することで時系列データを合成する。 時系列生成領域のための条件付きスコアネットワークを提案する。 さらに、時系列生成領域におけるスコアマッチングと雑音スコアマッチングとの損失関数も導出する。 最後に,実世界のデータセットにおいて,サンプリングの多様性と品質の観点から最先端の結果を得る。

Score-based generative models (SGMs) are generative models that are in the spotlight these days. Time-series frequently occurs in our daily life, e.g., stock data, climate data, and so on. Especially, time-series forecasting and classification are popular research topics in the field of machine learning. SGMs are also known for outperforming other generative models. As a result, we apply SGMs to synthesize time-series data by learning conditional score functions. We propose a conditional score network for the time-series generation domain. Furthermore, we also derive the loss function between the score matching and the denoising score matching in the time-series generation domain. Finally, we achieve state-of-the-art results on real-world datasets in terms of sampling diversity and quality.
翻訳日:2023-01-23 13:31:03 公開日:2023-01-20
# 時間を伴う生成論理:論理的一貫性と統計的可能性を超えて

Generative Logic with Time: Beyond Logical Consistency and Statistical Possibility ( http://arxiv.org/abs/2301.08509v1 )

ライセンス: Link先を確認
Hiroyuki Kido(参考訳) 本稿では、時間とともにデータから象徴的知識を完全に論理的に推論する理論を提案する。 データから記号的知識を生成する時間確率モデルを提案する。 モデルの統計的正確性は、コルモゴロフの公理、フェンスタッドの定理、最大確率推定との整合性の観点から正当化される。 モデルの論理的正当性は命題論理とその拡張に関する論理結果関係の観点から正当化される。 この理論は局所化問題に適用できることを示す。

This paper gives a theory of inference to logically reason symbolic knowledge fully from data over time. We propose a temporal probabilistic model that generates symbolic knowledge from data. The statistical correctness of the model is justified in terms of consistency with Kolmogorov's axioms, Fenstad's theorems and maximum likelihood estimation. The logical correctness of the model is justified in terms of logical consequence relations on propositional logic and its extension. We show that the theory is applicable to localisation problems.
翻訳日:2023-01-23 13:30:52 公開日:2023-01-20
# 言語非依存データ駆動逆テキスト正規化

Language Agnostic Data-Driven Inverse Text Normalization ( http://arxiv.org/abs/2301.08506v1 )

ライセンス: Link先を確認
Szu-Jui Chen, Debjyoti Paul, Yutong Pang, Peng Su, Xuedong Zhang(参考訳) 自動音声認識(ASR)モデルが出現すると、音声形式のテキスト(ASRから)を書式に変換することが緊急に必要となる。 この逆テキスト正規化(ITN)問題は、様々な分野から研究者の注目を集めている。 近年,データ駆動型itn手法が高品質な書式テキストを出力できることが示されている。 ラベル付き音声データセットの不足のため、非英語データ駆動型itnの研究は非常に限られている。 本研究では,このギャップを埋めるため,言語に依存しないITNフレームワークを提案する。 具体的には、低リソース言語のためのニューラルネットワーク変換データと組み合わせて、データ拡張を利用する。 さらに,英語データのみを利用可能とする言語非依存itnモデルの評価手法を設計する。 この言語非依存モデリングアプローチは,高リソース言語の性能を維持しつつ低リソース言語に有効であることを示す。

With the emergence of automatic speech recognition (ASR) models, converting the spoken form text (from ASR) to the written form is in urgent need. This inverse text normalization (ITN) problem attracts the attention of researchers from various fields. Recently, several works show that data-driven ITN methods can output high-quality written form text. Due to the scarcity of labeled spoken-written datasets, the studies on non-English data-driven ITN are quite limited. In this work, we propose a language-agnostic data-driven ITN framework to fill this gap. Specifically, we leverage the data augmentation in conjunction with neural machine translated data for low resource languages. Moreover, we design an evaluation method for language agnostic ITN model when only English data is available. Our empirical evaluation shows this language agnostic modeling approach is effective for low resource languages while preserving the performance for high resource languages.
翻訳日:2023-01-23 13:30:45 公開日:2023-01-20
# 予測計画:モデルベース強化学習のための不確実性予測モデル学習

Plan To Predict: Learning an Uncertainty-Foreseeing Model for Model-Based Reinforcement Learning ( http://arxiv.org/abs/2301.08502v1 )

ライセンス: Link先を確認
Zifan Wu, Chao Yu, Chen Chen, Jianye Hao, Hankz Hankui Zhuo(参考訳) モデルベース強化学習(mbrl)では、不正確なモデルが誤解を招くサンプルを生成することによってポリシー学習をバイアスできるため、モデル学習が重要である。 しかし、モデル学習シフトに使用される訪問状態に対して、ポリシーが継続的に更新されるため、正確なモデル学習は困難である。 先行手法はモデル生成サンプルの不確かさを定量化することでこの問題を緩和する。 しかし、これらの手法は、モデル軌道がこれらの非常に不確実な領域に落ちる前に不確実性を予測するのではなく、サンプルの生成後に受動的に不確かさを定量化する。 結果として得られる低品質なサンプルは不安定な学習目標を誘導し、ポリシーの最適化を妨げる。 さらに、一段階の予測誤差を最小限に抑えるために学習される一方で、モデルは一般的に複数のステップの予測に使用され、モデル学習の目的とモデル利用のミスマッチにつながる。 そこで本研究では,モデルを意思決定者として,現在の方針を動的に検討することで,モデルロールアウトプロセスを逐次決定問題として扱うMBRLフレームワークである,emph{Plan To Predict} (P2P)を提案する。 このように、モデルは現在の方針に迅速に適応し、軌道を生成する際に多段階の将来の不確実性を予測することができる。 理論的には、P2Pの性能は、実環境リターンの下位境界をほぼ最適化することで保証できることを示す。 実験の結果、P2Pはいくつかの挑戦的なベンチマークタスクで最先端のパフォーマンスを達成することが示された。

In Model-based Reinforcement Learning (MBRL), model learning is critical since an inaccurate model can bias policy learning via generating misleading samples. However, learning an accurate model can be difficult since the policy is continually updated and the induced distribution over visited states used for model learning shifts accordingly. Prior methods alleviate this issue by quantifying the uncertainty of model-generated samples. However, these methods only quantify the uncertainty passively after the samples were generated, rather than foreseeing the uncertainty before model trajectories fall into those highly uncertain regions. The resulting low-quality samples can induce unstable learning targets and hinder the optimization of the policy. Moreover, while being learned to minimize one-step prediction errors, the model is generally used to predict for multiple steps, leading to a mismatch between the objectives of model learning and model usage. To this end, we propose \emph{Plan To Predict} (P2P), an MBRL framework that treats the model rollout process as a sequential decision making problem by reversely considering the model as a decision maker and the current policy as the dynamics. In this way, the model can quickly adapt to the current policy and foresee the multi-step future uncertainty when generating trajectories. Theoretically, we show that the performance of P2P can be guaranteed by approximately optimizing a lower bound of the true environment return. Empirical results demonstrate that P2P achieves state-of-the-art performance on several challenging benchmark tasks.
翻訳日:2023-01-23 13:30:33 公開日:2023-01-20
# 因果的視点から見たグラフ表現学習へのエキスパート論理の導入

Introducing Expertise Logic into Graph Representation Learning from A Causal Perspective ( http://arxiv.org/abs/2301.08496v1 )

ライセンス: Link先を確認
Hang Gao, Jiangmeng Li, Wenwen Qiang, Lingyu Si, Xingzhe Su, Fengge Wu, Changwen Zheng, Fuchun Sun(参考訳) 人間の先行知識の注入から得られるグラフは、派生した離散データとして意味的に密接なものであり、モデルがそのようなデータから意味情報を効率的に学習できるようにする。 したがって、グラフニューラルネットワーク(GNN)は、様々な分野で顕著な成功を収めている。 GNNの学習パラダイムを再考すると、人間の専門知識とGNNがモデル化した知識の関係が研究者を混乱させ続けていることが分かる。 この目的のために、我々はモチベーション実験を導入し、人間の専門知識が一般ドメインのGNNによって徐々に学習されるという経験的観察を導き出す。 グラフ表現学習に専門知識ロジックを導入することの意義を更に観察することにより、GNNを人的知識の習得に導くことは、モデルの性能を向上させることができると結論付けている。 このような観察の背後にある本質的なメカニズムを探ることで、グラフ表現学習パラダイムのための構造的因果モデルについて詳述する。 理論的ガイダンスに従って,グラフ表現学習タスクに因果関係のある専門知識論理を学習するためのモデルを改善するための補助因果論理学習パラダイムを革新的に導入する。 実際には、最適化中に不十分なトレーニング問題に取り組むために、さらに対策技術が実施される。 工芸及び実世界の領域に関する多くの実験が提案手法の一貫性のある有効性を支持している。

Benefiting from the injection of human prior knowledge, graphs, as derived discrete data, are semantically dense so that models can efficiently learn the semantic information from such data. Accordingly, graph neural networks (GNNs) indeed achieve impressive success in various fields. Revisiting the GNN learning paradigms, we discover that the relationship between human expertise and the knowledge modeled by GNNs still confuses researchers. To this end, we introduce motivating experiments and derive an empirical observation that the human expertise is gradually learned by the GNNs in general domains. By further observing the ramifications of introducing expertise logic into graph representation learning, we conclude that leading the GNNs to learn human expertise can improve the model performance. By exploring the intrinsic mechanism behind such observations, we elaborate the Structural Causal Model for the graph representation learning paradigm. Following the theoretical guidance, we innovatively introduce the auxiliary causal logic learning paradigm to improve the model to learn the expertise logic causally related to the graph representation learning task. In practice, the counterfactual technique is further performed to tackle the insufficient training issue during optimization. Plentiful experiments on the crafted and real-world domains support the consistent effectiveness of the proposed method.
翻訳日:2023-01-23 13:30:08 公開日:2023-01-20
# マルチエージェント強化学習による社会的ジレンマにおけるモラル選択のモデル化

Modeling Moral Choices in Social Dilemmas with Multi-Agent Reinforcement Learning ( http://arxiv.org/abs/2301.08491v1 )

ライセンス: Link先を確認
Elizaveta Tennant, Stephen Hailes, Mirco Musolesi(参考訳) 現実世界における人工知能(AI)の実践的利用は、知的エージェントに道徳的選択を埋め込むことの重要性を証明している。 彼らはまた、AI上のトップダウンの倫理的制約を、あらゆる種類の道徳性に従って定義することは極めて困難であり、リスクをもたらす可能性があることも強調した。 ボトムアップ学習アプローチは、AIエージェントの倫理行動の研究と開発にもっと適しているかもしれない。 特に、興味深く洞察に富んだ出発点は、社会的ジレンマにおける道徳的報酬のセットに従って行動する強化学習(RL)エージェントの創発的行動の分析であると考えている。 本稿では,道徳理論に基づく報酬を内在的に動機づけたRLエージェントによる選択の体系的分析を行う。 我々は、一連の重要な倫理体系を単純化しつつも代表する報酬構造を設計することを目指している。 そこで、まず、結果に基づくエージェントと規範に基づくエージェントを区別する道徳的報酬関数を定義し、社会的な規範や内面的な徳に基づく道徳と、単一と混成の方法論(例えば、多目的)をそれぞれ定義する。 そこで我々は,3つの反復的ソーシャルジレンマゲーム (Prisoner's Dilemma, Volunteer's Dilemma, Stag Hunt) において,モラルエージェント間の反復的対話をモデル化して評価した。 我々は、異なるタイプの道徳が協力の出現、欠陥、搾取、およびそれに対応する社会的成果に与える影響を分析する。 最後に,これらの知見が人工・混在型AI社会におけるモラルエージェントの発達に与える影響について考察する。

Practical uses of Artificial Intelligence (AI) in the real world have demonstrated the importance of embedding moral choices into intelligent agents. They have also highlighted that defining top-down ethical constraints on AI according to any one type of morality is extremely challenging and can pose risks. A bottom-up learning approach may be more appropriate for studying and developing ethical behavior in AI agents. In particular, we believe that an interesting and insightful starting point is the analysis of emergent behavior of Reinforcement Learning (RL) agents that act according to a predefined set of moral rewards in social dilemmas. In this work, we present a systematic analysis of the choices made by intrinsically-motivated RL agents whose rewards are based on moral theories. We aim to design reward structures that are simplified yet representative of a set of key ethical systems. Therefore, we first define moral reward functions that distinguish between consequence- and norm-based agents, between morality based on societal norms or internal virtues, and between single- and mixed-virtue (e.g., multi-objective) methodologies. Then, we evaluate our approach by modeling repeated dyadic interactions between learning moral agents in three iterated social dilemma games (Prisoner's Dilemma, Volunteer's Dilemma and Stag Hunt). We analyze the impact of different types of morality on the emergence of cooperation, defection or exploitation, and the corresponding social outcomes. Finally, we discuss the implications of these findings for the development of moral agents in artificial and mixed human-AI societies.
翻訳日:2023-01-23 13:29:47 公開日:2023-01-20
# causalgraph: 知識グラフに埋め込まれた因果グラフのモデリング、永続化、視覚化のためのPythonパッケージ

causalgraph: A Python Package for Modeling, Persisting and Visualizing Causal Graphs Embedded in Knowledge Graphs ( http://arxiv.org/abs/2301.08490v1 )

ライセンス: Link先を確認
Sven Pieper, Carl Willy Mehling, Dominik Hirsch, Tobias L\"uke and Steffen Ihlenfeldt(参考訳) 本稿では,知識グラフに埋め込まれた因果グラフのモデリングと保存のための,因果グラフという新しいPythonパッケージについて述べる。 このパッケージは因果関係の発見と因果関係推論のような因果関係の分野間のインターフェースを提供するように設計されている。 このパッケージでは、ユーザーは因果グラフを作成して保存し、生成されたグラフをエクスポートして、他のグラフベースのパッケージで使用できる。 提案されたパッケージの主な利点は、追加の情報とメタデータを因果構造にリンクすることを容易にする機能である。 さらに、このパッケージは、ノードやエッジの編集、追加、削除など、グラフモデリングとプロットのためのさまざまな機能を提供している。 また、NetworkXやTigramiteといった広く使われているグラフデータサイエンスライブラリとも互換性があり、背景には特殊な因果グラフオントロジーが組み込まれている。 本稿では,本パッケージの主な機能,機能,使用例について概説する。

This paper describes a novel Python package, named causalgraph, for modeling and saving causal graphs embedded in knowledge graphs. The package has been designed to provide an interface between causal disciplines such as causal discovery and causal inference. With this package, users can create and save causal graphs and export the generated graphs for use in other graph-based packages. The main advantage of the proposed package is its ability to facilitate the linking of additional information and metadata to causal structures. In addition, the package offers a variety of functions for graph modeling and plotting, such as editing, adding, and deleting nodes and edges. It is also compatible with widely used graph data science libraries such as NetworkX and Tigramite and incorporates a specially developed causalgraph ontology in the background. This paper provides an overview of the package's main features, functionality, and usage examples, enabling the reader to use the package effectively in practice.
翻訳日:2023-01-23 13:29:20 公開日:2023-01-20
# 胸部X線画像における肺炎検出 : クラス不均衡の扱い

Pneumonia Detection in Chest X-Ray Images : Handling Class Imbalance ( http://arxiv.org/abs/2301.08479v1 )

ライセンス: Link先を確認
Wardah Ali, Eesha Qureshi, Omama Ahmed Farooqi, Rizwan Ahmed Khan(参考訳) 世界中の人々が肺炎に罹患しているが、サハラ以南のアジアや南アジアでは死者が最も多い。 近年,有効なワクチンや説得力のある抗生物質の使用の有無に関わらず,肺炎の発生率と死亡率の上昇がみられた。 したがって、肺炎は散発的な予防と治療を必要とする病気である。 肺炎の流行により、研究コミュニティは病気を正確にかつ迅速に検出し、診断し、分析するフレームワークを考案した。 人工知能(AI)研究コミュニティが直面している大きなハードルのひとつは、肺炎を含む胸部疾患のデータセットが公開されていないことだ。 第二に、利用可能なデータセットのほとんどは非常に不均衡である(通常の例は過剰にサンプリングされ、障害のあるサンプルは少数派である)ため、問題をさらに困難にしている。 本稿では,肺炎検出のための新しい枠組みについて紹介する。 提案手法の新規性は,クラス不均衡問題に取り組むことにある。 The Generative Adversarial Network (GAN)、特にDeep Convolutional Generative Adversarial Network (DCGAN) と Wasserstein GAN gradient penalty (WGAN-GP) の組合せは、増加のために少数派のクラス '`Pneumonia' に適用されたが、Random Under-Sampling (RUS) は不均衡問題に対処するために多数派のクラス ‘`No Findings' で実施された。 最も大きなデータセットの1つであるChestX-Ray8データセットは、提案されたフレームワークのパフォーマンスを検証するために使用される。 学習フェーズは、最先端ディープラーニングモデル、すなわちresnet-50、xception、vgg-16での転送学習を用いて完了する。 結果は最新を上回った。

People all over the globe are affected by pneumonia but deaths due to it are highest in Sub-Saharan Asia and South Asia. In recent years, the overall incidence and mortality rate of pneumonia regardless of the utilization of effective vaccines and compelling antibiotics has escalated. Thus, pneumonia remains a disease that needs spry prevention and treatment. The widespread prevalence of pneumonia has caused the research community to come up with a framework that helps detect, diagnose and analyze diseases accurately and promptly. One of the major hurdles faced by the Artificial Intelligence (AI) research community is the lack of publicly available datasets for chest diseases, including pneumonia . Secondly, few of the available datasets are highly imbalanced (normal examples are over sampled, while samples with ailment are in severe minority) making the problem even more challenging. In this article we present a novel framework for the detection of pneumonia. The novelty of the proposed methodology lies in the tackling of class imbalance problem. The Generative Adversarial Network (GAN), specifically a combination of Deep Convolutional Generative Adversarial Network (DCGAN) and Wasserstein GAN gradient penalty (WGAN-GP) was applied on the minority class ``Pneumonia'' for augmentation, whereas Random Under-Sampling (RUS) was done on the majority class ``No Findings'' to deal with the imbalance problem. The ChestX-Ray8 dataset, one of the biggest datasets, is used to validate the performance of the proposed framework. The learning phase is completed using transfer learning on state-of-the-art deep learning models i.e. ResNet-50, Xception, and VGG-16. Results obtained exceed state-of-the-art.
翻訳日:2023-01-23 13:29:05 公開日:2023-01-20
# 周波数ビン絡み込みquditの生成のための再構成可能なシリコンフォトニクスチップ

A reconfigurable silicon photonics chip for the generation of frequency bin entangled qudits ( http://arxiv.org/abs/2301.08475v1 )

ライセンス: Link先を確認
Massimo Borghi, Noemi Tagliavacche, Federico Andrea Sabattoli, Houssein El Dirani, Laurene Youssef, Camille Petit-Etienne, Erwine Pargon, J.E. Sipe, Marco Liscidini, Corrado Sciancalepore, Matteo Galli and Daniele Bajoni(参考訳) 集積リング共振器における量子光学マイクロコムは、多くのスペクトルモードで絡み合った光子対を生成し、高次元のキュディ状態を作ることができる。 理想的には、これらのソースはプログラム可能で、高い生成率を持ち、電子-光学周波数混合に基づく効率的なクディットゲートの実装のために、コーム線が密に間隔を置きます。 これらの要求は、高生成率とタイトなビン間隔のトレードオフがある単一共振器装置では満たせないが、有望な戦略は複数の共振器を使用することであり、それぞれが自発4波混合により特定の周波数ビンに光子対を生成することである。 このアプローチに基づき、周波数ビン絡み込みquditを生成するためのプログラム可能なシリコンフォトニクスデバイスを示し、このデバイスでは、ビン間隔、qudit次元、および2成分量子状態がチップ上で再構成できる。 22ミクロン半径の共振器を用い、15GHzのビン間隔を持つコーム線当たりの高輝度(MHz/(mW)^2)を実現し、最大絡み合うベル状態の85%以上の忠実度をヒルベルト空間次元16まで達成した。 各スペクトルモードを個別に処理することにより、単一共振器を用いてオンチップで生成できない状態を実現する。 本研究では,最大絡み合った2量子状態と2量子状態の相関行列を相互に偏りのない基底で測定し,98%を超える忠実度を求め,高次元セキュア通信プロトコルに適用できることを示す。

Quantum optical microcombs in integrated ring resonators generate entangled photon pairs over many spectral modes, and allow the preparation of high dimensional qudit states. Ideally, those sources should be programmable and have a high generation rate, with comb lines tightly spaced for the implementation of efficient qudit gates based on electro-optic frequency mixing. While these requirements cannot all be satisfied by a single resonator device, for which there is a trade-off between high generation rate and tight bin spacing, a promising strategy is the use of multiple resonators, each generating photon pairs in specific frequency bins via spontaneous four-wave mixing. Based on this approach we present a programmable silicon photonics device for the generation of frequency bin entangled qudits, in which bin spacing, qudit dimension, and bipartite quantum state can be reconfigured on-chip. Using resonators with a radius of 22 microns, we achieve a high brightness (MHz/(mW)^2) per comb line with a bin spacing of 15 GHz, and fidelities above 85% with maximally entangled Bell states up to a Hilbert space dimension of sixteen. By individually addressing each spectral mode, we realize states that can not be generated on-chip using a single resonator. We measure the correlation matrices of maximally entangled two-qubit and two-qutrit states on a set of mutually unbiased bases, finding fidelities exceeding 98%, and indicating that the source can find application in high-dimensional secure communication protocols.
翻訳日:2023-01-23 13:28:32 公開日:2023-01-20
# 二次量子共振子相互作用のための透過型ノイズスペクトロスコピー

Transmission-based noise spectroscopy for quadratic qubit-resonator interactions ( http://arxiv.org/abs/2301.08551v1 )

ライセンス: Link先を確認
Philipp M. Mutter, Guido Burkard(参考訳) 我々は、超伝導やナノメカニカル共振器と固体量子ビットを結合した2次相互作用を持つ雑音量子ビット共振器システムによる過渡透過を記述する理論を開発する。 量子ランジュバン方程式を任意の量子共振子カップリングに一般化した後、線形結合と二次結合の場合のみが標準入出力理論における解析的処理を可能にすることを示した。 2次結合に着目し、任意の初期量子ビットコヒーレンスを実現することにより、平均変動を伝送確率と平均位相の両方で記録することにより、入力出力測定からノイズ特性を抽出できることが示されている。 本結果は,透過型ノイズスペクトロスコピーの分野への拡張であり,即時応用である。

We develop a theory describing the transient transmission through noisy qubit-resonator systems with quadratic interactions as are found in superconducting and nanomechanical resonators coupled to solid-state qubits. After generalizing the quantum Langevin equations to arbitrary qubit-resonator couplings, we show that only the cases of linear and quadratic couplings allow for an analytical treatment within standard input-output theory. Focussing for the first time on quadratic couplings and allowing for arbitrary initial qubit coherences, it is shown that noise characteristics can be extracted from input-output measurements by recording both the averaged fluctuations in the transmission probability and the averaged phase. Our results represent an extension to the field of transmission-based noise spectroscopy with immediate practical applications.
翻訳日:2023-01-23 13:22:24 公開日:2023-01-20
# 文脈ルール支援機械学習(CRAML)を用いた非構造化テキストデータへの変換

Transforming Unstructured Text into Data with Context Rule Assisted Machine Learning (CRAML) ( http://arxiv.org/abs/2301.08549v1 )

ライセンス: Link先を確認
Stephen Meisenbacher, Peter Norlander(参考訳) ドメインエキスパートが文書の構造化されていないテキストから独自の構造化されたラベル付きデータセットを構築し、専門家が記述したルールにトレース可能なニッチな機械学習テキスト分類モデルを構築することができる方法と新しいノーコードソフトウェアツールについて説明する。 コンテキストルール支援機械学習(CRAML)法は、大量の非構造化テキストの正確な再現可能なラベル付けを可能にする。 CRAMLにより、ドメインの専門家は文書コーパス内に埋もれた珍しい構造にアクセスでき、コンテキストや透明性、相互運用性に欠ける現在の計算アプローチの制限を避けることができる。 本稿では,テキストデータから得られた最近の管理文献を分析し,プロプライエタリな求人広告テキストの分析から新たな機械学習モデルを記述・リリースし,フランチャイズ文書の公開コーパスから社会的・経済的関心の発見を提示する。 CRAMLは、定量的学術研究に使用できる文書レベルのコード化された表形式のデータセットを生成し、質的研究者が大量のテキストデータに対してニッチな分類スキームをスケールできるようにする。 CRAMLは、教師付きMLのためのトレーニングデータを構築するための、低リソースでフレキシブルでスケーラブルな方法論である。 我々は、ソフトウェア、ジョブ広告テキスト分類器、フランチャイズ文書の新しいコーパス、ポーチ条項の文脈で完全に複製可能な始終訓練例など、オープンソースリソースとして利用することができる。

We describe a method and new no-code software tools enabling domain experts to build custom structured, labeled datasets from the unstructured text of documents and build niche machine learning text classification models traceable to expert-written rules. The Context Rule Assisted Machine Learning (CRAML) method allows accurate and reproducible labeling of massive volumes of unstructured text. CRAML enables domain experts to access uncommon constructs buried within a document corpus, and avoids limitations of current computational approaches that often lack context, transparency, and interpetability. In this research methods paper, we present three use cases for CRAML: we analyze recent management literature that draws from text data, describe and release new machine learning models from an analysis of proprietary job advertisement text, and present findings of social and economic interest from a public corpus of franchise documents. CRAML produces document-level coded tabular datasets that can be used for quantitative academic research, and allows qualitative researchers to scale niche classification schemes over massive text data. CRAML is a low-resource, flexible, and scalable methodology for building training data for supervised ML. We make available as open-source resources: the software, job advertisement text classifiers, a novel corpus of franchise documents, and a fully replicable start-to-finish trained example in the context of no poach clauses.
翻訳日:2023-01-23 13:22:12 公開日:2023-01-20
# マルチ武装バンディットと量子チャネル・オラクル

Multi armed bandits and quantum channel oracles ( http://arxiv.org/abs/2301.08544v1 )

ライセンス: Link先を確認
Simon Buchholz, Jonas M. K\"ubler, Bernhard Sch\"olkopf(参考訳) マルチ武装バンディットは強化学習の理論的柱の1つである。 近年,多武装バンディット問題に対する量子アルゴリズムの研究が開始され,腕と腕の報酬のランダム性が重ね合わせで問合せできる場合,二次的なスピードアップが可能であることが判明した。 ここでは,報酬のランダム性への限定的なアクセスしかできないが,重ね合わせで腕を照会できる,さらなるバンディットモデルを紹介する。 これは量子アルゴリズムの高速化を妨げている。

Multi armed bandits are one of the theoretical pillars of reinforcement learning. Recently, the investigation of quantum algorithms for multi armed bandit problems was started, and it was found that a quadratic speed-up is possible when the arms and the randomness of the rewards of the arms can be queried in superposition. Here we introduce further bandit models where we only have limited access to the randomness of the rewards, but we can still query the arms in superposition. We show that this impedes any speed-up of quantum algorithms.
翻訳日:2023-01-23 13:21:48 公開日:2023-01-20
# 量子アルゴリズムの誤り補正:雑音量子信号処理の任意精度回復

Error Correction of Quantum Algorithms: Arbitrarily Accurate Recovery Of Noisy Quantum Signal Processing ( http://arxiv.org/abs/2301.08542v1 )

ライセンス: Link先を確認
Andrew K. Tan and Yuan Liu and Minh C. Tran and Isaac L. Chuang(参考訳) 量子システムの本質的な確率的性質は、量子計算に欠かせない誤り訂正や緩和をもたらす。 現在の誤り訂正戦略は、量子状態や量子ゲートの誤りを修正することに焦点を当てているが、これらのきめ細かい誤り訂正手法は、複雑さを増している量子アルゴリズムに大きなオーバーヘッドをもたらす可能性がある。 本稿では,量子信号処理(QSP)による現代量子アルゴリズムの統一的な視点を組み合わせることで,量子アルゴリズムのレベルで誤り訂正を行う第一歩を示す。 信号処理演算子のアンダーローテーションまたはオーバーローテーションを$\epsilon < 1$でパラメータ化したエラーモデルを導入する。 Pauli $Z$-errorsは追加リソースなしではリカバリできないが、Pauli $X$と$Y$エラーは、ノイズの 'recovery QSP' をコヒーレントに付加することで、任意に抑制できる。 さらに、長さ$O(2^k c^{k^2} d)$のリカバリQSPは、任意の長さ-$d$QSPを$c$一意位相で$k^{th}$-order in error$\epsilon$に補正するのに十分である。 追加の仮定が可能となると、$\omega(cd)$の下限が示され、これは回復シーケンスの長さで$k = 1$とタイトである。 本稿では,Groverの定点探索アルゴリズムに対して,アルゴリズムレベルの誤り訂正手法を適用した。

The intrinsic probabilistic nature of quantum systems makes error correction or mitigation indispensable for quantum computation. While current error-correcting strategies focus on correcting errors in quantum states or quantum gates, these fine-grained error-correction methods can incur significant overhead for quantum algorithms of increasing complexity. We present a first step in achieving error correction at the level of quantum algorithms by combining a unified perspective on modern quantum algorithms via quantum signal processing (QSP). An error model of under- or over-rotation of the signal processing operator parameterized by $\epsilon < 1$ is introduced. It is shown that while Pauli $Z$-errors are not recoverable without additional resources, Pauli $X$ and $Y$ errors can be arbitrarily suppressed by coherently appending a noisy `recovery QSP.' Furthermore, it is found that a recovery QSP of length $O(2^k c^{k^2} d)$ is sufficient to correct any length-$d$ QSP with $c$ unique phases to $k^{th}$-order in error $\epsilon$. Allowing an additional assumption, a lower bound of $\Omega(cd)$ is shown, which is tight for $k = 1$, on the length of the recovery sequence. Our algorithmic-level error correction method is applied to Grover's fixed-point search algorithm as a demonstration.
翻訳日:2023-01-23 13:21:40 公開日:2023-01-20
# グラフ運動量と筆跡難易度の評価に基づくlewy体疾患のプロドローマ診断

Prodromal Diagnosis of Lewy Body Diseases Based on the Assessment of Graphomotor and Handwriting Difficulties ( http://arxiv.org/abs/2301.08534v1 )

ライセンス: Link先を確認
Zoltan Galaz, Jiri Mekyska, Jan Mucha, Vojtech Zvoncak, Zdenek Smekal, Marcos Faundez-Zanuy, Lubos Brabenec, Ivona Moravkova, Irena Rektorova(参考訳) 本研究は,グラフモトールの定量的解析と手書き難易度に基づくLewy body disease(LBDs)の予後診断に焦点を当てた研究である。 本研究は,lewy体(mci-lb),パーキンソン病(pd)の発症確率50%以上,mci-lbとpd>50%の有望・有望な21名,年齢・性別対応の健康管理(hc)37名を対象に,軽度認知障害と診断された18名について検討した。 参加者はそれぞれ3つのタスクを実行した: アルキメデスのスパイラル描画(グラフモタの難易度を定量化する)、文章作成タスク(手書きの難易度を定量化する)、ペンタゴン複写テスト(認知低下度を定量化する)。 次に,取得したデータを時間的,運動的,動的,空間的,タスク特有の特徴によってパラメータ化する。 そして最後に,各タスクの分類モデルを別々に訓練し,それらの組み合わせのモデルを用いてlbdの識別のための特徴の予測パワーを推定した。 提案手法を用いて,74%の精度でプロドロマ性LBDを同定し,グラフモトールおよび手書き難易度の評価に基づいて,コンピュータ化目的および非侵襲診断の可能性を示した。

To this date, studies focusing on the prodromal diagnosis of Lewy body diseases (LBDs) based on quantitative analysis of graphomotor and handwriting difficulties are missing. In this work, we enrolled 18 subjects diagnosed with possible or probable mild cognitive impairment with Lewy bodies (MCI-LB), 7 subjects having more than 50% probability of developing Parkinson's disease (PD), 21 subjects with both possible/probable MCI-LB and probability of PD > 50%, and 37 age- and gender-matched healthy controls (HC). Each participant performed three tasks: Archimedean spiral drawing (to quantify graphomotor difficulties), sentence writing task (to quantify handwriting difficulties), and pentagon copying test (to quantify cognitive decline). Next, we parameterized the acquired data by various temporal, kinematic, dynamic, spatial, and task-specific features. And finally, we trained classification models for each task separately as well as a model for their combination to estimate the predictive power of the features for the identification of LBDs. Using this approach we were able to identify prodromal LBDs with 74% accuracy and showed the promising potential of computerized objective and non-invasive diagnosis of LBDs based on the assessment of graphomotor and handwriting difficulties.
翻訳日:2023-01-23 13:21:15 公開日:2023-01-20
# 深層ニューラルネットワークにおける1/f$ノイズに対する自己組織化

Self-Organization Towards $1/f$ Noise in Deep Neural Networks ( http://arxiv.org/abs/2301.08530v1 )

ライセンス: Link先を確認
Nicholas Chong Jia Le and Ling Feng(参考訳) 自然システムと人工システムの両方に1/f$のノイズが存在するにもかかわらず、この現象の一般的な説明は広く受け入れられていない。 1/f$のノイズが観測された有名なシステムは人間の脳であり、この「ノイズ」は脳の健康機能にとって重要であると提案されている。 ディープニューラルネットワーク(dnn)は人間の脳をゆるやかにモデル化し、特定のタスクで人間レベルのパフォーマンスを達成し始めるにつれて、これらの人工的なネットワークにも同じ1ドル/f$のノイズが存在するかどうかを調べる価値があるかもしれない。 実際、DNN(特にLong Short-Term Memory (LSTM)ネットワーク)における1/f$ノイズの存在は、自然言語の逐次入力に応答して、ネットワーク内の異なるアクティベーションのパワースペクトル密度(PSD)を測定することによって明らかである。 これは、脳波(eeg)や機能的磁気共鳴画像(fmri)などの技術を用いて、ヒト脳における1/f$ノイズの測定と類似している。 さらに、LSTMセルの「インナー」および「アウター」アクティベーションにおける1/f$ノイズの指数値について検討し、fMRI信号における指数の変動に類似点を見出した。 また、LSTMネットワークの「タスク」を行う場合と比較して「レスト」における指数値を比較すると、タスク実行時の指数値が負でない人間の脳と同様の傾向がみられた。

Despite $1/f$ noise being ubiquitous in both natural and artificial systems, no general explanations for the phenomenon have received widespread acceptance. One well-known system where $1/f$ noise has been observed in is the human brain, with this 'noise' proposed by some to be important to the healthy function of the brain. As deep neural networks (DNNs) are loosely modelled after the human brain, and as they start to achieve human-level performance in specific tasks, it might be worth investigating if the same $1/f$ noise is present in these artificial networks as well. Indeed, we find the existence of $1/f$ noise in DNNs - specifically Long Short-Term Memory (LSTM) networks modelled on real world dataset - by measuring the Power Spectral Density (PSD) of different activations within the network in response to a sequential input of natural language. This was done in analogy to the measurement of $1/f$ noise in human brains with techniques such as electroencephalography (EEG) and functional Magnetic Resonance Imaging (fMRI). We further examine the exponent values in the $1/f$ noise in "inner" and "outer" activations in the LSTM cell, finding some resemblance in the variations of the exponents in the fMRI signal. In addition, comparing the values of the exponent at "rest" compared to when performing "tasks" of the LSTM network, we find a similar trend to that of the human brain where the exponent while performing tasks is less negative.
翻訳日:2023-01-23 13:20:47 公開日:2023-01-20
# パーキンソン病画像解析における各種分画次数誘導体の探索

Exploration of Various Fractional Order Derivatives in Parkinson's Disease Dysgraphia Analysis ( http://arxiv.org/abs/2301.08529v1 )

ライセンス: Link先を確認
Jan Mucha, Zoltan Galaz, Jiri Mekyska, Marcos Faundez-Zanuy, Vojtech Zvoncak, Zdenek Smekal, Lubos Brabenec, Irena Rektorova(参考訳) パーキンソン病(英: Parkinson's disease、PD)は、65歳以上の人の有病率は2.0%と推定される一般的な神経変性疾患である。 PDの心的運動症状は、剛性やブラジキネジアが手書き作業に関与する筋肉に影響を及ぼし、PDジスフォニアと呼ばれる手書き異常を引き起こす。 現在、デジタル化タブレットが取得したオンライン手書き信号(時間情報付き信号)は、グラフモタ障害解析の最も先進的なアプローチである。 基本的な運動学的特徴はpddysgraphiaの症状を効果的に定量化することが証明されたが、近年の研究では分数計算の理論がグラフモータの難易度解析を改善するのに利用できることが判明した。 そこで本研究では,これまでの研究を追従し,pd失書症解析における分数次微分法(fd)の様々な手法の活用について検討する。 この目的のために,パーキンソン病手書きデータベース (pahaw) の繰り返しループタスクを用いた。 手書き信号は、Gr\"unwald-Letnikov's, Riemann-Liouville's, Caputo'sの3つのFD近似を用いたキネマティック特徴によってパラメータ化された。 相関分析の結果, 臨床状況と筆跡特徴との間には, 速度による有意な相関関係が認められた。 CaputoのFD近似によって抽出された特徴は、分析されたFDアプローチの他の部分よりも優れていた。 これは分類分析の結果も確認され、caputoの手書き文字の特徴から訓練された最良のモデルは79.73%、感度83.78%、特異度75.68%というバランスの取れた精度を示した。

Parkinson's disease (PD) is a common neurodegenerative disorder with a prevalence rate estimated to 2.0% for people aged over 65 years. Cardinal motor symptoms of PD such as rigidity and bradykinesia affect the muscles involved in the handwriting process resulting in handwriting abnormalities called PD dysgraphia. Nowadays, online handwritten signal (signal with temporal information) acquired by the digitizing tablets is the most advanced approach of graphomotor difficulties analysis. Although the basic kinematic features were proved to effectively quantify the symptoms of PD dysgraphia, a recent research identified that the theory of fractional calculus can be used to improve the graphomotor difficulties analysis. Therefore, in this study, we follow up on our previous research, and we aim to explore the utilization of various approaches of fractional order derivative (FD) in the analysis of PD dysgraphia. For this purpose, we used the repetitive loops task from the Parkinson's disease handwriting database (PaHaW). Handwritten signals were parametrized by the kinematic features employing three FD approximations: Gr\"unwald-Letnikov's, Riemann-Liouville's, and Caputo's. Results of the correlation analysis revealed a significant relationship between the clinical state and the handwriting features based on the velocity. The extracted features by Caputo's FD approximation outperformed the rest of the analyzed FD approaches. This was also confirmed by the results of the classification analysis, where the best model trained by Caputo's handwriting features resulted in a balanced accuracy of 79.73% with a sensitivity of 83.78% and a specificity of 75.68%.
翻訳日:2023-01-23 13:20:15 公開日:2023-01-20
# 高速鉄鋼製造における表面集合組織予測

Predicting Surface Texture in Steel Manufacturing at Speed ( http://arxiv.org/abs/2301.08527v1 )

ライセンス: Link先を確認
Alexander J. M. Milne, Xianghua Xie(参考訳) 鋼板の表面テクスチャ制御は, 従来のスタイラスを用いて, 顧客の要求を満たすために不可欠であり, 従来はポストプロダクションを計測していた。 インプロダクションレーザー反射測定は物理測定よりも一貫性が低いが、処理パラメータのリアルタイム調整により製品表面特性を最適化することができる。 本稿では,インラインレーザ反射計測から表面特性予測への変換精度向上のための機械学習の利用を提案する。 高速フィードバック制御には,精度に加えてモデル評価速度が重要である。 ROCKETモデルはアートモデルの最速状態の1つであるが、GPUを利用することで高速化することができる。 我々の貢献は、高速GPUカーネル変換のためのPyTorchにモデルを実装し、勾配流を許容するPyTorch Proportion of Positive Values (PPV)非線形プーリング関数のソフトバージョンを提供することである。 実装を比較して タイミングと性能を実験します

Control of the surface texture of steel strip during the galvanizing and temper rolling processes is essential to satisfy customer requirements and is conventionally measured post-production using a stylus. In-production laser reflection measurement is less consistent than physical measurement but enables real time adjustment of processing parameters to optimize product surface characteristics. We propose the use of machine learning to improve accuracy of the transformation from inline laser reflection measurements to a prediction of surface properties. In addition to accuracy, model evaluation speed is important for fast feedback control. The ROCKET model is one of the fastest state of the art models, however it can be sped up by utilizing a GPU. Our contribution is to implement the model in PyTorch for fast GPU kernel transforms and provide a soft version of the Proportion of Positive Values (PPV) nonlinear pooling function, allowing gradient flow. We perform timing and performance experiments comparing the implementations
翻訳日:2023-01-23 13:19:46 公開日:2023-01-20
# 神経画像に基づく精神医学研究におけるディープニューラルネットワークの約束と落とし穴

Promises and pitfalls of deep neural networks in neuroimaging-based psychiatric research ( http://arxiv.org/abs/2301.08525v1 )

ライセンス: Link先を確認
Fabian Eitel, Marc-Andr\'e Schulz, Moritz Seiler, Henrik Walter, Kerstin Ritter(参考訳) より正確な診断と個別の治療法の推奨を約束することで、深層ニューラルネットワークと特に畳み込みニューラルネットワークは、医療画像の強力なツールへと進歩した。 ここではまず,方法論的キー概念と表現と伝達学習,ドメイン固有の優先順位のモデリングといった方法論的約束について紹介する。 精神疾患の診断,疾患サブタイプの分類,規範的モデリング,神経画像バイオマーカーの開発など,神経画像に基づく精神医学研究の最近の応用を振り返って,現在の課題について考察する。 例えば、小さな、異質な、偏りのあるデータセットでモデルをトレーニングすることの難しさ、臨床ラベルの妥当性の欠如、アルゴリズムバイアス、共起変数の影響などです。

By promising more accurate diagnostics and individual treatment recommendations, deep neural networks and in particular convolutional neural networks have advanced to a powerful tool in medical imaging. Here, we first give an introduction into methodological key concepts and resulting methodological promises including representation and transfer learning, as well as modelling domain-specific priors. After reviewing recent applications within neuroimaging-based psychiatric research, such as the diagnosis of psychiatric diseases, delineation of disease subtypes, normative modeling, and the development of neuroimaging biomarkers, we discuss current challenges. This includes for example the difficulty of training models on small, heterogeneous and biased data sets, the lack of validity of clinical labels, algorithmic bias, and the influence of confounding variables.
翻訳日:2023-01-23 13:19:31 公開日:2023-01-20
# 森林地域のSARトモグラフィーイメージングのための深層学習手法

A Deep Learning Approach for SAR Tomographic Imaging of Forested Areas ( http://arxiv.org/abs/2301.08605v1 )

ライセンス: Link先を確認
Zo\'e Berenger, Lo\"ic Denis, Florence Tupin, Laurent Ferro-Famil, Yue Huang(参考訳) 合成開口レーダトモグラフィイメージングは、干渉形状で実行される一連のコヒーレント取得からシーンの3次元反射率を再構成する。 森林地帯では、多くの要素が各解像度セル内のレーダー信号を後方散乱する。 垂直反射率プロファイルを再構成するために、最先端技術は反復最小化アルゴリズムの形式で実装された正規化反転を行う。 軽量ニューラルネットワークは単一のフィードフォワードパスでトモグラフィインバージョンを実行するようにトレーニングできるため、将来のバイオマスミッションで提供されるデータ量に対してよりよくスケール可能な、高速な再構築が可能となる。 シミュレーションデータを用いてエンコーダ・デコーダネットワークを訓練し,実lバンドおよびpバンドデータ上での検証を行う。

Synthetic aperture radar tomographic imaging reconstructs the three-dimensional reflectivity of a scene from a set of coherent acquisitions performed in an interferometric configuration. In forest areas, a large number of elements backscatter the radar signal within each resolution cell. To reconstruct the vertical reflectivity profile, state-of-the-art techniques perform a regularized inversion implemented in the form of iterative minimization algorithms. We show that light-weight neural networks can be trained to perform the tomographic inversion with a single feed-forward pass, leading to fast reconstructions that could better scale to the amount of data provided by the future BIOMASS mission. We train our encoder-decoder network using simulated data and validate our technique on real L-band and P-band data.
翻訳日:2023-01-23 13:12:55 公開日:2023-01-20
# 線形非結合共振器における自発4波混合による光子対の生成

Generation of photon pairs by spontaneous four-wave mixing in linearly uncoupled resonators ( http://arxiv.org/abs/2301.08603v1 )

ライセンス: Link先を確認
Luca Zatti, J. E. Sipe, Marco Liscidini(参考訳) 非線形相互作用によってのみエネルギーを1つの共振器からもう1つの共振器に伝達できる2つの非結合共振器からなる構造体において、自発4波混合による光子対の生成に関する詳細な研究を行う。 具体的には、各共振器の共振コームを独立に調整できることを保証し、異なるコームに属するモード間の非線形相互作用を可能にするために、カプラで接続された2つの競馬場形状共振器について考察する。 このようなカプラを少なくとも2つの方法で実現できることが示される:方向カプラまたはマッハ・ツェンダー干渉計である。 これら2つのシナリオについて,単励起4波混合によるペア生成率の解析式を導出し,単一リング共振器で実現可能な結果と比較する。

We present a detailed study of the generation of photon pairs by spontaneous four-wave mixing in a structure composed of two linearly uncoupled resonators, where energy can be transferred from one resonator to another only through a nonlinear interaction. Specifically, we consider the case of two racetrack-shaped resonators connected by a coupler designed to guarantee that the resonance comb of each resonator can be tuned independently, and to allow the nonlinear interaction between modes that belong to different combs. We show that such a coupler can be realized in at least two ways: a directional coupler or a Mach-Zehnder interferometer. For these two scenarios, we derive analytic expressions for the pair generation rate via single-pump spontaneous four-wave mixing, and compare these results with that achievable in a single ring resonator.
翻訳日:2023-01-23 13:12:34 公開日:2023-01-20
# MAVERIC: パーソナライズされた自律運転のためのデータ駆動アプローチ

MAVERIC: A Data-Driven Approach to Personalized Autonomous Driving ( http://arxiv.org/abs/2301.08595v1 )

ライセンス: Link先を確認
Mariah L. Schrum and Emily Sumner and Matthew C. Gombolay and Andrew Best(参考訳) 自動運転車(AV)のパーソナライゼーションは、信頼、使用、受け入れを著しく増加させる可能性がある。 特に、エンドユーザの運転スタイルとAVの運転スタイルの類似性は、エンドユーザのAV使用意欲に大きな影響を与えると仮定する。 運転スタイルが利用者の受け入れに与える影響を調査するため, 1)運転スタイルのパーソナライズとデータ駆動型アプローチの開発 2) パーソナライゼーションがAVに対する態度に大きく影響を及ぼすことを示す。 提案手法では,AVの安全かつパーソナライズされた制御を確保するために,低レベルコントローラをチューニングする高レベルモデルについて学習する。 このアプローチの鍵は、ユーザの運転スタイルを表す情報的でパーソナライズされた埋め込みを学ぶことです。 当社のフレームワークは,運転者の好みに基づいて運転スタイルを最適化するために,攻撃レベルを調整できる。 人間の2つの主題研究(n = 54)において、我々はまず、エンドユーザーの運転スタイルを模倣し、スタイルの特徴(例えば攻撃性)をチューニングできるアプローチを実証する。 第2に、ホモフィリーに影響を及ぼす要因(信頼、人格など)、すなわち、個人が自分に類似した運転スタイルを好むことなどについて検討する。 このアプローチはエンドユーザースタイル(p<.001)と整合した運転スタイルを生成し,参加者のアプローチを攻撃性のレベル(p=.002)に類似した評価を行う。 人格(p<.001)、知覚的類似性(p<.001)、高速度駆動スタイル(p=.0031)はホモフィリーの効果を著しく調節する。

Personalization of autonomous vehicles (AV) may significantly increase trust, use, and acceptance. In particular, we hypothesize that the similarity of an AV's driving style compared to the end-user's driving style will have a major impact on end-user's willingness to use the AV. To investigate the impact of driving style on user acceptance, we 1) develop a data-driven approach to personalize driving style and 2) demonstrate that personalization significantly impacts attitudes towards AVs. Our approach learns a high-level model that tunes low-level controllers to ensure safe and personalized control of the AV. The key to our approach is learning an informative, personalized embedding that represents a user's driving style. Our framework is capable of calibrating the level of aggression so as to optimize driving style based upon driver preference. Across two human subject studies (n = 54), we first demonstrate our approach mimics the driving styles of end-users and can tune attributes of style (e.g., aggressiveness). Second, we investigate the factors (e.g., trust, personality etc.) that impact homophily, i.e. an individual's preference for a driving style similar to their own. We find that our approach generates driving styles consistent with end-user styles (p<.001) and participants rate our approach as more similar to their level of aggressiveness (p=.002). We find that personality (p<.001), perceived similarity (p<.001), and high-velocity driving style (p=.0031) significantly modulate the effect of homophily.
翻訳日:2023-01-23 13:12:08 公開日:2023-01-20
# 逆セグメンテーション一貫性を用いたスケッチカラー化の改良

Improving Sketch Colorization using Adversarial Segmentation Consistency ( http://arxiv.org/abs/2301.08590v1 )

ライセンス: Link先を確認
Samet Hicsonmez, Nermin Samet, Emre Akbas, Pinar Duygulu(参考訳) スケッチからカラー画像を生成する新しい手法を提案する。 スケッチのカラー化における現在のソリューションは、追加のユーザ命令を必要とするか、あるいは"ペア化"翻訳戦略に制限されている。 汎用panopticセグメンテーションネットワークからのセマンティック画像セグメンテーションを活用し,新たな逆損失関数を生成する。 提案した損失関数は任意のGANモデルと互換性がある。 本手法はセグメンテーションラベルを持つデータセットに制限されず,非ペア翻訳タスクにも適用可能である。 質的,定量的な分析を行い,ユーザスタディに基づいて4つの異なる画像データセットに対する提案手法の有効性を示す。 fidメトリクスでは、このモデルはベースラインを最大35ポイント改善します。 私たちのコード、事前トレーニングされたモデル、新しく導入されたデータセットと対応するスケッチイメージを生成するスクリプトは、https://github.com/giddyyupp/advsegloss.com/で利用可能です。

We propose a new method for producing color images from sketches. Current solutions in sketch colorization either necessitate additional user instruction or are restricted to the "paired" translation strategy. We leverage semantic image segmentation from a general-purpose panoptic segmentation network to generate an additional adversarial loss function. The proposed loss function is compatible with any GAN model. Our method is not restricted to datasets with segmentation labels and can be applied to unpaired translation tasks as well. Using qualitative, and quantitative analysis, and based on a user study, we demonstrate the efficacy of our method on four distinct image datasets. On the FID metric, our model improves the baseline by up to 35 points. Our code, pretrained models, scripts to produce newly introduced datasets and corresponding sketch images are available at https://github.com/giddyyupp/AdvSegLoss.
翻訳日:2023-01-23 13:11:41 公開日:2023-01-20
# 空間的長距離相関のない量子ホール効果とランダウ準位

Quantum Hall effect and Landau levels without spatial long-range correlations ( http://arxiv.org/abs/2301.08582v1 )

ライセンス: Link先を確認
Isac Sahlberg, Moein N. Ivaki, Kim P\"oyh\"onen, Teemu Ojanen(参考訳) 磁場中の変換不変系における荷電粒子のスペクトルは、固体の熱力学および輸送特性において基本的な役割を果たすランダウ準位によって特徴づけられる。 ランドー準位の位相的性質と近似縮退性は、原始セルを通る磁束がフラックス量子に比べて小さいとき、離散変換対称性を持つ結晶格子上でも生存することが知られている。 ここではランドー準位の概念と量子ホール効果が空間的長距離順序を伴わない2次元非結晶格子に一般化可能であることを示す。 驚くべきことに、微小な距離で空間相関が崩壊しても、2dシステムは多くのよく解かれたランダウのようなバンドを示すことができる。 これらのバンドの存在は、磁場中の非結晶系が、結晶性固体と典型的に関連づけられたホールマーク量子効果を支持できることを意味する。

The spectrum of charged particles in translation-invariant systems in a magnetic field is characterized by the Landau levels, which play a fundamental role in the thermodynamic and transport properties of solids. The topological nature and the approximate degeneracy of the Landau levels are known to also survive on crystalline lattices with discrete translation symmetry when the magnetic flux through a primitive cell is small compared to the flux quantum. Here we show that the notion of Landau levels and the quantum Hall effect can be generalized to 2d non-crystalline lattices without spatial long-range order. Remarkably, even when the spatial correlations decay over microscopic distances, 2d systems can exhibit a number of well-resolved Landau-like bands. The existence of these bands imply that non-crystalline systems in magnetic fields can support the hallmark quantum effects which have been typically associated with crystalline solids.
翻訳日:2023-01-23 13:11:27 公開日:2023-01-20
# 毒物予測のためのオントロジ事前学習

Ontology Pre-training for Poison Prediction ( http://arxiv.org/abs/2301.08577v1 )

ライセンス: Link先を確認
Martin Glauer, Fabian Neuhaus, Till Mossakowski, Janna Hastings(参考訳) 人間の知識をニューラルネットワークに統合することは、その堅牢性と解釈性を改善する可能性がある。 我々は、オントロジーの知識をオントロジー事前学習と呼ぶトランスフォーマーネットワークの構造に統合する新しいアプローチを開発し、オントロジーの構造をネットワークに埋め込む方法としてオントロジークラスのメンバシップを予測するネットワークをトレーニングし、その後、特定の予測タスクのためにネットワークを微調整する。 このアプローチを,分子構造に基づく小分子の潜在的毒性を予測するためのケーススタディに適用し,生命科学化学における機械学習の課題とした。 われわれのアプローチは、最先端の技術を改良し、さらにいくつかのメリットがある。 第一に、モデルがより強固さと解釈可能性を高めるために、オントロジーの事前学習によって予測を行う際に、より有意義な化学グループに注意を向けることを学ぶことを示すことができる。 第2に、オントロジー事前学習の後にトレーニング時間を短縮し、オントロジー事前学習で毒性予測に何が必要かを学ぶためにモデルが適していることを示す。 この戦略は、意味論的セマンティクスをニューラルネットワークに組み込むニューラルシンボリックアプローチとして、一般的な適用性を持っている。

Integrating human knowledge into neural networks has the potential to improve their robustness and interpretability. We have developed a novel approach to integrate knowledge from ontologies into the structure of a Transformer network which we call ontology pre-training: we train the network to predict membership in ontology classes as a way to embed the structure of the ontology into the network, and subsequently fine-tune the network for the particular prediction task. We apply this approach to a case study in predicting the potential toxicity of a small molecule based on its molecular structure, a challenging task for machine learning in life sciences chemistry. Our approach improves on the state of the art, and moreover has several additional benefits. First, we are able to show that the model learns to focus attention on more meaningful chemical groups when making predictions with ontology pre-training than without, paving a path towards greater robustness and interpretability. Second, the training time is reduced after ontology pre-training, indicating that the model is better placed to learn what matters for toxicity prediction with the ontology pre-training than without. This strategy has general applicability as a neuro-symbolic approach to embed meaningful semantics into neural networks.
翻訳日:2023-01-23 13:11:13 公開日:2023-01-20
# 視覚的書き起こしプロンプ:キュレートされた画像シーケンスによる文字周囲のストーリー生成

Visual Writing Prompts: Character-Grounded Story Generation with Curated Image Sequences ( http://arxiv.org/abs/2301.08571v1 )

ライセンス: Link先を確認
Xudong Hong, Asad Sayeed, Khushboo Mehra, Vera Demberg, Bernt Schiele(参考訳) 画像ベースのストーリー生成に関する現在の研究は、既存の画像シーケンスコレクションが背後にコヒーレントなプロットを持たないという事実に悩まされている。 我々は、新しい画像グラウンドデータセット、Visual Writing Prompts (VWP) を作成することで、ビジュアルストーリー生成を改善する。 VWPは5-10枚の画像を含む約2Kの映画シーンを含む。 画像シーケンスは、画像シーケンスと対応する画像シーケンスからの接地文字の集合とからクラウドソーシングにより収集された合計12kのストーリーにアライメントされる。 新たな画像シーケンス収集とフィルタリングのプロセスにより,従来よりも一貫性があり,ナラティビティも高いストーリーを得られるようになりました。 また,コヒーレンスをベースラインとするキャラクターベースのストーリー生成モデルを提案する。 評価の結果、我々の生成したストーリーは、現在の最先端モデルで生成されたストーリーよりも一貫性があり、視覚的基盤があり、よりナラティビティが高いことが示された。

Current work on image-based story generation suffers from the fact that the existing image sequence collections do not have coherent plots behind them. We improve visual story generation by producing a new image-grounded dataset, Visual Writing Prompts (VWP). VWP contains almost 2K selected sequences of movie shots, each including 5-10 images. The image sequences are aligned with a total of 12K stories which were collected via crowdsourcing given the image sequences and a set of grounded characters from the corresponding image sequence. Our new image sequence collection and filtering process has allowed us to obtain stories that are more coherent and have more narrativity compared to previous work. We also propose a character-based story generation model driven by coherence as a strong baseline. Evaluations show that our generated stories are more coherent, visually grounded, and have more narrativity than stories generated with the current state-of-the-art model.
翻訳日:2023-01-23 13:10:52 公開日:2023-01-20
# 量子ドット系における容量結合の自動抽出

Automated extraction of capacitive coupling for quantum dot systems ( http://arxiv.org/abs/2301.08654v1 )

ライセンス: Link先を確認
Joshua Ziegler, Florian Luthi, Mick Ramsey, Felix Borjans, Guoji Zheng, Justyna P. Zwolak(参考訳) ゲート定義量子ドット(QD)は量子コンピューティングプラットフォームとして魅力的な特性を持っているが、短期的なデバイスはQDデバイスのチューニングと操作において考慮すべき様々な欠陥を持っている。 そのような問題の1つは、QD量子ビットを定義し制御する金属ゲート間の容量的クロストークである。 コンデンサのクロストークを補償し、結合に依存しない特定のQDのターゲット制御を可能にするには、仮想ゲートを使用する。 本稿では,機械学習と従来の適合性を組み合わせた信頼性の高い自動容量結合同定手法を提案する。 また,実験装置のチューニング時に発生する突発性QDの同定に,クロスキャパシタンス測定がどのように用いられるかを示す。 当社のシステムは,qubit操作に適したシステムに対して,信頼性の高いチューニングを行う上で重要な情報である,運用体制近傍にスプリアスドットを持つデバイスを自律的に警告することができる。

Gate-defined quantum dots (QDs) have appealing attributes as a quantum computing platform, however, near-term devices possess a range of possible imperfections that need to be accounted for during the tuning and operation of QD devices. One such problem is the capacitive cross-talk between the metallic gates that define and control QD qubits. A way to compensate for the capacitive cross-talk and enable targeted control of specific QDs independent of coupling is by the use of virtual gates. Here, we demonstrate a reliable automated capacitive coupling identification method that combines machine learning with traditional fitting to take advantage of the desirable properties of each. We also show how the cross-capacitance measurement may be used for the identification of spurious QDs sometimes formed during tuning experimental devices. Our systems can autonomously flag devices with spurious dots near the operating regime which is crucial information for reliable tuning to a regime suitable for qubit operations.
翻訳日:2023-01-23 13:03:44 公開日:2023-01-20
# アウトオブサンプル保証によるオフライン政策評価

Offline Policy Evaluation with Out-of-Sample Guarantees ( http://arxiv.org/abs/2301.08649v1 )

ライセンス: Link先を確認
Sofia Ek, Dave Zachariah(参考訳) 過去の観測データを用いた意思決定ポリシーの性能評価の問題点を考察する。 政策の結果は、損失または不使用(または負の報酬)の観点から測定され、問題は、過去のデータが、おそらく未知のポリシーの下で観察されたときに、指定された政策のサンプル外損失に関する有効な推論を引き出すことである。 サンプルスプリッティング法を用いて,損失分布全体の評価を行う有限サンプルカバレッジ保証により,そのような推論を描画可能であることを示す。 重要なのは、この手法が過去のポリシーのモデルの誤定義を考慮に入れることだ。 この評価方法は、明確に指定されたモデル仮定の範囲の観測データを用いてポリシーの性能を検証するために使用できる。

We consider the problem of evaluating the performance of a decision policy using past observational data. The outcome of a policy is measured in terms of a loss or disutility (or negative reward) and the problem is to draw valid inferences about the out-of-sample loss of the specified policy when the past data is observed under a, possibly unknown, policy. Using a sample-splitting method, we show that it is possible to draw such inferences with finite-sample coverage guarantees that evaluate the entire loss distribution. Importantly, the method takes into account model misspecifications of the past policy -- including unmeasured confounding. The evaluation method can be used to certify the performance of a policy using observational data under an explicitly specified range of credible model assumptions.
翻訳日:2023-01-23 13:03:28 公開日:2023-01-20
# STORM-GAN : COVID-19に対する移動性反応の都市間評価のための時空間メタGAN

STORM-GAN: Spatio-Temporal Meta-GAN for Cross-City Estimation of Human Mobility Responses to COVID-19 ( http://arxiv.org/abs/2301.08648v1 )

ライセンス: Link先を確認
Han Bao, Xun Zhou, Yiqun Xie, Yanhua Li, Xiaowei Jia(参考訳) 新型コロナウイルス(COVID-19)のパンデミックでは、薬品以外の介入を行う政策立案者にとって重要なガイダンスとなる。 ディープラーニングのアプローチは、豊富なトレーニングデータを持つタスクにおける従来の推定手法よりも優れているが、継続的に進化するパンデミックは、データの非定常性、限られた観測、複雑な社会的文脈によって、この問題を解決する上で大きな課題となる。 それまでの移動度推定は、一つの都市に集中するか、都市や期間にまたがる時空間依存をモデル化する能力に欠ける。 これらの問題に対処するために,我々は,深層メタジェネレーティブフレームワークを用いて都市間人力推定問題に取り組む最初の試みを行う。 本研究では、COVID-19に関連する社会・政策条件のセットに基づいて、動的移動応答を推定する時空間メタジェネレーティブ・アドバイサル・ネットワーク(STORM-GAN)モデルを提案する。 新規な時空間タスクベースグラフ(STTG)の埋め込みにより、STORM-GANは、推定タスクの時空間分布から共有知識を学習し、限られたトレーニングサンプルで新しい都市や時間に迅速に適応することができる。 STTG埋め込みコンポーネントは、都市間の類似性を捉え、クロスタスクの不均一性を緩和するために設計されている。 実世界のデータを用いた実験の結果,提案手法は推定性能とベースライン外の性能を大幅に向上できることがわかった。

Human mobility estimation is crucial during the COVID-19 pandemic due to its significant guidance for policymakers to make non-pharmaceutical interventions. While deep learning approaches outperform conventional estimation techniques on tasks with abundant training data, the continuously evolving pandemic poses a significant challenge to solving this problem due to data nonstationarity, limited observations, and complex social contexts. Prior works on mobility estimation either focus on a single city or lack the ability to model the spatio-temporal dependencies across cities and time periods. To address these issues, we make the first attempt to tackle the cross-city human mobility estimation problem through a deep meta-generative framework. We propose a Spatio-Temporal Meta-Generative Adversarial Network (STORM-GAN) model that estimates dynamic human mobility responses under a set of social and policy conditions related to COVID-19. Facilitated by a novel spatio-temporal task-based graph (STTG) embedding, STORM-GAN is capable of learning shared knowledge from a spatio-temporal distribution of estimation tasks and quickly adapting to new cities and time periods with limited training samples. The STTG embedding component is designed to capture the similarities among cities to mitigate cross-task heterogeneity. Experimental results on real-world data show that the proposed approach can greatly improve estimation performance and out-perform baselines.
翻訳日:2023-01-23 13:03:15 公開日:2023-01-20
# 視覚トランスフォーマによる画像記憶性予測

Image Memorability Prediction with Vision Transformers ( http://arxiv.org/abs/2301.08647v1 )

ライセンス: Link先を確認
Thomas Hagen, Thomas Espeseth(参考訳) 行動研究では、画像の記憶力は人々のグループ間で類似しており、記憶力は画像の固有の特性の機能であり、個人の経験や特性とは無関係であることが示唆されている。 ディープラーニングネットワークはそのような特性に基づいてトレーニングし、新しいデータセットの記憶可能性を予測するために使用できる。 畳み込みニューラルネットワーク(cnn)は画像記憶可能性予測の先駆者となっているが、最近では視覚トランスフォーマー(vit)モデルも開発されている。 本稿では,vitに基づく新しい記憶可能性モデルである vitmem と,それに基づく記憶可能性予測を最新cnnモデルを用いて評価する。 その結果、ViTMemは全てのデータセットの最先端モデルと同等以上の性能を示した。 追加のセマンティックレベル分析により、ViTMemは画像の記憶可能性を促進するセマンティックコンテンツに特に敏感であることが判明した。 我々は、ViTMemが新たな一歩を踏み出し、ViT由来のモデルがCNNを置き換えることで、画像の記憶可能性の計算的予測を行うことができると結論付けた。 研究者、教育者、広告主、ビジュアルデザイナー、その他の関係者はこのモデルを利用して、画像素材の記憶力を向上させることができる。

Behavioral studies have shown that the memorability of images is similar across groups of people, suggesting that memorability is a function of the intrinsic properties of images, and is unrelated to people's individual experiences and traits. Deep learning networks can be trained on such properties and be used to predict memorability in new data sets. Convolutional neural networks (CNN) have pioneered image memorability prediction, but more recently developed vision transformer (ViT) models may have the potential to yield even better predictions. In this paper, we present the ViTMem, a new memorability model based on ViT, and evaluate memorability predictions obtained by it with state-of-the-art CNN-derived models. Results showed that ViTMem performed equal to or better than state-of-the-art models on all data sets. Additional semantic level analyses revealed that ViTMem is particularly sensitive to the semantic content that drives memorability in images. We conclude that ViTMem provides a new step forward, and propose that ViT-derived models can replace CNNs for computational prediction of image memorability. Researchers, educators, advertisers, visual designers and other interested parties can leverage the model to improve the memorability of their image material.
翻訳日:2023-01-23 13:02:49 公開日:2023-01-20
# 強化学習による生成スレート勧告

Generative Slate Recommendation with Reinforcement Learning ( http://arxiv.org/abs/2301.08632v1 )

ライセンス: Link先を確認
Romain Deffayet, Thibaut Thonet, Jean-Michel Render, Maarten de Rijke(参考訳) 最近の研究では、レコメンダシステムにおける長期ユーザエンゲージメントを最適化するために強化学習(rl)アルゴリズムを採用しており、ユーザの退屈さやフィルターバブルのような一般的な落とし穴を回避している。 彼らはレコメンデーションのシーケンシャルでインタラクティブな性質を捉え、長期的な報酬に対処し、筋電図的行動を避けるための原則的な方法を提供する。 しかしながら、RLアプローチは、組み合わせアクション空間のため、各相互作用ターンで項目のリストが推奨されるスレートレコメンデーションシナリオにおいて、難解である。 この設定では、アクションはアイテムの組み合わせを含むことができるスレートに対応する。 従来の研究では、トラクタビリティを確保するためにアクションを適切に分解することを提案したが、これらは制限的、時には非現実的な仮定に依存している。 そこで本研究では,変分オートエンコーダによって学習される連続的で低次元な潜在空間にスレートを符号化する手法を提案する。 そして、RLエージェントは、この潜伏空間における連続的な作用を選択し、最終的に対応するスレートにデコードされる。 そうすることで私たちは (i)前回の作業に必要な仮定を緩和し、 (二)独立した項目の代わりにフルスレートをモデル化することにより行動選択の質を向上させる。 シミュレーション環境で行った実験では,ベースラインの基礎となる制約的な仮定が解除された場合のベースラインに対するスレート生成モデルの有効性を確認した。 以上より,生成モデルを用いた表現学習は,一般化された rl ベーススレートレコメンデーションへの有望な方向であることが示唆された。

Recent research has employed reinforcement learning (RL) algorithms to optimize long-term user engagement in recommender systems, thereby avoiding common pitfalls such as user boredom and filter bubbles. They capture the sequential and interactive nature of recommendations, and thus offer a principled way to deal with long-term rewards and avoid myopic behaviors. However, RL approaches are intractable in the slate recommendation scenario - where a list of items is recommended at each interaction turn - due to the combinatorial action space. In that setting, an action corresponds to a slate that may contain any combination of items. While previous work has proposed well-chosen decompositions of actions so as to ensure tractability, these rely on restrictive and sometimes unrealistic assumptions. Instead, in this work we propose to encode slates in a continuous, low-dimensional latent space learned by a variational auto-encoder. Then, the RL agent selects continuous actions in this latent space, which are ultimately decoded into the corresponding slates. By doing so, we are able to (i) relax assumptions required by previous work, and (ii) improve the quality of the action selection by modeling full slates instead of independent items, in particular by enabling diversity. Our experiments performed on a wide array of simulated environments confirm the effectiveness of our generative modeling of slates over baselines in practical scenarios where the restrictive assumptions underlying the baselines are lifted. Our findings suggest that representation learning using generative models is a promising direction towards generalizable RL-based slate recommendation.
翻訳日:2023-01-23 13:02:29 公開日:2023-01-20
# 量子乱数発生器のリアルタイム後処理の改善

Improved Real-time Post-Processing for quantum Random Number Generators ( http://arxiv.org/abs/2301.08621v1 )

ライセンス: Link先を確認
Qian Li, Xiaoming Sun, Xingjian Zhang, and Hongyi Zhou(参考訳) ランダム性抽出は暗号と理論計算機科学の重要な問題である。 近年の量子暗号の急速な発展に伴い、量子敵の存在下でのセキュリティ問題に対処する量子耐性乱数抽出も広く研究されている。 入力された生データを最小エントロピー源として特徴付ける従来の量子保護ランダム性抽出器とは対照的に,信頼度の高い多数の量子乱数生成器が生成する入力生データを,いわゆるリバースブロック源として特徴付けることができる。 この事実により、我々は改良された抽出器を設計できる。 具体的には,実時間ブロックワイズ抽出を実現するリバースブロック源のための2つの新しい量子耐性ランダムネス抽出器を提案する。 一般的なミンエントロピー乱数抽出器と比較して,本設計は抽出速度が著しく向上し,同じ種子長の出力データ長が長くなる。 さらに、入力された生データ全体が利用可能になるのを待たずに、生データをオンザフライで処理するオンラインアルゴリズムの特性も享受している。 これらの特徴により、実用的な量子乱数生成器のリアルタイム後処理に適切な設計が選択できる。 抽出器を最も高速な量子乱数生成器の生データに適用することにより,最大374gbpsのシミュレーション抽出速度を実現する。

Randomness extraction is a key problem in cryptography and theoretical computer science. With the recent rapid development of quantum cryptography, quantum-proof randomness extraction has also been widely studied, addressing the security issues in the presence of a quantum adversary. In contrast with conventional quantum-proof randomness extractors characterizing the input raw data as min-entropy sources, we find that the input raw data generated by a large class of trusted-device quantum random number generators can be characterized as the so-called reverse block source. This fact enables us to design improved extractors. Specifically, we propose two novel quantum-proof randomness extractors for reverse block sources that realize real-time block-wise extraction. In comparison with the general min-entropy randomness extractors, our designs achieve a significantly higher extraction speed and a longer output data length with the same seed length. In addition, they enjoy the property of online algorithms, which process the raw data on the fly without waiting for the entire input raw data to be available. These features make our design an adequate choice for the real-time post-processing of practical quantum random number generators. Applying our extractors to the raw data of the fastest known quantum random number generator, we achieve a simulated extraction speed as high as 374 Gbps.
翻訳日:2023-01-23 13:02:03 公開日:2023-01-20
# 部分微分方程式の解を未知の項で推論するための結合型物理インフォームドニューラルネットワーク

Coupled Physics-informed Neural Networks for Inferring Solutions of Partial Differential Equations with Unknown Source Terms ( http://arxiv.org/abs/2301.08618v1 )

ライセンス: Link先を確認
Aina Wang, Pan Qin, Xi-Ming Sun(参考訳) 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式(PDE)の解を近似するための変換開発を提供する。 本研究では、外部力を持つシステムを記述するために用いられ、既存のPINNでは十分に近似できない非同次PDEのための結合物理情報ニューラルネットワーク(C-PINN)を提案する。 本稿では,NetUとNetGの2つのニューラルネットワークを提案する。 NetUは、PDEを満たす準溶液を生成するために構築されている。 NetGはNetUのトレーニングを規則化するために使用される。 そして、2つのネットワークをデータ物理ハイブリッドコスト関数に統合する。 最後に、2つのネットワークを最適化し結合する階層的トレーニング戦略を提案する。 C-PINNの性能は、いくつかの古典的PDEを近似することで証明される。

Physics-informed neural networks (PINNs) provide a transformative development for approximating the solutions to partial differential equations (PDEs). This work proposes a coupled physics-informed neural network (C-PINN) for the nonhomogeneous PDEs with unknown dynamical source terms, which is used to describe the systems with external forces and cannot be well approximated by the existing PINNs. In our method, two neural networks, NetU and NetG, are proposed. NetU is constructed to generate a quasi-solution satisfying PDEs under study. NetG is used to regularize the training of NetU. Then, the two networks are integrated into a data-physics-hybrid cost function. Finally, we propose a hierarchical training strategy to optimize and couple the two networks. The performance of C-PINN is proved by approximating several classical PDEs.
翻訳日:2023-01-23 13:01:42 公開日:2023-01-20
# 量子シミュレーションのための近似量子コンパイル:テンソルネットワークに基づくアプローチ

Approximate Quantum Compiling for Quantum Simulation: A Tensor Network based approach ( http://arxiv.org/abs/2301.08609v1 )

ライセンス: Link先を確認
Niall F. Robertson, Albert Akhriev, Jiri Vala, Sergiy Zhuk(参考訳) 量子スピン鎖のシミュレーションは量子優位性の実証の有望な候補である。 これを達成するための大きな障害の1つは、標準量子時間進化アルゴリズムに現れるディープ回路を実装することから生じるノイズである。 これらの深層回路を浅層回路にコンパイルすることは、この研究で私たちが取り組んだ重要な問題である。 我々は、最大100キュービットのハイゼンベルクスピンチェーンの時間進化をシミュレートする短深さ量子回路を生成するために、近似量子コンパイルのためのTensor Networkベースのアプローチを用いる。 さらに,ibmq-mumbai (27量子ビットデバイス) 上でこれらの短深さ回路を動作させ,テンソルネットワークコンパイル方式を適用して測定した観測器の精度が大幅に向上することを示す。

The simulation of quantum spin chains is a promising candidate for the demonstration of quantum advantage. One of the main obstacles to achieving this is the noise that arises from implementing the deep circuits that appear in standard quantum time evolution algorithms. Compiling these deep circuits into shallower ones is thus a key issue that we address in this work. We use a Tensor Network based approach to Approximate Quantum Compiling to produce short depth quantum circuits that simulate the time evolution of the Heisenberg spin chain on up to 100 qubits. Furthermore, we run these short depth circuits on a ibmq-mumbai - a 27 qubit device - and show that the accuracy of the measured observables is significantly improved after applying our Tensor Network compilation scheme.
翻訳日:2023-01-23 13:01:29 公開日:2023-01-20
# ベイズネットワークにおけるサイクルの基礎について

On the Foundations of Cycles in Bayesian Networks ( http://arxiv.org/abs/2301.08608v1 )

ライセンス: Link先を確認
Christel Baier and Clemens Dubslaff and Holger Hermanns and Nikolai K\"afer(参考訳) ベイズネットワーク(英: bayesian networks、bns)は、専門家の知識と不確実性の下での推論を表現するために広く用いられる確率論的グラフィカルモデルである。 伝統的に、確率変数間の依存関係をキャプチャする有向非巡回グラフに基づいている。 しかし、有向サイクルは、例えばフィードバックループのモデリングのために、確率変数間のクロス依存性が存在するときに自然に発生する。 このような相互依存を扱う既存の方法は通常、サイクルのないBNへの還元に依存している。 これらのアプローチは、アプリケーションコンテキストに関する追加の知識と相互作用するため、一般化するのが脆弱である。 本稿では,サイクルフリー設定を包括的かつ保守的に拡張したサイクリックBNのセマンティクスに関する基礎的研究を行う。 まず, BN上の完全関節分布の要件を局所的条件付き確率と独立性に整合させる制約に基づく意味論を提案する。 第二に、無限展開アプローチを形式化する2種類の極限意味論を導入し、マルコフ連鎖構成によって計算可能であることを示した。

Bayesian networks (BNs) are a probabilistic graphical model widely used for representing expert knowledge and reasoning under uncertainty. Traditionally, they are based on directed acyclic graphs that capture dependencies between random variables. However, directed cycles can naturally arise when cross-dependencies between random variables exist, e.g., for modeling feedback loops. Existing methods to deal with such cross-dependencies usually rely on reductions to BNs without cycles. These approaches are fragile to generalize, since their justifications are intermingled with additional knowledge about the application context. In this paper, we present a foundational study regarding semantics for cyclic BNs that are generic and conservatively extend the cycle-free setting. First, we propose constraint-based semantics that specify requirements for full joint distributions over a BN to be consistent with the local conditional probabilities and independencies. Second, two kinds of limit semantics that formalize infinite unfolding approaches are introduced and shown to be computable by a Markov chain construction.
翻訳日:2023-01-23 13:01:15 公開日:2023-01-20
# 人格モデリングのためのデータ拡張:デクスターマシン

Data Augmentation for Modeling Human Personality: The Dexter Machine ( http://arxiv.org/abs/2301.08606v1 )

ライセンス: Link先を確認
Yair Neuman, Vladyslav Kozhukhov, Dan Vilenchik(参考訳) 人格のモデル化は、人工精神療法士の工学からペルソナロボットの設計に至るまで、いくつかのAI課題において重要である。 しかし、計算パーソナリティ分析の分野はラベル付きデータに大きく依存しており、費用がかかるか、難しいか、あるいは入手が困難である。 この問題は、まれな性格タイプや障害(例えば、反社会的精神病性パーソナリティ障害)を扱う際に増幅される。 本研究では,人格のためのテキストベースのデータ拡張手法(PEDANT)を開発した。 PEDANTは、一般的なラベル付きデータではなく、生成事前訓練モデル(GPT)とドメインの専門知識の組み合わせに依存しています。 3つの異なるデータセットで方法論をテストすると、生成されたデータの品質をサポートする結果が得られる。

Modeling human personality is important for several AI challenges, from the engineering of artificial psychotherapists to the design of persona bots. However, the field of computational personality analysis heavily relies on labeled data, which may be expensive, difficult or impossible to get. This problem is amplified when dealing with rare personality types or disorders (e.g., the anti-social psychopathic personality disorder). In this context, we developed a text-based data augmentation approach for human personality (PEDANT). PEDANT doesn't rely on the common type of labeled data but on the generative pre-trained model (GPT) combined with domain expertise. Testing the methodology on three different datasets, provides results that support the quality of the generated data.
翻訳日:2023-01-23 13:01:00 公開日:2023-01-20
# Baechi: マシンラーニンググラフの高速デバイス配置

Baechi: Fast Device Placement of Machine Learning Graphs ( http://arxiv.org/abs/2301.08695v1 )

ライセンス: Link先を確認
Beomyeol Jeon, Linda Cai, Chirag Shetty, Pallavi Srivastava, Jintao Jiang, Xiaolan Ke, Yitao Meng, Cong Xie, Indranil Gupta(参考訳) マシンラーニンググラフ(あるいはモデル)は、メモリが限られているデバイスやモデルが大きい場合、トレーニングが困難あるいは不可能になる可能性がある。 モデルをデバイスに分割するために、学習ベースのアプローチは依然として人気がある。 これらは、データ(例えば、低ステップ時間)で高速にトレーニングするモデル配置をもたらすが、学習ベースのモデル並列処理は時間がかかり、デバイス上のオペレーターの配置計画を作成するのに何時間、数日もかかる。 本稿では,メモリ制約の小さなデバイスクラスタ上で機械学習学習グラフを実行するための配置問題に対するアルゴリズム的アプローチを最初に導入したBaechiシステムを提案する。 Baechiの実装を、TensorFlowとPyTorchという2つの人気のあるオープンソースの学習フレームワークに統合しています。 gpuを用いた実験結果はこう示しています (i)Baechiは、最先端の学習ベースアプローチよりも高速な配置計画654X-206KXを生成し、 (ii) baechi-placed modelのステップ(トレーニング)時間はpytorchのエキスパート配置に匹敵する。 2つのアルゴリズムが最適の定数係数内にあることを数学的に証明する。 私たちの研究は、学習ベースのアプローチと比較して、アルゴリズム的アプローチは機械学習システムに適応するためのさまざまな課題に直面することができることを示しています。

Machine Learning graphs (or models) can be challenging or impossible to train when either devices have limited memory, or models are large. To split the model across devices, learning-based approaches are still popular. While these result in model placements that train fast on data (i.e., low step times), learning-based model-parallelism is time-consuming, taking many hours or days to create a placement plan of operators on devices. We present the Baechi system, the first to adopt an algorithmic approach to the placement problem for running machine learning training graphs on small clusters of memory-constrained devices. We integrate our implementation of Baechi into two popular open-source learning frameworks: TensorFlow and PyTorch. Our experimental results using GPUs show that: (i) Baechi generates placement plans 654 X - 206K X faster than state-of-the-art learning-based approaches, and (ii) Baechi-placed model's step (training) time is comparable to expert placements in PyTorch, and only up to 6.2% worse than expert placements in TensorFlow. We prove mathematically that our two algorithms are within a constant factor of the optimal. Our work shows that compared to learning-based approaches, algorithmic approaches can face different challenges for adaptation to Machine learning systems, but also they offer proven bounds, and significant performance benefits.
翻訳日:2023-01-23 12:55:12 公開日:2023-01-20
# 限定注文書市場における取引信号実行のための非同期深層デュエルQラーニング

Asynchronous Deep Double Duelling Q-Learning for Trading-Signal Execution in Limit Order Book Markets ( http://arxiv.org/abs/2301.08688v1 )

ライセンス: Link先を確認
Peer Nagy, Jan-Peter Calliess and Stefan Zohren(参考訳) 我々は、エージェントを訓練するために深層強化学習(RL)を使用し、高周波取引信号を個々のリミット注文を配置するトレーディング戦略にうまく翻訳する。 abides limit order book simulatorに基づき、強化学習openaiジム環境を構築し、歴史的な注文帳メッセージに基づいてnasdaq株の現実的な取引環境をシミュレートする。 この環境でのトレーディングリターンの最大化を学習するトレーディングエージェントのトレーニングには、APEX(asynchronous prioritised Experience replay)アーキテクチャを使用したDeep Duelling Double Q-learningを使用します。 エージェントは、現在のリミットオーダーの帳簿状態、その最近の歴史、および短期的な方向性予測を観察する。 具体的な予測アルゴリズムから独立して適応的トレーディングを行うためのRLの性能について検討するため,ノイズレベルの異なる前方方向のリターンを摂動することで得られる合成アルファ信号を用いた手法の性能について検討した。 ここでは,RLエージェントが在庫管理の効果的なトレーディング戦略を学習し,それらが同一信号にアクセス可能なヒューリスティックなベンチマークトレーディング戦略より優れていることを示す。

We employ deep reinforcement learning (RL) to train an agent to successfully translate a high-frequency trading signal into a trading strategy that places individual limit orders. Based on the ABIDES limit order book simulator, we build a reinforcement learning OpenAI gym environment and utilise it to simulate a realistic trading environment for NASDAQ equities based on historic order book messages. To train a trading agent that learns to maximise its trading return in this environment, we use Deep Duelling Double Q-learning with the APEX (asynchronous prioritised experience replay) architecture. The agent observes the current limit order book state, its recent history, and a short-term directional forecast. To investigate the performance of RL for adaptive trading independently from a concrete forecasting algorithm, we study the performance of our approach utilising synthetic alpha signals obtained by perturbing forward-looking returns with varying levels of noise. Here, we find that the RL agent learns an effective trading strategy for inventory management and order placing that outperforms a heuristic benchmark trading strategy having access to the same signal.
翻訳日:2023-01-23 12:54:49 公開日:2023-01-20
# マルチエージェント経路探索のための非補間抽象化を用いた逆例

Counterexample Guided Abstraction Refinement with Non-Refined Abstractions for Multi-Agent Path Finding ( http://arxiv.org/abs/2301.08687v1 )

ライセンス: Link先を確認
Pavel Surynek(参考訳) Counterexample guided abstract refinement (CEGAR) は、モデルチェックや到達可能性分析などの様々なタスクにおいて、強力なシンボル技術である。 近年,マルチエージェントパス探索 (MAPF) において, CEGAR と Boolean satisfiability (SAT) を組み合わせた CEGAR が適用されている。 最近の CEGAR アプローチでは、MAPF 問題の初期の抽象化を用いて、エージェント間の衝突を省略し、その後の抽象化改良で排除した。 本研究では,SATをベースとしたMAPFのための新しいCEGAR型解法を提案する。 これにより、下層のsatソルバから得られた回答を処理後処理する必要が加わり、これらの回答は正しいmapfソリューションとわずかに異なる。 しかし、非精細化は、以前のアプローチよりも桁違いに小さいSATエンコーディングをもたらし、SATベースのMAPFソルバを関連するベンチマークで再び競合させる全体的な解決プロセスを高速化する。

Counterexample guided abstraction refinement (CEGAR) represents a powerful symbolic technique for various tasks such as model checking and reachability analysis. Recently, CEGAR combined with Boolean satisfiability (SAT) has been applied for multi-agent path finding (MAPF), a problem where the task is to navigate agents from their start positions to given individual goal positions so that the agents do not collide with each other. The recent CEGAR approach used the initial abstraction of the MAPF problem where collisions between agents were omitted and were eliminated in subsequent abstraction refinements. We propose in this work a novel CEGAR-style solver for MAPF based on SAT in which some abstractions are deliberately left non-refined. This adds the necessity to post-process the answers obtained from the underlying SAT solver as these answers slightly differ from the correct MAPF solutions. Non-refining however yields order-of-magnitude smaller SAT encodings than those of the previous approach and speeds up the overall solving process making the SAT-based solver for MAPF competitive again in relevant benchmarks.
翻訳日:2023-01-23 12:54:27 公開日:2023-01-20
# 離散変調連続変数量子鍵分散プロトコルの有限サイズセキュリティ

Finite-Size Security for Discrete-Modulated Continuous-Variable Quantum Key Distribution Protocols ( http://arxiv.org/abs/2301.08686v1 )

ライセンス: Link先を確認
Florian Kanitschar, Ian George, Jie Lin, Twesh Upadhyaya and Norbert L\"utkenhaus(参考訳) 離散変調(dm)連続可変量子鍵分布(cv-qkd)プロトコルは、実験的な単純化のため、量子通信ネットワークの商用実装の候補として有望である。 漸近的限界における厳密なセキュリティ分析は存在するが、有限サイズ体制の証明はまだ活発な研究の対象である。 本稿では,DM CV-QKDプロトコルに対する独立かつ同一に分散された集団攻撃に対する構成可能な有限サイズセキュリティ証明を提案する。 我々は,bobのシステムの有効次元を制限し,rennerのepsilon-securityフレームワークにおけるセキュリティを厳密に証明するための新しいエネルギーテスト定理を提案する。 我々は, いわゆる受入試験について, 有限サイズ体制における統計的解析の適切な概念であり, 漸近的セキュリティ解析におけるパラメータ推定の概念を置き換えたセキュリティ議論を, 導入し, 構築する。 最後に,安全な鍵レートの厳密な下限を計算するために,数値的セキュリティ証明手法を拡張し,適用する。 本研究では, 信頼できない, 理想的, 信頼できない非理想的検出のための, 二次位相シフト鍵プロトコルに適用する。 その結果,少なくとも73kmの伝送距離を持つ実験条件下では,安全な有限サイズ鍵レートが得られることがわかった。

Discrete-Modulated (DM) Continuous-Variable Quantum Key Distribution (CV-QKD) protocols are promising candidates for commercial implementations of quantum communication networks due to their experimental simplicity. While tight security analyses in the asymptotic limit exist, proofs in the finite-size regime are still subject to active research. We present a composable finite-size security proof against independently and identically distributed (i.i.d.) collective attacks for a general DM CV-QKD protocol. We introduce a new energy testing theorem to bound the effective dimension of Bob's system and rigorously prove security within Renner's epsilon-security framework. We introduce and build up our security argument on so-called acceptance testing which, as we argue, is the proper notion for the statistical analysis in the finite-size regime and replaces the concept of parameter estimation for asymptotic security analyses. Finally, we extend and apply a numerical security proof technique to calculate tight lower bounds on the secure key rate. To demonstrate our method, we apply it to a quadrature phase-shift keying protocol, both for untrusted, ideal and trusted non-ideal detectors. The results show that our security proof method yields secure finite-size key rates under experimentally viable conditions up to at least 73 km transmission distance.
翻訳日:2023-01-23 12:54:07 公開日:2023-01-20
# Aharonov-Vaidmanアイデンティティの不確実性

Uncertainty from the Aharonov-Vaidman Identity ( http://arxiv.org/abs/2301.08679v1 )

ライセンス: Link先を確認
M. S. Leifer(参考訳) 本稿では、Aharonov-Vaidman恒等式 $A \left \vert \psi\right \rangle = \left \langle A \right \rangle \left \vert \psi\right \rangle + \Delta A \left \vert \psi^{\perp}_A \right \rangle$ を用いて、量子力学における可観測物の標準偏差の間の関係を証明する。 特に、ロバートソンの不確実性関係のより直接的な、より抽象的な証明にどのようにつながるかをレビューする。 $\delta a \delta b \geq \frac{1}{2} \left \vert \left \langle [a,b] \right \rangle \right \vert$。 これら2つの証明の関係を議論し、コーシー・シュワルツの不等式がアハラノフ・ヴァイドマンの同一性からどのように導かれるかを示す。 Aharonov-Vaidman に基づく Maccone-Pati の不確かさ関係の証明を与え、量子力学における不確かさの伝播を扱うために、Aharonov-Vaidman のアイデンティティがどう使えるかを示す。 最後に、Aharonov-Vaidman恒等式を混合状態に拡張し、混合ケースに結果を一般化する方法について議論する。

In this article, I show how the Aharonov-Vaidman identity $A \left \vert \psi\right \rangle = \left \langle A \right \rangle \left \vert \psi\right \rangle + \Delta A \left \vert \psi^{\perp}_A \right \rangle$ can be used to prove relations between the standard deviations of observables in quantum mechanics. In particular, I review how it leads to a more direct and less abstract proof of the Robertson uncertainty relation $\Delta A \Delta B \geq \frac{1}{2} \left \vert \left \langle [A,B] \right \rangle \right \vert$ than the textbook proof. I discuss the relationship between these two proofs and show how the Cauchy-Schwarz inequality can be derived from the Aharonov-Vaidman identity. I give Aharonov-Vaidman based proofs of the Maccone-Pati uncertainty relations and I show how the Aharonov-Vaidman identity can be used to handle propagation of uncertainty in quantum mechanics. Finally, I show how the Aharonov-Vaidman identity can be extended to mixed states and discuss how to generalize the results to the mixed case.
翻訳日:2023-01-23 12:53:48 公開日:2023-01-20
# 測定のサブセットにまたがる量子不整合の分布

Distribution of quantum incompatibility across subsets of measurements ( http://arxiv.org/abs/2301.08670v1 )

ライセンス: Link先を確認
Lucas Tendick, Hermann Kampermann, Dagmar Bru{\ss}(参考訳) 非整合性、すなわち非整合測定可能な量子測定は多くの情報処理タスクに必要なリソースである。 異なる測定数の増大は、通常、測定スキームの不適合性を高めることが知られている。 しかし、この拡張がどの程度大きく、どの程度依存しているかは一般には分かっていない。 ここでは、付加的な測定によって得られる不整合性は、利用可能な測定のサブセットの不整合性の特定の関数によって上下に制限されていることを示す。 我々は、相互に偏りのない基底に基づく明示的な例を提供することにより、境界のいくつかを厳密に証明する。 最後に,ベル実験で測定値数を増やすことで得られる非局所性に対する結果の結果について考察する。

Incompatible, i.e. non-jointly measurable quantum measurements are a necessary resource for many information processing tasks. It is known that increasing the number of distinct measurements usually enhances the incompatibility of a measurement scheme. However, it is generally unclear how large this enhancement is and on what it depends. Here, we show that the incompatibility which is gained via additional measurements is upper and lower bounded by certain functions of the incompatibility of subsets of the available measurements. We prove the tightness of some of our bounds by providing explicit examples based on mutually unbiased bases. Finally, we discuss the consequences of our results for the nonlocality that can be gained by enlarging the number of measurements in a Bell experiment.
翻訳日:2023-01-23 12:53:15 公開日:2023-01-20
# 立体的に説明可能な視覚トランスフォーマー

Holistically Explainable Vision Transformers ( http://arxiv.org/abs/2301.08669v1 )

ライセンス: Link先を確認
Moritz B\"ohle, Mario Fritz, Bernt Schiele(参考訳) トランスフォーマーは多くのタスクやドメインで機械学習の世界を支配し、その結果を理解することの重要性を高めている。 注意モジュールは内部の動作について部分的な洞察を与えるが、注意スコアはモデル全体を説明するには不十分であることが示されている。 そこで本研究では,B-cos変換器を提案する。 具体的には、多層パーセプトロン、アテンション層、トークン化モジュールなどの各モデルコンポーネントを動的線形に定式化し、単一の線形変換によってトランスフォーマー全体を忠実に要約する。 提案した設計をViT(Vision Transformers)に適用し,Bcos-ViTと呼ばれるモデルが高解釈可能であり,ImageNet上のベースラインViTと競合することを示す。 コードはもうすぐ利用可能になる。

Transformers increasingly dominate the machine learning landscape across many tasks and domains, which increases the importance for understanding their outputs. While their attention modules provide partial insight into their inner workings, the attention scores have been shown to be insufficient for explaining the models as a whole. To address this, we propose B-cos transformers, which inherently provide holistic explanations for their decisions. Specifically, we formulate each model component - such as the multi-layer perceptrons, attention layers, and the tokenisation module - to be dynamic linear, which allows us to faithfully summarise the entire transformer via a single linear transform. We apply our proposed design to Vision Transformers (ViTs) and show that the resulting models, dubbed Bcos-ViTs, are highly interpretable and perform competitively to baseline ViTs on ImageNet. Code will be made available soon.
翻訳日:2023-01-23 12:53:06 公開日:2023-01-20
# MTGP: メタモルフィックテストと遺伝的プログラミングを組み合わせる

MTGP: Combining Metamorphic Testing and Genetic Programming ( http://arxiv.org/abs/2301.08665v1 )

ライセンス: Link先を確認
Dominik Sobania, Martin Briesch, Philipp R\"ochner, Franz Rothlauf(参考訳) 遺伝的プログラミングは、プログラム合成の性能で知られている進化的アプローチである。 しかし、実世界のソフトウェア開発で実用化するには、まだ成熟していない。通常、テストケースを一般化するプログラムを生成するために多くのトレーニングケースが必要となるからだ。 実際に、トレーニングケースはユーザによって高価に手作業でラベル付けされる必要があり、より少ない数のトレーニングケースでプログラムの動作をチェックするアプローチが必要である。 メタモルフィックテストにはラベル付きインプット/アウトプットの例は必要ない。 代わりに、プログラムは、最初に与えられた(ランダムに生成された)入力で複数回実行され、続いて関連する入力が、観測された出力間の特定のユーザー定義関係が保持しているかどうかをチェックする。 本研究では,メタモルフィックテストと遺伝的プログラミングを組み合わせたMTGPを提案し,その性能と生成プログラムの一般化性について検討する。 さらに,与えられたラベル付きトレーニングケースの数に一般化可能性がどのように依存するかを分析する。 メタモルフィックテストとラベル付きトレーニングケースを組み合わせることで、ほぼすべての構成でラベル付きトレーニングケースのみを使用するよりも、一般化率が高いことが分かりました。 したがって、トレーニングデータのラベル付けが高価であれば、システムでメタモルフィックテストを使用することを研究者に勧める。

Genetic programming is an evolutionary approach known for its performance in program synthesis. However, it is not yet mature enough for a practical use in real-world software development, since usually many training cases are required to generate programs that generalize to unseen test cases. As in practice, the training cases have to be expensively hand-labeled by the user, we need an approach to check the program behavior with a lower number of training cases. Metamorphic testing needs no labeled input/output examples. Instead, the program is executed multiple times, first on a given (randomly generated) input, followed by related inputs to check whether certain user-defined relations between the observed outputs hold. In this work, we suggest MTGP, which combines metamorphic testing and genetic programming and study its performance and the generalizability of the generated programs. Further, we analyze how the generalizability depends on the number of given labeled training cases. We find that using metamorphic testing combined with labeled training cases leads to a higher generalization rate than the use of labeled training cases alone in almost all studied configurations. Consequently, we recommend researchers to use metamorphic testing in their systems if the labeling of the training data is expensive.
翻訳日:2023-01-23 12:52:50 公開日:2023-01-20
# AccDecoder: ニューラル強化ビデオ分析のための高速化デコーディング

AccDecoder: Accelerated Decoding for Neural-enhanced Video Analytics ( http://arxiv.org/abs/2301.08664v1 )

ライセンス: Link先を確認
Tingting Yuan, Liang Mi, Weijun Wang, Haipeng Dai, Xiaoming Fu(参考訳) ビデオストリームの品質は、ニューラルネットワークベースのビデオ分析の鍵となる。 しかし、低品質ビデオは、例えばアップストリーム帯域幅の制限などにより、低品質カメラや過剰圧縮/縮小ビデオストリーミングプロトコルによって、既存の監視システムによって必然的に収集される。 この問題に対処するために、既存の研究では、画質向上器(例えば、ニューラル超解像)を使用してビデオの品質を改善する(例えば、解像度)。 それでも、品質向上剤の直接適用は、受け入れられないレイテンシをもたらすため、実際には機能しない。 本稿では,リアルタイム・ニューラルエンハンスドビデオ解析のための新しい高速化デコーダ accdecoder を提案する。 AccDecoderは、Deep Reinforcement Learning (DRL)を介して適応的にいくつかのフレームを選択して、ニューラル超解像により品質を高め、参照する未選択フレームをスケールアップすることで、精度が6-21%向上する。 AccDecoderは、DNNベースの推論のためにDRLを使用して重要なフレームをフィルタリングし、フレームとブロック間の参照関係を抽出することで、他のフレームに対して結果を再利用することで効率的な推論機能を提供する。

The quality of the video stream is key to neural network-based video analytics. However, low-quality video is inevitably collected by existing surveillance systems because of poor quality cameras or over-compressed/pruned video streaming protocols, e.g., as a result of upstream bandwidth limit. To address this issue, existing studies use quality enhancers (e.g., neural super-resolution) to improve the quality of videos (e.g., resolution) and eventually ensure inference accuracy. Nevertheless, directly applying quality enhancers does not work in practice because it will introduce unacceptable latency. In this paper, we present AccDecoder, a novel accelerated decoder for real-time and neural-enhanced video analytics. AccDecoder can select a few frames adaptively via Deep Reinforcement Learning (DRL) to enhance the quality by neural super-resolution and then up-scale the unselected frames that reference them, which leads to 6-21% accuracy improvement. AccDecoder provides efficient inference capability via filtering important frames using DRL for DNN-based inference and reusing the results for the other frames via extracting the reference relationship among frames and blocks, which results in a latency reduction of 20-80% than baselines.
翻訳日:2023-01-23 12:52:28 公開日:2023-01-20
# eEDM探索のためのトラップ付き多原子分子の量子制御

Quantum Control of Trapped Polyatomic Molecules for eEDM Searches ( http://arxiv.org/abs/2301.08656v1 )

ライセンス: Link先を確認
Lo\"ic Anderegg, Nathaniel B. Vilas, Christian Hallas, Paige Robichaud, Arian Jadbabaie, John M. Doyle, Nicholas R. Hutzler(参考訳) ウルトラコールド多原子分子は、量子科学、量子センシング、超コールド化学、標準モデルを超える物理の精密測定実験の候補として期待されている。 これらの実験の重要な要件は、分子の複雑な内部構造に対する完全な量子制御を達成する能力である。 そこで我々は,ポリ原子分子,一酸化カルシウム(CaOH)における個々の量子状態のコヒーレント制御を確立し,これらの手法を用いて電子電気双極子モーメント(eEDM)の探索方法を示す。 光学的に捕捉された超低温caoh分子は1つの量子状態で調製され、電界で分極され、電子スピン偏差測定が行われるeedm感度状態にコヒーレントに伝達される。 測定のコヒーレンス時間を延長するため,eEDM感度状態と調整可能なほぼゼロの磁場感度を利用する。 スピン先行コヒーレンス時間は交流スタークシフトと非制御磁場によって制限される。 これらの結果は,多原子分子を捕捉したeEDM探索の経路を確立し,時間反転物理に対する実験感度を向上させる。

Ultracold polyatomic molecules are promising candidates for experiments in quantum science, quantum sensing, ultracold chemistry, and precision measurements of physics beyond the Standard Model. A key, yet unrealized, requirement of these experiments is the ability to achieve full quantum control over the complex internal structure of the molecules. Here, we establish coherent control of individual quantum states in a polyatomic molecule, calcium monohydroxide (CaOH), and use these techniques to demonstrate a method for searching for the electron electric dipole moment (eEDM). Optically trapped, ultracold CaOH molecules are prepared in a single quantum state, polarized in an electric field, and coherently transferred into an eEDM sensitive state where an electron spin precession measurement is performed. To extend the coherence time of the measurement, we utilize eEDM sensitive states with tunable, near-zero magnetic field sensitivity. The spin precession coherence time is limited by AC Stark shifts and uncontrolled magnetic fields. These results establish a path for eEDM searches with trapped polyatomic molecules, towards orders-of-magnitude improved experimental sensitivity to time-reversal-violating physics.
翻訳日:2023-01-23 12:52:03 公開日:2023-01-20
# FlatFormer: 効率的なポイントクラウドトランスのためのフラットなウィンドウアテンション

FlatFormer: Flattened Window Attention for Efficient Point Cloud Transformer ( http://arxiv.org/abs/2301.08739v1 )

ライセンス: Link先を確認
Zhijian Liu, Xinyu Yang, Haotian Tang, Shang Yang, Song Han(参考訳) cnnの代替としてtransformerは、多くのモダリティ(テキストや画像など)において有効であることが証明されている。 3dポイントクラウドトランスフォーマーでは、既存の取り組みは主に精度を最先端レベルに引き上げることに集中している。 しかし、彼らのレイテンシはスパース畳み込みベースのモデル(3倍遅い)に遅れており、リソース制約のあるレイテンシに敏感なアプリケーション(自動運転など)での使用を妨げる。 この非効率性は点雲のスパースと不規則な性質に由来するが、トランスフォーマーは密度の高い通常のワークロード用に設計されている。 本稿では,空間的近接を交換することで,このレイテンシギャップを閉じるフラットフォームを提案する。 まず、ウィンドウベースのソートと分割ポイントで点雲を平らにし、同じ形状のウィンドウではなく、同じサイズのグループに分割する。 これにより、コストのかかる構造やパッドのオーバーヘッドを効果的に回避できる。 次に、グループ内でセルフアテンションを適用して、ローカルな特徴を抽出し、異なる方向から機能を集め、ウィンドウをグループ間で機能交換にシフトします。 FlatFormerはWaymo Open Dataset上で4.6倍のスピードアップ(トランスフォーマーベース)SST、1.4倍のスピードアップ(小さな畳み込み)CenterPointを提供する。 これは、エッジgpuでリアルタイムパフォーマンスを実現する最初のポイントクラウドトランスフォーマーであり、大規模なベンチマークでほぼあるいはそれ以上の精度を達成しながら、疎畳み込みメソッドよりも高速である。 私たちの結果を再現するコードは公開されます。

Transformer, as an alternative to CNN, has been proven effective in many modalities (e.g., texts and images). For 3D point cloud transformers, existing efforts focus primarily on pushing their accuracy to the state-of-the-art level. However, their latency lags behind sparse convolution-based models (3x slower), hindering their usage in resource-constrained, latency-sensitive applications (such as autonomous driving). This inefficiency comes from point clouds' sparse and irregular nature, whereas transformers are designed for dense, regular workloads. This paper presents FlatFormer to close this latency gap by trading spatial proximity for better computational regularity. We first flatten the point cloud with window-based sorting and partition points into groups of equal sizes rather than windows of equal shapes. This effectively avoids expensive structuring and padding overheads. We then apply self-attention within groups to extract local features, alternate sorting axis to gather features from different directions, and shift windows to exchange features across groups. FlatFormer delivers state-of-the-art accuracy on Waymo Open Dataset with 4.6x speedup over (transformer-based) SST and 1.4x speedup over (sparse convolutional) CenterPoint. This is the first point cloud transformer that achieves real-time performance on edge GPUs and is faster than sparse convolutional methods while achieving on-par or even superior accuracy on large-scale benchmarks. Code to reproduce our results will be made publicly available.
翻訳日:2023-01-23 12:45:53 公開日:2023-01-20
# 多体局在相間の共鳴拡散の正規化

Renormalization view on resonance proliferation between many-body localized phases ( http://arxiv.org/abs/2301.08738v1 )

ライセンス: Link先を確認
Jared Jeyaretnam, Christopher J. Turner, Arijeet Pal(参考訳) 位相と多体局在(MBL)は、有限エネルギー密度で量子情報を保存するための新しい道を開いた。 共鳴脱局在化はこれらの現象の不安定化に重要な役割を果たしている。 本研究では,波動関数の共振特性を効率的に特徴付ける実空間再正規化群を符号化するクリフォード回路を用いて,対称性を保護した位相秩序をホストする不規則相互作用イジングモデルにおける多体共鳴の統計的性質について検討する。 以上の結果から, 自明なmbl相と位相的に順序付けられたmbl相は共振に対して安定なままであるが, 共振増殖により局所化近傍では不安定であることが示された。 雪崩不安定性の発達への感受性の分散は、間欠的なエルゴード相を示唆する。 また、mbl相における運動の局所積分にアクセスし、秩序相における位相的エッジモード作用素を同定することができる。 以上の結果から,MBLの安定性と,MBL相間の相転移の対称性および非対称性が示唆された。

Topology and many-body localization (MBL) have opened new avenues for preserving quantum information at finite energy density. Resonant delocalization plays a crucial role in destabilizing these phenomena. In this work, we study the statistical properties of many-body resonances in a disordered interacting Ising model - which can host symmetry protected topological order - using a Clifford circuit encoding of the real space renormalization group which allows the resonant properties of the wave functions to be efficiently characterized. Our findings show that both the trivial and topologically ordered MBL phases remain stable to the resonances, but in the vicinity of the transition between them localization is destabilized by resonance proliferation. Diverging susceptibility towards the development of an avalanche instability suggests an intervening ergodic phase. We are also able to access the local integrals of motion in the MBL phases and identify the topological edge-mode operators in the ordered phase. Our results have important implications for the stability of MBL and phase transitions between distinct MBL phases with and without symmetries.
翻訳日:2023-01-23 12:45:23 公開日:2023-01-20
# ピーナッツは分布意味論に恋をするか?

Can Peanuts Fall in Love with Distributional Semantics? ( http://arxiv.org/abs/2301.08731v1 )

ライセンス: Link先を確認
James A. Michaelov, Seana Coulson, Benjamin K. Bergen(参考訳) 例えば、人為的なピーナッツを含む短い話の後、実験参加者は、N400振幅(Nieuwland & van Berkum, 2006)で示されるように、「ピーナッツは塩漬けだった」という文よりも「ピーナッツは愛していた」という文を期待する傾向にある。 状況モデル - 議論中のイベントの重要な要素の心的表現の更新、この場合、ピーナッツの主人公は、文脈に基づいてピーナッツが関与する可能性のあるイベントの種類について、コンプレッシャーの予想を迅速かつ動的に更新する。 しかし,近年の研究では,N400振幅が分布情報のみに基づいて予測できることが示されており,過去の研究で観測された文脈効果に状況モデルが実際に必要かどうかが疑問視されている。 そこで本研究では,6つの計算言語モデルと3組の単語ベクトルを用いて,nieuwland と van berkum (2006) の結果をモデル化する。 nieuwland と van berkum (2006) が発見した効果は、2つの言語モデルと2つの単語ベクトルセットによって完全にモデル化できる。 したがって、状況モデルによって説明される少なくともいくつかの処理効果は、実際には明示的な状況モデルを必要としない可能性がある。

The context in which a sentence appears can drastically alter our expectations about upcoming words - for example, following a short story involving an anthropomorphic peanut, experimental participants are more likely to expect the sentence 'the peanut was in love' than 'the peanut was salted', as indexed by N400 amplitude (Nieuwland & van Berkum, 2006). This rapid and dynamic updating of comprehenders' expectations about the kind of events that a peanut may take part in based on context has been explained using the construct of Situation Models - updated mental representations of key elements of an event under discussion, in this case, the peanut protagonist. However, recent work showing that N400 amplitude can be predicted based on distributional information alone raises the question whether situation models are in fact necessary for the kinds of contextual effects observed in previous work. To investigate this question, we attempt to model the results of Nieuwland and van Berkum (2006) using six computational language models and three sets of word vectors, none of which have explicit situation models or semantic grounding. We find that the effect found by Nieuwland and van Berkum (2006) can be fully modeled by two language models and two sets of word vectors, with others showing a reduced effect. Thus, at least some processing effects normally explained through situation models may not in fact require explicit situation models.
翻訳日:2023-01-23 12:45:06 公開日:2023-01-20
# 新視点音響合成

Novel-View Acoustic Synthesis ( http://arxiv.org/abs/2301.08730v1 )

ライセンス: Link先を確認
Changan Chen, Alexander Richard, Roman Shapovalov, Vamsi Krishna Ithapu, Natalia Neverova, Kristen Grauman, Andrea Vedaldi(参考訳) 我々は,nvas(new-view acoustic synthesis)タスクについて紹介する。音源の視点で観測された視覚と音を考えると,対象とする視点からそのシーンの「emph{sound}」を合成することは可能か? 入力された音声・視覚的手がかりを分析し,空間内の任意の点の音を合成することを学ぶ視覚誘導音響合成(ViGAS)ネットワークを提案する。 このタスクをベンチマークするために、我々は2つの大規模マルチビューオーディオ視覚データセットを収集した。 提案手法は,空間的手がかりの推論に成功し,両データセットに忠実な音声を合成することを示す。 我々の知る限り、この研究は、AR/VRからアート、デザインに至るまで、エキサイティングな可能性のある、新しい視点の音響合成タスクを解決するための、最初の定式化、データセット、アプローチを表している。 この研究に縛られずに、我々は、新しいビュー合成の未来は、ビデオからのマルチモーダル学習にあると信じている。

We introduce the novel-view acoustic synthesis (NVAS) task: given the sight and sound observed at a source viewpoint, can we synthesize the \emph{sound} of that scene from an unseen target viewpoint? We propose a neural rendering approach: Visually-Guided Acoustic Synthesis (ViGAS) network that learns to synthesize the sound of an arbitrary point in space by analyzing the input audio-visual cues. To benchmark this task, we collect two first-of-their-kind large-scale multi-view audio-visual datasets, one synthetic and one real. We show that our model successfully reasons about the spatial cues and synthesizes faithful audio on both datasets. To our knowledge, this work represents the very first formulation, dataset, and approach to solve the novel-view acoustic synthesis task, which has exciting potential applications ranging from AR/VR to art and design. Unlocked by this work, we believe that the future of novel-view synthesis is in multi-modal learning from videos.
翻訳日:2023-01-23 12:44:39 公開日:2023-01-20
# ニューラルアーキテクチャ検索:1000の論文からの洞察

Neural Architecture Search: Insights from 1000 Papers ( http://arxiv.org/abs/2301.08727v1 )

ライセンス: Link先を確認
Colin White, Mahmoud Safari, Rhea Sukthanker, Binxin Ru, Thomas Elsken, Arber Zela, Debadeepta Dey, Frank Hutter(参考訳) 過去10年間、ディープラーニングの進歩は、コンピュータビジョン、自然言語理解、音声認識、強化学習など、さまざまな分野においてブレークスルーをもたらしてきた。 専門的でハイパフォーマンスなニューラルアーキテクチャは、これらの分野でのディープラーニングの成功に不可欠である。 neural architecture search(nas)は、あるタスクのためにニューラルネットワークの設計を自動化するプロセスであり、機械学習を自動化するための必然的な次のステップであり、多くのタスクにおいて人間の設計したアーキテクチャを上回っています。 過去数年間、NASの研究は急速に進展し、2020年から1000以上の論文が出版された。 本稿では,ニューラルアーキテクチャ探索のための組織的かつ包括的なガイドを提供する。 我々は,検索空間,アルゴリズム,スピードアップ手法の分類を与え,ベンチマーク,ベストプラクティス,その他の調査,オープンソースライブラリなどのリソースについて議論する。

In the past decade, advances in deep learning have resulted in breakthroughs in a variety of areas, including computer vision, natural language understanding, speech recognition, and reinforcement learning. Specialized, high-performing neural architectures are crucial to the success of deep learning in these areas. Neural architecture search (NAS), the process of automating the design of neural architectures for a given task, is an inevitable next step in automating machine learning and has already outpaced the best human-designed architectures on many tasks. In the past few years, research in NAS has been progressing rapidly, with over 1000 papers released since 2020. In this survey, we provide an organized and comprehensive guide to neural architecture search. We give a taxonomy of search spaces, algorithms, and speedup techniques, and we discuss resources such as benchmarks, best practices, other surveys, and open-source libraries.
翻訳日:2023-01-23 12:44:22 公開日:2023-01-20
# 確率的デジタル人間は現在、シリコイメージングのトライアルに登録されている -- デジタルコホートを生成する方法とツール

The stochastic digital human is now enrolling for in silico imaging trials -- Methods and tools for generating digital cohorts ( http://arxiv.org/abs/2301.08719v1 )

ライセンス: Link先を確認
A Badano, M Lago, E Sizikova, JG Delfino, S Guan, MA Anastasio and B Sahiner(参考訳) ランダム化された臨床試験は、しばしば医療介入の質を判断する最高の立証法と見なされるが、完璧には程遠い。 サイリコイメージングの臨床試験では、この情報をコンピュータシミュレーションによって完全に収集し、医療機器の性能を確認することを目的とした計算研究が行なわれている。 新たな技術を評価するためのin silicoトライアルの利点には、重要なリソースと時間の節約、対象リスクの最小化、物理的世界で実現不可能なデバイスの研究能力、新技術の迅速かつ効果的な調査、関連するすべてのサブグループからの表現の確保が含まれる。 シリコの試験を行うには、人間のデジタル表現が必要である。 シリコンイメージング研究におけるデジタル人間獲得手法とツールの開発状況について概説する。 まず,デジタル・ヒューマン・モデルの用語と分類について述べる。 第2に,健常者および病弱者におけるデジタル人間生成の方法を調査し,拡張法の役割を簡潔に検討した。 最後に、デジタルコホートをサンプリングする4つのアプローチのトレードオフと、特定の患者分布を選択する際の学習バイアスの関連可能性について論じる。

Randomized clinical trials, while often viewed as the highest evidentiary bar by which to judge the quality of a medical intervention, are far from perfect. In silico imaging trials are computational studies that seek to ascertain the performance of a medical device by collecting this information entirely via computer simulations. The benefits of in silico trials for evaluating new technology include significant resource and time savings, minimization of subject risk, the ability to study devices that are not achievable in the physical world, allow for the rapid and effective investigation of new technologies and ensure representation from all relevant subgroups. To conduct in silico trials, digital representations of humans are needed. We review the latest developments in methods and tools for obtaining digital humans for in silico imaging studies. First, we introduce terminology and a classification of digital human models. Second, we survey available methodologies for generating digital humans with healthy and diseased status and examine briefly the role of augmentation methods. Finally, we discuss the trade-offs of four approaches for sampling digital cohorts and the associated potential for study bias with selecting specific patient distributions.
翻訳日:2023-01-23 12:43:44 公開日:2023-01-20
# 集団の非同期伝播による大規模並列遺伝的最適化

Massively Parallel Genetic Optimization through Asynchronous Propagation of Populations ( http://arxiv.org/abs/2301.08713v1 )

ライセンス: Link先を確認
Oskar Taubert, Marie Weiel, Daniel Coquelin, Anis Farshian, Charlotte Debus, Alexander Schug, Achim Streit and Markus G\"otz(参考訳) 本稿では,グローバル最適化,特にハイパーパラメータ探索のための進化的最適化アルゴリズムとソフトウェアパッケージであるpropulateを提案する。 HPCリソースの効率的な利用のために、Propulateは、従来の遺伝的アルゴリズムのように、各世代後の同期を省略する。 代わりに、新しい個体を育成するときに、完全な人口で探索を司る。 我々は,選択,突然変異,クロスオーバー,マイグレーションの変種を特徴とするアルゴリズムのmpiベース実装を提供し,カスタム機能により拡張が容易である。 Propulateを確立された最適化ツールであるOptunaと比較する。 Propulateは解の精度を犠牲にすることなく最大で3桁高速であり、遅延同期手法の有効性と有効性を示す。 コードとドキュメントはhttps://github.com/Helmholtz-AI-Energy/propulateで公開されている。

We present Propulate, an evolutionary optimization algorithm and software package for global optimization and in particular hyperparameter search. For efficient use of HPC resources, Propulate omits the synchronization after each generation as done in conventional genetic algorithms. Instead, it steers the search with the complete population present at time of breeding new individuals. We provide an MPI-based implementation of our algorithm, which features variants of selection, mutation, crossover, and migration and is easy to extend with custom functionality. We compare Propulate to the established optimization tool Optuna. We find that Propulate is up to three orders of magnitude faster without sacrificing solution accuracy, demonstrating the efficiency and efficacy of our lazy synchronization approach. Code and documentation are available at https://github.com/Helmholtz-AI-Energy/propulate
翻訳日:2023-01-23 12:43:13 公開日:2023-01-20
# 頂点作用素代数からの格子上のキラル位相秩序状態

Chiral topologically ordered states on a lattice from vertex operator algebras ( http://arxiv.org/abs/2301.08697v1 )

ライセンス: Link先を確認
Nikita Sopenko(参考訳) 単項有理頂点作用素代数に付随する位相次数を実現する2次元格子系の純粋状態のクラスを提案する。 これらの状態は熱力学的極限においてよく定義され、相関の指数的減衰を示す。 この構成は、任意のオンを挿入し、ある位相不変量を計算する自然な方法を提供する。 また、E_8$相を含む非自明な可逆相におけるボゾン状態の候補を与える。

We propose a class of pure states of two-dimensional lattice systems realizing topological order associated with unitary rational vertex operator algebras. We show that the states are well-defined in the thermodynamic limit and have exponential decay of correlations. The construction provides a natural way to insert anyons and compute certain topological invariants. It also gives candidates for bosonic states in non-trivial invertible phases, including the $E_8$ phase.
翻訳日:2023-01-23 12:43:02 公開日:2023-01-20