このサイトではarxivの論文のうち、30ページ以下でCreative Commonsライセンス(CC 0, CC BY, CC BY-SA)の論文を日本語訳しています。 本文がCCでない論文、長すぎる論文はメタデータのみを翻訳しています。(arxivのメタデータは CC 0です。) 翻訳文のライセンスはCC BY-SA 4.0です。 翻訳にはFugu-Machine Translatorを利用しています。

本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。

公開日が20221226となっている論文です。

PDF登録状況(公開日: 20221226)

TitleAuthorsAbstract論文公表日・翻訳日
# 一般化幾何交換子理論と量子幾何ブラケットとその応用

Generalized geometric commutator theory and quantum geometric bracket and its uses ( http://arxiv.org/abs/2001.08566v4 )

ライセンス: Link先を確認
Gen Wang(参考訳) Inspired by the geometric bracket for the generalized covariant Hamilton system, we abstractly define a generalized geometric commutator $$\left[ a,b \right]={{\left[ a,b \right]}_{cr}}+G\left(s,a,b \right)$$ formally equipped with geomutator $G\left(s, a,b \right)=a{{\left[ s,b \right]}_{cr}}-b{{\left[ s,a \right]}_{cr}}$ defined in terms of structural function $s$ related to the structure of spacetime or manifolds itself for revising the classical representation ${{\left[ a,b \right]}_{cr}}=ab-ba$ for any elements $a$ and $b$ of any algebra. 次に、一般化幾何学的可換子を用いて、量子ポアソンブラケットの一般化としてジオミュータットによって定義される量子幾何学ブラケットと関連する量子共変ポアソンブラケットを定義する。 共変ダイナミクスは、一般化されたハイゼンベルク方程式をハイゼンベルク方程式の自然な拡張として含み、量子幾何学ブラケットに基づくG-力学を含む。 応用として、標準可換関係と場の量子化をより完全なものに再考する。

Inspired by the geometric bracket for the generalized covariant Hamilton system, we abstractly define a generalized geometric commutator $$\left[ a,b \right]={{\left[ a,b \right]}_{cr}}+G\left(s,a,b \right)$$ formally equipped with geomutator $G\left(s, a,b \right)=a{{\left[ s,b \right]}_{cr}}-b{{\left[ s,a \right]}_{cr}}$ defined in terms of structural function $s$ related to the structure of spacetime or manifolds itself for revising the classical representation ${{\left[ a,b \right]}_{cr}}=ab-ba$ for any elements $a$ and $b$ of any algebra. Then we use the generalized geometric commutator to define quantum covariant Poisson bracket that is related to the quantum geometric bracket defined by geomutator as a generalization of quantum Poisson bracket. The covariant dynamics includes the generalized Heisenberg equation as a natural extension of Heisenberg equation and G-dynamics based on the quantum geometric bracket, meanwhile, the geometric canonical commutation relation is induced. As an application, we reconsider the canonical commutation relation and the quantization of field to be more complete.
翻訳日:2023-06-06 04:57:51 公開日:2022-12-26
# p$-wave相互作用を有する一成分フェルミガス中の3体組換え

Three-body recombination in a single-component Fermi gas with $p$-wave interaction ( http://arxiv.org/abs/2201.00962v2 )

ライセンス: Link先を確認
Shangguo Zhu, Zhenhua Yu, Shizhong Zhang(参考訳) 同一のフェルミオン原子の3体再結合について研究する。 p$-wave相互作用のゼロレンジモデルを用いて、弱束縛された$p$-waveダイマーへの3体再結合の速度定数を、大きな正の散乱体積$v$に対して$\alpha_{\rm rec} \propto v^{5/2}r^{1/2} k_t^4 (1+ c k_t^2 l_{\rm d}^2)$と書くことができることを示した。 ここでr$は$p$-wave有効範囲であり、$k_t^2$は衝突原子の平均熱運動エネルギーを与え、$l_{\rm d}$は$p$-waveダイマーの大きさである。 先頭項は、通常述べられている$v^{8/3}$-scaling法則とは異なるが、以前の2チャネル計算と一致する。 サブリーディング項では、パラメータ $\gamma\equiv r/v^{1/3}$ が小さいとき、関連する3体問題に対して摂動的に解いて定数 $c$ を計算する。 追加の$c k_t^2 l_{\rm d}^2$項は、$\alpha_{\rm rec}$ の温度と相互作用依存性、特に$k_t l_{\rm d}$ が比較的大きいときの共鳴に近い重要な補正を与える。

We study the three-body recombination of identical fermionic atoms. Using a zero-range model for the $p$-wave interaction, we show that the rate constant of three-body recombination into weakly bound $p$-wave dimers can be written as $\alpha_{\rm rec} \propto v^{5/2}R^{1/2} k_T^4 (1+ C k_T^2 l_{\rm d}^2)$ for large and positive scattering volume $v$. Here $R$ is the $p$-wave effective range, $k_T^2$ gives the average thermal kinetic energy of the colliding atoms, and $l_{\rm d}$ is the size of the $p$-wave dimer. The leading term is different from the usually stated $v^{8/3}$-scaling law, but is consistent with an earlier two-channel calculation. For the subleading term, we compute the constant $C$ by solving the relevant three-body problem perturbatively when the parameter $\gamma\equiv R/v^{1/3}$ is small. The additional $C k_T^2 l_{\rm d}^2$ term provides important corrections for the temperature and interaction dependence of $\alpha_{\rm rec}$, especially close to resonance when $k_T l_{\rm d}$ is relatively large.
翻訳日:2023-03-02 07:50:58 公開日:2022-12-26
# 準粒子と電荷ノイズを低減するための工学超電導量子ビット

Engineering superconducting qubits to reduce quasiparticles and charge noise ( http://arxiv.org/abs/2202.01435v2 )

ライセンス: Link先を確認
Xianchuang Pan, Yuxuan Zhou, Haolan Yuan, Lifu Nie, Weiwei Wei, Libo Zhang, Jian Li, Song Liu, Zhi Hao Jiang, Gianluigi Catelani, Ling Hu, Fei Yan and Dapeng Yu(参考訳) 量子コンピュータやシミュレータを設計するための重要なステップは、量子ビットにおけるデコヒーレンス機構の同定、定量化、抑制である。 超伝導回路は量子ビット設計の柔軟性を提供するが、その性能は準粒子(クーパー対)に悪影響を及ぼす。 したがって、スケーラブルで高コヒーレンスなデバイスと互換性のある準粒子緩和戦略の開発が望まれる。 ここでは, 量子ビットを小型化し, 金属カバーで包み込み, 適切な準粒子トラップを装備することにより, 準粒子生成を制御する手法を実験的に実証する。 フリップチップ設計を用いることで、超伝導ギャップの上のクビットの電磁環境を形成し、準粒子中毒を抑制する。 アンテナ状量子ビット構造による光子吸収の結果, 準粒子生成は, 接合部におけるクーパー対の破れに支配されるという仮説を支持する。 記録的な低電荷比スイッチング率(<1Hz)を達成する。 アルミニウムデバイスは、個別の充電イベントに対する安定性も向上した。

Identifying, quantifying, and suppressing decoherence mechanisms in qubits are important steps towards the goal of engineering a quantum computer or simulator. Superconducting circuits offer flexibility in qubit design; however, their performance is adversely affected by quasiparticles (broken Cooper pairs). Developing a quasiparticle mitigation strategy compatible with scalable, high-coherence devices is therefore highly desirable. Here we experimentally demonstrate how to control quasiparticle generation by downsizing the qubit, capping it with a metallic cover, and equipping it with suitable quasiparticle traps. Using a flip-chip design, we shape the electromagnetic environment of the qubit above the superconducting gap, inhibiting quasiparticle poisoning. Our findings support the hypothesis that quasiparticle generation is dominated by the breaking of Cooper pairs at the junction, as a result of photon absorption by the antenna-like qubit structure. We achieve record low charge-parity switching rate (<1Hz). Our aluminium devices also display improved stability with respect to discrete charging events.
翻訳日:2023-02-26 23:15:47 公開日:2022-12-26
# 偏り棒を有する分断型イオントラップの数値解析

Numerical investigation of a segmented-blade ion trap with biasing rods ( http://arxiv.org/abs/2202.07465v2 )

ライセンス: Link先を確認
Jungsoo Hong, Myunghun Kim, Hyegoo Lee, Moonjoo Lee(参考訳) 分断刃と偏り棒を有する線状イオントラップの数値解析を行った。 本システムでは、高周波(rf)ブレードと10個の電極を持つdcブレードと、イオンのマイクロモーションを補償する2つのバイアスロッドから構成される。 イオンの光アクセスを計算すると、rf電圧とdc電圧が検出され、安定したトラップ配置は$^{171}$yb$^{+}$ イオンとなる。 また, 偏動棒による微小運動補償についても検討し, トラップ電位に対するブレード不一致の影響を計算した。 本研究は,トラップアーキテクチャを定量的に理解し,イオントラップ量子コンピュータの信頼性の高い動作を支援する。

We report a numerical study of a linear ion trap that has segmented blades and biasing rods. Our system consists of radio frequency (rf) blades, dc blades with ten separate electrodes, and two biasing rods for compensating the ions' micromotion. After calculating the optical access for the ions, we find rf and dc voltages that result in a stable trapping configuration of $^{171}$Yb$^{+}$ ions. We also explore the micromotion compensation with the biasing rods, and calculate the influence of blade misalignment to the trap potential. Our work offers quantitative understanding of the trap architecture, assisting reliable operation of an ion-trap quantum computer.
翻訳日:2023-02-25 18:36:05 公開日:2022-12-26
# 敵対的学習による公正価格モデル

A Fair Pricing Model via Adversarial Learning ( http://arxiv.org/abs/2202.12008v3 )

ライセンス: Link先を確認
Vincent Grari, Arthur Charpentier, Marcin Detyniecki(参考訳) 保険事業の核心はリスクのある保険と非リスクのない保険の分類であり、リスクのある保険はリスクのない保険よりも多く貢献し、高いプレミアムを支払うべきである。 したがって、アクチュアリは、econometricまたはmachine learning技術を使用して分類するが、公正なアクチュアリル分類と「差別」の区別は微妙である。 このため、リンドホルム、リッチマン、ツァナカス、ウートリッチ(2022年)といった地域社会では公平さと差別への関心が高まっている。 非感受性の特徴は、保護された属性の代替またはプロキシとして機能すると考えられる。 例えば、自動車の色とモデルと運転者の職業の組み合わせは、自動車保険価格の予測において望ましくないジェンダーバイアスをもたらす可能性がある。 意外なことに,予測器のみの偏りは,正確な精度を維持するには不十分であることを示す(1)。 実際、従来の価格モデルは現在、2段階構造で構築されており、車や地理的リスクといった潜在的なコンポーネントの多くを考慮しています。 この伝統的な構造が公平性を達成する上で大きな限界があることを示します。 そこで我々は,新しい価格モデルアプローチを開発した。 近年、Blier-Wong、Cossette、Lamontagne、Marceau(2021年)、WuthrichとMerz(2021年)が価格におけるオートエンコーダの価値を示している。 本稿では,(2)複数の価格要因(地理的,カータイプ)に一般化できることを示す。(3)公平な文脈に完全に適合する(価格要素のセットを損なうことができるため)。我々は,この主概念を,所望のメートル法に従って不要なバイアスを緩和しつつ,純粋なプレミアムを予測するために必要な地理的およびカー価格要素を生成して,単一の価格モデル全体をトレーニングする一般的なフレームワークに拡張する。

At the core of insurance business lies classification between risky and non-risky insureds, actuarial fairness meaning that risky insureds should contribute more and pay a higher premium than non-risky or less-risky ones. Actuaries, therefore, use econometric or machine learning techniques to classify, but the distinction between a fair actuarial classification and "discrimination" is subtle. For this reason, there is a growing interest about fairness and discrimination in the actuarial community Lindholm, Richman, Tsanakas, and Wuthrich (2022). Presumably, non-sensitive characteristics can serve as substitutes or proxies for protected attributes. For example, the color and model of a car, combined with the driver's occupation, may lead to an undesirable gender bias in the prediction of car insurance prices. Surprisingly, we will show that debiasing the predictor alone may be insufficient to maintain adequate accuracy (1). Indeed, the traditional pricing model is currently built in a two-stage structure that considers many potentially biased components such as car or geographic risks. We will show that this traditional structure has significant limitations in achieving fairness. For this reason, we have developed a novel pricing model approach. Recently some approaches have Blier-Wong, Cossette, Lamontagne, and Marceau (2021); Wuthrich and Merz (2021) shown the value of autoencoders in pricing. In this paper, we will show that (2) this can be generalized to multiple pricing factors (geographic, car type), (3) it perfectly adapted for a fairness context (since it allows to debias the set of pricing components): We extend this main idea to a general framework in which a single whole pricing model is trained by generating the geographic and car pricing components needed to predict the pure premium while mitigating the unwanted bias according to the desired metric.
翻訳日:2023-02-19 15:11:06 公開日:2022-12-26
# オンライン音楽リスナー2部ネットワークにおける選好行動の普遍性:ビッグデータ分析

Universality of preference behaviors in online music-listener bipartite networks: A Big Data analysis ( http://arxiv.org/abs/2212.13139v1 )

ライセンス: Link先を確認
Xiao-Pu Han, Fen Lin, Jonathan J.H. Zhu, Tarik Hadzibeganovic(参考訳) 我々は,中国最大のオンライン音楽プラットフォームであるnetease cloud music (ncm) の数百万人のユーザによる音楽選好の形成を調査した。 ビッグデータ分析の文脈における複雑なネットワーク理論と情報科学の手法を組み合わせることで,音楽嗜好行動の形成と進化の基盤となる統計的パターンとコミュニティ構造を明らかにする。 本分析では,音楽影響の減衰パターン,音楽に対するユーザの感受性,年齢・性別差,地域経済指標との関係について考察した。 ユーザ音楽2部構成ネットワークにおけるコミュニティ検出を用いて,ncm利用者の8つの主要文化コミュニティを同定した。 女性の嗜好行動は男性よりもグループ内変動が高く,25歳前後に大きな変化がみられた。 さらに,女性の音楽的嗜好や嗜好の多様性も経済的要因と強く関連していた。 しかし,音楽トラックの人気が高度に変動し,文化的・人口的差異が同定されたにもかかわらず,音楽嗜好の時間的変化はゆるやかに崩壊する機能に続き,NCMリスナーは青年期に解放された音楽に対して最も敏感で,13歳でピークを迎えた。 本研究は,音楽の嗜好形成における普遍的特性の存在を示唆すると同時に,その文化的要因と人口統計学的要因との関係も示唆し,オンライン音楽プラットフォームにおけるコミュニティ検出とレコメンデーションシステム設計への幅広い影響を示唆する。

We investigate the formation of musical preferences of millions of users of the NetEase Cloud Music (NCM), one of the largest online music platforms in China. We combine the methods from complex networks theory and information sciences within the context of Big Data analysis to unveil statistical patterns and community structures underlying the formation and evolution of musical preference behaviors. Our analyses address the decay patterns of music influence, users' sensitivity to music, age and gender differences, and their relationship to regional economic indicators. Employing community detection in user-music bipartite networks, we identified eight major cultural communities in the population of NCM users. Female users exhibited higher within-group variability in preference behavior than males, with a major transition occurring around the age of 25. Moreveor, the musical tastes and the preference diversity measures of women were also more strongly associated with economic factors. However, in spite of the highly variable popularity of music tracks and the identified cultural and demographic differences, we observed that the evolution of musical preferences over time followed a power-law-like decaying function, and that NCM listeners showed the highest sensitivity to music released in their adolescence, peaking at the age of 13. Our findings suggest the existence of universal properties in the formation of musical tastes but also their culture-specific relationship to demographic factors, with wide-ranging implications for community detection and recommendation system design in online music platforms.
翻訳日:2023-02-19 13:19:19 公開日:2022-12-26
# 交通安全・モビリティ応用のためのデジタルツインシステムに向けて:レビュー

Towards Transportation Digital Twin Systems for Traffic Safety and Mobility Applications: A Review ( http://arxiv.org/abs/2212.12242v2 )

ライセンス: Link先を確認
Muhammad Sami Irfan, Sagar Dasgupta, Mizanur Rahman(参考訳) デジタルツイン(dt)システムは、物理的ツインとリアルタイムで更新される物理オブジェクトの仮想レプリカを作成し、そのライフサイクルを通じて物理的資産と共に進化することを目的としている。 交通システムはこの新しいパラダイムの恩恵を受ける可能性がある。 特に、DT技術はインテリジェント輸送システムの能力を増強することができる。 しかし,ネットワークワイド・トランスポートDTシステムの開発と展開には,将来的なコネクテッド・自動輸送システムのスケールと動的性質を考慮する必要がある。 このようなシステムの開発と実装に必要な要件や課題を理解する必要性に動機づけられ,個々の輸送資産からネットワーク全体のtdtまで,トランスポーテーションdt(transporting dt, tdt)システムの階層的概念を提案する。 提案した階層的概念の任意のスケールでTDTシステムを開発するためのガイドとして使用できる,TDTシステムのための参照アーキテクチャを提案する。 さらに, 交通安全, 移動性, 環境アプリケーションの観点から, TDT システムの実用性を示す参照アーキテクチャに基づいて, いくつかのユースケースを提示する。 続いて、TDTシステムの領域における現在の研究のレビューを行う。 最後に,tdtにおける重要な課題と今後の研究の方向性について考察し,安全で効率的な接続・自動輸送システムを実現するための既存の障壁を克服する。

Digital twin (DT) systems aim to create virtual replicas of physical objects that are updated in real time with their physical counterparts and evolve alongside the physical assets throughout its lifecycle. Transportation systems are poised to significantly benefit from this new paradigm. In particular, DT technology can augment the capabilities of intelligent transportation systems. However, the development and deployment of networkwide transportation DT systems need to take into consideration the scale and dynamic nature of future connected and automated transportation systems. Motivated by the need of understanding the requirements and challenges involved in developing and implementing such systems, this paper proposes a hierarchical concept for a Transportation DT (TDT) system starting from individual transportation assets and building up to the entire networkwide TDT. A reference architecture is proposed for TDT systems that could be used as a guide in developing TDT systems at any scale within the presented hierarchical concept. In addition, several use cases are presented based upon the reference architecture which illustrate the utility of a TDT system from transportation safety, mobility and environmental applications perspective. This is followed by a review of current studies in the domain of TDT systems. Finally, the critical challenges and promising future research directions in TDT are discussed to overcome existing barriers to realize a safe and operationally efficient connected and automated transportation systems.
翻訳日:2023-02-19 13:18:37 公開日:2022-12-26
# オーストラリアのパンデミック・アプリはどこでうまくいかなかったのか?

COVID Down Under: where did Australia's pandemic apps go wrong? ( http://arxiv.org/abs/2212.12178v2 )

ライセンス: Link先を確認
Shaanan Cohney, and Marc Cheong(参考訳) 新型コロナウイルス(COVID-19)の感染拡大の防止と追跡を支援するため、各国政府や企業がさまざまな技術策を講じた。 オーストラリアでは、これらのアプリケーションにはユーザビリティ、アクセシビリティ、セキュリティの欠陥が含まれており、その効果と採用を妨げている。 オーストラリアは、多くの国と同様に、新型コロナウイルスを疫病として扱うようになった。 しかし、パンデミックへのアプローチに関する技術的問題からの教訓をまだ吸収していない。 本稿では、最も注目すべきイベントの体系化、これらのアプリケーションのさまざまな障害モードの特定とレビュー、そして将来の危機に直面したアプリ開発のためのレコメンデーションを開発する。 私たちの仕事は一つの国に焦点を当てている。 しかし、オーストラリアの問題は、将来のパンデミックに直面した国が対処すべき驚くほどの落とし穴を浮き彫りにしている。

Governments and businesses worldwide deployed a variety of technological measures to help prevent and track the spread of COVID-19. In Australia, these applications contained usability, accessibility, and security flaws that hindered their effectiveness and adoption. Australia, like most countries, has transitioned to treating COVID as endemic. However it is yet to absorb lessons from the technological issues with its approach to the pandemic. In this short paper we provide a systematization of the most notable events; identify and review different failure modes of these applications; and develop recommendations for developing apps in the face of future crises. Our work focuses on a single country. However, Australia's issues are particularly instructive as they highlight surprisingly pitfalls that countries should address in the face of a future pandemic.
翻訳日:2023-02-19 13:18:16 公開日:2022-12-26
# 説明人を信頼する: 説明可能な人工知能の教師によるコース設計の検証

Trusting the Explainers: Teacher Validation of Explainable Artificial Intelligence for Course Design ( http://arxiv.org/abs/2212.08955v2 )

ライセンス: Link先を確認
Vinitra Swamy, Sijia Du, Mirko Marras, Tanja K\"aser(参考訳) 学習分析のためのディープラーニングモデルはここ数年で人気が高まっているが、信頼と透明性の欠如により、実際の環境ではまだ広く採用されていない。 本稿では,ブラックボックスニューラルネットワークのための説明可能なAI手法を実装することでこの問題に対処する。 本研究は、オンライン学習とブレンド学習の文脈と、学生の成功予測モデルの使用事例に焦点を当てる。 ペアワイズ学習設計を用いて,コースのペア間の制御された差異を調査できる。 分析では,1つの教育的側面が異なる5つのコースペアと2つの一般的なインスタンスベースの説明可能なAI手法(LIMEとSHAP)を網羅した。 説明と方法の間の距離を定量的に比較する。 次に,大学レベルの教育者に対する26の半構造化インタビューを通じて,lime と shap の説明を検証し,学生の成功に最も寄与すると思われる機能,最も信頼できる説明,これらの洞察を実践可能なコースデザイン決定に転換する方法について検証した。 以上の結果から,どの説明が重要か,また質的に,専門家自身はどの説明がもっとも信頼に値するのかについて意見が一致しないことが示唆された。 すべてのコード、拡張された結果、およびインタビュープロトコルはhttps://github.com/epfl-ml4ed/trusting-explainersで提供される。

Deep learning models for learning analytics have become increasingly popular over the last few years; however, these approaches are still not widely adopted in real-world settings, likely due to a lack of trust and transparency. In this paper, we tackle this issue by implementing explainable AI methods for black-box neural networks. This work focuses on the context of online and blended learning and the use case of student success prediction models. We use a pairwise study design, enabling us to investigate controlled differences between pairs of courses. Our analyses cover five course pairs that differ in one educationally relevant aspect and two popular instance-based explainable AI methods (LIME and SHAP). We quantitatively compare the distances between the explanations across courses and methods. We then validate the explanations of LIME and SHAP with 26 semi-structured interviews of university-level educators regarding which features they believe contribute most to student success, which explanations they trust most, and how they could transform these insights into actionable course design decisions. Our results show that quantitatively, explainers significantly disagree with each other about what is important, and qualitatively, experts themselves do not agree on which explanations are most trustworthy. All code, extended results, and the interview protocol are provided at https://github.com/epfl-ml4ed/trusting-explainers.
翻訳日:2023-02-19 13:06:57 公開日:2022-12-26
# 量子クエンチ下における局所弦状観測器の時間的臨界挙動

Late-time critical behavior of local string-like observables under quantum quenches ( http://arxiv.org/abs/2205.00201v2 )

ライセンス: Link先を確認
Souvik Bandyopadhyay, Anatoli Polkovnikov, Amit Dutta(参考訳) 近年、平衡量子臨界性のシグネチャが驚くほど、平衡から遠く離れた多体系に現れることが観察されている。 我々は、クエンチを受ける相互作用スピン系におけるそのようなシナリオを探求し、非平衡ポストクエンチダイナミクスによる基底状態臨界物理学を体系的に探究するロバストな方法を開発した。 有限弦状観測器の潜時挙動を解析したところ、平衡臨界性の鋭いサインが現れる。 特に、これらの可観測性は、クエンチ後の長期経過後に、平衡臨界点と普遍スケーリング指数を正確に検出する。 この現象は、解析された系はカオス/エルゴードが強く、クエンチ後に観測可能な初期状態が強い記憶力を持つという事実にもかかわらず起こる。 その結果, イオン量子シミュレータを用いた最近の実験では, ポストクエンチ領域形成における臨界シグネチャの説明にも利用できることがわかった。

In recent times it has been observed that signatures of equilibrium quantum criticality surprisingly show up in many-body systems which are manifestly far from equilibrium. We explore such scenarios in interacting spin systems subject to a quench and develop a robust method to systematically probe ground state critical physics through nonequilibrium post-quench dynamics. Analyzing late-time behavior of finite string-like observables, we find emerging sharp signatures of equilibrium criticality. Specifically, these observables accurately detect equilibrium critical points and universal scaling exponents after long times following a quench. This happens despite the fact that the analyzed systems are strongly chaotic/ergodic and is interestingly due to a strong memory of the initial conditions retained by these observables after quench. We find that our results can also be used to explain critical signatures in post-quench domain formation, seen in a recent experiment with trapped ion quantum simulators.
翻訳日:2023-02-15 01:23:43 公開日:2022-12-26
# 単スピンナノスケールにおけるサブナオネスラ感度

Sub-nanotesla Sensitivity at the Nanoscale with a Single Spin ( http://arxiv.org/abs/2205.04415v2 )

ライセンス: Link先を確認
Zhiyuan Zhao, Xiangyu Ye, Shaoyi Xu, Pei Yu, Zhiping Yang, Xi Kong, Ya Wang, Tianyu Xie, Fazhan Shi, and Jiangfeng Du(参考訳) 微小磁場の高感度検出は、多くの分野において必須である。 良い感度と高い空間分解能は、エネルギー分解限界(ERL)によって定量される測定において相互に矛盾する。 ナノスケールでの0.5${\bf{nT/\sqrt{Hz}}}$の感度は、数十ナノメートルの深さを持つダイヤモンドの窒素空孔欠陥を用いて実験的に達成される。 実現された感度は、リアルタイムフィードバックの初期化、形状パルスによる動的デカップリング、量子論理による反復的な読み出しなど、複数の量子技術との統合によって大幅に向上する。 われわれの磁気センサは、標準模型を超えた新しい物理学の探索、凝縮物質の微視的磁気現象の調査、細胞内スケールでの生命活動の検出に新たな光を当てる。

High-sensitivity detection of microscopic magnetic field is essential in many fields. Good sensitivity and high spatial resolution are mutually contradictory in measurement, which is quantified by the energy resolution limit (ERL). Here we report that a sensitivity of 0.5 ${\bf{nT/\sqrt{Hz}}}$ at the nanoscale is achieved experimentally by using nitrogen-vacancy defects in diamond with depths of tens of nanometers. The achieved sensitivity is substantially enhanced by integrating with multiple quantum techniques, including real-time-feedback initialization, dynamical decoupling with shaped pulses, repetitive readout via quantum logic. Our magnetic sensors will shed new light on searching new physics beyond the standard model, investigating microscopic magnetic phenomena in condensed matters, and detection of life activities at the sub-cellular scale.
翻訳日:2023-02-13 20:30:08 公開日:2022-12-26
# 共形場理論における2区間のマルチチャージモーメント

Multi-charged moments of two intervals in conformal field theory ( http://arxiv.org/abs/2206.01534v2 )

ライセンス: Link先を確認
Filiberto Ares, Pasquale Calabrese, Giuseppe Di Giulio, Sara Murciano(参考訳) 中心電荷$c=1$と大域電荷$U(1)$対称性を持つ2つの1+1$次元CFTの基底状態における2つの不整合区間に対する多重電荷モーメントについて検討する: 質量を持たないディラック場理論とコンパクトボソン(ラッティンガー液体)。 そこで,本研究では,表面のシート間の磁束の存在下で,レプリカ法から生じる高次リーマン面上の分割関数を計算する。 各分岐点においてフラックスが異なるツイスト境界条件を生成する一般的な状況について考察する。 得られたマルチチャージモーメントは、R'enyiエンタングルメントエントロピーの対称性分解と非補分分割の相互情報を引き出すことができる。 我々は,無質量ディラック理論の格子的実現であるタイト結合モデルについて,正確な数値計算結果と比較する。

We study the multi-charged moments for two disjoint intervals in the ground state of two $1+1$ dimensional CFTs with central charge $c=1$ and global $U(1)$ symmetry: the massless Dirac field theory and the compact boson (Luttinger liquid). For this purpose, we compute the partition function on the higher genus Riemann surface arising from the replica method in the presence of background magnetic fluxes between the sheets of the surface. We consider the general situation in which the fluxes generate different twisted boundary conditions at each branch point. The obtained multi-charged moments allow us to derive the symmetry resolution of the R\'enyi entanglement entropies and the mutual information for non complementary bipartitions. We check our findings against exact numerical results for the tight-binding model, which is a lattice realisation of the massless Dirac theory.
翻訳日:2023-02-10 20:16:37 公開日:2022-12-26
# Tavis-Cummingsモデルにおける暗黒状態の崩壊

Collapse of dark states in Tavis-Cummings model ( http://arxiv.org/abs/2207.03175v4 )

ライセンス: Link先を確認
Vitaliy Afanasyev and Chen Ran and Yuri Ozhigov and You Jiangchuan(参考訳) 2つの2レベル原子からなる系の一重項状態は、この場合断熱定理が適用できないにもかかわらず、ハミルトニアンtcがゆっくりと変形するため、滑らかに変化する。 この場合、自由光子の放出の確率は小さいが、ハミルトニアンの変形の滑らかさには依存しない。 自発的放出の効果は、キャビティ内の仮想光子の交換によって、一重項状態においてさらに1対の原子を加えることで強化される。 同様の効果は、原子が2つの空洞の間を移動できる場合にも確立されたが、逆に原子の数が増加すると放出が減少する。 この純粋量子効果は原子一重項による実用的操作において考慮されなければならないが、その弱さはむしろ、暗黒状態の安定性と情報交換(量子暗号プロトコル)やnoデバイスのためのエネルギー蓄積器としての使用の見通しについて検証される。

The singlet state of a system of two two-level atoms changes smoothly, remaining dark, as the Hamiltonian TC is slowly deformed, despite the inapplicability of the adiabatic theorem to this case. In this case, there is a small probability of emission of free photons, which does not depend on the smoothness of the deformation of the Hamiltonian. The effect of spontaneous emission is enhanced by the addition of one more pair of atoms in the singlet state due to the exchange of virtual photons in the cavity. A similar effect was also established for the case when atoms can move between two cavities, but here, on the contrary, with an increase in the number of atoms, the emission decreases. This purely quantum effect must be taken into account in practical manipulations with atomic singlets; however, its weakness testifies, rather, to the stability of dark states and the prospects for their use in information exchange (quantum cryptographic protocols) and as an energy accumulator for nono-devices.
翻訳日:2023-02-06 07:18:05 公開日:2022-12-26
# 金めっきアルミナによるイオントラップ:基板と表面キャラクタリゼーション

Ion trap with gold-plated alumina: substrate and surface characterization ( http://arxiv.org/abs/2207.06878v2 )

ライセンス: Link先を確認
Myunghun Kim, Keumhyun Kim, Jungsoo Hong, Hyegoo Lee, Youngil Moon, Wonchan Lee, Sehyun Kim, Taekyun Ha, Jae-Yoon Sim, Moonjoo Lee(参考訳) 本稿では,セグメントドブレード式リニアイオントラップの開発プロセスについて述べる。 アルミナ基板は、X線回折および損失タングエント測定により特徴づけられる。 ブレードはレーザー加工され研磨され、続いてスパッタリングと金めっきが行われる。 表面粗さは、電子と光学顕微鏡の両方を通して製造の各工程で調べられる。 金メッキされたファセットでは、イオン位置付近で数十ナノメートルの高さ偏差が得られる。 レーザー冷却した$^{174}$yb$^{+}$イオンのトラップ効果を示す。

We describe a complete development process of a segmented-blade linear ion trap. Alumina substrate is characterized with an X-ray diffraction and loss-tangent measurement. The blade is laser-micromachined and polished, followed by the sputtering and gold electroplating. Surface roughness is examined at each step of the fabrication via both electron and optical microscopies. On the gold-plated facet, we obtain a height deviation of tens of nanometers in the vicinity of the ion position. Trapping of laser-cooled $^{174}$Yb$^{+}$ ions is demonstrated.
翻訳日:2023-02-05 01:31:01 公開日:2022-12-26
# フェルミオン-量子ビット符号化を用いた線形光学系の量子回路シミュレーション

Quantum circuit simulation of linear optics using fermion to qubit encoding ( http://arxiv.org/abs/2209.00207v2 )

ライセンス: Link先を確認
Seungbeom Chin and Jaehee Kim and Joonsuk Huh(参考訳) 本研究では,ボソンの線形散乱過程に対するディジタル量子シミュレーションプロトコルを提案する。 本プロトコルは、boson-fermion対応関係とfermionとqubitエンコーディングプロトコルを組み合わせたものである。 概念実証として,香港・ウー・マンデルディップを生成する量子回路の設計を行った。 これらの回路はIBM QuantumとIonQクラウドサービスを用いて古典的および量子シミュレーションによって検証された。

This work proposes a digital quantum simulation protocol for the linear scattering process of bosons, which provides a simple extension to partially distinguishable boson cases. Our protocol is achieved by combining the boson-fermion correspondence relation and fermion to qubit encoding protocols. As a proof of concept, we designed quantum circuits for generating the Hong-Ou-Mandel dip by varying particle distinguishability. The circuits were verified with the classical and quantum simulations using the IBM Quantum and IonQ cloud services.
翻訳日:2023-01-28 06:45:36 公開日:2022-12-26
# 正方格子上の完全充填量子ループモデル:位相図とライダーバーグ原子への応用

Fully packed quantum loop model on the square lattice: phase diagram and application for Rydberg atoms ( http://arxiv.org/abs/2209.10728v3 )

ライセンス: Link先を確認
Xiaoxue Ran, Zheng Yan, Yan-Cheng Wang, Junchen Rong, Yang Qi, and Zi Yang Meng(参考訳) 量子二量体とループモデルは、これらの原始的制約系で現れる新しい相と相転移の基本的な重要性と、ブロック機構が局所的な制約を自然に強制するライドベルク原子配列における進行中の実験に対する親密な関係のために、大きな注目を集めている。 ここでは、全クラスタ量子モンテカルロ法を用いて、正方格子上の完全充填量子ループモデルの完全な基底状態位相図を示す。 強い二量体アトラクションを持つ格子ネマティック (LN) 相と強い二量体反発を持つスタガード相 (SP) の間には共鳴プラケット (RP) 相と非対角対称性の破れが存在する。 そのような新しい位相は、第一次遷移によってlnから分離され、有名なロクサー・キヴェルソン点によってspから分離される。 我々の再正規化群解析はモンテカルロシミュレーションの順序パラメータヒストグラムと完全に一致した異なる流れ方向を明らかにする。 Rydberg実験における位相図の実現と意味について提案する。

The quantum dimer and loop models attract great attentions, partially because the fundamental importance in the novel phases and phase transitions emerging in these prototypical constrained systems; and partially due to their intimate relevance towards the on-going experiments on Rydberg atom arrays in which the blockade mechanism naturally enforces the local constraint. Here we show, by means of the sweeping cluster quantum Monte Carlo method, the complete ground state phase diagram of the fully packed quantum loop model on the square lattice. We find between the lattice nematic (LN) phase with strong dimer attraction and the staggered phase (SP) with strong dimer repulsion, there emerges a resonating plaquette (RP) phase with off-diagonal translational symmetry breaking. Such a novel phase is separated from the LN via a first order transition and from the SP by the famous Rokhsar-Kivelson point. Our renormalization group analysis reveals the different flow directions, fully consistent with the order parameter histogram in Monte Carlo simulations. The realization and implication of our phase diagram in Rydberg experiments are proposed.
翻訳日:2023-01-25 18:15:14 公開日:2022-12-26
# UB3:Pure Exploration Unimodal Banditsによるミリ波システムにおけるベストビーム識別

UB3: Best Beam Identification in Millimeter Wave Systems via Pure Exploration Unimodal Bandits ( http://arxiv.org/abs/2301.03456v1 )

ライセンス: Link先を確認
Debamita Ghosh, Haseen Rahman, Manjesh K. Hanawal, and Nikola Zlatanov(参考訳) ミリ波(mmWave)通信は広帯域であり、5Gシステムで想定されるように、毎秒ギガビットのデータレートをサポートすることができる。 しかし、減衰損失に対する感受性のため長距離では使用できない。 5gネットワークでの使用を有効にするには、伝送エネルギーを鋭い鉛筆ビームに集中する必要がある。 送信機と受信機ビームのペア間の不一致がデータレートを大幅に低減できるため、可能な限り整列することが重要である。 最高の送受信ビームペアを見つけるために、最近のビームアライメント(ba)技術はビーム空間全体を検査し、結果として大量のba遅延が発生する可能性がある。 近年,受信信号強度やスループットで測定した累積報酬を最大化するビームを適応的に選択する手法が提案されている。 本稿では、受信したビームの信号強度の一様構造を利用して、純粋な探索手法を用いて、有限時間で最良のビームを識別するアルゴリズムを開発する。 固定時間スロット内の最良ビームを特定する戦略は、探索と搾取を継続的に行う累積報酬最大化戦略よりも無線ネットワークプロトコル設計に適している。 我々のアルゴリズムは、Unimodal Bandit for Best Beam (UB3) と名付けられ、数ラウンドで高い確率で最適なビームを識別する。 確率の誤差指数はビーム数に依存しないことを証明し、この場合はユニモーダルバンドイットの下限を確立することによって真に正しいことを示す。 UB3は広範囲なシミュレーションにより最先端のアルゴリズムよりも優れていることを示す。 さらに,本アルゴリズムは実装が簡単で,計算量も少ない。

Millimeter wave (mmWave) communications have a broad spectrum and can support data rates in the order of gigabits per second, as envisioned in 5G systems. However, they cannot be used for long distances due to their sensitivity to attenuation loss. To enable their use in the 5G network, it requires that the transmission energy be focused in sharp pencil beams. As any misalignment between the transmitter and receiver beam pair can reduce the data rate significantly, it is important that they are aligned as much as possible. To find the best transmit-receive beam pair, recent beam alignment (BA) techniques examine the entire beam space, which might result in a large amount of BA latency. Recent works propose to adaptively select the beams such that the cumulative reward measured in terms of received signal strength or throughput is maximized. In this paper, we develop an algorithm that exploits the unimodal structure of the received signal strengths of the beams to identify the best beam in a finite time using pure exploration strategies. Strategies that identify the best beam in a fixed time slot are more suitable for wireless network protocol design than cumulative reward maximization strategies that continuously perform exploration and exploitation. Our algorithm is named Unimodal Bandit for Best Beam (UB3) and identifies the best beam with a high probability in a few rounds. We prove that the error exponent in the probability does not depend on the number of beams and show that this is indeed the case by establishing a lower bound for the unimodal bandits. We demonstrate that UB3 outperforms the state-of-the-art algorithms through extensive simulations. Moreover, our algorithm is simple to implement and has lower computational complexity.
翻訳日:2023-01-15 23:05:45 公開日:2022-12-26
# 熱浴中における過酸化水素正イオンの定性モデル

Qualitative model of a positive hydrogen peroxide ion in a thermal bath ( http://arxiv.org/abs/2212.10662v2 )

ライセンス: Link先を確認
Chen Ran, Yuri Ozhigov, You Jiangchuan(参考訳) 単一モードの光学キャビティ内の酸素と水素を1つの価電子で結合し、熱浴に浸漬する一対の原子について定性モデルを提案した。 電子と空洞場の相互作用は核の状態に依存し、熱浴のフォノンモードの温度によって決定される。 このような系の量子力学のコンピュータシミュレーションは、安定な分子イオンと分離された中性酸素原子と正の水素イオンの両方の形成の安定な性質を示している。

A qualitative model is proposed for a pair of atoms: oxygen and hydrogen in a single-mode optical cavity, bound by one valence electron and immersed in a thermal bath. The interaction of an electron with the cavity field depends on the state of the nuclei, which, in turn, is determined by the temperature of the phonon mode of the thermal bath. Computer simulation of the quantum dynamics of such a system shows the stable nature of the formation of both a stable molecular ion and a separate neutral oxygen atom and a positive hydrogen ion.
翻訳日:2023-01-09 08:20:18 公開日:2022-12-26
# 量子物理学は新しく 驚くべき展開をしました

Quantum Physics has a New, and Remarkable, Expansion ( http://arxiv.org/abs/2212.12434v2 )

ライセンス: Link先を確認
John R. Klauder(参考訳) 正準量子化は我々に素晴らしいことを教えてくれた。 一般的な例としては、弦でボールを前後に振るような高調波発振器がある。 しかし、半高調波発振器は、ボールを底でブロックし、すぐに後方に跳ね返る。 この2番目のモデルは正準量子化では正しく解けない。 現在では、アフィン量子化と呼ばれる量子化の拡張があり、ハーフハーモニック発振器を正しく解き、場理論や重力にまで達する多くの問題に対して正しい解を与えることができる。 本論文は,アフィンの量子化と,それが何であり,何ができるかを紹介するために設計されている。

Canonical quantization has taught us great things. A common example is that of the harmonic oscillator, which is like swinging a ball on a string back and forth. However, the half-harmonic oscillator blocks the ball at the bottom and then it quickly bounces backwards. This second model cannot be correctly solved using canonical quantization. Now, there is an expansion of quantization, called affine quantization, that can correctly solve the half-harmonic oscillator, and offers correct solutions to a grand collection of other problems, which even reaches to field theory and gravity. This paper has been designed to introduce affine quantization; what it is, and what it can do.
翻訳日:2023-01-09 05:18:46 公開日:2022-12-26
# 量子参照自然放射トモグラフィ

Quantum-Referenced Spontaneous Emission Tomography ( http://arxiv.org/abs/2212.12521v2 )

ライセンス: Link先を確認
I. I. Faruque, B. M. Burridge, M. Borghi, J. G. Rarity, and J. Barreto(参考訳) そこで本研究では,主に非文字化された「ターゲット」源から発する自発光子対の結合スペクトル位相(JSP)を測定するトモグラフィー法を提案する。 対象源と基準源との量子干渉を用いて4つのスペクトル分解測定値でjspを抽出し、q-spet(quantum-referenced spontaneous emission tomography)と呼ぶ。 本手法をマイクロリング共振器光子対光源用フォトニック集積回路上で実証した。 その結果, マイクロリング共振器から自然発振する光子対は, 励起励起放射とは大きく異なり, 光源の詳細な知識のない古典的励起励起放射トモグラフィーでは, 一般的には十分に特徴付けることができないことがわかった。

We present a method of tomography that measures the joint spectral phase (JSP) of spontaneously emitted photon pairs originating from a largely uncharacterized ``target" source. We use quantum interference between our target source and a reference source to extract the JSP with four spectrally resolved measurements, in a process that we call quantum-referenced spontaneous emission tomography (Q-SpET). We have demonstrated this method on a photonic integrated circuit for a target micro-ring resonator photon-pair source. Our results show that spontaneously emitted photon pairs from a micro-ring resonator are distinctively different from that of stimulated emission, and thus cannot in general be fully characterized using classical stimulated emission tomography without detailed knowledge of the source.
翻訳日:2023-01-09 05:17:33 公開日:2022-12-26
# 完全正の発振子型量子井戸ポテンシャルを持つ位置依存質量schr\"odinger方程式の厳密解

Exact solution of the position-dependent mass Schr\"odinger equation with the completely positive oscillator-shaped quantum well potential ( http://arxiv.org/abs/2212.13062v1 )

ライセンス: Link先を確認
E.I. Jafarov and S.M. Nagiyev(参考訳) 完全正の振動子型量子井戸の2つの完全可解な閉じ込めモデルを提案する。 提案した量子井戸ポテンシャルに対応する位置依存質量Schr\"オーディンガー方程式の厳密解を示す。 両モデルの離散エネルギースペクトル表現は、ある正の閉じ込めパラメータに依存することが示されている。 スペクトルは、無限に高い壁のみに閉じ込められたモデルに対して正の同値な振る舞いを示し、両面から無限に高い壁に閉じ込められたモデルに対して非等価な振る舞いを示す。 建設中のモデルの定常状態の波動関数はラゲール多項式とヤコビ多項式を通して表される。 一般に、波動関数に現れるヤコビ多項式はパラメータ$a$と$b$に依存するが、ラゲール多項式はパラメータ$a$にのみ依存する。 構築したモデルの限界と特別な場合について議論する。

Two exactly-solvable confined models of the completely positive oscillator-shaped quantum well are proposed. Exact solutions of the position-dependent mass Schr\"odinger equation corresponding to the proposed quantum well potentials are presented. It is shown that the discrete energy spectrum expressions of both models depend on certain positive confinement parameters. The spectrum exhibits positive equidistant behavior for the model confined only with one infinitely high wall and non-equidistant behavior for the model confined with the infinitely high wall from both sides. Wavefunctions of the stationary states of the models under construction are expressed through the Laguerre and Jacobi polynomials. In general, the Jacobi polynomials appearing in wavefunctions depend on parameters $a$ and $b$, but the Laguerre polynomials depend only on the parameter $a$. Some limits and special cases of the constructed models are discussed.
翻訳日:2023-01-09 03:29:19 公開日:2022-12-26
# デコヒーレンス率を持つ散逸ランドウ・ツェナー遷移

Dissipative Landau-Zener transition with decoherence rate ( http://arxiv.org/abs/2212.13093v1 )

ライセンス: Link先を確認
Le Tuan Anh Ho, Liviu Ungur, Liviu F. Chibotaru(参考訳) 最小のパラメータを持つ革新的な微視的モデル:トンネル分割ギャップ、外部磁場掃討速度、デコヒーレンスレートは、デコヒーレンスの存在下での散逸ランドウ-ゼナー遷移のダイナミクスを記述するために用いられる。 極限の場合、導出運動方程式は有名なランダウ・ツェナーの公式とカヤヌマ公式をもたらす。 一般的な場合、この記述は、他のモデルでも見られるスイーピング速度に関する非単調な反転確率を示す。 この非単調性は、量子トンネル、交差周期、デコヒーレンス過程の競合と時間スケールを考慮することで説明できる。 この理論の単純さと堅牢性はランダウ・ツェナー転移の実践的で斬新な記述を提供する。 さらに、関連する量子系の効果的なデコヒーレンス速度を測定するために、電子常磁性共鳴に代わる方法を約束している。

An innovative microscopic model with a minimal number of parameters: tunneling splitting gap, external field sweeping velocity, and decoherence rate is used to describe dynamics of the dissipative Landau-Zener transition in the presence of the decoherence. In limiting cases, the derived equation of motion gives rise to the well-known Landau-Zener and Kayanuma formula. In a general case, the description demonstrates a non-monotonic flipping probability with respect to the sweeping velocity, which is also found in some other models. This non-monotony can be explained by considering the competition and timescale of the quantum tunneling, crossing period, and decoherence process. The simplicity and robustness of the theory offer a practical and novel description of the Landau-Zener transition. In addition, it promises an alternative method to the electron paramagnetic resonance in measuring the effective decoherence rate of relevant quantum systems.
翻訳日:2023-01-09 03:29:04 公開日:2022-12-26
# 空間調整計測専用回路における創発対称性保護位相

Emergence symmetry protected topological phase in spatially tuned measurement-only circuit ( http://arxiv.org/abs/2212.13142v1 )

ライセンス: Link先を確認
Yoshihito Kuno, Ikuo Ichinose(参考訳) 空間調整単点測定による位相位相遷移を計測専用回路で測定し、3種類の射影測定演算子について検討した。 3つの測定演算子間の特定の空間設定と可換関係の組み合わせは、そのような遷移を生成する。 実際には、対称保護トポロジカル位相(SPT)位相は、奇部分格子上の別の空間的に調整された射影測定を施すことにより、SPTを乱す射影測定を除去することにより、たとえ部分格子上でも復元される。 さらに, 相転移の臨界特性について検討し, 2次元パーコレーション遷移と同じ臨界指数を持つことを示した。

Topological phase transition induced by spatially-tuned single-site measurement is investigated in a measurement-only circuit, in which three different types of projective measurement operator. Specific spatial setting and combination of commutation relations among three measurement operators generate such a transition. In practice, symmetry protected topological (SPT) phase is recovered on even sublattice by eliminating a projective measurement disturbing the SPT via applying another spatially-tuned projective measurement on odd sublattice. We further investigate the critical properties of the phase transition and find that it has the same critical exponents with the two-dimensional percolation transition.
翻訳日:2023-01-09 03:28:46 公開日:2022-12-26
# 拡大の線形代数的概念について

On linear-algebraic notions of expansion ( http://arxiv.org/abs/2212.13154v1 )

ライセンス: Link先を確認
Yinan Li, Youming Qiao, Avi Wigderson, Yuval Wigderson, Chuanqi Zhang(参考訳) 有界次グラフ展開に関する基本的な事実は、頂点展開、エッジ展開、スペクトル拡大の3つの概念がすべて同値であるということである。 本稿では,展開の線形代数的概念に対して,そのような言明がどの程度真であるかを考察する。 線形代数展開のよく研究されている概念は、次元展開(グラフ頂点展開の類似で定義される)と量子展開(グラフスペクトル展開の類似で定義される)である。 ルボツキーとゼルマノフは後者が前者を意味することを証明した。 逆は偽であり、量子展開器ではない次元展開器が存在することを証明している。 さらに、この非対称性はグラフエッジ展開の2つの異なる線形代数的類似が存在するという事実によって説明される。 ひとつは量子エッジ展開であり、hastingsによって導入され、量子拡張と同値であることが証明された。 我々は、次元拡大と同値であることが証明され、量子エッジ拡大によって暗示される新しい概念「次元エッジ展開」を導入する。 したがって、上記の分離はより細かいものである:次元のエッジ展開は量子のエッジ展開よりも厳密に弱い。 この新たな概念は、量子膨張器が次元拡大器であるという新しいモジュラーなルボツキー-ゼルマノフの証明にも繋がる。

A fundamental fact about bounded-degree graph expanders is that three notions of expansion -- vertex expansion, edge expansion, and spectral expansion -- are all equivalent. In this paper, we study to what extent such a statement is true for linear-algebraic notions of expansion. There are two well-studied notions of linear-algebraic expansion, namely dimension expansion (defined in analogy to graph vertex expansion) and quantum expansion (defined in analogy to graph spectral expansion). Lubotzky and Zelmanov proved that the latter implies the former. We prove that the converse is false: there are dimension expanders which are not quantum expanders. Moreover, this asymmetry is explained by the fact that there are two distinct linear-algebraic analogues of graph edge expansion. The first of these is quantum edge expansion, which was introduced by Hastings, and which he proved to be equivalent to quantum expansion. We introduce a new notion, termed dimension edge expansion, which we prove is equivalent to dimension expansion and which is implied by quantum edge expansion. Thus, the separation above is implied by a finer one: dimension edge expansion is strictly weaker than quantum edge expansion. This new notion also leads to a new, more modular proof of the Lubotzky--Zelmanov result that quantum expanders are dimension expanders.
翻訳日:2023-01-09 03:28:33 公開日:2022-12-26
# 有限温度におけるpsedo-hermitianハミルトニアン

Psedo-hermitian Hamiltonians at finite temperature ( http://arxiv.org/abs/2212.13173v1 )

ライセンス: Link先を確認
Romina Ram\'irez and Marta Reboiro(参考訳) 二重グリーン関数形式主義は、与えられた自己随伴ハミルトニアンの作用の下で時間的に進化した量子系の熱力学を扱うために広く用いられている。 本研究では、形式論を擬エルミート的ハミルトニアンを含むように拡張する。 我々は、PT対称性スワンソンハミルトニアンを、PT対称性スワンソン対称性相とPT対称性相の両方において有限温度で研究するために形式主義を適用する。 周期的相互作用によって摂動する系の挙動を,まずは一定温度で平衡状態にある系の挙動を解析する。

The Double Green Function Formalism has been extensively used in dealing with the thermodynamics of quantum systems which evolved in time under the action of a given self-adjoint Hamiltonian. In this work, we extend the formalism to include pseudo-hermitian Hamiltonians. We apply the formalism to study the PT-symmetry Swanson Hamiltonian at finite temperature, both in the PT-unbroken and in the PT-broken symmetry phase. We analyse the behaviour of the system, which is initially at equilibrium at a given temperature, when it is perturbed by a periodic interaction.
翻訳日:2023-01-09 03:28:13 公開日:2022-12-26
# 行列積再正規化グループ:ポテンシャル普遍量子多体解法

Matrix Product Renormalization Group: Potential Universal Quantum Many-Body Solver ( http://arxiv.org/abs/2212.13267v1 )

ライセンス: Link先を確認
Masahiko G. Yamada, Takumi Sanno, Masahiro O. Takahashi, Yutaka Akagi, Hidemaro Suwa, Satoshi Fujimoto, Masafumi Udagawa(参考訳) 密度行列再正規化群 (DMRG) は1次元量子多体系の基底状態を非常に効率的に計算するテンソルネットワークアルゴリズムである。 本稿では,行列積再正規化群 (mprg) と呼ばれる連続テンソルネットワークアルゴリズムの定式化の改良を提案する。 MPRGは普遍的な量子多体解法であり、ゼロ温度と有限温度の両方で2次元と高次元で動作する可能性があり、開量子系にも適用できる。 さらに、MPRGはいかなる変分原理にも依存せず、したがって任意の次元における任意の種類の非エルミート系をサポートする。 実演として,yang-leeエッジ特異点の臨界特性を代表的非エルミート系として一次元で示す。

The density matrix renormalization group (DMRG) is a celebrated tensor network algorithm, which computes the ground states of one-dimensional quantum many-body systems very efficiently. Here we propose an improved formulation of continuous tensor network algorithms, which we name a matrix product renormalization group (MPRG). MPRG is a universal quantum many-body solver, which potentially works at both zero and finite temperatures, in two and higher dimensions, and is even applicable to open quantum systems. Furthermore, MPRG does not rely on any variational principles and thus supports any kind of non-Hermitian systems in any dimension. As a demonstration, we present critical properties of the Yang-Lee edge singularity in one dimension as a representative non-Hermitian system.
翻訳日:2023-01-09 03:27:35 公開日:2022-12-26
# 量子アンサンブルと統計演算子:チュートリアル

Quantum ensembles and the statistical operator: a tutorial ( http://arxiv.org/abs/2212.13027v1 )

ライセンス: Link先を確認
Yinxi\`u Zhan and Matteo G. A. Paris(参考訳) このチュートリアルの主な目的は、量子力学における状態のアンサンブルによって何を意味するべきかの詳細を解明し、正確には2つの異なるアンサンブルを区別する問題に適切に対処することである。 本研究の目的は,量子アンサンブルの概念と定義,および量子力学における統計演算子の概念との関係を概観することである。 量子アンサンブルと対応する単粒子統計演算子の対応を導入する際の暗黙の仮定を指摘し、これらの仮定が満たされない場合に生じる問題について議論する。 我々は、明らかにパラドックスにつながる微妙な性質を概説し、近似量子クローニングの役割を解説する。 特に、量子系の異なる(しかし等価な)構成、すなわち同一の単粒子統計演算子に対応する異なるアンサンブルが、多粒子相関をうまく利用し、あるいはアンサンブル内の粒子数に関する事前知識をうまく識別できるような、実用的関心のいくつかの例を考察する。

The main purpose of this tutorial is to elucidate in details what should be meant by ensemble of states in quantum mechanics, and to properly address the problem of discriminating, exactly or approximately, two different ensembles. To this aim, we review the notion and the definition of quantum ensemble as well as its relationships with the concept of statistical operator in quantum mechanics. We point out the implicit assumptions contained in introducing a correspondence between quantum ensembles and the corresponding single-particle statistical operator, and discuss some issues arising when these assumptions are not satisfied. We review some subtleties leading to apparent paradoxes, and illustrate the role of approximate quantum cloning. In particular, we review some examples of practical interest where different (but equivalent) preparations of a quantum system, i.e. different ensembles corresponding to the same single-particle statistical operator, may be successfully discriminated exploiting multiparticle correlations, or some a priori knowledge about the number of particles in the ensemble.
翻訳日:2023-01-09 03:17:59 公開日:2022-12-26
# 秘密鍵レートの明示的上下境界を持つ量子鍵分布の新しいプロトコル

New protocols for quantum key distribution with explicit upper and lower bound on secret-key rate ( http://arxiv.org/abs/2212.13089v1 )

ライセンス: Link先を確認
Arindam Dutta and Anirban Pathak(参考訳) ここでは、量子鍵分布(qkd)のための2つの新しいスキームを提案する。 したがって、提案プロトコルは商業的に利用可能な現実的な単一光子源を用いて実装することができる。 これらのスキームは、複数の攻撃(例えば、インターセプト再送攻撃と集団攻撃のクラス)に対して安全であることが示されている。 キーレートのバウンドが得られ、ある種類の古典的前処理を適用することにより、許容誤差の限界を増大させることができる。 使用する量子リソースとeveで明らかにされる情報とのトレードオフが観察され、より少ない量の量子リソースを使用する同じファミリーのプロトコルよりも、より効率のよいプロトコルを設計することが可能であることが示されている。 具体的には、SARG04プロトコルは、同じ家族のプロトコルであり、提案プロトコルは、より多くの量子リソースを消費するコストにおいて、SARG04よりも高い効率を提供できることを示す。

Here we present two new schemes for quantum key distribution (QKD) which neither require entanglement nor require an ideal single photon source. Thus, the proposed protocols can be implemented using realistic single photon sources which are commercially available. The schemes are shown to be secure against multiple attacks (e.g., intercept resend attack and a class of collective attacks). Bounds on the key rate are obtained and it is shown that by applying a certain type of classical pre-processing, the tolerable error limit can be increased. A trade-off between quantum resources used and information revealed to Eve is observed and it's shown that by using slightly more quantum resources it's possible to design protocols having higher efficiency compared to a protocol of the same family that uses a relatively lesser amount of quantum resources. Specifically, in our case, SARG04 protocol is a protocol of the same family and it's clearly shown that the proposed protocols can provide higher efficiency compared to SARG04 at the cost of consumption of more quantum resources.
翻訳日:2023-01-09 02:52:43 公開日:2022-12-26
# 特集「パイロット波とその先:louis de broglie and david bohm's quest for a quantum ontology」の編集にあたって

Forewords for the special issue `Pilot-wave and beyond: Louis de Broglie and David Bohm's quest for a quantum ontology' ( http://arxiv.org/abs/2212.13186v1 )

ライセンス: Link先を確認
Aur\'elien Drezet(参考訳) この二重誕生日を祝うために、雑誌「ファウンデーションズ・オブ・物理」は、ルイ・ド・ブロイとデイヴィッド・ボームの量子基礎に関する先駆的な研究に続く発展に関するトピック集「パイロ・ウェーブ・アンド・ザ・エゴ」を出版している。 このトピックコレクションには、量子力学の解釈と理解に関するボームとド・ブロイの科学的遺産について議論する物理学者や哲学者からの貢献が含まれている。 これらの序文では、ド・ブロイとボームが量子力学の解釈をどのように発展させたかを説明する歴史的文脈を概観する。 この2つの偉大な思想家との関係をさらに分析し、物理学への存在論的アプローチにおける複数の協力者や継続者の役割を強調する。

In order to celebrate this double birthday the journal Foundations of Physics publishes a topical collection `Pilot-wave and beyond' on the developments that have followed the pioneering works of Louis de Broglie and David Bohm on quantum foundations. This topical collection includes contributions from physicists and philosophers debating around the world about the scientific legacy of Bohm and de Broglie concerning the interpretation and understanding of quantum mechanics. In these forewords we give a general review of the historical context explaining how de Broglie and Bohm developed their interpretations of quantum mechanics. We further analyze the relationship between these two great thinkers and emphasize the role of several collaborators and continuators of their ontological approach to physics.
翻訳日:2023-01-09 02:52:24 公開日:2022-12-26
# ナノエンジニアリングシリコンデバイスにおけるプログラム可能な周波数ビン量子状態

Programmable frequency-bin quantum states in a nano-engineered silicon device ( http://arxiv.org/abs/2212.13191v1 )

ライセンス: Link先を確認
Marco Clementi, Federico A. Sabattoli, Massimo Borghi, Laur\`ene Youssef, Linda Gianini, Nicola Bergamasco, Houssein El Dirani, Noemi Tagliavacche, Camille Petit-Etienne, Erwine Pargon, John E. Sipe, Marco Liscidini, Corrado Sciancalepore, Matteo Galli, Daniele Bajoni(参考訳) 光量子ビットは、実用的な用途のために光ネットワークを介して伝送される場合、オンチップとノイズ耐性を制御可能であるべきである。 さらに、量子ビットソースはプログラム可能で、量子アルゴリズムに有用な輝度を持ち、損失に対するレジリエンスを与える必要がある。 しかし、広範な符号化スキームはこれらの性質のほとんど2つを結合するだけである。 そこで本研究では,光リンク上の長距離伝送と互換性のある符号化方式である周波数ビン絡み光子を生成するプログラム可能なシリコンナノフォトニックチップの実証により,このハードルを克服した。 放出された量子状態は、シリコンフォトニクスに統合可能なアクティブデバイスを含む既存の通信コンポーネントを使って操作できる。 実演として、2量子系の4つの計算基底状態と4つの最大絡み合うベル状態を生成するために、我々のチップをプログラムできることを示す。 当社のデバイスは、オンチップ状態再構成と密結合のキー・プロパティをすべて組み合わせ、高輝度、忠実度、純度を確保します。

Photonic qubits should be controllable on-chip and noise-tolerant when transmitted over optical networks for practical applications. Furthermore, qubit sources should be programmable and have high brightness to be useful for quantum algorithms and grant resilience to losses. However, widespread encoding schemes only combine at most two of these properties. Here, we overcome this hurdle by demonstrating a programmable silicon nano-photonic chip generating frequency-bin entangled photons, an encoding scheme compatible with long-range transmission over optical links. The emitted quantum states can be manipulated using existing telecommunication components, including active devices that can be integrated in silicon photonics. As a demonstration, we show our chip can be programmed to generate the four computational basis states, and the four maximally-entangled Bell states, of a two-qubits system. Our device combines all the key-properties of on-chip state reconfigurability and dense integration, while ensuring high brightness, fidelity, and purity.
翻訳日:2023-01-09 02:52:07 公開日:2022-12-26
# チャープパルスを用いた半導体量子ドット-金属ナノ粒子複合構造における高効率励起子生成

Efficient exciton generation in a semiconductor quantum dot-metal nanoparticle composite structure using conventional chirped pulses ( http://arxiv.org/abs/2212.13204v1 )

ライセンス: Link先を確認
Dionisis Stefanatos, Athanasios Smponias, Ioannis Thanopulos, Emmanuel Paspalakis(参考訳) 金属ナノ粒子に結合した半導体量子ドットからなるナノ構造を考察し、従来のガウス型および双曲型セカンタンエンベロープを用いたチャープパルスを用いて、小さな粒子間距離でも量子ドットの励起状態が基底状態から頑健に生成できることを数値シミュレーションにより示す。 適用パルスのチャープ符号に関する最後のエクシトン集団で観測された非対称性は、この系を記述する非線形密度行列方程式を用いて説明され、量子ドット中の励起子と金属ナノ粒子中のプラズモンとの相互作用から生じるパラメータの実際の部分に起因する。 実験室で容易に実装できる従来のチャープパルスの単純さにより、提案された堅牢な量子制御スキームは超高速ナノスイッチの実装や半導体量子ドットを用いた量子情報処理タスクに有用である可能性がある。

We consider a nanostructure consisting of a semiconductor quantum dot coupled to a metal nanoparticle, and show with numerical simulations that the exciton state of the quantum dot can be robustly generated from the ground state even for small interparticle distances, using conventional chirped pulses with Gaussian and hyperbolic secant envelopes. The asymmetry observed in the final exciton population with respect to the chirp sign of the applied pulses is explained using the nonlinear density matrix equations describing the system, and is attributed to the real part of the parameter emerging from the interaction between excitons in the quantum dot and plasmons in the metal nanoparticle. The simplicity of the conventional chirped pulses, which can also be easily implemented in the laboratory, make the proposed robust quantum control scheme potentially useful for the implementation of ultrafast nanoswitches and quantum information processing tasks with semiconductor quantum dots.
翻訳日:2023-01-09 02:51:49 公開日:2022-12-26
# 中間励起状態の崩壊率が大きい閉じた$\Lambda$-systemに対する光ポンピングの最適性について

On the optimality of optical pumping for a closed $\Lambda$-system with large decay rates of the intermediate excited state ( http://arxiv.org/abs/2212.13212v1 )

ライセンス: Link先を確認
Dionisis Stefanatos and Emmanuel Paspalakis(参考訳) 最適制御理論を用いて、励起中間準位が共通の大きな速度で低レベルに崩壊する閉じた$\lambda$-システムに対して、低レベル間の人口移動の最適スキームは実際には光ポンピングであることを示す。 この結果を得るために,大減衰率を利用して弱結合励起状態を排除し,暗い状態と明るい状態からなる基底への変換を行い,最終的にこの変換系に最適制御を適用する。 次に, 数値的最適制御により, 初期閉値$\lambda$-system に対する光ポンピングスキームの最適性を確認した。 また, 対象状態に対する減衰率が初期状態よりも大きい場合や, 2つの速度が互いに大きく異なる場合, 光ポンピングが最適であることを示す。 本研究は,このようなシステムが遭遇する量子情報処理の様々なタスクに応用されることが期待される。

We use optimal control theory to show that for a closed $\Lambda$-system where the excited intermediate level decays to the lower levels with a common large rate, the optimal scheme for population transfer between the lower levels is actually optical pumping. In order to obtain this result we exploit the large decay rate to eliminate adiabatically the weakly coupled excited state, then perform a transformation to the basis comprised of the dark and bright states, and finally apply optimal control to this transformed system. Subsequently, we confirm the optimality of the optical pumping scheme for the original closed $\Lambda$-system using numerical optimal control. We also demonstrate numerically that optical pumping remains optimal when the decay rate to the target state is larger than that to the initial state or the two rates are not very different from each other. The present work is expected to find application in various tasks of quantum information processing, where such systems are encountered.
翻訳日:2023-01-09 02:51:31 公開日:2022-12-26
# 渦ビームによる単層遷移金属ジカルコゲナイド中の暗い励起子の形成:光学的選択規則

Formation of dark excitons in monolayer transition metal dichalcogenides by a vortex beam: optical selection rules ( http://arxiv.org/abs/2212.13240v1 )

ライセンス: Link先を確認
Omadillo Abdurazakov, Chunqiang Li, Yun-Pil Shim(参考訳) 単層遷移金属ジアルコゲナイドは、室温でも光電子反応を支配的な励起子を強く結合する。 光線は、これらの物質を偏光(しばしば光のスピン角運動量と呼ばれる)で研究するのによく使われ、励起励起状態のメカニズムを提供する。 しかし、光線は位相前方のヘリカル構造を作ることで軌道角運動量を運ぶことができる。 本研究では, スピン角運動量に加えて軌道角運動量を有するラゲール・ガウシアンビームを考察し, 単層遷移金属ジカルコゲナイド中の励起子を生成する。 我々は、対称性の引数を用いて様々な励起子級数への許容遷移を制御する光学選択規則を導出する。 我々の対称性の考察は、これらの高次光ビームを用いて暗黒励起子を生成できることを示し、量子情報処理と記憶においてそれらを活用する可能性を秘めている。

Monolayer transition metal dichalcogenides host tightly-bound excitons, which dominate their optoelectronic response even at room temperatures. Light beams are often used to study these materials with the polarization - often termed as the spin angular momentum of the light - providing the mechanism for exciting excitonic states. Light beams, however, can also carry an orbital angular momentum by creating helical structures of their phase front. In this work, we consider a Laguerre-Gaussian beam possessing an orbital angular momentum in addition to the spin angular momentum to create excitons in monolayer transition metal dichalcogenides. We derive optical selection rules that govern the allowed transitions to various exciton series using symmetry arguments. Our symmetry considerations show that we can create dark excitons using these high-order optical beams opening up new avenues for creating long-lived dark excitons with the potential of exploiting them in quantum information processing and storage.
翻訳日:2023-01-09 02:51:14 公開日:2022-12-26
# ダイナミクスによる多粒子絡み合いによるトポロジカル量子相転移の予測

Predicting Topological Quantum Phase Transition via Multipartite Entanglement from Dynamics ( http://arxiv.org/abs/2212.13252v1 )

ライセンス: Link先を確認
Leela Ganesh Chandra Lakkaraju, Sudip Kumar Haldar, Aditi Sen De(参考訳) 2次元正方格子内の正確に解けるキタエフモデルは、0温度での対称性破れ遷移とは異なる位相量子相転移を示す。 初期状態と異なる摂動強度を持つ非線形摂動北エフモデルの基底状態が純粋な北エフモデルに焼成されると、ロシミトエコーや時間平均多部絡みといった動的状態の様々な特徴が、初期状態が位相相であるか否かを判断できることを示した。 さらに、量子化器の微分は、平衡に存在する位相量子相転移を忠実に識別することができる。 格子の個々の量子ビットが局所熱浴と反復的に相互作用すると、ブロックの絡み合いはシステムが進化を始める相を区別することができる。

An exactly solvable Kitaev model in a two-dimensional square lattice exhibits a topological quantum phase transition which is different from the symmetry-breaking transition at zero temperature. When the ground state of a non-linearly perturbed Kitaev model with different strengths of perturbation taken as the initial state is quenched to a pure Kitaev model, we demonstrate that various features of the dynamical state, such as Loschmidt echo, time-averaged multipartite entanglement, can determine whether the initial state belongs to the topological phase or not. Moreover, the derivatives of the quantifiers can faithfully identify the topological quantum phase transition, present in equilibrium. When the individual qubits of the lattice interact with the local thermal bath repeatedly, we observe that block entanglement can nevertheless distinguish the phases from which the system starts evolution.
翻訳日:2023-01-09 02:50:58 公開日:2022-12-26
# 量子情報プロトコルにおける相対論的場の量子自由度の役割

The role of quantum degrees of freedom of relativistic fields in quantum information protocols ( http://arxiv.org/abs/2212.13262v1 )

ライセンス: Link先を確認
T. Rick Perche and Eduardo Mart\'in-Mart\'inez(参考訳) 我々は、相対論的量子情報プロトコルにおける量子自由度と相対論的場の違いを分析する。 相互作用する量子系の現象論を説明するために、量子自由度の存在が不可欠である体制を分類する。 また、相対論的量子情報プロトコルにおいて、量子場が量子制御された古典場によってよく近似できる正確な状態を特定する。 この結果は、古典的および量子場理論において、どの特徴が根本的に異なるかを明らかにするのに有用である。

We analyze the differences between relativistic fields with or without quantum degrees of freedom in relativistic quantum information protocols. We classify the regimes where the existence of quantum degrees of freedom is necessary to explain the phenomenology of interacting quantum systems. We also identify the precise regimes where quantum fields can be well approximated by quantum-controlled classical fields in relativistic quantum information protocols. Our results can be useful to discern which features are fundamentally different in classical and quantum field theory.
翻訳日:2023-01-09 02:50:42 公開日:2022-12-26
# 量子蝶前線での進行不連続性

Traveling discontinuity at the quantum butterfly front ( http://arxiv.org/abs/2212.13265v1 )

ライセンス: Link先を確認
Camille Aron, Eric Brunet, Aditi Mitra(参考訳) 超伝導相転移近傍の相互作用電子のパラダイムモデルを用いて,量子情報の運動論的理論を定式化する。 総体次元に広がる情報のダイナミクスを効果的に制御する連結偏微分方程式の組を慎重に導出する。 彼らは光円錐の境界で不連続な進行波解を示し、その溶液が光円錐の外側にこぼれないように完全に因果構造を持つ。

We formulate a kinetic theory of quantum information scrambling in the context of a paradigmatic model of interacting electrons in the vicinity of a superconducting phase transition. We carefully derive a set of coupled partial differential equations that effectively govern the dynamics of information spreading in generic dimensions. They exhibit traveling wave solutions that are discontinuous at the boundary of the light cone, and have a perfectly causal structure where the solutions do not spill outside of the light cone.
翻訳日:2023-01-09 02:50:34 公開日:2022-12-26
# 本質的に相互作用する高次トポロジカル超伝導体

Intrinsically Interacting Higher-Order Topological Superconductors ( http://arxiv.org/abs/2212.13013v1 )

ライセンス: Link先を確認
Hao-Ran Zhang, Jian-Hao Zhang, Zheng-Cheng Gu, Rui-Xing Zhang, Shuo Yang(参考訳) 自由フェルミオン実現のない2次元クラスD高次超伝導体に対する最小相互作用格子モデルを提案する。 Lieb-Schultz-Mattis型制約を提案し,格子モデル構築のガイドに応用した。 このモデルは弱相互作用状態において自明な積基底状態を示し、電子相関を増加させることで、新しい位相的量子相転移をd_4$-symmetric high-order topological superconducting stateに導く。 対称保護マヨナコーナーモードは行列積状態法で数値的に確認される。 我々の理論は、明示的な格子モデル構築と相関する高階位相の研究方法である。

We propose a minimal interacting lattice model for two-dimensional class-D higher-order topological superconductors with no free-fermion realization. A Lieb-Schultz-Mattis-type constraint has been proposed and applied to guide our lattice model construction. Our model exhibits a trivial product ground state in the weakly interacting regime while increasing electron correlations provoke a novel topological quantum phase transition to a $D_4$-symmetric higher-order topological superconducting state. The symmetry-protected Majorana corner modes are numerically confirmed with the matrix-product-state technique. Our theory paves the way for studying correlated higher-order topology with explicit lattice model constructions.
翻訳日:2023-01-09 02:41:44 公開日:2022-12-26
# 線形配置を超えた1次元秩序原子鎖における集合状態の光制御

Optical control of collective states in 1D ordered atomic chains beyond the linear regime ( http://arxiv.org/abs/2212.13022v1 )

ライセンス: Link先を確認
Nikos Fayard, Igor Ferrier-Barbut, Antoine Browaeys and Jean-Jacques Greffet(参考訳) 効率的な原子-光子界面を開発する必要性により、近年の取り組みは、サブラジアントまたは超ラジカル集合状態をサポートすることのできる大きな冷原子配列によるキャビティの置換を提案している。 実際には、亜ラジアント状態は放射から分離され、ほとんどの用途にとってハードルとなる。 本研究では,v字型構成でn個の3レベル原子からなる1次元(1次元)鎖を用いて,この限界をバイパスするプロトコルを理論的に検討する。 プロトコル全体を通して、チェーンは時変メタマテリアルとして振る舞う:スペクトル的に空間的に制御されたモードで吸収、貯蔵、オンデマンドの放出を可能にする。 原子の量子的性質を考慮に入れると、リニアレジームと非線形レジームの境界が確立される。

Driven by the need to develop efficient atom-photon interfaces, recent efforts have proposed replacing cavities by large arrays of cold atoms that can support subradiant or superradiant collective states. In practice, subradiant states are decoupled from radiation, which constitutes a hurdle to most applications. In this work, we study theoretically a protocol that bypasses this limit using a one dimensional (1D) chain composed of N three-level atoms in a V-shaped configuration. Throughout the protocol, the chain behaves as a time-varying metamaterial: enabling absorption, storage and on-demand emission in a spectrally and spatially controlled mode. Taking into account the quantum nature of atoms, we establish the boundary between the linear regime and the nonlinear regime where singly and doubly excited subradiant states compete in the instantaneous decay rate during the storage
翻訳日:2023-01-09 02:41:36 公開日:2022-12-26
# 量子気象学における一般化条件予測の操作意味

Operational meaning of a generalized conditional expectation in quantum metrology ( http://arxiv.org/abs/2212.13162v1 )

ライセンス: Link先を確認
Mankei Tsang(参考訳) 量子力学に対する一般化条件付き期待(gce)の統一的形式論が最近浮上しているが、量子観測可能性の遡及に関する物理的意義は議論を呼んでいる。 この論争に対処するために、ベイズ量子パラメータ推定の文脈において、実弱値が特別な場合である GCE のバージョンの運用的意味を提供する。 量子センサがデコヒーレンスによって破損した場合、GCEはデコヒーレンス前後の演算子値の最適推定器を関連付ける。 さらに、デコヒーレンスに起因する誤りの増加または後悔は、2つの推定器間のばらつきに等しいことが示される。 真の弱値は、特に、最適推定において同じ役割を果たす -- 最適推定器からの発散は、最適測定器を使用しないという後悔の念である。 フォーマリズムの応用として,推定誤差を最小限に抑えるコントローラの設計に動的プログラミングを用いることが可能であることを示す。 これらの結果から、GCEと関連する発散は、量子決定と制御理論において自然で有用で不可逆的な役割を果たす。

A unifying formalism of generalized conditional expectations (GCEs) for quantum mechanics has recently emerged, but its physical implications regarding the retrodiction of a quantum observable remain controversial. To address the controversy, here I offer an operational meaning of a version of the GCEs -- of which the real weak value is a special case -- in the context of Bayesian quantum parameter estimation. When a quantum sensor is corrupted by decoherence, the GCE is found to relate the operator-valued optimal estimators before and after the decoherence. Furthermore, the error increase, or regret, caused by the decoherence is shown to be equal to a divergence between the two estimators. The real weak value, in particular, plays the same role in suboptimal estimation -- its divergence from the optimal estimator is precisely the regret for not using the optimal measurement. As an application of the formalism, I show that it enables the use of dynamic programming for designing a controller that minimizes the estimation error. These results give the GCE and the associated divergence a natural, useful, and incontrovertible role in quantum decision and control theory.
翻訳日:2023-01-09 01:58:36 公開日:2022-12-26
# 単エネルギー測定積分ゆらぎ定理と非射影測定

Single energy measurement Integral Fluctuation theorem and non-projective measurements ( http://arxiv.org/abs/2212.13225v1 )

ライセンス: Link先を確認
Daniel Alonso and Antonia Ruiz Garc\'ia(参考訳) 非射影的アンシャープ測定を用いて監視されるシステムにおける作業に対するjarzysnki型等式について検討する。 エネルギー測定の結果からオブザーバが得た情報と、それに続く条件付き正規化状態である$\hat \rho(t,f)$が、エネルギーの最終的な期待値と測定結果の$f$との差として、作業を定義するために使用される。 ジャルジンスキーの等式は、状態がプロセス中に発達するコヒーレンス、エネルギーを測定するために使用されるメーターの特性、そしてそれがシステムに誘導するノイズに依存する。 これらの貢献を詳細に分析して役割を明らかにします。 非常に特殊な場合において、一般にはそのようなノイズの効果は、射影測定を非射影測定の代わりに使用した場合に得られる結果の乗算を与える。 測定器の解像度を定義するシステムのエネルギーを監視するために使用される測定器のシャープな性質は、異なる関心のシナリオをもたらす。 特に、エネルギースペクトル内の隣接する元素間の距離がメータの分解能よりもはるかに大きい場合は、メータに依存する乗算係数まで、射影的測定ケースと同様の結果が得られる。 さらに微妙な状況は、測定が非形式的である場合、すなわち、システムに関する情報更新に寄与しない場合において発生する。 この場合、重複しないケースで得られた関係に対する補正が現れる。 我々はそのような修正が無視できる条件を分析する。 また,コヒーレンスの相対エントロピーについても検討し,コヒーレンスの相対エントロピーについて検討した。 単純な測定器で監視された2段階のシステムを分析して結果を示す。

We study a Jarzysnki type equality for work in systems that are monitored using non-projective unsharp measurements. The information acquired by the observer from the outcome $f$ of an energy measurement, and the subsequent conditioned normalized state $\hat \rho(t,f)$ evolved up to a final time $t$ are used to define work, as the difference between the final expectation value of the energy and the result $f$ of the measurement. The Jarzynski equality obtained depends on the coherences that the state develops during the process, the characteristics of the meter used to measure the energy, and the noise it induces into the system. We analyze those contributions in some detail to unveil their role. We show that in very particular cases, but not in general, the effect of such noise gives a factor multiplying the result that would be obtained if projective measurements were used instead of non-projective ones. The unsharp character of the measurements used to monitor the energy of the system, which defines the resolution of the meter, leads to different scenarios of interest. In particular, if the distance between neighboring elements in the energy spectrum is much larger than the resolution of the meter, then a similar result to the projective measurement case is obtained, up to a multiplicative factor that depends on the meter. A more subtle situation arises in the opposite case in which measurements may be non-informative, i.e. they may not contribute to update the information about the system. In this case, a correction to the relation obtained in the non-overlapping case appears. We analyze the conditions in which such a correction becomes negligible. We also study the coherences, in terms of the relative entropy of coherence developed by the evolved post-measurement state. We illustrate the results by analyzing a two-level system monitored by a simple meter.
翻訳日:2023-01-09 01:58:18 公開日:2022-12-26
# 散逸存在下での刺激されたラマン断熱通路の最適近道

Optimal shortcuts of Stimulated Raman Adiabatic Passage in the presence of dissipation ( http://arxiv.org/abs/2212.13231v1 )

ライセンス: Link先を確認
Dionisis Stefanatos and Emmanuel Paspalakis(参考訳) 最適制御理論を用いて、3段階のSTIRAPシステムにおける人口移動を最大化し、その過程の所与の有限期間と中間状態における特定散逸率を求める。 我々はポンプとストークスパルスの強度の和を固定し、混合角を単独制御変数として用いる。 この角度の最適変化を決定し、散逸の影響を最小限に抑えるために、最適軌道における特異弧の役割を明らかにする。

We use optimal control theory to obtain shortcuts to adiabaticity which maximize population transfer in a three-level STIRAP system, for a given finite duration of the process and specified dissipation rate at the intermediate state. We fix the sum of the intensities of the pump and Stokes pulses and use the mixing angle as the sole control variable. We determine the optimal variation of this angle and reveal the role of singular arc in the optimal trajectory, in order to minimize the effect of dissipation.
翻訳日:2023-01-09 01:57:50 公開日:2022-12-26
# バスカップリングが弱いボソニック自動絡み合いエンジンは不可能である

Bosonic autonomous entanglement engines with weak bath coupling are impossible ( http://arxiv.org/abs/2212.13309v1 )

ライセンス: Link先を確認
Bradley Longstaff, Michael G. Jabbour, and Jonatan Bohr Brask(参考訳) 絡み合いは量子物理学の基本的特徴であり、量子通信、計算、センシングの鍵となる資源である。 絡み合った状態は脆弱であり、コヒーレンスを維持することは量子情報処理における中心的な課題である。 それでも、エンタングルメントは散逸過程を通じて生成および安定化することができる。 実際、絡み合いは、熱浴への不整合結合のみを対象とする相互作用量子系の定常状態に存在することが示されている。 これは有限次元のシステムを用いて、様々な二部および多部構成で証明されている。 ここでは無限次元ボソニック系の定常状態に着目する。 具体的には,任意の強度の励振数保存相互作用を行うボソニックモードの任意の集合を考慮し,各カップルが異なる温度で熱浴に弱く接触する任意の数に分割する。 定常状態は常に分離可能であることを示す。

Entanglement is a fundamental feature of quantum physics and a key resource for quantum communication, computing and sensing. Entangled states are fragile and maintaining coherence is a central challenge in quantum information processing. Nevertheless, entanglement can be generated and stabilised through dissipative processes. In fact, entanglement has been shown to exist in the steady state of certain interacting quantum systems subject solely to incoherent coupling to thermal baths. This has been demonstrated in a range of bi- and multipartite settings using systems of finite dimension. Here we focus on the steady state of infinite-dimensionsional bosonic systems. Specifically, we consider any set of bosonic modes undergoing excitation-number-preserving interactions of arbitrary strength and divided between an arbitrary number of parties that each couple weakly to thermal baths at different temperatures. We show that the steady state is always separable.
翻訳日:2023-01-09 01:57:39 公開日:2022-12-26
# 個人化学生属性推定

Personalized Student Attribute Inference ( http://arxiv.org/abs/2212.14682v1 )

ライセンス: Link先を確認
Khalid Moustapha Askia, Marie-Jean Meurs(参考訳) 将来のパフォーマンスを正確に予測することで、学生は卒業を成功させ、時間とお金を節約できる。 しかし,このような予測の達成には,学生の背景の多様性と,その進歩を継続的に追跡する必要性という2つの課題がある。 この研究の目的は、障害のある生徒を自動的に検出できるシステムを作ることだ。 文献で広く使われているナイーブなアプローチは、データセットで利用可能な属性(等級)を使い、パーソナライズされた学生属性推論(PSAI)と呼ばれるパーソナライズされたアプローチと比較する。 モデルにより、各学生の特定の背景をキャプチャするパーソナライズされた属性を作成する。 どちらのアプローチも、決定木やサポートベクターマシン、ニューラルネットワークといった機械学習アルゴリズムを使って比較される。

Accurately predicting their future performance can ensure students successful graduation, and help them save both time and money. However, achieving such predictions faces two challenges, mainly due to the diversity of students' background and the necessity of continuously tracking their evolving progress. The goal of this work is to create a system able to automatically detect students in difficulty, for instance predicting if they are likely to fail a course. We compare a naive approach widely used in the literature, which uses attributes available in the data set (like the grades), with a personalized approach we called Personalized Student Attribute Inference (PSAI). With our model, we create personalized attributes to capture the specific background of each student. Both approaches are compared using machine learning algorithms like decision trees, support vector machine or neural networks.
翻訳日:2023-01-09 01:49:24 公開日:2022-12-26
# 集積シリコンフォトニクスを用いた資源効率の量子鍵分布

Resource-efficient quantum key distribution with integrated silicon photonics ( http://arxiv.org/abs/2212.12980v1 )

ライセンス: Link先を確認
Kejin Wei, Xiao Hu, Yongqiang Du, Xin Hua, Zhengeng Zhao, Ye Chen, Chunfeng Huang, and Xi Xiao(参考訳) 集積フォトニクスは、小型化、堅牢性、スケーラビリティの観点から量子鍵分布(QKD)システムのための有望なプラットフォームを提供する。 統合フォトニクスに基づくQKD作品が報告されている。 それでも、現在のチップベースのqkd実装のほとんどは、量子状態の復調や時間同期や偏光基底追跡などの補助タスクを実行するために、チップ外のハードウェアの追加を必要とする。 本稿では,シリコンベースのエンコーダとデコーダを用いた資源効率の高いBB84QKDのデモンストレーションを報告する。 本方式では,オンチップデバイスが生成する量子状態の生成と測定を頼りに,時間同期と分極補償を実装しているため,追加ハードウェアは不要である。 実験の結果,本手法は6時間連続で0.50\pm 0.02\%$の低固有qberで安定であることが判明した。 さらに、150kmまでの商用ファイバーチャネル上で、866bpsの速度でセキュアな鍵分布を実現することができる。 我々の実証は、低コストでウエハスケールのQKDシステムへの道を開いた。

Integrated photonics provides a promising platform for quantum key distribution (QKD) system in terms of miniaturization, robustness and scalability. Tremendous QKD works based on integrated photonics have been reported. Nonetheless, most current chip-based QKD implementations require additional off-chip hardware to demodulate quantum states or perform auxiliary tasks such as time synchronization and polarization basis tracking. Here, we report a demonstration of resource-efficient chip-based BB84 QKD with a silicon-based encoder and decoder. In our scheme, the time synchronization and polarization compensation are implemented relying on the preparation and measurement of the quantum states generated by on-chip devices, thus no need additional hardware. The experimental tests show that our scheme is highly stable with a low intrinsic QBER of $0.50\pm 0.02\%$ in a 6-h continuous run. Furthermore, over a commercial fiber channel up to 150 km, the system enables realizing secure key distribution at a rate of 866 bps. Our demonstration paves the way for low-cost, wafer-scale manufactured QKD system.
翻訳日:2023-01-09 01:46:45 公開日:2022-12-26
# 量子干渉による量子ドット交絡光子源の時間相関の除去

Eliminating temporal correlation in quantum-dot entangled photon source by quantum interference ( http://arxiv.org/abs/2212.13126v1 )

ライセンス: Link先を確認
Run-Ze Liu, Yu-Kun Qiao, Han-Sen Zhong, Zhen-Xuan Ge, Hui Wang, Tung-Hsun Chung, Chao-Yang Lu, Yong-Heng Huo, Jian-Wei Pan(参考訳) 半導体量子ドットは、有望な固体プラットフォームとして、量子情報応用のための高偏光エンタングルメントf\textcompwordmark idelityを持つ決定論的光子対生成を示す。 しかし、本質的にカスケードされた放出からの時間的相関のため、光子区別不能性は限られており、多光子実験の潜在的なスケーラビリティを制限している。 ここで、量子干渉を利用して偏光を時間相関から切り離し、多光子エンタングルメントf\textcompwordmark idelityを$(58.7\pm 2.2)\%$から$(75.5\pm 2.0)\%$に改善する。 私たちの研究は、量子ドットからスケーラブルで高品質な多光子状態を実現する方法を提供します。

Semiconductor quantum dots, as promising solid-state platform, have exhibited deterministic photon pair generation with high polarization entanglement f\textcompwordmark idelity for quantum information applications. However, due to temporal correlation from inherently cascaded emission, photon indistinguishability is limited, which restricts their potential scalability to multi-photon experiments. Here, by utilizing quantum interferences to decouple polarization entanglement from temporal correlation, we improve multi-photon entanglement f\textcompwordmark idelity from $(58.7\pm 2.2)\%$ to $(75.5\pm 2.0)\%$. Our work paves the way to realize scalable and high-quality multi-photon states from quantum dots.
翻訳日:2023-01-09 01:46:28 公開日:2022-12-26
# グラフニューラルネットワークを用いたネットワーク攻撃検出のためのNIDSデータセットと事前特徴集合導出の検討と修正

Investigation and rectification of NIDS datasets and standratized feature set derivation for network attack detection with graph neural networks ( http://arxiv.org/abs/2212.13994v1 )

ライセンス: Link先を確認
Anton Raskovalov, Nikita Gabdullin and Vasily Dolmatov(参考訳) ネットワーク侵入検知システム(NIDS)は、現代のネットワークにおける悪意あるトラフィックとサイバー攻撃検出に不可欠である。 人工知能ベースのNIDSは、正確な攻撃予測のために複雑なデータ相関を学習できる強力なツールである。 グラフニューラルネットワーク(GNN)は、フロー機能とともにネットワークトポロジを分析する機会を提供し、NIDSアプリケーションに特に適している。 しかし、そのようなツールをうまく利用するには、トレーニングとテストのために大量の注意深く収集されラベル付けされたデータが必要である。 本稿では,ToN-IoTデータセットの異なるバージョンを調査し,いくつかのバージョンで矛盾点を指摘する。 ToN-IoTのフルバージョンをフィルタリングし、ToN-IoT-Rという新しいバージョンを示す。 一般化を保証するため,NetFlowv5互換データからのみ派生した,標準化されたコンパクトなフロー特徴セットを提案する。 数値データとフラグを異なるカテゴリに分離し,数値特徴に対する新しいデータセット非依存正規化手法を提案する。 これによりフローフラグの意味を保存することができ、例えばネットワークプロトコルに基づいてターゲット分析を行うことを提案する。 フロー分類にはE-GraphSageアルゴリズムと修正ノード初期化手法を用いており、ノード特徴にノード次数を追加することができる。 ToN-IoT-Rの分類精度を高くし,これまでに公表したToN-IoT,NF-ToN-IoT,NF-ToN-IoT-v2と比較した。 我々は,データ収集とラベル付けと適切なデータ前処理の選択の重要性を強調し,高流量分類の精度を維持しつつ,交通監視装置の要求を少なくするため,提案した特徴セットが実際のNIDSに適用可能であることを結論付けた。

Network Intrusion and Detection Systems (NIDS) are essential for malicious traffic and cyberattack detection in modern networks. Artificial intelligence-based NIDS are powerful tools that can learn complex data correlations for accurate attack prediction. Graph Neural Networks (GNNs) provide an opportunity to analyze network topology along with flow features which makes them particularly suitable for NIDS applications. However, successful application of such tool requires large amounts of carefully collected and labeled data for training and testing. In this paper we inspect different versions of ToN-IoT dataset and point out inconsistencies in some versions. We filter the full version of ToN-IoT and present a new version labeled ToN-IoT-R. To ensure generalization we propose a new standardized and compact set of flow features which are derived solely from NetFlowv5-compatible data. We separate numeric data and flags into different categories and propose a new dataset-agnostic normalization approach for numeric features. This allows us to preserve meaning of flow flags and we propose to conduct targeted analysis based on, for instance, network protocols. For flow classification we use E-GraphSage algorithm with modified node initialization technique that allows us to add node degree to node features. We achieve high classification accuracy on ToN-IoT-R and compare it with previously published results for ToN-IoT, NF-ToN-IoT, and NF-ToN-IoT-v2. We highlight the importance of careful data collection and labeling and appropriate data preprocessing choice and conclude that the proposed set of features is more applicable for real NIDS due to being less demanding to traffic monitoring equipment while preserving high flow classification accuracy.
翻訳日:2022-12-29 16:30:23 公開日:2022-12-26
# その場観測のためのミッション科学出力を高める人工知能:スパースデータチャレンジへの取り組み

Artificial Intelligence to Enhance Mission Science Output for In-situ Observations: Dealing with the Sparse Data Challenge ( http://arxiv.org/abs/2212.13289v1 )

ライセンス: Link先を確認
M. I. Sitnov, G. K. Stephens, V. G. Merkin, C.-P. Wang, D. Turner, K. Genestreti, M. Argall, T. Y. Chen, A. Y. Ukhorskiy, S. Wing, Y.-H. Liu(参考訳) 地球の磁気圏では、低軌道を超える専用のプローブは10個以下あり、いつでもその場で観測できる。 結果として、その地球構造と進化、主活動過程、磁気嵐、サブストームのメカニズムを十分に理解していないのです。 機械学習、データマイニング、データ同化を含む新しい人工知能(AI)メソッドと、このスパースデータ課題を満たすために、新たなAI対応ミッションを開発する必要がある。

In the Earth's magnetosphere, there are fewer than a dozen dedicated probes beyond low-Earth orbit making in-situ observations at any given time. As a result, we poorly understand its global structure and evolution, the mechanisms of its main activity processes, magnetic storms, and substorms. New Artificial Intelligence (AI) methods, including machine learning, data mining, and data assimilation, as well as new AI-enabled missions will need to be developed to meet this Sparse Data challenge.
翻訳日:2022-12-29 16:21:09 公開日:2022-12-26
# 深層学習による構造に基づく創薬

Structure-based drug discovery with deep learning ( http://arxiv.org/abs/2212.13295v1 )

ライセンス: Link先を確認
R{\i}za \"Oz\c{c}elik, Derek van Tilborg, Jos\'e Jim\'enez-Luna, Francesca Grisoni(参考訳) 深層学習の形で人工知能(AI)は、タンパク質の構造と分子生物活性を予測し、有機合成を計画し、設計分子を$\textit{de novo}$とすることを約束する。 創薬における深層学習のほとんどがリガンドに基づくアプローチに焦点が当てられているが、構造に基づく創薬は未探索のタンパク質標的に対する親和性予測、結合機構の解明、関連する化学反応特性の合理化といった未解決の課題に対処できる可能性がある。 深層学習手法の進歩と、タンパク質三次構造に対する正確な予測の可用性は、AIによって導かれる薬物発見のための構造に基づくアプローチにおいて$\textit{renaissance}$を提唱する。 本レビューでは,創薬のための構造に基づく深層学習のアルゴリズム概念を概説し,今後の機会,応用,課題を予測する。

Artificial intelligence (AI) in the form of deep learning bears promise for drug discovery and chemical biology, $\textit{e.g.}$, to predict protein structure and molecular bioactivity, plan organic synthesis, and design molecules $\textit{de novo}$. While most of the deep learning efforts in drug discovery have focused on ligand-based approaches, structure-based drug discovery has the potential to tackle unsolved challenges, such as affinity prediction for unexplored protein targets, binding-mechanism elucidation, and the rationalization of related chemical kinetic properties. Advances in deep learning methodologies and the availability of accurate predictions for protein tertiary structure advocate for a $\textit{renaissance}$ in structure-based approaches for drug discovery guided by AI. This review summarizes the most prominent algorithmic concepts in structure-based deep learning for drug discovery, and forecasts opportunities, applications, and challenges ahead.
翻訳日:2022-12-29 16:13:16 公開日:2022-12-26
# PMODE:原型マスクを用いた物体次元推定

PMODE: Prototypical Mask based Object Dimension Estimation ( http://arxiv.org/abs/2212.13281v1 )

ライセンス: Link先を確認
Thariq Khalid, Mohammed Yahya Hakami, Riad Souissi(参考訳) ニューラルネットワークは、野生の物体の次元を推定できるのか? 本稿では,単眼カメラを用いて映像に興味のある四角形物体の寸法を推定する手法とディープラーニングアーキテクチャを提案する。 提案手法は, カメラキャリブレーションや手作りの幾何学的特徴を用いないが, 訓練過程におけるセグメンテーションニューラルネットワークの係数を用いて特徴を学習する。 resnet50バックボーンを備えたリアルタイムインスタンスセグメンテーションベースのディープニューラルネットワークを採用し、オブジェクトのプロトタイプマスクを提供し、その次元を後退させる関心領域を提供する。 インスタンスセグメンテーションネットワークは、最も関心のあるオブジェクトのみを見るように訓練される。 回帰は、バウンディングボックス検出器ヘッドとプロトタイプセグメンテーションマスクのマスク係数のみを見るMLPヘッドを用いて実行される。 次元推定のためのテストデータセットで22%のmapeを実現する3つの異なるランダムカメラでシステムを訓練した。

Can a neural network estimate an object's dimension in the wild? In this paper, we propose a method and deep learning architecture to estimate the dimensions of a quadrilateral object of interest in videos using a monocular camera. The proposed technique does not use camera calibration or handcrafted geometric features; however, features are learned with the help of coefficients of a segmentation neural network during the training process. A real-time instance segmentation-based Deep Neural Network with a ResNet50 backbone is employed, giving the object's prototype mask and thus provides a region of interest to regress its dimensions. The instance segmentation network is trained to look at only the nearest object of interest. The regression is performed using an MLP head which looks only at the mask coefficients of the bounding box detector head and the prototype segmentation mask. We trained the system with three different random cameras achieving 22% MAPE for the test dataset for the dimension estimation
翻訳日:2022-12-29 15:19:13 公開日:2022-12-26
# VQAとビジュアル推論:最近のデータセット,方法,課題の概要

VQA and Visual Reasoning: An Overview of Recent Datasets, Methods and Challenges ( http://arxiv.org/abs/2212.13296v1 )

ライセンス: Link先を確認
Rufai Yusuf Zakari, Jim Wilson Owusu, Hailin Wang, Ke Qin, Zaharaddeen Karami Lawal, Yuezhou Dong(参考訳) 人工知能(AI)とその応用は近年、驚くべき関心を集めている。 この成果は、機械学習(ML)、コンピュータビジョン(CV)、自然言語処理(NLP)など、AIサブフィールドの進歩に部分的に説明することができる。 ニューラルネットワークの概念を用いた機械学習のサブフィールドであるdeep learningは、これらの領域における最も急速な成長を可能にした。 ビジョンと言語の統合は、この結果、多くの注目を集めた。 タスクは、深層学習の概念を適切に実証するための方法で作られています。 本稿では,芸術的アプローチの状況,鍵となるモデル設計原則,既存のデータセット,手法,VQAの問題点の定式化と評価,および視覚的推論タスクについて,視覚と言語表現学習を理解するための詳細なレビューを行う。 また,本研究は,既存の課題に対処し,新たなアプリケーションを開発するために,新たなアイデアと新しいアプローチを生み出すことを期待して,今後の研究の道筋を示す。

Artificial Intelligence (AI) and its applications have sparked extraordinary interest in recent years. This achievement can be ascribed in part to advances in AI subfields including Machine Learning (ML), Computer Vision (CV), and Natural Language Processing (NLP). Deep learning, a sub-field of machine learning that employs artificial neural network concepts, has enabled the most rapid growth in these domains. The integration of vision and language has sparked a lot of attention as a result of this. The tasks have been created in such a way that they properly exemplify the concepts of deep learning. In this review paper, we provide a thorough and an extensive review of the state of the arts approaches, key models design principles and discuss existing datasets, methods, their problem formulation and evaluation measures for VQA and Visual reasoning tasks to understand vision and language representation learning. We also present some potential future paths in this field of research, with the hope that our study may generate new ideas and novel approaches to handle existing difficulties and develop new applications.
翻訳日:2022-12-29 15:18:56 公開日:2022-12-26
# Demystifying Advertising Campaign Bid Recommendation: A Constraint target CPA Goal Optimization

Demystifying Advertising Campaign Bid Recommendation: A Constraint target CPA Goal Optimization ( http://arxiv.org/abs/2212.13915v1 )

ライセンス: Link先を確認
Deguang Kong, Konstantin Shmakov and Jian Yang(参考訳) クリック単価(CPC)またはクリック単価(CPM)広告キャンペーンでは、広告主は常に十分なコンバージョンを得ることなく予算を消費するリスクを負う。 さらに、広告在庫の入札は、コスト・パー・アクセシション(tCPA)の目標に到達できる確率とはほとんど関係がない。 そこで本研究では,広告主が望むtCPA目標を達成するための入札最適化シナリオを提案する。 特に,非パラメトリック学習を用いて,リッチな履歴オークションデータから学習した入札ランドスケープモデルを活用した,厳密に定式化された制約付き最適化問題を解くことにより,意思決定を行う最適化エンジンを構築する。 提案モデルでは,広告入札行動の変動と変動による不完全ログ,不完全ログ,不確実性といった,入札ランドスケープモデリングが直面するデータ課題を本質的に扱う広告主の歴史的オークション行動に対する推測を行うことで,広告主の期待に応えた入札を自然に推奨することができる。 入札最適化モデルは、実世界のキャンペーンのベースラインメソッドよりも優れており、パフォーマンス向上と収益向上のための幅広いシナリオに適用されている。

In cost-per-click (CPC) or cost-per-impression (CPM) advertising campaigns, advertisers always run the risk of spending the budget without getting enough conversions. Moreover, the bidding on advertising inventory has few connections with propensity one that can reach to target cost-per-acquisition (tCPA) goals. To address this problem, this paper presents a bid optimization scenario to achieve the desired tCPA goals for advertisers. In particular, we build the optimization engine to make a decision by solving the rigorously formalized constrained optimization problem, which leverages the bid landscape model learned from rich historical auction data using non-parametric learning. The proposed model can naturally recommend the bid that meets the advertisers' expectations by making inference over advertisers' historical auction behaviors, which essentially deals with the data challenges commonly faced by bid landscape modeling: incomplete logs in auctions, and uncertainty due to the variation and fluctuations in advertising bidding behaviors. The bid optimization model outperforms the baseline methods on real-world campaigns, and has been applied into a wide range of scenarios for performance improvement and revenue liftup.
翻訳日:2022-12-29 15:02:27 公開日:2022-12-26
# 広告費を無駄にしてはいけない: コンキャビティ変更による入札推薦

Do not Waste Money on Advertising Spend: Bid Recommendation via Concavity Changes ( http://arxiv.org/abs/2212.13923v1 )

ライセンス: Link先を確認
Deguang Kong, Konstantin Shmakov and Jian Yang(参考訳) 計算広告では、予算制約が与えられた投資(ROI)に対するベストリターンを達成するために、どのように広告主を推薦するかが課題である。 本稿では,クリック予測曲線の凹凸変化を検出する入札推薦シナリオを提案する。 推奨入札は、大幅な増加(コンケーブ下向き)から緩やかな増加(凸上向き)への転換点に基づいて導出される。 対応する制約最適化問題を解くことにより、パラメトリック学習に基づく手法を適用する。 実世界の広告シナリオに関する実証的研究は、ビジネスメトリクスのパフォーマンス向上(収益増加、クリック増加、広告主ROIの増加を含む)を明確に示している。

In computational advertising, a challenging problem is how to recommend the bid for advertisers to achieve the best return on investment (ROI) given budget constraint. This paper presents a bid recommendation scenario that discovers the concavity changes in click prediction curves. The recommended bid is derived based on the turning point from significant increase (i.e. concave downward) to slow increase (convex upward). Parametric learning based method is applied by solving the corresponding constraint optimization problem. Empirical studies on real-world advertising scenarios clearly demonstrate the performance gains for business metrics (including revenue increase, click increase and advertiser ROI increase).
翻訳日:2022-12-29 15:02:03 公開日:2022-12-26
# 21世紀の地球物理学発見ツール : データサイエンスと機械学習の構造と2020-2050年の提言

Heliophysics Discovery Tools for the 21st Century: Data Science and Machine Learning Structures and Recommendations for 2020-2050 ( http://arxiv.org/abs/2212.13325v1 )

ライセンス: Link先を確認
R. M. McGranaghan, B. Thompson, E. Camporeale, J. Bortnik, M. Bobra, G. Lapenta, S. Wing, B. Poduval, S. Lotz, S. Murray, M. Kirk, T. Y. Chen, H. M. Bain, P. Riley, B. Tremblay, M. Cheung, V. Delouille(参考訳) 主なポイントは3つ。 1.データサイエンス(DS)は、生理学においてますます重要になるでしょう。 2. ヘリオ物理科学発見の方法は、厳格に適用され発見を支援することができる学習技術(機械学習(ML)など)を必要とせず、継続的に進化していく。 3. データ、技術、労働力の変化のペースで成長するためには、ヘリオフィジカルスは知識の表現に新しいアプローチを必要とする。

Three main points: 1. Data Science (DS) will be increasingly important to heliophysics; 2. Methods of heliophysics science discovery will continually evolve, requiring the use of learning technologies [e.g., machine learning (ML)] that are applied rigorously and that are capable of supporting discovery; and 3. To grow with the pace of data, technology, and workforce changes, heliophysics requires a new approach to the representation of knowledge.
翻訳日:2022-12-29 14:52:04 公開日:2022-12-26
# 無線センサネットワークにおけるオートエンコーダに基づく自己教師付き学習ベース異常ノード検出手法

A Novel Self-Supervised Learning-Based Anomaly Node Detection Method Based on an Autoencoder in Wireless Sensor Networks ( http://arxiv.org/abs/2212.13904v1 )

ライセンス: Link先を確認
Miao Ye, Qinghao Zhang, Xingsi Xue, Yong Wang, Qiuxiang Jiang and Hongbing Qiu(参考訳) 本稿では,既存の無線センサネットワーク(WSN)に基づく異常検出手法が時間的特徴のみを考慮し,解析することから,オートエンコーダに基づく自己教師付き学習に基づく異常ノード検出手法を設計する。 この方法は、時間的wsnデータフロー特徴抽出、空間的位置特徴抽出、およびモード間wsn相関特徴抽出をオートエンコーダの設計に統合し、異常検出にwsnの空間的及び時間的情報をフル活用する。 まず、完全接続ネットワークを用いて、局所的な空間的視点から単一のモードを考慮し、ノードの時間的特徴を抽出する。 第2に、グラフニューラルネットワーク(GNN)を用いて、グローバルな空間的視点からWSNトポロジを導入して異常検出を行い、単一モードを考慮してノードとその隣人のデータフローの空間的・時間的特徴を抽出する。 次に、重み付き和を含む適応融合法を用いて、異なるモデル間の関連特徴を抽出する。 さらに,時間次元の長期依存問題を解決するために,ゲートリカレントユニット(GRU)を導入する。 最終的に、デコーダの再構成された出力とオートエンコーダの隠された層表現が完全に接続されたネットワークに供給され、現在のシステムの異常確率を算出する。 空間的特徴抽出操作が進んでいるため,クラスタリング操作を追加することにより,大規模ネットワーク異常検出タスクに設計手法を適用することができる。 実験により、設計した手法はベースラインを上回り、f1スコアは90.6%に達し、教師なしの再構成と予測に基づいて既存の異常検出手法よりも5.2%高い値を示した。 コードとモデルはhttps://github.com/guetye/anomaly_detection/glslで入手できる。

Due to the issue that existing wireless sensor network (WSN)-based anomaly detection methods only consider and analyze temporal features, in this paper, a self-supervised learning-based anomaly node detection method based on an autoencoder is designed. This method integrates temporal WSN data flow feature extraction, spatial position feature extraction and intermodal WSN correlation feature extraction into the design of the autoencoder to make full use of the spatial and temporal information of the WSN for anomaly detection. First, a fully connected network is used to extract the temporal features of nodes by considering a single mode from a local spatial perspective. Second, a graph neural network (GNN) is used to introduce the WSN topology from a global spatial perspective for anomaly detection and extract the spatial and temporal features of the data flows of nodes and their neighbors by considering a single mode. Then, the adaptive fusion method involving weighted summation is used to extract the relevant features between different models. In addition, this paper introduces a gated recurrent unit (GRU) to solve the long-term dependence problem of the time dimension. Eventually, the reconstructed output of the decoder and the hidden layer representation of the autoencoder are fed into a fully connected network to calculate the anomaly probability of the current system. Since the spatial feature extraction operation is advanced, the designed method can be applied to the task of large-scale network anomaly detection by adding a clustering operation. Experiments show that the designed method outperforms the baselines, and the F1 score reaches 90.6%, which is 5.2% higher than those of the existing anomaly detection methods based on unsupervised reconstruction and prediction. Code and model are available at https://github.com/GuetYe/anomaly_detection/GLSL
翻訳日:2022-12-29 14:33:17 公開日:2022-12-26
# ニューラルチューニング景観のレベルセットと不変性について

On the Level Sets and Invariance of Neural Tuning Landscapes ( http://arxiv.org/abs/2212.13285v1 )

ライセンス: Link先を確認
Binxu Wang, Carlos R. Ponce(参考訳) 視覚表現は、画像に応じてニューロン集団の活性化として定義することができる。 すべての画像空間上の関数としてのニューロンの活性化は「チューニングランドスケープ」と表現されている。 高次元空間上の関数として、このランドスケープの構造は何でしょう? 本研究では,レベルセットのレンズとモース理論によるランドスケープのチューニングを特徴付ける。 最近の研究では、異なる脳領域のニューロンの2次元チューニングマップを測定した。 そこで我々は,レベル集合の位相変化に基づいて,これらのマップに対する統計的に信頼性の高いシグネチャを開発した。 畳み込みニューラルネットワーク(CNN)では,このトポロジカルシグネチャが皮質階層を通して徐々に変化し,同様の傾向がみられた。 さらに,cnnユニットのチューニング環境におけるレベル集合の幾何解析を行った。 我々は、高次単位は局所的に等方的ラジアル基底関数とみなすことができるが、グローバルではないという仮説を推し進めた。 これは、画像空間上のニューロンの活性化を理解するための概念ツールとして、レベルセットのパワーを示す。

Visual representations can be defined as the activations of neuronal populations in response to images. The activation of a neuron as a function over all image space has been described as a "tuning landscape". As a function over a high-dimensional space, what is the structure of this landscape? In this study, we characterize tuning landscapes through the lens of level sets and Morse theory. A recent study measured the in vivo two-dimensional tuning maps of neurons in different brain regions. Here, we developed a statistically reliable signature for these maps based on the change of topology in level sets. We found this topological signature changed progressively throughout the cortical hierarchy, with similar trends found for units in convolutional neural networks (CNNs). Further, we analyzed the geometry of level sets on the tuning landscapes of CNN units. We advanced the hypothesis that higher-order units can be locally regarded as isotropic radial basis functions, but not globally. This shows the power of level sets as a conceptual tool to understand neuronal activations over image space.
翻訳日:2022-12-29 14:16:43 公開日:2022-12-26
# 公共放送におけるニュース記事の自動テキスト簡易化

Automatic Text Simplification of News Articles in the Context of Public Broadcasting ( http://arxiv.org/abs/2212.13317v1 )

ライセンス: Link先を確認
Diego Maupom\'e, Fanny Rancourt, Thomas Soulas, Alexandre Lachance, Marie-Jean Meurs, Desislava Aleksandrova, Olivier Brochu Dufour, Igor Pontes, R\'emi Cardon, Michel Simard, Sowmya Vajjala(参考訳) 本報告は,2022年8月にモントリオール大学で開かれた第12回モントリオール工業問題解決ワークショップにおいて,著者らが行った成果をまとめたものである。 チームは、CBC/Radio-Canadaが自動テキスト単純化(ATS)というテーマで提出した問題に取り組みました。

This report summarizes the work carried out by the authors during the Twelfth Montreal Industrial Problem Solving Workshop, held at Universit\'e de Montr\'eal in August 2022. The team tackled a problem submitted by CBC/Radio-Canada on the theme of Automatic Text Simplification (ATS).
翻訳日:2022-12-29 14:16:06 公開日:2022-12-26
# MC-非局所PINN:モンテカルロサンプリングによるPINNにおける非局所演算子処理

MC-Nonlocal-PINNs: handling nonlocal operators in PINNs via Monte Carlo sampling ( http://arxiv.org/abs/2212.12984v1 )

ライセンス: Link先を確認
Xiaodong Feng and Yue Qian and Wanfang Shen(参考訳) 積分方程式や非局所PDEなどの一般非局所モデルの解法として,モンテカルロ非局所物理学インフォームドニューラルネットワーク(MC-Nonlocal-PINN)を提案する。 MC-fPINNと同様、MC-Nonlocal-PINNはモンテカルロ方式で非局所作用素を処理し、高次元問題に対する非常に安定したアプローチをもたらす。 我々は,高次元ボルテラ型積分方程式,超特異積分方程式,非局所PDEなど,多種多様なテスト問題を提示し,本手法の有効性を実証する。

We propose, Monte Carlo Nonlocal physics-informed neural networks (MC-Nonlocal-PINNs), which is a generalization of MC-fPINNs in \cite{guo2022monte}, for solving general nonlocal models such as integral equations and nonlocal PDEs. Similar as in MC-fPINNs, our MC-Nonlocal-PINNs handle the nonlocal operators in a Monte Carlo way, resulting in a very stable approach for high dimensional problems. We present a variety of test problems, including high dimensional Volterra type integral equations, hypersingular integral equations and nonlocal PDEs, to demonstrate the effectiveness of our approach.
翻訳日:2022-12-27 15:43:37 公開日:2022-12-26
# 高次組織的特徴は、疾患クラスのタンパク質相互作用ネットワークを区別する:腫瘍と神経疾患のケーススタディ

Higher order organizational features can distinguish protein interaction networks of disease classes: a case study of neoplasms and neurological diseases ( http://arxiv.org/abs/2212.13171v1 )

ライセンス: Link先を確認
Vikram Singh and Vikram Singh(参考訳) ネオプラズマ(NPs)と神経疾患と疾患(NDDs)は、世界中の不均等な数の人の死の根底にある病気の主要な分類の一つである。 これら2つのクラスに属する疾患の発症時に出現するタンパク質相互作用の局所的配線パターンに特有の特徴があるかどうかを調べるために,NPとNDDに属する112と175のタンパク質相互作用ネットワークについて検討した。 それぞれのネットワークの軌道利用プロファイル(OUP)は、ネットワークの局所的なトポロジを調査して列挙された。 56個のNon-redundant OUPs(nrOUPs)を誘導し,これら2つの病型分類のネットワーク特徴として利用した。 k-nearest neighbor(KNN)、サポートベクターマシン(SVM)、ディープニューラルネットワーク(DNN)、ランダムフォレスト(RF)の4つの機械学習分類器がこれらのデータに基づいて訓練された。 DNNはこれらの分類器の中で最も平均的な AUPRC (0.988) を得た。 node2vec 上で開発された DNN と提案した nrOUPs の埋め込みを,viz., AUPRC, Accuracy, Sensitivity, Specificity, Precision, MCC の6つの評価指標の平均値に基づいて 5 倍のクロスバリデーションを用いて比較した。 nroupsベースの分類器は,これら6つの性能指標すべてにおいて優れた性能を示した。

Neoplasms (NPs) and neurological diseases and disorders (NDDs) are amongst the major classes of diseases underlying deaths of a disproportionate number of people worldwide. To determine if there exist some distinctive features in the local wiring patterns of protein interactions emerging at the onset of a disease belonging to either of these two classes, we examined 112 and 175 protein interaction networks belonging to NPs and NDDs, respectively. Orbit usage profiles (OUPs) for each of these networks were enumerated by investigating the networks' local topology. 56 non-redundant OUPs (nrOUPs) were derived and used as network features for classification between these two disease classes. Four machine learning classifiers, namely, k-nearest neighbour (KNN), support vector machine (SVM), deep neural network (DNN), random forest (RF) were trained on these data. DNN obtained the greatest average AUPRC (0.988) among these classifiers. DNNs developed on node2vec and the proposed nrOUPs embeddings were compared using 5-fold cross validation on the basis of average values of the six of performance measures, viz., AUPRC, Accuracy, Sensitivity, Specificity, Precision and MCC. It was found that nrOUPs based classifier performed better in all of these six performance measures.
翻訳日:2022-12-27 15:43:25 公開日:2022-12-26
# 5gネットワークを超えて:コミュニケーション、コンピューティング、キャッシング、制御の統合

Beyond 5G Networks: Integration of Communication, Computing, Caching, and Control ( http://arxiv.org/abs/2212.13141v1 )

ライセンス: Link先を確認
Musbahu Mohammed Adam, Liqiang Zhao, Kezhi Wang, and Zhu Han(参考訳) 近年,知的応用によるスマートデバイスの急激な普及は,従来のセルネットワークに深刻な課題をもたらしている。 このような課題は、通信、コンピューティング、キャッシング、制御(i4c)技術を統合することで克服できる。 本調査ではまず,i4Cの背景,モチベーション,先導技術イネーブラー,潜在的な応用,ユースケースなど,さまざまな側面のスナップショットを提示する。 次に、コミュニケーション、コンピューティング、キャッシュ、制御(4C)のさまざまなモデルを説明し、統合アプローチの基礎を定めます。 我々は、i4Cに関連する最先端の研究成果を概観し、従来型と人工知能(AI)ベースの統合アプローチの最近の動向に注目した。 リソース統合におけるインテリジェンスの必要性も強調します。 そこで我々は、ISACの統合について論じ、その統合アプローチを様々なクラスに分類する。 最後に,6Gなどの5Gネットワークを超えて,オープンな課題と今後の研究方向性を提案する。

In recent years, the exponential proliferation of smart devices with their intelligent applications poses severe challenges on conventional cellular networks. Such challenges can be potentially overcome by integrating communication, computing, caching, and control (i4C) technologies. In this survey, we first give a snapshot of different aspects of the i4C, comprising background, motivation, leading technological enablers, potential applications, and use cases. Next, we describe different models of communication, computing, caching, and control (4C) to lay the foundation of the integration approach. We review current state-of-the-art research efforts related to the i4C, focusing on recent trends of both conventional and artificial intelligence (AI)-based integration approaches. We also highlight the need for intelligence in resources integration. Then, we discuss integration of sensing and communication (ISAC) and classify the integration approaches into various classes. Finally, we propose open challenges and present future research directions for beyond 5G networks, such as 6G.
翻訳日:2022-12-27 15:42:39 公開日:2022-12-26
# ニューラルネットワークにおける部分群のバイアス軽減フレームワーク

Bias Mitigation Framework for Intersectional Subgroups in Neural Networks ( http://arxiv.org/abs/2212.13014v1 )

ライセンス: Link先を確認
Narine Kokhlikyan, Bilal Alsallakh, Fulton Wang, Vivek Miglani, Oliver Aobo Yang and David Adkins(参考訳) 保護属性に関連付けられた交差部分群バイアスを緩和するフェアネス対応学習フレームワークを提案する。 従来の研究は、複雑な公平性駆動の制約を最適化の目的に組み込んだり、特定の保護された属性に焦点を当てた追加のレイヤを設計することで、偏見の軽減に重点を置いてきた。 本稿では,モデルが保護属性と出力変数の関係を学習することを防止し,それらの相互情報を低減し,単純で汎用的なバイアス緩和手法を提案する。 われわれの手法は、バイアスをほとんど、あるいは全く正確に減らすのに効果的であることを示す。 また、学習フレームワークでトレーニングされたモデルが、保護属性の値に対して因果的に公平で無関心になることを示す。 最後に,保護属性と非保護属性の特徴的相互作用を研究することにより,このアプローチを検証する。 これらの相互作用はバイアス緩和を施す際に著しく減少する。

We propose a fairness-aware learning framework that mitigates intersectional subgroup bias associated with protected attributes. Prior research has primarily focused on mitigating one kind of bias by incorporating complex fairness-driven constraints into optimization objectives or designing additional layers that focus on specific protected attributes. We introduce a simple and generic bias mitigation approach that prevents models from learning relationships between protected attributes and output variable by reducing mutual information between them. We demonstrate that our approach is effective in reducing bias with little or no drop in accuracy. We also show that the models trained with our learning framework become causally fair and insensitive to the values of protected attributes. Finally, we validate our approach by studying feature interactions between protected and non-protected attributes. We demonstrate that these interactions are significantly reduced when applying our bias mitigation.
翻訳日:2022-12-27 15:36:24 公開日:2022-12-26
# プライバシー予算を効果的にパッケージする

Packing Privacy Budget Efficiently ( http://arxiv.org/abs/2212.13228v1 )

ライセンス: Link先を確認
Pierre Tholoniat, Kelly Kostopoulou, Mosharaf Chowdhury, Asaf Cidon, Roxana Geambasu, Mathias L\'ecuyer, Junfeng Yang(参考訳) 機械学習(ML)モデルは、ユーザに関する情報をリークし、差分プライバシー(DP)は、所定の予算の下でそのリークを束縛する厳格な方法を提供する。 このDP予算は、ユーザデータに基づいてトレーニングされた複数のMLモデルのワークロードにおいて、新しいタイプの計算リソースと見なすことができる。 一度使用すると、dp予算は永遠に消費される。 したがって、できるだけ多くのモデルを訓練するために最も効率的に割り当てることが不可欠である。 本稿では、効率を最適化するプライバシースケジューラを提案する。 プライバシスケジューリングを,dp予算効率を最大化するプライバシナップサックという,新たな多次元ナップサック問題として定式化する。 プライバシ・クナプサックはNPハードであるため、実用的なアルゴリズムは必ずしも近似である。 我々はプライバシknapsack,DPKの近似アルゴリズムを開発し、マイクロベンチマークとAlibaba MLクラスタトレースから開発した新しい合成プライベートMLワークロードに基づいて評価する。 DPK:(1)効率を最適化するスケジュールに近づき、(2)公正性(Alibabaの1.3-1.7倍、マイクロベンチマークの1.0-2.6倍)に焦点を当てた最先端のプライバシスケジューリングアルゴリズムと比較して、タスクを継続的にスケジュールする。 したがって、DPKを使用することで、DP MLオペレータは、同じ量のユーザデータ上で、同じプライバシ保証をユーザに対して提供しながら、より多くのモデルをトレーニングすることができます。

Machine learning (ML) models can leak information about users, and differential privacy (DP) provides a rigorous way to bound that leakage under a given budget. This DP budget can be regarded as a new type of compute resource in workloads of multiple ML models training on user data. Once it is used, the DP budget is forever consumed. Therefore, it is crucial to allocate it most efficiently to train as many models as possible. This paper presents the scheduler for privacy that optimizes for efficiency. We formulate privacy scheduling as a new type of multidimensional knapsack problem, called privacy knapsack, which maximizes DP budget efficiency. We show that privacy knapsack is NP-hard, hence practical algorithms are necessarily approximate. We develop an approximation algorithm for privacy knapsack, DPK, and evaluate it on microbenchmarks and on a new, synthetic private-ML workload we developed from the Alibaba ML cluster trace. We show that DPK: (1) often approaches the efficiency-optimal schedule, (2) consistently schedules more tasks compared to a state-of-the-art privacy scheduling algorithm that focused on fairness (1.3-1.7x in Alibaba, 1.0-2.6x in microbenchmarks), but (3) sacrifices some level of fairness for efficiency. Therefore, using DPK, DP ML operators should be able to train more models on the same amount of user data while offering the same privacy guarantee to their users.
翻訳日:2022-12-27 15:36:05 公開日:2022-12-26
# テンソル主成分分析

Tensor Principal Component Analysis ( http://arxiv.org/abs/2212.12981v1 )

ライセンス: Link先を確認
Andrii Babii, Eric Ghysels, Junsu Pan(参考訳) 本稿では,高次元テンソルデータセットの解析手法を提案する。 テンソル因子モデルでは、高次元データセットを低ランク成分と慣性ノイズの和として記述し、パネルデータの従来の因子モデルを一般化する。 パネルデータに適用可能な従来のPCAを一般化したテンソル主成分分析(PCA)と呼ばれる推定アルゴリズムを提案する。 このアルゴリズムは、テンソルを異なる次元に沿って行列列に展開し、展開された行列にPCAを適用する。 負荷および要因のテンソルPCA推定器の整合性と漸近分布に関する理論的結果を提供する。 このアルゴリズムはMote Carlo実験で優れた性能を示し、ソートされたポートフォリオに適用される。

In this paper, we develop new methods for analyzing high-dimensional tensor datasets. A tensor factor model describes a high-dimensional dataset as a sum of a low-rank component and an idiosyncratic noise, generalizing traditional factor models for panel data. We propose an estimation algorithm, called tensor principal component analysis (PCA), which generalizes the traditional PCA applicable to panel data. The algorithm involves unfolding the tensor into a sequence of matrices along different dimensions and applying PCA to the unfolded matrices. We provide theoretical results on the consistency and asymptotic distribution for tensor PCA estimator of loadings and factors. The algorithm demonstrates good performance in Mote Carlo experiments and is applied to sorted portfolios.
翻訳日:2022-12-27 15:34:37 公開日:2022-12-26
# CT金属アーチファクト学習のための方位共有畳み込み表現

Orientation-Shared Convolution Representation for CT Metal Artifact Learning ( http://arxiv.org/abs/2212.13166v1 )

ライセンス: Link先を確認
Hong Wang, Qi Xie, Yuexiang Li, Yawen Huang, Deyu Meng, Yefeng Zheng(参考訳) X線CT(CT)スキャンでは,患者を担持した金属インプラントがCT画像に悪影響を及ぼし,臨床治療に支障を来すことが多かった。 このメタルアーティファクト削減(MAR)タスクに対して、既存のディープラーニングベースの手法は、有望な再構築性能を得た。 しかしながら、この特定のタスクの根底にある重要な事前知識が十分に活用されていないため、MAR性能と一般化能力のさらなる改善の余地はまだ残っている。 そこで本稿では, 金属加工品の特性を慎重に分析し, 加工品の物理構造, すなわち回転対称なストリーキングパターンに適応するための配向型畳み込み表現戦略を提案する。 提案手法は人工物モデリングにおいてフーリエ級数展開に基づくフィルタパラメトリゼーションを合理的に採用し,解剖組織からアーティファクトを分離し,モデルの一般化性を高める。 合成および臨床データセット上で実施した総合的な実験は、現在の代表的MAR法を超える詳細な保存において、本手法の優位性を示している。 コードは \url{https://github.com/hongwang01/OSCNet} で入手できる。

During X-ray computed tomography (CT) scanning, metallic implants carrying with patients often lead to adverse artifacts in the captured CT images and then impair the clinical treatment. Against this metal artifact reduction (MAR) task, the existing deep-learning-based methods have gained promising reconstruction performance. Nevertheless, there is still some room for further improvement of MAR performance and generalization ability, since some important prior knowledge underlying this specific task has not been fully exploited. Hereby, in this paper, we carefully analyze the characteristics of metal artifacts and propose an orientation-shared convolution representation strategy to adapt the physical prior structures of artifacts, i.e., rotationally symmetrical streaking patterns. The proposed method rationally adopts Fourier-series-expansion-based filter parametrization in artifact modeling, which can better separate artifacts from anatomical tissues and boost the model generalizability. Comprehensive experiments executed on synthesized and clinical datasets show the superiority of our method in detail preservation beyond the current representative MAR methods. Code will be available at \url{https://github.com/hongwang01/OSCNet}
翻訳日:2022-12-27 15:28:50 公開日:2022-12-26
# 条件付き期待関数の比に対する直交級数の推定

Orthogonal Series Estimation for the Ratio of Conditional Expectation Functions ( http://arxiv.org/abs/2212.13145v1 )

ライセンス: Link先を確認
Kazuhiko Shinoda and Takahiro Hoshino(参考訳) データ科学の様々な分野において、研究者は条件付き期待関数(CEFR)の比率を推定することに関心がある。 特に因果推論問題において、オッズ比やハザード比といった比に基づく治療効果を考慮することは自然であり、実験的な条件下では差に基づく治療効果さえCEFRと同一視されることがある。 本章では,無限次元ニュアンスパラメータに対するフレキシブル機械学習の利用を可能にするCEFR上の推定と推定のための一般的なフレームワークを開発する。 フレームワークの第1段階では、直交信号はデバイアス機械学習技術を用いて構築され、目標推定に対するニュアンス推定における正規化バイアスの負の影響を軽減する。 信号はcefr用に調整された新しい系列推定器と結合される。 ケプシアンブートストラップの有効性を含むCEFR上の推定と推定のための点数的および均一な漸近的結果を導出し,提案したフレームワークを具体例に適用するための低レベルな条件を提供する。 数値シミュレーションにより,提案手法で構築した直列推定器の有限サンプル性能を示す。 最後に,提案手法を適用し,家計資産に対する401(k)プログラムの因果効果を推定する。

In various fields of data science, researchers are often interested in estimating the ratio of conditional expectation functions (CEFR). Specifically in causal inference problems, it is sometimes natural to consider ratio-based treatment effects, such as odds ratios and hazard ratios, and even difference-based treatment effects are identified as CEFR in some empirically relevant settings. This chapter develops the general framework for estimation and inference on CEFR, which allows the use of flexible machine learning for infinite-dimensional nuisance parameters. In the first stage of the framework, the orthogonal signals are constructed using debiased machine learning techniques to mitigate the negative impacts of the regularization bias in the nuisance estimates on the target estimates. The signals are then combined with a novel series estimator tailored for CEFR. We derive the pointwise and uniform asymptotic results for estimation and inference on CEFR, including the validity of the Gaussian bootstrap, and provide low-level sufficient conditions to apply the proposed framework to some specific examples. We demonstrate the finite-sample performance of the series estimator constructed under the proposed framework by numerical simulations. Finally, we apply the proposed method to estimate the causal effect of the 401(k) program on household assets.
翻訳日:2022-12-27 15:28:19 公開日:2022-12-26
# パーティクルフィルタを用いた画像フレーム列内の低オブザーバブル物体の検出と追跡

Detection and Tracking of Low Observable Objects in a Sequence of Image Frames Using Particle Filter ( http://arxiv.org/abs/2212.13020v1 )

ライセンス: Link先を確認
Reza Rezaie(参考訳) ノイズやクラッタの存在下での映像フレーム列に基づく低オブザーバブル物体の検出と追跡のためのトラック先行検出(tbd)粒子フィルタに基づく手法について検討した。 画像のフレームを受信した各時間に、まず、いくつかの前処理アプローチを画像に適用する。 次に、粒子フィルタに基づく検出・追跡アルゴリズムに送信する。 ノイズや乱れなどの異なるシナリオにおける物体の検出と追跡のために,アプローチの性能を評価する。

A track-before-detect (TBD) particle filter-based method for detection and tracking of low observable objects based on a sequence of image frames in the presence of noise and clutter is studied. At each time instance after receiving a frame of image, first, some preprocessing approaches are applied to the image. Then, it is sent to the detection and tracking algorithm which is based on a particle filter. Performance of the approach is evaluated for detection and tracking of an object in different scenarios including noise and clutter.
翻訳日:2022-12-27 15:27:58 公開日:2022-12-26
# クープマンオートエンコーダの固有値初期化と正規化

Eigenvalue initialisation and regularisation for Koopman autoencoders ( http://arxiv.org/abs/2212.12086v2 )

ライセンス: Link先を確認
Jack W. Miller, Charles O'Neill, Navid C. Constantinou, and Omri Azencot(参考訳) ニューラルネットワークのパラメータ行列の規則化は、深層モデルのトレーニングにおいてユビキタスである。 典型的な正規化アプローチでは、小さなランダム値を使ってウェイトを初期化し、ウェイトをペナライズしてスパーシティを促進する。 しかし、これらの広く使われている手法は特定のシナリオでは効果が低い可能性がある。 本稿では、エンコーダ、koopman演算子層、デコーダを含むkoopmanオートエンコーダモデルについて検討する。 これらのモデルは、解釈可能なダイナミクスと物理に関連した制約を組み込む能力で、物理学関連の問題に取り組むために設計され、研究されている。 しかし、既存の作業の大部分は標準の正規化プラクティスを採用している。 本研究では,物理関連設定に適した初期化とペナルティ方式により,クープマンオートエンコーダの強化を図る。 具体的には、特定の固有値分布から初期koopman演算子をサンプリングする"eigeninit"初期化スキームを提案する。 さらに,トレーニング中にkoopman演算子の固有値にペナルティを与える"eigenloss"ペナルティスキームを提案する。 これらのスキームは,2つの合成データ,すなわち駆動振子とシリンダーを過ぎる流れ,および海洋表面温度とサイクロン風場という実世界の問題に対して有効であることを示す。 これらのデータセットでは、eigenlossとeigeninitが収束率を最大5倍に向上させ、累積長期予測誤差を最大3倍に減少させることがわかった。 このような発見は、他の物理学関連のディープラーニングアプローチにおいて、帰納的バイアスとして同様のスキームを組み込むことの有用性を指摘する。

Regularising the parameter matrices of neural networks is ubiquitous in training deep models. Typical regularisation approaches suggest initialising weights using small random values, and to penalise weights to promote sparsity. However, these widely used techniques may be less effective in certain scenarios. Here, we study the Koopman autoencoder model which includes an encoder, a Koopman operator layer, and a decoder. These models have been designed and dedicated to tackle physics-related problems with interpretable dynamics and an ability to incorporate physics-related constraints. However, the majority of existing work employs standard regularisation practices. In our work, we take a step toward augmenting Koopman autoencoders with initialisation and penalty schemes tailored for physics-related settings. Specifically, we propose the "eigeninit" initialisation scheme that samples initial Koopman operators from specific eigenvalue distributions. In addition, we suggest the "eigenloss" penalty scheme that penalises the eigenvalues of the Koopman operator during training. We demonstrate the utility of these schemes on two synthetic data sets: a driven pendulum and flow past a cylinder; and two real-world problems: ocean surface temperatures and cyclone wind fields. We find on these datasets that eigenloss and eigeninit improves the convergence rate by up to a factor of 5, and that they reduce the cumulative long-term prediction error by up to a factor of 3. Such a finding points to the utility of incorporating similar schemes as an inductive bias in other physics-related deep learning approaches.
翻訳日:2022-12-27 15:27:51 公開日:2022-12-26
# OMSNとFAROS:OCTA微細セグメントネットワークとフルアノテーション網膜OCTAセグメントデータセット

OMSN and FAROS: OCTA Microstructure Segmentation Network and Fully Annotated Retinal OCTA Segmentation Dataset ( http://arxiv.org/abs/2212.13059v1 )

ライセンス: Link先を確認
Peng Xiao, Xiaodong Hu, Ke Ma, Gengyuan Wang, Ziqing Feng, Yuancong Huang, and Jin Yuan(参考訳) 効率的なセグメンテーション法と完全なラベル付きデータセットの欠如は、網膜血管ネットワーク (rvn) やfoveal avascular zone (faz) のような光学的コヒーレンス断層血管造影 (optical coherence tomography angiography,octa) の包括的評価を制限している。 本稿では,エンコーダデコーダをベースとしたアーキテクチャとマルチスケールスキップ接続とスプリットアテンションベースの残差ネットワークResNeStを組み合わせることで,OCTAマイクロ構造セグメントネットワーク(OMSN)を提案する。 OMSNは、RVNやFAZセグメンテーションのための優れたシングル/マルチタスク性能を実現する。 特にマルチタスクモデルの評価基準は同じデータセット上でシングルタスクモデルよりも優れている。 これにより、ピクセルレベルフルラベルオクタデータセットの空白を満たした、完全アノテートされた網膜オクタセグメンテーション(faros)データセットが半自動で構築される。 FAROSで再訓練されたOMSNマルチタスクセグメンテーションモデルは、同時にRVNとFAZセグメンテーションの精度をさらに向上させる。

The lack of efficient segmentation methods and fully-labeled datasets limits the comprehensive assessment of optical coherence tomography angiography (OCTA) microstructures like retinal vessel network (RVN) and foveal avascular zone (FAZ), which are of great value in ophthalmic and systematic diseases evaluation. Here, we introduce an innovative OCTA microstructure segmentation network (OMSN) by combining an encoder-decoder-based architecture with multi-scale skip connections and the split-attention-based residual network ResNeSt, paying specific attention to OCTA microstructural features while facilitating better model convergence and feature representations. The proposed OMSN achieves excellent single/multi-task performances for RVN or/and FAZ segmentation. Especially, the evaluation metrics on multi-task models outperform single-task models on the same dataset. On this basis, a fully annotated retinal OCTA segmentation (FAROS) dataset is constructed semi-automatically, filling the vacancy of a pixel-level fully-labeled OCTA dataset. OMSN multi-task segmentation model retrained with FAROS further certifies its outstanding accuracy for simultaneous RVN and FAZ segmentation.
翻訳日:2022-12-27 15:18:09 公開日:2022-12-26
# 医用画像のためのトランスフォーマーとGANを用いた超解像再構成ネットワーク

Transformer and GAN Based Super-Resolution Reconstruction Network for Medical Images ( http://arxiv.org/abs/2212.13068v1 )

ライセンス: Link先を確認
Weizhi Du and Harvery Tian(参考訳) 低磁場磁気共鳴画像のような低放射線量で高画質の画像を得る必要があるため、医用画像の超高解像度再構成が一般的になっている(MRI)。 しかし, 医用画像の複雑化と審美的要求のため, 画像の超解像再構成は難しい課題である。 本稿では,Transformer and Generative Adversarial Networks (T-GAN) を用いた低解像度画像から医用画像の再構成を行う。 より正確なテクスチャ情報を抽出し、画像再構成のための生成的逆ネットワークにトランスフォーマーを挿入した後、グローバル画像マッチングにより、より重要な位置に集中することができる。 さらに,提案モデルT-GANのトレーニングにおいて,最終マルチタスク損失関数として,コンテンツ損失,敵対的損失,敵対的特徴損失の組み合わせを重み付けした。 提案するT-GANは,PSNRやSSIMなどの確立した指標と比較して最適な性能を示し,MRIスキャンした膝と腹の画像の超解像再構成において,よりテクスチャな特徴を回復する。

Because of the necessity to obtain high-quality images with minimal radiation doses, such as in low-field magnetic resonance imaging, super-resolution reconstruction in medical imaging has become more popular (MRI). However, due to the complexity and high aesthetic requirements of medical imaging, image super-resolution reconstruction remains a difficult challenge. In this paper, we offer a deep learning-based strategy for reconstructing medical images from low resolutions utilizing Transformer and Generative Adversarial Networks (T-GAN). The integrated system can extract more precise texture information and focus more on important locations through global image matching after successfully inserting Transformer into the generative adversarial network for picture reconstruction. Furthermore, we weighted the combination of content loss, adversarial loss, and adversarial feature loss as the final multi-task loss function during the training of our proposed model T-GAN. In comparison to established measures like PSNR and SSIM, our suggested T-GAN achieves optimal performance and recovers more texture features in super-resolution reconstruction of MRI scanned images of the knees and belly.
翻訳日:2022-12-27 15:17:42 公開日:2022-12-26
# typeformer:モバイルキーストローク生体認証のためのトランスフォーマー

TypeFormer: Transformers for Mobile Keystroke Biometrics ( http://arxiv.org/abs/2212.13075v1 )

ライセンス: Link先を確認
Giuseppe Stragapede, Paula Delgado-Santos, Ruben Tolosana, Ruben Vera-Rodriguez, Richard Guest, Aythami Morales(参考訳) 最近のモバイルデバイスの広範な利用、それらの情報に含まれる機密性、および現在のモバイルユーザ認証方法の欠点は、ユーザのアイデンティティを検証するために、新規でセキュアで控えめなソリューションを求めることである。 本稿では,ユーザ認証のためにモバイルデバイス上で実行される自由テキストキーストロークダイナミクスをモデル化する,新しいトランスフォーマーアーキテクチャであるTypeFormerを提案する。 提案手法は,2つのLong Short-Term Memory(LSTM)リカレントレイヤ,ガウスレンジエンコーディング(GRE),マルチヘッド自己保持機構,ブロックリカレント構造を含むテンポラルおよびチャネルモジュールからなる。 aaltoモバイルキーストロークデータベース(aalto mobile key stroke database)の実験では、50キーストロークの5つの問合せセッションだけで3.25%のエラー率(eer)で現在の最先端システムを上回る。 このようにして、デスクトップおよび固定テキストのシナリオに対する挑戦的なモバイル自由テキストシナリオの従来のパフォーマンスギャップを低減することに寄与する。 さらに、キーストローク列の長さやエンローメントセッションの量など、実験的な構成の異なるモデルの振る舞いを分析し、より多くのエンローメントデータによる改善のマージンを示す。 最後に、既存のアプローチと比較してTypeFormerが抽出した機能の堅牢性を示すクロスデータベース評価を行う。

The broad usage of mobile devices nowadays, the sensitiveness of the information contained in them, and the shortcomings of current mobile user authentication methods are calling for novel, secure, and unobtrusive solutions to verify the users' identity. In this article, we propose TypeFormer, a novel Transformer architecture to model free-text keystroke dynamics performed on mobile devices for the purpose of user authentication. The proposed model consists in Temporal and Channel Modules enclosing two Long Short-Term Memory (LSTM) recurrent layers, Gaussian Range Encoding (GRE), a multi-head Self-Attention mechanism, and a Block-Recurrent structure. Experimenting on one of the largest public databases to date, the Aalto mobile keystroke database, TypeFormer outperforms current state-of-the-art systems achieving Equal Error Rate (EER) values of 3.25% using only 5 enrolment sessions of 50 keystrokes each. In such way, we contribute to reducing the traditional performance gap of the challenging mobile free-text scenario with respect to its desktop and fixed-text counterparts. Additionally, we analyse the behaviour of the model with different experimental configurations such as the length of the keystroke sequences and the amount of enrolment sessions, showing margin for improvement with more enrolment data. Finally, a cross-database evaluation is carried out, demonstrating the robustness of the features extracted by TypeFormer in comparison with existing approaches.
翻訳日:2022-12-27 15:17:22 公開日:2022-12-26
# 衛星画像からの道路セマンティックセグメンテーションのための半監督領域適応

Semi-Supervised Domain Adaptation for Semantic Segmentation of Roads from Satellite Images ( http://arxiv.org/abs/2212.13079v1 )

ライセンス: Link先を確認
Ahmet Alp Kindiroglu, Metehan Yal\c{c}{\i}n, Furkan Burak Ba\u{g}c{\i}, Mahiye Uluya\u{g}mur \"Ozt\"urk(参考訳) 本稿では,衛星画像から道路を抽出する半教師付きセグメンテーション手法の予備的知見を示す。 衛星画像から道路データを抽出する手法として,人工ニューラルネットワークと画像分割法が最も成功した。 しかし、これらのモデルは高い精度を達成するために、異なる地域からの大量のトレーニングデータを必要とする。 このデータがより多くの量や品質を必要とする場合、異なるソースから得られた注釈データから知識を転送してディープニューラルネットワークを訓練する標準的な方法である。 本研究では,半教師付き学習手法を用いて経路分割を行う手法を提案する。 擬似ラベル法と最小クラス混乱法に基づく半教師付きフィールド適応法が提案されており,ターゲットデータセットの性能向上が期待されている。

This paper presents the preliminary findings of a semi-supervised segmentation method for extracting roads from sattelite images. Artificial Neural Networks and image segmentation methods are among the most successful methods for extracting road data from satellite images. However, these models require large amounts of training data from different regions to achieve high accuracy rates. In cases where this data needs to be of more quantity or quality, it is a standard method to train deep neural networks by transferring knowledge from annotated data obtained from different sources. This study proposes a method that performs path segmentation with semi-supervised learning methods. A semi-supervised field adaptation method based on pseudo-labeling and Minimum Class Confusion method has been proposed, and it has been observed to increase performance in targeted datasets.
翻訳日:2022-12-27 15:16:54 公開日:2022-12-26
# 効率的な自動特徴工学を目指して

Toward Efficient Automated Feature Engineering ( http://arxiv.org/abs/2212.13152v1 )

ライセンス: Link先を確認
Kafeng Wang, Pengyang Wang and Chengzhong xu(参考訳) 自動機能エンジニアリング(automated feature engineering, afe)とは、ダウンストリームタスクのための最適な機能セットを自動的に生成し、選択することを指す。 現在のAFE手法は、主に生成された機能の有効性の改善に重点を置いているが、大規模展開における低効率の問題を無視している。 そこで本研究では,AFEの効率向上のための汎用フレームワークを提案する。 具体的には、強化学習設定に基づいてAFEパイプラインを構築し、各特徴をエージェントに割り当て、特徴変換 \com{and}選択を行い、下流タスクで生成された特徴の評価スコアがポリシーを更新する報酬となる。 AFEの効率を2つの視点で改善する。 一方,我々は,特徴評価の効率を損なう2つの主要な要因であるサンプルサイズと特徴量を削減するための特徴事前評価(FPE)モデルを開発した。 一方,我々は,事前評価タスクにおいてfpeを実行し,訓練方針をゼロから回避するための方針の初期化を行い,二段階の政策訓練戦略を考案する。 分類と回帰の両面で36のデータセットについて総合的な実験を行った。 その結果、平均で2.9\%$高い性能を示し、最先端のAFE法と比較して2倍高い計算効率を示した。

Automated Feature Engineering (AFE) refers to automatically generate and select optimal feature sets for downstream tasks, which has achieved great success in real-world applications. Current AFE methods mainly focus on improving the effectiveness of the produced features, but ignoring the low-efficiency issue for large-scale deployment. Therefore, in this work, we propose a generic framework to improve the efficiency of AFE. Specifically, we construct the AFE pipeline based on reinforcement learning setting, where each feature is assigned an agent to perform feature transformation \com{and} selection, and the evaluation score of the produced features in downstream tasks serve as the reward to update the policy. We improve the efficiency of AFE in two perspectives. On the one hand, we develop a Feature Pre-Evaluation (FPE) Model to reduce the sample size and feature size that are two main factors on undermining the efficiency of feature evaluation. On the other hand, we devise a two-stage policy training strategy by running FPE on the pre-evaluation task as the initialization of the policy to avoid training policy from scratch. We conduct comprehensive experiments on 36 datasets in terms of both classification and regression tasks. The results show $2.9\%$ higher performance in average and 2x higher computational efficiency comparing to state-of-the-art AFE methods.
翻訳日:2022-12-27 15:11:26 公開日:2022-12-26
# ガウス過程分類バンド

Gaussian Process Classification Bandits ( http://arxiv.org/abs/2212.13157v1 )

ライセンス: Link先を確認
Tatsuya Hayashi, Naoki Ito, Koji Tabata, Atsuyoshi Nakamura, Katsumasa Fujita, Yoshinori Harada, Tamiki Komatsuzaki(参考訳) 分類バンディット(英: classification bandit)とは、与えられた腕の組を、少なくともhの期待報酬を持つ腕の割合が与えられた閾値hとw以上であるか否かに応じて、正または負のクラスに分類することであるマルチアームのバンディット問題である。 w. ガウス過程に従って生成される期待報酬 f(x) を持つd-次元実空間の点 x に腕を対応させる特殊分類バンドイット問題について検討する。 各種アーム選択ポリシーを用いて,この問題に対するフレームワークアルゴリズムを開発し,FCBおよびFTSVと呼ばれるポリシーを提案する。 f(x) が少なくとも h であるか否かを各arm に対して決定しなければならないレベル集合推定の既存のアルゴリズムよりも、fcb のサンプル複雑性の上限が小さいことを示す。 x.少なくともhの報酬を伴う腕数の推定値に依存する腕選択ポリシーも提案され、経験的サンプル複雑さを改善することが示されている。 実験結果によると, FCB と FTSV の速度推定バージョンは,最大分散度でポイントを選択する人気能動学習ポリシーとともに,合成関数の他のポリシーよりも優れており,FTSV は実世界のデータセットにとって最高の演奏者でもある。

Classification bandits are multi-armed bandit problems whose task is to classify a given set of arms into either positive or negative class depending on whether the rate of the arms with the expected reward of at least h is not less than w for given thresholds h and w. We study a special classification bandit problem in which arms correspond to points x in d-dimensional real space with expected rewards f(x) which are generated according to a Gaussian process prior. We develop a framework algorithm for the problem using various arm selection policies and propose policies called FCB and FTSV. We show a smaller sample complexity upper bound for FCB than that for the existing algorithm of the level set estimation, in which whether f(x) is at least h or not must be decided for every arm's x. Arm selection policies depending on an estimated rate of arms with rewards of at least h are also proposed and shown to improve empirical sample complexity. According to our experimental results, the rate-estimation versions of FCB and FTSV, together with that of the popular active learning policy that selects the point with the maximum variance, outperform other policies for synthetic functions, and the version of FTSV is also the best performer for our real-world dataset.
翻訳日:2022-12-27 15:11:06 公開日:2022-12-26
# 2-hop Neighbor Class similarity (2NCS):グラフニューラルネットワークの性能を示すグラフ構造計量

2-hop Neighbor Class Similarity (2NCS): A graph structural metric indicative of graph neural network performance ( http://arxiv.org/abs/2212.13202v1 )

ライセンス: Link先を確認
Andrea Cavallo, Claas Grohnfeldt, Michele Russo, Giulio Lovisotto, Luca Vassio(参考訳) グラフニューラルネットワーク(gnns)は、多数のドメインにわたるグラフ構造化データで最先端のパフォーマンスを実現する。 ノードをビジニティの要約として表現する基本的な能力は、特に同型ノードが接続する傾向にあるホモフィルグラフに有効であることが証明されている。 異なるタイプのノードが接続される可能性のある異種グラフでは、近所の情報は代表的でも誤解を招くこともあるため、gnnは一貫性を欠く。 一方、GNNの性能は全ての異種グラフに劣るわけではなく、他のグラフ特性がGNNの性能にどのような影響を及ぼすかは理解されていない。 本稿では,GNNの性能を推定する上で,広く使用されているホモフィリー比と最近のクロスクラス近傍類似度(CCNS)の限界を強調した。 これらの制約を克服するために,新しい定量的グラフ構造特性である2-hop neighbor class similarity (2ncs) を導入する。 2NCSは、2つのホップ近傍を、GCNのトレーニング推論プロセスを管理する2段階のラベル伝播プロセスの理論上の帰結であると考えている。 1つの合成グラフと8つの実世界のグラフデータセットの実験は、ノード分類タスクにおけるGCNおよびGATベースのアーキテクチャの精度を推定する上で、既存のメトリクスよりも一貫した改善を確認した。

Graph Neural Networks (GNNs) achieve state-of-the-art performance on graph-structured data across numerous domains. Their underlying ability to represent nodes as summaries of their vicinities has proven effective for homophilous graphs in particular, in which same-type nodes tend to connect. On heterophilous graphs, in which different-type nodes are likely connected, GNNs perform less consistently, as neighborhood information might be less representative or even misleading. On the other hand, GNN performance is not inferior on all heterophilous graphs, and there is a lack of understanding of what other graph properties affect GNN performance. In this work, we highlight the limitations of the widely used homophily ratio and the recent Cross-Class Neighborhood Similarity (CCNS) metric in estimating GNN performance. To overcome these limitations, we introduce 2-hop Neighbor Class Similarity (2NCS), a new quantitative graph structural property that correlates with GNN performance more strongly and consistently than alternative metrics. 2NCS considers two-hop neighborhoods as a theoretically derived consequence of the two-step label propagation process governing GCN's training-inference process. Experiments on one synthetic and eight real-world graph datasets confirm consistent improvements over existing metrics in estimating the accuracy of GCN- and GAT-based architectures on the node classification task.
翻訳日:2022-12-27 15:10:42 公開日:2022-12-26
# 連続学習のためのサリエンシ強化メモリ補完

Saliency-Augmented Memory Completion for Continual Learning ( http://arxiv.org/abs/2212.13242v1 )

ライセンス: Link先を確認
Guangji Bai, Chen Ling, Yuyang Gao, Liang Zhao(参考訳) 継続学習は、次世代人工知能への重要なステップだと考えられている。 様々な方法の中で、以前のサンプルの小さなエピソード記憶を維持し再生するリプレイベースのアプローチは、破滅的忘れに対する最も成功した戦略の1つである。 しかし、メモリ境界と非バウンドタスクが与えられた場合、忘れることは避けられないので、どのように忘れるかは継続的な学習の問題である。 したがって、単に破滅的な忘れることを避けるだけでなく、未熟な問題は、人間の記憶のメリットを保証しながら、合理的に忘れる方法である。 1.貯蔵効率 2. 一般化可能性、及び 3. 解釈可能性 これらを同時に実現するために,認知神経科学における記憶完全分離の最近の発見に触発された,連続学習のための新たなサリエンシ強化メモリ補完フレームワークを提案する。 具体的には,サリエンシマップの抽出とメモリエンコーディングにより,課題に最も重要な画像の一部をエピソードメモリに格納することを提案する。 新しいタスクを学ぶとき、メモリからの前のデータは、人間がエピソードメモリを完成させる方法にインスパイアされた適応データ生成モジュールによって影響される。 モジュールのパラメータはすべてのタスクで共有され、双方向最適化として連続学習分類器と共同でトレーニングすることができる。 複数の連続学習および画像分類ベンチマークに関する広範囲な実験により,提案手法の有効性と効率が実証された。

Continual Learning is considered a key step toward next-generation Artificial Intelligence. Among various methods, replay-based approaches that maintain and replay a small episodic memory of previous samples are one of the most successful strategies against catastrophic forgetting. However, since forgetting is inevitable given bounded memory and unbounded tasks, how to forget is a problem continual learning must address. Therefore, beyond simply avoiding catastrophic forgetting, an under-explored issue is how to reasonably forget while ensuring the merits of human memory, including 1. storage efficiency, 2. generalizability, and 3. some interpretability. To achieve these simultaneously, our paper proposes a new saliency-augmented memory completion framework for continual learning, inspired by recent discoveries in memory completion separation in cognitive neuroscience. Specifically, we innovatively propose to store the part of the image most important to the tasks in episodic memory by saliency map extraction and memory encoding. When learning new tasks, previous data from memory are inpainted by an adaptive data generation module, which is inspired by how humans complete episodic memory. The module's parameters are shared across all tasks and it can be jointly trained with a continual learning classifier as bilevel optimization. Extensive experiments on several continual learning and image classification benchmarks demonstrate the proposed method's effectiveness and efficiency.
翻訳日:2022-12-27 15:10:19 公開日:2022-12-26
# オンラインカーネル学習におけるカーネルアライメントの改善

Improved Kernel Alignment Regret Bound for Online Kernel Learning ( http://arxiv.org/abs/2212.12989v1 )

ライセンス: Link先を確認
Junfan Li and Shizhong Liao(参考訳) 本稿では,Hinge損失関数の仕組みにおいて,オンラインカーネル学習に拘束されるカーネルアライメントの後悔を改善する。 事前のアルゴリズムは、$O((\mathcal{A}_TT\ln{T})^{\frac{1}{4}})$O(\sqrt{\mathcal{A}_TT\ln{T}})$の計算複雑性(空間と単位時間)において、$O(\sqrt{\mathcal{A}_TT\ln{T}})$を後悔する。 本稿では,従来の結果よりも後悔と計算の複雑さが優れているアルゴリズムを提案する。 結果は,核行列の固有値の減衰速度に依存する。 核行列の固有値が指数関数的に減衰すると、我々のアルゴリズムは$O(\sqrt{\mathcal{A}_T})$の後悔を、$O(\ln^2{T})$の計算複雑性で楽しむ。 さもなくば、我々のアルゴリズムは$O((\mathcal{A}_TT)^{\frac{1}{4}})$の計算複雑性で$O(\sqrt{\mathcal{A}_TT})$の後悔を楽しむ。 我々はアルゴリズムをバッチ学習に拡張し、以前の$O(1/\sqrt{T})$境界を改善した$O(\frac{1}{T}\sqrt{\mathbb{E}[\mathcal{A}_T]})$余剰リスク境界を得る。

In this paper, we improve the kernel alignment regret bound for online kernel learning in the regime of the Hinge loss function. Previous algorithm achieves a regret of $O((\mathcal{A}_TT\ln{T})^{\frac{1}{4}})$ at a computational complexity (space and per-round time) of $O(\sqrt{\mathcal{A}_TT\ln{T}})$, where $\mathcal{A}_T$ is called \textit{kernel alignment}. We propose an algorithm whose regret bound and computational complexity are better than previous results. Our results depend on the decay rate of eigenvalues of the kernel matrix. If the eigenvalues of the kernel matrix decay exponentially, then our algorithm enjoys a regret of $O(\sqrt{\mathcal{A}_T})$ at a computational complexity of $O(\ln^2{T})$. Otherwise, our algorithm enjoys a regret of $O((\mathcal{A}_TT)^{\frac{1}{4}})$ at a computational complexity of $O(\sqrt{\mathcal{A}_TT})$. We extend our algorithm to batch learning and obtain a $O(\frac{1}{T}\sqrt{\mathbb{E}[\mathcal{A}_T]})$ excess risk bound which improves the previous $O(1/\sqrt{T})$ bound.
翻訳日:2022-12-27 15:00:28 公開日:2022-12-26
# gwo-fi:グレーウルフオプティマイザと頻繁な項目セットを組み合わせた新しい機械学習フレームワークによるケルマンシャヒアン心血管疾患患者の院内死亡率と滞在期間の診断と検討

GWO-FI: A novel machine learning framework by combining Gray Wolf Optimizer and Frequent Itemsets to diagnose and investigate effective factors on In-Hospital Mortality and Length of Stay among Kermanshahian Cardiovascular Disease patients ( http://arxiv.org/abs/2212.13048v1 )

ライセンス: Link先を確認
Ali Yavari, Parisa Janjani, Sayeh Motavaseli, Seyran Weysi, Soraya Siabani, Mohammad Rouzbahani(参考訳) 院内死亡率や滞在期間を含む患者の予後の調査と分析は、入院開始時の患者結果を判断するための臨床医の補助や、病院のリソース配分を支援する上で重要である。 本稿では,よく知られたオオカミのアルゴリズムとアソシエーションルールマイニングアルゴリズムによって抽出された頻繁な項目を組み合わせたアプローチを提案する。 まず、原特徴と識別的抽出頻度の高い項目を組み合わせる。 これらの特徴の最良のサブセットが選択され、使用する分類アルゴリズムのパラメータもグレーウルフアルゴリズムを使用して調整される。 この枠組みは、イランのイマーム・アリ・ケルマンシャー病院の2816人の患者からなる実際のデータセットを用いて評価された。 研究の結果は、エジェクション・フラクションの低下、老齢、CPK値の上昇、クレアチニン値の上昇が患者の死亡に寄与していることを示している。 病院における死亡率や滞在期間に関するいくつかの重要かつ興味深いルールも抽出・提示されている。 また,SVM分類器を用いた病院における死亡診断のためのフレームワークの精度,感度,特異性,オーロックは0.9961,0.9477,0.9992,0.9734であった。 フレームワークの発見によると、頻繁な項目を特徴として追加することで、分類精度が大幅に向上する。

Investigation and analysis of patient outcomes, including in-hospital mortality and length of stay, are crucial for assisting clinicians in determining a patient's result at the outset of their hospitalization and for assisting hospitals in allocating their resources. This paper proposes an approach based on combining the well-known gray wolf algorithm with frequent items extracted by association rule mining algorithms. First, original features are combined with the discriminative extracted frequent items. The best subset of these features is then chosen, and the parameters of the used classification algorithms are also adjusted, using the gray wolf algorithm. This framework was evaluated using a real dataset made up of 2816 patients from the Imam Ali Kermanshah Hospital in Iran. The study's findings indicate that low Ejection Fraction, old age, high CPK values, and high Creatinine levels are the main contributors to patients' mortality. Several significant and interesting rules related to mortality in hospitals and length of stay have also been extracted and presented. Additionally, the accuracy, sensitivity, specificity, and auroc of the proposed framework for the diagnosis of mortality in the hospital using the SVM classifier were 0.9961, 0.9477, 0.9992, and 0.9734, respectively. According to the framework's findings, adding frequent items as features considerably improves classification accuracy.
翻訳日:2022-12-27 14:59:59 公開日:2022-12-26
# 船舶性能予測の改善に向けて : 速度・電力関係をモデル化するサービス内船舶監視データの比較分析

Towards Improved Prediction of Ship Performance: A Comparative Analysis on In-service Ship Monitoring Data for Modeling the Speed-Power Relation ( http://arxiv.org/abs/2212.13061v1 )

ライセンス: Link先を確認
Simon DeKeyser, Casimir Morob\'e, Malte Mittendorf(参考訳) 船舶性能の正確なモデリングは、燃料消費を最適化し、その後排出を減らすために船舶業界にとって不可欠である。 しかし,実環境における速度・パワー関係の予測は依然として課題である。 本研究では,船体形状の異なる複数の船体からのサービス内監視データを用いて,データ駆動型機械学習(ml)アルゴリズムの精度と従来の船体性能評価手法との比較を行った。 本解析は,(1)運用データに適合した海面試験曲線と穏やかな水面曲線の比較,(2)mlを用いた複数波浪抵抗理論のベンチマークの2つの主成分からなる。 その結果、単純なニューラルネットワークは、最初の原則に従う半経験式よりも優れていた。 ニューラルネットワークは入力として操作データしか必要とせず、従来の方法では、しばしば使用できない広範な船種が必要だった。 これらの結果から,データ駆動型アルゴリズムは実用アプリケーションの出荷性能予測に有効である可能性が示唆された。

Accurate modeling of ship performance is crucial for the shipping industry to optimize fuel consumption and subsequently reduce emissions. However, predicting the speed-power relation in real-world conditions remains a challenge. In this study, we used in-service monitoring data from multiple vessels with different hull shapes to compare the accuracy of data-driven machine learning (ML) algorithms to traditional methods for assessing ship performance. Our analysis consists of two main parts: (1) a comparison of sea trial curves with calm-water curves fitted on operational data, and (2) a benchmark of multiple added wave resistance theories with an ML-based approach. Our results showed that a simple neural network outperformed established semi-empirical formulas following first principles. The neural network only required operational data as input, while the traditional methods required extensive ship particulars that are often unavailable. These findings suggest that data-driven algorithms may be more effective for predicting ship performance in practical applications.
翻訳日:2022-12-27 14:59:32 公開日:2022-12-26
# 四元系バックプロパゲーション

Quaternion Backpropagation ( http://arxiv.org/abs/2212.13082v1 )

ライセンス: Link先を確認
Johannes P\"oppelbaum, Andreas Schwung(参考訳) 四元数重畳ニューラルネットワークは、過去数年間、研究者から人気と関心が高まり、最適化に必要な四元数に対する微分は、実部と虚部に関する偏微分の和として計算される。 しかし、製品とチェーンルールがこのアプローチを保たないことを示すことはできる。 我々は、ghr計算とそれに基づく四元系バックプロパゲーションを用いることにより、これを解決する。 さらに, 四元系バックプロパゲーションの機能を実験的に証明した。

Quaternion valued neural networks experienced rising popularity and interest from researchers in the last years, whereby the derivatives with respect to quaternions needed for optimization are calculated as the sum of the partial derivatives with respect to the real and imaginary parts. However, we can show that product- and chain-rule does not hold with this approach. We solve this by employing the GHRCalculus and derive quaternion backpropagation based on this. Furthermore, we experimentally prove the functionality of the derived quaternion backpropagation.
翻訳日:2022-12-27 14:59:15 公開日:2022-12-26
# 行動類似性の適応的メタ学習による強化学習のための学習一般化表現

Learning Generalizable Representations for Reinforcement Learning via Adaptive Meta-learner of Behavioral Similarities ( http://arxiv.org/abs/2212.13088v1 )

ライセンス: Link先を確認
Jianda Chen, Sinno Jialin Pan(参考訳) 高レベルの視覚的観察から制御タスクを効果的に強化学習ベースで学習する方法は、実用的で困難な問題である。 この問題を解決する鍵は、効果的なポリシーを学ぶことができる観察から低次元の状態表現を学ぶことである。 状態符号化の学習を促進するために、最近の研究は状態表現間の動作の類似性を捉えたり、視覚的な観察にデータ拡張を適用することに焦点を当てている。 本稿では,強化学習における行動類似性に関する表現学習のためのメタラーナーベースフレームワークを提案する。 具体的には,高次元観測をマルコフ決定過程(mdp)における報酬とダイナミクスに関する2つの分解埋め込みに符号化する。 一対のメタリアナーが開発され、一方は報酬の類似性を定量化し、もう一方は対応する分解された埋め込みに対するダイナミクスの類似性を定量化する。 メタラーナーは自己学習して状態埋め込みを更新し、2つの解離項をオン・ポリチック・バイシミュレーション・メトリックで近似することで状態埋め込みを更新する。 報酬とダイナミクスの用語を組み込むため、私たちはさらに、異なるタスクや環境に基づいて彼らの影響を適応的にバランスさせる戦略を開発します。 提案手法は,従来のDM Control Suite,Distracting DM Control Suite,自動運転タスクCARLAなど,いくつかのベンチマークにおいて,最先端のベースラインよりも優れていることを示す。

How to learn an effective reinforcement learning-based model for control tasks from high-level visual observations is a practical and challenging problem. A key to solving this problem is to learn low-dimensional state representations from observations, from which an effective policy can be learned. In order to boost the learning of state encoding, recent works are focused on capturing behavioral similarities between state representations or applying data augmentation on visual observations. In this paper, we propose a novel meta-learner-based framework for representation learning regarding behavioral similarities for reinforcement learning. Specifically, our framework encodes the high-dimensional observations into two decomposed embeddings regarding reward and dynamics in a Markov Decision Process (MDP). A pair of meta-learners are developed, one of which quantifies the reward similarity and the other quantifies dynamics similarity over the correspondingly decomposed embeddings. The meta-learners are self-learned to update the state embeddings by approximating two disjoint terms in on-policy bisimulation metric. To incorporate the reward and dynamics terms, we further develop a strategy to adaptively balance their impacts based on different tasks or environments. We empirically demonstrate that our proposed framework outperforms state-of-the-art baselines on several benchmarks, including conventional DM Control Suite, Distracting DM Control Suite and a self-driving task CARLA.
翻訳日:2022-12-27 14:59:09 公開日:2022-12-26
# 大規模ゼロショット学習のためのセマンティック強化知識グラフ

Semantic Enhanced Knowledge Graph for Large-Scale Zero-Shot Learning ( http://arxiv.org/abs/2212.13151v1 )

ライセンス: Link先を確認
Jiwei Wei, Yang Yang, Zeyu Ma, Jingjing Li, Xing Xu, Heng Tao Shen(参考訳) Zero-Shot Learningは、ビジョンと言語分野の両方において、注目すべき研究トピックである。 近年,ほとんどの既存手法では,カテゴリ間の明示的相関をモデル化するために構造化知識情報を採用し,ディープグラフ畳み込みネットワークを用いてカテゴリ間の情報伝達を行っている。 しかし、既存の構造化知識グラフに新たなカテゴリを追加することは困難であり、ディープグラフ畳み込みネットワークは過度に滑らかな問題に悩まされる。 本稿では,専門知識とカテゴリー意味相関の両方を含む新しい意味的拡張知識グラフを提案する。 セマンティクス強化知識グラフは,カテゴリ間の相関をさらに強化し,新たなカテゴリを吸収しやすくする。 知識グラフに関する情報を伝達するために,我々はResidual Graph Convolutional Network (ResGCN)を提案する。 大規模なImageNet-21KデータセットとAWA2データセットを用いた実験は,本手法の有効性を示し,ゼロショット学習における新たな最先端技術を確立する。 さらに,様々な特徴抽出ネットワークを用いた大規模imagenet-21kの結果から,本手法の一般化とロバスト性が向上した。

Zero-Shot Learning has been a highlighted research topic in both vision and language areas. Recently, most existing methods adopt structured knowledge information to model explicit correlations among categories and use deep graph convolutional network to propagate information between different categories. However, it is difficult to add new categories to existing structured knowledge graph, and deep graph convolutional network suffers from over-smoothing problem. In this paper, we provide a new semantic enhanced knowledge graph that contains both expert knowledge and categories semantic correlation. Our semantic enhanced knowledge graph can further enhance the correlations among categories and make it easy to absorb new categories. To propagate information on the knowledge graph, we propose a novel Residual Graph Convolutional Network (ResGCN), which can effectively alleviate the problem of over-smoothing. Experiments conducted on the widely used large-scale ImageNet-21K dataset and AWA2 dataset show the effectiveness of our method, and establish a new state-of-the-art on zero-shot learning. Moreover, our results on the large-scale ImageNet-21K with various feature extraction networks show that our method has better generalization and robustness.
翻訳日:2022-12-27 14:53:27 公開日:2022-12-26
# MRTNet:ビデオセマンスグラウンドのためのマルチリゾリューション時間ネットワーク

MRTNet: Multi-Resolution Temporal Network for Video Sentence Grounding ( http://arxiv.org/abs/2212.13163v1 )

ライセンス: Link先を確認
Wei Ji, Long Chen, Yinwei Wei, Yiming Wu, Tat-Seng Chua(参考訳) 未編集のビデオと自然言語のクエリが与えられた場合、ビデオ文のグラウンド化は、ビデオ中のターゲット時間モーメントをローカライズすることを目的としている。 既存の手法では,1つの時間分解能に基づいて記述文とビデオセグメントのセマンティクスをマッチング・整合させ,異なる解像度で映像コンテンツの時間的一貫性を無視する。 本研究では,マルチモーダル特徴エンコーダ,マルチリゾリューション・テンポラル(MRT)モジュール,および予測モジュールで構成される,新しいマルチレゾリューション・テンポラルビデオ文グラウンドリングネットワーク MRTNetを提案する。 MRTモジュールはエンコーダとデコーダのネットワークであり、デコーダ部の出力機能はTransformerと連動して最終開始時刻と終了時刻を予測する。 特に、我々のMRTモジュールはホットプラグ可能であり、任意のアンカーフリーモデルにシームレスに組み込むことができる。 さらに,MRTモジュールのクロスモーダルな特徴を,フレームレベル,クリップレベル,シーケンスレベルという3つのスケールでより正確にグラウンド化するために,ハイブリッド損失を利用する。 3つの一般的なデータセットに対する大規模な実験は、MRTNetの有効性を示している。

Given an untrimmed video and natural language query, video sentence grounding aims to localize the target temporal moment in the video. Existing methods mainly tackle this task by matching and aligning semantics of the descriptive sentence and video segments on a single temporal resolution, while neglecting the temporal consistency of video content in different resolutions. In this work, we propose a novel multi-resolution temporal video sentence grounding network: MRTNet, which consists of a multi-modal feature encoder, a Multi-Resolution Temporal (MRT) module, and a predictor module. MRT module is an encoder-decoder network, and output features in the decoder part are in conjunction with Transformers to predict the final start and end timestamps. Particularly, our MRT module is hot-pluggable, which means it can be seamlessly incorporated into any anchor-free models. Besides, we utilize a hybrid loss to supervise cross-modal features in MRT module for more accurate grounding in three scales: frame-level, clip-level and sequence-level. Extensive experiments on three prevalent datasets have shown the effectiveness of MRTNet.
翻訳日:2022-12-27 14:53:07 公開日:2022-12-26
# 熱画像を用いた船舶の微視的セマンティックセグメンテーション

Weakly-Supervised Semantic Segmentation of Ships Using Thermal Imagery ( http://arxiv.org/abs/2212.13170v1 )

ライセンス: Link先を確認
Rushil Joshi, Ethan Adams, Matthew Ziemann, Christopher A. Metzler(参考訳) アメリカ合衆国海岸線は95,471マイルで、人力だけでは効果的にパトロールや確保ができない距離である。 赤外線カメラとディープラーニングベースのアルゴリズムを備えた無人航空機(uavs)は、興味のある物体、すなわち船を識別し分割するより効率的な選択肢である。 しかし、これらのアルゴリズムを訓練するための標準的なアプローチは、高密度にラベル付けされた赤外線海洋画像の大規模データセットを必要とする。 このようなデータセットは公開されておらず、大規模なデータセットのすべてのピクセルに手動でアノテートすることは、極端にコストがかかる。 本研究では, 船舶の赤外線画像のセグメンテーションにおいて, 少ないラベル付きデータによるアルゴリズムの弱い監督は, システム性能に最小限の影響を伴ってデータラベリングコストを大幅に削減できることを示した。 我々は海軍航空戦センター航空機部門(NAWCAD)から得られた7055赤外線画像のラベル付きデータセットに弱教師付き学習を適用した。 画像毎の32点のみをスパースラベルでラベル付けすることで、弱い教師付きセグメンテーションモデルでも、ジャカードスコアが最大0.756の船を効果的に検出およびセグメンテーションできることがわかった。

The United States coastline spans 95,471 miles; a distance that cannot be effectively patrolled or secured by manual human effort alone. Unmanned Aerial Vehicles (UAVs) equipped with infrared cameras and deep-learning based algorithms represent a more efficient alternative for identifying and segmenting objects of interest - namely, ships. However, standard approaches to training these algorithms require large-scale datasets of densely labeled infrared maritime images. Such datasets are not publicly available and manually annotating every pixel in a large-scale dataset would have an extreme labor cost. In this work we demonstrate that, in the context of segmenting ships in infrared imagery, weakly-supervising an algorithm with sparsely labeled data can drastically reduce data labeling costs with minimal impact on system performance. We apply weakly-supervised learning to an unlabeled dataset of 7055 infrared images sourced from the Naval Air Warfare Center Aircraft Division (NAWCAD). We find that by sparsely labeling only 32 points per image, weakly-supervised segmentation models can still effectively detect and segment ships, with a Jaccard score of up to 0.756.
翻訳日:2022-12-27 14:52:44 公開日:2022-12-26
# 大規模モデルのためのプロトタイプ誘導クロスタスク知識蒸留

Prototype-guided Cross-task Knowledge Distillation for Large-scale Models ( http://arxiv.org/abs/2212.13180v1 )

ライセンス: Link先を確認
Deng Li, Aming Wu, Yahong Han, Qi Tian(参考訳) 近年、大規模な事前訓練モデルでは、多くのタスクにおいてその利点が示されている。 しかし、計算の複雑さとストレージの要求が大きいため、大規模なモデルを現実のシーンに適用することは困難である。 一般的な解決策は知識蒸留であり、これは大規模なモデルを教師モデルとみなし、小さな学生モデルを訓練して競争性能を得るのに役立つ。 クロスタスク知識蒸留は、大規模事前学習モデルの応用シナリオを拡張する。 既存の知識蒸留作業は、グローバルレベルの特性を表す教師モデルの最終的な予測や中間層を直接模倣することに焦点を当てており、タスク固有である。 異なるラベル空間の制約を緩和するために、不変な内在的な局所的対象特性(牛や馬の足と尾の形状特性など)を捉えることが重要な役割を果たす。 実シーンタスクの複雑さと可変性を考慮して,大規模教師ネットワークの固有のローカルレベルのオブジェクト知識を様々なタスクシナリオに転送するプロトタイプ誘導クロスタスク知識蒸留(ProC-KD)アプローチを提案する。 まず,教師モデルにおける汎用知識をクロスタスクシナリオでよりよく伝達するために,教師モデルにおけるオブジェクトの本質的特徴表現から学習するためのプロトタイプ学習モジュールを提案する。 次に,多様な下流課題に対して,学習した一般化プロトタイプ機能を用いて学習モデルの特徴を高めるタスク適応機能拡張モジュールを提案し,その一般化能力を向上させるための学習モデルのトレーニングを指導する。 各種視覚課題に対する実験結果から,大規模モデルのクロスタスク知識蒸留シーンに対するアプローチの有効性が示された。

Recently, large-scale pre-trained models have shown their advantages in many tasks. However, due to the huge computational complexity and storage requirements, it is challenging to apply the large-scale model to real scenes. A common solution is knowledge distillation which regards the large-scale model as a teacher model and helps to train a small student model to obtain a competitive performance. Cross-task Knowledge distillation expands the application scenarios of the large-scale pre-trained model. Existing knowledge distillation works focus on directly mimicking the final prediction or the intermediate layers of the teacher model, which represent the global-level characteristics and are task-specific. To alleviate the constraint of different label spaces, capturing invariant intrinsic local object characteristics (such as the shape characteristics of the leg and tail of the cattle and horse) plays a key role. Considering the complexity and variability of real scene tasks, we propose a Prototype-guided Cross-task Knowledge Distillation (ProC-KD) approach to transfer the intrinsic local-level object knowledge of a large-scale teacher network to various task scenarios. First, to better transfer the generalized knowledge in the teacher model in cross-task scenarios, we propose a prototype learning module to learn from the essential feature representation of objects in the teacher model. Secondly, for diverse downstream tasks, we propose a task-adaptive feature augmentation module to enhance the features of the student model with the learned generalization prototype features and guide the training of the student model to improve its generalization ability. The experimental results on various visual tasks demonstrate the effectiveness of our approach for large-scale model cross-task knowledge distillation scenes.
翻訳日:2022-12-27 14:52:24 公開日:2022-12-26
# 完全微分可能なRANSAC

Fully Differentiable RANSAC ( http://arxiv.org/abs/2212.13185v1 )

ライセンス: Link先を確認
Tong Wei, Yash Patel, Jiri Matas, Daniel Barath(参考訳) そこで本研究では,入力データ点の異常確率を予測し,誘導サンプラーの予測を活用し,モデルパラメータ(基本行列など)とその品質を推定し,手続き全体の勾配を伝播する。 $\nabla$-RANSACのランダムサンプリングは、利口な再パラメータ化戦略、すなわちGumbel Softmaxサンプルに基づいており、これにより勾配を直接、微分可能な最小解法へと伝播することができる。 モデル品質関数は、$\nabla$-RANSACで見積もるすべてのモデルのスコアから、ネットワーク学習の正確かつ有用な確率を導出する。 $\nabla$-RANSACは、幾何学的推定パイプラインのエンドツーエンドトレーニングを最初にアンロックし、特徴検出、マッチング、RANSAC風のランダム化ロバスト推定を含む。 その可能性の証明として、我々はLoFTR、すなわち最近の検出器なし特徴整合器と共に$\nabla$-RANSACを訓練し、エンドツーエンドで信頼できる対応を見つける。 基本的および本質的な行列推定に基づいて,多数の実世界のデータセット上で$\nabla$-RANSACをテストする。 精度の面では最先端の手法よりも優れているが、最速の手法である。 コードとトレーニングされたモデルは公開されます。

We propose the fully differentiable $\nabla$-RANSAC.It predicts the inlier probabilities of the input data points, exploits the predictions in a guided sampler, and estimates the model parameters (e.g., fundamental matrix) and its quality while propagating the gradients through the entire procedure. The random sampler in $\nabla$-RANSAC is based on a clever re-parametrization strategy, i.e.\ the Gumbel Softmax sampler, that allows propagating the gradients directly into the subsequent differentiable minimal solver. The model quality function marginalizes over the scores from all models estimated within $\nabla$-RANSAC to guide the network learning accurate and useful probabilities.$\nabla$-RANSAC is the first to unlock the end-to-end training of geometric estimation pipelines, containing feature detection, matching and RANSAC-like randomized robust estimation. As a proof of its potential, we train $\nabla$-RANSAC together with LoFTR, i.e. a recent detector-free feature matcher, to find reliable correspondences in an end-to-end manner. We test $\nabla$-RANSAC on a number of real-world datasets on fundamental and essential matrix estimation. It is superior to the state-of-the-art in terms of accuracy while being among the fastest methods. The code and trained models will be made public.
翻訳日:2022-12-27 14:52:00 公開日:2022-12-26
# dsi2i: 画像対画像変換のための密集したスタイル

DSI2I: Dense Style for Unpaired Image-to-Image Translation ( http://arxiv.org/abs/2212.13253v1 )

ライセンス: Link先を確認
Baran Ozaydin, Tong Zhang, Sabine Susstrunk, Mathieu Salzmann(参考訳) unpaired exemplar-based image-to-image (uei2i)翻訳は、対象画像exemplarのスタイルでソース画像を対象画像ドメインに翻訳することを目的としている。 既存のUEI2Iメソッドは、グローバル、イメージレベルの特徴ベクトルまたはオブジェクトインスタンス/クラス毎に1つのベクトルを使用してスタイルを表現するが、シーンセマンティクスの知識を必要とする。 そこで,本稿では,スタイルを高密度特徴マップとして表現し,外部の意味情報を必要とせず,より詳細なソース画像への転送を可能にすることを提案する。 次に、私たちは知覚的および敵対的損失に依存して、密集したスタイルとコンテンツ表現を区別し、教師なしのクロスドメイン意味対応を利用して、exemplarスタイルをソースコンテンツに警告します。 標準メトリクスを用いた2つのデータセットにおける本手法の有効性を,類型的手法による新しい局所的距離計測スタイル類似性とともに実証する。 以上の結果から,本手法が生成する翻訳文は,原文内容を維持しつつ,最先端手法よりも多種多様であり,模範に近いことが判明した。

Unpaired exemplar-based image-to-image (UEI2I) translation aims to translate a source image to a target image domain with the style of a target image exemplar, without ground-truth input-translation pairs. Existing UEI2I methods represent style using either a global, image-level feature vector, or one vector per object instance/class but requiring knowledge of the scene semantics. Here, by contrast, we propose to represent style as a dense feature map, allowing for a finer-grained transfer to the source image without requiring any external semantic information. We then rely on perceptual and adversarial losses to disentangle our dense style and content representations, and exploit unsupervised cross-domain semantic correspondences to warp the exemplar style to the source content. We demonstrate the effectiveness of our method on two datasets using standard metrics together with a new localized style metric measuring style similarity in a class-wise manner. Our results evidence that the translations produced by our approach are more diverse and closer to the exemplars than those of the state-of-the-art methods while nonetheless preserving the source content.
翻訳日:2022-12-27 14:51:36 公開日:2022-12-26
# smmix:視覚トランスフォーマーのための自己モチベーション画像混合

SMMix: Self-Motivated Image Mixing for Vision Transformers ( http://arxiv.org/abs/2212.12977v1 )

ライセンス: Link先を確認
Mengzhao Chen, Mingbao Lin, ZhiHang Lin, Yuxin Zhang, Fei Chao, Rongrong Ji(参考訳) CutMixは視覚変換器(ViT)の性能と一般化能力を決定する重要な拡張戦略である。 しかし、混合画像と対応するラベルとの矛盾は、その有効性を損なう。 既存のCutMixの変種は、より一貫性のある混合画像やより正確な混合ラベルを生成することでこの問題に対処するが、必然的に重いトレーニングオーバーヘッドや追加の情報を必要とし、使いやすさを損なう。 そこで本研究では,学習モデルによる画像強調とラベル強調の両方をモチベーションとする効率的かつ効果的な自己モチベーション画像混合法(smmix)を提案する。 具体的には,混合画像中の注意対象を豊かにするための最大注意領域混合手法を提案する。 そこで我々は,混合画像の出力トークンをきめ細かい監督でコトレーニングする,きめ細かいラベル割り当て手法を提案する。 さらに,混合画像と非混合画像から特徴を整合させるために,新たな特徴一貫性制約を考案する。 自己モチベーションパラダイムの微妙な設計のため、我々のSMMixは訓練のオーバーヘッドが小さく、他のCutMixの亜種よりも性能が良い。 特に、SMMixは、ImageNet-1k上で、DeiT-T/S、CaiT-XXS-24/36、PVT-T/S/M/Lの精度を+1%以上改善する。 本手法の一般化機能は,ダウンストリームタスクやアウトオブディストリビューションデータセットでも実証されている。 このプロジェクトのコードはhttps://github.com/chenmnz/smmixで入手できる。

CutMix is a vital augmentation strategy that determines the performance and generalization ability of vision transformers (ViTs). However, the inconsistency between the mixed images and the corresponding labels harms its efficacy. Existing CutMix variants tackle this problem by generating more consistent mixed images or more precise mixed labels, but inevitably introduce heavy training overhead or require extra information, undermining ease of use. To this end, we propose an efficient and effective Self-Motivated image Mixing method (SMMix), which motivates both image and label enhancement by the model under training itself. Specifically, we propose a max-min attention region mixing approach that enriches the attention-focused objects in the mixed images. Then, we introduce a fine-grained label assignment technique that co-trains the output tokens of mixed images with fine-grained supervision. Moreover, we devise a novel feature consistency constraint to align features from mixed and unmixed images. Due to the subtle designs of the self-motivated paradigm, our SMMix is significant in its smaller training overhead and better performance than other CutMix variants. In particular, SMMix improves the accuracy of DeiT-T/S, CaiT-XXS-24/36, and PVT-T/S/M/L by more than +1% on ImageNet-1k. The generalization capability of our method is also demonstrated on downstream tasks and out-of-distribution datasets. Code of this project is available at https://github.com/ChenMnZ/SMMix.
翻訳日:2022-12-27 14:43:00 公開日:2022-12-26
# 一貫性制約とシグナー除去による連続手話認識の改善

Improving Continuous Sign Language Recognition with Consistency Constraints and Signer Removal ( http://arxiv.org/abs/2212.13023v1 )

ライセンス: Link先を確認
Ronglai Zuo and Brian Mak(参考訳) ほとんどのディープラーニングベースの連続手話認識(CSLR)モデルは、視覚モジュール、シーケンシャルモジュール、アライメントモジュールからなる同様のバックボーンを共有している。 しかし、訓練サンプルが限られているため、コネクショニストの時間的分類損失はCSLRバックボーンを十分に訓練することができない。 本研究では,CSLRバックボーンを強化するための3つの補助タスクを提案する。 最初のタスクは、一貫性の観点から、不十分なトレーニング問題に敏感な視覚モジュールを強化する。 具体的には、手話の情報は主に署名者の表情や手の動きに含まれているため、視覚モジュールに情報領域、すなわち空間的注意一貫性を集中させるキーポイント誘導空間注意モジュールが開発されている。 第二に、視覚的およびシーケンシャルなモジュールの出力特徴が同じ文を表すことに気付き、バックボーンのパワーをよりよく活用するために、視覚的およびシーケンシャルなモジュール間の文埋め込み一貫性制約を課し、両方の特徴の表現力を高める。 我々は、上記の補助タスクで訓練されたCSLRモデルを、整合性強化CSLRと呼び、すべてのシグナがトレーニングとテストの両方の間に現れるシグナ依存データセットでうまく機能する。 さらに、シグナー非依存設定をより堅牢にするため、特徴異方性に基づくシグナー除去モジュールを提案し、シグナー情報をバックボーンから削除する。 これらの補助作業の有効性を検証するために広範なアブレーション研究が行われている。 さらに、トランスフォーマーベースのバックボーンにより、PHOENIX-2014、PHOENIX-2014-T、PHOENIX-2014-SI、CSL、CSL-Dailyの5つのベンチマークで、最先端または競合的なパフォーマンスを達成する。

Most deep-learning-based continuous sign language recognition (CSLR) models share a similar backbone consisting of a visual module, a sequential module, and an alignment module. However, due to limited training samples, a connectionist temporal classification loss may not train such CSLR backbones sufficiently. In this work, we propose three auxiliary tasks to enhance the CSLR backbones. The first task enhances the visual module, which is sensitive to the insufficient training problem, from the perspective of consistency. Specifically, since the information of sign languages is mainly included in signers' facial expressions and hand movements, a keypoint-guided spatial attention module is developed to enforce the visual module to focus on informative regions, i.e., spatial attention consistency. Second, noticing that both the output features of the visual and sequential modules represent the same sentence, to better exploit the backbone's power, a sentence embedding consistency constraint is imposed between the visual and sequential modules to enhance the representation power of both features. We name the CSLR model trained with the above auxiliary tasks as consistency-enhanced CSLR, which performs well on signer-dependent datasets in which all signers appear during both training and testing. To make it more robust for the signer-independent setting, a signer removal module based on feature disentanglement is further proposed to remove signer information from the backbone. Extensive ablation studies are conducted to validate the effectiveness of these auxiliary tasks. More remarkably, with a transformer-based backbone, our model achieves state-of-the-art or competitive performance on five benchmarks, PHOENIX-2014, PHOENIX-2014-T, PHOENIX-2014-SI, CSL, and CSL-Daily.
翻訳日:2022-12-27 14:42:30 公開日:2022-12-26
# 顔の認識に関する調査

A Survey of Face Recognition ( http://arxiv.org/abs/2212.13038v1 )

ライセンス: Link先を確認
Xinyi Wang, Jianteng Peng, Sufang Zhang, Bihui Chen, Yi Wang, Yandong Guo(参考訳) 近年、深層畳み込みニューラルネットワークによる顔認識のブレークスルーが見られた。 FR分野の多くの論文が毎年発行されている。 そのいくつかは産業社会に応用され、デバイスアンロックやモバイル支払いなど、人間の生活において重要な役割を果たした。 本稿では,その歴史,パイプライン,従来の手動設計機能やディープラーニングに基づくアルゴリズム,主流トレーニング,評価データセット,関連するアプリケーションなど,顔認識について紹介する。 我々は、できるだけ多くの最先端の作業を分析し比較し、バックボーンサイズとデータ分布の影響を調べるための実験セットを慎重に設計した。 本調査は,fg2023の産業分野における実用的顔認識技術(practical face recognition technology)というチュートリアルの教材である。

Recent years witnessed the breakthrough of face recognition with deep convolutional neural networks. Dozens of papers in the field of FR are published every year. Some of them were applied in the industrial community and played an important role in human life such as device unlock, mobile payment, and so on. This paper provides an introduction to face recognition, including its history, pipeline, algorithms based on conventional manually designed features or deep learning, mainstream training, evaluation datasets, and related applications. We have analyzed and compared state-of-the-art works as many as possible, and also carefully designed a set of experiments to find the effect of backbone size and data distribution. This survey is a material of the tutorial named The Practical Face Recognition Technology in the Industrial World in the FG2023.
翻訳日:2022-12-27 14:41:58 公開日:2022-12-26
# MonoNeRF:モノクロビデオから一般化可能な動的放射場を学習する

MonoNeRF: Learning a Generalizable Dynamic Radiance Field from Monocular Videos ( http://arxiv.org/abs/2212.13056v1 )

ライセンス: Link先を確認
Fengrui Tian, Shaoyi Du, Yueqi Duan(参考訳) 本稿では,単眼映像から一般化可能な動的放射能場を学習する問題を対象とする。 複数のビューに基づく既存のnerfメソッドと異なり、単眼ビデオは各タイムスタンプで1つのビューしか含んでおらず、ポイント特徴やシーンフローの推定において、ビュー方向に沿ってあいまいさに苦しむ。 DynNeRFのような従来の研究では、位置符号化による不明瞭な点の特徴は伝達不可能であり、一般化能力を著しく制限している。 結果として、これらの手法は各シーンの独立したモデルを訓練し、実世界のアプリケーションで単眼ビデオの増加に適用する場合、計算コストがかかる。 これに対処するために,モノナーフでは,ポイントの軌跡とフレーム間の特徴対応制約により,ポイントの特徴とシーンフローを同時に学習する。 より具体的には、時間的特徴から点軌道を推定するために暗黙の速度場を学習し、その後にフローベースの特徴集約モジュールが続き、点軌道に沿った空間的特徴を得る。 ネットワークをエンドツーエンドでトレーニングすることで,時間的および空間的特徴を協調的に最適化する。 実験の結果、MonoNeRFは複数のシーンから学習でき、シーン編集、見えないフレーム合成、高速な新規シーン適応などの新しいアプリケーションをサポートしています。

In this paper, we target at the problem of learning a generalizable dynamic radiance field from monocular videos. Different from most existing NeRF methods that are based on multiple views, monocular videos only contain one view at each timestamp, thereby suffering from ambiguity along the view direction in estimating point features and scene flows. Previous studies such as DynNeRF disambiguate point features by positional encoding, which is not transferable and severely limits the generalization ability. As a result, these methods have to train one independent model for each scene and suffer from heavy computational costs when applying to increasing monocular videos in real-world applications. To address this, We propose MonoNeRF to simultaneously learn point features and scene flows with point trajectory and feature correspondence constraints across frames. More specifically, we learn an implicit velocity field to estimate point trajectory from temporal features with Neural ODE, which is followed by a flow-based feature aggregation module to obtain spatial features along the point trajectory. We jointly optimize temporal and spatial features by training the network in an end-to-end manner. Experiments show that our MonoNeRF is able to learn from multiple scenes and support new applications such as scene editing, unseen frame synthesis, and fast novel scene adaptation.
翻訳日:2022-12-27 14:41:48 公開日:2022-12-26
# 大面積空中画像における効率的な物体検出法

Fewer is More: Efficient Object Detection in Large Aerial Images ( http://arxiv.org/abs/2212.13136v1 )

ライセンス: Link先を確認
Xingxing Xie, Gong Cheng, Qingyang Li, Shicheng Miao, Ke Li, Junwei Han(参考訳) 現在主流となっている大型空中画像の物体検出方法は、通常、大きな画像をパッチに分割し、すべてのパッチで関心のある物体を徹底的に検出する。 このパラダイムは効果的ではあるが、検出者は全てのパッチを通す必要があり、推論速度を著しく阻害するため、非効率である。 本稿では,検出者がより少ないパッチに焦点を合わせるのに役立ちながら,より効率的な推論とより正確な結果が得られるように,大規模画像におけるオブジェクト検出の簡易かつ効果的な解法を実現するために,Objectness Activation Network(OAN)を提案する。 簡単に言うと、OANは、各パッチにオブジェクトが含まれているかどうかを判断するための、軽量で完全な畳み込みネットワークである。 我々は5つの先進検出器でOANを広範囲に評価した。 OANを用いて、5つの検出器は3つの大規模空中画像データセットで30.0%以上のスピードアップを獲得し、精度は一貫して改善された。 非常に大きなGaofen-2画像(29200$\times$27620ピクセル)では、OANは検出速度を70.5%向上させる。 さらに,oanをドライブシーン物体検出と4k映像物体検出に拡張し,精度を犠牲にすることなく検出速度を112.1%,75.0%向上させた。 コードはhttps://github.com/ranchosky/oanで入手できる。

Current mainstream object detection methods for large aerial images usually divide large images into patches and then exhaustively detect the objects of interest on all patches, no matter whether there exist objects or not. This paradigm, although effective, is inefficient because the detectors have to go through all patches, severely hindering the inference speed. This paper presents an Objectness Activation Network (OAN) to help detectors focus on fewer patches but achieve more efficient inference and more accurate results, enabling a simple and effective solution to object detection in large images. In brief, OAN is a light fully-convolutional network for judging whether each patch contains objects or not, which can be easily integrated into many object detectors and jointly trained with them end-to-end. We extensively evaluate our OAN with five advanced detectors. Using OAN, all five detectors acquire more than 30.0% speed-up on three large-scale aerial image datasets, meanwhile with consistent accuracy improvements. On extremely large Gaofen-2 images (29200$\times$27620 pixels), our OAN improves the detection speed by 70.5%. Moreover, we extend our OAN to driving-scene object detection and 4K video object detection, boosting the detection speed by 112.1% and 75.0%, respectively, without sacrificing the accuracy. Code is available at https://github.com/Ranchosky/OAN.
翻訳日:2022-12-27 14:41:07 公開日:2022-12-26
# textbox 2.0: 事前学習された言語モデルを持つテキスト生成ライブラリ

TextBox 2.0: A Text Generation Library with Pre-trained Language Models ( http://arxiv.org/abs/2212.13005v1 )

ライセンス: Link先を確認
Tianyi Tang, Junyi Li, Zhipeng Chen, Yiwen Hu, Zhuohao Yu, Wenxun Dai, Zican Dong, Xiaoxue Cheng, Yuhao Wang, Wayne Xin Zhao, Jian-Yun Nie, and Ji-Rong Wen(参考訳) 本稿では,テキスト生成の研究を容易にするために,事前学習言語モデル(PLM)の利用に着目した,包括的で統一化されたTextBox 2.0を提案する。 このライブラリには、一般的なテキスト生成タスクと、それに対応する8ドルのデータセットが含まれており、さらに一般、翻訳、中国語、対話、制御可能、蒸留、プロンプト、軽量のPLMをカバーする45ドルのPLMが組み込まれています。 また、効率的なトレーニング戦略を4ドルで実装し、スクラッチから新しいPLMを事前トレーニングするための4ドル世代目標を提供します。 統一するために、研究パイプライン全体をサポートするインターフェース(データローディングからトレーニングと評価まで)を設計し、各ステップが統一された方法で実行可能であることを保証します。 豊富な機能にもかかわらず、フレンドリーなpython apiまたはコマンドラインを介して、ライブラリを簡単に利用できます。 図書館の有効性を検証するため,大規模な実験を行い,4種類の研究シナリオを実証した。 プロジェクトはリンクでリリースされた。 https://github.com/RUCAIBox/TextBox。

To facilitate research on text generation, this paper presents a comprehensive and unified library, TextBox 2.0, focusing on the use of pre-trained language models (PLMs). To be comprehensive, our library covers $13$ common text generation tasks and their corresponding $83$ datasets and further incorporates $45$ PLMs covering general, translation, Chinese, dialogue, controllable, distilled, prompting, and lightweight PLMs. We also implement $4$ efficient training strategies and provide $4$ generation objectives for pre-training new PLMs from scratch. To be unified, we design the interfaces to support the entire research pipeline (from data loading to training and evaluation), ensuring that each step can be fulfilled in a unified way. Despite the rich functionality, it is easy to use our library, either through the friendly Python API or command line. To validate the effectiveness of our library, we conduct extensive experiments and exemplify four types of research scenarios. The project is released at the link: https://github.com/RUCAIBox/TextBox.
翻訳日:2022-12-27 14:26:44 公開日:2022-12-26
# 臨床知識をエンコードした大規模言語モデル

Large Language Models Encode Clinical Knowledge ( http://arxiv.org/abs/2212.13138v1 )

ライセンス: Link先を確認
Karan Singhal, Shekoofeh Azizi, Tao Tu, S. Sara Mahdavi, Jason Wei, Hyung Won Chung, Nathan Scales, Ajay Tanwani, Heather Cole-Lewis, Stephen Pfohl, Perry Payne, Martin Seneviratne, Paul Gamble, Chris Kelly, Nathaneal Scharli, Aakanksha Chowdhery, Philip Mansfield, Blaise Aguera y Arcas, Dale Webster, Greg S. Corrado, Yossi Matias, Katherine Chou, Juraj Gottweis, Nenad Tomasev, Yun Liu, Alvin Rajkomar, Joelle Barral, Christopher Semturs, Alan Karthikesalingam, Vivek Natarajan(参考訳) 大規模言語モデル (LLM) は, 自然言語の理解と生成において顕著な能力を示したが, 医療・臨床応用における品質基準は高い。 今日では、モデルの臨床知識を評価する試みは、通常は限られたベンチマークによる自動評価に依存している。 さまざまなタスクにわたってモデル予測や推論を評価する標準はありません。 これを解決するために、専門家の診察、研究、消費者の問い合わせにまたがる6つの既存のオープンな質問応答データセットを組み合わせたベンチマークであるMultiMedQAと、オンラインで検索された新しい無料の医療質問データセットであるHealthSearchQAを紹介する。 本稿では, 現実性, 正確性, 潜在的害, バイアスを含む複数の軸に沿ったモデル回答の人為的評価のための枠組みを提案する。 さらに,MultiMedQA 上で PaLM (540ビリオンパラメータ LLM) と命令調整型 Flan-PaLM の評価を行った。 flan-palmはプロンプト戦略を組み合わせることで、medqa、medmcqa、pubmedqa、mmlu臨床トピックのすべてのマルチメダカマルチチョイスデータセットにおいて最先端の精度を実現し、67.6%のmedqa(us medical license examination question)の精度を17%以上向上させた。 しかしながら、人間の評価はFlan-PaLM応答における重要なギャップを明らかにする。 これを解決するために,いくつかの例を用いてLLMを新しい領域に整列するパラメータ効率の手法である命令プロンプトチューニングを導入する。 結果として得られたモデルであるMed-PaLMは、積極的に行動するが、臨床医には劣っている。 モデルスケールとインストラクション・プロンプト・チューニングにより理解,知識のリコール,医学的推論が改善し,医学におけるllmの潜在的有用性が示唆された。 臨床応用のための安全で有用なllmモデルの作成において,評価フレームワークと手法開発の両方の重要性を補強し,今日のモデルの重要な限界を明らかにする。

Large language models (LLMs) have demonstrated impressive capabilities in natural language understanding and generation, but the quality bar for medical and clinical applications is high. Today, attempts to assess models' clinical knowledge typically rely on automated evaluations on limited benchmarks. There is no standard to evaluate model predictions and reasoning across a breadth of tasks. To address this, we present MultiMedQA, a benchmark combining six existing open question answering datasets spanning professional medical exams, research, and consumer queries; and HealthSearchQA, a new free-response dataset of medical questions searched online. We propose a framework for human evaluation of model answers along multiple axes including factuality, precision, possible harm, and bias. In addition, we evaluate PaLM (a 540-billion parameter LLM) and its instruction-tuned variant, Flan-PaLM, on MultiMedQA. Using a combination of prompting strategies, Flan-PaLM achieves state-of-the-art accuracy on every MultiMedQA multiple-choice dataset (MedQA, MedMCQA, PubMedQA, MMLU clinical topics), including 67.6% accuracy on MedQA (US Medical License Exam questions), surpassing prior state-of-the-art by over 17%. However, human evaluation reveals key gaps in Flan-PaLM responses. To resolve this we introduce instruction prompt tuning, a parameter-efficient approach for aligning LLMs to new domains using a few exemplars. The resulting model, Med-PaLM, performs encouragingly, but remains inferior to clinicians. We show that comprehension, recall of knowledge, and medical reasoning improve with model scale and instruction prompt tuning, suggesting the potential utility of LLMs in medicine. Our human evaluations reveal important limitations of today's models, reinforcing the importance of both evaluation frameworks and method development in creating safe, helpful LLM models for clinical applications.
翻訳日:2022-12-27 14:26:26 公開日:2022-12-26
# 生成型事前学習変換器を用いた生体設計概念生成

Biologically Inspired Design Concept Generation Using Generative Pre-Trained Transformers ( http://arxiv.org/abs/2212.13196v1 )

ライセンス: Link先を確認
Qihao Zhu, Xinyu Zhang, Jianxi Luo(参考訳) 自然界の生物システムは環境に適応し生き残るために何百万年も進化してきた。 彼らが開発した多くの機能は、現代の産業における技術的な問題を解決するのにインスピレーションを与え、有益である。 これはバイオインスパイアドデザイン(bid)と呼ばれる特定のデザイン・バイ・アナロジーに繋がる。 設計手法としてのBIDは有用であることが証明されているが、生物学と工学のギャップは設計者が効果的に適用するのを継続的に妨げている。 そこで我々は,このギャップを埋めるためのデータ駆動型アプローチとして,人工知能(AI)の最近の進歩を探求する。 本稿では,生物アナロジーの自動検索とマッピングを行い,自然言語形式の入札を生成するための生成前訓練言語モデル(plm)に基づく生成設計手法を提案する。 最新の生成前訓練トランスであるGPT-3がベースPLMとして使用されている。 問題空間表現のゆるさに応じて、3種類の設計概念生成器をPLMから同定し、微調整する。 マシン評価器は、生成されたBID概念内のドメイン間のマッピング関連性を評価するために微調整される。 提案手法は, コンセプト設計段階において, 軽量空飛ぶ車を設計するための実世界のプロジェクトとして評価され, 採用されている。

Biological systems in nature have evolved for millions of years to adapt and survive the environment. Many features they developed can be inspirational and beneficial for solving technical problems in modern industries. This leads to a specific form of design-by-analogy called bio-inspired design (BID). Although BID as a design method has been proven beneficial, the gap between biology and engineering continuously hinders designers from effectively applying the method. Therefore, we explore the recent advance of artificial intelligence (AI) for a data-driven approach to bridge the gap. This paper proposes a generative design approach based on the generative pre-trained language model (PLM) to automatically retrieve and map biological analogy and generate BID in the form of natural language. The latest generative pre-trained transformer, namely GPT-3, is used as the base PLM. Three types of design concept generators are identified and fine-tuned from the PLM according to the looseness of the problem space representation. Machine evaluators are also fine-tuned to assess the mapping relevancy between the domains within the generated BID concepts. The approach is evaluated and then employed in a real-world project of designing light-weighted flying cars during its conceptual design phase The results show our approach can generate BID concepts with good performance.
翻訳日:2022-12-27 14:25:35 公開日:2022-12-26
# 最適化問題の自動定式化のための入力中のハイライト名前付きエンティティ

Highlighting Named Entities in Input for Auto-Formulation of Optimization Problems ( http://arxiv.org/abs/2212.13201v1 )

ライセンス: Link先を確認
Neeraj Gangwar and Nickvash Kani(参考訳) 運用研究は、数学的最適化問題として現実世界の問題のモデリングと解決を扱っている。 数学のシステムを解くことは分析ソフトウェアによって行われるが、数学の操作の集合として問題を定式化するのはドメインの専門家が手作業で行うのが一般的である。 しかし、最近の機械学習モデルでは、テキスト上の問題記述を対応する数学的定式化に変換することが約束されている。 本稿では,線形計画語問題を構造化され,最適化解法で使用可能な意味表現に変換する手法を提案する。 提案手法では,NL4Optコンペティションの2番目のタスク(https://nl4opt.github.io)を勝ち取り,入力を拡大し,最先端の精度を達成する。

Operations research deals with modeling and solving real-world problems as mathematical optimization problems. While solving mathematical systems is accomplished by analytical software, formulating a problem as a set of mathematical operations has been typically done manually by domain experts. However, recent machine learning models have shown promise in converting textual problem descriptions to corresponding mathematical formulations. In this paper, we present an approach that converts linear programming word problems into meaning representations that are structured and can be used by optimization solvers. Our approach uses the named entity-based enrichment to augment the input and achieves state-of-the-art accuracy, winning the second task of the NL4Opt competition (https://nl4opt.github.io).
翻訳日:2022-12-27 14:25:18 公開日:2022-12-26
# コメント者特性を考慮した攻撃的ニュースコメントのパーソナライズ予測

Personalized Prediction of Offensive News Comments by Considering the Characteristics of Commenters ( http://arxiv.org/abs/2212.13205v1 )

ライセンス: Link先を確認
Teruki Nakahara and Taketoshi Ushiama(参考訳) ソーシャルネットワークサービスやニュースサイトでニュース記事を読むと、読者はこれらの記事に他の人がマークしたコメントを見ることができる。 これらのコメントを読むことで、読者はニュースに関する世論を理解することができ、ニュースの全体像を理解するのに役立つことが多い。 しかし、これらのコメントは読者が読むのが好まない攻撃的な言語を含んでいることが多い。 本研究は,このような不快なコメントを予測し,コメントを読みながら読者体験の質を向上させることを目的としている。 提案手法は,読者の価値観の多様性を考慮して,読者が過去に「攻撃的」と評した少数のニュースコメントからのフィードバックに基づいて,各読者に対する攻撃的ニュースコメントを予測する。 さらに,ニュースコメントにおける単語や話題に依存しない予測を行うために,コメンタの特性を考慮した機械学習モデルを用いた。 提案手法の実験結果から,予測に使用する読者のフィードバックデータが限られている場合でも,予測がパーソナライズ可能であることが示された。 特に,提案手法はコメント者の特性を考慮したものであり,攻撃的コメントを誤検出する確率は低い。

When reading news articles on social networking services and news sites, readers can view comments marked by other people on these articles. By reading these comments, a reader can understand the public opinion about the news, and it is often helpful to grasp the overall picture of the news. However, these comments often contain offensive language that readers do not prefer to read. This study aims to predict such offensive comments to improve the quality of the experience of the reader while reading comments. By considering the diversity of the readers' values, the proposed method predicts offensive news comments for each reader based on the feedback from a small number of news comments that the reader rated as "offensive" in the past. In addition, we used a machine learning model that considers the characteristics of the commenters to make predictions, independent of the words and topics in news comments. The experimental results of the proposed method show that prediction can be personalized even when the amount of readers' feedback data used in the prediction is limited. In particular, the proposed method, which considers the commenters' characteristics, has a low probability of false detection of offensive comments.
翻訳日:2022-12-27 14:25:04 公開日:2022-12-26
# 胸部x線診断による新型コロナウイルスの診断

Diagnosis of COVID-19 based on Chest Radiography ( http://arxiv.org/abs/2212.13032v1 )

ライセンス: Link先を確認
Mei Gah Lim and Hoi Leong Lee(参考訳) コロナウイルス感染症2019(COVID-19)は、2019年12月初旬に中国の武漢で最初に発見された。 新型コロナウイルス患者が放射線検査を受けると、放射線技師は胸部X線(CXR)画像から放射線異常の存在を観察できる。 本研究では, 深部畳み込みニューラルネットワーク(CNN)モデルを用いて, 新型コロナウイルスの診断における放射線科医の支援を行った。 まず,修正VGG-16,ResNet-50,DenseNet-121を用いて,CXR画像を正常,COVID-19,ウイルス性肺炎に分類した。 そして,画像強調が分類結果に及ぼす影響を評価した。 この研究全体で、公開のCOVID-19ラジオグラフィーデータベースが使用された。 比較の結果、resnet-50は95.88%で最高精度を達成した。 次に、回転、翻訳、水平フリップ、強度シフト、ズーム拡張データセットでresnet-50をトレーニングした後、精度は80.95%に低下した。 さらに, 画像増倍が分類結果に及ぼす影響に関するアブレーション研究により, 回転法と強度シフト増倍法の組み合わせは, 96.14%のベースラインよりも精度が高いことがわかった。 最後に,resnet-50の回転と強度シフトの強化がベストであり,最終分類モデルとして提案されている。 これらの結果から,提案する分類モデルが新型コロナウイルスの診断に有望な結果をもたらす可能性が示唆された。

The Coronavirus disease 2019 (COVID-19) was first identified in Wuhan, China, in early December 2019 and now becoming a pandemic. When COVID-19 patients undergo radiography examination, radiologists can observe the present of radiographic abnormalities from their chest X-ray (CXR) images. In this study, a deep convolutional neural network (CNN) model was proposed to aid radiologists in diagnosing COVID-19 patients. First, this work conducted a comparative study on the performance of modified VGG-16, ResNet-50 and DenseNet-121 to classify CXR images into normal, COVID-19 and viral pneumonia. Then, the impact of image augmentation on the classification results was evaluated. The publicly available COVID-19 Radiography Database was used throughout this study. After comparison, ResNet-50 achieved the highest accuracy with 95.88%. Next, after training ResNet-50 with rotation, translation, horizontal flip, intensity shift and zoom augmented dataset, the accuracy dropped to 80.95%. Furthermore, an ablation study on the effect of image augmentation on the classification results found that the combinations of rotation and intensity shift augmentation methods obtained an accuracy higher than baseline, which is 96.14%. Finally, ResNet-50 with rotation and intensity shift augmentations performed the best and was proposed as the final classification model in this work. These findings demonstrated that the proposed classification model can provide a promising result for COVID-19 diagnosis.
翻訳日:2022-12-27 14:17:43 公開日:2022-12-26
# 主成分系ウェーブレットCNNを用いたWi-Fi CSIデータからの人間の活動認識

Human Activity Recognition from Wi-Fi CSI Data Using Principal Component-Based Wavelet CNN ( http://arxiv.org/abs/2212.13161v1 )

ライセンス: Link先を確認
Ishtiaque Ahmed Showmik, Tahsina Farah Sanam, Hafiz Imtiaz(参考訳) HAR(Human Activity Recognition)は、監視、セキュリティ、医療分野に応用された新興技術である。 Wi-Fi Channel State Information (CSI) 信号に基づく非侵襲的HARシステムは、ユビキタスWi-Fi技術の迅速な成長と、CSIダイナミクスと体の動きの相関を利用して開発することができる。 本稿では,実用的なリアルタイムアプリケーションにロバスト性と効率性を提供する新しい手法である,主成分ベースのウェーブレット畳み込みニューラルネットワーク(pcwcnn)を提案する。 提案手法は、主成分分析(PCA)と離散ウェーブレット変換(DWT)という2つの効率的な前処理アルゴリズムを含む。 我々は、正確かつ計算学的に軽量な適応的アクティビティセグメンテーションアルゴリズムを用いる。 さらに、よく研究されているResNetやDenseNetに類似した深層畳み込みネットワークであるWavelet CNNを分類に使用した。 提案したPCWCNNモデルが,既存のアプローチよりも優れた実データセットで非常によく動作することを実証的に示す。

Human Activity Recognition (HAR) is an emerging technology with several applications in surveillance, security, and healthcare sectors. Noninvasive HAR systems based on Wi-Fi Channel State Information (CSI) signals can be developed leveraging the quick growth of ubiquitous Wi-Fi technologies, and the correlation between CSI dynamics and body motions. In this paper, we propose Principal Component-based Wavelet Convolutional Neural Network (or PCWCNN) -- a novel approach that offers robustness and efficiency for practical real-time applications. Our proposed method incorporates two efficient preprocessing algorithms -- the Principal Component Analysis (PCA) and the Discrete Wavelet Transform (DWT). We employ an adaptive activity segmentation algorithm that is accurate and computationally light. Additionally, we used the Wavelet CNN for classification, which is a deep convolutional network analogous to the well-studied ResNet and DenseNet networks. We empirically show that our proposed PCWCNN model performs very well on a real dataset, outperforming existing approaches.
翻訳日:2022-12-27 14:17:21 公開日:2022-12-26
# 2重平滑化gda:制約付き非凸非凸ミニマックス最適化のための大域収束アルゴリズム

Doubly Smoothed GDA: Global Convergent Algorithm for Constrained Nonconvex-Nonconcave Minimax Optimization ( http://arxiv.org/abs/2212.12978v1 )

ライセンス: Link先を確認
Taoli Zheng, Linglingzhi Zhu, Anthony Man-Cho So, Jose Blanchet, Jiajin Li(参考訳) nonconvex-nonconcave minimax optimizationは、機械学習と運用研究に広く応用されているため、過去10年間にわたって激しい研究の焦点となっている。 残念ながら、既存のアルゴリズムの多くは収束を保証できず、常に制限サイクルに苦しむ。 それらの大域収束は、チェックが難しい特定の条件に依存しており、大域的ポリアック-\L{}ojasiewicz条件、弱ミンティ変量不等式を満たす解の存在、および$\alpha$-相互作用支配条件に限らない。 本稿では,2次スムーズな勾配勾配上昇法という,新たな条件を伴わずに限界周期を除去するアルゴリズムを開発した。 さらに,本アルゴリズムは,非凹凸条件下での単一ループアルゴリズムの最適反復複雑性と一致するゲーム定常点を求めるために,$\mathcal{O}(\epsilon^{-4})$の反復複雑性を持つことを示した。 ここで提示されるアルゴリズムは、非凸非凸ミニマックス最適化問題の証明可能なアルゴリズムを設計するための新しい経路を開く。

Nonconvex-nonconcave minimax optimization has been the focus of intense research over the last decade due to its broad applications in machine learning and operation research. Unfortunately, most existing algorithms cannot be guaranteed to converge and always suffer from limit cycles. Their global convergence relies on certain conditions that are difficult to check, including but not limited to the global Polyak-\L{}ojasiewicz condition, the existence of a solution satisfying the weak Minty variational inequality and $\alpha$-interaction dominant condition. In this paper, we develop the first provably convergent algorithm called doubly smoothed gradient descent ascent method, which gets rid of the limit cycle without requiring any additional conditions. We further show that the algorithm has an iteration complexity of $\mathcal{O}(\epsilon^{-4})$ for finding a game stationary point, which matches the best iteration complexity of single-loop algorithms under nonconcave-concave settings. The algorithm presented here opens up a new path for designing provable algorithms for nonconvex-nonconcave minimax optimization problems.
翻訳日:2022-12-27 14:05:34 公開日:2022-12-26
# グラフ畳み込みネットワークにおける一般化の統計力学

Statistical Mechanics of Generalization In Graph Convolution Networks ( http://arxiv.org/abs/2212.13069v1 )

ライセンス: Link先を確認
Cheng Shi, Liming Pan, Hong Hu and Ivan Dokmani\'c(参考訳) グラフニューラルネットワーク(gnn)は、タンパク質相互作用ネットワーク、生物学的ニューラルネットワーク、科学コラボレーショングラフなど、リレーショナルデータセットのデフォルト機械学習モデルとなっている。 統計物理学とランダム行列理論のツールを用いて、文脈確率ブロックモデル上の単純なグラフ畳み込みネットワークの一般化を正確に特徴付ける。 導出曲線は現象学的に豊富であり、ホモフィルグラフとヘテロフィルグラフの学習の区別を説明し、GNNの存在が近年の研究によって疑問視されている二重降下を予測する。 本研究は,スタイリッシュなグラフ学習モデルだけでなく,乱雑な実世界のデータセット上での複雑なgnnの振る舞いを初めて正確に説明した。 本稿では,ホモフィアとヘテロフィアに関する分析的知見を用いて,負の自己ループフィルタを簡易に付加することにより,いくつかのヘテロフィアベンチマークにおける最先端グラフニューラルネットワークの性能を向上させる。

Graph neural networks (GNN) have become the default machine learning model for relational datasets, including protein interaction networks, biological neural networks, and scientific collaboration graphs. We use tools from statistical physics and random matrix theory to precisely characterize generalization in simple graph convolution networks on the contextual stochastic block model. The derived curves are phenomenologically rich: they explain the distinction between learning on homophilic and heterophilic graphs and they predict double descent whose existence in GNNs has been questioned by recent work. Our results are the first to accurately explain the behavior not only of a stylized graph learning model but also of complex GNNs on messy real-world datasets. To wit, we use our analytic insights about homophily and heterophily to improve performance of state-of-the-art graph neural networks on several heterophilic benchmarks by a simple addition of negative self-loop filters.
翻訳日:2022-12-27 14:05:13 公開日:2022-12-26
# 教師なし領域適応のMRI構造解析への応用

Application of Unsupervised Domain Adaptation for Structural MRI Analysis ( http://arxiv.org/abs/2212.12986v1 )

ライセンス: Link先を確認
Pranath Reddy(参考訳) 本研究の主な目的は、OASISデータセットに対するアルツハイマー病(AD)検出の文脈において、バイナリ分類や異常検出などの様々な応用に対する教師なしドメイン適応アプローチの有効性を検討することである。 また、3次元構造MRIデータの解析と生成のための画像再構成と画像合成についても検討し、異常検出のための性能ベンチマークを確立する。 本研究では,教師付き設定と教師なし設定の両方において,ドメイン適応により広告検出性能が向上することを示す。 さらに,提案手法はOASIS-1データセットのバイナリ分類における最先端性能を実現する。

The primary goal of this work is to study the effectiveness of an unsupervised domain adaptation approach for various applications such as binary classification and anomaly detection in the context of Alzheimer's disease (AD) detection for the OASIS datasets. We also explore image reconstruction and image synthesis for analyzing and generating 3D structural MRI data to establish performance benchmarks for anomaly detection. We successfully demonstrate that domain adaptation improves the performance of AD detection when implemented in both supervised and unsupervised settings. Additionally, the proposed methodology achieves state-of-the-art performance for binary classification on the OASIS-1 dataset.
翻訳日:2022-12-27 14:04:58 公開日:2022-12-26
# 半スーパービジョンオートエンコーダを用いたソフトセンサ開発のためのオンラインアクティブラーニング

Online Active Learning for Soft Sensor Development using Semi-Supervised Autoencoders ( http://arxiv.org/abs/2212.13067v1 )

ライセンス: Link先を確認
Davide Cacciarelli, Murat Kulahci, John Tyssedal(参考訳) データ駆動型ソフトセンサーは工業プロセスや化学プロセスで広く使われ、日常的な操作中に実際の値が追跡しにくいプロセス変数を予測する。 これらのセンサで使用される回帰モデルは、しばしば多くのラベル付き例を必要とするが、品質検査によって必要とされる高い時間とコストを考えると、ラベル情報を取得することは非常に高価である。 この文脈では、アクティブな学習手法は、クエリに最も有益なラベルを提案できるため、非常に有益である。 しかしながら、回帰のために提案されたアクティブな学習戦略のほとんどは、オフライン設定に重点を置いている。 本研究では,これらのアプローチのいくつかをストリームベースのシナリオに適応させ,最も有益なデータポイントを選択できる方法を示す。 また,直交オートエンコーダに基づく半教師付きアーキテクチャを用いて,低次元空間におけるサルエント特徴を学習する方法を示す。 テネシー・イーストマン過程は、提案されたアプローチの予測性能を比較するために用いられる。

Data-driven soft sensors are extensively used in industrial and chemical processes to predict hard-to-measure process variables whose real value is difficult to track during routine operations. The regression models used by these sensors often require a large number of labeled examples, yet obtaining the label information can be very expensive given the high time and cost required by quality inspections. In this context, active learning methods can be highly beneficial as they can suggest the most informative labels to query. However, most of the active learning strategies proposed for regression focus on the offline setting. In this work, we adapt some of these approaches to the stream-based scenario and show how they can be used to select the most informative data points. We also demonstrate how to use a semi-supervised architecture based on orthogonal autoencoders to learn salient features in a lower dimensional space. The Tennessee Eastman Process is used to compare the predictive performance of the proposed approaches.
翻訳日:2022-12-27 13:59:32 公開日:2022-12-26
# ブラックボックス対応パッチ攻撃における摂動と位置の同時最適化

Simultaneously Optimizing Perturbations and Positions for Black-box Adversarial Patch Attacks ( http://arxiv.org/abs/2212.12995v1 )

ライセンス: Link先を確認
Xingxing Wei, Ying Guo, Jie Yu, Bo Zhang(参考訳) 敵パッチは、ディープニューラルネットワークの堅牢性に重大なリスクをもたらす現実世界の敵攻撃の重要な形態である。 従来の方法は、貼付位置を固定しながら摂動値を最適化するか、パッチの内容を修正しながら位置を操作することにより、敵パッチを生成する。 これは、位置と摂動がともに敵の攻撃にとって重要であることを示している。 そこで本研究では,敵パッチの位置と摂動を同時に最適化し,ブラックボックス設定において高い攻撃成功率を得る新しい手法を提案する。 技術的には、パッチの位置、設計済みのハイパーパラメータを変数として、パッチの摂動を決定するために考慮し、この強化学習フレームワークを使用して、ターゲットモデルから得られる報酬を少数のクエリで同時に解決する。 顔認識(FR)タスクにおいて大規模な実験を行い、4つの代表的なFRモデルによる結果から,攻撃成功率とクエリ効率を大幅に向上できることが示された。 さらに、商用FRサービスと物理環境に関する実験により、実用的応用価値が確認された。 また,本手法をトラヒックサイン認識タスクに拡張し,その一般化能力を検証する。

Adversarial patch is an important form of real-world adversarial attack that brings serious risks to the robustness of deep neural networks. Previous methods generate adversarial patches by either optimizing their perturbation values while fixing the pasting position or manipulating the position while fixing the patch's content. This reveals that the positions and perturbations are both important to the adversarial attack. For that, in this paper, we propose a novel method to simultaneously optimize the position and perturbation for an adversarial patch, and thus obtain a high attack success rate in the black-box setting. Technically, we regard the patch's position, the pre-designed hyper-parameters to determine the patch's perturbations as the variables, and utilize the reinforcement learning framework to simultaneously solve for the optimal solution based on the rewards obtained from the target model with a small number of queries. Extensive experiments are conducted on the Face Recognition (FR) task, and results on four representative FR models show that our method can significantly improve the attack success rate and query efficiency. Besides, experiments on the commercial FR service and physical environments confirm its practical application value. We also extend our method to the traffic sign recognition task to verify its generalization ability.
翻訳日:2022-12-27 13:57:56 公開日:2022-12-26
# Skit-S2I:インド発声データセット

Skit-S2I: An Indian Accented Speech to Intent dataset ( http://arxiv.org/abs/2212.13015v1 )

ライセンス: Link先を確認
Shangeth Rajaa, Swaraj Dalmia, Kumarmanas Nethil(参考訳) 従来の会話アシスタントは、音声認識(ASR)を用いて音声信号からテキストの書き起こしを抽出し、その書き起こしから意図を予測する。 エンドツーエンドの音声言語理解(SLU)を用いて、話者の意図を中間テキストの書き起こしを必要とせず、音声信号から直接予測する。 その結果、モデルが意図分類を直接最適化し、ASRからのカスケードエラーを回避することができる。 エンドツーエンドのSLUシステムは、意図予測モデルのレイテンシ低減にも役立ちます。 多くのデータセットがテキスト対インテントタスクで公開されているが、ラベル付き音声対インテントデータセットは限られており、インドのアクセントで利用可能なデータセットはない。 本稿では,インドで初めて公開されたsluデータセットであるskit-s2iデータセットを,対話的トーナリティで公開する。 複数のベースラインを用いて実験を行い、異なる事前学習された音声エンコーダの表現を比較し、sslプリトレーニングされた表現がasrプリトレーニングされた表現よりも、音声から意図的な分類のための韻律的特徴を欠いた表現よりもわずかに優れていることを発見した。 データセットとベースラインコードは \url{https://github.com/skit-ai/speech-to-intent-dataset} で利用可能である。

Conventional conversation assistants extract text transcripts from the speech signal using automatic speech recognition (ASR) and then predict intent from the transcriptions. Using end-to-end spoken language understanding (SLU), the intents of the speaker are predicted directly from the speech signal without requiring intermediate text transcripts. As a result, the model can optimize directly for intent classification and avoid cascading errors from ASR. The end-to-end SLU system also helps in reducing the latency of the intent prediction model. Although many datasets are available publicly for text-to-intent tasks, the availability of labeled speech-to-intent datasets is limited, and there are no datasets available in the Indian accent. In this paper, we release the Skit-S2I dataset, the first publicly available Indian-accented SLU dataset in the banking domain in a conversational tonality. We experiment with multiple baselines, compare different pretrained speech encoder's representations, and find that SSL pretrained representations perform slightly better than ASR pretrained representations lacking prosodic features for speech-to-intent classification. The dataset and baseline code is available at \url{https://github.com/skit-ai/speech-to-intent-dataset}
翻訳日:2022-12-27 13:57:37 公開日:2022-12-26
# ct画像における腎臓および腎臓腫瘍の分画

Kidney and Kidney Tumour Segmentation in CT Images ( http://arxiv.org/abs/2212.13034v1 )

ライセンス: Link先を確認
Qi Ming How and Hoi Leong Lee(参考訳) Computed Tomography (CT) 画像における腎腫瘍と腎腫瘍の自動分節は, 従来の手動分節法に比べて少ない時間で行うことができるため, 必須である。 しかし, 医療従事者による手動研究やCT画像の分割は, 精度が高いため, 依然として多くの病院が頼りにしている。 そこで本研究では,造影CT画像における腎および腎腫瘍の自動分節法の開発に焦点をあてる。 畳み込みニューラルネットワーク(convolutional neural network, cnn)を用いた3次元u-netセグメンテーションモデルを開発し, ctスキャンから腎臓と腎臓の腫瘍を描出する訓練を行った。 各CT画像はCNNに入力する前に前処理され、ダウンサンプリングおよびパッチワイド入力画像がモデル性能に与える影響を解析した。 提案手法は2021年のKidney and Kidney Tumour Segmentation Challenge (KiTS21)データセットで評価された。 最高成績モデルを用いた方法では, 平均トレーニングサイススコアが0.6129, 腎臓腫瘍サイススコアが0.7923, 腎臓腫瘍サイススコアが0.4344であった。 試験では、腎臓のDiceスコアが0.8034、腎臓のDiceスコアが0.4713、平均のDiceスコアが0.6374であった。

Automatic segmentation of kidney and kidney tumour in Computed Tomography (CT) images is essential, as it uses less time as compared to the current gold standard of manual segmentation. However, many hospitals are still reliant on manual study and segmentation of CT images by medical practitioners because of its higher accuracy. Thus, this study focuses on the development of an approach for automatic kidney and kidney tumour segmentation in contrast-enhanced CT images. A method based on Convolutional Neural Network (CNN) was proposed, where a 3D U-Net segmentation model was developed and trained to delineate the kidney and kidney tumour from CT scans. Each CT image was pre-processed before inputting to the CNN, and the effect of down-sampled and patch-wise input images on the model performance was analysed. The proposed method was evaluated on the publicly available 2021 Kidney and Kidney Tumour Segmentation Challenge (KiTS21) dataset. The method with the best performing model recorded an average training Dice score of 0.6129, with the kidney and kidney tumour Dice scores of 0.7923 and 0.4344, respectively. For testing, the model obtained a kidney Dice score of 0.8034, and a kidney tumour Dice score of 0.4713, with an average Dice score of 0.6374.
翻訳日:2022-12-27 13:56:53 公開日:2022-12-26
# 時間差誤差重み付き損失関数を用いたオフポリシー強化学習

Off-Policy Reinforcement Learning with Loss Function Weighted by Temporal Difference Error ( http://arxiv.org/abs/2212.13175v1 )

ライセンス: Link先を確認
Bumgeun Park, Taeyoung Kim, Woohyeon Moon, Luiz Felipe Vecchietti and Dongsoo Har(参考訳) オフポリシー・ディープ強化学習(rl)によるトレーニングエージェントは、学習に使用される過去の経験を記憶するリプレイメモリと呼ばれる大きなメモリを必要とする。 これらの経験は、トレーニングに使用されるバッチを作成するために、一様または非一様にサンプリングされる。 損失関数を計算するとき、オフポリシーアルゴリズムは全てのサンプルが同じ重要性を持つと仮定する。 本稿では,td(temporal-difference)エラーに基づいて,各体験に異なる重要度を付与することで,トレーニングを向上できると仮定する。 学習段階における損失関数を計算する際に,各経験に重み付け係数を導入する新しい手法を提案する。 均一サンプリングを用いた場合の収束速度の向上に加えて, 非一様サンプリングの優先順位付け手法と組み合わせることができる。 提案手法と優先順位付け手法を組み合わせることでサンプリング効率が向上し,TDに基づくオフポリシーRLアルゴリズムの性能が向上する。 提案手法の有効性は,OpenAI Gymスイートの6つの環境での実験によって実証された。 実験の結果,提案手法は3つの環境における収束速度を33%~76%削減し,リターンを11%向上させ,他の3つの環境での成功率を3%~10%向上させた。

Training agents via off-policy deep reinforcement learning (RL) requires a large memory, named replay memory, that stores past experiences used for learning. These experiences are sampled, uniformly or non-uniformly, to create the batches used for training. When calculating the loss function, off-policy algorithms assume that all samples are of the same importance. In this paper, we hypothesize that training can be enhanced by assigning different importance for each experience based on their temporal-difference (TD) error directly in the training objective. We propose a novel method that introduces a weighting factor for each experience when calculating the loss function at the learning stage. In addition to improving convergence speed when used with uniform sampling, the method can be combined with prioritization methods for non-uniform sampling. Combining the proposed method with prioritization methods improves sampling efficiency while increasing the performance of TD-based off-policy RL algorithms. The effectiveness of the proposed method is demonstrated by experiments in six environments of the OpenAI Gym suite. The experimental results demonstrate that the proposed method achieves a 33%~76% reduction of convergence speed in three environments and an 11% increase in returns and a 3%~10% increase in success rate for other three environments.
翻訳日:2022-12-27 13:49:41 公開日:2022-12-26
# $\beta$-potential regularization による最適輸送のロバスト計算

Robust computation of optimal transport by $\beta$-potential regularization ( http://arxiv.org/abs/2212.13251v1 )

ライセンス: Link先を確認
Shintaro Nakamura, Han Bao, Masashi Sugiyama(参考訳) 最適輸送(OT)は、確率分布間の差を測定する機械学習分野で広く使われているツールである。 例えば、OTは経験的分布とパラメトリックモデルとの差を定量化する一般的な損失関数である。 近年、エントロピーペナルティ項と祝われるシンクホーンアルゴリズムは、計算効率のよい方法で元のotを近似するために一般的に用いられている。 しかし、シンクホーンアルゴリズムはkullback-leiblerの発散に関連する射影を実行するため、しばしば外れ値に対して脆弱である。 この問題を克服するために、ロバストな統計学で開発されたいわゆる$\beta$-divergence に関連する \beta-potential term によるotの正則化を提案する。 我々の理論的分析により、$\beta$-potential は質量が異常値に輸送されることを防げることが明らかとなった。 提案アルゴリズムで計算した輸送行列は,外乱が存在する場合でも確率分布を頑健に推定する。 さらに,提案手法は,汚染されたデータセットから外れ値を検出することができる。

Optimal transport (OT) has become a widely used tool in the machine learning field to measure the discrepancy between probability distributions. For instance, OT is a popular loss function that quantifies the discrepancy between an empirical distribution and a parametric model. Recently, an entropic penalty term and the celebrated Sinkhorn algorithm have been commonly used to approximate the original OT in a computationally efficient way. However, since the Sinkhorn algorithm runs a projection associated with the Kullback-Leibler divergence, it is often vulnerable to outliers. To overcome this problem, we propose regularizing OT with the \beta-potential term associated with the so-called $\beta$-divergence, which was developed in robust statistics. Our theoretical analysis reveals that the $\beta$-potential can prevent the mass from being transported to outliers. We experimentally demonstrate that the transport matrix computed with our algorithm helps estimate a probability distribution robustly even in the presence of outliers. In addition, our proposed method can successfully detect outliers from a contaminated dataset
翻訳日:2022-12-27 13:49:22 公開日:2022-12-26
# 事前学習拡散確率モデルによる教師なし表現学習

Unsupervised Representation Learning from Pre-trained Diffusion Probabilistic Models ( http://arxiv.org/abs/2212.12990v1 )

ライセンス: Link先を確認
Zijian Zhang, Zhou Zhao, Zhijie Lin(参考訳) 拡散確率モデル(DPM)は高品質の画像サンプルを生成する強力な能力を示している。 近年,拡散オートエンコーダ (Diff-AE) が提案されている。 彼らのキーとなるアイデアは、画像から意味のある表現を発見するエンコーダと、画像再構築のためのデコーダとして条件付きDPMを共同で訓練することである。 画像再構成のためのデコーダに既存の事前学習済みDPMを適応させる一般的な手法である \textbf{P}re-trained \textbf{D}PM \textbf{A}uto\textbf{E}ncoding (\textbf{PDAE})を提案する。 具体的には,事前学習したdpmが潜在変数から画像の再構成に失敗した理由は,予測された後方平均と実際の画像とのギャップを生じさせるフォワードプロセスの情報損失によるものである。 この観点から、分類器誘導サンプリング法は、余分な平均シフトを計算してギャップを埋め、失われたクラス情報をサンプルに再構成するものとして説明できる。 これらのことから、ギャップは画像の失われた情報に対応しており、ギャップを埋めて画像を再構築することができる。 そこからインスピレーションを得て、エンコードされた表現に従って平均シフトを予測し、できるだけ多くのギャップを埋めるように訓練する訓練可能なモデルを用いて、エンコーダは、画像からできるだけ多くの情報を学習し、その埋め合わせを支援する。 事前訓練されたDPMのネットワークの一部を再利用し、拡散損失の重み付け方式を再設計することにより、PDAEは画像から意味のある表現を効率的に学習することができる。 PDAEの有効性、効率、柔軟性を示す大規模な実験。

Diffusion Probabilistic Models (DPMs) have shown a powerful capacity of generating high-quality image samples. Recently, diffusion autoencoders (Diff-AE) have been proposed to explore DPMs for representation learning via autoencoding. Their key idea is to jointly train an encoder for discovering meaningful representations from images and a conditional DPM as the decoder for reconstructing images. Considering that training DPMs from scratch will take a long time and there have existed numerous pre-trained DPMs, we propose \textbf{P}re-trained \textbf{D}PM \textbf{A}uto\textbf{E}ncoding (\textbf{PDAE}), a general method to adapt existing pre-trained DPMs to the decoders for image reconstruction, with better training efficiency and performance than Diff-AE. Specifically, we find that the reason that pre-trained DPMs fail to reconstruct an image from its latent variables is due to the information loss of forward process, which causes a gap between their predicted posterior mean and the true one. From this perspective, the classifier-guided sampling method can be explained as computing an extra mean shift to fill the gap, reconstructing the lost class information in samples. These imply that the gap corresponds to the lost information of the image, and we can reconstruct the image by filling the gap. Drawing inspiration from this, we employ a trainable model to predict a mean shift according to encoded representation and train it to fill as much gap as possible, in this way, the encoder is forced to learn as much information as possible from images to help the filling. By reusing a part of network of pre-trained DPMs and redesigning the weighting scheme of diffusion loss, PDAE can learn meaningful representations from images efficiently. Extensive experiments demonstrate the effectiveness, efficiency and flexibility of PDAE.
翻訳日:2022-12-27 13:39:22 公開日:2022-12-26
# 減衰率および/または周波数のインダクティブバイアスを伴う連続時間における非線形ダイナミクスのモデル化

Modeling Nonlinear Dynamics in Continuous Time with Inductive Biases on Decay Rates and/or Frequencies ( http://arxiv.org/abs/2212.13033v1 )

ライセンス: Link先を確認
Tomoharu Iwata, Yoshinobu Kawahara(参考訳) 本稿では,減衰率および/または周波数に誘導バイアスを課す連続時間における非線形ダイナミクスのためのニューラルネットワークモデルを提案する。 インダクティブバイアスは、特にトレーニングデータが小さい場合、ニューラルネットワークのトレーニングに役立ちます。 提案モデルはクープマン作用素理論に基づいており、クープマン空間における線形進化を記述するクープマン作用素の固有値を制限することで減衰率と周波数情報を利用する。 ニューラルネットワークを用いて適切なクープマン空間を探索し、不規則にサンプリングされた時系列データを用いてマルチステップ予測とバックキャストエラーを最小化する。 時系列データセットを用いた実験により,提案手法は既存手法よりも1つの短いトレーニングシーケンスで高い予測性能が得られることを示した。

We propose a neural network-based model for nonlinear dynamics in continuous time that can impose inductive biases on decay rates and/or frequencies. Inductive biases are helpful for training neural networks especially when training data are small. The proposed model is based on the Koopman operator theory, where the decay rate and frequency information is used by restricting the eigenvalues of the Koopman operator that describe linear evolution in a Koopman space. We use neural networks to find an appropriate Koopman space, which are trained by minimizing multi-step forecasting and backcasting errors using irregularly sampled time-series data. Experiments on various time-series datasets demonstrate that the proposed method achieves higher forecasting performance given a single short training sequence than the existing methods.
翻訳日:2022-12-27 13:30:39 公開日:2022-12-26
# 質問対アクションと質問対質問アライメントによる複雑な知識ベース質問応答の改善

Improving Complex Knowledge Base Question Answering via Question-to-Action and Question-to-Question Alignment ( http://arxiv.org/abs/2212.13036v1 )

ライセンス: Link先を確認
Yechun Tang, Xiaoxia Cheng, Weiming Lu(参考訳) 複雑な知識ベースの質問応答は、質問を事前定義されたアクションのシーケンスに変換することで実現できる。 しかし、自然言語とアクションシーケンスの間には重要な意味と構造的なギャップがあり、この変換は困難である。 本稿では,質問対アクションアライメントと質問対質問アライメントを通じて,このギャップを緩和するアライメント強化複雑な質問応答フレームワークであるALCQAを紹介する。 質問と各アクションを調整するために質問書き換えモデルをトレーニングし、事前訓練された言語モデルを使用して質問とKGアーティファクトを暗黙的に調整する。 さらに、類似した質問が類似のアクションシーケンスに対応することを考慮し、質問と質問のアライメントを通じて推論段階でトップk類似の質問応答ペアを検索し、候補アクションシーケンスから選択する新たな報酬誘導アクションシーケンス選択戦略を提案する。 cqaおよびwqspデータセットで実験を行い,本手法が最先端の手法を上回り,cqaデータセットのf1指標を9.88\%改善したことを示す。 ソースコードはhttps://github.com/ttttty/alcqaで入手できます。

Complex knowledge base question answering can be achieved by converting questions into sequences of predefined actions. However, there is a significant semantic and structural gap between natural language and action sequences, which makes this conversion difficult. In this paper, we introduce an alignment-enhanced complex question answering framework, called ALCQA, which mitigates this gap through question-to-action alignment and question-to-question alignment. We train a question rewriting model to align the question and each action, and utilize a pretrained language model to implicitly align the question and KG artifacts. Moreover, considering that similar questions correspond to similar action sequences, we retrieve top-k similar question-answer pairs at the inference stage through question-to-question alignment and propose a novel reward-guided action sequence selection strategy to select from candidate action sequences. We conduct experiments on CQA and WQSP datasets, and the results show that our approach outperforms state-of-the-art methods and obtains a 9.88\% improvements in the F1 metric on CQA dataset. Our source code is available at https://github.com/TTTTTTTTy/ALCQA.
翻訳日:2022-12-27 13:29:38 公開日:2022-12-26