A Comprehensive Survey on Test-Time Adaptation under Distribution Shifts [143.1] 新たなパラダイムであるテスト時適応は、事前トレーニングされたモデルをテスト中にラベルのないデータに適用し、予測を行う可能性がある。
このパラダイムの最近の進歩は、推論に先立って自己適応モデルのトレーニングにラベルのないデータを活用するという大きな利点を浮き彫りにしている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:32:21 GMT)
DiffTAD: Temporal Action Detection with Proposal Denoising Diffusion [137.9] そこで我々は,時間的行動検出(TAD)の新しい定式化を提案し,拡散を抑えるDiffTADを提案する。
入力されたランダムな時間的提案を考慮すれば、トリミングされていない長いビデオが与えられたアクションの提案を正確に得ることができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 00:40:52 GMT)
Linear Spaces of Meanings: Compositional Structures in Vision-Language
Models [133.8] 事前学習された視覚言語モデル(VLM)からのデータ埋め込みにおける構成構造について検討する。
まず,幾何学的観点から構成構造を理解するための枠組みを提案する。
次に、これらの構造がVLM埋め込みの場合の確率論的に持つものを説明し、実際に発生する理由の直観を提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:02:17 GMT)
Measuring Fairness Under Unawareness of Sensitive Attributes: A
Quantification-Based Approach [131.2] センシティブな属性の無意識下でのグループフェアネスを測定する問題に取り組む。
定量化手法は, フェアネスと無意識の問題に対処するのに特に適していることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:33:16 GMT)
Polyp-PVT: Polyp Segmentation with Pyramid Vision Transformers [110.2] 本稿では,Polyp-PVTと呼ばれる新しいタイプのPolypセグメンテーション手法を提案する。
提案モデルであるPolyp-PVTは,特徴の雑音を効果的に抑制し,その表現能力を大幅に向上させる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:58:27 GMT)
What Can Human Sketches Do for Object Detection? [109.7] スケッチは非常に表現力が高く、本質的に主観的かつきめ細かい視覚的手がかりを捉えている。
スケッチ可能なオブジェクト検出フレームワークは、 textityou sketch -- textit that zebra' に基づいて検出する。
スケッチベース画像検索(SBIR)のために構築された基礎モデル(例えばCLIP)と既存のスケッチモデルとの直感的な相乗効果を示す。
特に、まず、エンコーダモデルの両方のスケッチブランチで独立に実行し、高度に一般化可能なスケッチとフォトエンコーダを構築する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:33:23 GMT)
Unsupervised Point Cloud Representation Learning with Deep Neural
Networks: A Survey [104.7] 大規模クラウドラベリングの制約により,教師なしのポイントクラウド表現学習が注目されている。
本稿では、ディープニューラルネットワークを用いた教師なしポイントクラウド表現学習の総合的なレビューを提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:07:59 GMT)
Joint Video Multi-Frame Interpolation and Deblurring under Unknown
Exposure Time [101.9] 本研究では,より現実的で挑戦的なタスク – 複数フレームのジョイントビデオと,未知の露光時間下での劣化 – を野心的に目標とする。
我々はまず,入力されたぼやけたフレームから露出認識表現を構築するために,教師付きコントラスト学習の変種を採用する。
次に、プログレッシブ露光適応型畳み込みと動き改善による露出と動きの表現に基づいて、映像再構成ネットワークを構築した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:43:42 GMT)
Detecting Everything in the Open World: Towards Universal Object
Detection [100.4] オープン世界の巨大なカテゴリを認識できるユニバーサルオブジェクト検出器UniDetectorを提案する。
視覚と言語モダリティの両方からの豊富な情報のおかげで、目に見えるクラスと目に見えないクラスのバランスを維持しながら、オープンワールドに容易に一般化する。
LVIS、ImageNetBoxes、VisualGenomeのような大語彙データセット上で、ゼロショットの強力な一般化機能を実行する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 03:56:47 GMT)
SwiftFormer: Efficient Additive Attention for Transformer-based
Real-time Mobile Vision Applications [98.9] 本稿では,2次行列乗算演算を線形要素乗算に効果的に置き換える,新しい効率的な付加的注意機構を提案する。
我々は"SwiftFormer"と呼ばれる一連のモデルを構築し、精度とモバイル推論速度の両面で最先端のパフォーマンスを達成する。
私たちの小さなバージョンでは、iPhone 14で8.5%のImageNet-1Kの精度が達成され、そのレイテンシは0.8msで、MobileViT-v2より2倍速くなります。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:59:58 GMT)
DexDeform: Dexterous Deformable Object Manipulation with Human
Demonstrations and Differentiable Physics [97.8] 人間の実演から巧妙な操作スキルを抽象化する原理的枠組みを提案する。
次に、イマジネーションにおけるアクション抽象化を計画する上で、デモを使ってスキルモデルをトレーニングします。
提案手法の有効性を評価するために,6つの難解な変形可能なオブジェクト操作タスクの組を導入する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:59:49 GMT)
Sigmoid Loss for Language Image Pre-Training [97.7] 画像テキスト事前学習のための単純な一対のシグモイド損失を提案する。
シグモイド損失は画像とテキストのペアのみに作用し、正規化のためにペアの類似点のグローバルなビューを必要としない。
4つのTPUv4チップで、4kバッチサイズでBase CLIPモデルを、20kバッチサイズでLarge LiTモデルをトレーニングできます。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:53:01 GMT)
Online Non-Destructive Moisture Content Estimation of Filter Media
During Drying Using Artificial Neural Networks [95.4] 粗いろ過媒体製品の乾燥工程において, 水分量 (MC) の推定が重要である。
人工ニューラルネットワーク(ANN)に基づく手法は、文献で報告されている最先端のMC推定手法と比較する。
実験結果から, ANNとオーブン設定データ, 乾燥時間, 製品温度を組み合わせることで, バルクフィルターメディア製品のMCを確実に推定できることがわかった。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:37:53 GMT)
Average-Case Complexity of Tensor Decomposition for Low-Degree
Polynomials [93.6] 多くの統計的推論タスクにおいて「統計計算ギャップ」が発生する。
1つの成分が他の成分よりもわずかに大きいランダムオーダー3分解モデルを考える。
テンソルエントリは$ll n3/2$のとき最大成分を正確に推定できるが、$rgg n3/2$のとき失敗する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:04:10 GMT)
Blind Image Quality Assessment via Vision-Language Correspondence: A
Multitask Learning Perspective [93.6] ブラインド画像品質評価(BIQA)は、参照情報なしで画像品質の人間の知覚を予測する。
我々は,他のタスクからの補助的知識を活用するために,BIQAのための汎用的かつ自動化されたマルチタスク学習手法を開発した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:58:09 GMT)
Binarizing Sparse Convolutional Networks for Efficient Point Cloud
Analysis [93.6] 我々は,効率的な点群解析のためのBSC-Netと呼ばれるバイナリスパース畳み込みネットワークを提案する。
我々は,移動したスパース畳み込みにおけるサイトマッチングに最適なオプションを見つけるために,異なる検索戦略を採用している。
我々のBSC-Netは、我々の厳格なベースラインを大幅に改善し、最先端のネットワーク双対化手法より優れています。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:47:06 GMT)
Latent User Intent Modeling for Sequential Recommenders [92.7] 逐次リコメンデータモデルは、プラットフォーム上での氏のインタラクション履歴に基づいて、ユーザが次に対話する可能性のあるアイテムを予測することを学習する。
しかし、ほとんどのシーケンシャルなレコメンデータは、ユーザの意図に対する高いレベルの理解を欠いている。
したがって、インテントモデリングはユーザー理解と長期ユーザーエクスペリエンスの最適化に不可欠である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:45:19 GMT)
Optimal Online Generalized Linear Regression with Stochastic Noise and
Its Application to Heteroscedastic Bandits [88.6] 一般化線形モデルの設定におけるオンライン一般化線形回帰の問題について検討する。
ラベルノイズに対処するため、古典的追従正規化リーダ(FTRL)アルゴリズムを鋭く解析する。
本稿では,FTRLに基づくアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:52:52 GMT)
Mind the Label Shift of Augmentation-based Graph OOD Generalization [88.3] LiSAは、トレーニンググラフの textbfLabel-textbfinvariant textbfSubgraphs を利用して textbfAugmented環境を構築する。
LiSAは、一貫した予測関係を持つ多様な拡張環境を生成する。
ノードレベルのOODベンチマークとグラフレベルのOODベンチマークの実験により、LiSAは異なるGNNバックボーンで印象的な一般化性能を達成することが示された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 00:08:45 GMT)
Propagate And Calibrate: Real-time Passive Non-line-of-sight Tracking [84.4] 本研究では,リレー壁のみを観察することで,見えない部屋を歩いている人を追跡する純粋受動的手法を提案する。
本研究では,リレー壁の映像の非知覚的変化を発掘するため,時間的局所的な動きの伝達に欠かせない特徴として差分フレームを導入する。
提案手法を評価するため,最初の動的受動NLOS追跡データセットであるNLOS-Trackを構築し,公開する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:11:31 GMT)
EqMotion: Equivariant Multi-agent Motion Prediction with Invariant
Interaction Reasoning [83.1] 不変相互作用推論を用いた効率的な同変運動予測モデルであるEqMotionを提案する。
提案モデルに対して,粒子動力学,分子動力学,人体骨格運動予測,歩行者軌道予測の4つの異なるシナリオで実験を行った。
提案手法は4つのタスクすべてに対して最先端の予測性能を実現し,24.0/30.1/8.6/9.2%改善した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 04:51:17 GMT)
Scene-Aware 3D Multi-Human Motion Capture from a Single Camera [83.1] 静止カメラで記録された1枚のRGBビデオから、シーン内の複数の人間の3次元位置を推定し、その身体形状と調音を推定する問題を考察する。
コンピュータビジョンの最近の進歩を,2次元の人体関節,関節角度,正規化不均等マップ,人間のセグメンテーションマスクなど,様々なモダリティのための大規模事前訓練モデルを用いて活用している。
特に,2次元の関節と関節角度を用いた正規化不均等予測から,シーン深度とユニークな人格尺度を推定する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:59:55 GMT)
3D-Aware Multi-Class Image-to-Image Translation with NeRFs [82.3] 3D-Aware I2I(3D-Aware I2I)翻訳のための3D-Aware GANについて検討した。
我々は、この学習プロセスを多クラス3D対応のGANステップと3D対応のI2I翻訳ステップに分離する。
2つのデータセットに関する広範な実験において、我々は多視点一貫性を持つ3次元認識型I2I翻訳を成功させた。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:54:51 GMT)
OmniAvatar: Geometry-Guided Controllable 3D Head Synthesis [81.7] 我々は,非構造画像から学習した新しい幾何学誘導型3次元頭部合成モデルであるOmniAvatarを提案する。
我々のモデルは、最先端の手法と比較して、魅力的なダイナミックディテールで、より好ましいID保存された3Dヘッドを合成することができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:36:53 GMT)
Nighttime Smartphone Reflective Flare Removal Using Optical Center
Symmetry Prior [81.6] 反射フレア(英: Reflective flare)は、レンズの内部に光が反射し、明るい点や「ゴースト効果」を引き起こす現象である。
我々は、反射フレアと光源が常にレンズの光学中心の周囲に対称であることを示す光中心対称性を事前に提案する。
多様なリアルな反射フレアパターンを含むブラケットフレアと呼ばれる最初の反射フレア除去データセットを作成します。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:44:40 GMT)
ByteTrackV2: 2D and 3D Multi-Object Tracking by Associating Every
Detection Box [81.5] マルチオブジェクトトラッキング(MOT)は、ビデオフレーム間のオブジェクトのバウンディングボックスとIDを推定することを目的としている。
低スコア検出ボックス内の真のオブジェクトをマイニングするための階層型データアソシエーション戦略を提案する。
3次元のシナリオでは、トラッカーが世界座標の物体速度を予測するのがずっと簡単である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:35:21 GMT)
CAT:Collaborative Adversarial Training [80.6] ニューラルネットワークの堅牢性を改善するために,協調的対人訓練フレームワークを提案する。
具体的には、異なる対戦型トレーニング手法を使用して、堅牢なモデルをトレーニングし、トレーニングプロセス中にモデルが自身の知識と対話できるようにします。
Cat は Auto-Attack ベンチマークの下で CIFAR-10 上の追加データを用いることなく、最先端の敵の堅牢性を達成している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:37:43 GMT)
Zero-shot Model Diagnosis [80.4] ディープラーニングモデルを評価するための一般的なアプローチは、興味のある属性を持つラベル付きテストセットを構築し、そのパフォーマンスを評価することである。
本稿では,ゼロショットモデル診断(ZOOM)がテストセットやラベル付けを必要とせずに可能であることを論じる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:59:33 GMT)
Fully Self-Supervised Depth Estimation from Defocus Clue [79.6] スパース焦点スタックから深度を純粋に推定する自己教師型フレームワークを提案する。
筆者らのフレームワークは,深度とAIF画像の接地構造の必要性を回避し,より優れた予測を得られることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 04:26:50 GMT)
Attention-aware Resource Allocation and QoE Analysis for Metaverse
xURLLC Services [78.2] Metaverseは、次世代インターネットへの期待をカプセル化しつつ、新しいキーパフォーマンス指標(KPI)を提供する。
メタバースの特徴であるパーソナライズされた没入感を提供するのは難しい。
クオリティ・オブ・エクスペリエンス(QoE)は包括的メタバースとみなすことができるため、URLLCは、より高度なQoEを実現するために、パーソナライズされたリソース割り当てスキームを備えた次世代のURLLC(xURLLC)へと進化する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:20:48 GMT)
Multi-Modal Few-Shot Object Detection with Meta-Learning-Based
Cross-Modal Prompting [77.7] 本稿では,マルチモーダルな複数ショットオブジェクト検出(FSOD)について,少数ショット視覚例とクラスセマンティック情報の両方を用いて検討する。
我々のアプローチは、(メトリックベース)メタラーニングとプロンプトベースラーニングの高レベルな概念的類似性によって動機付けられている。
提案するマルチモーダルFSODモデルを,複数の複数ショットオブジェクト検出ベンチマークで総合的に評価し,有望な結果を得た。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:40:57 GMT)
Revisiting Multimodal Representation in Contrastive Learning: From Patch
and Token Embeddings to Finite Discrete Tokens [76.4] 本稿では,CLIPのような学習型視覚言語事前学習手法を提案する。
提案手法は,より包括的な表現を学習し,意味のある相互対応を捉えることができることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 00:58:39 GMT)
Vision Transformer with Quadrangle Attention [76.4] 窓面に基づく注意を一般的な四角形定式化に拡張する新しい四角形注意法(QA)を提案する。
提案手法では,既定のウィンドウを対象の四角形に変換するために,変換行列を予測し,エンドツーエンドで学習可能な四角形回帰モジュールを用いる。
QAをプレーンかつ階層的な視覚変換器に統合し、QFormerという名の新しいアーキテクチャを作成します。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:13:50 GMT)
DANI-Net: Uncalibrated Photometric Stereo by Differentiable Shadow
Handling, Anisotropic Reflectance Modeling, and Neural Inverse Rendering [75.9] 非平衡測光ステレオ(UPS)は、未知の光によってもたらされる固有の曖昧さのために困難である。
異方性シャドーハンドリングと異方性リフレクタンスモデリングを備えた逆レンダリングフレームワークであるDANI-Netを提案する。
我々のネットワークは、2つの異なる経路を通る影と異方性反射の手がかりから恩恵を受ける。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:10:54 GMT)
KPEval: Towards Fine-grained Semantic-based Evaluation of Keyphrase
Extraction and Generation Systems [75.4] 本研究では,自然性,忠実性,主観性,包括性,多様性,実用性の6つの重要な側面からなる包括的評価枠組みを提案する。
厳密なメタ評価研究は、我々の評価戦略が、以前使用されていた指標よりも人間の嗜好とよく相関していることを示している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:45:38 GMT)
ESC: Exploration with Soft Commonsense Constraints for Zero-shot Object
Navigation [75.1] 我々は,新しいゼロショットオブジェクトナビゲーション手法であるExploration with Soft Commonsense constraints (ESC)を提案する。
ESCは、事前訓練されたモデルのコモンセンス知識を、ナビゲーション経験のないオープンワールドオブジェクトナビゲーションに転送する。
MP3D, HM3D, RoboTHORのベンチマーク実験により, ESC法はベースラインよりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:33:40 GMT)
Optimizing Explanations by Network Canonization and Hyperparameter
Search [74.8] ルールベースで修正されたバックプロパゲーションXAIアプローチは、モダンなモデルアーキテクチャに適用される場合、しばしば課題に直面します。
モデルカノン化は、基礎となる機能を変更することなく問題のあるコンポーネントを無視してモデルを再構成するプロセスである。
本研究では、一般的なディープニューラルネットワークアーキテクチャに適用可能な、現在関連するモデルブロックのカノン化を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:42:13 GMT)
Progressive Semantic-Visual Mutual Adaption for Generalized Zero-Shot
Learning [74.5] 一般化ゼロショット学習(GZSL)は、目に見えない領域から移行した知識によって、見えないカテゴリを特定する。
プロトタイプと視覚特徴の対応性を段階的にモデル化するために,デュアルセマンティック・ビジュアル・トランスフォーマーモジュール(DSVTM)をデプロイする。
DSVTMは、インスタンス中心のプロトタイプを学習して異なる画像に適応させる、インスタンス駆動セマンティックエンコーダを考案した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:21:43 GMT)
ScarceNet: Animal Pose Estimation with Scarce Annotations [74.5] ScarceNetは、ラベルのない画像のための人工ラベルを生成するための擬似ラベルベースのアプローチである。
我々は、既存の半教師付きアプローチを大きなマージンで上回る、挑戦的なAP-10Kデータセットに対するアプローチを評価する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:15:53 GMT)
Scaling Pre-trained Language Models to Deeper via Parameter-efficient
Architecture [74.3] 行列積演算子(MPO)に基づくより有能なパラメータ共有アーキテクチャを設計する。
MPO分解はパラメータ行列の情報を再編成し、2つの部分に分解することができる。
私たちのアーキテクチャは、モデルのサイズを減らすために、すべてのレイヤで中央テンソルを共有しています。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:34:09 GMT)
WEDGE: Web-Image Assisted Domain Generalization for Semantic
Segmentation [72.9] 本稿では,Web画像の多様性を一般化可能なセマンティックセグメンテーションに活用したWEb画像支援ドメインゲネラライゼーション手法を提案する。
また、トレーニング中にWebクローリングされたデータのスタイル表現をソースドメインにインジェクトする手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:50:45 GMT)
Privacy-preserving machine learning for healthcare: open challenges and
future perspectives [72.4] 医療におけるプライバシー保護機械学習(PPML)に関する最近の文献を概観する。
プライバシ保護トレーニングと推論・アズ・ア・サービスに重点を置いています。
このレビューの目的は、医療におけるプライベートかつ効率的なMLモデルの開発をガイドすることである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:20:51 GMT)
GeoNet: Benchmarking Unsupervised Adaptation across Geographies [71.2] 地理的ロバスト性の問題について検討し、3つの主要な貢献を行う。
まず,地理的適応のための大規模データセットGeoNetを紹介する。
第2に、シーンコンテキストにおける大きな変化から、ドメインシフトの主な原因が生じるという仮説を立てる。
第3に、最先端の教師なしドメイン適応アルゴリズムとアーキテクチャを広範囲に評価する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:59:34 GMT)
Mask and Restore: Blind Backdoor Defense at Test Time with Masked
Autoencoder [70.3] 既存のバックドア防御手法では、いくつかのバリデーションデータとモデルパラメータにアクセスする必要があることが多い。
マスク付きオートエンコーダ(BDMAE)を用いたブラインドディフェンスの枠組みを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:23:33 GMT)
Forget-free Continual Learning with Soft-Winning SubNetworks [67.0] 本稿では,各タスクに対して適応バイナリ(WSN)と非バイナリサブネット(SoftNet)を逐次学習し,選択する2つの連続学習手法について検討する。
WSNとSoftNetは、各タスクに関連する作業の正規化モデルウェイトとタスク適応非バイナリマスクを共同で学習する。
タスクインクリメンタルラーニング(TIL)では、当選チケット毎に生成されるバイナリマスクを1つのNビットのバイナリディジットマスクにエンコードし、ハフマン符号化を用いてタスク数に対するネットワーク容量のサブ線形増加のために圧縮する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:53:23 GMT)
Sparks of Artificial General Intelligence: Early experiments with GPT-4 [66.1] OpenAIが開発したGPT-4は、前例のない規模の計算とデータを使って訓練された。
我々は, GPT-4が数学, コーディング, ビジョン, 医学, 法学, 心理学などにまたがる, 新規で困難な課題を解くことを実証した。
我々は、GPT-4を人工知能(AGI)システムの早期(まだ未完成)版と見なすことができると信じている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 22:36:40 GMT)
Model-Based Reinforcement Learning with Isolated Imaginations [66.0] モデルに基づく強化学習手法であるIso-Dream++を提案する。
我々は、切り離された潜在的想像力に基づいて政策最適化を行う。
これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:55:56 GMT)
3D Video Object Detection with Learnable Object-Centric Global
Optimization [65.7] 対応性に基づく最適化は3次元シーン再構成の基盤となるが、3次元ビデオオブジェクト検出では研究されていない。
オブジェクト中心の時間対応学習と特徴量付きオブジェクトバンドル調整を備えた、エンドツーエンドで最適化可能なオブジェクト検出器であるBA-Detを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:39:39 GMT)
Learnable Graph Matching: A Practical Paradigm for Data Association [65.0] データアソシエーションは、複数のオブジェクト追跡、画像マッチング、ポイントクラウド登録など、多くのコンピュータビジョンタスクの中核にある。
既存の手法は通常、ネットワークフローの最適化、双方向マッチング、エンドツーエンドの学習によって、データアソシエーションの問題を解決する。
本稿では,これらの問題に対処する一般的な学習可能なグラフマッチング法を提案する。特に,ビュー内関係を非方向性グラフとしてモデル化し,データアソシエーションがグラフ間の一般的なグラフマッチング問題となる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:39:00 GMT)
Towards Artistic Image Aesthetics Assessment: a Large-scale Dataset and
a New Method [64.4] まず、Boldbrush Artistic Image dataset (BAID)という大規模なAIAAデータセットを紹介します。
そこで我々は,芸術的イメージを評価するために,スタイル特異的で汎用的な美的情報を効果的に抽出し,活用する新たな手法であるSAANを提案する。
実験により,提案手法は提案したBAIDデータセット上で既存のIAA手法よりも優れていることが示された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:59:15 GMT)
A Framework for Demonstrating Practical Quantum Advantage: Racing
Quantum against Classical Generative Models [63.0] 生成モデルの一般化性能を評価するためのフレームワークを構築した。
古典的および量子生成モデル間の実用的量子優位性(PQA)に対する最初の比較レースを確立する。
以上の結果から,QCBMは,他の最先端の古典的生成モデルよりも,データ制限方式の方が効率的であることが示唆された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 22:48:28 GMT)
Fine-grained Audible Video Description [61.8] FAVDBench(きめのきめ細かな映像記述ベンチマーク)を構築した。
各ビデオクリップについて、まずビデオの1文要約を行い、次に、視覚的詳細を記述した4~6文と、最後に1~2つの音声関連記述を示す。
細かなビデオ記述を利用することで、キャプションよりも複雑なビデオが作成できることを実証する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 22:03:48 GMT)
Improving Dual-Encoder Training through Dynamic Indexes for Negative
Mining [61.1] 本稿では,ソフトマックスを証明可能な境界で近似し,木を動的に維持するアルゴリズムを提案する。
我々は,2000万以上のターゲットを持つデータセットについて検討し,オラクル・ブルート力負の鉱業に関して,誤差を半分に削減した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:18:32 GMT)
The Devil is in the Points: Weakly Semi-Supervised Instance Segmentation
via Point-Guided Mask Representation [61.0] 本稿では,ポイントラベル付き弱半教師付きインスタンスセグメンテーション(WSSIS)という新しい学習手法を提案する。
本稿では、予算に優しいポイントラベルを強力な弱監督源として効果的に活用できるWSSISの手法を提案する。
我々はCOCOとBDD100Kデータセットの広範な実験を行い、提案手法は完全な教師付きモデルのデータセットに匹敵する有望な結果を得る。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:11:22 GMT)
MUG: A General Meeting Understanding and Generation Benchmark [60.1] 我々はAliMeeting4MUG Corpusを構築した。
本稿では,このコーパスの詳細な紹介,SLPタスクと評価方法,ベースラインシステムとその性能について述べる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 03:51:52 GMT)
Large Language Models are Diverse Role-Players for Summarization
Evaluation [59.9] 言語評価の大きな課題は、既存のメトリクスと人間の評価の間に明確な違いがあることである。
LLMをベースとした新たな評価フレームワークを提案し、生成されたテキストと参照テキストを比較して総合的な評価フレームワークを提供する。
我々のモデルは競争力が高く、人間のアノテータとの一貫性が非常に高い。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:40:59 GMT)
Enabling Calibration In The Zero-Shot Inference of Large Vision-Language
Models [58.7] プロンプト、データセット、アーキテクチャといった関連する変数のキャリブレーションを測定し、CLIPによるゼロショット推論が誤校正されていることを見つけます。
学習した1つの温度は、推論データセットにまたがって特定のCLIPモデルごとに一般化され、選択が促される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 20:25:03 GMT)
Im2Hands: Learning Attentive Implicit Representation of Interacting
Two-Hand Shapes [58.6] Implicit Two Hands (Im2Hands) は、2つの相互作用する手の最初の暗黙の表現である。
Im2Handsは、両手と手と手と画像のコヒーレンシーの高い2つの手のきめ細かい幾何学を生成することができる。
両手再建におけるIm2Handsの有効性を, 関連手法と比較して実験的に実証した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:08:27 GMT)
Knowledge-in-Context: Towards Knowledgeable Semi-Parametric Language
Models [58.4] 我々は、新しい半パラメトリック言語モデルアーキテクチャ、Knowledge-in-Context(KiC)を開発した。
KiCは知識豊富な外部メモリを備えたパラメトリックテキスト-テキスト言語モデルを提供する。
知識豊富なセミパラメトリック言語モデルとして、KiCは、目に見えないタスクにおいて優れたゼロショットパフォーマンスを達成するために、はるかに小さな部分しか必要としない。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:33:14 GMT)
ACAT: Adversarial Counterfactual Attention for Classification and
Detection in Medical Imaging [57.2] 画像特徴を異なるスケールで変調するソフト空間アテンションマスクを得るために,サリエンシマップを用いたフレームワークを提案する。
ACATは、脳CTスキャンの病変の基準分類精度を71.39%から72.55%に引き上げ、肺CTスキャンの新型コロナウイルス関連所見を67.71%から70.84%に引き上げた。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:43:57 GMT)
MetaPortrait: Identity-Preserving Talking Head Generation with Fast
Personalized Adaptation [57.1] 本稿では,ID保存型音声ヘッド生成フレームワークを提案する。
密集したランドマークは、正確な幾何認識フローフィールドを達成するために不可欠であると主張する。
我々は、合成中にソースアイデンティティを適応的に融合させ、画像ポートレートのキー特性をよりよく保存する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:16:13 GMT)
DynaST: Dynamic Sparse Transformer for Exemplar-Guided Image Generation [56.5] 本稿では,動的スパースアテンションに基づくトランスフォーマーモデルを提案する。
このアプローチの核心は、ある位置がフォーカスすべき最適なトークン数の変化をカバーすることに特化した、新しいダイナミックアテンションユニットです。
3つの応用、ポーズ誘導型人物画像生成、エッジベース顔合成、歪みのない画像スタイル転送の実験により、DynaSTは局所的な詳細において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:55:32 GMT)
A Grid-based Method for Removing Overlaps of Dimensionality Reduction
Scatterplot Layouts [56.3] Distance Grid (DGrid) は、DDR(Diality Reduction) scatterplotレイアウトのオーバーラップを取り除くための新しい後処理戦略である。
DGridは、重複除去において最先端を超越し、大規模なデータセットでは2~3桁高速であることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:46:57 GMT)
On the Convergence of Distributed Stochastic Bilevel Optimization
Algorithms over a Network [55.6] バイレベル最適化は、幅広い機械学習モデルに適用されている。
既存のアルゴリズムの多くは、分散データを扱うことができないように、シングルマシンの設定を制限している。
そこで我々は,勾配追跡通信機構と2つの異なる勾配に基づく分散二段階最適化アルゴリズムを開発した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:09:27 GMT)
InterviewBot: Real-Time End-to-End Dialogue System to Interview Students
for College Admission [54.7] InterviewBotは会話履歴とカスタマイズされたトピックをコヒーレントな埋め込みスペースに統合する。
7,361件の人間対人間インタビューの音声録音を自動転写し、440件を手作業で微調整・評価する。
InterviewBotは、その回答をインタビューデータと比較することで統計的にテストし、プロのインタビュアーや様々な学生にリアルタイムで対話させることによって動的にテストする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:46:56 GMT)
Unsupervised Adaptation from Repeated Traversals for Autonomous Driving [54.6] 自動運転車はエンドユーザー環境に一般化し、確実に動作させなければならない。
潜在的な解決策の1つは、エンドユーザの環境から収集されたラベルのないデータを活用することである。
適応過程を監督する信頼性のある信号はターゲット領域に存在しない。
この単純な仮定は、ターゲット領域上の3次元物体検出器の反復的自己学習を可能にする強力な信号を得るのに十分であることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:07:55 GMT)
NeRF-RPN: A general framework for object detection in NeRFs [54.5] NeRF-RPNは、シーン内のオブジェクトのすべてのバウンディングボックスを検出することを目的としている。
NeRF-RPNは一般的なフレームワークであり、クラスラベルなしでオブジェクトを検出できる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:40:30 GMT)
Recovering 3D Hand Mesh Sequence from a Single Blurry Image: A New
Dataset and Temporal Unfolding [54.5] まず,3次元基底構造を持つぼやけた手画像を含む新しいデータセットBlurHandを提示する。
BlurHandは、シーケンシャルな手の画像から動きのぼかしを合成し、リアルで自然な動きのぼかしを模倣して作られている。
新しいデータセットに加えて、ぼやけた手画像から正確な3次元手メッシュを復元するためのベースラインネットワークであるBlurHandNetを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:40:29 GMT)
Optimal task and motion planning and execution for human-robot
multi-agent systems in dynamic environments [54.4] 本稿では,タスクのシーケンシング,割り当て,実行を最適化するタスクと動作計画の組み合わせを提案する。
このフレームワークはタスクとアクションの分離に依存しており、アクションはシンボル的タスクの幾何学的実現の可能な1つの可能性である。
ロボットアームと人間の作業員がモザイクを組み立てる共同製造シナリオにおけるアプローチの有効性を実証する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:50:45 GMT)
Shakes on a Plane: Unsupervised Depth Estimation from Unstabilized
Photography [54.4] 2秒で取得した12メガピクセルのRAWフレームの「長バースト」では,自然手震動のみからの視差情報で高品質のシーン深度を回復できることが示されている。
我々は、長時間バーストデータにニューラルRGB-D表現を適合させるテスト時間最適化手法を考案し、シーン深度とカメラモーションを同時に推定する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:54:46 GMT)
TMO: Textured Mesh Acquisition of Objects with a Mobile Device by using
Differentiable Rendering [54.4] スマートフォン1台でテクスチャ化されたメッシュを野生で取得するパイプラインを新たに提案する。
提案手法ではまず,RGBD支援構造を動きから導入し,フィルタした深度マップを作成できる。
我々は,高品質なメッシュを実現するニューラル暗黙表面再構成法を採用する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:07:52 GMT)
Opportunities and Challenges in Neural Dialog Tutoring [54.1] 言語学習のための2つの対話学習データセットを用いて、様々な生成言語モデルを厳密に分析する。
現在のアプローチでは、制約のある学習シナリオでチューリングをモデル化できますが、制約の少ないシナリオではパフォーマンスが悪くなります。
人的品質評価では, モデルと接地木アノテーションの両方が, 同等のチュータリングの点で低い性能を示した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:13:35 GMT)
Object Discovery from Motion-Guided Tokens [51.0] 自動エンコーダ表現学習フレームワークを、モーションガイダンスと中間レベルの特徴トークン化により強化する。
我々のアプローチは、解釈可能なオブジェクト固有の中間レベルの特徴の出現を可能にする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:14:00 GMT)
Aligning Step-by-Step Instructional Diagrams to Video Demonstrations [50.8] 組立図として表現される(i)命令ステップと、(ii)動画セグメントとを関連付ける新しい設定について考察する。
本稿では,ビデオの微妙な詳細化を学習する,教師付きコントラスト学習手法を提案する。
池田組立におけるIAW実験は, 代替案に対するアプローチの優れた性能を示すものである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:53:10 GMT)
$P+$: Extended Textual Conditioning in Text-to-Image Generation [50.8] テキスト・ツー・イメージ・モデルでは$P+$と呼ばれる拡張テキスト・コンディショニング・スペースを導入します。
拡張空間は画像合成に対してより密接な制御と制御を提供することを示す。
さらに、拡張テキスト変換(XTI)を導入し、画像は$P+$に変換され、層単位のトークンで表現される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:22:28 GMT)
Comment on "Comment on "Traversable wormhole dynamics on a quantum
processor" " [50.6] 我々は[1, arXiv:2302.07897]のコメントが鍵点上の[2]と一致することを観察する。
[1] の反対は、実験的に実装されたプロトコルの外での対実的なシナリオに関するものである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:45:47 GMT)
SPeC: A Soft Prompt-Based Calibration on Mitigating Performance
Variability in Clinical Notes Summarization [50.0] 本稿では,ソフトプロンプトを用いたモデルに依存しないパイプラインを導入し,確率に基づく要約の利点を保ちながら分散を減少させる。
実験結果から,本手法は性能を向上するだけでなく,様々な言語モデルの分散を効果的に抑制することが明らかとなった。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:56:26 GMT)
IRGen: Generative Modeling for Image Retrieval [49.7] 我々はシーケンス・ツー・シーケンス・モデルを用いて画像検索を生成モデルの一形態として再キャストする。
我々のフレームワークIRGenは、エンドツーエンドの微分検索を可能にする統一モデルである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:21:31 GMT)
Learning to Zoom and Unzoom [49.6] 入力画像にズームインし、空間的特徴を計算し、次に「アンゾム」して任意の変形を反転させる。
さまざまなタスクやデータセットを評価することで、この汎用性を実証する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:03:30 GMT)
Multipartite entanglement in a microwave frequency comb [46.5] 多周波デジタル信号処理プラットフォームを用いて伝送路に64の相関モードを求める。
我々の手法は近い将来さらに絡み合ったモードを生成するよう拡張することができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:11:35 GMT)
Hierarchically Self-Supervised Transformer for Human Skeleton
Representation Learning [45.1] 階層型トランスフォーマーベーススケルトンシーケンスエンコーダ(Hi-TRS)に組み込まれた自己教師型階層型事前学習方式を提案する。
教師付き評価プロトコルと半教師付き評価プロトコルの両方で,本手法は最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:35:11 GMT)
Gazeformer: Scalable, Effective and Fast Prediction of Goal-Directed
Human Attention [44.1] 我々は、これまで研究されなかった物体の視線を予測できるゼロショット学習のための新しいモデルを開発した。
Gazeformerは自然言語モデルを使ってターゲットを符号化し、スキャンパス予測における意味的類似性を活用する。
また、目標現在および目標存在探索タスクの標準視線予測において、既存の目標検出モデルよりも優れている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:02:48 GMT)
Rotating without Seeing: Towards In-hand Dexterity through Touch [43.9] 本稿では,タッチデクスタリティ(Touch Dexterity)を提案する。
小さな領域で正確な触覚センサーに頼る代わりに、ロボットハンドの片側をオーバーレイする密度の高い二分力センサー(タッチまたはタッチなし)を用いた新しいシステム設計を導入する。
我々は,各種物体のシミュレーションに強化学習を用いて手動回転ポリシーを訓練する。タッチオンリーセンシングを応用して,実際のロボットの手で直接ポリシーを展開し,トレーニングで提示されていない新規物体を回転させることができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:52:20 GMT)
PD-Quant: Post-Training Quantization based on Prediction Difference
Metric [43.8] ポストトレーニング量子化(PTQ)は、ニューラルネットワーク圧縮技術で、完全精度のモデルを低精度のデータ型を使用した量子化モデルに変換する。
適切な量子化パラメータを決定する方法が、現在直面している主要な問題である。
PD-Quantは、グローバル情報を考慮してこの制限に対処する手法である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:47:22 GMT)
The Differentiable Lens: Compound Lens Search over Glass Surfaces and
Materials for Object Detection [42.0] ほとんどのカメラレンズシステムは、下流のコンピュータ手法とは独立して設計されている。
本稿では,レンズ設計の課題に対処する最適化手法を提案する。
具体的には,ガラス材料のエンド・ツー・エンドコンテキストでの最適化を容易にするために,定量化ガラス変数を導入する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:16:47 GMT)
Few-Shot Domain Adaptation for Low Light RAW Image Enhancement [41.1] 実用的な低照度原画像の強調は、短い露光時間と照明の制限による激しいノイズや色歪みのために難しい課題である。
対象カメラからのラベル付きサンプルがほとんどない既存のソースカメラのラベル付きデータを利用するための,新規な数ショット領域適応手法を提案する。
実験の結果,対象カメラ領域のラベル付きサンプルは10個以下で,大容量のラベル付きカメラデータセットを用いてモデルをトレーニングするよりも,類似あるいは改善性能を向上できることがわかった。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:10:52 GMT)
Neural Network Approximations of PDEs Beyond Linearity: A
Representational Perspective [41.0] 非線形PDEの解を近似するためのニューラルネットワークの表現力について検討する。
Emphnonlinear elliptic variational PDEsとして知られるPDEのクラスを扱うことで、ニューラルネットワークは次元性の呪いを避けることができることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:49:07 GMT)
Learning Action Changes by Measuring Verb-Adverb Textual Relationships [40.6] 映像中の動作に適応した変化を示す副詞を予測することを目的としている。
我々は,副詞の予測とアントロニム分類に関する最先端の結果を得た。
そこで我々は,異なる動作を行うと意味のある視覚的変化を示す一連のアクションを,指導的レシピビデオに焦点をあてる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:53:38 GMT)
MD-VQA: Multi-Dimensional Quality Assessment for UGC Live Videos [39.1] 我々は、第一種主観的Live VQAデータベースを構築し、効果的な評価ツールを開発する。
textbfMD-VQAは、Live VQAデータベースと既存の圧縮VQAデータベースの両方で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:17:10 GMT)
Self-Supervised Learning for Gastritis Detection with Gastric X-ray
Images [38.7] そこで我々は,胃X線画像から明示的な自己教師付き学習を行い,識別表現を学習する新しい手法を開発した。
提案手法に基づいてトレーニングされたモデルは,いくつかの注釈付き胃X線画像からなるデータセットに基づいて微調整された。
胃X線画像を用いた胃炎検出における本法の有効性を実験的に検証した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:46:45 GMT)
Quantum Multi-Model Fitting [38.1] 本稿では,Multi-model fit (MMF) に対する最初の量子的アプローチを提案する。
我々は、目的関数の緩和を伴わずに、現代の断熱量子コンピュータで効率的にサンプリングできる問題としてMMFを定式化する。
実験により,様々なデータセットに対して有望な結果が得られた。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:59:54 GMT)
On Generalization of Decentralized Learning with Separable Data [37.9] 分離可能なデータに基づく勾配勾配勾配に基づく分散学習のアルゴリズム的および一般化特性について検討する。
具体的には、分散勾配降下と無限大で 0 に漸近する様々な損失関数に対して、新しい有限時間一般化境界を導出する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:28:31 GMT)
Generalization and Stability of Interpolating Neural Networks with
Minimal Width [37.9] 補間系における勾配によって訓練された浅層ニューラルネットワークの一般化と最適化について検討する。
トレーニング損失数は$m=Omega(log4 (n))$ニューロンとニューロンを最小化する。
m=Omega(log4 (n))$のニューロンと$Tapprox n$で、テスト損失のトレーニングを$tildeO (1/)$に制限します。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:00:54 GMT)
Learning a Deep Color Difference Metric for Photographic Images [36.7] 我々は、4つの望ましい特性を持つ写真画像の深度CDメトリクスを学習する。
写真画像間の正確なCDを計算し、主に色相が異なる。
特徴変換のためのマルチスケール自己回帰正規化フローを学習することで,これらの特性を一度に満たせることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:54:09 GMT)
Aerial-Ground Person Re-ID [36.7] 我々は,航空カメラと地上カメラをまたいで,人による再IDマッチングを行う新しいベンチマークデータセット AG-ReID を提案する。
データセットには、388のアイデンティティの21,983のイメージと、各IDに対する15のソフト属性が含まれている。
データは、高度15~45mのUAVと、大学のキャンパスで地上のCCTVカメラによって収集されました。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:56:21 GMT)
Xplainer: From X-Ray Observations to Explainable Zero-Shot Diagnosis [36.5] 臨床現場でのゼロショット診断のためのフレームワークであるXplainerを紹介した。
Xplainerは、コントラッシブ・ビジョン言語モデルの分類・記述アプローチをマルチラベル診断タスクに適用する。
我々の結果は、Xplainerが意思決定プロセスをより詳細に理解していることを示唆している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:36:12 GMT)
Generalizable Local Feature Pre-training for Deformable Shape Analysis [36.4] トランスファーラーニングは、ほとんどトレーニングデータのない設定で問題に対処するための基本となる。
変形可能な3Dオブジェクトを含むタスクにおける特徴の局所性と伝達可能性の関係を解析する。
本稿では,3次元伝達学習における受容場を最適化する微分可能な手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:13:46 GMT)
Level-S$^2$fM: Structure from Motion on Neural Level Set of Implicit
Surfaces [36.1] 本稿では、カメラのポーズとシーン形状を補正した画像から推定する、神経インクリメンタルなStructure-from-Motion(SfM)アプローチであるLevel-S$2$fMを提案する。
我々の新しい定式化は、インクリメンタルなSfMパイプラインにおいて、避けられない2ビューと少数ビューの設定のために、いくつかの新しい課題をもたらす。
Level-S$2$fMは、カメラポーズ推定とシーン形状再構成の有望な結果をもたらすだけでなく、カメラを知らずにニューラル暗示レンダリングの有望な方法を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:20:51 GMT)
DyGait: Exploiting Dynamic Representations for High-performance Gait
Recognition [35.6] 歩行認識は、歩行パターンを通して人間の身元を認識する生体計測技術である。
我々は動的特徴の抽出に焦点をあて,DyGaitという新しい高性能なフレームワークを提案する。
我々のネットワークは、GREWデータセットで71.4%、Gait3Dデータセットで66.3%、CAIA-Bデータセットで98.4%、OU-Mデータセットで98.3%の平均ランク1の精度を達成した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:36:47 GMT)
Prior-RadGraphFormer: A Prior-Knowledge-Enhanced Transformer for
Generating Radiology Graphs from X-Rays [35.5] 胸部X線(CXR)画像から直接ラジオグラフィーグラフを生成するための Pre-RadGraphFormer を提案する。
PKGは、解剖学的構造や医学的観察を含む放射線学の実体間の統計的関係をモデル化する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:50:44 GMT)
EFEM: Equivariant Neural Field Expectation Maximization for 3D Object
Segmentation Without Scene Supervision [35.2] 本研究では,3次元シーンのオブジェクトをアノテーションやトレーニングなしでセグメント化するために,EFEM(Equivariant Neural Field expectation Maximization)を導入する。
まず、この問題に同変形状表現を導入し、オブジェクト構成の変化によって引き起こされる複雑さを解消する。
第2に,前述した同変形状を用いて分割マスクを反復的に洗練する新しいEMアルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:59:29 GMT)
Diffusion Video Autoencoders: Toward Temporally Consistent Face Video
Editing via Disentangled Video Encoding [35.2] 拡散オートエンコーダに基づく新しい顔映像編集フレームワークを提案する。
我々のモデルは拡散モデルに基づいており、再構築と編集の両方を同時に行うことができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:15:59 GMT)
Seer: Language Instructed Video Prediction with Latent Diffusion Models [34.8] ビデオ予測は、命令と高忠実度フレームで指定されたタスクレベルの目標をまとめることが難しいタスクである。
時間軸に沿って,事前訓練されたテキスト・ツー・イメージ(T2I)の安定拡散モデルを膨らませることで,サンプルモデルと計算効率のよいtextbfSeerを提案する。
十分に設計されたアーキテクチャにより、Seerは少数のレイヤーを少量のデータで微調整することで、高忠実でコヒーレントで命令に沿ったビデオフレームを生成することができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 03:12:24 GMT)
Among Us: Adversarially Robust Collaborative Perception by Consensus [34.4] 複数のロボットは、シーン(例えば物体)を個人よりも協調的に知覚することができる。
本稿では,未知の攻撃者に対して一般化可能な新しいサンプリングベース防衛戦略であるROBOSACを提案する。
自律運転シナリオにおける協調3次元物体検出の課題に対して,本手法の有効性を検証した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:42:13 GMT)
Bilex Rx: Lexical Data Augmentation for Massively Multilingual Machine
Translation [33.6] この研究は、この問題に対処するための安価で豊富な資源であるバイリンガル・レキシカを探求する。
我々は,ウェブクローリングテキストを用いた200言語翻訳モデルを用いて,実世界の辞書におけるバイリンガル辞書の有効性を検証した。
筆者らは,(1)語彙データ拡張を用いて,教師なし翻訳の性能向上を実証し,(2)データ拡張のいくつかの家系を比較し,それらが類似した改善をもたらすことを示すとともに,(3)より大きく,ノイズの多いレキシカよりも慎重にキュレートされたレキシカの重要性を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:54:43 GMT)
CGC: Contrastive Graph Clustering for Community Detection and Tracking [33.5] グラフクラスタリングのための新しいエンドツーエンドフレームワークであるCGCを開発した。
CGCは、対照的なグラフ学習フレームワークでノードの埋め込みとクラスタ割り当てを学習する。
時間進化データに対してCGCを拡張し、時間的グラフクラスタリングを漸進的な学習方式で行う。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 00:03:08 GMT)
Detecting Backdoors During the Inference Stage Based on Corruption
Robustness Consistency [33.4] 本稿では,被害者モデルのハードラベル出力のみを必要とする試験時間トリガーサンプル検出法を提案する。
私たちの旅は、バックドアに感染したモデルが、クリーンな画像に対して異なる画像の破損に対して同様のパフォーマンスを持つのに、トリガーサンプルに対して不一致に実行するという興味深い観察から始まります。
大規模な実験では、最先端のディフェンスと比較すると、TeCoは異なるバックドア攻撃、データセット、モデルアーキテクチャにおいて、それらよりも優れています。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:10:37 GMT)
Generalizable Neural Voxels for Fast Human Radiance Fields [32.8] モノクロ映像から人体構造を極端に高速に学習できるレンダリングフレームワークを提案する。
このフレームワークは、ニューラルフィールドとニューラルボクセルを統合して構築されている。
提案手法は,従来手法に比べてトレーニング効率が有意に向上し,レンダリング品質も同等である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:00:31 GMT)
Hi4D: 4D Instance Segmentation of Close Human Interaction [32.5] Hi4Dは、20の被験者ペア、100のシーケンス、合計11Kフレームからなる4Dテクスチャスキャンのデータセットである。
このデータセットには、2Dと3Dのリッチなインタラクション中心アノテーションと、正確に登録されたパラメトリックボディモデルが含まれている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:53:09 GMT)
FreeKD: Free-direction Knowledge Distillation for Graph Neural Networks [32.0] 良く知られた過度なパラメータ化と過度な平滑化の問題のために、満足いく教師のGNNを訓練することは困難である。
我々は,GNNの強化学習を通じて,FreeKDと呼ばれる最初のフリーダイレクト知識蒸留フレームワークを提案する。
我々のFreeKDは汎用的で原則化されたフレームワークであり、異なるアーキテクチャのGNNと自然に互換性がある。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:59:30 GMT)
Enhancing General Face Forgery Detection via Vision Transformer with
Low-Rank Adaptation [31.8] 偽造の顔は 偽ニュースや 詐欺 偽造などの セキュリティ上の懸念を訴える
本稿では、視覚変換器(ViT)アーキテクチャに基づく、より一般的な偽顔検出モデルを設計する。
提案手法は, クロスマニピュレーションとクロスデータセット評価の両方において, 最先端検出性能を実現する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:42:24 GMT)
Neural Collapse Inspired Federated Learning with Non-iid Data [31.6] 非独立かつ同一に分散された(非ID)特性は、ローカル更新に大きな違いをもたらし、中央サーバの性能に影響する。
神経崩壊の現象にインスパイアされた私たちは、各クライアントを最適なグローバル構造に最適化するよう強制する。
提案手法は, 異なるサイズのデータセット上での収束速度を高速化して, 性能を向上することができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:29:53 GMT)
Debiasing Scores and Prompts of 2D Diffusion for Robust Text-to-3D
Generation [31.2] 可算名詞 可算名詞 可算名詞 可算名詞 可算名詞 可算名詞 可算名詞 可算名詞 〔of〕.
本稿では,ロバストテキスト・ツー・3D生成のためのスコア蒸留フレームワークをデバイアス化する2つの手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:31:13 GMT)
Spatio-Temporal AU Relational Graph Representation Learning For Facial
Action Units Detection [30.5] 提案手法は, (i) 入力シーケンスの各顔画像から強い顔表現を生成する事前訓練された顔エンコーダ表現, (ii) 顔表現から一連のAU特徴を学習するAU固有の特徴, (iii) 時間グラフ表現を構成する時間グラフ学習モジュールからなる。
当社のモデルは,第5回影響行動分析大会のAU認識トラックにおいて,第4位にランクインしている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:52:59 GMT)
Audio Visual Language Maps for Robot Navigation [30.3] 音声, 視覚, 言語情報からのクロスモーダル情報を格納するための3次元空間地図表現を統一したAVLMap(Audio-Visual-Language Map)を提案する。
AVLMapsは、インターネット規模で事前訓練されたマルチモーダル基礎モデルのオープン語彙機能を統合する。
ナビゲーションの文脈において、AVLMapsは、例えば、テキスト記述、画像、ランドマークの音声スニペットなどのマルチモーダルクエリに基づいて、ロボットシステムが地図内の目標をインデックスできることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:10:51 GMT)
Context-Aware Transformer for 3D Point Cloud Automatic Annotation [29.6] 自動3Dボックスラベスターとして、エンドツーエンドのコンテキスト認識変換器(CAT)を提案する。
Catは、少数の人間のアノテーションで訓練された2Dボックスから正確な3Dボックスアノテーションを生成する。
KITTIテストセットのハードタスクにおいて、既存の最先端の3D APを最大1.79%上回ることができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 03:00:18 GMT)
The Stable Signature: Rooting Watermarks in Latent Diffusion Models [29.2] 本稿では,画像透かしと潜時拡散モデルを組み合わせたアクティブな戦略を提案する。
目標は、生成したすべての画像が、将来の検出および/または識別を可能にする、見えない透かしを隠すことだ。
予め訓練された透かし抽出器は、生成された画像から隠された署名を回収し、統計検査を行い、生成モデルから来たものかどうかを判定する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:57:33 GMT)
Learning Iterative Neural Optimizers for Image Steganography [29.0] 本稿では,画像ステガノグラフィーが自然画像の(有意な)多様体上で本質的に実施されていることを論じる。
最適化を通して、ニューラルネットワークを訓練し、自然な画像の多様体に近づき続ける。
従来の最先端エンコーダ・デコーダ・ベースのステガノグラフィ法と比較して、回復誤差を桁違いに低減する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:17:07 GMT)
3D Human Mesh Estimation from Virtual Markers [28.3] 体表面上の64個のランドマークキーポイントを学習する仮想マーカーを中間表現として提示する。
提案手法は3つのデータセット上で最先端の手法より優れている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:19:57 GMT)
AIR-DA: Adversarial Image Reconstruction for Unsupervised Domain
Adaptive Object Detection [28.2] 特徴抽出器の対角訓練を容易にするための正則化器としての適応画像再構成(AIR)
ドメインシフトに挑戦するいくつかのデータセットにまたがって評価を行った結果,提案手法が従来の手法よりも優れていたことが判明した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:51:51 GMT)
FaceLit: Neural 3D Relightable Faces [28.1] FaceLitは、ユーザーが定義した様々な照明条件やビューでレンダリングできる3D顔を生成することができる。
FFHQデータセット上での3次元認識GANのFIDスコア3.5。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:59:10 GMT)
Online Knowledge Distillation via Mutual Contrastive Learning for Visual
Recognition [27.3] オンライン知識蒸留(KD)のための相互コントラスト学習(MCL)フレームワークを提案する。
我々のMCLは、クロスネットワーク埋め込み情報を集約し、2つのネットワーク間の相互情報に対する低境界を最大化することができる。
画像分類と視覚認識タスクへの変換学習の実験は、階層的MCLが一貫した性能向上につながることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:12:20 GMT)
Universal Few-shot Learning of Dense Prediction Tasks with Visual Token
Matching [26.3] 任意の密接な予測タスクに対して,ビジュアルトークンマッチング(VTM)を汎用的な数ショット学習として提案する。
VTMは、マッチングアルゴリズムを変調するタスク固有のパラメータの少ないタスクに柔軟に適応する。
我々は,タスクノミーデータセットの挑戦的な変種を用いてVTMを実験し,無意味な高密度な予測タスクを頑健に学習していることを観察した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:58:42 GMT)
Towards Open Temporal Graph Neural Networks [26.0] 本稿では,OTGNetと呼ばれるオープン時間グラフに対する汎用的,原則的学習手法を提案する。
ノードの知識は、クラス関連とクラス非依存に切り離すことができると仮定する。
また,重要な部分グラフ構造と多様な部分グラフ構造を効果的に選択するための戦略を考案した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:58:22 GMT)
Handwritten Text Generation from Visual Archetypes [26.0] Few-Shotスタイルの手書きテキスト生成のためのTransformerベースのモデルを提案する。
我々は,大規模な合成データセット上で,特定の事前学習を活用することで,目に見えない作者の書跡の堅牢な表現を得る。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:58:20 GMT)
Boosting Reinforcement Learning and Planning with Demonstrations: A
Survey [25.8] シーケンシャルな意思決定にデモを使うことの利点について論じる。
我々は,最近提案されたManiSkillロボット学習ベンチマークにおいて,デモの生成と活用のための実用的なパイプラインを実演する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:25:01 GMT)
LongShortNet: Exploring Temporal and Semantic Features Fusion in
Streaming Perception [25.8] LongShortNetは、長期の時間的動きを捉え、それをリアルタイム知覚のための短期空間意味論と統合する新しいデュアルパスネットワークである。
我々は、Argoverse-HDデータセット上でLongShortNetを評価し、既存の最先端手法よりも計算コストがほとんどないことを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:08:57 GMT)
UFO: A unified method for controlling Understandability and Faithfulness
Objectives in concept-based explanations for CNNs [25.5] 畳み込みニューラルネットワーク(CNN)の概念に基づく説明は、事前に定義されたセマンティック概念のセットを使用して、モデルの振る舞いと出力を説明することを目的としている。
彼らはしばしば、モデルの振る舞いを忠実に(正確に)特徴づけておらず、人々が理解するには複雑すぎる。
本研究では,概念に基づく説明において,理解可能性と忠実度を統一的に制御するUFOを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:08:31 GMT)
Partially Adaptive Multichannel Joint Reduction of Ego-noise and
Environmental Noise [25.5] エゴノワーズは主にロボットの内部モーターと関節によって引き起こされる。
本研究では,エゴノイズと環境騒音を協調的にモデル化する多チャンネル部分適応方式を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:40:14 GMT)
An End-to-End Framework For Universal Lesion Detection With Missing
Annotations [24.9] そこで本研究では,検出器を同時に訓練しながら,ラベルのない病変をマイニングするための新しいエンドツーエンドフレームワークを提案する。
本研究の枠組みは,高信頼度予測と,学生モデル学習のための部分的にラベル付けされた基礎的真理が組み合わさっている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:16:10 GMT)
SimpleNet: A Simple Network for Image Anomaly Detection and Localization [24.8] 本稿では,異常検出と局所化のためのシンプルでアプリケーションフレンドリーなネットワーク(SimpleNet)を提案する。
SimpleNetは、(1)ローカル特徴を生成する事前訓練されたフィーチャーエクストラクタ、(2)ターゲットドメインにローカル特徴を変換する浅いフィーチャーアダプタ、(3)異常特徴を偽装する単純なアノマリーフィーチャージェネレータの4つのコンポーネントから構成される。
MVTec ADベンチマークでは、SimpleNetは99.6%の異常検出AUROCを達成し、次の最高のパフォーマンスモデルと比較してエラーを55.5%削減した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:18:52 GMT)
Personalized Federated Learning on Long-Tailed Data via Adversarial
Feature Augmentation [24.7] PFLは、プライバシを保存する方法で、すべてのクライアントの知識に基づいて、各クライアントのパーソナライズされたモデルを学ぶことを目的としている。
既存のPFL法では、全てのクライアントにわたる基礎となるグローバルデータが、ロングテール分布を考慮せずに均一に分散されていると仮定している。
PFLにおけるこの共同問題に対処するために,FedAFA(Federated Learning with Adversarial Feature Augmentation)を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:00:20 GMT)
Unsupervised Representation Learning for 3D MRI Super Resolution with
Degradation Adaptation [24.4] 高分解能(HR)磁気共鳴イメージングは、診断や画像誘導治療において医師を支援する上で重要である。
深層学習に基づく超解像再構成(SRR)は、低分解能(LR)画像から超解像(SR)画像を生成するための有望な解決策として登場した。
このようなニューラルネットワークのトレーニングには、画像取得中と画像取得間の患者の動きのために取得が困難である、整列したHRとLRイメージペアが必要である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:39:54 GMT)
Bi-Manual Block Assembly via Sim-to-Real Reinforcement Learning [24.2] 2つのxArm6ロボットがU字型組立タスクを、シミュレーションで90%以上、実際のハードウェアで50%の確率で解決する。
以上の結果から,本システムは今後,深部RLおよびSim2Real転送バイマニュアルポリアの研究を刺激していきたいと願っている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:25:24 GMT)
Exploring Continual Learning of Diffusion Models [24.1] 拡散モデルの連続学習(CL)特性を評価する。
我々は,拡散の時間経過にまたがる多様な行動を示す,忘れのダイナミクスに関する洞察を提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:52:14 GMT)
Learning Attention as Disentangler for Compositional Zero-shot Learning [23.9] 合成ゼロショット学習(CZSL)の鍵となるのは、属性オブジェクト合成の歪みを学習することである。
クロスアテンションを構成的アンタングルとして利用して,非アンタングルな概念の埋め込みを学習する。
本手法は, クローズド・オープン・ワールド・セッティングにおいて, 従来よりも大幅に優れていた。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:29:54 GMT)
Multilingual Bidirectional Unsupervised Translation Through Multilingual
Finetuning and Back-Translation [23.4] 本研究では,NMTモデルをトレーニングし,未知の言語を英語と英語の両方に翻訳する2段階のアプローチを提案する。
最初の段階では、事前訓練されたXLM-RおよびRoBERTa重みにエンコーダデコーダモデルを初期化し、40言語で並列データに対して多言語微調整を行う。
このモデルは、目に見えない言語でのゼロショット翻訳に一般化できる。
私たちの最後のシングルEcXTra訓練モデルは、すべての翻訳方向の競合翻訳性能を実現し、特に、英語からカザフ語への新たな最先端(22.9 > 10.4 BLEU)を確立する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:41:21 GMT)
Unified Text Structuralization with Instruction-tuned Language Models [23.3] テキストから様々な構造を抽出する大規模言語モデル(LLM)を提案する。
実験により、様々な言語や知識のデータセット上で、言語モデルが他の最先端の手法と同等に動作できることが示されている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:39:05 GMT)
Can't Steal? Cont-Steal! Contrastive Stealing Attacks Against Image
Encoders [23.3] 自己教師付き表現学習技術は、下流のタスクに不利なリッチな特徴に画像をエンコードする。
専用モデル設計と大量のリソースの要求は、潜在的なモデル盗難攻撃のリスクに画像エンコーダを露出させる。
本研究では,コントラスト学習に基づく攻撃であるCont-Stealを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:45:43 GMT)
On the Importance of Feature Separability in Predicting
Out-Of-Distribution Error [22.8] そこで本研究では,分布シフト時のテスト精度を推定するために,特徴分散に基づくデータセットレベルスコアを提案する。
本手法は,表現学習における特徴の望ましい特性,すなわちクラス間分散とクラス内コンパクト性に着想を得たものである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:52:59 GMT)
Edge-free but Structure-aware: Prototype-Guided Knowledge Distillation
from GNNs to MLPs [22.5] グラフタスク上での低遅延多層パーセプトロン(MLP)への高精度グラフニューラルネットワーク(GNN)の蒸留はホットな研究トピックとなっている。
グラフエッジ(エッジフリー)を必要としないが構造認識を学習するプロトタイプガイド型知識蒸留(PGKD)法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:06:35 GMT)
Do Deep Learning Methods Really Perform Better in Molecular Conformation
Generation? [22.1] 従来のMDG法に基づくシンプルで安価なアルゴリズムを設計する。
GEOM-QM9 や GEOM-Drugs のベンチマークでは,ディープラーニングに基づく MCG 手法に匹敵する,あるいは性能に優れていた。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:15:37 GMT)
Adaptive Federated Learning via Entropy Approach [21.8] フェデレートラーニング(FL)は、リソース制約のあるクライアントが中央サーバのオーケストレーションの下でグローバルモデルを協調的に学習することを可能にする。
異種クライアントの機器とデータのばらつきの違いにより、局所モデル間のパラメータ偏差が生じる。
本稿では,エントロピー理論に基づく適応学習率スキームを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:57:04 GMT)
Learning the Unlearnable: Adversarial Augmentations Suppress Unlearnable
Example Attacks [21.6] 学習不能な例攻撃は、ディープラーニングモデルをトレーニングするための許可されていない使用に対して、公開データを保護するために使用することができる。
UEraser法は、未学習の事例攻撃に対する現在の防御よりも優れる。
私たちのコードはオープンソースで、ディープラーニングコミュニティで利用できます。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:00:54 GMT)
DETRs with Hybrid Matching [21.6] 1対1のセットマッチングは、DETRがエンドツーエンドの機能を確立するための鍵となる設計である。
本稿では,従来の1対1のマッチングブランチと,トレーニング中に補助的な1対1のマッチングブランチを組み合わせるハイブリッドマッチング方式を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:27:04 GMT)
Progressive Transformation Learning for Leveraging Virtual Images in
Training [21.6] 本稿では,PTL(Progressive Transformation Learning)を導入し,リアル性を高めた仮想画像を追加することにより,トレーニングデータセットを増強する。
1) 領域ギャップに応じて仮想イメージのプールからサブセットを選択する,2) 選択した仮想イメージを変換してリアリズムを向上する,3) 変換された仮想イメージをトレーニングセットに追加する,という3つのステップを段階的に繰り返す。
実験により、PTLは、特に小さなデータとクロスドメインシステムにおいて、ベースラインよりも大幅にパフォーマンスが向上することが示された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:21:27 GMT)
Learned Image Compression with Mixed Transformer-CNN Architectures [21.5] 本稿では, 並列トランスフォーマー-CNN混合ブロック(TCM)を提案する。
近年のエントロピー推定モデルとアテンションモジュールの進歩に触発されて,パラメータ効率の高いスウィントランスフォーマーに基づくアテンションを持つチャネルワイドエントロピーモデルを提案する。
実験により,提案手法が最先端の速度歪み性能を実現することを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:19:01 GMT)
Continuous Intermediate Token Learning with Implicit Motion Manifold for
Keyframe Based Motion Interpolation [20.3] 精度に基づく制約で潜在動作を定式化するための新しい枠組みを提案する。
提案手法は,地上の真理運動に優れたデータセットの精度と高い視覚的類似性を実証する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:53:01 GMT)
EVA-CLIP: Improved Training Techniques for CLIP at Scale [20.1] 本稿では,CLIPトレーニングの効率と有効性を向上する一連のモデルであるEVA-CLIPを提案する。
提案手法は, 表現学習, 最適化, 拡張のための新しい手法を取り入れ, EVA-CLIPによる性能向上を実現する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:02:21 GMT)
Towards Practical Plug-and-Play Diffusion Models [19.8] 拡散に基づく生成モデルは、画像生成において顕著な成功を収めた。
市販の市販オフザシェルフモデルのガイダンスへの直接的使用は、ノイズの多い入力のパフォーマンスが低かったために失敗する。
既存のプラクティスは、ノイズで汚染されたラベル付きデータでガイダンスモデルを微調整することです。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:17:48 GMT)
Self-Supervised Video Forensics by Audio-Visual Anomaly Detection [19.8] 操作されたビデオには、視覚信号と音声信号の間に微妙な矛盾があることが多い。
本稿では,これらの不整合を識別できる異常検出に基づくビデオ法医学手法を提案する。
ビデオフレームと音声の時間同期をキャプチャする特徴セットを用いて、自動回帰モデルを訓練し、音声・視覚的特徴のシーケンスを生成する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:53:32 GMT)
NL4Opt Competition: Formulating Optimization Problems Based on Their
Natural Language Descriptions [19.0] 競争の目標は、非専門家が自然言語を使ってそれらと対話できるようにすることにより、最適化ソルバのアクセシビリティとユーザビリティを向上させることである。
LPワード問題データセットを提示し,NeurIPS 2022コンペティションのためのタスクを共有する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:10:12 GMT)
Improving the Transferability of Adversarial Examples via Direction
Tuning [18.9] 移動型対人攻撃では、敵対例は代理モデルによってのみ生成され、犠牲者モデルにおいて効果的な摂動が達成される。
新たなトランスファーベースアタック、すなわち方向調整アタックが提案され、大きなステップ長の更新偏差を減少させる。
さらに,ネットワークプルーニング手法を提案し,決定境界を円滑にすることで,更新振動を低減し,生成した逆数例の転送性を向上させる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:26:34 GMT)
Physics-Informed Optical Kernel Regression Using Complex-valued Neural
Fields [18.8] 本稿では,リソグラフィーモデルを非パラメトリックマスク操作に分解する新しい機械学習パラダイムを提案する。
我々のフレームワークは、69$times$1.3$times$1.3$times$小さな平均二乗誤差を達成しながら、31%のパラメータを使うことができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:11:17 GMT)
Learning Harmonic Molecular Representations on Riemannian Manifold [18.5] 分子表現学習は、AIによる薬物発見研究において重要な役割を担っている。
本研究では,その分子表面のラプラス・ベルトラミ固有関数を用いた分子を表現する高調波分子表現学習フレームワークを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:02:47 GMT)
NeuFace: Realistic 3D Neural Face Rendering from Multi-view Images [18.5] 本稿では,新しい3次元顔レンダリングモデルであるNeuFaceを提案し,その基礎となる3次元表現の正確かつ物理的意味を学習する。
BRDFと簡易な低ランク前処理を導入し,両面のあいまいさを効果的に低減し,顔のBRDFの性能を向上させる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:17:02 GMT)
Lifetime-based Optimization for Simulating Quantum Circuits on a New
Sunway Supercomputer [18.4] 本稿では,スライシングオーバーヘッドを低減し,計算効率を向上させる新しい手法を提案する。
結果としてのシミュレーション時間は、Sycamore量子プロセッサRQCの96.1秒に短縮される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:36:39 GMT)
The Resource Problem of Using Linear Layer Leakage Attack in Federated
Learning [18.3] また,SOTAと比較してモデルサイズを327$times$以上,計算時間を334$times$以上削減できることを示す。
スパーシティの使用は,SOTAと比較してモデルサイズオーバーヘッドを327$times$以上,計算時間を3.34$times$以上削減できることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:21:31 GMT)
HexPlane: A Fast Representation for Dynamic Scenes [18.3] 動的3Dシーンは、6つの学習された特徴の平面で明示的に表現できることを示し、HexPlaneと呼ばれるエレガントなソリューションを生み出します。
HexPlaneは、高効率な各平面から抽出されたベクトルを融合させることにより、時空の点の特徴を計算する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:39:58 GMT)
D-TrAttUnet: Dual-Decoder Transformer-Based Attention Unet Architecture
for Binary and Multi-classes Covid-19 Infection Segmentation [18.2] 我々はCTスライスからのCovid-19感染症分離のためのTransformer-CNNベースの新しいアプローチを提案する。
Transformer-CNNエンコーダはTransformerレイヤ、UpResBlocks、ResBlocks、max-poolingレイヤを使って構築されている。
The proposed D-TrAttUnet architecture is evaluate for both Binary and Multi-classes Covid-19 infection segmentation。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 20:05:09 GMT)
FEATHERS: Federated Architecture and Hyperparameter Search [18.2] FEATHERS - $textbfFE$derated $textbfA$rchi$textbfT$ecture and $textbfH$yp$textbfER$ $textbfS$earchを紹介します。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:26:59 GMT)
DiffRF: Rendering-Guided 3D Radiance Field Diffusion [18.2] 本稿では,拡散確率モデルに基づく3次元放射場合成の新しい手法であるDiffRFを紹介する。
2次元拡散モデルとは対照的に、我々のモデルは多視点一貫した先行情報を学習し、自由視点合成と正確な形状生成を可能にする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:51:07 GMT)
An Information Extraction Study: Take In Mind the Tokenization! [18.2] 文書から情報を抽出する際のトークン化の影響について検討する。
本稿では,サブワードベースモデルと文字ベースモデルの比較研究と解析を行う。
トークン化パターンは、最先端のパフォーマンスをもたらす帰納的バイアスをもたらす可能性がある。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:08:35 GMT)
Lifting uniform learners via distributional decomposition [17.8] 均一分布の下で動作する任意のPAC学習アルゴリズムが、ブラックボックス方式で、任意の未知分布の$mathcalD$の下で動作させるアルゴリズムに変換可能であることを示す。
重要な技術的要素は、前述の$mathcalD$にアクセスすると、$mathcalD$の最適な決定木分解を生成するアルゴリズムである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:55:25 GMT)
CAT: LoCalization and IdentificAtion Cascade Detection Transformer for
Open-World Object Detection [17.8] オープンワールドオブジェクト検出には、既知のオブジェクトと未知のオブジェクトの両方を検出するために、既知のオブジェクトのデータからトレーニングされたモデルが必要である。
CAT: LoCalization and IdentificAtion Cascade Detection Transformerを提案する。
我々のモデルはOWOD, インクリメンタルオブジェクト検出(IOD), オープンセット検出といったタスクにおけるすべての指標において, 最先端技術よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:37:27 GMT)
Deep Spiking Neural Networks with High Representation Similarity Model
Visual Pathways of Macaque and Mouse [17.5] スパイクニューラルネットワーク(SNN)は、スパイクニューロンがスパイクの時系列で情報をエンコードしているため、生物学的に妥当なモデルである。
本研究では,視覚野を深部SNNで初めてモデル化し,また最先端の深部CNNとViTで比較した。
SNNのほぼ全ての類似度スコアは、平均6.6%のCNNよりも高い。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:12:45 GMT)
Efficient Activation Function Optimization through Surrogate Modeling [17.4] 本稿は,3つのステップによるアートの状況改善を目的としている。
まず、ベンチマークデータセットであるAct-Bench-CNN、Act-Bench-ResNet、Act-Bench-ViTが作成された。
第2に、ベンチマーク空間のキャラクタリゼーションが開発され、新しいサロゲートに基づく最適化手法が開発された。
第3に、サロゲートは、CIFAR-100およびImageNetタスクの活性化機能の改善を発見するために使用された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:35:49 GMT)
3DGen: Triplane Latent Diffusion for Textured Mesh Generation [17.2] 三面体VAEは、テクスチャメッシュの潜時表現を学習し、条件拡散モデルが三面体の特徴を生成する。
このアーキテクチャは初めて、高品質なテクスチャ化された、3Dメッシュの条件付きおよび非条件生成を可能にする。
メッシュの品質とテクスチャ生成において、イメージコンディショニングと非コンディショナリ生成において、従来よりも大幅にパフォーマンスが向上した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:04:20 GMT)
Text is All You Need: Personalizing ASR Models using Controllable Speech
Synthesis [17.2] 特定の個人に汎用音声認識モデルを適用することは、パーソナライズされたデータの不足のために難しい問題である。
近年の研究では、パーソナライズされたテキスト音声合成によるトレーニングデータの量の増加が提案されている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:50:02 GMT)
ChatGPT as a Factual Inconsistency Evaluator for Abstractive Text
Summarization [17.2] ゼロショット設定下でのChatGPTの非整合性評価能力について検討した。
その結果、ChatGPTは3つのタスクにわたる6/9データセットのSOTA評価指標よりも優れていた。
結果は、迅速な設計の重要性と、評価バイアス、誤った推論、幻覚に対するChatGPTの限界に対処する必要があることも強調している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 22:30:39 GMT)
PreFair: Privately Generating Justifiably Fair Synthetic Data [17.0] PreFairは、差分プライバシー(DP)公正な合成データ生成を可能にするシステムである。
我々は、合成データ生成シナリオに適合する正当性の概念に適応する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:11:51 GMT)
Active Self-Supervised Learning: A Few Low-Cost Relationships Are All
You Need [17.0] Self-Supervised Learning (SSL)は、ラベルのないデータから転送可能な表現を学習する選択肢のソリューションとして登場した。
本研究では,ポジティブアクティブラーニング(PAL)を通じて,この原則を一般化し,定式化する。
PALは3つの主要な目標を達成している。まず、SSLを超えて理論的に基礎付けられた学習フレームワークを公表する。これは、雇用されたオラクルに依存する教師付きおよび半教師付き学習に取り組むために拡張できる。
第二に、事前知識、例えばいくつかのラベルをトレーニングパイプラインの変更なしにSSL損失に組み込むための一貫したアルゴリズムを提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:44:39 GMT)
Mutually-paced Knowledge Distillation for Cross-lingual Temporal
Knowledge Graph Reasoning [17.0] 言語間の時間的知識グラフ推論問題は,低リソース言語における時間的知識グラフの推論を容易にすることを目的としている。
知識伝達のブリッジとして機能する言語間アライメントは通常、2つのTKG間で十分な知識を伝達するには不十分である。
本稿では,TKGをトレーニングした教師ネットワークが,TKGを対象とする学生ネットワークのトレーニングをガイドできる,相互に接触した知識蒸留モデルMP-KDを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 03:15:27 GMT)
Unimodal Training-Multimodal Prediction: Cross-modal Federated Learning
with Hierarchical Aggregation [16.3] HA-Fedformerは新しいトランスフォーマーベースのモデルで、クライアントでのアンモダルデータセットのみを使用して、単一モダルトレーニングを可能にする。
我々は,マルコフ連鎖モンテカルロサンプリングを用いた局所エンコーダの不確実性を考慮したアグリゲーション法を開発した。
一般的な感情分析ベンチマークであるCMU-MOSIとCMU-MOSEIの実験は、HA-Fedformerが最先端のマルチモーダルモデルを大幅に上回ることを示した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:07:33 GMT)
High-fidelity 3D Human Digitization from Single 2K Resolution Images [16.3] 大規模な2K人間のデータセットを構築し、2K解像度画像から3次元人間のモデルを推定する2K2Kを提案する。
また, テクスチャマップ, 3Dジョイント, SMPLパラメータなど, 2,050個の人体モデルも提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:22:54 GMT)
FeatureBooster: Boosting Feature Descriptors with a Lightweight Neural
Network [16.1] 同じ画像内のキーポイントの記述子を改善するために,軽量なネットワークを導入する。
ネットワークは、元の記述子とキーポイントの幾何学的性質を入力として取り込む。
提案するネットワークを用いて,手工芸品(ORB,SIFT)と最先端の学習ベース記述子の両方を増強する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:18:59 GMT)
From Self-Adaptation to Self-Evolution Leveraging the Operational Design
Domain [15.7] 自己適応は、変化する状況に対処するための実行可能なアプローチであることが示されている。
自己適応システムの能力は、その運用設計領域(ODD)によって制約される
ODDの定義を提供し、それを自己適応システムに適用する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:49:07 GMT)
Theoretical Analyses of Multiobjective Evolutionary Algorithms on
Multimodal Objectives [15.6] OJZJ問題(OJZJ problem)は、古典的なジャンプ関数のベンチマークに同型な2つの目的からなる双目的問題である。
確率1のSEMOは、実行時に関係なく、完全なParetoフロントを計算していないことを証明します。
また、より厳密な制限付き$frac 32 e nk+1 pm o(nk+1)$を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:57:10 GMT)
SAFE: Sensitivity-Aware Features for Out-of-Distribution Object
Detection [15.5] バッチ正規化による残差畳み込み層は感性認識機能(SAFE)を生じることを示す。
SAFEは、分布外検出と分布内検出を区別するために一貫して強力である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:39:41 GMT)
List Online Classification [15.0] 学習者が複数のラベルのリストを用いて予測できるマルチクラスオンライン予測について検討する。
我々は、このモデルにおける学習可能性について、$b$-ary Littlestone 次元を用いて特徴づける。
私たちの研究の一環として、ラベルのリストを使って予測するために、LittlestoneのSOAやRosenblattのPerceptronのような古典的なアルゴリズムを適用しました。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:56:57 GMT)
DualAfford: Learning Collaborative Visual Affordance for Dual-gripper
Manipulation [15.0] そこで我々は,DualAffordという新しい学習フレームワークを提案する。
この手法の中核となる設計は、2つのグリップの二次問題を2つの非絡み合った相互接続サブタスクに還元し、効率的な学習を行うことである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 04:10:14 GMT)
$P^{3}O$: Transferring Visual Representations for Reinforcement Learning
via Prompting [14.8] 本稿では,ターゲットからソース環境への視覚表現の転送を行う3段階DRLアルゴリズムであるPromptベースのP3O$を紹介した。
We implement $P3O$ and evaluation it on the OpenAI CarRacing video game。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:15:09 GMT)
Cross-utterance ASR Rescoring with Graph-based Label Propagation [14.7] 本稿では,グラフに基づくラベルの伝搬を反映した新しいASR N-best仮説を提案する。
従来のニューラルネットワークモデル(LM)をベースとしたASR再構成/格付けモデルとは対照的に,本手法は音響情報に重点を置いている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:08:05 GMT)
Error-mitigated Quantum Approximate Optimization via Learning-based
Adaptive Optimization [14.6] 組合せ最適化問題は、一般にユビキタスで計算的に解決が難しい。量子コンピューティングは、潜在的な計算上の利点を提供する強力なツールとして考えられている。
最も代表的な量子古典ハイブリッドアルゴリズムの1つである量子近似最適化アルゴリズム(QAOA)は、特定の最適化問題を解くために設計されている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:14:56 GMT)
Physical Backdoor Trigger Activation of Autonomous Vehicle using
Reachability Analysis [14.6] 最近の研究では、自動運転車は隠れたバックドアで操作できることが示されている。
本研究は制御力学系の到達可能性問題として物理トリガ活性化を示す。
本手法は,事故の引き金条件に到達可能な交通システムにおけるセキュリティクリティカル領域を同定する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 04:05:48 GMT)
Classifier Robustness Enhancement Via Test-Time Transformation [14.6] アドリナルトレーニングは、現在、敵の攻撃下での分類を達成するための最もよく知られている方法である。
本稿では,ロバストネス向上型テスト時間変換(TETRA)について紹介する。
本研究では,提案手法が最先端の成果を達成し,広範囲な実験を通じてその主張を検証した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:28:20 GMT)
LOT: Layer-wise Orthogonal Training on Improving $\ell_2$ Certified
Robustness [14.2] 近年の研究では、リプシッツ制約によるディープニューラルネットワーク(DNN)のトレーニングは、対向的ロバスト性や安定性などのモデル特性を高めることができることが示されている。
本研究では,1-Lipschitz畳み込み層を効果的に学習するための層ワイド直交訓練法(LOT)を提案する。
LOTは、決定論的l2証明されたロバスト性に関して、ベースラインを著しく上回り、より深いニューラルネットワークにスケールすることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:19:33 GMT)
A New Family of Generalization Bounds Using Samplewise Evaluated CMI [14.1] 本稿では,学習損失と人口損失を連接凸関数を用いて比較する情報理論の一般化境界系を提案する。
これまでに知られていた情報理論境界を拡張することで,この枠組みの汎用性を実証する。
いくつかのシナリオでは、この新しい境界は、以前の境界よりも深いニューラルネットワークの人口減少を厳しく評価する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:53:56 GMT)
Multi-Flow Transmission in Wireless Interference Networks: A Convergent
Graph Learning Approach [14.0] ネットワークデータ信号の2段階干渉対応マルチフロー最適化(DIAMOND)という新しいアルゴリズムを提案する。
集中型ステージは、グラフニューラルネットワーク(GNN)強化学習(RL)ルーティングエージェントの新しい設計を用いて、マルチフロー伝送戦略を計算する。
そして、分散学習更新の新しい設計に基づいて、分散ステージにより性能が向上する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:49:47 GMT)
Improving the speed of variational quantum algorithms for quantum error
correction [13.9] 本稿では、量子回路に作用する汎用量子ノイズに対して、適切な量子誤り補正(QEC)手順を考案する問題を考察する。
一般に、符号化と補正のユニタリゲートを得るための解析的普遍的な手順は存在しない。
次数1の量子ワッサーシュタイン距離に基づくコスト関数を用いてこの問題に対処する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:43:27 GMT)
DepthFormer: Multimodal Positional Encodings and Cross-Input Attention
for Transformer-Based Segmentation Networks [13.9] セグメンテーションタスクで最先端のパフォーマンスを達成したトランスフォーマーベースのディープラーニングアーキテクチャに焦点をあてる。
位置エンコーディングに埋め込んで深度情報を活用することを提案する。
私たちのアプローチは、Cityscapesベンチマークのパフォーマンスを継続的に改善します。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:54:49 GMT)
A large-scale dataset for end-to-end table recognition in the wild [13.7] テーブル認識(Table Recognition, TR)は、パターン認識におけるホットスポットの一つ。
現在、実際のシナリオにおけるエンドツーエンドのTRは、3つのサブタスクを同時に達成しているが、まだ探索されていない研究領域である。
そこで本研究では,様々なテーブル形式を持つテーブル認識セット(TabRecSet)という大規模データセットを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:48:51 GMT)
Railway Network Delay Evolution: A Heterogeneous Graph Neural Network
Approach [13.7] 列車、列車、駅間の相互作用を捉え、異なるエッジに基づいて駅や他の駅間での遅延進化を捉えることを目的としている。
提案したSAGE-Hetモデルの性能とロバスト性をテストするために,中国鉄道網の2つのサブネットワークのデータを適用した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:08:34 GMT)
Information Maximizing Curriculum: A Curriculum-Based Approach for
Training Mixtures of Experts [13.7] 混合専門家(MoE)は、複数のモードで複雑な条件分布を学習できることで知られている。
そこで本研究では,MoEの各コンポーネントが学習用トレーニングデータのサブセットを選択可能な,新たなカリキュラムベースの混合モデル学習手法を提案する。
我々は,様々なマルチモーダル行動学習タスクに対するカリキュラムベースのアプローチを評価し,MoEモデルと条件付き生成モデルを学ぶための競合する手法よりも優れていることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:02:50 GMT)
Probing Complex-energy Topology via Non-Hermitian Absorption
Spectroscopy in a Trapped Ion Simulator [13.7] 非エルミート系は複雑なエネルギーを持ち、リンクや結び目のような位相構造をホストすることができる。
ここでは, 複雑なアイジネギーがアンリンク, カンノット, ホップリンク構造を示す単一トラップイオンを持つ2バンド非エルミート模型を実験的に実現した。
我々の研究は、複素エネルギーが非エルミタン吸収分光法を用いて量子シミュレータで実験的に測定できることを実証した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:21:01 GMT)
Contrastive Learning Is Spectral Clustering On Similarity Graph [13.4] 標準InfoNCE損失と対照的な学習は、類似性グラフ上のスペクトルクラスタリングと等価であることを示す。
理論的な知見により、いくつかの視覚データセット上で標準のガウスカーネルよりも優れた新しいカーネル関数を組み込んだカーネル混合損失を導入する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:13:35 GMT)
Towards End-to-End Generative Modeling of Long Videos with
Memory-Efficient Bidirectional Transformers [13.4] 本稿では,ビデオの長期依存性をエンドツーエンドに学習するためのメモリ指向の双方向変換器(MeBT)を提案する。
本手法は,部分的に観察されたパッチからビデオの全時間容積を並列に復号する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:53:58 GMT)
MAIR: Multi-view Attention Inverse Rendering with 3D Spatially-Varying
Lighting Estimation [13.3] マルチビュー画像を用いてシーンを幾何学、SVBRDF、3次元空間的に変化する照明に分解するシーンレベルの逆レンダリングフレームワークを提案する。
実験の結果,提案手法はシングルビュー方式よりも優れた性能を示すが,実世界のシーンでは頑健な性能が得られることがわかった。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 04:32:11 GMT)
Parameter Efficient Local Implicit Image Function Network for Face
Segmentation [13.1] 顔解析は、人間の顔を含む画像のピクセルごとのラベル付けとして定義される。
我々は人間の顔の構造的整合性を利用して、軽量な顔解析法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:50:27 GMT)
"That's important, but...": How Computer Science Researchers Anticipate
Unintended Consequences of Their Research Innovations [12.9] 意図しない結果を考えることは一般的に重要であるが、実践されることは滅多にない。
主要な障壁は、正式なプロセスと戦略の欠如と、迅速な進歩と出版を優先する学術的な実践である。
我々は,研究プロセスの前後において,技術革新の社会的意味を日常的に探究する道を開くことを目的としている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:21:29 GMT)
Learning Rate Schedules in the Presence of Distribution Shift [12.9] 変化するデータ分布の存在下でネットワークを後悔する学習スケジュールを設計する。
これらの学習スケジュールに対する高次元回帰回帰モデルの実験とその後悔について述べる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:29:02 GMT)
Interactive Explanations by Conflict Resolution via Argumentative
Exchanges [12.9] 我々は,エージェント(AIモデルと人間)間の紛争解決の枠組みとして,計算的議論を活用することで,対話的な説明に焦点をあてる。
具体的には,マルチエージェントシステムにおける動的共有のためのArgumentative eXchanges(AXs)を定義する。
次に、マシンと人間がマシンの予測について対話するXAI設定にAXをデプロイする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:15:48 GMT)
IRFL: Image Recognition of Figurative Language [12.8] フィギュラティブな形式は、言語が表現力を持ち、感情を呼び起こし、そうでなければ可視化が難しい抽象的なアイデアを伝えることを可能にする。
本稿では,図形言語に対する視覚モデルと言語モデルの理解を検討するために,図形言語データセットの画像認識を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:59:55 GMT)
NeUDF: Learning Unsigned Distance Fields from Multi-view Images for
Reconstructing Non-watertight Models [12.8] 本論文では,多視点画像から精度の高い符号なし距離場(UDF)を学習するための新しいアルゴリズムを提案する。
NeUDFは、非水密でテクスチャレスなモデルを再構築するために特別に設計された。
テクスチャリッチモデルとテクスチャレスモデルの両方の実験は、提案手法の堅牢性と有効性を示している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:35:28 GMT)
A numerical approximation method for the Fisher-Rao distance between
multivariate normal distributions [12.7] 正規分布に結合する離散曲線を用いて、ジェフリーズ発散の平方根による曲線上の連続した正規分布間のラオ距離を近似する。
我々は, 数値近似を下界と上界の両方と比較し, 近似手法の質評価を行った。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:59:42 GMT)
SCOTCH and SODA: A Transformer Video Shadow Detection Framework [12.4] フレーム間の大きな影の変形のため、ビデオ内の影を検出するのは難しい。
本稿では,新しいタイプのビデオ自己注意モジュールであるSODA(Shadow deformation attention trajectory)を紹介する。
また、ネットワークを誘導し、統一された影表現を学習することを目的とした新しいシャドーコントラスト学習機構(SCOTCH)を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:58:17 GMT)
Exposing the Functionalities of Neurons for Gated Recurrent Unit Based
Sequence-to-Sequence Model [12.3] 本稿では,バニラGRUをベースとしたSeq2Seqモデルがトークン配置を達成できない理由を説明するために,ニューロンレベルの解析を行うことを目的とする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:25:46 GMT)
A Learning-based Adaptive Compliance Method for Symmetric Bi-manual
Manipulation [12.2] 本稿では,対称的双方向操作の効率性とロバスト性を向上させる学習型適応コンプライアンスアルゴリズム(LAC)を提案する。
LSTMネットワークを用いたActor-Criticフレームワークを導入し、双方向操作の同期性を向上させる。
両腕協調処理およびペグ・イン・ホール組立実験で評価すると,本手法は最適性とロバスト性の観点からベースラインアルゴリズムより優れている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:51:29 GMT)
Addressing the Challenges of Open-World Object Detection [12.1] OW-RCNNは、オープンワールドオブジェクト検出(OWOD)の3つの課題に対処するオープンワールドオブジェクト検出器である。
OW-RCNNは、MS-COCO上のオープンワールド評価プロトコルを用いて、新しい最先端技術を確立する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:11:28 GMT)
Reveal to Revise: An Explainable AI Life Cycle for Iterative Bias
Correction of Deep Models [11.9] 最先端の機械学習モデルは、トレーニングデータに埋め込まれた急激な相関を学習することが多い。
これにより、これらのモデルを高い意思決定のためにデプロイする際のリスクが生じる。
そこで我々はReveal to Revise (R2R)を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:43:17 GMT)
Task-Agnostic Graph Neural Network Evaluation via Adversarial
Collaboration [11.7] GraphACは、分子表現学習のためのグラフニューラルネットワーク(GNN)の研究を評価するための、原則付き、タスクに依存し、安定したフレームワークである。
2つのGNNが互いに直接競合することから、共同で自分自身を更新できる、競争力のあるバーロウツインズ(Competitive Barlow Twins)という新しい客観的機能を導入します。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:59:10 GMT)
MoViT: Memorizing Vision Transformers for Medical Image Analysis [11.4] 大規模データセットの必要性を軽減するために,覚醒視覚変換器 (MoViT) を提案する。
MoViTはトレーニングデータのわずか3.0%でViTの競争性能に達することができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:12:02 GMT)
NeuralPCI: Spatio-temporal Neural Field for 3D Point Cloud Multi-frame
Non-linear Interpolation [11.4] 本稿では,3次元ポイント・クラウド・ニューラル化のためのエンドツーエンドの4次元点補間法を提案する。
我々は、自律走行シーンにおける大きな非線形運動のためのNL-Driveと呼ばれる新しいデータセットを構築した。
最終的に,本手法はDHB(Dynamic Human Bodies)とNL-Driveデータセットの両方で最先端の性能を実現する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:58:52 GMT)
Learning Expressive Prompting With Residuals for Vision Transformers [11.3] 視覚変換器(ViT)の有効適応に特化して学習パラダイムを改良したEXPRES(Expressive Prompts with Residuals)を提案する。
本手法は,VTABベンチマークの3/3カテゴリにおいて,画像分類,少ないショット学習,セマンティックセマンティックセマンティックセマンティクスにEXPRESを適用した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 20:47:01 GMT)
AnomMAN: Detect Anomaly on Multi-view Attributed Networks [11.3] マルチビュー分散ネットワーク上での異常検出のためのグラフ畳み込みに基づくフレームワークAnomMANを提案する。
実世界のデータセットの実験によると、AnomMANは最先端のモデルよりも優れています。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:53:17 GMT)
3D Human Pose and Shape Estimation via HybrIK-Transformer [11.2] HybrIKは解析的逆運動学とディープラーニングを組み合わせて、より正確な3Dポーズ推定を生成する。
本稿では2Dから3Dへのリフトモジュールの強化を提案し,デコンボリューションをTransformerに置き換える。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:33:35 GMT)
Core-Periphery Principle Guided Redesign of Self-Attention in
Transformers [10.8] ANN(Best-Performing Neural Network)は、バイオニューラルネットワーク(BNN)に類似している。
視覚変換器(ViT)の自己注意における情報伝達機構の導出にコア・ペリファリー(CP)の組織を活用している。
CP-ViT に繋がる CP-ViT グラフのスイートスポットが存在することを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:36:41 GMT)
On the Equivalence Between Temporal and Static Graph Representations for
Observational Predictions [10.8] 時相グラフにおけるノード表現は、時間とグラフと時間という2つの異なるフレームワークにキャストできることを示す。
実世界のタスクにおいて,リアルタイムのタイム・アンド・グラフ法よりも優れた性能と効率を実現することができることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:15:57 GMT)
Beyond Accuracy: A Critical Review of Fairness in Machine Learning for
Mobile and Wearable Computing [10.8] 我々は過去5年間のACM Interactive, Mobile, Wearable and Ubiquitous Technologies(IMWUT)ジャーナルに掲載された論文をレビューする。
論文のごく一部が近代的公正レポートに適合していることが,本研究で確認された。
これらの知見を踏まえ、ユビキタステクノロジーの設計・開発のための実践的ガイドラインを提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 20:28:26 GMT)
PLIKS: A Pseudo-Linear Inverse Kinematic Solver for 3D Human Body
Estimation [10.5] 1枚の2次元画像から人体の3次元メッシュを再構築するためのPLIKSを提案する。
PLIKSはパラメトリックSMPLモデルの線形化された定式化に基づいている。
PLIKSは10%以上の精度で再現可能であることを確認した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:50:01 GMT)
Music-Driven Group Choreography [10.5] $rm AIOZ-GDANCE$は、音楽駆動のグループダンス生成のための新しい大規模データセットである。
集団舞踊運動の生成に単一舞踊生成法を鼻で適用することで,満足のいく結果が得られないことが示唆された。
本稿では,複数のグループコヒーレントな振付を効率よく作成するために,入力音楽シーケンスとダンサーの3D位置のセットを取り入れた新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:59:41 GMT)
CoRe-Sleep: A Multimodal Fusion Framework for Time Series Robust to
Imperfect Modalities [10.3] CoRe-SleepはCoordinated Representation Multimodal fusion Networkである。
このような堅牢性を達成するための鍵として,マルチモーダル情報の適切な処理が重要であることを示す。
本研究の目的は,自動解析ツールと臨床応用とのギャップを埋めることである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:28:58 GMT)
Exemplar-based Video Colorization with Long-term Spatiotemporal
Dependency [10.2] 外見に基づく映像のカラー化は、古い映画復元のような応用に欠かせない技術である。
本稿では,長期間の時間依存性を考慮したビデオカラー化フレームワークを提案する。
我々のモデルは、特に物体が大きく不規則に変化する場面において、よりカラフルでリアルで安定した結果を生み出すことができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:45:00 GMT)
Stochastic Interpolants: A Unifying Framework for Flows and Diffusions [10.0] フローベースおよび拡散ベースを統一する生成モデルのクラスを紹介する。
補間材の時間依存性確率密度関数は1次輸送方程式を満たすことを示す。
これらの目的の最小化は、ダイナミクスに基づいて構築された生成モデルのいずれかの可能性を制御できることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:07:52 GMT)
Text-to-Image Diffusion Models are Zero-Shot Classifiers [10.0] ゼロショット分類器として評価する手法を提案し,テキスト・画像拡散モデルについて検討した。
我々はこの手法をImagenに適用し、Imagenの知識のきめ細かい側面を探索し、CLIPのゼロショット能力と比較する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:15:17 GMT)
Accelerating Neural Network Inference with Processing-in-DRAM: From the
Edge to the Cloud [9.9] ニューラルネットワークの性能(およびエネルギー効率)は、計算またはメモリリソースによって拘束できる。
PIM(Processing-in-Memory)パラダイムは、メモリバウンドNNを高速化する実行可能なソリューションである。
NN性能とエネルギー効率向上のための3つの最先端PIMアーキテクチャを解析する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:16:03 GMT)
Coupling Artificial Neurons in BERT and Biological Neurons in the Human
Brain [9.9] 本研究は,トランスフォーマーに基づくNLPモデルと言語に対する神経活動をリンクする,新しい,汎用的で効果的なフレームワークを提案する。
実験の結果,(1)ANsとBNsの活性化は有意に同期し,(2)ANsは意味のある言語/意味情報を持ち,BNシグネチャにアンカーし,(3)アンカーされたBNは神経言語学的文脈で解釈可能であることがわかった。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:41:48 GMT)
EEGMatch: Learning with Incomplete Labels for Semi-Supervised EEG-based
Cross-Subject Emotion Recognition [9.8] ラベル付き脳波データとラベルなし脳波データの両方を活用する新しい半教師付き学習フレームワーク(EEGMatch)を提案する。
2つのベンチマークデータベース(SEEDとSEED-IV)で大規模な実験を行う。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:02:33 GMT)
Deep Ranking Ensembles for Hyperparameter Optimization [9.5] 本稿では,メタ学習型ニューラルネットワークが構成性能のランク付けに最適化され,アンサンブルによる不確実性をモデル化する手法を提案する。
12のベースライン、16のHPO検索スペース、86のデータセット/タスクからなる大規模実験プロトコルにおいて、本手法がHPOの新たな最先端結果を実現することを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:52:40 GMT)
Distributed Subweb Specifications for Traversing the Web [9.4] Link Traversal-based Query Processing (ltqp) は理論上興味深いが実用的ではない技術である。
本稿では、データパブリッシャーが興味のある情報源を提案し、データ消費者を関連性のある信頼できるデータへと導くことができるべきだと論じる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:58:23 GMT)
Regularized EM algorithm [9.4] 本稿では,従来の知識を効率的に活用し,LSSの状況に対処できる,GMM-sの正規化EMアルゴリズムを提案する。
コンバージェンスホールドの理論的保証は、構造化共分散行列モデルや低サンプル設定のEMアルゴリズムの性能向上につながることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:32:20 GMT)
Maximum tolerable excess noise in CV-QKD and improved lower bound on
two-way capacities [8.8] ボソニックガウスチャネルの2方向量子および秘密鍵容量のエネルギー制約と非拘束による新しい下界を求める。
我々の値は、(逆)コヒーレント情報が負となるパラメータ範囲において、最初のゼロでない下界である。
本研究では, 繰り返し処理とハッシュ処理を組み合わせた具体的な絡み合い分布と蒸留プロトコルを考案し, 最適化する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:52:32 GMT)
Learning to Exploit Elastic Actuators for Quadruped Locomotion [8.8] 足の移動におけるスプリングベースのアクチュエータは、エネルギー効率と性能の向上を提供する。
従来の研究は、そのようなシステムに最適なコントローラを見つけるために、広範囲なモデリングとシミュレーションに重点を置いてきた。
実ロボットでモデルフリーのコントローラを直接学習することを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:40:03 GMT)
Stability of Entropic Wasserstein Barycenters and application to random
geometric graphs [8.7] ワッサーシュタイン・バリーセンタ(Wasserstein Barycenters、WB)は、最適輸送の理論に由来するバリーセンタの概念である。
離散化されたメッシュ上のWBが基底多様体の幾何学とどのように関係するかを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:01:30 GMT)
mSPD-NN: A Geometrically Aware Neural Framework for Biomarker Discovery
from Functional Connectomics Manifolds [8.4] 本稿では,コネクトーム,すなわちmSPD-NNのための幾何学的認識型ニューラルネットワークフレームワークを提案する。
我々は,SPD平均推定のための一般的な選択肢に対するmSPD-NNの有効性を実証した。
ADHD-ASD併用性および健常者におけるネットワークの微妙な差異に関連する安定なバイオマーカーを明らかにする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:30:11 GMT)
Using Graph Algorithms to Pretrain Graph Completion Transformers [8.3] 自己教師付き事前トレーニングは、下流グラフ、リンク、ノード分類タスクのパフォーマンスを向上させることができる。
複数のグラフアルゴリズムを用いて構築し,外部データと組み合わせない5種類の事前学習信号について検討する。
本稿では,情報ゲインによって誘導される経路探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:04:30 GMT)
Are Metrics Enough? Guidelines for Communicating and Visualizing
Predictive Models to Subject Matter Experts [7.8] 本稿では,コミュニケーションのギャップを理解するために,課題の専門家とデータ科学者の双方による反復的研究について述べる。
モデルの強みと弱みを伝達するための共通媒体として可視化を利用する一連のコミュニケーションガイドラインを導出する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:07:47 GMT)
Training-free Style Transfer Emerges from h-space in Diffusion models [7.6] 拡散モデル(DM)は、様々な領域で高品質な画像を合成する。
近年、スタイルCLIPのようなDMの編集がU-Netのボトルネックとなり、$h$-spaceと名付けられている。
生成過程の進行性を考慮した,ある画像の内容を他の画像に注入する原理的手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:19:50 GMT)
Extreme subradiance from two-band Bloch oscillations in atomic arrays [7.5] 有限サイズ原子配列における自発崩壊時間よりも12桁も大きい時間スケールでエキゾチックサブ放射を実現できることを示す。
また,超ラジアント状態とサブラジアント状態との制御可能なスイッチングの可能性も指摘し,量子ストレージへの応用の可能性も示唆した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:23:41 GMT)
JAWS: Just A Wild Shot for Cinematic Transfer in Neural Radiance Fields [7.5] JAWSは、Wild内の参照ビデオクリップから新しく生成されたクリップへの、映像的特徴のロバストな転送を実現している。
我々は、暗黙の神経表現(INR)を用いて、参照クリップと同じ映画的特徴を共有するクリップを計算する。
結果は,映画からよく知られたカメラシーケンスを再現する能力を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:52:21 GMT)
Best of Both Worlds: Multimodal Contrastive Learning with Tabular and
Imaging Data [7.5] 単調エンコーダを学習するための自己指導型コントラスト学習フレームワークを提案する。
我々のソリューションは、2つの主要なコントラスト学習戦略であるSimCLRとSCARFを組み合わせています。
DVMカー広告データセットを用いて,自然画像へのアプローチの一般化可能性を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:24:03 GMT)
Deterministic generation of multi-photon bundles in a quantum Rabi model [7.5] 本稿では,量子ラビモデルにおける仮想励起による多光子束を生成する手法を提案する。
駆動パルスは、量子ラビモデルの固有状態から複数の光子の決定論的放出を誘導することを示す。
出力光子の一般化された2次相関関数を計算し、出力された光子が反有界多光子束を形成することを明らかにした。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:09:59 GMT)
UniDistill: A Universal Cross-Modality Knowledge Distillation Framework
for 3D Object Detection in Bird's-Eye View [7.1] 単一モダリティ検知器の性能向上を目的として, 普遍的クロスモダリティ知識蒸留フレームワーク (UniDistill) を提案する。
UniDistillは、LiDAR-to-camera、カメラ-to-LiDAR、融合-to-LiDAR、融合-to-camera蒸留パスを容易にサポートする。
nuScenesの実験では、UniDistillは学生検出器のmAPとNDSを2.0%3.2%改善することを示した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:50:58 GMT)
Entangling Two Bosonic Polaritons via Dispersive Coupling with a Third
Mode [7.0] 我々は、2つのハイブリッド化(偏光子)モードを形成する2つの強結合ボソニック系を絡む一般的なメカニズムを提供する。
絡み合いは、系の散逸と浴槽温度に対して堅牢である。
この理論は、キャビティ・マグノメカニクス(英語版)やエキシトン-フォトン-フォノン系(英語版)など、様々なボソニック系に適用できる非常に一般的な理論である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:57:53 GMT)
Anticorrelated Noise Injection for Improved Generalization [7.0] 勾配降下(GD)に人工ノイズを注入することで、機械学習モデルの性能を向上させることが一般的である。
しかし、これが最適かどうか、あるいは他の種類のノイズがより良い一般化性能を提供できるかどうかは不明である。
我々は,抗相関性摂動(Anti-PGD)を持つGDが,GDと標準(非相関性)PGDよりもはるかに良く一般化することを示す,様々な目的関数を考察する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:29:55 GMT)
Graph Neural Networks for Power Allocation in Wireless Networks with
Full Duplex Nodes [6.9] ユーザ間の相互干渉のため、無線ネットワークにおける電力割り当て問題はしばしば自明ではない。
グラフグラフニューラルネットワーク(GNN)は、これらの問題に対処するための有望なアプローチとして最近登場し、無線ネットワークの基盤となるトポロジを活用するアプローチである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:59:09 GMT)
An active inference model of car following: Advantages and applications [6.9] ドライバープロセスモデルは、自動および自律走行車技術のテスト、検証、開発において中心的な役割を果たす。
データ駆動機械学習モデルは、ルールベースのモデルよりも能力が高いが、大規模なトレーニングデータセットの必要性と、解釈可能性の欠如によって制限されている。
本稿では,解釈可能性を維持しつつ,データ駆動モデルに匹敵する振る舞いの柔軟性を有するアクティブ推論を用いたモデリング手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:39:26 GMT)
EMShepherd: Detecting Adversarial Samples via Side-channel Leakage [6.9] 敵対的攻撃は、ディープラーニングを駆使したクリティカルな応用にとって悲惨な結果をもたらす。
モデル実行の電磁的トレースを捕捉し、トレース上で処理を行い、敵検出に利用するためのフレームワークEMShepherdを提案する。
提案手法は,一般的に使用されているFPGA深層学習アクセラレータ上で,異なる敵攻撃を効果的に検出できることを実証する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:38:55 GMT)
Which Factors are associated with Open Access Publishing? A Springer
Nature Case Study [6.7] 我々はSpringer Natureが発行した522,411の論文を調査した。
APCウェイバーの著者は、ゴールドOA誌に他の著者よりも多く掲載している。
APC割引を受けることができる著者は、OA出版物の中で最も低い割合である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:58:11 GMT)
Sample Imbalance Adjustment and Similar Object Exclusion in Underwater
Object Tracking [6.4] 既存の検出ベースの後処理アプローチは、追跡対象と類似したオブジェクトを区別するのに苦労する。
UOSTrackは水中画像とオープンエアシークエンスハイブリッドトレーニングを併用して提案されている。
UOTベンチマークの2つの結果は、UOSTrackが最先端のベンチマークを新たに設定していることを示している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:23:07 GMT)
Semantic-visual Guided Transformer for Few-shot Class-incremental
Learning [6.3] 本研究では,事前学習した機能バックボーンの機能抽出能力を向上させるために,セマンティック・ビジュアル・ガイド付きトランスフォーマー (SV-T) を開発した。
我々のSV-Tは、ベースクラスからのより監督的な情報を最大限に活用し、機能バックボーンのトレーニングロバスト性をさらに強化できます。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:06:49 GMT)
Disruption Precursor Onset Time Study Based on Semi-supervised Anomaly
Detection [6.3] 本稿では,不均衡な正と負のデータサンプルの欠点を克服する異常検出に基づく破壊予測手法を提案する。
異常検出予測器によって推定される開始時間を用いて前駆的なラベリングを最適化し、教師付き学習破壊予測器上で最適化されたラベルをテストする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:54:56 GMT)
Asynchronous Online Federated Learning with Reduced Communication
Requirements [6.3] 通信効率のよい非同期オンライン連合学習(PAO-Fed)戦略を提案する。
参加者のコミュニケーションオーバーヘッドを減らすことで,学習課題への参加をよりアクセスしやすく,効率的に行うことができる。
提案手法の総合シミュレーションを行い,提案手法の有効性について検討した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:06:05 GMT)
Diffusion Denoised Smoothing for Certified and Adversarial Robust
Out-Of-Distribution Detection [6.2] 本稿では,OOD検出のロバスト性を,入力周辺の$ell$-norm内で証明するための新しい手法を提案する。
我々は,OOD検体に対する敵攻撃を検出するための現在の手法を改良するとともに,非分布検体に対する高いレベルの認証及び敵ロバスト性を提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:52:58 GMT)
Modeling Population Movements under Uncertainty at the Border in
Humanitarian Crises: A Situational Analysis Tool [6.2] 本研究では,人道危機において国境を越える移民や強制移住者の数を予測するための状況分析ツールを提案する。
i) 従来およびビッグデータソースからの移動を意図した潜在的意図の指標、(ii) 将来の動きを予測するための予測モデル、(iii) 異なる条件下での国境横断と避難所容量のシミュレーションである。
このツールは、新型コロナウイルス(COVID-19)のパンデミックでブラジルとヴェネズエラの国境に応用された、不確実性の高い環境での緊急計画に特化している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:48:38 GMT)
Prediction of Time and Distance of Trips Using Explainable
Attention-based LSTMs [6.1] 本研究では,将来の走行時間と走行可能な距離を予測するための機械学習ソリューションを提案する。
我々は、旅行時間と距離の多次元履歴データを同時に扱うように設計された、長期記憶(LSTM)に基づく構造を用いる。
提案手法のうち、最も先進的なAt-LSTMは次の旅行距離と時刻を3.99%の誤差で予測する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:54:32 GMT)
TransCODE: Co-design of Transformers and Accelerators for Efficient
Training and Inference [6.0] 本稿では,アクセラレータの設計空間におけるトランスフォーマー推論とトレーニングをシミュレートするフレームワークを提案する。
我々はこのシミュレータとTransCODEと呼ばれる共同設計手法を併用して最適性能のモデルを得る。
得られた変圧器・加速器対は、最先端の対よりも0.3%高い精度を達成する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:45:18 GMT)
Borrowing Human Senses: Comment-Aware Self-Training for Social Media
Multimodal Classification [6.0] 視覚的および言語的類似性を共同で活用することで,ユーザコメントからヒントを抽出する。
分類タスクは教師-学生のフレームワークにおける自己学習を通じて探索され、通常はラベル付きデータスケールに動機づけられる。
その結果,提案手法は従来の最先端モデルの性能をさらに向上させることが示された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:59:55 GMT)
Leveraging Hidden Positives for Unsupervised Semantic Segmentation [5.9] 隠れ陽性を抽出することで、コントラスト学習を活用して、豊かな意味関係を学習する。
隣接パッチ間のセマンティック一貫性を学習するための勾配伝搬戦略を導入する。
提案手法は,COCO-stuff,Cityscapes,Potsdam-3データセットにおけるSOTA(State-of-the-art)の新たな結果を実現する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:57:28 GMT)
TextMI: Textualize Multimodal Information for Integrating Non-verbal
Cues in Pre-trained Language Models [5.7] マルチモーダルな行動分析タスクのための汎用的,競争的なベースラインとして,TextMIを提案する。
我々のアプローチは、モデルの複雑さを著しく減らし、モデルの判断に解釈可能性を追加し、様々なタスクに適用できます。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:54:32 GMT)
A Linear Weight Transfer Rule for Local Search [5.4] Divide and Distribute Fixed Weights algorithm (ddfw) は、局所最小値において、満足度から偽値に重みを移す動的局所探索SAT解決アルゴリズムである。
本稿では,局所ミニマにおける節間の動的重みを移動させる線形重み移動法,局所ミニマにおいて満足節をどのように選択して重みを与えるかの調整,およびフリップする変数を選択する重み付きランダム法という3つの基本アルゴリズムの修正を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 03:06:34 GMT)
Multi-Granularity Archaeological Dating of Chinese Bronze Dings Based on
a Knowledge-Guided Relation Graph [5.4] 現在の考古学は、青銅年代測定を行うための訓練された専門家に依存している。
先進的な深層学習技術と考古学的知識を統合するための学習に基づくアプローチを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:54:50 GMT)
Improved Adversarial Training Through Adaptive Instance-wise Loss
Smoothing [5.1] 敵の訓練は、このような敵の攻撃に対する最も成功した防御であった。
本稿では,新たな対人訓練手法を提案する。
本手法は,$ell_infty$-norm制約攻撃に対する最先端のロバスト性を実現する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:32:43 GMT)
Learning linear dynamical systems under convex constraints [5.0] 線形力学系を1つの軌道から同定する問題を考察する。
最近の結果は主に、mathbbRn × n$ の系行列 $A* 上の構造的仮定が成立しないような設定に焦点が当てられている。
フロベニウスノルムの非漸近誤差境界は、$A*$で$mathcalK$の接円錐の局所的な大きさに依存する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:49:40 GMT)
Uncovering Bias in Personal Informatics [5.0] 本稿では,PIシステムにおけるバイアスの包括的研究として,生データのバイアスや機械学習ライフサイクル全体について紹介する。
その結果, 糖尿病, 関節症, 高血圧などの健康上の問題を持つユーザ, 女性ユーザが最も影響を受けやすいグループとなった。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 20:49:42 GMT)
Blind Inpainting with Object-aware Discrimination for Artificial Marker
Removal [5.0] 画像中のターゲット領域のマスクを指定せずに視覚的コンテンツを自動補完する新しい視覚的塗装手法を提案する。
提案モデルはマスクレス再構成ネットワークとオブジェクト認識識別器を含む。
オブジェクト認識識別器は、任意の局所領域において再構成画像のマーカーを検出できないように、高密度物体検出器の強力な認識能力に依存している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:56:20 GMT)
Explain, Adapt and Retrain: How to improve the accuracy of a PPM
classifier through different explanation styles [4.6] 最近の論文では、結果指向の予測に予測プロセスモニタリングモデルがなぜ間違った予測を提供するのかを説明するための新しいアプローチが紹介されている。
半自動的な方法でミスを犯す予測者を誘導する最も一般的な特徴を特定するために、説明を利用する方法を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:37:55 GMT)
Interpretable Few-shot Learning with Online Attribute Selection [4.6] 本稿では,人間に親しみやすい属性をベースとした,少数ショット学習のための本質的に解釈可能なモデルを提案する。
また,各エピソードにおける無関係な属性を効果的にフィルタリングするオンライン属性選択機構を提案する。
提案手法は,広範に使用されている4つのデータセット上で,ブラックボックス数ショット学習モデルと同等の結果が得られることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:43:18 GMT)
Complexity and scalability of defeasible reasoning in many-valued
weighted knowledge bases with typicality [4.4] 典型性を持つ記述論理の重み付き知識ベースは、多層パーセプトロンの論理的解釈を提供する。
ASPは有限個の値を持つ場合において、デファシブルな推論に対処するのに適していることが示されている。
本稿ではPNP[log]$-completeness結果と,大規模検索空間を持つ重み付き知識ベースを扱うASPエンコーディングを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:12:47 GMT)
Global Relation Modeling and Refinement for Bottom-Up Human Pose
Estimation [4.2] ボトムアップヒトポーズ推定のための畳み込みニューラルネットワークを提案する。
我々のモデルは、地域によって異なる粒度に焦点を合わせることができる。
COCO と CrowdPose のデータセットで得られた結果は,多人数ポーズ推定の効率的なフレームワークであることを実証している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:54:08 GMT)
Describing and Organizing Semantic Web and Machine Learning Systems in
the SWeMLS-KG [4.1] 機械学習(ML)コンポーネントとセマンティックWeb(SW)コミュニティが開発したテクニックを組み合わせることに焦点を当てた、新しいサブ領域が登場した。
私たちは体系的な研究を行い、この領域で過去10年間に発行された500近い論文を分析しました。
我々の分析では、SWeML Systemsに対する関心が急速に高まり、いくつかのアプリケーションドメインやタスクに大きな影響を与えています。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:31:42 GMT)
Meeting Action Item Detection with Regularized Context Modeling [4.0] ミーティングのトランスクリプトにおけるアクションアイテムは、ミーティング後のTo-Doタスクを管理するために重要です。
我々は、手動のアクション項目アノテーションを用いた最初の中国のミーティングコーパスを構築し、リリースする。
コントラスト学習により局所的・グローバルな文脈を両立させるコンテキストドロップ手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 03:27:08 GMT)
TabIQA: Table Questions Answering on Business Document Images [4.0] 本稿では,ビジネス文書イメージに関する疑問に答えるために,TabIQAという新しいパイプラインを提案する。
TabIQAは、1)最先端のディープラーニング技術を組み合わせて、画像からテーブルの内容と構造情報を抽出し、2)数値データ、テキストベース情報、構造化テーブルからの複雑なクエリに関する様々な質問に答える。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:31:21 GMT)
Optimal control and ultimate bounds of 1:2 nonlinear quantum systems [3.9] 我々は、2レベルおよび3レベルの量子非線形系の時間的限界(量子速度制限と呼ばれる)とエネルギーを定式化し、結合する。
3階のKerr項は、共鳴にダイナミクスをロックするためにデチューニングにおいて吸収可能であることを示す。
2レベル問題では、与えられた精度に対して最適な$pi$-pulse逆変換の非線形逆数を決定する。
3レベル問題では、線形のパルス列と類似しているが異なる形状の直感的なパルス列が得られる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:31:17 GMT)
itKD: Interchange Transfer-based Knowledge Distillation for 3D Object
Detection [3.7] 本稿では,チャネルワイド圧縮と非圧縮を含むオートエンコーダスタイルのフレームワークを提案する。
教師ネットワークのマップビュー特徴を学習するために、教師ネットワークと学生ネットワークの機能は、共有オートエンコーダを介して独立して渡される。
マルチヘッド自己認識機構によって引き起こされた3次元物体検出情報と一致するように,頭部の注意損失を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 04:30:25 GMT)
Improving Contextualized Topic Models with Negative Sampling [3.7] 本稿では,文脈化トピックモデルに対する負のサンプリング機構を提案し,生成したトピックの品質を向上する。
特に、モデルトレーニング中に生成された文書トピックベクトルを摂動させ、三重項損失を用いて、正しい文書トピックベクトルから入力文書に類似した文書を再構築することを奨励する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:28:46 GMT)
Assessment of Reinforcement Learning for Macro Placement [3.6] マクロ配置に対するGoogle Brainの深層強化学習アプローチと,そのサーキットトレーニング(CT)実装をGitHubに実装しています。
我々は,CTのオープンソースキー"ブラックボックス"要素を実装し,CTとNature論文の相違点を明らかにする。
我々はCTを複数の代替マクロプレースラと共に評価し、すべての評価フローと関連するスクリプトをGitHubで公開しています。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:01:40 GMT)
Security boundaries of an optical power limiter for protecting quantum
key distribution systems [3.5] 無認可光注入は、量子鍵分布(QKD)システムの実用的セキュリティにとって、常に重要な脅威である。
熱光学除染効果に基づく光パワーリミッタ (OPL) が提案され, 実装されている。
ハードウェア対策として、様々な光注入攻撃によるOPLの性能試験を行い、セキュリティ境界を明らかにする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:15:32 GMT)
HD-Bind: Encoding of Molecular Structure with Low Precision,
Hyperdimensional Binary Representations [3.4] 超次元計算(HDC)は、低精度二進ベクトル算術を活用できる学習パラダイムである。
本稿では,HDCに基づく推論手法が,より複雑な機械学習手法よりも90倍効率が高いことを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:21:46 GMT)
Fast remote spectral discrimination through ghost spectrometry [3.4] ゴーストスペクトロメトリは, 化学, 生物, 放射線, 核の脅威の有無を評価するのに有効であることを示す。
多くの場合、対象の完全なスペクトル線形状を再構成する必要がなく、スペクトル吸収対象が存在するか否かを識別する関心がある。
異なるサンプルを用いて得られた実験結果を考察し,それらをシミュレーションで補完し,最も一般的なシナリオを探索する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:46:48 GMT)
Unified Keypoint-based Action Recognition Framework via Structured
Keypoint Pooling [3.3] 本稿では,従来の骨格に基づく行動認識に関する3つの制限を同時に解決する。
アクション認識には、ポイントクラウドのディープラーニングパラダイムが導入される。
構造化キーポイントプールと呼ばれる新しいディープニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:59:08 GMT)
Prompt-Guided Zero-Shot Anomaly Action Recognition using Pretrained Deep
Skeleton Features [3.3] 教師なしの異常行動認識は、異常なサンプルを伴わずに、教師なしの方法で、ビデオレベルの異常な人間-行動事象を識別する。
対象領域非依存型骨格特徴抽出器を用いたユーザプロンプト誘導型ゼロショット学習フレームワークを提案する。
ユーザプロンプト埋め込みと共通空間に並んだ骨格的特徴の類似度スコアを異常スコアに組み込み,通常の動作を間接的に補う。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:59:33 GMT)
From the digital twins in healthcare to the Virtual Human Twin: a
moon-shot project for digital health research [3.2] このポジションペーパーは仮想人間双対の開発のための概念的基礎を定めている。
VHTインフラストラクチャは、学術研究者、公共機関、バイオメディカル産業が医療ソリューションで新たなデジタルツインを開発し、検証することを促進することを目的としている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:32:34 GMT)
All-photonic multiplexed quantum repeaters based on concatenated bosonic
and discrete-variable quantum codes [3.2] 本稿では,ボソニックなGottesman-Kitaev-Preskill符号を多重化した双方向リピータアーキテクチャで使用するための新しい戦略を提案する。
GKP量子ビットは決定論的二量子ゲートを容易に許容し、これにより大規模なクラスタ状態を生成することなく多重化が可能となる。
我々は,GKPスケザリングの13dB未満であっても,1000kmを超える長距離量子通信が可能であることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:44:49 GMT)
Explain To Me: Salience-Based Explainability for Synthetic Face
Detection Models [3.0] 本稿では,モデル・サリエンスを利用してモデル・サリエンスを大規模に説明するための5つの手法を提案する。
これらの方法は、 (a) モデルのサリエンスマップの平均エントロピーは何か、 (b) モデルサリエンスがどのように変化するか、 (c) モデルサリエンスを独立したトレーニングで安定させるか、 (e) モデルサリエンスがサリエンス誘導画像の劣化にどのように反応するかを問う。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:56:38 GMT)
A novel Multi to Single Module for small object detection [2.9] 小さな物体検出器の性能は、しばしばピクセルの欠如と重要な特徴の欠如によって損なわれる。
本稿では,特徴抽出と精細化を改良し,特定の層を拡張したMulti to Single Module (M2S)を提案する。
提案手法の有効性をVisDrone2021-DETとSeaDronesSeeV2の2つのデータセットで評価した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:17:22 GMT)
A hybrid ensemble method with negative correlation learning for
regression [2.8] ヘテロジニアスモデルプールからサブモデルを自動的に選択および重み付けする。
内部点フィルタリング線形探索アルゴリズムを用いて最適化問題を解く。
本研究の価値は、その使いやすさと有効性にあるため、ハイブリッドアンサンブルは多様性と正確性を受け入れることができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:52:42 GMT)
A Tractable Online Learning Algorithm for the Multinomial Logit
Contextual Bandit [2.8] 我々は、意思決定者が消費者に製品のサブセットを提供する動的集合最適化問題を考える。
MNL(Multinomial Logit)モデルを用いて消費者選択行動のモデル化を行う。
後悔は$O(sqrtdT + kappa)$で束縛され、既存のメソッドよりもパフォーマンスが大幅に向上していることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:47:44 GMT)
Pushing the Envelope for Depth-Based Semi-Supervised 3D Hand Pose
Estimation with Consistency Training [2.7] ラベル付きトレーニングデータへの依存を著しく低減する半教師付き手法を提案する。
提案手法は,教師ネットワークと学生ネットワークの2つの同一ネットワークを共同で訓練した。
実験により,提案手法は最先端の半教師付き手法よりも大きなマージンで優れていることが示された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:32:49 GMT)
A Novel Neural Network Approach for Predicting the Arrival Time of Buses
for Smart On-Demand Public Transit [2.7] 乗務員の到着時刻を推定する際には、より正確で信頼性の高いバス輸送が問題となる。
一般的な問題は、バスの到着時刻がスケジュールと一致せず、固定されたスケジュールの遅延が生じることである。
本研究では,各交通機関(駅)におけるバスの到着時刻を推定するための,AIに基づく新しいデータ駆動型アプローチを提案する。
我々のアプローチは、完全に接続されたニューラルネットワークに基づいており、大都市圏のすべてのバス路線の到着時刻を総合的に予測することができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:45:22 GMT)
How far generated data can impact Neural Networks performance? [2.6] ニューラルネットワークの性能向上において、生成したデータが実際のデータにどの程度役立つかを検討する。
実験の結果,実データに対する5倍の合成データが精度16%向上することが判明した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:02:43 GMT)
On the Creativity of Large Language Models [2.5] 大規模言語モデル(LLM)は、人工知能のいくつかの領域に革命をもたらしている。
本稿では、まず、創造性理論のレンズ下でのLCMの開発について分析する。
次に、機械の創造性における「簡単」かつ「ハード」な問題の集合を特定し、LLMに関してそれらを議論する。
最後に、創造的産業に焦点をあてて、これらの技術の社会的影響を分析する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:00:01 GMT)
How creative versus technical constraints affect individual learning in
an online innovation community [2.5] 私たちは、33,813人の個人から136,989件のデザイン申請をクラウドソースした、オンラインイノベーションコミュニティからの10年間のデータを分析しました。
技術的制約が十分に緩和された場合にのみ,創造的な制約が学習率の向上につながることが分かっています。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:53:59 GMT)
Scalable multi-chip quantum architectures enabled by cryogenic hybrid
wireless/quantum-coherent network-in-package [2.5] 分散量子コア(Qcore)を量子コヒーレントな量子ビット状態転送リンクを介して相互接続し、統合された無線相互接続によってオーケストレーションする、新しい世代のスケーラブル量子コンピューティングアーキテクチャのビジョンを提示する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:07:50 GMT)
Anti-DreamBooth: Protecting users from personalized text-to-image
synthesis [2.4] 誤用された場合、DreamBoothは偽のニュースや、個々の犠牲者をターゲットにしたコンテンツを生成することができる。
本稿では,このような悪質なDreamBoothの使用に対するアンチドリームBoothと呼ばれる防衛システムについて検討する。
当社の手法は,これらのモデルの悪用からユーザを効果的に保護する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:55:44 GMT)
Assorted, Archetypal and Annotated Two Million (3A2M) Cooking Recipes
Dataset based on Active Learning [2.4] それぞれのカテゴリにラベル付けされた200万の料理レシピのデータセットを新たに提示する。
データセットを構築するために、レシピをRecipeNLGデータセットから収集する。
私たちのデータセットには200万以上のレシピがあり、それぞれが分類され、信頼性スコアが関連付けられています。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:53:18 GMT)
Real-Time Semantic Segmentation using Hyperspectral Images for Mapping
Unstructured and Unknown Environments [2.4] 本稿では,ハイパースペクトル画像を用いた実時間画素単位のセマンティック分類とセグメンテーションを提案する。
得られたセグメント画像は、ポリゴンとして抽出、フィルタリング、近似オブジェクトとして処理される。
得られたポリゴンは環境のセマンティックマップを生成するために使用される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 22:33:55 GMT)
CNN-based real-time 2D-3D deformable registration from a single X-ray
projection [2.1] 本稿では, フルオロスコープ画像を用いたリアルタイム2D-3D非剛体登録法を提案する。
術前スキャンから解剖学の変位場と2次元投影からなるデータセットを生成する。
ニューラルネットワークは、未知の3D変位場を単一の投影画像から回復するように訓練される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:22:54 GMT)
Identifying Suspicious Regions of Covid-19 by Abnormality-Sensitive
Activation Mapping [2.0] 本稿では, 胸部CT上における新型コロナウイルス(COVID-19)の疑わしい部位の同定を完全自動で行う方法を提案する。
2.5次元CNNと3次元アテンション機構を用いた分類タスクによる識別手法を実現する。
提案されたアーキテクチャはすべてのデータセットに対して0.900以上のAUCを達成し、感度は0.853 pm 0.036$、特異性は0.870 pm 0.040$である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 03:22:25 GMT)
A Note on the Regularity of Images Generated by Convolutional Neural
Networks [2.0] 畳み込みニューラルネットワークによって生成された画像の規則性を分析する。
その結果、ネットワーク重みの基本的なL2正規化は、過剰なスムースな出力につながる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:30:34 GMT)
Mixed-state long-range order and criticality from measurement and
feedback [1.9] 本稿では、局所的な測定、局所的なユニタリ、非局所的な古典的通信を用いて量子チャネルを構築するための一般的なフレームワークを提案する。
フェルミオン占有数測定を用いて1次元のスピンフルフリーフェルミオンを量子臨界混合状態に変換する2つの応用を提案する。
後者は、局所的な量子演算と非局所的な古典的通信を用いて、一定深さの物質のギャップ状態から混合状態の量子臨界が生じる例である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:00:02 GMT)
Simulation of chemical reaction dynamics based on quantum computing [1.9] 反応動力学をシミュレートする量子コンピューティングに基づくab initio分子動力学を開発した。
このアプローチを用いてヘッセン行列を計算し、資源を評価する。
以上の結果から,分子構造,性質,反応性を評価できる可能性が示唆された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:54:50 GMT)
Consistent and fast inference in compartmental models of epidemics using
Poisson Approximate Likelihoods [1.9] 疫学推論のためのPoisson Approximate Likelihood (PAL) 法を紹介した。
PALの実装は単純で、初等演算のみを含み、チューニングパラメータは含まない。
PALは、Stanにおける自動分化を利用して、年齢構成のインフルエンザモデルに適合し、連続したモンテカルロにPALを埋め込むことでロタウイルスの過剰分散を比較することができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:20:36 GMT)
Uncertain Quality-Diversity: Evaluation methodology and new methods for
Quality-Diversity in Uncertain Domains [1.8] 品質多様性最適化(QD)は、幅広いアプリケーションにわたって有望な結果をもたらすことが証明されている。
しかし、QDアプローチは、ソリューションの真のパフォーマンスとノベルティを定量化する能力に影響を与えるため、環境における不確実性の存在に苦慮する。
不確実領域に対する共通フレームワークを定式化する。
第2に、新しい世代ごとのサンプリング予算と、不確実QDに特化して設計された既存のメトリクスのセットを頼りに、不確実QDアプローチを評価するための新しい方法論を提案する。
第3に、不確実な3つの新しいQDアルゴリズム、アーカイブサンプリング、並列適応を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:44:40 GMT)
ACO-tagger: A Novel Method for Part-of-Speech Tagging using Ant Colony
Optimization [1.7] Ant Colony Optimization (ACO) はアリの捕食行動とそのフェロモンの敷設機構に着想を得たものである。
Part-of-Speech(POS)タグ付けは自然言語処理における基本的なタスクであり、文中の各単語にPart-of-Speechロールを割り当てることを目的としている。
本研究では,ACOタグをベースとした高性能なPOSタグ作成手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:48:40 GMT)
Fictitious Play Outperforms Counterfactual Regret Minimization [1.7] マルチプレイヤーゲームにおけるナッシュ均衡の近似において, ファクトプレイと反ファクト後悔最小化という2つの人気アルゴリズムの性能を比較した。
本研究では,様々なゲームクラスやサイズに対して,架空のプレイによってナッシュ均衡近似が向上することを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 03:47:17 GMT)
Numerical modeling of the multi-stage Stern$\unicode{x2013}$Gerlach
experiment by Frisch and Segr\`e using co-quantum dynamics via the Bloch
equation [1.5] 我々は、新しい共量子力学理論の文脈の中で、最初の多段階Stern$ Blochx2013$lach実験を数値的に再現する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:06:53 GMT)
Spin-chain based quantum thermal machines [1.5] モデルの動作流体が多体量子系で表される量子熱機械の性能について検討する。
セットアップの極限サイクルの形式的特徴づけは、量子チャネルの混合特性の観点から示される。
この系がハミルトニアンの磁化保存によって結合されたスピン1/2粒子の集合である特別な場合、可能な運用状態の完全な特徴が提供される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 20:00:02 GMT)
Defect detection using weakly supervised learning [1.4] 近年,従来の教師あり学習の代替手段として,弱教師あり学習技術が注目されている。
本稿では,欠陥検出作業において,弱教師付き分類器と完全教師付き分類器の性能を比較した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:01:16 GMT)
Identifying Adversarially Attackable and Robust Samples [1.4] 本研究は, 対人攻撃に最も影響を受けやすいサンプルを同定することを目的とした, サンプル攻撃可能性の概念を紹介する。
本研究では,未知のターゲットモデルに対する未知のデータセットにおいて,逆攻撃可能で頑健なサンプルを検出するディープラーニングに基づく手法を提案する。
深部攻撃性検知器は、攻撃性/破壊性サンプルを特定するための単純なモデル不確実性に基づく測定よりも優れた性能を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:35:15 GMT)
Recognizing Rigid Patterns of Unlabeled Point Clouds by Complete and
Continuous Isometry Invariants with no False Negatives and no False Positives [1.2] 点雲の厳密なパターンは、完全な等距離不変量によってのみ確実に比較できることを示す。
我々は任意のユークリッド空間において、ラベルなしの雲の最初の連続的かつ完備な不変量を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:58:39 GMT)
Sequential training of GANs against GAN-classifiers reveals correlated
"knowledge gaps" present among independently trained GAN instances [1.1] 我々は、繰り返しGAN分類器を訓練し、分類器を「偽」するGANを訓練する。
本稿では, GAN訓練力学, 出力品質, GAN分類器の一般化に対する効果について検討する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:18:15 GMT)
Rawgment: Noise-Accounted RAW Augmentation Enables Recognition in a Wide
Variety of Environments [1.0] 本稿では,難易度の高い環境における画像認識のための雑音対応RAW画像強調手法を提案する。
本質的には、非線形ISPを適用する前にRAW画像に色ジッタとぼやけた強調を加え、現実的な強度をもたらす。
提案手法は,簡単な学習データのみを用いて,難易度の高い環境下での音声認識精度を2倍にすることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:17:13 GMT)
DynamicISP: Dynamically Controlled Image Signal Processor for Image
Recognition [1.0] 動的ISPは、複数の古典的ISP関数から構成され、前のフレームの認識結果に応じて各フレームのパラメータを動的に制御する。
本稿では,複数のISP関数のパラメータの制御に成功し,単一および複数カテゴリのオブジェクト検出タスクにおいて,計算コストの低い最先端の精度を実現する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:02:09 GMT)
Philosophical Foundations of GeoAI: Exploring Sustainability, Diversity,
and Bias in GeoAI and Spatial Data Science [1.0] 本章では、GeoAIと空間データ科学の哲学的基盤を形成する基本的な前提と原則について述べる。
それは、持続可能性、トレーニングデータのバイアス、スキーマ知識の多様性、そして、統一倫理的な視点からGeoAIシステムの中立性(潜在的に欠如している)といったテーマを強調している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:01:22 GMT)
A Practical Survey on Faster and Lighter Transformers [0.9] Transformerは、入力シーケンスの任意の2つの位置を関連付けることのできるアテンションメカニズムのみに基づくモデルである。
多数のシーケンスモデリングタスクにまたがって最先端のタスクを改善した。
しかし、その有効性は、シーケンス長に関して2次計算とメモリの複雑さを犠牲にしている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:10:28 GMT)
Taming Dyson-Schwinger equations with null states [0.9] 場の量子論において、ダイソン=シュウィンガー方程式(ダイソン=シュウィンガーしき、英: Dyson-Schwinger equations)は、n$ポイントグリーンの関数を自己整合的に関連する無限の方程式の集合である。
主要な問題の1つは、無限系の有限個の切り離しが過小評価されていることである。
本稿では,ヌルブートストラップを考慮した別の経路を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:02:25 GMT)
One-shot Feature-Preserving Point Cloud Simplification with Gaussian
Processes on Riemannian Manifolds [0.9] 本研究では,従来の表面再構成工程を使わずに,点雲の健全な構造特徴と全体形状の両方を保存できるワンショット点雲簡易化法を提案する。
提案手法をいくつかのベンチマークデータセット上で評価し,既存手法と比較し,実験性能と計算効率の両面で競合することを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:05:34 GMT)
Manifold Learning by Mixture Models of VAEs for Inverse Problems [0.9] 任意の位相の多様体を表現するために,変分オートエンコーダの混合モデルを学習する。
学習多様体に制限されたデータ忠実度項を最小化することにより、逆問題の解法に使用する。
本手法を低次元トイの例に応用し, 脱臭・電気インピーダンストモグラフィーにも応用した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:29:04 GMT)
Diffusion Models for Memory-efficient Processing of 3D Medical Images [0.8] 本稿では,3次元拡散モデルにおける資源消費の削減法について述べる。
本論文の主な貢献は,メモリ効率のパッチベース拡散モデルである。
提案した拡散モデルは,任意の画像生成タスクに適用できるが,BraTS 2020データセットの腫瘍セグメンテーションタスクについて評価する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:10:19 GMT)
Multi-view Cross-Modality MR Image Translation for Vestibular Schwannoma
and Cochlea Segmentation [0.8] コントラスト強調T1 (ceT1) MR画像から高分解能T2 (hrT2) MR画像へ変換できる多視点画像翻訳フレームワークを提案する。
画素レベルの一貫した制約とパッチレベルのコントラスト的制約を用いる2つの画像変換モデルを並列に採用する。
これにより、異なる視点を反映した擬似hrT2画像が拡張され、最終的に高い性能のセグメンテーションモデルが実現される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:42:10 GMT)
Quantum-inspired classification based on quantum state discrimination [0.8] 量子状態判別の問題に触発された分類タスクに対する量子インスピレーション付きアルゴリズムを提案する。
構築によって、これらのアルゴリズムは多重クラス分類を実行し、オーバーフィッティングを防止し、確率出力を生成することができる。
量子コンピュータで実装できるが、ここではそのようなアルゴリズムの古典的な実装に焦点を当てる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:09:40 GMT)
Quantum Simulation of Z2 Lattice Gauge theory with minimal resources [0.8] 2+1)DにおけるフェルミオンZ2ゲージ場理論をシミュレートするための様々な選択肢について検討する。
NISQデバイスで理論をシミュレートするには、使用する量子ビットの数と回路深さの両方を最小化することが不可欠である。
我々は、量子コンピュータ上でこの理論を最小の量子ビット要求でシミュレートする新しい方法を開発した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:03:44 GMT)
Data Augmentation techniques in time series domain: A survey and
taxonomy [0.8] 時系列を扱うディープニューラルネットワークは、トレーニングで使用されるデータセットのサイズと一貫性に大きく依存する。
この研究は、この領域の現在の最先端を体系的にレビューし、利用可能な全てのアルゴリズムの概要を提供し、最も関連する研究の分類法を提案する。
本研究の究極的な目的は、この分野の将来の研究者を導くために、より良い結果をもたらす領域の進化と性能を概説することである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:07:11 GMT)
Depth- and Semantics-aware Multi-modal Domain Translation: Generating 3D
Panoramic Color Images from LiDAR Point Clouds [0.7] 本研究は,LiDARとカメラセンサのマルチモーダル構成によるクロスドメイン画像・画像変換のための条件生成モデルであるTITAN-Nextを提案する。
我々は、これがこの種の最初のフレームワークであり、フェールセーフなメカニズムを提供し、ターゲット画像領域で利用可能なデータを増強するなど、自動運転車に実践的な応用があると主張している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:02:36 GMT)
Comparison between layer-to-layer network training and conventional
network training using Convolutional Neural Networks [0.7] 畳み込みニューラルネットワーク(CNN)は、データから特徴を抽出する効果のため、様々なアプリケーションで広く利用されている。
層間学習法を提案し,その性能を従来の訓練法と比較する。
実験の結果, 層間学習法は両モデルの従来の訓練法よりも優れていた。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:29:18 GMT)
Universal entanglement and correlation measure in two-dimensional
conformal field theories [0.7] 例えば $mathcalE$ は 2 つの不連続区間においても普遍的な表現を持つことを示す。
我々は,スピン-1/2 XXZ鎖で数値検証を行った。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:27:24 GMT)
Variational Quantum Time Evolution without the Quantum Geometric Tensor [0.7] 量子状態のリアルタイムおよび想像的進化は、量子力学の研究、基底状態の作成、熱力学的観測値の計算のための物理学や化学における強力なツールである。
短期デバイスでは、可変量子時間進化がこれらのタスクの有望な候補であり、必要な回路モデルは、利用可能なデバイス能力と近似精度をトレードオフするように調整することができる。
ハイゼンベルク・ハミルトニアンの時間発展のためのアルゴリズムは、標準的な変動量子時間進化アルゴリズムのコストのごく一部でシステム力学を正確に再現することを示した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:46:38 GMT)
Bounds to electron spin qubit variability for scalable CMOS
architectures [0.5] 我々は、Si/SiO$$インタフェースの不可避な原子スケール粗さによるスピン量子ビットの変動をグラフ化し、12デバイスで実験をコンパイルし、理論ツールを開発する。
我々は, 粗さがクビット位置, 変形, 谷分割, 谷相, スピン軌道結合, 交換結合における変動性と相関することを示した。
これらの変数は、堅牢な制御方法が組み込まれている限り、量子コンピューティングのスケーラブルなアーキテクチャの許容範囲内にあることが判明した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 00:52:39 GMT)
Evaluating self-attention interpretability through human-grounded
experimental protocol [0.5] 本稿では,トランスフォーマーの注意が解釈可能性向上にどう役立つかを評価することを目的とする。
CLaSification-Attention (Attention-A) と呼ばれる新しい注意に基づく解釈法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:26:02 GMT)
Quantum nonlinear optics in atomic dual arrays [0.5] 我々は、光と1つ以上の原子配列との結合が、量子非線形光学の領域にどのように視点を広げるかを示す。
2つのアレイの組み合わせは強力な光子-光子相互作用を誘発し、入ってくる古典ビームを高い反結合光に変換する。
このような量子準曲面は、非古典的な光をコヒーレントに生成し、操作する新しい可能性を開く。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:34:58 GMT)
Spatial-photonic Boltzmann machines: low-rank combinatorial optimization
and statistical learning by spatial light modulation [0.4] 空間フォトニックイジングマシン(SPIM)は、空間光変調を利用して大規模な最適化問題を効率的に解決する有望な光学アーキテクチャである。
光学実装を変更することなく任意のIsing問題に対応可能なSPIMの新しい計算モデルを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:36:37 GMT)
Some Initial Guidelines for Building Reusable Quantum Oracles [0.4] この研究は、他のアルゴリズムが入力として使用する関数の実行に使用できる量子アルゴリズムのパターンであるオーラクルの再利用性に焦点を当てている。
特に、本研究では、再利用可能な量子オラクルを作るためのガイドラインをいくつか提示する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:45:14 GMT)
A CQM-based approach to solving a combinatorial problem with
applications in drug design [0.4] D-WaveのLeap Hybrid solverは、Knapsack最適化問題の解法として用いられる。
これは、最適化問題をCQM(Constrained Quadratic Model)として初めて定式化し、量子アニーラーに送信することで実現される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:41:58 GMT)
A Survey on Causal Discovery Methods for Temporal and Non-Temporal Data [0.3] Causal Discovery (CD) は、変数間の因果関係をデータから識別するプロセスである。
本研究では,因果発見における共通用語について紹介する。
また、異なる設定における因果エッジを特定するために設計されたアプローチについても論じる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:21:41 GMT)
The Quality-Diversity Transformer: Generating Behavior-Conditioned
Trajectories with Decision Transformers [0.3] 品質多様性アルゴリズムは、多様かつ効率的なポリシーのレパートリーを生成するのに有効であることが証明されている。
不確実な環境では、ポリシーは堅牢性と再現性に欠ける可能性がある。
本稿では,2つのメカニズムに基づく行動条件付き軌道生成を実現するための新しい手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:39:49 GMT)
mHealth hyperspectral learning for instantaneous spatiospectral imaging
of hemodynamics [0.3] ハイパースペクトル学習は、写真は単なる写真ではなく、詳細なスペクトル情報を含むという考えを生かしている。
ハイパースペクトルデータの小さなサンプリングにより、スペクトル情報による学習により、RGB画像からハイパーキューブを復元することができる。
ハイパースペクトル学習は、科学的分光計の高スペクトル分解能に匹敵する、ハイパーキューブの完全な分光分解能を回復することができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:12:10 GMT)
A survey on GANs for computer vision: Recent research, analysis and
taxonomy [0.2] Surveyは、GANの概要を提供し、最新のアーキテクチャ、損失関数の最適化、検証メトリクス、アプリケーション領域を示すことを目的としている。
モデルアーキテクチャの異なるバリエーションの効率性を評価するとともに、最適なアプリケーション領域を示す。
本調査の最終目的は,今後の研究者を導く上で,より優れた結果が得られるGANの進化と性能の要約を提供することである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:57:21 GMT)
SilverAlign: MT-Based Silver Data Algorithm For Evaluating Word
Alignment [0.2] 単語ペアの評価のための銀データを自動的に生成する新しい手法であるSilverAlignを提案する。
シルバーデータのパフォーマンスは、9つの言語ペアのゴールドベンチマークとよく相関していることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 22:00:44 GMT)
Leveraging Hamiltonian Simulation Techniques to Compile Operations on
Bosonic Devices [0.2] 特定の操作のクラスを実現するために,厳密に証明されたエラー境界を用いた解析的手法を提案する。
本研究は、ハイブリットボソン量子ビットデバイスをよりよく制御するために、ハミルトンシミュレーションの手法を適用する方法を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:41:47 GMT)
Feature-adjacent multi-fidelity physics-informed machine learning for
partial differential equations [0.2] 物理インフォームドニューラルネットワークは偏微分方程式の解法として登場した。
複雑な問題に対して、そのようなネットワークのトレーニングには高忠実度データが必要である。
本稿では,低忠実度および高忠実度ソリューションで共有される特徴空間に基づく,新しい多忠実度アーキテクチャを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:29:33 GMT)
Methods and Tools for Monitoring Driver's Behavior [0.1] 本稿では,車内センサの革新的なアーキテクチャとドライバの動作を測定するための手法とツールを提案する。
NIHプロジェクトでは,早期認知症のある高齢ドライバの監視と識別に,方法やツールを含むアーキテクチャが使用されている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:50:07 GMT)
Open the box of digital neuromorphic processor: Towards effective
algorithm-hardware co-design [0.1] 本稿では,アルゴリズム設計者がSNNアルゴリズムを正確にベンチマークするための実践的なアプローチを提案する。
ビデオ処理とオンライン学習におけるSNNアルゴリズムのエネルギー効率について述べる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:03:11 GMT)
Production of genuine multimode entanglement in circular waveguides with
long-range interactions [0.0] 相互作用強度の異なるモードからなる円形導波路は、真のマルチモード絡み合い(GME)を発生させることができる
固定相互作用とスクイーズ強度では, 相互作用範囲が大きくなるにつれて, 結果として生じる状態のGME含量が増加することを示した。
任意のモード数を含むシステムに対して,すべてのモードが等しく相互作用する場合に,GGMの正確な表現を解析的に決定する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 12:11:16 GMT)
unarXive 2022: All arXiv Publications Pre-Processed for NLP, Including
Structured Full-Text and Citation Network [0.0] 我々は、unarXiveというデータセットの新バージョンを提案する。
得られたデータセットは、複数の分野にまたがる1.9Mの出版物と32年からなる。
データセットに加えて、引用レコメンデーションとIMRaD分類のための準備の整ったトレーニング/テストデータを提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:40:59 GMT)
Visual Response to Emotional State of User Interaction [0.0] Mood spRingは、シーズンの没入型3Dアニメーションを制御するAIプログラムで構成されている。
もしAIプログラムがユーザーの言語とトーンを心地よいと認識すれば、アニメーションは季節の理想化された修正を通じて進行する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 20:23:18 GMT)
Variation and Instability in Dialect-Based Embedding Spaces [0.0] 本論文は、英語の異なる地域品種で訓練された埋め込み空間の変動を測定する。
実験により、埋め込み空間はトレーニングデータに表される方言に大きく影響されることが確認された。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:53:23 GMT)
VIDIMU. Multimodal video and IMU kinematic dataset on daily life
activities using affordable devices [0.0] VIDIMUは、リモートの日常生活行動認識と運動分析のための安価な患者追跡ソリューションへの道を開くことを目指している。
VIDIMUの斬新さは以下のとおりである。
選択した運動の臨床的関連性。
安価なビデオとカスタムセンサーを 組み合わせたものです
3Dボディポーズ追跡とモーション再構成のマルチモーダルデータ処理のための最先端ツールの実装。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:05:49 GMT)
Universal tetramer limit-cycle at the unitarity limit [0.0] エフィモフ環とは独立な四ボソン極限サイクルは、ユニタリ極限においてハミルトン系に現れる。
これは、独立四ボソンスケールの普遍的な表象であり、エフィモフスケールを超えるサイクルと結びついている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:33:00 GMT)
Ultrafast dynamics of cold Fermi gas after a local quench [0.0] 我々は、2つの独立な貯水池の非平衡ダイナミクスを、コールドフェルミガスで満たされた$A$と$B$の2つの量子クエンチで結合し、疎結合した$B$とみなす。
クエンチによって誘導されるフォン・ノイマンエントロピー生成は,貯水池間の熱輸送よりも高速であることがわかった。
A$とB$が結合されると、そのエントロピーは(フェルミ時間のタイムスケールで)システム内の熱流よりも速く成長する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:22:50 GMT)
Typhoon: Towards an Effective Task-Specific Masking Strategy for
Pre-trained Language Models [0.0] 本稿では,事前学習された大規模言語モデルのためのタスク固有マスキングフレームワークについて検討する。
我々はトークン入力勾配に基づく独自のマスキングアルゴリズムであるTyphoonを開発し、これを他の標準ベースラインと比較する。
私たちの実装は、公開のGithubリポジトリで確認できます。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 22:27:23 GMT)
Transversal Diagonal Logical Operators for Stabiliser Codes [0.0] パウリ群演算子は量子誤り訂正符号に実装することができる。
単一および複数ビットの対角形クリフォード階層ゲートからなる論理演算子を同定する。
単一キュービット位相ゲートを用いて実装された,所望の対角論理クリフォード階層演算子を持つCSSコードを構築する方法を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:49:37 GMT)
Towards secure judgments aggregation in AHP [0.0] グループ意思決定フレームワークの1つ以上の専門家が、結果の操作を好意的に試みている。
本稿では,マニピュレータの検出とグループコンセンサスへの影響を最小化する2つの手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:07:09 GMT)
Towards black-box parameter estimation [0.0] 弱いパラメータ構造仮定に基づいて統計モデルのパラメータを推定する新しいブラックボックス手法を開発した。
頻繁な頻度で構造化された確率に対して、これは、広範囲なシミュレートされたデータベース上でディープニューラルネットワークを事前トレーニングすることで達成される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:39:38 GMT)
Towards Scalable Physically Consistent Neural Networks: an Application
to Data-driven Multi-zone Thermal Building Models [0.0] 物理的に一貫性のあるニューラルネットワーク(PCNN)が最近開発された。
そこで本研究では,PCNNの温度特性をモデル化し,従来のグレーボックス法とブラックボックス法とを徹底的に比較する手法を提案する。
PCNNは、制約された構造にもかかわらず、最先端の精度を達成し、古典的なNNベースモデルよりも優れていることが示されている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:44:53 GMT)
Topological Reconstruction of Particle Physics Processes using Graph
Neural Networks [0.0] トポグラフは、中間粒子を含む基礎となる物理過程を、粒子物理学の崩壊の性質から基礎となる先駆的手法を利用して再構成する。
我々は、全ハドロン減衰チャネルにおけるトップクォーク対生成にトポグラフを適用し、標準手法より優れ、最先端の機械学習技術の性能に適合する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:27:45 GMT)
Thermodynamics of bidirectional associative memories [0.0] 双方向連想記憶(BAM)の平衡特性について検討する。
コスコは1988年にホップフィールドモデルを二部構造への一般化として導入した。
このモデルの拡張の計算能力を熱力学限界で特徴づける。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:27:57 GMT)
Thermal Emission Control via Twist Tuning of Embedded Eigenstates [0.0] 熱放射工学は、照明、エネルギー収穫、イメージングなど様々な用途に大きな可能性を持っている。
既存の構造は、製造において困難に直面したり、発光強度、スペクトル組成、角分布といった重要なパラメータの制御に必要なレベルを提供しない。
そこで我々は, 平面内双曲応答, エプシロン・ネアゼロにより実現された埋め込み固有状態, アルファ-MoO3ヘテロ構造のねじれによる例外的なチューニング性を活用する新しいアプローチを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:25:23 GMT)
The structure of the density-potential mapping. Part I: Standard
density-functional theory [0.0] 密度汎関数理論(DFT)のホヘンベルク・コーンの定理は、一体粒子密度だけで電子系の基底状態における完全な特徴づけの基礎として広く考えられている。
このレビューのパート1は、磁場を含む理論の異なる拡張において、DFTとパートIIにおけるホヘンベルク・コーンの定理の状況を明らかにすることを目的としている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:20:01 GMT)
The spinorial ball: a macroscopic object of spin-1/2 [0.0] 内部LED照明を内蔵した透明なプラスチックボールであるスピノリアルボールは、マクロなハーフスピン物体として振る舞う。
半整数スピンを可視化する新しいツールと、SU(2) から SO(3) への被覆群準同型を提供し、特に SO(3) の異なるホモトピー類をはっきりと視覚化する。
システム全体がオープンソースハードウェアであり、ビルドの詳細、モデル、3dプリンティングファイルなどがオープンソースライセンスで提供されている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:56:27 GMT)
The Impact of Asynchrony on Parallel Model-Based EAs [0.0] 非同期並列化設定において,MBEAに対する評価時間バイアスの影響と存在について検討する。
現代のMBEAであるGOMEAが評価時間バイアスの影響を受けていないのに対して、より古典的なMBEAであるECGAはGAのように影響を受けています。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:49:22 GMT)
Spreading entanglement through pairwise exchange interactions [0.0] 我々は、1つの励起を$N$2レベル原子または量子ビットに分散させる作業を考える。
この課題を達成するための3つのプロトコルについて述べる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:57:11 GMT)
Spin-motion coupling in a circular Rydberg state quantum simulator: case
of two atoms [0.0] 円状リドベルク原子はスピンアレイの量子シミュレーションに顕著な道具である。
スピン交換と運動力学の相互作用を、調和トラップに閉じ込められた2つの相互作用する円形リドベルク原子の単純な場合で研究する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:06:44 GMT)
Simultaneous quantum estimation of phase and indistinguishability in a
two photon interferometer [0.0] 我々は、干渉計位相の同時推定に付随する量子フィッシャー情報行列を導出する。
本研究では,2ポート干渉計に入射する不明瞭度が未知の光子対を用いた実験を行った。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:56:03 GMT)
Scale Invariant Scattering in 2D [0.0] 固定$theta neq 0$の場合、古典的極限は容易に得られる。
2つの空間次元の非相対論的スケール不変系に対して、量子散乱振幅$f(theta)$は分散関係として与えられる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 00:16:48 GMT)
STB-VMM: Swin Transformer Based Video Motion Magnification [0.0] この研究は、Swin Transformerに基づいた新しい最先端モデルを示す。
ノイズの少ない入力や、ノイズ、ぼかし、アーティファクトが先行技術よりも少ない品質の出力に耐性がある。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 20:18:45 GMT)
SLD Fisher information for kinetic uncertainty relations [0.0] オープン量子系の運動的不確実性関係(KUR)に対する対称対数微分(SLD)フィッシャー情報について検討する。
有限時間および任意の初期状態において、二重時間積分であるSLD Fisher情報の簡潔な表現を導出する。
我々は,長谷川によるマンデルスタム・タmm関係に基づいて,SLDフィッシャー情報も速度限界に現れることを指摘する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:11:20 GMT)
Risk-aware linear bandits with convex loss [0.0] 提案手法は, 線形帯域幅の一般化に類似した, 最適リスク認識動作を学習するための楽観的 UCB アルゴリズムを提案する。
このアプローチではアルゴリズムの各ラウンドで凸問題を解く必要があり、オンライン勾配降下法によって得られる近似解のみを許すことで緩和することができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:49:45 GMT)
Reply to the Comment on `The operational foundations of PT-symmetric and
quasi-Hermitian quantum theory' [0.0] 最初のコメントは3つの追加書で構成されています。
最初の付録は、我々の仕事は動機が悪いと主張している。
第2の加算は、いくつかの欠落した参照を指し示している。
第3の補題は、標準量子論の拡張につながる制約を示唆している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 02:56:19 GMT)
Randomized measurement protocols for lattice gauge theories [0.0] 本稿では,量子状態の構造を解明するための対称性を考慮したランダム化計測手法を提案する。
これは、我々が提案する対称性を意識したランダム化測定スキームによって利用することができ、対称性-盲乱数化よりも明確な優位性が得られる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:01:51 GMT)
Quantum gradient evaluation through quantum non-demolition measurements [0.0] 本稿では,コスト関数の導関数を量子コンピュータで推定するための量子非破壊測定プロトコルについて論じる。
これは変分量子回路の実装における重要なステップである。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:58:06 GMT)
Quantum $k$-uniform states from quantum orthogonal arrays [0.0] 任意の$Ngeq 5$に対して、素数$dgeq 2$の次元を持つ$N$系の2-ユニフォーム状態の無限クラスを与える。
また、任意の$Ngeq 6$と$Nneq 7,8,9,11$に対して$N$-qubitシステムの3つの一様状態を与える。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:43:35 GMT)
Probing optimisation in physics-informed neural networks [0.0] トレーニング軌道の曲率を追跡する新しい手法が提案され、低計算コストでフライで評価できる。
このオプティマイザ選択がPINNのモデル性能と精度に大きく影響することを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:35:28 GMT)
Optical transmitter for time-bin encoding Quantum Key Distribution [0.0] 標準光ファイバー上にデコイ状態法でタイムビン符号化されたシンボルを生成できる電気光学配置を導入する。
この装置は、パルス生成用に特別に設計されたパルスパターン生成器と、タイミングと同期を制御するフィールドプログラマブルゲートアレイで構成されている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:00:36 GMT)
Online Learning for Incentive-Based Demand Response [0.0] 我々は、需要応答(DR)リソースを管理するためにオンライン学習の問題を考察する。
報酬価格の摂動を考慮した最小二乗を用いたオンライン学習手法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 22:08:05 GMT)
On the stepwise nature of self-supervised learning [0.0] 組込みネットワークを用いた自己教師型学習手法の学習過程について検討する。
これらの手法は, 離散的, 分離されたステップの列において, 1次元の高次元埋め込みを同時に学習する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:59:20 GMT)
On the convex characterisation of the set of unital quantum channels [0.0] 我々は、$d$次元のユニタリ量子チャネルの凸集合を考える。
特に、写像の族をパラメトリズし、このパラメトリゼーションを通じて集合の部分的な特徴付けを提供する。
四重チャネルの場合、集合の極点とその分類をクラウス階数に関して考慮する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:55:39 GMT)
On the Connection between $L_p$ and Risk Consistency and its
Implications on Regularized Kernel Methods [0.0] 本研究の目的は,リスク一貫性と損失関数のより広いクラスに対する$L_p$一貫性の密接な関係を確立することである。
この接続をシフトした損失関数に転送しようとする試みは、このシフトが、基礎となる確率測度で必要とされる仮定を、他の多くの結果と同じ程度に減らさないことを驚くほど明らかにしている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:51:56 GMT)
Object Motion Sensitivity: A Bio-inspired Solution to the Ego-motion
Problem for Event-based Cameras [0.0] 我々は、CMOSイメージセンサ(IRIS)における第2世代のニューロモルフィック画像センサ、統合網膜機能について強調する。
IRISは、光受容体から網膜の出力への完全な網膜計算を模倣し、特徴抽出を目的とする。
イベントベースカメラのエゴモーション問題を解決するためのOMSの能力について検討する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:55:42 GMT)
Not cool, calm or collected: Using emotional language to detect COVID-19
misinformation [0.0] ツイッターなどのソーシャルメディアプラットフォーム上での新型コロナウイルス(COVID-19)の誤報は、効果的なパンデミック管理の脅威だ。
我々は、ツイート感情エンコーダと、ツイートに新型コロナウイルスの誤情報が含まれているかどうかを予測するために、ツイート感情エンコーダと、ツイート誤情報エンコーダの両方を使用する、新しい新型コロナウイルス誤情報モデルを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 22:24:05 GMT)
Nonlinear classifiers for ranking problems based on kernelized SVM [0.0] 多くの分類問題は、全てのサンプルではなく、最も関連性の高いサンプルのみの性能を最大化することに焦点を当てている。
本稿では、これらの線形分類問題のいくつかのクラスを含む一般的な枠組みを導出する。
問題を二元化し、カーネルを追加し、コンポーネントワイドのアセンジ法を提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:48:56 GMT)
Non-Markovianity through entropy-based quantum thermodynamics [0.0] 単一量子進化に対する熱流に基づく非マルコビアン性の測定法を提案する。
この測度は、内部エネルギーの符号を反転しない単位力学写像に適用することができる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:55:24 GMT)
New derivation of Time-Independent Perturbation Theory [0.0] 我々は、量子力学(QM)の教科書で提示される通常の導出よりも根本的な優位性を持つ、時間非依存摂動理論(PT)の新たな導出を提案する。
これは、生徒がPTを学ぶための、現在の方法よりも簡単で迅速な方法を提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 00:33:24 GMT)
Neuronal diversity can improve machine learning for physics and beyond [0.0] 我々は、ニューロンから独自の活性化関数を学習し、急速に多様化し、画像分類や非線形回帰タスクにおいて、同質のニューロンよりも優れるニューラルネットワークを構築した。
サブネットワークは、特に非線形応答のメタ学習が効率的であるニューロンをインスタンス化する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:03:13 GMT)
Multiphysics discovery with moving boundaries using Ensemble SINDy and
Peridynamic Differential Operator [0.0] 本研究では,移動境界を持つ現象の物理を学習するための新しい枠組みを提案する。
提案手法は Ensemble SINDy と Peridynamic Differential Operator (PDDO) を組み合わせたものである。
この手法のロバスト性は, 測定データ中の様々なレベルのノイズを考慮することで実証される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:05:21 GMT)
Multipartite information of free fermions on Hamming graphs [0.0] 本研究では,ハミンググラフ上に定義された自由フェルミオンモデルの基底状態における多部情報と絡み合い対策について検討する。
解グラフの絡み合いエントロピーの正確な公式と、相互情報および三部情報を得る。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:37:26 GMT)
Multipartite entanglement and quantum error identification in
$D$-dimensional cluster states [0.0] ローカルゲートやインタラクションを使って$m$-uniform状態を生成する方法を示す。
本研究では, 超伝導量子コンピュータ上で, 1次元クラスター状態が1量子ビット誤差を検出し, 同定する実験を行った。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:00:02 GMT)
Monetizing Explainable AI: A Double-edged Sword [0.0] 説明可能な人工知能(XAI)は、アルゴリズムによる意思決定のロジックに関する洞察を提供することを目的としている。
このトピックに関する多くの研究にもかかわらず、XAIの消費者向け応用は依然として稀である。
本稿では,説明プラットフォームを通じてプログラム広告とアルゴリズムによる説明を融合させる新たな収益化戦略について紹介する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:50:41 GMT)
Machine Learning in Orbit Estimation: a Survey [0.0] 約100万個の天体が現在地球を公転していると推定されている。
現在の近似物理学に基づく手法は、7日間の予測に数キロの誤差がある。
本稿では,軌道決定,軌道予測,大気密度モデリングに機械学習を適用した研究の概要について述べる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:32:13 GMT)
Linguistically Informed ChatGPT Prompts to Enhance Japanese-Chinese
Machine Translation: A Case Study on Attributive Clauses [0.0] 本稿では,日本語から中国語への帰属句の正しい翻訳の問題について検討する。
翻訳の精度を高めることを目的とした事前編集方式を提案する。
平均翻訳精度を35%以上向上させる新しい2段階のプロンプト戦略が提案されている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 20:33:40 GMT)
LEURN: Learning Explainable Univariate Rules with Neural Networks [0.0] LEURNは、一変量決定ルールを学ぶニューラルネットワークアーキテクチャである。
LEURNは、分類と回帰問題のための30のデータセットにわたる最先端のメソッドに匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:34:42 GMT)
Knowing the Distance: Understanding the Gap Between Synthetic and Real
Data For Face Parsing [0.0] 分散ギャップがパフォーマンスギャップの最大の貢献者であることを示し、そのギャップの50%以上を占めている。
これは、合成データが実際のデータ、特に実際のデータが限定的または入手が困難である場合に、実際のデータの代替となることを示唆している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:59:26 GMT)
Joint Person Identity, Gender and Age Estimation from Hand Images using
Deep Multi-Task Representation Learning [0.0] 画像から人物の身元、性別、年齢を共同で推定するマルチタスク表現学習フレームワークを提案する。
公開可能な1kハンドデータセット上で,畳み込みベースと変圧器ベースの両方のディープラーニングアーキテクチャの評価と比較を行う。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:52:08 GMT)
Is there a Moore's law for quantum computing? [0.0] 量子コンピューティングにおける聖杯 (Holy Grail) は、物理量子ビットの数千個の誤りを訂正した論理量子ビットを持つ巨大な量子コンピュータである。
この論文では、ムーアの経験則が量子コンピューティングにおいて等価なものに容易に変換できないことが分かる。
アルゴリズム、ソフトウェアツール、エンジニアリングもまた、量子コンピューティングの進歩を可能にする重要な役割を果たす。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:55:51 GMT)
Intersection over Union with smoothing for bounding box regression [0.0] 本稿では,境界ボックス回帰に対する損失関数の構成に着目する。
IoU(Intersection over Union)メトリックは、より高速に収束するように改善される。
提案した損失関数は,地中真理境界ボックスの次元における雑音に対して頑健であることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:20:34 GMT)
Interpretable machine learning of amino acid patterns in proteins: a
statistical ensemble approach [0.0] ボルツマンマシンは、$alpha$-helicesまたは$beta$-sheetsの開始または終了時に5つのアミノ酸列に格納された情報を数ビットに連続的に圧縮することを示した。
機械が学習した重量は、アミノ酸の予期せぬ性質とタンパク質の二次構造を明らかにする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:08:27 GMT)
Hyperparameter optimization, quantum-assisted model performance
prediction, and benchmarking of AI-based High Energy Physics workloads using
HPC [0.0] 本研究は,高性能コンピューティングシステムにおいてHPOプロセスを支援するために,モデル性能予測を利用する可能性について検討する。
量子アニールは性能予測器の訓練に用いられ、量子系の現在の限界から生じる問題を克服する手法が提案されている。
衝突イベント再構成のためのAIモデルに基づくコンテナ化されたベンチマークの開発から結果が提示される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:55:33 GMT)
High-fidelity Interpretable Inverse Rig: An Accurate and Sparse Solution
Optimizing the Quartic Blendshape Model [0.0] 本研究では,現実的な人間の顔アニメーションにおける逆リグ問題を解くことで,任意の精度のブレンドシェープリグモデルに適合する手法を提案する。
提案手法は,最先端手法に匹敵するメッシュエラーの解が得られることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:21:29 GMT)
Genuine Multipartite Nonlocality for All Isolated Many-body Systems [0.0] 我々は,真のマルチパーティライト非局所性,真のマルチパーティライトEPRステアリング,および真のマルチパーティライトエンタングルメントが,任意の孤立多体システムに等価であることを示す。
これは、与えられたソースの複数のコピーからなる膨らませたネットワーク上でのベル試験によって達成される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 06:54:20 GMT)
Generation of quantum-certified random numbers using on-chip
path-entangled single photons from an LED [0.0] 単一光子の絡み合いは、単一の光子の2つ以上の自由度が量子力学的に相関する特別なタイプの絡み合いである。
単光子パス絡み合った状態を生成・操作できるフォトニック集積チップ(PIC)を実証する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:32:55 GMT)
Generalisability of deep learning-based early warning in the intensive
care unit: a retrospective empirical evaluation [0.0] 深層学習(Deep Learning, DL)は、医師が患者状態の悪化を早期に検出するのに役立つ。
DLベースの早期警戒モデルは、訓練を受けた病院ではよく機能するが、新しい病院では信頼性が低い傾向にある。
死亡, 急性腎障害 (AKI) , 敗血症の3例について, DLモデルの信頼性を系統的に評価した。
その結果,AUROCは高死亡率 (0.838-0.869), AKI (0.823-0.866), 敗血症 (0.749-0.824) の順であった。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:13:54 GMT)
From Dual Unitarity to Generic Quantum Operator Spreading [0.0] 局所作用素の拡散に対する弱破壊二重ユニタリ性の影響について検討する。
蝶の速度と拡散定数は、微小な量の集合によって決定される。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 18:17:54 GMT)
Fano Interference in Microwave Resonator Measurements [0.0] Q_mathrmi$のシステマティックエラーは、信号とバックグラウンドパスとの干渉によって生じることを示す。
典型的なマイクロ波共振器測定におけるファノ干渉の関連について実験的に述べる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:42:11 GMT)
Evaluating XGBoost for Balanced and Imbalanced Data: Application to
Fraud Detection [0.0] 本稿では,データセットサイズとクラス分布の異なるXGboostの性能を評価する。
XGBoostは、検出性能と速度のために、いくつかのベンチマークで際立っているため、評価のために選択されている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:59:22 GMT)
Ergotropy and entanglement in critical spin chains [0.0] 半自由フェルミオン鎖の有界エネルギーは、鎖長で割られた絡み合いエントロピーの平方として崩壊することを示す。
この関係が全ての1次元臨界状態に対して成り立つと推測する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:11:56 GMT)
Efficient Robustness Assessment via Adversarial Spatial-Temporal Focus
on Videos [0.0] 本稿では,ビデオの空間時間的アタック(AstFocus)を新たに設計し,同時に焦点を絞ったキーフレームとキー領域に対するアタックを行う。
連続的なクエリにより、キーフレームとキー領域からなる縮小された検索空間が正確になっている。
4つの主流ビデオ認識モデルと3つの広く使われているアクション認識データセットの実験は、提案したAstFocus攻撃がSOTA法より優れていることを示した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 01:57:56 GMT)
Does Transliteration Help Multilingual Language Modeling? [0.0] 異なるスクリプトを使用する関連する言語を共通スクリプトに変換することで、MLLMの下流タスクのパフォーマンスが向上する可能性がある。
私たちは特に、世界で最もスクリプトの多様性が高いインド・アーリア語族に焦点を当てています。
比較的高いソースコード言語に悪影響を及ぼすことなく、低リソース言語にトランスリテラゼーションが有効であることに気付きました。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:38:19 GMT)
Discrete-Event Controller Synthesis for Autonomous Systems with
Deep-Learning Perception Components [0.0] 本稿では,DeepDECSを提案する。DeepDECSは,自律システムのための高精度離散イベント制御器を合成するための新しい手法である。
合成モデルは、自律システムの安全性、信頼性、性能要件を満たすために保証されたコントローラに対応する。
本手法は,移動ロボット衝突軽減のための制御器の合成と,共有制御自律運転における運転注意の維持に有効である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:51:56 GMT)
Dictionary Learning for the Almost-Linear Sparsity Regime [0.0] 辞書学習は、信号処理やデータ科学における応用においてますます重要になっている。
SPORADIC (SPectral ORAcle DICtionary Learning) は、重み付けされた共分散行列の族に対する効率的なスペクトル法である。
高次元において、SPORADICはよく知られた制限等尺性(RIP)を満たす過剰完備(K > M$)辞書を復元できることを示す。
これらの精度保証は、未知のスパースベクトル $mathbfx_i$ の支持と符号が、高い確率で正確に復元され、任意に閉じることができるような「オラクル特性」を持つ。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:28:27 GMT)
Designing High-Fidelity Gates for Dissipative Cat Qubits [0.0] 我々は,高忠実度および偏りを保った猫量子ビットゲートの4つの新しい設計を導入し,これらを一般的なゲート法と比較した。
これら4つの設計は、異なる相補的なアイデアを持つ散逸系のためのゲートエンジニアリングの広範な概要を提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:46:50 GMT)
Depletion in fermionic chains with inhomogeneous hoppings [0.0] 半充填時の不均一ホッピングを持つ自由フェルミオン鎖の基底状態は、ディラック真空にマッピングできる。
ハーフフィリングから遠く離れた密度変調と劣化効果を観察する。
ホッピングに比例する化学的ポテンシャルを付加することにより,全ての充填率に対して消耗効果を補償できることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:38:06 GMT)
Democratising AI: Multiple Meanings, Goals, and Methods [0.0] 多くの政党がAIの民主化を要求しているが、この言葉は様々な目標を指し、その追求は時折矛盾する。
本稿では、一般的に議論されている4種類のAI民主主義について述べる。
主な特徴は、AIの民主化は多言語であり、時には矛盾する概念であるということだ。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:34:55 GMT)
DeepTopPush: Simple and Scalable Method for Accuracy at the Top [0.0] 上位の精度は、少数の関連する(トップ)サンプルでのみ性能が評価される、バイナリ分類問題の特別なクラスである。
任意の(ディープ)ネットワークの形で分類器を検討し、トップの損失関数を最小化するための新しい手法DeepTopPushを提案する。
視覚認識データセットと実世界の2つのアプリケーションにおけるDeepTopPushの優れた性能を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:58:34 GMT)
Dancing the Quantum Waltz: Compiling Three-Qubit Gates on Four Level
Architectures [0.0] 本稿では,超伝導系アーキテクチャへの3量子ゲートのコンパイルのために,最適制御により合成された数個の3量子ゲートの直接対パルス実装について述べる。
Toffoliゲートの実行に一時的に高レベル状態を使用し、量子回路の忠実性を改善するために常に高レベル状態を使用する戦略を実証する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 16:11:31 GMT)
Curriculum Learning for Compositional Visual Reasoning [0.0] 本稿では,GQAデータセット上での学習を温めるために,クロスモーダルな埋め込みに依存するNMN法を提案する。
CL法を適切に選択することにより,トレーニングコストとトレーニングデータの量を大幅に削減できることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:47:18 GMT)
Coupled-Cluster Theory Revisited. Part II: Analysis of the
single-reference Coupled-Cluster equations [0.0] 位相次数理論を用いて単一参照結合クラスタ法の非線形方程式を解析する。
truncated Coupled-Cluster 法では、シュロディンガー方程式の近似固有状態に対して有界なエネルギー誤差を導出する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:21:19 GMT)
Coupled-Cluster Theory Revisited. Part I: Discretization [0.0] 本稿では,グラフに基づく概念を用いた結合クラスタ法における離散化手法について述べる。
我々は、単一参照とJeziorski-Monkhorst多重参照結合クラスター方程式を、統一的かつ厳密な方法で導出する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:01:24 GMT)
Contextuality with disturbance and without: Neither can violate
substantive requirements the other satisfies [0.0] 文脈性(Contextuality)は、元来、ランダム変数の連続的に連結されたシステムに対してのみ定義される。
このような要求の集合は、CbD だけでなく、CbD のような文脈性の拡張も不可能であることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:44:56 GMT)
Contactium: A strongly correlated model system [0.0] 本研究では,フェルミ=フン擬ポテンシャルを通じて相互作用する閉じ込めにおける2つのフェルミオンまたはボソンを含む系の一粒子的記述について検討する。
1粒子記述の詳細な解析により、従来のモデルシステムでは遭遇しないいくつかの特異点が明らかになった。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:27:33 GMT)
Conjunction Data Messages for Space Collision Behave as a Poisson
Process [0.0] 国際機関は、観測対象の大規模なデータベースを継続的に監視し、共同データメッセージの形で警告を発する。
衛星オペレーターにとって重要な問題は、新しい情報がいつ到着するかを見積もることである。
本稿では,メッセージ到着過程の統計的学習モデルを提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 10:28:35 GMT)
Coherently induced quantum correlation in a delayed-choice scheme [0.0] 量子相関のコヒーレンス解釈は、フランソン型相関と遅延チョイス量子消去器のために提案されている。
ここでは、ペア化されたコヒーレント光子間の基底積重ね合わせのコヒーレンス操作を遅延選択方式で量子的特徴に対して提示する。
このようなコヒーレントに励起された量子特徴は、空間のような分離量子粒子間の非局所量子相関に対するベルの不等式違反の核である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:53:42 GMT)
CoCon: A Data Set on Combined Contextualized Research Artifact Use [0.0] CoConは学術出版物の全文に研究成果物の組み合わせを反映した大規模な学術データセットである。
データセットは35kのアーティファクト(データセット、メソッド、モデル、タスク)と340kのパブリッシュで構成されています。
我々は,「総合研究成果物利用予測」のためのリンク予測タスクを形式化し,データに基づくMLアプリケーションの解析と開発を利用するためのコードを提供する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:29:09 GMT)
ChatGPT Outperforms Crowd-Workers for Text-Annotation Tasks [0.0] また、ChatGPTは、いくつかのアノテーションタスクにおいて、クラウドワーカーよりも優れていることを示す。
ChatGPTのアノテーションあたりのコストは0.003ドル未満で、MTurkの約20倍安い。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:59:48 GMT)
ChatDoctor: A Medical Chat Model Fine-tuned on LLaMA Model using Medical
Domain Knowledge [0.0] 大規模言語モデル(LLM)は、指示に従うことや、人間のような反応を生み出すことに顕著な成功を収めている。
この問題に対処するために,700以上の疾患とその症状,必要な医療検査,推奨薬を収集した。
得られたモデルは、患者のニーズを理解し、インフォームドアドバイスを提供し、様々な医療関連分野に有用な支援を提供する大きな可能性を持って出現する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 20:41:46 GMT)
CNN based Intelligent Streetlight Management Using Smart CCTV Camera and
Semantic Segmentation [0.0] 街灯は、不要な地域では、あまりにも多くの光を発生させます。
本研究の目的は,コンピュータビジョン技術を利用したスマートトランスポート監視システムと閉回路テレビ(CCTV)カメラを組み合わせることで,新たな街灯制御手法を開発することである。
街路灯「ON」と「OFF」を自動変換して省エネ化を図った。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:56:44 GMT)
CLIDiM: Contrastive Learning for Image Denoising in Microscopy [0.0] 数発の顕微鏡画像復調のための新しいフレームワークを提案する。
提案手法は,比較学習(CL)を用いて学習したGAN(Generative Adversarial Network)と,損失項を保存する2つの構造を組み合わせたものである。
本手法が3つのよく知られた顕微鏡画像データセットに対して有効であることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:55:07 GMT)
Bridging Deliberative Democracy and Deployment of Societal-Scale
Technology [0.0] 大規模言語モデル(LLM)の安全性を確保するための既存のプロセスは不十分であり、システムに民主的な正当性を与えていない、と私は主張する。
このAI安全研究と実践のシフトは、熟考の実施方法を決定する企業および公共政策の設計を必要とする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 04:47:19 GMT)
Beyond Toxic: Toxicity Detection Datasets are Not Enough for Brand
Safety [0.0] ブランド安全は、広告が表示されないコンテキストを特定することで、商業ブランドを保護することを目的としている。
我々は、一般的な毒性検出データセットを応用して、ブランドの安全特定データセットを構築する必要性を実証する。
テキスト分類における重み付けサンプリング戦略の効果を実証分析する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:29:09 GMT)
Automatically Score Tissue Images Like a Pathologist by Transfer
Learning [0.0] 病理学者は、腫瘍を識別するために手動で組織マイクロアレイ(TMA)画像を見る必要がある。
最大の課題は、異なる形状、サイズ、位置のTMAイメージが同じスコアを持つことだ。
提案したアルゴリズムは、「類似した」スコアパターンを示す組織像から知識を抽出できるが、がんの種類は異なる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:18:14 GMT)
Automatic breach detection during spine pedicle drilling based on
vibroacoustic sensing [0.0] 本研究は,非視覚センサと深層学習を併用した新しい放射能非破壊検出アルゴリズムを提案する。
コンタクトマイク,フリーフィールドマイク,3軸加速度計,光トラッキングシステムなどの複数の視覚音響センサをセットアップに統合した。
提案手法は, ペプシクル掘削時のスクリューのずれや骨破壊を回避するために, 非視覚センサ融合の可能性を示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:32:14 GMT)
Automated detection of symmetry-protected subspaces in quantum
simulations [0.0] 2つの古典的アルゴリズムを導入し、対称性保護部分空間の特徴を効率的に計算し、解明する。
これらのアルゴリズムは、量子コンピュータデータのポストセレクション、量子システムの最適化された古典的シミュレーション、以前は量子力学系に隠されていた対称性の発見に役立っている。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 21:17:02 GMT)
Artificial intelligence approaches for materials-by-design of energetic
materials: state-of-the-art, challenges, and future directions [0.0] 我々は,AIによる材料設計の進歩とそのエネルギー材料への応用についてレビューする。
文献における手法を,少数のデータから学習する能力の観点から評価する。
本稿では,メタラーニング,アクティブラーニング,ベイズラーニング,半/弱教師付きラーニングなど,EM教材の今後の研究方向性について提案する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 03:29:48 GMT)
Artificial Intelligence for Sustainability: Facilitating Sustainable
Smart Product-Service Systems with Computer Vision [0.0] この研究は、生産および製品利用の持続可能性を高めるために、ディープラーニングをどのように活用できるかを示している。
深層学習に基づくコンピュータビジョンを用いて製品の摩耗状態を決定する。
我々は, 加工ツールと回転X線アノードの2つの製品に対するアプローチを実証する。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 07:53:49 GMT)
Architecturing Binarized Neural Networks for Traffic Sign Recognition [0.0] バイナリニューラルネットワーク(BNN)は、計算に制限された、エネルギーに制約のあるデバイスにおいて、有望な結果を示している。
我々はドイツ交通信号認識ベンチマーク(GTSRB)の90%以上を達成できるBNNアーキテクチャを提案する。
これらのアーキテクチャのパラメータの数は100kから2M未満まで様々である。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 08:46:31 GMT)
Anomalous universal adiabatic dynamics: The case of the Fredkin model [0.0] 我々は、他の普遍的スケーリング法則を示すことができる欠陥の数について研究するが、これは重要な指数である$z$ と $nu$ にのみ関係しているが、キブル・ズレックの結果とは異なっている。
例として、変形したフレドキンスピン鎖(英語版)があり、そこでは標準的な断熱力学の破れが生じる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 19:34:57 GMT)
An ontology-aided, natural language-based approach for multi-constraint
BIM model querying [0.0] 本稿では,異なる制約を含む自然言語クエリ(NLQ)を,複雑なBIMモデルを問合せするためのコンピュータ可読コードに自動的にマッピングする,新しいオントロジー支援セマンティクスを提案する。
実世界の住宅ビルの設計チェックに関する事例研究は,建設業における提案手法の実践的価値を実証している。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 11:35:40 GMT)
AmorProt: Amino Acid Molecular Fingerprints Repurposing based Protein
Fingerprint [0.0] そこで本研究では,AmorProt型タンパク質 (AmorProt型タンパク質) を精製するアミノ酸分子指紋を提案する。
木に基づく機械学習と人工ニューラルネットワークモデルの性能を比較した。
その結果、現在のタンパク質表現法は、タンパク質に関連する様々な分野に適用できることが判明した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 23:57:47 GMT)
Advances and Applications of Computer Vision Techniques in Vehicle
Trajectory Generation and Surrogate Traffic Safety Indicators [0.0] 本稿では、サロゲート安全対策(SSM)を用いた交通安全モデリングにおけるコンピュータビジョン(CV)技術の適用について概観する。
車両の検知と追跡に使用されるCVアルゴリズムについて,最先端モデルへの早期アプローチについて要約する。
車両軌道データに対するSSMの検討と交通安全解析への応用について述べる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:13:02 GMT)
Adapting Pretrained Language Models for Solving Tabular Prediction
Problems in the Electronic Health Record [0.0] 本研究は,MIMIC-III放電サマリー,臨床ノート,放射線学報告,PubMed要約からなるデータセット上で,小さなDeBERTaモデルを事前訓練する。
我々は,本モデルの性能を,施設のEHR(DeBERTa)とXGBoostモデルから臨床テキストを事前学習したDeBERTaモデルと比較した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 05:34:19 GMT)
AI-driven Hypergraph Network of Organic Chemistry: Network Statistics
and Applications in Reaction Classification [0.0] 我々は、標準の反応データセットを使用してハイパーネットワークを構築し、その統計を報告する。
また、反応の等価なグラフ表現に対して各統計量を計算し、平行線を描画し、相違点を強調する。
ハイパーネットワーク表現は柔軟性があり、反応コンテキストを保持し、隠れた洞察を明らかにする。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 15:43:43 GMT)
A probabilistic view of wave-particle duality for single photons [0.0] 単一光子状態に作製した光の波動-粒子双対性を示す簡単な実験について述べる。
古典的確率論の観点からこの問題にアプローチすることにより、標準相関関数は、ある種の波動と粒子観測物の間の隠れた非線形依存を明らかにすることができないことが分かる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 13:21:25 GMT)
A critical Schr\"odinger cat qubit [0.0] 猫量子ビットでは、この多様体を安定化させるために、2光子駆動と損失を組み合わせた工学的な散逸方式が用いられている。
高性能ゲートを設計できるKerr cat qubitsでは、2光子駆動とKerr非線形性が協調してシステムを閉じ込める。
大規模なデチューニングと小さいが無視できない2光子損失率は、最適な性能を達成するのに不可欠であることを示す。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 14:48:43 GMT)
A biological sequence comparison algorithm using quantum computers [0.0] 本稿では,2つのゲノム配列間の類似性を量子コンピュータ上に表示し,解析する手法を提案する。
量子コンピュータ上での視覚の人間の知覚と画像のピクセル表現に触発され、これらの技術を利用してペアワイズシーケンス解析を実装した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:04:27 GMT)
A Gillespie algorithm for efficient simulation of quantum jump
trajectories [0.0] 我々は、量子ジャンプを予測するためのGilespieアルゴリズムの量子バージョンを提案する。
これにより、タイムステップの離散化がまったく不要になり、代わりに、システムを1回のジャンプから次のジャンプへと継続的に進化させる。
身体的複雑性を増大させる4つの例を挙げる。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 17:21:31 GMT)
3D sympathetic cooling and detection of levitated nanoparticles [0.0] 浮遊ナノ粒子の質量運動の中心を冷却することは、メソスコピックスケールでの量子実験への道のりとなる。
浮遊シリカナノ粒子の3次元交感神経冷却と重心運動の検出を実証した。
論文参考訳(メタデータ) (Mon, 27 Mar 2023 09:46:32 GMT)