LayoutLLM-T2I: Eliciting Layout Guidance from LLM for Text-to-Image
Generation [121.5] レイアウト計画と画像生成を実現するための粗大なパラダイムを提案する。
提案手法は,フォトリアリスティックなレイアウトと画像生成の観点から,最先端のモデルよりも優れている。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 05:36:42 GMT)
Constructing Holistic Spatio-Temporal Scene Graph for Video Semantic
Role Labeling [96.6] Video Semantic Label Roleing (VidSRL)は、与えられたビデオから健全なイベントを検出することを目的としている。
近年、VidSRLの手法が提案されているが、2つの重要な欠点を負う可能性がある。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 06:02:02 GMT)
GPT-4 Is Too Smart To Be Safe: Stealthy Chat with LLMs via Cipher [89.5] 実験により、いくつかの安全領域において、GPT-4の安全性アライメントをバイパスするために、ある暗号がほぼ100%の時間で成功することが示された。
本稿では,ロールプレイのみを使用し,自然言語によるいくつかの実演を行い,これを誘発する新しいSelfCipherを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 04:05:57 GMT)
Bird's-Eye-View Scene Graph for Vision-Language Navigation [85.7] 視覚言語ナビゲーション(VLN)は、人間の指示に従って3D環境をナビゲートするエージェントである。
室内環境のシーンレイアウトと幾何学的手がかりを符号化するために,多段階のBEV表現を利用するBEVシーングラフ(BSG)を提案する。
BSGに基づいて、エージェントは、ローカルなBEVグリッドレベル決定スコアとグローバルなグラフレベル決定スコアを予測し、パノラマビューのサブビュー選択スコアと組み合わせる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 08:29:16 GMT)
Revisiting Disentanglement and Fusion on Modality and Context in
Conversational Multimodal Emotion Recognition [81.2] 特徴の多様性と会話の文脈化は、特徴の絡み合いと融合の段階において、同時に適切にモデル化されるべきである。
マルチモーダル・コンテキスト統合のためのコントリビューション・アウェア・フュージョン・メカニズム(CFM)とコンテキスト・リフュージョン・メカニズム(CRM)を提案する。
我々のシステムは、新しい最先端のパフォーマンスを一貫して達成する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 06:05:26 GMT)
Model-Free Reinforcement Learning with the Decision-Estimation
Coefficient [79.3] 本稿では,汎用関数近似による構造化帯域と強化学習を包含する対話型意思決定の課題について考察する。
提案手法は,値関数近似を用いたモデル自由強化学習における残差を導出し,より一般的には有効かつ不可能な構造的結果を与える。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 20:43:21 GMT)
A Stitch in Time Saves Nine: Detecting and Mitigating Hallucinations of
LLMs by Validating Low-Confidence Generation [76.3] 大規模な言語モデルは、しばしば信頼性を著しく損なう「ハロシン化」する傾向がある。
生成過程における幻覚を積極的に検出・緩和する手法を提案する。
提案手法は, GPT-3.5モデルの幻覚を平均47.5%から14.5%に低減する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 14:57:37 GMT)
AutoConv: Automatically Generating Information-seeking Conversations
with Large Language Models [74.1] 合成会話生成のためのAutoConvを提案する。
具体的には,会話生成問題を言語モデリングタスクとして定式化する。
我々は、情報探索プロセスの特徴を捉えるために、人間同士の会話でLLMを微調整する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 08:52:40 GMT)
Planting a SEED of Vision in Large Language Model [73.2] このSEEDは,大規模言語モデル(LLM)とSEEとDrawを同時に実現する,精巧な画像トークンである。
このバージョンのSEEDは、64のV100 GPUと5Mのパブリックな画像テキストペアを使用して、5.7日間でトレーニングされた。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 04:42:29 GMT)
NewsDialogues: Towards Proactive News Grounded Conversation [72.1] 本稿では,対話システムがニュースの重要な話題に基づいて会話を積極的にリードする新しいタスク,Proactive News Grounded Conversationを提案する。
この課題をさらに発展させるために、人間と人間の対話データセットtsNewsDialoguesを収集し、合計14.6Kの発話を含む1Kの会話を含む。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 08:33:42 GMT)
Split, Encode and Aggregate for Long Code Search [70.4] 提案するSEA (Split, Encode and Aggregate for Long Code Search) は,長いコードをコードブロックに分割し,それらのブロックを埋め込みにエンコードし,それらを集約して包括的なロングコード表現を得る。
SEAでは、Transformerベースの事前トレーニングモデルを直接使用して、内部構造や再トレーニングを変更することなく、長いコードをモデル化することができます。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 07:04:59 GMT)
Automated Learning for Deformable Medical Image Registration by Jointly
Optimizing Network Architectures and Objective Functions [69.7] 本稿では、アーキテクチャとそれに対応する学習目標の両方を協調的に最適化する自動学習登録アルゴリズム(AutoReg)を提案する。
マルチサイトボリュームデータセットと各種登録タスクについて,画像登録実験を行った。
我々のAutoRegは、与えられたボリュームに対して最適な深層登録ネットワークを自動的に学習し、最先端の性能を達成することができる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 03:55:11 GMT)
Zolly: Zoom Focal Length Correctly for Perspective-Distorted Human Mesh
Reconstruction [66.1] Zollyは、視点歪みの画像に焦点を当てた最初の3DHMR法である。
人体の2次元密度ゆらぎスケールを記述した新しいカメラモデルと新しい2次元歪み画像を提案する。
このタスク用に調整された2つの現実世界のデータセットを拡張します。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 16:32:11 GMT)
Breaking Common Sense: WHOOPS! A Vision-and-Language Benchmark of
Synthetic and Compositional Images [63.6] ビジュアルコモンセンスのための新しいデータセットとベンチマークであるWHOOPS!を紹介します。
データセットは、デザイナによって作成された、意図的に常識を守るイメージで構成されています。
GPT3やBLIP2のような最先端モデルがWHOOPSの人間性能に遅れをきたしていることを示す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 22:37:31 GMT)
One-bit Flip is All You Need: When Bit-flip Attack Meets Model Training [54.6] メモリフォールトインジェクション技術を利用したビットフリップ攻撃(BFA)と呼ばれる新たな重み修正攻撃が提案された。
本稿では,高リスクモデルを構築するための訓練段階に敵が関与する,訓練支援ビットフリップ攻撃を提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 09:34:43 GMT)
Cyclic Test-Time Adaptation on Monocular Video for 3D Human Mesh
Reconstruction [49.5] テスト画像からの2Dエビデンスに依存するネットワークを微調整するテスト時間適応により、いくつかの先行研究がドメインギャップ問題に対処している。
本稿では,HMRNet(Human Mesh Restruction Network)とMDNet(Human Motion Denoising Network)の2つのネットワークを循環的に適応するCycleAdaptを紹介する。
本フレームワークは,MDNetが生成した3D監視ターゲットを用いてHMRNetを完全に監視し,不完全な2Dエビデンスを補う。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 12:55:20 GMT)
Alternative Pseudo-Labeling for Semi-Supervised Automatic Speech
Recognition [49.4] ラベル付きデータが不十分な場合、擬似ラベル技術による半教師付き学習は自動音声認識の性能を大幅に向上させることができる。
損失関数のグラウンドトルースとしてノイズラベルを取ると、最適以下の性能が得られる。
そこで我々は,ノイズの多い擬似ラベル問題に対処するために,代替擬似ラベル方式という新しい枠組みを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 12:13:52 GMT)
SegPrompt: Boosting Open-world Segmentation via Category-level Prompt
Learning [49.2] オープンワールドインスタンスセグメンテーション(OWIS)モデルは、クラスに依存しない方法で未知のオブジェクトを検出する。
以前のOWISは、未知のオブジェクトに一般化するモデルの能力を維持するために、トレーニング中のカテゴリ情報を完全に消去するアプローチだった。
そこで本研究では,モデルのクラスに依存しないセグメンテーション能力を改善するためにカテゴリ情報を利用するSegPromptと呼ばれる新しいトレーニング機構を提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 11:25:39 GMT)
Three-Way Trade-Off in Multi-Objective Learning: Optimization,
Generalization and Conflict-Avoidance [47.4] マルチオブジェクト学習(MOL)問題は、複数の学習基準や複数の学習タスクがある場合、機械学習の問題を発生させる。
最近の研究はMGDAやその変種などのMOLのための様々な動的重み付けアルゴリズムを開発しており、そこでは目的間の衝突を避けるための更新方向を見つけることが中心となっている。
本稿では,Mouble sample (MoDo)アルゴリズムを用いた多目的勾配法MGDAの新しい変種について検討し,動的重み付けに基づくMoDoの一般化性能について検討する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 18:29:36 GMT)
DialogRE^C+: An Extension of DialogRE to Investigate How Much
Coreference Helps Relation Extraction in Dialogs [47.0] この研究は、ダイアログ関係抽出シナリオにコア参照解決を導入し、新しいベンチマークデータセットDialogREC+を導入している。
既存のDialogREデータに基づいて,36,369個の引数参照に対して,合計5,068個のコア参照チェーンを手動で注釈付けする。
DREタスクを改善するための効果的なコア参照表現を学習する4つのコア参照強化グラフベースDREモデルを開発した。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 06:12:36 GMT)
Temporal Action Segmentation: An Analysis of Modern Techniques [43.7] ビデオにおける時間的アクションセグメンテーション(TAS)は、複数のアクションクラスを持つ分長ビデオにおいて、ビデオフレームを密に識別することを目的としている。
近年のTAS技術の急速な発展にもかかわらず、これらの分野では体系的な調査は行われていない。
この調査は、最も重要なコントリビューションとトレンドを分析し、要約します。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 13:07:18 GMT)
Approximate Answering of Graph Queries [40.4] 本章では,このような条件下での問合せに対処するために提案されたいくつかの手法の概要について述べる。
まず、これらのメソッドと一般的に評価に使用されるデータセットがサポートするさまざまなクエリタイプの概要を説明します。
次に、異なるアプローチの概要を述べ、表現性、サポートされたグラフタイプ、推論機能の観点から記述する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 14:47:21 GMT)
Revisiting Vision Transformer from the View of Path Ensemble [40.1] 視覚変換器(ViT)は通常、トランス層のスタックと見なされる。
異なる長さの複数の並列経路を含むアンサンブルネットワークとして、ViTを見ることができることを示す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 12:18:16 GMT)
Simple Model Also Works: A Novel Emotion Recognition Network in Textual
Conversation Based on Curriculum Learning Strategy [39.0] カリキュラム学習戦略(ERNetCL)に基づく新しい感情認識ネットワークを提案する。
提案するERNetCLは主にテンポラル(TE)、空間(SE)、カリキュラム学習(CL)の損失からなる。
提案手法は有効であり,他のベースラインモデルに劇的に勝っている。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 03:05:44 GMT)
MT4CrossOIE: Multi-stage Tuning for Cross-lingual Open Information
Extraction [38.9] 言語横断的オープン情報抽出は,複数の言語にまたがる原文から構造化された情報を抽出することを目的としている。
以前の作業では、異なる言語を扱うために、共通言語間の事前訓練モデルを使用していたが、言語固有の表現の可能性を過小評価している。
MT4CrossIEという,言語間オープン情報抽出の効率化を目的とした,効果的な多段階チューニングフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 12:38:10 GMT)
Seed Feature Maps-based CNN Models for LEO Satellite Remote Sensing
Services [38.8] 高性能畳み込みニューラルネットワーク(CNN)モデルは、リモートセンシング画像処理のために低軌道(LEO)衛星に配備される。
既存のアプローチでは、大きな浮動小数点演算(FLOP)と実質的なモデルパラメータ伝達が必要となることが多い。
本稿では,これらの問題に対処するための地上局型サーバ支援フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 09:41:18 GMT)
Feature Modulation Transformer: Cross-Refinement of Global
Representation via High-Frequency Prior for Image Super-Resolution [35.3] クロスリファインメント適応型特徴変調トランス(CRAFT)
提案手法であるクロスリファインメント適応型特徴変調トランス (CRAFT) は, 畳み込み構造と変圧器構造の強度を統合する。
複数のデータセットに対する実験により、CRAFTはより少ないパラメータを使用しながら、最先端のメソッドを最大0.29dBで上回ります。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 10:38:43 GMT)
VisIT-Bench: A Benchmark for Vision-Language Instruction Following
Inspired by Real-World Use [34.1] VisIT-Benchは、命令追従型視覚言語モデルの評価のためのベンチマークである。
提案データセットは592個のテストクエリからなり,それぞれに人手による指示条件付きキャプションを付与した。
人的評価と自動評価の両方を用いて,モデルと参照間の品質ギャップを定量化する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 15:27:51 GMT)
Predicting the generalization gap in neural networks using topological
data analysis [33.5] トポロジカルデータ解析の手法を用いて,ニューラルネットワークの一般化ギャップについて検討する。
トレーニング後のニューロン活性化相関から構築した重み付きグラフのホモロジー永続図を計算する。
持続性図から異なる数値要約の有用性を比較し、それらの組み合わせによって、テストセットを必要とせずに、その一般化ギャップを正確に予測し、部分的に説明できることを示す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 09:23:59 GMT)
Summaries as Captions: Generating Figure Captions for Scientific
Documents with Automated Text Summarization [31.6] 図文キャプション生成は、科学文書におけるテキスト要約タスクとして、より効果的に取り組むことができる。
図式参照段落を具体的に要約するために,事前学習した抽象要約モデルであるPEGを微調整した。
大規模arXiv図を用いた実験により,本手法は,自動評価と人的評価の両方において,先行視覚法よりも優れた性能を示した。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 03:00:55 GMT)
Latent Random Steps as Relaxations of Max-Cut, Min-Cut, and More [30.9] クラスタリングと単純化を統一する非負行列分解に基づく確率モデルを提案する。
ハードクラスタリングをソフトクラスタリングに緩和することにより、ハードクラスタリングの潜在的な問題をトラクタブルクラスタに緩和する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 02:47:57 GMT)
EgoPoser: Robust Real-Time Ego-Body Pose Estimation in Large Scenes [30.8] ヘッドポーズとハンドポーズだけでのフルボディのエゴ位置推定は、ヘッドセットベースのプラットフォーム上でのアバター表現を効果的に活用するための研究の活発な領域となっている。
本稿では,ヘッドセットを用いたエゴ位置推定のための入力表現を再考し,新しい動作分解法を導入することで,これらの制約を克服するEgoPoserを提案する。
実験の結果,EgoPoserは600fps以上の高速な推論速度を維持しながら,定性的かつ定量的に最先端の手法より優れていることがわかった。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 07:46:50 GMT)
SLoRA: Federated Parameter Efficient Fine-Tuning of Language Models [28.8] FL(Federated Learning)は、FLエッジクライアントの分散データとプライベートデータの恩恵を受けることができる。
異種データシナリオにおけるLoRAの重要な制約を克服するSLoRAという手法を提案する。
実験の結果,SLoRAは完全微調整に匹敵する性能を示した。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 10:33:57 GMT)
An Efficient Stochastic Algorithm for Decentralized
Nonconvex-Strongly-Concave Minimax Optimization [28.1] 本稿では,マルチエージェントネットワーク上での分散非強度コンケーブ(NC-SC)ミニマックス問題の最適化を実現する。
本稿では,DREAM(Decentralized Recursive-gradient descEnt Ascent Method)と呼ばれる効率的なアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 09:29:07 GMT)
Foundation Model for Endoscopy Video Analysis via Large-scale
Self-supervised Pre-train [27.2] 本研究では,大規模な内視鏡映像データを用いた基礎モデルであるEndo-FMを提案する。
私たちのデータセット全体は、最大500万フレームの33Kビデオクリップで構成されており、さまざまなプロトコル、対象臓器、疾患タイプが含まれています。
我々のEndo-FMは、現在最先端(SOTA)の自己指導型事前学習とアダプタベースのトランスファー学習を、かなりの差で上回っている。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 05:44:16 GMT)
Generating Faithful Text From a Knowledge Graph with Noisy Reference
Text [26.7] 与えられたグラフから忠実な自然言語テキストを生成することができるKG-to-text生成モデルを開発した。
まず、コントラスト学習を利用して、テキスト内の忠実な情報と幻覚的な情報を区別するモデルの能力を強化する。
第2に、制御可能なテキスト生成技術を用いて、デコーダに生成したテキストの幻覚レベルを制御する権限を与える。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 07:12:45 GMT)
Are We Ready to Embrace Generative AI for Software Q&A? [25.7] 世界最大のソフトウェアQ&A(SQA)WebサイトであるStack Overflowは、生成AI技術の出現により、トラフィックの大幅な減少に直面している。
ChatGPTは、Stack Overflowのリリースからわずか6日後に禁止される。
これを検証するために、我々は人書きとChatGPT生成の回答の比較評価を行った。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 13:10:02 GMT)
A Bi-directional Multi-hop Inference Model for Joint Dialog Sentiment
Classification and Act Recognition [25.4] ダイアログ知覚分類(DSC)とアクト認識(DAR)の併用作業は,ダイアログ中の各発話に対する感情ラベルと行動ラベルを同時に予測することを目的としている。
本稿では,リッチな感情を反復的に抽出・統合し,双方向で手掛かりを行動させる双方向マルチホップ推論モデル(BMIM)を提案する。
BMIMは、DARのF1スコアで少なくとも2.6%、DSCのF1スコアで1.4%、最先端のベースラインを上回っている。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 06:17:42 GMT)
HyperFormer: Enhancing Entity and Relation Interaction for
Hyper-Relational Knowledge Graph Completion [25.4] ハイパーリレーショナル知識グラフ(HKG)は、属性値の等式をトリプルに関連付けることによって、標準的な知識グラフを拡張する。
本稿では,三重項の実体,関係,等化子の内容をエンコードする局所レベルシーケンシャル情報を考慮したモデルであるHyperFormerを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 09:31:43 GMT)
Relation-Oriented: Toward Knowledge-Aligned Causal AI [24.8] 機械学習では、観測変数が事前に存在し、関係構築の段階を設定する観察指向原理を自然に適用する。
従来のモデルには十分だが、ビッグデータとAIの統合は、観測モデルと実際の理解との相違を露呈する。
本研究は,コンピュータビジョンと健康情報学の直感的な例に照らされた,現在のモデリングパラダイムにおけるこの誤認識の根源について考察する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 01:32:48 GMT)
Gated Attention Coding for Training High-performance and Efficient
Spiking Neural Networks [24.0] 従来の人工ニューラルネットワーク(ANN)に代わるエネルギー効率の高い代替手段として、スパイキングニューラルネットワーク(SNN)が登場している
Gated Attention Coding (GAC) は多次元アテンションユニットを利用して入力を効率よく強力な表現に符号化するプラグイン・アンド・プレイモジュールである。
GACは、SNNのスパイク駆動特性を阻害しない前処理層として機能し、最小限の変更で効率的なニューロモルフィックの実装を可能にする。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 14:42:02 GMT)
Fusion-GRU: A Deep Learning Model for Future Bounding Box Prediction of
Traffic Agents in Risky Driving Videos [20.9] Fusion-Gated Recurrent Unit (Fusion-GRU)は、将来のバウンディングボックスローカライゼーションのための新しいエンコーダデコーダアーキテクチャである。
提案手法は, ROL と HEV-I の2つの公開データセットを用いて評価する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 18:35:59 GMT)
MC-DRE: Multi-Aspect Cross Integration for Drug Event/Entity Extraction [19.5] 薬物の実体・事象検出のための多視点クロスインテグレーションフレームワークを提案する。
我々のモデルは、最近の12の最先端モデルよりも大幅に優れています。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 12:03:41 GMT)
Uncertainty-Guided Spatial Pruning Architecture for Efficient Frame
Interpolation [19.1] ビデオフレーム(VFI)モデルはすべての場所に畳み込み演算を適用し、簡単に動く領域で冗長な計算を行う。
冗長計算を省略する不確実性誘導型空間プラニングアーキテクチャを開発した。
提案手法は,複数のベンチマーク上でのFLOPの低下による最先端性能を実現する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 06:39:44 GMT)
Demonstration-based learning for few-shot biomedical named entity
recognition under machine reading comprehension [16.7] 本研究は, 数発の学習シナリオにおいて, バイオメディカルな実体を認識する能力を向上させる戦略を考案した。
数ショットの学習の領域では、MRCベースの言語モデルは、シーケンスラベリングアプローチと比較して、生物医学的な実体を認識するのにはるかに熟練している。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 03:23:09 GMT)
On the Interplay of Convolutional Padding and Adversarial Robustness [16.3] 本研究は, 対人攻撃によって画像境界における摂動異常が生じることを示し, 対人攻撃はパディングが用いられる領域であることを示した。
異なるパディングモード(またはその欠如)が様々なシナリオにおける敵の堅牢性にどのように影響するかという質問に対する回答を求める。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 17:06:48 GMT)
Latent Emission-Augmented Perspective-Taking (LEAPT) for Human-Robot
Interaction [16.2] 本稿では,ロボットが知覚と概念的視点の両方を捉えることができる深層世界モデルを提案する。
鍵となる革新は、架空の観測・放出を生成・拡張できる多モード潜在状態モデルである。
我々は,3つの部分観測可能なHRIタスクにおいて,人間の観察と信念を予測するために,モデルを実行した。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 08:22:11 GMT)
Text-to-Video: a Two-stage Framework for Zero-shot Identity-agnostic
Talking-head Generation [16.1] 本稿では,人別ビデオクローンのための新しい2段階フレームワークを提案する。
最初の段階では、事前訓練されたゼロショットモデルを利用してテキスト音声変換を行う。
第2段階では、説得力のあるビデオを生成するために、音声駆動音声ヘッド生成法が用いられる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 03:30:49 GMT)
Learn Single-horizon Disease Evolution for Predictive Generation of
Post-therapeutic Neovascular Age-related Macular Degeneration [15.6] 本稿では,治療後SD-OCT画像の予測生成を行う単一水平病進化ネットワーク(SHENet)を提案する。
SHENetでは、入力されたSD-OCT画像を深い特徴に変換する機能エンコーダを用いて、グラフ進化モジュールが高次元ラテント空間における病気の進化過程を予測する。
また,病気の進化学習の有効性を確保するために,進化強化モジュールを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 01:40:23 GMT)
Stationary Algorithmic Balancing For Dynamic Email Re-Ranking Problem [15.6] メールプラットフォームは、ユーザーの好みを満たすメールの個人別ランキングを生成する必要がある。
提案するMOSR(Multi-Objective Stationary Recommender)は、適応制御モデルを用いて、これらの基準のバランスをとり、好みの変化に適応する新しいオンラインアルゴリズムである。
私たちの研究は、ユーザの満足度に影響を与える複数の目的を考慮に入れた、メールの再ランク付けシステムの設計方法に関する、新しい洞察を提供する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 23:08:15 GMT)
3DMOTFormer: Graph Transformer for Online 3D Multi-Object Tracking [15.3] 最先端の3Dマルチオブジェクト追跡(MOT)アプローチは通常、Kalman Filterのような非学習モデルベースのアルゴリズムに依存している。
本稿では3DMOTFormerを提案する。この3D MOTフレームワークはトランスフォーマーアーキテクチャをベースに構築されている。
提案手法は, nuScenesバリデーションとテストスプリットでそれぞれ71.2%, AMOTA68.2%を達成している。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 19:19:58 GMT)
DISQ: Dynamic Iteration Skipping for Variational Quantum Algorithms [14.2] 本稿では,VQAトレーニングのための安定した景観の構築と,ノイズドリフト問題への取り組みについて提案する。
DisQは参照回路を備えた「ドリフト検出器」を採用し、ノイズドリフトエラーによって深刻な影響を受けるイテレーションを特定し、スキップする。
DisQの利点は1.1-1.9倍であり、平均ノイズ検出速度は2.07倍に向上する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 19:08:19 GMT)
Optimal Synthesis of Stabilizer Codes via MaxSAT [14.2] MaxSATを介して様々なハードウェア構造に汎用安定化器符号を縫合する最適合成器を提案する。
高レベルのQECコード設計と低レベルのハードウェア制約のギャップを埋めることにより、この作業は、長期のフォールトトレラントな量子コンピューティング目標を達成するための道を開く。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 01:09:20 GMT)
Split-State Non-Malleable Codes and Secret Sharing Schemes for Quantum
Messages [14.2] 本稿では,共有エンタングルメントを持つ量子敵に対してセキュアな量子メッセージに対して,分割状態の非有理符号と秘密共有方式を導入する。
また、低エラー非可逆性を実現するようなスキームの明示的な構成も提示する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 05:15:35 GMT)
MathBERT: A Pre-trained Language Model for General NLP Tasks in
Mathematics Education [13.5] MathBERTは、BASE BERTモデルを大規模な数学的コーパスで事前訓練したモデルである。
MathBERTでトレーニングするために、数学固有の語彙'mathVocab'を構築します。
MathBERTは現在、商用の教育リソースプロバイダであるStride, Incと、無料のオンライン教育プラットフォームであるASSISTments.orgで採用されている。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 15:45:07 GMT)
Robust estimation of exposure ratios in multi-exposure image stacks [12.4] 入力画像から直接露光率を推定する。
カメラノイズによる推定誤差を最小限に抑えるために,一対の露光から画素を選択できる最適化問題として露出時間推定を導出する。
複数の空間タイルから画素を収集することにより、カメラや物体の動きによる画素の不一致に容易に対応できることを示す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 10:36:52 GMT)
Is GitHub's Copilot as Bad as Humans at Introducing Vulnerabilities in
Code? [12.4] セキュリティの観点から,Copilot生成したコードの比較実験解析を行った。
われわれは、Copilotが人間の開発者と同じソフトウェア脆弱性をもたらす可能性が高いかどうかを調査する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 14:23:30 GMT)
Copilot Security: A User Study [12.4] 私たちはGitHubのCopilotを評価し、コードのセキュリティに関する長所と短所をよりよく理解しています。
Copilotへのアクセスは,難しい問題に対処する上で,よりセキュアなソリューションであることに気付きました。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 14:49:46 GMT)
VesselMorph: Domain-Generalized Retinal Vessel Segmentation via
Shape-Aware Representation [12.2] ドメインシフトは医療画像の本質的な特性であり、学習ベースのアルゴリズムを大規模に展開する上で大きな障害となっている。
形状認識表現を合成することにより2次元網膜血管セグメンテーションタスクを一般化するVesselMorphという手法を提案する。
VesselMorphは、異なるドメインシフトシナリオの競合するメソッドと比較して、優れた一般化性能を実現する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 04:45:12 GMT)
EquiDiff: A Conditional Equivariant Diffusion Model For Trajectory
Prediction [12.0] 本研究では,将来の車両軌道予測のための深部生成モデルであるEquiDiffを提案する。
EquiDiffは、過去の情報とランダムなガウスノイズを組み込んで将来の軌跡を生成する条件拡散モデルに基づいている。
以上の結果から,EquiDiffは短期予測では他のベースラインモデルよりも優れているが,長期予測では誤差が若干高いことがわかった。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 13:17:09 GMT)
Emergent communication for AR [11.9] モバイル拡張現実(MAR)におけるコミュニケーションプロトコルを学習するための創発的意味コミュニケーションフレームワークを提案する。
具体的には、修正されたルイス信号ゲームを通して2つのエージェントを訓練し、個別の通信プロトコルを自発的に生成する。
実験により、提案手法は従来のMARの物体認識よりも、見えない物体の一般化が優れていることが示された。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 16:45:39 GMT)
Distributionally Robust Optimization and Invariant Representation
Learning for Addressing Subgroup Underrepresentation: Mechanisms and
Limitations [10.5] サブグループの低表現によって引き起こされる純粋相関は、DNNによって永続できるバイアスの源として注目されている。
本研究は,医用画像分類におけるサブグループ非表現による急激な相関の緩和メカニズムの理解と改善に向けた第一歩である。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 01:55:58 GMT)
Human Behavior-based Personalized Meal Recommendation and Menu Planning
Social System [9.6] 提案するフレームワークには、異なる食事の影響を認識するソーシャル・アフェクティブ・コンピューティング・モジュールが含まれている。
脳波は脳の信号を捉え、それを分析し、食べ物に対する感情を予測できる。
実験結果から, 感情計算, 食事推奨, メニュー計画アルゴリズムは, 様々な評価パラメータで良好に機能することが示唆された。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 12:19:23 GMT)
Answering Unseen Questions With Smaller Language Models Using Rationale
Generation and Dense Retrieval [9.1] スモールランゲージモデルは、質問応答課題に挑戦する上で、強力な推論能力を示すことが示されている。
この設定でさらに改善する2つの方法を評価する。
4億4000万のパラメータしか使用していない1つの最良の推論モデルは、見当たらない評価データセットに対して、強力な比較前のベースラインを大幅に改善します。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 00:02:15 GMT)
Locally differentially private estimation of nonlinear functionals of
discrete distributions [9.0] 離散分布の非線形関数を局所的差分プライバシーの文脈で推定する問題について検討する。
alpha$-locally differentially private (LDP) サンプルのみが公開されているが、'local' という用語は、各$z_i$が1つの個々の$x_i$を使って生成されることを意味する。
パワー和関数 $F_gamma = sum_k=1K p_kgamma$, $gamma > 0$ を $K, n の関数として推定する二次リスクの挙動を記述する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 09:50:20 GMT)
Transforming Graphs for Enhanced Attribute Clustering: An Innovative
Graph Transformer-Based Method [9.0] 本研究では、グラフクラスタリングのためのグラフトランスフォーマーオートエンコーダ(GTAGC)と呼ばれる革新的な手法を提案する。
Graph Auto-EncoderをGraph Transformerでマージすることで、GTAGCはノード間のグローバルな依存関係をキャプチャできる。
GTAGCのアーキテクチャはグラフの埋め込み、オートエンコーダ構造内のグラフ変換器の統合、クラスタリングコンポーネントを含んでいる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 14:37:23 GMT)
Accelerating Relaxation Dynamics in Open Quantum System with Liouvillian
Skin Effect [8.6] 非相互勾配ホッピングを特徴とする非エルミートモデルについて検討する。
このモデルにおける緩和時間は、リウヴィリアの皮膚効果に関連する関係によって説明できない。
これらの知見により,サイドバンド構造を持つ原子系において,この非エルミートモデルを実現するための理論的アプローチを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 08:41:48 GMT)
Greybox Fuzzing of Distributed Systems [8.6] Malloryは、分散システムのグレーボックスファズテストのための最初のフレームワークである。
Jepsenのような一般的なブラックボックスの分散システムファッザとは異なり、Malloryは適応性がある。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 13:11:24 GMT)
Dealing with Small Annotated Datasets for Deep Learning in Medical
Imaging: An Evaluation of Self-Supervised Pre-Training on CT Scans Comparing
Contrastive and Masked Autoencoder Methods for Convolutional Models [8.3] 医用画像の深層学習は、診断ミスのリスクを最小限に抑え、放射線医の作業量を減らし、診断を加速する可能性がある。
このようなディープラーニングモデルのトレーニングには,すべてのトレーニングサンプルに対するアノテーションを備えた,大規模かつ正確なデータセットが必要です。
この課題に対処するために、ディープラーニングモデルは、自己教師付き学習の分野からのメソッドを使用してアノテーションなしで、大規模な画像データセット上で事前トレーニングすることができる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 11:31:01 GMT)
Efficient 3D Semantic Segmentation with Superpoint Transformer [7.7] 大規模3次元シーンの効率的なセマンティックセマンティックセグメンテーションのための新しいスーパーポイントベースのトランスフォーマーアーキテクチャを提案する。
提案手法では,高速アルゴリズムを用いて点雲を階層的なスーパーポイント構造に分割し,前処理を既存手法の7倍高速にする。
我々のモデルは、S3DISデータセットの折りたたみに3時間で1つのGPUでトレーニングできます。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 09:55:56 GMT)
Performance Prediction for Multi-hop Questions [7.4] オープンドメイン型マルチホップ質問の性能を予測するための検索前手法であるmultHPを提案する。
評価の結果,提案モデルが従来のシングルホップQPPモデルよりも優れた性能を示すことが示唆された。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 01:34:41 GMT)
ADRMX: Additive Disentanglement of Domain Features with Remix Loss [7.2] ドメインの一般化は、新しい目に見えないドメインに一般化できる堅牢なモデルを作成することを目的としている。
本稿では,Remix Lossによるドメイン特徴の付加的分散という新しいアーキテクチャについて述べる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 17:52:21 GMT)
Can Unstructured Pruning Reduce the Depth in Deep Neural Networks? [6.5] プルーニングは、パフォーマンスを維持しながら、ディープニューラルネットワークのサイズを減らすために広く使われているテクニックである。
本研究では,深層ニューラルネットワークのサイズを減らし,その性能を保ちつつ,革新的なエントロピー誘導型プルーニングアルゴリズムであるEGPを紹介する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 17:27:49 GMT)
Bio-SIEVE: Exploring Instruction Tuning Large Language Models for
Systematic Review Automation [6.5] LLM(Large Language Models)は、医学的体系的レビューのための文献スクリーニングをサポートすることができる。
私たちのベストモデルであるBio-SIEVEは、ChatGPTとトレーニングされた伝統的なアプローチの両方より優れています。
バイオSIEVEは, バイオメディカル・システマティック・レビューのプロセスにおいて, LLMを専門化するための重要なステップであると考えている。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 16:56:55 GMT)
Sample-Specific Debiasing for Better Image-Text Models [6.3] 画像テキストデータに基づく自己教師付き表現学習は、画像分類、視覚的接地、相互モーダル検索などの重要な医学的応用を促進する。
1つの一般的なアプローチは、意味論的に類似した(肯定的な)および異種(否定的な)データポイントの対を対比することである。
トレーニングデータセットから一様に負のサンプルを描画すると、偽の負、すなわち、異種として扱われるが同一のクラスに属するサンプルが導入される。
医療データでは、基礎となるクラス分布は不均一であり、偽陰性は高い変動率で起こることを意味する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 15:44:27 GMT)
Time-varying Signals Recovery via Graph Neural Networks [6.2] 時間変動グラフ信号の回復のための時間グラフニューラルネットワーク(TimeGNN)を提案する。
本アルゴリズムは,平均二乗誤差関数とソボレフ滑らか度演算子からなる特殊損失を持つエンコーダデコーダアーキテクチャを用いる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 22:47:28 GMT)
Transparent Shape from a Single View Polarization Image [6.2] 本稿では,一視点偏光画像から透明表面を推定する学習手法を提案する。
従来の偏光法(SfP)法では、固有の透過干渉が物理に基づく事前の信頼性を大幅に低下させるため、透明な形状を推定することが困難である。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 11:52:29 GMT)
Mismatching-Aware Unsupervised Translation Quality Estimation For
Low-Resource Languages [6.0] XLMRScoreは、XLM-RoBERTa (XLMR)モデルで計算されたBERTScoreの言語間対応である。
WMT21QE共有タスクの4つの低リソース言語対に対して提案手法を評価する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 10:59:56 GMT)
Understanding the Social Context of Eating with Multimodal Smartphone
Sensing: The Role of Country Diversity [5.8] 本研究は,8カ国678人の大学生を対象に,約24Kの自己申告データを収集した。
分析の結果,食事イベントにおけるスマートフォンの利用状況は各国で類似しているが,各国に特有の傾向がみられた。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 20:31:22 GMT)
An Industrial Case Study on Test Cases as Requirements [5.7] アジャイルプロジェクトは、要件の弱いエンジニアリングがプロジェクトの失敗の既知の原因である場合、"要件なしで"成功できる、という誤解があります。
テストケースが要件の役割を果たす方法を理解するために、3つの企業でこのアジャイルプラクティスを調査しました。
この調査結果は、考慮すべき課題を含む、アジャイル開発における要件の役割をどのように満たすかについての洞察を提供する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 09:06:22 GMT)
Flexible Keyword Spotting based on Homogeneous Audio-Text Embedding [5.7] 音声対応テキストエンコーダを用いて任意のキーワードを効率的に検出する新しいアーキテクチャを提案する。
テキストエンコーダは,G2Pモデルを用いてテキストを音素に変換し,代表音素ベクトルを用いた埋め込みに変換する。
実験結果から, この手法は, Libriphrase のハードデータセット上での最先端の結果よりも優れていた。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 05:41:15 GMT)
A One-dimensional HEVC video steganalysis method using the Optimality of
Predicted Motion Vectors [5.7] 本稿では,1次元の予測MVの最適性に基づくステガナリシス特性を提案する。
ステガノグラフィー手法は,カバービデオとステゴビデオの区別を正確に行うことができる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 04:51:04 GMT)
Multiclass Learnability Does Not Imply Sample Compression [5.3] 仮説クラスはサンプル圧縮スキームを認め、もしクラスから仮説によってラベル付けされた全てのサンプルに対して、小さなサブサンプルのみを保持することができる。
サンプル圧縮に関する類似文は、多クラス仮説クラスには当てはまらないことを示す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 00:26:08 GMT)
Sensitivity-Aware Mixed-Precision Quantization and Width Optimization of
Deep Neural Networks Through Cluster-Based Tree-Structured Parzen Estimation [5.2] 本稿では,個々のニューラルネットワーク層に対して最適なビット幅と層幅を自動的に選択する革新的な探索機構を提案する。
これにより、ディープニューラルネットワークの効率が著しく向上する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 00:16:51 GMT)
Ground Truth Or Dare: Factors Affecting The Creation Of Medical Datasets
For Training AI [5.1] アノテーションが作成される前に、医療領域におけるデータセット作成に関わる課題について説明する。
3つの保健医療機関での作業に基づいて、医療データセット作成プロセスを規定する5つの外部および内部要因について説明する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 13:15:43 GMT)
Not So Robust After All: Evaluating the Robustness of Deep Neural
Networks to Unseen Adversarial Attacks [5.0] ディープニューラルネットワーク(DNN)は、分類、認識、予測など、さまざまなアプリケーションで注目を集めている。
従来のDNNの基本的属性は、入力データの修正に対する脆弱性である。
本研究の目的は、敵攻撃に対する現代の防御機構の有効性と一般化に挑戦することである。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 05:21:34 GMT)
Performance Analysis for Resource Constrained Decentralized Federated
Learning Over Wireless Networks [4.8] 分散連合学習(DFL)は、通信オーバーヘッドと中央サーバへの依存を著しく引き起こす可能性がある。
本研究では、無線ネットワーク上の異なる通信方式(デジタルおよびアナログ)を用いて、資源制約付きDFLの性能を分析し、通信効率を最適化する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 07:56:48 GMT)
With a Little Help from the Authors: Reproducing Human Evaluation of an
MT Error Detector [4.6] 本研究は,Vamvas and Sennrich (2022) の論文で提示された人体評価実験の結果を再現し, オーバートランスレーションとアンダートランスレーションを検出する自動システムの評価を行った。
著者らが提供したドキュメンテーションやコードの品質は高いが、正確な実験的なセットアップを再現し、改善のためのレコメンデーションを提供する際に見つかったいくつかの問題について議論する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 11:00:59 GMT)
A new solution and concrete implementation steps for Artificial General
Intelligence [4.3] 介護、家計、農業生産、自動車運転、試行錯誤など、実際の環境と対話する必要がある分野は高価である。
本稿では,大規模モデルの技術的経路の限界を解析し,これらの制限に対処し,解決策を提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 13:31:02 GMT)
DFM-X: Augmentation by Leveraging Prior Knowledge of Shortcut Learning [4.0] 本稿では,周波数ショートカットに関する知識を活用するデータ拡張戦略DFM-Xを提案する。
我々は,あるクラスの学習画像をランダムに選択し,他のクラスのDFMに含まれる周波数を保持することによって処理する。
実験の結果,DFM-Xは一般的な汚職や敵攻撃に対する堅牢性を向上することが示された。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 17:39:10 GMT)
Asymptotic Bounds for Smoothness Parameter Estimates in Gaussian Process
Interpolation [3.9] マタン核の滑らかさは、大きなデータ限界におけるモデルの多くの重要な性質を決定する。
我々は,滑らか度パラメータの最大推定値が真理の下では過小評価できないことを証明した。
最大推定は、コンパクトに支持された自己相似関数のクラスにおける真の滑らかさを回復することを示す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 13:39:14 GMT)
Three Ways of Using Large Language Models to Evaluate Chat [3.8] 本稿では,DSTC 11 Track 4コンペティションであるChatEvalのチーム6が提出したシステムについて述べる。
大規模言語モデル(LLM)に基づく応答のターンレベル品質を予測するための3つのアプローチを提案する。
本稿では,ChatGPTのプロンプトのためのベクトルストアからの動的少数ショット例を用いて,ベースラインの改善を報告する。
チャレンジ期限後に行われたアブレーション調査は、新しいLlama 2モデルがChatGPTとオープンソースのLLMのパフォーマンスギャップを埋めていることを示している。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 08:34:15 GMT)
Many-body physics of spontaneously broken higher-rank symmetry: from
fractonic superfluids to dipolar Hubbard model [3.8] フラクトニック超流体(英: Fractonic superfluid)は、ボソンが移動性の制約を受ける物質のエキゾチックな相である。
本稿では,このような系における自発対称性の破れの理論に関するエキサイティングな展開を紹介する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 07:59:06 GMT)
Decidability of Querying First-Order Theories via Countermodels of
Finite Width [3.7] 本稿では、幅広い論理的包含問題の決定可能性を確立するための一般的な枠組みを提案する。
幅有限有限普遍モデル集合を示す論理を同定し、幅広い準同型クローズドクエリに対して決定可能なエンテーメントを保証する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 14:38:53 GMT)
TongueSAM: An Universal Tongue Segmentation Model Based on SAM with
Zero-Shot [3.4] 舌分節はTCM舌の自動診断の第一段階である。
TongueSAM は SAM (Segment Anything Model) に基づく普遍的舌分割モデルである
オブジェクト検出に基づくプロンプトジェネレータをSAMに統合し、エンドツーエンドの自動舌分割法を実現する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 02:38:43 GMT)
From the digital twins in healthcare to the Virtual Human Twin: a
moon-shot project for digital health research [3.4] このポジションペーパーは仮想人間双対の開発のための概念的基礎を定めている。
VHTインフラストラクチャは、学術研究者、公共機関、バイオメディカル産業の促進を目的としている。
本論文は,合意プロセスの出発点として,利害関係者全員に武器を求めることを意図している。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 06:35:53 GMT)
Universal approach to deterministic spatial search via alternating
quantum walks [2.9] 本稿では,量子ウォークを交互に組み合わせることで,様々なグラフ上で決定論的量子探索アルゴリズムを設計するための新しいアプローチを提案する。
我々のアプローチは、異なるグラフに対してインスタンス固有の分析を必要としないため、普遍的である。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 07:43:26 GMT)
4DRVO-Net: Deep 4D Radar-Visual Odometry Using Multi-Modal and
Multi-Scale Adaptive Fusion [2.9] 4次元(4D)レーダー-視覚計測(4DRVO)は4次元レーダーとカメラの補完情報を統合している。
4DRVOは4Dレーダーポイント雲の空隙による追跡誤差が顕著である可能性がある。
本稿では,4次元レーダ・ビジュアル・オドメトリーの手法である4DRVO-Netを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 14:00:09 GMT)
A Deep Learning Framework for Generation and Analysis of Driving
Scenario Trajectories [2.9] 本研究では,運転シナリオトラジェクトリの生成と解析のための統合型ディープラーニングフレームワークを提案する。
本研究では,フィールド内データ収集から得られた実世界のシナリオトラジェクトリにおけるフレームワークの性能について実験的に検討する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 20:42:08 GMT)
Smart Knowledge Transfer using Google-like Search [2.8] 本稿では,アプリケーションの様々な側面に関する知識を意味グラフとして抽出し,統合する検索フレームワークを提案する。
このグラフは、構文とセマンティッククエリをサポートし、プログラム理解の過程をエム検索のような検索問題に変換する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 23:38:34 GMT)
A Domain-adaptive Physics-informed Neural Network for Inverse Problems
of Maxwell's Equations in Heterogeneous Media [2.8] ヘテロジニアスメディアにおけるマクスウェル方程式の逆問題を解決するために,ドメイン適応型PINN(da-PINN)を提案する。
まず,領域全体を複数のサブドメインに分解するメディアインタフェースの位置パラメータを提案する。さらに,電磁インタフェース条件を損失関数に組み込んで,インターフェース近傍での予測性能を向上させる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 02:14:52 GMT)
Genetic heterogeneity analysis using genetic algorithm and network
science [2.6] ゲノムワイド・アソシエーション(GWAS)は、疾患に感受性のある遺伝的変数を同定することができる。
遺伝的効果に絡み合った遺伝的変数は、しばしば低い効果サイズを示す。
本稿では,FCSNet(Feature Co-Selection Network)という,GWASのための新しい特徴選択機構を提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 01:28:26 GMT)
Transport, Variational Inference and Diffusions: with Applications to
Annealed Flows and Schr\"odinger Bridges [2.4] 本稿では,最適輸送と変分推論の関連について検討する。
本稿では,経路空間上の発散に着目したサンプリングおよび生成モデリングのための原理的かつ体系的な枠組みを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 19:49:40 GMT)
Equilibration of Isolated Systems: investigating the role of
coarse-graining on the initial state magnetization [2.0] 初期状態の磁化における分解能の欠如や粗粒化の影響について検討する。
本研究は,量子系の平衡力学における初期状態準備の重要な役割を明らかにする。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 18:05:05 GMT)
A Conceptual Architecture for a Quantum-HPC Middleware [1.8] 量子コンピューティングは、古典的なコンピュータよりも高速に計算に複雑な問題を解くことによって、科学と産業の可能性を約束する。
規模が大きくなるにつれ、量子古典コンピューティングの効率的な結合を促進するシステムが重要になってきている。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 16:48:56 GMT)
A Sequential Meta-Transfer (SMT) Learning to Combat Complexities of
Physics-Informed Neural Networks: Application to Composites Autoclave
Processing [1.6] PINNは非線形偏微分方程式の解法として人気がある。
PINNは、与えられたPDEシステムの特定の実現を近似するように設計されている。
新しいシステム構成に効率的に適応するために必要な一般化性は欠如している。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 02:46:54 GMT)
A Proposed Quantum Hamiltonian Encoding Framework for Time Evolution
Operator Design of Potential Energy Function [1.2] この研究は、量子化学と凝縮物質物理学にまたがる応用のためのポテンシャルエネルギー関数による時間進化の操作について検討する。
アルゴリズムはシミュレータとIBM量子ハードウェアで実装され、その有効性を証明した。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 07:37:42 GMT)
CoverNav: Cover Following Navigation Planning in Unstructured Outdoor
Environment with Deep Reinforcement Learning [1.0] オフロード地形やジャングル環境における隠蔽およびナビゲート可能な軌道を識別するための,Deep Reinforcement Learning に基づく新しいアルゴリズム CoverNav を提案する。
CoverNavは、ロボットエージェントが報酬関数を使って低い標高の地形を学習するのを助ける。
また,カバーナブの最大目標距離12mと,カバーオブジェクトの有無による異なる標高シナリオにおける成功率について検討した。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 15:19:49 GMT)
Testing System Intelligence [0.9] 私たちは、置換テストに合格するインテリジェントシステムの構築には、現在のAIの範囲外にある一連の技術的な問題が含まれる、と論じています。
我々は,人間と機械のスキルの相補性に基づく代替テストが,多種多様な知能概念につながることを示唆する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 07:19:20 GMT)
Deep Learning Approaches on Image Captioning: A Review [0.6] 画像キャプションは、静止画像の形で視覚コンテンツのための自然言語記述を生成することを目的としている。
ディープラーニングとビジョン言語による事前学習技術がこの分野に革命をもたらし、より洗練された手法と性能の向上につながった。
この分野で直面している課題は、対象の幻覚、欠落した文脈、照明条件、文脈理解、参照表現といった課題を強調することで解決する。
画像とテキストのモダリティ間の情報不一致問題への対処、データセットバイアスの軽減、字幕生成を向上するための視覚言語事前学習手法の導入、精度向上のための評価ツールの開発など、この分野における研究の今後の方向性について検討する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 16:59:44 GMT)
Decentralised Service Allocation using Blockchain [0.5] PropTechは短期不動産賃貸の新しいカテゴリーだ。
一部の大手企業は、業界全体を中央集権的にコントロールしている。
トランザクションを実行し、ブロックチェーン上で秩序を満たすことによって、エコシステムをより透明性と分散化することができる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 12:37:22 GMT)
Advances in Self-Supervised Learning for Synthetic Aperture Sonar Data
Processing, Classification, and Pattern Recognition [0.4] 本稿では,SASデータ処理,分類,パターン認識に自己教師付き学習を活用するMoCo-SASを提案する。
実験の結果,MoCo-SASは従来の教師あり学習法よりも優れていた。
これらの知見は、SASデータ処理における最先端の進歩におけるSSLの可能性を強調し、水中物体の検出と分類を強化するための有望な道を提供する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 20:59:39 GMT)
On the fragility of gate-error metrics in simulation models of
flux-tunable transmon quantum computers [0.3] 精度の欠如は、平均不忠実度やダイヤモンド距離といったゲートエラーの指標によって定量化されることが多い。
本稿では,これらの問題をフラックス可変トランスモンとカップリング共振器を用いた量子コンピュータの現実シミュレーションモデルを用いて検討する。
本研究の主目的は,(1)ゲートエラー指標がモデル上の多くの仮定に影響されていること,(2)連続ゲートエラーが線形に蓄積されないこと,(3)ゲートエラー指標が連続ゲートの性能予測に弱いこと,である。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 15:09:46 GMT)
An Efficient Quantum Factoring Algorithm [0.3] 我々は、$tildeO(n3/2)$の量子回路を独立に実行することで、$n$bit整数を分解できることを示した。
アルゴリズムの正しさは、指数的古典的因数分解アルゴリズムで使われるものに似た数論的な仮定に依存する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 13:57:38 GMT)
Learning Abstract Visual Reasoning via Task Decomposition: A Case Study
in Raven Progressive Matrices [0.2] Raven Progressive Matrices(source)では、タスクは、与えられたコンテキストで利用可能な答えの1つを選択することである。
本稿では,変換器の青写真に基づく深層学習アーキテクチャを提案する。
自己教師型トレーニングにおいて,視覚入力をトークンにパースする方法と,入力の一部をマスキングするいくつかの方法を検討する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 11:02:21 GMT)
Learning Semantic Text Similarity to rank Hypernyms of Financial Terms [0.2] 本稿では,財務用語のハイパニムを抽出・ランク付けできるシステムを提案する。
このシステムは、DBpediaのような様々な情報源から得られた財務的なテキストコーパスで訓練されている。
負のサンプルでトレーニングセットを増強するために、新しいアプローチが使用されている。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 23:51:53 GMT)
Efficient Guided Generation for Large Language Models [0.2] 本稿では, 有限状態マシンの状態間の遷移の観点から, ニューラルテキスト生成の問題を構成的に再構成する方法を示す。
このフレームワークは、正規表現と文脈自由文法でテキスト生成を導くための効率的なアプローチをもたらす。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 21:09:44 GMT)
Volterra Accentuated Non-Linear Dynamical Admittance (VANYA) to model
Deforestation: An Exemplification from the Amazon Rainforest [0.0] アルゴリズム学習は神経科学、遺伝学、人間とコンピュータの相互作用といった先進的な分野を持っている。
本稿では,プレデター・プレイ・ダイナミクスを取り入れたVANYAモデルを用いて森林の損失をモデル化することに焦点を当てる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 05:28:49 GMT)
Verification of Quantum Stable Sources [0.0] 我々は、マルコフ状態(Markov state)と呼ばれる非i.i.d.ソースに由来する状態の族を紹介する。
定理 1 において、これらの状態は変化元上のテンソル積とよく説明されていないことを証明している。
定理2では、さらに2つのマルコフ状態の間のトレース距離の低い境界を与える。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 14:59:36 GMT)
Tiny and Efficient Model for the Edge Detection Generalization [0.0] 提案するTiny and Efficient Edge Detector(TEED)は,パラメータが5,8Kドルの軽量畳み込みニューラルネットワークである。
BIPEDデータセットのトレーニングには30分以上かかり、各エポックは5分未満である。
提案したモデルは訓練が容易で,予測されたエッジマップはクオリティが高く,初期のごく一部のエポック内に急速に収束する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 05:23:36 GMT)
Surpassing spectator qubits with photonic modes and continuous
measurement for Heisenberg-limited noise mitigation [0.0] ノイズは、脆弱な量子状態の生成と保存に常に挑戦している。
近年の研究では、スペクトル量子ビットを用いたノイズ緩和のための資源として、空間雑音相関が利用できることが示唆されている。
工学的な散逸を用いて、スペクトルモードのノイズ緩和を完全自律的に行うことができることを示す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 04:39:27 GMT)
Software refactoring and rewriting: from the perspective of code
transformations [0.0] マイクロパス/ナノパスコンパイラのアイデアを借りることができます。
ソフトウェアのプロシージャをコードを構成するものとして扱うことで、その正確さを手作業で分析できるように、プロセスの表現を十分に短くすることが可能になる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 17:11:54 GMT)
Polyp-SAM++: Can A Text Guided SAM Perform Better for Polyp
Segmentation? [0.0] テキストプロンプト支援SAMであるPolyp-SAM++は、堅牢でより正確なPolypセグメンテーションのために、テキストプロンプトを使用してSAMをより有効に利用できる。
我々は、ベンチマークデータセット上でのポリプセグメンテーションタスクにおいて、テキスト誘導SAMの性能を評価する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 17:45:39 GMT)
Out-of-distribution multi-view auto-encoders for prostate cancer lesion
detection [0.0] Unsupervised Out-of-Distribution (OOD) 検出は、アノテーションの少ないデータを必要とする代替手段である。
OOD の応用は、医学データに一般的に見られるクラススキューネスを利用する。
OODアプローチにおけるPCa病変検出の性能向上のために,異なるT2w方向に対応するマルチストリーム手法を提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 06:33:04 GMT)
Optimal Generators for Quantum Sensing [0.0] 与えられた量子状態を用いた最大感度は、量子フィッシャー情報行列(QFIM)の最大固有値によって決定されることを示す。
状態準備プロトコルに焦点をあてるのではなくパラメータ符号化のプロセスを最適化するため、我々の手法はあらゆる量子センサに関係している。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 02:12:25 GMT)
On Cooperative Coevolution and Global Crossover [0.0] フィットネスランドスケープのよく知られたNKモデルを用いて、基礎となるフィットネスランドスケープの頑丈さに対するグローバルクロスオーバーの様々な側面の影響を探索する。
その結果、最も広く使われているCCEAよりも改善が示唆され、他のよく知られたテスト関数を使ってさらに実証された。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 14:41:11 GMT)
Neural Latent Aligner: Cross-trial Alignment for Learning
Representations of Complex, Naturalistic Neural Data [0.0] そこで本稿では, 複雑な振る舞いをよく拘束し, 行動に関連のある神経表現を見つけるために, 教師なし学習フレームワークNeural Latent Aligner(NLA)を提案する。
提案するフレームワークは, ベースラインよりも地上横断的な一貫した表現を学習し, 可視化すると, 試行錯誤による共有神経軌道が明らかにされる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 02:35:24 GMT)
Multicomponent spin mixtures of two-electron fermions [0.0] 内在的なSU($N$)相互作用対称性を持つアルカリ-アース原子のフェルミオン同位体の場合について論じる。
いくつかの研究方針が提示され、光学格子中の173ドルYb原子の核-スピン混合物を用いてフィレンツェで行われた実験に焦点が当てられる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 15:07:46 GMT)
Leveraging multi-view data without annotations for prostate MRI
segmentation: A contrastive approach [0.0] U-Net, tU-Net (triplet U-Net) に基づくトリプルトエンコーダとシングルデコーダネットワークを提案する。
提案アーキテクチャでは,非注釈の矢状図とコロナ図を対照的な学習によって活用し,ボリュームの観点からセグメンテーションを改善することができる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 06:07:47 GMT)
LadleNet: Translating Thermal Infrared Images to Visible Light Images
Using A Scalable Two-stage U-Net [0.0] U-Netアーキテクチャに基づくアルゴリズムであるLadleNetを導入する。
LadleNetは2段階のU-Net結合構造を採用し、スキップ接続と洗練された機能集約技術で拡張されている。
本稿では,LadleNetのHandleモジュールを事前トレーニングしたDeepLabv3+ネットワークに置き換えるLadleNet+を提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 16:14:44 GMT)
Jordan Decomposition of Non-Hermitian Fermionic Quadratic Forms [0.0] フェルミオン性フェルミオンリウビリアンの分解の零部分について、Prosen [Prosen T 2010 J. Stat. Mech. $textbf2010$ P07020] による Conjecture 3.1 の厳密な証明を与える。
また、各大きさのジョーダンブロックの数は、$q$-二項係数の係数で表せることを示す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 15:43:50 GMT)
Improved YOLOv8 Detection Algorithm in Security Inspection Image [0.0] 本稿では,X線画像検出の過程において,重なり合う検出対象,反帯域の誤検出,誤検出の問題点について述べる。
YOLOv8sに基づく改良されたX線対バンド検出アルゴリズムCSS-YOLOを提案する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 03:13:38 GMT)
Engineering Floquet codes by rewinding [0.0] フロッケ符号は動的に生成された論理量子ビットを持つ量子誤り訂正符号である。
本稿では,各期間に再帰する計測スケジュールを持つFloquet符号の新たな例を示す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 21:25:17 GMT)
Digital elevation model correction in urban areas using extreme gradient
boosting, land cover and terrain parameters [0.0] 南アフリカのケープタウン上空で2台の中分解能30m DEMの精度を高めるために, 極勾配促進(XGBoost)アンサンブルアルゴリズムを採用した。
トレーニングデータセットは、標高、都市フットプリント、斜面、アスペクト、表面粗さ、地形位置指数、地形粗さ指数、地形表面テクスチャ、ベクトル粗さ測定、森林被覆、裸地被覆を含む11の予測変数からなる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 12:03:31 GMT)
Diffusive modes of two-band fermions under number-conserving dissipative
dynamics [0.0] 駆動散逸性プロトコルは、非自明な量子多体相関状態の制御と生成のために提案される。
粒子数保存散逸力学における拡散モードの存在を示す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 12:52:56 GMT)
Coherently excited nonlocal quantum features using
polarization-frequency correlation between quantum erasers [0.0] 光子不明瞭性は、量子力学における波動-粒子双対性の観点から、謎の量子的特徴を理解するために不可欠な概念である。
ここでは、ポアソン分散光子対の偏光周波数相関に基づく非局所相関に純粋コヒーレンスアプローチを適用する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 04:09:20 GMT)
Automated COVID-19 CT Image Classification using Multi-head Channel
Attention in Deep CNN [0.0] 新型コロナウイルスのCTスキャン自動分類のための新しい深層学習手法を提案する。
新しく設計されたチャネルアテンション機構と重み付きグローバル平均プールを組み込んだ改良型Xceptionモデルを提案する。
広く使われている新型コロナウイルスのCTスキャンデータセットの実験は96.99%の精度を示し、他の最先端技術よりも優れていることを示している。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 17:50:45 GMT)
Artificial intelligence and biological misuse: Differentiating risks of
language models and biological design tools [0.0] AIツールの2つのクラスは、大きな言語モデル(LLM)と生物学的デザインツール(BDT)という、このようなバイオセキュリティリスクを生じさせる。
BDTはパンデミックの病原体を今までにないほど悪化させる可能性がある。
リスク軽減に欠かせないことは、遺伝子合成産物の普遍的および強化されたスクリーニングである。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 12:08:56 GMT)
Analyzing Robustness of the Deep Reinforcement Learning Algorithm in
Ramp Metering Applications Considering False Data Injection Attack and
Defense [0.0] ランプメータリング(英語: Ramp metering)は、高速道路の本線への車両の走行を制御する行為である。
深部Q-Learningアルゴリズムは,ループ検出情報のみを入力として利用する。
モデルは、道路のジオメトリーやレイアウトに関わらず、ほぼすべてのランプ計測サイトに応用できる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 22:33:50 GMT)
An alternative foundation of quantum theory [0.0] 本稿では,量子論の新しいアプローチを提案する。
基礎はまず理論変数とされ、アクセス可能あるいはアクセス不能な変数である。
アクセス可能な理論変数に対応する演算子を導出する。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 08:02:47 GMT)
A survey of universal quantum von Neumann architecture [0.0] 我々は、最近提案された量子フォン・ノイマンアーキテクチャのモデルについて、実用的で広範な設定で研究する。
我々は、量子CPUと量子制御ユニットの構造を分析し、それらの接続を計算上の利点で引き出す。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 17:23:53 GMT)
A Secure Open-Source Intelligence Framework For Cyberbullying
Investigation [0.0] 本稿では,Twitterのデータを用いたオープンソースのインテリジェンスパイプラインを提案する。
リアルタイム監視を備えたOSINTダッシュボードは、法執行機関が迅速に行動し、被害者を保護し、より安全なオンライン環境を構築するための大きな努力をすることができる。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 02:26:25 GMT)
4-bit Factorization Circuit Composed of Multiplier Units with
Superconducting Flux Qubits toward Quantum Annealing [0.0] 素因数分解(P = M*N)は量子計算における有望な応用であると考えられている。
超伝導フラックス量子ビットを用いた量子アニールの4ビット分解実験を行った。
論文参考訳(メタデータ) (Sat, 12 Aug 2023 13:24:46 GMT)