WizardMath: Empowering Mathematical Reasoning for Large Language Models
via Reinforced Evol-Instruct [128.9] 本稿では,Llama-2の数学的推論能力を向上するWizardMathを提案する。
GSM8kではChatGPT-3.5, Claude Instant-1, PaLM-2, Minervaを上回り, 同時にMATHでは Text-davinci, PaLM-1, GPT-3 を上回ります。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:23:21 GMT)
RLCD: Reinforcement Learning from Contrast Distillation for Language
Model Alignment [128.7] コントラスト蒸留による強化学習(Reinforcement Learning from Contrast Distillation, RLCD)は、人間のフィードバックを使わずに自然言語の原則に従うために言語モデルを整列させる手法である。
RLCDは、高品質と低品質の両方の例を含むシミュレーションされた選好ペアを使用して、選好モデルを訓練する。
次に、嗜好モデルを用いて、強化学習によるベースアンアライメント言語モデルを改善する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:16:51 GMT)
What does CLIP know about a red circle? Visual prompt engineering for
VLMs [116.9] テキストの代わりに画像空間を編集することで、分類を超えたコンピュータビジョンタスクを解くための視覚的プロンプトエンジニアリングのアイデアを探求する。
キーポイントのローカライゼーションタスクにおけるゼロショット参照表現の理解と強力な性能を両立させることにより,このシンプルなアプローチのパワーを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:49:47 GMT)
Invariant Training 2D-3D Joint Hard Samples for Few-Shot Point Cloud
Recognition [108.1] 我々は,従来の3次元モデルとよく訓練された2次元モデルとの合同予測を用いて,少数の3次元物体の雲認識におけるデータ不足問題に取り組む。
異なるラベルに対して高い信頼性の予測を行う'結合型ハードサンプル'のトレーニングは、クラックがより効果的でないことが分かりました。
InvJointと呼ばれる提案した不変トレーニング戦略は、ハードサンプルに重点を置いているだけでなく、矛盾する2Dと3Dの不明瞭な予測の相違も求めている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:43:12 GMT)
FeDXL: Provable Federated Learning for Deep X-Risk Optimization [105.2] 我々は、既存のアルゴリズムが適用できないXリスクのファミリーを最適化するために、新しい連邦学習(FL)問題に取り組む。
Xリスクに対するFLアルゴリズムを設計する際の課題は、複数のマシンに対する目的の非可逆性と、異なるマシン間の相互依存にある。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:18:51 GMT)
SimDA: Simple Diffusion Adapter for Efficient Video Generation [102.9] 本稿では,強力なT2Iモデルの1.1Bパラメータのうち24Mしか微調整せず,パラメータ効率のよいビデオ生成に適応できる簡易拡散適応器(SimDA)を提案する。
野生でのT2V生成に加えて、SimDAは2分間のチューニングでワンショットビデオ編集にも使えるようになった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:58:44 GMT)
PhysDiff: Physics-Guided Human Motion Diffusion Model [101.2] 既存の運動拡散モデルは、拡散過程における物理学の法則をほとんど無視する。
PhysDiffは拡散過程に物理的制約を組み込む。
提案手法は,最先端の動作品質を実現し,身体的可視性を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 19:59:48 GMT)
Diffusion Models for Image Restoration and Enhancement -- A
Comprehensive Survey [97.0] 本稿では,近年の拡散モデルに基づく画像復元手法について概観する。
我々は、赤外線とブラインド/現実世界の両方で拡散モデルを用いて、革新的なデザインを分類し、強調する。
本稿では,拡散モデルに基づくIRの今後の研究に向けた5つの可能性と課題を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:40:38 GMT)
Segmenting Known Objects and Unseen Unknowns without Prior Knowledge [86.5] 全体論的セグメンテーションは、目に見えない未知のカテゴリのオブジェクトを、それに関する事前の知識なしにインスタンスに識別し、分離することを目的としている。
U3HSでは、未知の領域を極めて不確実な領域として見つけ、対応するインスタンス認識の埋め込みを個々のオブジェクトにクラスタ化する。
MS、Cityscapes、Lost&Foundの公開データに関する実験は、U3HSの有効性を実証している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:57:13 GMT)
Enumerating Safe Regions in Deep Neural Networks with Provable
Probabilistic Guarantees [86.1] 安全プロパティとDNNが与えられた場合、安全であるプロパティ入力領域のすべての領域の集合を列挙する。
この問題の #P-hardness のため,epsilon-ProVe と呼ばれる効率的な近似法を提案する。
提案手法は, 許容限界の統計的予測により得られた出力可到達集合の制御可能な過小評価を利用する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:30:35 GMT)
Towards Attack-tolerant Federated Learning via Critical Parameter
Analysis [85.4] フェデレートされた学習システムは、悪意のあるクライアントが中央サーバーに誤ったアップデートを送信すると、攻撃を害するおそれがある。
本稿では,新たな防衛戦略であるFedCPA(Federated Learning with critical Analysis)を提案する。
攻撃耐性凝集法は, 有害局所モデルでは有毒局所モデルでは有毒局所モデルでは有毒局所モデルでは有毒局所モデルでは有毒局所モデルでは有毒局所モデルでは有毒であるのに対し, 類似したトップkおよびボトムk臨界パラメータを持つ。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:37:55 GMT)
Deformable Mixer Transformer with Gating for Multi-Task Learning of
Dense Prediction [84.4] CNNとTransformerには独自の利点があり、MTL(Multi-task Learning)の高密度予測に広く使われている。
本稿では,変形可能なCNNと問合せベースのTransformerの長所を共用したMTLモデルを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:15:25 GMT)
Unsupervised 3D Pose Estimation with Non-Rigid Structure-from-Motion
Modeling [83.8] 本研究では,人間のポーズの変形をモデル化し,それに伴う拡散に基づく動きを事前に設計する手法を提案する。
動作中の3次元人間の骨格を復元する作業は3次元基準骨格の推定に分割する。
混合時空間NASfMformerを用いて、各フレームの3次元基準骨格と骨格変形を2次元観測シーケンスから同時に推定する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:41:57 GMT)
Robust Monocular Depth Estimation under Challenging Conditions [81.6] 最先端のモノクル深度推定手法は、難解な照明や気象条件下では信頼性が低い。
我々はmd4allでこれらの安全クリティカルな問題に取り組む: 単純で効果的なソリューションで、悪条件と理想条件の両方で確実に機能する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:59:01 GMT)
GHN-Q: Parameter Prediction for Unseen Quantized Convolutional
Architectures via Graph Hypernetworks [80.3] 我々は,未知の量子化CNNアーキテクチャのパラメータの予測にグラフハイパーネットを用いることを初めて検討した。
我々は、CNNの探索空間の縮小に着目し、GHN-Qが実際に8ビットの量子化されたCNNの量子化-ロバストパラメータを予測できることを見出した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:26:31 GMT)
A Survey on Large Language Models for Recommendation [80.0] 大規模言語モデル(LLM)は自然言語処理(NLP)の分野で強力なツールとして登場した。
本調査では,これらのモデルを2つの主要なパラダイム(DLLM4Rec)とジェネレーティブLSM4Rec(GLLM4Rec)に分類する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:56:05 GMT)
Long-range Multimodal Pretraining for Movie Understanding [79.6] 本稿では,映画データを利用してトランスファー可能なマルチモーダルエンコーダとクロスモーダルエンコーダを訓練する戦略とモデルを提案する。
私たちのキーとなるアイデアは、長期にわたる関係を観察し、抽出することで、映画のあらゆるモダリティから学ぶことです。
本モデルでは,複数のLVUタスクの最先端化を実現し,従来の作業よりもはるかにデータ効率がよい。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:52:59 GMT)
ALIP: Adaptive Language-Image Pre-training with Synthetic Caption [78.9] コントラスト言語-画像事前学習(CLIP)は、様々な視覚言語タスクのパフォーマンスを大幅に向上させた。
Webデータに固有のノイズと未整合画像テキストペアが存在することは、表現学習のパフォーマンスに影響を与える可能性がある。
本稿では、原文と合成キャプションの両方からの監督を統合するバイパスモデルであるAdaptive Language-Image Pre-Training(ALIP)を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:04:30 GMT)
GiGaMAE: Generalizable Graph Masked Autoencoder via Collaborative Latent
Space Reconstruction [76.4] マスク付きオートエンコーダモデルは、グラフデータに対する優れた一般化能力に欠ける。
本稿では,GiGaMAEと呼ばれる新しいグラフマスマスキングオートエンコーダフレームワークを提案する。
私たちの結果は、グラフ構造化データに基づく基礎モデルの設計に光を当てます。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:30:51 GMT)
DeepAccident: A Motion and Accident Prediction Benchmark for V2X
Autonomous Driving [76.3] 本研究では,現実の運転において頻繁に発生する多様な事故シナリオを含む大規模データセットを提案する。
提案したDeepAccidentデータセットには57Kの注釈付きフレームと285Kの注釈付きサンプルが含まれており、これは大規模なnuScenesデータセットの約7倍である。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:38:06 GMT)
DiffDis: Empowering Generative Diffusion Model with Cross-Modal
Discrimination Capability [76.0] 本稿では,拡散過程下での1つのフレームワークに,モダクティブと差別的事前学習を統一するDiffDisを提案する。
DiffDisは画像生成タスクと画像テキスト識別タスクの両方において単一タスクモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:03:48 GMT)
Masked Spatio-Temporal Structure Prediction for Self-supervised Learning
on Point Cloud Videos [75.9] 人間のアノテーションを使わずにポイントクラウドビデオの構造をキャプチャするMasked-temporal Structure Prediction (MaST-Pre)法を提案する。
MaST-Preは,2つの自己指導型学習タスクから構成される。まず,マスク付きポイントチューブを再構築することにより,ポイントクラウドビデオの出現情報を捉えることができる。
第2に、動作を学習するために、点管内の点数の変化を推定する時間的濃度差予測タスクを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:12:54 GMT)
Point Contrastive Prediction with Semantic Clustering for
Self-Supervised Learning on Point Cloud Videos [71.2] 本稿では,オブジェクト中心およびシーン中心のデータを対象とした一元的クラウドビデオ自己教師型学習フレームワークを提案する。
本手法は、広範囲の下流タスクにおいて教師付きタスクよりも優れる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:17:47 GMT)
A Comprehensive Overview of Large Language Models [70.8] 大規模言語モデル(LLM)は、最近自然言語処理タスクにおいて顕著な機能を示した。
この記事では、この分野の最近の展開について、簡潔かつ包括的に概説する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:53:06 GMT)
G2L: Semantically Aligned and Uniform Video Grounding via Geodesic and
Game Theory [70.8] ジオデシック・ゲーム・ローカライゼーション(Geodesic and Game Localization, G2L)は,ジオデシック・ゲーム理論によるセマンティック・アライメントと均一なビデオグラウンドティング・フレームワークである。
本研究は,モデルが正しいクロスモーダル表現を学習するための測地距離を利用したモーメント間の相関関係を定量化する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:54:20 GMT)
Unlimited Knowledge Distillation for Action Recognition in the Dark [69.2] 既存の知識組み立て手法では、複数の教師モデルからの知識を学生モデルに抽出するために大量のGPUメモリを必要とする。
本稿では,無制限な知識蒸留(UKD)を提案する。
実験の結果,UKDで蒸留した単一ストリームネットワークは2ストリームネットワークを超えていることがわかった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:04:39 GMT)
Machine learning methods for the search for L&T brown dwarfs in the data
of modern sky surveys [67.2] ブラウン・ドワーフ(BD)は、銀河の全ての天体の25%を占めるべきである。
その弱さのため、ブラウン・ドワーフのスペクトル研究は比較的困難である。
多くの試みが、その色を決定規則として使用して茶色の小星を探索し、生成する試みがなされている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:10:29 GMT)
DReg-NeRF: Deep Registration for Neural Radiance Fields [66.7] 我々は,人間の介入なしにオブジェクト中心のアノテートシーンにおけるNeRF登録問題を解くためにDReg-NeRFを提案する。
提案手法は,SOTAポイントクラウド登録方式を大きなマージンで打ち負かす。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:37:49 GMT)
Retro-FPN: Retrospective Feature Pyramid Network for Point Cloud
Semantic Segmentation [65.8] 本稿では,各点特徴量の予測を明示的かつふりかえり的な精錬プロセスとしてモデル化するRetro-FPNを提案する。
その重要な斬新さは、前層から意味コンテキストを要約するレトロ・トランスフォーマーである。
Retro-FPNは最先端のバックボーンよりも性能が大幅に向上することを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:28:25 GMT)
Language-guided Human Motion Synthesis with Atomic Actions [65.6] 本稿では,ATOM (ATomic mOtion Modeling) を提案する。
我々は、学習中に人間の動作を一連の原子行動に合成し、学習した原子行動を用いて新しい動作を組み立てる。
我々は,テキスト・ツー・モーション・シンセサイザーやアクション・ツー・モーション・シンセサイザーなどの広範囲な実験を通して,ATOMの有効性を実証する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:13:03 GMT)
Bridged-GNN: Knowledge Bridge Learning for Effective Knowledge Transfer [65.4] グラフニューラルネットワーク(GNN)は、隣接するノードから情報を集約する。
知識ブリッジ学習(KBL)は、対象ドメインに対する知識強化後部分布を学習する。
Bridged-GNNには、Bridged-Graphを構築するためのAdaptive Knowledge Retrievalモジュールと、Graph Knowledge Transferモジュールが含まれている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:14:51 GMT)
Self-Calibrated Cross Attention Network for Few-Shot Segmentation [65.2] 我々は、パッチベースの効率的なアテンションのために、自己校正型クロスアテンション(SCCA)ブロックを設計する。
SCCAは、同じクエリイメージからのパッチと、サポートイメージからのアライメントパッチをK&Vとしてグループ化する。
このようにして、クエリBG機能はFGをサポートするBG機能と混同され、前述の問題が軽減される。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:41:50 GMT)
An Image is Worth a Thousand Toxic Words: A Metamorphic Testing
Framework for Content Moderation Software [64.4] ソーシャルメディアプラットフォームは、ヘイトスピーチ、悪意のある広告、ポルノなど、有害なコンテンツを拡散するためにますます悪用されている。
コンテンツモデレーション手法の開発と展開に多大な努力を払っているにもかかわらず、悪意のあるユーザは、テキストを画像に埋め込むことでモデレーションを回避することができる。
コンテンツモデレーションソフトウェアのためのメタモルフィックテストフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:33:06 GMT)
Towards Understanding the Generalizability of Delayed Stochastic
Gradient Descent [63.4] 非同期で実行される勾配降下は、大規模機械学習モデルのトレーニングにおいて重要な役割を果たす。
既存の一般化誤差境界は悲観的であり、非同期遅延と一般化の相関を明らかにすることはできない。
我々の理論的結果は、非同期遅延は遅延SGDアルゴリズムの一般化誤差を低減することを示唆している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:00:27 GMT)
ELITE: Encoding Visual Concepts into Textual Embeddings for Customized
Text-to-Image Generation [59.4] 高速かつ正確にカスタマイズされた画像生成のための学習ベースエンコーダを提案する。
提案手法は,高速な符号化処理により,高忠実度インバージョンとより堅牢な編集性を実現する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:12:13 GMT)
Deformer: Dynamic Fusion Transformer for Robust Hand Pose Estimation [59.3] 既存の方法では、手のこもりが強かったり、ぼやけたりすると、手のポーズが難しい場合が多い。
ビデオでは、手の動きによって、片方のフレームに隠されたり、ぼやけたりして、手のさまざまな部分を観察することができる。
画像内の手の部分間の関係を暗黙的に推論するフレームワークであるDeformerを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:20:35 GMT)
Dynamic 3D Gaussians: Tracking by Persistent Dynamic View Synthesis [58.6] 動的シーンビュー合成と6自由度(6-DOF)追跡のタスクを同時に処理する手法を提案する。
我々は、シーンを3Dガウスアンのコレクションとしてモデル化する最近の研究に触発された、分析バイシンセサイザーの枠組みに従う。
我々は,1人称視点合成,動的合成シーン合成,4次元映像編集など,我々の表現によって実現された多数のダウンストリームアプリケーションを紹介した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:59:21 GMT)
Goal Representations for Instruction Following: A Semi-Supervised
Language Interface to Control [58.1] 本稿では,少数の言語データのみを用いて,共同画像と目標条件のポリシーを言語と併用する手法を提案する。
本手法は,言語を目標画像と一致させないラベル付きデータから埋め込みを学習することにより,実世界のロバストな性能を実現する。
ラベル付きデータの外部の言語命令に一般化して,様々な操作タスクをさまざまな場面で追従する命令を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 00:47:00 GMT)
Lip Reading for Low-resource Languages by Learning and Combining General
Speech Knowledge and Language-specific Knowledge [57.4] 本稿では,特に低リソース言語を対象とした新しい唇読解フレームワークを提案する。
低リソース言語は、そのモデルを訓練するのに十分なビデオテキストペアデータを持っていないため、低リソース言語のための唇読解モデルを開発するのは難しいと考えられている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:19:03 GMT)
SUR-adapter: Enhancing Text-to-Image Pre-trained Diffusion Models with
Large Language Models [56.9] 本研究では,事前学習拡散モデルに対するセマンティック・アダプタ (SUR-adapter) と呼ばれる簡易なパラメータ効率の良い微調整手法を提案する。
ユーザエクスペリエンスの向上により,テキストから画像への拡散モデルの使いやすさが向上する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:13:46 GMT)
CARLA: A Self-supervised Contrastive Representation Learning Approach
for Time Series Anomaly Detection [56.7] 本稿では,時系列データ中の異常パターンを識別する,革新的なエンドツーエンドの自己組織化フレームワークを提案する。
コントラスト表現学習を活用することで、CARLAは時系列ウィンドウのロバスト表現を効果的に生成する。
本研究は,時系列異常検出の分野でのコントラスト表現学習の可能性を強調した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:45:56 GMT)
Object Detection in Hyperspectral Image via Unified Spectral-Spatial
Feature Aggregation [55.9] S2ADetは、高スペクトル画像に固有の豊富なスペクトル情報と空間補完情報を利用する物体検出器である。
S2ADetは既存の最先端メソッドを超え、堅牢で信頼性の高い結果を達成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:27:27 GMT)
HumanLiff: Layer-wise 3D Human Generation with Diffusion Model [55.9] 既存の3D生成モデルは、主に1回のパスで、検出不能な3Dモデルとして、着物付き3D人間を生成する。
拡散過程を統一した第1層の3次元人間生成モデルであるHumanLiffを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:59:04 GMT)
Guide3D: Create 3D Avatars from Text and Image Guidance [55.7] Guide3Dは拡散モデルに基づく3Dアバター生成のためのテキスト・画像誘導生成モデルである。
我々のフレームワークは、トポロジカルかつ構造的に正しい幾何と高分解能なテクスチャを生成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:55:47 GMT)
Human Part-wise 3D Motion Context Learning for Sign Language Recognition [54.8] 本稿では,手話認識のためのP3Dを提案する。
我々の主な貢献は、パートワイズ動作の文脈を学習し、ポーズアンサンブルを用いて2Dと3Dのポーズを併用することである。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:01:52 GMT)
Diffusion Variational Autoencoder for Tackling Stochasticity in
Multi-Step Regression Stock Price Prediction [54.2] 長期的地平線上での多段階の株価予測は、ボラティリティの予測に不可欠である。
多段階の株価予測に対する現在の解決策は、主に単一段階の分類に基づく予測のために設計されている。
深層階層型変分オートコーダ(VAE)と拡散確率的手法を組み合わせてセック2seqの株価予測を行う。
本モデルでは, 予測精度と分散性の観点から, 最先端の解よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:21:15 GMT)
Self-supervised Character-to-Character Distillation for Text Recognition [54.1] そこで本研究では,テキスト表現学習を容易にする汎用的な拡張を可能にする,自己教師型文字-文字-文字間蒸留法CCDを提案する。
CCDは、テキスト認識の1.38%、テキストセグメンテーションの1.7%、PSNRの0.24dB、超解像の0.0321(SSIM)で、最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:34:03 GMT)
RLIPv2: Fast Scaling of Relational Language-Image Pre-training [53.2] 本稿では,大規模な擬似ラベル付きシーングラフデータに対する事前学習のリレーショナルスケーリングを可能にする高速収束モデルRLIPv2を提案する。
非対称言語画像融合 (ALIF) は、より早く、より深く分岐したクロスモーダル融合と、スパシファイド言語による符号化を容易にする。
RLIPv2は、3つのベンチマークで、完全な微調整、少数ショット、ゼロショット設定で、最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:17:09 GMT)
UniVTG: Towards Unified Video-Language Temporal Grounding [52.6] Video Temporal Grounding (VTG)は、カスタム言語クエリに従ってビデオのターゲットクリップをグラウンドすることを目的としている。
我々は、UniVTGと呼ばれる多様なVTGラベルとタスクを3方向に沿って統一することを提案する。
統合されたフレームワークのおかげで、大規模な多様なラベルから事前学習する時間的基盤を解き放つことができます。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:56:32 GMT)
A Counterfactual Safety Margin Perspective on the Scoring of Autonomous
Vehicles' Riskiness [52.3] 我々は,衝突につながる可能性のある正常な行動から最小限の偏差を示す,反事実的安全マージンの概念を導入する。
AVの行動方針が不明な場合でも,提案手法が適用可能であることを示す。
この研究は、この新興技術を取り巻く立法・保険問題に対処するためのAVの安全性評価と支援に貢献する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:47:38 GMT)
Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.1] 本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:13:09 GMT)
Active and Passive Causal Inference Learning [51.9] 本稿では,因果推論に関心を持つ機械学習研究者,技術者,学生の出発点となる。
まず、因果同定に総合的に必要とされる重要な仮定のセットを配置することから始めます。
私たちは、それらを2つのバケット、アクティブとパッシブのアプローチに分類することで、重要な因果推論テクニックのセットを構築します。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:23:48 GMT)
Latent State Models of Training Dynamics [51.9] 異なるランダムなシードでモデルをトレーニングし、トレーニングを通じてさまざまなメトリクスを計算します。
次に、結果のメトリクス列に隠れマルコフモデル(HMM)を適合させる。
我々はHMM表現を用いて相転移を研究し、収束を遅くする潜伏状態(detour state)を特定する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:20:08 GMT)
TrajectoryFormer: 3D Object Tracking Transformer with Predictive
Trajectory Hypotheses [51.6] 3Dマルチオブジェクトトラッキング(MOT)は、自律走行車やサービスロボットを含む多くのアプリケーションにとって不可欠である。
本稿では,新しいポイントクラウドベースの3DMOTフレームワークであるTrjectoryFormerを紹介する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:31:15 GMT)
Among Us: Adversarially Robust Collaborative Perception by Consensus [50.7] 複数のロボットは、シーン(例えば物体)を個人よりも協調的に知覚することができる。
本稿では,未知の攻撃者に対して一般化可能な新しいサンプリングベース防衛戦略であるROBOSACを提案する。
自律運転シナリオにおける協調3次元物体検出の課題に対して,本手法の有効性を検証した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:40:18 GMT)
Breaking the Complexity Barrier in Compositional Minimax Optimization [50.1] 合成のミニマックス最適化は、機械学習にまたがる重要な課題であるが、未探索の課題である。
現在のテクニックは、最適以下の複雑さを示すか、大きなバッチサイズに大きく依存する。
本稿では,Nested STOchastic Recursive Momentum (NSTORM)を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:57:21 GMT)
Do you know what q-means? [50.0] クラスタリングは、大規模なデータセットを分析する上で最も重要なツールの1つである。
クラスタリングのための"$q$-means"アルゴリズムの改良版を提案する。
また、$Obig(frack2varepsilon2(sqrtkd + log(Nd))big で実行される $varepsilon に対する "dequantized" アルゴリズムも提示する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:52:12 GMT)
ASAG: Building Strong One-Decoder-Layer Sparse Detectors via Adaptive
Sparse Anchor Generation [50.0] 適応スパースアンカージェネレータ(ASAG)の提案により、スパース検出器と密度検出器のパフォーマンスギャップを橋渡しする。
ASAGは、グリッドではなくパッチの動的なアンカーを予測することで、機能競合の問題を軽減する。
提案手法は高密度な手法より優れ,高速かつ高精度なトレードオフを実現する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:06:49 GMT)
Topological multi-mode waveguide QED [49.2] 本稿では, 位相的に保護された伝播モードを量子エミッタで対向して利用する方法を示す。
このような能力は、トポロジカルに保護された光子の間で量子ゲートを生成する方法と、トポロジカルチャネルにおいてより複雑な光の絡み合った状態を生成する方法を舗装する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:30:39 GMT)
Reconstructing $S$-matrix Phases with Machine Learning [49.2] 我々は、ユニタリティ制約の研究に現代の機械学習技術を適用した。
我々は、そのような解に対する既知の限界を以前の境界を超えるような新しい位相あいまいな解を求める。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:29:26 GMT)
Dynamically Emergent Quantum Thermodynamics: Non-Markovian Otto Cycle [49.2] 我々は,量子オットーサイクルの熱力学的挙動を再考し,メモリ効果と強い系-バス結合に着目した。
我々の研究は、厳密な量子マスター方程式を用いて、マルコビアン性(英語版)を正確に扱うことに基づいている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:00:32 GMT)
SKED: Sketch-guided Text-based 3D Editing [49.0] 我々は,NeRFで表される3次元形状を編集する技術であるSKEDを提案する。
我々の手法は、異なる視点からの2つのガイドスケッチを使用して、既存のニューラルネットワークを変化させる。
本稿では,ベースインスタンスの密度と放射率を保ちつつ,所望の編集を生成する新しい損失関数を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 21:32:50 GMT)
PatchCT: Aligning Patch Set and Label Set with Conditional Transport for
Multi-Label Image Classification [48.9] マルチラベル画像分類は、与えられた画像から複数のラベルを識別することを目的とした予測タスクである。
本稿では,このギャップを埋める条件輸送理論を紹介する。
複数ラベルの分類をCT問題として定式化することで,画像とラベルの相互作用を効率的に活用できることがわかった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:53:27 GMT)
On the Effectiveness of LayerNorm Tuning for Continual Learning in
Vision Transformers [47.8] 最新のリハーサルなし連続学習手法は、視覚変換器の特異性を利用してタスク固有のプロンプトを学習する。
そこで、まずタスク固有のパラメータを最適化し、次に推論時間の同じ選択手順で分類器を訓練する。
提案手法は, 計算コストを抑えながら, より優れた結果が得られるか, あるいは, 技術水準に匹敵する結果が得られる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:11:16 GMT)
Towards Large-scale 3D Representation Learning with Multi-dataset Point
Prompt Training [47.0] ポイント・プロンプト・トレーニング(Point Prompt Training)は、3D表現学習の文脈におけるマルチデータセットのシナジスティック学習のための新しいフレームワークである。
シナジスティック学習に関連する負の移動を克服し、一般化可能な表現を生成する。
教師付きマルチデータセットトレーニングを備えた1つの重み付きモデルを用いて、各データセットの最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:59:57 GMT)
Semidefinite programming relaxations for quantum correlations [45.8] 量子相関論において、半定緩和のコアアイデアがどのように様々な研究トピックに適用できるかを論じる。
これらのトピックには、非局所性、量子通信、量子ネットワーク、絡み合い、量子暗号が含まれる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:04:16 GMT)
RFDforFin: Robust Deep Forgery Detection for GAN-generated Fingerprint
Images [45.7] 本稿では,GAN生成画像の独自の隆起特性と生成アーティファクトを組み合わせた指紋画像に対する最初の深部偽造検出手法を提案する。
提案手法は,低複雑性で有効かつ堅牢である。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:05:18 GMT)
Onchain Sports Betting using UBET Automated Market Maker [45.4] 分散スポーツの賭けには、効率的な流動性提供のために自動市場メーカー(AMM)が必要である。
Uniswapのような既存のAMMは、公正な確率に一致せず、流動性プロバイダーのリスクを生み出している。
本稿では、スマートコントラクトとアルゴリズムを活用して、スポーツオッズを公平に価格設定するUBET AMM(UAMM)を紹介する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:19:30 GMT)
Graph-based Alignment and Uniformity for Recommendation [45.4] 協調フィルタリングに基づく推薦システムは、ユーザの好みを正確に予測するために、ユーザやアイテムの学習表現に依存する。
本稿では,グラフに基づくアライメントと統一性(GraphAU)という新たなアプローチを提案する。
4つのデータセットの実験によると、GraphAUはスパーシリティの問題を大幅に軽減し、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:33:36 GMT)
Image Processing and Machine Learning for Hyperspectral Unmixing: An
Overview and the HySUPP Python Package [45.0] アンミキシングは、ピクセル内のエンドメンバーの分数量を推定する。
本稿では,先進的および従来型のアンミックス手法の概要について述べる。
シミュレーションされた3つのデータセットと2つの実際のデータセット上でのアンミックス手法の性能を比較した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:10:41 GMT)
VL-PET: Vision-and-Language Parameter-Efficient Tuning via Granularity
Control [44.7] ビジョン・アンド・ランゲージ (VL) では, モジュール修正をエンコーダ・デコーダ PLM に統合するために, パラメータ効率調整 (PET) 技術が提案されている。
我々はビジョン・アンド・ランゲージを提案する。
モジュール化を効果的に制御するための効率的なチューニング(VL-PET)フレームワーク。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:18:30 GMT)
Label-Free Event-based Object Recognition via Joint Learning with Image
Reconstruction from Events [42.7] 本研究では,カテゴリラベルとペア画像が利用できない,ラベルのないイベントベースオブジェクト認識について検討する。
提案手法はまずイベントからイメージを再構成し,コントラスト言語-画像事前学習(CLIP)によるオブジェクト認識を行う。
画像の再構成にはカテゴリ情報が不可欠であるため,カテゴリ誘導アトラクション損失とカテゴリ非依存の反発損失を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:28:17 GMT)
Towards Robust Referring Video Object Segmentation with Cyclic
Relational Consensus [42.1] Referring Video Object (R-VOS) は、言語表現に基づくビデオ内のオブジェクトのセグメンテーションを目的とした課題である。
既存のほとんどのR-VOSメソッドは重要な仮定を持ち、参照されるオブジェクトはビデオに表示されなければならない。
本研究では,意味的ミスマッチを扱えるロバストなR-VOSモデルの必要性を強調した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:48:33 GMT)
Leveraging Intrinsic Properties for Non-Rigid Garment Alignment [42.0] 本稿では,2つのニューラル変形場を持つ固有多様体特性を生かした,粗粒二段法を提案する。
本手法は, クリンクルレベル, テクスチャレベルのアライメントを高精度に達成し, ロングコートなどの衣料の難しさに対処する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:54:12 GMT)
A tailored Handwritten-Text-Recognition System for Medieval Latin [40.3] バイエルン科学人文科学アカデミーは中世ラテン語辞典のデジタル化を目指している。
この辞書は、低資源言語である中世ラテン語のレムマを参照するレコードカードを含んでいる。
我々は中世ラテン語の辞書に合わせたエンドツーエンドのパイプラインを導入し、補題の検索、抽出、翻訳を行う。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:02:52 GMT)
Polyglot Code Smell Detection for Infrastructure as Code with GLITCH [40.0] 本稿では、インフラストラクチャー・アズ・コードスクリプトの自動臭い検出を可能にする技術に依存しない新しいフレームワークGLITCHを提案する。
GLITCHを用いて行った研究は、複数のIaC技術のためのコードの臭い分析を書く労力を減らすだけでなく、現在の最先端ツールよりも高精度でリコールできることを示した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:44:47 GMT)
Language-Guided Diffusion Model for Visual Grounding [39.8] 既存のアプローチは、そのような視覚的テキスト推論を1ステップで完了させる。
本稿では,ビジュアルグラウンドディングのための言語誘導拡散フレームワークLG-DVGを提案する。
広範に使用されている5つのデータセットの実験は、視覚的グラウンドリングの優れた性能、つまり、モーダルなアライメントタスクを生成的手法で検証した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:54:13 GMT)
A Methodology for Generative Spelling Correction via Natural Spelling
Errors Emulation across Multiple Domains and Languages [39.8] 本稿では,英語とロシア語でテストした生成スペル補正法について述べる。
本研究では,これらの誤りを正しい文でエミュレートして生成モデルの事前訓練手順を効果的に強化する方法について検討する。
本研究の成果として,自動生成SCライブラリとしてSAGE(Spell check via Augmentation and Generative Distribution Emulation)を導入する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:07:28 GMT)
Spatial LibriSpeech: An Augmented Dataset for Spatial Audio Learning [39.6] 本研究では,空間音響データセットを650時間以上の19チャンネル音声,1次アンビソニクス,任意ノイズで提示する。
Space LibriSpeechは機械学習モデルトレーニング用に設計されており、ソース位置、発話方向、室内音響、幾何学のラベルが含まれている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:45:32 GMT)
Minimum Coverage Sets for Training Robust Ad Hoc Teamwork Agents [39.2] 既存のAd Hoc Teamwork(AHT)メソッドは、さまざまなチームメイトポリシーを持つエージェントをトレーニングすることで、この問題に対処する。
我々は、AHTトレーニングに使用されるチームメイトポリシーのセットを生成するL-BRDivアルゴリズムを導入し、エージェントがMCSのポリシーをエミュレートすることを奨励する。
実験により,L-BRDivは2人共役の幅広い問題において,最先端の手法よりも堅牢なAHTエージェントを生成することを示した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:45:22 GMT)
Diff2Lip: Audio Conditioned Diffusion Models for Lip-Synchronization [38.6] Diff2Lip(ディフ2リップ)は、これらの特性を保ちながら唇の同期を行うことができる、オーディオ条件の拡散ベースモデルである。
本稿では,Voxceleb2 と LRW のデータセット上で,再構成(音声-ビデオ入力)とクロス設定(音声-ビデオ入力)の両方について結果を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:59:40 GMT)
Improving 3D Pose Estimation for Sign Language [38.2] この研究は、単一の画像における3次元人間のポーズ復元に対処する。
本稿では,フォワード・キネマティクス(FK)とニューラルネットワークを組み合わせた3次元ポーズの高速かつ有効な予測手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:05:10 GMT)
Denoising Diffusion for 3D Hand Pose Estimation from Images [38.2] 本稿では,モノクロ画像やシーケンスからの3次元手ポーズ推定の問題に対処する。
本稿では,3次元ハンドレグレッションのための新しいエンド・ツー・エンド・エンド・フレームワークを提案する。
提案モデルは,2次元の片手画像を3Dに持ち上げる際に,最先端の性能を提供する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:57:22 GMT)
Learning to Generate Training Datasets for Robust Semantic Segmentation [37.9] セマンティックセグメンテーション手法の堅牢性を改善するための新しい手法を提案する。
我々は、現実的で可視な摂動画像や外乱画像を生成するために、頑健な条件生成対向ネットワークを設計し、訓練する。
我々の結果は、このアプローチが安全クリティカルなアプリケーションに有用である可能性を示唆している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:42:58 GMT)
EgoHumans: An Egocentric 3D Multi-Human Benchmark [37.4] EgoHumansは、エゴセントリックな人間の3Dポーズ推定と追跡の最先端化を図るために、新しいマルチビューマルチヒューマンビデオベンチマークである。
本研究では,エゴセントリックなマルチヒューマン・ベンチマークを構築するために,新しい3Dキャプチャ・セットアップを提案する。
コンシューマグレードのウェアラブルカメラ搭載メガネを、エゴセントリックな視点に活用することで、テニス、フェンシング、バレーボールなどのダイナミックな活動を捉えることができます。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 23:28:45 GMT)
Do DALL-E and Flamingo Understand Each Other? [36.5] 本研究では,Flamingoが与えられた画像の記述を生成し,DALL-Eがこの記述を入力として新しい画像を合成する再構成タスクを提案する。
画像の最適記述は、生成した画像が元の画像と似たものになることを示す。
本稿では,テキスト・トゥ・イメージと画像・トゥ・テキストモデルを微調整する統合フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:44:51 GMT)
Dimension Independent Mixup for Hard Negative Sample in Collaborative
Filtering [36.3] 否定的なサンプリングは、暗黙のフィードバックでCFベースのモデルをトレーニングする上で重要な役割を果たす。
そこで本研究では,CFモデルトレーニングのためのエリアワイドサンプリング法であるDINS(Dimension Independent Mixup for Hard Negative Smpling)を提案する。
我々の研究は、新しい視点に寄与し、エリアワイドサンプリングを導入し、DINSをネガティブサンプリングのための新しいアプローチとして提示する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:24:24 GMT)
Deep Task-specific Bottom Representation Network for Multi-Task
Recommendation [36.1] 本稿では,Deep Task-specific Bottom Representation Network (DTRN)を提案する。
提案した2つのモジュールは、タスクの相互干渉を緩和するためにタスク固有のボトム表現を得る目的を達成することができる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:37:14 GMT)
AutoLog: A Log Sequence Synthesis Framework for Anomaly Detection [34.9] AutoLogは、異常検出のための最初の自動ログ生成手法である。
実際にシステムを実行することなく、実行時のログシーケンスを生成する。
人間の知識に基づいて、取得した各実行パスに異常ラベルを伝搬する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:56:18 GMT)
Streamlined Lensed Quasar Identification in Multiband Images via
Ensemble Networks [34.8] 強いレンズを経験するクエーサーは、宇宙膨張速度、暗黒物質、およびクエーサーホスト銀河に関連する主題に独自の視点を与える。
我々は,現実的な銀河・クエーサーレンズシミュレーションに基づいて訓練された最先端畳み込みネットワーク(CNN)を組み込むことにより,新しいアプローチを開発した。
我々は親標本として約6000万個の情報源を検索し、光度測定によるクエーサーを$theta_mathrmE5$arcsecのEinstein radiiで発見した後、これを892,609個に減らした。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:31:30 GMT)
Is context all you need? Scaling Neural Sign Language Translation to
Large Domains of Discourse [34.7] 手話翻訳(SLT)は手話ビデオから音声言語文を生成することを目的とした課題である。
本稿では,翻訳タスクを人間と同じようにコンテキスト対応で処理する,新しいマルチモーダルトランスフォーマーアーキテクチャを提案する。
本稿では,文脈情報を用いた最先端翻訳性能の大幅な向上を報告し,ベースラインアプローチのBLEU-4スコアをほぼ倍増させた。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:27:22 GMT)
Fairness Continual Learning Approach to Semantic Scene Understanding in
Open-World Environments [33.8] 本稿では,意味的セグメンテーション問題に対するフェアネス連続学習手法を提案する。
The fairness objective, a new fairness continual learning framework based on class distributions。
連続学習における重要な課題に対処するために, 新たにプロトタイプなコントラストクラスタリング損失を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:59:24 GMT)
Learnt Contrastive Concept Embeddings for Sign Recognition [33.7] 我々は手話と話し言葉のギャップを埋める手話埋め込みを明示的に作成することに注力する。
我々は手話ビデオの言語ラベルに基づく埋め込みの語彙を訓練する。
我々は,NLP法から単語埋め込みを活用可能な概念的類似性損失を開発し,音声言語対応に優れた手話を含む手話埋め込みを生成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:47:18 GMT)
DMCVR: Morphology-Guided Diffusion Model for 3D Cardiac Volume
Reconstruction [33.6] 現在の心臓MRIによる再建技術は、平面解像度が制限された2Dである。
本稿では,高解像度2次元画像とそれに対応する3次元再構成ボリュームを合成する3次元心容積再構成のための形態誘導拡散モデルDMCVRを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 00:48:30 GMT)
Meta-learning enhanced next POI recommendation by leveraging check-ins
from auxiliary cities [32.7] メタラーニングを強化した次世代POI勧告フレームワーク(MERec)を提案する。
MERecleverは、様々な都市間のチェックイン行動の相関関係をメタラーニングパラダイムに分類し、ターゲット都市におけるユーザの嗜好を推測する。
特に、都市レベルの相関戦略は、都市間の共通パターンを注意深く捉え、より相関のある都市からより関連性の高い知識を伝達するために考案されている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:07:41 GMT)
Boosting Few-shot Action Recognition with Graph-guided Hybrid Matching [32.6] グラフ誘導ハイブリッドマッチングを用いた新しいフレームワークGgHMを提案する。
クラスプロトタイプ構築中にグラフニューラルネットワークについて学ぶ。
次に、フレームレベルとコアレベルのマッチングを組み合わせたハイブリッドマッチング戦略を設計し、ビデオの分類を行う。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:07:36 GMT)
I Can't Believe There's No Images! Learning Visual Tasks Using only
Language Supervision [32.5] 4つのタスクのテキストトレーニングデータのみを用いてモデルを作成する。
これらのモデルは、画像上で訓練されたモデルに近いパフォーマンスを示す。
画像データと人為的な言語データを用いない,多種多様なスタイリスティックな画像キャプションモデルについて紹介する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 23:43:42 GMT)
Red-Teaming Large Language Models using Chain of Utterances for
Safety-Alignment [32.2] 我々は,新しい安全評価ベンチマークRED-EVALを提案する。
広範にデプロイされたモデルであっても、CoU(Chain of Utterances-based)のプロンプトの影響を受けやすいことを示す。
また、RED-EVALが8つのオープンソースLCMにまたがる一貫性を実証し、レッドチームの試みの86%以上で有害な応答を発生させることを示した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:27:04 GMT)
LVOS: A Benchmark for Long-term Video Object Segmentation [31.8] textbfLVOSという,合計421分間の220ビデオからなるベンチマークデータセットを提案する。
LVOSのビデオは平均1.59分で、既存のVOSデータセットのビデオの20倍の長さです。
本稿では,時間的情報を適切に活用するための3つの相補的メモリバンクからなる横動的メモリネットワーク(DDMemory)を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:35:59 GMT)
Balancing Transparency and Risk: The Security and Privacy Risks of
Open-Source Machine Learning Models [31.7] 本稿では,オープンソースモデルの使用に伴う共通プライバシーとセキュリティの脅威について概観する。
これらの危険に対する認識を高めることで、私たちはAIシステムの責任と安全な利用を促進することに努めます。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:59:15 GMT)
MonoNeRD: NeRF-like Representations for Monocular 3D Object Detection [31.6] 我々は,高密度な3次元形状と占有度を推定できる新しい検出フレームワークMonoNeRDを提案する。
具体的には、SDF(Signed Distance Function)を用いてシーンをモデル化し、密集した3D表現の作成を容易にする。
我々の知る限り、この研究は初めてM3Dのボリュームレンダリングを導入し、画像に基づく3D知覚のための暗黙的な再構築の可能性を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:39:52 GMT)
Vision Relation Transformer for Unbiased Scene Graph Generation [31.3] 現在のシーングラフ生成 (SGG) 法は, 関連符号化プロセスにおいて, 実体の局所レベルに関する情報損失に悩まされる。
本稿では,新しい局所レベルの実体関係エンコーダであるビジョンrElation TransfOrmer(VETO)を紹介する。
VETO+MEETは10倍の精度で予測性能を最大47パーセント向上させることを示した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:15:31 GMT)
PoSynDA: Multi-Hypothesis Pose Synthesis Domain Adaptation for Robust 3D
Human Pose Estimation [31.1] 現在の3Dポーズ推定器は、ターゲットドメイントレーニングセットで2D-3Dポーズペアが不足しているため、新しいデータセットに適応する際の課題に直面している。
この問題を解決するために,textitMulti-Hypothesis textbfPose textbfSynthesis textbfDomain textbfAdaptation (textbfPoSynDA) フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:57:25 GMT)
Backdoor Mitigation by Correcting the Distribution of Neural Activations [30.6] バックドア(トロイジャン)攻撃はディープニューラルネットワーク(DNN)に対する敵対的攻撃の重要なタイプである
バックドア攻撃の重要な特性を解析し、バックドア・トリガー・インスタンスの内部層活性化の分布の変化を引き起こす。
本稿では,分散変化を補正し,学習後のバックドア緩和を効果的かつ効果的に行う方法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:52:29 GMT)
Multi-Visual-Inertial System: Analysis, Calibration and Estimation [30.0] マルチビジュアル・慣性システム(MVIS)の状態を推定し,センサ融合アルゴリズムを開発した。
我々は、関連する視覚慣性センサーの完全な校正に興味を持っている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:06:50 GMT)
MATLABER: Material-Aware Text-to-3D via LAtent BRDF auto-EncodeR [30.0] BRDF自動エンコーダ(textbfMATLABER)を用いたマテリアル・アウェア・テキスト・トゥ・3Dを提案する。
我々は,この自動エンコーダを大規模実世界のBRDFコレクションで訓練し,その潜在空間の滑らかさを確保する。
提案手法は, 現実的かつ一貫性のある物質を生成する上で, 既存の物質よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:40:38 GMT)
Video-Instrument Synergistic Network for Referring Video Instrument
Segmentation in Robotic Surgery [29.7] 本研究は,手術用ビデオ機器(RSVIS)の新たな課題を探求する。
与えられた言語表現に基づいて対応する手術器具を自動的に識別・分節することを目的としている。
我々は,ビデオレベルと楽器レベルの両方の知識を学習し,性能を向上させるために,ビデオ機器合成ネットワーク(VIS-Net)を考案した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:24:06 GMT)
O^2-Recon: Completing 3D Reconstruction of Occluded Objects in the Scene
with a Pre-trained 2D Diffusion Model [29.6] 咬合は、RGB-Dビデオからの3D再構成において一般的な問題であり、しばしばオブジェクトの完全な再構成をブロックする。
本研究では,物体の隠れた部分の完全な表面を再構築する2次元拡散に基づくインペインティングモデルを用いて,新しい枠組みを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:38:31 GMT)
Meta-ZSDETR: Zero-shot DETR with Meta-learning [29.6] 本稿では,DeTRとメタラーニングを組み合わせてゼロショットオブジェクト検出を行うMeta-ZSDETRを提案する。
このモデルは、回帰ヘッドを含むメタコントラスト学習で最適化され、クラス固有のボックスの座標を生成する。
実験の結果,本手法は既存のZSD法よりも高い性能を示した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:17:07 GMT)
EAVL: Explicitly Align Vision and Language for Referring Image
Segmentation [29.3] 画像セグメント化の参照は、自然言語で言及されたオブジェクトを画像からセグメントすることを目的としている。
従来のアプローチは主に、言語関連のローカライゼーションを完全に解決することなく、視覚と言語機能の融合に焦点を当てていた。
画像参照のための視覚と言語を明示的に調整する(EAVL)。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:59:27 GMT)
Investigation of Architectures and Receptive Fields for Appearance-based
Gaze Estimation [29.2] 本稿では、ResNetアーキテクチャのいくつかの単純なパラメータをチューニングすることで、既存のガンマ推定タスクの最先端手法よりも優れていることを示す。
ETH-XGazeが3.64、MPIIFaceGazeが4.50、Gaze360が9.13の3つのデータセットで最先端のパフォーマンスを得る。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:41:51 GMT)
RoCourseNet: Distributionally Robust Training of a Prediction Aware
Recourse Model [29.1] RoCourseNetは、将来のデータシフトに対して堅牢な予測とリコースを共同で最適化するトレーニングフレームワークである。
RoCourseNetは、ロバストな妥当性を96%以上達成し、ロバストな説明を生成する上で、最先端のベースラインを少なくとも10%上回っていることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:31:08 GMT)
Supporting Human-AI Collaboration in Auditing LLMs with LLMs [29.0] 大きな言語モデルは偏見があり、無責任に振る舞うことが示されている。
これらの言語モデルを厳格に監査することは重要である。
既存の監査ツールは、人間とAIの両方を活用して失敗を見つける。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:09:46 GMT)
KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired
True-Range Multilateration [29.0] KeyPoint Positioning System (KeyPosS) は画期的な顔のランドマーク検出フレームワークである。
KeyPosSは完全な畳み込みネットワークを使用して距離マップを予測し、ポイント・オブ・興味(POI)と複数のアンカーポイントの間の距離を計算する。
その結果,KeyPosSは低解像度設定で先行手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:54:02 GMT)
Training with Product Digital Twins for AutoRetail Checkout [28.8] デジタル双生児(DtTrain)を用いたトレーニングデータ最適化フレームワークを提案する。
これらのデジタルツインは製品ラベルを継承し、拡張されるとデジタルツイントレーニングセット(DTセット)を形成する。
本実験では,既存のデータセット合成手法で作成したトレーニングセットを,精度の点で性能的に優れることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:58:10 GMT)
Latent Jailbreak: A Test Suite for Evaluating Both Text Safety and
Output Robustness of Large Language Models [28.4] 大きな言語モデル(LLM)は人間の値と一致し、安全なテキストを生成するように設計されている。
以前のJailbreaking LLMのベンチマークでは、主にモデルの安全性の評価に焦点が当てられていた。
本稿では,LLMの安全性とロバスト性を両立させ,バランスの取れたアプローチの必要性を強調した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:52:53 GMT)
Multi-Task Pseudo-Label Learning for Non-Intrusive Speech Quality
Assessment Model [28.3] 本研究では,非侵入的音声品質評価モデルに対するマルチタスク擬似ラベル学習(MPL)を提案する。
MPLは、事前訓練されたモデルから擬似ラベルスコアを取得し、マルチタスク学習を行う2つのステージから構成される。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:36:21 GMT)
From Sky to the Ground: A Large-scale Benchmark and Simple Baseline
Towards Real Rain Removal [28.0] 我々は,100万の高解像度(1920*1080)フレーム対を持つ3000の動画シーケンスを含む大規模高品質ペアド実雨量ベンチマーク(LHP-Rain)を構築した。
提案したデータセットの利点は3つある: 雨は多彩で大規模、画像は高解像度で高画質の地上構造である。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:46:04 GMT)
NeRFs: The Search for the Best 3D Representation [27.3] 我々は、ビュー合成と関連する問題に最適な3D表現を見つけるために、30年にわたる探究を簡潔にレビューする。
次に、NeRF表現の観点から新しい展開を記述し、3D表現の将来についていくつかの観察と考察を行う。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:57:39 GMT)
Generalizable Decision Boundaries: Dualistic Meta-Learning for Open Set
Domain Generalization [27.0] We propose a novel framework called dualistic Meta-learning with joint DomaIn-Class matching (MEDIC)。
その結果、MEDICはオープンセットのシナリオにおいて従来の手法よりも優れるだけでなく、競合するクローズドセットの一般化能力も同時に維持することを示した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:46:02 GMT)
Rethinking Image Forgery Detection via Contrastive Learning and
Unsupervised Clustering [26.9] 画像偽造検出のためのFOCAL(FOrensic ContrAstive cLustering)法を提案する。
FOCALは対照的な学習と教師なしクラスタリングに基づいている。
その結果、FOCALは最先端の競合アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:05:30 GMT)
StudioGAN: A Taxonomy and Benchmark of GANs for Image Synthesis [26.7] Generative Adversarial Network (GAN) は、現実的な画像合成のための最先端の生成モデルの一つである。
現在のGAN研究エコシステムは、その評価を一定かつ公平に行うための信頼性の高いベンチマークを提供していない。
我々はGANアプローチの分類について研究し、StudioGANという新しいオープンソースライブラリを提示する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:39:27 GMT)
InfLoR-SNN: Reducing Information Loss for Spiking Neural Networks [26.7] スパイキングニューラルネットワーク(SNN)はバイナリスパイク信号を用いて情報を伝達する。
本稿では,教師付きトレーニングベースSNNの「ソフトリセット」機構を提案する。
We show that the SNNs with the "Soft Reset" mechanism and MPR are outperform their vanilla equivalents on both static and dynamic datasets。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:28:59 GMT)
TrOMR:Transformer-Based Polyphonic Optical Music Recognition [26.1] 本稿では, TrOMR と呼ばれる終端ポリフォニック OMR に対して, 優れた大域的知覚能力を有するトランスフォーマーベースアプローチを提案する。
また、複雑な楽譜の認識精度を向上させるために、新しい整合損失関数とデータアノテーションの合理的なアプローチを導入する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:06:27 GMT)
Deep Knowledge Tracing is an implicit dynamic multidimensional item
response theory model [25.9] ディープ・ナレッジ・トレーシング(Deep Knowledge Trace, DKT)は、リカレントニューラルネットワークに依存するナレッジ・トレースの競合モデルである。
本稿では,エンコーダデコーダアーキテクチャとして深い知識追跡を行う。
より単純なデコーダは、DKTが使用するデコーダよりもパラメータが少なく、学生のパフォーマンスをより良く予測できることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:32:49 GMT)
Deep Equilibrium Object Detection [24.7] 本稿では,ディープ平衡デコーダを設計し,新しいクエリベースのオブジェクト検出器(DEQDet)を提案する。
我々の実験では、DECDtはより早く収束し、メモリ消費を減らし、ベースラインよりも優れた結果が得られることを示した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:56:03 GMT)
Unbiased Image Synthesis via Manifold-Driven Sampling in Diffusion
Models [24.6] 拡散モデルは、高品質な画像を生成することができる強力な生成モデルのクラスである。
データバイアスに関連する問題に直面し、特定のデータモードを優先する。
本稿では,拡散モデルにおけるデータバイアスを軽減するために,多様体誘導を利用した新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:06:16 GMT)
A Lightweight Transformer for Faster and Robust EBSD Data Collection [24.6] 本稿では,効率的なトランスモデルとプロジェクションアルゴリズムを用いて,3次元EBSDボリュームの欠落スライスを復元する2ステップ手法を提案する。
本モデルでは, 自己スーパービジョンを用いた合成3次元EBSDデータのみを用いて学習し, 既存の手法と比較して, 実際の3次元EBSDデータの回復精度を向上する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:41:39 GMT)
Multi-Level Compositional Reasoning for Interactive Instruction
Following [24.6] 多レベル合成共鳴剤(MCR-Agent)
最上位レベルでは、高レベルポリシー構成制御器による言語命令に基づいて、人間の解釈可能なサブゴールのシーケンスを推測する。
中間レベルでは、ナビゲーションポリシーと様々な独立したインタラクションポリシーを交互に切り替えることで、エージェントのナビゲーションをマスターポリシーで識別的に制御する。
最も低いレベルでは、適切なインタラクションポリシーを用いて、対応するオブジェクトマスクによる操作動作を推論する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:38:28 GMT)
StableVideo: Text-driven Consistency-aware Diffusion Video Editing [24.5] 拡散に基づく手法は、リアルな画像やビデオを生成することができるが、ビデオ内の既存のオブジェクトを編集するのに苦労し、その外観は時間の経過とともに保たれる。
本稿では、既存のテキスト駆動拡散モデルへの時間的依存を導入し、編集対象に対して一貫した外観を生成する。
我々は,この機構,すなわちStableVideoに基づくテキスト駆動のビデオ編集フレームワークを構築し,一貫性を意識したビデオ編集を実現する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:39:16 GMT)
Gradient-Based Word Substitution for Obstinate Adversarial Examples
Generation in Language Models [24.3] 勾配に基づくアプローチであるGradObstinateを導入する。
広範囲にわたる実験により,提案したGradObstinateはより強力な強敵の例が得られた。
GradObstinateが見いだした頑健な単語置換の伝達可能性を示すために,4つの代表的NLPベンチマークの単語を、その頑健な置換に置き換える。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:07:02 GMT)
Dual-Stream Diffusion Net for Text-to-Video Generation [24.0] ビデオ生成におけるコンテンツ変動の整合性を改善するために,デュアルストリーム拡散ネット(DSDN)を提案する。
特に、デザインされた2つの拡散ストリーム、ビデオコンテンツとモーションブランチは、コンテンツだけでなく、パーソナライズされたビデオのバリエーションを生成するために、それぞれのプライベートスペースで別々に実行できた。
われわれの方法では、フリックを減らした素晴らしい連続ビデオが作れる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:31:24 GMT)
Variational optimization of the amplitude of neural-network quantum
many-body ground states [23.5] ニューラルネットワーク量子状態(NQS)は、従来の手法とディープラーニング技術を組み合わせることで、変動的に最適化される。
そこで我々は,量子多体変動波関数を実数値振幅ニューラルネットワークと手形構造の乗算に分割した。
その結果,複素数値NQSの符号構造を最適化することが困難であることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:30:57 GMT)
Diverse Cotraining Makes Strong Semi-Supervised Segmentor [23.0] 我々は、複数の互換性と条件付き独立なビューという、協調学習をサポートするコア仮定を再考する。
現在のコトレーニングモデルのほとんどは密結合であり、この仮定に違反している。
我々のDiverse Co-trainingは、異なる評価プロトコル間で大きなマージンで最先端のSOTA(State-of-the-art)手法より優れています。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:46:29 GMT)
Differentially Private Community Detection for Stochastic Block Models [22.5] 本研究では,個々の接続のプライバシを保ちながら,コミュニティ検出問題について検討する。
本稿では,3つの異なる地域社会回復機構の幅広いクラスについて,関連する情報トレードオフを提示し,分析する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:18:04 GMT)
CroCo v2: Improved Cross-view Completion Pre-training for Stereo
Matching and Optical Flow [22.2] 自己教師付き事前学習法は、ステレオマッチングや光学フローのような密集した幾何学的視覚タスクでは、まだ提供されていない。
我々は、同じシーンから2番目のビューを利用するマスク付き画像モデリングのバリエーションである、最近のクロスビュー補完フレームワークの上に構築する。
本稿では,ステレオマッチングと光学的流れに関する最先端の成果を,従来のタスク固有の手法を使わずに到達できることを初めて示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:06:20 GMT)
PoseDiffusion: Solving Pose Estimation via Diffusion-aided Bundle
Adjustment [22.0] 本稿では,確率的拡散フレームワーク内での運動構造(SfM)問題を定式化することを提案する。
本稿では,従来のSfMパイプラインよりもPoseDiffusionが大幅に改善されていることを示す。
本手法は,さらなるトレーニングを行なわずにデータセットをまたいで一般化できることが観察された。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 21:29:39 GMT)
Overlap Bias Matching is Necessary for Point Cloud Registration [21.6] 登録される点雲間のオーバーラップは比較的小さい。
部分点クラウド登録のための教師なしネットワーク Overlap Bias Matching Network (OBMNet) を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:47:22 GMT)
3D Segmentation of Humans in Point Clouds with Synthetic Data [21.5] 本稿では,3次元人間の意味的セグメンテーション,インスタンスセグメンテーション,複数人体部分セグメンテーションの課題を提案する。
実際の3Dシーンと相互作用する合成人間のトレーニングデータを生成するためのフレームワークを提案する。
また,新しいトランスフォーマーモデルであるHuman3Dを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:51:38 GMT)
Generalized Sum Pooling for Metric Learning [21.5] ディープラーニングのための学習可能な一般化和プーリング法(GSP)を提案する。
提案手法の有効性を4つの一般的なメトリクス学習ベンチマークで評価した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:20:25 GMT)
DiffLLE: Diffusion-guided Domain Calibration for Unsupervised Low-light
Image Enhancement [21.4] 既存の教師なし低照度画像強調法は、実用上十分な有効性と一般化を欠いている。
DiffLLEと呼ばれる、より堅牢で効果的に教師なしの低照度化を実現するために拡散型領域校正を開発した。
我々の手法は、単純な教師なしベースラインのみを用いることで、教師なしメソッドよりも優れています。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:40:40 GMT)
Defending Label Inference Attacks in Split Learning under Regression
Setting [20.8] Split Learning(スプリットラーニング)は、垂直的フェデレートラーニングを実装するためのプライバシー保護手法である。
本稿では,回帰条件下でのスプリット学習におけるラベル推論攻撃に着目した。
我々はRandom Label Extension (RLE)を提案し、そこでラベルを拡張して勾配に含まれるラベル情報を難読化する。
そこで本研究では,モデルに基づく適応ラベル拡張(MLE)を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:22:31 GMT)
Too Large; Data Reduction for Vision-Language Pre-Training [20.5] 本稿では,広範に使用されているVision-Language Pre-Trainingデータセットにおける画像テキストの不一致と高い冗長性の問題について検討する。
これらの問題に対処するために、TL;DRと呼ばれる効率的かつ簡単な視覚言語学習アルゴリズムを提案する。
まず、コードブックベースのエンコーダ・デコーダキャプタを開発し、代表サンプルを選定する。
次に、選択されたサンプルの原文キャプションを補完する新たなキャプションを生成し、テキスト画像の誤認識問題を緩和する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:20:06 GMT)
SparseBEV: High-Performance Sparse 3D Object Detection from Multi-Camera
Videos [20.5] SparseBEVは完全にスパースな3Dオブジェクト検出器で、密度の高い物体よりも優れています。
nuScenesのテスト分割で、SparseBEVは67.5 NDSの最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:11:01 GMT)
Progression-Guided Temporal Action Detection in Videos [20.0] 本稿では,時間的行動検出(TAD)のための新しいフレームワークであるAction Progression Network(APN)を提案する。
このフレームワークは、アクション進化プロセスを検出して、ビデオ中のアクションを見つける。
完全なアクションプロセスを101段階に定量化し、アクションの進行を認識するためにニューラルネットワークをトレーニングする。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:14:05 GMT)
Learning MDL logic programs from noisy data [19.7] ノイズの多いデータから最小記述長プログラムを学習する手法を提案する。
薬物設計やゲームプレイ,プログラム合成など,いくつかの分野での実験を行った結果,既存のアプローチよりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:49:30 GMT)
Robust Audio Anti-Spoofing with Fusion-Reconstruction Learning on
Multi-Order Spectrograms [19.5] 本稿では,S2pecNetというスペクトル融合再構成戦略を用いた新しい深層学習手法を提案する。
融合表現から入力スペクトログラムへの再構成により、潜在的融合情報損失がさらに低減される。
提案手法は,広く使用されているデータセット上でのEERの0.77%で最先端の性能を達成した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:51:15 GMT)
UAV-assisted Semantic Communication with Hybrid Action Reinforcement
Learning [19.5] 本稿では, セマンティックモデルスケール, チャネル割り当て, 送信電力, UAV軌道に関する決定を行うためのハイブリッドアクション強化学習フレームワークを提案する。
シミュレーションの結果,提案したハイブリッドアクション強化学習フレームワークは,アップリンクセマンティックデータ収集の効率を効果的に向上できることが示された。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:30:18 GMT)
Learning Reward Machines through Preference Queries over Sequences [19.5] 我々は、リターンマシンを好みから学習するための新しいアルゴリズムであるREMAPにコントリビュートする。
本研究は,REMAPの正当性と終了の証明に加えて,正当性を測定する実証的証拠を提示する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:49:45 GMT)
End-to-End Feasible Optimization Proxies for Large-Scale Economic
Dispatch [19.4] 本稿では,経済的ディスパッチ問題に対する最適化プロキシのトレーニングのための新しいエンド・ツー・エンド学習・修復アーキテクチャを提案する。
E2ELRは、ディープニューラルネットワークとクローズドフォームで微分可能な修復層を組み合わせることで、エンドツーエンドで学習と実現性を統合する。
E2ELRは、エネルギとリザーブを共同最適化する経済的なディスパッチを使用して、数万のバスを持つ産業規模の電力網で評価されている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:46:38 GMT)
Solving PDEs on Spheres with Physics-Informed Convolutional Neural
Networks [19.0] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式(PDE)の解法において効率的であることが示されている。
本稿では,物理インフォームド畳み込みニューラルネットワーク(PICNN)の厳密な解析を行い,球面上のPDEを解く。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:58:23 GMT)
Sketch-based Video Object Localization [18.8] 我々はSketch-Video Attention Network (SVANet)を構築し、スケッチとビデオの間の領域ギャップを埋める。
SVANetは、学習可能なオブジェクトトークン、クエリスケッチ、ビデオ間のインタラクションをモデル化するクロスモーダルトランスフォーマーを備えている。
SVANetは、クエリスケッチとビデオオブジェクトのマッピングをうまく学習し、SVOLベンチマークで最先端の結果を得る。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:08:10 GMT)
ResQ: Residual Quantization for Video Perception [18.5] 本稿では,Residual Quantization(Residual Quantization)と呼ばれるビデオネットワークのための新しい量子化手法を提案する。
ビデオの変化量に比例してビット幅を動的に調整するために、我々のモデルを拡張します。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:41:10 GMT)
Heterogeneous Knowledge Fusion: A Novel Approach for Personalized
Recommendation via LLM [18.1] 本稿では,Large Language Model (LLM) を用いたパーソナライズされたレコメンデーションのための新しいアプローチを提案する。
提案手法は,ユーザの不均一な振る舞いを効果的に統合し,推薦性能を大幅に向上させることができる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:05:10 GMT)
Audio-Visual Glance Network for Efficient Video Recognition [18.0] 本稿では,映像の時間的に重要な部分を効率的に処理するためのオーディオ・ビジュアル・ネットワーク(AVGN)を提案する。
我々は,各フレームのサリエンシスコアを推定するAV-TeST (Audio-Visual Temporal Saliency Transformer) を用いた。
AVGNの堅牢性と有効性を高めるため,様々なトレーニング手法とマルチモーダル特徴融合を取り入れた。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:46:20 GMT)
Scaling Clinical Trial Matching Using Large Language Models: A Case
Study in Oncology [17.2] 大規模言語モデル(LLM)を用いた臨床治験マッチングのスケーリングに関する系統的研究を行う。
本研究は、米国の大規模医療ネットワークにおいて、現在試験展開中の臨床試験マッチングシステムに基礎を置いている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:05:45 GMT)
Smoothness Similarity Regularization for Few-Shot GAN Adaptation [16.9] 本稿では,学習済みのGANの学習済みの滑らかさを少数ショット対象領域に伝達する,新しい滑らかさ類似性正規化を提案する。
我々は,無条件GANとクラス条件GANを多種多様な標的ドメインに適応させることにより,我々のアプローチを評価する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:59:53 GMT)
Artificial-Spiking Hierarchical Networks for Vision-Language
Representation Learning [16.9] 最先端の手法は、大規模データセットの事前トレーニングによって、素晴らしいパフォーマンスを達成する。
本稿では,新しい視覚的セマンティックモジュールを導入することで,マルチモーダルアライメントのための効率的なフレームワークを提案する。
実験の結果、提案されたASH-Netsは競合する結果が得られることが示された。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:40:25 GMT)
Implicit Identity Representation Conditioned Memory Compensation Network
for Talking Head video Generation [16.7] 対話型ヘッドビデオ生成は静止画像中の人間の顔を動的ポーズと動き情報を用いた表情でアニメーションすることを目的としている。
それでもソース画像は、隠された領域や微妙な表現のバリエーションに対して十分な外観情報を提供できない。
MCNetと呼ばれる暗黙的同一性表現条件付きメモリ補償ネットワークを,高忠実度音声ヘッド生成のために提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:29:19 GMT)
Tree-of-Mixed-Thought: Combining Fast and Slow Thinking for Multi-hop
Visual Reasoning [16.5] 大規模言語モデル(LLM)は、視覚的推論のような複雑な推論タスクのためのコードライクな計画を生成することができる。
ワンストップ推論 (fast) とツリー・オブ・シント (slow) を統合した階層型計画探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:21:40 GMT)
Attesting Distributional Properties of Training Data for Machine
Learning [16.2] いくつかの管轄区域は、機械学習の規制フレームワークを準備している。
ドラフト規則は、トレーニングデータセットが特定の分散特性を持つことを示すために、モデルトレーナーが必要であることを示している。
本研究では,証明者がデータを明らかにすることなく,学習データの適切な分布特性を検証者に示すことのできる特性証明の概念を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:33:02 GMT)
Distributed Neurodynamics-Based Backstepping Optimal Control for Robust
Constrained Consensus of Underactuated Underwater Vehicles Fleet [16.2] 本稿では,新しいコンセンサスに基づく最適コーディネーションプロトコルとロバストコントローラを開発する。
UUVの艦隊の最適な編成追跡が達成され、制約が満たされる。
全体的なUUVの形成システムの安定性は、UUVのすべての状態が、未知の乱れの存在下で一様に束縛されていることを保証するために確立されている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:04:12 GMT)
Open-vocabulary Video Question Answering: A New Benchmark for Evaluating
the Generalizability of Video Question Answering Models [16.0] 我々は,ビデオQAモデルの一般化性を評価するために,OVQA(Open-vocabulary Video Question Answering)という新しいベンチマークを導入する。
さらに,本論文では,稀かつ未確認な回答の予測を向上する,新しいGNNベースのソフト・ボーダライザを提案する。
我々のアブレーション研究と定性的な分析により,GNNに基づくソフト・ボーダライザがモデル性能をさらに向上することが示された。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:45:10 GMT)
A Robust Policy Bootstrapping Algorithm for Multi-objective
Reinforcement Learning in Non-stationary Environments [15.8] 多目的強化学習法は、多目的最適化手法で強化学習パラダイムを融合させる。
これらの方法の大きな欠点の1つは、環境における非定常力学への適応性の欠如である。
本研究では,非定常環境において,凸カバレッジの集合をオンライン的に頑健に進化させることのできる,新しい多目的強化学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:15:12 GMT)
Graph of Thoughts: Solving Elaborate Problems with Large Language Models [15.7] Graph of Thoughts (GoT)は、大規模言語モデル(LLM)のプロンプト機能を向上させるフレームワークである。
GoTの主な利点は、LLMによって生成された情報を任意のグラフとしてモデル化できることである。
この研究は、推論を人間の思考や再発のような脳のメカニズムに近づける。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:29:23 GMT)
GPS-GLASS: Learning Nighttime Semantic Segmentation Using Daytime Video
and GPS data [15.4] 特に夜間セマンティックセグメンテーションは、注釈付き夜間画像の欠如により困難である。
夜間セマンティックセグメンテーションのための新しいGPSベースのトレーニングフレームワークを提案する。
実験により,複数の夜間セマンティックセグメンテーションデータセットにおける提案手法の有効性が示された。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:38:32 GMT)
Unsupervised Light Field Depth Estimation via Multi-view Feature
Matching with Occlusion Prediction [15.4] 監督訓練に十分な深度ラベルを得ることは費用がかかる。
本稿では,LF画像から深度を推定するための教師なしフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:11:15 GMT)
Normalization Is All You Need: Understanding Layer-Normalized Federated
Learning under Extreme Label Shift [15.2] 階層正規化(Layer normalization, LN)は、特に基礎モデルの時代に広く採用されているディープラーニング技術である。
本研究では,フェデレート学習における階層正規化とラベルシフト問題との深い関係を明らかにする。
極端にラベルシフトした標準ベンチマークでは,正規化が大幅に改善されることが示されている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:57:04 GMT)
Tensor-Compressed Back-Propagation-Free Training for (Physics-Informed)
Neural Networks [15.2] 後方伝播(BP)は、ニューラルネットワークトレーニングの勾配を計算するために広く使われている。
自動微分をサポートするハードウェアやソフトウェアリソースが不足しているため、エッジデバイス上でBPを実装するのは難しい。
本稿では,現実的なニューラルネットワークを学習するためには,前方伝播のみを必要とする,完全にBPフリーなフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 23:56:50 GMT)
PUMGPT: A Large Vision-Language Model for Product Understanding [15.2] 商品理解タスクは,オンラインショッピング体験の向上に不可欠な役割を担っている。
マルチモーダルな大規模言語モデルの最近の発展は、視覚言語タスクを解く強力な能力を示している。
本稿では,製品理解タスクを単一モデル構造の下で統一することを目的とした大規模視覚言語モデルPUMGPTを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:01:37 GMT)
Far3D: Expanding the Horizon for Surround-view 3D Object Detection [15.0] 本稿では、Far3Dと呼ばれるスパースクエリベースの新しいフレームワークを提案する。
高品質な2Dオブジェクトの事前利用により、3Dグローバルクエリを補完する3D適応クエリを生成する。
長距離オブジェクトに対する様々なビューやスケールの識別的特徴を効果的に捉えるために,視点認識集約モジュールを導入する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:19:17 GMT)
Foundation Models in Smart Agriculture: Basics, Opportunities, and
Challenges [15.0] 本研究の目的は,スマート農業分野におけるFMの可能性を探ることである。
コンピュータサイエンス分野における最近のFMをまずレビューし、言語FM、視覚FM、マルチモーダルFM、強化学習FMの4つのカテゴリに分類した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:16:37 GMT)
REAP: A Large-Scale Realistic Adversarial Patch Benchmark [15.0] アドリアパッチ攻撃は、自動運転車のようなカメラに依存するサイバー物理システムにとって重大な脅威となる。
実際の画像に対するパッチアタックをユーザが評価できるデジタルベンチマークであるREAPベンチマークを提案する。
Mapillary Vistasデータセットの上に構築された私たちのベンチマークには、14,000以上のトラフィックサインが含まれています。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:46:35 GMT)
A serial dual-channel library occupancy detection system based on Faster
RCNN [14.9] ソフトウェアベースのシート予約やセンサーベースの占有検知といった既存のソリューションは、この問題に効果的に対処するには不十分であることが証明されている。
本稿では,Faster RCNNに基づく2チャネルオブジェクト検出モデルを提案する。
このモデルは,図書館内の座席の全てを識別し,座席の占有状況に関するリアルタイム情報を継続的に更新するように設計されている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:11:02 GMT)
DiLogics: Creating Web Automation Programs With Diverse Logics [14.7] 我々は,NLPを利用してWebオートメーションプログラムの作成を支援するプログラミング・バイ・デモレーションシステムであるDiLogicsを提案する。
各ステップでユーザデモを記録することで、DiLogicsはWebマクロを新しいがセマンティックに類似したタスク要求に一般化する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:33:39 GMT)
Distributed Robust Learning-Based Backstepping Control Aided with
Neurodynamics for Consensus Formation Tracking of Underwater Vessels [14.7] 本稿では,複数の水中船のコンセンサス生成追跡のための分散ロバスト学習に基づく制御について述べる。
海洋船舶のシステムパラメータは完全に未知であり、モデリングミスマッチ、海洋障害、騒音にさらされていると推定されている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:45:13 GMT)
V2A-Mapper: A Lightweight Solution for Vision-to-Audio Generation by
Connecting Foundation Models [14.5] 基礎モデル(FM)の上に人工知能システムを構築することは、AI研究の新たなパラダイムになりつつある。
本稿では,基礎モデル,特にCLIP,CLAP,AudioLDMを活用することで,この問題に対する軽量な解決策を提案する。
提案手法では,V2A-Mapperを高速に訓練し,高忠実で視覚的に整合した音を生成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:49:38 GMT)
SyncDiffusion: Coherent Montage via Synchronized Joint Diffusions [14.5] 複数の画像を縫い合わせると、しばしば目に見える縫い目になる。
本稿では,知覚的類似性損失からの勾配降下を通じて複数の拡散を同期するプラグイン・アンド・プレイモジュールSyncDiffusionを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:38:57 GMT)
DOMINO: Domain-invariant Hyperdimensional Classification for
Multi-Sensor Time Series Data [14.4] ノイズの多いマルチセンサ時系列データにおける分散シフト問題に対処する新しいHDC学習フレームワークであるDOMINOを提案する。
DOMINOは最先端(SOTA)DNNベースのドメイン一般化技術よりも平均2.04%高い精度で達成し、16.34倍高速なトレーニングと2.89倍高速な推論を提供する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:40:20 GMT)
Hard No-Box Adversarial Attack on Skeleton-Based Human Action
Recognition with Skeleton-Motion-Informed Gradient [14.4] 骨格に基づくヒトの行動認識法は、敵の攻撃に弱いことが示されている。
本稿では,攻撃者が被害者モデルや訓練データやラベルにアクセスできない新たな攻撃課題について考察する。
具体的には,スケルトン運動インフォームド・グラデーション(SMI)と呼ばれる攻撃の新たな勾配を計算するために,敵の損失を定義する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:34:40 GMT)
Adapt Your Teacher: Improving Knowledge Distillation for Exemplar-free
Continual Learning [14.4] 本研究は, 知識蒸留(KD)を正規化戦略として応用した, 既成のクラスインクリメンタルラーニングについて検討する。
KDベースの手法はCILでうまく使われているが、以前のタスクからトレーニングデータの例にアクセスできることなくモデルを規則化するのに苦労することが多い。
近年の試験時間適応法に触発されて,インクリメンタルトレーニング中に教師とメインモデルを同時に更新する手法であるTeacher Adaptation (TA)を導入した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:22:59 GMT)
A Large-scale Study of Spatiotemporal Representation Learning with a New
Benchmark on Action Recognition [14.2] BEARは5つのカテゴリ(異常、ジェスチャー、毎日、スポーツ、教育)に分類される18のビデオデータセットのコレクションである。
教師付き学習と自己指導型学習の両方によって事前訓練された6つの共通時間モデルについて、徹底的に評価した。
我々の観察では、現在の最先端技術は、実世界のアプリケーションに近いデータセット上でのハイパフォーマンスを確実に保証できないことを示唆している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:06:04 GMT)
Quantum Atomic Matter Near Two-Dimensional Materials in Microgravity [14.1] グラフェンや遷移金属ジアルコゲナイドのような2次元(2次元)原子平らな材料は、非伝統的なディラック電子スペクトルを示す。
本研究では, 微小重力下での低温原子との相互作用を効果的に設計し, 複雑な電子・原子集団量子相と現象の相乗効果をもたらすことを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:18:13 GMT)
KESDT: knowledge enhanced shallow and deep Transformer for detecting
adverse drug reactions [14.1] 本稿では,ADR検出のための知識強調シャロー・ディープトランスフォーマ(KESDT)モデルを提案する。
最初の問題に対処するため、浅い融合方式でトランスフォーマーモデルにドメインキーワードを組み込む。
低アノテートデータを克服するため、深層融合方式でトランスフォーマーモデルに同義集合を統合する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:10:11 GMT)
Test Code Refactoring Unveiled: Where and How Does It Affect Test Code
Quality and Effectiveness? [13.9] リファクタリングは、生産コードの品質に関して、過去に広く研究されてきた。
開発者がどのようにコードをテストするかについては、まだ調査の欠如がある。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:25:53 GMT)
Leveraging Large Language Models for DRL-Based Anti-Jamming Strategies
in Zero Touch Networks [13.9] Zero Touch Networks (ZTN) は、人間の介入を最小限に抑え、完全自動化された自己最適化ネットワークの実現を目指している。
ZTNの利点は効率性とスケーラビリティにあるが、透明性、適応性、および人間の信頼に関わる課題は依然として一般的である。
本稿では,Large Language Models(LLM)をZTNに統合し,ネットワーク透過性を高め,ユーザインタラクションを改善する可能性を明らかにする。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:13:23 GMT)
From Hope to Safety: Unlearning Biases of Deep Models by Enforcing the
Right Reasons in Latent Space [13.8] ディープニューラルネットワークは、トレーニングデータに埋め込まれた急激な相関を学習する傾向があるため、潜在的なバイアスのある予測につながる。
これは、医療応用など、高い意思決定のためにこれらのモデルをデプロイする際のリスクを生じさせる。
本稿では,モデルが勾配によってバイアスに対する感度を低下させることにより,概念レベルでの適切な理由を保証する手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:07:46 GMT)
Transformer-based Detection of Microorganismson High-Resolution Petri
Dish Images [13.6] 医療や医薬品のプロセスには、継続的な衛生モニタリングに関する厳格なガイドラインがある。
これはしばしば、ペトリ料理の微生物を訓練された職員によって手動で数えるという労働集約的な作業を伴う。
本稿では,新しい変圧器変動を利用した高分解能検出パイプラインであるAttnPAFPNを紹介する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:07:38 GMT)
Digital Twin-Oriented Complex Networked Systems based on Heterogeneous
node features and interaction rules [13.3] 本研究では,Digital Twin-Oriented Complex Networked Systemsのための拡張可能なモデリングフレームワークを提案する。
我々は,これらのネットワークに広まる流行に関連するネットワーク成長と異なる透過性に関する様々な特徴と規則を取り入れたシミュレーションベースのDT-CNSの実験を行う。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:54:48 GMT)
Audio-Visual Spatial Integration and Recursive Attention for Robust
Sound Source Localization [13.3] 人間は、音源を見つけるための空間的手がかりとして、オーディオと視覚の両方のモダリティを利用する。
両モードの空間的手がかりを統合した音声・視覚空間統合ネットワークを提案する。
提案手法はより堅牢な音源定位を実現する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:19:52 GMT)
Distribution shift mitigation at test time with performance guarantees [13.2] 分散シフトはグラフニューラルネットワーク(GNN)のテスト性能に悪影響を及ぼす可能性がある
既存のアプローチは、分散シフトに対するGNNの堅牢性を高めるか、あるいはシフト自体を減らすことによって、この問題を軽減する。
特徴再構成を行うための汎用フレームワークFR-GNNを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:34:37 GMT)
Online Class Incremental Learning on Stochastic Blurry Task Boundary via
Mask and Visual Prompt Tuning [13.2] 継続的な学習は、連続したデータストリームからモデルを学習することを目的としていますが、主に、明確なタスク境界を持つ固定されたデータとタスクを前提としています。
実世界のシナリオでは、入力データやタスクの数は常に統計的に変化しており、静的ではない。
我々は,実世界の統計特性を反映した,Si-Blurryと呼ばれる新たなインクリメンタルBlurryタスクシナリオを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:52:56 GMT)
FineRecon: Depth-aware Feed-forward Network for Detailed 3D
Reconstruction [13.2] ポーズ画像からの3次元再構成に関する最近の研究は、深層ニューラルネットワークを用いてシーンレベルの3次元幾何を直接推定できることを実証している。
推論に基づく3次元再構成の忠実度を改善するための有効な3つの方法を提案する。
提案手法はスムーズかつ高精度な再構成を行い,多深度および3次元再構成の指標において顕著な改善が見られた。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:35:08 GMT)
Non-Adiabatic Effect in Topological and Interacting Charge Pumping [13.1] 我々は、量子化された電荷ポンプからのこの偏差とポンプ円後の絡み合いの発生との関係を論じる。
本稿では,ライス-メレ-ハバードモデルにおいて,ブロックウォール型量子回路モデルとして表現可能な可溶性ポンプ方式を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:33:11 GMT)
Source-free Domain Adaptive Human Pose Estimation [13.0] HPE(Human Pose Estimation)は、モーション分析、ヘルスケア、バーチャルリアリティーなど、さまざまな分野で広く使われている。
これを解決する1つのアプローチは、合成データセット上でHPEモデルをトレーニングし、実世界のデータに対してドメイン適応を実行することである。
HPEの既存のDAメソッドは、適応プロセスでソースデータとターゲットデータの両方を使用することで、データのプライバシとセキュリティを無視する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 23:50:47 GMT)
Synergistic Integration of Large Language Models and Cognitive
Architectures for Robust AI: An Exploratory Analysis [12.9] 本稿では、知的行動を示す人工エージェントの構築において、AIの2つのサブカテゴリを統合するための代替手段について検討する:大規模言語モデル(LLM)と認知アーキテクチャ(CA)である。
さまざまなシナジスティックアプローチが、それぞれの弱点と限界を相互に補うことができ、最終的にはより堅牢で洗練された人工知能システムを育むことができる、という仮説を立てる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 21:42:47 GMT)
Loss of Plasticity in Deep Continual Learning [12.9] 連続学習のためのデータセットをタスクのシーケンスとして利用して,可塑性損失の実証を行う。
このアルゴリズムは従来のバックプロパゲーションをわずかに修正し、各例の後で少数の未使用単位を再利用する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 21:56:39 GMT)
WIKITIDE: A Wikipedia-Based Timestamped Definition Pairs Dataset [12.7] ウィキタイデはウィキペディアから抽出したタイムスタンプ定義のペアから抽出したデータセットである。
我々の結果は、WikiTiDeのシードバージョンをブートストラップすると、より微調整されたモデルが得られることを示唆している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:31:52 GMT)
Design and execution of quantum circuits using tens of superconducting
qubits and thousands of gates for dense Ising optimization problems [12.5] 本研究では,各層におけるコストハミルトニアンのすべての相互作用のサブセットをパラメトリズする,既存のアンサツェから派生した,変動最適化のためのハードウェア効率の良いアンサッツを開発する。
最大5000個の2量子ビットおよび5000個の1量子ビットネイティブゲートを含む回路において、ランダムな推定オラクルを使用するよりも、性能が大幅に向上したことを報告した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:36:38 GMT)
AI Hilbert: From Data and Background Knowledge to Automated Scientific
Discovery [12.4] ケプラーの第3惑星運動法則を含む有名な科学法則は、部分的に正しい背景公理の集合から自動的に導出できることを示す。
さらに、二項変数と論理的制約を用いて最小の複雑性の概念をモデル化し、混合整数や半定値最適化による最適化問題を解き、科学的な発見の有効性を自動証明する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:19:41 GMT)
CCFace: Classification Consistency for Low-Resolution Face Recognition [12.1] TinyFaceやSCFaceのような現実の低解像度のベンチマークに適用した場合、ディープフェイス認識手法はパフォーマンスを著しく低下させる。
本稿では,学習した分類器を高分解能モデルから低分解能ネットワークへ変換する新しい分類整合性知識蒸留手法を提案する。
提案手法は,高分解能ベンチマークの性能を維持しながら,TinyFaceを3%改善した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:24:52 GMT)
A hybrid Decoder-DeepONet operator regression framework for unaligned
observation data [12.1] 非整合データを扱うために,Decoder-DeepONet演算子回帰フレームワークを提案する。
また、トレーニングデータの平均フィールドを入力拡張として利用するMulti-Decoder-DeepONetを導入する。
その結果,非整合観測データを扱う上でDecoder-DeepONetとMulti-Decoder-DeepONetの利点を示し,予測精度を向上する可能性を示した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:32:55 GMT)
Dynamic Snake Convolution based on Topological Geometric Constraints for
Tubular Structure Segmentation [12.1] 我々はこの知識を用いてDSCNetを誘導し、特徴抽出、特徴融合、損失制約という3つの段階の認識を同時に強化する。
2Dおよび3Dデータセットの実験により、DSCNetは管状構造セグメンテーションタスクにおいて、いくつかの手法と比較して精度と連続性が高いことを示した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:12:06 GMT)
Logistics Hub Location Optimization: A K-Means and P-Median Model Hybrid
Approach Using Road Network Distances [11.8] ロジスティックハブは、最終マイルの配送距離において重要な役割を果たす。
電子商取引業界は、都市環境における資源配分の最適化の必要性を強めている。
本研究では,ロジスティックハブの配置を最適化するためにハイブリッドアプローチを用いる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:28:07 GMT)
Multi-scale Target-Aware Framework for Constrained Image Splicing
Detection and Localization [11.8] 統合パイプラインにおける特徴抽出と相関マッチングを結合するマルチスケールなターゲット認識フレームワークを提案する。
提案手法は,関連パッチの協調学習を効果的に促進し,特徴学習と相関マッチングの相互促進を行う。
我々の実験では、統一パイプラインを用いたモデルが、いくつかのベンチマークデータセット上で最先端の手法より優れていることを示した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:38:30 GMT)
CoVLR: Coordinating Cross-Modal Consistency and Intra-Modal Structure
for Vision-Language Retrieval [11.5] 我々は,新しい直接協調型視覚言語検索法(dubed CoVLR)を提案する。
CoVLRは、クロスモーダルアライメントと単一モーダルクラスタ保存タスクの間の非同期問題を研究・緩和することを目的としている。
ベースラインと比較して、クロスモーダル検索能力を保ちながら、シングルモーダル検索精度を向上させることができる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:32:17 GMT)
Deep Boosting Multi-Modal Ensemble Face Recognition with Sample-Level
Weighting [11.4] 深層畳み込みニューラルネットワークは顔認識において顕著な成功を収めた。
現在のトレーニングベンチマークは、不均衡な品質分布を示している。
これは、訓練中に不足しているため、ハードサンプルの一般化に問題を引き起こす。
有名なAdaBoostにインスパイアされた本研究では、FR損失に異なるサンプルの重要性を組み込むためのサンプルレベルの重み付け手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:44:54 GMT)
Causal Interpretable Progression Trajectory Analysis of Chronic Disease [11.4] 慢性疾患は死因の主要な原因であり、疾患進行軌跡の正確な予測の必要性を強調している。
既存の機械学習モデルには因果解釈可能な予測を提供する能力がない。
本研究では,この限界に対応するために,因果軌道予測(CTP)と呼ばれる新しいモデルを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:58:31 GMT)
Time Series Predictions in Unmonitored Sites: A Survey of Machine
Learning Techniques in Water Resources [11.3] モニタリングされていない場所での動的環境変数の予測は、水資源科学の長年の課題である。
現代の機械学習手法は、水文時系列予測のためのプロセスベースおよび経験的モデルよりもますます優れている。
ストリームフロー,水質,その他の水資源予測における機械学習の最先端技術応用について概説する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:30:33 GMT)
Hindsight-DICE: Stable Credit Assignment for Deep Reinforcement Learning [11.1] 我々は,既存の重要度・重要度比推定手法をオフ政治評価に適用し,いわゆる後見政策手法の安定性と効率を大幅に向上させる。
我々の後視分布補正は、信用代入がベースライン手法を悩ませている広範囲の環境において、安定的で効率的な学習を容易にする。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:35:02 GMT)
On Gradient-like Explanation under a Black-box Setting: When Black-box
Explanations Become as Good as White-box [11.1] 本稿では,ブラックボックス設定下で勾配のような説明を行うGEEXについて述べる。
画像データに着目して,提案手法が最先端のブラックボックス法より優れていることを示す実験を行った。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:24:57 GMT)
Summary of the 3rd International Workshop on Requirements Engineering
and Testing [11.0] RETワークショップシリーズは、Requireements Engineering(RE)とTestingの2つの異なる分野の研究者と実践者のためのミーティングポイントを提供する。
目標は、アイデア、課題、プラクティス、経験、成果の交換を通じて、これらの2つの領域の接続性と整合性を改善することです。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:32:23 GMT)
Fundamental limits on quantum cloning from the no-signalling principle [10.6] 閉包定理は量子暗号の基礎である。
我々の結果は、量子力学の法則に従わないクローンマシンに対しても成り立つ。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:31:17 GMT)
Generative AI Assistants in Software Development Education: A vision for
integrating Generative AI into educational practice, not instinctively
defending against it [10.2] ジェネレーティブAI(GAI)アシスタントは、人々の想像力(と恐怖)に火をつけた
業界がどのように適応するかは不明だが、大規模なソフトウェア企業によってこれらの技術を統合する動きは、意図と方向性を明確に示している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:08:02 GMT)
Quantitative Susceptibility Mapping through Model-based Deep Image Prior
(MoDIP) [10.2] モデルベースDeep Image Prior(モデルベースDeep Image Prior)と呼ばれるトレーニング不要なモデルベース教師なし手法を提案する。
MoDIPは、訓練されていない小さなネットワークと、データフィデリティ最適化(DFO)モジュールで構成される。
計算効率は33%向上し、従来のDIPベースのアプローチの4倍高速である。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:07:39 GMT)
Generalized Bandit Regret Minimizer Framework in Imperfect Information
Extensive-Form Game [9.9] 我々は,IIEGのダイナミクスを知らない対話型バンディットフィードバック設定の問題点を考察する。
NEを学習するには、後悔最小化器は、全フィードバック損失勾配$ellt$ by $v(zt)$を推定し、後悔を最小化する。
モデルフリーであり、$O(sqrtX B/T+sqrtY C/T)$から$O()$までの最良の収束率を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:16:12 GMT)
LaRS: A Diverse Panoptic Maritime Obstacle Detection Dataset and
Benchmark [9.9] 我々は,湖沼,河川,海のシーンを特徴とする,最初の海洋パノビュータ障害物検出ベンチマークLaRSを提示する。
LaRSは1ピクセルあたり4000以上のラベル付きキーフレームと9つの前のフレームで構成され、時間的テクスチャの利用を可能にしている。
本稿では,27のセマンティック・パノプティック・セグメンテーション手法と,いくつかのパフォーマンスインサイトと今後の研究方向性について報告する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:21:15 GMT)
How important are specialized transforms in Neural Operators? [9.8] 本稿では,変換型ニューラル演算子の成功に対する変換層の重要性について検討する。
驚いたことに、線形層は最もよく知られた変換ベースの層に匹敵する性能を提供するのに十分である。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:35:13 GMT)
Predictive Authoring for Brazilian Portuguese Augmentative and
Alternative Communication [9.6] 本稿では,ブラジルの BERT 版 BERTimbau を用いて,AAC システムにおけるピクトグラムの予測を行う。
BERTimbauを微調整するため,ブラジルポルトガル語をトレーニングコーパスとして使用するAACコーパスを構築した。
同義語の使用は難易度を低下させるが、字幕の使用は最も高い精度に繋がる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:14:25 GMT)
Microscopy Image Segmentation via Point and Shape Regularized Data
Synthesis [9.5] 合成学習データを用いた顕微鏡画像セグメンテーションのための統一パイプラインを構築した。
本フレームワークは,濃密なラベルを持つ高精度な顕微鏡画像で訓練されたモデルと同等の結果が得られる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:00:53 GMT)
Learning Computational Efficient Bots with Costly Features [9.4] 本稿では,入力特徴の計算コストを考慮した汎用的なオフライン学習手法を提案する。
本稿では,D4RLベンチマークや複雑な3D環境など,様々なタスクにおける本手法の有効性を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:43:31 GMT)
LFM-3D: Learnable Feature Matching Across Wide Baselines Using 3D
Signals [9.2] 学習可能なマーカは、画像ペア間のコビジュアビリティの小さな領域だけが存在する場合、しばしば性能が低下する。
グラフニューラルネットワークに基づくモデルを用いた学習可能な特徴マッチングフレームワーク LFM-3D を提案する。
その結果,画像対の相対的ポーズ精度が向上し,画像対の相対的ポーズ精度が向上することがわかった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:25:57 GMT)
Inferior Alveolar Nerve Segmentation in CBCT images using
Connectivity-Based Selective Re-training [9.2] Inferior Alveolar Nerve (IAN) canal detection in CBCT is a important step in many Dental and maxillofacial surgery application。
ToothFairy2023 Challengeは、すべてのスパースラベルと部分密度ラベルからなる3次元顎顔面データセットを確立することを目的としている。
擬似ラベリングによる自己学習に着想を得て,IAN接続に基づく選択的再学習フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:48:23 GMT)
Carbon cluster emitters in silicon carbide [8.7] 4H-SiCの欠陥量子ビットは、量子技術における多くの応用の優れた候補である。
炭素クラスターは、4H-SiCの熱酸化または照射中に発生する放出源として機能する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:53:10 GMT)
Importance of Aligning Training Strategy with Evaluation for Diffusion
Models in 3D Multiclass Segmentation [8.6] DDPMに基づく2つの大規模マルチクラスデータセット上の3次元マルチクラスセグメンテーションのためのセグメンテーションモデルについて検討した。
その結果,既存のDDPM法では訓練方法と試験方法の違いが劣ることがわかった。
この不整合を緩和するため, モデルの予測に基づいて, 劣化したマスクを生成するリサイクル手法を提案した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:31:45 GMT)
Differentiable Retrieval Augmentation via Generative Language Modeling
for E-commerce Query Intent Classification [8.6] 知識検索と外部コーパスによる下流モデルを強化し,単にモデルパラメータの数を増大させるだけでなく,テキスト分類や質問応答など多くの自然言語処理(NLP)タスクにもうまく適用されている。
レトリバーと下流モデルを別々にあるいは非同期にトレーニングする既存の方法は、主に2つの部分間の非微分性のため、通常、エンドツーエンドのジョイントトレーニングと比較して性能が劣化する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:05:35 GMT)
Perceptions and Realities of Text-to-Image Generation [8.6] 生成人工知能(AI)は広く普及している技術であり、社会や個人に大きな影響を与える。
本研究は,テキスト・ツー・イメージ・ジェネレーションに対する人々の認識に関する調査研究の成果である。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:24:15 GMT)
Toward Transparent AI: A Survey on Interpreting the Inner Structures of
Deep Neural Networks [8.4] インナー・インタープリタビリティ・ツールに焦点をあてて300を超える研究をレビューする。
そこで我々は,ネットワークのどの部分で説明できるかによって,メソッドを分類する分類法を提案する。
我々は、解釈可能性研究における現状は、主に非生産的であると論じる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 21:14:43 GMT)
Capacity Bounds for Hyperbolic Neural Network Representations of Latent
Tree Structures [8.3] 本稿では,ReLUアクティベーション機能を持つHNN(Deep Hyperbolic Neural Network)の表現能力について検討する。
HNN が任意の有限重み付き木を少なくとも 2$ に等しい次元の双曲空間に埋め込むことができるという最初の証明を確立する。
グラフ表現を実装するHNNのネットワーク複雑性は,表現の忠実さ/歪みとは無関係であることがわかった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:24:32 GMT)
Learning from A Single Graph is All You Need for Near-Shortest Path
Routing in Wireless Networks [8.2] 無線ネットワークの標準モデルにおいて,任意のランダムグラフに一般化しながら,単一のグラフから得られるデータサンプルを数個だけ必要とするような局所ルーティングポリシーの学習アルゴリズムを提案する。
そこで我々はディープニューラルネットワーク(DNN)を訓練し、局所的なルーティングポリシーを効率的に学習することで、全ペアに近い経路問題を解決する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 21:35:45 GMT)
Training-based Model Refinement and Representation Disagreement for
Semi-Supervised Object Detection [8.1] 半教師付き物体検出(SSOD)は、既存の物体検出器の性能と一般化を改善することを目的としている。
近年のSSOD法は, 古典的指数移動平均 (EMA) 戦略を用いて, モデル改良の不十分さが問題となっている。
本稿では,新しいトレーニングベースモデル改良段階と,シンプルで効果的な表現不一致(RD)戦略を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:51:13 GMT)
Denoising diffusion-based MR to CT image translation enables whole spine
vertebral segmentation in 2D and 3D without manual annotations [8.1] 本研究は,T1wとT2wのMR画像系列をCT/MRの合計263対のCT画像に変換することを含む。
椎骨登録1回あたりの2つのランドマークは、MRIからCTへの画像と画像の変換を可能にし、すべての未経験のアプローチより優れていた。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:07:15 GMT)
Improving Buoy Detection with Deep Transfer Learning for Mussel Farm
Automation [7.9] ニュージーランドの養殖業は急速に拡大しており、特に貝類の輸出に重点を置いている。
ムッセル農業活動の需要が発展を続けるにつれ、人工知能とコンピュータビジョン技術の統合が、運用効率を高める効果的なアプローチとして現れつつある。
本研究は, 深層学習手法を活用して, ブイ検出の高度化を図っている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:53:47 GMT)
HyperLoRA for PDEs [7.9] 物理インフォームドニューラルネットワーク(PINN)は、偏微分方程式の解に対するニューラルネットワークの開発に広く用いられている。
PINNの欠点は、初期境界条件やPDE係数の変化に応じて再訓練する必要があることである。
モデルベースのメタ学習技術であるHypernetworkは、パラメータ化されたタスクを入力として埋め込み、PINNの重みを出力として予測する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:29:48 GMT)
LivePose: Online 3D Reconstruction from Monocular Video with Dynamic
Camera Poses [7.8] ScanNet上で動作するSLAMシステムからの動的ポーズを含むLivePoseというデータセットを導入する。
本稿では,古いシーンコンテンツを削除することを学習する新しい非線形分解モジュールを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:50:36 GMT)
Deep Learning Techniques in Extreme Weather Events: A Review [7.3] 本総説は,その分野における最先端の深層学習の概要を概観することを目的としている。
天気予報の様々な側面において,ディープラーニングアーキテクチャの利用について検討する。
複雑なパターンや非線形関係をキャプチャする能力など、ディープラーニングの可能性を強調します。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:15:21 GMT)
LibreFace: An Open-Source Toolkit for Deep Facial Expression Analysis [7.2] 表情解析のためのオープンソースのツールキットLibreFaceを紹介する。
ディープラーニングモデルによる顔の動作のリアルタイムおよびオフライン分析を提供する。
また,本モデルでは,最先端の表情解析手法と競合する性能を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 00:33:29 GMT)
Metadata Improves Segmentation Through Multitasking Elicitation [6.9] 本稿では,畳み込みネットワークにおけるチャネル変調機構を用いてメタデータを組み込み,セマンティックセグメンテーションタスクに与える影響について検討する。
畳み込みネットワークへの付加的な入力としてのメタデータは、一般的なモデルに対するピンブルアドオンとして実装が安価でありながらセグメンテーション結果を改善することができることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:23:55 GMT)
Multi-feature concatenation and multi-classifier stacking: an
interpretable and generalizable machine learning method for MDD
discrimination with rsfMRI [6.9] 機械学習アルゴリズムは、RSfMRIの豊富な情報を活用し、MDD患者を正常なコントロールから識別するために開発された。
本稿では、複数の特徴を連結し、複数の分類器を積み重ねることでMDD識別のための機械学習手法(MFMC)を提案する。
MFMCは96.9%のMDD識別精度を示し、既存の方法よりも大幅に改善されている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:40:56 GMT)
Robust Uncertainty Quantification using Conformalised Monte Carlo
Prediction [6.9] 不確実量化(UQ)手法は、予測毎のモデルの信頼性を推定する。
我々は新しい適応モンテカルロ(MC)ドロップアウト法と共形予測(CP)を組み合わせた新しいハイブリッドUQ手法であるMC-CPを紹介する。
MC-CPは、分類と回帰のベンチマークにおいて、MCドロップアウト、RAPS、CQRといった高度なUQ手法よりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:07:01 GMT)
ChatHaruhi: Reviving Anime Character in Reality via Large Language Model [6.8] 改良されたプロンプトとスクリプトから抽出した文字の記憶によって言語モデルを制御するアルゴリズムを提案する。
我々は,中国語/英語テレビ/アニメの32文字を54k以上の模擬対話でカバーするChatHaruhiを構築した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:50:25 GMT)
Which Transformer to Favor: A Comparative Analysis of Efficiency in
Vision Transformers [6.7] 視覚変換器および関連アーキテクチャの効率を評価するために,30モデル以上の包括的解析を行う。
私たちのベンチマークは、効率指向のトランスフォーマーのランドスケープに匹敵するベースラインを提供します。
FLOPS数とトレーニングメモリとの間には強い正の相関関係が発見され,必要なVRAMの推定が可能となった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:06:49 GMT)
Feature Affinity Assisted Knowledge Distillation and Quantization of
Deep Neural Networks on Label-Free Data [6.6] 深層ニューラルネットワーク(DNN)の量子化学習を改善するための機能親和性(FA)支援知識蒸留(KD)法を提案する。
FA損失は、従来のKDで最終回答を与えるのではなく、生徒にソリューションの中間ステップを教える役割を担っている。
その結果、量子化された学生ネットワークは、ラベル付き地上データよりも強い監督を受けていることがわかった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:29:21 GMT)
Solving Schr\"odinger Equation with a Language Model [6.5] 本稿では,言語モデルで使用されるトランスフォーマーアーキテクチャに基づいて,QiankunNetという機械学習モデルを提案する。
QiankunNetは複雑な量子相関を十分に捉え、その表現力を高める。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:58:39 GMT)
Learning Representations on Logs for AIOps [6.5] 大規模言語モデル(LLM)は、膨大な量のラベルのないデータに基づいて自己監督を用いて訓練される。
本稿では,パブリックおよびプロプライエタリなログデータに基づいてトレーニングされたログデータのためのLLMを提案する。
提案するLLMは,公開およびプロプライエタリなログデータに基づいてトレーニングされ,複数のダウンストリームタスクにおいて優れたパフォーマンスを提供する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:34:46 GMT)
Investigating the Interplay between Features and Structures in Graph
Learning [6.4] 過去には、メッセージパッシング手法のノード分類予測の改善と、ホモフィリィに強く関連していると考えられていた。
最近では、グラフが完全にヘテロ親和性であるが性能が高いノード分類タスクを構築することができるため、そのような二分法は単純すぎると研究者らは指摘した。
本研究は,ノード分類タスクの2つの生成過程を定式化することにより,この強い仮定が成立しない場合に何が起こるかを検討する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:02:56 GMT)
Baird Counterexample Is Solved: with an example of How to Debug a
Two-time-scale Algorithm [6.4] Baird反例は1995年にLeemon Bairdによって提案され、この例で時間差分(TD(0))アルゴリズムが分岐することを示すために最初に使われた。
勾配性TDアルゴリズムは、Baird反例におけるTDの分散問題を解いた。
しかし、この例におけるそれらの収束は依然として非常に遅く、遅くなる性質はよく理解されていない。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 00:46:42 GMT)
Hybrid Models for Mixed Variables in Bayesian Optimization [6.2] 混合変数の管理に有効なベイズ最適化(BO)のための新しいタイプのハイブリッドモデルを提案する。
提案手法は,モンテカルロ木探索構造(MCTS)とガウス過程(GP)を融合したハイブリッドモデルである。
代理モデリングフェーズにおける私たちの革新の中心は、混合変数BOのオンラインカーネル選択です。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:34:57 GMT)
Self-Supervised Single-Image Deconvolution with Siamese Neural Networks [6.1] 画像再構成における逆問題は、未知のノイズ特性によって根本的に複雑である。
ディープラーニングの手法は、ノイズのフレキシブルなパラメトリゼーションを可能にし、データから直接その特性を学習する。
我々は3次元デコンボリューションタスクにおけるトレーニング速度アップを提供する高速フーリエ変換畳み込み問題に対処する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:51:11 GMT)
Variance reduction techniques for stochastic proximal point algorithms [5.9] 本稿では,SVRG,SAGAの近位バージョンと,そのスムーズな凸関数に対する変種について紹介する。
数値実験により, 勾配法に対する近似分散低減法の利点を実証した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:11:50 GMT)
Can Unstructured Pruning Reduce the Depth in Deep Neural Networks? [5.9] プルーニングは、パフォーマンスを維持しながら、ディープニューラルネットワークのサイズを減らすために広く使われているテクニックである。
本研究では,深層ニューラルネットワークのサイズを減らし,その性能を保ちつつ,革新的なエントロピー誘導型プルーニングアルゴリズムであるEGPを紹介する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:00:23 GMT)
LSCD: A Large-Scale Screen Content Dataset for Video Compression [5.9] 714のソースシーケンスを含む大規模画面コンテンツデータセットを提案する。
本稿では,スクリーンコンテンツビデオの特徴を示すために提案したデータセットの分析を行う。
また、従来の手法と学習法の両方のパフォーマンスを含むベンチマークも提供する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:27:35 GMT)
How susceptible are LLMs to Logical Fallacies? [5.7] 論理的誤りに対する大規模言語モデルの堅牢性を評価するための診断ベンチマークであるLOGICOMを提案する。
本稿では,GPT-3.5とGPT-4の性能を評価するために,議論の的となっているトピックを含むデータセットを用いて評価を行う。
以上より, GPT-3.5 と GPT-4 は理屈によって意見の調整が可能であることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 23:07:29 GMT)
OCR Language Models with Custom Vocabularies [5.6] 本稿では,OCRシステムにおける汎用言語モデルに対して,実行時にドメイン固有の単語ベース言語モデルを効率的に生成し,アタッチするアルゴリズムを提案する。
また,CTCビームサーチデコーダを改良し,将来的な語彙の完成を前提として仮説を競合状態に保たせるようにした。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:46:11 GMT)
Accelerated materials language processing enabled by GPT [5.5] 我々は材料言語処理のための生成変換器(GPT)対応パイプラインを開発した。
まず、関連する文書をスクリーニングするためのGPT対応文書分類手法を開発する。
第二に、NERタスクでは、エンティティ中心のプロンプトを設計し、そのほとんどを学習することで、パフォーマンスが改善された。
最後に,GPT対応抽出QAモデルを開発し,性能の向上とアノテーションの自動修正の可能性を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:31:13 GMT)
VALERIE22 -- A photorealistic, richly metadata annotated dataset of
urban environments [5.4] VALERIEツールパイプラインは、ドメイン固有の要素の理解に寄与するために開発された合成データジェネレータである。
VALERIE22データセットは、フォトリアリスティックセンサーシミュレーションを提供するVALERIEプロシージャツールパイプラインで生成された。
データセットは独自のリッチなメタデータセットを提供し、特定のシーンとセマンティックな特徴の抽出を可能にする。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:44:45 GMT)
On the Limitations of Model Stealing with Uncertainty Quantification
Models [5.4] モデルステルスは、オリジナルのトレーニングコストのごく一部で、犠牲者モデルの機能を推測することを目的としている。
実際には、モデルのアーキテクチャ、重み寸法、および元のトレーニングデータを正確に決定することはできない。
複数の可能なネットワークを生成し、それらの予測を組み合わせることで、盗まれたモデルの品質を改善する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:35:05 GMT)
Local Function Complexity for Active Learning via Mixture of Gaussian
Processes [5.4] 実世界のデータにおける不均一性は、観測ノイズレベルの変化や源関数の構造的複雑さの変化により、統計的推測に固有の課題が生じる。
本稿では,局所関数複雑性(LFC)の推定に関する最近の理論的結果について述べる。
我々は、LPSベースのLFCのガウスプロセス回帰(GPR)に基づくアナログを導出、推定し、上記のフレームワークの代用として使用し、堅牢でスケーラブルにする。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:32:13 GMT)
Architectures of Topological Deep Learning: A Survey on Topological
Neural Networks [5.3] トポロジカルディープラーニング(TDL)は、複雑なシステムに関連するデータから知識を処理、抽出するためのフレームワークを提供する。
TDL文学の急速な成長は、トポロジカルニューラルネットワーク(TNN)アーキテクチャにおける表記と言語の統合の欠如につながっている。
これは、既存の作業の上に構築し、TNNを新たな現実的な問題にデプロイする上で、真の障害となる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:59:31 GMT)
Window-Based Early-Exit Cascades for Uncertainty Estimation: When Deep
Ensembles are More Efficient than Single Models [5.0] アンサンブルは、アーキテクチャファミリ内の単一モデルをスケーリングするよりも、より計算的に(推論において)効率的であることを示す。
本研究では,不確実性推定に関連する課題に対して,これらの効率性の向上について検討する。
多数のネットワークアーキテクチャおよび不確実性タスクにわたるImageNetスケールデータの実験により、提案したウィンドウベースの早期実行アプローチは、より優れた不確実性計算トレードオフを実現することができることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:51:30 GMT)
Scope is all you need: Transforming LLMs for HPC Code [5.0] 本稿では,HPCにおける前処理やコンパイル中心のタスクに特化して設計された,Tokompilerという新しいトークン機構を提案する。
Tokompilerは言語プリミティブの知識を活用して、言語指向のトークンを生成し、コード構造をコンテキスト対応で理解する。
その結果、Tokompilerは従来のトークン化ツールに比べてコード補完精度と意味理解を著しく向上させることがわかった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:12:03 GMT)
Deciphering knee osteoarthritis diagnostic features with explainable
artificial intelligence: A systematic review [4.9] 変形性膝関節症(OA)を診断するための既存の人工知能モデルは、その透明性と解釈可能性の欠如に対して批判を浴びている。
近年,説明可能な人工知能 (XAI) がモデルの予測に自信を与える特別な技術として出現している。
本報告では膝OA診断に用いるXAI技術について紹介する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:23:47 GMT)
Software Development in Startup Companies: The Greenfield Startup Model [4.9] 本研究の目的は,スタートアップが採用するソフトウェア開発戦略の理解を深めることである。
私たちはその結果をGreenfield Startup Model(GSM)にまとめました。
GSMがもたらす影響は課題とギャップを概説し、将来の研究がスタートアップのコンテキストにおけるエンジニアリングプラクティスを開発し、検証する機会を指摘した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:08:10 GMT)
Detecting and Preventing Hallucinations in Large Vision Language Models [4.7] M-HalDetectは、詳細な画像記述のための最初のマルチモーダル幻覚検出データセットである。
InstructBLIPから細粒度マルチモーダル報酬モデルを訓練し,その有効性を評価する。
LLaVAとmPLUG-OWLの幻覚をそれぞれ15%と57%低減する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:56:52 GMT)
A Two-Part Machine Learning Approach to Characterizing Network
Interference in A/B Testing [4.7] 異種ネットワーク干渉を識別し特徴付ける機械学習に基づく手法を提案する。
我々のアプローチは、潜伏する複雑なネットワーク構造を考慮し、"露光マッピング"のタスクを自動化する。
提案手法の有効性は,2つの合成実験と,100,200万人のInstagramユーザを対象とした実世界の大規模テストにより検証された。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 19:37:55 GMT)
Balancing Privacy and Performance for Private Federated Learning
Algorithms [4.7] Federated Learning(FL)は、複数のクライアントがプライベートデータを公開せずにモデルをトレーニングする分散機械学習フレームワークである。
FLアルゴリズムは、共有前に各クライアントのモデル更新にノイズを導入する差分プライバシーメカニズムを頻繁に採用する。
ローカルステップの数と通信ラウンドの間に最適なバランスがあることを示し、プライバシー予算内での収束性能を最大化する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 19:57:00 GMT)
Relation-aware graph structure embedding with co-contrastive learning
for drug-drug interaction prediction [4.6] 相関学習を併用した関係認識グラフ構造に基づく新しいDDI予測手法であるRaGSECoを提案する。
提案したRaGSECoは, マルチリレーショナルDDIグラフとマルチアトリビュートドラッグ・ドラッグ類似性(DDS)グラフの2つの異種薬物グラフを構築した。
薬物対表現(DP)を学習するための新しいコントラスト学習モジュールを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:30:00 GMT)
A Part-of-Speech Tagger for Yiddish [4.6] これは、音声タグと構文構造をYiddishテキストに自動的に割り当てる、より大きなプロジェクトの第一歩である。
現在の作業には2つのリソース – Penn Parsed Corpus of Historical Yiddish (PPCHY)の80Kワードサブセットと,Yiddish Book Center (YBC)のOCRのYiddishテキストの6億5000万ワード – が組み合わされている。
我々は、YBCで訓練された単純な非文脈的埋め込みでさえ、まずコーパスを「標準化」することなく、綴り変種間の関係を捉えることができることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:56:31 GMT)
Automated Semiconductor Defect Inspection in Scanning Electron
Microscope Images: a Systematic Review [4.5] 機械学習アルゴリズムは、半導体サンプルの欠陥を正確に分類し、特定するために訓練することができる。
畳み込みニューラルネットワークはこの点において特に有用であることが証明されている。
本稿では,SEM画像における半導体欠陥の自動検査の現状について概観する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:03:04 GMT)
Efficient Sensor Placement from Regression with Sparse Gaussian
Processes in Continuous and Discrete Spaces [4.4] 相関環境におけるセンサ配置問題を回帰問題に還元することで解決する。
我々は、センサを非点視野で処理し、統合的な観測を行うアプローチを一般化する。
提案手法は,情報経路計画アルゴリズムにおける大規模センサ配置と高速ロボットセンサ配置の両立を可能にする。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 21:10:59 GMT)
Decoupled conditional contrastive learning with variable metadata for
prostate lesion detection [4.3] 前立腺イメージング報告・データシステム(PI-RADS)は、病変悪性度スコアを定義して、前立腺MRIの標準化された解釈を行う。
PI-RADSデータは、ラジオロジーレポートから容易に入手できるが、レポート間のばらつきが高い。
サンプル毎に複数のアノテータを持つ弱いメタデータを利用する新しいコントラスト損失関数を提案する。
公開PI-CAIチャレンジデータセットでは,AUCが3%増加し病変検出が可能となった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:19:26 GMT)
Reconstruction, forecasting, and stability of chaotic dynamics from
partial data [4.3] 本研究では,部分的な観測から隠れカオス変数の力学を推定するためのデータ駆動手法を提案する。
提案するネットワークは,時間的・統計的に隠れた変数を予測できることを示す。
この研究は、完全な状態を再構築し、隠れた変数を推論し、部分的なデータからカオスシステムの安定性を計算する新しい機会を開く。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:33:59 GMT)
Exploring Sampling Techniques for Generating Melodies with a Transformer
Language Model [4.0] 異なるサンプリング手法が多様性や構造などの音楽的品質に与える影響について検討する。
分散トランケーションサンプリング手法を用いて生成したサンプルの音質を解析する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:34:46 GMT)
Emergent hydrodynamic behaviour of few strongly interacting fermions [4.0] 構成成分が著しく少ないシステムにおける流体力学の出現を実証する。
実験では, 単一粒子の分解, 粒子数の決定論的制御, 相互作用強度により, 微視的記述と流体力学の枠組みの境界を, 前例のない詳細で調べることができた。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:46:21 GMT)
Towards Grounded Visual Spatial Reasoning in Multi-Modal Vision Language
Models [3.9] 本研究では,視覚言語モデルによる空間関係の理解能力について検討する。
このギャップをよりよく理解するために,空間的関係のきめ細かい構成的接地を示す。
本稿では,空間的節のランク付けと空間関係推論タスクの性能評価のためのボトムアップ手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:58:54 GMT)
The Impact of Background Removal on Performance of Neural Networks for
Fashion Image Classification and Segmentation [3.8] ファッション画像から背景を取り除き、データ品質を高め、モデル性能を向上させる。
背景除去は、過度に適合しない単純で浅いネットワークにおいて、ファッションデータに対して効果的に機能する。
モデルのスクラッチからトレーニングする場合、FashionStyle14データセットの分類において、最大5%の精度でモデル精度を向上させることができる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:18:47 GMT)
On the Approximation of Bi-Lipschitz Maps by Invertible Neural Networks [3.7] Invertible Neural Network(INN)は、ディープニューラルネットワークアーキテクチャの重要なクラスである。
コンパクト領域上でのバイリプシッツ連続写像を近似するために,結合型 INN のクラスが持つキャパシティを解析する。
我々は、前方と逆写像を同時に近似する無限次元空間上の双Lipschitz写像を近似するアプローチを開発する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:01:45 GMT)
Path convergence of Markov chains on large graphs [3.7] 有限ラベル付きグラフ上の自然過程のクラスを2つ検討する。
グラフのサイズが無限大になるにつれて、プロセスのランダムな軌跡は決定論的極限に収束することを示す。
これらの極限は測度値グラフンの空間上の曲線である。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 00:13:59 GMT)
Poison Dart Frog: A Clean-Label Attack with Low Poisoning Rate and High
Attack Success Rate in the Absence of Training Data [3.7] バックドアアタックのための新しいクリーンラベル手法「Poison Dart Frog」を提案する。
Poison Dart Frogはトレーニングデータへのアクセスを必要としない。
LC、HTBA、BadNets、Blendに比べて高いアタック成功率を達成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:49:33 GMT)
Blockchain-Enabled Federated Learning: A Reference Architecture Design,
Implementation, and Verification [3.7] 本稿ではブロックチェーン対応フェデレーションラーニング(BCFL)のための革新的な参照アーキテクチャを提案する。
フェデレーションドラーニングとブロックチェーン技術の強みを融合させる。
我々のアーキテクチャでは、分散識別子(DID)ベースの認証システムが戦略的に採用されている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:04:12 GMT)
Robust Evaluation of Diffusion-Based Adversarial Purification [3.6] 拡散法に基づく浄化法は,試験時間における入力データ点からの逆効果を除去することを目的としている。
白箱攻撃はしばしば浄化の堅牢性を測定するために使用される。
本研究では, 従来の拡散法に比べてロバスト性の向上を図った新しい浄化法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:34:10 GMT)
GP-PCS: One-shot Feature-Preserving Point Cloud Simplification with
Gaussian Processes on Riemannian Manifolds [3.5] 本研究では,従来の表面再構成工程を使わずに,点雲の健全な構造的特徴と全体形状の両方を保存できるワンショット点雲簡略化法を提案する。
グリーディスペーシフィケーションスキームを用いて点を順次選択し、原雲の簡易版を得る。
提案手法は,複数のベンチマークおよび自己取得点クラウド上で評価し,既存の手法と比較し,登録および表面再構成の下流タスクにおける適用を実証し,実験性能と計算効率の両面で競合することを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:17:26 GMT)
Modelling Electricity Consumption in Irish Dairy Farms Using Agent-Based
Modelling [3.4] アイリッシュ・デイリー・ファームの電力消費をモデル化するためのエージェントベースモデルが提案されている。
このモデルでは、牧畜農家のエネルギー消費に影響を与える様々な要因を考慮に入れている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:54:38 GMT)
Uncertainty-based quality assurance of carotid artery wall segmentation
in black-blood MRI [3.4] 黒血MRIにおける頸動脈壁分画の完全自動アルゴリズムを開発した。
頸動脈を中心にした3Dパッチの巣状動脈壁を同定する。
本研究では,輪郭位置のモデル予測の不確かさが,誤り検出の代役となるかを検討する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:16:00 GMT)
How Do Java Developers Reuse StackOverflow Answers in Their GitHub
Projects? [3.3] StackOverflow (SO)は、ソフトウェア開発者およびコンピュータ科学者のための広く使われているQ&A(Q&A)ウェブサイトである。
GitHubは、ソフトウェアプロジェクトの保存、追跡、コラボレーションに使用されるオンライン開発プラットフォームである。
私たちは、GitHubで利用可能なJavaプロジェクトで再利用されたSOの回答をマイニングして、実証的研究を行いました。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:04:59 GMT)
A Tractable Online Learning Algorithm for the Multinomial Logit
Contextual Bandit [3.3] 我々は、意思決定者が消費者に製品のサブセットを提供する動的集合最適化問題を考える。
MNL(Multinomial Logit)モデルを用いて消費者選択行動のモデル化を行う。
後悔は$O(sqrtdT + kappa)$で束縛され、既存のメソッドよりもパフォーマンスが大幅に向上していることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:10:22 GMT)
SAMedOCT: Adapting Segment Anything Model (SAM) for Retinal OCT [3.2] Segment Anything Model (SAM) は画像セグメンテーションの分野で大きな注目を集めている。
我々は,RETOUCH チャレンジによる大規模な OCT データセット上で,SAM とその適応の包括的評価を行う。
網膜CTスキャンにおいてSAMの有効性は強力なセグメンテーションモデルとして応用されたが,確立された方法には遅れがみられた。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:26:22 GMT)
Revisiting Skin Tone Fairness in Dermatological Lesion Classification [3.2] ITAに基づく4つの皮膚音分類手法をISIC18データセットで検討・比較した。
ITAに基づく皮膚のトーン推定手法のリスクを実証する先行研究の間には高い相違点がみられた。
本研究は,ISIC18データセットにおける多様性の欠如が,公正度分析のためのテストベッドとしての利用を制限することを明らかにする。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:59:55 GMT)
Document Automation Architectures: Updated Survey in Light of Large
Language Models [3.0] 本稿では,文書自動化(DA)における技術の現状について調査する。
DAの目的は、異なるソースからの入力を自動生成して統合し、定義されたテンプレートに準拠した文書を組み立てることにより、文書作成時の手作業を削減することである。
DAの商業的ソリューションのレビューは、特に法律分野において行われてきたが、これまでDAアーキテクチャと技術に関する学術研究の包括的なレビューは行われていない。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:59:55 GMT)
Disparity, Inequality, and Accuracy Tradeoffs in Graph Neural Networks
for Node Classification [2.8] グラフニューラルネットワーク(GNN)は、属性付きグラフのノードラベルを予測するための重要な人間のアプリケーションで、ますます使われている。
保護されたグループと保護されていないグループのノード間の分離性を減少させるPFR-AXと、ブラックボックスポリシーに基づいたモデル予測を更新するPostProcessという2つの新しいGNN非依存的介入を提案する。
PFR-AXとPostProcessは,保護群におけるノードの正の結果を正確に予測した場合に,粒度制御とモデル信頼度の向上を図っている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:45:28 GMT)
Remote Bio-Sensing: Open Source Benchmark Framework for Fair Evaluation
of rPPG [2.8] r(pg photoplethysmography)は、カメラで捉えたヘモグロビンの光吸収特性を用いてBVP(Blood Volume Pulse)を測定し、分析する技術である。
本研究は,多種多様なデータセットを対象とした様々なrベンチマーク手法の評価を行い,妥当性評価と比較を行うためのフレームワークを提供することを目的とする。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:03:06 GMT)
Neural Superstatistics for Bayesian Estimation of Dynamic Cognitive
Model [2.7] 我々は,時間変化パラメータと時間不変パラメータの両方を復元できるベイズ推論のシミュレーションに基づくディープラーニング手法を開発した。
この結果から,ディープラーニングアプローチは時間的ダイナミクスを捉える上で極めて効率的であることが示唆された。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:52:27 GMT)
Multi-Scale Relational Graph Convolutional Network for Multiple Instance
Learning in Histopathology Images [2.7] マルチスケールグラフ畳み込みネットワーク(MS-RGCN)をマルチラーニング手法として導入する。
病理組織像パッチと近隣のパッチと他のスケールのパッチとの関係をグラフとしてモデル化する。
前立腺癌の病理組織像を実験的に検討し,パッチから抽出した特徴に基づいて拡大群を予測した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 21:44:59 GMT)
End-to-End Test Coverage Metrics in Microservice Systems: An Automated
Approach [2.6] 本稿では、マイクロサービスエンドポイントのE2Eテストスイートカバレッジの範囲を評価するためのテストカバレッジメトリクスを紹介する。
次に、これらのメトリクスを計算してE2Eテストスイートの完全性に関するフィードバックを提供する自動化アプローチを提示します。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:30:19 GMT)
YoloCurvSeg: You Only Label One Noisy Skeleton for Vessel-style
Curvilinear Structure Segmentation [2.6] データアノテーションコストとモデル性能の対立を軽減するために、弱教師付き学習(WSL)が提案されている。
そこで本稿では,YoloCurvSeg という,構造に対する特異な注釈付きセグメンテーションフレームワークを提案する。
YoloCurvSegは、各データセットで完全に教師されたパフォーマンスの97%以上を達成している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:43:37 GMT)
LVLane: Deep Learning for Lane Detection and Classification in
Challenging Conditions [2.6] 本稿では,ディープラーニング手法に基づくエンドツーエンドの車線検出・分類システムを提案する。
本研究では,最新技術(SOTA)レーンローカライゼーションモデルにおいて重要な課題を提起するシナリオを包含する,厳密にキュレートされたユニークなデータセットを提案する。
そこで本研究では,CNNをベースとした検知器とシームレスに統合し,異なるレーンの識別を容易にする分類手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:02:05 GMT)
Transitivity-Preserving Graph Representation Learning for Bridging Local
Connectivity and Role-based Similarity [2.5] 局所的およびグローバルな構造情報を固定長ベクトル表現に統合するUnified Graph Transformer Networks (UGT)を提案する。
まず、UGTは各ノードの局所的な部分構造を特定し、各ノードの$k$ホップ近傍の特徴を集約することによって局所構造を学習する。
第三に、UGTは自己アテンションを通じて統一表現を学び、構造距離とノードペア間の$p$ステップ遷移確率を符号化する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:49:57 GMT)
Reduced Order Modeling of a MOOSE-based Advanced Manufacturing Model
with Operator Learning [2.5] 先進的製造(AM)は、核材料への潜在的な応用について、原子力コミュニティに多大な関心を集めている。
1つの課題は、実行時に製造プロセスを制御することによって、望ましい材料特性を得ることである。
深部強化学習(DRL)に基づくインテリジェントAMは、最適な設計変数を生成するためのプロセスレベルの自動制御機構に依存している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:38:00 GMT)
A First Order Survey of Quantum Supply Dynamics and Threat Landscapes [2.3] 本稿では,セキュリティの観点から量子コンピューティングのエコシステムを探求する最初の試みである。
IBM、Google、Honeywellなどの業界トップランナーから公開された情報を調査することで、量子コンピューティングサプライチェーンのさまざまなコンポーネントをまとめました。
いくつかの潜在的な脆弱性を発見し、攻撃モデルを発見し、防御を提案します。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:48:37 GMT)
An Efficient 1 Iteration Learning Algorithm for Gaussian Mixture Model
And Gaussian Mixture Embedding For Neural Network [2.3] 新しいアルゴリズムは、古典的な期待最大化(EM)アルゴリズムよりも頑丈さと単純さをもたらす。
また、精度も向上し、学習に1回しかかからない。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:17:59 GMT)
The Impact of Live Polling Quizzes on Student Engagement and Performance
in Computer Science Lectures [2.2] 新型コロナウイルス(COVID-19)のパンデミックに先立ち、ライブポーリングやリアルタイムフィードバックツールの採用が高等教育で勢いを増した。
パンデミックによる学習行動の最近の変化は、これらの活発な学習技術の再評価を必要としている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:57:55 GMT)
Hybrid HHL with Dynamic Quantum Circuits on Real Hardware [2.1] 量子線形系ソルバのほとんどのコンポーネントは、ノイズの多い中間スケールの量子デバイスの範囲から遠く離れている。
この研究は、より小さな量子デバイスに適しているHarrow-Hassidim-Lloyd (HHL)アルゴリズムのハイブリッド版を推し進める。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:07:42 GMT)
Acoustic frequency atomic spin oscillator in the quantum regime [2.1] スピン測定の量子バックアクションと光の入射的スキーズは、スピン振動によって6kHzまで低下する。
その結果,音響領域における量子ノイズ低減とエンタングルメント・エンハンスドセンシングへの重要な一歩となった。
重力波検出器のブロードバンド雑音低減効果について検討した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 23:51:53 GMT)
A Shift In Artistic Practices through Artificial Intelligence [2.1] 人工知能モデルによって生成されたコンテンツの爆発は、芸術、音楽、メディアの文化的変化を引き起こしている。
簡単に利用できる、インターネットの膨大なデータセットは、Web上のあらゆるコンテンツでAIモデルをトレーニングするための環境を作成しました。
AI技術が音楽、芸術、新メディアにどのような変化をもたらすのか?
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:47:18 GMT)
Physics-Informed Boundary Integral Networks (PIBI-Nets): A Data-Driven
Approach for Solving Partial Differential Equations [1.9] 本稿では、偏微分方程式(PDE)を元の問題空間よりも小さい1次元で解くためのデータ駆動手法として、物理インフォームド境界積分ネットワーク(PIBI-Nets)を提案する。
PIBI-Netsは計算領域境界でのコロケーションポイントのみを必要とするが、精度は高い。
ラプラス方程式とポアソン方程式に対するPIBI-Netの優れた性能を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:03:34 GMT)
Development of a Neural Network-based Method for Improved Imputation of
Missing Values in Time Series Data by Repurposing DataWig [1.9] 時系列データの欠落は頻繁に発生し、成功した分析に障害を与える。
時系列データの堅牢な計算のために様々な手法が試みられているが、最も先進的な手法でさえもまだ課題に直面している。
大規模なデータセットを処理する能力を持つニューラルネットワークベースの方法であるDataWigを修正して、tsDataWig(時系列データウィグ)を開発しました。
元のDataWigとは異なり、tsDataWigは時間変数の値を直接処理し、複雑な時間で欠落した値をインプットする。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:53:40 GMT)
Competitive and imbalanced turn-based many-body quantum games [1.8] 我々は、同じ多体量子レジスタ上で交互に作用する2つの競合するプレイヤー間のゲームのクラスを考える。
このタイプのゼロサムゲームは、両方のプレイヤーがレジスタの同じ部分を絡めることができれば、明確な第2のムーバーの利点がある。
しかし、第1のプレイヤーが第2のプレイヤーよりも多くの量子ビットを絡めることができれば(これは量子的優位性(quantum advantage)と呼ばれる)、第2のムーバー優位性は著しく低下する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:49:34 GMT)
To Compute or not to Compute? Adaptive Smart Sensing in
Resource-Constrained Edge Computing [1.7] 我々は,時間変化信号のサンプリングと基地局への更新をリモートグローバル監視のために送信するエッジコンピューティングアプリケーションのための,スマートセンサのネットワークを考察する。
センサーはセンサーと計算機能を備えており、生のデータを送信したり、送信前にオンボードで処理することができる。
計算と通信遅延の両方を埋め込んだ推定理論最適化フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:40:18 GMT)
Robust Single-view Cone-beam X-ray Pose Estimation with Neural Tuned
Tomography (NeTT) and Masked Neural Radiance Fields (mNeRF) [1.7] X線プロジェクションを用いた放射能物体のポーズ推定法を提案する。
このタスクの実行において最適なビュー合成が果たす重要な役割を実証する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:00:55 GMT)
Designing and implementing an automated grading workflow for providing
personalized feedback to open-ended data science assignments [1.5] 一般的なグレーティングワークフローのステップについて議論し、自動化グレーディングワークフローとして定義したアプローチでどのステップを自動化できるかを強調します。
新しいRパッケージである gradetools が、RStudio 内でこのアプローチを実装し、個別化されたフィードバックを提供しながら、効率的で一貫したグレーディングを容易にする方法について説明する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:22:11 GMT)
Preference-conditioned Pixel-based AI Agent For Game Testing [1.5] 環境とのインタラクションによって学習するゲームテストAIエージェントは、これらの課題を軽減する可能性がある。
本稿では,ユーザの好みに応じて設定された環境を探索しながら,主に画素ベースの状態観測に依存するエージェント設計を提案する。
実AAAゲームにおける多くの側面に類似した複雑なオープンワールド環境において、調査対象とテスト実行品質に対して、我々のエージェントは、最先端の画素ベースのゲームテストエージェントよりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:19:36 GMT)
Quantum Convolutional Neural Networks with Interaction Layers for
Classification of Classical Data [1.5] 本稿では,3量子相互作用を利用した新しい相互作用層を持つ量子畳み込みネットワークを提案する。
提案手法は、MNIST、Fashion MNIST、Irisデータセットという3つの公開データセットでテストされている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:22:21 GMT)
Advancing Relation Extraction through Language Probing with Exemplars
from Set Co-Expansion [1.5] 関係抽出(RE)は、構造化されていないテキストから構造化情報を自動的に抽出する重要なタスクである。
代表例を統合し,コセット展開を通じて多面的アプローチを提案する。
提案手法は,ほとんどの設定において,少なくとも1%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 00:56:35 GMT)
Exploiting the Quantum Advantage for Satellite Image Processing: Quantum
Resource Estimation [1.4] 我々は、地球観測と衛星画像のための量子コンピューティング技術の現状を概観する。
我々は、量子優位性から利益を得るための課題を特定し、高性能コンピューティングと量子コンピューティングの最適な共有を見つける。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:34:34 GMT)
Conversational Ontology Alignment with ChatGPT [1.3] 本研究はアライメントアプローチにおけるChatGPTの適用性と効率性を評価する。
この比較は、マッチングに単純である方法で使用する場合、大きな言語モデルの能力に関する洞察を提供することを目的としている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 00:26:05 GMT)
Audiovisual Moments in Time: A Large-Scale Annotated Dataset of
Audiovisual Actions [1.2] 本稿では,視覚行動イベントの大規模データセットであるAVMIT(Audiovisual Moments in Time)を紹介する。
データセットには57,177本のオーディオヴィジュアルビデオのアノテーションが含まれており、それぞれが訓練を受けた11人のうち3人によって独立して評価されている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:13:45 GMT)
An Efficient High-Dimensional Gene Selection Approach based on Binary
Horse Herd Optimization Algorithm for Biological Data Classification [1.2] Horse Herd Optimization Algorithm (HOA)は、異なる年齢の馬の行動に基づく新しいメタヒューリスティックアルゴリズムである。
本稿では、離散的な問題を解くためにHOAのバイナリバージョンを提案し、特徴部分集合を選択する。
提案手法 (MRMR-BHOA) は, 精度, 最小選択特性において優れた性能を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 19:40:59 GMT)
Benchmark Dataset Dynamics, Bias and Privacy Challenges in Voice
Biometrics Research [1.1] 2012年から2021年までの訓練と評価に使用される話者認識データセットの縦断的研究を行った。
本研究は、この分野で最もよく使われているデータセットを特定し、それらの利用パターンを調べ、バイアス、公平性、その他の倫理的関心事に影響を与える属性を評価する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:05:24 GMT)
Learning in Cooperative Multiagent Systems Using Cognitive and Machine
Models [1.1] マルチエージェントシステム(MAS)は、人間との協調と協調を必要とする多くのアプリケーションにとって重要である。
一つの大きな課題は、動的環境における独立したエージェントの同時学習と相互作用である。
我々はMulti-Agent IBLモデル(MAIBL)の3つの変種を提案する。
我々は,MAIBLモデルが学習速度を向上し,動的CMOTPタスクにおいて,現在のMADRLモデルと比較して様々な報酬設定でコーディネートを達成できることを実証した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 00:39:06 GMT)
Constrained Bayesian Optimization Using a Lagrange Multiplier Applied to
Power Transistor Design [1.1] 本稿では,横方向拡散金属酸化物半導体(LDMOS)トランジスタのための制約付きベイズ最適化(BO)アルゴリズムを提案する。
制約付きBO問題をラグランジュ乗算器を用いて従来のBO問題に変換する。
本アルゴリズムにより、設計空間にターゲットBVを設定可能とし、最適化されたFOMとターゲットBV制約を自動的に満たす装置を得る。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:14:31 GMT)
Optimal Partitioning of Quantum Circuits using Gate Cuts and Wire Cuts [1.1] 量子ビット数の制限、高いエラー率、限られた量子ビット接続は、効率的な短期量子計算の大きな課題である。
量子回路分割は、量子計算を小さな量子(サブ)回路と古典的な後処理ステップを含む一連の計算に分割する。
量子回路編み込みの最近の進歩に基づく最適分割法を開発した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:59:55 GMT)
Noise Sensitivity and Stability of Deep Neural Networks for Binary
Classification [0.9] 一般的なDNNモデルで表されるブール関数のある種の列がノイズ感受性かノイズ安定かを問う。
DNNモデルの自然ランダム性のため、これらの概念は熱処理および焼成バージョンに拡張される。
ガウス重みを始点とする2つの標準DNNアーキテクチャ(完全連結モデルと畳み込みモデル)の特性について検討する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:09:31 GMT)
PC-Droid: Faster diffusion and improved quality for particle cloud
generation [0.9] PC-JeDiの成功に基づいて,ジェット粒子雲の生成のための拡散モデルであるPC-Droidを導入する。
新しい拡散定式化、より最近の積分解法の研究、および全てのジェット型を同時に訓練することにより、あらゆる種類のジェットに対して最先端の性能を達成することができる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:33:39 GMT)
Neural-network quantum state study of the long-range antiferromagnetic
Ising chain [0.9] 長距離反強磁性相互作用の崩壊を伴う横磁場イジング鎖の量子相転移について検討する。
中心電荷は、短距離(SR)イジング値に非常に近い臨界指数に対して、小さな崩壊指数$alpha_mathrmLR$で1/2から逸脱する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:58:36 GMT)
Data Compression and Inference in Cosmology with Self-Supervised Machine
Learning [0.9] 本稿では,機械学習のパラダイムを新たな方法で活用して,大規模データセットの代表要約を構築する手法を提案する。
本手法を流体力学宇宙学シミュレーションに展開することにより,高度に情報的な要約を実現できることを示す。
その結果、自己教師型機械学習技術は、宇宙データの圧縮と解析に有望な新しいアプローチを提供することが示された。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:00:22 GMT)
Cross-modality Attention-based Multimodal Fusion for Non-small Cell Lung
Cancer (NSCLC) Patient Survival Prediction [0.6] 非小細胞肺癌(NSCLC)における患者生存予測のためのモダリティ特異的知識の統合を目的としたマルチモーダル核融合パイプラインを提案する。
組織画像データとRNA-seqデータのみを用いてc-index0.5772と0.5885を達成した単一モダリティと比較して, 提案した融合法はc-index0.6587を達成した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 21:42:52 GMT)
Path Signatures for Seizure Forecasting [0.6] 脳計測によるてんかん発作の予測は未解決の問題である。
基礎となる脳のダイナミクスを記述する完全なモデルも存在せず、個々の患者が単一の発症パターンを示すこともない。
この研究は、より広い文脈での時系列に対する一般化可能なパターン認識パイプラインへのステップと見なすことができる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:19:18 GMT)
Stacked tree construction for free-fermion projected entangled pair
states [0.6] 本稿では,指数関数的局所化ワニエ関数を補うことによる記述を許容する自由フェルミオン状態に対するPEPS表現を構築するための分割・コンカレント手法を提案する。
正方格子上の閉塞原子絶縁体の基底状態を含む1次元と2次元の状態の構成を実証する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:13:35 GMT)
Secure and Privacy-Preserving Automated Machine Learning Operations into
End-to-End Integrated IoT-Edge-Artificial Intelligence-Blockchain Monitoring
System for Diabetes Mellitus Prediction [0.6] 本稿では,危険因子に基づく糖尿病予測のためのIoT-edge-Artificial Intelligence (AI)-blockchainシステムを提案する。
提案システムはブロックチェーンによって支えられ、異なる病院の患者からリスクファクターデータの密集したビューを得る。
提案システムでは,最も正確なランダム林モデルを用いて,数値実験と比較解析を行った。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 00:32:21 GMT)
A Regularized $(XP)^2$ Model [0.6] 古典的ハミルトニアン $H(x,p)=(x2+a2)(p2+a2)$ で記述される動的モデルについて検討する。
量子化ハミルトニアンの3つの異なる形式を示し、それらを$cosh 2x$-likeのポテンシャルで標準シュラー・オーディンガー方程式に再構成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:34:57 GMT)
Investigations of 2D ion crystals in a hybrid optical cavity trap for
quantum information processing [0.5] 静的電極電圧と光キャビティ場を用いた2次元イオン結晶のハイブリッドトラップ構造を数値解析した。
これらの2次元イオン結晶は、フラストレーションされたスピン系の量子シミュレーションのための優れたプラットフォームを提供する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:25:25 GMT)
Comprehensive Training and Evaluation on Deep Reinforcement Learning for
Automated Driving in Various Simulated Driving Maneuvers [0.4] 本研究では、DQN(Deep Q-networks)とTRPO(Trust Region Policy Optimization)の2つのDRLアルゴリズムの実装、評価、比較を行う。
設計されたComplexRoads環境で訓練されたモデルは、他の運転操作にうまく適応でき、全体的な性能が期待できる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:58:31 GMT)
Generating Hard Ising Instances With Planted Solutions Using
Post-Quantum Cryptographic Protocols [0.4] 本稿では,パブリックプライベートなMcElieceポスト量子暗号プロトコルに基づくハードインスタンスの生成手法を提案する。
我々のプロトコルは、"バックドア"が悪用されるリスクを伴わずに、量子デバイスをテストし、評価するのに適している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:55:37 GMT)
End-to-end topographic networks as models of cortical map formation and
human visual behaviour: moving beyond convolutions [0.3] 霊長類視覚システムの組織をモデル化するオールトポグラフィニューラルネットワーク(All-TNN)を開発した。
これらの結果から,All-TNNは,従来の最先端の畳み込みモデルよりも,その地形特性から,人間の行動との整合性が著しく向上していることが示唆された。
これにより、全TNNは視覚脳の空間的構造と、それが視覚行動をどのように仲介するかを理解するための重要な一歩となる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:03:51 GMT)
PTransIPs: Identification of phosphorylation sites based on protein
pretrained language model and Transformer [0.3] 本稿では,リン酸化部位の同定のための新しい深層学習モデルであるPTransIPsを紹介する。
PTransIPは、タンパク質配列内のアミノ酸を単語として扱い、そのタイプとシーケンシャルな位置に基づいて独自のエンコーディングを抽出する。
独立テストの結果、PTransIPsは既存の最先端(SOTA)メソッドよりも優れていることが明らかになった。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:35:50 GMT)
High-fidelity operation and algorithmic initialisation of spin qubits
above one kelvin [0.2] 我々は1ケルビン以上のシリコンでスピン量子ビットを調整し、動作させ、そのような温度での耐故障操作に必要な範囲の忠実度を持つ。
我々は1量子クリフォードゲート忠実度99.85パーセント、および2量子ゲート忠実度98.92パーセントを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 04:51:01 GMT)
Surprise machines: revealing Harvard Art Museums' image collection [0.1] Surprise Machines(サプライズ・マシーンズ)は、ハーバード大学美術館の画像コレクション全体を視覚化する実験的なミューズロジーのプロジェクトである。
このプロジェクトは、人工知能の限界を探求し、大量の画像を表示し、訪問者に驚きを与える。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:05:30 GMT)
Can lies be faked? Comparing low-stakes and high-stakes deception video
datasets from a Machine Learning perspective [0.1] ローテイクとハイテイクの嘘は、ある種類のデータセットが他の種類のアプリケーションには使用できないほど、非常に異なる。
実験では,低テイクデータセットの強化戦略として低テイクデータを用いた場合,低テイクデータを用いた場合よりも,高テイクデータを識別するネットワークの精度が向上した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:01:29 GMT)
biquality-learn: a Python library for Biquality Learning [0.0] バイ品質学習は、監督とデータセットシフトの弱点を扱うアルゴリズムを設計するためのフレームワークとして提案されている。
Python Library for Biquality Learningは、バイ品質データから機械学習モデルを学ぶための直感的で一貫性のあるAPIである。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:01:18 GMT)
Verification of Quantum Stable Sources [0.0] 我々は、マルコフ状態(Markov state)と呼ばれる非i.i.d.ソースに由来する状態の族を紹介する。
定理 1 において、これらの状態は変化元上のテンソル積とよく説明されていないことを証明している。
定理2では、さらに2つのマルコフ状態の間のトレース距離の低い境界を与える。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:32:26 GMT)
Vector detection of AC magnetic fields by Nitrogen-Vacancy centers of
single orientation in diamond [0.0] ダイヤモンド中の窒素空洞(NV)中心は、交流磁場や直流磁場を検出するのに有用な性質を持つ。
単方向のNV中心を用いてこれを実現する手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:02:06 GMT)
Taken by Surprise: Contrast effect for Similarity Scores [0.0] 人間の知覚のコントラスト効果をカプセル化したアンサンブル正規化類似度尺度を提案する。
このスコアは、ペアのアンサンブルの類似性に対する2つの要素間の与えられた類似性を見つけるために、サプライズを定量化する。
我々は、ゼロ/フェーショットの分類とクラスタリングタスクに基づいて、この測定値を評価し、通常、生のコサインの類似性と比較して10~15%高い性能を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:18:55 GMT)
Survival Probability of an Excited State in the Bixon-Jortner Model [0.0] これは分子内放射のない遷移をモデル化するために導入されたBixon-Jortnerモデルの中で数値的に研究されている。
短い期間の後に、生存確率の崩壊は指数関数であることがしばしば見出される。
しかし、生存確率は、さらなる時間とともに増加し、時間とともに続くパターンが減少する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 19:47:55 GMT)
Suppression of Pulsed Dynamic Nuclear Polarization by Many-Body Spin
Dynamics [0.0] マイクロ波パルス制御電子スピンからの偏極移動による原子核過分極の抑制機構について検討した。
我々の研究は、核スピンの集合工学とパルス化された動的核分極プロトコルの設計に光を当てている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:28:00 GMT)
Spontaneous Symmetry Breaking and Time-Crystal States in Chiral Atomic
Systems [0.0] 本研究では、縮退した基底状態と相互環境を特徴とする原子間の相互作用に関する理論的研究を行う。
本研究は,原子系における時間反転対称性の自発的破壊機構について紹介する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:44:07 GMT)
Single Frame Semantic Segmentation Using Multi-Modal Spherical Images [0.0] 本稿では,マルチモーダル融合と全方向シーン認識のギャップを埋めるトランスフォーマーを用いたクロスモーダル融合アーキテクチャを提案する。
我々は、極端物体の変形とパノラマ歪みに対処するために歪み認識モジュールを用いる。
我々の技術は、Stanford2D3DS(RGB-HHA)60.60%、Structured3D(RGB-D-N)71.97%、Matterport3D(RGB-D)35.92%という最先端のmIoU性能を達成した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:06:18 GMT)
Semantic relatedness in DBpedia: A comparative and experimental
assessment [0.0] 本稿では,コーパスに基づくアプローチに代わる知識に基づく手法について述べる。
既存の文献から, 隣接資源, トリプルパターン, トリプル重みに基づく手法に基づいて整理した10の手法を選択した。
DBpediaを参考RDF知識グラフとして実装し評価している。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:26:10 GMT)
SU(2) Gauge Theory in $2+1$ Dimensions on a Plaquette Chain Obeys the
Eigenstate Thermalization Hypothesis [0.0] 2+1次元SU(2)格子ゲージ理論の固有状態熱化仮説(ETH)を考える。
運動量セクターのエネルギー準位は、残りの離散対称性を持たない。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:09:20 GMT)
SA Unet Improved [0.0] 本稿では網膜血管の分節を含むDRIVE課題について述べる。
そこで我々は,StyleGAN2とSA-Unetを組み合わせた新しい手法を開発した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:26:47 GMT)
Quantum information and quantum simulation of neutrino physics [0.0] ニュートリノは 力学現象やミクロ物理現象を 引き起こすのに重要な役割を担っている
超新星や中性子星の融合のような極端な天体物理学環境では、ニュートリノは様々な力学現象やミクロ物理現象を駆動する上で重要な役割を果たしている。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 23:54:08 GMT)
Quantum Image Denoising: A Framework via Boltzmann Machines, QUBO, and
Quantum Annealing [0.0] 制限ボルツマンマシン(RBM)を用いた二元画像デノナイズのためのフレームワークについて検討する。
訓練されたRBMが学習した分布と、ノイズ画像から導出するペナルティ項とのバランスをとることにより、妄想目的を達成する。
モデルをイメージ記述モデルとしてフレーム化するが、任意のバイナリデータに適用できる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 14:59:57 GMT)
Proceedings of the 2nd International Workshop on Adaptive Cyber Defense [0.0] 第2回アダプティブ・サイバー・ディフェンスに関する国際ワークショップがフロリダ州のフロリダ工科大学で開催された。
このワークショップは、人工知能(AI)と機械学習(ML)のユニークな応用を探求する研究を共有するために組織された。
サイバードメインは現在、人間の専門家に大きく依存することなく、確実かつ効果的に防御することはできない。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:56:04 GMT)
Privacy-Preserving 3-Layer Neural Network Training using Mere
Homomorphic Encryption Technique [0.0] ニューラルネットワークのプライバシ保護トレーニングの問題点を,ただの同型暗号設定で検討する。
利用可能ないくつかの拡張テクニックを組み合わせて、いくつかの拡張を行い、最終的に回帰と分類の両問題に対する3層ニューラルネットワークのトレーニングを可能にします。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:11:23 GMT)
On Entropy Growth in Perturbative Scattering [0.0] バイパルタイト系における製品状態の動的ユニタリ進化によって生じるサブシステムエントロピーの変化について検討する。
注目すべきは、粒子散乱の場合、$n$-Tsallisエントロピーに対応する回路図はオンシェル図と同じである。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:57:57 GMT)
Non-perturbative effects of deep-strong light-matter interaction in a
mesoscopic cavity-QED system [0.0] 真空電磁ゆらぎに対する深い強い結合状態において、二量体間の創発的な光子アシスト相互作用は、強い非線形量子化クロスポーラライゼーション応答をもたらすことを示す。
全体分極は、数と位置が群内の二量体の数のパリティに依存するような、ほぼ理想的なステップの連続を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:11:35 GMT)
NASimEmu: Network Attack Simulator & Emulator for Training Agents
Generalizing to Novel Scenarios [0.0] NASimEmuは、浸透試験エージェントをトレーニングするための新しいフレームワークである。
シミュレータとエミュレータに共有インターフェースを提供する。
フレームワークを使って、新しい、構造的に異なるシナリオに移行する一般的なエージェントをトレーニングする方法を示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:32:44 GMT)
Modular Superconducting Qubit Architecture with a Multi-chip Tunable
Coupler [0.0] 我々は、キュービット間の相互作用を別々のチップ上で仲介するために、フローティング・チューナブル・カプラを使用する。
各設計において、異なるチップ上のキュービット間のゼロカップリング条件が達成可能であることを示す。
単一チップ上の可変カプラを用いた2キュービットゲート動作を量子ビットと同レベルに示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:00:33 GMT)
Modified dipole-dipole interactions in the presence of a nanophotonic
waveguide [0.0] 双極子-双極子相互作用は、エミッタアンサンブルが電磁場と相互作用するときに誘導される。
これらの相互作用をうまく計算する方法を詳述する。
本稿では, 円筒状ナノファイバーで導かれる光の伝達信号を, 近傍のエミッタ鎖の存在下で計算することによって, これを説明する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:21:24 GMT)
Mitigating the Risk of Knowledge Leakage in Knowledge Intensive
Organizations: a Mobile Device Perspective [0.0] 現代の組織は、機密データと組織の知識の保護に苦慮している。
モバイルデバイスを使った知識漏洩のリスクを軽減する戦略についてはあまり知られていない。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 01:22:31 GMT)
Measurement Models with Separable Interaction Channels [0.0] 測定モデル(MM)は、量子測定理論の最も高い構造レベルにある。
MMは次のレベルに立つ楽器を構築するために使用することができる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 19:17:21 GMT)
Macroscopic quantum correlation using coherence manipulations of
polarization-path correlations of a continuous-wave laser [0.0] 連続波レーザーの偏光パス相関のコヒーレンス操作のためのマクロ量子相関を示す。
この機能は、将来の古典光学互換量子情報のための顕微鏡的構造を超えた、量子力学の新たな理解への扉を開く。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:05:15 GMT)
Machine-Learning Solutions for the Analysis of Single-Particle Diffusion
Trajectories [0.0] 拡散時系列の機械学習における最近導入された手法の概要について概説する。
我々は、解釈可能性を改善し、マシンの学習プロセスに関する具体的な洞察を提供するとともに、不確実性の推定と特徴に基づくアプローチを含む手段に焦点を当てる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:29:29 GMT)
Lasing, quantum geometry and coherence in non-Hermitian flat bands [0.0] 平坦なバンド格子のラシングはブロッホ状態の幾何学的性質により安定化可能であることを示す。
解析により, 位相ダイナミクスは, 先頭方向のカルダル・パリ・張の非線形性を驚くほどキャンセルしたことを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:24:24 GMT)
Krylov complexity in large-$q$ and double-scaled SYK model [0.0] 我々は、Krylov複雑性とより高いKrylov累積を、$t/q$効果とともに、部分リーディング順序で計算する。
クリロフ複雑性は分布の「サイズ」を自然に記述し、高い累積量はよりリッチな情報をエンコードする。
クリロフ複雑性の増大は「超高速」のように見えるが、これは以前はド・ジッター空間の揺らぎと関連していると推測されていた。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:50:46 GMT)
Isolated Majorana mode in a quantum computer from a duality twist [0.0] クラマース・ワニエ双対変換を行う非可逆位相欠陥について検討する。
空間上の一点に作用する場合、この双対性欠陥は双対性ツイスト境界条件と1つのマヨラナ零モードを課す。
二重性欠陥を持つ閉IsingチェーンのFloquet駆動を用いて、ディジタル量子コンピュータにおいてこのMajoranaゼロモードを生成する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:49:12 GMT)
Integrability is attractive [0.0] 2つの独立結合によってパラメータ化されるスピン鎖の2つの一般的なモデルを考える。
どちらの場合も、結合空間の最も短い経路は可積分領域へと導かれる。
局所積分可能性の破れが急速にカオス化するが,熱力学的限界においてもエルゴディディティを回避するという数値的な証拠を提供する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:00:03 GMT)
Instabilities near ultrastrong coupling in microwave optomechanical
cavity [0.0] 超伝導導波路キャビティと機械共振器を用いたキャビティ・エレクトロメカニカルデバイスを実験的に実現した。
強いポンプの存在下では、機械偏光子分裂は機械周波数の81%に近づき、散逸速度を超過することができる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:43:11 GMT)
Incrementalizing Production CodeQL Analyses [0.0] インクリメンタルな静的解析は1回だけ完全に解析し、コードの変更に基づいて前の結果を更新する。
CodeQL用のインクリメンタルソルバのプロトタイプを作成し、インクリメンタル性を活用しています。
コード変更のサイズに比例した更新時間を実際に達成できることを示す実験結果について報告する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:22:47 GMT)
ICU Mortality Prediction Using Long Short-Term Memory Networks [0.0] 我々はElectronic Health Records(EHRs)から得られた大量の時間データを解析する自動データ駆動システムを実装した。
我々は,院内死亡率とLOS(Longth of Stay)を早期に予測するために,高レベル情報を抽出する。
実世界の予測エンジン構築のための厳密な時系列測定によるLSTMモデルの効率性について実験を行った。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:44:47 GMT)
Human-Like Intuitive Behavior and Reasoning Biases Emerged in Language
Models -- and Disappeared in GPT-4 [0.0] 大型言語モデル (LLM) は人間の直感に類似した行動を示す。
また、直感的な意思決定の傾向がいかに頑丈かも調べる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:33:15 GMT)
Germanium Vacancy in Diamond Quantum Memory Exceeding 20 ms [0.0] ミリケルビン温度におけるゲルマニウム空洞中心(GeV)のコヒーレント制御を示す。
我々は、そのコヒーレンス時間を数桁の桁から20ミリ秒以上まで拡張する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:37:14 GMT)
Gauging tensor networks with belief propagation [0.0] 本稿では,信仰伝播を用いたテンソルネットワークのゲージ化アルゴリズムを提案する。
本研究では,この手法が既知のテンソルネットワークゲージ法と密接に関連していることを示す。
我々は,このアルゴリズムが既存のガウグアルゴリズムよりも高速であることを示す数値的証拠とスケーリング論を提示する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 16:41:30 GMT)
Gauge dependence of the Aharonov-Bohm phase in a quantum electrodynamics
framework [0.0] Aharonov-Bohm (AB) 相は通常、ソレノイドのような外部電流源によって生成される電磁ベクトルポテンシャルの線積分と関連付けられる。
荷電粒子と外部電流の相互作用によるAB効果を説明する最近の試みは、量子光子の交換によるものであり、AB相のシフトは荷電粒子と外部電流源との相互作用エネルギーの変化に比例すると仮定されている。
この主張を批判的に検証し、このアプローチによって得られた位相が実際にゲージ依存であり、非閉経路の観測可能でないことを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 02:36:45 GMT)
FunQuant: A R package to perform quantization in the context of rare
events and time-consuming simulations [0.0] 量子化は離散近似を計算することによって連続分布を要約する。
データ量子化の広く採用されている方法の1つにロイドのアルゴリズムがあり、このアルゴリズムは空間を「ボロノ」セルに分割し、クラスターとして見ることができる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:34:45 GMT)
Exploring the Power of Creative AI Tools and Game-Based Methodologies
for Interactive Web-Based Programming [0.0] 創造的なAIツールとゲームベースの方法論が強力な道具として登場した。
この章では、インタラクティブなWebベースのプログラミングにおけるこれらのツールの可能性について論じる。
それらのメリット、制限、および実世界のアプリケーションを調べます。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 20:01:04 GMT)
Entropic uncertainty relations from equiangular tight frames and their
applications [0.0] 等角的タイトフレームに割り当てられた量子測度に対する不確実性関係を導出する。
また, エンタングルメントなどの相関を検出するため, 検討された測定値の応用についても検討する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 08:38:34 GMT)
Entanglement structure in quantum many-body systems, field theories, and
holography [0.0] この論文の目的は、様々な量子系における量子相関のタイプである絡み合いの構造を明らかにすることである。
エンタングルメントとホログラフィーの以前の研究は、量子システムの特定のクラスに焦点を当ててきた。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:04:44 GMT)
Enhancing Reasoning Capabilities of Large Language Models: A Graph-Based
Verification Approach [0.0] 大きな言語モデル(LLM)は印象的な推論機能を示しています。
本稿では,LLMの推論能力をさらに向上するグラフベースの新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:12:59 GMT)
Enhancing Agent Communication and Learning through Action and Language [0.0] 本稿では,教師と学習者の両方として機能するGCエージェントの新たなカテゴリを紹介する。
アクションベースのデモンストレーションと言語ベースの指示を活用することで、これらのエージェントは通信効率を向上させる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:45:21 GMT)
Efficient variational quantum circuit structure for correlated
topological phases [0.0] 本稿では,変分量子固有解法(VQE)アルゴリズムに使用される変分量子回路の効率的な回路構造を提案する。
VQE計算により, テクスチノンで解ける交互スピン-1/2$ハイゼンベルク鎖における対称性保護型トポロジカルハルデン相について検討した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:41:21 GMT)
Efficient Simulation of Quantum Circuits by Model Order Reduction [0.0] 提案手法は既存の手法を補完し,システム生物学と制御工学のモデル還元手法と密接に一致させることができる。
一般に利用可能なプロトタイプ実装を提供することで、一般的な量子コンピューティングベンチマークの大幅な削減を得ることにより、このアプローチの適用性を実証する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 12:40:47 GMT)
Dynamics-based quantumness certification of continuous variables using
time-independent Hamiltonians with one degree of freedom [0.0] 我々は、時間に依存しないハミルトニアンの下で進化する一自由度に関する力学に基づく証明について議論する。
いくつかは明示的に研究されており、いくつかは低エネルギーの極限においてほぼ調和である。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 06:29:39 GMT)
Dynamics and Geometry of Entanglement in Many-Body Quantum Systems [0.0] 新しい枠組みは、多体量子系における絡み合いのダイナミクスを研究するために定式化されている。
量子相関伝達関数(QCTF)は孤立特異点を持つ複素関数の新しい空間に変換される。
QCTFに基づく幾何学的記述は、多体絡みの理論的に明らかな側面を提供する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 19:16:44 GMT)
Dyadic Greens function for a topological insulator stratified sphere [0.0] 電磁気学の枠組みの中で, 位相絶縁体(TI)成層球に対してDGF(Dyadic Greens function)を構築する。
これらのDGFの適用により、TI成層球近傍の双極子からの光散乱の定式化が導かれる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:27:09 GMT)
Design of quantum backflow in the complex plane [0.0] 厳密に正の運動量スペクトルを持つにもかかわらず、逆流、すなわち負の確率電流を示す量子波動関数を設計する方法が提示される。
これらの波動関数は、上半平面で解析され、逆流挙動が制御される下半平面でゼロを持つ有理複素関数から導かれる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 07:39:24 GMT)
Data augmentation and explainability for bias discovery and mitigation
in deep learning [0.0] この論文は、ディープニューラルネットワークにおけるバイアスの影響を調査し、モデルパフォーマンスへの影響を減らす方法を提案する。
最初の部分は、データやモデルのバイアスやエラーの潜在的な原因を分類し、記述することから始まり、特に機械学習パイプラインのバイアスに焦点を当てている。
次の章では、予測と制御を正当化し、モデルを改善する手段として、説明可能なAIの分類と方法について概説する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 11:02:27 GMT)
Calculating composite-particle spectra in Hamiltonian formalism and
demonstration in 2-flavor QED$_{1+1\text{d}}$ [0.0] ハミルトン形式論におけるゲージ理論の質量スペクトルを計算する3つの異なる方法を考える。
我々は、$sigma$ mesonの質量が2倍のイオン質量より軽いことを発見し、$sigma$は崩壊過程に対して安定である。
我々の数値計算結果は、ピオンとシグマ中間体の間のWKB式に非常に近い、M_sigma/M_pi=sqrt3$。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 05:59:24 GMT)
Beyond Fermi's golden rule with the Jacobi method [0.0] エルゴードハミルトニアンへのクエンチ後の忠実度の解析式を導出する。
この式は弱クエンチと強クエンチの両方に対して有効であり、ヒルベルト空間の有限性が忠実性を制限する前の時間スケールである。
これはフェルミの黄金律と異なり、強いクエンチの速度で初期崩壊と指数崩壊を再現する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:40:16 GMT)
Bell nonlocality in maximal-length quantum mechanics [0.0] 変形した量子力学モデルが正の宇宙定数を模倣した場合、量子相関は劣化する。
これにより、十分に大きな距離で古典性を取り戻す可能性が開ける。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:45:25 GMT)
Balancing Exploration and Exploitation: Disentangled $\beta$-CVAE in De
Novo Drug Design [0.0] 分子グラフ$beta$-CVAEモデルを提案する。
我々はオクタノール水分配係数(ClogP)、モル屈折率(CMR)、薬物類似度(QED)、合成アクセシビリティスコア(SAS)を最適化した。
本モデルでは,両特性とも平均30.07%$pm$0.01%分子を生成した。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 03:11:43 GMT)
Average Pure-State Entanglement Entropy in Spin Systems with SU(2)
Symmetry [0.0] 格子スピン系において生成するSU(2)対称性とリッチヒルベルト空間構造が、局所ハミルトニアンの高励起固有状態とランダム純粋状態の平均エンタングルメントエントロピーに与える影響について検討する。
このことは、平均固有状態絡み合いエントロピーが、非アベリア対称性を持つハミルトニアンの量子カオスと可積分性の診断に使用できるという期待を裏付けるものである。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 18:19:17 GMT)
Autonomous feedback stabilization of a cavity-coupled spin oscillator [0.0] 我々は,光共振器による自律的フィードバックによる原子アンサンブルの集合スピンの平衡安定化を報告する。
キャビティ軸に対する角度で印加された磁場に対して、キャビティへの分散結合は、縦方向と横方向のスピンの組み合わせに対して感度を与える。
光キャビティ光による原子へのコヒーレントなバックアクションは、光キャビティ感受性によって条件付けられ、任意のエネルギーで集合スピン状態を安定化させる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 22:32:00 GMT)
An algebraic quantum field theoretic approach to toric code with gapped
boundary [0.0] 境界が狭くなったトーリック符号の場合について検討する。
境界理論は、予想通り、バルク上の加群テンソル圏であることを示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 15:35:26 GMT)
Achieving quantum metrological performance and exact Heisenberg limit
precision through superposition of $s$-spin coherent states [0.0] この研究は、$s$-spinコヒーレント状態重畳を用いた量子位相推定に発展する。
スピン猫状態の最終的な測定精度がハイゼンベルク極限に近づくことを解析的に示す。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 21:46:26 GMT)
Ab initio quantum approach to electron-hole exchange for semiconductors
hosting Wannier excitons [0.0] 我々は、ブロッホ状態電子演算子の観点から問題を記述するために、第二量子化形式を利用する。
このアプローチは、そのような特異な効果がバンド間クーロン過程に由来するという事実を透明にする。
逆格子ベクトル $bf G_m$ で書くと、小さな波動ベクトル移動極限におけるバンド間クーロン散乱の特異性は、$bf G_m = 0$ 項から得られる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 09:23:38 GMT)
A simplified M{\o}lmer-S{\o}rensen gate for the trapped ion quantum
computer [0.0] トラップされたイオン量子コンピュータで使用されるMolmer-Sorensen(MS)ゲートの簡易化について論じる。
単色コヒーレント光電場を個別に照射することにより、2つのイオンの分離可能な状態をベル状態の1つに変換する方法を提案する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 10:58:06 GMT)
A review of technical factors to consider when designing neural networks
for semantic segmentation of Earth Observation imagery [0.0] レビューでは、畳み込みニューラルネットワーク(CNN)、Recurrent Neural Networks(RNN)、Generative Adrial Networks(GAN)、Transformer Modelに焦点を当てている。
最適なデータ準備を確保するための一般的な前処理技術についても紹介する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 00:40:42 GMT)
A Principle for Global Optimization with Gradients [0.0] この研究は、多くの準最適局所ミニマを持つある微分可能関数の大域的最適化のための勾配の効用を示す。
実験は、非局所探索方向の品質と、提案した単純化アルゴリズムの性能を測定する。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 13:39:29 GMT)
(Re)Construction of Quantum Space-Time: Transcribing Hilbert Into
Configuration Space [0.0] 量子力学における時空はヒルベルトと構成空間をブリッジすることである。
ニュートン時空劇場を、おそらく高次元ヒルベルト空間の像に置き換えることで、新たな視点が得られる。
論文参考訳(メタデータ) (Fri, 18 Aug 2023 17:59:33 GMT)