Re-evaluating the Need for Multimodal Signals in Unsupervised Grammar Induction [119.1] 近年の研究では、マルチモーダルな学習インプットが文法誘導を改善することが示されている。
LC-PCFGと呼ぶ強力なテキストのみのベースラインを設計する。
LC-PCFGは、最先端のマルチモーダル文法誘導法と比較して最大17%改善したコーパスF1を提供する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:53:30 GMT)
Megalodon: Efficient LLM Pretraining and Inference with Unlimited Context Length [112.8] 文脈長無制限の効率的なシーケンスモデリングのためのニューラルネットワークであるMegalodonを紹介する。
Llama2と比較して、Megalodonは70億のパラメータと2兆のトレーニングトークンのスケールでTransformerよりも効率が良い。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 20:28:14 GMT)
FoodLMM: A Versatile Food Assistant using Large Multi-modal Model [96.8] 大規模マルチモーダルモデル(LMM)は多くの視覚言語タスクにおいて顕著な進歩を遂げている。
本稿では,多機能なLMMに基づく多目的食品アシスタントであるFoodLMMを提案する。
本稿では,食品の栄養価と複数のセグメンテーションマスクを予測するために,一連の新しいタスク固有のトークンとヘッドを導入する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:21:20 GMT)
Incremental Extractive Opinion Summarization Using Cover Trees [81.6] オンラインマーケットプレースでは、ユーザレビューは時間とともに蓄積され、意見要約を定期的に更新する必要がある。
本研究では,漸進的な環境下での抽出的意見要約の課題について検討する。
本稿では,CentroidRankの要約をインクリメンタルな設定で正確に計算するアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:13:06 GMT)
A Dynamical Model of Neural Scaling Laws [79.6] ネットワークトレーニングと一般化の解決可能なモデルとして,勾配降下で訓練されたランダムな特徴モデルを分析する。
我々の理論は、データの繰り返し再利用により、トレーニングとテスト損失のギャップが徐々に増大することを示している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:16:09 GMT)
SpikeNVS: Enhancing Novel View Synthesis from Blurry Images via Spike Camera [78.2] 従来のRGBカメラは、動きがぼやけやすい。
イベントやスパイクカメラのようなニューロモルフィックカメラは、本質的により包括的な時間情報をキャプチャする。
我々の設計は、NeRFと3DGSをまたいだ新しいビュー合成を強化することができる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:58:21 GMT)
WildFusion: Learning 3D-Aware Latent Diffusion Models in View Space [77.9] 潜在拡散モデル(LDM)に基づく3次元画像合成の新しいアプローチであるWildFusionを提案する。
我々の3D対応LCMは、マルチビュー画像や3D幾何学を直接監督することなく訓練されている。
これにより、スケーラブルな3D認識画像合成と、Wild画像データから3Dコンテンツを作成するための有望な研究道が開かれる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:44:44 GMT)
Self-Supervised Dataset Distillation for Transfer Learning [77.5] ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。
両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。
転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 01:53:33 GMT)
WonderJourney: Going from Anywhere to Everywhere [75.1] WonderJourneyは、永続的な3Dシーン生成のためのモジュール化されたフレームワークである。
私たちは多様だがコヒーレントに結びついている3Dシーンの長いシリーズを旅していきます。
私たちは、様々なシーンタイプやスタイルにまたがって、魅力的で多様な視覚結果を示し、想像上の「Wonderjourneys」を形成します。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:47:05 GMT)
Transformer based Pluralistic Image Completion with Reduced Information Loss [72.9] トランスフォーマーをベースとした手法は,近年,イメージインペイントにおいて大きな成功を収めている。
彼らは各ピクセルをトークンとみなし、情報損失の問題に悩まされる。
我々はPUTと呼ばれる新しいトランスフォーマーベースのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:58:33 GMT)
On the Robustness of Language Guidance for Low-Level Vision Tasks: Findings from Depth Estimation [71.7] 対象中心の3次元空間関係を伝達する低レベルな文を生成し,これらを追加言語として組み込んで,深度推定における下流の影響を評価する。
我々の重要な発見は、現在の言語誘導深度推定器がシーンレベルの記述のみを最適に実行することである。
追加データを活用するにもかかわらず、これらの手法は敵の直接攻撃や分散シフトの増加に伴う性能低下に対して堅牢ではない。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:35:20 GMT)
Universal Humanoid Motion Representations for Physics-Based Control [71.5] 物理学に基づくヒューマノイド制御のための総合的な運動スキルを含む普遍的な運動表現を提案する。
まず、大きな非構造運動データセットから人間の動きをすべて模倣できる動き模倣機を学習する。
次に、模倣者から直接スキルを蒸留することで、動作表現を作成します。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 03:33:31 GMT)
A Quadratic Synchronization Rule for Distributed Deep Learning [66.7] 本研究は、擬似同期規則(QSR)と呼ばれる$H$を決定するための理論基底法を提案する。
ResNet と ViT の実験により、QSR を用いた局所勾配法は、他の同期戦略よりもテスト精度を一貫して向上することが示された。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:59:01 GMT)
Pre-training Small Base LMs with Fewer Tokens [63.8] 本研究では,既存の大規模基盤LMから始まる小ベース言語モデル(LM)を簡易に開発する手法の有効性について検討する。
簡単なレシピをInherituneと呼び、まず1Bトークンを使って1.5Bパラメータを持つ小さなベースLMを構築することを実証します。
GPT2-medium (355M) と GPT-2-large (770M) のいくつかの層を利用して訓練した小型LMは、スクラッチからトレーニングした場合に、より大きい層が失われることに効果的に対応できることを示した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:53:34 GMT)
The Curious Price of Distributional Robustness in Reinforcement Learning with a Generative Model [61.9] 本稿では,強化学習(RL)におけるモデルロバスト性を検討した。
我々は,デプロイ環境が,名目MDPに規定された不確実性に陥る場合に,最悪の場合のパフォーマンスを最適化する政策を学習することを目的とした,分布的に堅牢なマルコフ決定プロセス(RMDP)の枠組みを採用する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:09:33 GMT)
EventEgo3D: 3D Human Motion Capture from Egocentric Event Streams [59.8] 本稿では,魚眼レンズを用いた一眼一眼レフカメラによる3次元モーションキャプチャーという新たな課題を紹介する。
イベントストリームは、時間分解能が高く、高速な人間の動作下での3次元モーションキャプチャーと、急速に変化する照明のための信頼性の高い手がかりを提供する。
我々のEE3Dは、リアルタイム3Dポーズ更新レートを140Hzでサポートしながら、既存のソリューションと比較して堅牢性と優れた3D精度を示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:59:47 GMT)
Can Public Large Language Models Help Private Cross-device Federated Learning? [58.1] 言語モデルのプライベート・フェデレーション・ラーニング(FL)について検討する。
公開データは、大小両方の言語モデルのプライバシーとユーティリティのトレードオフを改善するために使われてきた。
提案手法は,プライベートなデータ分布に近い公開データをサンプリングするための理論的基盤を持つ新しい分布マッチングアルゴリズムである。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:01:12 GMT)
AIMDiT: Modality Augmentation and Interaction via Multimodal Dimension Transformation for Emotion Recognition in Conversations [58.0] AIMDiTと呼ばれる新しいフレームワークを提案し、深い特徴のマルチモーダル融合の問題を解決する。
公開ベンチマークデータセットMELDでAIMDiTフレームワークを使用して行った実験では、Acc-7とw-F1メトリクスの2.34%と2.87%の改善が明らかにされた。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:31:18 GMT)
How is Visual Attention Influenced by Text Guidance? Database and Model [56.8] 我々は、主観的視点と客観的視点の両方から、テキスト誘導イメージ・サリエンシ(TIS)の研究を行う。
我々は,様々なテキスト記述が視覚的注意に与える影響を,最先端の正当性モデルを用いて分析する。
本稿では,画像特徴とテキスト特徴の両方を抽出,統合し,さまざまなテキスト記述条件下での画像塩分率の予測を行うTGSal予測モデルを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:18:44 GMT)
Probing the 3D Awareness of Visual Foundation Models [56.7] 視覚基礎モデルの3次元認識を解析する。
凍結した特徴に対するタスク固有プローブとゼロショット推論手法を用いて実験を行う。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:58:04 GMT)
NIR-Assisted Image Denoising: A Selective Fusion Approach and A Real-World Benchmark Datase [53.8] 近赤外(NIR)画像を活用して、視認可能なRGB画像の復調を支援することで、この問題に対処する可能性を示している。
既存の作品では、NIR情報を効果的に活用して現実のイメージを飾ることに苦戦している。
先進デノナイジングネットワークにプラグイン・アンド・プレイ可能な効率的な選択核融合モジュール(SFM)を提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:54:26 GMT)
Manifest V3 Unveiled: Navigating the New Era of Browser Extensions [53.3] 2020年、Googleは、2023年1月までに以前のバージョン2(V2)を置き換えることを目的として、Manifest Version 3(V3)による拡張開発の変更を発表した。
本稿では,Manifest V3エコシステムを包括的に分析する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:09:26 GMT)
"Don't forget to put the milk back!" Dataset for Enabling Embodied Agents to Detect Anomalous Situations [49.7] 私たちは、SafetyDetectと呼ばれる新しいデータセットを作成しました。
SafetyDetectデータセットは1000の異常なホームシーンで構成されている。
提案手法は,シーンのグラフ表現とシーン内のオブジェクト間の関係の両方とともに,大規模言語モデル(LLM)を利用する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:56:21 GMT)
Coverage Axis++: Efficient Inner Point Selection for 3D Shape Skeletonization [49.5] Coverage Axis++は、3D形状のスケルトン化に対する、新しくて効率的なアプローチである。
メディア軸変換(MAT)の高精度近似を提供する。
コードが公開されたら、コードは公開されます。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 19:48:27 GMT)
Collaborative-Enhanced Prediction of Spending on Newly Downloaded Mobile Games under Consumption Uncertainty [49.4] ラベルのばらつきと極端性を緩和する頑健なモデルトレーニングと評価フレームワークを提案する。
本フレームワークでは,ユーザIDに頼ることなく,ユーザのゲーム支出を予測するための協調型モデルを提案する。
当社のアプローチは、オフラインデータに対する注目すべき textbf17.11% の強化を実現し、プロダクションモデルよりも顕著に改善されていることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:47:02 GMT)
RLHF Deciphered: A Critical Analysis of Reinforcement Learning from Human Feedback for LLMs [49.4] 大きな言語モデル(LLM)を訓練し、人間の効果的なアシスタントとして機能させるには、慎重に検討する必要がある。
有望なアプローチとして、人間からのフィードバック(RLHF)からの強化学習がある。
本稿では、強化学習原理のレンズを通してRLHFを分析し、その基礎を理解する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:54:15 GMT)
MoE-FFD: Mixture of Experts for Generalized and Parameter-Efficient Face Forgery Detection [49.3] CNNフェースフォージェリ検出器と比較して、VT法はトランスの表現性を生かし、優れた検出性能を実現する。
この研究は、汎用的でパラメータ効率のよいViTベースのアプローチであるFace Forgery Detection (MoE-FFD)のためのMixture-of-Expertsモジュールを導入する。
MoE-FFDは軽量のローランド適応(LoRA)層とアダプタ層のみを更新し、ViTバックボーンは凍結されている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:02:08 GMT)
Exploring Contrastive Learning for Long-Tailed Multi-Label Text Classification [48.8] マルチラベルテキスト分類のための新しいコントラスト損失関数を提案する。
マイクロF1スコアは、他の頻繁に採用される損失関数と一致するか、上回っている。
これは、3つのマルチラベルデータセットでMacro-F1スコアが大幅に改善されたことを示している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:12:16 GMT)
`Eyes of a Hawk and Ears of a Fox': Part Prototype Network for Generalized Zero-Shot Learning [47.1] 一般化ゼロショット学習(GZSL)における現在のアプローチは、画像全体に対する単一のクラス属性ベクトル表現のみを考慮したベースモデル上に構築されている。
属性情報に敏感なVINVL(Pre-trained Vision-Language Detector)を用いて,地域特性を効率的に取得する。
学習された関数は、その領域の特徴を、クラス部分プロトタイプを構築するために使われる地域固有の属性アテンションにマップする。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:37:00 GMT)
Scalability in Building Component Data Annotation: Enhancing Facade Material Classification with Synthetic Data [46.0] Googleストリートビューの画像で訓練されたコンピュータビジョンモデルは、物質カダストを作成することができる。
現在のアプローチでは手動でアノテートされたデータセットが必要です。
本稿では、DALL-Eで生成された合成データセット上でSwin Transformerモデルを微調整し、同様の手動注釈付きデータセットと比較する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:54:48 GMT)
Relational Prompt-based Pre-trained Language Models for Social Event Detection [45.6] ソーシャルイベント検出(SED)は、社会的ストリームから重要なイベントを識別することを目的としており、世論分析からリスク管理まで幅広い応用がある。
GNNベースのメソッドは、しばしばノイズやメッセージ間のエッジの欠如に悩まされ、学習されたメッセージの埋め込みの品質に影響する。
本稿では,メッセージペアにソーシャルメッセージを構築するための新しいペアワイズメッセージモデリング手法と,マルチリレーショナルなプロンプトベースのメッセージ学習機構を提案する。
RPLM_SEDモデルがオフライン,オンライン,低リソース,長テールで最先端のパフォーマンスを実現することを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 06:23:07 GMT)
Dataset Reset Policy Optimization for RLHF [45.5] Reinforcement Learning from Human Preference-based feedbackは、微調整生成モデルの一般的なパラダイムである。
オフラインの選好データセットから報酬モデルを学習し、学習した報奨モデルを最適化するためにオンラインRLを実行する。
本稿では,リセットのアイデアを活用することで,証明可能な保証付きRLHFアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:25:49 GMT)
Conv-Adapter: Exploring Parameter Efficient Transfer Learning for ConvNets [44.8] 本稿では,ConvNets用に設計されたPETモジュールであるConv-Adapterを提案する。
Conv-Adapterは軽量で、ドメイン変換可能で、アーキテクチャに依存しない。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 04:48:48 GMT)
Non-discrimination law in Europe: a primer. Introducing European non-discrimination law to non-lawyers [44.7] 我々は、非法律家や非欧州の弁護士が、その内容や課題を容易に把握できるように、この法律を記述することを目指している。
我々は、多くのEU指令に含まれるEU全体の非差別規則を紹介します。
最後のセクションは、バイアス関連法とEU AI法および関連する法令の事例を含むための地平を広げている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:59:58 GMT)
A Systematic Survey of Deep Learning-based Single-Image Super-Resolution [44.4] 単一像超解像(SISR)は画像処理において重要な課題であり、画像システムの解像度を高めることを目的としている。
最近、SISRは大きな飛躍を遂げ、ディープラーニング(DL)の助けを借りて有望な成果を上げている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:37:47 GMT)
Multi-Branch Generative Models for Multichannel Imaging with an Application to PET/CT Joint Reconstruction [43.0] 本稿では,マルチブランチ生成モデルを用いて,医用画像の相乗的再構成を学習するための概念実証について述べる。
我々は,MNIST (Modified National Institute of Standards and Technology) とPET (positron emission tomography) とCT (Computed tomography) の両方にアプローチの有効性を示す。
本研究は, パッチ分解やモデル制限などの課題にもかかわらず, 医用画像再構成のための生成モデルの可能性を強調した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:21:08 GMT)
Convolutional neural network classification of cancer cytopathology images: taking breast cancer as an example [40.4] 本稿では,画像の高速分類に畳み込みニューラルネットワーク(CNN)を用いる手法を提案する。
病理像を良性群と悪性群に迅速かつ自動分類することができる。
本手法は乳がんの病理像の分類における精度を効果的に向上することを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:08:05 GMT)
Generating Synthetic Time Series Data for Cyber-Physical Systems [38.8] データ拡張は、時系列ドメインにおけるディープラーニングアプリケーションの重要なファシリテータである。
文献でギャップを識別し、時系列におけるデータ拡張のためのシークエンスモデルであるトランスフォーマーのスパース探索を実証する。
いくつかの成功した事前をハイブリダイズしたアーキテクチャは、強力な時間領域類似度メトリックを使用してテストされる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:55:08 GMT)
OpenTab: Advancing Large Language Models as Open-domain Table Reasoners [38.3] OpenTabは、Large Language Models (LLM)を利用したオープンドメインテーブル推論フレームワークである。
OpenTabはオープンドメインとクローズドドメインの両方でベースラインを大幅に上回り、最大21.5%の精度を実現している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:27:34 GMT)
FCert: Certifiably Robust Few-Shot Classification in the Era of Foundation Models [38.0] FCertは、データ中毒攻撃に対する最初の認証された防御法であり、数発の分類である。
1)攻撃なしでの分類精度を維持すること,2)データ中毒攻撃に対する既存の認証された防御能力を上回ること,3)効率的で汎用的なこと,である。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:50:40 GMT)
Automated distribution of high-rate, high-fidelity polarization entangled photons using deployed metropolitan fibers [37.7] ニューヨーク市内の34kmの光ファイバー上に偏光共役光子を分散する完全自動化システムを提案する。
エンドツーエンドのペアレートは5ドル近い105ドル/sで、エンタングルメントの忠実度は約99%です。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:39:51 GMT)
The Integration of Semantic and Structural Knowledge in Knowledge Graph Entity Typing [36.3] 最近の研究は、エンティティの地域地区におけるtextittextbf知識のみを利用している。
我々は,新しい textbfunderlineSemantic と textbfunderlineStructure-aware KG textbfunderlineEntity textbfunderlineTyping (SSET) フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:17:44 GMT)
LLaVA-PruMerge: Adaptive Token Reduction for Efficient Large Multimodal Models [35.9] 大規模マルチモーダルモデル(LMM)は、視覚エンコーダと大規模言語モデルとを接続することで、重要な推論能力を示している。
近年のLMMには、高解像度の画像やビデオなど、より複雑な視覚入力が組み込まれており、視覚トークンの数が大幅に増加する。
そこで我々はPruMergeを提案する。PruMergeは適応型視覚トークン削減手法で、比較モデルの性能を維持しながら、視覚トークンの数を大幅に削減する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:34:29 GMT)
EasyTrack: Efficient and Compact One-stream 3D Point Clouds Tracker [35.7] そこで本稿では,TextbfEasyTrackと呼ばれる,簡潔でコンパクトな1ストリームトランスフォーマ3D SOTパラダイムを提案する。
3Dポイントクラウド追跡機能付き事前学習モジュールを開発し、3Dポイントクラウド追跡表現の学習にマスク付きオートエンコーディングを利用する。
密集した鳥眼ビュー(BEV)特徴空間における目標位置ネットワークを構築し、目標分類と回帰を行う。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 04:23:12 GMT)
Using Large Language Models to Understand Telecom Standards [35.3] 大きな言語モデル(LLM)は、関連する情報へのより高速なアクセスを提供する。
質問応答(QA)アシスタントとして使用される最先端のLCMの性能を評価する。
その結果,LLMはテレコム技術文書の信頼できる参照ツールとして利用できることがわかった。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 09:08:30 GMT)
IDD-X: A Multi-View Dataset for Ego-relative Important Object Localization and Explanation in Dense and Unstructured Traffic [35.2] 大規模なデュアルビュー駆動ビデオデータセットであるIDD-Xを提案する。
697Kのバウンディングボックス、9Kの重要なオブジェクトトラック、ビデオあたり1-12のオブジェクトを持つIDD-Xは、複数の重要なロードオブジェクトに対して包括的なエゴ相対アノテーションを提供する。
また、複数の重要なオブジェクトのローカライゼーションとオブジェクトごとの説明予測を目的とした、カスタムデザインのディープネットワークも導入する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:00:03 GMT)
AdapterSwap: Continuous Training of LLMs with Data Removal and Access-Control Guarantees [33.4] 大規模言語モデル(LLM)は、静的事前学習コーパスからの情報をリコールすることで、知識集約的なタスクを完了させる能力がますます高まっている。
本稿では,データ収集からの知識を低ランクなアダプタの集合に整理するトレーニングおよび推論スキームであるAdapterSwapを紹介する。
実験では、AdapterSwapが効率的な継続的学習をサポートすると同時に、データアクセスと削除をきめ細かな制御が可能であることを実証した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 12:06:02 GMT)
HuixiangDou: Overcoming Group Chat Scenarios with LLM-based Technical Assistance [33.0] 我々はLarge Language Models (LLM)を利用した技術アシスタントHixiangDouを紹介する。
このシステムは、オープンソースのアルゴリズムプロジェクトに関連する質問に対する洞察に富んだ回答を提供することによって、アルゴリズム開発者を支援するように設計されている。
WeChatやLarkといったインスタントメッセージング(IM)ツールのグループチャットへのこのアシスタントの統合についても検討する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 10:50:30 GMT)
Enhancing Autonomous Vehicle Training with Language Model Integration and Critical Scenario Generation [32.0] CRITICALは、自動運転車(AV)のトレーニングとテストのための新しいクローズドループフレームワークである。
このフレームワークは、現実世界のトラフィックダイナミクス、運転行動分析、安全性対策、オプションのLarge Language Model (LLM)コンポーネントを統合することで、これを実現する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:13:10 GMT)
On the Minimax Regret in Online Ranking with Top-k Feedback [30.1] オンラインランキングでは、学習アルゴリズムが一連のアイテムを順次ランク付けし、関連するスコアの形式でランキングに対するフィードバックを受け取る。
Pairwise Loss, Discounted Cumulative Gain, Precision@n という,すべての$k$に対する最上位の$k$のフィードバックモデルで,ミニマックスの後悔率をフルに評価する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:28:39 GMT)
CGS-Mask: Making Time Series Predictions Intuitive for All [29.6] 本稿では,CGS-Maskを提案する。
我々はCGS-Maskを合成および実世界のデータセット上で評価し、時間とともに特徴の重要性を解明するために最先端の手法より優れていた。
質問紙調査によるパイロット調査によると,CGS-Maskは容易に理解できる時系列予測結果を示す上で,最も効果的な手法である。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:44:25 GMT)
Comment-aided Video-Language Alignment via Contrastive Pre-training for Short-form Video Humor Detection [29.3] CVLA(Commitment-Aided Video-Language Alignment)という,短時間のビデオユーモア検出のための新しいモデルを提案する。
CVLAは様々なモーダルチャネルにまたがる生信号で動作するが、一貫したセマンティック空間内にビデオと言語コンポーネントを整列させることにより、適切なマルチモーダル表現が得られる。
DY11kとUR-FUNNYを含む2つのユーモア検出データセットの実験結果は、CVLAが最先端といくつかの競合するベースラインアプローチを劇的に上回っていることを示している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 02:51:45 GMT)
The Generation Gap:Exploring Age Bias in Large Language Models [28.4] 我々は,若年層に対するLarge Language Models(LLMs)値の一般的な傾向を見出した。
また、年齢の異なるコホートで価値の相違を緩和する上での課題も観察する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:36:20 GMT)
Q-PEFT: Query-dependent Parameter Efficient Fine-tuning for Text Reranking with Large Language Models [28.1] 本稿では,Large Language Models (LLMs) へのリーク情報の再ランク付けのための,Q-PEFT (Q-PEFT) アプローチを提案する。
クエリを使用して、入力ドキュメントから上位$kのトークンを抽出し、コンテキストのヒントとして機能します。
検索機構をマルチヘッドアテンション層に置き換えて、エンドツーエンドのトレーニングを実現し、文書中のすべてのトークンをカバーすることにより、Q-PEFTをさらに強化する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 00:18:06 GMT)
Scaling (Down) CLIP: A Comprehensive Analysis of Data, Architecture, and Training Strategies [27.8] 本稿では,CLIP(Contrastive Language-Image Pre-Training)の性能を,限られた計算予算にスケールダウンする際の性能について検討する。
高品質なデータのより小さなデータセットは、より低い品質のデータセットよりも優れていることを示す。
SLIP、FLIP、CLIP、CLIP+Data Augmentationという4つのCLIPトレーニング戦略を比較し、トレーニング戦略の選択が利用可能な計算リソースに依存することを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 02:04:34 GMT)
Look at the Text: Instruction-Tuned Language Models are More Robust Multiple Choice Selectors than You Think [27.6] テキスト回答は、最初のトークン確率よりも、摂動に疑問を呈するほど堅牢であることを示す。
本研究は,第1トークン確率評価よりもテキスト応答評価が有効であることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 10:36:15 GMT)
The Illusion of State in State-Space Models [27.6] ステートスペースモデル(SSM)は、大きな言語モデルを構築するための代替アーキテクチャとして考えられる。
我々は,SSMが変圧器のような非リカレントモデルに類似した制約があることを示し,実世界の状態追跡問題を解く能力を制限する可能性があることを示した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:30:06 GMT)
FF-LOGO: Cross-Modality Point Cloud Registration with Feature Filtering and Local to Global Optimization [27.5] 本稿では,特徴フィルタリングと局所的最適化を併用したクロスモダリティポイントクラウド登録フレームワークを提案する。
提案手法は,3DCSRデータセットにおける現在の最先端手法と比較して,大幅なリコール率の向上を実現している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 05:34:02 GMT)
Bounds on Representation-Induced Confounding Bias for Treatment Effect Estimation [27.4] 条件平均処理効果(CATE)推定のための最先端手法は、表現学習を広く活用する。
ここでは、(潜在的に制約された)低次元表現による低サンプルCATE推定のばらつきを低減する。
低次元の表現は、観測された共同設立者に関する情報を失う可能性があり、その結果、CATE推定のための表現学習の妥当性が典型的に侵害されるため、バイアスにつながる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 12:57:40 GMT)
AudioChatLlama: Towards General-Purpose Speech Abilities for LLMs [27.1] 我々は、エンドツーエンドの汎用音声処理と推論能力を備えた命令調整型Llama-2モデルを拡張する。
結果、AudioChatLlamaと呼ばれるエンドツーエンドモデルは、音声プロンプトをテキストの代替として利用し、会話を維持することができる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:55:22 GMT)
Be Bayesian by Attachments to Catch More Uncertainty [27.0] 本稿では,アタッチド構造を持つ新しいベイズニューラルネットワークを提案し,アウト・オブ・ディストリビューション(OOD)データからより不確実性を求める。
ABNNは期待モジュールといくつかの配布モジュールで構成されている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:37:18 GMT)
Towards Measuring the Representation of Subjective Global Opinions in Language Models [27.0] 大規模言語モデル(LLM)は、社会問題に関する多様なグローバルな視点を公平に表すものではない。
本研究では,どの意見がモデル生成応答に類似しているかを定量的に評価する枠組みを開発する。
他者が使用して構築するためのデータセットをリリースしています。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 00:05:53 GMT)
Improving Referring Image Segmentation using Vision-Aware Text Features [26.8] VATEXは、視覚認識テキスト機能によるオブジェクトとコンテキスト理解の強化により、参照画像のセグメンテーションを改善する。
提案手法は,RefCOCO,RefCO+,G-Ref. Codeの3つのベンチマークデータセットに対して,大幅な性能向上を実現する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:38:48 GMT)
Harnessing the Power of Large Language Model for Uncertainty Aware Graph Processing [24.7] 本稿では,大言語モデル(LLM)のパワーを生かした新しい手法を提案する。
筆者らは,2つのグラフ処理タスク,すなわち知識グラフ補完とグラフ分類について実験を行った。
LLM が生成した回答の正確性を予測するため,10 つのデータセットのうち 7 つに対して 0.8 以上の AUC を達成した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:30:10 GMT)
Deep Classifier Mimicry without Data Access [24.4] 本稿では,モデルに依存しない知識蒸留法であるContrastive Abductive Knowledge extract (CAKE)を提案する。
CAKEは、ノイズの多い合成サンプルのペアを生成し、モデルを決定境界に向けて対照的に拡散させる。
我々は、いくつかのベンチマークデータセットとさまざまなアーキテクチャ選択を使用して、CAKEの有効性を実証的に裏付ける。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:50:26 GMT)
Counterfactual Explanations for Face Forgery Detection via Adversarial Removal of Artifacts [23.3] ディープフェイクとして知られる、非常にリアルなAI生成顔偽造は、深刻な社会的懸念を引き起こしている。
本稿では,人工物除去の観点からの顔偽造検出の非現実的説明を行う。
本手法は,90%以上の攻撃成功率と優れた攻撃伝達性を実現する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 09:13:37 GMT)
What is the Solution for State-Adversarial Multi-Agent Reinforcement Learning? [22.9] Deep Reinforcement Learning (DRL)を通じて学んだ政策は、敵国の摂動攻撃に影響を受けやすい。
本稿では,国家逆境マルコフゲーム (SAMG) を提案するとともに,MARL の異なる解概念を状態不確実性の下で研究する試みを行う。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:58:52 GMT)
CosalPure: Learning Concept from Group Images for Robust Co-Saliency Detection [22.8] Co-Salient Object Detection (CoSOD) は、特定の画像群をまたいだ共通領域(通常は前景)を特定することを目的としている。
逆行性摂動は、いくつかの逆行性摂動の影響を受けやすいため、かなりの精度の低下につながる。
本稿では,入力群画像に基づいて,共分散オブジェクトの概念を学習し,新しいロバストネス向上フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 02:27:09 GMT)
Single-image driven 3d viewpoint training data augmentation for effective wine label recognition [22.8] 本稿では,ワインラベル認識に適した新しい3次元視点拡張手法を提案する。
実世界のワインラベル画像から視覚的にリアルなトレーニングサンプルを生成し、テキストとロゴの複雑な組み合わせによって生じる課題を克服する。
実験の結果,従来の2次元データ拡張技術に比べて認識精度が有意に向上した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:30:09 GMT)
Under pressure: learning-based analog gauge reading in the wild [22.6] 本稿では,実世界のロボットシステムに展開可能なアナログゲージを読むための解釈可能なフレームワークを提案する。
私たちのフレームワークは、読み取りタスクを各ステップで潜在的な障害を検出するなど、別々のステップに分割します。
我々のシステムは、ゲージの種類やスケールの範囲について事前の知識を必要とせず、使用する単位を抽出することができる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 19:13:42 GMT)
Generalization in diffusion models arises from geometry-adaptive harmonic representations [21.4] 画像復調のために訓練されたディープニューラルネットワーク(DNN)は、スコアベースの逆拡散アルゴリズムを用いて高品質なサンプルを生成することができる。
トレーニングセットの記憶に関する最近の報告は、これらのネットワークがデータの「真の」連続密度を学習しているかどうかという疑問を提起している。
データセットの重複しない部分集合でトレーニングされた2つのDNNは、ほぼ同じスコア関数を学習し、したがってトレーニング画像の数が十分に大きい場合、同じ密度を学習する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:48:47 GMT)
Towards Measuring and Modeling "Culture" in LLMs: A Survey [21.1] いずれの研究でも、複雑で多面的な概念である「文化」は定義されていない。
これらの側面を文化のプロキシと呼び、人口統計学、意味学、言語-文化的相互作用の3つの側面にまたがってそれらを整理する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:09:59 GMT)
The Effective Horizon Explains Deep RL Performance in Stochastic Environments [21.1] 強化学習(Reinforcement Learning, RL)理論は、最小の複雑性サンプル境界の証明に重点を置いている。
本稿では,RLアルゴリズムSQIRLを提案する。このアルゴリズムはランダムに探索してロールアウトを収集することで,最適に近いポリシーを反復的に学習する。
我々は、SQIRLを利用して、指数的に「効果的な地平線」のルックアヘッドにのみ現れるRLのインスタンス依存のサンプル複雑性境界を導出し、近似に使用されるクラスの複雑性を導出する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:26:36 GMT)
Beyond Bayesian Model Averaging over Paths in Probabilistic Programs with Stochastic Support [20.5] 本研究では,この完全後続モデルを用いて予測を行うことにより,経路上のベイズ平均化(BMA)を暗黙的に行うことを示す。
経路重み付けの代替メカニズムとして,積み重ねに基づくもの,PAC-Bayesのアイデアに基づくものを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:36:18 GMT)
Multi-Task Learning for Routing Problem with Cross-Problem Zero-Shot Generalization [18.3] 車両ルーティング問題(VRP)は多くの現実世界のアプリケーションで見られる。
本研究では,クロスプロブレム一般化という重要な課題に取り組むための最初の試みを行う。
提案モデルでは、ゼロショットの一般化方式で、見当たらない属性の組み合わせでVRPを解くことができる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:34:18 GMT)
Experimental Design for Active Transductive Inference in Large Language Models [18.3] アクティブトランスダクティブ推論(ATI)と呼ばれる適応的プロンプト設計のためのフレームワークを提案する。
LLMプロンプトは、与えられた推論クエリに対して、少数ショットの例を適応的に選択することで設計する。
GOとSALの2つのアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 23:27:46 GMT)
PEEB: Part-based Image Classifiers with an Explainable and Editable Language Bottleneck [18.3] クラス名が不明なゼロショット設定では、PEEBはCLIPをはるかに上回っている。
PEEBは、教師付き学習環境(CUB-200とDogs-120でそれぞれ88.80%と92.20%の精度)における最先端技術(SOTA)であるだけでなく、ユーザーがテキスト記述子を編集して再訓練せずに新しい分類子を作成できるようにする最初の方法でもある。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 20:10:29 GMT)
Recursive expansion of Tanner graph: a method to construct stabilizer codes with high coding rate [18.1] 本稿では,XZ型Tanner-graph-recursive-expansion(XZ-TGRE)符号とTanner-graph-recursive-expansion hypergraph product(TGRE-HP)符号を提案する。
XZ-TGRE符号の符号容量ノイズ閾値は約0.078であり、TGRE-HP符号の符号容量は0.096である。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 01:28:08 GMT)
Interpretation of Intracardiac Electrograms Through Textual Representations [17.3] 心房細動(AFib)の不規則な電気活動を理解することは心電図において重要な課題である。
人工知能(AI)の最近の進歩は、深層学習フレームワークを使用して、AFib中にEGMを解釈する作業を可能にしている。
本研究では,事前学習したLMを用いて,マスク付き言語モデリングによるEGMおよびAFib分類の微調整を行う。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 01:32:32 GMT)
Comparing Apples to Oranges: LLM-powered Multimodal Intention Prediction in an Object Categorization Task [17.2] 意図に基づくヒューマンロボットインタラクション(Human-Robot Interaction, HRI)システムは、ロボットがユーザーの行動を知覚し、解釈することを可能にする。
身振り,ポーズ,表情など,非言語的手がかりを解釈するための階層的アプローチを提案する。
本評価は,LLMが非言語的手がかりを解釈し,文脈理解能力と組み合わせることの可能性を示すものである。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 12:15:14 GMT)
Joint Physical-Digital Facial Attack Detection Via Simulating Spoofing Clues [17.1] 本研究では,単一モデル内での物理的攻撃とデジタル攻撃を共同で検出する革新的な手法を提案する。
提案手法は主に,SPSC(Simulated Physical Spoofing Clues Augmentation)とSDSC(Simulated Digital Spoofing Clues Augmentation)という2種類のデータ拡張を含む。
The 5th Face Anti-Spoofing Challenge@CVPR2024の"Unified Physical-Digital Face Detection"で優勝した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:01:22 GMT)
RoadFormer: Duplex Transformer for RGB-Normal Semantic Road Scene Parsing [17.1] RoadFormer(ロードフォーマー)は、トランスフォーマーベースの道路シーン解析用データフュージョンネットワークである。
RoadFormerは、ロードシーン解析のための最先端ネットワークをすべて上回っている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 05:07:28 GMT)
E3: Ensemble of Expert Embedders for Adapting Synthetic Image Detectors to New Generators Using Limited Data [16.9] 本稿では,合成画像検出器を更新するための新しい連続学習フレームワークであるEnsemble of Expert Embedders (E3)を紹介する。
E3は、最小限のトレーニングデータを使用して、新しく登場したジェネレータからの画像の正確な検出を可能にする。
実験により,E3は既存の連続学習法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:14:20 GMT)
OTTER: Improving Zero-Shot Classification via Optimal Transport [13.8] 最適輸送による事前学習モデル予測を調整するための,シンプルで軽量な手法を提案する。
我々は,ゼロショット画像とテキスト分類タスクの広範囲で検証を行い,精度を4.8%,平均15.9%向上させた。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:18:47 GMT)
JailbreakLens: Visual Analysis of Jailbreak Attacks Against Large Language Models [13.7] JailbreakLensは視覚分析システムで、ユーザはターゲットモデルに対してjailbreakのパフォーマンスを探索することができる。
モデルセキュリティの評価とモデルの弱点の同定を支援するシステムの有効性を実証する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 19:54:42 GMT)
Agile and versatile bipedal robot tracking control through reinforcement learning [12.8] 本稿では,二足歩行ロボットのための多目的コントローラを提案する。
足首と身体の軌跡を、単一の小さなニューラルネットワークを用いて広範囲の歩行で追跡する。
最小限の制御ユニットと高レベルなポリシーを組み合わせることで、高いフレキシブルな歩行制御を実現することができる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 05:25:03 GMT)
Tackling Ambiguity from Perspective of Uncertainty Inference and Affinity Diversification for Weakly Supervised Semantic Segmentation [12.3] 画像レベルのラベルを持つ弱教師付きセマンティックセマンティックセグメンテーション(WSSS)は、退屈なアノテーションを使わずに高密度なタスクを実現することを目的としている。
WSSSの性能、特にクラス活性化マップ(CAM)の生成と擬似マスクの精製の段階では、あいまいさに悩まされている。
統一された単一ステージWSSSフレームワークであるUniAを提案し、不確実性推論と親和性多様化の観点からこの問題に対処する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 01:54:59 GMT)
Understanding and Modeling the Effects of Task and Context on Drivers' Gaze Allocation [12.2] 我々は,ドライバーの視線予測を明示的な行動と文脈情報で調節する新しいモデルを開発した。
我々は、DR(eye)VEで使用されるデータ処理パイプラインを補正し、記録された視線データのノイズを低減する。
我々は、サリエンシとドライバの視線予測のためのベースラインモデルとSOTAモデルをベンチマークし、新しいアノテーションを使用して、異なるタスクを含むシナリオにおけるパフォーマンスの変化を分析する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:10:51 GMT)
Data Limitations for Modeling Top-Down Effects on Drivers' Attention [12.2] 運転は視覚運動のタスクであり、つまり、ドライバーが見ているものと何をするかの間には関連がある。
ドライバーの視線の一部のモデルは、ドライバーの行動によるトップダウン効果を考慮に入れている。
大多数は人間の視線と運転映像のボトムアップ相関しか学ばない。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:23:00 GMT)
Solving Parametric PDEs with Radial Basis Functions and Deep Neural Networks [12.2] POD-DNNはパラメトリック方程式に対する解多様体の低次元特性を利用する新しいアルゴリズムである。
数値実験では、POD-DNNはオンラインフェーズにおいて計算速度を大幅に高速化することを示した。
妥当な仮定の下では、POD-DNNによるパラメトリックマッピングの近似の複雑さについて、厳密な上限を導出する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:47:07 GMT)
Efficient Graph Laplacian Estimation by Proximal Newton [12.1] グラフ学習問題は、精度行列の最大極大推定(MLE)として定式化することができる。
いくつかのアルゴリズム的特徴を利用した効率的な解法を得るための2次手法を開発した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 06:38:32 GMT)
Language Model Prompt Selection via Simulation Optimization [12.0] プロンプト(英: prompt)は、コンテンツ生成において生成言語モデルのガイドとして機能する、ユーザが提供する命令または記述である。
我々は,この選択をシミュレーション最適化によって促進し,選択したプロンプトに対する事前定義されたスコアを最大化することを目的としている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 00:03:56 GMT)
Negative Feedback Training: A Novel Concept to Improve Robustness of NVCIM DNN Accelerators [11.8] 非揮発性メモリ(NVM)デバイスは、Deep Neural Network(DNN)推論の実行時のエネルギー効率とレイテンシが優れている。
ネットワークから取得したマルチスケールノイズ情報を活用した負フィードバックトレーニング(NFT)を提案する。
提案手法は,既存の最先端手法よりも46.71%の精度向上を実現している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:56:21 GMT)
Incremental Learning with Concept Drift Detection and Prototype-based Embeddings for Graph Stream Classification [11.8] 本研究は,グラフストリーム分類の新しい手法を提案する。
データ生成プロセスは、時間とともにさまざまなノードとエッジを持つグラフを生成する。
ドリフトの検出時にグラフプロトタイプを再計算するために、ロスベースのコンセプトドリフト検出機構が組み込まれている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:43:07 GMT)
Exploring the Frontier of Vision-Language Models: A Survey of Current Methodologies and Future Directions [11.8] VLM(Vision-Language Models)は、画像キャプションや視覚的質問応答といった複雑なタスクに対処できる高度なモデルである。
我々の分類では、VLMを視覚言語理解専用のモデル、マルチモーダル入力を処理するモデル、マルチモーダル入力とアウトプットの両方を受け付け、生成するモデルという3つのカテゴリに分類する。
我々は各モデルを慎重に識別し、基礎となるアーキテクチャ、データソースのトレーニング、および可能な限りの強度と限界を広範囲に分析する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:20:37 GMT)
BAMBOO: a predictive and transferable machine learning force field framework for liquid electrolyte development [11.7] 本稿では,分子動力学(MD)シミュレーションのための新しいフレームワークであるBAMBOOを紹介し,リチウム電池用液体電解質の文脈でその能力を実証する。
BamBOOは密度、粘性、イオン伝導率などの主要な電解質特性を予測するための最先端の精度を示す。
この研究は、一般的な有機液体の性質をシミュレートできる「ユニバーサルMLFF」への道を開くことを目的としている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 01:08:34 GMT)
VertAttack: Taking advantage of Text Classifiers' horizontal vision [11.6] VertAttackは、5つのデータセットで4つの異なるトランスフォーマーモデルの精度を大幅に下げることができる。
クラウドワーカーは、オリジナルのテキストの81%に比べて77%の混乱したテキストを正しくラベル付けできる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:32:17 GMT)
Lossy Image Compression with Foundation Diffusion Models [10.4] 本研究は,拡散を用いた量子化誤差の除去をデノナイジングタスクとして定式化し,送信された遅延画像の損失情報を復元する。
このアプローチによって、完全な拡散生成プロセスの10%未満の実行が可能になり、バックボーンにアーキテクチャ的な変更は不要になります。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:23:42 GMT)
Assessing Economic Viability: A Comparative Analysis of Total Cost of Ownership for Domain-Adapted Large Language Models versus State-of-the-art Counterparts in Chip Design Coding Assistance [10.4] 本稿では,ドメイン適応型大言語モデル (LLM) と最先端LLM (SoTA) の比較検討を行った。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 23:37:56 GMT)
Text Prompt with Normality Guidance for Weakly Supervised Video Anomaly Detection [10.3] 本稿では,WSVAD の正規性ガイダンス付き Text Prompt に基づく新しい擬似ラベル生成と自己学習フレームワークを提案する。
提案手法は,UCF-CrimeとXD-Violeの2つのベンチマークデータセットに対して,最先端の性能を実現する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:18:25 GMT)
Unsupervised Learning of Group Invariant and Equivariant Representations [10.3] グループ不変および同変表現学習を教師なし深層学習の分野に拡張する。
本稿では,エンコーダ・デコーダ・フレームワークに基づく一般学習戦略を提案する。このフレームワークでは,潜在表現を不変項と同変群アクション成分で分離する。
鍵となる考え方は、ネットワークがグループ不変表現にデータをエンコードしてデコードすることを学習し、さらに適切なグループ動作を予測して、入力と出力のポーズを調整して再構成タスクを解決することである。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:16:54 GMT)
Generalized Population-Based Training for Hyperparameter Optimization in Reinforcement Learning [10.2] 一般人口ベーストレーニング(GPBT)とペアワイズ学習(PL)
PLは、パフォーマンスの差を識別し、パフォーマンスの低いエージェントに対する全体的なガイダンスを提供するために、包括的なペアワイズ戦略を採用している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 04:23:20 GMT)
ADMarker: A Multi-Modal Federated Learning System for Monitoring Digital Biomarkers of Alzheimer's Disease [9.3] アルツハイマー病(AD)と関連する認知症は高齢化による世界的な健康問題である。
マルチモーダルセンサと,自然環境における多次元ADデジタルバイオマーカー検出のための新しいフェデレーション学習アルゴリズムを統合した,初のエンドツーエンドシステムであるADMarkerを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 06:25:43 GMT)
Gaining More Insight into Neural Semantic Parsing with Challenging Benchmarks [9.3] 並列平均銀行における意味解析と意味テキスト生成のためのニューラルモデルの評価を行った。
まず、事前のランダム分割の代わりに、標準的なテストデータの信頼性を向上させるために、より体系的な分割手法を提案する。
第二に、標準的なテストセットを除いて、談話構造を含む長いテキストを持つものと、構成的一般化に対処するものという2つの課題セットを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 09:48:58 GMT)
Online Safety Analysis for LLMs: a Benchmark, an Assessment, and a Path Forward [9.2] 大規模言語モデル(LLM)は多くの分野にまたがって広く応用されている。
その限定的な解釈可能性によって、複数の側面からの安全な操作が懸念される。
近年,LLMの品質保証手法の開発が進められている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:55:16 GMT)
Differentiable All-pole Filters for Time-varying Audio Systems [9.1] 我々は時間変化のある全極フィルタを再表現し、勾配自体をバックプロパゲートする。
この実装は、効率の良い勾配評価のためにポール付きフィルタを含む任意のオーディオシステムで使用することができる。
本研究では,位相器,時間変化型減算合成器,フィードフォワード圧縮器を用いて実世界の動的オーディオシステムをモデル化するための学習効率と表現能力を示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 09:58:58 GMT)
Measuring Cross-lingual Transfer in Bytes [9.0] 多様な言語からのモデルが、言語横断的な設定で対象言語と類似して動作することを示す。
また,この移行が言語汚染や言語近接と関係がないという証拠も発見された。
我々の実験は、事前学習中に学習した言語に依存しない表現の量を測定する新しい可能性を開いた。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 01:44:46 GMT)
LlamaTouch: A Faithful and Scalable Testbed for Mobile UI Automation Task Evaluation [9.0] 本稿では、デバイス上でのエージェント実行と、忠実でスケーラブルなエージェント評価のためのテストベッドであるLlamaTouchを提案する。
LlamaTouchは、エージェントが手動でアノテートされた本質的なアプリケーション/システム状態をすべてトラバースするかどうかのみを評価する、新しい評価アプローチを採用している。
LlamaTouchはまた、タスクアノテーションと新しいモバイルエージェントの統合を可能にする。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:39:09 GMT)
LazyDP: Co-Designing Algorithm-Software for Scalable Training of Differentially Private Recommendation Models [8.9] 本稿ではDP-SGDを用いたプライベートRecSysトレーニングの特性について述べる。
本稿では,RecSysをDP-SGDでトレーニングする際の計算とメモリの問題に対処するアルゴリズムとソフトウェアの共同設計であるLazyDPを提案する。
最先端のDP-SGDトレーニングシステムと比較して,LazyDPが平均119倍のトレーニングスループット向上を実現していることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 23:32:06 GMT)
Advanced wood species identification based on multiple anatomical sections and using deep feature transfer and fusion [8.8] DNA分析、近赤外分光法(NIR)、DART質量分析法(Direct Analysis in Real Time、DART)といった手法は、長年確立されてきた細胞および組織形態の解剖学的評価を補完する。
これらの手法の多くは、高コスト、データ解釈の熟練した専門家の必要性、専門家参照のための優れたデータセットの欠如など、いくつかの制限がある。
本稿では,コンボリューショナルニューラルネットワークを用いた2つの伝達学習手法を多視点木種データセットに適用する。
以上の結果から,多様なデータセットや解剖学的部分の精度が,他の手法よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:30:15 GMT)
Macroscopic Bell state between a millimeter-sized spin system and a superconducting qubit [8.8] 絡み合い(英: entanglement)は、系が相互距離に関係なく分離不可能な量子相関を共有する量子力学の基本的な性質である。
本報告では, ハイブリッド量子システムにおけるBell状態の決定論的生成とトモグラフィについて報告する。
我々の研究により、マクロスピン系は最大絡み合った量子状態を生成することができる最大の系となる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 03:11:32 GMT)
Semantic Communication for Cooperative Multi-Task Processing over Wireless Networks [8.8] セマンティック・ソース」の定義を導入し、単一の観察に基づく複数の意味論の解釈を可能にする。
次にセマンティックエンコーダの設計を導入し、エンコーダを共通のユニットと複数の特定のユニットに分割する。
シミュレーションの結果,提案するセマンティックソースの有効性とシステム設計の有効性が示された。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:03:41 GMT)
Direct May Not Be the Best: An Incremental Evolution View of Pose Generation [8.7] 本稿では,細粒度展開中心のポーズ生成フレームワークを提案する。
コンテンツ歪みやぼやけを効果的に抑制することができる。
我々のフレームワークは、様々な中間的なポーズという、価値のある副産物を生成できる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 12:08:06 GMT)
Few-Shot Cross-System Anomaly Trace Classification for Microservice-based systems [8.6] マイクロサービスベースのシステム(MSS)は、複雑で動的な性質のため、さまざまな障害カテゴリで障害を経験する可能性がある。
障害を効果的に処理するために、AIOpsツールはトレースベースの異常検出と根本原因分析を利用する。
そこで本研究では,MSSの異常トレース分類のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 10:09:16 GMT)
LLM-Seg: Bridging Image Segmentation and Large Language Model Reasoning [8.4] セグメンテーション(Reasoning segmentation)は、セグメンテーションシステムが暗黙のユーザ意図を推論し解釈することを可能にする新しいタスクである。
推論セグメンテーションに関する研究は、方法論設計とデータセットラベリングの両方に寄与する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:45:51 GMT)
Artificial Intelligence in Everyday Life 2.0: Educating University Students from Different Majors [8.3] それらの能力、限界、関連する利点と欠点に関する誤解が広まっています。
本経験報告では,異なる専攻の学生に提供した入門講座の概要について述べる。
授業の課題とクイズについて議論し,AIプロセスの初歩的な経験を学生に提供する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:10:42 GMT)
3D Human Scan With A Moving Event Camera [7.7] イベントカメラは高時間分解能と高ダイナミックレンジの利点がある。
本稿では,3次元ポーズ推定とヒューマンメッシュ復元のためのイベントベース手法を提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:34:24 GMT)
Using Explainable AI and Transfer Learning to understand and predict the maintenance of Atlantic blocking with limited observational data [7.7] ブロッキング・イベントは、極度の気象、特に気象システムを妨害する長期のブロッキング・イベントの重要な原因である。
説明可能な人工知能(Explainable Artificial Intelligence)は、長いブロッキングイベントの物理的原因を特定するのに役立つ、データ分析手法のクラスである。
我々は、畳み込みニューラルネットワーク(CNN)をトレーニングし、大西洋ブロッキングの持続性に対するスパース予測モデルを構築します。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:22:29 GMT)
Distributed Multi-Agent Reinforcement Learning Based on Graph-Induced Local Value Functions [7.7] 協調型マルチエージェント強化学習(MARL)のための計算効率の良い分散フレームワークを提案する。
MARLにおける3種類のエージェント間カップリングを記述した3つのカップリンググラフを導入する。
結合グラフから導出した局所値関数に基づく2つの分散RL手法を提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 03:41:09 GMT)
Integrated Variational Fourier Features for Fast Spatial Modelling with Gaussian Processes [7.6] トレーニングポイントが$N$の場合、正確な推論は$O(N3)$コストを持ち、$M ll N$機能により、アートスパース変分メソッドの状態は$O(NM2)$コストを持つ。
近年、空間モデリングのような低次元タスクにおいて優れた性能を持つ$O(M3)$コストを約束する手法が提案されているが、最もよく使われるカーネルを除いて、非常に限られた種類のカーネルでしか動作しない。
本稿では,Fourier機能の統合について提案する。これは,これらのパフォーマンスのメリットを,より広範な定常的コのクラスに拡張するものである。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:31:51 GMT)
Large Language Model for Causal Decision Making [7.1] 大きな言語モデル(LLM)は、言語理解と一般的なトピックの推論で成功していることを示している。
LLMをLLM4Causalに微調整することで、因果タスクを識別し、対応する関数を実行し、ユーザのクエリと提供されたデータセットに基づいてその数値結果を解釈できる可能性を探る。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 01:30:55 GMT)
Mitigating Challenges of the Space Environment for Onboard Artificial Intelligence: Design Overview of the Imaging Payload on SpIRIT [7.0] 本研究では,SpIRIT上にホストされた搭載AIサブシステムのハードウェアおよびソフトウェア設計について述べる。
このシステムは、可視光と長波赤外線カメラに基づくコンピュータビジョン実験のために最適化されている。
本稿では,厳密な空間条件下でのシステムのロバスト性を最大化するための重要な設計選択について述べる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:08:26 GMT)
D2E-An Autonomous Decision-making Dataset involving Driver States and Human Evaluation [6.9] Driver to Evaluationデータセット(D2E)は、自律的な意思決定データセットである。
運転状態、車両状態、環境状況、および人間レビュアーによる評価スコアに関するデータが含まれている。
D2Eは、人間のドライバーファクターから評価結果をカバーする1100以上の対話運転ケースデータを含んでいる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:29:18 GMT)
Graph Neural Networks in Vision-Language Image Understanding: A Survey [6.8] 2次元画像理解はコンピュータビジョンの複雑な問題である。
それは人間レベルのシーン理解を提供する鍵を握る。
近年、グラフニューラルネットワーク(GNN)は多くの2次元画像理解パイプラインの標準コンポーネントとなっている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 06:42:47 GMT)
Complexity of Probabilistic Reasoning for Neurosymbolic Classification Techniques [6.8] 本稿では,情報監督型分類と手法の形式化について紹介する。
次に、確率論的推論に基づく3つの抽象的神経象徴的手法を定義するために、このフォーマリズムの上に構築する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:31:37 GMT)
The Impact of Variable Ordering on Bayesian Network Structure Learning [6.7] 本研究では,データから変数を読み取る順序が,これらの因子よりもアルゴリズムの精度に大きく影響を与えることを示す。
変数順序付けは任意であるため、学習したグラフの精度に重要な影響を与える。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:05:03 GMT)
CATS: Contextually-Aware Thresholding for Sparsity in Large Language Models [6.4] 大規模言語モデル(LLM)は、劇的に高度なAIアプリケーションを持っているが、その膨大な推論コストのため、そのデプロイメントは難しいままである。
本稿では,基本LLMの活性化と推論コストの低減を両立させる新しいフレームワーク,CATS(Contextually Aware Thresholding for Sparsity)を提案する。
提案手法は,Mistral-7BやLlama2-7Bなどの各種ベースモデルに適用可能であり,下流タスク性能において既存のスペーサー化手法よりも優れていることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:42:18 GMT)
MoPE: Mixture of Prefix Experts for Zero-Shot Dialogue State Tracking [6.3] 異なるドメインの類似したスロット間の接続を確立するために,Mixture of Prefix Experts (MoPE)を提案する。
MoPE-DSTはMultiWOZ2.1では57.13%、SGDでは55.40%である。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:57:41 GMT)
Tied-Lora: Enhancing parameter efficiency of LoRA with weight tying [6.2] 低ランク適応(LoRA)のパラメータ効率を高めるために、ウェイトタイリングと選択的トレーニングを活用する新しいパラダイムであるTied-LoRAを導入する。
本稿では,パラメータトレーニングと凍結,およびウェイトタイリングを併用して,パラメータの最適トレードオフとトレーニング可能なパラメータの数を推定する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 23:15:51 GMT)
Seismic First Break Picking in a Higher Dimension Using Deep Graph Learning [6.0] 1D信号、2Dソース収集、または3Dソース受信者が収集する。
本稿では,DGL-FB と呼ばれる深層グラフ学習手法を提案する。
DGL-FBは、ディープグラフエンコーダを用いて、サブグラフをグローバルな特徴に符号化し、その後、符号化されたグローバルな特徴をローカルノード信号と組み合わせて、FB検出のためのResUNetベースの1Dセグメンテーションネットワークに入力する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:36:24 GMT)
Which Transformer to Favor: A Comparative Analysis of Efficiency in Vision Transformers [6.0] 画像分類、精度、速度、メモリ使用量を評価するために、30以上のモデルをベンチマークする。
我々は,ハイブリッドアテンション-CNNモデルにおいて,メモリとパラメータの効率が著しく向上することが観察された。
我々のベンチマークは、高解像度画像よりも、一般により大きなモデルを使用することの方が効率的であることを示している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 09:21:33 GMT)
Enhancing Traffic Safety with Parallel Dense Video Captioning for End-to-End Event Analysis [5.5] 本稿では,AIシティチャレンジ2024におけるトラック2の解決策を紹介する。
このタスクは、Woven Traffic Safetyのデータセットを用いて、交通安全の説明と分析を解決することを目的としている。
私たちのソリューションはテストセットで得られ、競争で6位を獲得しました。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 04:08:21 GMT)
Masked Diffusion as Self-supervised Representation Learner [5.4] Masked diffusion model (MDM) は意味的セグメンテーションのためのスケーラブルな自己教師型表現学習システムである。
本稿では,拡散モデルに固有の生成能力と表現学習能力の相互関係を分解する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:11:16 GMT)
Identifying Important Group of Pixels using Interactions [5.3] 予測信頼度の高い画素群を効率よく同定する手法であるMoXIを提案する。
提案手法は,個々の画素の影響を考慮し,ゲーム理論の概念,シェープ値,相互作用を用いる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:44:04 GMT)
State-Space Systems as Dynamic Generative Models [5.2] 本稿では、入力過程と出力過程の間の決定論的離散時間状態空間システムによって引き起こされる依存構造について検討する。
状態空間系は、これらの2つの空間の間に機能的関係が存在しない場合でも、入力列空間と出力列空間の間の純粋確率的依存構造を誘導できることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:32:57 GMT)
An Effective Automated Speaking Assessment Approach to Mitigating Data Scarcity and Imbalanced Distribution [5.2] 自己教師付き学習(SSL)は、従来の手法と比較して星級のパフォーマンスを示している。
しかし、SSLベースのASAシステムは、少なくとも3つのデータ関連の課題に直面している。
これらの課題には、限られた注釈付きデータ、学習者の習熟度レベルの不均一分布、CEFR習熟度レベル間の不均一スコア間隔が含まれる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 01:22:47 GMT)
Analyzing and Overcoming Local Optima in Complex Multi-Objective Optimization by Decomposition-Based Evolutionary Algorithms [5.2] 多目的進化アルゴリズム(MOEAD)はしばしば局所最適に収束し、解の多様性を制限する。
本稿では,局所最適問題を克服するために,革新的なRP選択戦略であるベクトルガイドウェイトハイブリッド法を提案する。
本研究は,2014年から2022年までのMOEADsフレームワークにおける14のアルゴリズムによるアブレーションと,提案手法の有効性を従来の手法と最先端の手法の両方に対して評価するための一連の実証実験からなる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:29:45 GMT)
Impacts of Color and Texture Distortions on Earth Observation Data in Deep Learning [5.1] 土地被覆分類と変化検出はリモートセンシングと地球観測の重要な応用である。
入力EOデータの異なる視覚特性がモデルの予測に与える影響はよく分かっていない。
ランドカバー分類のための複数の最先端セグメンテーションネットワークを用いて実験を行い、色歪みよりも一般的にテクスチャに敏感であることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 10:15:45 GMT)
Quantum integrated sensing and communication via entanglement [4.9] 本稿では,ハイゼンベルク限界下での量子センシングを実現する新しい量子統合センシング・通信プロトコルを提案する。
われわれは盗聴者に対する安全を理論的に証明した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 09:17:43 GMT)
HCL-MTSAD: Hierarchical Contrastive Consistency Learning for Accurate Detection of Industrial Multivariate Time Series Anomalies [4.8] 本稿では,産業用MSSにおける異常検出のための自己教師付き階層的コントラスト整合学習手法を提案する。
HCL-MTSADはマルチレイヤのコントラスト損失を発生させることで、データの一貫性とタイムスタンプと時間的関連を広範囲にマイニングすることができる。
HCL-MTSADの異常検出能力は、F1スコアの平均1.8%で最先端のベンチマークモデルを上回っている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 03:39:33 GMT)
QCSHQD: Quantum computing as a service for Hybrid classical-quantum software development: A Vision [4.6] 本研究は,古典的開発者のためのQCリソースへのアクセスを民主化するために設計されたQCSHQDの青写真を示す。
QCSHQDのビジョンは、古典的コンピュータと量子コンピュータのハイブリッド化における重要な課題に対処することで、イノベーションを画期的なものにする道を開く。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 05:55:56 GMT)
A Survey of Neural Network Robustness Assessment in Image Recognition [4.6] 近年,ニューラルネットワークの堅牢性評価に注目が集まっている。
ディープラーニングの堅牢性問題は特に重要であり、画像分類モデルに対する敵対的攻撃の発見によって強調される。
本稿では, ニューラルネットワーク評価において, 対向ロバスト性 (AR) と汚職ロバスト性 (CR) の両方を詳細に検討した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:19:16 GMT)
Abstractors and relational cross-attention: An inductive bias for explicit relational reasoning in Transformers [4.6] 抽象モジュールと呼ばれる新しいモジュールを通じて明示的なリレーショナル推論を可能にするトランスフォーマーの拡張が提案されている。
Abstractorの中核には、リレーショナル・クロスアテンション(relational cross-attention)と呼ばれる注意の亜種がある。
このアプローチは、関係情報をオブジェクトレベルの特徴から切り離す関係学習のためのアーキテクチャ的帰納的バイアスによって動機付けられます。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 22:49:28 GMT)
A novel Fourier neural operator framework for classification of multi-sized images: Application to three dimensional digital porous media [4.5] 様々なサイズで画像の分類を行うための新しいディープラーニングフレームワークを提案する。
提案するネットワークをマルチサイズの画像で同時にトレーニングする。
導入したフレームワークの有効性を示し、その性能を直感的なアプローチと比較する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:17:17 GMT)
Mayhem: Targeted Corruption of Register and Stack Variables [4.5] Rowhammerはどのようにしてスタック変数に障害を注入し、被害者のプロセスに値を登録するかを示す。
我々は、プロセスのスタックに格納されたレジスタ値をターゲットとし、その後メモリにフラッシュアウトすることでこれを実現する。
スタックとレジスタがもはやRowhammer攻撃から安全でないことを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:06:54 GMT)
Systematically Assessing the Security Risks of AI/ML-enabled Connected Healthcare Systems [4.5] 医療システムにおけるMLの使用は、対人的介入の際の患者の健康に致命的な被害をもたらす可能性のあるセキュリティリスクがあることが示される。
これらの新たなリスクは、周辺機器と通信チャネルのセキュリティ上の脆弱性によって生じる。
現状のリスク評価技術は、これらの新たなリスクを特定し評価するには不十分であることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 00:33:58 GMT)
Routing and Spectrum Allocation in Broadband Quantum Entanglement Distribution [4.4] 光ネットワーク上での量子エンタングルメント分布のリソース割り当てについて検討する。
我々は、絡み合い分布における最大値の公平性に着目し、様々なスペクトル割り当て方式の性能を比較する。
中央値のEPRペアレート、ジャイナ指数、実行時を考慮した場合、最低値のEPRペアレートを達成するスペクトル割当手法が著しく悪化することが判明した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:11:25 GMT)
EasyACIM: An End-to-End Automated Analog CIM with Synthesizable Architecture and Agile Design Space Exploration [4.3] 本研究は、合成可能なアーキテクチャ(EasyACIM)に基づくエンドツーエンド自動ACIMを提案する。
EasyACIMは、様々な設計仕様でACIMのレイアウトを自動的に生成できる。
EasyACIMが提供するACIMソリューションは、最先端(SOTA)ACIMと比較して、幅広い設計空間と競争性能を有する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:12:17 GMT)
Optimizing Cyber Response Time on Temporal Active Directory Networks Using Decoys [4.3] 攻撃の可能性を検出するために,Microsoft Active Directory (AD) ネットワークにデコイを配置する問題について検討する。
本稿では、時間的攻撃グラフにおけるデコイ配置の有効性を測定するために、応答時間と呼ばれる新しい指標を提案する。
我々の目標は、最悪の攻撃経路に対するディフェンダーの対応時間を最大化することです。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 02:45:07 GMT)
Computing distances and means on manifolds with a metric-constrained Eikonal approach [4.3] 距離関数の連続かつ微分可能な表現を得るために,距離制約付きアイコンソルバを導入する。
これらの表現の微分可能な性質は、多様体上の大域的長さ最小化パスの直接計算を可能にする。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:26:32 GMT)
TaCo: Targeted Concept Removal in Output Embeddings for NLP via Information Theory and Explainability [4.3] 情報理論は、モデルが性別、民族、年齢などの敏感な変数を予測できないことを示唆している。
NLPモデルの埋め込みレベルで機能する新しい手法を提案する。
提案手法は,NLPモデルにおける性別関連関連性を著しく低減することを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:50:14 GMT)
MambaDFuse: A Mamba-based Dual-phase Model for Multi-modality Image Fusion [4.2] MMIF(Multi-modality Image fusion)は、異なるモダリティからの補完情報を単一の融合画像に統合することを目的としている。
本研究では, モーダリティ特異的およびモーダリティ融合特徴を抽出するために, マンバをベースとした2相融合モデル(MambaDFuse)を提案する。
提案手法は,赤外線可視画像融合と医用画像融合において有望な融合を実現する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:33:26 GMT)
Enhanced Muscle and Fat Segmentation for CT-Based Body Composition Analysis: A Comparative Study [4.2] 本研究は, 筋・脂肪(皮下・内臓)の分画のための内装具の信頼性を, 確立されたTtalSegmentatorツールと比較して評価した。
皮下脂肪分画と筋分画の精度を評価するためにDice scoreを用いた。
コーエンのカッパは、ツール間のセグメンテーション合意を評価するために使用された。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 23:33:27 GMT)
Efficient Masked Face Recognition Method during the COVID-19 Pandemic [4.1] 新型コロナウイルス(COVID-19)は異例の危機であり、多くの死傷者やセキュリティ上の問題に繋がる。
新型コロナウイルスの感染拡大を抑えるため、マスクを着用して身を守ることが多い。
これにより、顔の一部が隠されているため、顔認識は非常に難しいタスクとなる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:14:04 GMT)
Pretraining and Updating Language- and Domain-specific Large Language Model: A Case Study in Japanese Business Domain [4.1] 本研究では、非英語と高需要産業ドメインの組み合わせについて検討する。
この種のモデルには、ビジネス領域の専門知識、強力な言語スキル、そしてその知識の定期的な更新が必要です。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 06:21:48 GMT)
ScribblePrompt: Fast and Flexible Interactive Segmentation for Any Biomedical Image [4.1] 本稿では,バイオメディカルイメージングのためのフレキシブルニューラルネットワークを用いたインタラクティブセグメンテーションツールであるScribblePromptを紹介する。
ドメインの専門家によるユーザスタディでは、ScribblePromptはアノテーションの時間を28%削減し、Diceを15%改善した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 20:41:14 GMT)
Generative AI-Based Effective Malware Detection for Embedded Computing Systems [4.0] そこで本研究では,限定的なマルウェアの複数の変異サンプルを生成するコード認識データ生成手法を提案する。
損失最小化は、生成したサンプルが限られたマルウェアを忠実に模倣し、非現実的なサンプルを緩和することを保証する。
提案手法は,最先端技術により得られた精度の約3倍のマルウェアを検知し,90%の精度で検出する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 20:18:00 GMT)
Realization of two-qubit gates and multi-body entanglement states in an asymmetric superconducting circuits [3.9] 本研究では, 可変フラキソニウム-トランスモン (FTT) コープリング方式を提案する。
フラクソニウムとトランスモンからなる非対称構造は周波数空間を最適化し、高忠実度2量子ビットの量子ゲートを形成する。
一般のシングルキュービットXpi/2ゲートと2キュービット(iSWAP)ゲートをシミュレートし,本方式の性能について検討した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:44:21 GMT)
VADA: a Data-Driven Simulator for Nanopore Sequencing [3.9] 本稿では,自己回帰潜在変数モデルに基づいて,ナノ孔をシミュレーションする純粋データ駆動手法を提案する。
実験的なナノ孔データに対して,本モデルが競合シミュレーション性能を実現することを実証的に実証した。
我々は,DNAラベルから予測される情報的潜伏表現を学習したことを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:24:28 GMT)
Optomechanical second-order sidebands and group delays in a spinning resonator with parametric amplifier and non-Markovian effects [3.7] キャビティ内の異なるポンプ周波数で駆動されるOPAは、第2次サイドバンドの振幅を増大させ、変調することができることを示す。
スピン共振器における2次のサイドバンドは, 環境スペクトル幅を制御することによって, 非マルコフ系からマルコフ系への移行を示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 02:18:00 GMT)
Adapting CNNs for Fisheye Cameras without Retraining [3.7] 多くの応用において、より広い視野の魚眼カメラのような従来のカメラを使う方が有益である。
問題は、これらの大きなFOV画像は、元の画像のかなりの刈り取らなければ、視点投影に修正できないことである。
我々は、事前学習された畳み込みネットワークを新しい非パースペクティブな画像で操作するための新しいアプローチであるRectified Convolutionsを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 01:36:00 GMT)
An Integrated Toolbox for Creating Neuromorphic Edge Applications [3.7] スパイキングニューラルネットワーク(SNN)とニューロモルフィックモデルはより効率的で、より生物学的リアリズムを持つ。
CARLsim++は、ニューロモルフィックアプリケーションの高速かつ簡易な作成を可能にする統合ツールボックスである。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:34:55 GMT)
Enhancing Visual Question Answering through Question-Driven Image Captions as Prompts [3.6] 視覚的質問応答(VQA)は、視覚と言語の内容を理解し、推論し、推論する必要があるため、AI完全タスクとして知られている。
本稿では,VQAパイプラインの中間プロセスとして画像キャプションを組み込むことによる影響について検討する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:35:23 GMT)
Pathological Primitive Segmentation Based on Visual Foundation Model with Zero-Shot Mask Generation [3.5] 本稿では,SAMの学習済み自然画像エンコーダを検出ベース領域提案に適用する手法を提案する。
SAMというベースフレームワーク全体は、追加のトレーニングや微調整を必要としないが、病理学における2つの基本的なセグメンテーションタスクに対してエンドツーエンドの結果をもたらす可能性がある。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:29:49 GMT)
Hindsight PRIORs for Reward Learning from Human Preferences [3.5] 嗜好に基づく強化学習(PbRL)では、政策行動に対する嗜好フィードバックから報酬を学習することで報酬関数を手渡す必要がなくなる。
PbRLへの現在のアプローチは、行動のどの部分が優先に最も寄与しているかを決定することに固有の信用割当問題に対処しない。
我々は、世界モデルを用いて軌道内の状態重要度を近似し、報酬を国家重要度に比例するように誘導する信用割当戦略(Hindsight PRIOR)を導入する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:59:42 GMT)
CoBra: Complementary Branch Fusing Class and Semantic Knowledge for Robust Weakly Supervised Semantic Segmentation [3.4] 本稿では,クラス(CNN)とセマンティック(ViT)の相補的知識を提供する2つの異なるアーキテクチャからなる新しい2つの分岐フレームワークを提案する。
我々のモデルはCoBraを通じてCNNとViTの補完的な出力を融合し、クラス情報とセマンティック情報の両方を効果的に統合する堅牢な擬似マスクを生成する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:48:45 GMT)
Benchmarking logical three-qubit quantum Fourier transform encoded in the Steane code on a trapped-ion quantum computer [3.3] 量子変換のための3量子ビット回路を論理的に符号化した。
我々は、量子量子コンピュータQuantinuum H2-11の回路をベンチマークする。
論理的QFTベンチマークの結果を,論理的成分ベンチマークに基づく予測と比較する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:27:27 GMT)
Analyzing Decades-Long Environmental Changes in Namibia Using Archival Aerial Photography and Deep Learning [3.3] 我々は,1943年から1972年にかけて,ナミビアのオシカンゴ周辺で観測された灰色以下の空中画像を用いて,重要な物体を同定することを目的としている。
我々は, クラス重み付け, 擬似ラベル付け, 経験的p値ベースのフィルタリングなど, 基底真理データ中のオブジェクトの歪んだ表現とスパース表現のバランスをとるための戦略を多数採用している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:37:53 GMT)
A Conceptual Framework for Conversational Search and Recommendation: Conceptualizing Agent-Human Interactions During the Conversational Search Process [3.2] 対話型検索タスクは、エージェントとの自然言語対話を通じて、ユーザが情報ニーズを解決できるようにすることを目的としている。
本研究の目的は,ユーザが検索空間を探索し,情報ニーズを解決するための,ユーザとエージェントの行動と意図に関する概念的枠組みを構築することである。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:48:18 GMT)
Overcoming Scene Context Constraints for Object Detection in wild using Defilters [3.0] 物体検出、認識、セグメンテーションなどの高レベルのコンピュータビジョンタスクは、特に画像歪みに敏感である。
物体検出に先立って画像歪みを補正する画像デファイラを提案する。
この方法では、非歪画像のトレーニング時にモデルが最適に実行されるため、オブジェクト検出精度が向上する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:30:52 GMT)
RFFNet: Large-Scale Interpretable Kernel Methods via Random Fourier Features [3.0] RFFNetは1次最適化によってカーネルの関連性をリアルタイムで学習するスケーラブルな手法である。
提案手法はメモリフットプリントが小さく,実行時,予測誤差が低く,関連する特徴を効果的に識別できることを示す。
私たちは、Scikit-learn標準APIと結果を完全に再現するためのコードに準拠した、効率的でPyTorchベースのライブラリをユーザに提供します。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:51:32 GMT)
Structured Model Pruning for Efficient Inference in Computational Pathology [3.0] バイオメディカルイメージングにおいて広く使われているU-Netスタイルのアーキテクチャを解析する手法を開発した。
我々は,プルーニングが性能を低下させることなく,少なくとも70%圧縮できることを実証的に実証した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 22:05:01 GMT)
A Mutual Inclusion Mechanism for Precise Boundary Segmentation in Medical Images [2.9] 医用画像の正確な境界セグメンテーションのための新しい深層学習手法MIPC-Netを提案する。
位置特徴抽出時のチャネル情報に重点を置くMIPCモジュールを提案する。
また,エンコーダとデコーダの統合性を高めるグローバルな残差接続であるGL-MIPC-Residueを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 02:14:35 GMT)
Platinum-based Catalysts for Oxygen Reduction Reaction simulated with a Quantum Computer [2.9] 水素は有望なエネルギー源として現れ、低炭素で持続可能な移動を可能にする鍵を握っている。
ここでは、古典的および量子的な計算手法を組み合わせて、純白金および白金/コバルト表面上のORRを調べる先駆的な研究を提案する。
その結果、コバルト含有触媒に強く相関する種が関与していることが明らかとなり、将来の応用における量子優位性を示すための理想的な候補としての可能性が示唆された。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 12:04:32 GMT)
Accelerating ViT Inference on FPGA through Static and Dynamic Pruning [2.9] 視覚変換器(ViT)は様々なコンピュータビジョンタスクにおいて最先端の精度を実現している。
重みとトークンプルーニングは複雑さを減らすためのよく知られた方法である。
FPGA上でのViTの高速化を同時に行うためのアルゴリズムハードウェア符号を提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 05:07:27 GMT)
Let It Flow: Simultaneous Optimization of 3D Flow and Object Clustering [2.8] 実大規模原点雲列からの自己監督型3次元シーンフロー推定の問題点について検討する。
重なり合うソフトクラスタと非重なり合う固いクラスタを組み合わせられる新しいクラスタリング手法を提案する。
本手法は,複数の独立移動物体が互いに近接する複雑な動的シーンにおける流れの解消に優れる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 10:04:03 GMT)
CiFlow: Dataflow Analysis and Optimization of Key Switching for Homomorphic Encryption [2.7] ホモモルフィック暗号化(HE)は、暗号化されたデータの計算を可能にするプライバシー保護計算技術である。
HEは極めて遅いため、実際のアプリケーションでは使用できない。
本稿では,そのデータフローを厳密に解析することでHE性能を向上させる新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 19:17:58 GMT)
General surgery vision transformer: A video pre-trained foundation model for general surgery [2.6] 現在までに680時間に及ぶ手術ビデオのデータセットをオープンソース化しています。
本稿では,前方映像予測に基づく手術映像における一般手術視変換器(GSViT)の事前訓練手法を提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 22:30:54 GMT)
Multi-Objective Evolutionary Algorithms with Sliding Window Selection for the Dynamic Chance-Constrained Knapsack Problem [2.6] 静的および動的重み制約下での利益を伴うknapsack問題に対する多目的進化的アプローチを提案する。
我々は、期待される利益を最大化し、分散を最小化する双方向の定式化を考える。
重み制約を緩和して3目的の定式化を導出する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 03:07:15 GMT)
Box Facets and Cut Facets of Lifted Multicut Polytopes [2.5] 昇降型マルチカット問題の線形プログラム定式化について検討する。
2進線形プログラムのカット不等式がファセットを定義するかどうかを決定することはNPハードであることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:38:20 GMT)
Generalized Contrastive Learning for Multi-Modal Retrieval and Ranking [2.5] マルチモーダル検索・ランキング(GCL)のための一般化コントラスト学習を提案する。
GCLは、バイナリ関連スコアを超えて、きめ細かいランキングから学ぶように設計されている。
以上の結果から,GCLはドメイン内NDCG@10が94.5%,コールドスタート評価が26.3~48.8%増加した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:30:03 GMT)
Advancing Forest Fire Prevention: Deep Reinforcement Learning for Effective Firebreak Placement [2.5] 本研究では,特に深層強化学習(Deep Reinforcement Learning)という人工知能技術を用いて,現場の火災発生問題に対処することを提案する。
我々は,森林環境内の火災発生箇所を学習し,良好な結果を得られる計算エージェントの実装に成功した。
提案手法は,40×40セル程度の問題事例の収束性を示し,この重要な問題に強化学習を適用する上で重要なマイルストーンとなる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:10:57 GMT)
TextMachina: Seamless Generation of Machine-Generated Text Datasets [2.5] TextMachinaは、高品質でバイアスのないデータセットの作成を支援するために設計されたPythonフレームワークである。
MGTデータセット構築の固有の複雑さを抽象化する、ユーザフレンドリなパイプラインを提供する。
TextMachinaが生成したデータセットの品質は、以前の研究で評価されている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 09:52:05 GMT)
Machine Learning-based Approach for Ex-post Assessment of Community Risk and Resilience Based on Coupled Human-infrastructure Systems Performance [2.4] コミュニティのリスクとレジリエンスを評価するための,機械学習に基づく手法を開発した。
テキサス州ハリス郡の2017年ハリケーン・ハーベイにおける地域社会のリスクとレジリエンス性能について検討した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 03:46:38 GMT)
Towards a spatial cat state of a massive pendulum [2.2] 我々は、$mathcalO$(mg)の順序で吊り鏡の空間猫状態を構築する実験を提案する。
鏡は2つの鏡の中心にセットされ、2つの光学キャビティと光バネを生み出している。
地中波動関数の断熱条件を,原点の局所状態から二重井戸電位内の空間的猫状態への変態に推定する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 12:32:50 GMT)
Post-Quantum Hybrid Digital Signatures with Hardware-Support for Digital Twins [2.2] Digital Twins (DT) はモノのインターネット(IoT)コンポーネントを使って仮想的にサイバー物理オブジェクトをモデル化する。
NIST PQCシグネチャ標準は、フォワードセキュリティを考慮せずに、ローエンドIoTに対して極端にコストがかかる。
我々は,認証者が署名者間の相互作用を伴わずに高価なコミットメントを得られるように,ハードウェア支援型暗号コミットメント構成書(CCO)を作成する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 23:13:34 GMT)
Robust Representation Learning with Self-Distillation for Domain Generalization [2.1] 本稿では,ロバスト表現学習(Robust Representation Learning with Self-Distillation)と呼ばれる新しい領域一般化手法を提案する。
3つのデータセットの最先端データに対して、平均精度を1.2%から2.3%に改善する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 04:42:29 GMT)
AILS-NTUA at SemEval-2024 Task 6: Efficient model tuning for hallucination detection and analysis [2.0] SemEval-2024 Task-6 - SHROOM - 幻覚と関連する過剰発生に関する共有タスク。
実験では,幻覚検出の訓練済みモデルと自然言語推論(NLI)モデルを微調整した。
最も成功した戦略はこれらのモデルのアンサンブルの作成であり、それぞれモデルに依存しないデータセットで77.8%と79.9%の精度が得られた。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 12:27:48 GMT)
HICO-DET-SG and V-COCO-SG: New Data Splits for Evaluating the Systematic Generalization Performance of Human-Object Interaction Detection Models [1.9] ヒューマン・オブジェクト・インタラクション(Human-Object Interaction、HOI)は、画像中の人間とオブジェクトをローカライズし、人間とオブジェクトのペア間の相互作用を予測するタスクである。
我々はHICO-DETとV-COCOデータセットに基づいてHICO-DET-SGとV-COCO-SGという2つの新しいHOI検出データ分割を作成した。
新たなデータ分割を評価した場合,様々な特徴を持つHOI検出モデルは,元の分割を評価する場合よりもはるかに低性能であった。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 00:46:26 GMT)
A State-Space Perspective on Modelling and Inference for Online Skill Rating [1.9] 逐次モンテカルロモデルと離散隠れマルコフモデルに基づく新しいアプローチを導入する。
我々は、プレイヤーのスキルを時間変化として表現し、一致した結果が観測量として機能する状態空間モデル視点を提唱する。
我々は,多数の選手や試合にスケールアップする上での課題について検討し,主な近似と縮小を強調した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:51:43 GMT)
Entanglement signatures for quantum synchronization with single-ion phonon laser [1.9] 外部駆動を受ける単一イオンフォノンレーザーによる量子同期の絡み合い特性について検討した。
イオンの内部状態と外部状態の間の定常な絡み合いの最大値は、ノイズのない境界付近で発生する。
後続のエンタングルメントのダイナミクスは、周波数エントラクションの発生も示している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 02:53:29 GMT)
Increasing Trust in Language Models through the Reuse of Verified Circuits [1.8] 言語モデル(LM)は、幅広い予測タスクにますます使われていますが、それらのトレーニングは稀なエッジケースを無視します。
数学的および論理的に規定されたフレームワークを使用して構築すれば,トランスフォーマーモデルをこの標準を満たすように訓練できることが示される。
両タスクの加算回路を広範囲に再利用し,より複雑な減算器モデルの検証を容易にする。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 03:57:24 GMT)
Navigating Quantum Security Risks in Networked Environments: A Comprehensive Study of Quantum-Safe Network Protocols [1.8] 量子コンピューティングの出現は、ネットワークプロトコルに深刻なセキュリティ上の課題をもたらす。
本稿では,広く利用されているセキュリティプロトコルの多種多様な配列において,量子コンピューティングによって導入された脆弱性を網羅的に分析する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 04:20:05 GMT)
Conformer-1: Robust ASR via Large-Scale Semisupervised Bootstrapping [1.8] 本稿では,570k時間の音声データを対象としたエンドツーエンド自動音声認識(ASR)モデルを提案する。
我々は、強力なConformer RNN-Tベースラインモデルを用いて、ラベルのない公開データに対して擬似ラベルを生成する。
これらの擬似ラベル付きデータを追加することで、我々の非同期およびリアルタイムモデルでは、相対的なワードエラー率(WER)が11.5%、24.3%向上した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:23:35 GMT)
Foundational Competencies and Responsibilities of a Research Software Engineer [1.7] Research Software Engineerという用語は10年ほど前に、研究コミュニティで働く個人を表現し、ソフトウェア開発にフォーカスする手段として登場した。
スペクトルの一端では、RSEの役割は伝統的な研究の役割と似ているかもしれない。
反対に、彼らは業界のソフトウェアエンジニアに似ています。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:05:31 GMT)
Investigating Neural Machine Translation for Low-Resource Languages: Using Bavarian as a Case Study [1.7] 本稿では,ドイツ語とバイエルン語の自動翻訳システムを開発するために,最先端のニューラルマシン翻訳技術を再考する。
我々の実験では、バックトランスレーションとトランスファー学習を適用して、より多くのトレーニングデータを自動生成し、より高い翻訳性能を達成する。
ボニフェロニ補正による統計的意義は驚くほど高いベースラインシステムを示し、バックトランスレーションにより大幅な改善がもたらされた。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 06:16:26 GMT)
FaceFilterSense: A Filter-Resistant Face Recognition and Facial Attribute Analysis Framework [1.7] 面白い自撮りフィルターは、顔の生体認証システムの機能に大きく影響を与えている。
現在、顔のキーポイントを歪めているARベースのフィルターやフィルターは、最近流行し、裸眼でも顔が認識不能になっている。
これらの制約を緩和するため、我々は最新のフィルタの全体的影響分析を行い、フィルタ画像を用いたユーザ認識モデルを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:04:56 GMT)
Mitigating Cascading Effects in Large Adversarial Graph Environments [1.7] 社会の膨大なインフラは、電信グリッド、交通ネットワーク、ソーシャルネットワークなど、グラフ構造を用いてモデル化することができる。
それぞれのドメインは、電力グリッドに過負荷されたデバイスや、誤情報を含むソーシャルメディアポストのリーチなど、負の影響のカスケード拡散に影響を受けやすい。
本稿では,多ノード表現学習と対実データ拡張を用いたデータ駆動型深層学習手法を提案する。
我々は,提案手法が防衛戦略を識別できることを示す実験を通じて実証する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 20:23:02 GMT)
Number-State Reconstruction with a Single Single-Photon Avalanche Detector [1.6] 単光子雪崩検出器(SPAD)は多くの分野や用途において重要な光センサーである。
1つのSPADのみを用いて光子数状態再構成を行う手法を提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:00:28 GMT)
Training a Vision Language Model as Smartphone Assistant [1.4] モバイルデバイス上で多様なタスクをこなせる視覚言語モデル(VLM)を提案する。
私たちのモデルはユーザインターフェース(UI)のみと対話することで機能します。
従来の手法とは異なり、我々のモデルは単一の画面画像だけでなく、過去のスクリーンショットのシーケンスから生成された視覚言語文でも動作する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:28:44 GMT)
Using Information Flow to estimate interference between developers same method contributions [1.4] この研究は、統合シナリオにおける動的セマンティックコンフリクトの存在を示すために、情報フロー制御(IFC)が使えるかどうかを理解することを目的としている。
GoguenとMeseguerの干渉の概念のコードレベル適応を検知しようと試みる。
我々は、干渉を推定するために情報の流れが用いられるかどうかを理解するために評価を行う。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:29:22 GMT)
Quantum geometric tensor and the topological characterization of the extended Su-Schrieffer-Heeger model [1.3] エネルギーバンド電子の量子計量とベリー曲率の正確な式を導出する。
また、ガウス・ボンネットの定理に基づくエネルギーバンドの位相的オイラー数を得る。
ベリー曲率が第1ブリルアンゾーンで等しくゼロであるいくつかの領域は、量子計量の縮退をもたらす。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 03:34:56 GMT)
A Systematic Construction Approach for All $4\times 4$ Involutory MDS Matrices [1.3] 偶数次不揮発性MDS行列のいくつかの特性について述べる。
有限体上の4×4$不揮発性MDS行列を体系的に構築する手法を提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 05:37:42 GMT)
Transfer Learning Study of Motion Transformer-based Trajectory Predictions [1.3] 自動運転における軌道計画は、他の道路利用者の緊急行動を予測することに大きく依存している。
学習ベースの手法は現在、シミュレーションベースの課題において印象的な結果を示している。
本研究は,実世界への効果的な移行を支援するために,計算時間と性能のトレードオフの可能性に関する洞察を提供することを目的としている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 06:50:32 GMT)
On Input Formats for Radar Micro-Doppler Signature Processing by Convolutional Neural Networks [1.2] 位相情報の有用性と畳み込みニューラルネットワークに対するドップラー時間入力の最適なフォーマットを解析する。
畳み込みニューラルネットワーク分類器によって達成された性能は入力表現の種類に大きく影響されている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:30:08 GMT)
A Novel Micro-Doppler Coherence Loss for Deep Learning Radar Applications [1.1] 本稿では,入力と出力間のマイクロドップラー振動成分の正規化パワーが一致した場合に,マイクロドップラーコヒーレンス損失を最小化する。
実データを用いた実験により、導入した損失の応用により、モデルがノイズに対してより弾力性を持つことを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:11:07 GMT)
A higher-order transformation approach to the formalization and analysis of BPMN using graph transformation systems [1.1] 本稿ではBPMNの実行セマンティクスの形式化を提案する。
私たちのアプローチは、BPMNモデルからグラフ変換システムへの高次の変換に基づいています。
このアプローチの能力を示すため、オープンソースのWebベースツールとして実装しました。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 12:47:26 GMT)
Random walks on simplicial complexes [1.0] マルコフ連鎖の生成元は、離散構造に対する代数トポロジーの文脈で定義される上ラプラシアンであることが示される。
本研究は, 単体錯体が平坦なトーラスの再精製三角形の列である場合の拡散限界について検討する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 20:37:34 GMT)
Short vs. Long-term Coordination of Drones: When Distributed Optimization Meets Deep Reinforcement Learning [0.9] 自律型対話型ドローンの群れは、スマートシティーに魅力的なセンシング機能を提供する。
本稿では,コスト効率の高いナビゲーション,センシング,リチャージのための新しいコーディネートソリューションの提供を目的とする。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:32:58 GMT)
Measuring the Predictability of Recommender Systems using Structural Complexity Metrics [0.6] 本研究では,ユーザ・イテム評価行列の構造的複雑さに基づいて,RSの予測可能性を測定するためのデータ駆動メトリクスを提案する。
予測可能性の低いスコアは、複雑で予測不可能なユーザとイテムのインタラクションを示し、高い予測可能性スコアは予測可能性を持つより複雑なパターンを明らかにします。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 22:00:27 GMT)
Scarce Resource Allocations That Rely On Machine Learning Should Be Randomized [0.5] 本稿では,機械学習を用いて少ない資源を割当てることがしばしばランダム性を必要とすることを論じる。
我々は、個人が社会財や機会を割り当てなければならないという主張を、より適切に考慮する手順を提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:40:29 GMT)
Evaluating the Quality of Answers in Political Q&A Sessions with Large Language Models [0.5] 本稿では,政治質問・回答セッションにおける回答の質を評価するための新しいアプローチを提案する。
そこで本研究では,最初の質問を正確に推測できる度合いに基づいて,回答の品質を測定することを提案する。
回答の質は、質問する議員の党員会派によって大きく異なることが分かっています。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:16:53 GMT)
Semantic Approach to Quantifying the Consistency of Diffusion Model Image Generation [0.4] 拡散モデルにおける画像生成の再現性、あるいは一貫性の解釈可能な定量的スコアの必要性を同定する。
セマンティック・コンセンサス・スコアとしてペア平均CLIPスコアを用いるセマンティック・アプローチを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 20:16:03 GMT)
Potential of quantum scientific machine learning applied to weather modelling [0.4] 実世界のグローバルストリーム関数を4degの解像度で再現するために量子モデルをいかに訓練するかを示す。
次に、トレーニングされたモデルを用いて、人工的な初期気象状態から、目に見えない将来のダイナミクスを高精度に予測する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:01:26 GMT)
A Large Scale Survey of Motivation in Software Development and Analysis of its Validity [0.4] 文献から11人のモチベーターを特定し,その動機に対する相対的影響を評価した。
動機づけは内的主観的感情であるため,回答の有効性も分析する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:51:21 GMT)
Stochastic Halpern iteration in normed spaces and applications to reinforcement learning [0.3] 基礎となるオラクルが一様有界であれば,本手法は全体のオラクル複雑性が$tildeO(varepsilon-5)$であることを示す。
平均報酬と割引報酬を決定するための新しい同期アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 19:14:59 GMT)
Reducing the Barriers to Entry for Foundation Model Training [0.3] 最近、世界は機械学習と人工知能のアプリケーションに対する需要が前例のない加速を目撃した。
この需要の急増は、サプライチェーンの基盤技術スタックに多大な負担を課している。
技術エコシステム全体にわたるAIトレーニング基盤の根本的な変更を提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 20:58:25 GMT)
Paved2Paradise: Cost-Effective and Scalable LiDAR Simulation by Factoring the Real World [0.3] Paved2Paradiseは、スクラッチからライダーデータセットを生成するためのシンプルで費用対効果の高いアプローチである。
Paved2Paradise合成データのみを訓練したモデルが果樹園におけるヒトの検出に極めて有効であることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:19:36 GMT)
Regularized Gradient Clipping Provably Trains Wide and Deep Neural Networks [0.2] 我々は、クリッピング勾配アルゴリズムの正規化形式をインスタンス化し、ディープニューラルネットワーク損失関数の大域的最小値に収束できることを証明する。
我々は、我々の理論的に確立された正規化勾配クリッピングアルゴリズムが、最先端のディープラーニングと競合する経験的証拠を提示する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:37:42 GMT)
From News to Summaries: Building a Hungarian Corpus for Extractive and Abstractive Summarization [0.2] HunSum-2は、抽象的および抽出的要約モデルのトレーニングに適したオープンソースのハンガリー語コーパスである。
データセットは、徹底的なクリーニングを行うCommon Crawlコーパスのセグメントから組み立てられる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:05:13 GMT)
One-step implementation of nonadiabatic geometric fSim gate in superconducting circuits [0.2] 本稿では,非断熱的ホロノミック制御相(CP)ゲートと非断熱的非循環的幾何学的iSWAPゲートからなる非断熱的幾何学的fSimゲートの一段階実装を提案する。
非断熱的ホロノミックCPゲートと非断熱的幾何iSWAPゲートからなる複合非断熱的幾何学的fSimゲートと比較して,本手法は半分の時間を要し,パラメータ変動と環境影響を実証する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:04:20 GMT)
Leveraging Foundation Models for Content-Based Medical Image Retrieval in Radiology [0.1] コンテンツに基づく画像検索は、放射線学における診断支援と医学研究を大幅に改善する可能性がある。
現在のCBIRシステムは、特定の病態の専門化による限界に直面しており、実用性は制限されている。
本稿では,コンテンツに基づく医用画像検索のための特徴抽出器として視覚基盤モデルを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:52:24 GMT)
A different perspective on the Landau-Zener dynamics [0.1] ランダウ・ツェナー問題に対する2つの異なるアプローチを提案する。
マルコフ近似は方程式の非線形性を無視するが、それでも正確な結果を与える。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:29:23 GMT)
UMBCLU at SemEval-2024 Task 1A and 1C: Semantic Textual Relatedness with and without machine translation [0.1] SemEval-2024 Task 1の目的は、2つの文間の意味的テキスト関連性を特定するモデルを開発することである。
教師付きおよび言語間設定のための2つのSTRモデル、textitTranSem$ と $textitFineSem$ を開発します。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 00:53:29 GMT)
Reducing hallucination in structured outputs via Retrieval-Augmented Generation [0.0] 大型言語モデル(LLM)は、幻覚を除去または少なくとも減らすことなく、嵐によって世界を席巻した。
本稿では,構造化された出力の品質を大幅に向上させるために,検索拡張生成(RAG)を利用したシステムを提案する。
さらに,小型で訓練のよいエンコーダを用いることで,付随するLLMのサイズを小さくすることができることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 01:42:09 GMT)
Evaluation Framework for Quantum Security Risk Assessment: A Comprehensive Study for Quantum-Safe Migration [0.0] 大規模量子コンピューティングの台頭は、従来の暗号セキュリティ対策に重大な脅威をもたらす。
量子攻撃は、現在の非対称暗号アルゴリズムを損なう。
本研究では、量子セーフ暗号状態への移行の課題について検討する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 04:18:58 GMT)
Volume-entangled exact eigenstates in the PXP and related models in any dimension [0.0] PXPおよび関連するハミルトン族によってホストされたアインシュタイン-ポドルスキー-ローゼン型スカーステートの正確な体積絡み合いを報告した。
近い将来のRydberg量子デバイス上での具体的かつ実現可能なプロトコルを提供することで、そのような状態の実験的妥当性を指摘する。
また,時間外相関関数を無限温度で測定するための単純なプロトコルを記述することで,量子力学の研究におけるこれらの状態の有用性を実証する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 02:55:16 GMT)
Viewing the process of generating counterfactuals as a source of knowledge: a new approach for explaining classifiers [0.0] 本稿では,このシミュレーションプロセスを,使用可能な知識を,後に異なる方法で生成するための情報源として捉えることを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:49:57 GMT)
Uncertainty Quantification in Detecting Choroidal Metastases on MRI via Evolutionary Strategies [0.0] 不確かさの定量化は、放射線学におけるAIの実践的実装を促進する上で重要な役割を担っている。
両眼のMRI画像を用いた単純な畳み込みニューラルネットワーク(CNN)の訓練にDNEを用いた。
その結果,ヒトの放射線技師が評価した主観的特徴は,不確実性が高いイメージを説明できることがわかった。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 23:49:37 GMT)
Theory of time-bin entangled photons from quantum emitters [0.0] 絡み合った光子対は、量子通信の領域における多くの応用の基礎となる。
時間ビン符号化は分極符号化量子ビットに比べて安定性が向上する可能性がある。
我々は、量子状態トモグラフィー測定に対応する時間ビン符号化光子対の多重時間相関関数を導出する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 09:23:46 GMT)
Thematic Analysis with Large Language Models: does it work with languages other than English? A targeted test in Italian [0.0] 本稿では,大言語モデル(Large Language Model,LLM)を用いた主題解析(TA)を英語と異なる言語で行うテストを提案する。
イタリアにおけるセミ構造化インタビューのオープンアクセスデータセットを使用して、テストが提案される。
テストは、事前訓練されたモデルが、イタリア語のプロンプトを使用して、データ上でそのようなTAを実行可能であることを示している。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:10:09 GMT)
The boosted HP filter is more general than you might think [0.0] 本稿では,高次統合プロセスや時系列に拡張する傾向決定能力を拡張した。
さまざまな動的パターンを示すFREDデータベースに時系列の宇宙が与えられ、危機時のダウンターンをタイムリーにキャプチャし、その後に続くリカバリを行う。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:36:59 GMT)
Synthetic Dataset Creation and Fine-Tuning of Transformer Models for Question Answering in Serbian [0.0] 我々は、SQuAD-srという名前の87K以上のサンプルからなるセルビア最大のQAデータセットを作成します。
セルビア語でスクリプトの双対性を認めるために、我々はデータセットのキリル文字版とラテン文字版の両方を生成した。
最高の結果は、私たちのラテンSQuAD-srデータセット上でBERTi'cモデルを微調整し、73.91%のExact Matchと82.97%のF1スコアを得たことである。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 17:27:54 GMT)
Study of Emotion Concept Formation by Integrating Vision, Physiology, and Word Information using Multilayered Multimodal Latent Dirichlet Allocation [0.0] 構築された感情の理論は、近年の感情研究で一般的になっている。
感情概念は過去の経験を知識として記憶し、獲得した情報から観測されていない情報を予測することができる。
本研究では,構成的感情理論の観点から構成主義的アプローチを用いて感情概念の形成をモデル化する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:34:46 GMT)
Star exponentials from propagators and path integrals [0.0] 我々は、変形量子化形式に現れる恒星指数と、量子力学におけるプロパゲータに関連するファインマンの経路積分の関係に対処する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 21:15:25 GMT)
Speeding Up Squeezing with a Periodically Driven Dicke Model [0.0] 一般に用いられる1軸ねじれ(OAT)モデルよりも高速な時間スケールで高絡み合うスピン状態を生成するための簡便かつ効率的な方法を提案する。
我々は、周期的にディック・ハミルトニアンを共鳴周波数で駆動することにより、この系は、ハイゼンベルク極限スケールの絡み合った状態を迅速に生成することが知られている2軸対向ハミルトニアンとなることを示した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 19:43:51 GMT)
Single-qubit rotation algorithm with logarithmic Toffoli count and gate depth [0.0] 我々のアルゴリズムは、繰り返し固定回転を適用するのではなく、直ちに$R_thetaast$を適用する。
厳密に1/2$以上の確率で成功し、予想されるトフォリ数対数$tfrac1epsilon$、期待されるゲート深さ$tfrac1epsilon$で対数を持つ。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:20:06 GMT)
Simulation of a Vision Correction Display System [0.0] 本稿では,視覚障害者の視覚体験を高めるために,視覚補正ディスプレイ(VCD)のシミュレーションに焦点を当てた。
これらのシミュレーションでは、視覚力と快適さの潜在的な改善が見られる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 04:45:51 GMT)
Shortcuts to adiabaticity with general two-level non-Hermitian systems [0.0] 断熱性 (Adiabaticity) は、断熱過程と同じ最終状態を有限または短い時間で再現する高速な過程である。
本稿では,トランジッションレス量子駆動アルゴリズムをベースとした,断熱処理のショートカットを提案する。
一般ハミルトニアンが互いに共役しない非対角要素は、多くの物理系で実装可能であることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 02:15:07 GMT)
Scalable entanglement certification via quantum communication [0.0] 頑健な絡み合いの利点は可能であるが,アインシュタイン-ポドルスキー-ローゼンステアリングによって制限されていることを示す。
これにより、絡み合った2ビットのヴェルナー状態から絡み合う利点を証明し、高次元系への一般化を証明し、量子テレポーテーションへの接続を確立する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:20:13 GMT)
SIR-RL: Reinforcement Learning for Optimized Policy Control during Epidemiological Outbreaks in Emerging Market and Developing Economies [0.0] 本研究では,パンデミック時の健康・経済的成果の最適化を目的とした,新たな強化学習フレームワークを提案する。
強化学習を実施することで、政府の対応を最適化し、公衆衛生と経済の安定に関わる競争コストのバランスをとることを目指す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 12:11:51 GMT)
Rényi entropy of the permutationally invariant part of the ground state across a quantum phase transition [0.0] 本研究では, 密度行列(PIDM)の変分不変部分が, 量子相転移時の系の基底状態の性質を捉える上で果たす役割について検討する。
逆場イジング連鎖を例として、PIDMの2階R'enyiエントロピーを基底状態として計算する。
PIDMのR'enyiエントロピー(R'enyi entropy, R'enyi entropy, R'eny Entropy, R'enyi Entropy, R'enyi Entropy, R'enyi Entropy, R'enyi Entropy, R'enyi Entropy)の挙動を考察し, 相転移現象の解析への応用について検討した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 10:45:38 GMT)
Quantum Isotropic Universe in RQM Analogy: the Cosmological Horizon [0.0] 自由質量スカラー場の存在下での等方宇宙の量子力学について検討する。
宇宙の進化における「転回点」の導入によって、宇宙の膨張と崩壊を表す本質的な曖昧さが克服されることを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:47:00 GMT)
Public-private funding models in open source software development: A case study on scikit-learn [0.0] ケーススタディは、研究助成金、商業スポンサーシップ、コミュニティ寄付、フランスの人工知能戦略から3200万ユーロの助成金を組み合わせた、機械学習のためのPythonライブラリであるScikit-learnに関するものだ。
本研究は,シキット・ラーンのメンテナと資金提供者に対する25回のインタビューを通じて,研究と実践に2つの重要な貢献をしている。
公的、民間の資金提供者がシキット・ラーンを支援するために果たした役割や、メンテナーが資金提供者の多様な利益のバランスをとり、コミュニティの利益を守るために採用したプロセスとガバナンスの仕組みに光を当てている。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 22:06:02 GMT)
NeuroLGP-SM: Scalable Surrogate-Assisted Neuroevolution for Deep Neural Networks [0.0] 進化的アルゴリズムは、人工深層ニューラルネットワーク(DNN)のアーキテクチャ構成とトレーニングにおいて重要な役割を果たす
本研究では, DNNから出力される表現型距離ベクトルと, Kriging partial Least Squares (KPLS) を用いて探索する。
提案手法はニューロLinear Genetic Programming surrogate model (NeuroLGP-SM) と名付けられ, 完全評価を必要とせず, DNNの適合性を効率的に正確に推定する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 19:15:38 GMT)
Neural Likelihood Approximation for Integer Valued Time Series Data [0.0] 我々は、基礎となるモデルの無条件シミュレーションを用いて訓練できるニューラルな可能性近似を構築した。
本手法は,多くの生態学的および疫学的モデルを用いて推定を行うことにより実証する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 07:45:49 GMT)
Modeling the effects of perturbations and steepest entropy ascent on the time evolution of entanglement [0.0] この研究は、急激なエントロピー指数量子熱力学(SEAQT)の運動方程式、リンドブラッド方程式、および絡み合いの損失の様々な尺度を用いて、ベル対角状態の進化を分析する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:46:47 GMT)
Modeling Stochastic Chemical Kinetics on Quantum Computers [0.0] 三分子反応ネットワークのシュルオグルモデルを用いて、量子アルゴリズムを用いて化学動力学をモデル化する方法を示す。
ノイズやノイズのない量子シミュレーションによる量子計算結果は、古典的に計算された固有値やゼロモードと数パーセント以内で一致します。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:53:38 GMT)
Memory Traces: Are Transformers Tulving Machines? [0.0] メモリトレースは1975年にEndel TulvingとMichael J. Watkinsによる先駆的な研究で測定された。
LLMの現在の上位にオリジナルのTulving-Watkinsテストを再考させることは、基礎モデルがこのタイプの心理学モデルを完全にインスタンス化するかどうかを評価するのに役立つかもしれない。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 15:37:35 GMT)
Many-body entanglement and spectral clusters in the extended hard-core bosonic Hatano-Nelson model [0.0] ハードコア限界における拡張ボソニック・ハタノ・ネルソンモデルの多体絡みとスペクトルについて検討する。
本システムでは, ギャップレス位相から電荷密度波位相への位相遷移と, 1次励起状態における$mathcalPT$遷移が伴うことを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 02:34:57 GMT)
Lowering the Exponential Wall: Accelerating High-Entropy Alloy Catalysts Screening using Local Surface Energy Descriptors from Neural Network Potentials [0.0] 本研究では, 単金属系のデータから, HEAの特性を予測するモデルを高速に構築する手法を提案する。
従来の機械学習と量子機械学習の両方を用いて高精度なモデル開発を行う。
提案手法は, 新規触媒の設計を促進するため, HEAの広大な化学空間の迅速探索を可能にする。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 11:54:06 GMT)
Identification of a replicable optical security element using laser speckle [0.0] 提案した光学素子は、接触及び写真コピーから保護される。
セキュリティホログラムを具現化するための標準機器上で,提案したセキュリティ要素を大量生産できると仮定した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:25:50 GMT)
Grover's algorithm in a four-qubit silicon processor above the fault-tolerant threshold [0.0] 我々は、半導体スピン量子ビットで報告されている最も高い96.2%の忠実度を持つ3量子ビットグリーンバーガー・ホーネ・ザイリンガー状態(GHZ)を作成する。
ハイパーファイン相互作用によって提供される核スピンのすべての接続は、効率的なマルチキュービット演算を可能にする。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:05:34 GMT)
Graph data augmentation with Gromow-Wasserstein Barycenters [0.0] 非ユークリッド空間で動作するグラフに対する新たな拡張戦略が提案されている。
非ユークリッド距離、特にグロモウ=ワッサーシュタイン距離は、グラフンのより良い近似をもたらす。
このフレームワークはまた、異なるグラフオン推定アプローチを検証する手段を提供する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 10:22:55 GMT)
Geometric characterization for cyclic heat engines far from equilibrium [0.0] 循環型熱機関の経路に沿った幾何学的長さと,そのパワーと効率の関係について検討する。
我々は、幾何学的長さと熱機関の時間スケールを用いて、電力と効率のトレードオフ関係を確立する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:27:21 GMT)
Gauging Public Acceptance of Conditionally Automated Vehicles in the United States [0.0] 社会的影響、パフォーマンスの期待、努力の期待、ヘドニックな動機付け、条件の緩和により、条件付き自動車両の受け入れが決定される。
この研究から得られた知見を統合することで、ステークホルダーは自動運転車技術の採用をより促進できる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 00:11:32 GMT)
Explaining the Machine Learning Solution of the Ising Model [0.0] この研究は、統計物理学における機械学習(ML)研究の主要なターゲットである強磁性イジングモデルに対してどのように達成できるかを示す。
隠れた層を持たないニューラルネットワーク(NN)を使用し(最も単純な)、ハミルトニアンの対称性によって情報を伝達することにより、教師付き学習ソリューションを見つけるための戦略を説明する。
これらの結果は、物理インフォームドされた説明可能な一般化されたフレームワークへの道を開き、モデルのパラメータから物理法則と原理を抽出することができる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 10:36:28 GMT)
Decoding AI: The inside story of data analysis in ChatGPT [0.0] 本稿では,ChatGPTのデータ解析機能について,その性能を幅広いタスクで評価する。
DAは前例のない分析能力を持つ研究者や実践者を提供するが、完璧とは程遠いものであり、その限界を認識し、対処することが重要である。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:57:30 GMT)
Corn Yield Prediction Model with Deep Neural Networks for Smallholder Farmer Decision Support System [0.0] 作物の収量予測は、気象変数と土壌変数の相互作用がないという仮定に基づいてモデル化されている。
本稿では、相互作用の存在を論じ、Kendall相関係数を用いて微細にモデル化することができる。
提案したトウモロコシ収量モデルの目的は、小作農が賢く知的に養殖できるようにすることである。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 18:49:46 GMT)
Convergence of coordinate ascent variational inference for log-concave measures via optimal transport [0.0] 平均場推論 (VI) は、最も近い積(分解された)測度を求める問題である。
良く知られたアセンセント変分推論(CAVI)は、この近似測度を1つの座標上の変分によって求めるものである。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 19:43:54 GMT)
Completing the Quantum Reconstruction Program via the Relativity Principle [0.0] 量子力学の異なるキネマティクスはどちらも一つの原理に基づいている。
これは情報理論の原理によるQMの公理的再構成によって実現される。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:27:25 GMT)
Coherent States for infinite homogeneous waveguide arrays: Cauchy coherent states for $E(2)$ [0.0] ユークリッドE(2)対称性を持つ無限同質導波路アレイに対するペロモフコヒーレント状態が定義される。
ユークリアン E(2) 群のペレロモフコヒーレント状態は単純で自然な物理的実現を持つ。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 16:49:15 GMT)
Coherence properties of NV-center ensembles in diamond coupled to an electron-spin bath [0.0] 強相関電子スピン浴によるダイヤモンド中の窒素空孔中心のアンサンブルについて検討した。
クラスタ相関展開法 (CCE) を用いて, NV中心スピンの脱コヒーレンス特性を0.1-100ppmの浴中濃度で完全に計算した。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 10:44:12 GMT)
ChatGPT and general-purpose AI count fruits in pictures surprisingly well [0.0] 数ショットの学習を伴う基礎モデルは、従来のアプローチに比べて、時間と労力を大幅に節約することができる。
どちらのアプローチもコーディングスキルは必要とせず、AI教育と普及を促進することができる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 14:54:34 GMT)
CUDA-Accelerated Soft Robot Neural Evolution with Large Language Model Supervision [0.0] 本稿では,新しいニューラルネットワーク進化アプローチにより,ソフトロボットの形状と制御を共設計するという課題に対処する。
そこで本研究では,ソフトロボットを暗黙的に二重符号化する革新的な手法を提案し,形態学と制御の同時設計を容易にする。
また,進化過程において制御センタとして機能する大規模言語モデルも導入する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 19:24:06 GMT)
ASR advancements for indigenous languages: Quechua, Guarani, Bribri, Kotiria, and Wa'ikhana [0.0] 多様な情報源にまたがる音声コーパスをクロールすることで,各対象言語に対する信頼性の高いASRモデルを提案する。
凍結調整された更新とドロップアウト率は,lrのエポックの総数よりも重要なパラメータであることがわかった。
私たちは最高のモデルを解放します -- ワシカーナとコティリアの2つについて、これまでに報告された他のASRモデルはありません。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 10:12:38 GMT)
A randomized benchmarking suite for mid-circuit measurements [0.0] 本稿では、ランダム化ベンチマークのユビキタスパラダイムから開発された中間回路計測ベンチマークスイートを提案する。
我々は、我々のベンチマークスイートがどのようにして、測定されたキュービットとオブザーバキュービットの両方のエラーを検知し、定量化することができるかを示す。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 22:05:43 GMT)
A Technique for Classifying Static Gestures Using UWB Radar [0.0] UWBに基づく静的ジェスチャー認識のためのロバストなフレームワークを提案する。
我々の最高の性能モデルは96.78%の精度を達成した。
本研究は,UWB技術を用いた静的ジェスチャー認識の高度化に向けた重要な一歩である。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 03:14:34 GMT)
A Secure Quantum Key Distribution Protocol Using Two-Particle Transmission [0.0] Unextendible Product Bases (UPB) は、その固有の不明瞭さのため、量子暗号において約束を守る。
本研究は, UPBを用いて遠隔者間の量子鍵を確立するプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 13:51:40 GMT)
A Review of Reward Functions for Reinforcement Learning in the context of Autonomous Driving [0.0] 強化学習は自動運転にとって重要なアプローチである。
報酬関数は、強化学習において、学習したスキル目標を確立し、エージェントを最適な政策へ導くために用いられる。
自律運転は、目的と異なる優先度の度合いで部分的に矛盾する複雑な領域であるため、適切な報酬関数を開発することは、根本的な課題である。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 08:32:54 GMT)
A Cloud-Edge Framework for Energy-Efficient Event-Driven Control: An Integration of Online Supervised Learning, Spiking Neural Networks and Local Plasticity Rules [0.0] 本稿では,複雑な制御系における計算とエネルギーの制約に対処する新しいクラウドエッジフレームワークを提案する。
生物学的に妥当な学習法を局所的可塑性規則と組み合わせることで、スパイキングニューラルネットワーク(SNN)の効率性、スケーラビリティ、低レイテンシを活用する。
この設計は、植物に直接クラウドベースのコントローラからの制御信号を複製し、絶え間なく植物とクラウドの通信が不要になる。
論文参考訳(メタデータ) (Fri, 12 Apr 2024 22:34:17 GMT)