Guarantees on the structure of experimental quantum networks [105.1] 量子ネットワークは、セキュアな通信、ネットワーク量子コンピューティング、分散センシングのためのマルチパーティ量子リソースと多数のノードを接続し、供給する。
これらのネットワークのサイズが大きくなるにつれて、認証ツールはそれらの特性に関する質問に答える必要がある。
本稿では,ある量子ネットワークにおいて特定の相関が生成できないことを保証するための一般的な方法を示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:02:40 GMT)
On the Shortcut Learning in Multilingual Neural Machine Translation [95.3] 本研究は、多言語ニューラルマシン翻訳(MNMT)において、一般的に語られるオフターゲット問題を再考する。
ターゲット外の問題は、(非中心的、中心的でない)言語マッピングのショートカットが過度に適合していることに起因しています。
学習力学の解析によると、ショートカット学習はモデルトレーニングの後期に一般的に発生する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:09:36 GMT)
mlan: language-based instruction tuning improves zero-shot generalization of multimodal large language models [79.1] マルチモーダルな大規模言語モデルのゼロショットタスクの一般化を改善するために,新しい命令チューニング手法を提案する。
提案手法の有効性を,言語と視覚の両面にまたがる9つの未知のデータセットに対して評価した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:09:59 GMT)
Optimization-based Prompt Injection Attack to LLM-as-a-Judge [78.2] LLM-as-a-Judgeは、大きな言語モデル(LLM)を使用して、ある質問に対する候補セットから最適な応答を選択する。
LLM-as-a-Judgeに対する最適化に基づくプロンプトインジェクション攻撃であるJiceDeceiverを提案する。
評価の結果,JiceDeceiveは既存のプロンプトインジェクション攻撃よりも効果的であることがわかった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:57:28 GMT)
Q-VLM: Post-training Quantization for Large Vision-Language Models [73.2] 本稿では,大規模視覚言語モデル(LVLM)の学習後量子化フレームワークを提案する。
視覚言語モデル全体の離散化誤差に大きな影響を及ぼす層間依存関係を抽出し、この依存関係を最適な量子化戦略に組み込む。
実験の結果,提案手法はメモリを2.78倍圧縮し,出力速度を約13B LLaVAモデルで1.44倍向上させることができた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:57:06 GMT)
FitDiT: Advancing the Authentic Garment Details for High-fidelity Virtual Try-on [73.1] Diffusion Transformer (DiT) を用いた高忠実度仮想試行用ガーメント知覚増強技術FitDiT
布地テクスチャ抽出装置を導入し, 布地や模様, テクスチャなどのリッチな細部を, よりよく捉えられるようにした。
また,クロスカテゴリー試着中にマスク領域全体を埋める衣服の発生を防止し,衣料の正しい長さに適応する拡張緩和マスク戦略を採用した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:02:23 GMT)
InterFormer: Towards Effective Heterogeneous Interaction Learning for Click-Through Rate Prediction [72.5] 我々はインターリービング方式で異種情報インタラクションを学習するInterFormerという新しいモジュールを提案する。
提案するInterFormerは,3つのパブリックデータセットと大規模産業データセットに対して,最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:20:36 GMT)
Measuring Non-Adversarial Reproduction of Training Data in Large Language Models [71.6] 自然と良性のプロンプトに応答する際のモデル応答と事前学習データの重なりを定量化する。
一般的な会話言語モデルによるテキスト出力の最大15%は、インターネットのスニペットと重なることが判明した。
適切なプロンプトは、平均して非敵の再現を減少させるが、トレーニングデータの最悪の再現を緩和するには、より強力な防御が必要である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:55:01 GMT)
Labeled Datasets for Research on Information Operations [71.3] ソーシャルメディアプラットフォームによって検証されたIOポストと、同様のトピックを同じ時間フレーム(制御データ)で議論した303kアカウントによる1300万以上の投稿の両方を含む、26のキャンペーンに関するラベル付きデータセットを新たに提示する。
データセットは、さまざまなキャンペーンや国で調整されたアカウントによって使用される物語、ネットワークインタラクション、エンゲージメント戦略の研究を促進する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:15:01 GMT)
IDEATOR: Jailbreaking Large Vision-Language Models Using Themselves [67.3] ブラックボックスのジェイルブレイク攻撃に対して,悪意のある画像テキストペアを自動生成する新しいジェイルブレイク手法 IDEATOR を提案する。
IDEATORはVLMを使用して、ターゲットとなるJailbreakテキストを作成し、最先端の拡散モデルによって生成されたJailbreakイメージと組み合わせる。
平均5.34クエリでMiniGPT-4をジェイルブレイクし、LLaVA、InstructBLIP、Meta's Chameleonに転送すると82%、88%、75%という高い成功率を達成した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:41:50 GMT)
BioNeMo Framework: a modular, high-performance library for AI model development in drug discovery [67.0] 計算生物学と化学AIモデルのトレーニングを容易にするために,BioNeMo Frameworkを紹介した。
256のNVIDIA A100では、BioNeMo Frameworkは40億のパラメータBERTベースのPLMを4.2日で1兆個以上のトークンでトレーニングしている。
BioNeMo Frameworkはオープンソースで、誰でも自由に使える。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:46:16 GMT)
WavChat: A Survey of Spoken Dialogue Models [66.8] GPT-4oのようなシステムで実証された音声対話モデルの最近の進歩は、音声領域において大きな注目を集めている。
これらの高度な音声対話モデルは、音声、音楽、その他の音声関連の特徴を理解するだけでなく、音声のスタイリスティックな特徴や音節的な特徴も捉える。
音声対話システムの進歩にもかかわらず、これらのシステムを体系的に組織化し分析する包括的調査が欠如している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:16:45 GMT)
Enhancing the Reasoning Ability of Multimodal Large Language Models via Mixed Preference Optimization [65.6] 本稿では,MLLMのマルチモーダル推論能力を高めるための選好最適化プロセスを提案する。
我々は,マルチモーダルCoT性能を向上する,MPO(Mixed Preference Optimization)と呼ばれるシンプルで効果的な手法を開発した。
我々のモデルであるInternVL2-8B-MPOは、MathVista上で67.0の精度を実現し、InternVL2-8Bを8.7ポイント上回り、10倍のInternVL2-76Bに匹敵する性能を達成する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:59:27 GMT)
An undetectable watermark for generative image models [65.3] 生成画像モデルに対する検出不能な最初の透かし方式を提案する。
特に、検出不能な透かしは、効率的に計算可能なメートル法で画質を劣化させることはない。
提案手法は,擬似乱数誤り訂正符号を用いて拡散モデルの初期潜時間を選択する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:20:37 GMT)
Towards High-Fidelity 3D Portrait Generation with Rich Details by Cross-View Prior-Aware Diffusion [63.8] シングルイメージの3Dポートレート生成法は通常、多視点の知識を提供するために2次元拡散モデルを使用し、それを3次元表現に蒸留する。
本稿では,複数ビュー画像の状態の整合性を高める条件として,複数ビュー先行を明示的かつ暗黙的に組み込んだハイブリッド優先ディフジョンモデルを提案する。
実験により,1枚の画像から正確な幾何学的,詳細な3次元像を作成できることが示された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:19:18 GMT)
Budget-Aware Sequential Brick Assembly with Efficient Constraint Satisfaction [63.7] レゴブロックを用いた逐次レンガ組立体の課題に対処し、3D構造を創出する。
特に、使用されるレンガの数が増えるにつれて、組み立て可能な構造物の数は指数関数的に増加する。
本稿では,U字型スパース3次元畳み込みニューラルネットワークを用いて,次のブロック位置のスコアを予測する新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:42:07 GMT)
Motion-Grounded Video Reasoning: Understanding and Perceiving Motion at Pixel Level [63.2] Motion-Grounded Video Reasoningは、入力された質問に応じて視覚的回答(ビデオセグメンテーションマスク)を必要とする新しい動作理解タスクである。
このタスクは、質問による暗黙の推論を可能にすることで、明示的なアクション/モーショングラウンドの既存の基盤作業を、より一般的なフォーマットに拡張する。
我々はMotion-Grounded Video Reasoning Assistant(MORA)という新しいベースラインモデルを導入する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:45:09 GMT)
BiDense: Binarization for Dense Prediction [62.7] BiDenseは、効率よく正確な密度予測タスクのために設計された一般化されたバイナリニューラルネットワーク(BNN)である。
BiDenseは2つの重要なテクニックを取り入れている: 分散適応バイナリー (DAB) とチャネル適応完全精度バイパス (CFB) である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:46:04 GMT)
SlimLM: An Efficient Small Language Model for On-Device Document Assistance [61.0] SlimLMはモバイル端末上での文書支援タスクに最適化された一連のSLMである。
SlimLMはSlimPajama-627Bで事前訓練され、DocAssistで微調整されている。
我々はSlimLMを既存のSLMと比較し、同等または優れた性能を示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:44:34 GMT)
Model Inversion Attacks: A Survey of Approaches and Countermeasures [60.0] 近年、新しいタイプのプライバシ攻撃であるモデル反転攻撃(MIA)は、トレーニングのためのプライベートデータの機密性を抽出することを目的としている。
この重要性にもかかわらず、総合的な概要とMIAに関する深い洞察を提供する体系的な研究が欠如している。
本調査は、攻撃と防御の両方において、最新のMIA手法を要約することを目的としている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:09:28 GMT)
Generative Agent Simulations of 1,000 People [56.8] 本稿では,1,052人の実人の態度と行動をシミュレートする新しいエージェントアーキテクチャを提案する。
生成エージェントは一般社会調査の参加者の回答を85%の精度で再現する。
我々のアーキテクチャは、人種的およびイデオロギー的グループにおける正確さのバイアスを、人口統計学的記述のエージェントと比較して低減する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:14:34 GMT)
MARS: Unleashing the Power of Variance Reduction for Training Large Models [56.5] Adam、Adam、およびそれらの変種のような大規模な勾配アルゴリズムは、この種のトレーニングの開発の中心となっている。
本稿では,事前条件付き勾配最適化手法と,スケールドモーメント手法による分散低減を両立させる枠組みを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:57:39 GMT)
Confidence-aware Denoised Fine-tuning of Off-the-shelf Models for Certified Robustness [56.2] 我々はFT-CADIS(Fun Fine-Tuning with Confidence-Aware Denoized Image Selection)を紹介する。
FT-CADISは、既成の分類器の信頼性が、視覚的平滑化中の幻覚像を効果的に識別できるという観察に着想を得たものである。
様々なベンチマークにおいて、すべての$ell$-adversary半径にわたる偏微分平滑化法のうち、最先端の証明されたロバスト性を確立している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:13:33 GMT)
Partial Scene Text Retrieval [56.1] 部分的なシーンテキスト検索のタスクは、画像ギャラリーから与えられたクエリテキストと同一または類似のテキストインスタンスをローカライズして検索することである。
既存のメソッドはテキストラインインスタンスのみを扱うことができ、部分パッチの検索は未解決のままである。
テキストラインインスタンスと部分パッチの両方を同時に検索できるネットワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:08:04 GMT)
Graph-based Complexity for Causal Effect by Empirical Plug-in [56.1] 本稿では、因果効果クエリに対する経験的プラグイン推定の計算複雑性に焦点を当てる。
計算は、推定値のハイパーグラフに依存するため、データサイズにおいて、潜在的に線形な時間で効率的に行うことができることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:42:01 GMT)
A Dynamic LLM-Powered Agent Network for Task-Oriented Agent Collaboration [55.4] 本稿では,様々なタスクやドメインに対する動的コミュニケーション構造において,候補からエージェントのチームを自動的に選択する手法を提案する。
具体的には, LLMを利用したエージェント協調のための動的LLMパワーエージェントネットワーク(textDyLAN$)というフレームワークを構築した。
我々は、コード生成、意思決定、一般的な推論、算術的推論タスクにおいて、適度な計算コストで、DyLANが強力なベースラインを上回ることを実証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:30:04 GMT)
Networking Systems for Video Anomaly Detection: A Tutorial and Survey [55.3] ビデオ異常検出(VAD)は人工知能(AI)コミュニティにおける基本的な研究課題である。
本稿では,各種深層学習駆動型VAD経路の基本前提,学習フレームワーク,適用シナリオについて述べる。
我々は、産業用IoTおよびスマート都市における最新のNSVAD研究と、デプロイ可能なNSVADのためのエンドクラウド共同アーキテクチャを紹介します。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:44:40 GMT)
REBORN: Reinforcement-Learned Boundary Segmentation with Iterative Training for Unsupervised ASR [54.6] 教師なしASRにおける反復訓練を用いたREBORN, Reinforcement-Learned boundaryを提案する。
ReBORNは、音声信号におけるセグメント構造の境界を予測するセグメンテーションモデルのトレーニングと、セグメンテーションモデルによってセグメント化された音声特徴である音素予測モデルのトレーニングを交互に行い、音素転写を予測する。
我々は、広範囲にわたる実験を行い、同じ条件下で、REBORNは、LibriSpeech、TIMIT、および5つの非英語言語において、以前の教師なしASRモデルよりも優れていることを発見した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:38:26 GMT)
A Low-rank Matching Attention based Cross-modal Feature Fusion Method for Conversational Emotion Recognition [54.4] 低ランクマッチング注意法(LMAM)と呼ばれる新しい軽量クロスモーダル機能融合法を提案する。
LMAMは、会話における文脈的感情的意味情報を効果的に捉え、自己認識機構によって引き起こされる二次的複雑性問題を緩和する。
実験により, LMAMの軽量化を前提として, 他の一般的な相互拡散法と比較し, LMAMの優位性を検証した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:44:58 GMT)
Statistical Analysis of Policy Space Compression Problem [54.2] 政策探索手法は強化学習において重要であり、継続的な状態反応と部分的に観察可能な問題に対処するための枠組みを提供する。
政策圧縮による政策空間の削減は、学習プロセスを加速するための強力で報酬のないアプローチとして現れます。
この手法は方針空間をより小さく代表的な集合に凝縮し、元の効果のほとんどを維持している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:46:55 GMT)
CleanerCLIP: Fine-grained Counterfactual Semantic Augmentation for Backdoor Defense in Contrastive Learning [53.8] バックドアトリガの特徴的接続を遮断するための細粒な textbfText textbfAlignment textbfCleaner (TA-Cleaner) を提案する。
TA-Cleanerは、ファインタニングベースの防御技術の中で最先端の防御性を達成している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:56:58 GMT)
Step-wise Distribution Alignment Guided Style Prompt Tuning for Source-free Cross-domain Few-shot Learning [53.6] クロスドメインの少数ショット学習手法は、アクセス不能なソースデータとトレーニング戦略により、大規模事前学習モデルの課題に直面している。
本稿では,ステップワイド配向ガイド型プロンプトチューニング(StepSPT)を紹介する。
StepSPTは予測分布最適化を通じて暗黙的にドメインギャップを狭める。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:34:07 GMT)
FengWu-W2S: A deep learning model for seamless weather-to-subseasonal forecast of global atmosphere [53.2] 本研究では,FengWuグローバル気象予報モデルに基づくFengWu-Weather to Subseasonal (FengWu-W2S)を提案する。
我々は,FengWu-W2Sが大気環境を3~6週間先まで確実に予測し,マデン・ジュリア振動 (MJO) や北大西洋振動 (NAO) などの地球表面温度, 降水量, 地磁気高度, 季節内信号の予測能力を向上させることを実証した。
日時から季節時の予測誤差成長に関するアブレーション実験
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:44:37 GMT)
LLM-assisted Explicit and Implicit Multi-interest Learning Framework for Sequential Recommendation [51.0] 本研究では,ユーザの興味を2つのレベル – 行動と意味論 – でモデル化する,明示的で暗黙的な多目的学習フレームワークを提案する。
提案するEIMFフレームワークは,小型モデルとLLMを効果的に組み合わせ,多目的モデリングの精度を向上させる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:53:36 GMT)
Demystifying Large Language Models for Medicine: A Primer [50.8] 大規模言語モデル(LLM)は、医療のさまざまな側面に革命をもたらすことのできる、変革的なAIツールのクラスである。
本チュートリアルは、LSMを臨床実践に効果的に統合するために必要なツールを医療専門家に提供することを目的としている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:15:18 GMT)
Towards Sample-Efficiency and Generalization of Transfer and Inverse Reinforcement Learning: A Comprehensive Literature Review [50.7] 本稿では,転送および逆強化学習(T-IRL)によるRLアルゴリズムのサンプル効率と一般化を実現するための総合的なレビューを行う。
以上の結果から,最近の研究成果の大部分は,人間のループとシム・トゥ・リアル戦略を活用することで,上記の課題に対処していることが示唆された。
IRL構造の下では、経験の少ない移行と、そのようなフレームワークのマルチエージェントおよびマルチインテンション問題への拡張を必要とするトレーニングスキームが近年研究者の優先事項となっている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:18:57 GMT)
Instruction-Guided Editing Controls for Images and Multimedia: A Survey in LLM era [49.2] 命令ベースの編集の最近の進歩は、ユーザ意図と複雑な編集操作の間の橋渡しとして自然言語を用いて、視覚コンテンツとの直感的な対話を可能にしている。
我々は,エンターテイメントから教育に至るまで,様々な産業において強力なビジュアル編集を民主化することを目指している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:18:15 GMT)
Semiparametric inference for impulse response functions using double/debiased machine learning [49.2] 本稿では,インパルス応答関数(IRF)に対する機械学習推定手法を提案する。
提案した推定器は、処理と結果変数の完全な非パラメトリック関係に依存することができ、柔軟な機械学習アプローチを用いてIRFを推定することができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:42:02 GMT)
First Steps towards K-12 Computer Science Education in Portugal -- Experience Report [49.2] 本報告では,ポルトガルにおけるensICO協会の取り組みについて報告する。
2020年のいくつかの学校でのパイロットプロジェクトから始まり、現在4500人の学生、35の学校、100の学校教師と協力している。
主な目的は、コンピュータを必須科目として教えるための総合的なシラバスを定義するのに十分な経験と知識を得ることである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:32:52 GMT)
Discovery of Timeline and Crowd Reaction of Software Vulnerability Disclosures [47.4] Apache Log4Jはリモートコード実行攻撃に対して脆弱であることが判明した。
35,000以上のパッケージが最新バージョンでLog4Jライブラリをアップデートせざるを得なかった。
ソフトウェアベンダが脆弱性のないバージョンをリリースするたびに、ソフトウェア開発者がサードパーティのライブラリを更新するのは、事実上妥当です。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:45:19 GMT)
OnlyFlow: Optical Flow based Motion Conditioning for Video Diffusion Models [46.7] 本稿では,カメラの移動制御や映像編集などの様々な用途において,正確な制御を行うテキスト・ツー・ビデオ生成タスクの問題点について考察する。
入力ビデオから抽出した光フローを利用して生成ビデオの動作を条件付ける手法である OnlyFlow を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:19:25 GMT)
NeISF++: Neural Incident Stokes Field for Polarized Inverse Rendering of Conductors and Dielectrics [46.7] 導体と誘電体をサポートする逆レンダリングパイプラインであるNeISF++を提案する。
本提案の主成分は導体と誘電体の両方を記述した一般的なpBRDFである。
合成および実データを用いた実験結果から,本手法は既存の偏極逆レンダリング法を超越し,幾何学的および物質的分解を行った。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:42:57 GMT)
Graph Neural Networks Do Not Always Oversmooth [46.6] グラフ畳み込みネットワーク (GCN) における過剰スムーシングを, 無限に多くの隠れた特徴の極限におけるガウス過程 (GP) の等価性を用いて検討する。
ネットワークの初期重みが十分に大きな場合、GCNは過度に過度に変化せず、ノード特徴は大きな深さでも情報的のままである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:41:56 GMT)
Learning rheological parameters of non-Newtonian fluids from velocimetry data [46.2] せん断薄い流体の最も可能性が高いカラオウパラメータを学習するアルゴリズムを考案する。
このアルゴリズムは,最も可能性の高いCarreauパラメータを学習することで,流れ場を再構築できることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:55:00 GMT)
Enhancing Diffusion Posterior Sampling for Inverse Problems by Integrating Crafted Measurements [45.7] 拡散モデルは視覚生成のための強力な基礎モデルとして登場してきた。
現在の後方サンプリングに基づく手法では、測定結果を後方サンプリングに取り込み、対象データの分布を推定する。
本研究は, 早期に高周波情報を早期に導入し, より大きい推定誤差を生じさせることを示す。
工芸品計測を取り入れた新しい拡散後サンプリング手法DPS-CMを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:06:57 GMT)
Low-Latency Task-Oriented Communications with Multi-Round, Multi-Task Deep Learning [45.6] 本稿では,マルチラウンド・マルチタスク・ラーニング(MRMTL)によるマルチラウンド・トランスミッションにおけるチャネル利用の動的更新を提案する。
MRMTLはタスク指向通信の効率を大幅に向上することを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:48:06 GMT)
Number it: Temporal Grounding Videos like Flipping Manga [45.5] Number-Prompt (NumPro) は、Vid-LLMに時間的接地による視覚的理解をブリッジする手法である。
NumProは動画をフレーム画像のシーケンスとして扱い、VTGを直感的なプロセスに変換します。
実験により、NumProは計算コストを伴わずに最上位のVid-LLMのVTG性能を大幅に向上することが示された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:32:34 GMT)
Let people fail! Exploring the influence of explainable virtual and robotic agents in learning-by-doing tasks [45.2] 本研究は,古典的対パートナー意識による説明が学習作業中の人間の行動とパフォーマンスに与える影響を比較検討した。
その結果, パートナー意識による説明は, 関係する人工エージェントの種類によって, 参加者に異なる影響を及ぼした。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:22:04 GMT)
MDHP-Net: Detecting Injection Attacks on In-vehicle Network using Multi-Dimensional Hawkes Process and Temporal Model [44.4] 本稿では、インジェクションアタックとして知られる特定のタイプのサイバーアタックについて考察する。
これらのインジェクション攻撃は時間の経過とともに効果があり、徐々にネットワークトラフィックを操作し、車両の正常な機能を破壊している。
本稿では,MDHP-LSTMブロックに最適なMDHPパラメータを組み込んだインジェクション攻撃検出器MDHP-Netを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:05:01 GMT)
BONE: a unifying framework for Bayesian online learning in non-stationary environments [44.3] BONE は (B)ayesian (O)nline learning in (N)on-stationary (E)nvironments の略である。
BONEは、オンライン学習、事前予測、文脈的盗賊など、さまざまな問題に対処するための共通の構造を提供する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:52:02 GMT)
DiffLoRA: Generating Personalized Low-Rank Adaptation Weights with Diffusion [43.6] DiffLoRAは、拡散モデルをハイパーネットワークとして活用し、パーソナライズされた低ランク適応重みを予測できる効率的な手法である。
これらのLoRA重みをオフザシェルのテキスト・ツー・イメージモデルに組み込むことで、推論中にゼロショットのパーソナライズが可能になる。
本稿では、DiffLoRAのトレーニングプロセスを容易にするために、新しいアイデンティティ指向のLoRA重み付けパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:36:51 GMT)
Legal Evalutions and Challenges of Large Language Models [42.5] 我々は,OPENAI o1モデルを事例研究として,法律規定の適用における大規模モデルの性能評価に利用した。
我々は、オープンソース、クローズドソース、および法律ドメインのために特別に訓練された法律固有のモデルを含む、最先端のLLMを比較します。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:23:12 GMT)
Explainable Artificial Intelligence for Medical Applications: A Review [42.3] 本稿では、説明可能な人工知能(XAI)に関する最近の研究をレビューする。
視覚、オーディオ、マルチモーダルの観点からの医療実践に焦点を当てている。
我々は、将来の研究者や医療専門家に支援とガイダンスを提供することを目的として、これらのプラクティスを分類し、合成することに努めます。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:31:06 GMT)
Try-On-Adapter: A Simple and Flexible Try-On Paradigm [42.3] オンラインショッピングで広く使われている画像ベースの仮想試着は、特定の衣服に着飾った自然な服装の人のイメージを作成することを目的としている。
従来の手法では、元のモデルの立像の特定の部分をマスキングし、マスクされた領域に塗布することで、対応する参照服を身に着けたモデルのリアルなイメージを生成する。
本稿では,既存の塗装パラダイムと異なる塗装パラダイムであるトライオンアダプタ(TOA)を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:35:58 GMT)
Region-Aware Text-to-Image Generation via Hard Binding and Soft Refinement [40.9] 本稿では,正確なレイアウト構成のための地域記述を前提とした地域認識テキスト・画像生成手法であるRAGを提案する。
RAGは従来のチューニング不要手法よりも属性バインディングやオブジェクト関係よりも優れた性能を実現している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:38:32 GMT)
Deep learning robotics using self-supervised spatial differentiation drive autonomous contact-based semiconductor characterization [40.4] 空間的に異なる損失関数を持つ自己教師型畳み込みニューラルネットワークを提案する。
このネットワークは、既存のモデルと比較して、有効なポーズ生成を20.0%改善する。
我々は,3,025個の予測ポーズで光伝導性を特徴付ける4自由度ロボットを駆動することで,ネットワークの性能を実証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:36:36 GMT)
M-VAR: Decoupled Scale-wise Autoregressive Modeling for High-Quality Image Generation [40.0] このスケールワイド自己回帰フレームワークは,テキストイントラスケールモデリングに効果的に分離可能であることを示す。
計算オーバーヘッドを大幅に削減するために,Mambaのような線形複雑度機構を適用した。
実験により,本手法は画像品質と生成速度の両方で既存モデルより優れていることが示された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:54:42 GMT)
Creation and Evaluation of a Food Product Image Dataset for Product Property Extraction [39.6] 自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:29:05 GMT)
Drift-Resilient TabPFN: In-Context Learning Temporal Distribution Shifts on Tabular Data [39.4] In-Context Learning with a Prior-Data Fitted Network に基づく新しいアプローチである Drift-Resilient TabPFN を提案する。
先行した合成データセットのベイズ推定を近似することを学ぶ。
精度は0.688から0.744に向上し、OC AUCは0.786から0.832に向上し、キャリブレーションも強化された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 23:49:23 GMT)
Agentic LLMs in the Supply Chain: Towards Autonomous Multi-Agent Consensus-Seeking [39.4] 大規模言語モデル(LLM)はサプライチェーン管理(SCM)におけるコンセンサス検索を自動化する
従来のSCMは、ブルウィップ効果のような創発的な問題を避けるために、意思決定における人間のコンセンサスに依存している。
ジェネレーティブAI、特にLLMの最近の進歩は、これらの障壁を克服する約束を示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:33:10 GMT)
Recent Advances on Machine Learning-aided DSP for Short-reach and Long-haul Optical Communications [39.1] 光通信のための等化器の実装に機械学習を用いた最近の進歩を強調した。
我々は,従来のハードウェアとニューロモルフィックハードウェアを用いた実装とアルゴリズムの進歩を強調した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:53:40 GMT)
LLMs are Imperfect, Then What? An Empirical Study on LLM Failures in Software Engineering [38.2] 非自明なソフトウェアエンジニアリングタスクにおいて,ChatGPTをコーディングアシスタントとして使用した22名の参加者を対象に,観察的研究を行った。
そこで我々は,ChatGPTが失敗した事例,その根本原因,およびユーザが使用する緩和ソリューションを特定した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:29:41 GMT)
Treat Visual Tokens as Text? But Your MLLM Only Needs Fewer Efforts to See [37.7] MLLM(Multimodal Large Language Models)は、視覚エンコーダからの視覚トークンをテキストトークンとして扱う。
トークンの数が増加するにつれて、LLMにおける計算の2次スケーリングは効率のボトルネックをもたらす。
本研究では,LLaVAにおけるパラメータと計算パターンの両レベルでの視覚計算の冗長性について検討する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:43:23 GMT)
Co-Fix3D: Enhancing 3D Object Detection with Collaborative Refinement [37.2] 運転シナリオにおける3次元物体検出は、複雑な道路環境の課題に直面している。
我々はCo-Fix3Dと呼ばれる高度な検出フレームワークを提案する。
Co-Fix3DはLocal and Global Enhancement (LGE)モジュールを統合し、Bird's Eye View (BEV)機能を洗練する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:09:34 GMT)
SEAGULL: No-reference Image Quality Assessment for Regions of Interest via Vision-Language Instruction Tuning [36.7] 本稿では,大規模視覚・言語モデルを用いたGUidanceを用いてROI品質を評価・評価できる新しいネットワークSEAGULLを提案する。
SEAGULLは、視覚言語モデル(VLM)、SAM(Segment Anything Model)によって生成されたマスクをROIとして、MFE(Mask-based Feature Extractor)を巧みに設計し、指定されたROIのグローバルトークンとローカルトークンを抽出する。
SEAGULL-100w の事前トレーニングと SEAGULL-3k の微調整を行った後, SEAGULL は細粒化ROI 品質評価において顕著な性能を示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:07:22 GMT)
On the Privacy Risk of In-context Learning [36.6] 我々は、プロンプトモデルがプロンプト内で使用されるデータに対して、重大なプライバシーリスクを示すことを示した。
また、トリガーモデルのプライバシリスクが、同じユーティリティレベルで微調整されたモデルを超えることも観察します。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:11:42 GMT)
Flow Priors for Linear Inverse Problems via Iterative Corrupted Trajectory Matching [35.8] 本稿では,MAP推定器を効率的に近似する反復アルゴリズムを提案し,様々な線形逆問題の解法を提案する。
本アルゴリズムは,MAPの目的を局所MAP'の目的の和で近似できるという観測によって数学的に正当化される。
我々は,超解法,デブロアリング,インペイント,圧縮センシングなど,様々な線形逆問題に対するアプローチを検証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:10:51 GMT)
Semantics and Spatiality of Emergent Communication [35.1] メッセージは、インスタンス間で同様の意味を持つべきだという考え方に基づいて、意味のあるコミュニケーションにゴールに依存しない前提条件を特定します。
軽微な仮定の下では、意味的に一貫性のない通信プロトコルが識別タスクの最適解であることを示す。
また, 再建目的は, メッセージ間の距離を考慮に入れた, より厳密な特性, 空間的意味性を促進することも示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:19:27 GMT)
Private Counterfactual Retrieval With Immutable Features [34.1] 分類タスクにおいて、対実的な説明は、入力が好ましいクラスに分類されるために必要な最小限の変更を提供する。
受理されたサンプルのデータベースから最も近い正解をプライベートに回収する問題を考察する。
プライベート情報検索(PIR)の技術を活用し,その通信コストを特徴付ける2つのI-PCR手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:50:53 GMT)
VeriGraph: Scene Graphs for Execution Verifiable Robot Planning [33.9] 本稿では,ロボット計画のための視覚言語モデル(VLM)を統合するフレームワークであるVeriGraphを提案する。
VeriGraphはシーングラフを中間表現として使用し、キーオブジェクトと空間関係をキャプチャして、計画検証と改善を改善する。
提案手法は,多様な操作シナリオにおけるタスク完了率を大幅に向上させ,言語ベースタスクでは58%,画像ベースタスクでは30%,ベースラインメソッドでは58%向上させる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:59:51 GMT)
LLaVA-o1: Let Vision Language Models Reason Step-by-Step [33.7] LLaVA-o1は、自律的な多段階推論を実現するために設計された新しいVLMである。
チェーン・オブ・シークレットのプロンプトとは異なり、LLaVA-o1は独立に要約、視覚的解釈、論理的推論、結論生成の逐次的な段階に関与する。
100kのトレーニングサンプルと単純な推論時間スケーリング法により、LLaVA-o1はベースモデルよりも8.9%性能が向上する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:58:31 GMT)
A minimalistic representation model for head direction system [33.7] 本稿では,方向(HD)システムに対する最小限の表現モデルを提案する。
本研究の目的は,HD細胞の本質的特性を捉えた頭部方向の高次元的表現を学習することである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:38:33 GMT)
Bridging The Gap between Low-rank and Orthogonal Adaptation via Householder Reflection Adaptation [32.4] 家庭内リフレクション適応法 (HRA) は, 家庭内リフレクションに基づく簡易かつ効果的な適応法である。
HRAは、大きな言語モデルと条件付き画像生成装置を適用する際に、学習可能なパラメータが少なくて優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:02:03 GMT)
Face De-identification: State-of-the-art Methods and Comparative Studies [32.3] 顔の特定は、顔画像のプライバシーを保護する効果的な手段とみなされる。
本稿では,現在最先端の顔識別手法を,ピクセルレベル,表現レベル,意味レベルという3つのレベルに分類する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 01:00:00 GMT)
RSHazeDiff: A Unified Fourier-aware Diffusion Model for Remote Sensing Image Dehazing [32.2] Hazeはリモートセンシング画像の視覚的品質を著しく低下させる。
本稿では,RSHazeDiffと呼ばれるリモートセンシング画像デハージングのための新しいFourier-aware拡散モデルを提案する。
合成および実世界のベンチマークの実験は、最先端の手法よりもRSHazeDiffの好ましい性能を検証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:17:07 GMT)
Upsample or Upweight? Balanced Training on Heavily Imbalanced Datasets [31.6] ドメイン間のデータの可用性は、しばしば長いテール分布に従う。
この不均衡は、すべてのドメインで一様に言語モデルをトレーニングする際の課題を生じさせる。
トレーニング中の温度サンプリングを減らし,低リソース言語に過度に適合することなく収束を加速する手法であるCooldownを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:33:18 GMT)
Definition and Detection of Centralization Defects in Smart Contracts [30.2] スマートコントラクトの集中化欠陥に起因するセキュリティインシデントは、かなりの財政的損失をもたらしている。
本稿では,597のStack Exchangeポストと117の監査レポートを手作業で分析することにより,スマートコントラクトの集中化欠陥を6種類紹介する。
我々は,CDRipper (Centralization Defects Ripper) というツールを導入し,その定義した集中化欠陥を特定する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:16:16 GMT)
Seeing Clearly by Layer Two: Enhancing Attention Heads to Alleviate Hallucination in LVLMs [30.1] 幻覚は、画像トークンの自己注意行列における注意シンクのパターンと密接に関連している。
我々は、textcolorredtextbfEnhancing textcolorredtextbfAttention textcolorredtextbfHeads (EAH)というトレーニング不要な方法を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:51:29 GMT)
Dockformer: A transformer-based molecular docking paradigm for large-scale virtual screening [29.9] 複合ライブラリのサイズが大きくなるにつれて、従来のドッキングモデルの複雑さが増す。
ディープラーニングアルゴリズムは、ドッキングプロセスのスピードを高めるために、データ駆動リサーチと開発モデルを提供することができる。
本研究では,Dockformerという,ディープラーニングに基づくドッキング手法を紹介する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:31:52 GMT)
KuaiFormer: Transformer-Based Retrieval at Kuaishou [29.3] 大規模なコンテントレコメンデーションシステムにデプロイされたトランスフォーマーベースの検索フレームワークであるKuaiFormerを紹介する。
KuaiFormerは、従来のスコア推定タスクからトランスフォーマー駆動のNext Action Predictionパラダイムに移行することで、検索プロセスを再定義する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:20:46 GMT)
Introduction to AI Safety, Ethics, and Society [28.6] この本は、AIリスクを理解するための包括的なアプローチを提供することを目的としている。
この本は様々な背景から読者がアクセスできるように設計されている。
コンテンツはスリムでモジュラーなので、どの章を読むかを選べる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 23:19:18 GMT)
How Does Vision-Language Adaptation Impact the Safety of Vision Language Models? [27.5] 大規模言語モデル(LLM)を大規模視覚言語モデル(LVLM)に変換する視覚言語適応(VL適応)
安全性対策の弱さによる潜在的有害性にもかかわらず、VL適応の安全性への影響に関する詳細な分析は未調査のままである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:20:57 GMT)
Provably Unlearnable Data Examples [27.2] 原文(投稿日:2012/09/19)へのリンク 未許可のモデルでは、共有データを学習不能にするための努力が続けられている。
本稿では、学習不能データセットのいわゆる$(q, eta)$-Learnabilityを認証するためのメカニズムを提案する。
認証の低い$(q, eta)$-Learnabilityは、データセットに対するより堅牢で効果的な保護を示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:28:15 GMT)
Is Precise Recovery Necessary? A Task-Oriented Imputation Approach for Time Series Forecasting on Variable Subset [27.2] 時系列予測のための可変サブセット予測のためのタスク指向インプット(TOI-VSF)を提案する。
TOI-VSFは、不足変数を補うように設計された予測モデルに依存しない自己教師型計算モジュールを組み込んでいる。
4つのデータセットにわたる大規模な実験は、TOI-VSFの優位性を示し、ベースラインメソッドを平均15%以上上回っている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:00:54 GMT)
Exploiting Cross-Layer Vulnerabilities: Off-Path Attacks on the TCP/IP Protocol Suite [27.0] ICMPエラーメッセージによるTCP/IPプロトコルスイート内の層間相互作用について検討する。
情報漏洩、非同期化、セマンティックギャップ、アイデンティティスプーリングなど、いくつかの重大な脆弱性を発見しました。
これらの脆弱性は、ネットワークトラフィックを密かに操作するオフパス攻撃者によって悪用され、人気のあるウェブサイトの20%以上と公共Wi-Fiネットワークの89%以上に影響を与える。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:41:53 GMT)
Breaking the $T^{2/3}$ Barrier for Sequential Calibration [26.6] バイナリシーケンスのオンライン校正予測の問題について検討する。
Foster & Vohra (1998) は、$O(T2/3)$キャリブレーション誤差を$T$タイムステップ後に引き起こし、$Omega(T1/2)$の低い境界を示した。
Qiao & Valiant (2021) は、符号保存と呼ばれるゲームを導入して下限を$Omega(T0.528)$に改善した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:32:38 GMT)
Visual-Linguistic Agent: Towards Collaborative Contextual Object Reasoning [26.4] Visual-Linguistic Agent (VLA)は、MLLMのリレーショナル推論強度と従来の物体検出器の正確な位置決め能力を組み合わせた協調的なフレームワークである。
VLAは空間的推論とオブジェクトローカライゼーションの両方を強化し、マルチモーダル理解における重要な課題に対処する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:02:06 GMT)
Mitigating Hallucination in Multimodal Large Language Model via Hallucination-targeted Direct Preference Optimization [26.3] MLLM(Multimodal Large Language Models)は幻覚として知られており、実用性に制限がある。
MLLMにおける幻覚を低減するために,Halucination-targeted Direct Preference Optimization (HDPO)を導入する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:56:01 GMT)
Mitigating the Linguistic Gap with Phonemic Representations for Robust Cross-lingual Transfer [26.0] 多言語理解の改善へのアプローチは、高リソース言語と低リソース言語の間の大きなパフォーマンスギャップに悩まされることが多い。
本研究は,12言語を対象とした3つの言語間タスクに関する実験である。
音韻表現は、正書法表現と比較して言語間の類似性が高い。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:11:08 GMT)
Morpho-Aware Global Attention for Image Matting [25.8] 視覚変換器(ViT)と畳み込みニューラルネットワーク(CNN)は、画像マッチングにおいて固有の課題に直面している。
本稿では,微細構造の形態を効果的に把握するための新しいMorpho-Aware Global Attention(MAGA)機構を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:01:00 GMT)
To Shuffle or not to Shuffle: Auditing DP-SGD with Shuffling [25.7] シャッフル法を用いてDP-SGDを解析した。
プライバシー保証を十分に過大評価(最大4倍)することで訓練された最先端のDPモデルを示す。
我々の研究は、DP-SGDの実際のプライバシー漏洩を、Poissonサブサンプリングのvis-a-visに代えてシャッフルを使用するリスクを実証的に証明している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:34:28 GMT)
UniHOI: Learning Fast, Dense and Generalizable 4D Reconstruction for Egocentric Hand Object Interaction Videos [25.4] 密集した4次元再構成に必要な全ての変数を統一するモデルであるUniHOIを導入する。
UniHOIは、動きの存在下で、高速で密度が高く、一般的な単眼的なHOIシーンを再構築するための最初のアプローチである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:27:39 GMT)
Rethinking Normalization Strategies and Convolutional Kernels for Multimodal Image Fusion [25.1] マルチモーダル画像融合は、様々なモーダルからの情報を総合的な画像を得るために統合することを目的としている。
既存の手法では、自然画像の融合を優先し、情報補完とネットワークトレーニング戦略に重点を置く傾向にある。
本稿では,融合目標,統計特性,およびデータ分布に関する2つの課題の有意な差異を論じる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:36:24 GMT)
Scaling Law for Post-training after Model Pruning [25.0] トランスフォーマーアーキテクチャに基づく大規模言語モデル(LLM)は、様々なドメインやタスクに広く採用されている。
これを軽減するため、高性能を維持しつつ、より効率的なモデルを作成するためにモデルプルーニング技術が開発されている。
本稿では,LLMの学習後要件について検討し,学習後データの最適量を決定するためのスケーリング法を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:28:42 GMT)
Unlocking the `Why' of Buying: Introducing a New Dataset and Benchmark for Purchase Reason and Post-Purchase Experience [24.9] 本稿では,現代のAIモデルのための新しいタスクとして,購入理由予測を提案する。
まず,ユーザが商品の購入決定を行う理由を実世界から説明するためのデータセットを作成する。
当社のアプローチは,ユーザレビューにおいて,製品購入の背景にある理由と購入後の体験を明確に区別するためにLCMを誘導する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 23:21:38 GMT)
Weakly-Supervised Multimodal Learning on MIMIC-CXR [24.9] 我々はMIMIC-CXRデータセット上で,Multimodal Variational Mixture-of-Experts (MMVM) VAEの評価を行った。
我々の分析により,MMVM VAEは,他のマルチモーダルVAEや完全教師付きアプローチよりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:05:33 GMT)
Advancing Prompt Learning through an External Layer [24.8] 本稿では,新しい外部層(EnLa)を備えたEnPromptというパラダイムを提案する。
学習可能な外部レイヤは、トレーニング済みのCLIPの有効な埋め込みに基づいて構築される。
4つの実験により,本手法が既存の即時学習法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:48:05 GMT)
SC3D: Label-Efficient Outdoor 3D Object Detection via Single Click Annotation [23.6] LiDARポイントクラウドからの3D検出器のトレーニングは通常、高価なバウンディングボックスアノテーションに依存している。
本稿では,各フレームの3D点雲の鳥の視線をワンクリックするだけでよい,革新的なラベル効率の手法であるSC3Dを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:01:34 GMT)
GenoCraft: A Comprehensive, User-Friendly Web-Based Platform for High-Throughput Omics Data Analysis and Visualization [23.5] GenoCraftは、オミクスデータ処理のパイプライン全体を扱うように設計された、Webベースの包括的なソフトウェアソリューションである。
GenoCraftは高度なバイオインフォマティクスツールを備えた統一プラットフォームを提供し、オミクスデータ分析のあらゆる側面をカバーする。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:49:21 GMT)
ColorEdit: Training-free Image-Guided Color editing with diffusion model [23.5] 画像編集タスクにはテキスト・ツー・イメージ(T2I)拡散モデルが採用されており、顕著な有効性を示している。
しかし, テキストプロンプトから, 物体のクロスアテンションマップと新たな色属性との衝突や注意漏れにより, テキスト誘導画像編集法では物体の色が変化しない可能性がある。
本稿では,物体の色を微調整や訓練を必要とせず,手軽で安定的で効果的な画像誘導手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:45:58 GMT)
Continuous Bayesian Model Selection for Multivariate Causal Discovery [22.9] 現在の因果的発見アプローチは、構造的識別可能性を確保するために、限定的なモデル仮定や介入データへのアクセスを必要とする。
近年の研究では、ベイズモデルの選択はより柔軟な仮定のために制限的モデリングを交換することで精度を大幅に向上させることができることが示されている。
合成データセットと実世界のデータセットの両方において、我々のアプローチの競争力を実証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:55:05 GMT)
Pooling Image Datasets With Multiple Covariate Shift and Imbalance [22.5] カテゴリー論の観点からこの問題がいかに単純かつ効果的な解をもたらすかを示す。
提案手法の有効性を,実データを用いた広範囲な実験により示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:28:17 GMT)
Effective Guidance for Model Attention with Simple Yes-no Annotations [22.2] CRAYONは最先端のパフォーマンスを実現し、3つのベンチマークデータセットで12メソッドを上回っている。
我々はCRAYON(Correcting Reasoning with s of Yes Or No)を紹介し、モデルの注意を正すための効果的でスケーラブルで実用的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:53:42 GMT)
SOWA: Adapting Hierarchical Frozen Window Self-Attention to Visual-Language Models for Better Anomaly Detection [22.0] CLIPモデルに基づく新しいウィンドウ自己認識機構を導入し、学習可能なプロンプトを付加してマルチレベル機能を処理する。
提案手法は5つのベンチマークデータセットで厳格に評価され,20項目中18項目をリードすることで,優れた性能を実現している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:40:34 GMT)
Hyper-multi-step: The Truth Behind Difficult Long-context Tasks [21.7] Long-context Language Model (LCLM) はますます人気が高まっている。
長いコンテキストのベンチマークでは、最も先進的なLCLMでさえ完成に苦しむ課題が提示される。
本研究は, 主に2つの基本課題から生じる難易度を示す実験を行った。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:07:38 GMT)
Stochastic Nonlinear Control via Finite-dimensional Spectral Dynamic Embedding [21.4] 本稿では,非線形系の最適制御のためのスペクトルダイナミクス埋め込み制御(SDEC)を提案する。
我々は、状態-作用値関数を線形に表現するために無限次元の特徴を使い、実用的な実装のために有限次元のトランケーション近似を利用する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:51:08 GMT)
Federated Domain Generalization via Prompt Learning and Aggregation [20.9] フェデレーションドメイン一般化(FedDG)は、目に見えない領域におけるグローバルモデル一般化を改善することを目的としている。
既存のFedDG研究における一般的な戦略は、クライアント間でドメイン固有の知識を共有することである。
我々は、FedDGシナリオにおいて、事前学習された視覚言語モデル(VLM)を適応するための即時学習を導入する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:26:00 GMT)
GSGAN: Adversarial Learning for Hierarchical Generation of 3D Gaussian Splats [20.8] 本稿では,Gaussianを3D GANの3次元表現として利用し,その効率的かつ明示的な特徴を活用する。
生成したガウスの位置とスケールを効果的に正規化する階層的多スケールガウス表現を持つジェネレータアーキテクチャを導入する。
実験結果から,最先端の3D一貫したGANと比較して,レンダリング速度(x100)が大幅に向上することが示された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:28:16 GMT)
mmSpyVR: Exploiting mmWave Radar for Penetrating Obstacles to Uncover Privacy Vulnerability of Virtual Reality [20.7] 本稿は、攻撃者が障害物を通じてVRのプライバシーを捕捉できるVRシステムの新たな脆弱性を明らかにする。
我々は,mmWaveレーダによるVRユーザのプライバシーに対する新たな攻撃であるmmSpyVRを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:22:44 GMT)
EveGuard: Defeating Vibration-based Side-Channel Eavesdropping with Audio Adversarial Perturbations [20.2] バイブロメトリベースのサイドチャネルは、重大なプライバシーリスクをもたらす。
本稿では,対戦型音声を生成するソフトウェア駆動型防衛フレームワークであるEveGuardについて述べる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:32:03 GMT)
Bitcoin Research with a Transaction Graph Dataset [19.7] 本稿では,Bitcoinユーザ間の取引を表すトランザクショングラフとして,大規模なデータセットを提案する。
グラフには2億2200万のノードと7億8500万のエッジが含まれており、約13年間のトランザクションと6億7000万トランザクションのタイムスパンをカバーしている。
ノードラベルを予測するために、さまざまなグラフニューラルネットワークモデルをトレーニングし、将来の研究のベースラインを確立する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:28:03 GMT)
Off-Dynamics Reinforcement Learning via Domain Adaptation and Reward Augmented Imitation [19.4] 本稿では、模擬学習を利用して、報酬修正から学んだポリシーを対象ドメインに転送することを提案する。
DARAIL(Domain Adaptation and Reward Augmented Imitation Learning)は,ドメイン適応のための報酬修正手法である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:35:20 GMT)
Toward Robust and Accurate Adversarial Camouflage Generation against Vehicle Detectors [19.3] 本稿では,頑健で正確なカモフラージュ生成手法であるRAUCAを提案する。
RAUCAのコアは、車両のテクスチャを正確に最適化し投影できる新しいニューラルネットワークレンダリングコンポーネントであるEnd-to-End Neural Renderer Plus (E2E-NRP)である。
さらに、我々は、E2E-NRPを活用して攻撃堅牢性を高めるために、カモフラージュ生成のためのマルチウェザーデータセットを統合する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:17:08 GMT)
Unlocking Transfer Learning for Open-World Few-Shot Recognition [19.3] Few-Shot Open-Set Recognition (FSOSR) は、入力を既知のカテゴリに分類することを目的としている。
オープンセットなメタ学習とオープンセットのフリートランスファー学習を組み合わせた2段階の手法を提案する。
提案手法は,2つの広く認識されているベンチマークである miniImageNet と tieredImageNet の最先端性能を実現し,トレーニング作業は 1.5% しか増加しない。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:43:49 GMT)
Fully Dynamic Adversarially Robust Correlation Clustering in Polylogarithmic Update Time [19.3] 動的相関クラスタリング問題について,textitadaptive$ edge label flipsを用いて検討した。
相関クラスタリングでは、エッジを$(+)$または$(-)$とラベル付けした$n$-vertex完全グラフが与えられる。
本稿では, 対数ロバスト性を持つ動的設定について考察する。ここでは, $textitadaptive$ adversary がアルゴリズムの現在の出力に基づいてエッジのラベルを反転させることができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:26:37 GMT)
Constraint Learning for Parametric Point Cloud [19.2] パラメトリック点雲はCAD形状から採取され、工業生産でますます普及している。
この問題に対処するために,制約の効果を分析し,その深層学習に優しい表現を提案した。
CstNetはCAD形状解析に適した制約に基づく最初の学習手法である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:10:52 GMT)
Open LLMs are Necessary for Current Private Adaptations and Outperform their Closed Alternatives [18.9] 閉LLMのプライベート適応のための4つの最新の手法のプライバシ保護と性能について分析する。
真のプライバシ保護のLLM適応を実現するために、現在の方法やモデルを考慮して、オープンなLLMを使用する必要がある。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:23:17 GMT)
Free Lunch in Pathology Foundation Model: Task-specific Model Adaptation with Concept-Guided Feature Enhancement [18.8] 概念アンカー誘導型タスク固有特徴強調(CATE)を提案する。
CATEは、特定の下流タスクに対する病理基盤モデルの表現性と識別性を高めることができる。
パブリックなWSIデータセットの実験は、CATEがMILモデルの性能と一般化性を著しく向上させることを示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:38:00 GMT)
A Dual Adaptive Assignment Approach for Robust Graph-Based Clustering [18.6] 我々は、ロバストグラフベースクラスタリング(RDSA)のためのDual Adaptive Assignment Approachと呼ばれる新しいフレームワークを導入する。
RDSAは3つの主要なコンポーネントから構成される: (i) グラフのトポロジ的特徴とノード属性を効果的に統合するノード埋め込みモジュール、 (ii) ノード割り当てに親和性行列を利用することでグラフモジュラリティを改善する構造ベースのソフトアサインモジュール、 (iii) コミュニティランドマークを識別し、モデルの堅牢性を高めるためにノード割り当てを洗練させるノードベースのソフトアサインモジュール。
この結果から,RDSAはクラスタリングの有効性やロバスト性,適応性など,グラフの種類によって堅牢なクラスタリングを実現していることが明らかとなった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:54:31 GMT)
The Dawn of GUI Agent: A Preliminary Case Study with Claude 3.5 Computer Use [18.4] Claude 3.5 Computer Useは、GUIエージェントとして公開ベータでコンピュータの使用を提供する最初のフロンティアAIモデルである。
このケーススタディでは、さまざまなドメインやソフトウェアにまたがる、慎重に設計されたタスクの集合をキュレートし、整理する。
これらのケースからの観察は、デスクトップアクションへのエンドツーエンド言語におけるClaude 3.5 Computer Useの前例のない能力を示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:23:52 GMT)
VLEU: a Method for Automatic Evaluation for Generalizability of Text-to-Image Models [18.3] VLEU(Visual Language Evaluation Understudy)と呼ばれる新しい指標を導入する。
VLEUは、視覚テキストの限界分布とモデルが生成した画像の条件分布との間のクルバック・リーバーの偏差を計算することにより、モデルの一般化可能性を定量化する。
本実験は,様々なT2Iモデルの一般化能力を評価する上で,VLEUの有効性を示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:19:03 GMT)
DLPO: Diffusion Model Loss-Guided Reinforcement Learning for Fine-Tuning Text-to-Speech Diffusion Models [17.8] Reinforcement Learning with Human Feedback (RLHF) は画像合成のための拡散モデルを強化することができる。
拡散モデル損失誘導RLポリシー最適化(DLPO)を導入し、他のRLHF手法と比較する。
以上の結果から,RLHFは拡散に基づく音声合成モデルを向上させることができることがわかった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:10:29 GMT)
A Survey of Machine Learning-based Physical-Layer Authentication in Wireless Communications [17.7] 無線環境におけるユニークな特性の活用により,Physical-Layer Authentication (PLA) が有望な補完として浮上している。
本稿では,MLベースのPLAで使用可能な特徴と技術について,包括的に調査する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:01:23 GMT)
Any2Any: Incomplete Multimodal Retrieval with Conformal Prediction [17.6] 我々はAny2Anyという新しい検索フレームワークを提案し、クエリと参照の両方が不完全なモダリティを持つシナリオに対処する。
クロスモーダルエンコーダとのペアワイズ類似度を計算し、同型予測を伴う2段階キャリブレーションプロセスを用いて類似度を整列する。
KITTIデータセットで35%のRecall@5を達成する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:44:27 GMT)
Enhancing Robustness to Noise Corruption for Point Cloud Recognition via Spatial Sorting and Set-Mixing Aggregation Module [17.6] 本研究では,個々の雑音点の影響を緩和するノイズロバストアグリゲーションモジュール,Set-Mixerを提案する。
ModelNet40-Cで行った実験によると、Set-Mixerはノイズの多い点のクラウド上でのモデル性能を大幅に向上する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:53:11 GMT)
Forming Auxiliary High-confident Instance-level Loss to Promote Learning from Label Proportions [17.4] ラベルパーセンテージ(LLP)からの学習は、各インスタンスのアノテートラベルではなく、インスタンスのバッグとバッグ内のクラスの割合を使用して分類器をトレーニングすることを目的としている。
本稿では,L2P-AHILを用いたLLP手法を提案する。
我々は,L2P-AHILが既存のベースライン法を超越し,バッグサイズが大きくなるにつれて性能向上がさらに重要であることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:14:18 GMT)
Learning Generalizable 3D Manipulation With 10 Demonstrations [16.5] 10個のデモから操作スキルを学習する新しいフレームワークを提案する。
シミュレーションベンチマークと実世界のロボットシステムの両方に関する広範な実験を通じて、我々のフレームワークを検証する。
この研究は、現実世界のアプリケーションにおいて、効率的で一般化可能な操作スキル学習を前進させる大きな可能性を示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:01:02 GMT)
Stabilizer bootstrapping: A recipe for efficient agnostic tomography and magic estimation [16.5] 未知の$n$-qubit state $rho$のコピーが与えられたとき、与えられたクラス$C$の何らかの状態を持つフィデリティ$tau$を持ち、そのフィデリティ$ge tau - epsilon$と$rho$を持つ状態を見つける。
我々は,このタスクのための計算効率の良いプロトコルを設計するための新しいフレームワークである安定化器ブートストラッピングを提供し,これを用いて,安定化器状態と離散積状態という,次のクラスに対する新しい非依存トモグラフィープロトコルを得る。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:20:45 GMT)
Information Extraction from Clinical Notes: Are We Ready to Switch to Large Language Models? [16.3] 大規模言語モデル(LLM)は生成タスクに優れるが、抽出タスクのパフォーマンスについては議論が続いている。
本研究は,オープンソースLLMを用いた包括的臨床用IEシステムの開発と評価を行った最初の試みである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:54:19 GMT)
4DPV: 4D Pet from Videos by Coarse-to-Fine Non-Rigid Radiance Fields [16.3] 野生の複数のRGB配列からカメラのポーズと未知の物体の4次元再構成を復元するための粗大なニューラルモデルを提案する。
提案手法では,事前構築した3Dテンプレートや3Dトレーニングデータ,制御条件を考慮しない。
複素および実世界の変形を伴う挑戦シナリオにおいて,本手法を徹底的に検証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:31:58 GMT)
Dataset Awareness is not Enough: Implementing Sample-level Tail Encouragement in Long-tailed Self-supervised Learning [16.1] 擬似ラベル情報を利用して動的温度と再重み付け戦略を推進し、自己教師付き長期学習に擬似ラベルを導入する。
我々は,温度パラメータにおける量認識の欠如を分析し,この不足を補うために再重み付けを用いて,サンプルレベルで最適なトレーニングパターンを実現する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:16:01 GMT)
Structure Tensor Representation for Robust Oriented Object Detection [16.0] オブジェクト指向オブジェクト検出は、オブジェクトの位置とバウンディングボックスに加えて、向きを予測する。
正確な方向予測は、角周期性のため難しいままである。
本稿では,配向境界箱の向きを構造テンソルとして表現することを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:29:47 GMT)
Framework for Co-distillation Driven Federated Learning to Address Class Imbalance in Healthcare [15.7] Federated Learning(FL)は、分散機械学習の先駆的なアプローチである。
連携型医療環境における共蒸留駆動型枠組みを提案する。
我々のフレームワークは、他のベースラインを上回りながら、不均衡を増大させながら、最小限の標準偏差を持っている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:46:42 GMT)
ORLM: A Customizable Framework in Training Large Models for Automated Optimization Modeling [15.7] 本稿では,OR-Instruct という,最適化モデル問題のための半自動データ合成フレームワークを提案する。
我々は、70億のパラメータ(ORLM)を持つ様々なオープンソースのLDMを訓練する。
結果として得られたモデルは、NL4OPT、MAMO、IndustrialORベンチマークにまたがって最先端のパフォーマンスを達成し、大幅な最適化モデリング能力を示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:25:40 GMT)
A Simple but Strong Baseline for Sounding Video Generation: Effective Adaptation of Audio and Video Diffusion Models for Joint Generation [15.3] オーディオとビデオのベース拡散モデルを考えると,これらを1つのモデルに追加モジュールに統合し,モデルが共同でオーディオとビデオを生成するように訓練する。
音声とビデオのペア間のアライメントを高めるために,本モデルでは2つの新しいメカニズムを導入する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:48:26 GMT)
Similarity-aware Syncretic Latent Diffusion Model for Medical Image Translation with Representation Learning [15.2] 非造影CT(non-contrast CT)は画像のコントラストと解剖学的視認性を低下させ、診断の不確実性を増大させる可能性がある。
医用画像翻訳のための潜時拡散モデルに基づく新しいシンプレティック生成モデル(S$2$LDM)を提案する。
S$2$LDMは、シンプレティックエンコーディングと拡散を通じて、異なるモーダル画像の類似性を高め、潜伏空間における重複情報を促進し、対照的に強調された領域でより詳細な医療画像を生成する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:32:57 GMT)
Exploring GPU-to-GPU Communication: Insights into Supercomputer Interconnects [15.1] 本稿では,Alps,Leonardo,LUMIの3種類のスーパーコンピュータを特徴付ける。
我々は,最大4096GPU上でのノード内およびノード間相互接続の性能評価に注目する。
その結果,帯域幅が未使用であること,最適化の機会がまだたくさんあることが判明した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:55:40 GMT)
CLCE: An Approach to Refining Cross-Entropy and Contrastive Learning for Optimized Learning Fusion [15.1] クロスエントロピー損失(CE)はモデルの一般化と安定性を損なう可能性がある。
本稿では,Contrastive Learning と CE を統合した CLCE という新しいアプローチを提案する。
CLCEは12ベンチマークでCEのTop-1精度を大きく上回っている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:16:56 GMT)
The ParClusterers Benchmark Suite (PCBS): A Fine-Grained Analysis of Scalable Graph Clustering [15.0] ParClusterers Benchmark Suite (PCBS)は、高度にスケーラブルな並列グラフクラスタリングアルゴリズムとベンチマークツールのコレクションである。
PCBSは、スケーラブルなグラフクラスタリングアルゴリズムのアクティブな研究領域の品質とパフォーマンスのトレードオフを評価し、判断する標準化された方法を提供する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:47:32 GMT)
On the Universal Statistical Consistency of Expansive Hyperbolic Deep Convolutional Neural Networks [14.9] 本稿では,Poincar'e Discに基づくHyperbolic DCNNを提案する。
双曲空間における拡張的畳み込みの普遍的一貫性に関する広範な理論的洞察を提供する。
結果、双曲的畳み込み構造はユークリッド構造よりも可換なマージンで優れていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:01:03 GMT)
SaMoye: Zero-shot Singing Voice Conversion Model Based on Feature Disentanglement and Enhancement [14.9] 歌唱音声変換(SVC)は、歌唱者の声を参照音声から他の歌唱者の声に変換し、本来の意味を保ちながら行うことを目的としている。
そこで我々は,歌唱を人間と非人間の音色に変換できる,オープンソースの初の高品質ゼロショットSVCモデルSaMoyeを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:51:08 GMT)
ULTra: Unveiling Latent Token Interpretability in Transformer Based Understanding [14.8] 本稿では,トランスフォーマーの埋め込みを解釈し,意味のある意味的パターンを明らかにする新しいフレームワークを提案する。
ゼロショットの教師なしセマンティックセマンティックセグメンテーションを微調整なしで効果的に行うことができることを示す。
提案手法は,COCO-Stuffデータセットでは67.2 %,mIoU32.9 %,PASCALVOCデータセットではmIoU51.9 %である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:36:50 GMT)
KeySpace: Public Key Infrastructure Considerations in Interplanetary Networks [14.7] ネットワークトポロジ間でPKIシステムを比較するための標準化されたフレームワークを開発した。
我々は、高度に分散した惑星間ネットワークにおいて、地球上のPKI技術が適用可能であることを実証した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:58:47 GMT)
VMID: A Multimodal Fusion LLM Framework for Detecting and Identifying Misinformation of Short Videos [14.6] 本稿では,マルチモーダル情報に基づく新しいフェイクニュース検出手法を提案する。
提案フレームワークは,ビデオにマルチモーダル機能を組み込むことで,偽ニュース検出の精度と信頼性を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:20:26 GMT)
DaYu: Data-Driven Model for Geostationary Satellite Observed Cloud Images Forecasting [14.4] 本稿では,高度データ駆動熱赤外雲画像予測モデル"DaYu"を提案する。
DaYuは静止衛星観測のために特別に設計されており、時間分解能は0.5時間である。
相関係数が0.9より高く、0.8より6時間高く、0.7より12時間高い。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:36:01 GMT)
Supra-Laplacian Encoding for Transformer on Dynamic Graphs [14.3] 本稿では,時間情報を保持しつつ,GTアーキテクチャの新しいテンポラルエンコーディングを提案する。
具体的には、Time Dynamic Graphplas を多層グラフに変換し、関連する超ラテン行列のスペクトル特性を利用する。
第2のコントリビューションは、動的リンク予測のための正確なエッジ表現を提供するクロスアテンション機構と相互にノードをモデル化する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:22:00 GMT)
Inconsistencies In Consistency Models: Better ODE Solving Does Not Imply Better Samples [14.2] CM (Consistency Model) は, 将来性のある拡散モデル蒸留法として登場した。
直接CMは、CMと比較してODEの解法誤差を減少させるが、サンプルの品質は著しく低下する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:06:23 GMT)
ConSmax: Hardware-Friendly Alternative Softmax with Learnable Parameters [14.0] 自己注意機構は、畳み込みニューラルネットワークと反復ニューラルネットワークとを区別して、トランスフォーマーベースの大規模言語モデル(LLM)を区別する。
シリコン上でのリアルタイムLEM推定は、自己注意においてSoftmaxが広く使用されているため、依然として困難である。
我々は,ソフトウェアハードウェアの共同設計であるConstant Softmax(ConSmax)を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:09:44 GMT)
AmoebaLLM: Constructing Any-Shape Large Language Models for Efficient and Instant Deployment [14.0] AmoebaLLMは任意の形状の大規模言語モデルの即時導出を可能にする新しいフレームワークである。
AmoebaLLMは、様々なプラットフォームやアプリケーションに適した迅速なデプロイメントを著しく促進する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:02:28 GMT)
Do Large Language Models Truly Grasp Mathematics? An Empirical Exploration From Cognitive Psychology [14.0] 提案手法は,Chains of Thoughtプロンプトを用いても,修正されたCRT問題を解く際の誤り率が高いことを示す。
具体的には、従来の質問と比べて平均精度が最大50%低下した。
この発見は、LLMが人間に匹敵する真の数学的推論能力を持っているという信念に挑戦する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:46:30 GMT)
Being Considerate as a Pathway Towards Pluralistic Alignment for Agentic AI [13.9] 複数のアライメントは、AIシステムの目的と行動が人間の価値観と視点の多様性と調和していることを保証することを目的としている。
我々は、将来の幸福を考慮し、他の(人間)エージェントのエージェントがいかに多元的アライメントを促進できるかを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:34:09 GMT)
DiMoDif: Discourse Modality-information Differentiation for Audio-visual Deepfake Detection and Localization [13.8] 本稿では,新しいオーディオ・ビジュアル・ディープフェイク検出フレームワークを提案する。
実際のサンプルでは、ディープフェイクとは対照的に、視覚信号と音声信号は情報の観点から一致しているという仮定に基づいている。
ビデオと音声の音声認識に特化しているディープネットワークの機能を、フレームレベルのクロスモーダルな矛盾を見つけるために使用しています。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:47:33 GMT)
Dense ReLU Neural Networks for Temporal-spatial Model [13.8] 非パラメトリック推定にRectified Linear Unit (ReLU) アクティベーション機能を利用する完全接続深層ニューラルネットワークに着目する。
我々は、観測された測定における時間的および空間的依存に対処するため、収束率につながる非漸近境界を導出する。
我々はまた、多様体上のデータをモデル化し、高次元データの本質的な次元性を探求することで、次元性の呪いに取り組む。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:30:36 GMT)
Thinking Before Looking: Improving Multimodal LLM Reasoning via Mitigating Visual Hallucination [13.7] MLLM(Multimodal large language model)は、視覚的・言語的モダリティの統合を推進している。
思考の連鎖(CoT)推論のような現在のアプローチは、大規模言語モデル(LLM)の認知能力を増強している。
しかし、MLLMへの適応は、相互モダリティ理解における幻覚のリスクの増大によって妨げられている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:01:37 GMT)
Adversarial Environment Design via Regret-Guided Diffusion Models [13.7] 環境変化に対して堅牢な訓練エージェントは、深い強化学習において重要な課題である。
非教師なし環境設計(UED)は、エージェントの能力に合わせた一連のトレーニング環境を生成することで、この問題に対処するために最近登場した。
後悔誘導拡散モデル(ADD)を用いた新しいUEDアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 01:01:44 GMT)
Efficient Progressive Image Compression with Variance-aware Masking [13.3] 本稿では,まず画像がベース品質とトップ品質の潜在表現のペアとして表現されるプログレッシブ画像圧縮法を提案する。
残留潜在表現は、トップとベース表現の要素ワイド差として符号化される。
我々は、計算複雑性、復号時間、パラメータ数を大幅に削減しながら、最先端の競合相手と競合する結果を得る。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:34:46 GMT)
Optimal tradeoffs for estimating Pauli observables [13.1] 未知の$n$-qubit量子状態 $rho$, estimate $texttr(Prho)$ for some set of Pauli operator $P$ to within additive error $epsilon$。
textpoly(n)$-copy測定を行うプロトコルは、$Omega (1/epsilon4)$測定をしなければならない。
提案するプロトコルは、絶対値だけでなく、実際の$texttr(Prho)$を推定することもできる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:29:27 GMT)
A Polarization Image Dehazing Method Based on the Principle of Physical Diffusion [12.9] 外部光源に依存しない革新的な半物理的偏光脱ハージング法を提案する。
この方法は霧の拡散過程をシミュレートし、この拡散によって引き起こされる画像のぼかしに対応する拡散カーネルを設計する。
このアプローチは、シーンのデハージングとディテールの強化を効果的に実現します。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:47:36 GMT)
ThermoHands: A Benchmark for 3D Hand Pose Estimation from Egocentric Thermal Images [12.9] 熱画像に基づくエゴセントリックな3Dハンドポーズ推定に焦点をあてた最初のベンチマークであるThermoHandsを紹介する。
熱画像におけるエゴセントリックな3Dハンドポーズ推定に2つのトランスフォーマーモジュールを利用する新しいベースライン手法であるTherFormerを導入する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:01:39 GMT)
Fair Secretaries with Unfair Predictions [12.8] 予測値が少なくとも$maxOmega (1), 1 - O(epsilon)$倍の候補を受け入れることを約束しているにもかかわらず、アルゴリズムが最良の候補を受け入れる確率がゼロであることを示し、ここでは$epsilon$が予測誤差である。
私たちのアルゴリズムと分析は、既存の作業から分岐し、結果のいくつかを単純化/統一する、新たな"ペギング(pegging)"アイデアに基づいている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:23:59 GMT)
Quanta Video Restoration [12.7] 本稿では,古典的量子再生手法のコアアイデアに基づいて構築された,エンドツーエンドのトレーニング可能なネットワークであるQuanta Video Restoration(QUIVER)を紹介する。
シミュレーションデータと実データでは、QUIVERは既存のQuanta復元法をかなりの差で上回っている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:13:55 GMT)
Towards Efficient and Optimal Covariance-Adaptive Algorithms for Combinatorial Semi-Bandits [12.7] 我々は、プレイヤーがPアクションの中から d 個の基本アイテムを含む集合のパワーセットから選択する半帯域の問題に対処する。
提案手法は半帯域フィードバックを効果的に活用し,帯域フィードバックアプローチより優れていることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:41:26 GMT)
A Joint Representation Using Continuous and Discrete Features for Cardiovascular Diseases Risk Prediction on Chest CT Scans [12.7] 胸部CT画像から抽出した離散的量的バイオマーカーと連続的な深部特徴を統合した新しい関節表現法を提案する。
本手法はCVDリスク予測性能を大幅に改善し,各バイオマーカーの個人貢献分析を行う。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:02:32 GMT)
Experiences from Using LLMs for Repository Mining Studies in Empirical Software Engineering [12.5] 大規模言語モデル(LLM)は、ソフトウェアリポジトリを分析する革新的な方法を提供することで、ソフトウェア工学(SE)を変革した。
私たちの研究は、PRIMES(Prompt Refinement and Insights for Mining Empirical Software repository)というフレームワークをまとめています。
この結果,PRIMESの標準化により,LLMを用いた研究の信頼性と精度が向上することが示唆された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:08:57 GMT)
A Benchmark for Cross-Domain Argumentative Stance Classification on Social Media [12.5] 論証的姿勢分類は、特定のトピックに対する著者の視点を特定する上で重要な役割を担っている。
既存のベンチマークは、単一のドメインからのものや、限られたトピックにフォーカスすることが多い。
我々は,人的アノテーションの必要性を回避するために,プラットフォームルール,手軽に利用可能な専門家によるコンテンツ,および大規模言語モデルを活用することを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 23:18:53 GMT)
Towards Multi-View Consistent Style Transfer with One-Step Diffusion via Vision Conditioning [12.4] 提案手法により生成した異なる視点からのスティル化画像は、構造的整合性が良く、歪みも少ない、優れた視覚的品質を実現する。
本手法は,3次元情報のないスタイリング画像における構造情報と多視点整合性を効果的に保存する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:02:07 GMT)
TEESlice: Protecting Sensitive Neural Network Models in Trusted Execution Environments When Attackers have Pre-Trained Models [12.3] TSDPは、TEE内のプライバシーに敏感な重みを保護し、GPUに不感な重みをオフロードする手法である。
トレーニング戦略の前に新たなパーティションを導入し,プライバシに敏感な重みをモデルの他のコンポーネントと効果的に分離する。
提案手法は, 計算コストを10倍に削減し, 完全なモデル保護を実現できることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:52:11 GMT)
The Spatial Complexity of Optical Computing and How to Reduce It [12.2] 特定の関数を実行するのにどれくらいの空間が必要かは光学の基本的な問題である。
我々は,光コンピューティングシステムの「空間複雑性」をスケーリング法則の観点から検討する。
空間効率のよいニューロモルフィック光学系を設計するための新しいパラダイムを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:56:00 GMT)
Real-Time AI-Driven People Tracking and Counting Using Overhead Cameras [12.0] 本研究では,新しい物体追跡アルゴリズム,新しい計数アルゴリズム,微調整対象検出モデルを組み合わせた新しい手法を提案する。
低消費電力エッジコンピュータ上でのフレームレート20~27FPSでリアルタイムに97%の精度を実現する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:37:49 GMT)
Fused Gromov-Wasserstein Variance Decomposition with Linear Optimal Transport [11.9] 2-ワッサーシュタイン空間における測度の集合のフレット分散の分解を行い、これらの測度のLOT埋め込みによって説明される分散の割合を計算する。
また, 組込みLOTの寸法, 分散率, 組込みデータに基づく機械学習分類器の分類精度との関係について検討した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:10:52 GMT)
Sm: enhanced localization in Multiple Instance Learning for medical imaging classification [11.7] マルチ・インスタンス・ラーニング(MIL)は医療画像分類において、ラベル付けの労力を減らすために広く用いられている。
ローカル依存関係をモデル化するための,新しい,原則付き,フレキシブルなメカニズムを提案する。
我々のモジュールは、最先端のローカライゼーションにおいて、競争力や優越性を保ちながら、最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:24:41 GMT)
Normative Modeling for AD Diagnosis and Biomarker Identification [11.6] 本稿では,アルツハイマー病(AD)の診断とバイオマーカー同定のために,焦点障害と対向自己エンコーダ(FAAE)を取り入れた新しい規範的モデリング手法を提案する。
本手法は,自己エンコーダ構造内に対向焦点損失判別器を組み込むエンド・ツー・エンドの手法である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:45:16 GMT)
CoSAM: Self-Correcting SAM for Domain Generalization in 2D Medical Image Segmentation [11.6] 自己補正SAM(CoSAM)と呼ばれる2次元医用画像分割法を提案する。
提案手法は,SAMを用いて粗いマスクをプロンプトフリーで生成することから始まり,その後の段階の事前プロンプトを提供する。
修正マスクに基づくフィードバックとして多様なプロンプトを生成し、予測を反復的に洗練する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:20:52 GMT)
GSEditPro: 3D Gaussian Splatting Editing with Attention-based Progressive Localization [11.2] 本稿では,ユーザがテキストプロンプトのみを使用して,創造的で正確な編集を行うことのできる,新しい3Dシーン編集フレームワークであるGSEditProを提案する。
レンダリング中に各ガウス語に意味ラベルを追加するために、注意に基づくプログレッシブなローカライゼーションモジュールを導入する。
これにより、T2Iモデルのクロスアテンション層から派生した編集プロンプトとの関連性に基づいて、ガウスアンを分類することで、編集領域の正確なローカライズが可能になる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:25:14 GMT)
Comparing Robustness Against Adversarial Attacks in Code Generation: LLM-Generated vs. Human-Written [11.2] 本稿では,人間が記述したコードに微調整したPTMC(Pre-trained Models of Code)の対角的ロバスト性を評価するための実証的研究を紹介する。
2つのデータセット、2つの最先端PTMC、2つの堅牢性評価基準、3つのメトリクスを実験で用いた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:25:32 GMT)
Once More, With Feeling: Measuring Emotion of Acting Performances in Contemporary American Film [11.0] ポピュラーな現代アメリカ映画に音声感情認識モデルを適用した。
音声演奏において,物語構造,ダイアクロニックシフト,ジャンルや対話に基づく制約が認められる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:53:02 GMT)
Information upper bounds in composite quantum systems [11.0] 量子状態を分解し、法定量子状態を構成する成分に含まれる情報の総量に焦点を当てる。
解析により、量子純状態の後方情報内容の上限は、正確には 2 に等しいことを証明した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:10:52 GMT)
Does Prompt Formatting Have Any Impact on LLM Performance? [10.9] 本稿では,異なるプロンプトテンプレートが大規模言語モデル(LLM)の性能に与える影響について検討する。
自然言語推論やコード生成,OpenAIのGPTモデルを用いた翻訳といったタスクに対する影響を評価した。
実験の結果、GPT-3.5-turboの性能はプロンプトテンプレートによって最大40%変化し、GPT-4のような大型モデルはより堅牢であることがわかった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:26:38 GMT)
A dataset of questions on decision-theoretic reasoning in Newcomb-like problems [10.8] いわゆるニューコム型問題の決定理論において,自然言語質問のデータセットを導入する。
ニューコムのような問題に対する推論のいくつかの方法は、モデル間のより深い協調を可能にするかもしれない。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:19:04 GMT)
RedTest: Towards Measuring Redundancy in Deep Neural Networks Effectively [10.8] 深層学習モデル構造における冗長度を測定するために,モデル構造冗長スコア(MSRS)を用いる。
MSRSは、多くの最先端モデルにおける冗長性の問題を明らかにし、評価するのに効果的である。
最適なモデル構造を探索するための新しい冗長性認識アルゴリズムを設計する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:36:07 GMT)
Compound-QA: A Benchmark for Evaluating LLMs on Compound Questions [10.8] 本稿では、複合質問合成(CQ-Syn)を導入し、複合QAベンチマークを作成する。
このベンチマークは、プロプライエタリな大規模言語モデルにアノテートされた既存のQAデータセットに由来する。
LLM能力は、理解、推論、知識を含む3次元の観点で評価する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:12:29 GMT)
Forecasting GPU Performance for Deep Learning Training and Inference [10.7] NeuSightは、トレーニングと推論の両方のために、実際の実行を必要とせずに、見えないGPU上で、さまざまなディープラーニングモデルのパフォーマンスを予測するフレームワークである。
NeuSightは、単一のディープラーニングカーネル予測をタイルと呼ばれる小さなワーキングセットに分解し、GPU上で独立して実行される。
GPT3モデルのトレーニングとH100での推論の遅延を予測して、198%と19.7%から3.8%に減少する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:30:38 GMT)
DEEP-IoT: Downlink-Enhanced Efficient-Power Internet of Things [10.7] 本稿では,IoTデバイスの通信方法を再定義する,革新的な通信パラダイムであるDEEP-IoTを提案する。
先駆的なフィードバックチャネルコーディング戦略を通じて、DEEP-IoTは従来の送信機(IoTデバイス)中心の通信モデルに挑戦し、変革する。
従来のTurboとPolarのコードを52.71%まで上回る、IoTセルの運用寿命が大幅に向上したことを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:42:28 GMT)
PFML: Self-Supervised Learning of Time-Series Data Without Representation Collapse [10.4] 自己教師型学習(英: Self-supervised learning, SSL)は、データ固有の構造を利用して学習プロセスを導く、データ駆動型学習手法である。
本稿では,PFML (Masked Latents) からの関数予測という,時系列データに対する新しいSSLアルゴリズムを提案する。
PFMLは、マスク埋め込みに対応する入力信号の統計的機能を予測することで機能する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:16:38 GMT)
The Oxford Spires Dataset: Benchmarking Large-Scale LiDAR-Visual Localisation, Reconstruction and Radiance Field Methods [10.3] 本稿では,オックスフォードの有名なランドマーク周辺で収集された大規模マルチモーダルデータセットを紹介する。
また、ローカライゼーション、再構築、新規ビュー合成を含むタスクのベンチマークも作成する。
我々のデータセットとベンチマークは、放射場法とSLAMシステムのより良い統合を容易にすることを意図している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:43:24 GMT)
Unveiling Topological Structures in Text: A Comprehensive Survey of Topological Data Analysis Applications in NLP [10.1] トポロジカル・データ・アナリティクス(Topological Data Analysis)は、ノイズにもかかわらずデータの本質的な形状を識別する統計手法である。
トポロジカルデータ分析は、コンピュータビジョンのような構造的に異なる領域に比べて、自然言語処理領域内ではあまり注目を集めていない。
本研究は,これらの研究を理論的および非理論的アプローチに分類した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:55:05 GMT)
Demo: Multi-Modal Seizure Prediction System [9.9] SeizNetは、マルチモーダルセンサーネットワークから恩恵を受けるてんかん発作を予測する革新的なシステムである。
てんかんは世界中で約6500万人に影響を及ぼし、その多くは薬剤耐性の発作を経験している。
SeizNetは、移植可能なデバイスのサイズとエネルギー制限を維持しながら、発作予測において97%の精度を達成する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:36:30 GMT)
Self-eXplainable AI for Medical Image Analysis: A Survey and New Outlooks [9.9] Self-eXplainable AI (S-XAI)は、ディープラーニングモデルのトレーニングプロセスに説明可能性を直接組み込む。
本研究は,様々な画像モダリティと臨床応用を包括的に検討する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:35:25 GMT)
Memorization in Attention-only Transformers [9.9] 本稿では,現在の仮説を任意の文脈サイズに拡張する言語ベースのトランスフォーマーの証明を提案する。
本手法は,注目層を用いたより効果的な正確な記憶を実現することにより,最先端技術の向上を図っている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:29:31 GMT)
The Interference Channel with Entangled Transmitters [9.9] 送信機間の絡み合い資源の可用性により強化された、2-sender、2-receiver 古典的干渉チャネル上の通信を探索する。
これは、純粋に古典的な場合であっても、一般的な容量公式が欠如しているという永続的な課題に対処し、量子的優位性を評価する際に達成可能な速度表現の顕著な類似点を強調している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:33:02 GMT)
ScribbleVS: Scribble-Supervised Medical Image Segmentation via Dynamic Competitive Pseudo Label Selection [9.7] ScribbleVSは、scribbleアノテーションを利用する新しいフレームワークである。
本稿では,地域ラベル拡散モジュールを導入し,監督範囲を拡大する。
また,擬似ラベルの選択の洗練を図るための動的競合選択モジュールを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:51:30 GMT)
Electrical Load Forecasting in Smart Grid: A Personalized Federated Learning Approach [9.7] スマートグリッドの電力管理と安定性には電力負荷予測が不可欠である。
従来の機械学習(ML)手法は負荷予測によく使用されるが、データ共有は必要である。
フェデレートラーニング(FL)は、データ交換なしでローカルSMで分散MLモデルを実行することでこの問題に対処できる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:44:50 GMT)
FedAli: Personalized Federated Learning with Aligned Prototypes through Optimal Transport [9.7] フェデレートラーニング(FL)は、生データを共有することなく、複数のデバイス間で協調してパーソナライズされたモデルトレーニングを可能にする。
入力埋め込みを学習可能なプロトタイプに近づけるPrototypesレイヤのアライメントを導入する。
我々はFedAliを異種センサによる人間の活動認識と視覚ベンチマークのデータセットで評価し、既存のFL戦略よりも優れていることを示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:35:21 GMT)
Imagine-2-Drive: High-Fidelity World Modeling in CARLA for Autonomous Vehicles [9.6] 本稿では,VISTAPlanとDPAの2つのコンポーネントで構成されるフレームワークであるImagine-2-Driveを紹介する。
DPAは、軌道予測のための多モード挙動をモデル化するための拡散に基づくポリシーである。
我々は,標準走行距離における技術(SOTA)世界モデルの現状を,ルート完了率と成功率でそれぞれ15%,20%上回った。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:17:54 GMT)
Flow with FlorDB: Incremental Context Maintenance for the Machine Learning Lifecycle [9.4] 機械学習パイプラインから任意のメタデータを抽出・クエリする手法を提案する。
後ろ向きのロギングによって、そのようなステートメントが追加され、ポストホックで実行されるかを示します。
これは、アジャイル開発の重要なパスから外れた"メタメタスタイル"で行われます。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:57:40 GMT)
Efficient Pauli channel estimation with logarithmic quantum memory [9.3] a protocol can estimated the eigen values of a Pauli channel to error $epsilon$ using only $O(log n/epsilon2)$ ancilla and $tildeO(n2/epsilon2)$ measured。
我々の知識によれば、量子メモリの対数的に多くの量子ビットが指数統計上の優位性のために十分である最初の量子学習タスクである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:40:41 GMT)
Diachronic Document Dataset for Semantic Layout Analysis [9.1] このデータセットは、デジタル化されたデジタル・デジタル・マテリアルの大きな時間範囲(1600-2024)にまたがる7,254ページの注釈付きページを含む。
異なる時代やジャンルのコンテンツを取り入れることで、様々なレイアウトの複雑さと文書構造の歴史的変化に対処する。
本データセットを用いてオブジェクト検出モデルの評価を行い,入力サイズとサブセットベーストレーニングの影響について検討した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:33:13 GMT)
Bias Unveiled: Investigating Social Bias in LLM-Generated Code [9.1] 大規模言語モデル(LLM)は、自動コード生成の分野を大幅に進歩させた。
本研究では,LLM生成コードの社会的バイアスの評価と緩和を目的とした,新しいフェアネスフレームワークであるSolarを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:55:57 GMT)
Evidential Federated Learning for Skin Lesion Image Classification [9.1] FedEvPromptは、明らかなディープラーニング、迅速なチューニング、知識蒸留の原則を統合する、連合学習アプローチである。
ラウンドベースの学習パラダイムで最適化されており、各ラウンドではローカルモデルをトレーニングし、次にすべてのフェデレーションクライアントとアテンションマップを共有する。
結論としてFedEvPromptは、データ不均一性、不均衡、プライバシー保護、知識共有といった課題に効果的に対処する、連邦学習に有望なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:34:28 GMT)
Difficulties of the NSGA-II with the Many-Objective LeadingOnes Problem [9.0] NSGA-IIは最も顕著な多目的進化アルゴリズムである。
NSGA-IIは指数時間以下ではパレートフロントを計算できないことを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:50:40 GMT)
Improving the accuracy of automated labeling of specimen images datasets via a confidence-based process [9.0] 本稿では,自動ラベリング精度を大幅に向上させる手法を提案する。
初期精度の86%を生んだナイーブモデルでは,性能が向上することが実証された。
このアプローチを様々な方法で検証した後、60,000以上のハーバリウム標本の大規模なデータセットに注釈を付けました。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:39:12 GMT)
Hybrid Querying Over Relational Databases and Large Language Models [8.9] 実世界の4つのデータベースに対する120以上の問合せを含む最初のクロスドメインベンチマークであるSWANを提示する。
1つはスキーマ拡張に基づくもので、もう1つはユーザ定義関数に基づくものである。
評価の結果,GPT-4Turboを数発のプロンプトで使用すれば,実行精度が40.0%,データ事実性が48.2%まで向上できることがわかった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:31:00 GMT)
CMATH: Cross-Modality Augmented Transformer with Hierarchical Variational Distillation for Multimodal Emotion Recognition in Conversation [8.9] 会話におけるマルチモーダル感情認識は、会話発話中の感情を正確に識別することを目的としている。
CMATHと呼ばれる2つの主要成分から構成される階層的変分蒸留を用いたクロスモダリティ拡張変圧器を提案する。
IEMOCAPとMELDデータセットの実験により、提案したモデルが従来の最先端ベースラインより優れていることが示された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:23:02 GMT)
InvestESG: A multi-agent reinforcement learning benchmark for studying climate investment as a social dilemma [8.9] InvestESGは、ESG開示義務が企業気候投資に与える影響を研究するために設計された、新しいマルチエージェント強化学習(MARL)ベンチマークである。
我々の実験は、十分な資本を持つESGを意識した投資家がいなければ、開示委任統治下での企業緩和努力は限定的であることを示している。
地球温暖化のリスクに関するより多くの情報を提供することで、投資家が関与しなくても、企業は緩和により多くの投資をすることができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:31:45 GMT)
Multi-Task Adversarial Variational Autoencoder for Estimating Biological Brain Age with Multimodal Neuroimaging [8.6] 我々は、脳年齢予測を改善するために設計された独自のディープラーニングフレームワークであるMultitask Adversarial Variational Autoencoderを提案する。
このモデルは潜在変数を汎用的およびユニークなコードに分離し、共有およびモダリティ固有の特徴を分離する。
マルチタスク学習と性分類を付加的なタスクとして統合することにより、モデルが性固有の老化パターンをキャプチャする。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:50:36 GMT)
Game Theoretic Liquidity Provisioning in Concentrated Liquidity Market Makers [8.6] 集中流動性市場メーカ(CLMM)におけるLPのインセンティブについて検討する。
リスク資産を有する流動性プールでは、LPはナッシュ均衡から遠く離れた投資戦略を採用する。
いくつかのプールにおいて、我々のゲームのナッシュ均衡をより緊密に適合させる戦略を更新することで、LPは日々のリターンの中央値を16.99ドル改善できることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:09:43 GMT)
I2I-Mamba: Multi-modal medical image synthesis via selective state space modeling [8.5] 本稿では,医用画像合成のための新しい敵対モデルI2I-Mambaを提案する。
I2I-Mambaは、ターゲットモダリティ画像の合成における最先端CNNおよびトランスフォーマーベースの手法に対して優れた性能を提供する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:35:58 GMT)
Self-Supervised Learning of Grasping Arbitrary Objects On-the-Move [8.4] 本研究では3つの完全畳み込みニューラルネットワーク(FCN)モデルを導入し,視覚入力から静的グリッププリミティブ,動的グリッププリミティブ,残留移動速度誤差を予測する。
提案手法は高い把握精度とピック・アンド・プレイス効率を実現した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:59:16 GMT)
Probabilistic Prior Driven Attention Mechanism Based on Diffusion Model for Imaging Through Atmospheric Turbulence [8.4] 大気の乱流は、厳密な空間的および幾何学的な歪みをもたらし、従来の画像復元法に挑戦する。
本稿では,確率的拡散に基づく事前モデリングとトランスフォーマー駆動型特徴抽出を組み合わせた確率的事前乱流除去ネットワーク(PPTRN)を提案する。
PPTRNは、乱流劣化画像の復元品質を著しく改善し、明瞭度と構造的忠実度の新しいベンチマークを設定した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:22:22 GMT)
The Surprising Ineffectiveness of Pre-Trained Visual Representations for Model-Based Reinforcement Learning [8.4] 視覚強化学習法は、しばしば大量のデータを必要とする。
モデルベースRL(MBRL)は、プランニングによる効率的なデータ利用の潜在的なソリューションを提供する。
MBRLには現実世界のタスクの一般化機能が欠けている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:21:26 GMT)
TESGNN: Temporal Equivariant Scene Graph Neural Networks for Efficient and Robust Multi-View 3D Scene Understanding [8.3] 本稿では,3次元点群からセマンティックなシーングラフを生成するEquivariant Scene Graph Neural Network (ESGNN) の実装について述べる。
我々の組み合わせアーキテクチャは、時間等変Scene Graph Neural Network (TESGNN) と呼ばれ、シーン推定精度において既存の最先端手法を超えるだけでなく、より高速な収束を実現する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:39:04 GMT)
Recurrent Neural Goodness-of-Fit Test for Time Series [8.2] 時系列データは、金融や医療など、さまざまな分野において重要である。
従来の評価基準は、時間的依存関係と潜在的な特徴の高次元性のために不足している。
Recurrent Neural (RENAL) Goodness-of-Fit testは,生成時系列モデルを評価するための新しい,統計的に厳密なフレームワークである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:58:35 GMT)
Self-Defense: Optimal QIF Solutions and Application to Website Fingerprinting [8.2] 量的情報フロー(QIF)は、情報漏洩を最小限に抑えたセキュアなシステムを設計するための堅牢な情報理論のフレームワークを提供する。
リークを最小限に抑えることを目的とした,未知の情報理論チャネルにおいて,新しい行を構築するための最適解を提案する。
我々は,サイト管理者が自身のサイトを変更できるが,他のサイトは変更できないシナリオを考慮して,ウェブサイトの指紋認証防衛の問題にアプローチを適用した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:22:14 GMT)
Physics-informed Machine Learning for Battery Pack Thermal Management [8.2] 電池セルを熱ペーストで囲む冷板を上下に配置した21700バッテリパック間接液体冷却システムを開発した。
冷媒流量が高いため、蓄電池が熱源であるのに対し、冷板は一定の温度境界とみなすことができる。
物理インフォームド畳み込みニューラルネットワークは、電池パックの温度分布を推定する代理モデルとして機能した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:23:26 GMT)
Image Matching Filtering and Refinement by Planes and Beyond [8.2] 本稿では,画像マッチングにおけるスパース対応のフィルタリングと精細化のためのモジュール型非深度学習手法を提案する。
提案手法は, 標準データセットと画像マッチングパイプラインで広く評価され, 最先端のアプローチと比較される。
実験の結果,提案した非深層学習の幾何学的アプローチは,最近の最先端のディープラーニング手法に匹敵する,あるいは同等な性能を達成できることが示された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:48:31 GMT)
Automated Clinical Data Extraction with Knowledge Conditioned LLMs [7.9] 大規模言語モデル(LLM)は、レポート中の構造化されていないテキストの解釈に有効であるが、ドメイン固有の知識の欠如により幻覚することが多い。
In-context Learning (ICL) を通じて生成された内部知識を外部知識と整合させる新しい枠組みを提案する。
本フレームワークでは,検索した内部知識および外部知識の関連単位を抽出し,抽出した内部知識規則の真偽と有用性を評価する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:07:34 GMT)
EyeDiff: text-to-image diffusion model improves rare eye disease diagnosis [7.9] EyeDiffは、自然言語のプロンプトからマルチモーダル眼科画像を生成するために設計されたテキスト・ツー・イメージモデルである。
EyeDiffは8つの大規模なデータセットでトレーニングされており、10のマルチリージョンの外部データセットに適応している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:30:53 GMT)
Private Communication over a Bosonic Compound Channel [7.8] 両相シフトキーリングアルファベットを用いたボソニック化合物ワイヤタップチャネルのキャパシティ公式を証明した。
この研究で、チャネルの不確実性がデータ転送率をいかにペナルティ化するか、正確に定量化できます。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:49:33 GMT)
Multidimensional Byte Pair Encoding: Shortened Sequences for Improved Visual Data Generation [7.7] 言語処理では、変換器は圧縮されたテキストから大いに恩恵を受ける。
これは、平易な文字の代わりに単語の断片をキャプチャするより大きな語彙によって達成される。
私たちの仕事はByte Pairの導入によって視覚データのトークン化を改善します。
1次元から複数の次元へ。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:36:48 GMT)
DR-BFR: Degradation Representation with Diffusion Models for Blind Face Restoration [7.5] 低品質 (LQ) の顔画像から様々な劣化を分解する能力を持つ拡散モデルを開発した。
DR-BFRと呼ばれる新しい修復手法は、劣化表現(DR)とLQ画像からのコンテンツ特徴を取り入れることで、遅延拡散モデル(LDM)の認知を導く。
DR-BFRは、様々なデータセットに対して定量的かつ質的に最先端の手法を著しく上回る。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:24:42 GMT)
Debias your Large Multi-Modal Model at Test-Time with Non-Contrastive Visual Attribute Steering [7.5] 大規模マルチモーダルモデル(LMM)のための新しいデバイアス化フレームワークを提案する。
提案手法は,1つの画像と対象属性のリストが与えられた場合,画像自体の勾配降下の1ステップで対応する表現をアブレーションすることができる。
我々の実験は、LMMが保護属性に関連するテキストを生成することの妥当性を最小化できるだけでなく、感情を改善し、単に合成データを使ってアブレーションを知らせることさえできることを示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:06:09 GMT)
Dynamic Dimension Wrapping (DDW) Algorithm: A Novel Approach for Efficient Cross-Dimensional Search in Dynamic Multidimensional Spaces [7.4] 本稿では,新しい最適化アルゴリズムである動的次元ラッピング(DDW)を提案する。
このアルゴリズムは動的時間ウォーピング(DTW)とユークリッド距離を組み合わせて、動的多次元空間に適応する適合度関数を設計する。
実験の結果,DDWは動的多次元空間において優れた性能を示し,従来の最適化アルゴリズムよりも優れていた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:01:19 GMT)
A Multi-Server Information-Sharing Environment for Cross-Party Collaboration on A Private Cloud [7.2] 本研究では,相互運用と相互運用の課題に対処するため,プライベートクラウド上でのマルチサーバ情報共有手法を提案する。
提案されたアプローチは、サードパーティのデータ共有とコラボレーションをサポートしながら、データのオーナシップとプライバシを維持するために実現可能である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:37:01 GMT)
Erasure Decoding for Quantum LDPC Codes via Belief Propagation with Guided Decimation [7.2] 我々は、量子LDPC符号のガイドデシミテーション(BPGD)復号化により、量子消去チャネル上での競合性能を示すことを示す。
BPGDは、量子LDPCのランドスケープを横断する消去デコードのための効果的な汎用ソリューションである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:26:59 GMT)
Contextualizing Security and Privacy of Software-Defined Vehicles: State of the Art and Industry Perspectives [7.2] Software-Defined Vehicles(SDV)によるサイバーセキュリティとプライバシの課題に関する調査
SDVはOTA(Over-the-Air)アップデートやV2X(Valby-to-Everything)通信といった機能をますます統合している。
SDVへの移行は、車両が大量の機密データを収集するなど、重要なプライバシー上の懸念も引き起こす。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:30:07 GMT)
Guided Learning: Lubricating End-to-End Modeling for Multi-stage Decision-making [7.1] 多段階意思決定におけるエンド・ツー・エンド・ラーニングを強化するためのガイドド・ラーニングを提案する。
本稿では,中間的ニューラルネットワーク層を段階的な目標に向けてトレーニングする関数である「ガイド」の概念を紹介する。
明示的な監督ラベルを欠いた意思決定シナリオに対しては、全決定の報酬'を定量化するユーティリティ関数を組み込む。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:54:25 GMT)
Visual question answering based evaluation metrics for text-to-image generation [7.1] 本稿では,各オブジェクトに対する入力テキストと生成画像のアライメントを評価するための新しい評価指標を提案する。
実験結果から,提案手法はより微細なテキスト画像のアライメントと画質を同時に評価できる優れた指標であることがわかった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:32:23 GMT)
Block based Adaptive Compressive Sensing with Sampling Rate Control [7.1] 本稿では,ビデオ圧縮センシング(CS)における時間的冗長性について検討し,サンプリングレート制御戦略を備えたブロックベース適応センシングフレームワークを提案する。
非移動領域の冗長な圧縮を避けるため、まず連続するフレーム間の移動ブロック検出を取り入れ、移動ブロックの測定のみを送信する。
ブロックアーチファクトの低減と復元品質の向上のために,前フレームからの非移動ブロックの測定を参照して,移動ブロックと非移動ブロックの協調的再構成を採用する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:58:56 GMT)
SINETRA: a Versatile Framework for Evaluating Single Neuron Tracking in Behaving Animals [7.0] SINETRAは、変形可能な背景にある粒子の合成追跡データを生成する汎用シミュレータである。
このシミュレーターは、Hydra Vulgarisのような動物が見ている複雑な動きを反映した注釈付き2Dと3Dビデオを生成する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:41:48 GMT)
Count of Monte Crypto: Accounting-based Defenses for Cross-Chain Bridges [7.0] 2021年から2023年の間、暗号資産の価値は260億ドルを超え、「ブリッジ」に対する攻撃によって盗まれた。
本稿では,この期間にキーブリッジが使用した1000万件のトランザクションを実証分析する。
クロスチェーンのインフローとアウトフローのバランスをとる単純な不変性は、正当な使用法と互換性があるが、既知のすべての攻撃を正確に識別する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:01:15 GMT)
Large Language Models as User-Agents for Evaluating Task-Oriented-Dialogue Systems [6.9] タスク指向対話(TOD)モデルを評価するために、オフラインデータセットが使用されている。
コンテキスト対応のユーザエージェントは、人間の会話の多様性と予測不能をシミュレートすることができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:05:45 GMT)
Explanation for Trajectory Planning using Multi-modal Large Language Model for Autonomous Driving [6.9] この制限を解決するために,エゴ車両の将来の計画軌道を入力とする推論モデルを提案する。
本研究では,エゴ車両の今後の計画軌跡を入力として,この制限を新たに収集したデータセットで解決する推論モデルを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:05:33 GMT)
STLight: a Fully Convolutional Approach for Efficient Predictive Learning by Spatio-Temporal joint Processing [6.9] チャネルワイドおよび深度ワイドの畳み込みを学習可能な層としてのみ依存する,S時間学習のための新しい方法STLightを提案する。
STLightは、空間次元と時間次元を並べ替えることで、従来の畳み込みアプローチの限界を克服する。
本アーキテクチャは,データセットや設定のSTLベンチマーク上での最先端性能を実現するとともに,パラメータや計算FLOPの計算効率を大幅に向上させる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:53:19 GMT)
Static network structure cannot stabilize cooperation among Large Language Model agents [6.9] 大規模言語モデル(LLM)は、人間の社会的行動のモデル化にますます利用されている。
本研究の目的は,LLMとヒトの協調行動における並列性を明らかにすることである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:52:15 GMT)
Implicit Grid Convolution for Multi-Scale Image Super-Resolution [6.8] 我々は,Implicit Grid Convolution(IGConv)と連携して,単一エンコーダを用いたマルチスケールフレームワークを提案する。
本フレームワークは,既存の固定スケール手法に匹敵する性能を達成しつつ,トレーニング予算を削減し,パラメータを3倍に抑える。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:39:48 GMT)
A Low-Resolution Image is Worth 1x1 Words: Enabling Fine Image Super-Resolution with Transformers and TaylorShift [6.8] 1x1のパッチサイズを利用して制限に対処するTaylorIRを提案し、任意のトランスフォーマーベースSRモデルでピクセルレベルの処理を可能にする。
実験により,従来の自己注意型変圧器と比較して,メモリ消費を最大60%削減しながら,最先端のSR性能を実現することができた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:43:58 GMT)
Design fast Rydberg blockade SWAP gates with synthetic modulated driving [6.8] コールド原子量子ビットプラットフォームは、量子計算研究の次の段階において魅力的な選択として現れる。
Controlled-PHASE Rydberg ブロックゲートの成功は、2ビットの Rydberg ブロックゲート SWAP が存在するかどうかという興味深い疑問を引き起こす。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:02:47 GMT)
Improved Canonicalization for Model Agnostic Equivariance [6.8] 従来の方法で同変モデルを構築するには、既存のモデルの同変モデルを設計し、それらをゼロから訓練する必要がある。
そこで本研究では,任意の非同変ネットワークを正準化に利用する最適化手法を提案する。
提案手法は, コントラスト学習を用いて, 正準化ネットワークの選択に対して, 効率よく学習し, 柔軟性を向上する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:08:55 GMT)
Content-Aware Preserving Image Generation [6.8] 本稿では,出力画像に所望のコンテンツを組み込むように設計された,新たな画像生成フレームワークを提案する。
このフレームワークは高度な符号化技術を利用し、コンテンツ融合と周波数符号化モジュールを統合する。
Flickr-Faces-High Quality、Animal Faces High Quality、大規模シーン理解データセットなど、広く使用されているベンチマークデータセットでテストが行われる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 01:32:19 GMT)
Building 6G Radio Foundation Models with Transformer Architectures [6.7] 基礎深層学習(DL)モデルは、対象とするモダリティの一般的な、堅牢で適応可能な表現を学習するために設計されている。
これらのモデルは、自己教師付き学習(SSL)を使用して、大規模でラベルのないデータセットで事前訓練される
スペクトログラム学習のための無線基礎モデルとして視覚変換器(ViT)を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:01:44 GMT)
AMXFP4: Taming Activation Outliers with Asymmetric Microscaling Floating-Point for 4-bit LLM Inference [6.7] 高速な大規模言語モデル推論のための非対称マイクロスケーリング4ビット浮動小数点(AMXFP4)を提案する。
データ・ローテーションとコスト・キャリブレーションに依存する従来の4ビット量子化法とは異なり、AMXFP4は4ビット直接鋳造に非対称な共有スケールを使用する。
私たちのAMXFP4フォーマットはMXFP4や他の主要な量子化技術よりも優れており、ロバストでキャリブレーションのない4ビットの推論を可能にします。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:11:19 GMT)
HEOM-QUICK2: a general-purpose simulator for fermionic many-body open quantum systems -- An Update [6.7] HEOM-QUICK2はフェルミオン多体OQSの汎用シミュレータである。
定常状態のより効率的な解法、非マルコフメモリのより正確な処理、長期散逸ダイナミクスの数値安定性の改善などが特徴である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:36:59 GMT)
Evaluating Creativity and Deception in Large Language Models: A Simulation Framework for Multi-Agent Balderdash [6.7] 大きな言語モデル(LLM)は複雑なタスクや対話的な環境において印象的な機能を示している。
本稿では, LLMの創造性と論理的推論の両面を評価するために, Balderdash を利用したシミュレーションフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:42:48 GMT)
DriveThru: a Document Extraction Platform and Benchmark Datasets for Indonesian Local Language Archives [6.6] インドネシアは言語的にも最も多様な国の一つである。
この言語的多様性にもかかわらず、インドネシア語は、自然言語処理の研究と技術において不足している。
インドネシアではこれまでデジタル言語リソースの構築に使われていなかった文書をデジタル化してデータセットを作成する方法を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:42:59 GMT)
Chain of Alignment: Integrating Public Will with Expert Intelligence for Language Model Alignment [6.6] 本研究では,公的な意志と言語モデル(LM)の振舞いのアライメントを測定する手法を提案する。
私たちのアライメントの連鎖はルールベース報酬(RBR)を生み出します。
メンタルヘルスに関連する3つの分野のLMプロンプトにまたがって適用することで、我々のアプローチを検証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:10:39 GMT)
Reachability Analysis of the Domain Name System [6.5] DNSは、セキュリティと信頼性を確保するために、ユニークな課題を提起する。
DNS検証問題の最初の決定手順を提供し、その複雑性を$mathsf2ExpTime$として確立する。
我々は、DNS上で最も顕著な攻撃ベクトルである増幅攻撃とブラックホリングの書き直しを2つモデル化する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:36:01 GMT)
A Survey of Event Causality Identification: Principles, Taxonomy, Challenges, and Assessment [6.5] 事象因果同定(ECI)は自然言語処理(NLP)において重要な課題となっている。
本分類法は文レベル(SECI)と文書レベルの事象因果同定(DECI)の2つの主要なタスクに従ってECIの手法を分類する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:19:42 GMT)
That Chip Has Sailed: A Critique of Unfounded Skepticism Around AI for Chip Design [6.4] 2020年、我々は超人的なチップレイアウトを生成する深層強化学習法を導入した。
ISPD 2023の非レビュー論文は、Natureに記載されているように、我々の方法を実行できなかったにもかかわらず、パフォーマンスに関する主張を疑問視した。
われわれはこの対応を公表し、誰もこの影響のある分野での革新を誤って妨げられないようにしている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:11:10 GMT)
CorrCLIP: Reconstructing Correlations in CLIP with Off-the-Shelf Foundation Models for Open-Vocabulary Semantic Segmentation [6.4] オープン語彙セマンティックセグメンテーションのためのトレーニング不要なアプローチであるCorrCLIPを紹介する。
基礎モデルを用いたパッチ間の相関関係を著しく再構築する。
トレーニングフリーの方法として、CorrCLIPは8つの挑戦的なベンチマークで顕著な改善を実現している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:14:55 GMT)
M3TR: Generalist HD Map Construction with Variable Map Priors [6.3] 本稿では,HDマップ構築のための一般手法であるM3TRを紹介する。
そこで本研究では,意味的に多様なマップ先行モデルを用いた最初の現実シナリオを提案する。
すべての事前シナリオにわたるトレーニングは、以前のExpertモデルと同等のパフォーマンスを持つ単一のジェネリストモデルをもたらすことを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:14:48 GMT)
On the Foundation Model for Cardiac MRI Reconstruction [6.3] 本稿では,適応アンロール,チャネルシフト,パターンとコントラスト-プロンプト-UNetを用いた基礎モデルを提案する。
PCP-UNetは画像コントラストとサンプリングパターンプロンプトを備える。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:15:56 GMT)
Governing the Commons: Code Ownership and Code-Clones in Large-Scale Software Development [6.2] 弱いオーナシップや集合的なオーナシップを採用するソフトウェア開発組織では,さまざまなチームがさまざまなコンポーネントの変更を自律的に実施することが期待される。
私たちの目標は、異なるチームが異なるコンポーネントを変更するときに、コードのクローンという形で技術的負債を導入する方法と理由を理解することです。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:54:04 GMT)
DCD: Discriminative and Consistent Representation Distillation [6.2] 本研究では,大きな教師モデルからより小さな学生モデルへ知識を伝達するための識別・一貫性蒸留(DCD)を提案する。
DCDは、教師と生徒の表現の分布の相違を最小限に抑えるために、一貫性の規則化とともに対照的な損失を生んでいる。
学生モデルが教師の精度を上回りながら,DCDが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:54:58 GMT)
Learning Diffusion Priors from Observations by Expectation Maximization [6.2] 不完全および雑音のみから拡散モデルをトレーニングするための予測最大化アルゴリズムに基づく新しい手法を提案する。
提案手法は,非条件拡散モデルに対する改良された後続サンプリング方式の提案と動機付けである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:57:14 GMT)
Semantic Segmentation by Semantic Proportions [6.2] セマンティック・セグメンテーションのための新しい手法を提案し、個々のセマンティック・クラス比の粗い情報を必要とする。
これにより、データアノテーションプロセスが大幅に単純化され、アノテーションの時間、コスト、ストレージスペースが大幅に削減される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 01:43:35 GMT)
Memory Proxy Maps for Visual Navigation [6.1] 視覚的なナビゲーションは人間からインスピレーションを受け、視覚を使って、詳細な環境マップを使わずに、これまで見えなかった環境をナビゲートする。
これに触発されて、封建的学習を用いた視覚ナビゲーションのための、No-RL、No-graph、No-odometryアプローチを導入し、3つのタイレッドエージェントを構築した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:37:14 GMT)
meds_reader: A fast and efficient EHR processing library [6.1] meds_readerは効率的なEHRデータ処理のための最適化されたPythonパッケージである。
2つの主要なEHR処理パイプラインのキーコンポーネントを再実装することで、meds_readerの利点を実証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:48:06 GMT)
Interactive Image-Based Aphid Counting in Yellow Water Traps under Stirring Actions [5.9] 本稿では,対話的発振動作による新しいアフィドカウント法を提案する。
我々は,イエローウォータートラップにおけるアフィドの分布を変化させるために,インタラクティブなかき混ぜを用いている。
また,計数結果の信頼性を評価するために,計数信頼度評価システムを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:06:50 GMT)
Back to Supervision: Boosting Word Boundary Detection through Frame Classification [5.9] 単語境界検出を教師付きで行うためのモデルに依存しないフレームワークを提案する。
私たちはBuckeyeデータセットでトレーニングとテストを行い、TIMITデータセットでのみテストしました。
我々は,Buckeyeデータセットで0.8427,TIMITデータセットで0.7436,R値で0.8489,0.7807を得た。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:43:29 GMT)
Refined and Segmented Price Sentiment Indices from Survey Comments [5.9] 我々は,内閣府が実施した経済監視者調査から価格に関するコメントを抽出する。
大規模言語モデル(LLM)を用いて価格トレンドを分類する。
我々は、一般的な目的だけでなく、より具体的な目的のために価格感指数を構築します。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:22:21 GMT)
Layer Importance and Hallucination Analysis in Large Language Models via Enhanced Activation Variance-Sparsity [5.9] 本稿では,アクティベーション・ヴァリタンス・スパーシリティスコア(AVSS)を用いて,まず層の重要性を考察する。
AVSSを基盤として,レイヤ間の幻覚の適合性を評価するための改良版を提案する。
この改良されたアプローチは、Halucination-Specific Activation Variance(HSAV)とHalucination-Specific Sparsity(HSS)メトリクスを導入し、Halucination-prone層の正確な識別を可能にする。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:33:47 GMT)
Everything is a Video: Unifying Modalities through Next-Frame Prediction [5.7] 自然言語処理(NLP)を超えて,タスク再構成の概念を多モーダル学習に拡張する新しいフレームワークを提案する。
本稿では,多様なマルチモーダルタスクを統一した次フレーム予測問題に再構成することを提案する。
提案手法は,テキスト・トゥ・テキスト,画像・トゥ・テキスト,ビデオ・トゥ・ビデオ,ビデオ・トゥ・テキスト,音声・トゥ・テキストなど,様々なタスクで評価される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:59:37 GMT)
Prompting and Fine-tuning Large Language Models for Automated Code Review Comment Generation [5.6] プログラムデータと自然言語データの両方で事前訓練された大きな言語モデルは、コード指向のタスクでうまく機能する傾向にある。
我々は,パラメータ効率,量子化低ランクのオープンソースLarge Language Model (LLM) をコンシューマグレードハードウェア上で微調整し,レビューコメント生成を改善する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:01:38 GMT)
3D-GSW: 3D Gaussian Splatting for Robust Watermarking [5.5] モデルとレンダリング画像の両方の所有権を確保する3D-GSのためのロバストな透かし方式を提案する。
提案手法は高いレンダリング品質を維持しながら、レンダリング画像の歪みやモデルアタックに対して頑健である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:11:34 GMT)
Adapting the Biological SSVEP Response to Artificial Neural Networks [5.5] 本稿では,神経科学の手法である周波数タギングに触発されたニューロン重要度評価に対する新しいアプローチを提案する。
画像分類のための畳み込みニューラルネットワークを用いて行った実験では、パートベースの周波数タギングの下でのニューロン特異的応答における顕著な調和と相互変調が明らかにされた。
提案手法は,ネットワークプルーニングやモデル解釈可能性などの応用を約束し,説明可能な人工知能の進歩に寄与する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:02:48 GMT)
AI and the Future of Work in Africa White Paper [5.4] この白書はナイロビにおける多学派ワークショップの成果である(2023年9月)
Microsoft Research、NEPAD、Lelapa AI、オックスフォード大学などの組織横断チームによって率いられた。
マクロ経済学的影響、雇用、技能、労働市場、労働者の視点、アフリカ・セントリスのAIプラットフォームという4つの主要なテーマを中心に議論が行われた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:34:59 GMT)
Understanding The Effect Of Temperature On Alignment With Human Opinions [5.2] 分布を得るための3つの簡単な方法の実証分析を行う。
この結果から,単純なパラメータ調整によるサンプリングと対数確率のアプローチにより,主観的タスクにおいてより整合した出力を返却できることが示唆された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:50:27 GMT)
Towards Automatic Evaluation of Task-Oriented Dialogue Flows [5.1] 本稿では,対話フローの品質を評価するための新しい指標であるFuDGE(Fuzzy Dialogue-Graph Edit Distance)を紹介する。
FuDGEは、個々の会話がフローとどの程度うまく一致しているかを測定し、その結果、会話の集合がフロー全体によってどれだけうまく表現されるかを測定する。
FuDGEは対話フローの標準化と最適化により、対話設計者と自動化技術により、より高いレベルの効率と自動化を実現する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:35:00 GMT)
Lateral Movement Detection via Time-aware Subgraph Classification on Authentication Logs [4.9] 側方移動は、ネットワークにおける先進的永続的脅威(APT)攻撃の重要な構成要素である。
LMDetectと呼ばれるマルチスケール横移動検出フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:35:56 GMT)
Establishing and Evaluating Trustworthy AI: Overview and Research Challenges [4.8] 一部のAIシステムは予期せぬ結果または望ましくない結果をもたらすか、疑わしい方法で使用された。
本稿では,信頼に値するAIの既存の概念を6つの要件に従って合成する。
幅広い読者の参考として、そして将来の研究方向性の基礎として機能することを目的としている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:05:52 GMT)
EchoMimicV2: Towards Striking, Simplified, and Semi-Body Human Animation [4.8] 本研究では, 半体細部, 顔の表情, ジェスチャーの表現性を向上し, コンディションの冗長性を低減するため, 半体アニメーション手法であるEchoMimicV2を提案する。
特定のフェーズにおけるアニメーションの動作、ディテール、低レベルの品質をガイドするために、フェーズ固有のDenoising Lossを設計する。
大規模な実験と分析により、EchoMimicV2は定量評価と定性評価の両方において既存の手法を超越していることが示された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:23:18 GMT)
Adaptive Non-Uniform Timestep Sampling for Diffusion Model Training [4.8] データ分布が複雑化するにつれて、収束のためのトレーニング拡散モデルがますます複雑になる。
より重要な時間ステップを優先する一様でない時間ステップサンプリング手法を提案する。
提案手法は, 各種データセット, スケジューリング戦略, 拡散アーキテクチャにまたがるロバストな性能を示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:12:18 GMT)
FGCE: Feasible Group Counterfactual Explanations for Auditing Fairness [4.7] 本稿では,モデルフェアネスを監査するために,グループ対実的説明を生成する最初のグラフベースのフレームワークを提案する。
我々のフレームワークは、Fasible Group Counterfactual Explanations (FGCEs)と名付けられ、現実世界の現実性制約を捉え、類似の反事実を持つサブグループを構築する。
また、カウンターファクト・ジェネレーションにおける重要なトレードオフとして、カウンターファクト・ジェネレーションの件数、関連するコスト、達成された範囲の広さのバランスがあげられる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:02:15 GMT)
SmoothCache: A Universal Inference Acceleration Technique for Diffusion Transformers [4.7] Diffusion Transformer (DiT)は、画像、ビデオ、音声合成など、様々なタスクのための強力な生成モデルとして登場した。
本稿では,DiTアーキテクチャのモデルに依存しない推論高速化手法であるSmoothCacheを紹介する。
我々の実験は、SmoothCacheが71%のスピードアップを実現し、多様なモダリティをまたいだ生成品質の維持や改善を実現していることを示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:24:02 GMT)
Take Package as Language: Anomaly Detection Using Transformer [4.7] 本稿では,ネットワーク侵入検出のためのGPTに基づく因果言語モデルであるNIDS-GPTを提案する。
NIDS-GPTはパケット内の各番号をパケットフィールドではなく独立した「ワード」として扱い、よりきめ細かいデータ表現を可能にする。
CICIDS 2017とカーハックデータセットの実験は、NIDS-GPTが極端な不均衡条件下で100%の精度を達成することを示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:00:43 GMT)
SPARS3R: Semantic Prior Alignment and Regularization for Sparse 3D Reconstruction [4.7] 本研究では,SPARS3Rを提案する。このSPARS3Rは,深度推定から構造移動と高密度点雲からの正確なポーズ推定を合成する。
我々は,SPARS3Rがスパース画像によるフォトリアリスティックレンダリングを実現し,既存の手法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:06:15 GMT)
Revealing the Evolution of Order in Materials Microstructures Using Multi-Modal Computer Vision [4.6] マイクロエレクトロニクス用高性能材料の開発は, マイクロ構造秩序を記述し, 直接的に定義する能力に依存している。
本稿では, 複合酸化物La$_1-x$Sr$_x$FeO$_3$の電子顕微鏡解析の順序を記述するためのマルチモーダル機械学習(ML)手法を実証する。
我々は、ユニモーダルモデルとマルチモーダルモデルの性能の違いを観察し、コンピュータビジョンを用いて結晶の秩序を記述する一般的な教訓を導いた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:44:32 GMT)
Effective Generative AI: The Human-Algorithm Centaur [4.6] 私たちは、多くの分野におけるAI開発と利用の未来は、他のAIアプローチとは対照的に、センタウロスにもっと集中する必要があると論じています。
センタウロス(Centaurs)は、形式分析と人間の直観を共生的に組み合わせたハイブリッドな人間-アルゴリズムモデルである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:48:07 GMT)
Reducing Reasoning Costs -- The Path of Optimization for Chain of Thought via Sparse Attention Mechanism [4.6] この研究は、いくつかの関連するトークンにのみ焦点をあてるスパースアテンションメカニズムを使うことを提案する。
この実験は、MIT OpenCourseWareの線形代数テスト問題の解法において、このモデルの推論時間、正当性スコア、思考長の連鎖とo1プレビューを比較して比較した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:28:27 GMT)
Mitigating Sycophancy in Decoder-Only Transformer Architectures: Synthetic Data Intervention [4.6] 本研究はデコーダのみのトランスアーキテクチャに合成データ介入技術を適用した。
以上の結果から,SDIトレーニングモデルでは,精度と薬効率の観点から,SDIトレーニングモデルがサポートできることが示唆された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:59:46 GMT)
EHRMamba: Towards Generalizable and Scalable Foundation Models for Electronic Health Records [4.5] 我々は,Mambaアーキテクチャ上に構築された堅牢な基盤モデルであるEHRMambaを紹介する。
EHRデータに対するMPF(Multitask Prompted Finetuning)の新たなアプローチを導入し,EHRMambaが単一ファインタニングフェーズで複数の臨床タスクを同時に学習できるようにする。
MIMIC-IVデータセットを用いて評価したところ, EHRMambaは6つの主要な臨床課題にまたがって最先端の成績を向上し, EHR予測に優れており, この分野における飛躍的な進歩を示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:24:00 GMT)
Systolic Arrays and Structured Pruning Co-design for Efficient Transformers in Edge Systems [4.5] 本研究では, 構造化プルーニングとシストリック加速度の相互関係について検討し, プルーニングブロックの大きさとシストリックアレイ寸法とを一致させた。
本稿では,アルゴリズム最適化,システムシミュレーション,ハードウェア設計メトリクスを統合した新しい協調設計フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:40:49 GMT)
Pretrained ViTs Yield Versatile Representations For Medical Images [4.4] ヴィジュアルトランスフォーマー(ViT)はCNNの対抗馬として登場している。
いくつかの標準的な2次元医用画像ベンチマークのデータセットとタスクについて、一連の実験を行った。
以上の結果から,CNNはスクラッチからトレーニングすると性能が向上するが,ImageNetで事前トレーニングを行った場合,市販のビジョントランスフォーマーはCNNと同等に動作可能であることがわかった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:31:44 GMT)
Adversarial Robustness of VAEs across Intersectional Subgroups [4.4] 可変オートエンコーダ (VAEs) は, 決定論的AEよりも逆方向の摂動に強い抵抗を示す。
本研究は,非標的敵攻撃に対するVAEの堅牢性を評価する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:51:10 GMT)
Xmodel-1.5: An 1B-scale Multilingual LLM [4.3] 約2兆のトークンで事前訓練された新しい1ビリオンパラメータ多言語大モデルであるXmodel-1.5を紹介する。
このモデルは、タイ語、アラビア語、フランス語などいくつかの言語で強いパフォーマンスを示し、中国語や英語でも効果がある。
我々は,Chulalongkorn University's School of Integrated Innovationの学生が注釈付けした数百の質問を含むタイ語評価データセットをリリースする。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:01:52 GMT)
Scaling up the Evaluation of Collaborative Problem Solving: Promises and Challenges of Coding Chat Data with ChatGPT [4.3] 本稿では,ChatGPTを用いてCPSチャットデータを直接コードする際の知見を,複数のデータセットやコーディングフレームワークのパフォーマンスをベンチマークすることで報告する。
また,ChatGPTをベースとしたコーディングは,会話が口語言語によって特徴付けられるタスクにおいて,人間のコーディングよりも優れていた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:57:39 GMT)
BAdam: A Memory Efficient Full Parameter Optimization Method for Large Language Models [4.3] BAdamは、ブロック座標降下(BCD)フレームワークをAdamの更新ルールで活用する最適化手法である。
BAdamは、大きな言語モデルの完全なパラメータ微調整に対するメモリ効率のよいアプローチを提供する。
私たちのコードは、任意のPyTorchベースのシステムに簡単に統合できます。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:17:35 GMT)
Realised Volatility Forecasting: Machine Learning via Financial Word Embedding [4.2] 本研究は15年間のビジネスニュースを用いた財務用語の埋め込みを開発する。
応用として、この単語を単純な機械学習モデルに組み込んで、実現されたボラティリティを予測するためのHARモデルを強化する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:28:11 GMT)
Y-MAP-Net: Real-time depth, normals, segmentation, multi-label captioning and 2D human pose in RGB images [4.2] 本稿では,RGB画像上でリアルタイムマルチタスク学習を実現するニューラルネットワークアーキテクチャY-MAP-Netを提案する。
Y-MAP-Netは、深さ、表面の正常、人間のポーズ、セマンティックセグメンテーションを同時に予測し、複数ラベルのキャプションを生成する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:33:59 GMT)
A Supercomputing Based Distributed Cloud Marketplace [4.2] 我々は,市販のハードウェアであるLulChainでスーパーコンピュータの速度を増大させる,無限にスケーラブルでセキュアで高スループットのブロックチェーンを導入する。
全参加者のタイムスタンプ同期と過半数の合意の必要性をなくすことで、LluChainは信頼できる信頼、低コストのインスタントトランザクション、フレキシブルなインスタントコントラクトへの扉を開く。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:53:20 GMT)
Orca: Enhancing Role-Playing Abilities of Large Language Models by Integrating Personality Traits [4.1] 我々は,人格特性を統合することで,カスタム文字のLLMをデータ処理し,訓練するためのフレームワークOrcaを提案する。
Orcaは4つのステージで構成されている。 パーソナリティ特性の推測、LCMの活用により、ユーザのBigFiveパーソナリティ特性のレポートとスコアを推測する。
提案手法は,本ベンチマークにおいて優れた性能を示すことを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:35:47 GMT)
Evaluating and Enhancing Large Language Models for Conversational Reasoning on Knowledge Graphs [4.1] 我々は知識グラフ(KG)を用いた現在最先端の大規模言語モデル(GPT-4)の会話推論能力を評価する。
我々は,KG経路の正確かつ適応的な予測を行うために設計された基底KG推論エージェントであるLLM-ARKを紹介する。
LLaMA-2-7B-ARKは、現在の最先端モデルよりも5.28ポイント優れており、ターゲット@1評価基準では36.39%である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:48:58 GMT)
From Isolation to Collaboration: Federated Class-Heterogeneous Learning for Chest X-Ray Classification [4.1] フェデレートラーニングは,グローバル胸部X線分類モデル(CXR)を協調的にトレーニングするための,有望なパラダイムである。
本研究では,選択的アグリゲーションを用いてグローバルモデルの協調学習を行うFL法である外科的アグリゲーションを提案する。
その結果,本手法は現在の手法よりも優れ,一般化性が高いことがわかった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:00:24 GMT)
Features that Make a Difference: Leveraging Gradients for Improved Dictionary Learning [4.1] スパースオートエンコーダ(SAE)は、ニューラルネットワーク表現を抽出するための有望なアプローチである。
我々は、TopKアクティベーション関数を増強することにより、$k$-sparseのオートエンコーダアーキテクチャを変更するGradient SAEを紹介する。
g-SAEが任意の文脈でモデルを操る上で平均的に効果的である潜伏者を学ぶ証拠が見つかる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:03:52 GMT)
Diffusion Model with Perceptual Loss [4.0] 誘導のない拡散モデルは非現実的なサンプルを生成する傾向があるが、この問題の原因は十分に研究されていない。
本稿では,拡散モデル自体を知覚的損失として利用する新たな自己知覚的損失を提案する。
本研究は, 知覚的損失を拡散訓練に応用し, 試料品質を効果的に改善できることを実証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:05:31 GMT)
XChainWatcher: Monitoring and Identifying Attacks in Cross-Chain Bridges [3.9] 橋梁の監視と攻撃検出のための最初のメカニズムであるXChainWatcherを提案する。
XChainWatcherは、任意のクロスチェーンブリッジにプラグイン可能なように設計された、Datalogエンジンを使用したクロスチェーンモデルに依存している。
3つのブロックチェーンにまたがる81,000cctxの最初のオープンソースデータセットを提供し、トークン転送で420億ドル以上を獲得しています。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:13:01 GMT)
Is thermography a viable solution for detecting pressure injuries in dark skin patients? [3.9] 圧力障害(PI)の検出は特に暗い肌の色調において困難である。
深層学習モデルは、PIを確実に検出する大きな可能性を証明している。
より暗い肌色に焦点をあてた35人の被験者による新しい熱・光学画像データセットを導入する。
我々は、すべての皮膚のトーン上の熱画像または光学画像に基づいて訓練された小さな畳み込みニューラルネットワーク(CNN)の性能を比較した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 23:22:21 GMT)
How to Build a Quantum Supercomputer: Scaling Challenges and Opportunities [3.9] 数百の物理量子ビット上の量子アルゴリズムプリミティブに対して、小さなデモが可能になった。
大幅な進歩と興奮にもかかわらず、フルスタックのスケーラブルな技術への道のりはほとんど不明である。
既存の半導体技術を採用して、より高品質な量子ビットを構築することで、スケーリングへの道が拓けることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:22:46 GMT)
The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning [3.8] この論文は$d$-dimensional recursion approximation, $$theta_n+1=theta_n + alpha_n + 1 f(theta_n, Phi_n+1)に関するものである。
主な結果は、ドスカー・バラダン・リャプノフドリフト条件(DV3)の平均流とバージョンに関する追加条件の下で確立される。
a example is given where $f$ and $barf$ are linear in $theta$, and $Phi$ is a geometryal.
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:34:34 GMT)
Transformers -- Messages in Disguise [3.7] NNベースの暗号は、ランダムな暗号スキームを学習し実装する能力のために研究されている。
Rは、(i)投影層、(ii)逆投影層、(iii)ドット生成層という3つの新しいNN層から構成される。
その結果、(i) が計算効率が高く、(ii) 暗号化されたメッセージが一意であること、(iii) が通信オーバーヘッドを誘発しないことが保証される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:42:29 GMT)
A Realistic Collimated X-Ray Image Simulation Pipeline [3.7] コリメータ検出は、信頼できない情報や利用できない情報を持つX線システムでは依然として困難な課題である。
本稿では,X線画像におけるコリメータ影の特性をシミュレートする物理動機付き画像処理パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:04:01 GMT)
Motion Diffusion-Guided 3D Global HMR from a Dynamic Camera [3.7] 拡散最適化を用いた新しい3次元大域HMR法DiffOptを提案する。
我々の重要な洞察は、動き拡散モデル(MDM)のような人間の動き生成の最近の進歩は、コヒーレントな人間の動きの強い先行を含むことである。
我々はDiffOptをGlobal 3D Human Pose and Shape in the Wildの電磁データベースからビデオシーケンスで検証した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:09:40 GMT)
Efficient Density Control for 3D Gaussian Splatting [3.6] より効率的な長軸分割操作を導入し,元のクローンとスプリットを置き換えた。
また,低オプティシティ・ガウス数を削減するため,簡単な適応型プルーニング手法を提案する。
提案手法を,様々な課題のある実世界のデータセット上で評価する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:12:56 GMT)
Embedding Byzantine Fault Tolerance into Federated Learning via Virtual Data-Driven Consistency Scoring Plugin [3.5] 本稿では,Byzantine-Resilienceを実現するために既存のFL技術に統合可能な直感的なプラグインを提案する。
医用画像分類タスクの数値的な結果は,提案手法を代表FLアルゴリズムに組み込むことで,効果的にビザンチンレジリエンスを実現する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:17:19 GMT)
Hysteresis Activation Function for Efficient Inference [3.5] 本稿では,Hysteresis Rectified Linear Unit (HLU) を提案する。
トレーニングと推論のための固定しきい値を持つ従来のアクティベーション関数とは異なり、HLUはバックプロパゲーションを洗練させる可変しきい値を使用する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:46:58 GMT)
Provocation: Who benefits from "inclusion" in Generative AI? [3.3] 我々は、AI開発と評価におけるコミュニティ参加の圧倒的な構造は、社会的に疎外されたグループのメンバーが参加の結果として経験できる利益と害について十分に明示されていないと論じる。
この投機的コンテキストを使って、提案された利益を実現するために克服すべき障壁を整理し、害を軽減します。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:09:40 GMT)
Voxel-Aggergated Feature Synthesis: Efficient Dense Mapping for Simulated 3D Reasoning [3.2] Voxel-Aggregated Feature Synthesis (VAFS) はシミュレーションにおける高密度3次元マッピングの新しいアプローチである。
VAFSはシミュレータの物理エンジンによって計算される分節点クラウドを用いて計算を大幅に削減する。
シミュレーションシーンにおける異なるオブジェクトに対する意味的クエリのIoUスコアを評価することで、結果の表現を検証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:37:56 GMT)
Nonlinear Neural Dynamics and Classification Accuracy in Reservoir Computing [3.2] 複雑度の異なる人工分類タスクにおける貯水池コンピュータの精度について検討する。
極端に非線形性が低下した活性化関数や弱いリカレント相互作用、小さな入力信号であっても、貯水池は有用な表現を計算することができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:52:12 GMT)
Disclosure of AI-Generated News Increases Engagement but Does Not Reduce Aversion, Despite Positive Quality Ratings [3.0] ジャーナリズムにおけるAIの統合は、民主主義の機会とリスクの両方を提示している。
本研究では,AI支援記事とAI生成記事と人為的ニュース記事の認識品質について検討する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:42:46 GMT)
Large Language Model-Based Interpretable Machine Learning Control in Building Energy Systems [3.0] 本稿では、モデルとその推論の透明性と理解を高める機械学習(ML)の分野である、解釈可能な機械学習(IML)について検討する。
共有価値の原則とLarge Language Models(LLMs)のコンテキスト内学習機能を組み合わせた革新的なフレームワークを開発する。
本稿では,仮想テストベッドにおける需要応答イベント下での予測制御に基づく事前冷却モデルの実現可能性を示すケーススタディを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:34:42 GMT)
Melanoma Detection with Uncertainty Quantification [3.0] 現在のメラノーマ検出ツールは、しばしば複数のデータセットの完全な統合を見落としている。
公開データセットを組み合わせることで、データの多様性を向上し、多数の実験でさまざまな分類器を訓練し評価することができます。
ベンチマークデータセットの実験では、不確実性に基づく拒絶を適用した後、93.2%前、97.8%の精度を示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:22:32 GMT)
GGAvatar: Reconstructing Garment-Separated 3D Gaussian Splatting Avatars from Monocular Video [3.0] GGAvatar(Garment-separated 3D Gaussian Splatting Avatar)の開発。
このモデルは、分離された、編集可能な、現実的な人間の再構築を効果的に達成する。
この論文では、図1に示すように、衣料品編集の応用についても紹介している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:09:20 GMT)
Secure multi-party quantum computation protocol for quantum circuits: the exploitation of triply-even quantum error-correcting codes [2.9] MPQCプロトコルは、エラーのない分散量子計算を可能にする暗号プリミティブである。
本稿では,従来の量子誤り訂正符号を採用したMPQCプロトコルを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:52:18 GMT)
Advancing Building Energy Modeling with Large Language Models: Exploration and Case Studies [2.9] 人工知能の急速な進歩は、ChatGPTのような大きな言語モデルの出現を促している。
本稿では,大規模言語モデルの革新的統合とエネルギーモデリングソフトウェアの構築について考察する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:20:23 GMT)
Unsupervised Congestion Status Identification Using LMP Data [2.9] 本稿では,非教師的手法を用いて,高次元ユークリッド空間におけるLMPの混雑部分の基本分布について検討する。
損失のないDC最適電力流(DC-OPF)に基づくLMPモデルを解析し,LMPデータの重なり合う部分空間特性を示す。
提案手法は,LMPデータのサブスペースにまたがる基底ベクトルを階層的に探索する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:21:54 GMT)
Mitigating Parameter Degeneracy using Joint Conditional Diffusion Model for WECC Composite Load Model in Power Systems [2.7] 連立条件拡散モデルに基づく逆問題解法(JCDI)を開発した。
JCDIは、パラメータの一般化性を改善するために、マルチイベント観測を同時に入力するジョイントコンディショニングアーキテクチャを組み込んでいる。
WECC CLMのシミュレーション研究により、提案したJCDIは縮退パラメータの不確かさを効果的に低減することを示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:53:08 GMT)
On the Cost of Model-Serving Frameworks: An Experimental Evaluation [2.6] 実運用環境でモデルを効果的にデプロイし、管理するためには、サービング戦略が不可欠です。
これらの戦略により、実際のアプリケーションでモデルが利用可能で、スケーラブルで、信頼性があり、パフォーマンスが保証される。
DL固有のフレームワーク(TensorFlow ServingとTorchServe)は、3つの汎用MLフレームワークよりも大幅にレイテンシが低いことを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:36:21 GMT)
CART: Compositional Auto-Regressive Transformer for Image Generation [2.6] 本稿では,自動回帰(AR)モデリングを用いた画像生成手法を提案する。
提案手法は,画像に細かな細部を合成的に繰り返し付加することにより,これらの課題に対処する。
この戦略は従来の次世代予測よりも効果的であることが示され、最先端の次世代予測アプローチを超えている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:29:44 GMT)
An Empirical Study on LLM-based Agents for Automated Bug Fixing [2.4] 大規模な言語モデル (LLM) と LLM ベースのエージェントが自動的にバグを修正するために適用されている。
自動バグ修正のためのSWE-bench Liteベンチマークにおいて,プロプライエタリでオープンソースな7つのシステムについて検討した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:19:15 GMT)
Risk Sources and Risk Management Measures in Support of Standards for General-Purpose AI Systems [2.3] 我々は、汎用AIシステムのためのリスクソースとリスク管理対策の広範なカタログをコンパイルする。
この作業には、モデル開発、トレーニング、デプロイメントステージにわたる技術的、運用的、社会的リスクの特定が含まれる。
このカタログは、AIガバナンスと標準における利害関係者による直接的な使用を容易にするために、パブリックドメインライセンス下でリリースされている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:18:57 GMT)
Adaptive Transfer Clustering: A Unified Framework [2.3] 本稿では,未知の相違点が存在する場合の共通性を自動的に活用するアダプティブ・トランスファー・クラスタリング(ATC)アルゴリズムを提案する。
これはガウス混合モデル、ブロックモデル、潜在クラスモデルを含む幅広い統計モデルに適用される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:32:55 GMT)
Attraction-Repulsion Swarming: A Generalized Framework of t-SNE via Force Normalization and Tunable Interactions [2.3] ARSは、アトラクションと反発力によって駆動される相互作用するエージェントの群として、t分散データ近接埋め込み(t-SNE)可視化技術を見ることに基づくフレームワークである。
ARSはまた、アトラクションとリプルションカーネルを個別にチューニングする機能も備えている。これにより、クラスタ内のタイツネスと、視覚化におけるそれらの間の間隔をユーザがコントロールできるようになる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:42:11 GMT)
Emergent kin selection of altruistic feeding via non-episodic neuroevolution [2.3] 神経進化を継続するエージェントの集団内で自然に出現する親族選抜の最初の実演を示す。
具体的には、親から子への資源のゼロサム移動は、子孫が単独で生き残るのが難しい環境での親子選択を通じて進化する。
さらに, シミュレーションにおける親族選択は, 親族認識と個体群粘度の組み合わせに依存することを示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:17:51 GMT)
Tissue Concepts: supervised foundation models in computational pathology [2.2] 基礎モデルのトレーニングは通常、データ、計算、時間の観点から非常に高価です。
本稿では,これらの費用を大幅に削減する教師あり学習手法を提案する。
提案手法は, 912,000個のパッチに対して16種類の分類, セグメンテーション, 検出タスクを組み合わせることで, 共同エンコーダを訓練するためのマルチタスク学習に基づいている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:32:02 GMT)
A Multi-Granularity Supervised Contrastive Framework for Remaining Useful Life Prediction of Aero-engines [2.1] 本稿では,多粒度教師付きコントラスト(MGSC)フレームワークを直感から開発する。
これは実装において、あまりに大きなミニバッチサイズとアンバランスなサンプルの問題に対処する。
また、シンプルでスケーラブルな基本ネットワーク構造を示し、CMPASSデータセット上で提案されたMGSC戦略を検証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:01:59 GMT)
Label Cluster Chains for Multi-Label Classification [2.1] マルチラベル分類は、複数のラベルをインスタンスに同時に割り当てることができる教師付き機械学習の一種である。
そこで本稿では,ラベル空間に分割法を適用して得られた解離相関ラベルクラスタをチェーンする手法を提案する。
提案手法は,学習と連鎖が相関するラベルクラスタをよりよく探索し,ラベル相関を学習できることを示唆する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:15:46 GMT)
Nonlinearity-Driven Morphing and Control of Topological Modes in Non-Hermitian Systems [2.1] 非エルミート皮膚効果(NHSE)と非線形性は、それぞれ境界から位相零モード(TZM)を非局在化することができる。
非エルミート非線形トポロジカルインタフェースモデルを開発し、正確なパラメータチューニングの課題を克服する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:05:04 GMT)
Leveraging large language models for efficient representation learning for entity resolution [2.0] TriBERTaは、エンティティマッチングのための表現を学習する教師付きエンティティ解決システムである。
提案手法は最先端の表現を3~19%のマージンで上回る。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 23:24:07 GMT)
Trading Datarate for Latency in Quantum Communication [1.9] 無線通信システムでは低レイテンシと高データレートの性能が不可欠である。
本稿では,光無線通信におけるレイテンシとデータレートのトレードオフについて検討する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:06:29 GMT)
AdapShare: An RL-Based Dynamic Spectrum Sharing Solution for O-RAN [1.9] AdapShareは、インテントベースのスペクトル管理に強化学習を活用する、ORAN互換のソリューションである。
RLエージェントを採用することで、AdapShareはインテリジェントにネットワーク要求パターンを学び、リソースを割り当てる。
AdapShareは、長期ネットワーク需要統計に基づく準静的リソース割り当て方式より優れている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:08:56 GMT)
Low-Rank Optimal Transport through Factor Relaxation with Latent Coupling [1.9] 大規模データセットに最適なトランスポートを適用する上で重要な課題は、データセットのサイズと結合行列の2次スケーリングである。
我々は、$textitlatent coupling$(LC)因子化に基づいて、低ランク問題の代替パラメータ化を導出する。
グラフクラスタリングや空間転写学などの多様なアプリケーションにおいて,その解釈可能性を示しながら,優れた性能を示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:07:15 GMT)
Quantum sensing with duplex qubits of silicon vacancy centers in SiC at room temperature [1.8] ケイ素炭化ケイ素(SiC)のシリコン空孔中心は、スピン$frac32$電子状態の室温で光学的に対応可能な量子ビットを提供する。
2つの共振周波数を持つマイクロ波パルスを用いて、クォーテットの二重量子ビット演算に基づくセンシング手法を提案し、同時に$left |+3/2rangle, |+1/2rangle right$と$left |-1/2rangle, |-3/2rangle right$を演算する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:13:04 GMT)
Uncertainty in Supply Chain Digital Twins: A Quantum-Classical Hybrid Approach [1.8] 本研究では,量子古典型ハイブリッド機械学習(ML)モデルを用いた不確実性定量化(UQ)について検討する。
これは、量子コンピューティング技術がUQのデータ機能を、特に従来の方法と組み合わせることで、どのように変換できるかを示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:02:35 GMT)
On Rank Aggregating Test Prioritizations [1.8] テストケース優先順位付け(TCP)は回帰テストの最適化に有効な戦略である。
本研究では, (i) アンサンブル選択, (ii) ランク集約, (iii) テストケース実行の3段階パイプラインとして, Ensemble Test Prioritization (EnTP) を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:17:37 GMT)
SoftLMs: Efficient Adaptive Low-Rank Approximation of Language Models using Soft-Thresholding Mechanism [1.7] 本稿では,ソフトしきい値設定機構を用いて各層のランクを動的に決定する新しい圧縮手法を提案する。
本手法は,識別タスクのBERTや生成タスクのGPT2,TinyLlamaなど,注目に基づくアーキテクチャに適用可能である。
実験により,提案手法はエンコーダ/デコーダにおける1.33Xから1.72Xの高速化を実現し,全パラメータの50%削減を実現した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:29:51 GMT)
Towards quantum-centric simulations of extended molecules: sample-based quantum diagonalization enhanced with density matrix embedding theory [1.6] サンプルベース量子対角化法(SQD)と組み合わせて実施した第1密度行列埋め込み理論(DMET)について述べる。
我々はDMET-SQD形式を用いて18個の水素原子の環の基底状態エネルギーと、シクロヘキサンの椅子、半チェア、ねじれボート、ボートコンホメータの相対エネルギーを計算する。
我々のDMET-SQD計算は、短期量子コンピュータで正確に取り組めるアクティブ領域のサイズが明らかに進歩していることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:42:31 GMT)
Research on Domain-Specific Chinese Spelling Correction Method Based on Plugin Extension Modules [1.6] 伝統的な中国の綴り補正モデルは一般的に一般ドメインデータセットで訓練される。
ドメイン固有の用語の特徴を学習する拡張モジュールを設計する。
この拡張モジュールは、一般的な綴り補正性能を損なうことなく、モデルにドメイン知識を提供することができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:08:58 GMT)
Mechanisms of Generative Image-to-Image Translation Networks [1.6] 本稿では,既存のモデルに比べてシンプルなアーキテクチャで,画像間翻訳ネットワークを提案する。
GANモデルに対する逆算は、余分な複雑な損失のペナルティを伴わない既存の手法に匹敵する結果をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:17:46 GMT)
The Unreasonable Effectiveness of Guidance for Diffusion Models [1.6] 本研究では,最先端指導手法と競合する生成性能が達成可能であることを示す。
我々は、その受容場を制約することで、プライマリモデル自体を誘導するスライディングウィンドウ誘導(SWG)と呼ぶ。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:04:04 GMT)
Steering AI-Driven Personalization of Scientific Text for General Audiences [1.6] TranSliderはAIを利用したツールで、個々のユーザープロファイルに基づいて、科学テキストのパーソナライズされた翻訳を生成する。
我々のツールはインタラクティブなスライダを備えており、ユーザーはパーソナライゼーションの度合いを0から100まで(弱弱弱)に設定できる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:55:23 GMT)
Increasing the Accessibility of Causal Domain Knowledge via Causal Information Extraction Methods: A Case Study in the Semiconductor Manufacturing Industry [1.5] 本研究では,SST(Single-stage sequence tagging)とMST(Multi-stage sequence tagging)の2種類の因果情報抽出手法を提案する。
MSTはプレゼンテーションスライドから抽出したテキストに対して73%のF1スコアを達成する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:18:18 GMT)
Personalization of Code Readability Evaluation Based on LLM Using Collaborative Filtering [1.4] 本研究では,協調フィルタリングを用いて評価を校正する手法を提案する。
予備分析の結果,LLMを用いた可読性評価の精度を効果的に向上することが示唆された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:09:47 GMT)
Identifying Key Drivers of Heatwaves: A Novel Spatio-Temporal Framework for Extreme Event Detection [1.4] ヒートウェーブ(英: Heatwaves、HW)は、社会や環境に重大な影響を及ぼす極端な大気現象である。
本研究は,極寒時の運転者識別のための一般的な手法を提案する。
クラスタリングアルゴリズムとアンサンブル進化アルゴリズムを組み合わせることにより,鍵即時(短期)のHWドライバを識別する新しいフレームワーク(STCO-FS)を提案する。
イタリア・アダ川流域のHWの解析に本手法を適用した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:09:34 GMT)
Multi-agent Path Finding for Timed Tasks using Evolutionary Games [1.3] 我々のアルゴリズムは,少なくとも1桁の精度で深部RL法よりも高速であることを示す。
以上の結果から,他の方法と比較してエージェント数の増加にともなってスケールが向上することが示唆された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:10:25 GMT)
SymbolFit: Automatic Parametric Modeling with Symbolic Regression [1.3] シンボリック回帰を用いてパラメトリックモデリングを自動化するフレームワークであるSybolFitを導入し,データに適合する関数の機械探索を行う。
本手法はCERN大型ハドロン衝突型加速器における高エネルギー物理実験におけるデータ解析応用において実証された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:09:37 GMT)
Fault Injection and Safe-Error Attack for Extraction of Embedded Neural Network Models [1.2] モノのインターネット(IoT)における32ビットマイクロコントローラの組み込みディープニューラルネットワークモデルに焦点をあてる。
攻撃を成功させるためのブラックボックス手法を提案する。
古典的畳み込みニューラルネットワークでは、1500個の入力で最も重要なビットの少なくとも90%を回復することに成功した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:20:32 GMT)
Convergence of Dirichlet Forms for MCMC Optimal Scaling with Dependent Target Distributions on Large Graphs [1.2] マルコフ連鎖モンテカルロ(MCMC)アルゴリズムは統計学、物理学、機械学習などにおいて重要な役割を果たしている。
最も古典的なMCMCアルゴリズムであるランダムウォーク・メトロポリス(RWM)アルゴリズムは、科学と工学の発展と実践に大きな影響を与えた。
本稿では,ダイリクレ形式のモスコ収束を利用して,大グラフ上のRWMアルゴリズムを解析する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:13:04 GMT)
Calibration of ordinal regression networks [1.2] ディープニューラルネットワークは十分に校正されておらず、しばしば自信過剰な予測を生成する。
順序対応キャリブレーションを導入した新しい損失関数を提案する。
ソフトな順序エンコーディングと順序対応の正規化を取り入れ、校正と一様性の両方を強制する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:34:23 GMT)
Guiding Reinforcement Learning Using Uncertainty-Aware Large Language Models [1.2] 大きな言語モデル(LLMs)は、RLサンプルの非効率を軽減し、人間のトレーナーを置き換える可能性のある代替手段を提供する。
LLMアドバイスの信頼性を高めるためにモンテカルロ・ドロップアウトを用いた校正誘導システムにより,この制限に対処する。
また、動的モデル平均エントロピーに基づく新しいRLポリシー形成手法を開発し、ガイダンスの不確実性に応じてLLMがRLポリシーに与える影響を調整する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:00:29 GMT)
Communication Compression for Tensor Parallel LLM Inference [1.2] 大規模言語モデル(LLM)は人工知能のフロンティアを推し進めてきたが、数十億のパラメータと操作で構成されている。
高速な推論レイテンシを実現するため、LLMはさまざまなModel Parallelism戦略を通じて、複数のハードウェアアクセラレータにデプロイされる。
そこで本稿では, 並列化方式について詳細に検討し, 加速器間通信の圧縮による遅延低減を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:47:37 GMT)
Efficient Neural Hybrid System Learning and Transition System Abstraction for Dynamical Systems [1.1] システムダイナミクスを学ぶために、低レベルのモデルが訓練されます。
ハイレベルモデルは、低レベルなニューラルハイブリッドシステムモデルを抽象化するために訓練される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:53:34 GMT)
Causal Time-Series Synchronization for Multi-Dimensional Forecasting [1.1] プロセス産業のDigital Twinsに対する高い期待は、タスクや多様なドメインをまたいで一般化できるモデリングアプローチを必要とする。
提案手法は, (i) データ駆動方式を用いて高度にタグ付けされた因果関係を同定し, (ii) 原因-影響ペアを同期させて, チャネル依存事前学習のためのトレーニングサンプルを生成し, (iii) チャネル依存予測におけるこのアプローチの有効性を評価することに焦点を当てる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:50:57 GMT)
Efficient Depth Estimation for Unstable Stereo Camera Systems on AR Glasses [1.1] コストのかかるボリュームとプリプロセッシングに代わるハードウェアフレンドリーな代替品を開発する。
オンラインステレオ補正(前処理)のために,修正位置符号化(RPE)を用いたホモグラヒマトリクス予測ネットワークを導入する。
最適化されたコストボリュームを含むMultiHeadDepthでは、精度が11.8-30.3%向上し、レイテンシが22.9-25.2%削減された。
最適化前処理(Homograhpy + RPE)を含むHomoDepthは、未修正画像を処理し、エンドツーエンドのレイテンシを44.5%削減する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:43:45 GMT)
Temporal Patterns of Multiple Long-Term Conditions in Individuals with Intellectual Disability Living in Wales: An Unsupervised Clustering Approach to Disease Trajectories [1.1] 男性52.3%、女性47.7%であり、患者1人当たり平均4.5人である。
45歳未満の男性は神経学的条件(32.4%)に支配される単一のクラスターを形成し、45歳未満の男性は3つのクラスターを持ち、最も大きな循環器(51.8%)を特徴付ける。
45歳以下の女性は消化条件(24.6%)を最も多く用い、45歳以上の人は循環器(34.1%)と消化器(25.9%)と筋骨格(21.9%)の2つのクラスターを示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:58:47 GMT)
Multiscale Dubuc: A New Similarity Measure for Time Series [1.0] マルチスケールDubuc距離測度を導入し、それがメートル法であることを証明する。
UCR時系列分類アーカイブから95のデータセットを使用して、MDDのパフォーマンスをEuD、LCSS、DTWと比較する。
我々の実験によると、MDDの全体的な成功はケース固有のカスタマイズなしで、データセットごとのウィンドウサイズを最適化したDTWに匹敵する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:38:18 GMT)
Measuring Butterfly Velocity in the XY Model on Emerging Quantum Computers [1.0] バタフライ速度は、量子力学系の情報伝達特性を理解するために一般的に用いられる。
NISQデバイス上でのバタフライ速度を推定するために,本手法の実証実験を行った。
ここで提示される量子アルゴリズムの手法は、より複雑な格子モデルにおける情報伝達特性を研究するためにより一般的に利用することができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:11:18 GMT)
MicroCrackAttentionNeXt: Advancing Microcrack Detection in Wave Field Analysis Using Deep Neural Networks through Feature Visualization [1.0] 本研究は,マイクロクラック検出のための非対称エンコーダデコーダネットワークであるSpAsE-Netに基づく。
多様体探索解析 (MDA) アルゴリズムを用いて特徴空間の可視化により, 種々の活性化・損失関数の影響を検討した。
最適化されたアーキテクチャとトレーニング手法は86.85%の精度を達成した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:50:01 GMT)
Deep Learning for Micro-Scale Crack Detection on Imbalanced Datasets Using Key Point Localization [1.0] 内部き裂検出は、構造的健康モニタリングに焦点が当てられている。
深層学習(DL)法は, 微小き裂と相互作用する地震波場を効果的に解析できることが実証された。
本研究は, ひび割れの有界領域を定義する4つのキーポイントの座標を予測することにより, ひび割れの局所化を行う, DLベースのキーポイント検出技術の新たな応用を探求する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:50:46 GMT)
Artificial Intelligence in Pediatric Echocardiography: Exploring Challenges, Opportunities, and Clinical Applications with Explainable AI and Federated Learning [1.0] 本研究は,小児心エコー図におけるAIの限界と可能性について概観する。
XAIとFLの相乗的ワークフローと役割を強調し、研究のギャップを特定し、将来の発展を探求する。
XAI と FL の3つの臨床応用例は, (i) 視認, (ii) 疾患分類, (iii) 心臓構造の分節化, (iv) 心臓機能の定量的評価に焦点をあてたものである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:03:34 GMT)
Masked Image Contrastive Learning for Efficient Visual Conceptual Pre-training [1.0] 本論文では、マスク付き画像コントラスト学習(MiCL)と呼ばれる、効率的な視覚概念表現のためのスケーラブルで簡単な事前学習パラダイムを提案する。
私たちのMiCLアプローチは単純で、パッチをランダムにマスクして、画像内のさまざまなビューを生成し、それらを画像のミニバッチ間で対比します。
MiCLは、手作りのデータ拡張や追加の補助モジュールに頼ることなく、高度にセマンティックな概念表現を効率的に学習する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:37:29 GMT)
The Silicon Ceiling: Auditing GPT's Race and Gender Biases in Hiring [0.9] 我々は、一般的に使われている1つの大きな言語モデルにおいて、人種と性別の偏見のAI監査を行う。
モデルがステレオタイプに基づくバイアスを反映していることが分かる。
女性の履歴書には経験の少ない職業があり、アジアやヒスパニックの履歴書には移民のマーカーがあった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:53:18 GMT)
Continual Adversarial Reinforcement Learning (CARL) of False Data Injection detection: forgetting and explainability [0.9] スマートインバータに対する偽データインジェクション攻撃(FDIA)は、再生可能エネルギー生産の増加に関連する懸念が高まっている。
我々は,データに基づくFDIA検出手法が,影響のある,ステルス的な敵の例に対して脆弱であることを示す。
本稿では,CARL(Continuous Adversarial RL)アプローチによるデータに基づく検出訓練に,このような逆例を含めることを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:17:06 GMT)
Post-selection shifts the transition frequency of helium in an atomic beam [0.8] 選択後の効果は、正確な測定に意図しないバイアスをもたらす可能性がある。
ヘリウムの233S-23P$遷移の精密分光におけるポストセレクションの影響について検討した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:26:11 GMT)
Neural-network Generated Quantum State Can Alleviate the Barren Plateau in Variational Quantum Circuits [0.8] ニューラルネットワークを用いて量子状態を生成することで、ランダムな変動量子回路に存在するバレンプラトー現象を効果的に緩和できることがわかった。
特に、ニューラルネットワークを用いて量子状態を生成することで、ランダムな変動量子回路に存在するバレンプラトー現象を効果的に緩和できることがわかった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 01:33:29 GMT)
Hollywood's misrepresentation of death: A comparison of overall and by-gender mortality causes in film and the real world [0.8] 本研究は, 総合的, 男女別死亡率の映画的表現が, 現実とどのように異なるかを検討する。
全体としては、映画は自殺を強く誇張し、少ない段階では事故が起きている。
性別の面では、映画は男性を過度に表現し、女性をほとんどすべての主要な死亡原因とみなす。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:40:18 GMT)
Characterising Determinism in MBQCs involving Pauli Measurements [0.8] 本稿では,測定に基づく量子コンピューティングにおける決定論の新たな特徴付けについて紹介する。
全体的な決定論的計算を行うには、各測定の非決定性のために補正戦略が必要である。
より弱い意味での堅牢な決定論には,パウリ流が実際に必要であることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:51:10 GMT)
Vision Eagle Attention: A New Lens for Advancing Image Classification [0.8] コンボリューショナルな空間的注意力を用いた視覚的特徴抽出を促進する新しい注意機構であるビジョンイーグル注意(Vision Eagle Attention)を導入する。
このモデルは、局所的な空間的特徴を捉えるために畳み込みを適用し、画像の最も情報性の高い領域を選択的に強調するアテンションマップを生成する。
Vision Eagle Attentionを軽量なResNet-18アーキテクチャに統合しました。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:21:59 GMT)
BOP-Distrib: Revisiting 6D Pose Estimation Benchmark for Better Evaluation under Visual Ambiguities [0.7] 6次元ポーズ推定は、カメラの観察を最もよく説明する対象のポーズを決定することを目的としている。
現在、6次元ポーズ推定法は、その基礎となる真理アノテーションに対して、視覚的曖昧性は、グローバルなオブジェクト対称性にのみ関連していると考えるデータセット上でベンチマークされている。
本稿では,画像内の物体表面の視認性を考慮し,各画像に特有の6次元ポーズ分布を付加したデータセットのアノテート手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:35:19 GMT)
A Hard-Label Cryptanalytic Extraction of Non-Fully Connected Deep Neural Networks using Side-Channel Attacks [0.7] ディープニューラルネットワーク(DNN)の知的財産権の保護は依然として問題であり、新たな研究分野である。
最近の研究は、ハードラベル設定における暗号解析手法を用いて、完全に接続されたDNNを抽出することに成功している。
組込みDNNの忠実度の高いモデル抽出を目的とした,新たなエンドツーエンドアタックフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:19:59 GMT)
CNN-Based Classification of Persian Miniature Paintings from Five Renowned Schools [0.7] 畳み込みニューラルネットワーク(CNN)を用いた新しいアプローチを導入し、ペルシアのミニチュアをHerat、Tabriz-e Avval、Shiraz-e Avval、Tabriz-e Dovvom、Qajarの5つの学校から分類する。
平均精度は91%を超える。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:29:57 GMT)
Towards Utilising a Range of Neural Activations for Comprehending Representational Associations [0.7] ディープニューラルネットワークにおける中間表現をラベル付けするアプローチでは,その振る舞いに関する貴重な情報を捕捉できないことを示す。
非極端レベルのアクティベーションには、調査する価値のある複雑な情報が含まれていると仮定する。
そこで本研究では,中間領域のロジットサンプルから得られたデータを用いて,スプリアス相関を緩和する手法を開発した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:54:14 GMT)
Keep it Tighter -- A Story on Analytical Mean Embeddings [0.6] カーネル技術は、データサイエンスにおいて最も人気があり柔軟なアプローチの一つである。
平均埋め込みは、最大平均不一致(MMD)と呼ばれる分岐測度をもたらす。
本稿では,基礎となる分布の1つの平均埋め込みが解析的に利用可能である場合のMDD推定の問題に焦点をあてる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:15:30 GMT)
HMAFlow: Learning More Accurate Optical Flow via Hierarchical Motion Field Alignment [0.6] 本稿では,挑戦シーンにおける光学的フロー推定を改善するために,HMAFlowと呼ばれる新しい手法を提案する。
提案モデルは主に,階層型運動場アライメント(HMA)モジュールと相関自己認識(CSA)モジュールの2つのコアコンポーネントから構成される。
実験により,本モデルが他の最先端手法と比較して最高の一般化性能を達成できることが実証された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:49:30 GMT)
Virtual Reality in Teacher Education: Insights from Pre-Service Teachers in Resource-limited Region [0.6] この研究は、初めてVRに関わったガーナ人の教師36人の経験と振り返りを参考にしている。
参加者は、VRに満足したレッスンが、同期オンライン学習に代わる有望な代替手段だと考えている。
これらの有望な認識にもかかわらず、参加者は、限られたインフラ、信頼性の低いインターネット接続、VR機器へのアクセス不足など、重要な課題を特定した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:39:07 GMT)
Unifying view of fermionic neural network quantum states: From neural network backflow to hidden fermion determinant states [0.6] 我々は、これら全てをNNBFの枠組みでキャストするフェルミオン性神経量子状態の統一的なビューを開発する。
より大きい$r$の波動関数はより大きな空間にまたがり、より単純で直接的なSPOの更新はより表現力があり、よりエネルギッシュなものであることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:08:01 GMT)
Detrimental non-Markovian errors for surface code memory [0.5] 非マルコフ相関誤差の構造とそれらの表面コードメモリ性能への影響について検討する。
解析の結果、時間的相関構造はすべて有害な構造ではないが、特定の構造、特にマルチタイムの「不安定な」相関は、論理的誤り率のスケーリングを著しく低下させることが示唆された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:55:34 GMT)
Efficient Alignment of Large Language Models via Data Sampling [0.5] 本稿では,少数の高品質サブセットを同定し,効率的なアライメントのための情報理論に基づく手法を提案する。
提案手法を用いたモデルでは,他のサンプリング手法よりも優れた性能を示し,全データセットに対応するモデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:36:15 GMT)
G-computation for increasing performances of clinical trials with individual randomization and binary response [0.4] 臨床試験では、ランダムなアロケーションは腕間の予後因子のバランスを目標とし、真の共同設立者を防ぐ。
したがって、特に関連するパワーの増加のため、予後因子の調整が推奨される。
本稿では,機械学習によるG-computationが,サンプルサイズが小さい場合でもランダム化臨床試験に適した方法であると仮定した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:18:38 GMT)
HistoLens: An LLM-Powered Framework for Multi-Layered Analysis of Historical Texts -- A Case Application of Yantie Lun [0.4] HistoLensは、Large Language Models (LLMs)に基づく歴史的テキストのための多層解析フレームワークである。
HistoLensは、名前付きエンティティ認識、知識グラフの構築、地理情報可視化など、NLP技術を統合している。
本稿は,多次元・視覚的・定量的手法を用いて,ヒストレンスが「ヤンティー・ルン」の西漢文化を探索する方法について述べる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:21:13 GMT)
Observation of electric field induced superradiance slowdown in ultracold Rydberg atomic gases [0.4] 電子的に高いライドバーグ状態に励起された原子は自然放出過程を通じて低エネルギー状態に崩壊する。
電界印加時の超放射能の顕著な低下に関する実験的観察を報告する。
数値シミュレーションにより、超放射光デコヒーレンスは、Rydbergレベルのスタークシフトによって引き起こされることを示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:00:25 GMT)
Approximate Probabilistic Inference for Time-Series Data A Robust Latent Gaussian Model With Temporal Awareness [0.4] 本稿では,時間的情報を取得するための確率的生成モデルを提案する。
我々のモデルは、負のログ損失に基づいて損失関数を最小限に抑えるために訓練されている。
実験により、tDLGMは複雑な時系列データを再構成して生成することができ、ノイズや故障データに対して堅牢であることが示された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:17:22 GMT)
Physics-informed neural networks need a physicist to be accurate: the case of mass and heat transport in Fischer-Tropsch catalyst particles [0.4] 物理インフォームドニューラルネットワーク(PINN)は、機械学習の迅速かつ自動化された能力と、理論物理学に根ざしたシミュレーションの精度と信頼性を融合して、影響力のある技術として登場した。
しかし、PINNの広範な採用は信頼性の問題、特に入力パラメータ範囲の極端ではまだ妨げられている。
ドメイン知識に基づくPINNアーキテクチャの変更を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:55:31 GMT)
Floquet Flux Attachment in Cold Atomic Systems [0.4] Floquetフラックスアタッチメントはボソニック整数量子ホール状態を1/4$で安定化する。
また,2乗格子上での光学格子モデルの実装も提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:20:40 GMT)
ActNAS : Generating Efficient YOLO Models using Activation NAS [0.4] 活性化関数はニューラルネットワークに非線形性を導入し、複雑なパターンを学習することを可能にする。
YOLOモデルにおける混合活性化関数の使用効果に関する包括的研究を行う。
本稿では,ニューラルアーキテクチャサーチ(NAS)を用いて,複合アクティベーション関数を最適化したYOLOモデルを設計する手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:18:50 GMT)
Swarm Characteristics Classification Using Neural Networks [0.4] 本稿では、ニューラルネットワーク時系列分類(NN TSC)を用いて、軍事的文脈において自律エージェントをスワーミングする重要な属性と戦術を予測する。
NN TSCは2つのバイナリ属性 – 通信と比例ナビゲーション – を推論するために適用され、相互に排他的な4つのSwarm戦術を定義する。
鍵となる発見は、NNが20ステップの短い観察窓を用いて97%の精度でSwarmの挙動を予測できることを示し、50%のノイズ下で80%の精度で優雅な劣化を示すことである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:31:46 GMT)
Unveiling the Skills and Responsibilities of Serverless Practitioners: An Empirical Investigation [0.3] 本研究は,7カ国の求人広告141件の質的分析を行うことにより,サーバレス実践者の業界要件を特定し,整理することを目的とする。
包括的な役割、責任、スキルを開発し、19の責任をソフトウェア開発、インフラと運用、専門的な開発とリーダーシップ、ソフトウェアビジネスの4つのテーマに分類しました。
28のハードスキルを7つのテーマにマッピングし、32のソフトスキルを8つのテーマにマッピングしました。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:45:04 GMT)
Can Artificial Intelligence Generate Quality Research Topics Reflecting Patient Concerns? [0.3] 革新的自然言語処理(NLP)と人工知能(AI)を活用した自動フレームワークを提案する。
当院における乳がん・皮膚癌患者25,549名を対象に,614,464件の患者メッセージを分析した。
広く使われているAIを用いて、定義された問題を解決するための研究トピックを作成した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:24:38 GMT)
Reliable Interval Estimation for the Fidelity of Entangled States in Scenarios with General Noise [0.3] 絡み合った状態の忠実度推定は、量子ネットワークにおける品質制御とエラー検出に必須の構成要素である。
量子ネットワークは、しばしば異質で相関したノイズに遭遇し、推定された忠実度に過剰な不確実性をもたらす。
本稿では,一般雑音の存在下で有効である忠実度に対する信頼区間を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:44:09 GMT)
"On the goals of linguistic theory": Revisiting Chomskyan theories in the era of AI [0.2] 理論的言語学は、人間の言語とは何か、なぜなのかを説明する。
大きな言語モデルのような人工知能モデルは、印象的な言語能力を持つことが証明されている。
多くの人は、理論言語学が究極的な研究目標に達するのを助けるために、そのようなモデルがどのような役割を果たすべきかを疑問視している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:09:22 GMT)
DYRECT Computed Tomography: DYnamic Reconstruction of Events on a Continuous Timescale [0.2] 時間分解型高分解能X線CT(4D $mu$CT)は、可視光に不透明な材料内部の動的プロセスの進化に関する洞察を提供するイメージング技術である。
従来のトモグラフィー再構成技術は、異なるタイミングでサンプル状態を表す3D画像の連続を記録することに基づいている。
このフレームベースのアプローチは、CTスキャンに必要な時間のために、動的ラジオグラフィー実験と比較して時間分解能を制限する。
DYRECTという名前の4D$mu$CT再構成手法を用いて,試料中の各位置の個々の減衰特性を推定した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:21:46 GMT)
A Hybrid Artificial Intelligence System for Automated EEG Background Analysis and Report Generation [0.2] 本研究では,脳波の背景活動とレポート生成を自動的に解釈する,革新的なハイブリッド人工知能(AI)システムを提案する。
このシステムは、後続支配リズム(PDR)予測のためのディープラーニングモデル、教師なしアーティファクト除去、および異常検出のためのエキスパート設計アルゴリズムを組み合わせる。
このAIシステムは、全般的なバックグラウンドの減速を検知し、焦点異常の検出を改善することで神経学者を著しく上回った。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 01:49:17 GMT)
Modification Takes Courage: Seamless Image Stitching via Reference-Driven Inpainting [0.2] 現在の画像縫合法は、不均一な色相や大きな視差のような挑戦的なシナリオにおいて顕著な縫い目を生み出す。
本稿では, 画像の融合と整形を基準ベースインペイントモデルとして再構成する参照駆動型インペイント・スティッチャ (RDIStitcher) を提案する。
本稿では,Multimodal Large Language Models (MLLM) を用いた画像品質評価手法を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:05:01 GMT)
Debias-CLR: A Contrastive Learning Based Debiasing Method for Algorithmic Fairness in Healthcare Applications [0.2] 異なる治療と戦うために,暗黙の処理内脱バイアス法を提案した。
心不全患者の臨床記録と診断基準,治療報告,生理的活力について検討した。
Debias-CLRは、性別や民族を嫌う場合に、SC-WEAT(Single-Category Word Embedding Association Test)の効果を減少させることができた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:32:01 GMT)
Virtual entanglement purification via noisy entanglement [0.2] 本稿では,期待値のレベルにおいてノイズの多い絡み合いを解消する仮想演算を利用したプロトコルを提案する。
我々のプロトコルは,DQCと絡み合い,回路編み込みのギャップを埋めることによって,ハードウェアの限界がある場合に,さらなるスケーラビリティを実現するための柔軟な方法を提供する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:09:36 GMT)
How quantum computing can enhance biomarker discovery for multi-factorial diseases [0.1] 量子アルゴリズムは、特に機械学習において、バイオマーカー発見における重要な応用にマップされる。
アルゴリズムとアプリケーションに関連する機会と課題について論じる。
オープンな研究課題に関する見通しが提示されている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:50:05 GMT)
Matrix-Valued LogSumExp Approximation for Colour Morphology [0.1] 本稿では,上限と無限の概念に対する新しいアプローチの構築について分析する。
代わりに、最大値のLogExp近似に置き換えます。
さらに、最小性について検討し、我々のアプローチが入力データに継続的に依存していることを保証するために緩和を規定する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:30:24 GMT)
Uncertainty-Weighted Mutual Distillation for Multi-View Fusion [0.1] 本稿では,新しいMV-UWMD法を提案する。
MV-UWMDは既存のマルチビュー学習手法と比較して予測精度と一貫性を向上させる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:45:32 GMT)
Jal Anveshak: Prediction of fishing zones using fine-tuned LlaMa 2 [0.0] Jal AnveshakはDartとFlutterで書かれたアプリケーションフレームワークである。
Llama 2ベースのLarge Language Modelは、漁獲量と可用性に関連する政府の事前処理および強化されたデータに基づいて微調整されている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:05:03 GMT)
Evaluation Framework for Quantum Security Risk Assessment: A Comprehensive Strategy for Quantum-Safe Transition [0.0] 大規模量子コンピューティングの台頭は、従来の暗号セキュリティ対策に重大な脅威をもたらす。
量子攻撃は、現在の非対称暗号アルゴリズムを損なう。
本研究では、量子セーフ暗号状態への移行の課題について検討する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:59:17 GMT)
Zero-shot Voice Conversion with Diffusion Transformers [0.0] ゼロショット音声変換は、参照音声の音色を未知の話者から一致させるために、音源音声の発話を変換することを目的としている。
従来のアプローチでは、音色漏れ、音色表現の不十分、トレーニングと推論のミスマッチに悩まされていた。
トレーニング中に外部の音色シフタを導入することで,これらの問題に対処する新しいフレームワークであるSeed-VCを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:43:44 GMT)
Wigner function under changes of reference frames [0.0] 参照フレームの変化によるウィグナー関数の変換則について検討する。
波動関数の座標変換を用いて、位置と運動量の両方で変換されたウィグナー関数の積分表現を導出する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:30:20 GMT)
Weak Permission is not Well-Founded, Grounded and Stable [0.0] 根底的で(知覚的な)安定なセマンティクスの下でのデオン的対立の存在下では、弱いパーミッションを捕捉することは不可能である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 23:14:30 GMT)
Unlocking multiphoton emission from a single-photon source through mean-field engineering [0.0] 量子力学では、多光子放出は単光子放出よりも基本的で興味深いことが分かる。
量子干渉を乱して2レベル系の多光子力学を制御できることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:59:18 GMT)
Training Deep 3D Convolutional Neural Networks to Extract BSM Physics Parameters Directly from HEP Data: a Proof-of-Concept Study Using Monte Carlo Simulations [0.0] 角分布とキネマティック分布を「準像」に変換する単純だが斬新なデータ表現を提案する。
概念実証として、34層の残留ニューラルネットワークをトレーニングし、これらの画像を回帰させ、Wilson Coefficient $C_9$ in Monte Carlo Simulations of $B0 rightarrow K*0mu+mu-$ decays(英語版)のWilson Coefficient $C_9$に関する情報を決定する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:55:47 GMT)
Towards unearthing neglected climate innovations from scientific literature using Large Language Models [0.0] この研究は、科学論文の包括的リポジトリであるOpenAlexから得られた、キュレートされたデータセットを用いている。
我々は,7次元の科学論文から,気候変動緩和の可能性,技術開発段階,展開準備状況について,題名と肩書きのペアを評価した。
次に、言語モデルのアウトプットを人間の評価と比較し、将来有望だが見落とされた気候のイノベーションを特定する効果を評価する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:17:40 GMT)
Symmetric Clifford twirling for cost-optimal quantum error mitigation in early FTQC regime [0.0] 量子ゲートに影響を及ぼすノイズのツイリングは、エラーの理解と制御に不可欠である。
対称クリフォード・ツワイリング(英: symmetric Clifford twirling)は、あるパウリ部分群と可換な対称クリフォード作用素のみを利用するツワイリングである。
我々は、それぞれのパウリノイズがツイリングを通してどのように変換されるかを完全に特徴付け、あるパウリノイズが、グローバルなホワイトノイズに指数関数的に近いノイズにスクランブル可能であることを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:31:50 GMT)
Super-Heisenberg scaling of the quantum Fisher information using spin-motion states [0.0] トラップイオン系を用いた高精度量子力学のためのスピンモーション状態を提案する。
我々は,アディアバティック進化によってスピンスクイーズ状態が生成され,量子射影ノイズをサブショットノイズ限界まで低減することを示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:33:03 GMT)
Strategic Roadmap for Quantum- Resistant Security: A Framework for Preparing Industries for the Quantum Threat [0.0] 本稿では、量子攻撃によるリスクを予測・緩和する産業の戦略ロードマップを概説する。
構造化されたタイムラインと実行可能なレコメンデーションを提示することにより、このロードマップは、量子コンピューティング時代における潜在的なセキュリティ脅威を保護するための重要な戦略を持つ産業を準備する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 06:59:41 GMT)
Specx: a C++ task-based runtime system for heterogeneous distributed architectures [0.0] Specxは、C++で書かれたタスクベースのランタイムシステムである。
現代のC++で記述されたタスクベースのランタイムシステムであるSpecxを紹介する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:11:43 GMT)
Sim-CLIP: Unsupervised Siamese Adversarial Fine-Tuning for Robust and Semantically-Rich Vision-Language Models [0.0] 広範に使用されているCLIPビジョンエンコーダの敵攻撃に対する堅牢性を向上する,教師なし逆向き微調整手法であるSim-CLIPを提案する。
Sim-CLIPは、コサイン類似性の損失を伴うSiameseアーキテクチャを利用することで、大きなバッチサイズや運動量エンコーダを必要とせずに、意味的に意味があり、攻撃耐性のある視覚表現を学習する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:09:28 GMT)
Reply to the comment on "High-Power Collective Charging of a Solid-State Quantum Battery" by Haowei Xu and Ju Li [0.0] 我々は、Dicke量子電池(Phys. Lett. 120, 117702)に関する最初の研究について、XuとLi(arXiv:2411.04132)のコメントに返信する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:53:53 GMT)
Quantum similarity learning for anomaly detection [0.0] 類似性学習による異常検出のための量子コンピュータの可能性を探る。
ノイズの多い中間スケール量子デバイスでは、重スカラー共鳴を探索するために、ハイブリッド古典量子ネットワークを用いる。
本分析では,LHCデータ解析における量子アルゴリズムの適用性を強調し,フォールトトレラントな量子コンピュータの出現により改善が期待できる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:55:09 GMT)
Quantum Computing for Energy Management: A Semi Non-Technical Guide for Practitioners [0.0] 量子コンピューティングは、ハードウェアとソフトウェアの両方レベルでの情報処理の新たなパラダイムである。
この章では、エネルギー管理アプリケーションに量子コンピューティングを使用する機会と課題について論じる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:23:40 GMT)
Quadratic versus Polynomial Unconstrained Binary Models for Quantum Optimization illustrated on Railway Timetabling [0.0] 本稿では,任意の問題をpolynomial Unconstrained Binary Optimization (PUBO)問題に再構成する汎用手法を提案する。
また、擬似非拘束バイナリ最適化(QUBO)問題への総合的な再構成も提供する。
この結果から,PUBOの改定がQUBOよりも優れていることが示唆された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:23:52 GMT)
QuST: QuPath Extension for Integrative Whole Slide Image and Spatial Transcriptomics Analysis [0.0] デジタル病理学におけるAIの統合は、病気の理解を深める大きな可能性を秘めている。
本稿では,WSIとSTのギャップを埋めるツールQuSTを紹介する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:50:55 GMT)
Proposal of a quantum version of active particles via a nonunitary quantum walk [0.0] 量子能動物質の最小モデルとして非単位量子ウォークを用いた真決定論的量子能動粒子モデルを提案する。
我々は,1次元のピークの弾道伝播,2次元の定エネルギー平面に留まる歩行,および1次元と2次元の基底状態と励起状態の間の共鳴遷移に由来する振動の3つの特徴を観察した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:17:49 GMT)
Probing the fluctuating magnetic field of Fe-triazole spin-crossover thin-layers with nitrogen-vacancy centers in diamond [0.0] SCO錯体は温度変化に応じて磁気特性を変化させる材料である。
窒素空孔(NV)センターは空間分解能が高く磁場感度が高い室温で動作することができる。
その結果, この錯体は20degCから80degCの範囲で常磁性であることが判明した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:37:40 GMT)
Probing the Quantum and Classical Boundary: A Tabletop Experiment Using Quantum Optics [0.0] 本稿では,波動関数が崩壊する境界を求めるための簡易かつ効果的な実験を提案する。
光増倍管 (PMT) と相互作用する量子光学系を用いて、「全経路」情報に干渉して量子状態が崩壊するために必要な電子数を決定することができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:46:14 GMT)
Pragmatic information of aesthetic appraisal [0.0] このモデルは、西洋の声調音楽におけるリズム効果の実験的研究において、審美的快楽評価と質的に相関する。
関連する計算と神経力学について論じる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:15:15 GMT)
Parametrically controlled chiral interface for superconducting quantum devices [0.0] 非相互マイクロ波ルーティングは、量子回路を測定する上で重要な役割を果たす。
フェライト系循環器は、過剰な損失、大きなフットプリント、固定方向性に悩まされる。
本稿では,最小限制御可能な指向性インタフェースの設計と実験的実現について報告する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 05:37:27 GMT)
Oxidation Kinetics of Superconducting Niobium and a-Tantalum in Atmosphere at Short and Intermediate Time Scales [0.0] 超伝導薄膜の表面酸化物中の2レベル系(TLS)は、量子回路におけるデコヒーレンスの主要な原因である。
我々は,ニオブおよびタンタル表面の大気酸化特性を,製造に関連する時間スケールで解析した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:28:54 GMT)
Outliers resistant image classification by anomaly detection [0.0] 本研究では,分類と異常検出を同時に行うモデルを提案する。
距離学習を用いて多次元空間における画像のベクトル表現を生成し、次にクロスエントロピーを用いた分類を行う。
様々なコンピュータビジョンモデルアーキテクチャを用いて実験を行った。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:43:38 GMT)
On the fermionic van der Waals and Casimir-Polder interactions [0.0] ファンデルワールスとカシミール・ポルダー相互作用のフェルミオンバージョンを定式化し、それらの性質について研究する。
どちらの場合も、我々が導入する系は、真空のディラック場と結合した2レベル系の局所化原子を含む。
このディラック場はファン・デル・ワールスの場合の電磁場に似た役割を果たす。
この文脈において、ディラック体に対するバッグモデル条件は、カシミール・ポルダー効果における「鏡」の類似として機能する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:54:43 GMT)
Omnichain Web: The Universal Framework for Streamlined Chain Abstraction and Cross-Layer Interaction [0.0] Omnichain Webは、コアコンポーネントを通じて分散ネットワークを統合するための包括的なフレームワークを導入している。
このエコシステムは、シームレスなクロスチェーンアセットの解決、相互運用性、ユーザフレンドリな分散アプリケーション(dApp)開発を可能にします。
高度なゼロ知識証明システムとAIエージェントとの互換性を統合することで、Omnichain Webは意図駆動と自律的な機能を強化する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:06:00 GMT)
Non-invertible duality and symmetry topological order of one-dimensional lattice models with spatially modulated symmetry [0.0] N$状態クロックモデルの自己双対対称性と空間変調対称性の相互作用について検討する。
空間変調対称性が非自明なままであるとき、双対性は非可逆である。
以上の結果から,空間変調対称性と高次元の紫外/赤外混合の関係について考察した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:30:13 GMT)
Nitrogen vacancy center in diamond-based Faraday magnetometer [0.0] 窒素空孔中心のアンサンブルとファラデー効果を用いた新しい磁気センサを開発した。
磁気センサの感度は300nT/sqrtHz$です。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:56:34 GMT)
Neural Port-Hamiltonian Models for Nonlinear Distributed Control: An Unconstrained Parametrization Approach [0.0] ニューラルネットワーク(NN)は、優れたパフォーマンスをもたらす制御ポリシのパラメータ化に利用することができる。
NNの小さな入力変更に対する感度は、クローズドループシステムの不安定化のリスクを引き起こす。
これらの問題に対処するために、ポート・ハミルトンシステムのフレームワークを活用して、連続時間分散制御ポリシーを設計する。
提案する分散コントローラの有効性は,非ホロノミック移動ロボットのコンセンサス制御によって実証される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:44:29 GMT)
Monitoring Human Dependence On AI Systems With Reliance Drills [0.0] 人間は、自分自身でより良い決断を下すであろうとしても、AIが生み出すアドバイスに過信している。
本稿では,AIによるアドバイスにおいて,人間が誤りを認識できるかどうかを判定する演習を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:13:32 GMT)
Mitigating Gradient Overlap in Deep Residual Networks with Gradient Normalization for Improved Non-Convex Optimization [0.0] ディープラーニングにおいて、Residual Networks(ResNets)は、消滅する問題に対処する上で有効であることが証明されている。
ResNetのスキップ接続はオーバーラップし、学習した変換とスキップ接続がグラデーションで結合される。
重なりを管理する手法としてZ-score Normalization (ZNorm) を検討した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:32:50 GMT)
Measurement and feed-forward correction of the fast phase noise of lasers [0.0] レーザの高速, サブミクロ秒, 位相変動を検出し, 補正する完全繊維化装置を提案する。
これらの測定と補正技術は、原子や分子の励起電子状態の高忠実度操作のための重要なツールである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:57:13 GMT)
Machine Learning Algorithms to Assess Site Closure Time Frames for Soil and Groundwater Contamination [0.0] この研究は、長期環境モニタリング用に設計されたPythonパッケージであるPyLEnMの機能を拡張する。
我々は,Sr-90やI-129のような汚染物質が規制基準に達するのに必要な時間枠を推定する手法を導入する。
本手法は,Savannah River Site (SRS) F-Areaから得られたデータを用いて検討した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:21:32 GMT)
MOT\_FCG++: Enhanced Representation of Motion and Appearance Features [0.0] クラスタリングアソシエーション法MOT_FCGを改良した外観・空間特徴表現のための新しい手法を提案する。
空間運動の特徴として,物体の位置と形状の関係をより正確に表現した対角変調GIoUを提案する。
外観特徴に対して、信頼情報を含む動的外観表現を用い、軌道の外観特徴をより堅牢でグローバルにすることができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:17:05 GMT)
Local Clustering Decoder: a fast and adaptive hardware decoder for the surface code [0.0] 本稿では,リアルタイムデコードシステムの精度と速度要件を同時に達成するソリューションとしてローカルクラスタリングデコーダを紹介する。
我々のデコーダはFPGA上に実装され、ハードウェア並列性を利用して、最速のキュービットタイプにペースを保ちます。
通常の非適応復号法と比較して4倍少ない物理量子ビットを持つ100万個の誤りのない量子演算を可能にする。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:43:59 GMT)
LoRA-LiteE: A Computationally Efficient Framework for Chatbot Preference-Tuning [0.0] 本研究は,LoRA-Lite Ensemble(LoRA-LiteE)を紹介する。LoRA(Supervised Finetuning)とLoRA(Lo-Rank Learning)を組み合わせた革新的なフレームワークである。
実験により,提案したLoRA-LiteEモデルが未調整のGPT-4に匹敵する性能を示し,資源制約下での大規模モデルよりも優れた性能を示した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:57:13 GMT)
KPC-cF: Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering [0.0] 本研究は,韓国語などの低リソース言語におけるABSAの直感的で効果的な枠組みを提案する。
翻訳されたベンチマークと未ラベルの韓国データを統合することで、予測ラベルを最適化する。
英語のABSAと比較すると,F1スコアと精度に約3%の差が認められた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:59:10 GMT)
KAT to KANs: A Review of Kolmogorov-Arnold Networks and the Neural Leap Forward [0.0] Kolmogorov-Arnold Networksは次元の呪いの影響を受けないとして注目を集めている。
本稿では,コルモゴロフ・アルノルド表現定理と,コルモゴロフ・アルノルドネットワークの基礎となる数学的原理について考察する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 23:02:26 GMT)
JRadiEvo: A Japanese Radiology Report Generation Model Enhanced by Evolutionary Optimization of Model Merging [0.0] 我々は、公開データから50の翻訳サンプルのみを用いて、X線画像から正確な日本語レポートを生成するモデルを作成する。
80億のパラメータしか持たないこの比較的コンパクトな基礎モデルは、病院内でローカルに展開できる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 04:16:50 GMT)
Influence of Skill and Knowledge of Programmers on Program Behavior Visualization by CS Unplugged [0.0] コンピュータサイエンス・アンプラグド(コンピュータサイエンス・アンプラグド、CS unplugged)は、コンピュータサイエンスとコンピュータ思考を教える方法である。
CSは,プログラムの動作を可視化する新しい手法を提案し,プログラムの理解テストに基づいて評価した。
本研究は, 因子と試験結果の関係を解析した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:10:48 GMT)
Influence of Depth Camera Noise Models on Respiration Estimation [0.0] 本研究は,3次元レンダリングシミュレーションパイプラインの最初の成果であり,実測,深度カメラによる呼吸信号を生成するために,異なるノイズモデルに焦点を当てた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:50:31 GMT)
Infinite series involving special functions obtained using simple one-dimensional quantum mechanical problems [0.0] 一般化された超幾何関数、関連するラゲール関数、ベッセル関数、ストルーブ関数などの特殊関数を含む無限和のある種のクラスを解析的に評価する。
この計算は、単純な量子力学モデルに適用された基本的な量子力学原理に基づいている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:51:36 GMT)
Implementation of scalable suspended superinductors [0.0] 本稿では,超伝導回路を吊り下げ型スーパーインダクタで構築する枠組みを提案する。
ジョセフソン接合の懸濁配列を持つ共振器と量子ビットの両方を特徴付ける。
このプロセスは他のタイプのスーパーインダクタや回路設計と広く互換性がある。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:02:48 GMT)
Impact of micromotion on the excitation of Rydberg states of ions in a Paul trap [0.0] 我々は,Floquet理論を用いて数値解法し,摂動的アプローチを用いて解析的に解法する単一トラップリドベルクイオンを記述するモデルを開発した。
我々は,どのパラメータ規則に対処可能で,エネルギ的に孤立したRydberg線が持続するかを解析し,コヒーレントな操作を行う上で重要な要件である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:57:33 GMT)
How contextuality and antidistinguishability are related [0.0] 文脈性は古典的な現象から量子を分離する鍵となる特徴である。
状態の集合が文脈性を示すことができるかどうかを決定する形式主義は存在しない。
状態の集合における文脈性の度合いは、その反識別可能性のレベルと直接関係があることが示される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:40:25 GMT)
Harnessing Machine Learning for Single-Shot Measurement of Free Electron Laser Pulse Power [0.0] 我々は,電子束の時間的パワープロファイルを予測する機械学習モデルを開発した。
このモデルは統計的に検証され、最先端のバッチキャリブレーションよりも優れた予測が得られた。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:38:17 GMT)
Grover Speedup from Many Forms of the Zeno Effect [0.0] 我々は、他のゼノ効果の現示が、物理的に現実的なモデルにおいて最適なスピードアップをサポートすることを示す。
我々はこれらのアルゴリズムを3つのファミリーに分類し、スピードアップがどのように得られるかの構造化された理解を容易にする。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:55:52 GMT)
Graph Neural Networks and Differential Equations: A hybrid approach for data assimilation of fluid flows [0.0] 本研究では,グラフニューラルネットワーク(GNN)とReynolds-Averaged Navier Stokes(RANS)方程式を組み合わせた新しいハイブリッド手法を提案する。
その結果, 純粋なデータ駆動モデルと比較して, 再構成平均流の精度は著しく向上した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:09:33 GMT)
Geometry of orofacial neuromuscular signals: speech articulation decoding using surface electromyography [0.0] 何百万人もの個人が、神経筋疾患、脳卒中、外傷、頭頸部がん手術により、知能的に話す能力を失っている。
非侵襲的表面筋電図(sEMG)は、これらの個人における音声出力の回復を約束している。
目標は、音声を静かに生成するときに複数の音場からsEMG信号を収集し、その信号をデコードして、流動的で自然なコミュニケーションを可能にすることである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 02:33:29 GMT)
Generative AI in Multimodal User Interfaces: Trends, Challenges, and Cross-Platform Adaptability [0.0] ジェネレーティブAIは、ユーザーインターフェイスを再構築する上で重要なドライバとして登場します。
本稿では,現代ユーザインタフェースにおける生成AIの統合について考察する。
マルチモーダルインタラクション、クロスプラットフォーム適応性、動的パーソナライゼーションに焦点を当てている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:49:58 GMT)
Generation of synthetic gait data: application to multiple sclerosis patients' gait patterns [0.0] 多発性硬化症(Multiple sclerosis, MS)は、若年者における非外傷性障害の主要な原因であり、その頻度は世界中で増加している。
MSにおける歩行障害の変動は、定量的歩行評価のための非侵襲的で敏感で費用対効果の高いツールの開発を必要とする。
eGait運動センサは、股関節回転を表す単位四元数時系列(QTS)を通して人間の歩行を特徴付けるように設計されており、有望なアプローチである。
しかし、臨床研究に典型的な小さなサンプルサイズは、歩行データ解析ツールの安定性に課題をもたらす。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:32:01 GMT)
Generating Energy-efficient code with LLMs [0.0] 生成したコードのエネルギー消費に対する即時修正の影響を考察する。
使用されている言語モデルは、CodeLlama-70b、CodeLlama-70b-Python、DeepSeek-Coder-33b-base、DeepSeek-Coder-33b-instructである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:45:58 GMT)
Fill in the blanks: Rethinking Interpretability in vision [0.0] 我々は、新しい視点から視覚モデルの説明可能性を再考し、トレーニング中にモデルが学習した一般的な入力構造を探索する。
標準的なビジョンデータセットと事前トレーニングされたモデルの実験は、一貫性のあるパターンを明らかにし、追加のモデルに依存しない説明可能性ツールとして解釈できる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:31:06 GMT)
FedCL-Ensemble Learning: A Framework of Federated Continual Learning with Ensemble Transfer Learning Enhanced for Alzheimer's MRI Classifications while Preserving Privacy [0.0] 本研究は,ResNet,ImageNet,VNetなどの伝達学習モデルを用いて,医用画像データから高次特徴を抽出する。
提案モデルは, 患者データを共有することなく, フェデレーション学習を用いて構築された。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:49:22 GMT)
Feature Extraction Reimagined: Achieving Superior Accuracy in Camera Calibration [0.0] 本稿では,キャリブレーションにおける重要なステップである特徴抽出の精度向上に焦点を当てた。
パターン中心の異なる角度の複数のチェッカーボードパターンを合成する新しい動的キャリブレーションターゲットを提案する。
また、デフォーカス効果を考慮し、より物理的に現実的なモデルを提供する特徴改善の新たなコスト関数を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 03:07:13 GMT)
Exploring the Future Metaverse: Research Models for User Experience, Business Readiness, and National Competitiveness [0.0] 本研究は,バーチャルリアリティ(VR),拡張現実(AR),MR(Mixed Reality)技術によって総合的に実現された,社会技術的想像のメタバースについて検討した。
我々は3つの研究モデルを開発し、情報技術の社会技術的未来としてメタバースを調べる研究者を導くことができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:27:09 GMT)
Exploring Topological Boundary Effects through Quantum Trajectories in Dissipative SSH Models [0.0] Su-Schrieffer-Heegerモデル(SSH)のトポロジカルな性質を量子軌道法を用いて解析する。
本研究は, トポロジカルエッジ状態の保存と分解について検討し, 特に対称性保存と対称性破壊の散逸の影響に着目した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:51:42 GMT)
Evaluating the role of `Constitutions' for learning from AI feedback [0.0] コンスティチューションの選択がフィードバック品質にどのように影響するかを, 4つの異なるコンスティチューションを用いて検討する。
詳細な構成が、動機的品質に関するより良い結果をもたらすことがわかった。
しかし、情報収集・提供に関する実践的指向のスキルを習得する上で、どの憲法も基準を上回りませんでした。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:16:11 GMT)
Entropy and type-token ratio in gigaword corpora [0.0] 本研究では,英語,スペイン語,トルコ語の6つの大規模言語データセットにおいて,語彙の多様性を示す2つの指標であるエントロピーとテキストトケン比について検討した。
コーパスを横切るエントロピーとテキスト-トケン比の関数的関係が検討されている。
この結果は,テキスト構造の理論的理解に寄与し,自然言語処理などの分野に実践的な意味を与える。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:40:59 GMT)
Entangling color centers via magnon-antimagnon pair creation [0.0] 空間的に分離された一対のカラーセンター間の絡み合いは、非平衡磁気環境と弱い相互作用をさせることによって生成される。
これらの量子揺らぎは、非局所散逸を通して2つの双極子結合色中心に定常な絡み合いを印加することを示す。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 01:04:31 GMT)
Entanglement entropy dynamics of non-Gaussian states in free boson systems: random sampling approach [0.0] 単純なランダムサンプリング法により、永久的な計算コストを削減できることを数値的に示す。
計算コストはまだ指数関数的であるが、この改良により、フリーボソン系のエントロピー力学を100ドル以上で得ることができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 10:04:42 GMT)
Entanglement asymmetry in CFT with boundary symmetry breaking [0.0] 半無限バルク境界への対称性破れから生じるサブシステム$A$の非対称性について検討する。
ツイスト場の形式性を利用することで、非対称性に対する普遍的な表現を導出する。
本研究の正確な分析結果は,Isingモデルと3状態ポッツモデルにおける数値シミュレーションによって検証される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:56:03 GMT)
Energy-GNoME: A Living Database of Selected Materials for Energy Applications [0.0] 最近のGNoMEプロトコルは、380,000以上の新しい安定結晶を識別している。
我々はエネルギー-GNoMEデータベースを構成するエネルギー材料として33,000以上の物質を潜在的に同定する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 11:48:14 GMT)
Encodings of the weighted MAX k-CUT on qubit systems [0.0] 本稿では,重み付きMAX k-CUT問題の量子ビットシステム上での符号化法について検討する。
各種符号化方式について検討し,これらの手法の有効性について検討する。
重み付きおよび非重み付きグラフインスタンスの数値シミュレーションは、これらの符号化方式の有効性を実証する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:19:27 GMT)
Emotion Detection in Reddit: Comparative Study of Machine Learning and Deep Learning Techniques [0.0] 本研究は,GoEmotionsデータセットを利用したテキストによる感情検出に焦点を当てた。
このタスクには、6つの機械学習モデル、3つのアンサンブルモデル、Long Short-Term Memory(LSTM)モデルなど、さまざまなモデルを使用しました。
結果は、Stacking分類器が他のモデルよりも精度と性能が優れていることを示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:28:25 GMT)
Efficient Quantum Circuits based on the Quantum Natural Gradient [0.0] 任意の絡み合った量子状態の効率的な準備は、量子計算に不可欠である。
対称保存型量子近似最適化(SCom-QAOA)回路を提案する。
提案手法は、変分量子アルゴリズムで利用できる初期状態の集合を拡大し、量子シミュレータにおける非平衡現象の研究範囲を広げる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:21:32 GMT)
Dynamics of Quantum Correlations and Entanglement Generation in Electron-Molecule Inelastic Scattering [0.0] 核動力学を含む粒子-分子散乱の力学と過程を記述し、解析する。
研究の主なプロセスは、標的分子の解離を引き起こす非弾性過程である原子間電子捕獲(ICEC)である。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:08:05 GMT)
Dual axis atomic magnetometer and gyroscope enabled by nuclear spin perturbation [0.0] 本研究では,1つの希ガス種とアルカリ種とのコマグネトメトリー法を提案する。
自己補償を用いたよく知られた装置と似ているが、我々は高貴なガスを制御できる磁気パルスを導入する。
これらの応用パルスは、磁気ノイズの影響を単に抑制するのではなく、我々のスキームを計測することができる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 00:44:44 GMT)
Distribution Function for $n \ge g$ Quantum Particles [0.0] ボース・アインシュタイン凝縮(BEC)を予防する$nI(varepsilon)$の異常挙動
識別可能かつ識別不能な粒子とエネルギーレベルの両方に対して、徹底的な分類スキームが提示される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 01:53:48 GMT)
Dichroic cavity mode splitting and lifetimes from interactions with a ferromagnetic metal [0.0] 時間反転対称性の破れがキャビティモードの双対応答に繋がることを示す。
1つの偏極しか持たないモードの寿命の短縮は、円偏極キャビティの工学と制御に使用できる可能性がある。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 20:30:35 GMT)
DeepMedcast: A Deep Learning Method for Generating Intermediate Weather Forecasts among Multiple NWP Models [0.0] 我々は2つ以上のNWP出力間で中間予測を生成するディープラーニング手法であるDeepMedcastを紹介した。
アンサンブル平均値とは異なり、DeepMedcastは気象分野を歪ませることなく一貫した説明可能なメドキャストを提供することができる。
本稿では、DeepMedcastの方法論とケーススタディを詳述し、その利点と運用予測への潜在的貢献について議論する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 07:42:16 GMT)
Cryptographic tests of the python's lunch conjecture [0.0] 我々は、ピソンのランチ(PL)予想が境界CFTの相関に影響を及ぼすと主張している。
本稿では,AdS$_2+1$の欠陥幾何,BTZブラックホール,静的終末(ETW)ブレーンを持つ幾何などをさらに研究する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:01:25 GMT)
Coniferest: a complete active anomaly detection framework [0.0] coniferestはPythonで書かれたオープンソースの汎用アクティブな異常検出フレームワークである。
Active Anomaly Discovery (AAD)とPineforestアルゴリズムは、アクティブな異常検出問題に対処するために利用できる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:02:00 GMT)
Comparing Bills of Materials [0.0] 材料請求書(BOM)は、サプライチェーンリスクを管理するための有効なツールとして急速に成長している。
本稿では,BOMの比較に関するいくつかの課題について述べる。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 17:47:22 GMT)
Comparative Analysis of Machine Learning Approaches for Bone Age Assessment: A Comprehensive Study on Three Distinct Models [0.0] 骨年齢予測の自動化に最も広く用いられている3つのモデルを解析した。
3つのモデル、Xception、VGG、CNNモデルは、正確性やその他の関連する要因についてテストされている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 16:45:08 GMT)
Catalog of General Ethical Requirements for AI Certification [0.0] 我々は、これらの原則を技術に実装するためのツールに対して、全体的な倫理的要件と6つの倫理的原則を価値特有な推奨とともに提示する。
私たちの仕事は、信頼できるAIとAI認定のための最小限の倫理的要件を満たすための、潜在的な青写真として、利害関係者を対象としています。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 08:57:14 GMT)
Bayesian and frequentist estimators for the transition frequency of a driven two-level quantum system [0.0] 我々は、未知の遷移周波数を推定するためにベイズ的および頻繁なアプローチの両方を用いる。
頻繁なアプローチでは、古典的なフィッシャー情報と量子フィッシャー情報との距離を減らすことは、必ずしもデータの関数としての推定器が望ましい精度で推定することを意味するとは限らない。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:58:52 GMT)
Automated Segmentation of Ischemic Stroke Lesions in Non-Contrast Computed Tomography Images for Enhanced Treatment and Prognosis [0.0] NCCTにおける虚血性脳梗塞領域の自動抽出法について, nnU-Net フレームワークを用いて検討した。
我々はサンプルデータセットでDiceスコア0.596とIntersection over Union (IoU)スコア0.501を達成した。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 09:52:20 GMT)
Arithmetical Binary Decision Tree Traversals [0.0] 本稿では,新しい表現行列を利用して二分木構造を平坦化する二分木トラバーサルアルゴリズムを提案する。
当社のアプローチは、内部製品検索の最大化に基礎を置いており、意思決定ツリーに関する新たな洞察を与えています。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:29:07 GMT)
Anderson localization induced by structural disorder [0.0] 構造障害の強度が円滑に増加するとアンダーソン局在化遷移が生じることを示す。
本研究は, 物質波の破壊干渉が輸送を阻害し, 金属相と局所相の遷移を引き起こす, 構造的に乱れた格子モデルの新たなクラスを同定する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:58:10 GMT)
An exploration of the effect of quantisation on energy consumption and inference time of StarCoder2 [0.0] 本研究では,Large Language Models (LLMs) 推論におけるエネルギー消費を削減するための量子化とプルーニング戦略について検討する。
我々は,低スループットとある程度の精度の損失により,量子化によるエネルギー需要の増加を観察する。
精度の低下を最小限に抑えて効率を向上させるため,ハードウェア最適化量子化に関する今後の研究を提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 21:28:19 GMT)
An Ontology-based Approach Towards Traceable Behavior Specifications in Automated Driving [0.0] 本稿では,自動走行システム搭載車両の動作を特定する手法として,セマンティックノーム行動解析を提案する。
対象とする運用環境の特定行動を形式的に表現し、特定行動とステークホルダーのニーズの間のトレーサビリティを確立するために使用します。
評価の結果,行動仕様における仮定の明示的な文書化は,仕様の不備の特定と治療の両立を支えていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:09:05 GMT)
An Effective Framework to Help Large Language Models Handle Numeric-involved Long-context Tasks [0.0] 大きな言語モデル(LLM)は、長いテキストを扱う際、顕著な能力を示した。
長文の数値計算では,その性能は著しく低下する。
本稿では,数値型長文タスクを4つの低レベルサブタスクに分解するワークフローを提案する。
2つの数値付き長期コンテキストベンチマークの結果は、ワークフローが精度を向上できるだけでなく、API呼び出しのコストを大幅に削減できることを示している。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 12:39:02 GMT)
Advancing Autonomous Driving Perception: Analysis of Sensor Fusion and Computer Vision Techniques [0.0] このプロジェクトは、自動運転ロボットの理解とナビゲーション能力の向上に焦点を当てている。
既存の検出と追跡アルゴリズムを用いて、未知のマップ2Dマップへのより良いナビゲーションを実現する方法について検討する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:11:58 GMT)
AI Safety Frameworks Should Include Procedures for Model Access Decisions [0.0] ダウンストリームのユースケース、メリット、リスクは、モデルにどのようなアクセスが提供されるかに大きく依存します。
既存の安全フレームワークとAI開発者利用ポリシーは、与えられたモデルによって引き起こされるリスクが、与えられたオーディエンスに提供するアクセスのレベルに依存することを認識している。
本稿では、モデルアクセスに関する決定を行うための透明な手順を概説することにより、フロンティアAI企業が既存の安全フレームワークの上に構築することを提案する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 19:44:59 GMT)
A novel scheme for modelling dissipation or thermalization in open quantum systems [0.0] オープン量子系における散逸(利得)と熱化の新たな手法を提案する。
本手法の効率性と意義を実証するために, ユビキタスなオープン量子システムに適用する。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 15:52:40 GMT)
A logic for reasoning with inconsistent knowledge -- A reformulation using nowadays terminology (2024) [0.0] 本稿では,不整合知識を用いた推論の論理について述べる。
信頼関係は、相容れない仮定を選択するために用いられる。
矛盾が導出されない限り、その知識は一貫していると仮定される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 13:53:05 GMT)
A coupling prescription for post-Newtonian corrections in Quantum Mechanics [0.0] 我々は、任意の重力背景上のシュリンガー方程式にニュートン後の補正を表現するための共変フレームワークを開発する。
これらの結果は複素クライン-ゴルドン・ラグランジアンの1/c2$展開から得られることを示す。
関連するシュル・オーディンガー方程式は、新規で潜在的に測定可能な効果を捉えている。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 18:49:08 GMT)
A Survey on State-of-the-art Deep Learning Applications and Challenges [0.0] ディープラーニングモデルの構築は、アルゴリズムの複雑さと現実世界の問題の動的な性質のため、難しい。
本研究の目的は,コンピュータビジョン,自然言語処理,時系列解析,広範コンピューティングにおける最先端のディープラーニングモデルを網羅的にレビューすることである。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 14:30:43 GMT)
A Random-Key Optimizer for Combinatorial Optimization [0.0] Random-Key Hubs (RKO) は最適化問題に適した汎用的で効率的な局所探索手法である。
ランダムキーの概念を用いて、RKOは解をランダムキーのベクトルとしてエンコードし、後に問題固有のデコーダを介して実現可能な解へとデコードする。
RKOフレームワークは古典的メタヒューリスティクスの多元体を組み合わせ、それぞれが独立して、あるいは並列に動作可能であり、エリートソリューションプールを通じてソリューション共有が促進される。
論文参考訳(メタデータ) (Fri, 15 Nov 2024 22:04:15 GMT)