DeepSeek-V3 Technical Report [147.2] We present DeepSeek-V3, a strong Mixture-of-Experts (MoE) language model with 671B total parameters with 37B activated for each token。
我々は14.8兆の多様性と高品質のトークンでDeepSeek-V3を事前訓練し、その後にSupervised Fine-Tuning and Reinforcement Learningのステージを受講した。
包括的な評価によると、DeepSeek-V3は他のオープンソースモデルよりも優れており、主要なクローズドソースモデルに匹敵するパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:03:16 GMT)
Aurora-M: Open Source Continual Pre-training for Multilingual Language and Code [123.7] 本稿では,英語,フィンランド語,ヒンディー語,日本語,ベトナム語,コードに基づく15Bパラメータの多言語オープンソースモデルであるAurora-Mを提案する。
これは、人間がレビューした安全命令を微調整した初めてのオープンソース多言語モデルである。
我々はAurora-Mを幅広いタスクや言語で評価し、破滅的な忘れ物に対する頑健さを示した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:53:21 GMT)
Generative Video Propagation [87.2] 我々のフレームワークであるGenPropは、オリジナルビデオを選択コンテンツエンコーダでエンコードし、画像から映像への生成モデルを用いて第1フレームに変更を伝達する。
実験結果は,様々なビデオタスクにおいて,我々のモデルが先行する性能を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:42:29 GMT)
MERT: Acoustic Music Understanding Model with Large-Scale Self-supervised Training [74.3] 本稿では,MLMスタイルの音響事前学習において,教師モデルと擬似ラベルを組み込んだ大規模自己教師型学習(MERT)を用いた音響音楽理解モデルを提案する。
実験結果から,本モデルでは14曲の楽曲理解タスクを一般化し,性能を向上し,SOTA(State-of-the-art)全体のスコアを達成できることが示唆された。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 12:28:34 GMT)
Preemptive Detection and Correction of Misaligned Actions in LLM Agents [70.5] InferActは、実行前に不整合アクションを検出する新しいアプローチである。
タイムリーな修正をユーザーに警告し、有害な結果を防ぐ。
InferActは、ミスアライメントされたアクション検出におけるベースラインに対するMarco-F1の最大20%の改善を実現している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:17:05 GMT)
Cracking the Code of Hallucination in LVLMs with Vision-aware Head Divergence [69.9] 大型視覚言語モデル(LVLM)における幻覚を駆動する内部メカニズムについて検討する。
本稿では,視覚的コンテキストに対する注目ヘッド出力の感度を定量化する指標として,視覚認識型頭部偏差(VHD)を紹介する。
視覚認識型頭部強化(VHR)は,視覚認識型頭部機能を高めることで幻覚を緩和するための訓練不要なアプローチである。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:00:19 GMT)
ReNeg: Learning Negative Embedding with Reward Guidance [69.8] テキスト・ツー・イメージ(T2I)生成アプリケーションでは、負の埋め込みは生成品質を向上させるための単純で効果的なアプローチであることが証明されている。
Rewardモデルにより導かれる改良された負の埋め込みを学習するために設計されたエンドツーエンドの手法であるReNegを紹介する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:31:55 GMT)
Non-separable Spatio-temporal Graph Kernels via SPDEs [69.5] 原則付き時間モデリングのための正当化されたグラフカーネルの欠如は、グラフ問題における彼らの使用を妨げてきた。
偏微分方程式(SPDE)とオンセパ時間グラフのリンクを利用し、SPDEを介してグラフカーネルを導出するフレームワークを導入する。
グラフ上でのGPモデリングのための新しいツールを提供することで、既存のグラフカーネルを実世界のアプリケーションで上回っていることを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:08:01 GMT)
Asymmetrical Reciprocity-based Federated Learning for Resolving Disparities in Medical Diagnosis [68.1] 地理的な健康格差は、特に低所得国と中所得国の未保存地域において、世界的課題となっている。
我々は、地理的な健康格差を緩和し、未保存地域の診断能力を増強することを目的とした、新しいクロスサイロ・フェデレーション学習フレームワークであるFedHelpを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:59:58 GMT)
SUMI-IFL: An Information-Theoretic Framework for Image Forgery Localization with Sufficiency and Minimality Constraints [66.9] イメージフォージェリーローカライゼーション (IFL) は, 改ざん画像誤用を防止し, 社会安全を守るための重要な技術である。
本稿では,情報理論IFL フレームワーク SUMI-IFL について紹介する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:58:54 GMT)
Multi-P$^2$A: A Multi-perspective Benchmark on Privacy Assessment for Large Vision-Language Models [65.3] LVLM(Large Vision-Language Models)21個のオープンソースと2個のクローズドソースのプライバシ保護機能の評価を行った。
Multi-P$2$Aに基づいて、21のオープンソースと2つのクローズドソースLVLMのプライバシ保護機能を評価する。
以上の結果から,現在のLVLMは一般にプライバシー侵害のリスクが高いことが明らかとなった。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:33:39 GMT)
Sustainable Diffusion-based Incentive Mechanism for Generative AI-driven Digital Twins in Industrial Cyber-Physical Systems [65.2] 産業用サイバー物理システム(ICPS)は、現代の製造業と産業にとって不可欠なコンポーネントである。
製品ライフサイクルを通じてデータをデジタル化することにより、ICPSのDigital Twins(DT)は、現在の産業インフラからインテリジェントで適応的なインフラへの移行を可能にします。
GenAIはDTの構築と更新を推進し、予測精度を改善し、多様なスマート製造に備える。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:46:55 GMT)
Hindsight Planner: A Closed-Loop Few-Shot Planner for Embodied Instruction Following [62.1] 本研究は,Large Language Models (LLM) を用いた Embodied Instruction following (EIF) タスクプランナの構築に焦点をあてる。
我々は,このタスクを部分観測可能なマルコフ決定プロセス (POMDP) として構成し,数発の仮定で頑健なプランナーの開発を目指す。
ALFREDデータセットに対する我々の実験は、プランナーが数ショットの仮定で競争性能を達成することを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:05:45 GMT)
Safetywashing: Do AI Safety Benchmarks Actually Measure Safety Progress? [60.0] 我々は、より有意義な安全指標を開発するための実証的な基盤を提案し、機械学習研究の文脈でAIの安全性を定義する。
我々は、AI安全研究のためのより厳格なフレームワークを提供し、安全性評価の科学を前進させ、測定可能な進歩への道筋を明らかにすることを目指している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:36:21 GMT)
CogAgent: A Visual Language Model for GUI Agents [59.9] GUI理解とナビゲーションに特化した視覚言語モデル(VLM)であるCogAgentを紹介する。
低解像度画像エンコーダと高解像度画像エンコーダの両方を利用することで、CogAgentは1120*1120の解像度で入力をサポートする。
CogAgentは、VQAv2、OK-VQA、Text-VQA、ST-VQA、ChartQA、 infoVQA、DocVQA、MM-Vet、POPEを含む5つの一般的なVQAベンチマークで、技術の現状を達成している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 06:56:18 GMT)
M-Tuning: Prompt Tuning with Mitigated Label Bias in Open-Set Scenarios [58.6] 緩和ラベルバイアス(M-Tuning)を用いた視覚言語プロンプトチューニング手法を提案する。
これはWordNetからのオープンワードを導入し、クローズドセットラベルワードのみからもっと多くのプロンプトテキストを形成する単語の範囲を広げ、シミュレートされたオープンセットシナリオでプロンプトをチューニングする。
提案手法は,様々なスケールのデータセット上で最高の性能を達成し,広範囲にわたるアブレーション研究もその有効性を検証した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 23:55:53 GMT)
InfAlign: Inference-aware language model alignment [57.4] 言語モデルのアライメントは、現代の生成言語モデルのトレーニングにおいて重要なステップとなっている。
我々は,アライメントフレームワークが推論時間法の観点から準最適であることを示す。
推論認識アライメント(IAPO)のためのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:45:36 GMT)
CustomCrafter: Customized Video Generation with Preserving Motion and Concept Composition Abilities [56.6] CustomCrafterは、追加のビデオやリカバリのための微調整なしで、モデルの動き生成と概念的な組み合わせ能力を保持する。
動作生成では,VDMが早期に映像の動きを回復する傾向が見られた。
復調の後期では、特定対象の外観詳細を修復するために、このモジュールを復元する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:58:39 GMT)
On the Convergence of DP-SGD with Adaptive Clipping [56.2] 勾配クリッピングによるグラディエントDescentは、微分プライベート最適化を実現するための強力な技術である。
本稿では,量子クリッピング(QC-SGD)を用いたSGDの総合収束解析について述べる。
本稿では,QC-SGDが一定閾値クリッピングSGDに類似したバイアス問題にどのように悩まされているかを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 20:29:47 GMT)
Towards Simple and Provable Parameter-Free Adaptive Gradient Methods [56.1] 本稿では,AdaGrad++とAdam++について述べる。
我々は,AdaGrad++がAdaGradに比較して,事前定義された学習率の仮定を伴わずに,凸最適化においてAdaGradと同等の収束率を達成したことを証明した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:22:02 GMT)
Unprejudiced Training Auxiliary Tasks Makes Primary Better: A Multi-Task Learning Perspective [55.5] マルチタスク学習方法は、補助的なタスクを使用して、特定の一次タスク上でのニューラルネットワークのパフォーマンスを高めることを推奨する。
以前の方法では、しばしば補助的なタスクを慎重に選択するが、訓練中に二次的なものとして扱う。
本研究では,不確実性に基づく公平な学習手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:27:18 GMT)
OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis [55.4] グラフィカルユーザインタフェース(GUI)エージェントのための新しいデータ合成パイプラインであるOS-Genesisを提案する。
事前に定義されたタスクに頼る代わりに、OS-Genesisはエージェントがまず環境を認識し、ステップワイドなインタラクションを実行することを可能にする。
次に、生成された軌道の品質を保証するために軌道報酬モデルを用いる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:21:58 GMT)
Sharpening Neural Implicit Functions with Frequency Consolidation Priors [53.6] 符号付き距離関数 (Signed Distance Function, SDF) は、高忠実度3D表面を表現するために重要な暗黙の表現である。
現在の手法は主にニューラルネットワークを利用して、署名された3Dポイントクラウドやマルチビューイメージなど、さまざまな監督機関からSDFを学ぶ。
本研究では、高周波成分を回収し、よりシャープで完全な表面を追求することにより、低周波SDF観測を高速化する手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:18:46 GMT)
RAIN: Real-time Animation of Infinite Video Stream [53.0] RAINは、低レイテンシで、無限のビデオストリームをリアルタイムでアニメーションできるパイプラインソリューションである。
RAINは、より短いレイテンシと高速な速度でビデオフレームを生成すると同時に、拡張されたビデオストリームに対する長距離の注意を維持する。
RAINは、競合他社よりもはるかに優れた品質、正確性、一貫性で、リアルタイムにキャラクタをアニメーションすることができる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:13:15 GMT)
VideoMaker: Zero-shot Customized Video Generation with the Inherent Force of Video Diffusion Models [50.5] ビデオ拡散モデル(VDM)は本質的に被写体の特徴を抽出し注入する力を持っている。
高品質なゼロショットカスタマイズビデオ生成を実現するために,VDM固有の力を利用する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:49:25 GMT)
Intertwining CP and NLP: The Generation of Unreasonably Constrained Sentences [49.9] CPにおける制約文の生成手法が提案されている(Bonlarron et al, 2023)
本稿では,これらの難解な問題の多くに対処する,より汎用的なアプローチを提案する。
CPベースのアプローチのおかげで、強い制約のある文が生成される。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:56:10 GMT)
From Commands to Prompts: LLM-based Semantic File System for AIOS [47.5] プロンプト駆動型ファイル管理のためのLSFS(LLM-based semantic file system)を提案する。
従来のアプローチとは異なり、LSFSはLLMを組み込んで、ユーザやエージェントが自然言語のプロンプトを通じてファイルと対話できるようにする。
実験の結果,LSFSはユーザ利便性,サポート対象関数の多様性,ファイル操作の正確性や効率性の観点から,従来のファイルシステムよりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:32:38 GMT)
FGBERT: Function-Driven Pre-trained Gene Language Model for Metagenomics [46.2] FGBERTは、タンパク質に基づく遺伝子表現を文脈認識トークン化剤として利用する、新しいメダゲノミクス事前訓練モデルである。
これは、遺伝子、機能、細菌、環境レベルにまたがる4つのレベルでのメダゲノミクスデータセットに優れた性能を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 06:40:39 GMT)
Finger in Camera Speaks Everything: Unconstrained Air-Writing for Real-World [46.0] AWCV-100K-UCAS2024における画期的な漢字ビデオデータセット(AWCV-100K-UCAS2024)について述べる。
このデータセットは、一般的にアクセス可能なRGBカメラを使用して、さまざまな実世界のシナリオで手書きの軌跡をキャプチャする。
ビデオベース文字認識器VCRecについても紹介する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:04:04 GMT)
Geometric bound on structure factor [45.0] 量子幾何学は静的構造因子$S(q)$における$q4$項上の有界性を示す。
この境界を飽和するバンドはラプラス方程式の形式を満たすので、それらをテクスムロンバンドと呼ぶ。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:16:46 GMT)
Blessing or curse? A survey on the Impact of Generative AI on Fake News [45.0] 現在、高品質で個別にターゲットとするフェイクニュースのマス作成を自動化することが可能である。
この調査は、2024年のフェイクニュースの検出と作成のためのジェネレーティブAIの研究と実用化に関する総合的な調査を提供する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 11:31:01 GMT)
Building a Taiwanese Mandarin Spoken Language Model: A First Attempt [44.5] 本報告は,マルチターン会話におけるリアルタイム音声対話を実現するために,台湾語マンダリンのための大規模音声言語モデル(MLL)を構築することを目的とする。
エンドツーエンドモデルにはデコーダのみのトランスフォーマーアーキテクチャが組み込まれており,会話の流路を保ちながらシームレスな対話を実現することを目的としている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:29:19 GMT)
Paleoinspired Vision: From Exploring Colour Vision Evolution to Inspiring Camera Design [44.4] 網膜に新しいオプシン層を導入し,視覚伝達モデルを提案する。
我々は、特定のオプシンによって形成されたカラー画像のマシンビジョン認識精度を測定することにより、進化的圧力を定量化する。
我々はオプシンのスペクトル感度を再構築するための進化的保存最適化アルゴリズムを開発した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:07:52 GMT)
Safeguard Fine-Tuned LLMs Through Pre- and Post-Tuning Model Merging [43.4] 下流タスクのための細調整された大型言語モデル(LLM)は、安全に整合したLLMの安全性を低下させる。
下流タスク性能を向上しつつ, LLM 固有の安全性を維持する手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:03:22 GMT)
Can Large Language Models Adapt to Other Agents In-Context? [41.8] 近年の研究では、大きな言語モデルのマインド能力の理論は非常に印象的であり、人間レベルの性能を近似していることが示唆されている。
過去の研究では, エージェントのパフォーマンスを直接測定することはなく, 自然界の光沢のある発見につながっている可能性が示唆された。
最高のパフォーマンスのオープンソースLLMは、どのように引き起こされるかによって、心のリテラル理論に強い能力を示すかもしれませんが、機能的な心の理論に苦慮しているようです。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:30:12 GMT)
Long Context vs. RAG for LLMs: An Evaluation and Revisits [41.3] 本稿は、このトピックに関する最近の研究を再考し、その重要な洞察と相違点を明らかにする。
LCは、特にウィキペディアベースの質問に対して、質問応答ベンチマークにおいてRAGよりも優れていた。
また,既存の研究における文脈関連性の重要性を概観する,詳細な議論もおこなう。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:34:37 GMT)
Context-aware Inductive Knowledge Graph Completion with Latent Type Constraints and Subgraph Reasoning [41.0] 本稿では,新しい文脈認識型インダクティブ知識グラフソリューションであるCATSを紹介する。
まず、型認識推論モジュールは、候補エンティティがクエリ関係で要求される潜在エンティティタイプと一致するかどうかを評価する。
そして、サブグラフ推論モジュールは、関連する推論パスと近隣の事実を選択し、クエリの3倍の相関性を評価する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 15:32:01 GMT)
LongDocURL: a Comprehensive Multimodal Long Document Benchmark Integrating Understanding, Reasoning, and Locating [40.4] 大規模視覚言語モデル(LVLM)は文書理解能力を大幅に改善した。
既存の文書理解ベンチマークは少数のページしか処理できない。
半自動構築パイプラインを開発し,2,325の高品質な質問応答ペアを収集し,33,000ページ以上の文書を網羅する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:33:31 GMT)
DAS3R: Dynamics-Aware Gaussian Splatting for Static Scene Reconstruction [39.7] 日常映像からのシーン分解と静的な背景再構築のための新しいフレームワークを提案する。
提案手法はDAS3Rと呼ばれ,静的シーン再構成のためのダイナミック・アウェア・ガウス・スプレイティングの略である。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:59:46 GMT)
Is Your Text-to-Image Model Robust to Caption Noise? [38.2] テキスト・トゥ・イメージ(T2I)生成では、画像再カプセル化に視覚言語モデル(VLM)を用いることが一般的である。
VLMは幻覚を示すことで知られており、視覚的現実から逸脱する記述的内容を生成するが、そのような字幕幻覚がT2I世代のパフォーマンスに与える影響は未解明のままである。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:53:37 GMT)
Ultralight Signal Classification Model for Automatic Modulation Recognition [37.7] エッジアプリケーションに最適化された超軽量ハイブリッドニューラルネットワークを提案する。
クラス毎に100サンプル未満のサンプルを使用して、好ましくない信号と雑音の比率で堅牢なパフォーマンスを実現し、計算オーバーヘッドを大幅に削減します。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 11:03:26 GMT)
Mouth Articulation-Based Anchoring for Improved Cross-Corpus Speech Emotion Recognition [37.6] クロスコーパス音声感情認識(SER)は多くの実践的応用において重要な役割を担っている。
クロスコーパスの感情伝達への伝統的なアプローチは、しばしば異なるコーパス、ドメインまたはラベルに合わせるために音響的特徴を適用することに集中する。
本研究は、感情特異的な調音ジェスチャーを分析のコア要素とする、新しいコントラスト的アプローチを採用する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 20:00:45 GMT)
Not all Views are Created Equal: Analyzing Viewpoint Instabilities in Vision Foundation Models [37.3] 我々は、視角の微妙な変化に起因する重要な特徴変化として不安定性を定義する。
視点変化に対する応答に着目し,9つの基礎モデルについて検討する。
本手法は,アウト・オブ・ディストリビューション,偶発的,安定的な視点の認識と分類を可能にする。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 20:50:35 GMT)
"Did my figure do justice to the answer?" : Towards Multimodal Short Answer Grading with Feedback (MMSAF) [36.7] 本研究は, 主観的, オープンな質問に焦点を合わせ, フィードバックを伴うASAG (Automatic Short Answer Grading) の問題に類似している。
本稿では,従来のASAGフィードバック問題に対してMMSAF(Multimodal Short Answer grading with Feedback)問題を導入する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:33:39 GMT)
Deep Linear Hawkes Processes [36.0] マーク付き時間点プロセス(MTPP)は、不規則な到着時間を持つ異なる種類の事象のシーケンスをモデル化するために使用される。
我々は、現代の深部状態空間モデル(SSM)と線形ホークスプロセス(LHP)の接続を描画することで、既存の点過程モデルにおける欠点に対処する。
提案するDLHPモデルは,新しいMTPPモデルの構築に利用されたSSMのユニークなアーキテクチャ機能の最初の例である。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:23:58 GMT)
Confidence v.s. Critique: A Decomposition of Self-Correction Capability for LLMs [34.2] 大規模言語モデル(LLM)は自己生成応答を補正することができるが、自己補正後の精度の低下も観察されている。
自己訂正能力は、自信(回答を正す自信)と批判(間違った回答を正しいものにする)に分解します。
我々の戦略は両方の能力においてバニラSFTより優れており、自己補正後の精度ははるかに高い。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:09:11 GMT)
DrivingWorld: ConstructingWorld Model for Autonomous Driving via Video GPT [33.9] 我々は、自動運転のためのGPTスタイルの世界モデルであるDrivingWorldを紹介する。
本稿では,連続フレーム間の時間的コヒーレンスをモデル化する次世代予測手法を提案する。
また,長期ドリフト問題を軽減するため,トークン予測のための新しいマスキング戦略と再重み付け戦略を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:44:07 GMT)
Toward Adaptive Reasoning in Large Language Models with Thought Rollback [33.7] 本稿では,Thought Rollback (TR) と呼ばれる新しい推論フレームワークを提案する。
TRにより、大規模言語モデル(LLM)は、幻覚下での問題解決に向けた効果的な推論を維持しつつ、思考構造を適応的に構築することができる」。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:02:34 GMT)
Language-Guided Diffusion Model for Visual Grounding [33.7] 既存のアプローチは、そのような視覚的テキスト推論を1ステップで完了させる。
本稿では,ビジュアルグラウンドディングのための言語誘導拡散フレームワークLG-DVGを提案する。
広範に使用されている5つのデータセットの実験は、視覚的グラウンドリングの優れた性能、つまり、モーダルなアライメントタスクを生成的手法で検証した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:36:56 GMT)
Pixel-Wise Recognition for Holistic Surgical Scene Understanding [33.4] 本稿では,前立腺腫データセットの全体的および多角的手術シーン理解について述べる。
本ベンチマークでは,様々な粒度の相補的タスクの階層構造として,外科的シーン理解をモデル化する。
提案したベンチマークを活用するために,Transformers for Actions, Phases, Steps, and Instruments(TAPIS)モデルを導入する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 01:39:43 GMT)
Free-viewpoint Human Animation with Pose-correlated Reference Selection [31.4] 拡散に基づく人間アニメーションは、人物の人物像と、ポーズの列のような信号の駆動に基づいて人間キャラクターをアニメーションすることを目的としている。
既存のアプローチは、高忠実なポーズを生成することができるが、重要な視点の変化に苦慮している。
本稿では,ポーズ関連参照選択拡散ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:13:32 GMT)
Future Sight and Tough Fights: Revolutionizing Sequential Recommendation with FENRec [31.3] 逐次レコメンデーション(SR)システムは、時間順のインタラクションシーケンスを分析することによって、ユーザの好みを予測する。
SRの一般的な課題は、ユーザーが通常、限られた数のアイテムとのみ対話するため、データスパシティである。
シーケンシャルレコメンデーション(FENRec)におけるコントラスト学習のための継続ネガティクスを用いた今後のデータ活用を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:36:52 GMT)
StyleRWKV: High-Quality and High-Efficiency Style Transfer with RWKV-like Architecture [29.2] スタイル転送は、スタイルソースの芸術的表現ではなく、コンテンツを保存する新しいイメージを生成することを目的としている。
既存の手法の多くはトランスフォーマーや拡散モデルに基づいているが、2次計算の複雑さと高い推論時間に悩まされている。
本稿では,メモリ使用量と線形時間複雑性を制限した高品質なスタイル転送を実現するための新しいフレームワークであるStyleRWKVを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:01:15 GMT)
The Current Challenges of Software Engineering in the Era of Large Language Models [29.0] 本稿では,大規模言語モデル (LLM) の下でのソフトウェア開発ライフサイクル (SDLC) の見直しを目的とする。
ソフトウェア要件と設計、コーディングアシスト、コード生成のテスト、コードレビュー、コードメンテナンス、データ、トレーニング、評価を含む7つの側面から、26の重要な課題を達成しています。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:17:12 GMT)
Image Classification with Deep Reinforcement Active Learning [28.9] 多くの実世界のシナリオでは、ラベル付きデータは不足しており、ハンドラベルは時間、労力、コストが要求される。
アクティブラーニング(英: Active Learning)は、専門家によって注釈付けされ、手作業によるデータのラベル付けを緩和する代替パラダイムである。
本研究では,マルコフ決定過程(MDP)に基づく適応型能動学習法を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:37:51 GMT)
Baichuan-Omni Technical Report [28.3] 世界初のオープンソース 7B Multimodal Large Language Model (MLLM) であるBaichuan-omni を紹介する。
Baichuan-omniは画像、ビデオ、オーディオ、テキストのモダリティを同時に処理し分析する能力を持っている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:19:55 GMT)
Generalized Uncertainty-Based Evidential Fusion with Hybrid Multi-Head Attention for Weak-Supervised Temporal Action Localization [28.0] 弱教師付き時間的アクションローカライゼーション(WS-TAL)は、完全なアクションインスタンスをローカライズし、それらをビデオレベルのラベルに分類するタスクである。
動作背景のあいまいさは、主にアグリゲーションと動作内変動に起因するバックグラウンドノイズによって引き起こされるものであり、既存のWS-TAL手法にとって重要な課題である。
本稿では,ハイブリッドマルチヘッドアテンション(HMHA)モジュールと一般化された不確実性に基づく明らかな融合(GUEF)モジュールを導入し,この問題に対処する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:04:57 GMT)
Learning to Forget: Bayesian Time Series Forecasting using Recurrent Sparse Spectrum Signature Gaussian Processes [27.9] 署名カーネルは任意の長さの時系列の間のカーネルである。
本稿では,シグネチャの新規な記憶機構を導入し,データ駆動方式を提案する。
これにより、モデルがコンテキスト長を動的に適応して、より最近の情報に集中することができる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:31:09 GMT)
P3S-Diffusion:A Selective Subject-driven Generation Framework via Point Supervision [26.8] 本稿では,P3S-Diffusionについて紹介する。
P3S-Diffusionは最小のコストラベル(例えば点)を利用して主観的画像を生成する。
これらの点から拡張されたベースマスクを生成することができ、さらなるセグメンテーションモデルの必要性を回避できる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:59:01 GMT)
Spectral-Temporal Fusion Representation for Person-in-Bed Detection [25.6] 本研究はICASSP 2025 Signal Processing Grand Challenge's Accelerometer-based Person-in-Bed Detection Challengeに基づく。
作業は、"in bed"と"not in bed"の2つのトラックに分けられる。
混合データ拡張を用いたスペクトル時間融合に基づく特徴表現法を提案し、検出精度を最適化するために、IoU(Intersection over Union)損失を適用した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 02:05:09 GMT)
Towards General Industrial Intelligence: A Survey of Continual Large Models in Industrial IoT [25.2] 本調査では,大規模モデル(LM)とのIIoT統合とその産業環境への応用について検討する。
我々は,言語ベース,視覚ベース,時系列,マルチモーダルモデルという,産業用LMの4つの主要なタイプに注目した。
IIoTが豊富な多様なデータリソースをどのように提供するかを分析し、LMのトレーニングと微調整をサポートする。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 01:23:05 GMT)
An Engorgio Prompt Makes Large Language Model Babble on [25.1] 自動回帰型大規模言語モデル (LLM) は多くの実世界のタスクにおいて顕著な性能を発揮している。
本稿では,悪質なユーザがEngorgioのプロンプトを作らなければならないような,コスト・アタックを推論する脆弱性について検討する。
本研究では,新たな手法であるEngorgioを設計し,敵のEngorgioプロンプトを効率的に生成し,LLMのサービス可用性に影響を与える。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 01:00:23 GMT)
Diverse Rare Sample Generation with Pretrained GANs [24.2] 本研究では,GANを事前学習した高解像度画像データセットから多様な希少サンプルを生成する手法を提案する。
提案手法は,多目的フレームワーク内での遅延ベクトルの勾配に基づく最適化と,特徴空間上の密度推定に正規化フローを利用する。
これにより、レア画像の生成が可能となり、レアリティ、多様性、参照画像との類似性の制御可能なパラメータが提供される。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:10:30 GMT)
Are Sparse Neural Networks Better Hard Sample Learners? [24.2] ディープニューラルネットワークの最適性能において、ハードサンプルは重要な役割を果たす。
挑戦的なサンプルに基づいてトレーニングされたほとんどのSNNは、特定の間隔レベルで精度の高いモデルにマッチしたり、超えたりすることができる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 11:41:38 GMT)
In situ Qubit Frequency Tuning Circuit for Scalable Superconducting Quantum Computing: Scheme and Experiment [24.0] In situ超伝導回路を用いてキュービット周波数を調整できるスケーラブルなスキームを提案する。
我々の研究は超伝導量子プロセッサの大規模制御の道を開いた。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:28:51 GMT)
MECD: Unlocking Multi-Event Causal Discovery in Video Reasoning [23.9] 新しいタスクとデータセットであるMulti-Event Causal Discovery (MECD)を導入する。
時系列的に長いビデオに分散したイベント間の因果関係を明らかにすることを目的としている。
我々は,効率的なマスクベースの事象予測モデルを用いて,Granger Causality法にインスパイアされた新しいフレームワークを考案した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 02:20:36 GMT)
Hyperspectral Pansharpening: Critical Review, Tools and Future Perspectives [23.8] 高分解能パンクロマティックバンドと低分解能ハイパースペクトル画像とを融合させて、空間領域とスペクトル領域の両方で高分解能の画像を得る。
本稿では,新しい手法の迅速な開発と正確な評価のための包括的枠組みの欠如に対処する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:52:39 GMT)
Hybrid Local Causal Discovery [23.3] 局所因果発見は、対象変数の直接の原因と影響を観測データから学習し、識別することを目的としている。
既存の制約に基づく局所因果発見法は、局所因果骨格の構築にANDまたはORルールを使用している。
HLCDと呼ばれるハイブリッド局所因果探索アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:53:59 GMT)
DriveEditor: A Unified 3D Information-Guided Framework for Controllable Object Editing in Driving Scenes [23.2] DriveEditorは、動画のオブジェクト編集のための拡散ベースのフレームワークである。
再配置、置換、削除、挿入を含む包括的なオブジェクト編集操作のための統一されたフレームワークを提供する。
nuScenesデータセットの大規模な評価は、DriveEditorの異例の忠実さとコントロール可能性を示し、多様なドライブシーンの編集を生成する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:49:36 GMT)
A High Dimensional Statistical Model for Adversarial Training: Geometry and Trade-Offs [23.1] 本稿では,データと敵の攻撃的ジオメトリ間の相互作用を研究することのできる,引き込み可能な数学的モデルを提案する。
我々の主な理論的貢献は、敵の経験的リスク最小化のための十分な統計の正確な記述である。
我々は,複数の異なる特徴型が存在することが,逆行訓練の複雑度向上に不可欠であることを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 22:42:46 GMT)
A Large-scale Interpretable Multi-modality Benchmark for Facial Image Forgery Localization [22.7] 我々は、モデル予測を説明するのに基本的なバイナリフォージェリーマスクが不十分であると主張している。
本研究では,偽画像に対する有能な領域中心の解釈を生成する。
ForgeryTalkerは,フォージェリーローカライゼーションと解釈を同時に行うように設計されたアーキテクチャである。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 15:23:39 GMT)
Multi-scale Latent Point Consistency Models for 3D Shape Generation [22.7] MLPCM(Multi-scale Latent Point Consistency Model)を提案する。
OurCMは遅延拡散フレームワークに従い、ポイントレベルからスーパーポイントレベルまで、階層的な潜在表現レベルを導入します。
また,前者を1ステップの発電機に圧縮する潜時整合モデルを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 02:41:33 GMT)
Toward Scalable Multirobot Control: Fast Policy Learning in Distributed MPC [22.6] 本稿では,スケーラブルなマルチロボット制御のための分散学習ベース予測制御(DLPC)フレームワークを提案する。
オープンループ制御列を計算する従来のDMPC法とは異なり,本手法は数値解法を使わずに,MSSに対して明示的なクローズループDMPCポリシーを生成する。
学習したコントロールポリシーは、さまざまなロボットスケールでMSSにオンラインにデプロイでき、大規模MSSのスケーラビリティと転送性を向上させることができる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:31:52 GMT)
UniBrain: A Unified Model for Cross-Subject Brain Decoding [22.5] 被験者固有のパラメータを必要としない統一脳復号モデルUniBrainを提案する。
提案手法は, 可変fMRI信号長を扱うグループベース抽出器, クロスオブジェクトの共通点を捕捉する相互支援組込み器, 被写体不変特徴を抽出するバイレベル特徴アライメント方式を含む。
我々は、UniBrainを脳復号ベンチマークで検証し、パラメータが極端に少ない現在の最先端の主題特化モデルに匹敵する性能を実現した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:03:47 GMT)
Structural Similarity in Deep Features: Image Quality Assessment Robust to Geometrically Disparate Reference [22.3] 上記の問題に対処する統合型非学習型Deep Structure similarity (DeepSSIM) アプローチを提案する。
提案手法は,AR-IQAデータセット上での最先端性能を実現し,各種GDR-IQAテストケースに対して強い堅牢性を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:51:23 GMT)
FedMoE-DA: Federated Mixture of Experts via Domain Aware Fine-grained Aggregation [22.3] Federated Learning(FL)は、複数のクライアントがプライベートデータを共有せずにモデルをトレーニングできる、コラボレーティブな機械学習アプローチである。
我々は、新しいドメイン認識、きめ細かい集約戦略を取り入れた新しいFLモデルトレーニングフレームワークであるFedMoE-DAを提案し、ロバスト性、パーソナライズ性、通信効率を同時に向上する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:48:14 GMT)
GRPose: Learning Graph Relations for Human Image Generation with Pose Priors [21.9] 人間の画像生成のための制御情報を提供するために,ポーズ前のグラフ関係を考察する枠組みを提案する。
主な考え方は、ポーズ先行と拡散モデルの潜在表現の間のグラフ位相構造を確立することである。
事前訓練されたポーズ推定ネットワークに基づいてポーズ知覚損失を導入し、ポーズ差を最小限にする。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:27:39 GMT)
Nonconvex Stochastic Optimization under Heavy-Tailed Noises: Optimal Convergence without Gradient Clipping [21.9] 重み付き雑音下での最初の収束を提供するが、切断はしない。
また、テールインデックス$mathfrakp$が事前に不明な場合には、最初の$mathcalO(Tfrac1-mathfrakp3mathfrakp-2)$収束率も設定する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:46:46 GMT)
A Survey on Large Language Model Acceleration based on KV Cache Management [21.5] 大規模言語モデル(LLM)は、自然言語処理、コンピュータビジョン、マルチモーダルタスクなど、幅広い領域に革命をもたらした。
LLMの計算とメモリ要求は、それらを現実世界、長期コンテキスト、リアルタイムアプリケーションにスケールする際に大きな課題を生じさせる。
このサーベイは、LLMアクセラレーションのためのKVキャッシュ管理戦略を包括的に概観し、トークンレベル、モデルレベル、システムレベルの最適化に分類する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:17:57 GMT)
Pre-training, Fine-tuning and Re-ranking: A Three-Stage Framework for Legal Question Answering [20.9] 法的質問応答(QA)は、法的助言を求める人々から注目を集めている。
従来の手法では、主に二重エンコーダアーキテクチャを使用して、質問と回答の密集した表現を学習していた。
本稿では,アンダーラインプレトレーニング,アンダーラインファインチューニング,アンダーラインレグレードのための3段階フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 06:33:42 GMT)
A Text is Worth Several Tokens: Text Embedding from LLMs Secretly Aligns Well with The Key Tokens [20.4] テキストを大きな言語モデルベースの埋め込み器に入力すると、得られたテキストの埋め込みは入力テキストのキートークンと一致させることができる。
この現象は普遍的であり,モデルアーキテクチャ,トレーニング戦略,埋め込み手法の影響を受けないことを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:56:37 GMT)
S-STE: Continuous Pruning Function for Efficient 2:4 Sparse Pre-training [20.1] S-STEは,2:4スパースに連続的に重みを投影し,テンソルごとの固定スケーリング係数でスパース重みを再スケールする,シンプルな2:4トレーニング手法である。
その結果,本手法は以前の2:4の事前学習レシピを超え,完全なパラメータモデルでも同等であることがわかった。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:30:18 GMT)
MBQ: Modality-Balanced Quantization for Large Vision-Language Models [20.0] PTQ(Post-Training Quantization)は、メモリと計算オーバーヘッドを削減する効果的な手法である。
既存のPTQ手法は主に大きな言語モデル(LLM)に焦点をあてるが、他のモダリティの相違は考慮しない。
大規模な視覚言語モデルに対して,MBQ(Modality-Balanced Quantization)を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:55:36 GMT)
Toward Modality Gap: Vision Prototype Learning for Weakly-supervised Semantic Segmentation with CLIP [19.7] 本稿では,テキストプロトタイプの助けを借りて,視覚空間におけるクラス固有の視覚プロトタイプを学習するためのフレームワークを提案する。
また、対応するプロトタイプに埋め込まれた領域を対比する地域意味コントラストモジュールを提案する。
提案するフレームワークは,2つのベンチマークデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:55:11 GMT)
KALAHash: Knowledge-Anchored Low-Resource Adaptation for Deep Hashing [19.7] 既存のディープハッシュ手法は豊富なトレーニングデータに依存しており、低リソース適応のより困難なシナリオは比較的過小評価されている。
そこで我々は,クラスレベルのテキスト知識の埋め込みを活用することで,低ランク適応を動的に構築する新しいプラグイン・アンド・プレイアプローチであるClass-Calibration LoRAを紹介する。
提案手法であるKnowledge-Anchored Low-Resource Adaptation Hashing (KALAHash)は,検索性能を大幅に向上し,低リソースシナリオにおけるデータ効率を4倍に向上させる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:04:54 GMT)
Reasoning over Uncertain Text by Generative Large Language Models [19.0] 本稿では,大言語モデル (LLM) が,確率値を介して明示的に定量化される不確実性を含む情報を含むテキストを推論する際に直面する課題について考察する。
LLMの確率論的推論能力をテストするために設計された新しいデータセットであるBayesian Linguistic Inference dataset (BLInD)を紹介する。
我々は,Pythonのコード,確率的アルゴリズム,確率論的論理プログラミングなど,問題を異なる形式的表現にマッピングするいくつかのプロンプト戦略を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:43:59 GMT)
Learning Radiance Fields from a Single Snapshot Compressive Image [18.5] Snapshot Compressive Imaging (SCI) 法による1つの時間圧縮画像から基礎となる3次元シーン構造を復元する。
我々は,SCINeRFのトレーニングの一環として,SCIの物理像過程を定式化するSCINeRFを提案する。
さらに,一般的な3Dガウス・スプレイティング(3DGS)フレームワークを統合し,3Dシーンの再現品質とトレーニング・レンダリング速度を改善するためのSCISplatを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 06:40:44 GMT)
Generation through the lens of learning theory [18.4] 統計的学習理論のレンズを通して生成を研究する。
我々は「一様」および「非一様」生成と呼び、どの仮説類が一様かつ一様でない生成可能かを特徴づける。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:42:07 GMT)
Zero-Shot Artifact2Artifact: Self-incentive artifact removal for photoacoustic imaging without any data [18.2] ZS-A2Aは超軽量ネットワークをベースとしたゼロショット自己監督型アーティファクト除去手法である。
ZS-A2Aは、既存のゼロショット法と比較して、最先端(SOTA)性能を達成する。
インビボで$1のラット肝臓では、ZS-A2Aはわずか8秒でCNRを17.48から43.46に改善する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:49:15 GMT)
Boost UAV-based Ojbect Detection via Scale-Invariant Feature Disentanglement and Adversarial Learning [18.1] 本稿では,スケール不変の特徴を学習することで,単段階推論の精度を向上させることを提案する。
提案手法は,モデル精度を効果的に向上し,2つのデータセット上での最先端(SoTA)性能を実現する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:57:26 GMT)
Neighbor Does Matter: Density-Aware Contrastive Learning for Medical Semi-supervised Segmentation [17.7] 我々は,特徴空間の幾何から,監督情報を直接抽出できることを論じる。
密度に基づくクラスタリング仮説に着想を得て,特徴密度を用いて特徴クラスタ内のスパース領域を特定することを提案する。
本手法は, ラベル付きおよびラベルなしデータサンプルを用いて, 特徴密度を推定し, スパース領域の同定を行う。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:57:57 GMT)
Model Fusion through Bayesian Optimization in Language Model Fine-Tuning [16.9] 下流タスクのための微調整された事前学習モデルは、様々な領域にまたがる適応性と信頼性で広く採用されているテクニックである。
本稿では,多目的ベイズ最適化により,所望の計量と損失の両方を最適化する新しいモデル融合手法を提案する。
各種下流タスクを対象とした実験では,ベイズ最適化誘導方式による大幅な性能向上が見られた。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:27:23 GMT)
Comparing Few to Rank Many: Active Human Preference Learning using Randomized Frank-Wolfe [16.7] 我々は、この問題を、$K$-way比較フィードバックからN$選択の宇宙上のプラケット・リュックモデルを学習するものとして定式化する。
我々の解は、Pockett-Luce の目的に対する D-optimal 設計である。
この研究の主なアルゴリズム上の課題は、D-最適設計を解くための高速な方法でさえ、O(N choose K)$時間複雑性を持つことである。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 01:10:17 GMT)
Learning states enhanced knowledge tracing: Simulating the diversity in real-world learning process [16.5] 知識追跡タスクは、歴史的相互作用に基づいて学習者の将来のパフォーマンスを予測することに焦点を当てる。
我々はLSKT(Learning State Enhanced Knowledge Tracing)という新しい手法を提案する。
4つの実世界のデータセットによる実験結果から,我々のLSKT法は現在の最先端手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:41:25 GMT)
From Elements to Design: A Layered Approach for Automatic Graphic Design Composition [16.3] 階層設計の原理をLMM(Large Multimodal Models)に導入する。
LaDeCoは与えられた要素セットに対してレイヤプランニングを行い、入力要素をその内容に応じて異なるセマンティックレイヤに分割する。
その後、設計構成を階層的に制御する要素属性を予測し、以前に生成されたレイヤのレンダリングイメージをコンテキストに含める。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:13:08 GMT)
Gradient Weight-normalized Low-rank Projection for Efficient LLM Training [16.0] 大規模言語モデル(LLM)は様々なタスクにおいて顕著な性能を示してきたが、計算資源に対する需要の増大は大きな課題となっている。
これを解決するために、パラメータ効率のよい微細チューニング法(PEFT)が開発されているが、完全な微細チューニングに比べて性能が劣ることが多い。
我々はGradNormLoRPを導入し、パラメータとメモリ効率を両立させながら、完全な微調整に匹敵する性能を維持した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 12:23:39 GMT)
Gradient Alignment Improves Test-Time Adaptation for Medical Image Segmentation [15.8] グラディエントアライメントに基づくテスト時間適応法(GraTa)を提案する。
GraTa法は、勾配アライメントを容易にするために、擬似的勾配に補助勾配を組み込む。
擬似勾配と補助勾配のコサイン類似度に基づいて動的学習率を設計する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:29:25 GMT)
GHZ-W Genuinely Entangled Subspace Verification with Adaptive Local Measurements [15.6] 我々は3ビットGHZ-W GESのための2つの適応型検証戦略、XZ戦略と回転戦略を開発する。
2次元の2量子部分空間を3つの異なるタイプに分類する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:07:44 GMT)
CAD-GPT: Synthesising CAD Construction Sequence with Spatial Reasoning-Enhanced Multimodal LLMs [15.5] 本研究では,空間推論強化MLLMを用いたCAD合成法CAD-GPTを紹介する。
空間展開機構を用いて3次元空間位置と3次元スケッチ平面回転角を1次元言語特徴空間にマッピングする。
また、2Dスケッチ座標を適切な平面空間に識別し、空間開始位置、スケッチ方向、および2Dスケッチ座標変換の正確な決定を可能にする。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:19:36 GMT)
Diffusion Models Learn Low-Dimensional Distributions via Subspace Clustering [15.3] 拡散モデルは画像分布を効果的に学習し、新しいサンプルを生成する。
我々は、この現象に関する理論的な洞察を、重要な経験的観測を利用して提供する。
基礎となる分布を学習するのに必要となるサンプルの最小数は、本質的な次元と線形にスケールすることを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:33:51 GMT)
FAMNet: Frequency-aware Matching Network for Cross-domain Few-shot Medical Image Segmentation [15.1] 既存の数発の医用画像分割(FSMIS)モデルは、様々な画像技術によって引き起こされる領域シフトという、医療画像の実践的な問題に対処できない。
本稿では、周波数対応マッチング(FAM)モジュールとマルチスペクトル融合(MSF)モジュールの2つの主要なコンポーネントを含む周波数対応マッチングネットワーク(FAMNet)を提案する。
我々のFAMNetは、既存のFSMISモデルと3つのクロスドメインデータセット上のクロスドメインFew-shot Semanticモデルを上回っています。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 06:49:21 GMT)
Adiabatic topological passage based on coupling of giant atom with two Su-Schrieffer-Heeger chains [14.8] 巨大原子を介する2つのSu-Schrieffer-Heeger鎖の断熱的トポロジカルパスについて検討した。
2つのSSH鎖における巨大原子周波数ミスマッチと結合障害の両方に対する断熱的トポロジカルパスの堅牢性を示した。
本研究では,巨大原子とトポロジカル物質とのカップリングに基づく量子情報処理と量子光学デバイスの作製手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:15:49 GMT)
Goal-oriented Communications based on Recursive Early Exit Neural Networks [14.5] 計算を動的に分割するイノベーティブ・アーリーエグジット戦略を導入する。
我々は,早期終了点,計算分割,オフロード戦略を共同で決定する強化学習ベースのオンライン最適化フレームワークを開発した。
エッジ推論シナリオにおける数値評価は, 性能, レイテンシ, 資源効率の優れたトレードオフを打破する手法の適応性と有効性を示すものである。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 11:14:11 GMT)
From Ceilings to Walls: Universal Dynamic Perching of Small Aerial Robots on Surfaces with Variable Orientations [14.5] この研究は、様々な大きさの四元数と異なる向きを持つ曲面に対する普遍的動的摂動能力を示す。
異なるロボットスケールで幾何比率を維持することは、一貫したパーチ動作を保証する。
ランディングギアの継手剛性と減衰が引抜き挙動および性能に及ぼす影響
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:53:01 GMT)
Evaluating Software Development Agents: Patch Patterns, Code Quality, and Issue Complexity in Real-World GitHub Scenarios [13.9] この調査は、500の現実のGitHubイシューで上位10のエージェントから4,892のパッチを評価した。
一人のエージェントが支配的であり、170の問題が未解決であり、改善の余地があった。
ほとんどのエージェントはコードの信頼性とセキュリティを維持し、新しいバグや脆弱性を避けた。
一部のエージェントはコードの複雑さを増し、多くの重複を減らし、コードの臭いを最小限にした。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:52:05 GMT)
ViDTA: Enhanced Drug-Target Affinity Prediction via Virtual Graph Nodes and Attention-based Feature Fusion [13.8] 拡張DTA予測フレームワークであるViDTAを提案する。
仮想ノードをグラフニューラルネットワーク(GNN)ベースの薬物特徴抽出ネットワークに導入する。
本稿では,医薬品とタンパク質の相互作用情報をよりよく捉えるために,注目に基づく線形特徴融合ネットワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 11:19:10 GMT)
Graph-attention-based Casual Discovery with Trust Region-navigated Clipping Policy Optimization [13.8] 因果発見のための信頼領域探索型クリッピングポリシー最適化手法を提案する。
また、SDGATと呼ばれる改良されたグラフアテンションエンコーダを提案し、効率よく変数を符号化する。
これらの改善により、提案手法は、合成データセットとベンチマークデータセットの両方において、以前のRL法よりも優れている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:50:43 GMT)
High-Dimensional Differential Parameter Inference in Exponential Family using Time Score Matching [13.3] 各時間に高次元モデルを推定する代わりに、微分パラメータ、すなわちパラメータの時間微分を学習する。
本手法は,シミュレーションおよび実世界のデータセット上で検証された高次元グラフィカルモデルにおける微分構造を効果的に推定する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 19:00:40 GMT)
RobotDiffuse: Motion Planning for Redundant Manipulator based on Diffusion Model [13.1] 冗長マニピュレータは、キネマティック性能と汎用性の向上を提供する。
これらのマニピュレータの動作計画は、DOFの増加と複雑な動的環境のために困難である。
本稿では,冗長マニピュレータにおける運動計画のための拡散モデルに基づくロボットディフューズを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:34:54 GMT)
Causality Pursuit from Heterogeneous Environments via Neural Adversarial Invariance Learning [12.9] データから因果関係を抽出することは、科学的発見、治療介入、伝達学習における根本的な問題である。
本稿では,複数の環境における回帰モデルにおける非パラメトリック不変性と因果学習に対処するアルゴリズムを提案する。
提案したFocused Adrial Invariant Regularizationフレームワークは、逆検定により回帰モデルを予測不変解へ向ける革新的なミニマックス最適化手法を利用する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 22:35:56 GMT)
Right vs. Right: Can LLMs Make Tough Choices? [12.9] 倫理的ジレンマは、道徳的価値の矛盾を含む2つの「正しい」選択肢の選択を記述する。
LLMが倫理ジレンマをどのようにナビゲートするかを包括的に評価する。
我々は、4組の矛盾する値を含む1,730の倫理ジレンマからなるデータセットを構築した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 21:20:45 GMT)
Local Map Construction with SDMap: A Comprehensive Survey [12.8] 本稿では,SDMap を用いたローカルマップ構築手法について概説する。
また、SDMapベースのローカルマップ構築において、マルチモーダルデータ表現と融合法を解析する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:13:12 GMT)
Char-SAM: Turning Segment Anything Model into Scene Text Segmentation Annotator with Character-level Visual Prompts [12.4] Char-SAMはSAMを、文字レベルのビジュアルプロンプトを備えた低コストセグメンテーションアノテータに変換するパイプラインである。
Char-SAMは、高品質なシーンテキストセグメンテーションアノテーションを自動生成する。
そのトレーニング不要な性質により、COCO-TextやMLT17といった現実世界のデータセットから高品質なシーンテキストセグメンテーションデータセットを生成することもできる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 20:33:39 GMT)
Low-Rank Contextual Reinforcement Learning from Heterogeneous Human Feedback [12.4] 人間からのフィードバックからの強化学習(RLHF)は、大きな言語モデルと人間の嗜好を整合させる基盤となっている。
我々は、文脈情報を統合した低ランク文脈RLHFフレームワークを提案し、異種フィードバックをより良くモデル化する。
提案手法は,ユーザコンテキストと問合せ-問合せ-問合せ-問合せ-問合せ-問合せ-問合せ/問合せ-問合せ-問合せ-問合せ-問合せ間の相互作用の,本質的に低ランクな構造を利用した文脈選好モデルに基づく。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:02:46 GMT)
Evaluate Summarization in Fine-Granularity: Auto Evaluation with LLM [12.0] 要約を正確に客観的に評価することは 重大な課題です
ROUGEのような既存の手法では、人間の判断と相関の低いスコアがしばしば得られる。
これらの課題に対処するために,新しい評価手法とツールを導入する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 19:42:25 GMT)
Exploring Parameter-Efficient Fine-Tuning Techniques for Code Generation with Large Language Models [11.8] パラメータ効率のよい微調整(PEFT)は、大規模言語モデル(LLM)をタスク固有のデータに効率的に専門化するための有望なアプローチである。
本研究は,PEFTと量子化を組み合わせることで,より大きなLCMをチューニングし,メモリ使用量を大幅に削減する可能性を明らかにする。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:30:00 GMT)
SocRATES: Towards Automated Scenario-based Testing of Social Navigation Algorithms [11.4] シナリオベーステストによるより包括的なソーシャルナビゲーションの評価を提案する。
我々は、コンテキストや位置に適したソーシャルナビゲーションシナリオの自動生成を行うパイプラインを導入する。
実験の結果,我々のパイプラインは現実的なシナリオを生成し,シナリオ翻訳を大幅に改善していることがわかった。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 11:33:19 GMT)
Machine Learning for Sentiment Analysis of Imported Food in Trinidad and Tobago [11.2] 本研究では,トリニダードとトバゴの輸入食品に関連するTwitterデータの感情分析のための各種機械学習アルゴリズムの性能について検討した。
様々な構成でモデルを評価するために10の実験を行った。
その結果、VADERはマルチクラスとバイナリの感情分類において他のモデルよりも優れていた。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:25:08 GMT)
Achieving Robust Single-Photon Blockade with a Single Nanotip [11.1] 本研究では,Kerr非線形共振器近傍に固有の欠陥を有するナノチップを導入することにより,後方散乱損失に対する単一光子遮断を実現することができることを示す。
私たちの研究は、堅牢な単一光子源と後方散乱免疫量子デバイスへの応用のために、脆弱な量子デバイスを不完全から保護し、エンジニアリングすることに新たな光を当てています。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 12:09:30 GMT)
Meta-Learning-Based Delayless Subband Adaptive Filter using Complex Self-Attention for Active Noise Control [11.1] アクティブノイズコントロール問題をメタ学習問題として再検討する。
深層ニューラルネットワークを用いたメタラーニングに基づく遅延レスサブバンド適応フィルタを提案する。
本モデルでは従来の手法に比べてノイズ低減性能が優れている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:51:40 GMT)
Dust to Tower: Coarse-to-Fine Photo-Realistic Scene Reconstruction from Sparse Uncalibrated Images [11.1] Dust to Tower (D2T)は、3DGSと画像をスパース画像とアンキャリブレーション画像から同時にポーズする効率的なフレームワークである。
我々のキーとなる考え方は、まずまず効率よく粗いモデルを構築し、その後、新しい視点で歪んだり塗られたりすることでそれを洗練することである。
実験およびアブレーション実験は、D2Tとその設計選択の有効性を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:19:34 GMT)
Fortran2CPP: Automating Fortran-to-C++ Migration using LLMs via Multi-Turn Dialogue and Dual-Agent Integration [11.0] コードをC++に移行することは、多くの科学計算チームにとって一般的なタスクである。
高品質で専門的なデータセットの欠如は、その有効性を妨げている。
本稿では,新しいマルチターン対話データセットを導入することで,この問題に対処する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:06:25 GMT)
Attribution for Enhanced Explanation with Transferable Adversarial eXploration [10.8] AttEXplore++は、転送可能な逆アタックメソッドを組み込むことで、属性を向上させる。
我々は、ImageNetデータセットを用いて、CNN(Inception-v3, ResNet-50, VGG16, vision transformer)を含む5つのモデルで実験を行う。
提案手法は,AttEXploreに比べて7.57%,32.62%の性能向上を実現している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:27:53 GMT)
Asymptotically Optimal Search for a Change Point Anomaly under a Composite Hypothesis Model [10.5] 有限個のM過程の異常過程における変化点探索の問題に対処する。
我々のゴールは、サンプルの複雑さと検出精度のバランスをとることでベイズリスクを最小限に抑えるシーケンシャルな探索戦略を設計することである。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 00:44:34 GMT)
MLLM-SUL: Multimodal Large Language Model for Semantic Scene Understanding and Localization in Traffic Scenarios [10.4] マルチモーダル大規模言語モデル(MLLM)は、多くの自律運転タスクにおいて満足な効果を示している。
本稿では,MLLMを用いて,協調的セマンティック・シーン理解とリスク・ローカライゼーションの課題を解決する。
本手法はシーン理解タスクにおいて,80.1%のBLEU-1スコア,298.5%のCIDErスコア,59.6%の精度を達成している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 02:05:38 GMT)
AugGS: Self-augmented Gaussians with Structural Masks for Sparse-view 3D Reconstruction [10.0] スパースビュー3次元再構成はコンピュータビジョンにおいて大きな課題であり、限られた視角から完全な3次元モデルを作成することを目的としている。
本研究では,スパース・ビュー3D再構成のための構造マスクを付加した自己拡張型2段ガウス・スプレイティング・フレームワークを提案する。
提案手法は,認識品質における最先端性能と,スパース入力との多視点整合性を実現する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:47:11 GMT)
Modeling Continuous Spatial-temporal Dynamics of Turbulent Flow with Test-time Refinement [9.9] 直接数値シミュレーション(DNS)の代替として大型渦シミュレーション(LES)が登場している。
DNSは乱流輸送スケールの全スペクトルを正確に捉えることができず、空間分解能が低い場合にのみ存在する。
本稿では,物理知識を生かした新しいフロー再構成手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 21:22:18 GMT)
Official-NV: An LLM-Generated News Video Dataset for Multimodal Fake News Detection [9.5] マルチモーダル フェイクニュース検知が 最近注目を集めています
公式なニュースビデオを含むOffic-NVというデータセットを構築した。
また,マルチモーダル特徴量からキー情報をキャプチャするOFNVDと呼ばれる新しいベースラインモデルを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:34:15 GMT)
TARGA: Targeted Synthetic Data Generation for Practical Reasoning over Structured Data [9.4] TARGAは、手動のアノテーションなしで高関連性合成データを生成するフレームワークである。
これは、クローズソースモデルを使用する既存の非微調整手法よりも大幅に優れている。
非I.I.D.設定下では、優れたサンプル効率、堅牢性、一般化能力を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:16:39 GMT)
A Prototype Unit for Image De-raining using Time-Lapse Data [9.4] 本研究では,一雨画像から無雨背景情報を復元する作業である一雨脱落の課題に対処する。
我々は新しいソリューション、Rain Streak Prototype Unit(RsPU)を紹介する。
RsPUは、タイムラプスデータから得られたリアルタイムプロトタイプとして、レインストリーク関連機能を効率的にエンコードし、過剰なメモリリソースを不要にする。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:04:56 GMT)
Topology of Discrete Quantum Feedback Control [9.4] 真の動的トポロジカル位相のクラスは離散的な量子フィードバック制御によって実現できる。
トポロジカルフィードバック制御は、オープン量子系における非平衡トポロジカル位相の生成と制御のための多用途ツールを提供する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:10:21 GMT)
Research on Autonomous Driving Decision-making Strategies based Deep Reinforcement Learning [9.3] 行動決定サブシステムは、自律運転システムの重要な構成要素である。
本研究では、自律的に学習し、運転戦略を最適化する高度な強化学習モデルを採用する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 21:13:30 GMT)
Deep Kalman Filters Can Filter [8.9] ディープカルマンフィルタ(ディープカルマンろく、英: Deep Kalman filters、DKF)は、シーケンシャルデータからガウス確率測度を生成するニューラルネットワークモデルである。
DKFはカルマンフィルタにインスパイアされるが、フィルター問題と具体的な理論的関係は欠如している。
連続時間DKFは、非マルコフおよび条件付きガウス信号プロセスの幅広いクラスで条件法則を実装可能であることを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 23:53:30 GMT)
Feasibility Study of a Diffusion-Based Model for Cross-Modal Generation of Knee MRI from X-ray: Integrating Radiographic Feature Information [8.5] 膝関節症 (KOA) は筋骨格性疾患であり, 費用対効果からX線で診断されることが多い。
磁気共鳴イメージング(MRI)は優れた軟組織可視化を提供し、貴重な補助的診断ツールとして機能する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 06:00:28 GMT)
The Value of AI Advice: Personalized and Value-Maximizing AI Advisors Are Necessary to Reliably Benefit Experts and Organizations [8.4] AIのパフォーマンスの進歩にもかかわらず、AIアドバイザーは専門家の判断を損なうことができ、専門家が意思決定のために投資しなければならない時間と労力を増やすことができる。
AIアドバイザの設計と評価において、AIアドバイスが現実世界のコンテキストにもたらす価値を評価することの重要性を強調します。
我々の結果は、AIアドバイザのシステムレベルの価値駆動開発の必要性を強調し、専門家の独特な振る舞いに適応し、意思決定の改善と助言コストの間のコンテキスト固有のトレードオフに最適化されている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:50:54 GMT)
Multi-label Classification using Deep Multi-order Context-aware Kernel Networks [8.4] コンテキストは学習したモデルにさらなる手がかりを与え、分類性能を大幅に向上させるかもしれない。
本研究では,コンテクスト情報(画像の幾何学的構造)をフル活用して,画像間のコンテクスト認識の類似性(カーネルなど)を改善する。
得られたコンテキスト対応カーネルネットワークは、異なる距離の複数のパッチ隣人の順序を更に活用し、マルチラベル分類のためのより識別性の高い深層多階コンテキスト対応カーネルネットワーク(DMCKN)を実現する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:16:11 GMT)
RL-MUL 2.0: Multiplier Design Optimization with Parallel Deep Reinforcement Learning and Space Reduction [8.1] 強化学習に基づく乗算器設計最適化フレームワークを提案する。
行列とテンソル表現を乗算器の圧縮木に用いて,畳み込みニューラルネットワークをエージェントネットワークとしてシームレスに統合する。
異なるビット幅の乗算器を用いた実験により, 提案手法により生成した乗算器は, 面積, パワー, 遅延の点で, ベースライン全体の設計よりも優れていた。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:26:58 GMT)
Find the Intention of Instruction: Comprehensive Evaluation of Instruction Understanding for Large Language Models [8.0] LLM(Large Language Models)の重要な強みの1つは、与えられた指示に対する適切な応答を生成することによって、人間と対話する能力である。
この能力は命令追従能力として知られ、様々な分野におけるLSMの使用の基礎を確立している。
我々は、LLMが命令形式文によって容易に気を散らすことができ、それによって命令理解スキルの監視に繋がる可能性があることを指摘した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:37:39 GMT)
MonoSparse-CAM: Efficient Tree Model Processing via Monotonicity and Sparsity in CAMs [8.0] CAM回路のTBML間隔と単調性を利用して処理性能を向上する新しいCAMベースの最適化手法であるMonoSparse-CAMを提案する。
以上の結果から,MonoSparse-CAMは生処理と比較して28.56倍,最先端技術と比較して18.51倍までエネルギー消費量を削減し,計算効率を少なくとも1.68倍に向上した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:54:02 GMT)
CHESS: Optimizing LLM Inference via Channel-Wise Thresholding and Selective Sparsification [7.8] 本稿では,アクティベーションスペーシフィケーション問題を修正し,アクティベーションスペーシビリティとモデル性能の関係を明確に把握する。
本稿では,Channel-wise thrEsholding と Selective Sparsification による一般的な活性化スカラー化手法であるCHESSを提案する。
実験の結果,提案したCHESSは,既存の手法よりも少ないパラメータを活性化しながら,8つの下流タスクよりも低い性能劣化を実現することがわかった。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:49:34 GMT)
Engineering Digital Systems for Humanity: a Research Roadmap [7.7] 従来のソフトウェアの品質と並んで、人間、社会的、環境的な価値は、持続可能性と長期的な幸福のために欠かせないものとみなされている。
伝統的に、システムはビジネス目標と技術ドライバーを考慮して設計されている。
本稿では,システム工学は人間,社会,環境要因も考慮すべきである,と論じる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:28:39 GMT)
Mamba for Streaming ASR Combined with Unimodal Aggregation [7.6] 最近提案された状態空間モデルであるMambaは、様々なタスクでTransformerにマッチまたは超える能力を示した。
本稿では,制御可能な将来情報を活用するためのルックアヘッド機構を提案する。
2つの中国語データセットを用いて実験を行い、提案モデルが競争力のあるASR性能を達成することを示した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:23:14 GMT)
Tighter Learning Guarantees on Digital Computers via Concentration of Measure on Finite Spaces [7.4] デジタルコンピュータ上での学習モデルに適した一般化の族を$c_m/N1/ (2vee m)_m=1infty$とする。
パラメータ $m$ を$N$ に従って調整すると、実用的なサンプルサイズに対するより厳密な一般化境界が$N$ となる。
一般化境界の族は、有限距離空間における測度集中に対する新しい非漸近結果に基づいて定式化される。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 23:45:57 GMT)
Impact of Sunglasses on One-to-Many Facial Identification Accuracy [7.1] 1対多の顔認証に使われるプローブ画像は、監視ビデオのフレームから収集されることが多い。
ムグショット品質の画像に対するサングラスの精度は、強いぼやけや顕著に低い解像度に類似した量で低下することを示した。
暗いサングラスによる精度劣化を改善するため,すべてのギャラリー画像にサングラスを合成することにより,失った精度の約38%を回復できることを示した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:15:52 GMT)
INSIGHTBUDDY-AI: Medication Extraction and Entity Linking using Large Language Models and Ensemble Learning [6.8] 我々は,抽出した医療用語をSNOMED-CTコードと英国国定公式コードにマッピングするエンティティリンク機能を構築した。
私たちのモデルのツールキットとデスクトップアプリケーションは公開されています。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 20:53:02 GMT)
Identifying Cocoa Pollinators: A Deep Learning Dataset [6.7] ココアは数十億ドル規模の産業であるが、受粉による収量改善の研究は依然として限られている。
新しい組み込みハードウェアとAIベースのデータ分析は、ココアフラワービジター、そのアイデンティティと収量への影響に関する情報を前進させている。
本研究は,ココアフラワービジター・データセットとして,ココアフラワービジター・データセットとして,Ceratopogonidae,Formicidae,Aphididae,Araneae,Encyrtidaeの5,792種を記載した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 20:27:52 GMT)
Generalized Grade-of-Membership Estimation for High-dimensional Locally Dependent Data [6.6] 混合会員モデルは、調査回答と集団遺伝データの分析に広く利用されている。
ベイジアンMCMC推論のような既存のアプローチはスケーラブルではなく、高次元設定では理論的保証が欠如している。
本稿では,3方向準テンソルを「脂肪」行列に平坦化し,パラメータを推定するための特異値分解を行う,新しい,シンプルなアプローチを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:51:15 GMT)
Standard-Deviation-Inspired Regularization for Improving Adversarial Robustness [6.6] 敵対的訓練(AT)は、敵対的攻撃に対するディープニューラルネットワーク(DNN)の堅牢性を改善するために実証されている。
我々は、ATの内部はモデルの確率の標準偏差を最小化するのと似ていると論じる。
議論を支援するために,SDI尺度が敵の例を作成するのに有効であることを実験的に示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 22:59:21 GMT)
A C-Band Cryogenic GaAs MMIC Low-Noise Amplifier for Quantum Applications [6.2] 大規模超伝導量子コンピュータは、量子ビット読み出しのために大量の高性能低温低雑音増幅器(cryo-LNA)を必要とする。
本稿では,Cバンド型モノリシックマイクロ波集積回路(MMIC)について述べる。
この低温LNAは150nmGaAs擬態高電子移動トランジスタ(pHEMT)プロセスに基づいており、3段階のカスケードアーキテクチャで実装されている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 06:04:01 GMT)
ErgoChat: a Visual Query System for the Ergonomic Risk Assessment of Construction Workers [6.1] 本研究では, 作業者の姿勢のエルゴノミクスリスクを評価するために, 対話型ビジュアルクエリシステムを提案する。
システムには視覚的質問応答 (VQA) があり、作業者の姿勢エルゴノミクスリスクへの露出に関する視覚的クエリに応答する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 23:25:51 GMT)
LiRCDepth: Lightweight Radar-Camera Depth Estimation via Knowledge Distillation and Uncertainty Guidance [6.0] LiRCDepthは軽量レーダーカメラ深度推定モデルである。
知識蒸留を取り入れてトレーニングプロセスを強化する。
このモデルはnuScenesデータセット上でMAEを6.6%改善する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:38:09 GMT)
LASER: A new method for locally adaptive nonparametric regression [5.9] 我々は, 局所適応型非パラメトリック回帰法であるtextsfLASER (Locally Adaptive Smoothing Estimator for Regression) を導入する。
我々は、その領域のすべての点において、基礎となる回帰関数の局所H"older指数に(ほぼ)最適に適応することを証明した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:59:03 GMT)
A Fully Hardware Implemented Accelerator Design in ReRAM Analog Computing without ADCs [5.6] ReRAMベースのアクセラレータは、アナログ・コンピューティング・イン・メモリ(CiM)を介してニューラルネットワークを処理し、超高エネルギー効率を実現する。
本研究では、交叉二項化ニューロンを持つニューラルネットワークのSigmoidおよびSoftMaxアクティベーション機能のハードウェア実装について検討する。
本稿では、推論二項化ニューロンを活用することにより、ニューラルネットワークの計算を高速化する完全なReRAMベースのアナログコンピューティング加速器(RACA)を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:38:19 GMT)
Asymmetric protocols for mode pairing quantum key distribution with finite-key analysis [5.3] 有限鍵解析を用いて非対称MP-QKDプロトコルのセキュリティ解析を行う。
我々の研究は、元の戦略と比較して、安全な鍵レートと送信距離を著しく向上させることができる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 01:20:51 GMT)
Estimation of System Parameters Including Repeated Cross-Sectional Data through Emulator-Informed Deep Generative Model [5.3] 政治、経済学、生物学において、利用可能なデータは、しばしば異なる主題から異なる時点に独立して収集される。
従来の最適化手法は、RCSデータが様々な不均一性を示すとき、DECパラメータを正確に推定するのに苦労する。
エミュレータインフォームド・ディープジェネレーション・モデル(EIDGM)と呼ばれる新しい推定法を提案する。
EIDGMは物理インフォームドニューラルネットワークベースのエミュレータを統合しており、DECソリューションとワッサーシュタイン生成逆ネットワークベースのパラメータジェネレータを即座に生成する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:19:23 GMT)
MVTamperBench: Evaluating Robustness of Vision-Language Models [5.3] ビデオ改ざん効果に対するVLMのレジリエンスを評価するためのベンチマークであるMVTamperBenchを紹介する。
MVTamperBenchは、InternVL2-8Bのようなモデルで高い性能を実現している。
MVTamperBenchはモジュール評価ツールキットであるVLMEvalKitに統合されている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:47:05 GMT)
Estimating time in quantum chaotic systems and black holes [5.3] 我々はカオス量子多体系の力学の新しい普遍的特徴を特徴づける。
カオス系におけるほとんどのマクロ観測可能量は、ほぼ一定の深夜値に等しい。
ホーキングの状態は常に、放射線を使って時間を推定しようとする試みに対して大きな不確実性を持っている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 19:00:02 GMT)
CodeUltraFeedback: An LLM-as-a-Judge Dataset for Aligning Large Language Models to Coding Preferences [5.2] LLM-as-a-Judge法を用いて、LLMと符号化優先のアライメントを評価する。
CodeUltraFeedbackは1万のコード命令で構成され、それぞれに14 LLMの多様なプールから生成される4つの応答が注釈付けされている。
次に、教師付き微調整(SFT)とAIフィードバックからの強化学習(RLAIF)を用いたCodeLlama-7B-Instructの微調整のためのフィードバックデータとしてのCodeUltraFeedbackの利用について検討する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:13:23 GMT)
Hear the Scene: Audio-Enhanced Text Spotting [5.1] テキストスポッティングモデルのトレーニングに転写アノテーションのみを活用する革新的なアプローチを導入する。
提案手法では,暗黙的な位置特徴の学習を容易にする問合せに基づくパラダイムを用いている。
より正確なテキストインスタンスのローカライズを行うために、粗大から細粒のクロスアテンションローカライズ機構を導入する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:44:05 GMT)
Temporal Context Consistency Above All: Enhancing Long-Term Anticipation by Learning and Enforcing Temporal Constraints [4.9] 本稿では,初期未トリミング映像区間の観察から,動画中の動作ラベルとその持続時間を予測する手法を提案する。
並列デコーディングを備えたエンコーダ・デコーダアーキテクチャ上に構築し,2つの重要なコントリビューションを行う。
LTA,EpicKitchen-55,EGTEA+,50Salads,Breakfastの4つのベンチマークデータセットに対して,本手法の有効性を検証する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:29:10 GMT)
Chimera: A Block-Based Neural Architecture Search Framework for Event-Based Object Detection [4.9] イベントベースのカメラは、高速ロバスト性や低消費電力といった利点を提供する。
Chimeは、イベントベースのオブジェクト検出用に特別に設計されたブロックベースのニューラルネットワークフレームワークである。
PErson Detection in Roboticsデータセットの結果は、最先端の最先端モデルに匹敵するパフォーマンスレベルを示した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:50:44 GMT)
Efficient quantum pseudorandomness under conservation laws [4.8] 局所的に生成するユニタリ設計の効率は、量子擬似ランダム性の統計的概念を捉える。
任意の局所対称回路が効率的に2次元設計を生成できるかどうかという問題は、それを行うのが確実な回路構造を持たないままである。
直接的応用として、我々の構成は、ほぼ最適に近い量子誤り訂正符号を効率的に生成するのに利用できる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 06:43:10 GMT)
Feature Alignment-Based Knowledge Distillation for Efficient Compression of Large Language Models [4.7] 本研究では,大規模言語モデルと特徴アライメントに基づく知識蒸留アルゴリズムを提案する。
提案モデルは, パープレキシティ, BLEU, ROUGE, CER などの評価指標を用いて, 最先端の GPT-4 モデルに非常に近い性能を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:37:06 GMT)
PyraNet: A Large Scale Hierarchical Verilog Dataset [4.6] 我々は、PiraNetと呼ぶ多層構造を利用した、新しいオープンソースデータセットとそれに対応する微調整技術を紹介する。
実験により、提案したデータセットと微調整アプローチを用いることで、より正確な微調整モデルが得られ、構文的に、機能的に正しいVerilogコードを生成することが示された。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 01:07:02 GMT)
Reducing QUBO Density by Factoring Out Semi-Symmetries [4.6] 本稿では,QUBO行列におけるテクステミシンメトリの概念を紹介する。
提案アルゴリズムは結合数と回路深さを最大45%削減することを示した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:49:23 GMT)
Data Poisoning in LLMs: Jailbreak-Tuning and Scaling Laws [4.6] 我々は新しい攻撃パラダイムであるjailbreak-tuningを開発し、データ中毒とjailbreakを組み合わせ、最先端の保護を全面的にバイパスする。
悪意のある微調整、不完全なデータキュレーション、意図的なデータ汚染の3つの脅威モデルを評価する。
我々の実験では、より大きなLSMは、より小さなモデルよりも、有害なデータへの最小限の露出から有害な振る舞いを学習し、データ中毒にかなり敏感であることが判明した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:40:04 GMT)
Convergence analysis of wide shallow neural operators within the framework of Neural Tangent Kernel [4.3] ニューラルタンジェントカーネル(NTK)の枠組みにおける幅の狭いニューラル作用素の勾配降下の収束解析を行う。
過度なパラメータ化の設定の下で、勾配降下は連続時間であるか離散時間であるかに関わらず、大域的な最小値を見つけることができることを示した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 11:57:40 GMT)
Enhancing Fine-grained Image Classification through Attentive Batch Training [4.0] バッチ画像の視覚的特徴ベクトルを統合するために,Residual Relationship Attention (RRA) と呼ばれる新しいモジュールを提案する。
また、バッチ内の原画像間の関係の位置を符号化する関係位置という新しいフレームワークを設計する。
提案手法は, CUB200-2011およびStanford Dogデータセット上での, $(+2.78%)$および$(+3.83%)$の平均値の増加により, 異なる粒度分類器の精度が大幅に向上したことを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 12:07:58 GMT)
Revisiting PCA for time series reduction in temporal dimension [4.0] 我々は,主成分分析(PCA)を再検討し,時系列データに対する時間次元の削減におけるその有用性について検討する。
PCAはインフォーマトレーニングと推論速度を最大40%改善し、TimesNetのGPUメモリ使用量を30%削減する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:17:26 GMT)
Global Prediction of COVID-19 Variant Emergence Using Dynamics-Informed Graph Neural Networks [3.9] 新たな変種の普及を予測するための現在の手法は、統計的モデリングに依存している。
既存の変種が特定のリージョンにいつ到着するかを予測できますか?
変動力学インフォームドグラフニューラルネット(GNN)手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:43:44 GMT)
Mask-adaptive Gated Convolution and Bi-directional Progressive Fusion Network for Depth Completion [3.6] エンコーダ・デコーダ構造に基づく深度補完のための新しいモデルを提案する。
本モデルでは,マスク適応型Gated Convolutionアーキテクチャと双方向プログレッシブフュージョンモジュールの2つの重要なコンポーネントを紹介する。
深度マップの完成と既存手法の精度と信頼性に優れる性能を実現した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 02:22:16 GMT)
Comparative Performance Analysis of Quantum Machine Learning Architectures for Credit Card Fraud Detection [3.5] 本研究では3つのQML分類器の性能に異なる量子特徴写像とアンザッツ構成がどう影響するかを検討する。
VQCは引き続き強力な分類結果を示し、F1スコアは0.88であり、SQNNも有望な結果をもたらす。
対照的に、EQNNは、非標準化されたデータによってもたらされる課題を強調しながら、堅牢な結果を生み出すのに苦労している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:17:34 GMT)
Gx2Mol: De Novo Generation of Hit-like Molecules from Gene Expression Profiles via Deep Learning [3.5] 本稿では、遺伝子発現プロファイルを利用して、任意の標的タンパク質に好適な表現型を持つ分子構造を生成する、深層生成モデルGx2Molを提案する。
本アルゴリズムでは、変異オートエンコーダを特徴抽出器として使用して、遺伝子発現プロファイルの潜在特徴分布を学習する。
ケミカルジェネレータとして長期記憶を利用して、特徴抽出器によって抽出された遺伝子発現プロファイルの特徴条件を満たす構文的に有効なSMILES文字列を生成する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:16:56 GMT)
Bidding Games on Markov Decision Processes with Quantitative Reachability Objectives [3.4] 本研究では,環境不確かさとエージェント間のオークションベースの相互作用を組み合わせた新しいグラフゲーム群について検討する。
我々は、一般のMDPに対して、しきい値と最適なポリシーを近似するバリューイットアルゴリズムを考案する。
しきい値の発見は、単純な確率的なゲームを解くのと同じくらい難しいことを示します。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 12:10:00 GMT)
Assessing Text Classification Methods for Cyberbullying Detection on Social Media Platforms [3.2] 本研究は,サイバーバブル検出領域における既存のテキスト分類手法を適応し,評価することを目的とする。
BERT、RoBERTa、XLNet、DistilBERT、GPT-2.0など、大規模な言語モデルの活用と評価に重点を置いている。
その結果,BERTは性能,時間効率,計算資源のバランスを保っていることがわかった。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 21:22:28 GMT)
Enhancing Cognitive Diagnosis by Modeling Learner Cognitive Structure State [3.0] 理論的には、個人の認知状態は基本的にその認知構造状態と等価である。
学習者の認知構造は、意味のある学習を促進し、学業成績を形作るのに不可欠である。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:41:39 GMT)
User Willingness-aware Sales Talk Dataset [2.9] 大きな障壁は、信頼性のあるユーザ意欲データを備えたセールストークデータセットの欠如である。
われわれのアプローチは、実際の販売相互作用に不可欠な3種類のユーザー意欲に焦点を当てた。
実践的な応用として,ユーザによる購入意図の向上を目的とした販売対話システムを開発し,評価した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:16:10 GMT)
Disparate Model Performance and Stability in Machine Learning Clinical Support for Diabetes and Heart Diseases [2.9] 調査により、慢性疾患データセットとその派生した機械学習モデルにおいて、性別と年齢に関連する不等式が広く明らかになった。
25,000人以上の慢性疾患患者のデータを分析したところ、男女差は軽度であり、男性には予測精度が好ましく、若年者には有意な年齢差がみられた。
特に高齢患者では、7つのデータセットで矛盾した予測精度を示し、データの複雑さとモデルの性能が低下した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:31:14 GMT)
Reinforced Label Denoising for Weakly-Supervised Audio-Visual Video Parsing [2.9] 共同強化学習に基づくラベル記述手法(RLLD)を提案する。
このアプローチにより、ラベルの復号化モデルとビデオ解析モデルの同時学習が可能になる。
本稿では,ラベル記述ポリシーの学習を直接指導する,新たなAVVP検証とソフトリワードフィードバック機構を導入する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:05:56 GMT)
An Adaptive Mixer Allocation Algorithm for the Quantum Alternating Operator Ansatz [2.8] 制約付き最適化問題の解法としてアダプティブミキサーアロケーションアルゴリズム(AMA)を提案する。
AMAはリソース消費を大幅に減らし、QAOA+の回路深度は34.08%$29.77%、CNOTゲートの数は15.05%$18.72%である。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 12:43:36 GMT)
Advantage Distillation for Quantum Key Distribution [2.7] 量子鍵分布は情報理論的に安全な通信を約束する。
データ後処理は、生データからセキュアなキーを抽出する上で重要な役割を果たす。
本稿では,既存のキー蒸留プロトコルをカプセル化し,拡張するためのフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:39:36 GMT)
Transmon qutrit-based simulation of spin-1 AKLT systems [2.7] 量子回路は、興味のある系が局所的な次元が3である場合、全体の回路深さ、すなわちノイズを低減するのに役立つ。
そこで本研究では,パルスゲートを低誤り率に校正し,トランスモンクォートを得る。
我々はこれらのクォートリットを用いて、多くの興味深い現象を示す1次元スピン-1 AKLT状態のシミュレートを行う。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:32:39 GMT)
Evaluation of data driven low-rank matrix factorization for accelerated solutions of the Vlasov equation [2.6] 人工ニューラルネットワークを用いたデータ駆動分解法を提案する。
このステップは標準線形代数法よりも高速であることを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 22:12:36 GMT)
An In-Depth Analysis of Adversarial Discriminative Domain Adaptation for Digit Classification [2.5] 我々は、ADDA(Adversarial Discriminative Domain Adaptation)と呼ばれる特定の逆学習手法を実装している。
以上の結果から,ADDAはドメイン内性能に最小限の影響を伴って,特定のドメインシフトの精度を著しく向上することが示された。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 00:36:40 GMT)
Numerical solutions of fixed points in two-dimensional Kuramoto-Sivashinsky equation expedited by reinforcement learning [2.4] 本稿では, 深部強化学習(DRL)によるJacobian-Free Newton-Krylov法(JFNK)の有効性向上のための組み合わせアプローチを提案する。
文献に報告されていない2次元倉本・シヴァシンスキー方程式(KSE)の固定点の新結果について報告する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:01:34 GMT)
Enhancing Whisper's Accuracy and Speed for Indian Languages through Prompt-Tuning and Tokenization [2.4] 本稿では,インドの言語におけるWhisperの多言語音声認識性能を高めるための2つの新しいアプローチについて検討する。
まず,言語的に類似した言語におけるWhisperの精度を高めるために,言語家族情報を用いたプロンプトチューニングを提案する。
第二に、生成したトークンの数を減らし、Whisperの推論速度を加速する新しいトークン化器を導入する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:32:24 GMT)
SurgiTrack: Fine-Grained Multi-Class Multi-Tool Tracking in Surgical Videos [2.4] この研究は、外科的ツールトラッキングの新しい標準を設定し、最小侵襲の手術に対してより適応的で正確な支援を行うためのダイナミックな軌跡を提供する。
本稿では,ツール検出にYOLOv7を活用する新しいディープラーニング手法であるSurgiTrackを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:24:45 GMT)
PreNeT: Leveraging Computational Features to Predict Deep Neural Network Training Time [2.4] 本稿では,この最適化課題に対処するために設計された新しい予測フレームワークであるPreNeTを紹介する。
PreNeTの重要な特徴は、これまで検討されていなかったハードウェアインフラストラクチャのトレーニング期間を正確に予測する能力である。
実験の結果,PreNeTは現代の最先端フレームワークと比較して,予測精度が最大72%向上していることがわかった。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 02:48:04 GMT)
Optimizing Local-Global Dependencies for Accurate 3D Human Pose Estimation [2.1] SSR-STFは,局所的な特徴をグローバルな依存関係と統合し,人間の3次元ポーズ推定を強化する2重ストリームモデルである。
具体的には,SSRFormerについて紹介する。SSRFormerは,スケルトン選択的精細注意(SSRA)機構を用いて,局所的なきめ細かい依存関係を捕捉するシンプルなモジュールである。
Human3.6M と MPI-INF-3DHP のデータセットの実験では、SSR-STF がそれぞれ37.4 mm と 13.2 mm の誤差で最先端のパフォーマンスを達成した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:54:12 GMT)
DGNN-YOLO: Interpretable Dynamic Graph Neural Networks with YOLO11 for Small Object Detection and Tracking in Traffic Surveillance [2.1] 本稿では,動的グラフニューラルネットワーク(DGNN)をYOLO11と統合した新しいフレームワークであるDGNN-YOLOを紹介する。
グラフ構造の構築と更新により、DGNN-YOLOはオブジェクトをノードとして、インタラクションをエッジとして効果的に表現する。
実験により、DGNN-YOLOは様々な交通条件下で小さな物体を検出し、追跡する最先端の手法より一貫して優れていた。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:24:20 GMT)
Convergence of SGD with momentum in the nonconvex case: A time window-based analysis [2.0] モーメント付き勾配指数降下法(SGDM)は,大規模最適化問題の解法としてよく用いられる手法である。
その人気にもかかわらず、SGDMは非収束シナリオでは理解されていない。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:23:03 GMT)
Developing Cryptocurrency Trading Strategy Based on Autoencoder-CNN-GANs Algorithms [1.9] 本稿では、機械学習アルゴリズムを用いて財務時系列の予測と分析を行う。
プロセスは、主契約価格データからランダムなノイズ変動をフィルタリングするデノナイジングオートエンコーダから始まる。
1次元畳み込みは、フィルタリングデータの次元性を減少させ、キー情報を抽出する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:28:43 GMT)
Seq2Seq Model-Based Chatbot with LSTM and Attention Mechanism for Enhanced User Interaction [1.9] 本研究では、注意機構とLong Short-Term Memory(LSTM)セルを組み込んだエンコーダデコーダアーキテクチャを備えたSeq2Seqモデルを提案する。
提案されているSeq2Seqモデルベースのロボットは、モロッコのドラア・タフィラレ(Draa-Tafilalet)にある観光セクター向けのデータセットで訓練され、検証され、テストされている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 23:50:54 GMT)
Personality Differences Drive Conversational Dynamics: A High-Dimensional NLP Approach [1.9] 我々は、見知らぬ人との対話の軌跡を高次元空間にマッピングする。
本研究は,オープンネスの個性次元の差が大きいインターロケータが相互に影響し,幅広い話題を議論するのにより多くの時間を費やすことを示唆している。
また、参加者の感情(感情)が会話の前から後までどのように変化するかを調べ、外転の差が大きいと影響の差が大きくなることを予測している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 19:27:19 GMT)
Quantum Many-Body Lattice C-R-T Symmetry: Fractionalization, Anomaly, and Symmetric Mass Generation [1.8] 全ての時空次元におけるC-R-T-内部対称性の異常について検討する。
スタッガード・マヨラナ・フェルミオンの8つのコピーまたはスタッガード・ディラック・フェルミオンの4つのコピーはSMGを認めている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 15:36:31 GMT)
Improved image display by identifying the RGB family color space [1.8] 画素埋め込みとガウス過程を用いて色画像の色空間を同定する。
Adobe RGB、Apple RGB、ColorMatch RGB、ProPhoto RGB、sRGBの5つのカラースペースがサポートされている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:14:54 GMT)
Online High-Frequency Trading Stock Forecasting with Automated Feature Clustering and Radial Basis Function Neural Networks [1.8] 本研究では,高周波取引(HFT)株価予測のための自律的実験機械学習プロトコルを提案する。
k-meansアルゴリズムを放射基底関数ニューラルネットワーク(RBFNN)に組み込むことで,手動クラスタリングの課題に対処する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 00:43:39 GMT)
Data-driven tool wear prediction in milling, based on a process-integrated single-sensor approach [1.7] 本研究では,ツール摩耗予測のためのデータ駆動手法,特にディープラーニングについて検討する。
この研究は、畳み込みニューラルネットワーク(CNN)、長期記憶ネットワーク(LSTM)、サポートベクターマシン(SVM)、決定木など、いくつかの機械学習モデルを評価する。
ConvNeXtモデルには例外的な性能があり、装着するまで操作された4つのミリングツールのデータを用いてツール摩耗を特定する精度は99.1%である。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 23:10:32 GMT)
Markov Process-Based Graph Convolutional Networks for Entity Classification in Knowledge Graphs [1.6] マルコフプロセスに基づくアーキテクチャをよく知られたグラフ畳み込みネットワーク(GCN)に導入する。
このエンドツーエンドネットワークは、マルコフプロセス内の知識グラフにおけるエンティティのクラスアフィリエイトの予測を学習する。
実験は、いくつかの研究されたアーキテクチャとデータセットにおいて、既存のモデルよりもパフォーマンスが向上したことを示している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 11:49:53 GMT)
Differentiable Optimization of Similarity Scores Between Models and Brains [1.5] 線形回帰、CKA(Centered Kernel Alignment)、正規化バーレス類似度(NBS)、角状プロクリスト距離といった類似度は、この類似度を定量化するためにしばしば用いられる。
本稿では、類似度の高いスコアと「良い」スコアを構成するスコアについて調査する新しいツールについて紹介する。
驚くべきことに、高い類似度スコアは、ニューラルデータと整合した方法でタスク関連情報を符号化することを保証していない。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 19:46:07 GMT)
Approximation Rates in Fréchet Metrics: Barron Spaces, Paley-Wiener Spaces, and Fourier Multipliers [1.5] フーリエ領域の対応する記号を近似することで線形微分作用素の一般近似機能について検討する。
その意味で、近似誤差をFr'echetメートル法で測定する。
すると、我々は主定理の自然な拡張に焦点を合わせ、そこでは半ノルムの列の仮定を小さくすることができる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 20:16:04 GMT)
Pilot-Quantum: A Quantum-HPC Middleware for Resource, Workload and Task Management [1.4] Pilot-Quantumは、ハイブリッド量子古典環境におけるリソースとワークロードの統一されたアプリケーションレベルの管理を提供するように設計されている。
リソース、ワークロード、タスクを管理するために、もともとHPC用に開発されたPilot Abstraction概念モデルを実装している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:24:51 GMT)
HADES: Hardware Accelerated Decoding for Efficient Speculation in Large Language Models [1.2] 大規模言語モデル(LLM)は、人間に似たテキストを理解し、生成することで自然言語処理に革命をもたらした。
本稿では,LLMの性能とエネルギー効率を向上させる新しい手法であるハードウェア高速化復号法(HADES)を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 21:19:01 GMT)
Pivoting B2B platform business models: From platform experimentation to multi-platform integration to ecosystem envelopment [1.1] 製造業におけるデジタル化の進展は、従来の製品中心からプラットフォームビジネスモデル(BM)への戦略的シフトによって特徴づけられる。
本稿では,B2BプラットフォームBMとデジタルサービテーションの文献を前進させ,進行的アプローチの有効性と戦略的ピボットについて述べる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 21:34:05 GMT)
Reinforcement Learning for Multi-Truck Vehicle Routing Problems [0.9] 既存のエンコーダ・デコーダのアテンションモデルに新たな拡張を加えて,複数のトラックとマルチレグルーティング要求を処理できるようにした。
私たちのモデルには、少数のトラックやノードに対してトレーニングを行い、大きなサプライチェーンに組み込んで、多数のトラックやノードに対するソリューションを提供するという利点があります。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:42:17 GMT)
Leveraging Scene Geometry and Depth Information for Robust Image Deraining [0.9] 画像のデライン化は、雨条件下での自動運転車のビジョンを高める大きな可能性を秘めている。
従来の研究は主に、デライン画像を生成するために単一のネットワークアーキテクチャを使うことに重点を置いてきた。
本稿では,複数のネットワークを統合した新しい学習フレームワークを紹介する。デレーニングのためのオートエンコーダ,深度情報を組み込む補助ネットワーク,雨と澄んだシーン間の特徴整合性を強制する2つの監視ネットワークである。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 20:18:46 GMT)
Causal machine learning for heterogeneous treatment effects in the presence of missing outcome data [0.9] 条件付き平均治療効果(CATE)に対する因果的機械学習推定器に欠落した結果データが与える影響について論じる。
我々はCATE(mDR-learner)とmEP-learner(mEP-learner)の2つの非バイアス機械学習推定器を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:10:03 GMT)
DAG-aware Transformer for Causal Effect Estimation [0.8] 因果推論は、医療、経済学、社会科学などの分野における重要な課題である。
本稿では,これらの課題を克服する因果推論のためのトランスフォーマーを用いた新しい手法を提案する。
我々のモデルの中核となる革新は、注意機構に直接因果非巡回グラフ(DAG)を統合することである。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:16:12 GMT)
Deep Learning with Uncertainty Quantification for Predicting the Segmentation Dice Coefficient of Prostate Cancer Biopsy Images [0.7] 深層学習モデル(DLM)は病理組織像の分類と分類において最先端のパフォーマンスを達成することができる。
DLMの不確実性推定は、さらなるレビューを必要とする予測や画像を特定することによって信頼を高めることができる。
本研究は,無作為重量法とモンテカルロ下降法を用いて不確実性評価を訓練したDLMを用いて,顕微鏡的ヘマトキシリンおよびエオシン色素染色前立腺核生検組織像RGB画像から腫瘍を分離した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 22:21:01 GMT)
Single-qubit quantum gate at an arbitrary speed [0.7] 強結合かつ超高速な状態下で単一量子ゲートの普遍的な集合を構築することが可能であることを示す。
中心周波数のスケーリング挙動は,長門時間系から短門時間系への遷移を観察する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:05:27 GMT)
Exploiting Domain-Specific Parallel Data on Multilingual Language Models for Low-resource Language Translation [0.6] ドメイン固有NMTモデル構築における補助領域からの並列データの有効性を評価する。
NMTモデルの性能に対する領域分散の影響について検討する。
ドメイン固有NMTモデルの構築において補助並列データを利用するためのいくつかの戦略を推奨する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:25:52 GMT)
Enhancing Vision-Language Tracking by Effectively Converting Textual Cues into Visual Cues [0.6] Vision-Language Trackingは、ビジュアルテンプレートと言語記述を使用して、ターゲットをビデオシーケンスにローカライズすることを目的としている。
現在のデータセットはテキストよりもはるかに多くの画像データを含んでいるため、2つのモードを効果的に調整するVLTメソッドの能力は制限されている。
基礎地盤モデルの強力なテキスト画像アライメント機能を利用するCTVLTという新しいプラグイン・アンド・プレイ手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:54:32 GMT)
Machine Generated Product Advertisements: Benchmarking LLMs Against Human Performance [0.6] 本研究は,多面的評価モデルを用いて,AIによる製品記述と人手による製品記述の性能を比較した。
我々は、4つのAIモデルによって生成された100の製品について、サンプル記述と非サンプル記述による記述を、人間による記述に対して分析する。
その結果,ChatGPT 4が最高性能を示した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 12:11:50 GMT)
IMAGINE: An 8-to-1b 22nm FD-SOI Compute-In-Memory CNN Accelerator With an End-to-End Analog Charge-Based 0.15-8POPS/W Macro Featuring Distribution-Aware Data Reshaping [0.6] 作業負荷適応型1-to-8b CIM-CNNアクセラレータであるIMAGINEを22nm FD-SOIで紹介する。
1152x256のエンドツーエンドのチャージベースマクロと、パワーハングリーDACを回避する入力シリアル、ウェイトパラレルの蓄積に基づくマルチビットDPを導入している。
測定結果は、MNISTとCIFAR-10の競争力を持つ、0.3/0.6Vで40TOPS/Wの8b系レベルのエネルギー効率を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:18:15 GMT)
A non-semisimple non-invertible symmetry [0.6] スピン鎖に対する非半単純非可逆対称性の作用について検討する。
積状態といわゆる W 状態が自発的に対称性を破るモデルを見つける。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:27:24 GMT)
A Neural Network-Based Search for Unmodeled Transients in LIGO-Virgo-KAGRA's Third Observing Run [0.6] 本稿では, LIGO, Virgo, KAGRAの3回観測結果から, ニューラルネットワークを用いた短周期重力波トランジェント探索の結果について述べる。
探索は、30-1500Hzの周波数帯域でミリ秒から数秒間、受信信号の方向、偏光、形態について仮定することなく、未モデル化のトランジェントをターゲットにしている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 19:00:01 GMT)
From prediction to explanation: managing influential negative reviews through explainable AI [0.5] 本研究では、影響力のあるネガティブレビューを特定することを目的とした、新しい説明可能なAI(XAI)アルゴリズムを提案する。
101,338のレストランレビューで実施された実験は、アルゴリズムの有効性を検証した。
このアルゴリズムを活用することで、オンラインのネガティブなフィードバックを予測、知覚、戦略的に応答するための実用的な洞察を得ることができる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 15:37:19 GMT)
Outfox: a Packet Format for a Layered Mixnet [0.5] Outfoxは層暗号化に基づくパケットフォーマットである。
層状応答可能なミキサネットの理想的な機能について述べる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 21:53:56 GMT)
Generative Pretrained Embedding and Hierarchical Irregular Time Series Representation for Daily Living Activity Recognition [0.5] 本稿では,環境センサアクティベーションに適した2つの異なる事前学習型埋め込みの評価により,既存のアルゴリズムを活性化することを目的とする。
我々は、Transformer Decoderベースの事前トレーニングされた埋め込みアーキテクチャを探索し、GPT設計を思い起こさせる。
結論として、GPTにインスパイアされた階層的アプローチは、時間的洞察によって注入され、SOTA ELMoベンチマークより優れている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:43:52 GMT)
LLOR: Automated Repair of OpenMP Programs [0.4] 本稿では,OpenMP APIを用いてC/C++とFortranで記述された並列プログラムにおいて,データ競合エラーを修復する手法を提案する。
LLORは言語に依存しないアプローチを採用し、データ競合を避けるために同期構造を適切に配置する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:08:00 GMT)
Optimization of Connection Patterns between Mobile Phones and Base Stations using Quantum Annealing [0.4] 現在のモバイルネットワークでは、特定のエリアの携帯電話基地局が接続する基地局を最適化することが、各携帯電話の通信品質の確保に不可欠である。
本研究では,量子揺らぎを用いた一般的な解法である量子アニールを用いて,基地局への接続パターンを最適化する。
可変リダクションの定式化を採用することにより、典型的には用いられるナイーブの定式化と比較して、キュービットの要件を著しく削減する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:57:21 GMT)
Exponentially accurate open quantum simulation via randomized dissipation with minimal ancilla [0.4] リンドブラッド力学をシミュレートするいくつかの量子アルゴリズムは、精度$varepsilon$で対数的に短い回路深さを達成する。
観測可能な推定を目的とした複数のジャンプ演算子を用いて一般リンドブラッド力学をシミュレーションする量子アルゴリズムを提案し,対数的に短い回路深さと最小アンシラサイズの両方を達成する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:43:19 GMT)
A Time Series Analysis of Assertions in the Linux Kernel [0.3] 本論文は,Linuxカーネルにおけるアサーション利用の経年変化を実証的に検討する。
カーネルパニックを引き起こすアサーションの使用は、カーネルの3番目のリリースシリーズから6番目のリリースシリーズまで、わずかに減少することはなかった。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:22:09 GMT)
Significant circular Unruh effect at small acceleration [0.2] ウンルー効果の円形バージョンは、非常に小さな遠心加速でも有意であることがわかった。
この発見は、円形のウンルー効果の実験的検出に新たな光を放つ。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:45:56 GMT)
Efficient and high-performance routing of lattice-surgery paths on three-dimensional lattice [0.2] 格子探索命令に対する高速かつ高性能なスケジューリングアルゴリズムを提案する。
本稿では,量子位相推定アルゴリズムから生成されたベンチマークプログラムの実行時間を2.7倍に削減する手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:08:51 GMT)
YOLO-MST: Multiscale deep learning method for infrared small target detection based on super-resolution and YOLO [0.2] 本稿では,画像超解像技術とマルチスケール観測を組み合わせた深層学習赤外線小目標検出手法を提案する。
この手法の2つの公開データセットであるSIRSTとIRISでのmAP@0.5検出率は、それぞれ96.4%と99.5%に達した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:43:56 GMT)
MNet-SAt: A Multiscale Network with Spatial-enhanced Attention for Segmentation of Polyps in Colonoscopy [0.1] 大腸内視鏡画像におけるポリプセグメンテーションのためのMNetSAt(Multiscale Network with spatial-enhanced Attention)を提案する。
このフレームワークには、エッジガイド機能強化(EGFE)、マルチスケール機能集約(MSFA)、空間拡張注意(SEAt)の4つの重要なモジュールが含まれている。
我々は,Kvasir-SEGデータセットとCVC-ClinicDBデータセット上でMNet-SAtを評価し,96.61%,98.60%のDice類似度係数をそれぞれ達成した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:17:29 GMT)
GenDFIR: Advancing Cyber Incident Timeline Analysis Through Retrieval Augmented Generation and Large Language Models [0.1] デジタル法医学とインシデント応答(DFIR)におけるサイバータイムライン解析の重要性
伝統的な手法は、証拠の識別と特徴抽出のためにログやメタデータのような構造化された成果物に依存している。
本稿では,大規模言語モデル(LLM)を利用したフレームワークであるGenDFIR,特にゼロショットモードのLlama 3.1 8Bについて紹介し,Retrieval-Augmented Generation (RAG)エージェントと統合する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:29:14 GMT)
g-factor theory of Si/SiGe quantum dots: spin-valley and giant renormalization effects [0.0] Si/SiGe量子ドットの$g$-factor物理を理解することは、高品質なスピン量子ビットの実現に不可欠である。
我々は容易に計算可能な行列要素の観点で$g$を与える理論を構築する。
従来のSi/SiGe量子井戸と比較して、$g$-factorのかなりの再正規化が見られる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:50:38 GMT)
Zero-shot Hazard Identification in Autonomous Driving: A Case Study on the COOOL Benchmark [0.0] 本稿では,自動運転におけるラベル外ハザードの検出と分類のための新しいベンチマークであるCOOOLコンペティションについて述べる。
本手法は, 運転者反応検出, (ii) 危険物識別, (iii) 危険キャプションの3つのタスクにまたがる多様な手法を統合する。
提案されたパイプラインはベースライン手法を大きなマージンで上回り、相対誤差を33%減らし、32チームからなる最終リーダーボードで2位となった。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 22:43:46 GMT)
Uncertainty quantification for improving radiomic-based models in radiation pneumonitis prediction [0.0] 放射線肺炎は放射線療法の副作用である。
最近の機械学習(ML)モデルでは、放射能とDosiomic特徴が強化され、より良い予測が可能になった。
モデル予測の信頼性を向上させるために不確実性定量化(UQ)を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:01:42 GMT)
Two superconducting thin films systems with potential integration of different quantum functionalities [0.0] シリコン(Si)上に成長したコバルト(Co)薄膜は超伝導であることが判明した。
ハイブリッドCo膜の超伝導とCoSi$$の超伝導
T_c$の関数としての磁場走査は、このピークの強度と温度のモノトニックな増加を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:23:20 GMT)
Traversing Quantum Control Robustness Landscapes: A New Paradigm for Quantum Gate Engineering [0.0] 本稿では,制御パラメータを雑音感受性にマッピングする概念的フレームワークであるQuantum Control Robustness Landscape (QCRL)を紹介する。
QCRLをナビゲートすることで、ロバストネス不変パルス変動は、ロバスト性を維持しながら制御パルスの変動を可能にする。
数値シミュレーションにより、我々の単一および2量子ビットゲートは、大きなノイズがあっても量子誤差補正しきい値を超えていることが示される。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:56:38 GMT)
Towards Strong AI: Transformational Beliefs and Scientific Creativity [0.0] 強力な人工知能(AI)は、人間の知能に匹敵する一般的な認知能力と科学的創造性を持つことが想定されている。
弱い信念の単純な理論的・統計的枠組みを導入し,その枠組みを変換的信念(TB)と呼ぶ。
TBフレームワークが創造性を理解し、分析し、育成するための有望な基盤となる可能性を実証する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 22:02:36 GMT)
The Instability of a Quantum Superposition of Time Dilations [0.0] 重力ポテンシャルの重畳が非単位時間進化に繋がることを示した。
しかし、弱い重力場の重畳におけるプローブ粒子は、異なる時間拡張により劣化する。
対応する不安定な時間スケールは実験に利用可能であり、マクロの度合いとして使用することができる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:02:53 GMT)
Text2Insight: Transform natural language text into insights seamlessly using multi-model architecture [0.0] Text2Insightは、ユーザ定義の自然言語要求に基づいて、カスタマイズされたデータ分析と視覚化を提供する革新的なソリューションである。
解析能力を向上するため,BERTフレームワークを用いた質問応答モデルと予測モデルを統合した。
Text2Insightの性能評価は高い精度(99%)、精度(100%)、リコール(99%)、F1スコア(99%)、BLEUスコア0.5。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:17:22 GMT)
Tensor Network Estimation of Distribution Algorithms [0.0] 近年の論文では、テンソルネットワークを進化最適化アルゴリズムに統合する手法が登場している。
これらの手法の最適化性能は, 生成モデルのパワーと直接的に関係しないことがわかった。
これを踏まえると、生成モデルの出力に明示的な突然変異演算子を加えることで、最適化性能が向上することがしばしばある。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:22:47 GMT)
Symbolic Approximations to Ricci-flat Metrics Via Extrinsic Symmetries of Calabi-Yau Hypersurfaces [0.0] 我々は、Fermat Calabi-Yau n-foldsの平坦なメトリクスに機械学習の近似を解析する。
このような対称性が特定の軌跡上の平坦な計量を一意に決定することを示します。
ほぼゼロのスカラー曲率を持つケーラー計量の閉形式式をMLモデルを蒸留して初めて得られる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:19:26 GMT)
Surrogate Modeling for Explainable Predictive Time Series Corrections [0.0] 古典的時系列'ベースモデル'の予測を改善するために、当初は解釈不能な予測モデルが使用される。
補正の「説明可能性」は、誤り予測を除去したデータに再びベースモデルを適合させることで提供される(減算)。
本稿では,データ中のパターンを発見し,説明するための手法の可能性を示すための例を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 19:17:02 GMT)
Stroke Prediction using Clinical and Social Features in Machine Learning [0.0] ストロークは世界で2番目に多い死因である。
脳卒中は世界第2位の死因であり、生活習慣に基づく脳卒中確率を予測することが重要である。
この分析は、脳卒中予測のためのニューラルネットワーク(密度と畳み込み)とロジスティック回帰モデルを比較する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 23:05:16 GMT)
Streamlined Krylov construction and classification of ergodic Floquet systems [0.0] 我々は、クリロフ構成を周期的に駆動される(フロケ)量子系に一般化する。
また、カオス的で可積分なフロケ系の分類を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:56:27 GMT)
Speed-Accuracy Trade-Off Relations in Quantum Measurements and Computations [0.0] 我々はエネルギー保存法と地域性に基づく基本的な速度・精度のトレードオフ関係を確立する。
我々のトレードオフは、ハミルトニアンと非可換な作用素に対するゼロエラー測度が有限時間で実装できないというノーゴー定理として機能する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:00:08 GMT)
Signatures of the quantum skyrmion Hall effect in the Bernevig-Hughes-Zhang model [0.0] 我々は、量子スピンホール絶縁体に対する標準ベルネヴィグ・ヒューズ・チャン(BHZ)モデルを再検討する。
我々は,4次元チャーン絶縁体と同様の現象を観測し,時間反転対称性の弱さから明らかにした。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:11:23 GMT)
Segal-Bargmann type spaces related to non-rotational measure, and entanglement of bipartite squeezed coherent states [0.0] 2つの複素変数の正則エルミート関数によって生じる二部分断状態の絡み合いについて検討した。
2粒子量子力学系を開発した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 12:36:59 GMT)
Rules still work for Open Information Extraction [0.0] 本稿では,中国語テキストに適した革新的なオープン情報抽出モデルであるAPRCOIEを提案する。
モデルをトレーニングするために,大規模な中国語OIEデータセットを手動でアノテートした。
比較評価では、APRCOIEが現在の中国のOIEモデルより優れていることを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 02:40:36 GMT)
Robust phase estimation of the ground-state energy without controlled time evolution on a quantum device [0.0] 量子系におけるハミルトンの基底状態エネルギーの推定は重要な課題である。
本研究では, 制御時間進化を伴わずに, 基底状態エネルギーを正確に推定できることを実証した。
本手法は非断熱遷移に対して頑健であり,早期の耐故障量子コンピュータでの使用に適している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 11:20:45 GMT)
Revisiting the Bohr Model of the Atom through Brownian Motion of the Electron [0.0] 我々は、ブラウン運動による電子の挙動を記述するために力学を取り入れることで、水素原子のボーアモデルを強化する。
従来の量子力学とは対照的に、我々のモデルは単一粒子の位置の統計的平均化を行うことによってボルン則を導出する。
非常に短い時間スケールで、単一粒子位置の統計的平均化が不十分なため、波動関数に基づく単一電子確率分布が不十分であることを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 20:42:44 GMT)
Rethinking Deep Learning: Non-backpropagation and Non-optimization Machine Learning Approach Using Hebbian Neural Networks [0.0] NNにヘビアン学習を実装することで,生物学的ニューラルネットワークを模倣する機械学習手法を開発した。
ベクトルノルム等級を基準として,約75%の精度でMNIST文字認識プログラムを作成する。
このことは、Hebbian学習NNが客観的関数、バックプロパゲーション、最適化プロセス、巨大なデータセットなしで手書き文字を認識できることを実証している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:39:23 GMT)
Real-time classification of EEG signals using Machine Learning deployment [0.0] 本研究では,ある話題に対する生徒の理解度を予測するための,機械学習に基づくアプローチを提案する。
システムパラメータの値にアクセスして、選択したトピックに対する生徒の集中度を決定するブラウザインターフェースが導入された。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:14:28 GMT)
Readout of strongly coupled NV center-pair spin states with deep neural networks [0.0] 単一ショット読み出し方式を用いると、複合レジスタ空間の集合状態がアクセス可能であることを示す。
欠陥の電荷変換にスピンを用いることで、複雑な光子数統計量とスピン状態トモグラフィーとの接続を描く。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:56:04 GMT)
Quantum Cluster State Model with Haagerup Fusion Category Symmetry [0.0] クラスタ状態モデルの弱いホップ代数一般化に着想を得た(1+1)D格子モデルを提案する。
このモデルはHaagerup圏対称性をサポートし、テンソル積ヒルベルト空間を特徴とすることを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:05:15 GMT)
Pulsed laser as a continuous particle stream [0.0] 複数の光モードの集合粒子状態は、明るい状態よりもかなり多くの暗さを特徴としている。
パルスレーザー光は連続光子ビームを含み、パルス中に光子が明るい状態を形成し、その間に暗い状態が形成されることを示した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:14:41 GMT)
Probability-based approach to hybrid classical-quantum systems of any size: Generalized Gleason and Kraus theorems [0.0] ハイブリッド古典量子系の完全量子有効記述は、古典的部分系が離散的であるときに簡単に定式化できる。
古典量子確率のハイブリッド測度に対する4つの公理から始まる確率に基づくアプローチを提案する。
これらの変換の明示的な表現は、古典的部分系と量子的部分系が相互作用しないときに導かれる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:58:12 GMT)
ProKAN: Progressive Stacking of Kolmogorov-Arnold Networks for Efficient Liver Segmentation [0.0] proKAN は、これらの課題に対処するために設計された Kolmogorov-Arnold Networks (KAN) のプログレッシブなスタック手法である。
proKANは、過度に適合する振る舞いに基づいて、トレーニング中にkanブロックを徐々に追加することで、その複雑さを動的に調整する。
提案アーキテクチャは,肝セグメンテーションタスクにおける最先端性能,MLP(Multi-Layer Perceptrons)および固定kanアーキテクチャよりも優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:14:06 GMT)
Path integral derivation of the thermofield double state in causal diamonds [0.0] 1+1次元の2alpha$の大きさの因果ダイヤモンド上で定義されたスカラー場の経路積分を解析する。
因果ダイヤモンドの熱場二重状態(TFD)とユークリッド経路積分との接続を同定する。
この導出はユークリッド経路積分形式と因果ダイヤモンドのTFD状態の間の接続の普遍性を強調している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:01:23 GMT)
PLN and NARS Often Yield Similar strength $\times$ confidence Given Highly Uncertain Term Probabilities [0.0] 確率論的論理ネットワーク(PLN)と非公理的推論システム(NARS)の導出,誘導,導出式の比較を行った。
PLN と NARS の式は,高次確率不確実性を持つ多くの現実的状況において,推論の結論の力に対して非常によく似た結果を与える。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:31:19 GMT)
Optimizing Helmet Detection with Hybrid YOLO Pipelines: A Detailed Analysis [0.0] 本稿では、信頼性と計算負荷の観点から、ヘルメット検出の文脈における最近のYou Only Look Once (YOLO)モデルと比較する。
この写本では、全体的なパフォーマンスを著しく向上させる修正されたアーキテクチャパイプラインが提案されている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:26:12 GMT)
On some states minimizing uncertainty relations [0.0] 我々は、量子系の大量の状態が存在することを考察する。
これらの状態は、観測可能な$A$または$B$の固有状態ではない。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 19:49:45 GMT)
NijiGAN: Transform What You See into Anime with Contrastive Semi-Supervised Learning and Neural Ordinary Differential Equations [0.0] 本研究では,イメージ・ツー・イメージ翻訳の新しいモデルであるNijiGANを紹介する。
現実のシーンを、Scenimefyのパラメータの半分を使って高忠実なアニメヴィジュアライズに変換する。
Scenimefyを通じて生成された擬似ペアデータを使って教師付きトレーニングを行い、低品質のペアデータへの依存を排除している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 04:46:44 GMT)
Multi-Agent Collaboration in Incident Response with Large Language Models [0.0] インシデント対応(IR)はサイバーセキュリティの重要な側面であり、サイバー攻撃を効果的に対処するために、迅速な意思決定と協調的な努力が必要である。
大きな言語モデル(LLM)をインテリジェントエージェントとして活用することは、IRシナリオにおけるコラボレーションと効率を高めるための新しいアプローチを提供する。
本稿では,Backdoors & Breaches フレームワークを用いた LLM ベースのマルチエージェントコラボレーションの適用について検討する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:32:11 GMT)
Maximal Volume Matrix Cross Approximation for Image Compression and Least Squares Solution [0.0] 最大体積サブマトリクスに基づく古典行列クロス近似について検討する。
改良された定数による古典的不等式推定の新しい証明を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:31:31 GMT)
Lusifer: LLM-based User SImulated Feedback Environment for online Recommender systems [0.0] 本稿では,Lulsiferについて紹介する。LulsiferはLarge Language Models(LLMs)を利用して,シミュレーションされたユーザフィードバックを生成する新しい環境である。
Lusiferはユーザープロファイルとインタラクション履歴を合成し、推奨アイテムに対する反応と振る舞いをシミュレートする。
Lusiferは、RMSE 1.3のトレーニングデータが少なくても、ユーザの振る舞いや好みを正確にエミュレートする。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:44:30 GMT)
Let Watermarks Speak: A Robust and Unforgeable Watermark for Language Models [0.0] 検出不能で頑健な単一ビット透かし方式を提案する。
最上級のゼロビット透かし方式に匹敵する堅牢性を持つ。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 11:58:05 GMT)
Introduction to Graph Neural Networks: A Starting Point for Machine Learning Engineers [0.0] グラフニューラルネットワークは、ノードやエッジにアタッチされた属性を持つグラフ用に設計されたディープニューラルネットワークである。
本調査では,エンコーダ-デコーダフレームワークを通じてグラフニューラルネットワークを導入し,さまざまなグラフ解析タスクに対するデコーダの例を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:13:02 GMT)
Internal diffraction dynamics of trilobite molecules [0.0] トリロビテ分子(英: Trilobite molecules)は、高角運動量リドベリ電子が基底状態原子から散乱する際に形成される超長距離リドベリ分子である。
我々は,これらの分子の振動運動を,断熱波束伝播ダイナミクスの枠組みを用いて解析する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 19:12:28 GMT)
High precision spectroscopy of trilobite Rydberg molecules [0.0] 主量子数 $n = 2224,25,26$, 27 に対して 87$Rb トリロビット二量体の高分解能スペクトルを得る。
分子の大きな結合エネルギーと10-4$の相対分光分解能が組み合わさって、既存の理論モデルに対する厳密なベンチマークを提供する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:04:17 GMT)
Hidformer: Transformer-Style Neural Network in Stock Price Forecasting [0.0] 本稿では,Transformerベースのニューラルネットワークの株価予測への応用について検討する。
機械学習技術と金融市場分析の共通点に焦点を当てている。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 21:34:44 GMT)
HBT interferometry and Quantum Detection of Primordial Gravitational Waves in Hořava-Lifshitz Gravity [0.0] ホヴラヴァ・リフシッツ重力は、重力の正規化可能でユニタリで変分自由な量子場理論として認識されている。
本稿では,Hovrava-Lifshitz重力下で発生した原始重力波の量子的性質について検討する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 08:13:52 GMT)
Gröbner Basis Cryptanalysis of Ciminion and Hydra [0.0] CiminionとHydraは、最近導入された2つの対称鍵 Pseudo-Random- Functions for Multi-Party Computation である。
効率性のために、両プリミティブは2次置換をラウンドレベルで利用する。
システム問題解決に基づく攻撃がこれらのプリミティブに深刻な脅威をもたらすことを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 15:12:33 GMT)
Generative Adversarial Network on Motion-Blur Image Restoration [0.0] 我々は、GAN(Generative Adrial Networks)を活用して、動きのぼやけによるイメージを効果的に損なうことに焦点をあてる。
GANベースの逆流モデルを定義し、GoProデータセットを用いてトレーニングし、評価する。
PNR(Peak Signal-to-Noise Ratio)とSSIM(Structure similarity Index Measure)は、画像品質の定量的測定に使用される2つの評価指標である。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 06:12:50 GMT)
Fully Data-driven but Interpretable Human Behavioural Modelling with Differentiable Discrete Choice Model [0.0] Diff-DCMは、人間の行動の解釈可能なモデリング、学習、予測、制御のための完全なデータ駆動方式である。
実験により、Diff-DCMは様々な種類のデータに適用でき、少量の計算資源しか必要としないことが示された。
この研究は、人間の行動を完全に自動化し、信頼性の高いモデリング、予測、制御のための強力な基礎を提供する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 01:53:18 GMT)
FreStega: A Plug-and-Play Method for Boosting Imperceptibility and Capacity in Generative Linguistic Steganography for Real-World Scenarios [0.0] 言語学的ステガノグラフィーは、秘密情報を一見無実のテキストに埋め込んで、監視環境におけるプライバシーを保護している。
本稿では,FreStegaを提案する。FreStegaは,生成言語ステガノグラフィに使用される言語モデルの分布を再構成するプラグイン・アンド・プレイ方式である。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:56:51 GMT)
Entanglement-Driven Energy Exchange in a Two-Qubit Quantum Battery [0.0] 本研究は,2セル構成(2量子ビット)における細胞間エネルギー伝達の媒介における量子絡み合いの鍵となる役割に焦点をあてる。
その結果, 量子ビット間のエンタングルメントの度合いとエネルギー伝達効率の相関関係が示唆された。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:15:18 GMT)
Enhancing Adversarial Robustness of Deep Neural Networks Through Supervised Contrastive Learning [0.0] 敵攻撃は、知覚不能な摂動を導入することで畳み込みニューラルネットワークの脆弱性を悪用する。
本稿では,教師付きコントラスト学習とマージンに基づくコントラスト損失を組み合わせた新たな枠組みを提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:14:52 GMT)
Effective field theory of the quantum skyrmion Hall effect [0.0] 量子スミリオンホール効果(QSkHE)に対する有効場理論(EFT)を導入する。
私たちはこの目的のために単一の統一的な一般化を採用しています。
ファジィコセット空間上のゲージ場への依存を維持するために一般化された余剰ファジィ次元を持つゲージ理論を同定する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:09:48 GMT)
EEG-Reptile: An Automatized Reptile-Based Meta-Learning Library for BCIs [0.0] メタラーニングを活用する自動ライブラリであるEEG-Reptileを提案し、BCIやその他のEEGベースのアプリケーションにおけるニューラルネットワークの分類精度を改善する。
2つのベンチマークデータセットに対するEEG-Reptileの有効性を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:24:31 GMT)
Do LLMs Really Think Step-by-step In Implicit Reasoning? [0.0] Chain-of-Thoughtは複雑なタスクにおけるLCMのパフォーマンスを向上させる。
多くの研究は、中間ステップを明示的に生成するLLMを必要としない暗黙のCoTの使用を試みた。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 07:04:19 GMT)
Discrete dynamics in the set of quantum measurements [0.0] P_j=P_jdaggeq 0$ の正作用素の集合である。
ブロックワイズ行列による量子測定の集合における離散変換を記述する。
我々は、古典的バーホフ多面体(英語版)のオストロフスキーの記述の量子的類似性(英語版)を定式化する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:57:40 GMT)
Deep ReLU networks -- injectivity capacity upper bounds [0.0] 深部ReLUフィードフォワードニューラルネットワーク(NN)とそのインジェクティビティ能力について検討した。
任意の隠れレイヤアーキテクチャでは、ネットワークの出力と入力の最小比として定義される。
単一ReLU層インジェクティビティ特性の精密研究における最近の進歩は, より深いネットワークレベルに移行している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:57:40 GMT)
DLScanner: A parameter space scanner package assisted by deep learning methods [0.0] 本稿では,ディープラーニング(DL)技術によって強化されたスキャナパッケージを提案する。
提案パッケージは、これまで開発されたDLベースの手法に関連する2つの重要な課題に対処する。
提案手法は,他の走査法と比較して,性能と効率の両面で有意な向上を示した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:52:42 GMT)
Cross-Linguistic Examination of Machine Translation Transfer Learning [0.0] 本研究では,多種多様な言語族を対象とした機械翻訳における伝達学習の有効性について検討した。
この研究は、異なる言語背景からの言語ペアを含んでいる。
その結果,移動学習は言語家族間で有効であることが示唆された。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:34:56 GMT)
Continuous majorization in quantum phase space with Wigner negativity [0.0] 一般の$N$モードの場合において連続体化の理論を発展させる。
我々は、Van Herstraeten, Jabbour, Cerf の予想を$N$モードガウス状態の凸包に対して証明する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 15:51:15 GMT)
Concentration of ergotropy in many-body systems [0.0] 単体抽出可能な最大の仕事量であるエルゴトロピーは、量子電池の電荷レベル'を測定する。
我々は多体電池のエルゴトロピーが測定現象の濃度を示すことを証明した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:58:43 GMT)
Comprehensive Overview of Reward Engineering and Shaping in Advancing Reinforcement Learning Applications [0.0] 本稿では,強化学習アルゴリズムの効率性と有効性を高めるために,報酬工学と報酬形成の重要性を強調する。
強化学習の大幅な進歩にもかかわらず、いくつかの制限が続いた。
主要な課題の1つは、多くの現実世界のシナリオにおける報酬のまばらで遅れた性質である。
実世界の環境を正確にモデル化することの複雑さと強化学習アルゴリズムの計算要求は、依然としてかなりの障害である。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 19:25:58 GMT)
Complement or substitute? How AI increases the demand for human skills [0.0] 本稿では,AIが米国経済のスキル需要と報酬に与える影響について検討する。
雇用・産業・地域全体での内的効果(ジョブ置換・補完)と外的効果(職業・産業・地域全体で)について検討する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 17:26:30 GMT)
Combining Machine Learning with Recurrence Analysis for resonance detection [0.0] ほぼ可積分系における共振の幅は 摂動パラメータが 可積分性からシステムを 遠ざけていることを教えてくれます
EMRIでは、ブラックホールや中性子星のようなより軽いコンパクト物体が、重力放射線による超大質量ブラックホールに吸入する。
軌道の繰り返し量子化器は、系の寸法に関係なく共鳴振舞いのインプリントを持つことを示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 15:20:57 GMT)
Celestial Quantum Error Correction II: From Qudits to Celestial CFT [0.0] 我々は、CFT双対上の補正可能なゆらぎとして真空縮退とIR発散をエンコードする。
このフレームワークは、いわゆるクライン時空にキューディットの連鎖を埋め込むことによって物理的に動機づけられる。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:59:14 GMT)
Can AI Help with Your Personal Finances? [0.0] 大規模言語モデル(LLM)は人工知能(AI)の変革的発展として登場した。
本稿では、米国を中心に、個人金融における重要な課題にLLMが取り組む可能性について考察する。
OpenAIのChatGPT、GoogleのGemini、AnthropicのClaude、MetaのLlamaなど、主要なLLMを評価し、正確な財務アドバイスを提供することの有効性を評価する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:25:27 GMT)
Boosting the generation rate of squeezed single-photon states by generalized photon subtraction [0.0] 一般光子サブトラクション(GPS)は光子サブトラクション(PS)の単純な拡張である
2-dB-および4-dB-スクイーズ単一光子状態の生成速度をPSと比較して1桁以上向上させる実験を行った。
我々の結果は、より高度な量子情報プロトコルへの圧縮された単一光子状態の適用を加速する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 05:36:57 GMT)
Asynchronous Telegate and Teledata Protocols for Distributed Quantum Computing [0.0] 分散量子演算のコストは、絡み合った光子と古典情報の分散によるレイテンシが高い。
本稿では,非同期な古典通信を実現するために,テレゲートプロトコルとテレデータプロトコルの拡張を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:59:59 GMT)
Approximate quantum 3-colorings of graphs and the quantum Max 3-Cut problem [0.0] 各同期非局所ゲーム $mathcalG=(I,O,lambda)$ with $|I|=n$ and $O=m geq 3$ に対して、関連するグラフ $G_lambda$ が存在することを証明している。
また、グラフの非可換Max-$3$-Cutが$E|$か$E|$以下の$alpha |E|$がRE-hardかどうかを判定する$alpha in (0,1)$が存在することを証明している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 02:05:37 GMT)
Analysis of Premature Death Rates in Texas Counties: The Impact of Air Quality, Socioeconomic Factors, and COPD Prevalence [0.0] 統計的分析およびモデリング手法を用いて,大気質(PM2.5レベル),社会経済的要因(中間世帯所得),健康状態(COPD有病率)の影響を解析した。
以上の結果から, COPDは早期死亡率の予測因子として有病率が高く, 有病年数の増加に伴う死亡率の上昇が示唆された。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:12:04 GMT)
An unholy trinity: TFNP, polynomial systems, and the quantum satisfiability problem [0.0] 複素系の研究に基づいて, 完全関数NP (TFNP) の2つの新しいサブクラスを定義する。
我々の研究の中心は、SDR(System of Distinct Representatives)を用いた量子SAT(Quantum SAT)として知られる計算問題である。
本稿では, SFTA がゼロエラー版 SDR に含まれることから, 疎度・高次複雑さの根源を SDR で QSAT に埋め込む方法を示す。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 12:57:06 GMT)
An analogue of the Pöschl-Teller anharmonic oscillator on an $N$-dimensional sphere [0.0] 半径$R$のN$次元(Ngeqslant2$)超球面上のシュル「オーディンガー粒子を考える。
この粒子は、電位$V(theta)=2momega_12R2tan2(theta/2)+2momega_22R2cot2(theta/2)$、$0leqslantthetaleqslantpi$によって特徴づけられる力の作用を受ける。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 14:56:44 GMT)
An access model for quantum encoded data [0.0] ブロック符号化状態の生成と測定に満足するデータアクセスモデル(近似サンプルとクエリ)を導入,検討する。
これは構成的であり、計算能力があることを示す。
これらの結果を用いて, 分散内積推定における標本化と計算複雑性の両立を図った。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:32:08 GMT)
An Integrated Optimization and Deep Learning Pipeline for Predicting Live Birth Success in IVF Using Feature Optimization and Transformer-Based Models [0.0] 本研究は,IVF治療における出生結果の予測を目的とした,堅牢な人工知能パイプラインを開発する。
このパイプラインは、2010年から2018年にかけてHFEA(Human Fertilization and Embryology Authority)から匿名化されたデータを使用する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 15:46:59 GMT)
Adaptive Context-Aware Multi-Path Transmission Control for VR/AR Content: A Deep Reinforcement Learning Approach [0.0] ACMP TCPは、AR/VRストリーミングのようなデータ集約型アプリケーションのパフォーマンスを最適化するために設計されている。
本稿では,適応型コンテキスト対応マルチパス伝送制御プロトコル(ACMP TCP)を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 16:56:12 GMT)
A local automaton for the 2D toric code [0.0] 我々は、Tsirelson と G'acs の階層的古典的セルオートマトンからのアイデアを用いて、2次元トーリック符号の局所デコーダを構築する。
我々のデコーダは、回路レベルのノイズの存在下で指数時間に論理状態を保持する厳密な局所量子演算の回路である。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:59:57 GMT)
A data driven approach to classify descriptors based on their efficiency in translating noisy trajectories into physically-relevant information [0.0] ノイズトラジェクトリから情報を抽出する際の各種記述子の効率を比較検討する。
SOAPやLENSのような先進的な記述子は、信号と雑音の比率が高いため、古典的な記述よりも優れています。
この研究は、分子軌道からの情報抽出におけるノイズの重要な役割を強調している。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 09:56:51 GMT)
A Self-Efficacy Theory-based Study on the Teachers Readiness to Teach Artificial Intelligence in Public Schools in Sri Lanka [0.0] 本研究では,スリランカのICT教師が学校におけるAI教育の準備について,自己効力感に着目して検討した。
1,300人以上の教師を対象とした調査では,バンドラの理論に基づいた尺度を用いて自己効力を評価した。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 03:31:26 GMT)
A Review on the Integration of Artificial Intelligence and Medical Imaging in IVF Ovarian Stimulation [0.0] 人工知能(AI)は、インビトロ受精(IVF)における意思決定と治療プロトコルを最適化するための強力なツールとして登場した。
本総説では, 卵巣刺激に対する医療画像とAIの併用について検討する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 15:29:08 GMT)
A Novel Method for Pignistic Information Fusion in the View of Z-number [0.0] Dempster-Shafer evidences theory (DSET) は不確実な情報を扱うために広く使われている。
本稿では, DSETに基づいて, 便宜的変換とZ数に基づいて, 異なる情報源からの情報を融合する全く新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 18:17:28 GMT)
A Mathematical Framework for the Problem of Security for Cognition in Neurotechnology [0.0] インプラント可能なデバイス、非侵襲的なモニタリング、非侵襲的な治療はすべて、個人の認知のプライバシーと自律性を侵害する可能性を持っている。
これらのセキュリティ問題に対処するための科学と工学の努力を妨げる大きな障壁は、関連する問題を記述し分析する明確な手段がないことである。
本稿では,複数の分野の手法と結果に基づいて,そのような記述と分析を可能にする数学的枠組みである認知神経セキュリティを開発する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 13:08:14 GMT)
A Hybrid Technique for Plant Disease Identification and Localisation in Real-time [0.0] 本稿では, 画像のQuad-Tree分解に基づく植物病の同定とローカライズのための新しい手法を提案する。
提案アルゴリズムは,比較的計算負荷の少ない高解像度画像の精度と高速収束を著しく向上する。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 15:20:45 GMT)
A Comparative Study of Machine Unlearning Techniques for Image and Text Classification Models [0.0] 機械学習は人工知能の重要な領域として現れており、機械学習モデルから学習したデータを選択的に除去する必要性に対処している。
本稿では、画像とテキストの分類タスクに適用された6つの最先端の未学習技術について、総合的な比較分析を行う。
論文参考訳(メタデータ) (Fri, 27 Dec 2024 10:58:55 GMT)