The BrowserGym Ecosystem for Web Agent Research [151.9] BrowserGymエコシステムは、Webエージェントの効率的な評価とベンチマークの必要性の高まりに対処する。
本稿では,Webエージェント研究のためのBrowserGymベースの拡張エコシステムを提案する。
大規模なマルチベンチマークWebエージェント実験を初めて実施し、6つのWebエージェントベンチマークで6つの最先端LCMの性能を比較した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:02:27 GMT)
LLM Post-Training: A Deep Dive into Reasoning Large Language Models [131.1] 大規模言語モデル (LLMs) は自然言語処理の状況を変え、多様な応用をもたらした。
ポストトレーニング手法により、LLMは知識を洗練させ、推論を改善し、事実の正確性を高め、ユーザの意図や倫理的配慮をより効果的に整合させることができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:59:54 GMT)
Learning diverse attacks on large language models for robust red-teaming and safety tuning [126.3] レッドチーム、あるいは有害な応答を誘発するプロンプトの特定は、大きな言語モデルの安全なデプロイを保証するための重要なステップである。
新規性と多様性を優先する明確な規則化であっても、既存のアプローチはモード崩壊または効果的な攻撃を発生させることができないことを示す。
我々は,GFlowNetの微調整と二次平滑化フェーズを用いて,多種多様な効果的な攻撃プロンプトを生成するために攻撃モデルを訓練することを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:49:25 GMT)
Energy-Based Diffusion Language Models for Text Generation [126.2] エネルギーベース拡散言語モデル(Energy-based Diffusion Language Model, EDLM)は、拡散ステップごとに全シーケンスレベルで動作するエネルギーベースモデルである。
我々のフレームワークは、既存の拡散モデルよりも1.3$times$のサンプリングスピードアップを提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:41:03 GMT)
RMP-SAM: Towards Real-Time Multi-Purpose Segment Anything [117.0] この研究はリアルタイム多目的セグメンテーションと呼ばれる新しいリアルタイムセグメンテーション設定を探索する。
インタラクティブセグメンテーション、パノスコープセグメンテーション、ビデオインスタンスセグメンテーションの3つの基本的なサブタスクを含んでいる。
動的畳み込みに基づく新しい動的畳み込み手法であるReal-Time Multi-Purpose SAM(RMP-SAM)を提案する。
効率的なエンコーダと、プロンプト駆動のデコードを実行するための効率的なデカップリングアダプタを含む。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:54:23 GMT)
METAL: A Multi-Agent Framework for Chart Generation with Test-Time Scaling [100.3] 視覚言語モデル(VLM)をベースとした,効率的な自動チャート生成のためのマルチエージェントフレームワークを構築した。
グラフ生成のタスクを特殊エージェント間の反復的協調に分解するマルチエージェントフレームワークMETALを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:28:24 GMT)
Subtask-Aware Visual Reward Learning from Segmented Demonstrations [97.8] 本稿では,新しい報酬学習フレームワークであるReward Learning from Demonstration with Demonstrationsを紹介する。
我々は,映像セグメントとそれに対応するサブタスクに条件付けされた高密度報酬関数を訓練し,地道報酬信号との整合性を確保する。
実験の結果,REDSはメタワールドにおける複雑なロボット操作タスクのベースライン手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:25:37 GMT)
DeepSolution: Boosting Complex Engineering Solution Design via Tree-based Exploration and Bi-point Thinking [96.9] 我々は,工学的問題に対する完全かつ実現可能なソリューションを生成するシステムの能力を評価するために,新しいベンチマークであるSolutionBenchを導入する。
本稿では,木に基づく探索と二点思考機構を利用して信頼性の高いソリューションを生成する新しいシステムであるSolutionRAGを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:23:10 GMT)
Do as I do (Safely): Mitigating Task-Specific Fine-tuning Risks in Large Language Models [93.1] 悪質なアクターが、ほぼすべてのタスク固有のデータセットの構造を微妙に操作して、危険なモデル行動を促進する方法を示す。
本稿では,タスク形式を模倣した安全データとユーザデータのスタイルを混合した新しい緩和戦略を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:36:06 GMT)
Towards General Visual-Linguistic Face Forgery Detection(V2) [90.7] 顔操作技術は大きな進歩を遂げ、セキュリティと社会的信頼に深刻な課題を呈している。
近年の研究では、マルチモーダルモデルを活用することで、顔偽造検出の一般化と解釈可能性を高めることが示されている。
初期領域と型識別にフォージェリマスクを活用することで,正確なテキスト記述を生成する新しいアノテーションパイプラインである Face Forgery Text Generator (FFTG) を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:15:36 GMT)
VisualPredicator: Learning Abstract World Models with Neuro-Symbolic Predicates for Robot Planning [86.6] 本稿では,記号的・神経的知識表現の強みを組み合わせた一階抽象言語Neuro-Symbolic Predicatesを提案する。
提案手法は, サンプルの複雑さの向上, 分布外一般化の強化, 解釈可能性の向上を実現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:50:42 GMT)
Learning and Computation of $Φ$-Equilibria at the Frontier of Tractability [85.1] $Phi$-equilibriaは、オンライン学習とゲーム理論の中心にある、強力で柔軟なフレームワークだ。
効率的なオンラインアルゴリズムは、$textpoly(d, k)/epsilon2$ラウンドを使用して、平均$Phi$-regretを最大$epsilon$で生成することを示す。
また、オンライン設定において、ほぼ一致した下限を示し、その結果、$Phi$-regretの学習可能性を取得する偏差の族が初めて得られる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:45:49 GMT)
Bootstrapping Language-Guided Navigation Learning with Self-Refining Data Flywheel [83.7] 本稿では,高品質かつ大規模な航法軌道対を生成する自己精製型データフライホイール(SRDF)を提案する。
実験により, 数回のフライホイールラウンドの後, ナビゲータは従来のR2Rテストセットにおいて, 70%から78%のSPLの性能境界を上昇させることを示した。
このプロセスは、以前のVLN命令生成方法よりも23.5から26.2へのSPICE増加によって証明された優れたジェネレータをもたらす。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:06:39 GMT)
Invariant Tokenization of Crystalline Materials for Language Model Enabled Generation [82.9] 鍵となるステップは、3次元結晶構造を1次元配列に変換して言語モデル(LM)で処理することだ。
Mat2Seqは3次元結晶構造を1次元配列に変換し、同じ結晶の異なる数学的記述が単一のユニークなシーケンスで表現されることを保証する。
実験結果から,Mate2Seqは,従来の手法と比較して,結晶構造生成において有望な性能を発揮することがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:02:53 GMT)
DELTA: Dense Efficient Long-range 3D Tracking for any video [82.3] DELTAは3次元空間内のすべてのピクセルを効率よく追跡し,ビデオ全体の正確な動き推定を可能にする手法である。
提案手法では,低分解能追跡のためのグローバルアテンション機構と,高分解能予測を実現するためのトランスフォーマーベースアップサンプラーを併用する。
提案手法は,3次元空間における細粒度・長期動作追跡を必要とするアプリケーションに対して,ロバストなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:54:16 GMT)
MedHallTune: An Instruction-Tuning Benchmark for Mitigating Medical Hallucination in Vision-Language Models [81.6] 幻覚は臨床的意思決定を阻害し、診断や治療を害する可能性がある。
本稿では,医療用VLMにおける幻覚の評価と緩和を目的とした大規模ベンチマークであるMedHallTuneを提案する。
我々は、MedHallTuneを用いて、現在の医用および一般のVLMの総合的な評価を行い、臨床精度、関連性、ディテールレベル、リスクレベルなど、主要な指標でそれらの性能を評価する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:59:49 GMT)
LiNeS: Post-training Layer Scaling Prevents Forgetting and Enhances Model Merging [80.2] LiNeSは、微調整タスク性能を向上しつつ、事前訓練された一般化を維持するために設計されたポストトレーニング編集技術である。
LiNeSは、視覚と自然言語処理のさまざまなベンチマークにおいて、シングルタスクとマルチタスクの両方で大幅に改善されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:53:12 GMT)
FlexDrive: Toward Trajectory Flexibility in Driving Scene Reconstruction and Rendering [79.4] 経路外ビューの再構築の監督として,コンパクトで高品質な画像を作成するために,逆ビューワーピング技術を導入する。
提案手法は,広く使用されているOpenデータセット上で,経路内および経路外再構成およびレンダリング性能を向上する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:32:04 GMT)
Enhancing End-to-End Autonomous Driving with Latent World Model [78.2] 本稿では,LAW(Latent World Model)を用いたエンドツーエンド運転のための自己教師型学習手法を提案する。
LAWは、現在の特徴とエゴ軌道に基づいて将来のシーン機能を予測する。
この自己監督タスクは、知覚のない、知覚に基づくフレームワークにシームレスに統合することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:43:38 GMT)
A Theory for Token-Level Harmonization in Retrieval-Augmented Generation [76.8] Retrieval-augmented Generation (RAG)は、検索したテキストを利用して大規模言語モデル(LLM)を強化する。
本稿では,RAGの利益と有害性を説明するための理論を提供する。
提案手法は,本理論に基づいて,純粋LLMとRAGの協調生成を実現する実用的手法であるTok-RAGを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:23:52 GMT)
PersonaBench: Evaluating AI Models on Understanding Personal Information through Accessing (Synthetic) Private User Data [76.2] パーソナライゼーションは、AIアシスタント、特に個々のユーザーと連携するプライベートAIモデルのコンテキストにおいて重要である。
このようなデータのセンシティブな性質のため、AIモデルのユーザ理解能力を評価するためのデータセットは公開されていない。
多様なユーザプロファイルを作成する合成データ生成パイプラインと、人間の活動をシミュレートするプライベートドキュメントを導入する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:43:35 GMT)
Adaptive Keyframe Sampling for Long Video Understanding [75.8] 本稿では、適応鍵フレームサンプリング(AKS)という、単純だが効果的なアルゴリズムを提案する。
これはAdaptive Keyframe Sampling (AKS)と呼ばれるプラグインとプレイモジュールを挿入し、ビデオトークンの固定数で有用な情報を最大化することを目的としている。
2つの長いビデオ理解ベンチマークの実験は、AKSが情報的出会いを選択する際にビデオQA精度を改善することを検証する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:46:29 GMT)
AutoBencher: Towards Declarative Benchmark Construction [74.5] AutoBencherを使って、数学、多言語性、知識、安全性のためのデータセットを作成しています。
AutoBencherのスケーラビリティにより、詳細なカテゴリ知識をテストでき、既存のベンチマークよりも22%のモデルエラー(難易度)を誘発するデータセットを作成することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:14:49 GMT)
Beware of Your Po! Measuring and Mitigating AI Safety Risks in Role-Play Fine-Tuning of LLMs [73.1] RoleBenchを用いたロールプレイの微調整リスクの総合評価を行う。
実験により、ロールプレイの微調整が安全性能の顕著な低下につながることが明らかになった。
本稿では,ロールプレイ機能と安全性を両立させる新しい手法であるSARFT(Safety-Aware Role-Play Fine-Tuning)を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:31:27 GMT)
Cross-Modal Safety Mechanism Transfer in Large Vision-Language Models [72.8] LVLM(Large Vision-Language Models)における視覚言語アライメントにより、LLMは視覚入力を理解することができる。
既存の視覚言語アライメント手法では,LLMにおけるテキストの安全性機構を視覚に転送できないことがわかった。
LVLMのための新しいテキストガイド型視覚言語アライメント法(TGA)を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:17:41 GMT)
TimesBERT: A BERT-Style Foundation Model for Time Series Understanding [72.6] GPTスタイルのモデルは時系列予測の基礎モデルとして位置づけられている。
BERTスタイルのアーキテクチャは時系列理解のために完全にアンロックされていない。
時系列の汎用表現を学ぶために TimesBERT を設計する。
私たちのモデルは、さまざまなドメインにまたがる2600億のタイムポイントで事前トレーニングされています。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:14:44 GMT)
Representation Alignment for Generation: Training Diffusion Transformers Is Easier Than You Think [72.5] 生成のための大規模拡散モデルの訓練における主要なボトルネックは、これらの表現を効果的に学習することにある。
本稿では,RePresentation Alignment (REPA) と呼ばれる単純な正規化を導入し,ノイズの多い入力隠れ状態の投影を,外部の事前学習された視覚エンコーダから得られるクリーンな画像表現と整合させる手法を提案する。
我々の単純な戦略は、一般的な拡散やDiTsやSiTsといったフローベースのトランスフォーマーに適用した場合、トレーニング効率と生成品質の両方に大きな改善をもたらす。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:00:17 GMT)
SQL Injection Jailbreak: A Structural Disaster of Large Language Models [71.6] 本稿では,有害なコンテンツを生成するために,大規模言語モデル(LLM)を誘導する新しいジェイルブレイク手法を提案する。
ユーザプロンプトにジェイルブレイク情報を注入することで、SIJは有害なコンテンツを出力するモデルをうまく誘導する。
本稿では,SIJ に対抗するためのセルフリマインダーキー (Self-Reminder-Key) という簡単な防御手法を提案し,その有効性を実証する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:33:47 GMT)
Learning to Substitute Components for Compositional Generalization [71.0] そこで我々はCompSubと呼ばれる新しい構成拡張戦略を提案する。
また,CompSubにおけるコンポーネント置換確率の学習を支援するLCS(Learning Component Substitution)フレームワークについても紹介する。
その結果, CompSub, LCS, LCS-ICLのそれぞれ66.5%, 10.3%, 1.4%, 8.8%の改善が見られた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:30:47 GMT)
Samba: Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling [70.9] 選択状態空間モデル(SSM)であるMambaとSliding Window Attention(SWA)を組み合わせた単純なハイブリッドアーキテクチャであるSambaを提案する。
Sambaは特定のシーケンスを選択的にリカレントなシークレット状態に圧縮し、最近の記憶をアテンション機構で正確にリコールする能力を維持している。
私たちはSambaを3.8Bのパラメータに拡張し、3.2Tのトレーニングトークンを使用し、様々なベンチマークで最先端モデルよりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:20:49 GMT)
DKDM: Data-Free Knowledge Distillation for Diffusion Models with Any Architecture [69.6] 拡散モデル(DM)は、様々な領域にまたがる例外的な生成能力を示す。
DMはますます大量のデータを消費している。
既存のDMをデータソースとして使用して,新しいDMをアーキテクチャでトレーニングする,という新しいシナリオを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:26:03 GMT)
High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.3] 拡散モデルは、例外的な品質、詳細な解像度、強い文脈認識を提供することによって、テキストと画像の合成に革命をもたらした。
本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。
DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:44:00 GMT)
Ant Colony Sampling with GFlowNets for Combinatorial Optimization [68.8] Generative Flow Ant Colony Sampler (GFACS)は、階層的に償却推論と並列探索を組み合わせた新しいメタヒューリスティック手法である。
提案手法はまず,生成フローネットワーク(GFlowNets)を利用して,解空間上のエンフルティモーダル事前分布を補正する。
この前者は、Ant Colony Optimization (ACO) の精神で並列探索によって更新され、後部分布がほぼ最適解を生成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:33:02 GMT)
Super(ficial)-alignment: Strong Models May Deceive Weak Models in Weak-to-Strong Generalization [68.6] 弱い着想の問題が存在するかどうかを考察する。
弱いモデルと強いモデルの間の能力ギャップが増大するにつれて、偽造は増大する。
私たちの研究は、スーパーアライメントの真の信頼性にもっと注意を払う必要があることを強調します。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:43:17 GMT)
WorldCraft: Photo-Realistic 3D World Creation and Customization via LLM Agents [67.3] 大規模言語モデル(LLM)エージェントがプロシージャ生成を利用してオブジェクトを集約したシーンを生成するシステムであるWorldCraftを紹介する。
本フレームワークでは,コーディネータエージェントが全体の処理を管理し,シーン作成を完了させるために2つの特殊なLLMエージェントと連携する。
パイプラインには軌道制御エージェントが組み込まれており、ユーザはシーンをアニメーション化し、自然言語による対話を通じてカメラを操作することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:49:29 GMT)
3D StreetUnveiler with Semantic-aware 2DGS -- a simple baseline [66.9] StreetUnveilerは、混雑した観察から空の通りの3D表現を学習する。
空の街路シーンを、観察された、部分的に観察された、保存されていない領域に分割する。
街路景観データセットを用いた実験により, 空き路の3次元表現の再構築に成功した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:18:57 GMT)
LLM2: Let Large Language Models Harness System 2 Reasoning [65.9] 大規模言語モデル(LLM)は、無数のタスクにまたがって印象的な機能を示してきたが、時には望ましくない出力が得られる。
本稿では LLM とプロセスベースの検証器を組み合わせた新しいフレームワーク LLM2 を紹介する。
LLMs2は妥当な候補を生成するのに責任を持ち、検証者は望ましい出力と望ましくない出力を区別するためにタイムリーなプロセスベースのフィードバックを提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:06:02 GMT)
Non-Parametric Learning of Stochastic Differential Equations with Non-asymptotic Fast Rates of Convergence [65.6] 非線形微分方程式のドリフトと拡散係数の同定のための新しい非パラメトリック学習パラダイムを提案する。
鍵となる考え方は、基本的には、対応するフォッカー・プランク方程式のRKHSに基づく近似をそのような観測に適合させることである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:53:37 GMT)
Unlocking State-Tracking in Linear RNNs Through Negative Eigenvalues [65.4] Mamba、RWKV、GLA、mLSTM、DeltaNetは、長いシーケンスでTransformerの効率的な代替手段として登場した。
しかし、TransformerとLRNNはどちらも状態追跡に苦労しており、コード評価などのタスクではパフォーマンスを損なう可能性がある。
本研究では,Mamba と DeltaNet の固有値範囲を負の値を含むように拡張することで,状態追跡タスクの性能が向上することを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:17:14 GMT)
SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.7] MLLM(Multimodal Large Language Models)は、視覚データとテキストデータの両方を処理する。
構造化されていない知識と構造化されていない知識の両方を取り入れることでMLLMベースの自動運転システムを強化する新しいフレームワークであるSafeAutoを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:53:47 GMT)
Exploring Rewriting Approaches for Different Conversational Tasks [63.6] 正確な書き換えアプローチは、しばしば、会話アシスタントによってサポートされているユースケースとアプリケーション固有のタスクに依存します。
基本的に異なる2つの生成タスクに対して,書き換えと融合という2つの異なるアプローチを体系的に検討した。
以上の結果から, 特定の書き換え手法や融合手法は, 基礎となるユースケースや生成課題に大きく依存していることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:18:19 GMT)
Identifiable Multi-View Causal Discovery Without Non-Gaussianity [63.2] 多視点構造方程式モデル(SEM)の枠組みにおける線形因果発見への新しいアプローチを提案する。
我々は、SEMの構造が非巡回的であること以外は、余計な仮定をすることなく、モデルの全てのパラメータの識別可能性を証明する。
提案手法は,脳領域間の因果グラフの推定を可能にする実データへのシミュレーションおよび応用を通じて検証される。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:33:29 GMT)
FlashVideo: Flowing Fidelity to Detail for Efficient High-Resolution Video Generation [61.6] DiT拡散モデルは、モデルキャパシティとデータスケールのスケーラビリティを活用して、テキスト・ビデオ生成において大きな成功を収めた。
しかし、テキストプロンプトに一致した高い内容と動きの忠実度は、しばしば大きなモデルパラメータとかなりの数の関数評価(NFE)を必要とする。
本稿では,モデルキャパシティとNFEを戦略的に割り当て,生成精度と品質のバランスをとる新しい2つのステージフレームワークであるFlashVideoを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:22:09 GMT)
SPAM: Spike-Aware Adam with Momentum Reset for Stable LLM Training [61.0] 大規模言語モデル(LLM)は、様々なタスクにまたがる例外的なパフォーマンスを示しているが、そのトレーニングは、非常にリソース集約的で、トレーニングの不安定性に影響を受けやすいままである。
本稿では,LLMトレーニング中に観測された勾配スパイクを包括的に調査し,複数のアーキテクチャやデータセットにまたがる傾向を明らかにする。
本稿では,モーメントムリセットを用いたスパイク・アウェア・アダムを提案し,モーメントムリセットとスパイク・アウェア・クリッピングによる勾配スパイク対策について述べる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:15:31 GMT)
AutoG: Towards automatic graph construction from tabular data [60.9] 本稿では,グラフ構築問題を形式化し,効果的な解法を提案する。
既存の自動工法は特定の場合にのみ適用できる。
本稿では,グラフ構築手法の形式化と評価を行うデータセットについて述べる。
第2に,高品質なグラフスキーマを自動生成するLLMベースのソリューションAutoGを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:11:44 GMT)
LoRec: Large Language Model for Robust Sequential Recommendation against Poisoning Attacks [60.7] 本研究は,リコメンデータシステムにおける未知の不正行為の検出におけるLarge Language Models(LLM)の機能に着目した。
逐次リコメンデータシステムのロバスト性を高めるため,LLM強化を利用した高度なフレームワークであるLoRecを提案する。
総合的な実験により、LoRecは一般的なフレームワークとして、シーケンシャルなレコメンデータシステムの堅牢性を大幅に強化することを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:56:52 GMT)
See It from My Perspective: How Language Affects Cultural Bias in Image Understanding [60.7] 視覚言語モデル(VLM)は、多くの言語における画像に関するクエリに応答することができる。
画像理解におけるVLMの西洋的偏見を特徴付け,この格差の中で言語が果たす役割について検討する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:03:33 GMT)
Towards Practical Real-Time Neural Video Compression [60.4] 我々は,高圧縮比,低レイテンシ,広範汎用性を実現するために設計された実用的リアルタイムニューラルビデオ(NVC)を紹介する。
実験により,提案したDCVC-RTは1080pビデオに対して125.2/112.8フレーム(毎秒125.2/112.8フレーム)の高速符号化を実現し,H.266/VTMと比較して21%のfpsを節約できた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:32:23 GMT)
Structured Preference Optimization for Vision-Language Long-Horizon Task Planning [60.3] 視覚言語タスクプランニングの既存の方法は、短期水平タスクでは優れているが、動的環境における複雑な長期水平計画では不足することが多い。
これらの課題は、ロングホライゾンタスクのための高品質な推論プロセスを生成するために、効果的にモデルを訓練することの難しさから生じる。
本研究では,長期タスク計画における推論と行動選択の促進を目的とした構造的選好最適化(SPO)を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:47:34 GMT)
Preference Elicitation for Offline Reinforcement Learning [59.1] オフラインの嗜好に基づく強化学習アルゴリズムであるSim-OPRLを提案する。
本アルゴリズムは,配当外データに対する悲観的アプローチと,最適方針に関する情報的嗜好を得るための楽観的アプローチを用いる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:36:00 GMT)
HVI: A New Color Space for Low-light Image Enhancement [58.8] 水平/垂直インテンシティ(HVI)に基づく低照度画像強調(LLIE)のための新しい色空間を提案する。
HVIは分極されたHSマップと学習可能な強度で定義され、一方後者は黒のアーティファクトを除去するために低照度領域を圧縮する。
色と強度の情報をフル活用するために、新しい色と強度のデカップリングネットワーク(CIDNet)を導入する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:13:24 GMT)
Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback [58.7] 人からのフィードバックから学ぶことは、大言語モデル(LLM)のような生成モデルを調整する上で重要な役割を果たす
本稿では,このドメイン内のモデルについて考察する。-文脈的デュエルバンディット(contextual dueling bandits)と,正の選好ラベルを相手によって反転させることができる対向フィードバック(reversarial feedback)について考察する。
本稿では,不確実性重み付き最大推定に基づく頑健なコンテキストデュエルバンドイット(RCDB)を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:56:33 GMT)
Calibrated Probabilistic Forecasts for Arbitrary Sequences [58.5] 実際のデータストリームは、分散シフトやフィードバックループ、敵アクターによって予測不可能に変化する可能性がある。
データがどのように進化するかに関わらず、有効な不確実性推定を保証するための予測フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:30:26 GMT)
HAIC: Improving Human Action Understanding and Generation with Better Captions for Multi-modal Large Language Models [58.0] ビデオ理解のための2段階データアノテーションパイプラインを提案する。
まず、インターネットからの人間の行動を明確にした動画を蓄積する戦略を設計する。
第2に、ビデオは、人間の属性を使って個人を識別する標準化されたキャプション形式で注釈付けされる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:53:40 GMT)
WorldModelBench: Judging Video Generation Models As World Models [57.8] ビデオ生成モデルは急速に進歩し、ロボット工学や自動運転といった意思決定アプリケーションをサポートするビデオワールドモデルとしての地位を確立している。
現在のベンチマークでは、これらの主張を厳格に評価することができず、一般的なビデオ品質にのみ焦点が当てられている。
アプリケーション駆動ドメインにおけるビデオ生成モデルのワールドモデリング能力を評価するためのベンチマークであるWorldModelBenchを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:58:23 GMT)
Discovering physical laws with parallel combinatorial tree search [57.1] 記号回帰は、データから簡潔で解釈可能な数学的表現を発見する能力のおかげで、科学研究において重要な役割を果たす。
既存のアルゴリズムは10年以上にわたって精度と効率の重大なボトルネックに直面してきた。
制約データから汎用数学的表現を効率的に抽出する並列木探索(PCTS)モデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:41:19 GMT)
OpenEarthSensing: Large-Scale Fine-Grained Benchmark for Open-World Remote Sensing [57.1] オープンワールドリモートセンシングのための大規模きめ細かいベンチマークであるOpenEarthSensingを紹介する。
OpenEarthSensingには189のシーンとオブジェクトが含まれており、現実世界で起こりうる潜在的なセマンティックシフトの大部分をカバーしている。
我々はOpenEarthSensing上で,現在主流のオープンワールドタスクとメソッドのベースライン評価を行う。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:49:52 GMT)
AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.8] AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:14:48 GMT)
Sparse-ProxSkip: Accelerated Sparse-to-Sparse Training in Federated Learning [56.2] FL(Federated Learning)では、クライアントリソースの制約と通信コストの両方が、大規模モデルのトレーニングに大きな問題を引き起こします。
最近の研究によると、局所的な訓練は加速によってコミュニケーションの複雑さを確実に改善する。
Sparse-ProxSkipを導入し、その課題に対処し、Sparse Training に展開する Straight-Through Estorimat の効率的な手法を実装した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:07:22 GMT)
LoCoDL: Communication-Efficient Distributed Learning with Local Training and Compression [56.0] そこで我々はLoCoDL(LoCoDL)と,フロートの実次元ベクトルの代わりに短いビットストリームが送信される圧縮(Compression)という,ローカルトレーニングの一般的かつ効果的な2つの手法を利用する通信効率の高いアルゴリズムを紹介した。
LoCoDLは、局所的な訓練と圧縮の恩恵を受け、強い凸関数を持つ一般的な異種体制において、関数の条件数とモデル次元に関して、二重に加速された通信複雑性を享受する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:25:10 GMT)
GUIDE: LLM-Driven GUI Generation Decomposition for Automated Prototyping [55.8] 印象的なコード生成機能を備えた大規模言語モデル(LLM)は、GUIプロトタイピングを自動化するための有望なアプローチを提供する。
しかし、現在のLLMベースのプロトタイピングソリューションと従来のユーザベースのGUIプロトタイピングアプローチの間にはギャップがある。
プロトタイピングフレームワークであるFigmaにシームレスに統合された新しいLLM駆動GUI生成分解手法であるGUIDEを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:03:53 GMT)
Alleviating Distribution Shift in Synthetic Data for Machine Translation Quality Estimation [55.7] 本稿では,合成QEデータの分散シフトを緩和する新しいフレームワークであるADSQEを紹介する。
ADSQEは、参照、すなわち翻訳監督信号を使用して、生成プロセスとアノテーションプロセスの両方をガイドする。
実験によると、ADSQEはCOMETのようなSOTAベースラインを教師なしと教師なしの両方で上回っている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:51:26 GMT)
Humanoid Whole-Body Locomotion on Narrow Terrain via Dynamic Balance and Reinforcement Learning [54.3] 動的バランスと強化学習(RL)に基づく新しい全身移動アルゴリズムを提案する。
具体的には,ZMP(Zero-Moment Point)駆動の報酬とタスク駆動の報酬を,全身のアクター批判的枠組みで拡張した尺度を活用することで,動的バランス機構を導入する。
フルサイズのUnitree H1-2ロボットによる実験により、非常に狭い地形でのバランスを維持するための手法の有効性が検証された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:04:13 GMT)
D-NPC: Dynamic Neural Point Clouds for Non-Rigid View Synthesis from Monocular Video [53.8] 本稿では,スマートフォンのキャプチャなどのモノクロ映像から動的に新しいビューを合成する手法を導入することにより,この分野に貢献する。
我々のアプローチは、局所的な幾何学と外観を別個のハッシュエンコードされたニューラル特徴グリッドにエンコードする暗黙の時間条件のポイントクラウドである、$textitdynamic Neural point cloudとして表現されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:46:16 GMT)
SEE: See Everything Every Time -- Adaptive Brightness Adjustment for Broad Light Range Images via Events [53.8] ダイナミックレンジが120億ドルを超えるイベントカメラは、従来の組込みカメラをはるかに上回っている。
本研究では,広い照明条件下で撮影した画像の明るさを拡張・適応的に調整するために,イベントをどのように利用するかという,新しい研究課題を提案する。
我々のフレームワークは、センサパターンを通して色を捉え、イベントを輝度辞書としてモデル化するためにクロスアテンションを使用し、画像のダイナミックレンジを調整し、広い光域表現を形成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:55:37 GMT)
ReaLJam: Real-Time Human-AI Music Jamming with Reinforcement Learning-Tuned Transformers [53.6] ReaLJamは、人間とトランスフォーマーをベースとしたAIエージェントが強化学習でトレーニングしたライブ音楽ジャミングセッションのためのインタフェースとプロトコルである。
エージェントが継続的にパフォーマンスを予測し,ユーザに対してその計画を視覚的に伝達する,予測という概念を用いてリアルタイムインタラクションを可能にする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:42:58 GMT)
Mitigating Object Hallucination in MLLMs via Data-augmented Phrase-level Alignment [52.4] MLLM(Multimodal Large Language Models)はしばしば幻覚と呼ばれる事実的不正確な情報を生成する。
そこで,本研究では,MLLMの命令調整による幻覚の緩和に応用可能な新しい損失であるData-augmented Phrase-level Alignment(DPA)を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:26:42 GMT)
Training on the Benchmark Is Not All You Need [52.0] 本稿では,複数選択肢の内容に基づいた簡易かつ効果的なデータ漏洩検出手法を提案する。
本手法は,モデルトレーニングデータや重みを使用せずに,グレーボックス条件下で動作可能である。
4つのベンチマークデータセットから35個の主要なオープンソースLCMのデータ漏洩度を評価する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:40:58 GMT)
Fast and Accurate Gigapixel Pathological Image Classification with Hierarchical Distillation Multi-Instance Learning [51.5] HDMILは階層的な蒸留マルチインスタンス学習フレームワークであり、無関係なパッチを排除して高速かつ正確な分類を実現する。
HDMILは、動的マルチインスタンスネットワーク(DMIN)と軽量インスタンスプレスクリーンネットワーク(LIPN)の2つの重要なコンポーネントで構成されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:10:07 GMT)
Making Software Development More Diverse and Inclusive: Key Themes, Challenges, and Future Directions [50.5] ソフトウェア開発者の多様性と包摂性(SDDI)を改善するための課題と機会に関する6つのテーマを特定します。
4つのテーマの利点、害、今後の研究の方向性を特定します。
残りの2つのテーマ、人工知能とSDDIとAIとコンピュータサイエンスの教育について論じる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:37:23 GMT)
InterDyn: Controllable Interactive Dynamics with Video Diffusion Models [50.4] 我々は、初期フレームと駆動対象またはアクターの動作を符号化する制御信号が与えられたインタラクティブなダイナミクスのビデオを生成するフレームワークであるInterDynを提案する。
私たちの重要な洞察は、大規模なビデオ生成モデルは、大規模ビデオデータからインタラクティブなダイナミクスを学習し、ニューラルネットワークと暗黙の物理シミュレータの両方として機能できるということです。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:16:36 GMT)
Variations in Relevance Judgments and the Shelf Life of Test Collections [50.1] ニューラル検索モデルへのパラダイムシフトは、現代のテストコレクションの特徴に影響した。
ニューラル検索設定における先行研究を再現し、評価者の不一致がシステムランキングに影響を及ぼさないことを示す。
我々は、新しい関係判断によって、いくつかのモデルが著しく劣化し、既にランク付け者としての人間の有効性に到達していることを観察した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:46:56 GMT)
Automatically Adaptive Conformal Risk Control [50.0] 本稿では,テストサンプルの難易度に適応して,統計的リスクの近似的条件制御を実現する手法を提案する。
我々のフレームワークは、ユーザが提供するコンディショニングイベントに基づく従来のコンディショニングリスク制御を超えて、コンディショニングに適した関数クラスのアルゴリズム的、データ駆動決定を行う。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:44:08 GMT)
Spatial Reasoning with Denoising Models [49.8] 本稿では,連続変数の集合に対する推論を行うためのフレームワークを提案する。
はじめに,デノナイジングネットワーク自体によって生成順序を予測できることを実証した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:08:30 GMT)
OpenFly: A Versatile Toolchain and Large-scale Benchmark for Aerial Vision-Language Navigation [49.7] Vision-Language Navigation (VLN) は、言語命令と視覚的手がかりの両方を活用することで、エージェントを環境に誘導することを目的としている。
航空VLNのための多目的ツールチェーンと大規模ベンチマークからなるプラットフォームであるOpenFlyを提案する。
我々は、100kの軌跡を持つ大規模な航空VLNデータセットを構築し、18のシーンにまたがる様々な高さと長さをカバーした。
対応する視覚データは、Unreal, GTA V, Google Earth, 3D Splatting (3D GS)など、様々なレンダリングエンジンと高度な技術を用いて生成される。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:10:39 GMT)
Towards Anthropomorphic Conversational AI Part I: A Practical Framework [49.6] 会話に関わる人間の知性の重要な側面を再現するために設計されたマルチモジュールフレームワークを導入する。
アプローチの第2段階では、これらの会話データは、フィルタリングとラベル付けの後に、強化学習のためのトレーニングおよびテストデータとして機能する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:18:39 GMT)
Training-Free Exponential Context Extension via Cascading KV Cache [49.6] カスケードサブキャッシュバッファを利用して,最も関連性の高いトークンを選択的に保持する機構を導入する。
本手法は,1Mトークンのフラッシュアテンションと比較して,プリフィルステージ遅延を6.8倍削減する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:08:44 GMT)
New Dataset and Methods for Fine-Grained Compositional Referring Expression Comprehension via Specialist-MLLM Collaboration [49.2] Referring Expression (REC) は、言語理解、画像理解、言語と画像の接点の相互作用を評価するためのクロスモーダルなタスクである。
2つの重要な特徴を持つ新しいRECデータセットを導入する。第一に、オブジェクトカテゴリ、属性、関係性に関する詳細な推論を必要とする、制御可能な難易度で設計されている。
第二に、微粒な編集によって生成された否定的なテキストと画像が組み込まれ、既存のターゲットを拒否するモデルの能力を明示的にテストする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:36:32 GMT)
On the Adversarial Risk of Test Time Adaptation: An Investigation into Realistic Test-Time Data Poisoning [49.2] テスト時間適応(TTA)は、テストデータを使用して推論段階でモデルの重みを更新し、一般化を強化する。
既存の研究では、TTAが逆方向検体で更新されると、良性検体の性能が低下することが示されている。
そこで本研究では, 良性試料にアクセスすることなく, 有毒試料を効果的かつ現実的に生成する手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:02:23 GMT)
Quantum advantage in a unified scenario and secure detection of resources [49.2] 我々は、量子優位性観測の異なるアプローチを研究するために、単一のコミュニケーションタスクを考える。
私たちのタスクには、マネージャ、Alice、Bobの3つのパーティがあります。
Alice が qubit を送信するとタスクのゴールが達成できることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:30:24 GMT)
Measuring Data Diversity for Instruction Tuning: A Systematic Analysis and A Reliable Metric [48.8] サンプルレベルの「ノーベルティ」に基づく新しい多様性指標を提案する。
我々は,NovellSumが精度よく多様性の変動を捉え,命令調整モデルの性能と0.97の相関性が得られることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:44:08 GMT)
Adaptive Pruning of Pretrained Transformer via Differential Inclusions [48.5] 現在の圧縮アルゴリズムは一定の圧縮比でプルーーン変換器であり、各比に対して独自のプルーニングプロセスを必要とする。
本研究では,マスクパラメータの差分包摂性に基づいて,事前学習した変圧器を1つのプルーニング段階内において任意の所望の比率でプルーニングすることを提案する。
このダイナミクスは、ネットワーク構造を識別するサポートセットを持つマスクパラメータの全体正規化ソリューションパスを生成することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:35:09 GMT)
Ferret-UI 2: Mastering Universal User Interface Understanding Across Platforms [48.0] Ferret-UI 2 は多言語大言語モデル (MLLM) であり、幅広いプラットフォームでUIを統一的に理解するために設計された。
Ferret-UI 2では、複数のプラットフォームタイプのサポート、適応スケーリングによる高解像度の認識、GPT-4oを使った高度なタスクトレーニングデータ生成、マークのセット・オブ・マークによる視覚的プロンプトの3つの重要なイノベーションが導入されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:29:14 GMT)
Sixth-Sense: Self-Supervised Learning of Spatial Awareness of Humans from a Planar Lidar [48.0] ほとんどの商用サービスロボットは視野が狭いカメラを備えており、ユーザーが他の方向から近づいていると目が見えない。
本稿では,RGB-Dカメラを監視源として用いて,人間を検知し,その2Dポーズを1次元LiDARデータから推定する自己教師型アプローチを提案する。
提案モデルでは, 距離13cm, 方位44degの平均絶対誤差を保ちながら, 71%の精度と80%のリコールで1次元LiDARデータから一方向の人間を検出できる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:22:12 GMT)
Distributed Blind Source Separation based on FastICA [48.0] 本稿では,元の信号源の同定を目的とした分散独立成分分析(ICA)アルゴリズムを提案する。
最もよく使われるICAアルゴリズムの1つはFastICAと呼ばれ、空間的な事前白化操作を必要とする。
我々は、いわゆる分散適応信号融合フレームワークの特性を活用することにより、ネットワーク全体の事前白化の明確なステップを回避することができることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:55:06 GMT)
HybridGS: Decoupling Transients and Statics with 2D and 3D Gaussian Splatting [47.7] 画像ごとの過渡的対象に対して2次元ガウスアンを用いて,ハイブリッドGSと呼ばれる新しいハイブリッド表現を提案する。
また、ロバストなトレーニングと高品質なビュー合成を実現するために、単純かつ効果的なマルチステージトレーニング戦略を提案する。
ベンチマークデータセットを用いた実験は、室内および屋外の両方のシーンにおいて、新しいビュー合成の最先端性能を示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:49:45 GMT)
Probing the Latent Hierarchical Structure of Data via Diffusion Models [47.6] 拡散モデルを用いた実験は,データの潜伏構造を探索するための有望なツールであることを示す。
我々はこの予測を、最先端拡散モデルを用いてテキストと画像の両方で確認する。
以上の結果から,潜在変数がデータにどのように現れるかを示し,これらの影響を実データで測定する方法を確立した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:28:34 GMT)
Causality Is Key to Understand and Balance Multiple Goals in Trustworthy ML and Foundation Models [47.5] 本稿では,機械学習への因果的手法の統合を提唱し,信頼に値するMLの重要な原則間のトレードオフをナビゲートする。
我々は、信頼できるMLと基礎モデルの両方において、複数の競合する目標のバランスをとるためには、因果的アプローチが不可欠であると主張する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:57:33 GMT)
Transformers Learn to Implement Multi-step Gradient Descent with Chain of Thought [46.7] Chain of Thought (CoT) のプロンプトにより,大規模言語モデル (LLM) の性能が大幅に向上することが示されている。
線形回帰のための文脈内重み予測タスクにおいて,CoT目標に対する変圧器のトレーニングダイナミクスについて検討する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:40:38 GMT)
Agentic AI Needs a Systems Theory [46.4] AI開発は現在、個々のモデル機能に過度に重点を置いている、と私たちは主張する。
エージェント認知の強化,創発的因果推論能力,メタ認知認知のメカニズムについて概説する。
システムレベルの視点は、より理解し、意図的に形作り、エージェントAIシステムに不可欠である、と私たちは強調する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:51:32 GMT)
From Commands to Prompts: LLM-based Semantic File System for AIOS [46.3] プロンプト駆動型ファイル管理のためのLSFS(LLM-based semantic file system)を提案する。
従来のアプローチとは異なり、LSFSはLLMを組み込んで、ユーザやエージェントが自然言語のプロンプトを通じてファイルと対話できるようにする。
実験の結果,LSFSはユーザ利便性,サポート対象関数の多様性,ファイル操作の正確性や効率性の観点から,従来のファイルシステムよりも大幅に改善されていることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:41:00 GMT)
VIRES: Video Instance Repainting with Sketch and Text Guidance [46.2] スケッチとテキストガイダンスを備えたビデオインスタンス再描画手法であるVIRESを紹介する。
既存のアプローチは、提供されたスケッチシーケンスと時間的一貫性と正確なアライメントに苦慮している。
本稿では,自己スケーリングを標準化したSequential ControlNetを提案する。
スケッチ対応エンコーダは、再塗装された結果が提供されるスケッチシーケンスに一致していることを保証する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:57:48 GMT)
The Superposition of Diffusion Models Using the Itô Density Estimator [46.0] 以上の結果から,SuperDiffは大規模な事前学習拡散モデルに対してスケーラブルであることを示す。
また、スーパーディフは推論時間中に効率的であることを示し、従来の合成演算子を模倣する。
我々は,CIFAR-10上でより多様な画像を生成するためのSuperDiffの有用性を実証的に実証した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:00:23 GMT)
Joint Modeling in Recommendations: A Survey [46.0] 共同モデリングアプローチは、さまざまなタスク、シナリオ、モダリティ、振る舞いをレコメンデーションプロセスに統合することによって、制限を克服する上で中心となる。
我々は,マルチタスク,マルチシナリオ,マルチモーダル,マルチビヘイビア・モデリングという,4つの異なる次元のジョイント・モデリングのスコープを定義する。
本研究は,提案する共同モデルにおける今後の研究の道のりについて紹介し,その結果を簡潔にまとめる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:14:00 GMT)
Fast Scrambling in Hyperbolic Ising Model [46.0] 本稿では,AdS2を背景とした混合フィールドIsingモデルであるHyperbolic Isingモデルにおける多体カオスとスクランブルについて検討する。
局所的なサイトに依存した近接相互作用のみを持つこのモデルは、最大カオスであり、高速スクランブラーとして分類でき、あるパラメータ集合のカオスに縛られたマルダセナ・シェンカー・スタンフォード(MSS)を飽和させる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:00:07 GMT)
Self-Evolved Reward Learning for LLMs [45.7] RLHF(Reinforcement Learning from Human Feedback)は、言語モデルと人間の嗜好を整合させる重要な手法である。
本稿では、RMが反復的に自己改善するための追加のトレーニングデータを生成する新しいアプローチである自己進化リワード学習(SER:Self-Evolved Reward Learning)を提案する。
以上の結果から,人間による注釈付きデータであっても,自己フィードバックから学習することで,RM性能が向上することが示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:37:09 GMT)
PathVG: A New Benchmark and Dataset for Pathology Visual Grounding [45.2] そこで我々はPathVG(Pathology Visual Grounding)と呼ばれる新しいベンチマークを提案する。
実験の結果,病理表現の根底にある暗黙的な情報に最大の課題があることが判明した。
提案手法は,PathVGベンチマーク上での最先端性能を実現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:13:01 GMT)
Explore the Reasoning Capability of LLMs in the Chess Testbed [45.1] 我々は,注釈付き戦略と戦術を統合することで,チェスにおける大規模言語モデルの推論能力を向上させることを提案する。
我々はLLaMA-3-8Bモデルを微調整し、より優れたチェスの動きを選択するタスクにおいて、最先端の商用言語モデルと比較する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:58:28 GMT)
Linear combinations of latents in generative models: subspaces and beyond [44.7] 本稿では,潜伏変数の線形結合を形成する汎用手法として,潜伏変数の線形結合(LOL)を提案する。
LOLは、高次元オブジェクトの表現的低次元表現を劇的に単純化する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:37:12 GMT)
Variational Transformer Ansatz for the Density Operator of Steady States in Dissipative Quantum Many-Body Systems [44.6] 本稿では、散逸性量子多体系の定常状態を決定するための変圧器密度演算子アンサッツを提案する。
散逸性イジングとハイゼンベルクスピンチェーンモデルの定常状態を数値計算することで,本手法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:12:43 GMT)
Backdooring Vision-Language Models with Out-Of-Distribution Data [44.4] 視覚言語モデル(VLM)は視覚入力から詳細なテキスト記述を生成する。
重要性は増しているが、特にバックドア攻撃に対するVLMの安全性は検討中である。
VLOOD(Backdooring Vision-Language Models with Out-of-Distribution Data)は、2つの重要なコントリビューションを持つ新しいアプローチである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:47:54 GMT)
Task-Driven Semantic Quantization and Imitation Learning for Goal-Oriented Communications [44.3] GOS-VAE(Goal-Oriented Semantic Variational Autoencoder)という,新たな目標指向通信(GO-COM)フレームワークを提案する。
データ再構成における関連する意味的特徴を捉えるために、データ再生品質を測定するために模倣学習を採用する。
実験により,提案したGOS-VAEの目的指向意味論と帯域幅効率を特徴付ける上で,模倣学習の能力を示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:43:09 GMT)
Learning Evolving Tools for Large Language Models [44.3] ツール学習により、大きな言語モデル(LLM)が外部ツールやAPIと対話できるようになる。
既存の研究は主に静的環境に焦点を当てており、この問題を見落としている。
ツール変数に対するLLMの適応性と反射性を向上する新しいフレームワークであるToolEVOを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:37:07 GMT)
A Reductions Approach to Risk-Sensitive Reinforcement Learning with Optimized Certainty Equivalents [44.1] 本研究の目的は,累積報酬のリスク尺度を最適化する履歴依存政策を学習することである。
楽観主義に基づくメタアルゴリズムと政策勾配に基づくメタアルゴリズムを提案する。
我々は,提案アルゴリズムが概念実証MDPで最適な履歴依存ポリシーを学習できることを実証的に示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:35:06 GMT)
ProBench: Benchmarking Large Language Models in Competitive Programming [44.1] 競合プログラミングにおける大規模言語モデル(LLM)のベンチマークを行うためにProBenchを提案する。
ProBenchはCodeforces、Luogu、Nowcoderプラットフォームから包括的な競合プログラミング問題を収集している。
我々は,思考連鎖解析,誤り型診断,推論深度評価など,多次元の競合プログラミングにおける9つの最新のLCMを評価した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:12:42 GMT)
Gold-medalist Performance in Solving Olympiad Geometry with AlphaGeometry2 [43.9] 我々はTrinh et al. (2024)で導入されたAlphaGeometryの大幅な改良版であるAlphaGeometry2を提案する。
これを実現するために、まず最初のAlphaGeometry言語を拡張して、オブジェクトの動きに関わる難しい問題に対処する。
これは国際数学オリンピック(IMO)2000-2024の幾何学問題を66%から88%に改善した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:59:22 GMT)
InspireMusic: Integrating Super Resolution and Large Language Model for High-Fidelity Long-Form Music Generation [43.7] InspireMusicは,高忠実度長大な音楽生成のためのフレームワーク統合スーパーレゾリューションと大規模言語モデルである。
統合されたフレームワークは、超解像フローマッチングモデルを備えた自己回帰変換器を組み込んだ高忠実な音楽、歌、オーディオを生成する。
我々のモデルは、よりリッチなセマンティック情報を含む1つのコードブックを持つオーディオトークンーを使用するため、従来のアプローチと異なる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:58:25 GMT)
CADDreamer: CAD object Generation from Single-view Images [43.6] 既存の3D生成モデルは、しばしば過度に密度が高く非構造的なメッシュを生成する。
本稿では,CADオブジェクトの境界表現(B-rep)を単一画像から生成するための新しいアプローチであるCADDreamerを紹介する。
その結果,本手法は単視点画像から高品質CADオブジェクトを効果的に回収することを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:30:29 GMT)
SemlaFlow -- Efficient 3D Molecular Generation with Latent Attention and Equivariant Flow Matching [43.6] SemlaはスケーラブルなE(3)等価メッセージパッシングアーキテクチャである。
SemlaFlowは、原子タイプ、座標、結合タイプ、正式な電荷の結合分布を生成するために訓練されている。
本モデルでは,20段階のサンプリングを行ない,ベンチマークデータセットの最先端結果を生成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:56:08 GMT)
Towards High-performance Spiking Transformers from ANN to SNN Conversion [43.5] スパイクニューラルネットワーク(SNN)は、そのエネルギー効率、高速処理能力、ロバスト性によって大きな可能性を秘めている。
現在の変換方法は、主に畳み込みニューラルネットワーク(CNN)をSNNに変換することに焦点を当てている。
本稿では,変換の精度を維持するための期待補償モジュールを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:12:37 GMT)
Data Quality Control in Federated Instruction-tuning of Large Language Models [43.3] フェデレートラーニング(Federated Learning)は、大きな言語モデルのプライバシ保護と協調的な命令チューニングを可能にする。
ローカルクライアントには、トレーニング前にノイズや低品質のサンプルをフィルタリングするグローバルな可視性がない。
我々は,動的データ品質制御を備えた新しいフェデレーション・インストラクション・チューニング・フレームワークであるFedDQCを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:35:58 GMT)
Discovering Global False Negatives On the Fly for Self-supervised Contrastive Learning [43.3] 自己教師付きコントラスト学習において、負のペアは通常、アンカー画像と、アンカーを除くデータセット全体から引き出されたサンプルを使用して構成される。
このアプローチは、"偽陰性(false negatives)"と呼ばれる、類似のセマンティクスを持つ負のペアの生成をもたらす可能性がある。
最適化に基づくアプローチであるGloFNDを導入し、各アンカーデータのしきい値を自動的に学習して、その偽陰性を識別する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:28:25 GMT)
Scaling up Masked Diffusion Models on Text [43.2] 仮面拡散モデル(MDM)は言語モデリングにおいて有望であることを示す。
本稿では,MDMのスケーリングに関する最初の法則を確立する。
我々は、最大11億(B)のパラメータを持つMDMのファミリーをトレーニングし、そのパフォーマンスをより大きなサイズに対して評価する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:02:59 GMT)
ChartMimic: Evaluating LMM's Cross-Modal Reasoning Capability via Chart-to-Code Generation [42.9] 大規模マルチモーダルモデル(LMM)の視覚的グラウンドコード生成能力の評価を目的とした新しいベンチマークであるChartMimicを導入する。
ChartMimicには4,800の人間が計算した(図、命令、コード)三つ子が含まれている。
既存のコード生成ベンチマークとは異なり、ChartMimicは認知能力のブレンドを調和させるLMMの能力を評価することに重点を置いている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:33:00 GMT)
Plan2Align: Predictive Planning Based Test-Time Preference Alignment in Paragraph-Level Machine Translation [42.9] 予測計画問題として翻訳を扱うテスト時間アライメントフレームワークPlan2Alignを紹介する。
Plan2Alignは段落レベルの翻訳を大幅に改善し、既存のトレーニングタイムやテストタイムアライメント手法に匹敵するパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:24:33 GMT)
Multi-modal, Multi-task, Multi-criteria Automatic Evaluation with Vision Language Models [42.6] 視覚言語モデル(VLM)は、様々なマルチモーダルタスクにおいて印象的な能力を示している。
VLMによって生成されたテキストの品質を評価するための既存のメトリクスは、通常、特定のタスクに対する全体的な評価に焦点を当てる。
本稿では,ボトムアップ方式でスコアを生成するために,基準値のスコアを集約する総合評価指標であるHarmonicEvalを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:04:05 GMT)
ECLeKTic: a Novel Challenge Set for Evaluation of Cross-Lingual Knowledge Transfer [42.4] 本稿では,多言語クローズドブックQA(CBQA)データセットであるECLeKTicについて述べる。
12言語におけるウィキペディアの記事の存在と欠如を制御し,言語間の不均一なカバレッジを持つ情報を検出する。
我々は,SOTAモデルが,知識が獲得したのと同じ言語の問合せに対して,解答を十分に予測できたとしても,言語間で効率的に知識を共有するのに苦労していることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:59:30 GMT)
The Limited Impact of Medical Adaptation of Large Language and Vision-Language Models [42.1] 医療用大規模言語モデル(LLM)と視覚言語モデル(VLM)を対応するベースモデルと比較する。
以上の結果から,最先端の汎用ドメインモデルはすでに強力な医学的知識と推論能力を持っている可能性が示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:34:44 GMT)
Atomas: Hierarchical Alignment on Molecule-Text for Unified Molecule Understanding and Generation [42.1] SMILES文字列とテキストから表現を共同学習するマルチモーダルな分子表現学習フレームワークAtomasを提案する。
検索タスクでは、Atomasは堅牢な一般化能力を示し、ベースラインを平均30.8%上回っている。
生成タスクでは、Atomasは分子キャプションタスクと分子生成タスクの両方で最先端の結果を達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:19:08 GMT)
Efficient and Context-Aware Label Propagation for Zero-/Few-Shot Training-Free Adaptation of Vision-Language Model [41.6] 視覚言語モデル(VLM)は、さまざまな下流タスクに取り組むために、トレーニング済みの大きなモデルを活用することで、機械学習に革命をもたらした。
ラベル効率適応と推論のためのグラフベースの手法を提案する。
提案手法は,テキストプロンプト,少数ショット例,テストサンプルのグラフを動的に構築する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:17:06 GMT)
ARTalk: Speech-Driven 3D Head Animation via Autoregressive Model [41.4] 音声駆動型3D顔アニメーションは、任意の音声クリップから3Dヘッドモデルのリアルな唇の動きと表情を生成することを目的としている。
本研究では,高度に同期した唇の動きと,リアルな頭部ポーズと瞬きをリアルタイムに生成する自己回帰モデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:25:53 GMT)
Foot-In-The-Door: A Multi-turn Jailbreak for LLMs [41.0] 主な課題はjailbreakで、敵はビルトインのセーフガードをバイパスして有害な出力を誘導する。
心理学的フット・イン・ザ・ドアの原則に着想を得て,新しいマルチターンジェイルブレイク法であるFITDを導入する。
提案手法は,中間的なブリッジプロンプトを通じてユーザクエリの悪意ある意図を段階的にエスカレートし,それ自身でモデル応答を調整し,有害な応答を誘導する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:11:47 GMT)
Same accuracy, twice as fast: continuous training surpasses retraining from scratch [40.7] 連続学習は、モデルが学習したデータのパフォーマンスを損なうことなく、新しいデータセットに適応できるようにすることを目的としている。
場合によっては、以前のデータでトレーニングされたモデルを放棄し、両方のデータセットでスクラッチから新しいモデルを再トレーニングすることで、両方のデータセットのパフォーマンスが向上する。
評価フレームワークは,これらの手法をスクラッチからトレーニング性能を維持したり,超えたりしながら,計算的貯蓄量を定量化する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:28:12 GMT)
Chain-of-Thought Matters: Improving Long-Context Language Models with Reasoning Path Supervision [40.6] Chain-of-Thoughtプロンプトは、多段階推論を約束するが、長文シナリオの有効性は未検討のままである。
本稿では,LongRePSを提案する。LongRePSは,長いコンテキスト性能を向上させるための高品質な推論経路をモデルに教えるフレームワークである。
本フレームワークには,推論パスをブートストラップする自己サンプリング機構と,長期シナリオ用に設計された新しい品質評価プロトコルが組み込まれている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:15:12 GMT)
Small Models are LLM Knowledge Triggers on Medical Tabular Prediction [39.8] 小モデルを用いたシナジー学習による汎用的な自己プロンプト手法SERSALを提案する。
本研究は,SERSALが言語的プロンプト法に比べて大幅に改善されていることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:23:04 GMT)
Dataset Distillation with Neural Characteristic Function: A Minmax Perspective [39.8] minmax最適化問題としてデータセット蒸留を再構成し、ニューラル特徴関数離散性(NCFD)を導入する。
NCFDは分布差を測定するための包括的で理論的に基礎付けられた計量である。
提案手法は,低解像度および高解像度のデータセット上での最先端手法よりも高い性能向上を実現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:14:55 GMT)
Spectroscopy and complex-time correlations using minimally entangled typical thermal states [39.6] 最小絡み合った典型的な熱状態を用いた相関器の計算に実践的なアプローチを導入する。
これらの数値的手法がシャストリー・サザーランドモデルの有限温度力学を捉えることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:13:31 GMT)
All in One: Exploring Unified Vision-Language Tracking with Multi-Modal Alignment [39.5] 現在の視覚注入(VL)トラッキングフレームワークは、視覚特徴抽出器、言語特徴抽出器、融合モデルという3つの部分から構成される。
本稿では,一貫したトランスフォーマーバックボーンを採用することで,共同特徴抽出とインタラクションを学習するオールインワンフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:44:31 GMT)
Towards Zero Touch Networks: Cross-Layer Automated Security Solutions for 6G Wireless Networks [39.1] 本稿では,物理層認証とクロス層侵入検知システムを対象とした自動セキュリティフレームワークを提案する。
提案フレームワークはドリフト適応型オンライン学習技術と,動的ネットワーク環境向けに最適化されたMLモデルを自動的に生成する改良された逐次Halving(SH)ベースのAutomated ML(AutoML)手法を用いる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:16:11 GMT)
RuCCoD: Towards Automated ICD Coding in Russian [39.0] 我々は1万以上のエンティティと1500以上のユニークなICDコードで注釈付けされたICD符号化のための新しいデータセットを提案する。
このデータセットは、BERT、LLaMA with LoRA、RAGなど、最先端モデルのベンチマークとして機能する。
本実験は, 自動予測符号によるトレーニングが, 医師による手作業による注記データと比較して, 精度を大幅に向上することを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:40:24 GMT)
LLM-Empowered Class Imbalanced Graph Prompt Learning for Online Drug Trafficking Detection [38.9] 本稿では, LLM-HetGDT と呼ばれる, 違法な薬物トラヒック検出のための, 大規模言語モデルを用いた不均質グラフプロンプト学習フレームワークを提案する。
オンライン違法薬物密売行為を包括的に研究するために、Twitter上にTwitter-HetDrugと呼ばれる新しいHGデータセットを収集します。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:38:24 GMT)
FedDyMem: Efficient Federated Learning with Dynamic Memory and Memory-Reduce for Unsupervised Image Anomaly Detection [38.7] 非教師なし画像異常検出(UAD)は、産業および医療応用において重要なプロセスとなっている。
本稿では、FedDyMemと呼ばれる、教師なし画像異常検出のための動的メモリとメモリリデューサを備えた効率的なフェデレーション学習手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:55:58 GMT)
SafeText: Safe Text-to-image Models via Aligning the Text Encoder [38.1] テキスト・ツー・イメージモデルは、安全でないプロンプトが提示されたときに有害な画像を生成することができる。
拡散モジュールではなくテキストエンコーダを微調整する新しいアライメント手法であるSafeTextを提案する。
以上の結果から,SafeTextは画像に小さな影響を与えない有害な画像生成を効果的に防止し,安全なプロンプトを可能にすることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:02:57 GMT)
All-dry pick-up and transfer method for quantum emitter arrays in hexagonal boron nitride [37.7] 六方晶窒化ホウ素中の単一光子放出体は蛍光点のような欠陥に基づいている。
本研究は,これらの課題に対処し,有効性を向上させることを目的とした全乾式転送手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:48:19 GMT)
Connecting Federated ADMM to Bayes [37.5] 我々は, (i) ADMM と (ii) 変分ベイズ (VB) に基づく2つの異なる連邦学習アプローチの新たな接続を提供する。
具体的には、ADMMの双対変数は、等方的ガウス共分散を持つVBで用いられる「サイト」パラメータを通して自然に現れることを示す。
フレキシブルな共分散と機能正規化を利用するVBからADMMの2つのバージョンを導出する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:57:52 GMT)
Know You First and Be You Better: Modeling Human-Like User Simulators via Implicit Profiles [37.4] ユーザシミュレータは、対話システムとの人間のインタラクションを複製するのに不可欠である。
本研究では,人間と機械の会話から暗黙のユーザプロファイルを推論するフレームワークである暗黙のプロファイル(USP)を用いたユーザシミュレータを提案する。
USPは、一貫性において同等のパフォーマンスを達成しつつ、信頼性と多様性の観点から、強力なベースラインを上回ります。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:41:20 GMT)
Deciphering Functions of Neurons in Vision-Language Models [37.3] 本研究の目的は、視覚言語モデル(VLM)の内部を探索し、個々のニューロンの機能を理解することである。
入力された視覚トークンやテキストトークンに関してニューロンの活性化を観察し、いくつかの興味深い知見を明らかにした。
我々は、GPT-4oのアシスタントを用いて、ニューロンの説明を自動化するフレームワークを構築した。
視覚ニューロンに対しては,視覚ニューロンに対する説明の信頼性を評価するためのアクティベーションシミュレータを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:32:05 GMT)
SwimVG: Step-wise Multimodal Fusion and Adaption for Visual Grounding [37.3] 視覚的なグラウンドニングは、画像領域を自然言語でグラウンドすることを目的としており、それはクロスモーダルアライメントに大きく依存している。
SwimVGは、視覚的な接地のためのステップワイズマルチモーダルプロンプト(Swip)とクロスモーダルインタラクティブアダプタ(CIA)を提案する。
SwipとCIAはどちらもパラメータ効率のパラダイムであり、徐々に浅い層から深い層へとクロスモーダルな特徴を融合させていく。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:54:57 GMT)
Cyber Defense Reinvented: Large Language Models as Threat Intelligence Copilots [37.1] CYLENSは、大規模言語モデル(LLM)を利用したサイバー脅威情報通信システムである。
CYLENSは、脅威管理ライフサイクル全体を通じてセキュリティ専門家を支援するように設計されている。
脅威帰属、文脈化、検出、相関、優先順位付け、修復をサポートする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:16:09 GMT)
Generalization of CNNs on Relational Reasoning with Bar Charts [36.8] グラフィカルな知覚に関する以前の実験を再考し、CNNのベンチマーク性能を更新する。
バーチャートのバー長比を推定する古典的リレーショナル推論タスクにおいて,CNNの一般化性能を検証した。
以上の結果から,CNNはトレーニングデータとテストデータが同じ視覚的エンコーディングを持つ場合にのみ,人間よりも優れることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:32:06 GMT)
Rectifying Belief Space via Unlearning to Harness LLMs' Reasoning [36.7] 本研究では,真の信念を同時に拡張しつつ,素早い信念を抑えることによって信念空間を是正する手法を提案する。
提案手法はまず, モデルに文章の説明文を生成するように促すことにより, 誤った解答につながる信念を同定する。
次に、未学習を適用して、同定された刺激的な信念を抑え、真の信念を強化することにより、モデルの信念空間を効果的に修正する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:57:45 GMT)
A Second-Order Perspective on Model Compositionality and Incremental Learning [36.1] 本研究では,非線形ネットワークにおける構成性のデミスト化を試みる理論的研究を提案する。
提案した定式化は、構成可能なモジュールを達成するために、事前訓練された盆地内に留まることの重要性を強調している。
実際、インクリメンタルに学習されたモジュールのプールは、効果的なマルチタスクモデルの作成をサポートするだけでなく、特定のタスクの未学習と特殊化を可能にする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:08:43 GMT)
Unlearning through Knowledge Overwriting: Reversible Federated Unlearning via Selective Sparse Adapter [35.7] フェデレーション学習は、プライバシ保護のためのコラボレーティブモデルトレーニングにおいて有望なパラダイムである。
本稿では,各レイヤの知識に対する感受性を分析することによって,まず重要なレイヤを識別するFUSEDを提案する。
アダプタは元のパラメータを変更することなくトレーニングされ、未学習の知識を残りの知識で上書きする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:35:26 GMT)
Digital Player: Evaluating Large Language Models based Human-like Agent in Games [35.3] オープンソース戦略ゲーム「Unciv」に基づくアプリケーションレベルのテストベッドを開発する。
この「シビライゼーション」のようなゲームは、豊かな言語的相互作用とともに、広大な意思決定空間を特徴としている。
ソーシャルインタラクション、コラボレーション、人間プレイヤーとの交渉のためのヒューマンライクな応答を生成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:46:55 GMT)
Map Space Belief Prediction for Manipulation-Enhanced Mapping [35.0] 本研究では,操作強化セマンティックマッピングの問題に対処する。
ロボットは、散らかった棚の中のすべての物体を効率的に識別する必要がある。
提案する新しいPOMDPプランナは,既存の手法よりも地図の完全性と精度を向上する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:10:52 GMT)
Transformers with Joint Tokens and Local-Global Attention for Efficient Human Pose Estimation [35.0] 本稿では,精度,効率,ロバストな2次元ポーズ推定のための2つのViTモデルを提案する。
6つのベンチマーク実験により,提案手法が最先端手法を著しく上回ることを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:34:22 GMT)
A Compact Model for Large-Scale Time Series Forecasting [34.0] 我々は,超コンパクトな形状のバンクコンポーネントとクロス周期予測モジュールを統合したUltraSTFを提案する。
本モデルは,形状バンク成分の注意機構を用いて時系列の繰り返しパターンを効果的に検出する。
UltraSTFはLargeSTベンチマークで最先端のパフォーマンスを達成し、第2のベストアプローチで要求されるパラメータの0.2%未満を採用できる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:35:51 GMT)
UniGEM: A Unified Approach to Generation and Property Prediction for Molecules [33.9] 分子生成と特性予測をうまく統合する最初の統一モデルUniGEMを提案する。
我々の重要な革新は、分子足場が形成された後、後段で予測タスクが活性化される新しい2相生成プロセスにある。
UniGEMの背景にある原則は、自然言語処理やコンピュータビジョンなど幅広い応用を約束している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:12:22 GMT)
The Power of Personality: A Human Simulation Perspective to Investigate Large Language Model Agents [33.8] クローズドタスクにおける性格特性は問題解決にどのように影響するか?
オープンなタスクにおいて、特性は創造性をどう形成しますか?
シングルエージェントのパフォーマンスはマルチエージェントコラボレーションにどのように影響しますか?
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:01:39 GMT)
Beyond Demographics: Fine-tuning Large Language Models to Predict Individuals' Subjective Text Perceptions [33.8] モデルにより,学習時の社会デマログラフィーの促進効果が向上することを示す。
このパフォーマンス向上は主に、ソシオデマトグラフィーパターンよりも、アノテータ固有の振る舞いを学ぶモデルが原因である。
全ての課題において,本研究の結果から,ソシオデマトグラフィーとアノテーションの関連性はほとんど学習されていないことが示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:53:42 GMT)
MV-MATH: Evaluating Multimodal Math Reasoning in Multi-Visual Contexts [33.6] MV-MATHは,2,009の高次数問題からなる厳密にキュレートされたデータセットである。
それぞれの問題は、K-12シナリオから派生したテキストでインターリーブされた複数の画像を統合し、詳細なアノテーションで富む。
MV-MATHには、複数の選択、自由形式、多段階の質問が含まれており、3つの困難レベルにわたる11の主題領域をカバーしている。
我々は,マルチ視覚数学におけるMLLMの課題が,MV-MATH上での人間の能力に比較してかなりの性能差があることを観察した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:50:36 GMT)
Distilling foundation models for robust and efficient models in digital pathology [33.0] 大規模基礎モデルをより小さく蒸留し,数桁のパラメータ数を削減した。
我々のモデルであるH0-miniは、推定コストを大幅に削減して、大規模FMにほぼ匹敵する性能を実現する。
いくつかの公開ベンチマークで評価され、HESTベンチマークで3位、EVAベンチマークで5位となった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:44:24 GMT)
Utility-Directed Conformal Prediction: A Decision-Aware Framework for Actionable Uncertainty Quantification [32.9] 我々は,下流のコスト関数を考慮に入れた予測セットを特定するために,共形予測に基づく手法を開発した。
提案手法は,下流決定とユーザ指定ユーティリティ機能を取り入れつつ,コンフォメーション手法の強みを活用する。
本手法は皮膚疾患の階層構造を効果的に取り入れた医療診断における実世界のユースケースを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:26:15 GMT)
Supporting the development of Machine Learning for fundamental science in a federated Cloud with the AI_INFN platform [32.7] 機械学習(ML)は、科学者がデータ集約型ソフトウェアを設計、開発、デプロイする方法に革命をもたらしている。
MLの採用は、特に開発、テスト、運用のためのハードウェアアクセラレータへのアクセスのプロビジョニングとオーケストレーションに関して、コンピューティングインフラストラクチャに対する新たな課題を提示している。
INFNが出資するプロジェクトであるAI_INFN("Artificial Intelligence at INFN")は、AIネイティブコンピューティングリソースの提供を含む複数の側面のサポートを提供することで、INFNユースケースにおけるMLテクニックの採用を促進することを目的としている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:42:58 GMT)
ALVI Interface: Towards Full Hand Motion Decoding for Amputees Using sEMG [32.5] 表面EMG信号を用いた手の動きの復号化システムを提案する。
インターフェースは、上肢のアンプ用に設計された20度の自由度で指の関節角度をリアルタイムに再構築する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:29:35 GMT)
Empower Vision Applications with LoRA LMM [32.4] 低ランク適応(LoRA)は、外部知識を大規模言語モデル(LMM)に統合する有望な方法を提供する
既存のLoRAモデルは計算コストが大きすぎるため、非常にレイテンシが高い。
多様なビジョンタスクの強化とLoRA LMMによるビジョンアプリケーション強化を目的としたエンドツーエンドソリューションを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:57:42 GMT)
UXAgent: An LLM Agent-Based Usability Testing Framework for Web Design [32.3] 近年のLarge Language Model-simulated Agent (LLM-Agent) 研究はUXAgentの設計に影響を与えた。
LLM-Agentモジュールとユニバーサルブラウザコネクタモジュールを備えており、UX研究者は、ターゲットWebサイトをテストするために、何千ものシミュレーションされたユーザを自動的に生成できる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:28:55 GMT)
Learnable Expansion of Graph Operators for Multi-Modal Feature Fusion [32.1] コンピュータビジョンタスクでは、様々な表現、ドメイン、モダリティから特徴が生まれる。
関係グラフを構成することにより,高言語の特徴空間から低次元の解釈可能なグラフ空間へシフトする。
ビデオ異常検出におけるグラフベース融合法の有効性を実証する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:52:40 GMT)
Mitigating Hallucinations in Large Vision-Language Models by Adaptively Constraining Information Flow [32.0] 大きな視覚言語モデルは、人間の言語を通して視覚情報を理解する大きな可能性を示している。
それらは、物体の幻覚に苦しむ傾向があり、すなわち、生成された画像記述には、画像の中に存在しない物体が含まれている。
本稿では,幻覚雑音の導入による過信を軽減するため,変分情報ボトルネック(VIB)を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:56:23 GMT)
Training-free and Adaptive Sparse Attention for Efficient Long Video Generation [31.6] Diffusion Transformers (DiTs) による高忠実度長ビデオの生成は、しばしば大きな遅延によって妨げられる。
本稿では,最初の動的パターンとオンライン精密検索スパースアテンション手法であるAdaSpaを提案する。
AdaSpaは適応的なプラグアンドプレイソリューションとして実装されており、既存のDiTとシームレスに統合することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:11:20 GMT)
FANformer: Improving Large Language Models Through Effective Periodicity Modeling [30.8] 本稿ではFANformerを紹介し,Fourier Analysis Network(FAN)をアテンション機構に統合し,効率的な周期性モデリングを実現する。
FANformerはモデルサイズのスケールアップやトークンのトレーニングにおいて,Transformerよりも一貫してパフォーマンスが向上している。
FANformerの有効性をさらに検証するため、FANformer-1Bを1兆個のトークンで事前訓練する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:52:24 GMT)
TIMotion: Temporal and Interactive Framework for Efficient Human-Human Motion Generation [30.7] 本稿では,人間の動作生成のための効率的かつ効果的なフレームワークであるTIMotion(Temporal and Interactive Modeling)を紹介する。
本稿では2つの異なるシーケンスを時間的および因果的特性を利用した因果的シーケンスとしてモデル化するための因果的対話注入を提案する。
よりスムーズで合理的な動きを生成するために,短期動作パターンをキャプチャする局所パターン増幅法を設計した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:45:05 GMT)
No Free Lunch Theorem for Privacy-Preserving LLM Inference [30.6] 本研究では,プライバシ保護型大規模言語モデル(LLM)を推定するためのフレームワークを開発する。
プライバシー保護とユーティリティの相互作用を調べるための、しっかりとした理論的基盤を築いている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:38:26 GMT)
Large Language Models Are Innate Crystal Structure Generators [30.4] 本研究では,事前学習した大規模言語モデルが,追加のトレーニングを伴わずに本質的に安定な結晶構造を生成可能であることを示す。
私たちのフレームワークであるMatLLMSearchは、事前訓練されたLLMと進化的検索アルゴリズムを統合し、78.38%のメタスタブルレートを達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:41:16 GMT)
The Rise of Darkness: Safety-Utility Trade-Offs in Role-Playing Dialogue Agents [30.0] LLM(Large Language Models)はロールプレイング対話エージェントにおいて顕著な進歩を遂げ、文字シミュレーションにおいてその有用性を実証している。
この本質的なキャラクターシミュレーションは、安全でないコンテンツを生成するリスクが伴うため、これらのエージェントがキャラクタ描写ユーティリティとコンテンツ安全性のバランスを取ることは依然として困難である。
本稿では,リスクカップリングの度合いに基づいて安全ユーティリティの嗜好を動的に調整する適応動的マルチパラメータ(ADMP)手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:18:50 GMT)
UAV-Assisted Real-Time Disaster Detection Using Optimized Transformer Model [29.9] 本研究は,航空機上での航空画像処理により,適切な,リアルタイムな災害検出を実現することに焦点を当てる。
提案手法は,災害検知のためのUAV支援エッジ・フレームワークで,実時間航空画像分類に最適化されたモデルを活用することを提案する。
我々は、UAVや個人が現場で捉えた災害シーンを特徴とする新しいデータセット、DermaEyeを構築した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:42:30 GMT)
Real-Time Aerial Fire Detection on Resource-Constrained Devices Using Knowledge Distillation [29.9] 森林火災の災害は、環境劣化、人的損失、財政的損害を著しく引き起こす。
現在のシステムは、主に視野の限られた固定CCTVカメラに依存しており、大規模な屋外環境での有効性を制限している。
より強力な教師モデルからの知識の蒸留を通じて圧縮されたMobileViT-Sに基づく軽量火災検知モデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:49:58 GMT)
Tool-Planner: Task Planning with Clusters across Multiple Tools [29.3] ツールキットに基づくタスク処理フレームワークであるTool-Plannerを提案する。
Tool-Plannerは同じ関数を持つAPI関数をツールキットにグループ化する。
ツールエラーが発生した場合、言語モデルはツールキットに基づいてツールを再選択し、調整することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:12:21 GMT)
LLM Whisperer: An Inconspicuous Attack to Bias LLM Responses [28.5] 命令における微妙なシノニム置換は、LLMが目標概念に言及する可能性(最大78%)を高めることができることを示す。
我々は,1)人間による未修正のプロンプトと区別不能なプロンプト,2)LLMを押して目標概念をより頻繁に推奨すること,3)ユーザが目標概念に気づく可能性が高くなることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:41:16 GMT)
On Oversquashing in Graph Neural Networks Through the Lens of Dynamical Systems [28.4] Message-Passing Neural Networksの一般的な問題はオーバーカッシング(oversquashing)である。
本稿では, 過疎化に対処する新たな視点を導入し, グローバルおよびローカルな非拡散性のシステム特性を活用する。
空間領域と重み領域の両方において反対称性を持つ一意にパラメータ化されたGNNモデルであるSWANを非拡散性を得る手段として提示する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:37:29 GMT)
Bridging Context Gaps: Leveraging Coreference Resolution for Long Contextual Understanding [28.2] 大規模言語モデル(LLM)の性能向上を目的としたLong Question Coreference Adaptation (LQCA) 手法を提案する。
このフレームワークは、長いコンテキストに合わせて調整されたコア参照解決に焦点を当てており、モデルが参照を効果的に識別し、管理することができる。
私たちのコードはhttps://github.com/OceannTwT/LQCA.comで公開されています。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:09:00 GMT)
Cache Me If You Must: Adaptive Key-Value Quantization for Large Language Models [28.2] AQUA-KVは、コンパクトアダプタに依存するキーバリューキャッシュの適応量子化である。
パープレキシティとLongBenchスコアの相対誤差を1%以下の値で2-2.5ビットで近似する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:04:52 GMT)
A Pilot Empirical Study on When and How to Use Knowledge Graphs as Retrieval Augmented Generation [28.1] 本稿は,KG-RAGをいつ,どのように使用するかという質問に対して,体系的に回答する基盤を定めている。
我々は,KG-RAG手法を7つのデータセットにまたがる6つのKG-RAG手法を,多様なシナリオで再実装し,評価するために,KG-RAGの試験的研究を行った。
本結果は,KG-RAGコンポーネントの適切な適用条件と最適構成の重要な役割を裏付けるものである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:53:08 GMT)
RoboBrain: A Unified Brain Model for Robotic Manipulation from Abstract to Concrete [27.8] MLLM(Multimodal Large Language Models)は、様々なマルチモーダルコンテキストにまたがる顕著な機能を示す。
計画能力、順応知覚、軌道予測の3つの重要なロボット脳能力が欠如している。
タスク計画やオブジェクトの空き時間,エンドエフェクタの軌道といった多次元情報をラベル付けしたデータセットであるShareRobotを紹介する。
ロボットと一般的なマルチモーダルデータを組み合わせたMLLMベースのモデルであるRoboBrainを,マルチステージトレーニング戦略を用いて開発する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:30:39 GMT)
Identifying Sensitive Weights via Post-quantization Integral [27.7] 後方感度をきめ細かな方法で推定するための後量子化積分(PQI)を提案する。
また、ReQuantも提案しています。ReQuantはシンプルで強力なフレームワークで、主に2- and-Sparseのdetachコンポーネントで構成されています。
その結果、ReQuantは、QTIPを用いたLlama 3.2 1Bに対して2.66パープレキシティゲインを顕著に向上させ、最先端のポストトレーニング量子化手法を向上することが示された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:04:19 GMT)
3D Prior is All You Need: Cross-Task Few-shot 2D Gaze Estimation [27.5] 本研究では,未確認デバイス上での2次元視線予測に事前学習した3次元視線推定ネットワークを適用することを目的とした,クロスタスクな2次元視線推定手法を提案する。
このタスクは、3Dと2Dの視線、未知の画面ポーズ、限られたトレーニングデータとのドメインギャップのため、非常に難しい。
我々は,MPIIGaze,EVE,GazeCaptureの各データセットに対して,それぞれノートパソコン,デスクトップコンピュータ,モバイルデバイス上で収集した手法を評価する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:35:00 GMT)
MuseGNN: Forming Scalable, Convergent GNN Layers that Minimize a Sampling-Based Energy [27.3] グラフニューラルネットワーク(GNN)アーキテクチャは、クロスインスタンス関係でデータをモデル化することができる。
このアーキテクチャの重要なサブクラスは、フォワードパスが関心のグラフ正規化エネルギー関数を反復的に還元するように設計された層を含む。
本稿では, ある設定における収束保証によって導かれる, サンプリングベースエネルギー関数と拡張性のあるGNN層を反復的に削減する手法を提案する。
また、これらの設計に基づいて完全なGNNアーキテクチャをインスタンス化し、1TBを超える最大公用ノード分類ベンチマークに適用した場合の競合精度とスケーラビリティを実現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:36:30 GMT)
PersuasiveToM: A Benchmark for Evaluating Machine Theory of Mind in Persuasive Dialogues [27.2] 心の理論 (ToM) として知られる自己や他者の精神状態を理解し予測する能力は、効果的な社会的相互作用に不可欠である。
近年,Large Language Models (LLM) がToMの形式を示すかどうかを評価する研究が進んでいる。
本稿では,説得対話におけるLLMのToM能力を評価するためのベンチマークであるPersuasiveToMを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:04:04 GMT)
Eliciting In-context Retrieval and Reasoning for Long-context Large Language Models [27.2] 長文言語モデル(LCLM)は知識ベース全体を処理し、直接検索と推論を行うことができる。
LOFTのような既存のベンチマークは、過度に単純化されたコンテキストを提供することでLCLMのパフォーマンスを過大評価することが多い。
ICR2はLCLMをより現実的なシナリオで評価するベンチマークである。
次に, LCLMの性能向上のための3つの手法を提案する。(1) 検索-then-generate fine-tuning, (2) 注意頭を用いてデコード中の長いコンテキストをフィルタリング・復調する検索-attention-probing, (3) 生成ヘッドと併用した共同検索ヘッドトレーニング。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:40:20 GMT)
An Improved Privacy and Utility Analysis of Differentially Private SGD with Bounded Domain and Smooth Losses [27.0] 我々は、差分的にプライベートなグラディエントDescentの厳格なプライバシとユーティリティ特性を提供する。
境界領域を持つDPSGDの場合、プライバシー損失は凸性仮定なしで収束可能であることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:45:00 GMT)
Gradient Imbalance in Direct Preference Optimization [27.0] 計算効率のよい勾配再重み付け機構を導入するDPOの目的に対して, 単純かつ効果的な修正である Balanced-DPO を提案する。
本実験は, バランスドDPOの有効性を実証し, 理論的結果の検証と, DPOの性能向上の鍵となる勾配不均衡への対処について検証した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:47:03 GMT)
Quantum-machine-assisted Drug Discovery: Survey and Perspective [26.9] 従来のコンピュータ支援ドラッグデザイン(CADD)は、このプロセスの加速に大きな進歩をもたらした。
量子コンピューティングの本質的な能力を活用することで、新しい薬を市場に投入する際の時間とコストを削減できるかもしれません。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:07:42 GMT)
Bypassing the Exponential Dependency: Looped Transformers Efficiently Learn In-context by Multi-step Gradient Descent [26.8] 線形ループ変換器は、コンテキスト内学習において、多段階勾配勾配を効率よく実装できることを示す。
この結果から,入力データが一定条件数である場合,$n = O(d)$であれば,線形ループ変換器の誤差は小さくなることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:12:33 GMT)
CS-Bench: A Comprehensive Benchmark for Large Language Models towards Computer Science Mastery [26.4] 大規模言語モデル(LLM)は、研究や社会の様々な分野を前進させる大きな可能性を示している。
このギャップを埋めるために,計算機科学におけるLLMの性能評価に特化した最初の多言語ベンチマークCS-Benchを紹介する。
CS-Benchは、コンピュータ科学の4つの重要な領域にわたる26のサブフィールドをカバーする、約10Kの精巧にキュレートされたテストサンプルで構成されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:16:04 GMT)
Timing-Driven Global Placement by Efficient Critical Path Extraction [26.2] 本稿では,DREAMPlaceインフラストラクチャに正確なパスレベル情報を統合する,GPUによるタイミング駆動グローバル配置フレームワークを提案する。
実験結果から,本手法は現在のリードタイミング駆動型プレーサーよりも有意に優れていた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:34:19 GMT)
Characteristics Analysis of Autonomous Vehicle Pre-crash Scenarios [26.2] 自動運転車(AV)の公道試験で数百件の事故が発生
現在の研究は主に、従来の人間駆動車両の事故に焦点を当てている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:10:53 GMT)
FedConv: A Learning-on-Model Paradigm for Heterogeneous Federated Clients [25.8] フェデレートラーニング(FL)は、クライアントのプライベートデータを公開せずに、共有グローバルモデルの協調トレーニングを容易にする。
我々は、リソース制約のあるクライアントの計算とメモリ負荷を最小限に抑えるクライアントフレンドリーなFLフレームワークであるFedConvを提案する。
モデル精度,計算量,通信オーバヘッドの観点から,FedConvは最先端のFLシステムより優れていることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:39:53 GMT)
Unleashing the Potential of Two-Tower Models: Diffusion-Based Cross-Interaction for Large-Scale Matching [25.7] 2towerモデルは、幅広いアプリケーション領域にわたる産業規模のマッチング段階で広く採用されている。
マッチングパラダイム内での"クロスインタラクションデカップリングアーキテクチャ"を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:40:37 GMT)
Precise Event Spotting in Sports Videos: Solving Long-Range Dependency and Class Imbalance [25.3] イベントスポッティング(英: Event Spotting、PES)は、特にスポーツにおいて、長くトリミングされていないビデオからイベントとそのクラスを特定することを目的としている。
既存の方法は、主に大きな事前訓練されたネットワークの機能に依存しており、タスクには適していないかもしれない。
本稿では, エンド・ツー・エンドの設計したネットワークが, 最先端のSOTA(State-of-the-art)手法より優れていることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:53:42 GMT)
MIGE: A Unified Framework for Multimodal Instruction-Based Image Generation and Editing [25.1] MIGEはマルチモーダル命令を使ってタスク表現を標準化する統合フレームワークである。
対象駆動生成を空白キャンバス上の生成として扱い、命令ベースの編集を既存の画像の修正として扱う。
MIGEは、自由形式のマルチモーダル命令を統一された視覚言語空間にマッピングする新しいマルチモーダルエンコーダを導入している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:21:08 GMT)
Exploring the Effectiveness of Object-Centric Representations in Visual Question Answering: Comparative Insights with Foundation Models [24.6] 下流視覚質問応答(VQA)における表現学習に関する実証的研究を行った。
我々はOCモデルと代替アプローチの利点とトレードオフを徹底的に検討する。
両パラダイムの強みを活用するための,有望な道を見つける。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:32:26 GMT)
Data-driven Error Estimation: Upper Bounding Multiple Errors without Class Complexity as Input [24.5] 私たちはこれを「エラー推定問題」と捉えています。
目標は、推定クラスの最大誤差の高確率上限を決定することである。
有限なクラス設定と無限なクラス設定の両方にそのような境界を導出する、完全にデータ駆動のアプローチを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:10:30 GMT)
MiCEval: Unveiling Multimodal Chain of Thought's Quality via Image Description and Reasoning Steps [24.4] 本稿では,各推論ステップと記述の質を評価することによって,推論チェーンの正しさを評価するためのフレームワークを提案する。
MiCEvalは詳細なデータセット上に構築されており、各ステップを正確性、妥当性、情報性に応じて評価するアノテーションを備えている。
実験の結果、MiCEvalを用いた段階的評価は、既存の方法に比べて人間の判断とより密接に一致していることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:57:03 GMT)
Feedback Favors the Generalization of Neural ODEs [24.3] 本稿では、フィードバックループがニューラル常微分方程式(ニューラルODE)の学習潜時ダイナミクスを柔軟に補正可能であることを示す。
フィードバックニューラルネットワークは、新しい2自由度ニューラルネットワークであり、前のタスクで精度が失われることなく、目に見えないシナリオで堅牢なパフォーマンスを持つ。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:09:10 GMT)
SuperRAG: Beyond RAG with Layout-Aware Graph Modeling [24.2] 本稿では,マルチモーダルRAGのためのレイアウト対応グラフモデリングを提案する。
提案手法は,グラフ構造を用いてマルチモダリティの関係を考慮に入れた。
入力文書の構造は、テキストチャンク、テーブル、フィギュアの接続で保持される。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:05:49 GMT)
Does Generation Require Memorization? Creative Diffusion Models using Ambient Diffusion [24.2] 本研究では,ノイズスケールでノイズデータを用いて拡散モデルを訓練する原理的手法を提案する。
本手法は,テキスト条件モデルと非条件モデルの両方において,画像品質を低下させることなくメモリ化を大幅に削減する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:57:48 GMT)
FACTS: A Factored State-Space Framework For World Modelling [24.1] 本研究では,時空間空間モデリングのための新しいリカレントフレームワークであるtextbfFACTored textbfState-space (textbfFACTS) モデルを提案する。
FACTSフレームワークは、置換可能なメモリ表現を学習するルーティング機構を備えたグラフメモリを構築する。
汎用的な世界モデリング設計にもかかわらず、常に最先端のモデルに勝ったり、マッチする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:20:18 GMT)
Non-Stationary Latent Auto-Regressive Bandits [24.0] 我々は、報酬が変化を意味する非定常的盗賊問題について、潜在的自己回帰(AR)状態により考察する。
我々は,非定常予算に依存しないオンライン線形文脈帯域幅アルゴリズムであるLatent AR LinUCBを開発した。
環境における非定常性のレベルに関して、LARLの解釈可能な後悔境界を提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:29:21 GMT)
Dynamics as Prompts: In-Context Learning for Sim-to-Real System Identifications [23.9] そこで本研究では,テキスト内学習を用いてシミュレーション環境パラメータを動的に調整する手法を提案する。
オブジェクトスクーピングとテーブルエアホッケーという2つのタスクにまたがるアプローチを検証する。
提案手法は,ロボットの動的現実シナリオへの展開を推し進め,効率的かつスムーズなシステム識別を実現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:39:19 GMT)
Enhancing the coherence time of a neutral atom by an optical quartic trap [23.8] 光学的に閉じ込められた中性原子のコヒーレンス時間は、量子技術にとって重要なパラメータである。
差分エネルギーシフトと光子跳躍速度のばらつきに起因するデコヒーレンス率を定式化した。
捕捉された単一セシウム原子のコヒーレンス時間について実験的に検討した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:20:28 GMT)
Scalable Decentralized Learning with Teleportation [23.8] 分散学習環境では、与えられたトポロジのみに通信が発生すると仮定されるが、実際、トポロジは単に望ましい通信パターンを表すだけである。
従来の研究では、大きなスペクトルギャップを持つ位相を設計することで、これらの場合の収束速度の低下を緩和しようと試みてきた。
TELEPORTATIONは,ノード数のみを活性化することにより,収束率の低下を完全に軽減できることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:08:06 GMT)
Self-Training Elicits Concise Reasoning in Large Language Models [23.5] チェーン・オブ・シント(CoT)推論により、中間トークンによるさらなる計算を大規模言語モデル(LLM)が利用できるようになった。
自己生成した簡潔な推論経路を利用する簡単な微調整法を提案する。
提案手法は,GSM8KおよびMATH上の5つのモデルファミリに対して,平均精度を維持しつつ,出力トークンの30%削減を実現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:12:10 GMT)
SemiSAM+: Rethinking Semi-Supervised Medical Image Segmentation in the Era of Foundation Models [23.4] SemiSAM+は、医療画像セグメンテーションのための限定ラベル付きデータから効率的に学習する基盤モデル駆動SSLフレームワークである。
SemiSAM+は、ジェネラリストモデルとして1つまたは複数のプロンプト可能な基礎モデルと、専門家モデルとして訓練可能なタスク固有のセグメンテーションモデルで構成されている。
2つの公開データセットと1つの社内臨床データセットの実験は、SemiSAM+が大幅なパフォーマンス改善を実現していることを示している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:54:41 GMT)
UIBDiffusion: Universal Imperceptible Backdoor Attack for Diffusion Models [23.1] 拡散モデル(DM)はバックドア攻撃に対して脆弱である。
DMに対する汎用的非受容バックドアアタックであるUIBDiffusionを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:36:39 GMT)
Taming Overconfidence in LLMs: Reward Calibration in RLHF [23.0] RLHFは, モデルが自身の反応において, 言語的過信を表現することを示している。
PPO-M: PPO with Calibrated Reward Modeling と PPO-C: PPO with Calibrated Reward calculation の2種類を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:36:40 GMT)
Dreamweaver: Learning Compositional World Models from Pixels [23.0] 人間は自然に世界の知覚を物体とその属性に分解する能力を持っている。
この認知的プロセスは、慣れ親しんだ概念を再結合することで、新しい未来を想像することができる。
生のビデオから階層的および構成的表現を発見するために設計されたニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:12:21 GMT)
Seeing Eye to AI? Applying Deep-Feature-Based Similarity Metrics to Information Visualization [22.9] 近年の研究では、画像類似性の知覚的判断と深い特徴に基づく類似度指標がよく相関していることが示されている。
5つのMLアーキテクチャと3つの事前訓練された重み集合を用いて類似度尺度を拡張する。
我々の研究は、深い機能ベースのメトリクスが視覚化における類似性評価をどのように強化するかを理解し、視覚分析ツールや技術の改善に寄与する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:25:04 GMT)
ReFu: Recursive Fusion for Exemplar-Free 3D Class-Incremental Learning [22.9] ReFuと呼ばれる新しいRecursive Fusionモデルを導入し、3Dクラスインクリメンタルラーニングのためのポイントクラウドとメッシュを統合した。
本稿では,2つのモード間の相関関係を学習するPointcloud-Guided Mesh Attention Layerを特徴とする融合モジュールを提案する。
各種データセットを対象とした実験により,提案手法が3次元クラスインクリメンタル学習において既存手法より優れていることが示された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:55:27 GMT)
Procedural Synthesis of Synthesizable Molecules [22.9] 合成可能な分子の設計と、合成不可能な分子へのアナログの推奨は、分子発見を加速させる重要な問題である。
プログラム合成のアイデアを用いて,両問題を再認識する。
合成経路の空間を推論するための二段階のフレームワークを作成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:43:44 GMT)
Do Language Models Understand Honorific Systems in Javanese? [22.8] ジャワ語は、話者、聞き手、参照者の社会的地位に応じて異なる、複雑な名誉体系を持つ。
本稿では,Unggah-Ungguh Basaのニュアンスをカプセル化したデータセットであるUnggah-Ungguhを紹介する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:05:35 GMT)
Style Content Decomposition-based Data Augmentation for Domain Generalizable Medical Image Segmentation [22.7] 我々は、画像をそのスタイルコードとコンテンツマップに分解し、医療画像のドメインシフトが関与していることを明らかにする: textbfstyle shifts (emphi.、画像の外観の違い)と textbfcontent shifts (emphi.、解剖学的構造の変化)。
textbfStyCona, textbfstyle textbfcontent decomposition-based data textbfaugmentation method を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:56:46 GMT)
Capability Localization: Capabilities Can be Localized rather than Individual Knowledge [22.6] 大規模言語モデルは自然言語処理に関連するタスクにおいて優れたパフォーマンスを実現している。
従来の研究では、個々の知識は局所的なパラメータに格納され、個々の知識の保存形態は分散パラメータ、パラメータ層、パラメータチェーンであると考えられていた。
本稿では、共通性ニューロンの同定に成功し、GSM8Kデータセット上でのニューロン重複率96.42%を達成するCNL法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:22:13 GMT)
ByteScale: Efficient Scaling of LLM Training with a 2048K Context Length on More Than 12,000 GPUs [22.5] ByteScaleは、長いシーケンスと短いシーケンスの大規模な混合トレーニングのための効率的なフレームワークである。
ByteScaleはHybrid Data Parallelism(HDP)をベースにしている。
実験の結果,ByteScaleは最先端のトレーニングシステムよりも最大7.89倍優れていた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:01:03 GMT)
Enhancing dissipative cat qubit protection by squeezing [22.4] キャット量子ビットは、量子エラー訂正が組み込まれているため、量子プロセッサにとって有望なアーキテクチャである。
通常の猫に比べて160倍のビットフリップ時間の改善が見られた。
また、Z$-gate不忠実度を2倍に下げることを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:30:50 GMT)
PreMind: Multi-Agent Video Understanding for Advanced Indexing of Presentation-style Videos [22.4] PreMindは講義ビデオの理解とインデクシングのための新しいマルチエージェントマルチモーダルフレームワークである。
スライドの視覚的内容の抽出、音声の物語の書き起こし、これらの視覚的内容と音声的内容の統合化という3つの重要なステップを通じて、マルチモーダルインデックスを生成する。
VLMを用いた音声書き起こし誤りの検出・訂正や、視覚分析における動的反復自己回帰のための批判エージェントの利用などである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:17:48 GMT)
Technical Report for ReID-SAM on SkiTB Visual Tracking Challenge 2025 [21.9] ReID-SAMはSkiTB Challengeのために開発された新しいモデルで、スキーヤーの外観を追跡する複雑さに対処する。
SkiTBデータセットで評価すると、ReID-SAMは最先端のF1スコア0.870を達成した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:57:57 GMT)
Decoder Gradient Shield: Provable and High-Fidelity Prevention of Gradient-Based Box-Free Watermark Removal [21.9] ボックスフリーの透かしは、ディープ・イメージ・ツー・イメージ・モデルを保護することができる。
ボックスフリーの透かしは、それぞれエンコーダとデコーダを使用して、モデルの出力画像から見えない著作権マークを埋め込んで抽出する。
本稿では,保護されていない透かしデコーダの脆弱性を明らかにする。
本稿では,デコーダAPIの保護層としてデコーダ勾配シールド(DGS)を提案し,勾配に基づく透かし除去を防止する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:27:14 GMT)
Steering Large Language Model Activations in Sparse Spaces [21.6] AIアライメントにおける重要な課題は、テスト時に望ましい振る舞いに従うために、大きな言語モデル(LLM)を導くことである。
スパース・アクティベーション・ステアリング(SAS)はスパース・オートエンコーダ(SAE)を利用してスパース空間のステアリングを行う手法である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:43:45 GMT)
Dynamic Pricing in the Linear Valuation Model using Shape Constraints [21.3] 線形評価モデルにおける検閲データに対する動的価格設定に対する形状制約付きアプローチを提案する。
本手法は, 文献における既往の方法と比較して, 経験的後悔の度合いが向上する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:32:12 GMT)
Four-hour thunderstorm nowcasting using deep diffusion models of satellite [21.2] 衛星の深部拡散モデル(DDMS)を提案し,AIを用いた対流流速報システムを構築する。
FengYun-4A衛星による長期試験と客観的検証において,本システムは4時間までの有効対流を初めて達成した。
本システムは効率よく作動する(4時間の対流を8分で予測)。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:22:11 GMT)
Distribution Prototype Diffusion Learning for Open-set Supervised Anomaly Detection [21.1] Open-set Supervised Anomaly Detection (OSAD)では、既存の手法は通常、観測された異常サンプルの不足を補うために擬似異常を生成する。
本研究では,正規サンプルをコンパクトかつ識別可能な分布空間内に囲むことを目的とした分布プロトタイプ拡散学習法を提案する。
実験の結果,提案するDPDLの有効性と優位性を示し,9つの公開データセット上で最先端の性能を実現することができた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:50:50 GMT)
DiTASK: Multi-Task Fine-Tuning with Diffeomorphic Transformations [21.1] DiTASKは、複数のタスクに対してトレーニング済みの視覚変換器を効率的に適応するための新しいアプローチである。
重み行列特異ベクトルを保存し、タスク固有の適応を可能にすることで、事前訓練された表現を維持する。
PASCAL MTLとNYUDを用いた実験により、DiTASKは4つの密集予測タスクで最先端の性能を達成することが示された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:07:51 GMT)
Persuasion Should be Double-Blind: A Multi-Domain Dialogue Dataset With Faithfulness Based on Causal Theory of Mind [21.0] 最近の説得的対話データセットは、実世界の対人インタラクションと一致しないことが多い。
ToMMAは、心の因果理論によって導かれる対話生成のための新しいマルチエージェントフレームワークである。
マルチドメイン・マルチターン・パーサッシブ・ダイアログ・データセットであるCTOMPersuを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:28:16 GMT)
EDENet: Echo Direction Encoding Network for Place Recognition Based on Ground Penetrating Radar [20.9] 地中レーダ(GPR)に基づくローカライゼーションは,ロボット工学において顕著に認識されている。
既存の手法は主に小規模の位置認識(PR)に重点を置いており、大規模地図におけるPRの課題は未解決のまま残されている。
本稿では, 指向性応答を正確に抽出するための学習可能なGaborフィルタと, 効果的な幾何符号化のための方向認識型アテンション機構を紹介する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:48:12 GMT)
PASemiQA: Plan-Assisted Agent for Question Answering on Semi-Structured Data with Text and Relational Information [20.8] PASemiQAは,半構造化データ中のテキストと関係情報を協調的に活用して質問に答える手法である。
PASemiQAは,様々な領域から得られた各種半構造化データセットに対して有効であることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:26:47 GMT)
You Only Prune Once: Designing Calibration-Free Model Compression With Policy Learning [20.6] PruneNetは、ポリシー学習プロセスとしてモデルプルーニングを再構成する新しいモデル圧縮手法である。
LLaMA-2-7Bモデルはわずか15分で圧縮でき、ゼロショット性能の80%以上を維持できる。
複雑なマルチタスク言語理解タスクでは、PruneNetはオリジナルのモデルの80%のパフォーマンスを維持することで、その堅牢性を実証している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:23:40 GMT)
CoMT: Chain-of-Medical-Thought Reduces Hallucination in Medical Report Generation [20.6] 医療報告生成における幻覚を緩和するためのチェーン・オブ・メディカル・シント・アプローチ(CoMT)を提案する。
CoMTは、診断手順を分解することで、人間の医師の認知過程を模倣しようとしている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:36:50 GMT)
S4ConvD: Adaptive Scaling and Frequency Adjustment for Energy-Efficient Sensor Networks in Smart Buildings [20.5] 我々は、Deep State Space Models(Deep-SSMs)の新しい畳み込み変種であるS4ConvDを紹介する。
S4ConvDはリソース制約のある環境でのランタイムを最適化するように設計されている。
ASHRAE Great Energy Predictor IIIデータセットの実験では、S4ConvDが現在のベンチマークを上回っていることが明らかになった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:27:25 GMT)
FC-Attack: Jailbreaking Large Vision-Language Models via Auto-Generated Flowcharts [20.3] 本稿では,自動生成フローチャートFC-Attackに基づくジェイルブレイク攻撃手法を提案する。
FC-AttackはGemini-1.5、Llaval-Next、Qwen2-VL、InternVL-2.5で90%以上の攻撃成功率を達成した。
攻撃を緩和するため、いくつかの防御策を探索し、AdaShieldが脱獄性能を大幅に低下させるが、実用コストは低下する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:59:11 GMT)
LongReason: A Synthetic Long-Context Reasoning Benchmark via Context Expansion [20.3] LongReasonは、大規模言語モデルの長文推論能力を評価するための総合ベンチマークである。
LongReasonは、3つのタスクカテゴリにまたがる多様な推論パターンを持つ794の多重選択推論質問で構成されている。
LLMをLongReason上で評価した結果,コンテキスト長の増加に伴い,ほとんどのモデルが大幅な性能低下を経験していることが判明した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:53:20 GMT)
T2ICount: Enhancing Cross-modal Understanding for Zero-Shot Counting [20.2] ゼロショットオブジェクトカウントは、テキスト記述によって指定された任意のオブジェクトカテゴリのインスタンスをカウントすることを目的としている。
我々は、事前学習した拡散モデルから、豊富な事前知識ときめ細かい視覚的理解を活用する拡散に基づくフレームワークT2ICountを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:09:18 GMT)
PsychBench: A comprehensive and professional benchmark for evaluating the performance of LLM-assisted psychiatric clinical practice [20.2] LLM(Large Language Models)は、医療資源の不足や精神科臨床における診断整合性の低下といった問題に対処するための潜在的な解決策を提供する。
精神科臨床現場における LLM の実用性を評価するためのベンチマークシステム PsychBench を提案する。
既存のモデルは大きな可能性を秘めているが,精神科臨床における意思決定ツールとしてはまだ不十分である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:17:41 GMT)
Logicbreaks: A Framework for Understanding Subversion of Rule-based Inference [20.1] 我々は命題Hhorn論理の推論としてルール追従を定式化する。
我々は、小さなトランスフォーマーはそのようなルールを忠実に守ることができるが、悪意のあるプロンプトは、データから学んだ理論的構成とモデルの両方を誤解させる可能性があることを証明している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:50:12 GMT)
DiffBrush:Just Painting the Art by Your Hands [20.0] 現在のAI絵画エコシステムは、主にテキスト駆動拡散モデル(T2I)に依存している。
DiffBrushはT2Iモデルと互換性があり、ユーザーは画像の描画や編集ができる。
DiffBrushは、潜時とインスタンスレベルの注目マップを継続的に導くことで、画像内のオブジェクトの色、意味、およびインスタンスの制御を実現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:01:39 GMT)
egoPPG: Heart Rate Estimation from Eye-Tracking Cameras in Egocentric Systems to Benefit Downstream Vision Tasks [20.0] エゴセントリックな視覚システムは、その中の周囲と着用者の行動を理解することを目的としている。
エゴセンティブ型視覚システムのための新しい課題であるegoPulseを提案する。この課題は、着用者の生理状態の指標として、人の心拍数(HR)を抽出するものである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:23:40 GMT)
Grams: Gradient Descent with Adaptive Momentum Scaling for Training Large Language Models [20.0] $mathbfG$radient Descent with $mathbfA$daptive $mathbfM$omentum $mathbfS$caling。
Gramsは、ディープラーニングにおける更新の方向と大きさを分離する最適化アルゴリズムである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:31:39 GMT)
MIRAGE: Evaluating and Explaining Inductive Reasoning Process in Language Models [19.8] 帰納的および帰納的段階における大規模言語モデルの能力を評価する。
モデルが正しい帰納的規則を使わずに常に正しい推論を行う傾向があることが分かる。
帰納的推論プロセスでは、モデルは機能空間における現在のテスト例に近い観察された事実に焦点を当てる傾向があります。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:01:32 GMT)
Behind the Tip of Efficiency: Uncovering the Submerged Threats of Jailbreak Attacks in Small Language Models [19.8] 小型言語モデル(SLM)は、高い効率性と計算コストの低いエッジデバイスへの展開において、ますます顕著になっている。
種々のジェイルブレイク攻撃下での13の最先端SLMのセキュリティ性能を評価するための総合的な実証的研究を行った。
我々の実験では、ほとんどのSLMは既存のジェイルブレイク攻撃の影響を受けやすいが、一部のSLMは直接的な有害なプロンプトに対して脆弱である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:59:26 GMT)
TSPRank: Bridging Pairwise and Listwise Methods with a Bilinear Travelling Salesman Model [19.7] トラベリングセールスマン問題ランキング (TSPRank) は、ハイブリッド・ペア・リストワイズ・ランキング法である。
TSPRankの既存の手法に対する大きな利点は、ランク付け中にグローバルな情報をよりよく活用できることである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:56:56 GMT)
Oscillation-Reduced MXFP4 Training for Vision Transformers [19.6] FP4の精度で事前学習するトランスフォーマーには、かなりの精度が失われる。
MXFP4データフォーマットのトレーニングは依然として大きな劣化をもたらす。
より正確なFP4トレーニングのための新しいトレーニング手法TetraJetを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:51:55 GMT)
ARIC: An Activity Recognition Dataset in Classroom Surveillance Images [19.6] 私たちはARIC(Activity Recognition In Classroom)と呼ばれる教室監視画像行動認識に焦点を当てた新しいデータセットを構築した。
ARICデータセットには、複数の視点、32のアクティビティカテゴリ、3つのモダリティ、現実世界の教室シナリオの利点がある。
我々は、ARICデータセットが、オープンな教育シナリオの分析と研究のファシリテーターとして機能することを願っている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:45:25 GMT)
ChroKnowledge: Unveiling Chronological Knowledge of Language Models in Multiple Domains [19.4] ChroKnowBenchは、時系列的に蓄積された知識を評価するために設計されたベンチマークデータセットである。
ChroKnowledgeは、LLMの非パラメトリック時系列知識を評価するための新しいサンプリングベースのフレームワークである。
ChroKnowPrompt(クロクノウプロンプト)は、周囲の時間帯をステップバイステップで移動することで、時系列の知識を引き出すための奥行きである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:02:31 GMT)
CODI: Compressing Chain-of-Thought into Continuous Space via Self-Distillation [19.2] CoT(Chain-of-Thought)は、自然言語のステップバイステップ推論を可能にすることで、Large Language Models(LLM)を強化する。
暗黙のCoTメソッドは、明示的なCoTトークンなしで推論を有効にしようとするが、タスクパフォーマンスにおいて明示的なCoTメソッドに常に遅れを取っている。
本研究では,CoTを連続的な空間に蒸留する新しいフレームワークであるCODIを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:07:48 GMT)
Improving Open-world Continual Learning under the Constraints of Scarce Labeled Data [19.2] Openworld Continual Learning (OWCL)は、オープンサンプルによるシーケンシャルなタスクに適応し、忘れることを防ぐと同時に、知識を漸進的に学習する。
本稿では,(1)サンプル表現を付加的な知識で表現・強化するインスタンスワイドトークン拡張(ITA),(2)新しいタスクによるオープンな検出を支援するマージンベースのオープンバウンダリ(MOB),(3)未知を未知から未知に更新する知識を持つ適応的知識空間(AKS)の3つの重要なコンポーネントを統合する新しいOFCLフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:39:18 GMT)
Logic Synthesis Optimization with Predictive Self-Supervision via Causal Transformers [19.1] LSOformerは、自動回帰トランスフォーマーモデルと予測SSLを利用して、結果の質の軌道(QoR)を予測する新しいアプローチである。
LSOformerは、クロスアテンションモジュールを統合して、回路グラフと最適化シーケンスからの洞察をマージし、QoRメトリクスの予測精度を向上させる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:04:54 GMT)
Optimal Transfer Learning for Missing Not-at-Random Matrix Completion [18.9] 生物問題に動機づけられたMNAR(Missing Not-at-Random)環境におけるマトリックス完成のための伝達学習について検討した。
ターゲット行列$Q$は全行と列が欠落しており、サイド情報なしでは推定が不可能である。
我々は行と列のアクティブサンプリングとパッシブサンプリングの両方を考慮し、各設定においてエントリワイズ推定誤差に対して最小限の下位境界を確立する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:40:00 GMT)
Fully-inductive Node Classification on Arbitrary Graphs [18.9] 本稿では、モデルが新しい構造、特徴、ラベル空間を持つ任意のテストグラフ上で推論を行うための完全な帰納的設定を提案する。
この挑戦的なセットアップの最初の試みとして、GraphAnyを提案する。
実証的には、わずか120のラベル付きノードを持つ単一のウィスコンシンデータセットでトレーニングされたGraphAnyは、平均精度67.26%で30の新しいグラフに一般化できる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:56:45 GMT)
Extending Dense Passage Retrieval with Temporal Information [18.9] 本稿では、クエリタイムスタンプと文書日付を表現空間に組み込むことにより、明示的な時間的信号を統合する時間的検索モデルを提案する。
提案手法は,検索されたパスがトポロジに関連しているだけでなく,時間的にユーザの意図に適合していることを保証する。
大規模ベンチマークデータセットであるArchivealQAとCentrallingAmericaQAについて検討した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:06:25 GMT)
AuthSim: Towards Authentic and Effective Safety-critical Scenario Generation for Autonomous Driving Tests [18.8] 危険レベルに基づいてエリアを分割し,NPC車両が相対境界領域に入る可能性を高める3層相対安全領域モデルを提案する。
このモデルは,NPC車両に対して比較的安全な境界領域内での敵行動の実行を指示し,シナリオの信頼性を高める。
我々は、認証および効果的な安全クリティカルシナリオを生成するための総合的なプラットフォームAuthSimを紹介する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:38:35 GMT)
ManiSkill-HAB: A Benchmark for Low-Level Manipulation in Home Rearrangement Tasks [18.7] MS-HABは、低レベルの操作と家庭内オブジェクト再構成のための総合的なベンチマークである。
我々は、現実的な低レベル制御をサポートし、GPUメモリ使用率のごく一部で、事前の魔法の把握実装の3倍の速度を達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:10:33 GMT)
On Rademacher Complexity-based Generalization Bounds for Deep Learning [18.6] 我々は,Rademacherの複雑性に基づくフレームワークが,CNNに対して非空の一般化境界を確立することができることを示す。
重要な技術的進歩は、ベクトル空間間の高次元写像のための新しい縮約補題の定式化である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:24:49 GMT)
Ext2Gen: Alignment through Unified Extraction and Generation for Robust Retrieval-Augmented Generation [18.6] 提案するExt2Genは,回答を生成する前にクエリ関連文を抽出することでRAGを強化する新しい抽出列生成モデルである。
実験により、Ext2Genはクエリ関連文を高い精度とリコールで効果的に識別し、信頼性の高い回答をもたらすことが示された。
我々のモデルをRAG環境にデプロイすると、ベースLLMの性能が向上するだけでなく、クエリ拡張のような高度な検索戦略と相乗効果がもたらされることが明らかになる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:46:53 GMT)
Cell-ontology guided transcriptome foundation model [18.5] オープンバイオロジー・バイオメディカルオントロジーファウンデーションの細胞オントロジーグラフにマッピングされた細胞型ラベルを利用して,CellxGeneデータベースから2200万の細胞上でscCelloを事前訓練した。
我々のTFMは、生物学的に重要なタスクにおいて、既存のTFMよりも競合的な一般化と伝達性性能を示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:36:51 GMT)
Scalable Overload-Aware Graph-Based Index Construction for 10-Billion-Scale Vector Similarity Search [18.4] SOGAICは超大規模ベクトルデータベースに適したグラフベースのANNSインデックス構築システムである。
提案手法は実世界の産業用検索エンジンに導入され,毎日100億件以上のベクトルを処理している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:03:23 GMT)
Revisiting a Design Choice in Gradient Temporal Difference Learning [18.3] オフ・ポリシー・ラーニングは、強化学習エージェントが実行されていないポリシーについて反実的に推論することを可能にする。
関数近似とブートストラップを組み合わせると不安定になる可能性がある。
本稿では、$Atop$TDの変種である$A_ttop$TDが、致命的なトライアドの効果的な解であることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:52:31 GMT)
Adaptive Illumination-Invariant Synergistic Feature Integration in a Stratified Granular Framework for Visible-Infrared Re-Identification [18.2] Visible-Infrared Person Re-Identification (VI-ReID) は、捜索・救助、インフラ保護、夜間監視などの応用において重要な役割を担っている。
適応型モダリティインタラクションネットワークである textbfAMINet を提案する。
AMINetは、全体画像と上体画像の両方から包括的アイデンティティ属性をキャプチャするために、多粒度特徴抽出を利用する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:42:58 GMT)
A Riemannian Framework for Learning Reduced-order Lagrangian Dynamics [18.2] 本稿では,物理的に整合した低次動的パラメータを学習するための新しい幾何学的ネットワークアーキテクチャを提案する。
本手法は,剛性および変形性システムの高次元力学の高精度な長期予測を可能にする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:12:10 GMT)
Better Benchmarking LLMs for Zero-Shot Dependency Parsing [18.1] 本稿では,現在最先端のオープンウェイトLLMを,入力文にアクセスできないベースラインと比較することによって検討する。
その結果, 試験されたLLMのほとんどは, 最良の非インフォームベースラインを達成できないことがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:08:57 GMT)
UDora: A Unified Red Teaming Framework against LLM Agents by Dynamically Hijacking Their Own Reasoning [17.4] 外部ツールを備えた大規模言語モデル(LLM)エージェントは、複雑なタスクを扱うためにますます強力になっている。
LLMエージェント用に設計された統一レッドチーム化フレームワークであるUDoraを,エージェント自身の推論プロセスを動的に活用し,悪意のある動作に強制する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:30:28 GMT)
Dimension Agnostic Neural Processes [17.4] メタラーニングは、さまざまなタスクデータセット間で共有機能を抽出することで、ラベル付きデータで新しいタスクに一般化可能なモデルをトレーニングすることを目的としている。
本稿では、入力特徴を固定次元空間に変換し、様々なタスクで一般化可能な幅広い特徴を学習するDmension A Neural Processes(DANP)を紹介する。
実験により,DANPは従来のNPモデルよりも優れており,従来のNPモデルの限界を克服する効果が示された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:40:59 GMT)
Deep Incomplete Multi-view Learning via Cyclic Permutation of VAEs [17.3] 不完全データにおけるビュー間の不変関係を抽出する多視点自動エンコーダ(MVP)を提案する。
MVPは、変分自動エンコーダの潜在空間におけるビュー間の対応を確立し、行方不明のビューの推測を可能にする。
提案手法の有効性を,欠落率の異なる7つの多様なデータセットに対して示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:04:20 GMT)
Reward Dimension Reduction for Scalable Multi-Objective Reinforcement Learning [17.2] 本稿では,多目的強化学習アルゴリズムのスケーラビリティ問題に対処する,単純かつ効果的な報酬次元削減手法を提案する。
本手法は,多目的設定における学習効率と政策性能を向上させるために次元削減手法を用いる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:13:23 GMT)
Towards Lossless Implicit Neural Representation via Bit Plane Decomposition [17.2] 暗黙的ニューラル表現(INR)モデルのサイズの上限をデジタル視点から定量化する。
本稿では,INRがビット平面を予測するビット平面分解法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:43:46 GMT)
Generative Uncertainty in Diffusion Models [17.1] 合成試料の生成不確かさを推定するためのベイズ的枠組みを提案する。
提案手法は, 品質の悪いサンプルを効果的に同定し, 既存の不確実性に基づく手法を著しく上回ることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:56:39 GMT)
WHALE-FL: Wireless and Heterogeneity Aware Latency Efficient Federated Learning over Mobile Devices via Adaptive Subnetwork Scheduling [17.0] 我々は,適応サブネットワークスケジューリングによるFLトレーニングを高速化するために,無線かつ認識可能な遅延効率FL(WHALE-FL)アプローチを開発した。
評価の結果,WHALE-FLはピアデザインと比較して,学習精度を犠牲にすることなく,FLトレーニングを効果的に加速することがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:57:11 GMT)
Curse of Attention: A Kernel-Based Perspective for Why Transformers Fail to Generalize on Time Series Forecasting and Beyond [17.0] TSFタスクにおける変圧器の非効率性に関する最初の理論的説明を提案する。
トレーニングアテンションネットワークにおけるbf非対称学習のメカニズムを考察する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:36:37 GMT)
Fast Training of Sinusoidal Neural Fields via Scaling Initialization [16.9] sinusoidal Neural Field (SNFs) という,ニューラルネットワークの一般的なファミリーに焦点をあてる。
それぞれの重みを定数で乗算することで、SNFトレーニングを10$times$で加速できることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:20:04 GMT)
Everything, Everywhere, All at Once: Is Mechanistic Interpretability Identifiable? [16.9] 機械的解釈可能性(MI)は、人間の理解可能なアルゴリズムを抽出して、その振る舞いを説明することで、ニューラルネットワークをリバースエンジニアリングすることを目的としている。
与えられた行動に対して、そしてMIの基準の下では、ユニークな説明が存在するか?
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:13:54 GMT)
Evaluation of LLMs-based Hidden States as Author Representations for Psychological Human-Centered NLP Tasks [16.8] 我々は,異なるLMアーキテクチャとHuLMアーキテクチャを用いて,文書やユーザを表現するさまざまな方法を評価する。
文書をトークン隠蔽状態の平均として表すことが,一般に最善であることがわかった。
ユーザレベルの隠蔽状態自体が最高の表現であることはめったにないが、モデルに含めることでトークンやドキュメントの埋め込みが強化される。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:10:06 GMT)
Protein Structure Tokenization: Benchmarking and New Recipe [16.8] 我々はStructTokenBenchを紹介した。StructTokenBenchは、構造トークンの質と効率を包括的に評価するフレームワークである。
また、コードブック更新を強化し、コードブックのサイズと寸法を最適にバランスさせ、トークン化ツールの利用と品質を改善する戦略であるAminoAseedを開発します。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:14:33 GMT)
How Metacognitive Architectures Remember Their Own Thoughts: A Systematic Review [16.4] 計算メタ認知アーキテクチャ(CMA)がどのようにしてメタ認知経験をモデル化し、保存し、記憶し、処理するかをレビューする。
基礎となる心理学理論から収集データの内容と構造、使用するアルゴリズムや評価結果まで、さまざまな側面を考察する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:48:41 GMT)
FoCTTA: Low-Memory Continual Test-Time Adaptation with Focus [16.3] FoCTTAは低メモリ領域シフト適応戦略である。
FCTTAはメモリ使用量を平均3倍に削減し,精度は8.1%,3.6%,0.2%向上した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:06:15 GMT)
Token-level Ensembling of Models with Different Vocabularies [16.1] モデルアンサンブル(英: Model ensembling)は、2つ以上のモデルの予測分布を組み合わせる手法である。
本稿では,異なる語彙でモデルを組み立てる推論時間のみのアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:41:27 GMT)
OFER: Occluded Face Expression Reconstruction [16.1] OFERはシングルイメージの3次元顔再構成のための新しいアプローチであり、可塑性、多様性、表現力のある3次元顔を生成することができる。
多様な表現間の整合性を維持するため,予測された形状精度スコアに基づいて,形状拡散ネットワークの出力をソートする新しいランキング機構を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:16:33 GMT)
Autoregressive Medical Image Segmentation via Next-Scale Mask Prediction [16.0] 本稿では,AR-Segと呼ばれる次世代マスク予測によるAutoRegressiveフレームワークを提案する。
AR-Segは、すべての前のスケールで依存関係を明示的にモデリングすることで、次のスケールマスクを徐々に予測する。
本稿では,AR-Segが最先端の手法より優れており,中間粗大分節過程を明示的に可視化していることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:05:58 GMT)
XpertAI: uncovering regression model strategies for sub-manifolds [15.9] レグレッションでは、特定のユーザクエリに対処するために、説明を正確に定式化する必要がある。
XpertAIは、予測戦略を複数の範囲固有のサブストラテジーに切り離すフレームワークである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:08:37 GMT)
Spiking Transformer:Introducing Accurate Addition-Only Spiking Self-Attention for Transformer [15.9] スパイキングニューラルネットワークは、従来のニューラルネットワークに代わる有望なエネルギー効率の代替として登場した。
本稿では,A$2$OS$2$Aの精度付加型スパイク自己注意について紹介する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:23:29 GMT)
Unposed Sparse Views Room Layout Reconstruction in the Age of Pretrain Model [15.9] マルチビュールームレイアウト推定のための新しい手法であるPlain-DUSt3Rを提案する。
Plane-DUSt3RはDUSt3Rフレームワークを室内レイアウトデータセット(Structure3D)に組み込んで構造平面を推定する。
均一かつ同相な結果を生成することにより、Plane-DUSt3Rは、単一の後処理ステップと2D検出結果のみを用いて、部屋レイアウトの推定を可能にする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:33:01 GMT)
Raccoon: Multi-stage Diffusion Training with Coarse-to-Fine Curating Videos [15.8] CFC-VIDS-1Mは、体系的な粗いキュレーションパイプラインによって構築された高品質のビデオデータセットである。
我々は、空間的時間的注意機構を分離したトランスフォーマーベースのアーキテクチャであるRACCOONを開発した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:56:35 GMT)
PediaBench: A Comprehensive Chinese Pediatric Dataset for Benchmarking Large Language Models [15.6] LLM評価のための中国初の小児科用データセットであるPediaBenchを構築した。
対象質問は4,117件、主観的質問は1,632件である。
LLMの熟練度を徹底的に評価するために、異なる難易度に基づいて総合的なスコアリング基準を採用する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:54:16 GMT)
XAIxArts Manifesto: Explainable AI for the Arts [15.6] 本稿では、説明可能性とAIに関する新しい考え方を促すために、説明可能なAI for the Arts(XAIxArts)マニフェストを紹介する。
私たちはWorld Caf'eスタイルの議論フォーマットを生きたマニフェストと組み合わせて、エンパワーメント、インクルージョン、フェアネスの4つのテーマに疑問を投げかけます。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:50:17 GMT)
Modeling Human Beliefs about AI Behavior for Scalable Oversight [15.5] AIシステムがより能力を持つようになると、人間のフィードバックはますます信頼できなくなる。
これは、スケーラブルな監視の問題を提起する: 人間の能力を超えたAIシステムをどのように監視するか?
我々は、人間のフィードバックをよりよく解釈するために、AIシステムの振る舞いに対する人間の評価者の信念をモデル化することを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:39:55 GMT)
AMuLeT: Automated Design-Time Testing of Secure Speculation Countermeasures [15.4] 本稿では,シミュレータの設計段階の早い段階で投機的漏洩に対する安全な投機対策を検証できる最初のツールであるAMuLeTを開発する。
我々は,シミュレータにおいて,表現的かつ現実的な攻撃者オブザーバモデルを設計するなど,いくつかの課題を特定し,克服する。
AMuLeTは、単純な設計に比べて10倍以上のテストスループットをスピードアップし、脆弱性を増幅して限られたテスト予算内でそれらを発見するためのテクニックを使用している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:51:26 GMT)
ColPali: Efficient Document Retrieval with Vision Language Models [15.4] 我々は、複数のドメイン、言語、実用的な設定にまたがる様々なページレベルの検索タスクからなるVisual Document Retrieval Benchmark ViDoReを紹介する。
現代のシステムの本質的な複雑さと性能上の欠点は、ドキュメントページのイメージを直接埋め込むことで文書検索を行うという新しい概念を動機付けている。
文書ページの画像から高品質なマルチベクトル埋め込みを生成するために訓練されたビジョン言語モデルColPaliをリリースする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:51:57 GMT)
If At First You Don't Succeed: Test Time Re-ranking for Zero-shot, Cross-domain Retrieval [15.3] 反復的クラスタフリーリグレードプロセスは、ギャラリーギャラリー機能情報を活用して、クエリとギャラリーイメージ間のセマンティックリンクを確立する。
慎重に選択されたVision Transformerのバックボーンとゼロショット検索の損失の組み合わせを組み合わせると、我々の手法は最先端の結果をもたらす。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:02:21 GMT)
Exploring Information-Theoretic Metrics Associated with Neural Collapse in Supervised Training [14.9] 本稿では,教師あり学習のための分析ツールとして行列エントロピーを導入する。
ニューラルネットワークがニューラルネットワークに近づくと,行列エントロピーがデータ表現の情報量の変化を効果的に捉えていることが示される。
また、事前訓練されたモデルの微調整を最適化するために、クロスモデルアライメント(CMA)損失を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:19:00 GMT)
Palm: A Culturally Inclusive and Linguistically Diverse Dataset for Arabic LLMs [14.9] アラブ22カ国を対象とする1年間のコミュニティ主導プロジェクトであるデータセットを紹介します。
このデータセットには、現代標準アラビア語(MSA)と方言アラビア語(DA)の両方の指示が含まれており、20種類のトピックにまたがっている。
我々は、いくつかのフロンティアLSMの文化的・弁証的能力を評価するためにデータセットを使用し、顕著な限界を明らかにした。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:59:13 GMT)
Disentangling Feature Structure: A Mathematically Provable Two-Stage Training Dynamics in Transformers [14.8] 本稿では, 変圧器においてこのような2段階のトレーニング力学がどのように起こるかを理論的に示す。
最もよく知られているのは、トランスにおける2段階最適化プロセスに関して、これが最初の厳密な結果である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:27:24 GMT)
Semantic Volume: Quantifying and Detecting both External and Internal Uncertainty in LLMs [14.7] 大規模言語モデル (LLM) は、膨大な事実知識を符号化することで、様々なタスクにまたがる顕著な性能を示した。
彼らはまだ幻覚を起こす傾向があり、誤った情報や誤解を招く情報を生み出し、しばしば高い不確実性を伴う。
LLMにおける外部不確実性と内部不確実性の両方を定量化する新しい尺度であるSemantic Volumeを紹介する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:09:08 GMT)
MetaMetrics: Calibrating Metrics For Generation Tasks Using Human Preferences [14.6] メタメトリクス(MetaMetrics)は,様々なモダリティにまたがる生成タスクを教師付きで評価するメタメトリクスである。
我々の測定基準は、言語と視覚の両方の下流タスクにおける柔軟性と有効性を示し、様々な多言語および多ドメインのシナリオにおいて大きな利点を示します。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:33:22 GMT)
BadRefSR: Backdoor Attacks Against Reference-based Image Super Resolution [14.6] RefSRは、高周波の詳細を回復するために追加の参照画像を利用する。
BadRefSRは参照イメージにトリガを追加し、混合損失関数でトレーニングすることで、RefSRモデルにバックドアを埋め込む。
我々の研究は、研究者にRefSRのバックドアリスクを警告することを目的としています。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:53:39 GMT)
CoSMoEs: Compact Sparse Mixture of Experts [14.6] オンデバイス推論において,CoSMoE(Compact Sparse Mixture of Experts)を有効にする方法を示す。
特に、品質、メモリ、レイテンシの3つの主要なオンデバイスディメンションに取り組みます。
重量分解の専門家を導入し、MoEモデルの性能をさらに改善する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:25:11 GMT)
GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse [14.6] 我々は、暗黙のヘイトスピーチ、サイバーいじめ、性差別などのテーマをカプセル化した6K以上の様々なミームからなる包括的なミームベンチマークGOAT-Benchを紹介した。
我々はLMMがヘイトフルネス、軽蔑、攻撃性、皮肉、有害なコンテンツを正確に評価する能力について検討した。
LMMの幅広い実験により、現在のモデルは安全意識に欠けており、様々な形態の暗黙的虐待に敏感であることが明らかとなった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:13:46 GMT)
DexGraspVLA: A Vision-Language-Action Framework Towards General Dexterous Grasping [14.5] 汎用ロボットは任意のシナリオで多様な物体を把握できなければならない。
私たちのソリューションはDexGraspVLAです。これは、事前訓練されたビジョンランゲージモデルをハイレベルタスクプランナとして利用する階層的なフレームワークです。
本手法は, 数千の未確認物体, 照明, 背景の組み合わせで90%以上の成功率を達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:57:20 GMT)
PFGuard: A Generative Framework with Privacy and Fairness Safeguards [14.5] プライバシと公平性を保護した生成フレームワークであるPFGuardを提案する。
PFGuardは、公正なトレーニングステージとプライベートトレーニングステージの間のプライバシーと公正の衝突のバランスをとる。
実験の結果,PFGuardは高次元データから合成データを生成することに成功した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:03:21 GMT)
Amortized Control of Continuous State Space Feynman-Kac Model for Irregular Time Series [14.4] 医療、気候、経済などの現実世界のデータセットは、しばしば不規則な時系列として収集される。
本稿では,連続状態空間モデル (ACSSM) を時系列の連続的動的モデリングに用いるためのアモータイズ制御を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:30:08 GMT)
VRM: Knowledge Distillation via Virtual Relation Matching [14.3] 我々は,関係性に基づく手法において,過度な適合性や刺激的な応答に対する感受性など,いくつかの重要な課題に対処する。
我々は、有用なサンプル間、クラス間、およびビュー間相関の富をコンパクトにカプセル化する、新規に構築された親和性グラフを転送する。
CIFAR-100およびImageNetデータセットの実験は、提案した仮想関係マッチング(VRM)法の優れた性能を示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:29:39 GMT)
Visual Attention Exploration in Vision-Based Mamba Models [13.9] 状態空間モデル(SSM)は、トランスフォーマーモデルに代わる効率的な代替品として登場した。
SSMの最新の進歩の1つ、Mambaは、トレーニング可能なウェイトを入力トークンに割り当てる選択的スキャン機構を導入した。
Mambaはまた、2D画像を小さなパッチに分解し、1Dシーケンスとしてアレンジすることで、視覚領域にまで拡張された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:33:18 GMT)
ARS: Automatic Routing Solver with Large Language Models [13.9] 本稿では,自動ルーティング解法の有効性を評価するために,24属性から派生した1000種類のVRPのベンチマークであるRoutBenchを紹介する。
RoutBenchとともに,Large Language Model (LLM) エージェントを用いてバックボーンアルゴリズムフレームワークを強化する自動ルーティングソルバー(ARS)を提案する。
ARSは最先端のLCMベースの手法と一般的に使用されるソルバより優れており、一般的なVRPの91.67%が自動的に解決され、すべてのベンチマークで少なくとも30%の改善が達成されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:49:06 GMT)
Learning to Steer Learners in Games [13.8] ゲームにおける繰り返しの相互作用を通じて学習アルゴリズムを活用することの問題点を考察する。
まず,学習者が非学習アルゴリズムの一般からアルゴリズムを使用していることを知っていれば,これは不可能であることを示す。
学習者のアルゴリズムが、既知の正則化器とステップサイズで上昇したミラーを解析することにより、より小さなクラスから引き出される場合、このアプローチの有効性を実証する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:43:15 GMT)
Learning Multi-agent Multi-machine Tending by Mobile Robots [13.8] 本稿では,MARL(Multi-agent Reinforcement Learning)技術に基づく移動ロボットによるマルチエージェント型マルチマシン学習フレームワークを提案する。
マルチエージェント・プロキシ・ポリシー・オプティマイゼーション(MAPPO)アルゴリズムにアテンションベースの符号化機構を開発し,その性能を高める。
我々のモデル (AB-MAPPO) は, タスク成功, 安全性, 資源利用の観点から, MAPPO よりも優れていた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:41:20 GMT)
DropBP: Accelerating Fine-Tuning of Large Language Models by Dropping Backward Propagation [13.8] 本稿では,DropBP(Drop Backward Propagation)を提案する。
DropBPは後方伝播中にランダムにレイヤをドロップするが、これは本質的に浅いサブモジュールのトレーニングに相当する。
ベースラインに匹敵する精度でトレーニング時間を44%削減し、同じパープレキシティへの収束を1.5倍加速し、1つのNVIDIA-A100 GPUでシーケンス長6.2倍のトレーニングを可能にする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:53:34 GMT)
Enhancing deep neural networks through complex-valued representations and Kuramoto synchronization dynamics [13.6] 視覚的分類のために訓練された人工モデルにおいて、同期型メカニズムがオブジェクト符号化を向上できるかどうかを検討する。
複素数値表現と倉本ダイナミクスを組み合わせ、位相アライメントを促進し、同一対象に属する特徴のグルーピングを容易にする。
本研究は,ディープラーニングモデルの向上,性能の向上,堅牢性,一般化のための同期駆動機構の可能性を明らかにする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:10:42 GMT)
LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control [13.6] Portrait Animationは、単一のソースイメージからビデオを合成し、それを外観参照として使用し、駆動ビデオ、オーディオ、テキスト、または生成から派生したモーションで合成することを目的としている。
我々はLivePortraitというビデオ駆動のポートレート・アニメーション・フレームワークを開発した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:39:17 GMT)
Stochastic Optimal Control for Diffusion Bridges in Function Spaces [13.5] 無限次元空間に合わせた最適制御の理論を提案する。
我々は、Doob の $h$-transform が SOC の観点から導出され、無限次元に拡張されることを示す。
2つの無限次元分布間のブリッジの学習と、無限次元分布からの標本化のための生成モデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:26:29 GMT)
Distributional Scaling Laws for Emergent Capabilities [13.4] 測定値の急激なブレークスルーは,種子間の分布の連続的な変化によって生じることを示す。
逆スケーリングのケーススタディとして、成功したランの確率が低下しても、成功したランの平均性能が単調に増加し続けることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:52:47 GMT)
STPro: Spatial and Temporal Progressive Learning for Weakly Supervised Spatio-Temporal Grounding [13.4] Weakly Supervised S-Temporal Video Grounding (WSTVG) について検討した。
視覚時間基礎モデルの最近の進歩に触発されて,ゼロショットグラウンド機能を活用したWSTVGの実用性について検討する。
このギャップを埋めるため、2つの重要なモジュールを持つ新しいプログレッシブラーニングフレームワークSTProを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:06:23 GMT)
Flattening Supply Chains: When do Technology Improvements lead to Disintermediation? [13.2] デジタル経済では、技術革新によって高品質なコンテンツの製造が安価になる。
これらのイノベーションは、消費者が仲介をバイパスして直接これらの技術を使用することができるため、不干渉につながる可能性がある。
生産コストが高すぎるか、あるいは低すぎると、不調が生じます。
次に、均衡における福祉とコンテンツ品質の相違による影響について検討する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:04:01 GMT)
Learning Multi-Modal Whole-Body Control for Real-World Humanoid Robots [13.2] Masked Humanoid Controller (MHC)は、立位、歩行、体の一部の動きの模倣をサポートする。
MHCは、立ち上がり、歩行、最適化された基準軌跡、再ターゲットされたビデオクリップ、人間のモーションキャプチャーデータにまたがる行動のライブラリから、部分的にマスクされた動きを模倣する。
実世界のDigi V3ヒューマノイドロボット上でのシミュレート・トゥ・リアルトランスファーを実演する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:05:33 GMT)
EdgeAIGuard: Agentic LLMs for Minor Protection in Digital Spaces [13.2] 本稿では,未成年者に対するオンライングルーミングやデジタル活用のさまざまな形態から保護するためのEdgeAIGuardコンテンツモデレーション手法を提案する。
提案手法は,ネットワークエッジに戦略的に配置したマルチエージェントアーキテクチャを用いて,低レイテンシで高速に検出し,未成年者を対象とした有害なコンテンツを防止する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:29:34 GMT)
Synthesizing Tabular Data Using Selectivity Enhanced Generative Adversarial Networks [13.2] この論文は、クエリ選択性制約を取り入れた新しいGANベースのアプローチを導入している。
トレーニング済みのディープニューラルネットワークを統合して、実データと合成データ間の選択性一貫性を維持する。
提案手法は,5つの実世界のデータセットで検証され,最先端の3つのGANとVAEモデルより優れていた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:26:41 GMT)
EVLoc: Event-based Visual Localization in LiDAR Maps via Event-Depth Registration [13.1] イベントカメラはバイオインスパイアされたセンサーで、ハイダイナミックレンジや低レイテンシなどいくつかの特長がある。
既存のLiDARマップ内でのローカライズの可能性を探る。
構造的明瞭度を改善する新しいフレームベースのイベント表現を開発する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:27:49 GMT)
DISCO: Internal Evaluation of Density-Based Clustering [13.0] 密度に基づくクラスタリングでは、クラスタは低い対象密度領域によって分離された高い対象密度の領域である。
密度に基づくクラスタリングの結果の品質を適切に評価することは困難である。
ノイズラベルの品質も評価した最初のCVIである密度に基づくクラスタリングアウトカム用内部スコアであるdisCOを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:13:29 GMT)
Fine-Grained Retrieval-Augmented Generation for Visual Question Answering [12.6] VQA(Visual Question Answering)は、画像からの情報を活用することで、自然言語の質問に対する回答を提供することに焦点を当てている。
外部知識ベース(KB)を活用する検索拡張世代(RAG)が,将来性のあるアプローチとして出現する。
本研究では,テキストスニペットをベクトルデータベースに格納したエンティティイメージにマージする,きめ細かい知識単位を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:25:38 GMT)
A Survey of Uncertainty Estimation Methods on Large Language Models [12.3] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示している。
これらのモデルでは、偏見、幻覚、あるいは非現実的な反応が、その流感と現実的な外観によってもたらされる可能性がある。
不確実性推定がこの課題に対処する鍵となる方法である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:38:39 GMT)
Comparative study of the ansätze in quantum language models [12.1] 量子自然言語処理(QNLP)メソッドとフレームワークは、テキストの分類と生成のために存在する。
我々は、これらのアンスに基づく量子自然言語処理モデルの性能を、テキスト分類タスクの異なるレベルで評価する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:49:38 GMT)
Jawaher: A Multidialectal Dataset of Arabic Proverbs for LLM Benchmarking [12.1] 大型言語モデル(LLM)は、西洋文化、アングロ・セントリック文化、アメリカ文化への偏見を示し続けている。
我々は、アラビア語の証明を理解し解釈するLLMの能力を評価するために設計されたベンチマークであるJawaherを紹介する。
LLMは慣用的に正確な翻訳を生成できるが、文化的にニュアンスで文脈的に関係のある説明を生み出すのに苦労している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:28:00 GMT)
Dynamical Decoupling of Generalization and Overfitting in Large Two-Layer Networks [12.1] 2層ニューラルネットワークのトレーニング力学について検討する。
トレーニングダイナミクスにはいくつかの新しい現象がある。
これらには、ガウス/ラデマッハの複雑さの増大に伴う緩やかな時間スケールの出現が含まれる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:45:26 GMT)
The 3D-PC: a benchmark for visual perspective taking in humans and machines [12.0] ディープニューラルネットワーク(DNN)は、大規模な画像データセットのトレーニング後に3Dシーンを分析できるようになる、という報告が増えている。
DNNにおけるこの創発的3次元解析能力は、3次元知覚課題(3D-PC)を伴う視覚的視点撮影(VPT)に十分か検討した。
3D-PCは3つの3次元解析タスクからなる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:49:44 GMT)
MIDAS: Mixing Ambiguous Data with Soft Labels for Dynamic Facial Expression Recognition [11.9] 動的表情認識(DFER)のためのデータ拡張手法MIDASを提案する。
MIDASでは、ビデオフレームの対とその対応する感情クラスラベルを凸的に組み合わせてトレーニングデータを拡張する。
その結果、MIDASによって強化されたデータに基づいてトレーニングされたモデルは、元のデータセットでトレーニングされた既存の最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:39:19 GMT)
MetaOOD: Automatic Selection of OOD Detection Models [11.8] 我々はメタラーニングを利用してOOD検出モデルを自動的に選択する最初のゼロショット・アン教師なしフレームワークであるMetaOODを紹介した。
メタ学習のアプローチとして、MetaOODは、さまざまなベンチマークOOD検出データセットにまたがって、既存のメソッドの過去のパフォーマンスデータを活用する。
私たちはMetaOODが既存のメソッドを著しく上回り、限界時間のオーバーヘッドしか生じないことを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:14:32 GMT)
EndoPerfect: High-Accuracy Monocular Depth Estimation and 3D Reconstruction for Endoscopic Surgery via NeRF-Stereo Fusion [11.8] 内視鏡下副鼻腔手術(ESS)では,術中CTは術中評価に有用であるが,着床速度や放射線曝露に制約がある。
既存の技術は、しばしば密度の高い再建に必要なサブミリ精度を達成するのに苦労する。
本稿では,Neural Radiance Fields(NeRF)を中間表現として活用するオンライン学習手法を提案する。
提案手法では,0.5mm未満の点間精度が0.125$pm$0.443mmであることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:45:59 GMT)
I2VControl-Camera: Precise Video Camera Control with Adjustable Motion Strength [11.8] I2Vコントロルカメラ(I2VControl-Camera)は、被写体運動の強度を提供しながら、制御性を大幅に向上させる新しいカメラ制御方法である。
被写体運動の強度を正確に制御・調整するために,映像軌道展開の高次成分を明示的にモデル化する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:40:38 GMT)
Efficient Jailbreaking of Large Models by Freeze Training: Lower Layers Exhibit Greater Sensitivity to Harmful Content [11.6] 本研究では,大規模言語モデルのパラメータのサンプリングと正規化を行い,パラメータ分布の視覚表現とヒートマップを生成する。
このことから,我々は,下層層のみにSupervised Fine-Tuningを選択的に行うフリーズトレーニング戦略を採用した。
実験により、この手法は、高いジェイルブレイク成功率と高いハーネススコアを維持しながら、トレーニング時間とGPUメモリ消費を著しく低減することを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:07:41 GMT)
Fuzzy Speculative Decoding for a Tunable Accuracy-Runtime Tradeoff [11.6] Fuzzy Speculative Decoding (FSD)は、投機的復号(SD)を一般化する復号アルゴリズムである。
本手法は,ベンチマーク精度を2%程度低下させるだけで,SDよりも高速に5トークン/秒以上の大幅なランタイム改善を実現することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:25:42 GMT)
LarQucut: A New Cutting and Mapping Approach for Large-sized Quantum Circuits in Distributed Quantum Computing (DQC) Environments [11.5] LarQucutは、量子コンピューティングにおける大規模回路のための新しい量子回路切断およびマッピングアプローチである。
LarQucutはカットを減らし、回路を独立したサブ回路に切断しない。
LarQucutは、大きな回路の出力を再構築するために実行されるサブ回路の数を減らすことができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:41:53 GMT)
Symbolic regression via MDLformer-guided search: from minimizing prediction error to minimizing description length [11.5] 対象からの距離を反映した最小記述長に基づく新しい探索対象を提案する。
そこで我々は, 公式の正しい数学的形式を効果的に復元できる記号回帰法SR4MDLを実装した。
提案手法は,2つのベンチマークデータセットにまたがって約50の式を復元し,43.92%の精度で最先端の手法を再現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:48:42 GMT)
Converging to a Lingua Franca: Evolution of Linguistic Regions and Semantics Alignment in Multilingual Large Language Models [11.4] 大規模言語モデル(LLM)は、特に多言語文脈において顕著な性能を示した。
近年の研究では、LLMは、ある言語で学んだスキルを他の言語に伝達することができることが示唆されているが、この能力の背後にある内部メカニズムはいまだ不明である。
本稿では,LLMの内部動作に関する知見を提供し,言語間能力の向上のための基盤を提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:36:20 GMT)
PaCA: Partial Connection Adaptation for Efficient Fine-Tuning [11.4] モデルにアダプタ層を導入する代わりに、事前訓練した重み内でランダムに選択された部分接続を微調整するPAAを提案する。
LoRAと比較して、PaCAはトレーニング時間を22%削減し、メモリ使用量は16%削減した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:30:10 GMT)
You Only Click Once: Single Point Weakly Supervised 3D Instance Segmentation for Autonomous Driving [11.3] YoCoフレームワークは、最小限の粗いクリックアノテーションを使用して、3Dの擬似ラベルを生成する。
時間的および空間的なラベル更新モジュールは、信頼できる更新ラベルを生成するように設計されている。
疑似ラベルを高信頼・高IoU予測に置き換えたIoU誘導拡張モジュールを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:47:45 GMT)
Efimov Effect in Long-range Quantum Spin Chains [11.2] 我々は、エフィモフ効果が長距離量子スピン鎖にも現れることを示した。
理論的には、2つの連続する結合エネルギーの比が相互作用範囲に依存するかを決定する。
この結果から, 閉じ込められたイオン系で実験可能なマグノンの希薄量子気体の普遍物理学が明らかとなった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:28:17 GMT)
EPhishCADE: A Privacy-Aware Multi-Dimensional Framework for Email Phishing Campaign Detection [11.2] 通常電子メールで行われるフィッシング攻撃は、重要なサイバーセキュリティの脅威である。
我々は、bf Email bf Phishing bf CAmpaign bf DEtectionのための最初のプライバシ対応フレームワークであるbf EPhishCADEを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:58:42 GMT)
MagNet: Multi-Level Attention Graph Network for Predicting High-Resolution Spatial Transcriptomics [11.2] MagNetは高解像度HDデータの正確な予測のために設計されたマルチレベルアテンショングラフネットワークである。
マルチレベル機能を統合することで、MagNetは高解像度の遺伝子発現を予測する際に、低解像度の入力によって生じる制限を克服する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:55:37 GMT)
The Common Objects Underwater (COU) Dataset for Robust Underwater Object Detection [11.1] コモンオブジェクト 水中(COU: Common Objects Underwater)は、複数の水中および海洋環境においてよく見られる人造物体のインスタンス分割画像データセットである。
COUには約10Kのセグメンテーション画像が含まれており、様々な場所で多くの水中ロボットのフィールド試験で収集された画像から注釈が付けられている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:12:24 GMT)
KaSA: Knowledge-Aware Singular-Value Adaptation of Large Language Models [11.1] 知識認識型特異値適応(KaSA)
本稿では,知識認識特異値を用いた特異値分解(SVD)を利用したPEFT手法である知識認識特異値適応(KaSA)を導入し,その課題との関連性に基づいて,知識を動的に活性化する。
実験の結果、KaSAは16のベンチマークと4つの合成データセットでFFTと14のPEFTベースラインを一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:46:45 GMT)
Continual Learning-Aided Super-Resolution Scheme for Channel Reconstruction and Generalization in OFDM Systems [11.1] 我々は、チャネル再構成と一般化のためのニューラルネットワークをそれぞれ設計する、効率的なOFDMチャネル推定のための新しいスキームを利用する。
前者に対しては、パイロット位置のチャネルを全時間周波数チャネルにマッピングするための二重アテンション支援型超解像ニューラルネットワーク(DA-SRNN)を提案する。
後者では、ニューラルネットワークを異なるチャネル分布に適応させるために、継続学習(CL)支援トレーニング戦略を導入する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:31:13 GMT)
RelaCtrl: Relevance-Guided Efficient Control for Diffusion Transformers [11.0] Diffusion Transformerは、テキスト・ツー・イメージとテキスト・ツー・ビデオ生成において重要な役割を果たす。
本稿では,Relevance-Guided Efficient Controllable GenerationフレームワークRelaCtrlを提案する。
本手法は PixArt-delta と比較して, パラメータと計算複雑性の 15% しか得られず, 優れた性能を実現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:00:57 GMT)
Manifold Topological Deep Learning for Biomedical Data [11.0] 微分可能な画像に対して初めて,多様体トポロジカルディープラーニング(MTDL)を導入する。
MTDLは競合する他の手法よりも優れており、TDLを広範囲のデータに拡張している。
MedM v2NISTベンチマークデータベースを用いてMTDLの性能を評価する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:41:23 GMT)
Graph Sampling for Scalable and Expressive Graph Neural Networks on Homophilic Graphs [10.9] グラフニューラルネットワーク(GNN)は多くのグラフ機械学習タスクに優れるが、大規模ネットワークへのスケーリングでは課題に直面している。
グラフ構造を保存するために特徴ホモフィリーを利用する新しいグラフサンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:50:49 GMT)
ProAI: Proactive Multi-Agent Conversational AI with Structured Knowledge Base for Psychiatric Diagnosis [10.9] ほとんどの会話型AIシステムは、対話を導くことなく、ユーザーのプロンプトに反応して反応する。
目標指向でプロアクティブな会話型AIフレームワークであるProAIを紹介する。
精神障害の鑑別診断におけるProAIの精度は83.3%である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:45:39 GMT)
ObjectVLA: End-to-End Open-World Object Manipulation Without Demonstration [10.6] 本稿では,視覚・言語・アクションモデルによるオブジェクトの一般化を実現するための,シンプルで効果的な手法を提案する。
我々の手法は、ターゲットオブジェクトに関する知識を注入する軽量でスケーラブルな方法を提供する。
我々は、実際のロボットプラットフォーム上でObjectVLAを評価し、64%の成功率で100の新規オブジェクトを一般化できることを実証した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:17:11 GMT)
Leveraging Large Language Models for Building Interpretable Rule-Based Data-to-Text Systems [10.5] そこで本研究では,大規模言語モデル(LLM)を用いて,完全に解釈可能なデータ・テキスト・システムを自動的に実装するシンプルなアプローチを提案する。
実行時に、単一のCPUのみを使用して、ニューラルネットワークが必要とする処理時間のごく一部でテキストを生成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:23:55 GMT)
Rare event modeling with self-regularized normalizing flows: what can we learn from a single failure? [10.5] 本稿では,限られたデータから後進学習を行うフレームワークであるCalNFを紹介する。
データ制限された障害モデリングと逆問題に対して、最先端のパフォーマンスを実現する。
2022年のサウスウエスト航空のスケジュール危機の根本原因について、先進的なケーススタディを可能にする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:47:52 GMT)
Generating Physical Dynamics under Priors [10.4] 拡散に基づく生成モデルに物理先入観をシームレスに組み込む新しい枠組みを導入する。
我々の貢献は、生成モデリングの分野ではかなり進歩しており、正確で物理的に一貫したダイナミクスを生成する堅牢なソリューションを提供しています。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:34:39 GMT)
Fed-KAN: Federated Learning with Kolmogorov-Arnold Networks for Traffic Prediction [10.3] 従来の集中型学習アプローチは、高いレイテンシ、断続的な接続性、帯域幅の制限により、そのようなネットワークにおいて大きな課題に直面している。
Federated Learning with Multi-Layer Perceptrons (Fed-MLP)のような既存のFLモデルは、計算の複雑さと動的環境への適応性に悩まされる。
本稿では,Kolmogorov-Arnold Networks (Fed-KAN) を用いたフェデレートラーニングの詳細な分析を行う。
以上の結果から,Fed-KANはFed-MLPと比較して平均テスト損失を77.39%削減できることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:04:53 GMT)
Balancing Thermal Relaxation Deviations of Near-Future Quantum Computing Results via Bit-Inverted Programs [10.2] バーバー(英: Barber)は、非対称な熱緩和偏差に対抗するために設計された方法である。
プログラムの読み出し結果における熱緩和偏差を効果的に抑制することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:41:52 GMT)
Range and Bird's Eye View Fused Cross-Modal Visual Place Recognition [10.1] VPR(Image-to-point cloud cross-modal Visual Place Recognition)は、クエリがRGBイメージであり、データベースサンプルがLiDARポイントクラウドである、難しいタスクである。
本稿では,範囲(またはRGB)画像とBird's Eye View(BEV)画像からの情報を効果的に組み合わせた,革新的な初期検索と再ランク手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:10:21 GMT)
The Illusion of Empathy: How AI Chatbots Shape Conversation Perception [10.1] GPTベースのチャットボットは人間の会話相手よりも共感的でないと認識された。
以上の結果から,会話の質形成における共感の重要性が示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:56:10 GMT)
FlexPrefill: A Context-Aware Sparse Attention Mechanism for Efficient Long-Sequence Inference [9.9] 大規模言語モデル(LLM)は、長時間の推論において計算上の問題に遭遇する。
これまでの努力は、固定されたスパース注意パターンや、限られたケースに基づくスパース注意パターンの同定に頼っていた。
我々はFlexPrefillを紹介した。FlexPrefillはフレキシブルなスパースプリフィル機構で、スパースアテンションパターンと計算予算をリアルタイムで動的に調整する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:34:53 GMT)
The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition [9.9] 350以上のカメラで記録された20時間の野生チンパンジーの挙動を特徴とするPanAf-FGBGデータセットを提示する。
ユニークなのは、すべてのビデオとチンパンジー(前景ビデオ)を、同じカメラの場所から対応するバックグラウンドビデオ(チンパンジーなし)とをペアリングすることです。
この設定により、初めて、分布内および分布外条件を直接評価し、振る舞い認識モデルに対する背景の影響を定量化することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:18:57 GMT)
When Unsupervised Domain Adaptation meets One-class Anomaly Detection: Addressing the Two-fold Unsupervised Curse by Leveraging Anomaly Scarcity [9.7] 本稿では、教師なし異常検出(UAD)のための、最初の教師なしドメイン適応(UDA)フレームワークを紹介する。
まずこの問題を定式化し、2倍の「教師なしの呪い」と呼ぶ。
我々は、この呪いの先駆的な解決策を提案し、これまでのところ、異常は稀であると仮定して、難解であると見なされている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:05:47 GMT)
MallowsPO: Fine-Tune Your LLM with Preference Dispersions [9.7] 直接選好最適化(DPO)は、人間のフィードバックによる強化学習を改善するための一般的なアプローチとして現れている。
Mallowsの選好ランク理論に触発されて、我々は新しいアプローチであるMallowsPOを開発した。
このアプローチの際立った特徴は、人選好のプロンプトへの分散を反映する分散指標である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:03:32 GMT)
Towards Semantic 3D Hand-Object Interaction Generation via Functional Text Guidance [9.6] ハンドオブジェクトインタラクション(HOI)は、人間と環境の基本的なリンクである。
AIとロボティクスの進歩にもかかわらず、機能的把握タスクのセマンティクスを捉えることは大きな課題である。
本稿では,関数型テキストによって駆動される3次元HOIを生成するために,FGS-Net(Functional Grasp Synthesis Net)という,革新的な2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:42:54 GMT)
Kanana: Compute-efficient Bilingual Language Models [9.6] カナナ(Kanana)は、韓国語のパフォーマンスと英語の競争性能を超越した二言語モデルである。
このレポートでは、計算効率が良いが競争力のあるモデルを実現するために、事前学習で使用されるテクニックについて詳述している。
本報告では, 埋め込み, 検索拡張生成, 関数呼び出しなど, 特定のシナリオへの言語モデル適応に有効なアプローチについて詳述する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:23:16 GMT)
Emergent Abilities in Large Language Models: A Survey [9.5] 大規模言語モデル(LLM)は、人工知能への最も有望な研究の流れの1つとして、新しい技術革命を導いている。
これらのモデルのスケーリングは、以前は観測されていなかった様々な創発的能力と関連付けられている。
これらの能力は、高度な推論やコンテキスト内学習からコーディングや問題解決まで多岐にわたる。
トランスフォーメーションの可能性にもかかわらず、創発的能力は未理解のままであり、定義、性質、予測可能性、含意について誤解を招く。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:20:01 GMT)
Are foundation models useful feature extractors for electroencephalography analysis? [9.4] 脳波を用いた医療時系列分析における基礎モデルの有効性について検討する。
分析の結果,基礎モデルは意味のある脳波の特徴を抽出し,ドメイン適応を伴わずとも特化モデルに優れ,タスク固有のバイオマーカーをローカライズすることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:21:34 GMT)
Stochasticity in Motion: An Information-Theoretic Approach to Trajectory Prediction [9.4] 本稿では、軌道予測における不確実性モデリングの課題を全体論的アプローチで解決する。
情報理論を基礎とした本手法は,不確実性を測定する理論的に原理化された方法を提供する。
従来の作業とは異なり、我々のアプローチは最先端のモーション予測器と互換性があり、より広い適用性を実現している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:28:50 GMT)
Merging Clinical Knowledge into Large Language Models for Medical Research and Applications: A Survey [9.4] 医療人工知能(メディカルAI)は、現実の医療シナリオに学術的な医療AIシステムを適用することを目的としている。
この調査は、臨床データベース、データセット、トレーニングパイプラインの使用、医療知識グラフの統合、システム応用、評価システムなど、医療AIシステムの構築パラダイムに焦点を当てる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:00:51 GMT)
In-Context Learning with Hypothesis-Class Guidance [9.3] 本稿では,仮説クラスガイダンス(ICL-HCG)を用いたICLを提案する。
i)新しい仮説クラスに対する様々な一般化能力、(ii)異なるモデルアーキテクチャ、(iii)サンプル複雑性、(iv)命令の役割、(vi)仮説の事前学習の効果。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:20:03 GMT)
Efficiently Learning Probabilistic Logical Models by Cheaply Ranking Mined Rules [9.3] 我々は、論理規則の精度とリコールを導入し、それらの構成をルールユーティリティとして定義する。
また、リレーショナルデータから論理理論を学習するためのスケーラブルなフレームワークであるSPECTRUMを紹介する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:29:51 GMT)
FASTer: Focal Token Acquiring-and-Scaling Transformer for Long-term 3D Object Detection [9.3] 我々はFAST(Focal Token Acquring-and-Scaling Transformer)を提案する。
FASTerは、適応的で軽量な方法でトークンシーケンスを凝縮する。
性能と効率の両方で、他の最先端の検出器よりも大幅に優れています。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:15:33 GMT)
Conformal Risk Control for Semantic Uncertainty Quantification in Computed Tomography [9.0] 臓器依存的不確実性評価のためのCRC法を提案する。
本手法は各患者の解剖や臓器の位置に応じて意味的に適応する。
本手法は,実世界のCT(Computerd tomography)データに対して,より厳密な不確実性区間を提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:27:07 GMT)
Beyond Natural Language Perplexity: Detecting Dead Code Poisoning in Code Generation Datasets [9.0] 本稿では,コードの構造に合わせた新しいラインレベルの検出とクリーン化手法であるDePAを提案する。
DePAは既存の方法よりも優れており、検出F1スコアが0.14-0.19向上し、有毒セグメントの局在精度が44-65%向上した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:39:27 GMT)
Exploring the Impact of Temperature Scaling in Softmax for Classification and Adversarial Robustness [8.9] この研究は「温度」として知られるソフトマックス関数内でしばしば見過ごされるパラメータを掘り下げる。
畳み込みニューラルネットワークとトランスフォーマーを採用した我々の実証研究は、温暖化によって全体的なパフォーマンスが向上することを示した。
一般的な腐敗に対するモデルロバスト性の向上、自然摂動、そして投影されたグラディエント・ダイスンのような非標的の敵攻撃などです。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:07:45 GMT)
Equivariant Denoisers for Image Restoration [8.9] 等変復号器と最適化に基づいて,等変正規化(ERED)と呼ばれる統一フレームワークを提案する。
本稿では,このアルゴリズムの収束性を分析し,その実用性について論じる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:34:46 GMT)
Can LLM Assist in the Evaluation of the Quality of Machine Learning Explanations? [8.8] そこで本研究では,LLMに基づく判断と人間による判断を統合して説明を行うワークフローを提案する。
LLMに基づく審査員は、様々な説明手法の質を評価し、その評価能力と人間の判断能力を比較する。
LLMに基づく審査員は、主観的指標を用いて説明の質を効果的に評価するが、人間の判断に取って代わるだけの十分な開発は行われていないと結論づける。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:36:18 GMT)
Gungnir: Exploiting Stylistic Features in Images for Backdoor Attacks on Diffusion Models [8.7] 拡散モデル(DM)はバックドア攻撃に対して脆弱である。
Gungnirは、攻撃者が隠れたスタイルトリガーを通じてDMのバックドアをアクティベートできる新しい方法である。
提案手法は,0%バックドア検出率(BDR)を達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:08:26 GMT)
Displaying Fear, Sadness, and Joy in Public: Schizophrenia Vloggers' Video Narration of Emotion and Online Care-Seeking [8.6] 重度の精神疾患(SMI)を持つ人は、感情の開示やオンラインサポートを探すための真正な媒体としてヴログングに目を向ける傾向にある。
我々の研究では、統合失調症vloggersが作成した401本のYouTubeビデオを分析し、露骨な表現やストーリーテリングによる言葉によるナレーションを通じて、vloggersの恐怖、悲しみ、喜びを明らかにした。
特に、オーディエンスエンゲージメントにおける「視覚的アピール格差」が明らかとなり、視覚的にアピールするビデオは、はるかに多くのビュー、お気に入り、コメントを受け取るようになった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:23:27 GMT)
Language-Informed Hyperspectral Image Synthesis for Imbalanced-Small Sample Classification via Semi-Supervised Conditional Diffusion Model [8.6] 本稿では,新しい言語インフォームドハイパースペクトル画像合成法であるTxt2HSI-LDM(VAE)を提案する。
ハイパースペクトルデータの高次元性に対処するため、普遍変分オートエンコーダ(VAE)は、データを低次元の潜在空間にマッピングするように設計されている。
VAEは、拡散モデルによって生成された潜時空間から言語条件を入力としてHSIをデコードする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:33:31 GMT)
SelectLLM: Query-Aware Efficient Selection Algorithm for Large Language Models [8.6] 大規模言語モデル(LLM)は、様々なアプリケーションにまたがる顕著な性能のために広く採用されている。
これらの個々のLCMは、固有のトレーニングバイアス、モデルサイズ制約、トレーニング前のデータセットの品質や多様性による、複雑なタスクの一般化とパフォーマンスの制限を示す。
本稿では,入力クエリをLLMの最も適切なサブセットに効率的に誘導するSelectLLMを紹介する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:23:56 GMT)
The RAG Paradox: A Black-Box Attack Exploiting Unintentional Vulnerabilities in Retrieval-Augmented Generation Systems [8.3] 我々はRAGパラドックスに基づく現実的なブラックボックス攻撃シナリオを導入し、RAGシステムは不注意に脆弱性を暴露し、信頼性を高めようとする。
RAGシステムは応答生成時に外部文書を参照するため、攻撃は内部アクセスを必要とせずにこれらのソースを標的とします。
提案手法はまず、RAGシステムによって開示された外部ソースを特定し、これらのソースにマッチするように設計された誤情報を含む有毒な文書を自動的に生成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:32:53 GMT)
Prompt-Guided Internal States for Hallucination Detection of Large Language Models [8.2] 大規模言語モデル(LLM)の幻覚検出のための新しい枠組み、即時誘導型内部状態を提案する。
この構造を、異なるドメインのテキスト間でより健全で一貫性のあるものにします。
実験結果から,本フレームワークは既存の幻覚検出手法のクロスドメイン一般化を著しく促進することが明らかとなった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:41:06 GMT)
MESC-3D:Mining Effective Semantic Cues for 3D Reconstruction from a Single Image [8.1] 単一画像からの3次元再構成のためのマイニング有効セマンティックキュース(MESC-3D)と呼ばれる新しい1次元画像再構成法を提案する。
具体的には、ポイントクラウドとイメージセマンティック属性間の接続を確立するための効果的なセマンティックマイニングモジュールを設計する。
このモジュールは空間構造のセマンティックな理解を取り入れており、モデルがより正確でリアルな3Dオブジェクトを解釈し再構築することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:02:15 GMT)
Foundation-Model-Boosted Multimodal Learning for fMRI-based Neuropathic Pain Drug Response Prediction [8.0] FMM$_TC$は、fMRIに基づく神経因性鎮痛薬の反応予測のための基礎モデルを用いたマルチモーダル学習フレームワークである。
FMM$_TC$は、2つのrs-fMRIモダリティから補完情報を統合する。
FMM$_TC$の表現能力、一般化可能性、および既存の単モードfMRIモデルに対するクロスデータセット適応性を示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:50:03 GMT)
Minimax Optimal Kernel Two-Sample Tests with Random Features [8.0] ランダムフーリエ特徴量(RFF)近似に基づくスペクトル正規化2サンプル試験を提案する。
RFFの近似順序が十分に大きい場合、提案した試験が最小限最適であることを示す。
そこで本研究では,正規化パラメータとカーネルを選択するためのデータ適応型戦略を用いて,提案したテストの実用的実装可能な置換型バージョンを開発する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:12:00 GMT)
Armijo Line-search Makes (Stochastic) Gradient Descent Go Fast [8.0] アルミホ線探索凸(Armijo-LS)は勾配降下(GD)のステップサイズを設定する標準的な方法である
一定の非一様条件の場合、GD-LS は GD よりも安定に収束し、ステップサイズは 1/L である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:26:33 GMT)
Deconstructing What Makes a Good Optimizer for Language Models [7.9] 我々は,SGD,Adafactor,Adam,Lion,Sophiaなどの最適化アルゴリズムを比較した。
ハイパーパラメータの誤特定に対する性能や安定性の観点からは、明確な勝者として1つのアルゴリズムが現れることはなかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:47:44 GMT)
Scalable Decision-Making in Stochastic Environments through Learned Temporal Abstraction [7.9] 高次元連続行動空間における決定-決定は、重要な計算課題に直面している。
textitLatent Macro Action Planner (L-MAP) を提案する。
L-MAPは、既存のモデルベースの手法よりも優れており、強力なモデルフリーアクタクティクスでオンパーを実行する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:02:23 GMT)
Reward Learning from Multiple Feedback Types [7.9] 様々な種類のフィードバックを活用でき、強力な報酬モデリング性能が得られることを示す。
この研究は、RLHFのマルチタイプフィードバックの可能性を示す最初の強力な指標である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:29:54 GMT)
Adaptive Accelerated Proximal Gradient Methods with Variance Reduction for Composite Nonconvex Finite-Sum Minimization [7.9] 本稿では, 複合非有限和関数の最小化のために, 分散化を伴う Accelerated Proximal Gradient (AAPG) 法である sf AAPG-SPIDER を提案する。
sf AAPG-SPIDER と sf AAPG は、この種の問題に対して最適な複雑性を実現するための、最初の学習方法である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:37:56 GMT)
Zero-Shot and Efficient Clarification Need Prediction in Conversational Search [7.8] ゼロショットで効率的なCNPフレームワーク(Zef-CNP)を提案する。
まず、ゼロショット方式で大規模言語モデル(LLM)をプロンプトし、2組の合成クエリを生成する。
次に、生成されたクエリを使用して、効率的なCNPモデルをトレーニングします。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:49:18 GMT)
Passage Query Methods for Retrieval and Reranking in Conversational Agents [7.8] 本稿では,TREC Interactive Knowledge Assistance Track (iKAT) へのアプローチについて述べる。
本研究では,検索中の問合せ文書のマッチングを改善するために,対象文書の予測フォーマットと整合する問合せクエリを開発する。
調査の結果,PQは対象文書とのセマンティックアライメントを改善し,マルチターン対話システムの改善の可能性を示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:53:56 GMT)
Towards Reliable Vector Database Management Systems: A Software Testing Roadmap for 2030 [7.7] 大規模言語モデル(LLM)とAI駆動アプリケーションにより、Vector Database Management Systems(VDBMS)が重要なインフラストラクチャコンポーネントとして注目を浴びている。
VDBMSは、高密度ベクトル埋め込みの保存、インデックス化、クエリを専門とし、検索強化生成、長期メモリ、キャッシュ機構などの高度なLLM機能を実現する。
最適化された構造化データのための従来のデータベースとは異なり、VDBMSはベクトルデータの高次元の性質、ベクトル探索におけるファジィセマンティクス、動的データスケーリングとハイブリッドクエリ処理のサポートといったユニークなテスト課題に直面している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:56:37 GMT)
SPHERE: Unveiling Spatial Blind Spots in Vision-Language Models Through Hierarchical Evaluation [7.7] 現在の視覚言語モデルは、基本的な空間的手がかりを把握できるが、人間のような理解や現実世界の応用に必要な多次元空間的推論に苦慮している。
我々は,新しい人間注釈付きデータセットをサポートする階層的評価フレームワークであるSPHEREを開発した。
最先端モデルのベンチマーク評価では、特に距離と近接性についての推論において、重大な欠陥が示される。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:14:37 GMT)
RecCrysFormer: Refined Protein Structural Prediction from 3D Patterson Maps via Recycling Training Runs [7.6] $textttRecCrysFormer$は、トランスフォーマーの強度を利用して、結晶データからタンパク質構造を決定するための実験的およびMLアプローチを統合するハイブリッドモデルである。
構造予測において,textttRecCrysFormer$は精度が高く,単位セル次元や角度などの結晶パラメータの変動に対して頑健であることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:40:09 GMT)
Attention in Large Language Models Yields Efficient Zero-Shot Re-Rankers [7.6] 大規模言語モデル(LLM)は、赤外線システムにおいてゼロショットの再ランク付けに人気がある。
本稿では,検索クエリによる注目パターンの変化を利用した,高精度かつ効率的な再ランク付け手法であるin-context re- rank (ICR)を提案する。
本研究は,テキスト生成を超越したオープンウェイトLCMの新たな利用方法を探究することを目的とする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:49:30 GMT)
TractCloud-FOV: Deep Learning-based Robust Tractography Parcellation in Diffusion MRI with Incomplete Field of View [7.6] 本研究では,不完全なFOV条件下でのトラクトグラフィーを堅牢に解析するディープラーニングフレームワークであるTractCloud-FOVを紹介する。
そこで本研究では,実世界劣等なFOVカットオフシナリオのスペクトルをシミュレートするために,トラクトグラムを合成的にカットする,新しいトレーニング戦略FOV-Cut Augmentation(FOV-CA)を提案する。
提案したTractCloud-FOVを,不完全なFOVを含む2つの実生活データセットと合成されたトラクトグラフィーで評価した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:36:38 GMT)
ARIES: Autonomous Reasoning with LLMs on Interactive Thought Graph Environments [7.5] LLMを用いた推論のためのマルチエージェントアーキテクチャであるARIESを紹介する。
教師付き微調整(SFT)のない政策エージェントとして市販のLCMを使用することで,HumanEvalの精度が最大29%向上することが観察された。
また、観測された障害モードの徹底的な解析を行い、LLMサイズと問題分解の深さの制限が、LLM誘導推論をスケールする上での課題であることを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:28:13 GMT)
Measuring Determinism in Large Language Models for Software Code Review [7.5] 大規模言語モデル(LLM)は、ソフトウェアコードレビューの合理化を約束するが、一貫性のあるアセスメントを生成する能力は依然としてオープンな問題である。
プライベートとパブリックの両方のリポジトリから70のJavaコミットで4つの主要なLCMをテストしました。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:53:16 GMT)
JAM: Controllable and Responsible Text Generation via Causal Reasoning and Latent Vector Manipulation [7.3] JAMは,大規模言語モデル(LLM)の潜伏空間に因果解析を統合することで,テキスト生成を解釈し,制御する新しいフレームワークである。
以上の結果から,JAMは従来のCTG法よりも最大で22%向上していることがわかった。
これらの結果は、JAMの責任と現実的なテキスト生成の有効性と効率を強調し、より解釈可能で制御可能なモデルへの道を開いた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:31:48 GMT)
Zero-shot and Few-shot Learning with Instruction-following LLMs for Claim Matching in Automated Fact-checking [7.2] クレームマッチングタスクに対するゼロショットおよび少数ショット学習アプローチについて検討する。
新しいCMデータセットであるClimMatchを紹介します。
本稿では,異なる長さのテキストに対して評価を行うCMのパイプラインを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:23:54 GMT)
MAMUT: A Novel Framework for Modifying Mathematical Formulas for the Generation of Specialized Datasets for Language Model Training [7.2] 本研究は,数学的内容のエンコーディングを強化するための専門訓練データセットの開発に焦点をあてる。
そこで我々は,与えられた数学的公式の等価かつファルシフィケートなバージョンを生成可能なフレームワークであるMath Mutator (MAMUT)を紹介した。
MAMUTに基づいて、多種多様な表記を含む4つの大きな数学的データセットを生成し、拡張された数学的埋め込みを持つ言語モデルの訓練に使用することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:53:42 GMT)
How Consistent Are Humans When Grading Programming Assignments? [7.1] 本研究は,プログラム課題の人間の階調の整合性について検討する。
我々はクリッペンドルフの$alpha$を用いてグループ間の信頼性を測定した。
以上の結果から,本研究における人間の中等生は,学生に一片の作業を与えるために学年に同意できないことが示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:45:45 GMT)
A Multi-Source Data Fusion-based Semantic Segmentation Model for Relic Landslide Detection [7.1] 提案したHPCL-NetはLoess Plateau Relic地すべりデータセットを用いて評価した。
提案したHPCL-Netは,mIoUが0.620から0.651に増加し,Landslide IoUが0.334から0.394に改善され,F1scoreが0.501から0.565に向上した既存のモデルよりも大幅に優れている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:51:20 GMT)
ADUGS-VINS: Generalized Visual-Inertial Odometry for Robust Navigation in Highly Dynamic and Complex Environments [7.1] ADUGS-VINSを導入し,拡張SORTアルゴリズムと高速化可能な基礎モデルをVIOに統合する。
提案手法は,様々な場面を表現した複数の公開データセットを用いて評価し,多様な動的オブジェクトを含む実世界のシナリオで評価する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:12:24 GMT)
S-Graphs 2.0 -- A Hierarchical-Semantic Optimization and Loop Closure for SLAM [7.0] 本研究では,室内シーンの階層構造を活用し,効率的なデータ管理と最適化を行う状況グラフ2.0(S-Graphs 2.0)を提案する。
私たちのアルゴリズムは、環境を表す状況グラフを、キーフレーム、ウォール、ルーム、フロアの4つの層に構築することから始まります。
本研究では,建物の各階間の空洞化により発生する偽陽性閉鎖を効果的に拒否する,フロアベースのループ閉鎖戦略を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:23:03 GMT)
Cryptis: Cryptographic Reasoning in Separation Logic [7.0] 我々は,Iris分離論理の拡張であるCryptisを導入し,暗号の記号モデルを用いて暗号部品の検証を行う。
分離論理と暗号推論の組み合わせにより、プロトコルの正当性を証明し、後にこの結果を再利用して、プロトコルに依存するより大きなシステムを検証することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:33:37 GMT)
NutriGen: Personalized Meal Plan Generator Leveraging Large Language Models to Enhance Dietary and Nutritional Adherence [6.9] NutriGenは、ユーザが定義した食事の好みや制約に合わせて、パーソナライズされた食事プランを生成するように設計されたフレームワークである。
Llama 3.1 8B と GPT-3.5 Turbo がそれぞれ 1.55% と 3.68% の誤差を示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:05:49 GMT)
Parallel-Learning of Invariant and Tempo-variant Attributes of Single-Lead Cardiac Signals: PLITA [6.9] 本稿では,不変量とテンポ変量属性(PLITA)の並列学習について述べる。
PLITAは、不変とテンポ変量ECG属性の両方をキャプチャするために設計された、新しい自己監視学習(SSL)手法である。
我々は,これらの2種類の属性を学習する手法の能力と,既存のECG解析用SSL手法と比較してPLITAの性能を評価する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:42:33 GMT)
Quantum state discrimination in a $\mathcal{PT}$-symmetric system of a single trapped ion [6.9] 我々は、パリティ時間反転対称性を持つ非エルミートハミルトニアンの下で、2つの量子ビット状態の量子状態判別を実験的に実証した。
我々の研究は、量子情報処理における非エルミート物理学の有望な応用を示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:04:24 GMT)
Rethinking LLM Bias Probing Using Lessons from the Social Sciences [6.8] EcoLevelsは、(a)適切なバイアスプローブの決定、(b)プローブ間の競合する発見の調整、(c)バイアス一般化に関する予測を生成するフレームワークである。
全体として、LLMプローブは人間のプローブの直接的な応用であるため、社会科学研究において分析を基礎としており、これらの分野は人間の社会バイアスを研究する際にも同様の課題に直面している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:53:18 GMT)
Generating CAD Code with Vision-Language Models for 3D Designs [6.5] CADCodeVerifyはCADコードから生成された3Dオブジェクトを反復的に検証し、改善するための新しいアプローチである。
提案手法は,視覚言語モデルに一連の検証質問の生成と回答を促すことで,改善的なフィードバックを生成する。
その結果,CADCodeVerifyは視覚的フィードバックの提供,3Dオブジェクトの構造の向上,コンパイルプログラムの成功率の向上などにより,VLMの性能向上を実現していることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:28:23 GMT)
AMPLE: Event-Driven Accelerator for Mixed-Precision Inference of Graph Neural Networks [6.5] グラフニューラルネットワーク(GNN)は、非ユークリッドデータのパフォーマンスのために最近注目を集めている。
我々は,新しいイベント駆動プログラミングフローを活用するFPGAアクセラレータである textbfAMPLE (Accelerated Message Passing Logic Engine) を紹介する。
我々はGNN推論をノードレベルの粒度で定量化できる混合パラメータアーキテクチャを開発した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:14:16 GMT)
HoloMine: A Synthetic Dataset for Buried Landmines Recognition using Microwave Holographic Imaging [6.4] 本稿では,埋設地雷検出のための新しい合成データセットを提案する。
データセットは、41,800個のマイクロ波ホログラフィック画像(2D)と、さまざまな種類の埋没物体のホログラフィック反転スキャン(3D)で構成されている。
各種分類タスクのための合成データセットを用いて学習したいくつかの最先端ディープラーニングモデルの性能評価を行った。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:53:35 GMT)
AssertionBench: A Benchmark to Evaluate Large-Language Models for Assertion Generation [6.4] 本稿では,アサーション生成におけるLarge-Language Modelsの有効性を評価するための新しいベンチマークを提案する。
AssertioBenchにはOpenCoresから100のキュレートされたVerilogハードウェア設計が含まれており、GoldMineとHARMから生成された各設計について正式に承認されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:54:32 GMT)
Are LLMs Ready for Practical Adoption for Assertion Generation? [6.4] ハードウェア検証の品質、すなわちコーナーケース設計バグの検出と診断は、アサーションの品質に大きく依存する。
TransformersやLarge-Language Models (LLMs)のような生成AIが登場したことで、関数型およびセキュリティアサーションを生成する新しい、効果的でスケーラブルな技術の開発への関心が高まっている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:34:45 GMT)
Realizing quantum optics in structured environments with giant atoms [6.3] 構造されたフォトニック環境を持つ原子-光界面は、伝統的でない量子電磁力学を実現するためにしばしば用いられる。
本稿では,ハイブリッド巨大原子-大陸環境の多重結合点の工学的手法により,構造的光物質相互作用を実現することを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:26:15 GMT)
CuPID: Leveraging Masked Single-Lead ECG Modelling for Enhancing the Representations [6.3] 単誘導ECGに適した新しいMDM法CuPIDについて述べる。
CuPIDは、スペクトログラム由来のコンテキストをデコーダにキューすることで既存のMDM技術を強化し、エンコーダにより詳細な表現のインセンティブを与える。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:07:40 GMT)
The two filter formula reconsidered: Smoothing in partially observed Gauss--Markov models without information parametrization [6.3] 2つのフィルタ公式は、部分的に観察されたガウス-マルコフモデルの設定において再検討される。
対数二乗確率に対する再帰は代わりに定式化され、情報のパラメトリゼーションの必要性がなくなる。
公式は、提案された可能性表現から経路上の後続分布の前方マルコフ表現を生成するために与えられる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:53:43 GMT)
Logical Consistency of Large Language Models in Fact-checking [6.3] 大規模言語モデル(LLM)は、様々な自然言語タスクを実行する上で大きな成功を収めている。
人間のようなテキストを生成する素晴らしい能力にもかかわらず、LLMは一貫性のない反応で悪名高い。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:02:23 GMT)
Diffusion Restoration Adapter for Real-World Image Restoration [6.3] 拡散モデルは、その強力な画像生成能力を実証している。
本稿では、事前学習した画像の強力な生成能力を利用して、画像のリアルな復元を実現する比較的軽量なアダプタを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:14:30 GMT)
Semialgebraic Neural Networks: From roots to representations [6.3] 本稿では,任意の有界半代数関数を表現可能なニューラルネットワークアーキテクチャであるSemialgebraic Networks(SANN)を紹介する。
構築により,SANNアーキテクチャがこの継続法を実行可能であることを示し,学習された半代数関数を評価する。
これらのネットワークの例を示し、従来のディープラーニング技術でトレーニングできることを示します。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:44:15 GMT)
USER-VLM 360: Personalized Vision Language Models with User-aware Tuning for Social Human-Robot Interactions [6.2] 本稿では,マルチモーダル・ユーザ・モデリングとバイアス・アウェア・最適化を統合した総合的なフレームワークであるUser-VLM 360degを提案する。
提案手法は,(1)視覚言語信号を用いてリアルタイムに対話を適応するユーザ・アウェア・チューニング,(2)嗜好最適化によるバイアス緩和,(3)人口統計,感情,関係メタデータを付加した360degの社会動機的相互作用データセットをキュレートした。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:38:19 GMT)
BBGKY hierarchy for quantum error mitigation [6.2] 量子エラーの軽減は、現在のNISQデバイスにとって重要である。
実機で発生する量子ノイズの緩和を支援するために,物理の知識を利用する。
エラー軽減のためのZNE法では,BBGKY階層のサブセットを制約として採用している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:36:12 GMT)
Knowledge Transfer based Evolutionary Deep Neural Network for Intelligent Fault Diagnosis [6.2] 本稿では,ラベル付きデータサンプルの可用性を制限したDNNアーキテクチャを最適とする進化的Net2Net変換(EvoN2N)を提案する。
提案フレームワークは,時間を要する探索処理を伴わずに,インテリジェントな故障診断のための最良のモデルを得ることができる。
得られた最良のモデルは、ほとんどの操作条件に対して、優れた診断性能と分類精度をほぼ100%まで示すことができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:43:51 GMT)
EXACT-CT: EXplainable Analysis for Crohn's and Tuberculosis using CT [6.1] Crohn病と腸結核は、臨床、放射線学、内視鏡、組織学的特徴など多くの重複する特徴を持っている。
我々の研究は、3D CTEスキャン、コンピュータビジョン、機械学習を利用して、この区別を改善し、有害な治療ミス管理を避ける。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:08:32 GMT)
AutoComb: Automated Comb Sign Detector for 3D CTE Scans [6.1] Comb Signは、複数の消化管疾患を検出する重要なバイオマーカーである。
現在の検出方法は、手動、時間集約、主観的解釈の傾向にある。
本稿では,CTE からComb Sign を検出するための完全自動手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:53:32 GMT)
Controlled Model Debiasing through Minimal and Interpretable Updates [6.1] 2つのデシラタに依存する新しい教師付き学習課題である制御モデルデバイアスの概念を導入する。
モデルに依存しず,テスト時の感度特性を必要としないアルゴリズムCOMMODを提案する。
提案手法は,概念に基づくアーキテクチャと逆学習を組み合わせることで,最先端のデバイアス手法に匹敵する性能を達成できることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:03:55 GMT)
SPD: Sync-Point Drop for efficient tensor parallelism of Large Language Models [6.1] 我々は、注意出力に同期を選択的にドロップすることで、テンソル並列性における通信オーバーヘッドを低減するために、Sync-Point Drop (SPD)を導入する。
SPDは8つのGPU上でのLLaMA2-70B推論に対して、全体の推論遅延を約20%削減し、1%の精度のレグレッションを提供した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:20:48 GMT)
Enhanced Derivative-Free Optimization Using Adaptive Correlation-Induced Finite Difference Estimators [6.1] 勾配推定効率とサンプル効率の両面からDFOを向上させるアルゴリズムを開発した。
提案アルゴリズムの整合性を確立し,反復毎にサンプルのバッチを用いても,KW法やSPSA法と同じ収束率が得られることを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:05:54 GMT)
Anatomically-guided masked autoencoder pre-training for aneurysm detection [6.0] 頭蓋内動脈瘤は世界中で致死率と死亡率の主要な原因である。
本研究では,無注釈頭部CTスキャンデータを用いた3次元ビジョントランスモデルの事前学習のための新しい事前学習手法を提案する。
SOTA大動脈瘤検出モデルと比較すると, 絶対感度は+4-8%, 偽陽性率0.5。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:13:58 GMT)
Information Bottleneck-Guided Heterogeneous Graph Learning for Interpretable Neurodevelopmental Disorder Diagnosis [6.0] Interpretable Information Bottleneck Heterogeneous Graph Neural Network (I2B-HGNN)は、局所的なきめ細かいパターンから包括的なグローバルなマルチモーダルインタラクションまでを学習するために設計された新しいフレームワークである。
I2B-HGNNは、NDDを高精度に診断し、解釈可能なバイオマーカーの同定と非イメージングデータの効果的な解析を提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:41:55 GMT)
Towards long-term player tracking with graph hierarchies and domain-specific features [6.0] 本研究では、ジャージ番号、チームID、フィールド座標などのドメイン固有の特徴を活用する階層グラフベースのアプローチであるSportsSUSHIを導入し、追跡精度を向上させる。
SportsSUSHIは、サッカーネットデータセットと、新たに提案されたホッケー追跡データセット上で高いパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:12:40 GMT)
Tuning-Free Structured Sparse PCA via Deep Unfolding Networks [5.9] 教師なし特徴選択(UFS)のための新しいタイプのスパース主成分分析(PCA)を提案する。
解釈可能な深層展開ネットワークを使用して、反復最適化ステップをトレーニング可能なニューラルネットワークに変換する。
この革新は、従来の手法の経験的チューニング要求を効果的に回避し、正規化パラメータの自動学習を可能にする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:32:51 GMT)
Can We Simplify Slide-level Fine-tuning of Pathology Foundation Models? [5.9] 平均プーリングと多層パーセプトロンを組み合わせた単純な非線形マッピング戦略であるSiMLPは、複雑なMIL学習を伴わずに基礎モデルをスライドレベルタスクに効果的に適応させることができる。
本研究は,タスクに依存しない表現戦略だけで基礎モデルをWSI分析に効果的に適用できることを実証し,従来のMILに基づく微調整パラダイムに挑戦する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:10:30 GMT)
Fast 3D point clouds retrieval for Large-scale 3D Place Recognition [5.8] 本稿では,3次元点群検索に微分可能探索指数(DSI)を適用することにより,検索の高速化に着目する。
提案手法は点記述子に基づいて1次元識別子を生成し,一定時間で直接検索できる。
提案手法は,その検索能力と最先端の手法とを比較した公開ベンチマークにおける位置認識として評価される。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:03:04 GMT)
Detection of LLM-Paraphrased Code and Identification of the Responsible LLM Using Coding Style Features [5.8] Aliciousのユーザは、大きな言語モデル(LLM)を使って、オリジナルのものとよく似ているプロプライエタリなコードのパラフレーズ付きバージョンを生成することができる。
LPcodedecは人書きとLLM生成コード間のパラフレーズ関係を識別する手法である。
LPcodedecは2つのタスクで最高のベースラインを達成し、F1スコアは2.64%、F1スコアは15.17%向上し、それぞれ1,343xと213xのスピードアップを達成した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:06:00 GMT)
AnalogGenie: A Generative Engine for Automatic Discovery of Analog Circuit Topologies [5.6] 本稿ではアナログ回路トポロジの自動設計・発見ツールとしてAnalogGenieを提案する。
アナログ回路トポロジーの基礎的な包括的データセットの構築と、アナログ回路に普遍的なスケーラブルなシーケンスベースのグラフ表現の開発である。
実験結果から,アナログICの多様性の拡大,単一設計内でのデバイス数の増加,未確認の回路トポロジの発見など,AnalogGenieの優れた生成性能が示された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:41:20 GMT)
Teach-to-Reason with Scoring: Self-Explainable Rationale-Driven Multi-Trait Essay Scoring [5.6] マルチトレイ自動化エッセイスコアシステム(AES)は、エッセイの多様な側面のきめ細かい評価を提供する。
以前のシステムは、なぜ特定の特性スコアが割り当てられたのかを説明できない。
本稿では,自己説明可能なRationale-Driven Multi-Trit自動評価フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:54:23 GMT)
Zero-shot Imputation with Foundation Inference Models for Dynamical Systems [5.5] 我々は,ODEによって決定されると仮定される時系列データの欠落を補うという古典的な問題に対して,新たな視点を提供する。
本稿では,いくつかの(隠れた)ODEを満たすパラメトリック関数を通じて,ゼロショット時系列計算のための新しい教師付き学習フレームワークを提案する。
我々は,1と同一(事前学習)の認識モデルが,63個の異なる時系列に対してゼロショット計算を行なえることを実証的に実証した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:24:39 GMT)
PRISM: High-Resolution & Precise Counterfactual Medical Image Generation using Language-guided Stable Diffusion [5.5] 医用画像のための信頼性と一般化可能な深層学習システムの開発は、素早い相関関係、データ不均衡、データセットにおける限られたテキストアノテーションなどにより、大きな障害に直面している。
PRISMは,基礎モデルを利用して高分解能・言語誘導型医用画像対物を生成するフレームワークである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:32:08 GMT)
An Algebraic Framework for Hierarchical Probabilistic Abstraction [5.5] 本稿では,階層的抽象化のための測度理論基盤を拡張し,課題に対処することを目的とした階層的確率的抽象化フレームワークを提案する。
このアプローチは、低レベルの知覚データで高レベルの概念化をブリッジし、解釈可能性を高め、層解析を可能にする。
我々のフレームワークは、AIサブフィールド、特にシステム1とシステム2の考え方の整合性において、抽象分析のための堅牢な基盤を提供します。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:47:42 GMT)
Geodesic Slice Sampler for Multimodal Distributions with Strong Curvature [5.4] ターゲット分布に適したより一般的なジオメトリにヒット・アンド・ランスライスサンプリングを一般化する手法を提案する。
提案手法は,マルチモーダル分布におけるモード間の強い曲率と急激な遷移を持つ領域の探索を可能にする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:06:11 GMT)
ProDapt: Proprioceptive Adaptation using Long-term Memory Diffusion [5.4] 宇宙、軍事、水中の用途では、ロボットは外部受容センサーの故障に対して非常に堅牢でなければならない。
本稿では,ロボットと環境との接触の長期記憶を組み込んだProDaptを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:27:38 GMT)
A Non-contrast Head CT Foundation Model for Comprehensive Neuro-Trauma Triage [5.4] AIと医用画像の最近の進歩は、緊急頭部CTの解釈にトランスフォーメーションの可能性をもたらす。
本研究では, 多様な神経外傷所見を高精度かつ効率的に検出するための3次元基礎モデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:44:55 GMT)
Fading memory and the convolution theorem [5.2] 因果フィルタと時間不変フィルタの連続性と減少メモリの位相的および解析的概念を解析する。
主定理は、畳み込み表現の可用性が特徴づけられることを示している。
線形汎函数の入力空間と余領域がヒルベルト空間であるとき、最小の連続性と最小のフェードメモリ特性は、関連するカーネルヒルベルト空間の興味深い埋め込みの存在を保証する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:56:33 GMT)
Generative AI Policies under the Microscope: How CS Conferences Are Navigating the New Frontier in Scholarly Writing [5.2] コンピューティング分野において、明確なGen-AIポリシーを確立し、採用することが不可欠である。
本研究は,64大コンピュータサイエンス会議におけるGen-AI政策の展望について考察する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:56:10 GMT)
Human-AI Collaboration: Trade-offs Between Performance and Preferences [5.2] 人間の行動に配慮したエージェントは、純粋にパフォーマンスを最大化するエージェントよりも好まれることを示す。
我々は、不平等-逆転効果が人間の選択の原動力であることの証拠を見つけ、人々がチームへの有意義な貢献を可能にする協力的なエージェントを好むことを示唆している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:50:14 GMT)
GraphCheck: Multi-Path Fact-Checking with Entity-Relationship Graphs [5.1] GraphCheckは、クレームをエンティティ関係グラフに変換して包括的な検証を行う、新しいフレームワークである。
本稿では,DP-GraphCheckを提案する。DP-GraphCheckは,直接プロンプトを初期フィルタリングステップとして組み込むことで,性能を向上させる2段階の変種である。
当社の2段階フレームワークは、他のファクトチェックパイプラインを一般化して、その汎用性を実証しています。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:06:19 GMT)
Robust Deterministic Policy Gradient for Disturbance Attenuation and Its Application to Quadrotor Control [5.1] 本稿ではロバスト決定性ポリシー勾配(RDPG)と呼ばれる強化学習アルゴリズムを提案する。
RDPGは2プレイヤーゼロサムダイナミックゲームとして$H_infty$制御問題を定式化している。
次に、決定論的政策勾配(DPG)とその深い強化学習を用いて、効果的な外乱減衰を伴う堅牢な制御政策を訓練する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:58:22 GMT)
Dual Thinking and Logical Processing -- Are Multi-modal Large Language Models Closing the Gap with Human Vision ? [5.1] 我々は、人間の視覚における二重思考の枠組みの証拠を提供するために、新しい敵対的データセットを導入する。
私たちの精神物理学的な研究は、急速に続く複数の推論の存在を示しています。
エラーの解析は、視覚処理の早期停止は、関連する情報が欠落する可能性があることを示している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:28:36 GMT)
Large Language Model-Based Benchmarking Experiment Settings for Evolutionary Multi-Objective Optimization [5.1] 本研究では,大規模言語モデルにおけるEMOアルゴリズムの性能比較に関する暗黙の仮定について検討する。
LLMは古典的なベンチマーク設定をしばしば提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:46:34 GMT)
ForecastBench: A Dynamic Benchmark of AI Forecasting Capabilities [5.0] ForecastBenchは、機械学習システムの精度を評価するためのベンチマークである。
ForecastBenchは、提出時に既知の回答がない将来のイベントに関する質問のみで構成されている。
私たちはwww.forecastbench.orgの公開リーダーボードにシステムと人間のスコアを表示します。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:35:34 GMT)
Reinforcement learning optimization of the charging of a Dicke quantum battery [4.9] Dickeのバッテリーは、量子電池の最も有望な設計の1つだ。
ここでは、強化学習を用いて、Dicke電池の充電プロセスを最適化する。
エルゴトロピーと量子力学的エネルギーゆらぎ(チャージ精度)は標準充電戦略により大幅に改善できることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:29:34 GMT)
SCORE: Systematic COnsistency and Robustness Evaluation for Large Language Models [4.9] 本稿では,大規模言語モデルの非敵対的評価のための総合的なフレームワークであるSCORE ($mathbfS$ystematic $mathbfCO$nsistency and $mathbfR$obustness $mathbfE$valuationを提案する。
SCOREフレームワークは、様々な設定で同じベンチマークで繰り返しテストすることでモデルを評価し、精度と一貫性を現実的に見積もる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:27:29 GMT)
Towards Developing Ethical Reasoners: Integrating Probabilistic Reasoning and Decision-Making for Complex AI Systems [4.9] 計算倫理フレームワークは、複雑な実環境で動作するAIと自律システムにとって不可欠である。
既存のアプローチは、倫理原則を動的で曖昧な文脈に組み込むために必要な適応性に欠けることが多い。
本稿では,中間表現,確率論的推論,知識表現を組み合わせた総合的メタレベルフレームワークの構築に必要な要素について概説する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:25:11 GMT)
OATS: Outlier-Aware Pruning Through Sparse and Low Rank Decomposition [4.8] 入力埋め込みにおける第2モーメント情報を利用してモデル重みをスパース行列とローランク行列の和に分解する,OATSという大形変圧器の圧縮手法を提案する。
OATSは、Llama-3やPhi-3のような大型言語モデルやViTやDINOv2のようなビジョントランスフォーマーで最大60%の価格でモデルを圧縮する際に、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:39:44 GMT)
An Empirical Analysis of LLMs for Countering Misinformation [4.8] LLM(Large Language Models)は、オンラインの誤報を増幅するが、誤報に対処することを約束する。
我々は、政治的誤報に対処する3つのLDM(ChatGPT、Gemini、Claude)の能力を実証的に研究する。
以上の結果から,モデルが実際のニュースソースで回答を得るのに苦労し,左利きの情報源を引用する傾向が示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:12:03 GMT)
UoR-NCL at SemEval-2025 Task 1: Using Generative LLMs and CLIP Models for Multilingual Multimodal Idiomaticity Representation [4.8] SemEval-2025 Task 1は、与えられた名目化合物とのアライメントに基づいて、画像のランク付けに重点を置いている。
この研究は、生成的大言語モデル(LLM)と多言語CLIPモデルを用いて、慣用的な複合表現を強化する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:52:02 GMT)
Post-mastoidectomy Surface Multi-View Synthesis from a Single Microscopy Image [4.8] 単一CI顕微鏡画像から合成多視点映像を生成することができる新しいパイプラインを提案する。
本研究は, 術前CT検査を用いて, 乳頭切除後の表面を予測し, 本目的のために設計した方法である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:26:46 GMT)
A Fused Gromov-Wasserstein Approach to Subgraph Contrastive Learning [4.6] We present a new method called Fused Gromov Wasserstein Subgraph Contrastive Learning (FOSSIL)。
我々のモデルはノードレベルとサブグラフレベルのコントラスト学習を統合し、標準的なノードレベルコントラスト学習とFused Gromov-Wasserstein距離をシームレスに組み合わせる。
FOSSILは現在の最先端の手法に比べて性能が優れているか、競争力がある。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:32:07 GMT)
User-friendly introduction to PAC-Bayes bounds [4.6] 統計的学習理論では、手続きの一般化能力(PAC-Bayesian あるいは PAC-Bayes bounds)を理解するために設計された一連のツールが存在する。
例えば NIPS 2017 では PAC-Bayes に関するワークショップ "(ほぼ) 50 Shades of Bayesian Learning: PAC-Bayesian trend and insights" があった。
PAC-Bayes理論の初歩的な導入はいまだに欠けている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:54:28 GMT)
Understanding Virtual Nodes: Oversquashing and Node Heterogeneity [4.6] 仮想ノード(VN)によるMPNNの拡張は、さまざまなベンチマークのパフォーマンス向上に寄与している。
我々は,VNの役割とその利益に関する包括的理論的分析を行った。
グラフ構造に基づいてノードに対して異なる感度を持つ計算複雑性を持つVNの変種を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:34:37 GMT)
SciceVPR: Stable Cross-Image Correlation Enhanced Model for Visual Place Recognition [4.5] 視覚的位置認識(VPR)は、ロボット工学と自律システムにとって大きな課題である。
本稿では,ScisVPRと呼ばれるVPRのための安定なクロスイメージ相関強化モデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:05:30 GMT)
Towards Generalizable Scene Change Detection [4.5] 現在の環境変化検出手法は、目に見えない環境と異なる時間条件下では信頼性が低い。
本稿では,SCDの需要増加に対応するため,GeSCF(Generalizable Scene Change Detection Framework)を提案する。
GeSCFは、既存のSCDデータセットで平均19.2%、ChangeVPRデータセットで30.0%のパフォーマンス向上を達成した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:28:05 GMT)
A database to support the evaluation of gender biases in GPT-4o output [4.5] 大規模言語モデル(LLM)の顕著な倫理的リスクは、不公平な言語出力の生成である。
本稿では,ジェンダー関連バイアスを評価するためのデータベース構築手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:54:13 GMT)
AI-driven Inverse Design of Band-Tunable Mechanical Metastructures for Tailored Vibration Mitigation [4.5] メカニカルシステムにおけるオンデマンド振動緩和には、マルチスケールなメタ構造の適切な設計が必要である。
添加物製造により9つの層間構造体を作製する。
ハニカムの層間構造における金属介在物によるバンドギャップ変調についても検討した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:51:15 GMT)
Modeling Unknown Stochastic Dynamical System Subject to External Excitation [4.4] 未知の非線形力学系を学習するための数値的手法を提案する。
私たちの基本的な前提は、システムの統治方程式は利用できないということです。
十分な量のI/Oデータが得られる場合,本手法は未知のダイナミクスを学習することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:29:04 GMT)
TRENDy: Temporal Regression of Effective Nonlinear Dynamics [4.3] TRENDyは、低時間ダイナミクスを学ぶための方程式のないアプローチである。
我々はTRENDyをトレーニングし、物理科学と生命科学のあらゆる分野から、合成データと実データの効果的なダイナミクスを予測する。
TRENDyの予測有効状態は、時間とともに変化を正確に予測するだけでなく、異なるパターンの特徴を識別する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:27:44 GMT)
Retrieval Backward Attention without Additional Training: Enhance Embeddings of Large Language Models via Repetition [4.2] 本稿では,ゼロショット設定における事前学習言語モデルの性能向上に焦点をあてる。
本稿では,コンテキスト情報エンコーディングを強化するための新しい下位アテンション機構を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:19:18 GMT)
Stochastic variance-reduced Gaussian variational inference on the Bures-Wasserstein manifold [4.2] 本稿では,バーレス=ヴァッサーシュタイン空間の最適化のための新しい分散再現型推定器を提案する。
この推定器は、興味のあるシナリオにおけるモンテカルロ推定器よりも分散が小さいことを示す。
提案した推定器は以前のビュール=ヴァッサーシュタイン法よりも次数次改善が得られることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:48:54 GMT)
Soften the Mask: Adaptive Temporal Soft Mask for Efficient Dynamic Facial Expression Recognition [4.2] 動的表情認識(DFER)は,非言語コミュニケーションによる心理的意図の理解を促進する。
既存の手法では、バックグラウンドノイズや冗長なセマンティクスといった無関係な情報を管理するのに苦労し、効率と有効性の両方に影響を及ぼす。
そこで本稿では,DFERのための新しい教師付き仮面自動エンコーダネットワーク,すなわちAdaToskを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:45:08 GMT)
Two-Stream Spatial-Temporal Transformer Framework for Person Identification via Natural Conversational Keypoints [4.1] オンライン会話中に見える上半身キーポイントを用いた人物識別のための2ストリーム時空間変換フレームワークを提案する。
我々のフレームワークはキーポイント間の空間的関係と,その時間的進化を2つの専門分野を通して処理する。
このフレームワークは、自然会話に従事した114人のデータセットに基づいて評価され、空間ストリームの認識精度は80.12%、時間ストリームの63.61%に達した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:38:48 GMT)
LLMs in the Heart of Differential Testing: A Case Study on a Medical Rule Engine [4.1] ノルウェーがん登録局(CRN)は、コアがん登録活動を支援するために、自動がん登録支援システム(CaReSS)を使用している。
GURIはCaReSSの中核的なコンポーネントであり、医療ルールによる入ってくるデータの検証に責任がある。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:33:10 GMT)
Acquiring Grounded Representations of Words with Situated Interactive Instruction [4.0] 本稿では,人間インストラクターとの混合開始的,位置的相互作用から単語の接地表現を得る手法を提案する。
この研究は、知覚、意味、手続き的知識を含む多様な種類の知識の獲得と、基礎となる意味の学習に焦点を当てている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:04:52 GMT)
Legitimate ground-truth-free metrics for deep uncertainty classification scoring [4.0] 製造における不確実性定量化(UQ)手法の使用は依然として限られている。
この制限は、UQ基底真理を欠いたUQ手法を検証するという課題によってさらに悪化する。
本稿では,これらの指標を考察し,理論的に良好であり,実際に不確実な基礎的真理に結びついていることを証明する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:06:12 GMT)
Solving the enigma: Enhancing faithfulness and comprehensibility in explanations of deep networks [4.0] 本稿では,説明の正確性と理解性の両方を最大化することに集中して,ディープネットワークの説明可能性を高めるために設計された新しいフレームワークを提案する。
我々のフレームワークは、複数の確立されたXAI手法の出力を統合し、"説明(explanation)"と呼ばれる非線形ニューラルネットワークモデルを活用し、統一的で最適な説明を構築する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:48:17 GMT)
Unlocking the power of global quantum gates with machine learning [3.9] 有限個のグローバルゲートと単一量子ユニタリ層からなる回路アンサーゼについて検討する。
これらのアンサツェの表現性を示し、ハイゼンベルクモデルとトーリック符号ハミルトニアンのための基底状態準備問題に適用する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:14:18 GMT)
The Explanation Necessity for Healthcare AI [3.9] そこで本研究では,4つのクラスから成る新たな分類体系を提案する。
このフレームワークは、研究者が必要な説明可能性の適切な深さを決定するための実用的なツールを提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:16:47 GMT)
Emergent Misalignment: Narrow finetuning can produce broadly misaligned LLMs [3.8] 実験では、モデルを微調整して安全でないコードを出力し、それをユーザに開示する。
結果として得られるモデルは、コーディングとは無関係な幅広いプロンプトに対して不一致に作用する。
この効果は様々なモデルで観測されるが、GPT-4oやQwen2.5-Coder-32B-Instructでは最も強い。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:11:35 GMT)
Applications of Statistical Field Theory in Deep Learning [3.8] ディープラーニングアルゴリズムは、これらのアルゴリズムの複雑さのため、過去10年間に驚くべき進歩を遂げてきたが、ディープラーニングの科学は、まだ初期段階にある。
実験駆動の分野であるため、物理学のパラダイムの中でディープラーニングの理論を求めることは自然である。
深層学習は主に関数の学習と関数上の分布に関するものであるので、統計場理論は形式主義の明らかな選択である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:45:02 GMT)
The GUS Framework: Benchmarking Social Bias Classification with Discriminative (Encoder-Only) and Generative (Decoder-Only) Language Models [3.8] 一般化、不公平、ステレオタイプ(GUSフレームワーク)は、社会的偏見の根底にある重要な言語的要素であると考えられている。
GUSフレームワークは、倫理的基準を維持するために人間が検証する包括的な合成データセットを作成するために、半自動化されたアプローチを採用している。
本手法は,識別的(エンコーダのみ)モデルと生成的(自己回帰的)大規模言語モデルを組み合わせることで,テキスト中のバイアスのあるエンティティを識別する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:55:08 GMT)
Contextualizing biological perturbation experiments through language [3.7] PerturbQAは摂動実験に対する構造化推論のベンチマークである。
我々は、摂動をモデル化するための最先端の機械学習と統計的アプローチを評価する。
本稿では,サマー(SUMMarize,retrievE, answeR),シンプルなドメインインフォームドLLMフレームワークを紹介する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:15:31 GMT)
VLEER: Vision and Language Embeddings for Explainable Whole Slide Image Representation [3.7] 本稿では、WSI表現に視覚機能を活用するために設計された新しい方法であるVLEER(Vision and Language Embeddings for Explainable WSI Representation)を紹介する。
VLEERは、解釈可能性の独特な利点を提供し、結果に対する直接の人間可読な洞察を可能にする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:49:03 GMT)
Self-supervised Mamba-based Mastoidectomy Shape Prediction for Cochlear Implant Surgery [3.6] 術前CT(Computed Tomography)スキャンのみでマストイド摘出体積を合成する新しいマンバ法を提案する。
本手法では,マストイド手術の形状を予測し,マストイド手術後の3次元表面を再構成する自己指導型学習フレームワークを提案する。
本手法は,マストイド切除部位のDiceスコアを0.70と推定し,手術前計画の正確かつ効率的な立案に有効であることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:08:49 GMT)
Robust sensitivity control in digital pathology via tile score distribution matching [3.6] 最適輸送とMIL(Multiple Instance Learning)に基づくWSI分類モデルの感度制御のための新しいアプローチを提案する。
本手法は,少数の校正サンプルのみを用いて頑健な感度制御が可能であり,信頼性の高い計算病理システム構築のための実用的なソリューションを提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:39:21 GMT)
Solar Multimodal Transformer: Intraday Solar Irradiance Predictor using Public Cameras and Time Series [3.6] 文献と区別する3つの要素を含む,斬新で効果的なアプローチを導入する。
太陽マルチモーダル変換器(Solar Multimodal Transformer, SMT)と呼ばれる軽量なマルチモーダルモデルは、正確な短期的な太陽照度予測を行う。
太陽予測サービスプロバイダであるSolcastに対するベンチマークの結果,予測精度は25.95%向上した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:50:46 GMT)
A Survey of Link Prediction in Temporal Networks [3.6] 時系列リンク予測は、過去のネットワーク構造を分析して将来の接続を予測することを目的としている。
本稿では,既存手法からの表現と推論を明確に検証する新しい分類法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:00:57 GMT)
Set-Theoretic Compositionality of Sentence Embeddings [3.5] textitTextOverlap, textitTextDifference, textitTextUnion の3つのコア "set-like" 合成/操作に基づく6つの基準を提案する。
SBERT は,最新のLarge Language Model (LLM) ベースの文エンコーダでさえも,セットライクなコンポジション特性を一貫して示している。
文埋め込みのセットライクな構成性に対する将来のベンチマーク作業を容易にするために,92ドルのサンプルのデータセットを新たに導入する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:40:34 GMT)
Reinforcement Learning with Curriculum-inspired Adaptive Direct Policy Guidance for Truck Dispatching [3.5] 本稿では、ポリシーベースRLの新しいカリキュラム学習戦略である、カリキュラムインスパイアされた適応的ダイレクトポリシーガイダンスを紹介する。
我々は、時間差と一般化アドバンテージ推定の時間差を利用して、地雷派遣の不均一な決定間隔を最適化する。
提案手法は, スパースかつ高密度な報酬設定に対して, 10%の性能向上と, 標準PPOよりも早く収束することを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:43:32 GMT)
Transforming Tuberculosis Care: Optimizing Large Language Models For Enhanced Clinician-Patient Communication [3.5] 本稿では,治療支援者との対話的コミュニケーションを強化するために,専門的な大規模言語モデルを効果的なデジタルアテンデンス技術に統合することを提案する。
このAIを利用したアプローチは、ヒトのループフレームワーク内で動作し、患者のエンゲージメントを高め、TB治療結果を改善することを目的としている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:05:13 GMT)
PT -symmetry breaking and universal spectral statistics in quantum kicked rotors [3.4] 共振条件下でのPT対称量子キックロータの自然パリティ時間破断特性とスペクトル特性について検討した。
局所化系では、非エルミートパラメータの増大はPT対称性が自発的に壊れた位相からの遷移を誘導する。
非局在化状態において、そのような遷移の存在は、還元された系がPT対称であるかどうかに依存する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:27:27 GMT)
Synthesizing Individualized Aging Brains in Health and Disease with Generative Models and Parallel Transport [3.4] InBrainSynは、アルツハイマー病(AD)と正常な老化をシミュレートする高分解能被検者特異的MRIスキャンのためのフレームワークである。
InBrainSynは、並列トランスポートアルゴリズムを使用して、生成的な深層テンプレートネットワークによって学習された人口レベルの老化軌道に適応する。
全体としては、単一のベースラインスキャンだけで、InBrainSynは現実的な3D時間的T1w MRIスキャンを合成し、パーソナライズされた経年変化の軌跡を生成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:45:09 GMT)
EigenLoRAx: Recycling Adapters to Find Principal Subspaces for Resource-Efficient Adaptation and Inference [3.4] Low-Rank Adapters (LoRA)は、大規模なモデルを微調整するための軽量なソリューションを提供する。
パラメータ効率のよいファインタニング手法であるEigenLoRAxを導入し、既存のアダプタをリサイクルして主部分空間を生成する。
これにより、部分空間の主成分の軽量係数のみを学習することで、新しいタスクへの迅速な適応が可能になる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:25:58 GMT)
Probing the limitations of multimodal language models for chemistry and materials research [3.4] 実世界の化学や材料科学のタスクを視覚言語モデルがどのように扱うかを評価するためのベンチマークであるMaCBenchを紹介する。
これらのシステムは、基本的な知覚タスクにおいて有望な能力を示すが、空間的推論、クロスモーダル情報合成、論理的推論の基本的な限界を示す。
私たちの洞察は、化学や材料科学以外にも重要な意味を持ち、信頼性の高いマルチモーダルAI科学アシスタントを開発するには、適切なトレーニングデータとそれらのモデルをトレーニングするためのアプローチのキュレーションの進歩が必要であることを示唆している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:41:21 GMT)
"No negatives needed": weakly-supervised regression for interpretable tumor detection in whole-slide histopathology images [3.4] マルチインスタンス学習は、手動のアノテーションを必要とせず、大規模なデータによる弱い教師付き腫瘍検出のための広く使われているアプローチとして登場した。
本研究は, 腫瘍検出を回帰課題として再検討し, デジタル画像から腫瘍率を推定することにより, この限界に対処する。
複数の臓器, 検体タイプ, 臨床シナリオに適用し, 弱制御回帰フレームワークの解析を行った。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:47:20 GMT)
Quantum illumination via frequency-mode-based correlation-to-displacement conversion [3.4] 量子照明は絡み合いを利用して、高雑音環境においても古典的な目標検出を超越する。
重要な課題は、この利点を利用するために最適な受信機を設計することである。
本稿では,光子数に一致した周波数モードの絡み合った光源,広帯域モードにおける返却信号のヘテロダイン検出方式,プログラム可能なモード処理のためのキャビティ強化量子パルスゲートを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:42:46 GMT)
HQColon: A Hybrid Interactive Machine Learning Pipeline for High Quality Colon Labeling and Segmentation [3.3] 高解像度大腸セグメンテーションは、デジタル双生児やパーソナライズド医療などの臨床および研究用途に不可欠である。
そこで本研究では,完全自動高分解能大腸分割法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:59:49 GMT)
Back to the Future Cyclopean Stereo: a human perception approach unifying deep and geometric constraints [3.3] サイクロペアン眼モデルによる解析的3次元表面モデルを提供する。
この幾何学的基礎と学習されたステレオ特徴を組み合わせることで、システムは両方のアプローチの強みの恩恵を受けることができる。
本研究の目的は,三次元表面の幾何学的性質の理解とモデリングがコンピュータビジョン研究に有用であることを示すことである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:58:20 GMT)
Advancing AI-Powered Medical Image Synthesis: Insights from MedVQA-GI Challenge Using CLIP, Fine-Tuned Stable Diffusion, and Dream-Booth + LoRA [3.3] MEDVQA-GIチャレンジは、医療診断におけるAI駆動のテキスト・ツー・イメージ生成モデルの統合に対処する。
本研究では、テキスト記述から動的でスケーラブルで正確な画像を生成するための微調整生成モデルに基づく新しいアプローチを提案する。
我々のシステムは、安定拡散モデルとドリームブースモデルと、ローランド適応(LORA)を統合し、高忠実度医療画像を生成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:49:45 GMT)
Re-evaluating Theory of Mind evaluation in large language models [3.3] 認知科学からインスピレーションを得て,大規模言語モデルにおけるToM評価の状況を再評価する。
LLMがToMを持つかどうかについての意見の相違の主な理由は、モデルが人間の行動にマッチするかどうかの明確さの欠如である。
ToMと実用的コミュニケーションの関係など,今後の研究の方向性について論じる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:36:57 GMT)
Progressive Curriculum Learning with Scale-Enhanced U-Net for Continuous Airway Segmentation [3.2] 胸部CT画像における気道の連続的,正確な分画は,術前の計画とリアルタイム気管支鏡ナビゲーションに不可欠である。
セグメンテーションの継続性を高めるために,プログレッシブカリキュラム学習パイプラインとスケール強化U-Netを提案する。
社内および公開データセットの両方の実験により、我々の手法が既存のアプローチより優れていることが示された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:04:56 GMT)
CLIP Under the Microscope: A Fine-Grained Analysis of Multi-Object Representation [3.2] 対照的な言語-画像 事前学習モデルはゼロショット分類では優れているが、複雑な多目的シナリオでは課題に直面している。
この研究は、特別なデータセットであるComCOを使用して、これらのコンテキストにおけるCLIPの制限を包括的に分析する。
テキストエンコーダは初期オブジェクトを優先し,画像エンコーダはより大きなオブジェクトを優先する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:00:13 GMT)
Learning to Chain Operations by Routing Information Through a Global Workspace [3.2] 本稿では,グローバルワークスペース理論(Global Workspace Theory)にインスパイアされたモデルを提案する。
モデルの性能を単純な追加タスクで評価し、そこでは2つの加算をまとめる必要がある。
本研究は,深層学習の推論能力を高めるため,グローバルワークスペース理論に触発されたアーキテクチャの可能性を強調した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:30:55 GMT)
SalM$^{2}$: An Extremely Lightweight Saliency Mamba Model for Real-Time Cognitive Awareness of Driver Attention [3.2] 本稿では,最新のMambaフレームワークをベースとしたリアルタイムなSalliency Mambaネットワークを提案する。
図1に示すように、私たちのモデルは、SOTAのパフォーマンスを維持しながら、非常に少ないパラメータを使用します。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:11:00 GMT)
NeuroMorse: A Temporally Structured Dataset For Neuromorphic Computing [3.1] ニューロモルフィックエンジニアリングは、データを非同期の時間イベントとしてエンコードする脳の効率的な処理を模倣することで、コンピューティングを前進させることを目的としている。
ニューロモルフィックアルゴリズムのベンチマークの多くは、ほとんどのシーケンスベースのタスクに固有の時間的ダイナミクスである空間的特徴に焦点を当てている。
本稿では,ニューロモーフィック学習システムのベンチマークのための時間構造データセットであるNeuroMorseを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:22:45 GMT)
Measuring Quantum Discord at the LHC [3.0] 大型ハドロン衝突型加速器(LHC)におけるトップ反トップ量子状態における量子不協和の測定方法についての詳細な解析を行う。
量子不協和は、古典的な起源を持たないシステム間のすべての相関をカプセル化することを目的としているため、興味深い。
この研究は、粒子物理学における量子情報研究のツールキットを拡張した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:46:23 GMT)
Damper-B-PINN: Damper Characteristics-Based Bayesian Physics-Informed Neural Network for Vehicle State Estimation [2.9] 我々は、ダンパー特性に基づくベイズ物理学インフォームドニューラルネットワーク(ダンパー-B-PINN)を設計する。
我々はダンパーの機械的特性にインスパイアされたニューロンの前進過程を導入し、エポック間のニューロンの急激なジャンプを制限する。
物理情報は損失関数に組み込まれ、ニューラルネットワークの物理前駆体として機能する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:46:21 GMT)
Gabor-Enhanced Physics-Informed Neural Networks for Fast Simulations of Acoustic Wavefields [2.9] 物理インフォームドニューラルネットワーク(PINN)は偏微分方程式の解法として注目されている。
本稿ではGabor関数を組み込んだ簡易なPINNフレームワークを提案する。
従来の PINN とガボルベース PINN と比較して, 精度, 収束性, 堅牢性を向上した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:43:21 GMT)
Hybrid deep learning-based strategy for the hepatocellular carcinoma cancer grade classification of H&E stained liver histopathology images [2.8] 肝細胞癌(HCC)は肝癌の一種であり,早期診断が一般的である。
本稿では、トランスファーラーニングを用いて、事前学習された畳み込みニューラルネットワーク(CNN)モデルから特徴を抽出するハイブリッドディープラーニングベースのアーキテクチャを提案する。
提案したハイブリッドモデルでは,TCGA-LIHCおよびKMCデータベースの事前学習モデルよりも2%,4%の精度が向上した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:24:33 GMT)
Self-Attention-Based Contextual Modulation Improves Neural System Identification [2.8] 一次視覚野の皮質ニューロンは、水平およびフィードバック接続によって媒介される文脈情報に敏感である。
CNNはグローバルなコンテキスト情報を統合し、連続的な畳み込みと完全に接続された読み出し層という2つのメカニズムを通じてコンテキスト変調をモデル化する。
自己アテンションは、パラメータマッチングされたCNNよりも2つの重要な指標であるチューニング曲線相関とピークチューニングにおいて、ニューラルネットワークの応答予測を改善することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:43:51 GMT)
Weakly Supervised Multiple Instance Learning for Whale Call Detection and Localization in Long-Duration Passive Acoustic Monitoring [2.7] DSMIL-LocNetは,袋レベルのラベルのみを用いて,クジラの呼検出と位置決めを行うフレームワークである。
我々のデュアルストリームモデルは2~30分間の音声セグメントを処理し、スペクトルと時間的特徴と注意に基づくインスタンス選択を利用する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:34:12 GMT)
Information-Theoretic Perspectives on Optimizers [2.7] 本稿では,従来のシャープネス尺度では複雑な相互作用を完全に説明できず,エントロピーギャップと呼ばれる情報理論の指標を導入し,分析に役立てることを見出した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:32:56 GMT)
Tensor Product Neural Networks for Functional ANOVA Model [2.7] 機械学習モデルの複雑化に伴い、機械学習モデルの解釈可能性の重要性が増している。
高次元関数を低次元関数の和に分解する機能的ANOVAモデルは、AIを解釈する最も一般的なツールの1つである。
本稿では,ANOVAのユニークな分解を保証し,各成分を安定かつ正確に推定できるニューラルネットワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:00:20 GMT)
Fast Adversarial Training against Sparse Attacks Requires Loss Smoothing [2.7] 高速対人訓練に1ドル(約1,400円)のl_infty$摂動に1ドル(約1,300円)の攻撃を応用することの課題について検討した。
対人訓練のCOは1ステップの攻撃による最適以下の摂動位置によって引き起こされる。
本稿では,ソフトラベルとトレードオフ損失関数を組み込んだFast-LS-$l_$を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:32:47 GMT)
Approaching the Harm of Gradient Attacks While Only Flipping Labels [2.7] この研究はラベルフリップ攻撃の新たな形式化を導入し、攻撃者に最適化された損失関数を導出する。
ラベルのフリップだけでアベイラビリティーアタックの最初の証拠を提供する。
我々は、攻撃者がより多くのEmphwriteアクセスから得るものと、彼らがより多くのEmphflipping予算から得るものとの間の興味深い相互作用に光を当てた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:35:48 GMT)
Out-of-distribution Generalization for Total Variation based Invariant Risk Minimization [2.7] OOD-TV-IRMは基本的には原始双対最適化モデルである。
そこで我々は,対数学習計画を支援する収束原始双対アルゴリズムを開発した。
実験結果から,OOD-TV-IRMはITM-TVよりも高い性能を示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:09:56 GMT)
Prediction of Item Difficulty for Reading Comprehension Items by Creation of Annotated Item Repository [2.6] テキストの内容に基づいてアイテムの難易度を予測することは大きな関心事である。
我々は、もともと報告されたアイテムp-値のデータをIRTベースの難易度を回復する関連問題に焦点をあてる。
本リポジトリには,(1)読解項目の言語的特徴,(2)読解項目のテスト特徴,(3)文脈特徴に関するメタデータが付加されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:42:13 GMT)
Autonomous Curriculum Design via Relative Entropy Based Task Modifications [2.6] そこで本稿では,学習者の不確実性を活用してキュリキュラを自動的に設計する手法を提案する。
提案手法は,相対エントロピーを用いて学習者の政策の不確実性を測定し,学習を容易にするためにエージェントを高い不確実性状態へ誘導する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:50:10 GMT)
Generalized Random Forests using Fixed-Point Trees [2.6] 本研究では,多次元の異質効果を推定するための一般化ランダム林arXiv:1610.01271(GRFs)の計算効率の良い代替案を提案する。
GRFは、計算コストが高く不安定な勾配に基づく分割基準に依存しているが、この手法では、ジャコビアン推定の必要性を排除した固定点近似を導入する。
提案手法は,機械学習および因果推論アプリケーションにおける局所的効果推定のスケーラブルな代替手段であることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:38:10 GMT)
Multimodal Dreaming: A Global Workspace Approach to World Model-Based Reinforcement Learning [2.6] 強化学習(Reinforcement Learning, RL)では、世界モデルはエージェントの行動に応じて環境がどのように進化するかを捉えることを目的としている。
潜在空間内での夢のプロセスの実行は、より少ない環境ステップでのトレーニングを可能にすることを示す。
我々は、GWとWorld Modelsの組み合わせは、RLエージェントの意思決定を改善する大きな可能性を秘めていると結論づける。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:24:17 GMT)
Segmenting Bi-Atrial Structures Using ResNext Based Framework [2.6] 心房細動(英: atrial fibrillation、AF)は、心不整脈で最も一般的な疾患であり、特に高齢者の死亡に寄与する。
最近の研究は、追加の心房領域、特に後期ガドリニウム強調MRI(LGE-MRI)で同定される線維性領域を標的にすることの重要性を強調している。
ディープラーニング技術、特に畳み込みニューラルネットワーク(CNN)は、セグメンテーションの自動化を約束している。
LGE-MRIにおいて,ResNeXtエンコーダと,右心房(RA)とLA壁と空洞の両方を分割する循環学習率を組み合わせた新しい2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:23:12 GMT)
Neural Posterior Estimation for Cataloging Astronomical Images with Spatially Varying Backgrounds and Point Spread Functions [2.5] 本研究では,空間的に異なる背景とPSFを用いてニューラル・リテラル推定を行う手法を提案する。
ランダムサンプリングPSFと背景推定を用いて,これらのカタログの合成カタログと半合成画像を生成する。
Sloan Digital Sky Surveyデータによる実験では、空間的に異なる背景とPSFの存在下でのNPEの有効性が示されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:05:09 GMT)
AdEval: Alignment-based Dynamic Evaluation to Mitigate Data Contamination in Large Language Models [2.5] AdEvalはデータ汚染が信頼性に与える影響を緩和することを目的とした動的データ評価手法である。
キーとなる知識ポイントと主要なアイデアを抽出し、動的に生成された質問を静的データの中核的な概念と整合させる。
また、オンライン検索を活用して、関連する知識ポイントの詳細な説明を提供し、高品質な評価サンプルを作成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:07:55 GMT)
A data augmentation strategy for deep neural networks with application to epidemic modelling [2.5] 本稿では,最近導入されたSIR型モデルに対するデータ駆動型手法とディープニューラルネットワークの適用例を示す。
この結果から,データ駆動モデルに適したロバストなデータ拡張戦略により,フィードフォワードニューラルネットワーク(FNN)とオートレグレッシブネットワーク(NAR)の信頼性が向上することが示唆された。
このアプローチは非線形力学を扱う能力を高め、流行予測のためのスケーラブルでデータ駆動型ソリューションを提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:24:49 GMT)
Toward Foundational Model for Sleep Analysis Using a Multimodal Hybrid Self-Supervised Learning Framework [2.4] 本研究では,PSG(Polysomnography)データを解析するためのマルチモーダルハイブリッド学習フレームワークであるSynthSleepNetを紹介する。
SynthSleepNetは、マスク付き予測とコントラスト学習を効果的に統合し、複数のモードにまたがる相補的特徴を活用する。
3つの下流タスクにわたる最先端のメソッドよりも優れたパフォーマンスを実現した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:56:25 GMT)
Requirement falsification for cyber-physical systems using generative models [2.4] 我々は,OGANアルゴリズムを用いて,サイバー物理システムの自動要求ファルシフィケーションを提案する。
OGANは、ほとんど努力せずに新しいシステムに適用でき、テスト中のシステムの要件がほとんどなく、最先端のCPSファルシフィケーション効率と有効性を示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:22:07 GMT)
Autoencoder-Based Framework to Capture Vocabulary Quality in NLP [2.4] 語彙の豊かさ、多様性、複雑さのプロキシとしてニューラルネットワーク容量を使用するオートエンコーダベースのフレームワークを導入する。
本研究のアプローチは2つの異なるデータセットであるDIFrauDデータセットと,さまざまな言語,ジャンル,歴史期間を表すProject Gutenbergデータセットに対して検証を行った。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:45:28 GMT)
Auto-Balancer: Harnessing idle network resources for enhanced market stability [2.3] このメカニズムは、アイドルネットワークリソースを使用して、内部的に調停不能な非効率をキャプチャしようとする。
抽出可能な値漏洩を軽減し、実行摩擦を低減し、会場間の価格形成を改善する。
このメカニズムは、特にSupraのブロックチェーン用に設計されており、その高効率な自動化フレームワークを最大限活用することを目指している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:53:49 GMT)
FLTrojan: Privacy Leakage Attacks against Federated Language Models Through Selective Weight Tampering [2.2] 悪意のあるクライアントが、サーバからの協力なしに、FL内の他のユーザのプライバシーに敏感なデータを漏洩させる方法を示す。
提案手法は, 最大71%の個人データ再構成を達成し, 会員推算率を29%向上させる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:09:51 GMT)
Unbiased and Sign Compression in Distributed Learning: Comparing Noise Resilience via SDEs [2.2] 大規模モデルとデータセットで構成される機械学習パイプラインを扱うには、分散メソッドが不可欠だ。
言語モデルでしばしば見られる大きな重み付き勾配雑音に対する頑健さは、いまだに理解されていない。
本研究は,分散圧縮SGD (DCSGD) と分散符号SGD (DSignSGD) を微分方程式を用いて解析することにより,このギャップに対処する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:12:11 GMT)
Gaussian process surrogate model to approximate power grid simulators -- An application to the certification of a congestion management controller [2.2] 電力グリッドのデジタル化により、物理方程式はネットワークの振舞いを記述するのに不十分になる。
多数のシナリオをシミュレートする安全性検証のような数値実験は、計算的に難解になる。
一般的な解決策は、シミュレータのサロゲートモデルを機械学習(ML)で学習し、高速で評価可能なサロゲートモデルで直接実験を実行することである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:10:52 GMT)
Towards Fairness for the Right Reasons: Using Saliency Maps to Evaluate Bias Removal in Neural Networks [2.2] ニューラルネットワークの公平性向上と有害バイアス除去の関係について検討する。
モデル焦点を保護属性から切り離して, モデル焦点を系統的にリダイレクトする手法が成功していることを示す。
これらの発見は、モデルが正しい理由で公正であることを保証することの重要性を強調し、より倫理的で信頼できるAIシステムの開発に寄与する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:42:21 GMT)
Concealed Adversarial attacks on neural networks for sequential data [2.2] 我々は、異なる時系列モデルに対する隠れた敵攻撃を開発する。
より現実的な摂動を提供し、人間またはモデル判別器によって検出するのが困難である。
この結果から,堅牢な時系列モデルを設計する上での課題が浮き彫りになった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:03:32 GMT)
Lattice Protein Folding with Variational Annealing [2.2] 本稿では,2次元疎水性多孔体(HP)格子タンパク質の折りたたみにおける低エネルギー折りたたみの同定にマスキングを用いた新しいトレーニング手法を提案する。
本研究は,複雑なタンパク質の折り畳み問題に対処するための高度な機械学習技術の可能性を強調した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:30:15 GMT)
Towards Privacy-Preserving Split Learning: Destabilizing Adversarial Inference and Reconstruction Attacks in the Cloud [2.1] この作業は、スプリットラーニングフレームワーク内で、プライバシとユーティリティの両方を提供することを目的としている。
プラグイン戦略としてクラスアクティベーションマップとオートエンコーダを利用する新しい手法が提案されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:24:33 GMT)
Developing robust methods to handle missing data in real-world applications effectively [2.1] このPhDプロジェクトは、多種多様な欠落データメカニズムの影響を調査するために設計された総合的な研究課題を提示する。
主な目的は、MCAR、MAR、MNARメカニズムのユニークな特徴を付加しつつ、欠落したデータを効果的に処理できるロバストな方法論を考案することである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:26:39 GMT)
EXALT: EXplainable ALgorithmic Tools for Optimization Problems [2.1] 本稿では、最適化問題から始めることで、説明可能なアルゴリズムを開発するための新しいアプローチを提案する。
開発したソフトウェアライブラリは,4つの重要な方法論を通じて,人間に理解可能な説明を伴う基本アルゴリズムを充実させる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:28:20 GMT)
Guiding Quantitative MRI Reconstruction with Phase-wise Uncertainty [2.1] 我々は,qMRI再構成における不確実性インフォーメーションの利用を先駆する新しいアプローチであるPUQを導入した。
PUQは、2段階の再構成とパラメータフィッティングの枠組みを用いており、このフレームワークでは、再構成中に位相的不確実性を推定し、フィッティングの段階で利用することができる。
既存のqMRI再構成法と比較して、PUQはパラメータマップピングにおける最先端の性能を達成した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:21:01 GMT)
Robust and Efficient Writer-Independent IMU-Based Handwriting Recognization [2.0] 慣性測定単位(IMU)のデータを用いたオンライン手書き認識(HWR)は依然として困難である。
伝統的なモデルは、目に見えない作家から手書きを認識するのに苦労することが多い。
本稿では,特徴抽出用CNNエンコーダとシーケンスモデリング用BiLSTMデコーダを特徴とする,IMUデータ用のエンコーダデコーダ構造を持つHWRモデルを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:09:28 GMT)
Fine-tuning machine-learned particle-flow reconstruction for new detector geometries in future colliders [2.0] 本研究では,高エネルギー粒子衝突装置における粒子流再構成を訓練した機械学習アルゴリズムにおいて,伝達学習能力を実証する。
我々の知る限り、これは粒子流の完全なクロス・ディテクター・トランスファー・ラーニング研究としては初めてのものである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:16:01 GMT)
AgroLLM: Connecting Farmers and Agricultural Practices through Large Language Models for Enhanced Knowledge Transfer and Practical Application [2.0] AgroLLMは、Large Language Models(LLM)とRetrieval-Augmented Generation(RAG)フレームワークを使用して、農業における知識共有と教育を強化するように設計されている。
4つの主要農業領域における性能評価のための3つの先進モデルの比較研究を行った。
RAGを用いたChatGPT-4o Miniの精度は93%であった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:13:18 GMT)
Artemis: Toward Accurate Detection of Server-Side Request Forgeries through LLM-Assisted Inter-Procedural Path-Sensitive Taint Analysis [2.0] Artemisは、PHP WebアプリケーションのSSRF脆弱性を検出する静的なテナント解析ツールである。
ビルトイン関数とサードパーティ関数の両方を候補ソースとシンク関数として抽出する。
関数の関係を推測するために、明示的および暗黙的なコールグラフの両方を構築する。
207の真の脆弱な経路(106の真のSSRF)と15の偽陽性を報告している。
検出された106個のSSRFのうち、35個が新たに発見され、開発者に報告され、24個のCVE IDと割り当てられた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:14:58 GMT)
Triple Phase Transitions: Understanding the Learning Dynamics of Large Language Models from a Neuroscience Perspective [1.9] 大規模言語モデル(LLM)は、訓練中に特定の時点で新たな能力が出現する突発的な行動を示すことが多い。
この現象は一般に「相転移」と呼ばれ、よく理解されていない。
本稿では、学習データとアーキテクチャの両方で異なるLLMの学習力学に対する新しい解釈を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:59:04 GMT)
Automatic database description generation for Text-to-SQL [1.9] 本稿では,明示的な記述が不可能な場合に,有効なデータベース記述を自動的に生成する手法を提案する。
提案手法は, 粗大なプロセス, 粗大なプロセス, 粗大なプロセスである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:23:06 GMT)
Discrete Diffusion Schrödinger Bridge Matching for Graph Transformation [1.8] 任意の分布間の任意の分布の移動は、生成的モデリングの基本的な目標である。
高次元離散状態空間におけるSB問題の解法として,連続時間マルコフ連鎖を用いた新しいフレームワークを提案する。
我々は,分子の性質を最小限のグラフ変換で効果的に最適化できることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:55:22 GMT)
Graph Neural Networks at a Fraction [1.8] 本稿では、四元数空間を利用してノード表現を計算するフレームワークである四元数メッセージパッシングニューラルネットワーク(QMPNN)を紹介する。
GNN や QMPNN のコンテキストにおける適用性を再定義する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:26:53 GMT)
Learning Efficient Recursive Numeral Systems via Reinforcement Learning [1.7] 従来、強化学習(RL)を用いることで、エージェントは人間に類似した単純な近似的かつ正確に制限された数字系を導出することができることが示されている。
本稿では,効率的な再帰的数体系の出現に関する力学的な説明を導出する手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:22:04 GMT)
SSL4EO-S12 v1.1: A Multimodal, Multiseasonal Dataset for Pretraining, Updated [1.6] SSL4EO-S12 v1.1は大規模な基盤モデルの事前トレーニング用に設計されたデータセットである。
このデータセットは、世界1万の大都市とその周辺を4つの季節にわたって半径50kmの範囲でカバーしている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:30:56 GMT)
Personalized Causal Graph Reasoning for LLMs: A Case Study on Dietary Recommendations [1.6] 本稿では,大規模言語モデルを強化するエージェントフレームワークとしてパーソナライズされた因果グラフ推論を提案する。
本研究は, 食生活の暗黙的な影響による個人的推論を必要とする栄養指向の食事レコメンデーションのケーススタディで評価した。
以上の結果から, 提案手法は, 3つの時間窓にまたがる平均グルコースiAUCを減らすために, パーソナライズされたダイエットレコメンデーションを効率的に提供できることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:25:04 GMT)
MFSR-GAN: Multi-Frame Super-Resolution with Handheld Motion Modeling [1.6] スマートフォンのカメラはユビキタスな画像撮影ツールになっているが、小さなセンサーとコンパクトな光学系は空間分解能を制限していることが多い。
LR-HRトレーニングペアを合成するために,マルチ露光静的画像を用いた新しい合成データエンジンを提案する。
また,MFSRのためのマルチスケールRAW-to-RGBネットワークであるMFSR-GANを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:11:03 GMT)
Efficient Transformer-based Decoder for Varshamov-Tenengolts Codes [1.5] 主に単一エラー訂正のために設計されたVarshamov-Tenengolts (VT) コードは、研究の中心として浮上している。
既存の復号法では1つの誤りを訂正する精度が高いが、複数のIDSエラーを修正できない場合が多い。
本研究では,変換器をベースとしたVTデコーダを導入することにより,VT符号が複数のエラーに対処する能力を維持していることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:59:14 GMT)
SYN-LUNGS: Towards Simulating Lung Nodules with Anatomy-Informed Digital Twins for AI Training [1.5] 肺がんスクリーニングのための生成モデルは、データ不足によって制限され、一般化可能性と臨床応用性に影響を与える。
詳細なアノテーションで高品質な3DCT画像を生成するためのフレームワークであるSyn-LUNGSを紹介する。
データセットには1,044個のCTスキャンから3,072個の結節画像が含まれ、512個の病変と174個のデジタルツインがある。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:02:37 GMT)
Representation Learning of Point Cloud Upsampling in Global and Local Inputs [1.4] 本研究では,表現学習を通して,点雲のアップサンプリングがグローバルレベルとローカルレベルの両方に与える影響について検討した。
目標は、グローバルとローカルの両方のインプットから事前の知識を活用することで、ポイントクラウドにおけるスパーシリティとノイズの問題に対処することである。
深層学習を利用した一連のオートエンコーダモデルを用いて実験を行い,グローバル入力とローカル入力の両方で解釈可能性を得た。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:19:29 GMT)
Trajectory-based Road Autolabeling with Lidar-Camera Fusion in Winter Conditions [1.4] トラジェクトリに基づく自己管理手法は,手動のラベルを使わずに,横断経路から学習することができる。
本手法は,冬期運転データセットの評価において,近年のスタンドアロンカメラおよびライダー方式よりも優れていた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:28:56 GMT)
Hierarchical and Modular Network on Non-prehensile Manipulation in General Environments [1.3] 非包括的操作は、ロボットが家庭などの一般的な環境で操作する上で重要である。
しかしながら、非包括的操作に関する先行研究は、多様な測地を持つ環境全体にわたって、まだ一般化できない。
本稿では,タスク要求に基づいて適応的にネットワークモジュールを再構成するモジュール構造を提案する。
さらに、353個のオブジェクトを持つ現実世界のシーンの9つのデジタルツインを特徴とするシミュレーションベースのベンチマークもリリースした。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:42:00 GMT)
Continuous Adversarial Text Representation Learning for Affective Recognition [1.3] 本稿では、トランスモデルにおける感情認識の埋め込みを強化するための新しいフレームワークを提案する。
提案手法は,コントラスト学習を導くために,連続原子価覚醒ラベリングシステムを導入する。
動的トークン摂動機構を用いて,感情関連トークンに着目し,感情的手がかりに対するモデル感度を向上させる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:29:09 GMT)
Detecting Linguistic Diversity on Social Media [1.3] 我々は、公表された国勢調査データを基礎的真実として、また、グローバル言語利用コーパスのソーシャルメディアサブコーパスを代替データソースとして使用しています。
ソーシャルメディアデータセットにおける各ツイートの言語条件を特定し、2つの言語識別モデルを用いて結果を検証する。
その結果,ソーシャルメディアの言語データは,ある場所の言語的プロファイルに関する空間的・時間的洞察の豊富な情報源となる可能性が示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:56:34 GMT)
Quantum-assisted variational Monte Carlo [1.3] 量子多体系の基底状態を解くために,量子支援型変分モンテカルロ (QA-VMC) アルゴリズムを導入する。
提案手法は,従来の提案法に比べて絶対スペクトルギャップが大きく,自己相関時間も小さくなることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:31:38 GMT)
Towards properly implementing Theory of Mind in AI systems: An account of four misconceptions [1.2] 心の理論(ToM)に関する4つの一般的な誤解を識別する。
これらの誤解は、AIシステムを開発する際に考慮する必要がある。
誤解を議論した後、その誤解を克服するための暫定的なガイドラインを提供することで、各節を終わらせる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:12:35 GMT)
Improved 3D Point-Line Mapping Regression for Camera Relocalization [1.2] カメラ再配置のための3Dポイントとラインマッピングのレグレッションを改善するための新しいアプローチを提案する。
ローカライゼーションのためにそれらを組み合わせる前に、各機能を独立して優先順位付けすることを学ぶ新しいアーキテクチャを導入する。
実験結果から,カメラ再配置における3次元マップポイントとラインレグレッション性能を著しく向上することが示された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:57:23 GMT)
Clustering Context in Off-Policy Evaluation [1.2] オフ政治評価は、ログ化されたデータを活用して、eコマース、検索エンジン、メディアストリーミングサービス、医療における新しいポリシーの有効性を見積もることができる。
IPSのようなベースラインオフポリティクス推定器の性能は、ロギングポリシーと評価ポリシーとが著しく異なるときに低下する。
近年の研究では、同様の行動にまたがって情報を共有し、この問題を軽減することが提案されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:40:41 GMT)
A novel Fourier Adjacency Transformer for advanced EEG emotion recognition [1.1] 脳波の感情認識は、ノイズ干渉、信号の非定常性、脳活動の固有の複雑さによって大きな障害に直面している。
本稿では,Fourierベースの周期解析とグラフ駆動構造モデリングをシームレスに統合する新しいフレームワークであるFourier Adjacency Transformerを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:15:12 GMT)
Beyond the Kolmogorov Barrier: A Learnable Weighted Hybrid Autoencoder for Model Order Reduction [1.1] 我々は,コルモゴロフ障壁を克服するために,学習可能な重み付きハイブリッドオートエンコーダを提案する。
トレーニングされたモデルは、他のモデルに比べて何千倍もシャープさが小さいことを実証的に見出した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:12:31 GMT)
Less is More? Revisiting the Importance of Frame Rate in Real-Time Zero-Shot Surgical Video Segmentation [1.1] 胆嚢摘出術におけるフレームレートがゼロショット手術ビデオセグメンテーションに及ぼす影響について検討し,複数のフレームサンプリングレートでSAM2の有効性を評価した。
意外なことに,従来の評価設定では,フレームレートが1秒あたりの1フレームあたりのフレームレートが25FPSを上回ることが示唆された。
リアルタイムストリーミングのシナリオでは、高いフレームレートが時間的コヒーレンスと安定性を、特に外科的把握器のような動的対象に対して向上させる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:42:09 GMT)
Class prior estimation for positive-unlabeled learning when label shift occurs [1.1] 本稿では,後部確率の推定を回避した,クラス前の新しい直接推定手法を提案する。
これはカーネル埋め込みと共に分布マッチング技術に基づいており、最適化タスクの明示的な解として得られる。
合成データおよび実データに対する有限サンプルの挙動について検討し,提案手法が提案手法と相まって,提案手法を比較検討した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:12:53 GMT)
EndoPBR: Material and Lighting Estimation for Photorealistic Surgical Simulations via Physically-based Rendering [1.0] 手術シーンにおける3次元視覚におけるラベル付きデータセットの欠如は、堅牢な3次元再構成アルゴリズムの開発を阻害する。
内視鏡画像と既知の幾何から物質と照明を推定するための微分可能なレンダリングフレームワークを提案する。
レンダリング方程式で色予測を基底にすることにより、任意のカメラポーズでフォトリアリスティックな画像を生成することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:50:59 GMT)
Open-Source Manually Annotated Vocal Tract Database for Automatic Segmentation from 3D MRI Using Deep Learning: Benchmarking 2D and 3D Convolutional and Transformer Networks [1.0] 手作業のセグメンテーションは時間集約的であり、エラーの影響を受けやすい。
本研究の目的は,3次元MRIによる声道自動分割のためのディープラーニングアルゴリズムの有効性を評価することである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:28:44 GMT)
Detection of anomalies in cow activity using wavelet transform based features [1.0] 本研究の目的は, 牛の24時間連続活動における異常の検出であり, 疾患や肥満の症例を検出することである。
時系列の平均のウェーブレット変換と個々の時系列インスタンスのウェーブレット変換の比較に基づいて特徴を発達させる。
その結果,ウェーブレットに基づく特徴は異常検出に最も寄与する特徴の一つであることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:50:18 GMT)
Autonomous Robotic Swarms: A Corroborative Approach for Verification and Validation [1.0] 本稿では,自律型ロボット群を正式に検証し,検証する手法を提案する。
本研究は,実ロボットを用いた形式的検証とシミュレーションと実験的検証を組み合わせたものである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:59:51 GMT)
Microscopic Propagator Imaging (MPI) with Diffusion MRI [1.0] 本稿では,顕微鏡プロパゲータの指標を検索する新しい方法として,顕微鏡プロパゲータイメージング(MPI)を提案する。
Ensemble Average Propagatorの指標やDiffusion Imagingの指標とは異なり、MPIの指標は組織のメソスコピックな組織とは独立している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:10:00 GMT)
Evaluating Fault Tolerance and Scalability in Distributed File Systems: A Case Study of GFS, HDFS, and MinIO [0.9] 分散ファイルシステム(DFS)は、スケーラビリティ、フォールトトレランス、データアクセシビリティのメリットを提供する、複数のサーバにわたる巨大なデータセットを管理するために不可欠である。
本稿では、Google File System(GFS)、Hadoop Distributed File System(HDFS)、MinIOの3つのDFSを総合的に評価する。
詳細な分析を通じて、これらのシステムがデータの冗長性、サーバ障害、クライアントアクセスプロトコルをどのように扱うか、動的で大規模環境における信頼性を確実に評価する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:52:39 GMT)
Deep Reinforcement Learning for Dynamic Resource Allocation in Wireless Networks [0.9] 本報告では,無線通信システムにおける動的リソース割り当てに対する深部強化学習(DRL)アルゴリズムの適用について検討する。
アルゴリズムと学習率の選択はシステム性能に大きく影響を与え、DRLは従来の手法よりも効率的なリソース割り当てを提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:02:04 GMT)
DeepRetrieval: Powerful Query Generation for Information Retrieval with Reinforcement Learning [0.9] DeepRetrievalは、LLMに試行錯誤を通じてクエリ拡張を直接実行するように訓練する、新しい強化学習ベースのアプローチである。
予備的な結果は、DeepRetrievalが既存の最先端手法を著しく上回っていることを示している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:16:42 GMT)
WebFAQ: A Multilingual Collection of Natural Q&A Datasets for Dense Retrieval [0.8] WebFAQ(英語: WebFAQ)は、FAQスタイルのスキーマ.orgアノテーションから派生した、オープンドメインの質問応答データセットの大規模なコレクションである。
データ収集は、75言語にまたがる9600万の自然質問回答(QA)ペアで構成されており、うち4700万(49%)が非英語のサンプルである。
WebFAQは、合計1120万QAペアのモノリンガル検索ベンチマーク20の基盤となっている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:46:52 GMT)
Regional climate projections using a deep-learning-based model-ranking and downscaling framework: Application to European climate zones [0.8] 本研究は、深層学習に基づくマルチモデル評価およびダウンスケーリングフレームワークで、結合モデル相互比較プロジェクトフェーズ6(CMIP6)モデルランキング32を提示する。
熱帯・乾燥・温帯・大陸・極圏の気候帯は4季節にわたって調査されている。
4つのモデルは、上位のGCMを0.1$circ$の解像度にダウンスケールするのに貢献する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:32:03 GMT)
Extending the OmpSs-2 Programming Model for Hybrid Quantum-Classical Programming [0.8] 我々は,ネットワーク内の量子コンピュータをシミュレーションし,実行時にオフロードされたジョブを受信するシミュレータを開発した。
4つの詳細な例は、我々のプログラミングモデルがハイブリッド量子古典ソフトウェアを書くのにどのように使えるかを示している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:40:42 GMT)
Position: Solve Layerwise Linear Models First to Understand Neural Dynamical Phenomena (Neural Collapse, Emergence, Lazy/Rich Regime, and Grokking) [0.8] 機械学習では、階層的な線形モデルはニューラルネットワークのダイナミクスを単純化した表現として機能する。
これらのモデルは動的フィードバックの原則に従い、レイヤが相互に統治し、互いの進化を増幅する方法を記述する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:52:11 GMT)
BixBench: a Comprehensive Benchmark for LLM-based Agents in Computational Biology [0.8] LLM(Large Language Models)とLLMをベースとしたエージェントは、科学研究の加速に大きな期待を示している。
本稿では,バイオインフォマティクスベンチマーク(BixBench)について述べる。
オープンソースのカスタムエージェントフレームワークを用いて,2つのフロンティアLCMの性能評価を行った。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:47:57 GMT)
Evaluating Creative Short Story Generation in Humans and Large Language Models [0.8] 大規模言語モデル (LLM) は高品質なストーリーを生成する能力を示したが、創造的なストーリー記述能力は未探索のままである。
我々は,5文の創造的ストーリー記述タスクを用いて,60 LLMと60人の短いストーリー生成において,創造性を体系的に分析する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:17:47 GMT)
Delta-WKV: A Novel Meta-in-Context Learner for MRI Super-Resolution [0.8] 我々は,メタ・イン・コンテキスト・ラーニング(MiCL)とデルタ・ルールを組み合わせた新しいMRI超解像モデルであるDelta-WKVを提案し,MRI画像の局所パターンとグローバルパターンの両方をよりよく認識する。
デルタ-WKVは既存の手法より優れており、PSNRを0.06dB、SSIMを0.001改善し、トレーニングと推論時間を15%以上削減している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:49:46 GMT)
Evidence of Replica Symmetry Breaking under the Nishimori conditions in epidemic inference on graphs [0.7] 西森条件下では, レプリカ対称性が崩壊する証拠がある。
この現象の発端は、西森の環境下での複製対称性の破れであり、流行モデルにみられる相関性障害によるものと考えられる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:54:08 GMT)
Toward interoperable representation and sharing of disinformation incidents in cyber threat intelligence [0.7] 本稿では、相互運用可能な偽情報を共有するためのオープンソースの偽情報脅威インテリジェンスフレームワークを提案する。
我々の知る限りでは、この研究はCTIエコシステムに偽情報の脅威を統合するための最初の学術的および技術的取り組みである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:37:32 GMT)
Optimizing Large Language Models for ESG Activity Detection in Financial Texts [0.7] 本稿では,環境活動に関連するテキストを識別する次世代大規模言語モデルについて検討する。
ESG-ActivitiesはEUのESG分類に従って分類された1,325のラベル付きテキストセグメントを含むベンチマークデータセットである。
実験の結果,ESG-Activitiesの微調整は分類精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:52:25 GMT)
Neural Context Flows for Meta-Learning of Dynamical Systems [0.7] 我々は、不確実性推定を含む頑健で解釈可能なメタラーニングフレームワークであるNeural Context Flow (NCF)を紹介する。
NCFはTaylor拡張を使用してコンテキストの自己変調を可能にし、コンテキストベクトルが他のドメインからのダイナミクスに影響を与えると同時に、自分自身を変調することを可能にする。
この結果から, 線形および非線形の6つのベンチマーク問題のうち5つにおいて, NCFの出力性能が向上していることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:35:46 GMT)
Can Generative AI Support Patients' & Caregivers' Informational Needs? Towards Task-Centric Evaluation Of AI Systems [0.7] 人間の理解と意思決定を中心とする評価パラダイムを開発する。
具体的なタスクにおける人を支援するための生成AIシステムの有用性について検討する。
我々は,放射線技師の反応に対して,最先端の2つの生成AIシステムを評価する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:46:53 GMT)
Temperature as Joules per Bit [0.7] エントロピーはビット単位でよく測定されており、熱力学平衡における情報容量と一致する。
温度を1ビット当たりのジュールとして見ることで、ギブスが長年にわたって提示した、利用可能な容量と自由エネルギーの間の強い双対性が明らかになる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:25:22 GMT)
An experimental platform for levitated mechanics in space [0.7] 本稿では,宇宙空間における光磁気トラップ実験のための技術実証装置の開発について述べる。
私たちのペイロードは、基本的な物理的質問を探索する目的で、将来のミッションに向けた最初の具体的なステップを表しています。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:42:07 GMT)
Attention-Guided Integration of CLIP and SAM for Precise Object Masking in Robotic Manipulation [0.7] 本稿では,コンビニエンスストアにおけるロボット操作のためのオブジェクトマスキングの精度を高めるための新しいパイプラインを提案する。
このアプローチはCLIPとSAMという2つの高度なAIモデルを統合し、シナジスティックな組み合わせとマルチモーダルデータの有効利用に焦点を当てている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:20:15 GMT)
Predicting clinical outcomes from patient care pathways represented with temporal knowledge graphs [0.7] 知識グラフデータ表現とその埋め込みは、いくつかの環境で競合するが、バイオメディカルな予測モデルにどのような関心があるのかは不明だ。
頭蓋内動脈瘤症例の人工的・現実的データをシミュレートし,臨床成績を予測するための課題について検討した。
本研究は,グラフ表現とグラフ畳み込みネットワーク(GCN)の埋め込みが観測データから予測タスクの最適性能に達することを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:20:41 GMT)
TomoSelfDEQ: Self-Supervised Deep Equilibrium Learning for Sparse-Angle CT Reconstruction [0.7] TomoSelfDEQはスパース角度CT再構成のための自己教師型フレームワークである。
アンダーサンプル測定で直接訓練する。
最先端の結果を16個の射影角度で達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:59:52 GMT)
Turing Representational Similarity Analysis (RSA): A Flexible Method for Measuring Alignment Between Human and Artificial Intelligence [0.6] 我々は,AIと人間間のアライメントを定量化するために,ペアの類似度評価を用いたチューリング表現類似度分析(RSA)を開発した。
我々は,テキストと画像のモダリティ間のセマンティックアライメント(セマンティックアライメント)を検証し,Large Language and Vision Language Model(LLM, VLM)の類似性判断が,グループレベルでも個人レベルでも人間の反応とどのように一致しているかを測定した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:11:26 GMT)
Cost-Effective, High-Performance Open-Source LLMs via Optimized Context Retrieval [0.6] この研究は、最適化されたコンテキスト検索が、オープンソースのLLMを使用してコスト効率の高い高性能医療AIを解放することを示した。
重要なコントリビューションはOpenMedQAである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:49:44 GMT)
Generating patient cohorts from electronic health records using two-step retrieval-augmented text-to-SQL generation [0.6] このシステムは EHR データのコホート同定において 0.75 F1-スコアを達成し、複雑な時間的および論理的関係を効果的に捉える。
これらの結果は、疫学研究におけるコホート自動生成の可能性を示している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:46:02 GMT)
An LLM-based Delphi Study to Predict GenAI Evolution [0.6] 本研究では,大規模言語モデルを用いた定性的予測手法を提案する。
この手法は、ジェネレーティブ・人工知能の将来的な進化を探求するために応用された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:31:25 GMT)
ReMiDi: Reconstruction of Microstructure Using a Differentiable Diffusion MRI Simulator [0.6] ReMiDiは、微分拡散磁気共鳴イメージング(dMRI)シミュレーターを用いて神経細胞の微細構造を任意の3次元メッシュとして推定する新しい手法である。
本稿では、参照信号にマッチするように調整可能な信号をシミュレートする、エンドツーエンドの微分可能なパイプラインを提案する。
有限要素メッシュで表される任意の形状の微細構造を再構築する能力を示し,脳白質中の軸索ジオメトリーに着目した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:29:07 GMT)
Entanglement between accelerated probes in de Sitter [0.6] 曲線時空における加速量子プローブによる真空エンタングルメントの特性について検討する。
量子場との相互作用は、初期の非相関プローブ間の非局所的な相関を異なる方向に加速させる。
この結果から, エンタングルメントは, 加速度や曲率の変化によって独立に変化することが示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:16:04 GMT)
Raman Signatures of Single Point Defects in Hexagonal Boron Nitride Quantum Emitters [0.6] 欠陥同定のためのロバストな戦略としてラマン分光法を提案する。
密度汎関数理論を用いて、六方晶窒化ホウ素(hBN)の100個の欠陥のラマン符号を特徴づける
以上の結果から, 局所原子環境はラマンライン形状形成において重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:55:13 GMT)
Software development projects as a way for multidisciplinary soft and future skills education [0.6] 本論文は,短期的かつ集中的な共同プロジェクトにおいて,ソフトと将来的なスキルの教育の可能性を示す。
プロジェクトでは、問題ベースの学習、アクティブラーニング、グループワークの方法論を使用します。
その結果,提案手法はコミュニケーション,協力,デジタルスキル,自己反射において,参加者のソフトスキルを高めた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:52:40 GMT)
Learner and Instructor Needs in AI-Supported Programming Learning Tools: Design Implications for Features and Adaptive Control [0.6] 我々は15人の大学生と10人のインストラクターとともに参加型デザイン研究を行い、希望するヘルプ機能やコントロールの好みについての洞察を得た。
以上の結果から,学習者は,視覚的援助を取り入れ,ピア関連の洞察を取り入れた支援を好んでいることが示唆された。
我々の研究は、自律性とガイダンスを効果的にバランスさせるシステムの開発を通知することで、AI支援学習環境の人間中心の設計に寄与する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:50:10 GMT)
A non-ergodic framework for understanding emergent capabilities in Large Language Models [0.5] 大規模言語モデルには、予期せぬ規模で現れる創発的な能力がある。
スチュアート・カウフマン(Stuart Kauffman)の隣接可能な可能性(TAP)の理論に基づく数学的枠組みを提供し、能力の出現を説明する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:07:50 GMT)
Maximal Extractable Value in Decentralized Finance: Taxonomy, Detection, and Mitigation [0.5] 最大抽出可能な値(MEV)は、ブロックチェーン上の金融トランザクションから抽出することができる。
MEVは、DeFiエコシステムのセキュリティ、効率、分散化目標を破壊し、金融損失とコンセンサス不安定を引き起こす。
この調査は、研究者、開発者、利害関係者、政策立案者に貴重な洞察を提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:11:37 GMT)
Deep Learning-Driven Malware Classification with API Call Sequence Analysis and Concept Drift Handling [0.5] 動的環境におけるマルウェアの分類は、概念の漂流に起因する重要な課題である。
本稿では,マルウェアの分類精度と適応性を向上させるため,遺伝的アルゴリズムにより強化されたディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:53:41 GMT)
EasyRpl: A web-based tool for modelling and analysis of cross-organisational workflows [0.5] 本稿では,ユーザフレンドリーなWebベースのツールスイートであるEasyRplについて紹介する。
EasyRplは、ワークフローの変更の影響を可視化するシミュレータ、潜在的なリソースボトルネックを特定するためのピークリソース分析ツール、実行時間を推定する時間解析ツールで構成される。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:35:18 GMT)
Arabizi vs LLMs: Can the Genie Understand the Language of Aladdin? [0.5] アラビジはラテン文字と数字を含むアラビア語のハイブリッド形である。
機械翻訳には形式的な構造が欠如しているため、大きな課題がある。
本研究は、アラビジ語を現代標準アラビア語と英語の両方に翻訳する際のモデルの性能について検討する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:37:52 GMT)
Explainable AI for Classifying UTI Risk Groups Using a Real-World Linked EHR and Pathology Lab Dataset [0.5] 尿路感染症(UTIs)の特徴付けにリンクEHRデータセットを活用する
臨床専門知識からUTIリスク推定フレームワークを導入し,個別の患者タイムラインにまたがってUTIリスクを推定する。
リスクグループ間で臨床および人口統計学的予測値の違いが判明した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:16:36 GMT)
Foundation Models -- A Panacea for Artificial Intelligence in Pathology? [0.5] ファンデーションモデル(FM)は、様々な下流タスクのための普遍的なソリューションとして広く提唱されている。
そこで我々は,前立腺癌診断とGleason gradingのための臨床レベルのAIに焦点を当てた。
11ヶ国15ヶ所で7,342人のコア針生検を行った。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:40:45 GMT)
AutoQML: A Framework for Automated Quantum Machine Learning [0.4] 我々は、量子機械学習にAutoMLアプローチを適用する新しいフレームワークであるemphAutoQMLを紹介する。
4つの産業ユースケースでAutoQMLを評価し、高いパフォーマンスのQMLパイプラインを生成する能力を実証した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:08:15 GMT)
Disentangling Uncertainty for Safe Social Navigation using Deep Reinforcement Learning [0.4] 本研究は, 政策分布不確実性推定のためのDRLナビゲーションフレームワークに, アレタリック, エピステミック, 予測不確実性推定を統合する新しいアプローチを導入する。
本研究では,不確実な意思決定状況において,ロボットの社会的行動から保守的衝突回避への転換を提案する。
その結果, PPOにおけるODVおよびDropoutによるトレーニング性能が向上し, トレーニングシナリオが一般化に影響を及ぼすことが明らかとなった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:38:12 GMT)
In-context learning for medical image segmentation [0.4] In-context Cascade (ICS) は、シーケンシャルな医用画像に対して高いセグメンテーション精度を達成しつつ、アノテーション要求を最小限に抑える新しい手法である。
ICSはUniverSegフレームワーク上に構築されており、追加のトレーニングなしでサポートイメージを使用して少数ショットのセグメンテーションを実行する。
心臓8領域のセグメンテーションタスクを含むHVSMRデータセットを用いて,提案手法の評価を行った。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:19:59 GMT)
Learning-Driven Annealing with Adaptive Hamiltonian Modification for Solving Large-Scale Problems on Quantum Devices [0.4] 学習駆動アニーリング(LDA)は、個々の量子アニーリングの進化をグローバルなソリューション戦略に結びつけるフレームワークである。
LDAは問題構造について学び、ハミルトニアンを適応的に修正する。
大規模スピングラス用ハイブリッド量子古典解法の開発によるLDAの有効性を実証する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:15:36 GMT)
Model-based Elaboration of a Requirements and Design Pattern Catalogue for Sustainable Systems [0.4] リソースの保存、製品ライフサイクルの円度の改善、グローバルフェアネスの確保など、特定の側面に取り組むための戦略がいくつか現れています。
本稿では,参照持続可能性メタモデルとパターンテンプレートに基づくモデリング手法を用いて,これらの戦略の要素を捉える方法について検討する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:55:36 GMT)
Zero-Shot Automatic Annotation and Instance Segmentation using LLM-Generated Datasets: Eliminating Field Imaging and Manual Annotation for Deep Learning Model Development [0.4] 本研究では, 果樹園におけるリンゴの深層学習に基づくインスタンスセグメンテーション手法を提案する。
そこで我々は, YOLO11ベースモデルと統合したSegment Anything Model (SAM) を用いて, オーチャード画像を合成し, 自動的に注釈付けを行った。
その結果、自動生成したアノテーションはDice Coefficient 0.99513 と IoU 0.9303 を達成し、マスクアノテーションの精度と重複性を検証した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:44:36 GMT)
PaliGemma-CXR: A Multi-task Multimodal Model for TB Chest X-ray Interpretation [0.4] 多くの国では、胸部X線を解釈できる放射線技師の不足に直面している。
従来のアプローチはタスク固有のモデルに依存しており、タスク間の相互依存を利用できない。
本稿では,TB診断,オブジェクト検出,セグメンテーション,レポート生成,VQAを行うマルチタスクマルチモーダルモデルPaliGemma-CXRを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:34:06 GMT)
Analytic Formulas for Quantum Discord of Special Families of N-Qubit States [0.3] N-量子状態の特殊族に対する量子不協和の正確な解析式を示す。
位相フリップデコヒーレンスの下で、偶数ビット系の「不協和性凍結」を明らかにする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:55:16 GMT)
Distributed Variational Quantum Algorithm with Many-qubit for Optimization Challenges [0.3] 既存の量子アルゴリズムは、絡み合いに過度に依存するため、スケーラビリティと精度に苦しむ。
本稿では,量子重ね合わせのみを用いるアンサッツにおけるマルチキュービット(MQ)演算を利用する変分量子最適化アルゴリズムを提案する。
また、分散VQOAを導入し、高速コンピューティングと量子コンピューティングを統合し、MQシステムと古典ノード間で優れたパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:13:23 GMT)
LesionLocator: Zero-Shot Universal Tumor Segmentation and Tracking in 3D Whole-Body Imaging [0.2] 3次元医用画像におけるゼロショット長手病変追跡とセグメンテーションのためのフレームワークであるLesionLocatorを提案する。
本モデルでは,23,262個の注釈付き医用スキャンの広範囲なデータセットと,各種病変の経時的データを活用する。
LesionLocatorは、病変のセグメンテーションにおいて既存のすべてのプロンプト可能なモデルを約10のダイスポイントで上回り、人間レベルのパフォーマンスに達する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:58:33 GMT)
Explaining Humour Style Classifications: An XAI Approach to Understanding Computational Humour Analysis [0.2] 本稿では、ユーモアスタイルの分類を理解するための説明可能なAIフレームワークを提案する。
我々は、言語的、感情的、意味的な特徴がユーモアスタイルの分類決定にどのように貢献するかを分析するために、総合的なXAI手法を適用した。
本研究は,算術的ユーモア分析の理論的理解と,メンタルヘルス,コンテンツモデレーション,デジタル人文科学研究の実践的応用に寄与する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:57:47 GMT)
Reservoir Computing Benchmarks: a tutorial review and critique [0.2] 貯留層計算(Reservoir Computing)は、様々な基板上で計算を行う非伝統的な計算モデルである。
我々は貯水池計算の分野で用いられる評価手法をレビューし、批判する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:39:20 GMT)
Long-fiber Sagnac interferometers for twin field quantum key distribution networks [0.2] サニャックループ構造は、ツインフィールド量子鍵分布ネットワークの実践的な実装において大きな困難を克服するのに役立つ。
長繊維と損失光デバイスを含むサニャック系において,レイリー後方散乱雑音は信号対雑音比を制限することを示した。
この結果は,大都市圏量子ネットワークの実現に向けた重要なステップである,長距離TFQKDネットワークにおいて,サニャック方式が実現可能であることを示唆している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:14:30 GMT)
Bayesian computation with generative diffusion models by Multilevel Monte Carlo [0.2] 生成拡散モデルは、逆問題におけるサンプリングを行うための強力な戦略として登場した。
しかし、拡散モデルでは、正確な後部サンプルを提供するために、サンプル毎に多数の神経機能評価を必要とすることが多い。
本稿では,拡散モデルを用いたベイズ応用のコストを大幅に削減するマルチレベルモンテカルロ戦略を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:10:23 GMT)
Post-Hoc Uncertainty Quantification in Pre-Trained Neural Networks via Activation-Level Gaussian Processes [0.2] 本稿では,ガウス過程活性化関数(GAPA)を導入し,ニューロンレベルの不確実性を捉える。
我々のアプローチは、トレーニング済みニューラルネットワークの本来の平均予測を保ちながら、ポストホックな方法で動作します。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:29:06 GMT)
Identifying Emerging Concepts in Large Corpora [0.1] 大規模テキストコーパスにおける新しい概念を識別する手法を提案する。
基礎となる埋め込み空間の熱マップの変化を解析することにより、これらの概念を発生直後に高い精度で検出することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:59:15 GMT)
What are You Looking at? Modality Contribution in Multimodal Medical Deep Learning Methods [0.1] 本稿では,モデルがタスクを果たすためのデータセットにおいて,各モダリティの重要性を測定する手法を提案する。
いくつかのネットワークは、一様崩壊の傾向にあるモダリティの選好を持ち、いくつかのデータセットはゼロから不均衡であることがわかった。
深層学習に基づくマルチモーダル研究における解釈可能性の分野において,本手法は重要な貢献をする。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:39:39 GMT)
The Structural Complexity of Matrix-Vector Multiplication [0.1] 行列ベクトル乗算問題は$tildeO(n2)$プレプロセッシングと$tildeO(n2-1/d)$クエリ時間で解けることを示す。
我々の結果は、多くの応用において最初の非自明な上界が得られる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:11:36 GMT)
EvGNN: An Event-driven Graph Neural Network Accelerator for Edge Vision [0.1] イベント駆動グラフニューラルネットワーク(GNN)は、スパースイベントベースのビジョンのための有望なソリューションとして登場した。
我々は,低フットプリント,超低レイテンシ,高精度エッジビジョンのための,最初のイベント駆動型GNNアクセラレータであるEvGNNを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:55:01 GMT)
Experiences with Content Development and Assessment Design in the Era of GenAI [0.0] GenAIの進歩は教育のいくつかの側面、特に主題と評価設計に革命をもたらした。
本論文は、講義、研究室、評価など、GenAIがいかに効果的に対象を設計できるかを、プロンプトとカスタムベーストレーニングを用いて判断することを目的としている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:05:15 GMT)
À la recherche du sens perdu: your favourite LLM might have more to say than you can understand [0.0] LLMは、視覚的に人間には理解できないようなシーケンスに隠された意味を割り当てることができることを示す。
これらの意味のいくつかは、部分的にはBPEトークン化による巨大な急激な相関に由来すると仮定されている。
我々は、この観察は、現代と将来のLLMの安全性と安全性の両方に、はるかに大きな影響をもたらすかもしれないと論じる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:18:23 GMT)
Why Trust in AI May Be Inevitable [0.0] 説明は時々不可能であるので、信頼は前提条件であるかもしれないと我々は主張する。
この結果は,知識ネットワークによる探索プロセスとしての説明の形式化から導かれる。
我々のモデルは、理論上理想的な条件下でも説明が失敗する可能性があることを明らかにしている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:20:24 GMT)
When Respondents Don't Care Anymore: Identifying the Onset of Careless Responding [0.0] 我々は不注意応答(またはその欠如)の開始を識別する新しい方法を提案する。
機械学習に基づいて、非常に柔軟で、偽陽性率を制御するための統計的保証を提供する。
経験的応用は、部分的不注意の識別が不注意な応答行動に関する新しい洞察をいかに明らかにするかを強調している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:39:42 GMT)
What is ontic and what is epistemic in the Quantum Mechanics of Spin? [0.0] スピンを考慮に入れたEntropic Dynamicsフレームワークを拡張します。
確率の結果として生じるダイナミクスは、予想通り、パウリ方程式によって記述される。
という質問に対して、EDは「何も回転していない」という明快な答えを与えています。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:42:26 GMT)
VAEs and GANs: Implicitly Approximating Complex Distributions with Simple Base Distributions and Deep Neural Networks -- Principles, Necessity, and Limitations [0.0] 本チュートリアルは,変分オートエンコーダ(VAE)とGAN(Generative Adversarial Networks)の基本アーキテクチャに焦点を当てる。
VAEとGANは基礎としてガウスのような単純な分布を利用し、ニューラルネットワークの強力な非線形変換能力を利用して任意の複雑な分布を近似する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:34:14 GMT)
Unmanned Aerial Vehicle (UAV)-Based Mapping of Iris Pseudacorus L. Invasion in Laguna del Sauce (Uruguay) Coast [0.0] 生物の侵入は、水源の持続可能性に重大な脅威をもたらす。
リモートセンシング(RS)は、この取り組みを支援する潜在的なツールとして長年認識されてきた。
本稿では,外来種の実際の分布を地図化するためのプロセスについて詳述する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:06:38 GMT)
Universality in the Anticoncentration of Chaotic Quantum Circuits [0.0] ランダム量子回路の反集中特性において普遍的な挙動を確立する。
ランダムテンソルネットワーク状態のアンサンブルの正確な計算により、これらの補正を計算する。
そして、これらの補正の普遍性を論じ、汎用的レンガ加工回路の枠組みを同定する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:00:26 GMT)
Understanding Floquet Resonances in Ultracold Gas Scattering [0.0] シャープ共鳴が起こり、s波散乱長は大きな正と負の値に調整できる。
これらの共振器の形状は簡単な式で説明され, 駆動力によって共振器の位置とプレファクタの両方を変えることができることがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:00:00 GMT)
Transforming Cyber Defense: Harnessing Agentic and Frontier AI for Proactive, Ethical Threat Intelligence [0.0] この原稿は、エージェントAIとフロンティアAIの収束がサイバーセキュリティをいかに変えているかを説明する。
本稿では,リアルタイムモニタリング,自動インシデント応答,永続的学習といった,レジリエントでダイナミックな防衛エコシステム構築における役割について検討する。
我々のビジョンは、テクノロジーのイノベーションを、倫理的監視を揺るがさずに調和させることであり、未来のAIによるセキュリティソリューションが、新たなサイバー脅威を効果的に対処しつつ、公正性、透明性、説明責任の核心的価値を維持することを保証することである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:23:35 GMT)
Towards understanding the bias in decision trees [0.0] この信念は必ずしも決定木に対して正しいものではなく、そのバイアスが実際には反対方向にあることを示しています。
本研究は,無作為林など,一般的な樹木モデルの利用に影響を及ぼすものである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:03:56 GMT)
Towards Ultimate NMR Resolution with Deep Learning [0.0] 多次元NMR分光法では、実測分解能は、重なり合うピーク、熱ノイズ、スペクトルアーティファクトの背景に対する信号位置を識別し、正確に決定する能力として定義される。
最終的な解決を追求するために,各スペクトル点に確率を割り当てる統計的スペクトル表現であるピーク確率プレゼンテーション(P3$)を導入し,その位置で発生するピーク最大値の確率を示す。
スペクトルと$P3$の間のマッピングは、多次元NMRスペクトルを扱うように設計された物理に着想を得たディープラーニングニューラルネットワークアーキテクチャであるMR-Aiを用いて達成される。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:20:25 GMT)
The quantum Newton's bucket: Active and passive rotations in quantum theory [0.0] 量子系における「アクティブ」と「パッシブ」の回転の差について論じる。
我々は、量子場理論にどのように変換できるかについて議論した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:28:23 GMT)
The iSWAP gate with polar molecules: Robustness criteria for entangling operations [0.0] 光格子やツイーザーアレイに閉じ込められた極性分子は、量子情報処理と量子シミュレーションのための新興プラットフォームである。
近年のブレークスルーにより個々の分子の正確な制御が可能となり、iSWAPゲートに基づいた2量子ビット量子ゲートの実装の道が開かれた。
摂動的アプローチに基づく量子最適制御フレームワークを開発し,いずれかの系のハミルトンパラメータの準静的偏差に対して頑健なゲートを設計する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:08:29 GMT)
The concept of minimal dissipation and the identification of work in autonomous systems: A view from classical statistical physics [0.0] オープン量子システム上での作業を定義する手段として,最小散逸の概念について議論する。
作業の有用な定義を満たさなければならない条件の一つは、無限の熱容量を持つ環境との弱い結合の限界において、作業の熱力学的な概念を再現することである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:55:54 GMT)
The Jaynes Cummings model as an autonomous Maxwell demon [0.0] 我々はJaynes-Cummingsモデルを再考し、キュービットは最初は大きなコヒーレント場を含むキャビティによって駆動される自律熱力学マシンである。
本分析では,空洞の理想的な作業源の短時間での挙動と,空洞が自律的にキュービットを計測し,結果依存駆動を行う長時間のダイナミクスとの遷移を明らかにした。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:26:08 GMT)
The FFT Strikes Back: An Efficient Alternative to Self-Attention [0.0] 我々は、$mathcalO(nlog n)$時間でグローバルトークンの混合を実現するための適応スペクトルフィルタリングフレームワークであるFFTNetを紹介する。
学習可能なスペクトルフィルタとmodReLUアクティベーションは、従来の自己アテンションに対する厳密で適応的な代替手段を提供するために、サルエント周波数成分を動的に強調する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:06:23 GMT)
The Effect of Hop-count Modification Attack on Random Walk-based SLP Schemes Developed forWSNs: a Study [0.0] 我々は,アクティブアタックとパッシブアタックの両方からなる新しいハイブリッドアタックモデルを提案することによって,アクティブアタックの影響を理解することを試みる。
プライバシ指標のアルゴリズムの性能は、純粋な受動的攻撃や様々な強度のハイブリッド攻撃の場合と比較される。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:01:01 GMT)
The Causal-Effect Score in Data Management [0.0] 因果効果(英: Causal Effect, CE)は、観測結果に対する変数の因果影響の数値的な尺度である。
古典的および確率的データベースの文脈において、いわゆるCausal-Effect Scoreを導入し、検討する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:40:10 GMT)
Spin self-organization in an optical cavity facilitated by inhomogeneous broadening [0.0] 光キャビティに閉じ込められた駆動二層原子の熱アンサンブルにおける集合スピン自己組織化の開始について検討した。
不均一ドップラーの拡大はスピン自己組織化の開始を促進する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:51:57 GMT)
SegLocNet: Multimodal Localization Network for Autonomous Driving via Bird's-Eye-View Segmentation [0.0] SegLocNetはセマンティックセグメンテーションを用いて正確なローカライゼーションを実現するマルチモーダルフリーなローカライゼーションネットワークである。
本手法は,都市環境におけるエゴポーズを,一般化に頼ることなく正確に推定することができる。
私たちのコードと事前訓練されたモデルは公開されます。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:25:18 GMT)
Schwinger-Keldysh nonperturbative field theory of open quantum systems beyond the Markovian regime: Application to spin-boson and spin-chain-boson models [0.0] 我々は、任意の値 S の相互作用する多くの量子スピンを扱う場理論フレームワークを構築する。
我々のフレームワークは、非マルコフ系におけるスピンボソンの数値的正確なベンチマークを追跡する。
これは、量子コンピューティングや量子マグノニクスにおける駆動散逸系のシミュレーションのための有望なルートである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:36:00 GMT)
Safeguarding AI Agents: Developing and Analyzing Safety Architectures [0.0] 本稿では,人間チームと連携するAIシステムにおける安全対策の必要性について論じる。
我々は,AIエージェントシステムにおける安全プロトコルを強化する3つのフレームワークを提案し,評価する。
これらのフレームワークはAIエージェントシステムの安全性とセキュリティを大幅に強化することができると結論付けている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:26:17 GMT)
STROOBnet Optimization via GPU-Accelerated Proximal Recurrence Strategies [0.0] 本研究では,時空間レンジオブザーバ・オブザーバ・オブザーバ・バイパートイトネットワーク(STROOBnet)に着目した。
観測ノード(監視カメラなど)を定義された地理的領域内のイベントにリンクし、効率的な監視を可能にする。
ニューオーリンズのRTCC(Real-Time Crime Camera)システムとCFS(Calls for Service)のデータを用いて、ネットワークの初期観測不均衡に対処する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:53:24 GMT)
Retrieval Augmented Generation for Topic Modeling in Organizational Research: An Introduction with Empirical Demonstration [0.0] 本稿では,LLMを用いたトピックモデリング手法として,エージェント検索拡張生成(Agentic RAG)を提案する。
1) LLM の事前訓練された知識を超えた外部データへの自動アクセスを可能にする検索,(2) LLM の機能を利用してテキスト合成を行う生成,(3) エージェント駆動学習, 反復的に検索とクエリの定式化を行う。
本研究は,本手法がより効率的で解釈可能であり,同時に,従来の機械学習手法と比較して信頼性と妥当性が向上することを示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:25:11 GMT)
Resource Estimation for Delayed Choice Quantum Entanglement Based Sneakernet Networks Using Neutral Atom qLDPC Memories [0.0] 我々は、遅延チョイス量子エンタングルメントスワップを介して、ユーザを接続する中心的なパーティを備えた量子通信ネットワークを設計する。
この手法を従来の曲面符号と比較し、qLDPC符号が資源効率と論理量子ビット数において優れたスケーリングを提供することを示した。
短期的な到達可能なパッチサイズでは、中~高忠実度相関が達成でき、大規模商用量子ネットワークへの道を歩むことができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:39:30 GMT)
Reducing Reward Dependence in RL Through Adaptive Confidence Discounting [0.0] 環境状態における行動の価値の知識が低い場合にのみ報酬を要求できる新しい強化学習アルゴリズムを提供する。
高価な報酬への依存を減らすことで、報酬を得るための物流や費用が禁止されるような環境で、効率的に学習することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:58:21 GMT)
Quantum-aware Transformer model for state classification [0.0] 本稿では,データ駆動型ニューラルネットワークを用いた絡み合い分類手法を提案する。
我々のデータセットは、純粋な分離可能な状態、ヴェルナーの絡み合った状態、一般的な絡み合った状態、最大絡み合った状態を含む多様な二部体状態からなる。
本手法は,分離可能な状態と絡み合った状態とを効果的に区別し,ほぼ完全な分類精度を実現する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:56:48 GMT)
Quantum synchronization of twin limit-cycle oscillators [0.0] 古典的等価性を持つ量子リエナード系は、系が収束する2つの極限サイクルを特徴とする。
量子の場合、どちらの極限サイクルも1つの定常状態に共存する。
この明らかなパラドックス的な結果に光を当てるために、量子同期のより詳細な測度を導入する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:56:43 GMT)
Quantum reservoir computing on random regular graphs [0.0] 量子貯水池コンピューティング(QRC)は、入力駆動多体量子システムと古典的な学習技術を組み合わせた低複雑性学習パラダイムである。
我々は、情報局在化、動的量子相関、および乱れハミルトニアンの多体構造について研究する。
そこで本研究では、乱れたアナログ量子学習プラットフォームの最適設計のためのガイドラインを提供する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:12:01 GMT)
Quantum information elements in Quantum Gravity states and processes [0.0] 量子重力状態と過程の基本的特徴について論じ、関連する多くの量子重力形式に共通する。
エンタングルメントがトポロジカルな性質と幾何学的性質の種であり、また、量子因果性(quantum causality)の事前幾何学的、離散的な概念をどのように実装できるかを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:03:09 GMT)
Quantum group deformation of the Kittel--Shore model [0.0] キッテル=ショア(KS)ハミルトニアンは、同じ結合を持つ長距離相互作用を持つ$N$スピンを記述している。
本稿では、KSモデルの基底となる$mathfraksu(2)$ cogebra対称性を任意のスピンに対して示す。
KSハミルトニアン(q$-KSモデル)の量子変形は、対応する$mathfraksu_q(2)$量子群を用いて得られる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:31:53 GMT)
Quantum arrival times in free fall [0.0] 均一な重力場に質量$m$のガウス量子粒子を投下した場合、時間と位置の測定に関する不確実性は、Delta T_x Delta X_t geq frachbar2mgの関係で関連していることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:26:40 GMT)
Quantifying First-Order Markov Violations in Noisy Reinforcement Learning: A Causal Discovery Approach [0.0] 強化学習 (Reinforcement Learning, RL) 法は、それぞれの新しい観測が環境の状態を完全に反映していると仮定する。
実際には、部分的な可観測性やセンサ/アクチュエータノイズは、この仮定を無効にすることが多い。
本稿では,新しいマルコフ・ヴァイオレーションスコア(MVS)を用いて,このような違反を検出するための体系的手法を提案する。
MVSは、ノイズや不完全な状態情報がマルコフプロパティを乱すときに現れる多段階依存関係を測定する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:42:10 GMT)
Preconditioned Block Encodings for Quantum Linear Systems [0.0] Matrixプリコンディショニングは、プリコンディショナー$P$で$A$を乗算することで$kappa$を減らすための、確立された古典的テクニックである。
ブロック符号化のためのプリコンディショナと2つの符号化手法を検討する。
計算流体力学(Computational fluid Dynamics)の実用行列を用いて, サブ正規化因子と条件数$kappa$に対する影響を解析した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:08:14 GMT)
Photonic quantum information processing using the frequency continuous-variable of single photons [0.0] 有名なHong-Ou--Mandel効果は、2光子干渉計の豊かさを示している。
周波数工学的な2光子状態を用いて位相精度を向上する干渉計測手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:44:53 GMT)
Open-radiomics: A Collection of Standardized Datasets and a Technical Protocol for Reproducible Radiomics Machine Learning Pipelines [0.0] 我々は,3つのオープンソースデータセット,高次グリオーマ(HGG)と低次グリオーマ(LGG)の分類と生存分析のためのBraTS 2020に基づいて,大規模放射線学データセットをキュレートした。
脳腫瘍369例(GG76例,HG293例)に本プロトコルを適用した。
binWidthや画像正規化とは異なり,腫瘍の亜領域と画像の配列はモデルの性能に大きく影響した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 19:37:42 GMT)
On the Preservation of Africa's Cultural Heritage in the Age of Artificial Intelligence [0.0] 本論文は,口頭伝承からデジタル時代への知識の普及の過程を辿り,言語の重要性と文化の多様性を浮き彫りにしたものである。
また、デジタル技術が記憶、コミュニケーション、文化保存に与える影響を探求し、アフリカなどにおけるデジタル文化(デジタル文化ではなく)の文化を促進する必要性を強調している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:38:02 GMT)
Observation and mitigation of microwave echoes from dielectric defects in Josephson traveling wave amplifiers [0.0] Josephson-based Traveling Wave Parametric Amplifiers (JTWPA) は、量子限界に近い雑音を付加した記録帯域幅を示した。
本稿では,JTWPAが発するエコー信号の出現について報告する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:14:55 GMT)
Neuro-Symbolic Learning for Galois Groups: Unveiling Probabilistic Trends in Polynomials [0.0] 本稿では,ガロア群を既約群に分類するための神経象徴的アプローチを提案する。
ニューラルネットワークと記号的推論を組み合わせることで、精度と解釈可能性において純粋に数値的な手法より優れているモデルを開発する。
この研究は、予想や高次分類を含む計算代数学における将来の研究の道を開くものである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:42:57 GMT)
Multiscale autonomous forecasting of plasma systems' dynamics using neural networks [0.0] 本稿では,階層型マルチスケールニューラルネットワークアーキテクチャの自律プラズマ予測への応用を実証する。
ファインスケールネットワークは高速進化機能を正確に解決し、粗いスケールネットワークはより広い時間的コンテキストを提供する。
本研究により, 従来の単スケールネットワークよりも高い性能を示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:09:15 GMT)
Multimodal Learning for Just-In-Time Software Defect Prediction in Autonomous Driving Systems [0.0] 本稿では,マルチモーダル学習を用いた自律運転ソフトウェアシステムにおけるジャスト・イン・タイム・ソフトウェア欠陥予測(JIT-SDP)の新しい手法を提案する。
本研究は,自律運転ソフトウェアの信頼性と安全性を高めるためのマルチモーダル学習の可能性を明らかにするものである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 07:45:10 GMT)
Measuring and identifying factors of individuals' trust in Large Language Models [0.0] LLM(Large Language Models)は、人間のように見える会話の交換を行う。
LLMに対する個人の信頼度を測定する新しいフレームワークとして、TILLMI(Trust-In-LLMs Index)を紹介した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:16:34 GMT)
Lotus at SemEval-2025 Task 11: RoBERTa with Llama-3 Generated Explanations for Multi-Label Emotion Classification [0.0] 本稿では、Llama-3を用いて、あいまいな感情表現を明確化する説明コンテンツを生成するマルチラベル感情検出の新しいアプローチを提案する。
説明的文脈を取り入れることで、特に恐怖、喜び、悲しみなどの感情に対してF1スコアを改善し、テキストのみのモデルより優れる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:08:05 GMT)
Indoor Localization for Autonomous Robot Navigation [0.0] 本稿では,自律型ロボットの室内ナビゲーションにおける屋内位置決めシステム(IPS)の利用について検討する。
我々はA*経路計画アルゴリズムを開発し、ロボットが予測された方向をナビゲートできるようにした。
異なるネットワーク構造をテストした後、我々のロボットは、およそ50%の時間で角をナビゲートすることができた。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:25:04 GMT)
Improving error suppression with noise-aware decoding [0.0] 平均回路固有値サンプリング(ACES)は、フォールトトレラント量子計算に必要なスケールでデコーダを校正できるパウリノイズ特性化技術である。
我々は、ACESが高速に相関するデコーダを校正し、ノイズ認識復号を可能にすることを実証した。
その結果, 耐故障性超伝導量子コンピュータのデコーダの校正には, 数秒で行うノイズ特性化実験が十分であることが示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:39:41 GMT)
Improving Graph Neural Networks by Learning Continuous Edge Directions [0.0] グラフニューラルネットワーク(GNN)は、従来、非指向グラフ上の拡散に似たメッセージパッシング機構を採用している。
私たちのキーとなる洞察は、ファジィエッジ方向をグラフのエッジに割り当てることです。
ファジィエッジを持つグラフを学習するためのフレームワークとして,Continuous Edge Direction (CoED) GNNを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 20:41:51 GMT)
Imperfect preparation and Trojan attack on the phase modulator in the decoy-state BB84 protocol [0.0] 量子鍵分散(QKD)は、暗号鍵交換の理論的に安全な方法を提供する。
実践的な実装は、位相変調器に対するトロイの木馬攻撃のような脆弱性に直面している。
この研究は、理想的な状態準備シナリオと不完全な状態準備シナリオの両方を考慮して、このような攻撃下でのQKDシステムのセキュリティを分析する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:39:01 GMT)
Immunocto: a massive immune cell database auto-generated for histopathology [0.0] イムノクトは、6,848,454個のヒト細胞とオブジェクトを自動生成するデータベースです。
各セルに対して、64$times$64ピクセル、$mathbf40times$倍率で2$H&E画像と、核とラベルのバイナリマスクを提供する。
免疫細胞で訓練された深層学習モデルは、リンパ球検出のための最先端のパフォーマンスをもたらす。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:06:18 GMT)
Hybrid Quantum-Classical Optimisation of Traveling Salesperson Problem [0.0] トラベリングセールスパーソン問題(TSP)は基本的なNPハード最適化問題である。
量子最適化技術と古典的機械学習手法を統合するハイブリッド量子古典的手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:07:28 GMT)
How far can we go with ImageNet for Text-to-Image generation? [0.0] 最近のテキスト・ツー・イメージ(T2I)生成モデルは、数十億規模のデータセットのトレーニングによって、顕著な成果を上げている。
我々は、この確立されたパラダイムに挑戦し、大規模なWebスクラッドコレクションでトレーニングされたモデルに、小さくてよく計算されたデータセットの戦略的データ拡張が適合または優れることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:59:42 GMT)
How a Space-Time Singularity Helps Remove the Ultraviolet Divergence Problem [0.0] 量子ハミルトニアンにおける粒子生成用語は、通常紫外線の発散であり、数学的に不適切な定義である。
従来の論文では、このアプローチは非相対論的な状態にあることが示されていたが、粒子の生成は結局のところ相対論的な場合とほとんど関係がある。
我々は、内部有界条件に基づいて、特異点における粒子生成を伴うよく定義された自己随伴ハミルトニアンの存在を厳密に証明する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:12:10 GMT)
Hidden $sl(2)-$Symmetry of the Generalized Landau-Zener Vibronic Model [0.0] 一次元調和ビブロニックモデル(英: one-dimensional harmonic vibronic model)は、いわゆる線型ランダウ・ツェナーモデルの一般化である。
完全性のために、固有函数は位置空間においてBethe ansatz アプローチを介して得られる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:27:43 GMT)
Grover's search meets Ising models: a quantum algorithm for finding low-energy states [0.0] 本稿では,障害のあるIsingモデルのディジタル量子シミュレーションにおいて,Groverのアルゴリズムを実装する手法を提案する。
目的状態の位相反転を確実にすることで最適な進化時間を決定する。
この方法は古典的な方法に比べて2次的なスピードアップをもたらす。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:28:38 GMT)
Group Invariant Quantum Latin Squares [0.0] 量子ラテン正方形 (quantum Latin square) は単位ベクトルの$n 倍 n$ の配列であり、各行と列は固定された複素ベクトル空間の正則基底を形成する。
ここでは、$(G, G')$-不変量子ラテン正方形が存在することと、既約表現の次数の多重集合が$G$と$G'$に対して等しいことを示せる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:44:28 GMT)
Generating Clinically Realistic EHR Data via a Hierarchy- and Semantics-Guided Transformer [0.0] 生成過程の新たなフレームワークとして階層型・意味型変換器(HiSGT)を提案する。
HiSGTは、親子関係と臨床コード間の兄弟関係をエンコードする階層グラフを構築し、階層認識の埋め込みを導出するためにグラフニューラルネットワークを使用する。
MIMIC-IIIおよびMIMIC-IVデータセットの実験により、HiSGTは実際の患者記録と合成データの統計的アライメントを大幅に改善することが示された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:06:04 GMT)
Gauging tensor networks with belief propagation [0.0] 本稿では,信仰伝播を用いたテンソルネットワークのゲージ化アルゴリズムを提案する。
本研究では,この手法が既知のテンソルネットワークゲージ法と密接に関連していることを示す。
我々は,このアルゴリズムが既存のガウグアルゴリズムよりも高速であることを示す数値的証拠とスケーリング論を提示する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 16:47:01 GMT)
Forecasting Monthly Residential Natural Gas Demand Using Just-In-Time-Learning Modeling [0.0] 特に輸入契約について、トルコの今後のNGD(NGD)を正確に予測することが重要である。
2014年から2024年にかけての月間NGD消費データは、非サンプルの月間NGD予測を決定するために使用された。
提案手法はJust-in-Time-Learning-Gaussian Process Regression (JITL-GPR) と呼ばれ,従来のNG要求値に新しい特徴表現を用いる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 12:00:57 GMT)
Fine-tuning BERT with Bidirectional LSTM for Fine-grained Movie Reviews Sentiment Analysis [0.0] 映画レビューにおいて,Bidirectional LSTM (BiLSTM) を用いて事前学習したBERTモデルを微調整し,バイナリと微細なSAを両立させる。
本稿では,ベンチマークデータセットを用いた二項分類ときめ細かな分類について述べる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 03:30:48 GMT)
FINDER: Stochastic Mirroring of Noisy Quasi-Newton Search and Deep Network Training [0.0] 大規模設計空間上で定義される非滑らかでおそらくは非滑らかな目的関数に対する新しい次元を提案する。
FINDER (Derivative-free Evolutionary Recursion and Derivative-free filtering equations to reach a derivative-free update that has similar with the Newton)
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:35:38 GMT)
Enhancing Explainability with Multimodal Context Representations for Smarter Robots [0.0] 人間とロボットのインタラクションの鍵となる問題は、ロボットが音声や視覚などのマルチモーダル入力を効果的に知覚し、推論できるようにすることである。
本稿では,言語と視覚の融合を改善するために,コンテキスト表現のための汎用的で説明可能なマルチモーダルフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:36:47 GMT)
Energy-filtered excited states and real-time dynamics served in a contour integral [0.0] コーシー積分公式 (CIF) は、有限領域上の対角化可能作用素の正則函数を表現するために用いられる。
指数時間進化演算子のCIF形式に基づく新しいリアルタイム電子力学(RT-EOM-CCSD)アルゴリズムを紹介する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:58:57 GMT)
Direct Analysis of Zero-Noise Extrapolation: Polynomial Methods, Error Bounds, and Simultaneous Physical-Algorithmic Error Mitigation [0.0] ゼロノイズ外挿法(ゼロノイズ外挿法、ZNE)は、人工的に回路ノイズを増幅し、結果をノイズのない回路に外挿する量子誤差緩和法である。
本稿では、これらの課題を包括的に分析し、誤りを定量化するバイアスと分散を提示する。
本稿では,時間ステップサイズと雑音レベルを同時スケーリングすることで,回路とアルゴリズムの誤りを同時に軽減する手法を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 02:59:44 GMT)
Digital-Controlled Method of Conveyor-Belt Spin Shuttling in Silicon for Large-Scale Quantum Computation [0.0] シリコン系量子プロセッサのディジタル制御コンベアベルトシャットリング法を提案する。
スイッチ行列と低域通過フィルタを低温環境に配置することにより,直流電圧の限られた値から近正弦波波形を合成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:12:49 GMT)
Digital Doppelgangers: Ethical and Societal Implications of Pre-Mortem AI Clones [0.0] 生成型AIは、生物の行動、性格、知識を模倣するAI駆動のレプリカである、先史前のデジタルツインの作成を可能にした。
これらのデジタルドッペルガンガーは、生産性の向上、創造的なコラボレーションの実現、個人の正当性維持など、様々な機能を提供している。
しかし、その発展は批判的な倫理的、法的、社会的な関心を喚起する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:18:38 GMT)
Dichotomy in the effect of chaos on ergotropy [0.0] この研究は、2つの量子カオス系、量子キックトップと蹴られたイジングスピンチェーンにおけるエルゴトロピーを研究する。
以上の結果から, 量子カオスアシスト電池による作業抽出の可能性が示唆された。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:36:10 GMT)
Diagnosing COVID-19 Severity from Chest X-Ray Images Using ViT and CNN Architectures [0.0] 3つのソースをマージすることで、大規模なCOVID重症度データセットを作成します。
事前訓練されたDenseNet161モデルは3つの重大度予測問題において最善を尽くした。
平均絶対誤差は0.5676であり, 放射線技師が予測した重症度と比較すると最も高い回帰率を示した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:34:45 GMT)
Deep Learning of the Evolution Operator Enables Forecasting of Out-of-Training Dynamics in Chaotic Systems [0.0] カオスシステムのための深層学習エミュレータは,学習データに欠落する現象を予測できることを示す。
倉本・シヴァシンスキーおよびベータ平面乱流モデルを用いて,両システムの基本的な現象を推定し,エミュレータの評価を行った。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:07:18 GMT)
Dam Volume Prediction Model Development Using ML Algorithms [0.0] 南アフリカのロスコップダムのキーダム性能特性を予測するために,3つの機械学習回帰手法を適用した。
最良性能のアプローチは、高体積のランダム森林と低体積のリッジ回帰を組み合わせたしきい値に基づくブレンドモデルであった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 04:28:01 GMT)
Consistency Evaluation of News Article Summaries Generated by Large (and Small) Language Models [0.0] 大言語モデル (LLMs) は、流動的な抽象的な要約を生成することを約束しているが、ソーステキストに基づかない幻覚的な詳細を生成することができる。
本稿では,TextRank,BART,Mistral-7B-Instruct,OpenAI GPT-3.5-Turboなど,さまざまな手法を用いてテキスト要約の探索を行う。
XL-Sumデータセットでテストすると,すべての要約モデルが一貫した要約を生成することがわかった。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:58:17 GMT)
Collective Reasoning Among LLMs A Framework for Answer Validation Without Ground Truth [0.0] 本研究では,モデル間のコンセンサスによって応答信頼性が向上し,生成した質問の質を評価するためのプロキシとして機能することを示す。
本稿では、GPT-4-0125-preview、Meta-LLaMA-3-70B-Instruct、Claude-3-Opus、Gemini-1.5-Flashといった複数の大規模言語モデルを用いて、複雑なPhDレベルの確率問題の生成と応答を行う協調フレームワークを提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 06:20:52 GMT)
Clifford Strategies in Interactive Protocols are Classically Simulatable [0.0] 複雑性クラス $textClifford-MIPast$ を導入し、量子プロバーを Clifford 演算に制限する。
このモデルにおける戦略は古典的ランダム性共有プロバーによってシミュレートできることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 01:57:36 GMT)
Can Large Language Models Predict the Outcome of Judicial Decisions? [0.0] 大規模言語モデル(LLM)は自然言語処理(NLP)において例外的な機能を示す。
LLaMA-3.2-3B や LLaMA-3.1-8B を含む最先端のオープンソース LLM を様々な構成でベンチマークする。
本結果は,タスク固有のコンテキストにおいて,細調整された小型モデルが大規模モデルに匹敵する性能を実現することを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 18:27:21 GMT)
Can Bohmian mechanics be considered complete? [0.0] ド・ブロイ・ボーム理論(de Broglie Bohm theory)、あるいはパイロット波理論(pilot-wave theory)やブーム力学(bohmian mechanics)とも呼ばれる。
我々は、最も一般的な読解を評価し、より因果的かつ多元的なアプローチを擁護する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 08:49:34 GMT)
Broadband pulsed quadrature measurements with calorimeters [0.0] 一般的な1次元量子光学モードは、時間または周波数領域の形状によって記述される。
基本的な問題は、そのようなモードの二次作用素を測定することである。
パルスホモダイン検出はブロードバンドパルス(BBP)ホモダイン検出装置に一般化可能であることを示す。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:11:21 GMT)
Boundary-Emphasized Weight Maps for Distal Airway Segmentation [0.0] 境界に基づく重みマップと適応重み改善戦略を用いて境界保存を向上させる境界強調損失(BEL)を提案する。
ATM22とAIIB23で評価され、BELはベースライン損失関数より優れ、トポロジ関連メトリクスと同等の全体ベース尺度を達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:11:13 GMT)
Bound-state formation and thermalization within the Lindblad approach [0.0] リンドブラッド方程式は、開量子系の1つのアプローチとして、熱浴と接触する粒子の密度行列を記述する。
位置空間のリンドブラッド方程式は、ソースを持つ拡散対流方程式によって再構成可能であることを示す。
本研究では, 粒子のP"oschl-Teller-like電位によって実現された1次元温度条件下での熱浴と相互作用するバウンド状態の形成の可能性について述べる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:40:57 GMT)
Beyond Words: A Latent Memory Approach to Internal Reasoning in LLMs [0.0] 本研究では,暗黙的な心的表現を大規模言語モデルの内部推論プロセスに統合する枠組みを提案する。
予備実験は、インプリシットメモリモジュールを単純なGPTモデルに組み込むことで、最終トレーニング損失の35%から57%の削減が得られることを示している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 13:22:29 GMT)
BST: Badminton Stroke-type Transformer for Skeleton-based Action Recognition in Racket Sports [0.0] 本研究では,バドミントン放送の試合において,各選手のラケットスイングのフレームを抽出する新しいビデオセグメンテーション戦略を提案する。
本研究では,Badminton Stroke-type Transformer (BST)を提案する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:18:39 GMT)
Auxiliary-field quantum Monte Carlo method with quantum selected configuration interaction [0.0] 相無相補助場量子モンテカルロ(ph-AFQMC)における試行波関数として量子選択構成相互作用(QSCI)法により生成される波動関数を提案する。
我々はこの統合アプローチをQC-QSCI-AFQMC(略してQSCI-AFQMC)と呼ぶ。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:12:37 GMT)
Automated Evaluation of Meter and Rhyme in Russian Generative and Human-Authored Poetry [0.0] 我々は,ロシア語詩におけるストレスマーク配置のためのロシア語詩スキャンツールライブラリを紹介する。
RIFMA - 様々なジャンルや形式にまたがる詩の断片のデータセット。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:39:07 GMT)
Attend or Perish: Benchmarking Attention in Algorithmic Reasoning [0.0] 本稿では,無限入力領域の6つのタスクからなるアルゴリズムベンチマークを提案する。
これにより、(i)モデルが、新しい長さ、値範囲、入力領域を含む未知の入力に外挿する能力を評価するだけでなく、(ii)注目マップのレンズを通して、最近のモデルにおける機能的メカニズムの堅牢性を評価することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:50:38 GMT)
Are All Spanish Doctors Male? Evaluating Gender Bias in German Machine Translation [0.0] WinoMTDEは、ドイツの機械翻訳システムにおいて、仕事のステレオタイピングと表現不足を評価するために設計された新しい性別バイアス評価セットである。
このデータセットは、性別に関してバランスが取れた288のドイツ語文と、ドイツの労働統計を用いて注釈付けされたステレオタイプから構成されている。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:00:01 GMT)
An interpretation of the Brownian bridge as a physics-informed prior for the Poisson equation [0.0] ブラウン橋のガウス過程は、ポアソン方程式に先立って、柔らかく強化された物理学的に制約されたものとして見ることができる。
この接続により、逆問題の収束や振舞いなど、異なる理論的問題を探索することができる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 21:57:10 GMT)
Adversarial Combinatorial Semi-bandits with Graph Feedback [0.0] 時間的地平線上での最適後悔は、$widetildeTheta(SsqrtT+sqrtalpha ST)$としてスケールする。
重要な技術的要素は、負の相関を持つランダム決定ベクトルを用いて凸化作用を実現することである。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 00:20:14 GMT)
Adaptive Identification of Blurred Regions for Accurate Image Deblurring [0.0] ぼやけた領域を適応的に識別するネットワークであるAIBNetを提案する。
AIBNetは画像の劣化において優れた性能を達成する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 09:25:23 GMT)
A quantum walk inspired model for distributed computing on arbitrary graphs [0.0] 離散時間量子ウォークは、量子セルオートマトンの一粒子セクターとして知られている。
この研究は、量子セルオートマトンにインスパイアされた任意のグラフに対する分散計算モデルを導入する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:02:14 GMT)
A quantum speedup algorithm for TSP based on quantum dynamic programming with very few qubits [0.0] ゲート複雑性における初期状態として,N長ハミルトニアンサイクルの均一な重ね合わせ状態を生成する量子アルゴリズムを提案する。
理論的にはクエリの複雑さが低いが、実用的な実装ソリューションが欠如しているアルゴリズムと比較すると、本アルゴリズムは回路実装が可能である。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 05:56:03 GMT)
A proof that no-signalling implies microcausality in quantum field theory [0.0] 我々は(相対論的)量子論における基本的な性質の間のいくつかの論理的推論を研究する。
演算ノシグナリング条件は、量子力学の文脈で最初に導入された。
これは微小因果性とスピン統計定理の両方を意味することを証明している。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 11:57:47 GMT)
A Study of Superconducting Behavior in Ruthenium Thin Films [0.0] Rut(Ru)は次世代の電子配線の候補として期待されている。
Ruは1K未満の超伝導を示し、酸化に対する耐性、低い拡散率、小さな超伝導ギャップを持つ。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:34:44 GMT)
A Strategy for Proving the Strong Eigenstate Thermalization Hypothesis : Chaotic Systems and Holography [0.0] 強い固有状態熱化仮説(ETH)は、熱化と平衡に十分な条件を与える。
我々は、幅広いカオス理論に適用可能な強いETHの十分な条件を探求する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 14:59:29 GMT)
A Review on Generative AI For Text-To-Image and Image-To-Image Generation and Implications To Scientific Images [0.0] 本稿では、生成AIの範囲内でのテキスト・ツー・イメージ生成と画像・ツー・イメージ生成の最先端を概観する。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 15:30:55 GMT)
A Method of Selective Attention for Reservoir Based Agents [0.0] 層正規化のような既存のモジュールは、選択的な注意の一形態として働くように重量減衰で訓練することができる。
入力マスクの計算に多数のパラメータを加えると、より高速なトレーニングが得られるという驚くべき結果が得られます。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 17:00:19 GMT)
A Framework for Analyzing the Scalability of Ion Trap Geometries [0.0] ユーティリティスケールの量子情報プロセッサは、高速かつ高忠実なゲートで制御される数百万の量子ビットを必要とする。
重要なフィールド依存的なメリットの数字は、トラップ電位、ラジアルトラップ周波数、トラップ深さの調和性である。
このフレームワークは、トラップイオン量子情報処理のためのスケーラブルな電極ジオメトリの設計および実証における将来の研究に応用できる。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 22:06:34 GMT)
A Deep User Interface for Exploring LLaMa [0.0] 本稿では、トップp、周波数、プレゼンスペナルティを含むキーハイパーパラメータを対話的に制御するビジュアル分析駆動ツールを提案する。
ユーザスタディでは,視覚的デザインに対して好意的なフィードバックを受けたツールの有効性を評価した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 10:48:14 GMT)
1-Lipschitz Network Initialization for Certifiably Robust Classification Applications: A Decay Problem [0.0] 本稿では,SDPベースのLipschitz Layers(SLL)とAOL(AOL)の2つの標準1-Lipschitzネットワーク構造手法の重量パラメトリゼーションについて論じる。
重み分散は出力の分散分布に関係がなく、重み行列の次元のみが重要であることを実証した。
論文参考訳(メタデータ) (Fri, 28 Feb 2025 23:02:04 GMT)