Phi-4-Mini-Reasoning: Exploring the Limits of Small Reasoning Language Models in Math [135.1] CoT(Chain-of-Thought)は大規模言語モデル(LLM)の形式推論能力を著しく向上させる
しかし、Small Language Models (SLM) における推論の改善は、モデル能力が限られているため、依然として困難である。
本研究では,(1)多種多様な蒸留長CoTデータによる大規模中等教育,(2)高品質長CoTデータによる微調整,(3)厳格な選好データセットを活用したロールアウトDPO,(4)検証リワードを用いた強化学習(RL)の4段階からなるSLMの体系的トレーニングレシピを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 00:04:35 GMT)
Extracting and Transferring Abilities For Building Multi-lingual Ability-enhanced Large Language Models [105.0] 我々は,MAETと命名された多言語能力抽出と伝達手法を提案する。
我々のキーとなる考え方は、大きな言語モデルから言語に依存しない能力に関する重みを分解し抽出することである。
実験の結果,MAETは高度能力の抽出と伝達を効果的に行うことができることがわかった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:32:19 GMT)
SWE-smith: Scaling Data for Software Engineering Agents [100.3] SWE-smithは、大規模なソフトウェアエンジニアリングトレーニングデータを生成するための新しいパイプラインである。
128のGitHubリポジトリからソースされた50kインスタンスのデータセットを作成します。
我々はSWE-agent-LM-32Bをトレーニングし、SWE-bench Verifiedベンチマークで40.2%のPass@1リゾルバ率を達成した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:56:06 GMT)
Visual Text Processing: A Comprehensive Review and Unified Evaluation [99.6] 視覚テキスト処理における最近の進歩を包括的・多視点的に分析する。
本研究の目的は,視覚テキスト処理のダイナミックな分野における今後の探索と革新を促進する基礎資源として,本研究を確立することである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:19:29 GMT)
DDM: A Metric for Comparing 3D Shapes Using Directional Distance Fields [98.2] 既存の手法は主に2つのモデル間の対応を直接確立することに焦点を当てている。
本稿では,3次元幾何データに対する効率的,効率的,堅牢,かつ微分可能な距離測定法であるDDMを提案する。
一般的な距離計量として、DDMは3次元幾何モデリングの分野を前進させる可能性がある。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:55:37 GMT)
Can We Achieve Efficient Diffusion without Self-Attention? Distilling Self-Attention into Convolutions [94.2] 従来の自己アテンションモジュールをピラミッド畳み込みブロック((Delta)ConvBlocks)に置き換えるための(Delta)ConvFusionを提案する。
ローカライズされた畳み込み操作に注意パターンを蒸留し、他のコンポーネントを凍結させながら、(Delta)ConvFusionは、トランスフォーマーベースの処理に匹敵する性能を達成し、計算コストを6929$times$、LinFusionを5.42$times$の効率で上回る。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:57:28 GMT)
PPT: Pretraining with Pseudo-Labeled Trajectories for Motion Forecasting [90.5] 最先端のモーション予測モデルは、手動で注釈を付けたり、非常に後処理されたトラジェクトリを備えた、大規模なキュレートされたデータセットに依存している。
PWTはシンプルでスケーラブルな代替手段で、市販の3D検出器とトラッキングから自動生成される、未処理で多様な軌道を使用する。
標準ベンチマーク、特に低データのレシエーション、クロスドメイン、エンドツーエンド、マルチクラスの設定において、強力なパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:34:20 GMT)
AgiBot World Colosseo: A Large-scale Manipulation Platform for Scalable and Intelligent Embodied Systems [88.1] AgiBot Worldは、217のタスクにまたがる100万以上のトラジェクトリを5つのデプロイメントシナリオで構成した大規模なプラットフォームである。
AgiBot Worldは高品質で多様なデータ配信を保証する。
GO-1は、現実世界のデクスタラスタスクや長距離タスクにおいて例外的な能力を示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:18:40 GMT)
AdaR1: From Long-CoT to Hybrid-CoT via Bi-Level Adaptive Reasoning Optimization [86.6] 適応的で効率的な推論のための新しい2段階のフレームワークを提案する。
まず、長いCoTモデルと短いCoTモデルを組み合わせてハイブリッド推論モデルを構築する。
第二に、モデルに適切な推論スタイルを選択するための2段階の選好訓練を適用する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:01:45 GMT)
Stereo4D: Learning How Things Move in 3D from Internet Stereo Videos [76.1] 本稿では,インターネットの立体視,広角ビデオから高品質な4D再構成をマイニングするシステムを提案する。
本研究では,この手法を用いて世界整合型擬似3次元点雲の形で大規模データを生成する。
DUSt3Rの変種をトレーニングし、実世界の画像対から構造と3次元運動を予測することで、このデータの有用性を実証する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:59:59 GMT)
A Library for Learning Neural Operators [75.1] 我々は、演算子学習のためのオープンソースのPythonライブラリであるNeuralOperatorを紹介する。
ニューラルネットワークは有限次元ユークリッド空間の代わりに関数空間間の写像に一般化される。
PyTorch上に構築されたNeuralOperatorは、ニューラルオペレータモデルのトレーニングとデプロイのためのツールをすべて提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:23:25 GMT)
Microwave-Dressing of Rydberg States in a Trapped Calcium Ion [74.0] 単イオンを用い、主量子数 n=49 の多様体で分光的に観察する。
この結果は、ライドベルク状態の単一イオンとイオントラップの電場との相互作用を制御するために重要である。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 00:43:31 GMT)
AGHI-QA: A Subjective-Aligned Dataset and Metric for AI-Generated Human Images [58.9] 本稿では,人体画像の品質評価のための大規模ベンチマークAGHI-QAを紹介する。
データセットは、400の慎重に作成されたテキストプロンプトから生成される4,000の画像で構成され、10の最先端のT2Iモデルを使用している。
我々は,視覚的品質スコア,テキスト画像対応スコア,可視および歪んだ身体部分ラベルを含む多次元アノテーションの収集のために,体系的な主観的研究を行う。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:36:56 GMT)
Common3D: Self-Supervised Learning of 3D Morphable Models for Common Objects in Neural Feature Space [58.6] 3Dモデル(3DMM)は、オブジェクトカテゴリの形状や外観を表現する強力なツールである。
我々は,オブジェクト中心ビデオのコレクションから,オブジェクトの3DMMを自己管理的に学習する新しい手法であるCommon3Dを導入する。
Common3Dは、様々な視覚タスクをゼロショットで解くことができる最初の完全に自己教師された方法である。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:42:23 GMT)
BEVWorld: A Multimodal World Simulator for Autonomous Driving via Scene-Level BEV Latents [56.3] BEVWorldは,マルチモーダルセンサ入力を統一的でコンパクトなBird's Eye View潜在空間に変換し,全体的環境モデリングを行うフレームワークである。
提案する世界モデルは,多モードトークン化器と遅延BEVシーケンス拡散モデルという2つの主要成分から構成される。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:43:51 GMT)
Are Transformers Able to Reason by Connecting Separated Knowledge in Training Data? [55.9] 人間は、様々な情報源からの知識を統合することで、顕著な構成的推論を示す。
本稿では,このスキルを再現する上でのトランスフォーマーの可能性を検証するための合成学習タスクを提案する。
数発のChain-of-Thoughtプロンプトにより、TransformersはFTCT上でコンストラクショナル推論を行うことができる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:17:34 GMT)
Designing Control Barrier Function via Probabilistic Enumeration for Safe Reinforcement Learning Navigation [55.0] 本稿では,ニューラルネットワーク検証技術を利用して制御障壁関数(CBF)とポリシー修正機構の設計を行う階層型制御フレームワークを提案する。
提案手法は,安全なCBFベースの制御層を構築するために使用される,安全でない操作領域を特定するための確率的列挙に依存する。
これらの実験は、効率的なナビゲーション動作を維持しながら、安全でない動作を補正する提案手法の能力を実証するものである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:47:25 GMT)
Adapting In-Domain Few-Shot Segmentation to New Domains without Retraining [54.0] クロスドメイン小ショットセグメンテーション(CD-FSS)は、新しいドメインで新しいクラスのオブジェクトをセグメンテーションすることを目的としている。
多くのCD-FSSメソッドは、様々なドメイン一般化手法を用いて、ドメイン内FSSモデルを再設計し、再訓練する。
そこで,本研究では,FSSモデルを対象ドメインに適応させ,少数ショットラベル付きサポートサンプルからドメイン特性を学習する手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:16:33 GMT)
MF-LLM: Simulating Collective Decision Dynamics via a Mean-Field Large Language Model Framework [53.8] Mean-Field LLM (MF-LLM) フレームワークは、マイクロレベルの決定とマクロレベルの集団の間のフィードバックループを明示的にモデル化する。
MF-LLMは、個人状態とグループレベルの情報に基づいて個別の行動を生成するポリシーモデルと、人口分布を更新する平均フィールドモデルである。
実世界の社会データセット上でMF-LLMを評価し,非平均場ベースラインに対するKLの人口分布への分散を47%削減する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:41:51 GMT)
Bridging Personalization and Control in Scientific Personalized Search [53.7] 本研究では、パーソナライズされたランキングを積極的に制御できるパーソナライズされた検索モデルを提案する。
我々のモデルであるCtrlCEは、ユーザの過去のインタラクションから構築された編集可能なメモリを付加した、新しいクロスエンコーダモデルである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 19:36:59 GMT)
Between Underthinking and Overthinking: An Empirical Study of Reasoning Length and correctness in LLMs [52.4] 大規模な言語モデル(LLM)は、単純な問題を克服し、不要に長いアウトプットを生成し、より難しいものを過小評価する傾向にある。
これは、モデルが問題の難しさを誤認し、応答長を適切に調整できないことを示唆している。
実験の結果, 許容精度を維持しつつ, 生成時間を大幅に短縮できることがわかった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:48:06 GMT)
Q-function Decomposition with Intervention Semantics with Factored Action Spaces [51.0] 元の作用空間の低次元射影部分空間上で定義されるQ-函数を考察し、分解されたQ-函数の不偏性について考察する。
これにより、標準モデルフリー強化学習アルゴリズムにおいて、予測Q関数を用いてQ関数を近似する動作分解強化学習と呼ばれる一般的なスキームが導かれる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:26:51 GMT)
Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.3] LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。
本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。
最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 23:09:44 GMT)
An Empirical Study on the Effectiveness of Large Language Models for Binary Code Understanding [50.2] 本研究では,現実のリバースエンジニアリングシナリオにおけるLarge Language Models(LLM)の有効性を評価するためのベンチマークを提案する。
評価の結果、既存のLLMはバイナリコードをある程度理解でき、それによってバイナリコード解析の効率が向上することが明らかとなった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:02:06 GMT)
Arbitrary state creation via controlled measurement [49.5] このアルゴリズムは任意の$n$-qubit純量子重ね合わせ状態を生成し、精度は$m$-decimalsである。
このアルゴリズムは、1キュービット回転、アダマール変換、マルチキュービット制御によるC-NOT演算を使用する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:28:10 GMT)
Improving Informally Romanized Language Identification [49.4] ローマ化は、ヒンディー語やウルドゥー語など、文字の難易度に基づいて、通常容易に区別できる言語を表現している。
我々は、トレーニングセットを合成する手法を改善することにより、ロマライズされたテキストの言語識別(LID)精度を向上させる。
本研究では,Bhasha-Abhijnaanam 評価セットにおける20のIndic言語からのロマン化テキストに対して,最先端の LID 性能を示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:36:28 GMT)
Joint Modeling of Feature, Correspondence, and a Compressed Memory for Video Object Segmentation [47.7] 現在のオブジェクトビデオ参照メソッドは、抽出-then-matchingのパイプラインに従う。
本稿では,共同機能モデリング,対応,圧縮メモリのための統合VOSフレームワークであるJointFormerを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:19:18 GMT)
Emergence of a High-Dimensional Abstraction Phase in Language Transformers [47.6] 言語モデル (LM) は、言語コンテキストから出力トークンへのマッピングである。
我々は5つの事前学習されたトランスフォーマーベースLMと3つの入力データセットに対して、その解析、観察、高レベルの幾何学的アプローチをとる。
本結果は,多くの共通LMアーキテクチャにおいて,中心的な高次元位相がコア言語処理の基盤となることを示唆している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:06:00 GMT)
IDDM: Bridging Synthetic-to-Real Domain Gap from Physics-Guided Diffusion for Real-world Image Dehazing [46.2] 合成データセットでトレーニングされた現在のデータ駆動型デハージングアルゴリズムは、合成データでうまく機能するが、現実のシナリオに一般化するのに苦労する。
textbfImage textbfDehazing textbfDiffusion textbfModels (IDDM) を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:36:10 GMT)
Empirical Evaluation of Progressive Coding for Sparse Autoencoders [45.9] バニラSAEにおける辞書の重要性は権力法に従っていることを示す。
SAEは再建損失が低く,言語モデリング損失が回復したことを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 21:08:32 GMT)
Asymmetry of the Relative Entropy in the Regularization of Empirical Risk Minimization [45.9] 相対エントロピー非対称性の効果は、経験的リスク最小化の文脈で分析される。
良く理解されたタイプI ERM-RERとタイプII ERM-RERを比較することにより、エントロピー非対称性の影響が強調される。
その結果,Type-II正則化は経験的リスク関数の適切な変換を伴うType-I正則化と同値であることが示唆された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:37:00 GMT)
Eye2Eye: A Simple Approach for Monocular-to-Stereo Video Synthesis [45.6] ビデオ合成の進歩にもかかわらず、3Dビデオデータが比較的少ないため、3Dビデオを作成することは難しい。
本稿では,テキスト・ビデオ・ジェネレータをビデオ・ビデオ・ステレオ・ジェネレータに変換するための簡単な手法を提案する。
われわれのフレームワークは、動画フレームをシフトした視点から自動生成し、説得力のある3D効果を実現する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 19:06:09 GMT)
AnimalMotionCLIP: Embedding motion in CLIP for Animal Behavior Analysis [45.6] 本研究では,動作情報と効果的な時間的モデリング手法を統合することの課題を克服するために,AnimalMotionCLIPを提案する。
Animal Kingdomデータセットの実験では、AnimalMotionCLIPは最先端のアプローチよりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:26:37 GMT)
Insulin Resistance Prediction From Wearables and Routine Blood Biomarkers [44.7] われわれはインスリン抵抗性の研究のために、米国全土でこれまでで最大のデータセットをリモートで採用しました。
ディープニューラルネットワークモデルは、簡単に利用可能なデジタルバイオマーカーと血液バイオマーカーに基づいてインスリン抵抗を予測するために開発された。
モデルでは、肥満および妊娠中の被験者の93%の感度と95%の調整された特異性を示した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:10:20 GMT)
SDWPF: A Dataset for Spatial Dynamic Wind Power Forecasting Challenge at KDD Cup 2022 [44.3] 本稿では,一意な空間風力予測データセットであるSDWPFを提案する。
このデータセットは風力タービンの空間分布と動的文脈因子を含む。
このデータセットを使用して、Baidu KDD Cup 2022をローンチし、現在のWPFソリューションの限界を調べます。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:59:50 GMT)
CMD: Constraining Multimodal Distribution for Domain Adaptation in Stereo Matching [44.0] 教師なし領域適応のシナリオでは、ソフトアルグミンと滑らかなL1損失は、しばしばターゲット領域における多重モードの異性確率分布をもたらす。
本稿では,この問題に対処する新しいアプローチとして,CMD(Constrain Multi-modal Distribution)を提案する。
結果は、トップパフォーマンスモデルとドメイン適応型ステレオマッチングモデルの両方において、改良された一般化を一貫して示している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:23:48 GMT)
Always-Sparse Training by Growing Connections with Guided Stochastic Exploration [43.3] 本研究では,より大規模かつスペーサーなモデルへのスケーリングに優れる,効率的な常時スパーストレーニングアルゴリズムを提案する。
我々は,VGGモデルとVTモデルを用いて,CIFAR-10/100 と ImageNet の手法を評価し,様々なスペーサー化手法と比較した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:46:07 GMT)
20min-XD: A Comparable Corpus of Swiss News Articles [42.5] 20min-XD (20 Minuten cross-lingual document-level) は、フランスの新聞記事に匹敵する文書レベルのコーパスである。
私たちのデータセットは、2015年から2024年の間に15,000の記事ペアで構成され、セマンティックな類似性に基づいて自動的に一致します。
得られたデータセットは、近翻訳から緩やかな関連記事まで、多岐にわたる言語間類似性を示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:16:08 GMT)
WARP: An Efficient Engine for Multi-Vector Retrieval [42.1] WARPは、XTR目標で訓練された検索者の効率を大幅に改善する検索エンジンである。
本システムでは,XTRの参照実装を41倍に削減し,ColBERTv2/PLAIDエンジンの3倍の高速化を実現している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:28:56 GMT)
ObjectFinder: An Open-Vocabulary Assistive System for Interactive Object Search by Blind People [42.1] 視覚障害者による対話型オブジェクト検索のためのオープン語彙ウェアラブルシステムであるObjectFinderを提案する。
ObjectFinderでは、フレキシブルなワードでターゲットオブジェクトをクエリできる。
距離や方向を含む、エゴセントリックなローカライゼーション情報をリアルタイムで提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:42:40 GMT)
Learning 6-DoF Fine-grained Grasp Detection Based on Part Affordance Grounding [42.0] 本稿では,3次元部分レベルの可読性と把握能力学習を促進するために,言語誘導型SHape grAsPingデータを提案する。
ロボット認知の観点から、我々は2段階のきめ細かいロボット把握フレームワーク(LangPartGPD)を設計する。
我々の手法は、人間とロボットの協調と大規模言語モデル(LLM)の利点を組み合わせたものである。
提案手法は,3次元形状のきめ細かな接地,オブジェクトの空き度推定,および3次元部分認識把握タスクにおいて,競争性能を達成できることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:22:25 GMT)
Urban Computing in the Era of Large Language Models [41.5] 本稿では,大規模言語モデル(LLM)と都市コンピューティングの交わりについて検討する。
我々は,LLMの進化とコア技術について,簡潔に概説する。
我々は、交通、公共安全、環境モニタリングなど、主要都市領域にまたがる応用を調査する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:53:00 GMT)
AdaptMI: Adaptive Skill-based In-context Math Instruction for Small Language Models [41.2] In-context Learning (ICL) は、言語モデルに適切な情報を提供する際に、その問題解決能力を改善することができる。
最近の研究は、解決に必要なスキルを予測するために、フロンティアの大言語モデル(LLM)の能力を活用することで、ICLのパフォーマンスを向上できることを示している。
このスキルベースの戦略は、より大きなモデルでのICL性能を向上させるが、小型言語モデル(SLM)での利得は最小限である。
本稿では,SLMのためのスキルベースのテキスト内数学命令を選択するための適応的アプローチであるAdaptMIを紹介する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 19:35:46 GMT)
Padding Matters -- Exploring Function Detection in PE Files [41.2] 本稿では,Chromium と Conti を特徴とする Windows x86 と x64 PE ファイルの新しいデータセットである FuncPEval を紹介する。
我々は5つのランサムウェアと3つの機械学習ベースの関数開始検出ツールを評価した。
分析の結果、rev.ngを除く全てのテストツールがランダムなパディングに影響を受けやすいことがわかった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:15:09 GMT)
Automatic Mapping of AutomationML Files to Ontologies for Graph Queries and Validation [41.2] AutomationMLは、自動化ドメインにおけるオープンデータ交換フォーマットとして広く採用されている。
これは、マークアップ言語XMLに基づいたオープンでベンダー中立の標準である。
この記事では、AutomationML標準における概念の最新のオントロジーと、AutomationMLモデルを自動的にRDFトリプルに変換するマッピングを提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:34:56 GMT)
SeriesBench: A Benchmark for Narrative-Driven Drama Series Understanding [38.4] textbfSeriesBenchは、105個の注意深くキュレートされた物語駆動シリーズからなるベンチマークである。
そこで本研究では,手動のアノテーションを多様なタスク形式に変換するための,新しい長めの物語アノテーション手法とフル情報変換手法を導入する。
シリーズ内のプロット構造とキャラクタ関係を詳細に分析するためのモデルキャパシティをさらに向上するために,新しい物語推論フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:48:21 GMT)
A Survey of Interactive Generative Video [38.1] インタラクティブ・ジェネレーティブ・ビデオ(IGV)は、様々な領域にわたる高品質でインタラクティブなビデオコンテンツの需要の高まりに対応して、重要な技術として登場した。
1)ゲーム、IGVが仮想世界で無限に探索できるゲーム、2)AIの具体化、IGVは動的に進化するシーンとのマルチモーダルインタラクションにおいて、エージェントを訓練するための物理認識環境として機能する。
理想的なIGVシステムを,ジェネレーション,制御,メモリ,ダイナミクス,インテリジェンスという5つの重要なモジュールに分解する包括的フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:59:02 GMT)
Direct Motion Models for Assessing Generated Videos [38.0] ビデオ生成ビデオモデルの現在の制限は、可視的に見えるフレームを生成するが、動きが貧弱であることである。
ここでは、妥当な物体の相互作用と動きをよりよく測定する指標を開発することで、FVDを超えていく。
画素再構成や動作認識の代わりに点線を用いると、合成データの時間歪みに顕著に敏感な測定結果が得られることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 22:34:52 GMT)
On the Complexity of Finding Small Subgradients in Nonsmooth Optimization [37.3] 決定論的アルゴリズムにより次元自由度を達成できないことを示す。
関数が凸である場合に、$(delta,epsilon)$-定常点を見つける収束率をどのように改善できるかを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:27:35 GMT)
Real AI Agents with Fake Memories: Fatal Context Manipulation Attacks on Web3 Agents [36.5] 本稿では,ブロックチェーンベースの金融エコシステムにおけるAIエージェントの脆弱性を,現実のシナリオにおける敵対的脅威に曝露した場合に検討する。
我々は、保護されていないコンテキスト表面を利用する包括的攻撃ベクトルであるコンテキスト操作の概念を導入する。
これらの脆弱性を定量化するために、コンテキスト操作攻撃に対するAIエージェントの堅牢性を評価するWeb3ドメイン固有のベンチマークであるCrAIBenchを設計する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 20:40:47 GMT)
Using quantum annealing to generate test cases for cyber-physical systems [35.3] 本稿では,サイバー物理システムにおけるテストケース生成の高速化のための突然変異に基づく手法を提案する。
我々は、量子アニールを用いて、改善のためのテストケースの重要な領域を特定し、ターゲットにします。
我々のアプローチは、このプロセスをD-Waveの量子アニールを用いて解を見つけるアルゴリズムに機械化する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:20:58 GMT)
GenTorrent: Scaling Large Language Model Serving with An Overley Network [35.1] 本稿では,分散化コントリビュータの計算資源を活用するLLMサービスオーバーレイであるGenTorrentを提案する。
このような分散インフラストラクチャの実現に固有の4つの重要な研究課題を特定します。
この作業は、将来のAIサービス機能の民主化とスケーリングのための、新たな方向性の先駆者だと思います。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 21:24:19 GMT)
Preference-centric Bandits: Optimality of Mixtures and Regret-efficient Algorithms [34.9] 本稿では、予測に基づく評価から、選好基準(PM)と呼ばれる代替報酬の定式化へ移行するためのフレームワークを提案する。
PMは、異なる報酬の実現に望ましい重点を置くことができ、リスク回避、堅牢性、あるいは不確実性に対するその他の望ましい態度を含む、よりリッチな好みのモデリングを符号化することができる。
本稿ではPM中心のフレームワークを定式化し、2つのアルゴリズムクラスでミキシングを学習・追跡する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:59:34 GMT)
Introduction to Online Control [34.8] オンラインの非確率制御では、コスト関数と仮定された力学モデルからの摂動の両方が敵によって選択される。
目標は、ベンチマーククラスの政策から見て、最高の政策に対して低い後悔を得ることだ。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 22:23:18 GMT)
GDI-Bench: A Benchmark for General Document Intelligence with Vision and Reasoning Decoupling [34.7] 汎用ドキュメントインテリジェンスベンチマークは、9つの主要なシナリオと19のドキュメント固有のタスクにまたがる1.9kのイメージを備えている。
視覚的な複雑さと推論の複雑さを分離することにより、GDI-Benchは、困難によるパフォーマンス評価を可能にするタスクをグレードする。
本稿では,教師付き微調整過程における破滅的忘れの問題を緩和するGDIモデルを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:46:46 GMT)
High-Frequency Enhanced Hybrid Neural Representation for Video Compression [32.4] 本稿では,高周波拡張型ハイブリッドニューラル表現ネットワークを提案する。
本手法は,ネットワークによる細部合成を改善するために,高周波情報を活用することに焦点を当てている。
BunnyおよびUVGデータセットの実験は、我々の手法が他の手法よりも優れていることを示した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:50:26 GMT)
Galvatron: An Automatic Distributed System for Efficient Foundation Model Training [32.3] Galvatronは大規模ファンデーションモデルを効率的にトレーニングする分散システムである。
最適な並列戦略を選択する複雑さを克服し、最も効率的なハイブリッド戦略を自動的に識別する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:11:45 GMT)
Learning Universal User Representations Leveraging Cross-domain User Intent at Snapchat [32.3] 我々は、異なるアプリ内サーフェスにまたがってユニバーサルユーザモデリング(UUM)を行おうとしている。
ドメイン固有の表現を置き換える代わりに、UUM表現はドメイン間のトレンドをキャプチャする。
UUM埋め込みは、(i)ロングフォームビデオ埋め込みベースの検索に組み込まれており、(ii)ロングフォームビデオオープンレートの2.78%増加、(ii)ロングフォームビデオL2ランキングの19.2%増加、(iii)レンズL2ランキングの1.76%増加、(iv)通知L2ランキングの0.87%増加となっている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:48:43 GMT)
Revise, Reason, and Recognize: LLM-Based Emotion Recognition via Emotion-Specific Prompts and ASR Error Correction [31.7] 本研究では、音響学、言語学、心理学から感情固有の知識を取り入れた新しいプロンプトを提案する。
LLMトレーニングスキームの有用性を検討するために,文脈認識学習,文脈内学習,指導訓練の実験を行った。
本研究の目的は、感情認識および関連ドメインにおけるLLMの使用を改善することである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:26:38 GMT)
Responsive DNN Adaptation for Video Analytics against Environment Shift via Hierarchical Mobile-Cloud Collaborations [31.6] 既存のモデル適応フレームワークは、クラウド中心の方法で動作し、適応中に劣化したパフォーマンスを示し、環境シフトに対する遅延反応を示す。
本稿では,モバイルリソースとクラウドリソースの階層的協調による連続モデル適応の応答性を最適化する新しいフレームワークMOCHAを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:08:15 GMT)
SignLLM: Sign Language Production Large Language Models [31.6] 我々は多言語手話生成(SLP)大言語モデルであるSignLLMを提案する。
2つの新しいSLPモードMLSFとPrompt2LangGlossは、クエリテキスト入力と質問スタイルプロンプト入力から手話ジェスチャーを生成することができる。
我々はSignLLMを広範に評価し、8つの手話言語でSLPタスクの最先端性能を実現することを実証した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:19:25 GMT)
IP-CRR: Information Pursuit for Interpretable Classification of Chest Radiology Reports [31.4] 本稿では,放射線学レポートの分類のための解釈可能なフレームワークを提案する。
キーとなる考え方は、大量のレポートから最も情報性の高いクエリの集合を抽出し、これらのクエリとその対応する回答を使用して診断を予測することである。
提案手法の有効性を示すMIMIC-CXRデータセットの実験を行った。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 21:20:05 GMT)
Base Models Beat Aligned Models at Randomness and Creativity [31.0] ランダム数生成や混合戦略ゲーム(岩紙シッセ、隠れて探す)、創造的な文章など、予測不可能な出力を必要とするタスクについて検討する。
それぞれの場合、アライメントモデルは、例えば他の一様乱数よりも「7」を生成することを好むなど、異なる不利益をもたらす狭い振舞いに傾向する。
テストされたモデル全体では、一般的なベンチマークのパフォーマンス向上は、タスクのパフォーマンス低下と相関する傾向にあり、必要な能力の効果的なトレードオフが示唆されます。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:41:55 GMT)
High coherence fluxonium manufactured with a wafer-scale uniformity process [29.8] 約100%の収率を達成し、2インチウエハの均一性を維持できるジョセフソン接合の重なり過程を導入する。
この研究は、CMOS互換プロセスを用いたスケーラブルな高コヒーレンスフラクソニウムプロセッサの道を開いた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:21:38 GMT)
HoloTime: Taming Video Diffusion Models for Panoramic 4D Scene Generation [29.6] HoloTimeは、ビデオ拡散モデルを統合して、単一のプロンプトまたは参照イメージからパノラマビデオを生成するフレームワークである。
360Worldデータセットは、下流の4Dシーン再構築タスクに適したパノラマビデオの包括的なコレクションである。
パノラマアニメーションは、パノラマ画像を高品質のパノラマビデオに変換する2段階のイメージ・ツー・ビデオ拡散モデルである。
パノラマ空間時間再構成は、空間時間深度推定法を用いて、生成されたパノラマ映像を4次元の点雲に変換する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:55:28 GMT)
PixelHacker: Image Inpainting with Structural and Semantic Consistency [29.0] 塗り絵は画像編集と画像生成の基本的な研究領域である。
最近のSOTA(State-of-the-art)手法では、新しい注意機構、軽量アーキテクチャ、コンテキスト認識モデリングが研究されている。
我々は、潜在カテゴリガイダンスと呼ばれる単純だが効果的な塗装パラダイムを設計し、PixelHackerという拡散モデルを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:37:05 GMT)
Comparative Analysis of FPGA and GPU Performance for Machine Learning-Based Track Reconstruction at LHCb [28.6] 大型ハドロン衝突型加速器における光度と粒度の増加は、より効率的なデータ処理ソリューションの必要性を喚起している。
荷電粒子トラックのための有望なツールとして機械学習が登場した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:18:40 GMT)
Ditto: Motion-Space Diffusion for Controllable Realtime Talking Head Synthesis [27.4] Dittoは拡散型トーキングヘッドフレームワークで、きめ細かい制御とリアルタイム推論を可能にする。
我々は,Dittoが魅力的な音声ヘッドビデオを生成し,制御性とリアルタイム性能の両面で優位性を示すことを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:42:00 GMT)
TreeHop: Generate and Filter Next Query Embeddings Efficiently for Multi-hop Question Answering [27.4] TreeHopはマルチホップ質問応答のための埋め込みレベルのフレームワークである。
TreeHopはクエリの埋め込みを動的に更新する。
TreeHopは、知識集約型アプリケーションにデプロイするための、より速く、よりコスト効率の良いソリューションです。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:15:49 GMT)
Can We Trust Embodied Agents? Exploring Backdoor Attacks against Embodied LLM-based Decision-Making Systems [27.3] 大規模言語モデル(LLM)は、実世界のAI意思決定タスクにおいて大きな可能性を示している。
LLMは、固有の常識と推論能力を活用するために微調整され、特定の用途に適合する。
この微調整プロセスは、特に安全クリティカルなサイバー物理システムにおいて、かなりの安全性とセキュリティの脆弱性をもたらす。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:59:57 GMT)
Decision Making in Hybrid Environments: A Model Aggregation Approach [27.0] Foster、Xu、Zeeviによる最近の研究は、一般的なオンライン意思決定問題の複雑さを特徴づけている。
本稿では,ハイブリッド体制を特徴付けるDECの汎用拡張を提案する。
我々のフレームワークはフレキシブルなアルゴリズム設計につながり、学習者は仮説セットのサブセットについて学習する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:53:12 GMT)
MoBGS: Motion Deblurring Dynamic 3D Gaussian Splatting for Blurry Monocular Video [26.5] MoBGSは、ぼやけたモノクロビデオから端から端まで、シャープで高品質なビューを再構築する。
本稿では,Blur-Adaptive Latent Camera Estimation (BLCE)法を提案する。
また,大域カメラと局所物体の動きの連続的な劣化を確実にするためのLCEE法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:22:45 GMT)
Conditional independence testing with a single realization of a multivariate nonstationary nonlinear time series [26.2] 非定常非線形過程を単一実現した条件独立試験のための最初のフレームワークを紹介する。
主な技術要素は、時間変化の非線形回帰、時間変化の共分散推定、分布均一な強ガウス近似である。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:51:38 GMT)
From Events to Enhancement: A Survey on Event-Based Imaging Technologies [25.9] ダイナミックレンジと低レイテンシを提供するイベントカメラは、イメージングにおける破壊的な技術として出現している。
これらの利点を様々な画像処理タスクに活用する研究が増えているにもかかわらず、近年の進歩と課題に関する包括的な研究はいまだに不足している。
本調査ではまず,各種イベントセンサの物理モデルと特徴を基礎として紹介する。
次に、画像/映像強調タスクとイベントの進行と相互作用を強調した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 00:42:06 GMT)
Humanizing LLMs: A Survey of Psychological Measurements with Tools, Datasets, and Human-Agent Applications [25.4] 大規模言語モデル(LLM)は、人間中心のタスクでますます使われるようになっている。
彼らの心理的特徴を評価することは、彼らの社会的影響を理解し、信頼できるAIアライメントを確保するために不可欠である。
本研究は,LLMのより解釈しやすく,堅牢で,一般化可能な心理的アセスメントフレームワークを開発するための今後の方向性を提案することを目的とする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:09:40 GMT)
SignDiff: Diffusion Model for American Sign Language Production [24.9] 本稿では,手話話者を骨格ポーズから生成できるSignDiffという2条件拡散事前学習モデルを提案する。
また,テキスト入力からASL骨格ポーズビデオを生成する,ASLP(American Sign Language Production)の新たな手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 00:09:31 GMT)
LASHED: LLMs And Static Hardware Analysis for Early Detection of RTL Bugs [24.8] LASHEDは2つのアプローチ(LLMと静的解析)を組み合わせて、ハードウェアセキュリティバグ検出の限界を克服する。
推奨されたスキームによってフラグ付けされたインスタンスの87.5%が、CWE(Common Weaknessions)であることがわかった。
文脈内学習とモデルに"再考"を求めることで、LASHEDの精度が向上する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:15:53 GMT)
Leveraging Pre-trained Large Language Models with Refined Prompting for Online Task and Motion Planning [24.8] 本稿では,事前学習型大規模言語モデル (LLM) によって支援された閉ループタスク計画・実行システム LLM-PAS を提案する。
タスク実行時の異常条件に対するLLM-PASの有効性とロバスト性を示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:53:53 GMT)
Quantifying the Noise of Structural Perturbations on Graph Adversarial Attacks [24.6] グラフニューラルネットワークは、グラフ関連の課題を解決するために広く利用されている。
グラフ敵対攻撃に関する最近の研究は、現在のグラフニューラルネットワークが悪意のある攻撃に対して堅牢でないことを証明している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 01:46:37 GMT)
Venn: Resource Management for Collaborative Learning Jobs [24.6] コラボレーション学習(CL)は、機械学習(ML)と分散エッジデバイス間のデータサイエンスのための有望なアプローチとして登場した。
本稿では,複数のCLジョブ間で異種デバイスを効率的にスケジュールするCLリソースマネージャであるVennを紹介する。
評価の結果,最先端のCLリソースマネージャと比較して,Vennは平均JCTを最大1.88倍改善した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:21:01 GMT)
MSL: Not All Tokens Are What You Need for Tuning LLM as a Recommender [24.0] 提案するMasked Softmax Loss (MSL) は,大規模言語モデル (LLM) を推奨する。
MSLは、損失計算中に架空のアイテム記述につながる可能性のある無効トークンを識別し、マスクすることで、LMLを改善している。
4つの公開データセットで実施された大規模な実験は、MSLの有効性をさらに検証し、NDCG@10で平均42.24%の改善を達成した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:01:26 GMT)
MagicPortrait: Temporally Consistent Face Reenactment with 3D Geometric Guidance [23.7] 本稿では,3次元顔パラメトリックモデルを潜在拡散フレームワークに統合した映像顔再現法を提案する。
本手法は,3次元顔パラメトリックモデルを動作誘導として利用することにより,運転映像から捉えた動きと参照画像との顔の同一性のパラメトリックアライメントを可能にする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:30:46 GMT)
ColorEdit: Training-free Image-Guided Color editing with diffusion model [23.5] 画像編集タスクにはテキスト・ツー・イメージ(T2I)拡散モデルが採用されており、顕著な有効性を示している。
しかし, テキストプロンプトから, 物体のクロスアテンションマップと新たな色属性との衝突や注意漏れにより, テキスト誘導画像編集法では物体の色が変化しない可能性がある。
本稿では,物体の色を微調整や訓練を必要とせず,手軽で安定的で効果的な画像誘導手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:07:56 GMT)
Toward Automated Algorithm Design: A Survey and Practical Guide to Meta-Black-Box-Optimization [22.9] 進化計算(EC)コミュニティの新たな道としてメタブラックボックス最適化(MetaBBO)を導入する。
MetaBBOの成功にもかかわらず、現在の文献は主要な側面の要約が不十分であり、実装に関する実践的なガイダンスが欠如している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:28:22 GMT)
LongFuncEval: Measuring the effectiveness of long context models for function calling [22.8] ツールコール設定において,大規模言語モデルの長い文脈理解能力を包括的に研究するための最初の試みを行う。
ツール数の増加に伴い,パフォーマンス低下が7%から85%,ツール応答が長くなるにつれて回答検索が7%から91%,マルチターン会話が長くなるにつれて13%と40%の低下が見られた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:21:51 GMT)
Reinforced MLLM: A Survey on RL-Based Reasoning in Multimodal Large Language Models [22.8] 本調査は,RLに基づく多モーダル大言語モデルの推論の最近の進歩を体系的にレビューする。
我々は、RLの2つの主要なパラダイム、--value-free と value-based method を強調し、RLが推論能力をどのように強化するかを分析する。
ベンチマークデータセット、評価プロトコル、既存の制限について概観する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:14:28 GMT)
CodeFlowBench: A Multi-turn, Iterative Benchmark for Complex Code Generation [22.7] コードフローを実行するLLMの能力を総合的に評価するために設計された最初のベンチマークであるCodeFlowBenchを紹介する。
CodeFlowBenchは、Codeforcesから引き出された5258の問題で構成され、自動パイプラインを通じて継続的に更新される。
CodeFlowBenchではモデルの性能が悪く、反復的なコードフローのシナリオでは大幅にパフォーマンスが低下しています。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:45:28 GMT)
SageAttention: Accurate 8-Bit Attention for Plug-and-play Inference Acceleration [22.6] 本稿では,注目のための高効率かつ高精度な量子化手法であるSageAttentionを提案する。
このアプローチでは、さまざまなモデルにわたるエンドツーエンドのメトリクス損失はほとんどありません。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:31:29 GMT)
A Framework for Elastic Adaptation of User Multiple Intents in Sequential Recommendation [21.4] IMAと呼ばれる逐次的レコメンデーションにおけるユーザマルチインテント適応のための効果的なインクリメンタルラーニングフレームワークを提案する。
我々はIMAをElastic Multi-intent Adaptationフレームワークにアップグレードし、不活性なインテントを弾性的に取り除き、メモリ空間制限下でユーザインテントベクトルを圧縮する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:55:30 GMT)
FAST-Q: Fast-track Exploration with Adversarially Balanced State Representations for Counterfactual Action Estimation in Offline Reinforcement Learning [21.2] オンラインゲームにおけるレコメンデーションシステムのような高い利害関係の応用は、プレイヤーの心理によってさらに複雑になる。
現在のSOTA法は、既知の偽造行為をアウト・オブ・ディストリビューション(out-of-distribution)としてクリップすることで、そのようなオフラインデータからの学習を制限している。
FAST-Qは、グラディエント・リバーサル・ラーニング(Gradient Reversal Learning)を利用してバランスの取れた状態表現を構築する新しいアプローチを導入している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:32:40 GMT)
MoSAM: Motion-Guided Segment Anything Model with Spatial-Temporal Memory Selection [21.2] モデルにオブジェクトモーションキューを統合し、より信頼性の高い特徴記憶を確立するための2つの重要な戦略を組み込んだMoSAMを提案する。
MoSAMは、他の競合と比べて最先端の結果を達成する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:19:31 GMT)
CAE-DFKD: Bridging the Transferability Gap in Data-Free Knowledge Distillation [18.9] Data-Free Knowledge Distillation (DFKD) は、訓練済みの教師ネットワークから、実際の訓練データにアクセスすることなく、対象の学生モデルに知識を伝達することができる。
既存のDFKD法は主に関連するデータセットにおける画像認識性能の向上に重点を置いており、しばしば学習された表現の伝達可能性の重要な側面を無視する。
本稿では,データ-自由知識蒸留法(CAE-DFKD)を提案する。この手法は,モデル一般化を改善するための画像レベルの手法に依存するが,DFKDに直接適用した場合はフェールする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:58:02 GMT)
When Deep Learning Meets Information Retrieval-based Bug Localization: A Survey [18.7] 情報検索に基づくバグローカライゼーション(IRBL)はバグレポートに基づいてバグコードを特定する。
近年,深層学習(DL)の普及によりIRBLの顕著な成果が見られた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 19:30:28 GMT)
Lossless data compression by large models [18.7] 6G通信速度要件は、データ圧縮の革新的な新しいアイデアに対して、オープンな疑問を提起する。
大規模な言語モデル(LLM)は、これまで以上にデータをよりよく理解しています。
従来の圧縮アルゴリズムを全て破壊するLMCompressを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:11:38 GMT)
Are LLM-Judges Robust to Expressions of Uncertainty? Investigating the effect of Epistemic Markers on LLM-based Evaluation [18.6] 正直なところ、大きな言語モデル(LLM)を訓練する努力が増えている。
EMBERはLLM-judgesの頑健性を評価するためのベンチマークである。
EMBER を用いた評価の結果,GPT-4o を含む全ての LLM-judge 検査では,上皮マーカーの存在が顕著に欠如していることが判明した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 22:19:35 GMT)
Localizing Before Answering: A Benchmark for Grounded Medical Visual Question Answering [18.4] LMMのローカライズ能力とロバスト性を評価するためのベンチマークであるHEAL-MedVQAを紹介する。
そこで本研究では,LMMが関心のある対象領域をローカライズするためのLobA(Lobize-before-Answer)フレームワークを提案する。
実験の結果, HEAL-MedVQA ベンチマークでは, バイオメディカル LMM よりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:57:51 GMT)
Deep Learning Model Inversion Attacks and Defenses: A Comprehensive Survey [18.3] モデル反転(MI)攻撃は個人情報のプライバシーと完全性に重大な脅威をもたらす。
本調査は,MI攻撃と防衛戦略について,構造化された詳細な検討を行うことで,文献のギャップを埋めることを目的としている。
本調査と合わせて,MI攻撃・防衛研究を支援する総合リポジトリを開発した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:30:46 GMT)
You Name It, I Run It: An LLM Agent to Execute Tests of Arbitrary Projects [18.1] ExecutionAgentは、ソースコードから任意のプロジェクトを構築し、テストケースを実行するためのスクリプトを作成する自動テクニックである。
ExecutionAgentは、14の異なるプログラミング言語と多くの異なるビルドおよびテストツールを使用する50のオープンソースプロジェクトに適用します。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:25:22 GMT)
Algorithmic Collective Action with Two Collectives [18.0] 2つ以上の集団で集団行動を研究するための第1の枠組みを紹介する。
目的,戦略,規模,均一性が集団の有効性に与える影響について検討する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 21:39:06 GMT)
Talk Before You Retrieve: Agent-Led Discussions for Better RAG in Medical QA [17.8] 本稿では,医療質問応答システムを強化するためのプラグアンドプレイモジュールであるDisdisuss-RAGを提案する。
本手法では,多ターンブレインストーミングをエミュレートする医療専門家のチームを編成し,検索内容の関連性を向上する要約エージェントを提案する。
4つのベンチマーク医学QAデータセットによる実験結果から、DEC-RAGはMedRAGより一貫して優れていた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 01:37:44 GMT)
HeadEvolver: Text to Head Avatars via Expressive and Attribute-Preserving Mesh Deformation [17.6] 本稿では,テキストガイダンスからスタイリングされた頭部アバターを生成するための新しいフレームワークを提案する。
本手法は,面毎のヤコビアンによるメッシュ変形を表現し,学習可能なベクトル場を用いて局所変形を適応的に変調する。
我々のフレームワークは,テンプレートメッシュから保存した属性をシームレスに編集しながら,テキストでさらに編集できる現実的な形状やテクスチャを生成することができる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:06:06 GMT)
CoordField: Coordination Field for Agentic UAV Task Allocation In Low-altitude Urban Scenarios [17.5] 本稿では,複雑な都市環境下での不均一なUAV群をコーディネートするためのコーディネートフィールドエージェントシステムを提案する。
UAV動作とタスク選択を誘導するコーディネーションフィールド機構を提案し,創発的タスクの分散および適応的アロケーションを可能にする。
実験結果から, 動的変化に対するタスクカバレッジ, 応答時間, 適応性の観点から, より優れた性能が得られた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:02:45 GMT)
The Dual Power of Interpretable Token Embeddings: Jailbreaking Attacks and Defenses for Diffusion Model Unlearning [17.5] 拡散モデルは、特定のテキスト命令によって、有害なコンテンツを生成することができる。
この問題を未学習の有害な概念によって軽減するために、微調整のアプローチが開発されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:33:43 GMT)
Passive Measurement of Autonomic Arousal in Real-World Settings [17.5] 自律神経系(ANS)はストレス中に活性化される。
ANS活性は、心臓血管の健康、睡眠、免疫系、精神健康に悪影響を及ぼす可能性がある。
本稿では,広帯域の遠隔手首型センサによるANS活性化の連続的リモート計測手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 00:45:13 GMT)
Smoothed Analysis for Learning Concepts with Low Intrinsic Dimension [17.5] 教師付き学習の伝統的なモデルでは、学習者の目標は、あるクラスから最も適した概念の競争的($epsilon$以内)な仮説を出力することである。
学習者が最高の無知としか競合しないスムーズな分析フレームワークを導入する。
時間内に$k$-halfspacesの交点を前向きに学習する最初のアルゴリズムを得る。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 21:04:45 GMT)
Strong-to-weak spontaneous symmetry breaking meets average symmetry-protected topological order [17.4] これら2つの順序の非自明な拡張から生じる二重ASPT位相と呼ばれる新しい位相のクラスを提案する。
この新たなフェーズは以前の研究には欠落しており、従来の閉じたシステムには存在しない。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:17:41 GMT)
Black-Box Visual Prompt Engineering for Mitigating Object Hallucination in Large Vision Language Models [16.7] 大きな視覚言語モデル(LVLM)は、しばしばオブジェクト幻覚に悩まされ、その信頼性を損なう。
我々は,モデル内部へのアクセスを必要とせずにLVLM応答を向上させる最適なVPを特定するために,BBVPE(Black-Box Visual Prompt Engineering)を提案する。
提案手法では,候補となるVPのプールを用いて,与えられた入力画像に対して最も有効なVPを動的に選択するルータモデルを訓練する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:58:30 GMT)
Early Exit and Multi Stage Knowledge Distillation in VLMs for Video Summarization [16.7] DEEVISumは、セグメントワイズビデオ要約のための軽量で効率的でスケーラブルなビジョン言語モデルである。
DEEVISumはマルチステージ知識蒸留(MSKD)とEarly Exit(EE)を統合して、パフォーマンスと効率のバランスを取る。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:37:55 GMT)
Static or Dynamic: Towards Query-Adaptive Token Selection for Video Question Answering [16.7] 長いビデオから生成される大量のトークンは、メモリ効率とモデルパフォーマンスに対する課題を示す。
本稿では,要求条件に基づいて静的および動的情報を適応的に調整する新しいトークン選択戦略EXPLORE-THEN-SELECTを提案する。
提案するフレームワークは,様々なビデオ言語モデルにシームレスに統合可能なプラグイン・アンド・プレイである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:03:54 GMT)
3D Stylization via Large Reconstruction Model [16.5] 本研究では,大規模な画像生成モデルにおける注意機構を利用して視覚的スタイルを捕捉・伝達する2次元スタイリング手法の成功から着想を得た。
視覚的スタイルの画像からそのようなブロックに特徴を注入することにより、シンプルで効果的な3D外観スタイリング法を開発する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:46:32 GMT)
Unlocking User-oriented Pages: Intention-driven Black-box Scanner for Real-world Web Applications [16.2] Hoyenは、Large Language Modelを使ってユーザの意図を予測するブラックボックススキャナである。
Hoyenは、12の人気のあるオープンソースWebアプリケーションで厳格に評価され、6つの代表的なツールと比較されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:23:01 GMT)
Vision-Language Models Are Not Pragmatically Competent in Referring Expression Generation [16.2] Referring Expression Generation (REG)は、視覚言語システムの実用的能力を評価するための中核的なタスクである。
視覚言語モデル(VLM)の現在の評価は、しばしば実用的次元を見落としている。
本稿では,1.5k画像の新しいデータセット(RefOI)について述べる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 23:55:10 GMT)
Efficient and robust 3D blind harmonization for large domain gaps [16.1] 視覚障害者のための新しい3D調和フレームワークであるBlindHarmonyDiffを紹介する。
本フレームワークでは,対象の領域画像に基づいてトレーニングした3次元補正フローを用いて,エッジマップから元のイメージを再構成し,ソース領域画像のエッジから調和した画像を生成する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 19:00:58 GMT)
NGENT: Next-Generation AI Agents Must Integrate Multi-Domain Abilities to Achieve Artificial General Intelligence [15.8] 我々は、次世代AIエージェント(NGENT)が、人工知能(AGI)に進むために、ドメイン間の能力を統合するべきだと論じている。
将来のAIエージェントは、これらの特殊システムの強みを、テキスト、ビジョン、ロボット工学、強化学習、感情知性などにわたって操作できる統一されたフレームワークに合成するべきである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:46:14 GMT)
SoK: Security and Privacy Risks of Healthcare AI [15.7] 人工知能(AI)と機械学習(ML)を医療システムに統合することは、患者のケアを強化する大きな約束である。
しかし、機密データやシステムの完全性も、サイバー攻撃の可能性を秘めている。
ヘルスケアAIに関する現在のセキュリティとプライバシ(S&P)の研究は、ヘルスケアの展開シナリオと脅威モデルに関して非常に不均衡である。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 22:27:30 GMT)
Underwater Image Enhancement via Dehazing and Color Restoration [15.5] 既存の水中画像強調法は、ヘイズとカラーキャストを統一的な劣化過程として扱う。
本研究では,水中画像の品質向上を目的としたビジョントランス (ViT) ベースのネットワーク (WaterFormer と呼ぶ) を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:21:12 GMT)
A Survey on 3D Reconstruction Techniques in Plant Phenotyping: From Classical Methods to Neural Radiance Fields (NeRF), 3D Gaussian Splatting (3DGS), and Beyond [15.5] 植物形質転換は、植物形質とその環境との相互作用を理解する上で重要な役割を担っている。
3D再構成技術は、植物の形態や構造を詳細に把握するための強力なツールとして登場した。
本稿では,植物表現の3次元再構成技術について概説する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:04:23 GMT)
One Net to Rule Them All: Domain Randomization in Quadcopter Racing Across Different Platforms [14.8] この研究は、物理的に異なるクワッドコプターをまたいで一般化する、ドローンレースのための最初のニューラルネットワークコントローラを提示する。
ドメインランダム化で訓練された1つのネットワークが、様々なクワッドコプターを堅牢に制御できることを実証する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:44:41 GMT)
Why Compress What You Can Generate? When GPT-4o Generation Ushers in Image Compression Fields [14.8] AIGCファンデーションモデルは、コンパクトな記述子以上のものから複雑な構造ときめ細かい詳細を忠実に生成できるほど強力である。
OpenAIの最近のGPT-4o画像生成は、印象的なクロスモダリティ生成、編集、設計機能を実現している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:20:14 GMT)
Visual Encoders for Data-Efficient Imitation Learning in Modern Video Games [14.5] 事前学習したビジュアルエンコーダは、トレーニングコストを大幅に削減することで、ビデオゲームにおける意思決定研究をより容易にすることができることを示す。
この結果から,低解像度画像と数分のデモでは,エンドツーエンドのトレーニングが有効であることが示唆された。
実効的な意思決定を可能にすることに加えて,事前学習したエンコーダは,トレーニングコストを大幅に削減することで,ビデオゲームにおける意思決定研究をより容易に行えることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:44:55 GMT)
Anatomical Similarity as a New Metric to Evaluate Brain Generative Models [14.4] WASABI(Wasserstein-based Anatomical Brain Index)は、合成脳MRIの解剖学的リアリズムを評価するための新しい指標である。
WASABIは5つの生成モデルから得られた2つの実際のデータセットと合成MRIの実験に基づいて、解剖学的差異の定量化において高い感度を示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:16:14 GMT)
DyST-XL: Dynamic Layout Planning and Content Control for Compositional Text-to-Video Generation [14.3] DyST-XLは、フレーム認識制御により、既製のテキスト・ビデオモデルを強化するフレームワークである。
コードはhttps://github.com/XiaoBuL/DyST-XLで公開されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 01:00:18 GMT)
A Formal Framework for Understanding Length Generalization in Transformers [14.2] 因果変換器における長さ一般化を解析するための厳密な理論的枠組みを導入する。
我々は,この理論を,アルゴリズムおよび形式言語タスクにおける長さ一般化の成功と失敗の予測器として実験的に検証した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:01:01 GMT)
Exploring Acoustic Similarity in Emotional Speech and Music via Self-Supervised Representations [14.1] 音声や音楽からの感情認識は、その音響的重なり合いから類似性を共有しており、これらの領域間での知識の伝達に関心が持たれている。
本稿では,感情音声と音楽の音響的類似性を再考し,自己監督学習(SSL)モデルの階層的振る舞いの分析から始める。
最後に、Frechet音声距離を用いた感情音声と音楽の音響的類似性について検討し、音声と音楽のSSLモデルにおける感情バイアスの問題を明らかにする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:32:40 GMT)
Confidence in Large Language Model Evaluation: A Bayesian Approach to Limited-Sample Challenges [13.5] 本研究では,大規模言語モデル(LLM)能力評価のためのベイズ的アプローチを提案する。
モデル機能を潜時変数として扱い、キュレートされたクエリセットを利用して識別応答を誘導する。
GPTシリーズモデルを用いた実験により,提案手法は従来の評価手法よりも優れた識別性が得られることが示された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:24:50 GMT)
Sparse-to-Sparse Training of Diffusion Models [13.4] 本稿では,DMに対するスパース・ツー・スパーストレーニングのパラダイムを初めて紹介する。
我々は、無条件生成と6つのデータセットでスクラッチからスパースDMを訓練することに重点を置いている。
実験の結果,スパースDMはトレーニング可能なパラメータやFLOPの数を著しく減らしながら,相性が良く,性能も優れていることがわかった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:28:11 GMT)
FIM: Frequency-Aware Multi-View Interest Modeling for Local-Life Service Recommendation [13.4] 地域生活サービスレコメンデーションシステムにおけるユーザの定期行動のモデル化における主な課題は,1)ユーザの多様な要求が様々な周期性を示すこと,2)休日やプロモーションイベントなどの要因によってユーザの定期行動が動的に変化すること,である。
本稿では、ユーザの要求を異なる視点から分解し、様々な周期的意図を分離する周波数対応多視点関心モデリングフレームワーク(FIM)を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:51:20 GMT)
Iron Sharpens Iron: Defending Against Attacks in Machine-Generated Text Detection with Adversarial Training [13.2] 我々は、GREedy Adversary Promoted DefendER(GREATER)という、堅牢なMGT検出器をトレーニングするための対角的フレームワークを導入する。
テキスト摂動10戦略と6対逆攻撃による実験結果から, GREATER-DはSOTA防御法と比較して攻撃成功率(ASR)を0.67%削減することがわかった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 00:44:22 GMT)
Detecting and Mitigating Hateful Content in Multimodal Memes with Vision-Language Models [12.9] マルチモーダルミームは、個人やグループに対してヘイトスピーチを広めるために悪用されることがある。
ヘイトフルなミームを検出するための定義誘導プロンプト手法と、UnHateMemeという名前のミームにおけるヘイトフルなコンテンツを緩和するための統一的なフレームワークを提案する。
我々のフレームワークはビジョン・ランゲージ・モデルと統合されており、ヘイトフル・ミームを非ヘイトフル・フォームに変換する強力な能力を示している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 19:48:12 GMT)
IRL Dittos: Embodied Multimodal AI Agent Interactions in Open Spaces [12.9] In Real Life (IRL) Dittoは、オフィススペースを共有するリモート同僚を表現するために設計されたAI駆動の実施エージェントである。
IRL Dittoは、共有オフィススペース内の同僚間の相互作用や関係にどのように影響を与えるのか?
その結果,社会関係の強化は,IRL Dittoの源泉と参加者の関係の基盤に大きく依存していることが判明した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:16:32 GMT)
Fairness in Graph Learning Augmented with Machine Learning: A Survey [12.9] 機械学習技術を従来のグラフ学習モデルに拡張することで、さまざまな領域で顕著な成功を収めた。
本稿では,機械学習(GL-ML)を用いたグラフ学習がもたらす特異な公平性の課題を体系的に検討する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:02:23 GMT)
Enhancing New-item Fairness in Dynamic Recommender Systems [12.8] 新しいイテムは、新鮮で魅力的なユーザエクスペリエンスを提供するためのレコメンデータシステム(RS)において重要な役割を担います。
従来の方法では、露光時間と限られた相互作用記録のために、新しいイテムを効果的に推奨するのに苦労している。
本稿では, 強化学習(RL)を基盤とした, DRS用に特別に設計された新しいアイテムフェアネス向上フレームワークであるFairAgentを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:49:36 GMT)
The First Theoretical Approximation Guarantees for the Non-Dominated Sorting Genetic Algorithm III (NSGA-III) [12.7] N$が少なくとも参照点数$N_r$である場合、OneMinMaxベンチマークの最大空区間(MEI)インジケータによって測定される近似品質は、$lceilfrac(5-2sqrt2)nN_r-1rceil$よりも長い空区間がないことを示す。
これはNSGA-IIと連続生存選択の顕著な違いであり、個体数の増加は近似の質を向上させる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:49:42 GMT)
Uncertainty for SVBRDF Acquisition using Frequency Analysis [12.5] 本稿では,多視点撮影におけるSVBRDF取得の不確かさの定量化を目的とする。
本研究では,この曖昧さ,不確実性についてエントロピーを用いて検討し,周波数領域を用いて解析を高速化する。
その結果、オブジェクト全体の不確実性のマップをミリ秒以内で計算する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:42:25 GMT)
Mapping Trustworthiness in Large Language Models: A Bibliometric Analysis Bridging Theory to Practice [11.8] 大規模言語モデル(LLM)は、信頼性、透明性、公平性、倫理的整合性といった問題にまたがる信頼性に関する懸念を提起している。
本研究は,2019年から2025年までの2,006冊の書誌地図解析を行い,理論的議論と実践のギャップを埋めるものである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:04:55 GMT)
Garment3DGen: 3D Garment Stylization and Texture Generation [11.8] Garment3DGenは、単一の入力イメージをガイダンスとして与えられたベースメッシュから3Dの衣服資産を合成する新しい方法である。
画像から3Dへの拡散手法の最近の進歩を生かして, 3次元の衣服測地を創出する。
我々は、グローバルかつ局所的に一貫した高忠実なテクスチャマップを生成し、入力ガイダンスを忠実にキャプチャする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:22:19 GMT)
Round Trip Translation Defence against Large Language Model Jailbreaking Attacks [11.6] 本研究では,大規模言語モデルに対する社会工学的攻撃から守るために設計された,最初のアルゴリズムを提案する。
我々の防衛は、PAIR(Prompt Automatic Iterative Refinement)攻撃の70%以上を軽減できた。
また、MathsAttackを緩和し、攻撃成功率を約40%削減した最初の試みです。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:13:56 GMT)
VideoMultiAgents: A Multi-Agent Framework for Video Question Answering [11.5] Video Question Answering (VQA) は本質的にマルチモーダル推論に依存している。
本稿では,視覚,シーングラフ解析,テキスト処理などの特殊エージェントを統合するフレームワークであるVideoMultiAgentsを紹介する。
提案手法は, 対象, 行動, 時間的遷移をハイライトするキャプションを生成する, 質問誘導キャプション生成を補足する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:42:47 GMT)
Segmentation-Aware Generative Reinforcement Network (GRN) for Tissue Layer Segmentation in 3-D Ultrasound Images for Chronic Low-back Pain (cLBP) Assessment [11.5] 生成強化ネットワーク(GRN)と呼ばれる新しいセグメンテーション対応ジョイントトレーニングフレームワークについて紹介する。
GRNはセグメンテーション損失フィードバックを統合し、画像生成とセグメンテーションのパフォーマンスを1段階で最適化する。
サンプル効率学習用GRN(GRN-SEL)と半教師付き学習用GRN(GRN-SSL)の2種類も開発されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:19:58 GMT)
Canonicalization for Unreproducible Builds in Java [11.4] 再現可能なビルドの概念フレームワークを導入し,再現可能な中央からの大きなデータセットを分析し,再現不可能な6つの根本原因の新たな分類法を開発した。
再現不可能な12,283のアーティファクトに対して、9.48%から26.89%に成功を収めるツールであるChains-Rebuildを紹介します。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:17:54 GMT)
SAGE: A Framework of Precise Retrieval for RAG [9.9] Retrieval-augmented Generation (RAG) は,質問応答タスクの遂行に有意義な能力を示した。
RAGメソッドはセマンティクスを考慮せずにコーパスをセグメントし、関連するコンテキストを見つけるのが困難になる。
これらの制限を克服するために、RAGフレームワーク(SAGE)を導入します。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:32:52 GMT)
Mcity Data Engine: Iterative Model Improvement Through Open-Vocabulary Data Selection [9.9] 我々は、完全なデータベースの開発サイクルのためのモジュールを提供するMcity Data Engineを紹介します。
Mcity Data Engineは、オープン語彙データ選択プロセスを通じて、レアクラスと新しいクラスに焦点を当てている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:10:59 GMT)
The fundamental localization phases in quasiperiodic systems: A unified framework and exact results [9.8] 混乱した量子系は、拡張、局所化、臨界の3種類の量子状態を持つ。
基本アンダーソン相のすべての実現を統一するスピンフル準周期系に基づく統一的枠組みを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:45:19 GMT)
Improving Retrieval-Augmented Neural Machine Translation with Monolingual Data [9.7] 多くの設定では、ドメイン内のモノリンガルなターゲットサイドコーパスがしばしば利用可能である。
この研究は、対象言語に直接関連するセグメントを取得することによって、そのようなリソースを活用する方法を探究する。
2つのRANMTアーキテクチャを用いた実験では、まず、制御された環境で言語横断的な目的の利点を実演する。
次に,本手法を,対象のモノリンガルリソースが並列データの量よりはるかに多い実世界のセットアップに示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:41:03 GMT)
LabTOP: A Unified Model for Lab Test Outcome Prediction on Electronic Health Records [9.6] 本稿では,EHRデータに基づく言語モデリング手法を活用し,実験結果を予測する統一モデルであるLabTOPを提案する。
公開されている3つのEHRデータセット上でLabTOPを評価し、既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:54:58 GMT)
Data Augmentation as Free Lunch: Exploring the Test-Time Augmentation for Sequential Recommendation [9.6] 既存の方法は、モデルトレーニング中に新しいが効果的なデータを生成し、パフォーマンスを向上させる。
デプロイには、再トレーニング、アーキテクチャ修正、追加の学習可能なパラメータの導入が必要だ。
モデル推論中に入力を加算し、モデルが拡張したデータに対する予測を集約し、最終的な精度を向上させる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:43:41 GMT)
HOT3D: Hand and Object Tracking in 3D from Egocentric Multi-View Videos [9.5] データセットには833分(3.7M+画像)以上の記録があり、19人の被験者が33の多様な剛体物体と相互作用している。
記録には、エゴセントリックなマルチビューRGB/モノクロ画像、目視信号、シーンポイント雲、カメラ、手、オブジェクトの3Dポーズを含む複数の同期データストリームが含まれている。
実験では,3次元ハンドトラッキング,モデルベース6DoFオブジェクトポーズ推定,未知のインハンドオブジェクトの3次元持ち上げという3つの一般的なタスクに対して,マルチビュー・エゴセントリックデータの有効性を実証した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:32:06 GMT)
Efficient Conversational Search via Topical Locality in Dense Retrieval [9.4] 我々は、応答時間を改善するために、会話クエリに固有のトピックの局所性を利用する。
クエリの埋め込み類似性を活用することで,検索空間を意味的に関連するドキュメントクラスタに動的に制限する。
その結果,提案システムは複雑なマルチターンクエリを高い精度と効率で効果的に処理できることが示唆された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:56:34 GMT)
Mamba Based Feature Extraction And Adaptive Multilevel Feature Fusion For 3D Tumor Segmentation From Multi-modal Medical Image [9.0] マルチモーダルな3次元医用画像分割は、異なるモーダルの腫瘍領域を正確に同定することを目的としている。
従来の畳み込みニューラルネットワーク(CNN)ベースの手法は、グローバルな特徴を捉えるのに苦労する。
トランスフォーマーに基づく手法は,グローバルな文脈を効果的に捉えつつも,3次元医用画像のセグメンテーションにおいて高い計算コストに直面する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:29:55 GMT)
HateSieve: A Contrastive Learning Framework for Detecting and Segmenting Hateful Content in Multimodal Memes [9.0] textscHateSieveは、ミーム内の憎しみのある要素の検出とセグメンテーションを強化するために設計されたフレームワークである。
textscHateSieveは、セマンティックなペアのミームを生成するContrastive Meme Generatorを特徴としている。
Hateful Memeでの実証実験では、textscHateSieveはトレーニング可能なパラメータが少なく、既存のLMMを超えるだけでなく、ヘイトフルコンテンツを正確に識別し、分離するための堅牢なメカニズムを提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:30:36 GMT)
A general physics-constrained method for the modelling of equation's closure terms with sparse data [8.9] 複数の初期および境界条件から物理制約と異種データを統合した連続並列マルチネットワークアーキテクチャを提案する。
我々は、未知のクロージャ項を独立にモデル化し、様々な問題にまたがる一般化性を高めるために、専門的な作業を行っている。
これらの閉包モデルは正確な偏微分方程式(PDE)解法に統合され、工学的応用における複雑な予測シミュレーションに対する堅牢な解を可能にする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:41:18 GMT)
MeDSLIP: Medical Dual-Stream Language-Image Pre-training with Pathology-Anatomy Semantic Alignment [8.8] 本稿では,医療用デュアルストリーム言語-画像事前学習パイプラインであるMeDSLIPを提案する。
MeDSLIPは、病理学と解剖学的意味論を分離し、それらの関係をモデル化する。
胸部X線分析にMeDSLIPを適用し、4つのベンチマークデータセットを用いて包括的評価を行う。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:21:58 GMT)
UniBiomed: A Universal Foundation Model for Grounded Biomedical Image Interpretation [8.8] バイオメディカル画像解釈のための基礎モデルUniBiomedを紹介する。
UniBiomed は Multi-modal Large Language Model (MLLM) と Segment Anything Model (SAM) の新たな統合に基づいている
UniBiomedを開発するために、画像、アノテーション、テキスト記述を10つの画像モダリティで2700万以上含む大規模なデータセットをキュレートする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:51:48 GMT)
Hexcute: A Tile-based Programming Language with Automatic Layout and Task-Mapping Synthesis [8.7] Hexcuteはタイルベースのプログラミング言語で、共有メモリとレジスタの抽象化を公開し、混合型演算子のきめ細かい最適化を可能にする。
レイアウトとタスクマッピングの合成を、新しい型推論ベースのアルゴリズムで自動化する。
評価の結果,Hexcute は広い範囲の DL 演算子に一般化し,混合型演算子に対する既存の DL コンパイラよりも 1.7-11.28$times$ の高速化を実現し,エンドツーエンド評価では 2.91$times$ の高速化を実現している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:29:28 GMT)
Online Federation For Mixtures of Proprietary Agents with Black-Box Encoders [8.7] ほとんどの業界標準の生成AIとフィーチャーエンコーダはプロプライエタリであり、ブラックボックスアクセスのみを提供する。
我々の問題は自然に非競合的なゲーム理論レンズに結びつく。
オンライン環境におけるユニークなナッシュ均衡の存在を示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 23:19:37 GMT)
TRUST: An LLM-Based Dialogue System for Trauma Understanding and Structured Assessments [8.6] 本研究は,臨床症状を再現するLLMを用いた対話システムを開発することにより,メンタルヘルスアクセシビリティのギャップを埋めることを目的とする。
我々は、PTSDの正式な診断および評価を行うことができる協調LLMモジュールのフレームワークであるTRUSTを紹介する。
臨床医による時間と費用のかかる手動テストを置き換えるために,実生活の面接書に基づく患者シミュレーション手法を開発した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:58:06 GMT)
A comparative study of deep learning and ensemble learning to extend the horizon of traffic forecasting [8.6] 本稿では,大規模実世界の信号化動脈と高速道路交通流データセットの比較研究を行う。
我々は,1つのアンサンブルML手法,eXtreme Gradient Boosting (XGBoost) および様々なDeep Learning (DL) 手法を開発した。
時間埋め込みはこの文脈で特に効果的であり、30日間の予測でRNNがInformerを31.1%上回るのに役立っている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:31:21 GMT)
LEyes: A Lightweight Framework for Deep Learning-Based Eye Tracking using Synthetic Eye Images [8.5] 我々は、従来の手法とは異なり、ビデオベースのアイトラッキングに必要な重要な画像のみをモデル化する「ライトアイズ」または「リーズ」というフレームワークを提案する。
我々は、Leyesを用いて訓練されたモデルが、瞳孔やCRの局在の点から他の最先端アルゴリズムよりも一貫して優れていることを実証した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:43:45 GMT)
Clustering Internet Memes Through Template Matching and Multi-Dimensional Similarity [8.2] 類似のインターネットミームをクラスタ化することは、そのマルチモーダル性、文化的コンテキスト、適応性のために難しい。
既存のアプローチはデータベース、見落としのセマンティクスに依存しており、類似性の多様な次元を扱うのに苦労している。
本稿では,テンプレートベースのマッチングと多次元類似性特徴を用いた新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:25:30 GMT)
End-to-end Audio Deepfake Detection from RAW Waveforms: a RawNet-Based Approach with Cross-Dataset Evaluation [8.1] 生波形を直接操作するオーディオディープフェイク検出のためのエンドツーエンドのディープラーニングフレームワークを提案する。
我々のモデルであるRawNetLiteは、手作りの事前処理なしでスペクトルと時間の両方の特徴を捉えるために設計された軽量な畳み込み並列アーキテクチャである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:32:11 GMT)
Hoist with His Own Petard: Inducing Guardrails to Facilitate Denial-of-Service Attacks on Retrieval-Augmented Generation of LLMs [8.1] Retrieval-Augmented Generation (RAG)は、Large Language Models (LLM)を外部の知識ベースと統合し、新たなセキュリティリスクを導入しながら出力品質を改善する。
RAGの脆弱性に関する既存の研究は、典型的には不正な知識や悪意のあるテキストを注入する検索メカニズムの活用に重点を置いており、誤った出力を誘導している。
本稿では, LLM の安全ガードレールの脆弱性を明らかにする。LLM の安全ガードレールは保護のために設計されているが, 敵による攻撃ベクトルとして利用することもできる。この脆弱性に基づいて, 本脆弱性を生かして, ガードレールの可利用性を損なうために, リバース・オブ・サービス・アタックである MutedRAG を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:18:11 GMT)
A Domain-Agnostic Scalable AI Safety Ensuring Framework [8.1] AIの安全性に対する現在のアプローチは、通常、ドメイン固有の安全性条件に対処する。
我々は,AIシステムがユーザ定義制約に適合することを確実にする,新しいAI安全フレームワークを提案する。
様々な分野の実験を通して、我々のフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 22:06:09 GMT)
BiasGuard: A Reasoning-enhanced Bias Detection Tool For Large Language Models [8.0] フェアネス仕様を通じて入力と理由を明示的に分析する新しいバイアス検出ツールであるBiasGuardを紹介した。
BiasGuardは2段階のアプローチで実装されている。第1段階はフェアネス仕様に基づいてモデルを明示的に推論し、第2段階は強化学習を活用して推論と判断能力を向上する。
実験は5つのデータセットで行われ、BiasGuardが既存のツールより優れており、精度が向上し、過度な偏見が軽減されていることを実証した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:13:03 GMT)
RWKV-X: A Linear Complexity Hybrid Language Model [7.7] 我々は、短距離モデリングのためのRWKVの効率性と、長距離コンテキストをキャプチャするスパースアテンション機構を組み合わせた、新しいハイブリッドアーキテクチャであるtextbfRWKV-Xを紹介する。
RWKV-Xは,64Kパスキー検索ベンチマークにおいて,64K-tokenシーケンスで連続的に事前訓練された場合,ほぼ完全であることを示す。
これらの結果から、RWKV-Xは汎用言語モデリングのスケーラブルで効率的なバックボーンであり、100万個のトークンを安定な速度とメモリ使用量で復号できることを示した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:38:17 GMT)
A Generalized Meta Federated Learning Framework with Theoretical Convergence Guarantees [7.7] FL(Meta Federated Learning)はFLのパーソナライズされたバージョンであり、複数のエージェントが生データサンプルを交換することなく、最初の共有モデルのトレーニングに協力する。
任意の数$nu$の微調整ステップの後に、局所モデル上のエージェントの損失を最小化することにより、メタFLの一般化されたフレームワークを提案する。
実世界のデータセットを用いた実験により,提案手法の精度が向上し,より高速な収束が得られた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:29:46 GMT)
AdSight: Scalable and Accurate Quantification of User Attention in Multi-Slot Sponsored Search [7.7] 本稿では,マウスカーソルトラジェクトリを利用した,スケーラブルで正確なユーザ注意の定量化手法であるAdSightを紹介する。
AdSightはトランスフォーマーベースのシーケンシャル・ツー・シーケンスアーキテクチャを使用しており、エンコーダは軌道埋め込みを処理し、デコーダはスロット固有の機能を組み込む。
筆者らは,(1)固定時間とカウントの予測,(2)誤り分類という2つの機械学習タスクに対するアプローチを評価し,いくつかのスロットタイプが検出された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:51:26 GMT)
CountingDINO: A Training-free Pipeline for Class-Agnostic Counting using Unsupervised Backbones [7.7] CAC(Class-Agnostic counting)は、事前に定義されたカテゴリに制限されることなく、画像内のオブジェクト数を推定することを目的としている。
現在のCAC法はトレーニングのためにラベル付きデータに大きく依存している。
初となるCACフレームワークであるCountingDINOを紹介する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:44:22 GMT)
On the Efficacy of the Peeling Decoder for the Quantum Expander Code [7.5] 線形複雑性を持つ剥離デコーダとともに量子展開器符号を用いることを示す。
また,剥離操作後に適用可能な小セットフリップ復号法などの追加手法についても論じる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:54:49 GMT)
On the expressivity of deep Heaviside networks [7.4] ディープ・ヘビサイド・ネットワーク (DHN) は表現力に制限があるが, 接続をスキップするか, ニューロンを線形に活性化させることでこれを克服できることを示す。
Vapnik-Chervonenkis(VC)次元とこれらのネットワーククラスの近似率について下界と上界を提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:25:05 GMT)
Text-Conditioned Diffusion Model for High-Fidelity Korean Font Generation [7.3] 自動フォント生成(AFG)は、スタイルイメージのごく一部の例を使用して新しいフォントを作成するプロセスである。
本稿では,高品質で多様な韓国のフォント画像を生成する拡散型AFG手法を提案する。
鍵となる革新はテキストエンコーダで、音素表現を処理し、正確で文脈的に正しい文字を生成する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:24:49 GMT)
Nexus-Gen: A Unified Model for Image Understanding, Generation, and Editing [7.3] Nexus-Genは,多モーダル大言語モデルの言語推論能力を,拡散モデルの画像合成能力と相乗化する統一モデルである。
本稿では, 連続埋め込みではなく, 位置埋め込み型特殊トークンで入力シーケンスをプリフィルする自己回帰方式を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:30:48 GMT)
LLM-Empowered Embodied Agent for Memory-Augmented Task Planning in Household Robotics [7.3] 自律型家庭用オブジェクト管理のためのLLM駆動型エージェントオーケストレーションアーキテクチャを具現化したロボットシステムを提案する。
このシステムはメモリ拡張タスク計画を統合し、過去の動作を追跡しながらロボットがハイレベルなユーザーコマンドを実行できるようにする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:00:20 GMT)
Large Language Model Agent as a Mechanical Designer [7.1] 本研究では、FEMモジュールと協調して事前訓練された大規模言語モデル(LLM)を利用して、構造設計を自律的に生成、評価、洗練するフレームワークを提案する。
LLMはドメイン固有の微調整なしで動作し、設計候補を提案し、FEMから派生した性能指標を解釈し、構造的な音響修正を適用する。
NSGA-II (Non-Sorting Genetic Algorithm II) と比較して,本手法はより高速に収束し,より少ないFEM評価を実現する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:23:36 GMT)
From Lab to Wrist: Bridging Metabolic Monitoring and Consumer Wearables for Heart Rate and Oxygen Consumption Modeling [7.1] 当社では、コンシューマグレードのウェアラブルデータのみから、即時的な酸素消費トラジェクトリを予測できる最初のフレームワークとして、包括的なフレームワークを導入しています。
本手法では, 1 つの相補的生理モデルを用いて, 1 つの生理的制約付き常微分方程式(ODE)による心拍変動の正確なモデリングと, 300 万回以上の HR 観測に基づいて訓練されたニューラルカルマンフィルタを用いる。
提案手法は, 約13%の平均絶対誤差を達成し, 高速な生理的遷移と各種走行強度の定常条件を効果的に捉えた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:15:00 GMT)
Learning Heterogeneous Performance-Fairness Trade-offs in Federated Learning [6.7] HetPFL は Preference Smpling Adaptation (PSA) と Preference-aware Hypernet Fusion (PHF) から構成される。
We prove that HetPFL converges to the number of rounds, under weaker assumptions than existing method。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:25:02 GMT)
Orthogonal Factor-Based Biclustering Algorithm (BCBOF) for High-Dimensional Data and Its Application in Stock Trend Prediction [6.5] 従来のクラスタリングに基づくビクラスタリングアルゴリズムは、高次元データを処理する際に2つの基本的な制限に直面している。
本稿では,高次元データセットに対する直交因子に基づく二クラスタリングアルゴリズム(BCBOF)を提案する。
BCBOFは、高次元性に起因するデータ空間の問題を効果的に緩和した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:49:08 GMT)
Generative QoE Modeling: A Lightweight Approach for Telecom Networks [6.5] 本研究では,計算効率,解釈可能性,予測精度のバランスをとる軽量な生成モデリングフレームワークを提案する。
ベクトル量子化(VQ)を前処理技術として用いることにより、連続的なネットワーク機能は事実上離散的な分類記号に変換される。
このVQ-HMMパイプラインは、新しい未知のデータに対する確率的推論をサポートしながら、動的QoEパターンをキャプチャするモデルの能力を高める。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:19:37 GMT)
A Study on Group Decision Making Problem Based on Fuzzy Reasoning and Bayesian Networks [6.5] 本研究ではファジィ推論とベイズネットワークを統合したグループ意思決定システムを提案する。
ファジィルールベースは、しきい値、会員機能、エキスパートエクスペリエンス、ドメイン知識を組み合わせて構成される。
階層型ベイズネットワークが設計され、専門家が選択したノードを持つ有向非巡回グラフが特徴である。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:14:48 GMT)
Efficient self-consistent learning of gate set Pauli noise [6.3] ゲートセットパウリ雑音学習の課題について検討し、量子ゲートのセット、状態準備、測定はすべて、カスタマイズされたノイズアンサッツを備えた未知のパウリ雑音チャネルに悩まされる。
ゲートノイズに関する学習可能な情報はすべて、ノイズアンザッツに関する軽度な仮定の下で、相対的精度で学習可能であることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:10:21 GMT)
SAM4EM: Efficient memory-based two stage prompt-free segment anything model adapter for complex 3D neuroscience electron microscopy stacks [6.3] 我々は、電子顕微鏡(EM)データにおける複雑な神経構造の3次元分割のための新しいアプローチSAM4EMを提案する。
コントリビューションには、2段マスクデコードを用いたSAM用プロンプトフリーアダプタの開発が含まれている。
宇宙のプロセスとシナプスのセグメンテーションのためのユニークなベンチマークデータセットをリリースする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:38:02 GMT)
An Inversion Theorem for Buffered Linear Toeplitz (BLT) Matrices and Applications to Streaming Differential Privacy [5.9] 逆BLT行列のパラメータを計算するために,効率よく微分可能な$O(d3)$アルゴリズムを提案する。
我々の特徴は、自動微分によるプライバシー機構のBLTパラメータの直接最適化を可能にする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:14:09 GMT)
Efficient Domain-adaptive Continual Pretraining for the Process Industry in the German Language [5.9] ドメイン適応型連続事前訓練(ドメイン適応型連続事前訓練、DAPT)は、言語マスキング(英語版)などの事前訓練タスクにおいて、言語モデル(LM)をさらに訓練する最先端の技術である。
In-context Learning (ICL) と k-nearest neighbors (kNN) を利用して、ドメイン関連およびドメイン内テキストによるターゲットデータの拡張を行う。
以上の結果から,従来のDAPTよりも平均赤外域の3.5ポイント向上し,計算コストの約4倍の削減が期待できることがわかった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:13:15 GMT)
Conversations with AI Chatbots Increase Short-Term Vaccine Intentions But Do Not Outperform Standard Public Health Messaging [5.8] 大規模言語モデル(LLM)ベースのチャットボットは説得力のあるコミュニケーションにおける約束を示す。
このランダム化対照試験には、930人のワクチンヘシタント親が関与した。
自己申告されたワクチン接種意図(100ポイントスケールで7.1-10.3ポイント)は、メッセージが存在しないことに比べ、議論は著しく増加した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:22:51 GMT)
Adsorb-Agent: Autonomous Identification of Stable Adsorption Configurations via Large Language Model Agent [5.8] 本稿では,システム固有の安定な吸着構成を効率的に識別するLarge Language Model (LLM)エージェントであるAdsorb-Agentを紹介する。
徹底的なサンプリングへの依存を減らすことで、必要な初期設定の数を著しく削減する。
システム全体の35%で実際の世界最小値に近い低いエネルギーを達成し、従来の方法よりもはるかに少ない初期設定を必要とする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:05:27 GMT)
Characterizing AI Agents for Alignment and Governance [5.8] 本稿では,自律性,有効性,目標複雑性,汎用性という4つの側面に焦点を当てたAIエージェントの特性について述べる。
このフレームワークを使って、さまざまな種類のAIエージェントのための"エージェントプロファイル"を構築します。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:55:48 GMT)
Opioid Named Entity Recognition (ONER-2025) from Reddit [5.6] Redditのようなソーシャルメディアプラットフォームは、公共の認識、議論、オピオイドの使用に関する経験に関する洞察を提供する膨大な量の構造化されていないデータを提供している。
本研究では、自然言語処理(NLP)、特にOpioid Named Entity Recognition(ONER-2025)を活用して、これらのプラットフォームから実行可能な情報を抽出する。
まず、Redditからソースされたユニークな手動の注釈付きデータセットを作成し、ユーザーが異なる管理ルートを介してオピオイドの使用を自己報告した経験を共有する。
次に、ONER-2025データセットのラベル付けの課題を議論しながら、アノテーションプロセスとガイドラインを詳述する。
第三に、スラング、曖昧さ、断片化を含む重要な言語課題を分析する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 21:34:50 GMT)
PolyQROM: Orthogonal-Polynomial-Based Quantum Reduced-Order Model for Flow Field Analysis [5.6] 量子コンピューティングは流体流動シミュレーションの指数加速度を約束する。
量子符号化フローフィールドデータからフロー特徴を抽出するために必要な測定オーバーヘッドは、この利点を損なう。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:14:08 GMT)
Leveraging Motion Information for Better Self-Supervised Video Correspondence Learning [5.4] 我々は,効率的な自己教師型ビデオ対応学習フレームワークを開発した。
まず、ビデオ中の物体の動的動きをキャプチャーすることを強調するモーションエンハンスメントエンジンを設計する。
さらに,画素間対応情報に対するフレキシブルサンプリング戦略を導入する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:58:56 GMT)
Enhancing Self-Supervised Fine-Grained Video Object Tracking with Dynamic Memory Prediction [5.4] 本稿では,複数の参照フレームを用いた動的メモリ予測フレームワークを提案する。
提案アルゴリズムは,2つの細粒度ビデオオブジェクト追跡タスクにおいて,最先端の自己教師技術より優れる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:29:04 GMT)
Extended convexity and smoothness and their applications in deep learning [5.3] 本稿では,ディープラーニングにおける非滑らかな最適化のメカニズムを明らかにすることを目的とする。
解析の結果、勾配降下法(SGD)アルゴリズムは経験的リスクを効果的に最小化できることが示された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:16:13 GMT)
A Report on the llms evaluating the high school questions [5.3] 本報告は,高等学校理科の課題解決における大規模言語モデル(LLM)の性能評価を目的とする。
正確性、応答時間、論理的推論、創造性といった指標に基づいて総合的な評価を行った。
その結果, LLMは特定の面において優れた性能を発揮するが, 論理的推論や創造的問題解決にはまだ改善の余地があることが示唆された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:54:23 GMT)
Public Opinion and The Rise of Digital Minds: Perceived Risk, Trust, and Regulation Support [5.0] 本研究では,機関やAI技術に対する公的な信頼と,認識されるリスク,AI規制の形式的嗜好について検討する。
政府への信頼が高い人は規制を支持するが、AI企業やAI技術への信頼が高い人は規制を支持する傾向が低い。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:56:23 GMT)
SimPRIVE: a Simulation framework for Physical Robot Interaction with Virtual Environments [5.0] 本稿では,仮想環境との物理的相互作用をシミュレーションするSimPRIVEを提案する。
SimPRIVEを使用することで、ROS 2上で動作する任意の物理移動ロボットは、Unreal Engine 5グラフィックエンジンで構築された仮想世界でデジタルツインを動かせるように構成することができる。
このフレームワークは、AgileX Scout Miniローバーで障害物回避のためにトレーニングされた強化学習エージェントをテストすることで検証されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:22:55 GMT)
Whispers of Data: Unveiling Label Distributions in Federated Learning Through Virtual Client Simulation [4.8] Federated Learningは、データ共有を必要とせずに、地理的に分散した複数のクライアントにわたるグローバルモデルの協調トレーニングを可能にする。
推論攻撃、特にラベル推論攻撃の影響を受けやすい。
本稿では,様々なシナリオに対して安定かつ適応可能な新しいラベル分布推定攻撃を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:51:06 GMT)
Enhancing Security and Strengthening Defenses in Automated Short-Answer Grading Systems [4.8] 本研究は,変圧器を用いた医学教育における短期回答自動評価システムにおける脆弱性について検討する。
3種類のゲーム戦略がシステムの弱点を悪用し、偽陽性につながる可能性がある。
これらの脆弱性に対処するため、システムの堅牢性を高めるために、いくつかの敵の訓練手法を実装した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:53:09 GMT)
An Evaluation of a Visual Question Answering Strategy for Zero-shot Facial Expression Recognition in Still Images [4.6] 顔表情認識(FER)は、コンピュータビジョンと人間とコンピュータの相互作用において重要な研究領域である。
近年のディープラーニングの進歩にもかかわらず、特に新しいシナリオへの一般化には課題が続いている。
この問題に対処するため、コミュニティは最近、視覚的なタスクのためのLarge Language Modelsからの知識の統合を探り始めた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:38:05 GMT)
Enhancing Health Mention Classification Performance: A Study on Advancements in Parameter Efficient Tuning [4.6] HMC(Health Mention Classification)は、ソーシャルメディアの投稿をリアルタイムのトラッキングや公衆衛生モニタリングに活用する上で重要な役割を担っている。
我々は、バイオメディカル自然言語法(NLP)のパラメータを改良した従来の微調整により、より明確な言及が達成できると主張している。
本研究では,音声タグ情報の利用,PEFT技術の改良,その組み合わせなど,さまざまな手法について検討する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:21:54 GMT)
Wireless Communication as an Information Sensor for Multi-agent Cooperative Perception: A Survey [4.6] 協調認識は、V2X通信によるマルチエージェント情報共有を可能にすることにより、自動運転車の知覚能力を高める。
本調査では,情報表現,情報融合,大規模展開という3つの重要な側面に注目した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:23:57 GMT)
Probing the Quantum Capacitance of Rydberg Transitions of Surface Electrons on Liquid Helium via Microwave Frequency Modulation [4.6] 本稿では,液体ヘリウム上の表面電子のリドベルク転移に伴う量子容量を求める方法を提案する。
ライドバーグ転移の共鳴マイクロ波励起は、容量結合された電極上での画像電荷の再分配を誘導する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:37:34 GMT)
MultiMind: A Plug-in for the Implementation of Development Tasks Aided by AI Assistants [4.5] MultiMindは、AI支援開発タスクの作成を効率化するVisual Studioプラグインである。
ひとつはコードコメントの自動生成のためのもので、もうひとつはAIによるチャットの定義に関するものだ。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 01:54:49 GMT)
Consistency-aware Fake Videos Detection on Short Video Platforms [4.3] 本稿では,ショートビデオプラットフォーム上でのフェイクニュースの検出に焦点をあてる。
既存のアプローチは通常、分類層を適用する前に生のビデオデータとメタデータの入力を組み合わせる。
この知見に触発された本研究では,クロスモーダルな矛盾を明示的に識別し,活用する新たな検出パラダイムを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:26:04 GMT)
Scalable and modular generation of multipartite entangled states through memory-enhanced fusion [4.2] フォトニック・インターコネクトによる2つの多部交絡状態のメモリ拡張融合を実現する。
2つのリモート量子メモリモジュールで共有される4つのパーティのW状態の絡み合いを実演する。
マルチパートの絡み合った状態のスケーラブルな生成と融合は、大規模分散量子情報処理の実現への道を開く。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:53:09 GMT)
SustainDC: Benchmarking for Sustainable Data Center Control [4.2] データセンター(DC)のためのマルチエージェント強化学習(MARL)アルゴリズムをベンチマークするためのPython環境セットであるSustainDCを紹介する。
SustainDCは、ワークロードスケジューリング、冷却最適化、補助バッテリー管理などのカスタムDC構成とタスクをサポートする。
SustainDC上での各種MARLアルゴリズムの評価を行い, 各種DC設計, 位置, 気象条件, グリッドカーボン強度, 負荷負荷条件などを検討した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:01:16 GMT)
Inferring the Langevin Equation with Uncertainty via Bayesian Neural Networks [4.1] 本稿では、ベイズニューラルネットワークを用いてランゲヴィン方程式を過度に損傷された状態と過度に損傷された状態の両方で推定する包括的枠組みを提案する。
一つの値ではなく予測の分布を提供することで,予測の不確実性を評価することができる。
ニューロンモデルや顕微鏡エンジンを含む様々なシナリオに対してランゲヴィン方程式を推定する際のフレームワークの有効性を実証する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:08:49 GMT)
Learning Optimal Prompt Ensemble for Multi-source Visual Prompt Transfer [4.0] マルチソースプロンプト転送のための適応フレームワークであるHGPromptを提案する。
まず,情報理論による特徴の伝達性の評価手法を提案する。
そこで我々は,プロンプト間の勾配衝突を軽減するために,新しい勾配アライメント正規化を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:43:33 GMT)
In a Few Words: Comparing Weak Supervision and LLMs for Short Query Intent Classification [4.0] ユーザ意図の分類を,情報カテゴリ,ナビゲーションカテゴリ,トランザクションカテゴリに経験的に比較する。
以上の結果から,LSMはリコール時の監督能力が劣る一方で,精度の低下に悩まされ続けていることが示唆された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:54:04 GMT)
BCAT: A Block Causal Transformer for PDE Foundation Models for Fluid Dynamics [4.0] BCATは2次元流体力学問題に対する解の自動回帰予測のための基礎モデルである。
我々のアプローチはブロック因果アーキテクチャを用いて次のフレーム予測をモデル化し、画像生成法で一般的に使用されるサブフレームやピクセルベースの入力のみに頼るのではなく、以前のフレームをコンテキスト優先として活用する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:02:41 GMT)
Comparison of Different Deep Neural Network Models in the Cultural Heritage Domain [4.0] コンピュータビジョンの分野では2つのディープラーニングパラダイムが確立されている。
DenseNetは効率-計算可能性比の点で最高です。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:38:20 GMT)
The Planted Orthogonal Vectors Problem [4.0] 適度に選択された$p$に対して、d.$p$-biasedエントリを持つベクトル間で解を植え付ける方法を見つけ、植込みされた解が一意である。
我々の予想では、結果として生じる$k$-OVインスタンスは、解決する時間$nk-o(1)$を必要としている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 22:13:11 GMT)
First Order Logic with Fuzzy Semantics for Describing and Recognizing Nerves in Medical Images [4.0] 本稿では, 医用画像における繊維束, 特に神経の描写と認識について述べる。
解剖学の教科書に見られる神経の内在的に不正確な記述は、ファジィ意味論と一階述語論理を組み合わせて提案することにつながる。
解剖学的および拡散磁気共鳴画像からの神経の分画と認識のための空間的推論アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 20:41:04 GMT)
PANGAEA: A Global and Inclusive Benchmark for Geospatial Foundation Models [3.9] PANGAEAは標準化された評価プロトコルであり、さまざまなデータセット、タスク、解像度、センサーのモダリティ、時間性をカバーする。
我々は、このベンチマークで利用可能な最も人気のあるGFMを評価し、その性能を複数のドメインで分析する。
本研究は, GFMの限界を, 異なるシナリオ下で強調し, 教師付きモデルよりも常に優れていないことを示した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:17:21 GMT)
Does the Prompt-based Large Language Model Recognize Students' Demographics and Introduce Bias in Essay Scoring? [3.7] 大規模言語モデル (LLM) は自動エッセイ・スコーリング (AES) で広く使われている。
本研究は,学生の属性の予測力と評価課題における評価バイアスとの関係について検討した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:36:28 GMT)
AC-Lite : A Lightweight Image Captioning Model for Low-Resource Assamese Language [3.7] この研究は、低リソースのアサメ言語における画像キャプションのための計算効率の良いモデルであるAC-Liteを提示する。
ShuffleNetv2x1.5とGRUベースの言語デコーダの組み合わせと双線形アテンションは、最小限の計算で最高のパフォーマンスを提供する。
AC-Liteは2.45 GFLOPと22.87Mパラメータを持つCOCO-ACデータセットで82.3 CIDErスコアを達成した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:01:00 GMT)
Hypercontractivity for Quantum Erasure Channels via Variable Multipartite Log-Sobolev Inequality [3.7] 我々は、量子消去チャネルの産物に対して、ほぼ最適な超収縮不等式を証明した。
これは、固定状態を持たない量子チャネルに対して束縛された最初のテンソル化型超収縮率である。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:41:02 GMT)
A simple and effective approach for body part recognition on CT scans based on projection estimation [3.5] 本研究は, 身体領域同定のための3次元CTスキャンの2次元X線的推定に基づく, 単純かつ効果的なアプローチを提案する。
提案手法では,14個の異なる身体領域を識別するために推定された2次元画像を用いて,高品質な医療データセットの構築に有用な情報を提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:13:44 GMT)
Cascade Detector Analysis and Application to Biomedical Microscopy [3.5] 多解像度画像中のスパース物体を効率よく同定するためにカスケード検出器を用いる。
マルチレベル検出器は30~75%の時間で同等の性能を発揮することを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:58:30 GMT)
Estimation of discrete distributions in relative entropy, and the deviations of the missing mass [3.4] 我々は、相対エントロピーで測定された精度で、I.d.サンプルから有限アルファベット上の分布を推定する問題について検討する。
最適なリスク境界が知られているが、高い確率保証は十分に理解されていない。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:47:10 GMT)
Redundancy Analysis and Mitigation for Machine Learning-Based Process Monitoring of Additive Manufacturing [3.4] 過剰な冗長性は、機器コストの増加、モデル性能の損耗、高い計算要求をもたらす。
本稿では,MLに基づくAMプロセス監視における冗長性を定義し,それをサンプルレベル,特徴レベル,モデルレベルの冗長性に分類する。
データ登録やダウンスケール,モダリティ間の知識伝達,モデルプルーニングといった高度な手法を取り入れた,総合的マルチレベル冗長性緩和(MLRM)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:04:53 GMT)
Generative AI in Financial Institution: A Global Survey of Opportunities, Threats, and Regulation [3.4] ジェネレーティブ・人工知能(GenAI)は、グローバルな金融環境を急速に変えつつある。
この調査は、金融エコシステム全体でのGenAI採用の概要を提供する。
我々は、AI生成フィッシング、ディープフェイク対応詐欺、AIシステムに対する敵攻撃など、新たな脅威について議論する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:25:30 GMT)
Multi-view Structural Convolution Network for Domain-Invariant Point Cloud Recognition of Autonomous Vehicles [3.4] ドメイン不変点クラウド認識のためのマルチビュー構造畳み込みネットワーク(MSCN)。
MSCNは、ポイントクラウドから局所的なコンテキスト幾何学的特徴を抽出する構造畳み込み層(Structure Convolution Layers, SCL)から構成される。
MSCNは、ソースドメインポイントクラウドから派生した見えないドメインポイントクラウドでトレーニングすることで、機能表現を強化する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:17:09 GMT)
A Test Suite for Efficient Robustness Evaluation of Face Recognition Systems [3.4] RobFaceは、顔認識システムの堅牢性を評価するための効率的で使いやすい方法である。
これには、顔認識システムの堅牢性を包括的に評価するように設計された、転送可能な対向顔画像が含まれている。
私たちの知る限り、RobFaceはシステムに依存しない最初のロバストネス推定テストスイートです。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:27:08 GMT)
Enhanced Semi-Supervised Stamping Process Monitoring with Physically-Informed Feature Extraction [3.0] 本研究では、加速度計信号と物理情報を利用して、プロセス異常を効果的に捕捉する半教師付きプロセス内異常監視フレームワークを提案する。
提案フレームワークは,プロセス内状態をリアルタイムで監視し,バッチ異常を防止できる不均衡なサンプル分布をもつモニタリングモデルの構築を容易にする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:42:19 GMT)
A Unified Variational Framework for Quantum Excited States [2.9] 制約を克服する新しい変動原理を導入し、複数の低エネルギー励起状態のテキスト同時決定を可能にする。
様々な物理システムと変分アンサーゼにまたがって,この手法のパワーと汎用性を実証する。
全ての応用において、この手法は複数の最低エネルギーレベルとその対応する状態を正確に同時に取得する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:28:04 GMT)
vApps: Verifiable Applications at Internet Scale [2.9] 検証可能なアプリケーション(vApps)は、検証可能なコンピューティングアプリケーションの作成とデプロイを効率化するために設計された、新しい開発フレームワークである。
vAppsは、包括的なSDK内でRustベースのドメイン特化言語(DSL)を統一する。
これにより、多様なソフトウェアコンポーネントの確保に対する開発者の負担が軽減され、アプリケーションロジックに集中できるようになる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:34:34 GMT)
Investigating Opportunities for Growth and Increased Diversity in Quantum Information Science and Engineering Education in the U.S. based on an Analysis of the Current Educational Landscape [2.9] 量子情報科学・工学(QISE)は、幅広い分野において急速に関心を集めている。
初歩的なQISEコースを特徴づける努力が進行中であるが、米国全体のQISE教育に関する包括的理解はいまだに不足している。
本稿では、米国の高等教育におけるQISEコースと学位課程の現況を特徴づける取り組みの一環として、現在進行中の取り組みについて述べる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:18:01 GMT)
Security-by-Design at the Telco Edge with OSS: Challenges and Lessons Learned [2.9] 本稿では、産業R&Dプロジェクトにおいて、PON(Passive Optical Network)インフラストラクチャ上でエッジコンピューティングを行うプラットフォームであるGENIOをセキュアにし、オープンソースソフトウェア(OSS)をベースとした経験について述べる。
我々は、ハードニング、脆弱性管理、デジタルシグネチャ、静的および動的解析を通じて脅威と関連する緩和を識別する。
特に、OSSを用いてこれらの緩和を適用した際の教訓を報告し、これらのセキュリティソリューションの成熟度と限界に関する知見を産業的文脈で共有する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:27:09 GMT)
How to Construct Random Unitaries [2.8] 量子セキュアな片方向関数が存在すると仮定して、PRUが存在することを証明する。
本研究では,Haar-randomユニタリに対するクエリを量子コンピュータ上で効率的にシミュレートできることを証明した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:07:38 GMT)
Solving Copyright Infringement on Short Video Platforms: Novel Datasets and an Audio Restoration Deep Learning Pipeline [2.8] YouTube ShortsやTikTokのようなショートビデオプラットフォームは、著作権の遵守という大きな課題に直面している。
侵害者は、しばしば任意のバックグラウンド音楽(BGM)を、不明瞭なオリジナルサウンドトラック(OST)に埋め込む。
音楽音源分離(MSS)と相互モーダルビデオ音楽検索(CMVMR)を統合した新しいパイプラインを提案する。
提案手法は、任意のBGMを元のOSTから効果的に分離し、真のビデオオーディオトラックの復元を可能にする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:17:05 GMT)
Fine-Tuning LLMs for Low-Resource Dialect Translation: The Case of Lebanese [2.8] 本稿では,低リソースレバノン方言の翻訳におけるLarge Language Models(LLMs)の有効性について検討する。
我々は,オープンソースのAya23モデルを用いて,基本,コントラスト,文法ヒントチューニングの3つの微調整手法を比較した。
実験では、小さなが文化的に認識されているレバノンのデータセットに基づいて微調整されたモデルが、大規模で非ネイティブなデータでトレーニングされたモデルよりも一貫して優れていることが明らかになった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:33:53 GMT)
On-chip Frequency divider in superconducting quantum circuit [2.8] マイクロ波光子の周波数分割は、2つの量子過程からなる。
超伝導周波数分割器によって生成されたマイクロ波およびパルス信号は、超伝導量子ビットをポンプまたはリードアウトするために使用することができる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 01:28:11 GMT)
Optimizing Mouse Dynamics for User Authentication by Machine Learning: Addressing Data Sufficiency, Accuracy-Practicality Trade-off, and Model Performance Challenges [2.7] 本稿では,ApEn(Adroximate Entropy)を利用してセグメント長を最適化し,効率よく表現できるマウス認証ユニット(MAU)を提案する。
本研究では,局所時間マウス認証(LT-AMouse)フレームワークを設計し,局所特徴抽出のための1D-ResNetと長期時間依存性のモデリングのためのGRUを統合した。
我々のモデルは、DFLデータセットに対する盲点攻撃でAUC 98.52%、バラビットデータセットで94.65%を達成し、現在のソタのパフォーマンスを上回った。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:16:52 GMT)
A Unit Proofing Framework for Code-level Verification: A Research Agenda [2.7] 本稿では,方法論とツールの両面から,単体証明フレームワークの研究課題を提案する。
これにより、エンジニアはコードレベルの欠陥を早期に発見できる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:34:05 GMT)
BiPrompt-SAM: Enhancing Image Segmentation via Explicit Selection between Point and Text Prompts [2.7] BiPrompt-SAMは、新しいデュアルモーダルプロンプトセグメンテーションフレームワークである。
複雑なモデル修正なしに、空間的精度と意味的文脈を融合する。
これはEndovis17の医療データセット上で強力なゼロショットパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:42:34 GMT)
A Memetic Algorithm based on Variational Autoencoder for Black-Box Discrete Optimization with Epistasis among Parameters [2.7] ブラックボックス離散最適化(BB-DO)問題は、多くの現実世界のアプリケーションで発生する。
BB-DOの主な課題は、複数の変数を同時に修正しなければならないパラメータ間のエピスタシスである。
本稿では,VAEに基づくサンプリングと局所探索を組み合わせた新しいメメティックアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:56:22 GMT)
Explorations of the Softmax Space: Knowing When the Neural Network Doesn't Know [2.7] 本稿では,ニューラルネットワークの予測に対する信頼度を計測するための新しい手法を提案する。
高い精度でトレーニングされたネットワークは、信頼度が低いべき特定の出力を持つ可能性があると確認する。
精度評価において,全ての正しい予測に対する平均ソフトマックス出力として計算されたセントロイドのクラスタが適切なプロキシとして有効であることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:19:55 GMT)
Let Network Decide What to Learn: Symbolic Music Understanding Model Based on Large-scale Adversarial Pre-training [2.6] マスク言語モデル(MLM)は、自然言語処理(NLP)における人種差別差別のようなバイアス問題を導入するかもしれない
本稿では,ランダムマスキングではなく,マスカネットワークを介してマスクすべきものを適応的に決定する,SMU用Adversarial-MidiBERTを提案する。
提案手法は4つのSMUタスクにまたがって評価し,全てのケースにおいて優れた性能を示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:22:05 GMT)
Seasonal Prediction with Neural GCM and Simplified Boundary Forcings: Large-scale Atmospheric Variability and Tropical Cyclone Activity [2.6] 機械学習モデルは天気予報で成功し、気候シミュレーションの進歩を見せている。
本稿では,ML-物理ハイブリッド大気モデルであるNeuralGCMを用いて,大規模な大気変動と北半球熱帯サイクロン(TC)活動の季節予測を行った。
特に、北大西洋と東太平洋の流域におけるTC周波数の予測技術は、既存の物理モデルに匹敵する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 19:42:16 GMT)
A Preliminary Investigation on the Usage of Quantum Approximate Optimization Algorithms for Test Case Selection [2.2] この研究は、テストケースの選択に量子近似最適化アルゴリズム(QAOAs)の使用を想定している。
QAOAsは、ゲートベースの量子マシンのポテンシャルと、断熱進化の最適化能力とを融合する。
この結果から,QAOAsは効率面ではSelectQAに匹敵する性能を示しながら,ベースラインアルゴリズムよりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:10:50 GMT)
Gaussian process surrogate model to approximate power grid simulators -- An application to the certification of a congestion management controller [2.1] 電力グリッドのデジタル化により、物理方程式はネットワークの振舞いを記述するのに不十分になる。
多数のシナリオをシミュレートする安全性検証のような数値実験は、計算的に難解になる。
一般的な解決策は、シミュレータのサロゲートモデルを機械学習(ML)で学習し、高速で評価可能なサロゲートモデルで直接実験を実行することである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:29:06 GMT)
Safe and Efficient CAV Lane Changing using Decentralised Safety Shields [2.1] レーン変更はコネクテッド・アンド・オートマチック・ビークル(CAV)の複雑な意思決定問題である
我々は、最適化とルールに基づく安全保証アプローチを組み合わせた分散ハイブリッド安全シールド(HSS)を提案する。
本手法は,CAVの縦方向および横方向の制御入力を拘束するために制御障壁関数を適用し,安全な操作を確実にする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:11:09 GMT)
Bounds in Sequential Unambiguous Discrimination of Multiple Pure Quantum States [2.0] 純状態の集合の識別に適用した場合、逐次手法の性能境界を導出する。
これらの境界間のギャップは最小限であり、異なる状態の数と対数的にスケーリングする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:46:04 GMT)
Stable Trajectory Clustering: An Efficient Split and Merge Algorithm [1.9] クラスタリングアルゴリズムは、パターンを特定するために特徴によってデータポイントをグループ化する。
本稿ではDBSCAN線分クラスタリングに基づく全軌道クラスタリングとサブ軌道クラスタリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:11:36 GMT)
Capturing Quantum Snapshots from a Single Copy via Mid-Circuit Measurement and Dynamic Circuit [1.9] Quantum Snapshot with Dynamic Circuit (QSDC)は、量子スナップショットをキャプチャするハードウェアに依存しない学習駆動のフレームワークである。
本稿では、未知の量子状態の再構成のために古典的モデルを訓練する推測・検査手法を提案する。
本手法は,動的回路をサポートしたハードウェアを前提として,シングルコピー・中間回路状態再構成をサポートする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 01:18:21 GMT)
Optimized Homomorphic Permutation From New Permutation Decomposition Techniques [1.9] ホモモルフィックな置換は、バッチエンコーディングのホモモルフィック暗号に基づくプライバシ保存計算の基礎となる。
本稿では,同相置換を最適化する新しい分解手法を提案する。
従来の分解範囲から逸脱するネットワーク構造を設計し、最小回転鍵条件で最大1.69タイムの高速化で最先端技術より優れる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:00:36 GMT)
Is Intermediate Fusion All You Need for UAV-based Collaborative Perception? [1.9] 本稿では, LIF と呼ばれる, 遠隔期融合に基づくコミュニケーション効率の高い協調認識フレームワークを提案する。
視覚誘導型位置埋め込み(VPE)とボックスベースの仮想拡張機能(BoBEV)を活用し,様々なエージェントからの補完情報を効果的に統合する。
実験結果から,通信帯域を最小化して通信性能を向上し,その有効性と実用性を実証した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:22:14 GMT)
Exponential advantage in quantum sensing of correlated parameters [1.3] 量子センシングにおいて、ゴールは、決定論的であると仮定される1つ以上の未知のパラメータを推定することである。
量子センシングプロトコルの各ショットは、独立したランダムドローから得られる値を検出する。
エンタングルメントの使用は,分類や推定作業においてどのような効果があるかを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:39:30 GMT)
Homa at SemEval-2025 Task 5: Aligning Librarian Records with OntoAligner for Subject Tagging [1.3] 本稿では,SemEval-2025 Task 5: Subject TaggingのためのHomaについて述べる。
GND(Gemeinsame Normdatei)分類を用いて、TIBKATの技術的記録に主題ラベルを自動的に割り当てることに焦点を当てている。
提案手法では,対象のタグ付け問題をアライメントタスクとして定式化し,意味的類似性に基づいたカテゴリにレコードをマッチングする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:52:51 GMT)
Classical capacities under physical constraints: More capacity with less entanglement [1.2] 通信機器の最近の進歩は、量子チャネル上での古典的な情報伝達の調査を要求する。
符号化されたアンサンブルの平均エネルギーが有界であるとき、ノイズのない、ノイズの多い量子チャネルの古典的な容量に対する表現を提供する。
エネルギー制約のある状況下では、古典的量子ノイズチャネルは絡み合い支援下での能力向上を示すことができることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:41:38 GMT)
SoK: Enhancing Privacy-Preserving Software Development from a Developers' Perspective [1.2] このレビューは、開発者がプライバシ保護ソフトウェア開発を支援するための実証済みのソリューションを特定し、分析することを目的としている。
発見は、現在のプライバシ保護ソリューションを改善する研究者や、ソフトウェア開発にプライバシを埋め込む効果的な、検証済みのソリューションを探している実践者にとって、貴重な洞察を提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:38:48 GMT)
Balancing Interpretability and Flexibility in Modeling Diagnostic Trajectories with an Embedded Neural Hawkes Process Model [1.2] ホークス過程(HP)は、イベントシーケンスを自己強化ダイナミクスでモデル化するのに一般的に用いられる。
本稿では、イベント埋め込み空間において、ニューラルネットワークとしてインスタンス化されたフレキシブルなインパクトカーネルを定義することで、インパクト関数をモデル化する新しいHPを提案する。
このアプローチは従来のHPよりも柔軟だが、他のニューラルネットワークアプローチよりも解釈可能である。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:52:43 GMT)
A New Hybrid Quantum-Classical Algorithm for Solving the Unit Commitment Problem [1.1] 電力系統におけるユニットコミット問題に対するハイブリッド量子古典アルゴリズムを開発した。
電力負荷の時給を満たすため、発電ユニットを最適に割り当てながら、総コストを最小化することを目的としている。
選択時間に対するハイブリッド量子古典アルゴリズムの収束性は、IonQのForteシステムで証明されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 19:32:18 GMT)
A Comprehensive Study of Exploitable Patterns in Smart Contracts: From Vulnerability to Defense [1.1] スマートコントラクト内の脆弱性は、個々のアプリケーションのセキュリティを損なうだけでなく、より広範なブロックチェーンエコシステムに重大なリスクをもたらす。
本稿では,スマートコントラクトの重要なセキュリティリスク,特にSolidityで記述され,仮想マシン上で実行されるセキュリティリスクを包括的に分析する。
攻撃シナリオを複製し、効果的な対策を評価することにより、2つの一般的かつ重要なタイプ(冗長性と整数オーバーフロー)に焦点を当てる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:00:36 GMT)
Towards proactive self-adaptive AI for non-stationary environments with dataset shifts [1.1] 本稿では,AIパラメータの時間的・軌跡をモデル化する,プロアクティブな自己適応型AIアプローチを提案する。
この研究は、動的で非定常な環境に対する適応型AI研究の基礎を築いた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:09:59 GMT)
Wasserstein-Aitchison GAN for angular measures of multivariate extremes [1.0] 本稿では,Wasserstein-Aitchison Generative Adrial Networks (WA-GAN) を提案する。
WA-GANは将来の$d$次元多次元極端事象のシミュレーション値を提供する。
本手法は文献上の他の方法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:54:28 GMT)
MARIA: a Multimodal Transformer Model for Incomplete Healthcare Data [1.0] MARIAはトランスフォーマーベースのディープラーニングモデルであり、欠けているデータ問題に対処するために設計されている。
命令に依存する従来のアプローチとは異なり、MARIAはマスク付き自己注意機構を使用している。
MARIAは、さまざまなレベルのデータ不完全性に対するパフォーマンスとレジリエンスの観点から、既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:32:27 GMT)
Towards Improved Cervical Cancer Screening: Vision Transformer-Based Classification and Interpretability [1.0] EVA-02トランスモデルを用いた子宮頸癌検診のための新しい手法を提案する。
我々は、細調整EVA-02、特徴抽出、機械学習モデルによる重要な特徴の選択、新しい人工知能ニューラルネットワークのトレーニングという4段階のパイプラインを開発した。
ベストモデルではF1スコアの0.85227を達成し,ベースラインのEVA-02モデルを上回った。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:59:56 GMT)
Enhancing clinical decision support with physiological waveforms -- a multimodal benchmark in emergency care [1.0] 本稿では,救急医療におけるマルチモーダル意思決定支援を推進すべく,データセットとベンチマークプロトコルを提案する。
本モデルでは, 人口統計, バイオメトリックス, バイタルサイン, 検査値, 心電図(ECG)波形を入力として, 放電診断と患者の劣化の双方を予測する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 21:32:54 GMT)
Semiclassical Approach to Quantum Fisher Information [0.9] 量子カオス状態に駆動される量子センサーは、感度を劇的に向上させることができる。
我々は、位相空間解決量子フィッシャー情報(QFI)への直接的かつ効率的なアクセスを提供する、正確な半古典的アプローチを開発する。
この近似は、感覚パラメータに結びついた特定の動的量が対応する古典的時間進化の過程で大きなばらつきを示すとき、QFIが大きくなることを非常に具体的な言葉で示している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:31:50 GMT)
Adaptive Random Fourier Features Training Stabilized By Resampling With Applications in Image Regression [0.9] 浅層ニューラルネットワークのための適応型ランダムフーリエ(ARFF)訓練アルゴリズムを提案する。
本手法は, 粒子フィルタ型再サンプリング法を用いて, トレーニング過程を安定化し, パラメータ選択に対する感度を低下させる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:33:57 GMT)
Advancing Arabic Reverse Dictionary Systems: A Transformer-Based Approach with Dataset Construction Guidelines [0.9] 本研究では,アラビア語の自然言語処理における限界を,効果的なアラビア語逆辞書(RD)システムによって解決する。
幾何学的に減少する層を特徴とするセミエンコーダニューラルネットワークアーキテクチャを用いたトランスフォーマーに基づく新しいアプローチを提案する。
本手法は、包括的なデータセット構築プロセスを導入し、アラビア辞書定義の形式的品質基準を確立する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:56:36 GMT)
Filtering with Time-frequency Analysis: An Adaptive and Lightweight Model for Sequential Recommender Systems Based on Discrete Wavelet Transform [0.8] ユーザの興味を異なる周波数と時間で複数の信号に分解し、これらの信号の重みを自動的に学習するDWT方式の適応時間周波数フィルタを設計する。
また,適応時間周波数フィルタに基づく逐次レコメンデーションモデルDWTRecを開発した。
実験により,各領域,空間レベル,平均シーケンス長の異なるデータセットにおいて,我々のモデルが最先端のベースラインモデルより優れていることが示された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 04:04:16 GMT)
Towards Space Group Determination from EBSD Patterns: The Role of Deep Learning and High-throughput Dynamical Simulations [0.7] 深層学習法は、パターンを入力として、空間群対称性を分類することができる。
ニューラルネットワークは、背景修正EBSDパターンの空間群型を予測するために訓練された。
我々は,シミュレーションおよび実験データにおいて,90%以上の精度のスコアを得られたモデルを実現するためのレザベリング手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:36:31 GMT)
A Path to Quantum Simulations of Topological Phases: (2+1)D Wilson Fermions Coupled To U(1) Background Gauge Fields [0.7] 格子の定式化における鍵となる課題は、位相位相とチャーン・サイモンズ項の適切な実現である。
我々は、ハミルトニアン定式化において、$textU(1)$バックグラウンドゲージ場に結合したスタッガードおよびウィルソンフェルミオンを解析する。
我々の発見はハミルトンの定式化における既存の曖昧さを解決し、トポロジカル位相を持つゲージ理論の将来の量子シミュレーションの理論的基礎を提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:33:01 GMT)
Predicting clinical outcomes from patient care pathways represented with temporal knowledge graphs [0.7] 知識グラフデータ表現とその埋め込みは、いくつかの環境で競合するが、バイオメディカルな予測モデルにどのような関心があるのかは不明だ。
頭蓋内動脈瘤症例の人工的・現実的データをシミュレートし,臨床成績を予測するための課題について検討した。
本研究は,グラフ表現とグラフ畳み込みネットワーク(GCN)の埋め込みが観測データから予測タスクの最適性能に達することを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:52:56 GMT)
Discrete time crystals detected by time-translation twist [0.7] 量子系の動的位相を特徴付ける新しいプローブとして,時間変換によってねじれた境界条件を導入する。
平衡系のツイスト境界条件にインスパイアされたこのアプローチは、系の時間的進化を変化させる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:29:36 GMT)
Simulating quantum collision models with Hamiltonian simulations using early fault-tolerant quantum computers [0.7] 我々は、繰り返し相互作用スキームとしても知られる量子衝突モデルをシミュレートするランダム化量子アルゴリズムを開発した。
我々の手法は、初期のフォールトトレラント量子コンピュータにおけるマルコフ力学と非マルコフ力学の両方に量子衝突モデルを利用することができる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:09:54 GMT)
Low-rank computation of the posterior mean in Multi-Output Gaussian Processes [0.6] マルチアウトプットガウス過程(MOGP)と,MOGPの後方平均を効率的に計算するための低ランクアプローチについて考察する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:19:58 GMT)
On Advancements of the Forward-Forward Algorithm [0.6] Forward-Forwardアルゴリズムは機械学習の研究で進化し、現実のアプリケーションを模倣するより複雑なタスクに取り組んでいる。
この結果から,畳み込みチャネルグループ化,学習率スケジュール,独立したブロック構造を組み合わせることで,改善が達成できることが示唆された。
我々は、21$pm$6%の低いテストエラー率と164,706から754,386までのトレーニング可能なパラメータ数を達成できる、より軽量なモデルを提示した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:03:52 GMT)
Beyond Robertson-Schrödinger: A General Uncertainty Relation Unveiling Hidden Noncommutative Trade-offs [0.6] 我々はRobertson-Schr'odingerの不確実性関係の普遍的な強化を報告した。
2段階の量子系では、不等式は任意の状態と観測可能な一対の対に対して完全に等しいものとなる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 00:34:50 GMT)
REHEARSE-3D: A Multi-modal Emulated Rain Dataset for 3D Point Cloud De-raining [0.6] 我々は,3Dポイント・クラウド・デレイニングにおける研究の進展を促進するため,大規模で多モードの降雨データセットREHEARSE-3Dを新たにリリースした。
第一に、4D Radar点雲に富む高解像度のLiDARデータを持つ唯一のデータセットである。
We benchmark raindrop detection and removal in fused LiDAR and 4D Radar point clouds。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:43:38 GMT)
Low latency FPGA implementation of twisted Edward curve cryptography hardware accelerator over prime field [0.5] 本稿では,フィールドプログラマブルゲートアレイ(FPGA)に基づくモジュール演算,グループ演算,点乗算ユニットのハードウェア実装について述べる。
提案した点乗算モジュールは1.4ミリ秒の時間を消費し、最大クロック周波数は117.8MHzである。
このアーキテクチャは、高速無線通信ネットワークにおける高速なデータ暗号化の候補となるだろう。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:03:36 GMT)
BERSting at the Screams: A Benchmark for Distanced, Emotional and Shouted Speech Recognition [0.5] 本稿では,B(asic) E(motion) R(andom phrase) S(hou)t(s) (BERSt) データセットを提案する。
データセットには、地域のアクセントと非ネイティブアクセントの異なる98人のアクターから約4時間の英会話が含まれている。
ASRタスクとSERタスクの初期ベンチマークを行い、ASRは距離とシャウトレベルの増大とともに劣化し、意図した感情に応じて様々なパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:08:14 GMT)
Multiview Point Cloud Registration via Optimization in an Autoencoder Latent Space [0.5] ポイントクラウドの剛性登録は、3Dコンピュータビジョンの基本的な問題である。
多数のビューを効率的に処理できるマルチビュー登録方式であるPOLARを導入する。
提案手法は, 合成データおよび実データに対する最先端手法を著しく上回っている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:42:38 GMT)
Attention-enabled Explainable AI for Bladder Cancer Recurrence Prediction [0.4] 非浸潤性膀胱癌 (NMIBC) の再発率は70-80%まで上昇した。
各再発は、侵襲的な手順のカスケード、生涯にわたる監視、医療費の増大を引き起こす。
既存の臨床予測ツールには根本的な欠陥が残っており、しばしば再発リスクを過大評価する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 20:39:33 GMT)
The Coral Protocol: Open Infrastructure Connecting The Internet of Agents [0.3] Coral Protocolはオープンで分散化されたコラボレーション基盤であり、The Internet of Agentsのコミュニケーション、調整、信頼、支払いを可能にする。
マルチエージェントエコシステムの基盤となるプラットフォームとして、Coralは共通言語と調整フレームワークを確立している。
その設計は、幅広い互換性、セキュリティ、ベンダー中立性を強調し、エージェントのインタラクションが効率的で信頼性の高いものであることを保証する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 22:17:13 GMT)
Quantitative Auditing of AI Fairness with Differentially Private Synthetic Data [0.3] AIシステムの公正監査はバイアスを特定し定量化することができる。
現実世界のデータを使った従来の監査は、セキュリティとプライバシーの懸念を引き起こす。
本稿では,AIシステムの公正性を評価するために,微分プライベートな合成データを活用するフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:36:27 GMT)
Power Flow Approximations for Multiphase Distribution Networks using Gaussian Processes [0.3] 本研究では, ガウス過程(GP)に基づくデータ駆動型潮流モデルを提案する。
IEEE 123-bus と 8500-node 配電試験装置を用いたシミュレーションの結果, トレーニングしたGPモデルが非線形電力流解を確実に予測できることが実証された。
また,提案したGPベースパワーフロー近似器のトレーニング効率と試験性能を,ディープニューラルネットワークベース近似器に対して比較検討した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:26:31 GMT)
From Precision to Perception: User-Centred Evaluation of Keyword Extraction Algorithms for Internet-Scale Contextual Advertising [0.3] 本研究はTF-IDF, KeyBERT, Llama 2の比較評価を行った。
KeyBERTはパフォーマンスと計算効率のバランスが良い。
金標準のキーワードを強く好んでいるにもかかわらず、アルゴリズムの出力の違いは統計的に有意ではない。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:10:00 GMT)
Maximum and minimum causal effects of physical processes [0.2] 最大因果効果と最小因果効果と呼ばれる2つの尺度は、入力の変化によって引き起こされる量子過程の出力の最大と最小の変化を定量化する。
量子因果効果の最大値は、古典的な情報を伝達する非ゼロ容量の量子チャネルを検出するために用いられる。
最小因果効果は、量子情報の回復可能性を保証するために用いられる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:41:43 GMT)
Overlapping data in network protocols: bridging OS and NIDS reassembly gap [0.2] 所定のフローデータを再組み立てしようとするネットワーク侵入検知システム(NIDS)は、監視されたホストと同じ再組み立てポリシーを使用する必要がある。
1)OSの再組み立てポリシは時間とともに進化し,2)テスト対象のNIDSはオーバーラップベースの回避攻撃や挿入攻撃に対して脆弱であることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:15:50 GMT)
TartuNLP at SemEval-2025 Task 5: Subject Tagging as Two-Stage Information Retrieval [0.2] 我々はSemEval-2025のタスク5に提出する。
本課題は,図書館の図書館記録に被写体タグを割り当てる際の図書館員の支援を目的として,当該文書に関連性のあるタグのリストを作成することである。
2種類のエンコーダモデルを用いて2段階情報検索システムを構築する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:44:08 GMT)
GISE-TTT:A Framework for Global InformationSegmentation and Enhancement [0.2] GISE-TTTはテンポラルトランスフォーマー層をトランスフォーマーベースのフレームワークに統合する新しいアーキテクチャである。
本稿では,ビデオオブジェクト用ビデオオブジェクト(VOS)の長いビデオシーケンスにおいて,グローバルな時間依存性を捉えるという課題に対処する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 00:45:55 GMT)
Multi-modal Transfer Learning for Dynamic Facial Emotion Recognition in the Wild [0.1] 顔の表情認識(FER)はコンピュータビジョンのサブセットであり、人間とコンピュータの相互作用、医療、カスタマーサービスに重要な応用がある。
本稿では,ビデオベースFERデータセットの性能向上のために,マルチモーダルトランスファー学習を用いることを検討した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 01:09:11 GMT)
GEOM-Drugs Revisited: Toward More Chemically Accurate Benchmarks for 3D Molecule Generation [0.1] 我々はGEOM-Drugsを再検討し、修正された評価フレームワークを提案する。
データ前処理の問題を特定し, 化学的に正確な原子価表を作成し, GFN2-xTBに基づく幾何とエネルギーのベンチマークを導入する。
本研究は,3次元分子生成における化学的に厳密な評価手法の必要性を浮き彫りにした。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 20:29:22 GMT)
Polysemy of Synthetic Neurons Towards a New Type of Explanatory Categorical Vector Spaces [0.1] 我々は、n層内のニューロンを非直交基底を持つカテゴリーベクトル空間として幾何学的に定義し、n-1層で前のニューロンから抽出されたカテゴリーサブ次元からなる。
このカテゴリーベクトル空間は、各ニューロンの活性化空間によって構成され、ニューロン内の注意プロセスを通じて、言語モデルの効率性のために臨界カテゴリーゾーンの識別と利用を可能にする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:33:28 GMT)
ForceGrip: Reference-Free Curriculum Learning for Realistic Grip Force Control in VR Hand Manipulation [0.1] 本稿では,現実的な手操作動作を合成する深層学習エージェントであるForceGripを紹介する。
我々は、指の位置決め、意図適応、動的安定化を含む3段階のカリキュラム学習フレームワークを採用する。
以上の結果から,ForceGripの出力制御性と信頼性は最先端の手法に比べて優れていた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:03:25 GMT)
Reply to comment on: Observation of the quantum equivalence principle for matter-waves [0.1] 近年の主張とは対照的に, 量子ガリレオ干渉計は, 浮上条件がなくても, 均一な重力場に敏感であることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:29:18 GMT)
An unbiased measure over the matrix product state manifold [0.1] 局所ハール乱ユニタリを用いた逐次生成ランダム行列積状態(RMPS)の通常のアンサンブルは、ヒルベルト空間の制約と見なすと、一様でないことを示す。
その結果、鎖間の絡み合いは空間的非対称性の下で異常な非対称性を示す。
この新しいアンサンブルのいくつかの特性は解析的にも数値的にも検討されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:00:02 GMT)
Who Gets the Callback? Generative AI and Gender Bias [0.0] 大規模言語モデル(LLM)は特に高賃金の役割において男性を好む傾向にある。
求人広告における言語的特徴の包括的分析は、モデルレコメンデーションと伝統的なジェンダーステレオタイプとの強い整合性を示す。
我々の調査結果は、AIによる雇用が労働市場のバイアスを持続させ、企業内の公正性と多様性に影響を及ぼす可能性があることを強調している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:55:52 GMT)
xEEGNet: Towards Explainable AI in EEG Dementia Classification [0.0] xEEGNetは、EEGデータ分析のための、新しくてコンパクトで説明可能なニューラルネットワークである。
完全に解釈可能で、大きなパラメータ還元によって過度に適合する。
xEEGNetはスペクトル変化を含む他の神経学的条件に広く適用されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:24:50 GMT)
mAIstro: an open-source multi-agentic system for automated end-to-end development of radiomics and deep learning models for medical imaging [0.0] mAIstroは、医療AIモデルのエンドツーエンド開発とデプロイのための、オープンソースの、自律的なマルチエージェントフレームワークである。
自然言語インタフェースを通じて探索データ分析、放射能特徴抽出、画像分割、分類、回帰を編成する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:25:51 GMT)
When Reasoning Beats Scale: A 1.5B Reasoning Model Outranks 13B LLMs as Discriminator [0.0] 1.5B の蒸留パラメータ推論モデル (DeepSeek-R1) を, 最先端の非推論 LLM と比較した。
我々の中心的な仮説は、推論モデルは非共振LDMよりも効果的に識別できるというものである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:27:13 GMT)
Vision Transformers on the Edge: A Comprehensive Survey of Model Compression and Acceleration Strategies [0.0] ビジョントランス (ViT) はコンピュータビジョンタスクのための強力で有望な技術として登場した。
高い計算複雑性とメモリ要求は、リソース制約のあるエッジデバイスへのデプロイに困難をもたらす。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:55:51 GMT)
Virtual Atom-Photon Bound States and Spontaneous Emission Control [0.0] 原子-光子結合状態は、原子の完全な自発的崩壊を阻害し、導波路分散工学や巨大原子の利用によって実現することができる。
ここでは、初期原子-光子絡み合いから生じる一過性原子-光子結合状態について検討し、自発的な原子崩壊を減速させる方法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:49:35 GMT)
Variational Scarring in Open Two-Dimensional Quantum Dots [0.0] 2次元量子ドットにおける変分スカーリングは、開系においても頑健であることを示す。
制御された摂動は、傷ついた状態による電子伝達の変調を可能にする。
これらの知見は、量子デバイスにおける実験的実現のためのメソスコピック輸送およびオープンパスにおけるスカーリングの役割に関する洞察を与える。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:48:05 GMT)
VR-FuseNet: A Fusion of Heterogeneous Fundus Data and Explainable Deep Network for Diabetic Retinopathy Classification [0.0] 本稿では,VR-FuseNetと呼ばれる新しいハイブリッドディープラーニングモデルを提案することによって,糖尿病網膜症自動検出のための包括的アプローチを提案する。
提案したVR-FuseNetモデルは、最先端の畳み込みニューラルネットワークであるVGG19と、その深い階層的特徴抽出で知られるResNet50V2の強みを組み合わせたものだ。
このモデルは、糖尿病網膜症分類タスクにおけるハイブリッド特徴抽出の有効性を示すすべてのパフォーマンス指標において、個々のアーキテクチャよりも優れている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:38:47 GMT)
Uncertainty, bias and the institution bootstrapping problem [0.0] エージェントが既に存在するという誤った信念が、このパラドックスを解決できると提案する。
これらの要因がブートストラップ問題をどのように緩和するかを示す。
我々の分析は、理想化された合理性だけでなく、人間のような認知的制約を制度的出現とレジリエンスのモデルに組み込むことの重要性を浮き彫りにしている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:36:06 GMT)
Uncertainty Quantification for Language Models: A Suite of Black-Box, White-Box, LLM Judge, and Ensemble Scorers [0.0] 幻覚はLarge Language Models(LLM)における永続的な問題である
本稿では,実践者が実世界のユースケースに適用可能なゼロリソース幻覚検出のための多用途フレームワークを提案する。
柔軟性を高めるために、各信頼度スコアの組み合わせを組み込んだ調整可能なアンサンブルアプローチを導入する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:49:15 GMT)
UAV-VLN: End-to-End Vision Language guided Navigation for UAVs [0.0] AI誘導の自律性における中核的な課題は、エージェントが以前見えなかった環境で現実的で効果的にナビゲートできるようにすることである。
UAV-VLNは無人航空機(UAV)のための新しいエンドツーエンドビジョンランゲージナビゲーションフレームワークである。
本システムでは,自由形式の自然言語命令を解釈し,視覚的観察に利用し,多様な環境下で実現可能な航空軌道を計画する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:40:47 GMT)
Tuning Learning Rates with the Cumulative-Learning Constant [0.0] 学習率とデータセットサイズの間の未認識の比例が発見される。
累積学習定数を特定し、高度な学習率スケジュールを設計、最適化するためのフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 00:07:48 GMT)
Tree tensor network hierarchical equations of motion based on time-dependent variational principle for efficient open quantum dynamics in structured thermal environments [0.0] ボゾン浴と相互作用する駆動量子系に対するオープン量子力学を正確に計算するための効率的なTTN-HEOM法を提案する。
結合マスター方程式に対する3つの一般的なプロパゲータを実装した。
この結果から,TTN-HEOMは,構造浴と相互作用する量子駆動系の劣化と緩和のダイナミクスをシミュレートできることがわかった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:48:05 GMT)
Towards a $\cos(2\varphi)$ Josephson element using aluminum junctions with well-transmitted channels [0.0] 本研究では、全アルミニウムジョセフソン接合を高透過伝導チャネルで作製する新しい方法を提案する。
本稿では,これらのジャンクションに基づく簡単な超伝導回路の設計を提案し,パリティ保護量子ビットの実装を可能にする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:24:51 GMT)
Towards Non-Abelian Quantum Signal Processing: Efficient Control of Hybrid Continuous- and Discrete-Variable Architectures [0.0] 量子信号処理(QSP)は、$theta$で表されるユニタリパラメータを、関数$f(theta)$で表される1つに変換する。
我々はQSPを非可換制御パラメータを利用する新しいクラスである非可換QSPに拡張する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:41:48 GMT)
Topological classification and edge states of magnons in honeycomb ferromagnets [0.0] ハニカム上の強磁性体中のマグノンのトポロジカルな分類と関連するエッジ状態について検討した。
ボゾンBdGモデルの固有確率は非エルミート系と同値であるが、エルミート系に対する従来のバルクエッジ対応は部分的に有効である。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:29:38 GMT)
The Distribution of Dependency Distance and Hierarchical Distance in Contemporary Written Japanese and Its Influencing Factors [0.0] 文長の増加に伴う平均依存距離(MDD)と平均階層距離(MHD)の変化を分析した。
その結果, 日本語におけるMDDとMHDのトレードオフ関係の背景にある要因は, 述語の正当性であることがわかった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:27:33 GMT)
Spatio-temporal entanglement of the vacuum [0.0] この研究は、時空の絡み合う性質に関する新たな洞察を提供する。
これは、量子場の真空状態を用いたセキュアな量子情報伝達の実用的な応用を示唆している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:54:35 GMT)
Simulating Quantum Circuits with Tree Tensor Networks using Density-Matrix Renormalization Group Algorithm [0.0] 量子回路シミュレーションのための密度行列再正規化群(DMRG)アルゴリズムをツリーテンソルネットワーク(TTN)に拡張する。
TTNは、特にゲート接続がクラスタリングや階層構造を示す場合、量子回路をシミュレートするための有望なフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:59:07 GMT)
Scrambling Dynamics with Imperfections in a Solvable Model [0.0] 可解ブラウン回路モデルにおいて、量子スクランブルダイナミクスのプローブが2種類の不完全性にどのように反応するかを考察する。
回路平均ROTOCは演算子重み空間の有効確率分布によって制御されることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:00:01 GMT)
Sadeed: Advancing Arabic Diacritization Through Small Language Model [0.0] Sadeedはアラビア語の発音のための新しいデコーダのみの言語モデルである。
Sadeedは、厳格なデータクリーニングと正規化パイプラインを通じて構築された、慎重にキュレートされた高品質なダイアグラム化されたデータセットに微調整されている。
SadeedDiac-25は、さまざまなテキストジャンルや複雑性レベルに対して、より公平で包括的な評価を可能にするために設計された、新しいベンチマークである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:37:24 GMT)
SR-NeRV: Improving Embedding Efficiency of Neural Video Representation via Super-Resolution [0.0] Inlicit Neural Representations (INR)は、様々な領域にまたがる複雑な信号をモデル化する能力において、大きな注目を集めている。
汎用超解像(SR)ネットワークを統合したINRに基づく映像表現手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 03:31:40 GMT)
Rydberg Atom Electric Field Sensors as Linear Time-invariant Systems [0.0] ライドバーグ原子電界センサは、従来のアンテナベースの受信機に代わる代替や補機として研究されている。
本稿では,最大2桁の時間短縮が可能なインパルス応答関数を導出する解析的手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 20:05:14 GMT)
Realizing Negative Quantum States with the IBM Quantum Hardware [0.0] 本研究では、離散ウィグナー関数の枠組みを用いて記述された強絡み状態について検討する。
我々は,IBM の Emphibm_brisbane デバイス上でのトモグラフィ再構成により,状態生成のための量子回路を提案し,その検証を行う。
これらの絡み合った状態は、非マルコフ的エラーが頻繁に発生するシナリオにおいて、従来のベル状態の代わりに使われる可能性があると信じている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:08:19 GMT)
Real-World Gaps in AI Governance Research [0.0] 9,439件のAI生成論文(2020年1月から2025年3月)から1,178件の安全性と信頼性に関する論文を引用し、主要なAI企業や大学の研究成果を比較した。
企業AI研究は、モデルアライメントとテストと評価という、デプロイ前領域にますます集中していることに気付きました。
医療、金融、誤情報、説得力と中毒性の特徴、幻覚、著作権など、リスクの高い展開領域に重要な研究ギャップが存在する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 20:44:42 GMT)
RAIL in the Wild: Operationalizing Responsible AI Evaluation Using Anthropic's Value Dataset [0.0] 本稿では,大規模言語モデル(LLM)の規範的振る舞いを評価するために,Responsible AI Labs (RAIL) フレームワークを用いた体系的アプローチを提案する。
このフレームワークを、Arthropicの"Values in the Wild"データセットに適用し、Claude氏との308,000以上の会話と3000以上の注釈付き値表現を含む。
本研究は、これらの値をRAIL次元にマッピングし、合成スコアを計算し、実世界のLLMの倫理的行動に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 22:03:26 GMT)
Quarkonia Theory: From Open Quantum System to Classical Transport [0.0] これは長崎で開かれたハードプローブ2024カンファレンスでの相対論的重イオン衝突におけるクォーコニウム生成の理論的概要である。
この講演は、オープン量子システムフレームワークの適用と、クォーコニウムダイナミクスに関連するクォークグルーオンプラズマの特性を一意にエンコードするクロマトエレクトロコレレータの定式化に焦点を当てている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:10:23 GMT)
QuantumToolbox.jl: An efficient Julia framework for simulating open quantum systems [0.0] QuantumToolbox.jlは、量子システムをシミュレーションするためのオープンソースパッケージである。
高速でスケーラブルなシミュレーションを実現するために、Juliaの高性能エコシステムを活用する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:56:12 GMT)
Quantum-inspired exoplanet detection in the presence of experimental imperfections [0.0] 解析ツールを用いてSPADEの実用性を調べ,それに伴う太陽系外惑星検出の最適決定戦略を導出する。
一方, ノイズSPADEの検出確率は, 従来の手法と同様に惑星と恒星の分離や相対的な明るさと同一であることがわかった。
一方、現実的な雑音条件下でのスケーリング係数が優れているため、SPADEはサブレイリー系において、実用的な太陽系外惑星検出の最も効率的な方法であり続けている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:11:21 GMT)
Optimization of embeddings storage for RAG systems using quantization and dimensionality reduction techniques [0.0] 本研究では,float8量子化により,性能劣化を最小限に抑えつつ,ストレージの4倍の低減を実現することを示す。
PCAは最も効果的な次元削減技術として出現する。
本稿では,最適構成を特定するために,性能記憶トレードオフ空間を可視化する手法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:20:16 GMT)
Open-systems tools for non-thermalizing closed quantum systems [0.0] 非平衡定常状態を生成する制約付き対称量子回路力学について検討する。
各ネットワークは、位相共変ダイナミクスで進化する量子ビットの集合であるオープンシステムの集合として記述することができる。
定常状態と等質定常状態との距離を定量化し、それらの相互情報ネットワークの複雑さを用いてそれらをさらに特徴付ける。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:38:08 GMT)
On the dual structure of the Schrödinger dynamics [0.0] まず、古典力学を参照せずに、スクラッチから実数値シュリンガー方程式を導出する。
次に、Schr"odinger方程式と互換性のある方法で量子パス力学を研究する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:11:30 GMT)
On the Encapsulation of Medical Imaging AI Algorithms [0.0] 本稿では,医療画像AIアルゴリズムの相互運用性と(再利用性に着目した。
本論文は、医療画像AIアルゴリズムの相互運用性と(再利用性)に焦点を当てた研究データのためのFAIR原則について述べる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:12:09 GMT)
Non-standard quantum algebras and infinite-dimensional PT-symmetric systems [0.0] 我々は、Uz(sl(2,R))ホップ代数のPT対称無限次元表現を導入する。
これらのハミルトニアンはすべて、位置依存質量を持つ同値系にマッピング可能であることが示されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:40:56 GMT)
Neuroevolution of Self-Attention Over Proto-Objects [0.0] プロトオブジェクトは、ニューラルネットワークの長方形のイメージパッチに基づいた従来の注意機構に代わる有望な代替手段を提供する。
固定パッチではなくプロトオブジェクトで操作することにより、表現の複雑さを著しく低減する。
これにより、よりリッチなセマンティック情報を処理する、はるかに小さな自己アテンションモジュールが可能になる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 21:01:20 GMT)
Multi-level datasets training method in Physics-Informed Neural Networks [0.0] PINNは、解決し難い問題や、その解決策に高周波成分を持つ問題に苦慮する。
本研究では,上記の問題を緩和するための代替手法を提案する。
CFDコミュニティのマルチグリッド手法にインスパイアされた現在のアプローチの根底にある考え方は、トレーニングを通じて異なる周波数誤差を効率的に除去することである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:30:27 GMT)
MedPix 2.0: A Comprehensive Multimodal Biomedical Data set for Advanced AI Applications [0.0] 本稿では、データセットMedPix 2.0を構築するためのワークフロー全体について説明する。
よく知られているマルチモーダルデータセットであるMedPixから始まったセミオートマチックパイプラインは、視覚的およびテキスト的データを抽出するために開発された。
データセットとともに、MongoDBインスタンスを効率的にナビゲートするためのGUIを開発しました。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:41:49 GMT)
MatMMFuse: Multi-Modal Fusion model for Material Property Prediction [0.0] 本稿では,CGCNN(Crystal Graph Convolution Network)とSciBERTモデルからのテキスト埋め込みから構造を意識した融合モデルを提案する。
提案モデルでは,バニラCGCNNモデルに対して68%,SciBERTモデルに対して68%の精度で生成エネルギーを予測できた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 09:26:28 GMT)
Mapping minds not averages: a scalable subject-specific manifold learning framework for neuroimaging data [0.0] 構造化データと時間的非構造化データの両方にわたる主観的空間変動を捉えることができる多様体学習フレームワークを提案する。
本研究では,このフレームワークを大規模データセットに効率よく拡張し,新たな対象に最適化することを示す。
以上より,本フレームワークは臨床的に関連のある脳活動パターンを明らかにすることができることが示唆された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 21:40:54 GMT)
MPEC: Manifold-Preserved EEG Classification via an Ensemble of Clustering-Based Classifiers [0.0] 脳波信号の正確な分類法としてMPEC(Manifold-Preserved EEG Classification via an Ensemble of Clustering-Based Radial Basiss)を提案する。
MPECはBCIコンペティションIVデータセット2aの大幅な改善によって検証され、優れた結果を得る。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:34:15 GMT)
Learning to Borrow Features for Improved Detection of Small Objects in Single-Shot Detectors [0.0] そこで本研究では,クラス内のより大規模で意味的にリッチなインスタンスから,小さなオブジェクト表現を識別的特徴の「バラバラ化」を可能にする新しいフレームワークを提案する。
本手法は, 複雑な視覚環境下でのロバストな物体検出に有望な方向を提供するため, ベースライン法よりも小さな物体検出精度を著しく向上させる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 01:18:33 GMT)
Landau-Zener-Stückelberg spectroscopy of a fluxonium quantum circuit [0.0] 本研究では, フラキソニウム回路において, 大振幅非共振周期駆動下で得られた時間平均集団について検討した。
本稿では、駆動量子回路のマルチレベル構造を考慮した時間進化の数値シミュレーションを提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:28:03 GMT)
LSTM+Geo with xgBoost Filtering: A Novel Approach for Race and Ethnicity Imputation with Reduced Bias [0.0] 本稿では,位置情報を用いたLong Short-Term Memory Networkの拡張手法であるLSTM+Geoを紹介する。
大規模な投票者データセットを用いて、LSTM+Geo(88.7%の精度)がスタンドアローンLSTMおよびベイズ法より著しく優れていることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:20:08 GMT)
LSEAttention is All You Need for Time Series Forecasting [0.0] トランスフォーマーベースのアーキテクチャは自然言語処理とコンピュータビジョンにおいて顕著な成功を収めた。
これまでの研究では、伝統的な注意機構が、この領域におけるそれらの有効性を制限する重要な要素として特定されてきた。
本稿では,トランスフォーマーを用いた時系列予測において,エントロピー崩壊を緩和し,不安定性をトレーニングするための新しいアプローチであるLATSTを紹介する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 01:52:08 GMT)
Kraus is King: High-order Completely Positive and Trace Preserving (CPTP) Low Rank Method for the Lindblad Master Equation [0.0] 我々はリンドブラッド方程式の本質的構造を尊重しながら密度行列の低階構造を利用する。
本手法は完全陽性であり, 微量保存である。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:36:14 GMT)
Kernel-Based Ensemble Gaussian Mixture Probability Hypothesis Density Filter [0.0] EnGM-PHDフィルタは、GM-PHDフィルタのガウス混合法とSMC-PHDフィルタの粒子法を組み合わせたものである。
その結果, EnGM-PHDフィルタは, GM-PHDフィルタとSMC-PHDフィルタのどちらよりも優れたマルチターゲットフィルタ性能が得られることがわかった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 19:00:02 GMT)
Kernel Density Machines [0.0] カーネル密度マシン(英: kernel density machine、KDM)は、再生されたカーネルヒルベルト空間設定における新しい密度比推定器である。
整合性、機能中心極限定理、有限サンプル誤差境界を含む理論的保証を提供する。
シミュレーションおよび実データに基づく実験結果から,KDMの有効性と精度が示された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:25:25 GMT)
Investigating the Effect of Parallel Data in the Cross-Lingual Transfer for Vision-Language Encoders [0.0] トレーニング済みのVision-Language(VL)モデルと下流タスクのトレーニングデータは英語でのみ利用可能である。
並列データを用いて、すでに訓練済みのエンコーダを転送する。
その結果,機械翻訳されたタスクデータでさえ,平均的,キャプション的,真に並列なデータの方が,いくつかの言語で優れていたことが判明した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:19:15 GMT)
Investigating Literary Motifs in Ancient and Medieval Novels with Large Language Models [0.0] ギリシアの架空の物語は、しばしばラブノベルやロマンスと呼ばれ、紀元前1世紀から15世紀半ばまで、多くの点で類似していると考えられてきた。
本研究は, コーパスのテキストが共通であることの正確なモチーフと, それらの相違点について検討することを目的とする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:39:06 GMT)
InvAASTCluster: On Applying Invariant-Based Program Clustering to Introductory Programming Assignments [0.0] 本稿では,プログラムクラスタリングの新しいアプローチであるInvAASTClusterを提案する。
InvAASTClusterのプログラム表現は、その不変性と構造を通して、プログラムのセマンティクスの組み合わせを使用する。
以上の結果から,InvAASTClusterはクラスタリングベースの修復ツールで使用する場合,最先端の処理を高速化することがわかった。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:39:53 GMT)
Inference for Regression with Variables Generated by AI or Machine Learning [0.0] 我々は、AI/ML生成変数を「データ」として鼻で扱うと、偏りのある推定と不正な推測につながることを示す。
有効な推論を復元するために,(1)バイアス補正された信頼区間を持つ明示的バイアス補正法,(2)回帰パラメータと潜時変数の合同推定法を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:14:10 GMT)
In Search Of Lost Tunneling Time [0.0] 我々は,結合デルタ電位と定電場からなる静的一次元トンネルモデルの時刻時間を算出する。
トンネル出口ではゼロではないものの、原子から遠く離れた検出器で消滅する。
このモデルにより, 位置分解トンネル時間の類似を導出できる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:44:54 GMT)
Glucagon and insulin production in pancreatic cells modeled using Petri nets and Boolean networks [0.0] 糖尿病 (diabetes) は、血液中のグルコース濃度を一定に高めることによって特徴づけられる文明性慢性疾患である。
これらのプロセスをよりよく理解するために、私たちは、体内のグルコース調節のペトリネットモデルを作成することを目標にしました。
本稿では,膵β細胞におけるインスリン分泌のペトリネットモデル,および膵α細胞におけるグルカゴンについて紹介する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:36:02 GMT)
Generative Machine Learning in Adaptive Control of Dynamic Manufacturing Processes: A Review [0.0] 本稿では、意思決定アプリケーション、プロセスガイダンス、シミュレーション、デジタルツインを通じて、生産制御のための生成機械学習の可能性を示す。
本稿では,生産システムの動的複雑さに対処するために,ジェネレーティブMLと制御技術を組み合わせた統合フレームワークの開発を目的とした今後の研究方向性を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 22:48:04 GMT)
From expNN to sinNN: automatic generation of sum-of-products models for potential energy surfaces in internal coordinates using neural networks and sparse grid sampling [0.0] 本研究の目的は,積の和形におけるポテンシャルエネルギー面を表す正弦波活性化関数を持つ単一層人工ニューラルネットワークの実現性を評価することである。
sinNNという名前のフィッティングアプローチはHONOのPSSをモデル化し、トランス異性体とシス異性体の両方をカバーする。
sinNN PESモデルは、利用可能な基本振動遷移エネルギーを17cm-1の根平均二乗誤差で再現することができた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:31:32 GMT)
Finite and Asymptotic Key Analysis for CubeSat-Based BB84 QKD with Elliptical Beam Approximation [0.0] 衛星とCubeSatベースの量子鍵分布(QKD)は、安全な長距離通信のための有望なソリューションである。
本研究では,有限ブロックおよびシングルパス秘密鍵長の計算に用いる統計手法の性能について検討した。
効率的なBB84プロトコルは、大気条件の異なる標準バージョンよりも一貫して優れている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:23:08 GMT)
Fine-tuning Is a Surprisingly Effective Domain Adaptation Baseline in Handwriting Recognition [0.0] このようなシナリオでは、データ拡張による単純な微調整が驚くほどうまく機能することを示す。
大規模な実世界のデータセットでは、新しいライターの微調整により、16行で25パーセント、256行で50%の平均的なCER改善が得られた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:16:12 GMT)
Fact-Consistency Evaluation of Text-to-SQL Generation for Business Intelligence Using Exaone 3.5 [0.0] 大規模言語モデル(LLM)は、テキスト・ツー・ジェネレーションによる構造化データクエリーのための自然言語インタフェースの実現を約束している。
本稿では,Exaone 3.5 を用いて LLM 生成したsql 出力の意味的精度を評価するためのFact-Consistency Evaluation Framework を提案する。
本稿では,LG Electronicsの内部BigQuery環境における実際の販売データから抽出した219の自然言語ビジネス質問からなるドメイン固有ベンチマークを構築した。
我々は,応答精度,実行成功率,意味的誤り率,非応答率を用いてモデル性能を評価する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 14:42:18 GMT)
Evaluating the AI-Lab Intervention: Impact on Student Perception and Use of Generative AI in Early Undergraduate Computer Science Courses [0.0] Generative AI(GenAI)はコンピュータサイエンス教育に急速に参入しつつある。
形式コースにおける道具使用の指針となる構造的足場の研究のギャップを伴う過信共存に関する懸念。
本研究は,「AI-Lab」の介入が大学生に与える影響について考察する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:12:42 GMT)
Error analysis of quantum operators written as a linear combination of permutations [0.0] 我々は、置換の線形結合として与えられる行列を考慮し、固有値の摂動に対するビットと位相フリップの影響を分析する。
線形結合の係数が正となると、行列の固有値が量子ビットフリップ誤差に対するレジリエンスを示すことが観察される。
混合符号係数を持つ行列はビットフリップと位相フリップの誤差に対するレジリエンスが低いが、数値的な証拠は固有スペクトルの摂動が小さい場合に非常に小さいことを示している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:55:13 GMT)
Emotional Analysis of Fashion Trends Using Social Media and AI: Sentiment Analysis on Twitter for Fashion Trend Forecasting [0.0] ファッション関連ソーシャルメディア会話における感情パターンがファッショントレンドの予測要因となるかを検討する。
その結果、感情パターンとファッションテーマの人気との間には、アクセサリーとストリートウェアのテーマが統計的に有意な増加傾向を示した。
改良された予測モデルでは,感情分類の精度が78.35%向上し,傾向予測の信頼性が確立された。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 07:27:06 GMT)
Dynamics of decoherence in a noisy driven environment [0.0] 環境の非平衡臨界ダイナミクスによるデコヒーレンスは、非相関ノイズと相関ノイズの存在下で増幅されることを示す。
量子ビットと環境との強い結合は、デコヒーレンスの部分的な回復をもたらす。
我々は、ノイズの存在下で減衰するが、ノイズ相関時間が増加するにつれて増加するという、力学の非マルコビアン性を探究する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:11:02 GMT)
Dynamical Local Tadpole-Improvement in Quantum Simulations of Gauge Theories [0.0] 格子ゲージ理論の量子シミュレーションにおいて、時空依存的な量子補正から生じる新しい要素を同定する。
本研究は,2+1DにおけるSU(2)プラケット鎖とハニカム格子の時間発展に関する数値シミュレーションの結果について述べる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:26:32 GMT)
Dragonfly: a modular deep reinforcement learning library [0.0] Dragonflyはモジュール性を重視した強化学習ライブラリである。
これはシリアライズに依存しており、ビルディングブロックをスワップし、パラメータスイープを実行することができる。
その機能の一部は、数値シミュレーションのようなCPU集約環境向けに特別に設計されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:39:00 GMT)
Detection and Classification of Diseases in Multi-Crop Leaves using LSTM and CNN Models [0.0] 植物病は作物の収穫量を減らし、食糧品質に影響を与えることで農業に深刻な課題をもたらす。
本研究では,植物葉病の分類に畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)モデルを適用した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 02:36:51 GMT)
Design and Monte Carlo Simulation of a Phase Grating Moiré Neutron Interferometer to Measure the Gravitational Constant [0.0] 重力定数(G)は、自然界の最も正確には知られていない基本定数である。
一般的に適用される振り子法と異なる系統的効果を持つGを測定するための新しい技術が必要である。
PGMI (phase-grating moir'e interferometer) と呼ばれる新しいNI設計は、中性子フラックスをマグニチュードで増大させることが示されている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 20:37:20 GMT)
Decomposition of State Spaces into Subobjects in Quantum Field Theory [0.0] 本稿では、量子場の状態空間をいくつかの絡み合った部分オブジェクトに分解する包括的形式論を導入する。
部分対象のいくつかを退化背景状態に射影すると、システムは有効場理論に還元される。
すべての可能な遷移を平均化すると、固有値が増加する写像に対して、固有値が減少する写像よりも振幅が高いことが示される。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 08:41:19 GMT)
DNB-AI-Project at SemEval-2025 Task 5: An LLM-Ensemble Approach for Automated Subject Indexing [0.0] 我々のシステムは、知的注釈付きレコードの様々な例でLLMの選択を促すことに依存している。
生成したキーワードをターゲット語彙にマップし、結果の主題語をアンサンブル投票に集約し、レコードとの関連性についてランク付けする。
本システムは,全対象トラックにおける定量的ランキングでは4位であるが,主観的索引付けの専門家による質的ランキングでは最もよい結果が得られた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 12:47:09 GMT)
Cryptography without Long-Term Quantum Memory and Global Entanglement [0.0] 量子暗号プリミティブを構築するために,古典的なクエリアクセスのみが可能なオーラクルをどのように利用できるかを示す。
重要なことは、RAM難読化方式は長期の量子メモリや大域的な絡み合いを必要としない。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 17:51:25 GMT)
CryptoUNets: Applying Convolutional Networks to Encrypted Data for Biomedical Image Segmentation [0.0] プライバシー保護型U-Netディープラーニング推論フレームワーク,すなわち同型暗号化に基づくU-Net推論の実現可能性を示す。
我々の知る限り、この実装を実現するための最初の取り組みは、同型暗号化を完全にベースとしたU-Net推論を可能にすることである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:37:22 GMT)
Comparison of Kinematics and Kinetics Between OpenCap and a Marker-Based Motion Capture System in Cycling [0.0] 本研究は, サイクリング時の関節運動学および運動学評価におけるマーカーベースおよびマーカーレスモーションキャプチャシステム(OpenCap)の適合性を評価する。
OpenSimを用いて, 関節角度, モーメント, 関節反応負荷などの重要な指標を計算した。
その結果, 股関節(屈曲・伸展), 膝(屈曲・伸展), 足首(背屈・足関節屈曲)の関節角度について非常に強い一致(r GT 0.9)を示した。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:19:20 GMT)
Class Uncertainty: A Measure to Mitigate Class Imbalance [0.0] 授業の基数のみを考慮すると、クラス不均衡の原因となるすべての問題をカバーできるわけではない。
トレーニング事例の予測的不確実性の平均値として「クラス不確実性」を提案する。
また,SVCI-20は,クラスが同じ数のトレーニングサンプルを持つが,それらの硬さの点で異なる,新しいデータセットとしてキュレートする。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 20:42:18 GMT)
Chronic Diseases Prediction using Machine Learning and Deep Learning Methods [0.0] 本研究は,慢性疾患および甲状腺疾患の予測に機械学習(ML)およびディープラーニング(DL)技術の応用について検討した。
我々は、ロジスティック回帰(LR)、ランダムフォレスト(RF)、グラディエントブーストツリー(GBT)、ニューラルネットワーク(NN)、決定木(DT)、ネイティブベイズ(NB)など、さまざまなモデルを使用した。
その結果、ランダムフォレストやグラディエントブーストツリーのようなアンサンブル手法は一貫して優れていた。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 21:08:16 GMT)
Boundary effects in classical liquid density fluctuations at finite temperature [0.0] フォノン量子化法による閉じ込められた古典液体中の密度変動に対する熱的効果の研究
系は、ディリクレ、ノイマン、混合境界条件を持つ完全に反射する平行平面の間の無質量スカラー場を介してモデル化される。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:07:19 GMT)
Aspects of Complexity in Quantum Evolutions on the Bloch Sphere [0.0] 我々は、時間-最適および時間-最適量子ハミルトン進化に関連する複雑さの定量的理解を強化する。
我々の研究は、一般に、効率的な量子進化は非効率な進化よりも低い複雑さを持っていることを示唆している。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 20:24:32 GMT)
ArrhythmiaVision: Resource-Conscious Deep Learning Models with Visual Explanations for ECG Arrhythmia Classification [0.0] 本稿では,エッジデバイス上での効率的なリアルタイム不整脈分類に最適化されたArrhythmiNet V1とV2を提案する。
MobileNetの深い分離可能な畳み込み設計にインスパイアされたこれらのモデルは、それぞれ302.18KBと157.76KBのメモリフットプリントを維持している。
本研究は, 実用, ウェアラブル, 組込みECGモニタリングシステムにおいて, 解釈可能性, 予測精度, 計算効率の両立の可能性を示すものである。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:22:45 GMT)
Approximation theory for Green's functions via the Lanczos algorithm [0.0] グリーン函数は連続分数として表せることが知られている。
連続分数を用いたグリーン関数の近似における誤差に関する理論を提案する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:00:43 GMT)
Anomaly-Driven Approach for Enhanced Prostate Cancer Segmentation [0.0] 本研究では,2パラメータMRI系列から得られた異常マップを深層学習に基づくセグメンテーションフレームワークに組み込んだ,異常駆動型U-Net(adU-Net)を提案する。
固定点GAN再構成を用いて生成された異常マップは、正常前立腺組織からの偏差を強調し、セグメント化モデルを潜在的癌領域へ導く。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 16:48:00 GMT)
Algorithmic Addiction by Design: Big Tech's Leverage of Dark Patterns to Maintain Market Dominance and its Challenge for Content Moderation [0.0] 本稿では,オンラインプラットフォームが意図的に中毒性ユーザ行動と幅広い社会的意味を育む方法について考察する。
テクノロジー企業が支配を維持するために活用するツールとして、ダークパターン、説得力のあるデザイン要素、レコメンデーションアルゴリズムなど、中毒性のあるデザインが使われている。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 10:43:18 GMT)
Adversarial KA [0.0] コルモゴロフとアーノルド(Kolmogorov and Arnold、KA)は、ギュイユモトライト関数を表現または表現するためのアルゴリズムである。
KA は連続した逆数の可算集合に対して堅牢であるが、外函数の等連続性に関する疑問を解く。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 15:07:54 GMT)
Adaptive Time Stepping for the Two-Time Integro-Differential Kadanoff-Baym Equations [0.0] 我々はグリーン関数の運動方程式、カダノフ・バイム方程式(KBE)の統合スキームを提案する。
我々は、KBEを自己整合的に解くことの重要性を分析し、正確な結果を得るためには、履歴積分評価の順序の順応が重要であることを示す。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 23:30:34 GMT)
Actual Knowledge Gain as Privacy Loss in Local Privacy Accounting [0.0] 本稿では、局所微分プライバシー(LDP)と、クエリ対象に固有の知識の学習に関する世界的制限の等価性を確立する。
LDPクエリからの出力は、学習限界の上限に匹敵する正確な知識を提供するために必ずしも必要ではない。
実際の知識獲得の最小上限は導出され、実現されたプライバシー損失と呼ばれる。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 06:34:01 GMT)
A note on the quantum Wielandt inequality [0.0] ラハマンによって導入された作用素代数的方法を拡張して、任意の原始シュワルツ写像の原性指数が少なくとも2(D-1)2$であることを示す方法を示す。
行列積状態の親ハミルトニアンの性質について、ペレス=ガルシア、ヴェルシュトラーテ、ウルフ、シラクの予想とどのように関係するかを簡単に議論する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 13:40:53 GMT)
A Novel Compound AI Model for 6G Networks in 3D Continuum [0.0] 本稿では,複雑なタスクを専門的かつ相互運用可能なモジュールに分解する,新しい三部構成のフレームワークを導入する,複合AIシステムの形式モデルを提案する。
我々は、クロスドメインリソースオーケストレーション、動的トポロジへの適応、異種環境における一貫性のあるAIサービス品質の維持など、3D連続体で動作する6Gネットワーク内の複合AIシステムで直面する重要な課題を特定します。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 11:28:33 GMT)
A Geometric Substructure for Quantum Dynamics [0.0] 閉量子系の理論は、基礎となる部分構造の同定によって拡張される。
リーマン部分構造への一般化の可能性は推測され、背景重力場との予期せぬ相互作用が示唆される。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:14:49 GMT)
A CMOS Probabilistic Computing Chip With In-situ hardware Aware Learning [0.0] 本稿では,チメラグラフに440本のスピンを配置し,0.44mm2の領域を占有する確率的ビット物理による解法を実証する。
論理ゲートや完全加算器などの確率的計算タスクやMaxCutなどの最適化タスクの実行能力を検証する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 05:38:53 GMT)
A Bridge to Nowhere: A Healthcare Case Study for Non-Reformist Design [0.0] 広義の領域における構造的損害を軽減し, 設計の公正性を高めるために, 非整形設計のための4つのテネセットを提案する。
非改革主義改革の廃止主義的枠組みが、事前の承認の害を軽減する代替介入の明確化にどのように役立つかを検討する。
論文参考訳(メタデータ) (Wed, 30 Apr 2025 18:33:04 GMT)