Personalization of Large Language Models: A Survey [131.0] 大規模言語モデル(LLM)のパーソナライゼーションは、最近、広範囲のアプリケーションでますます重要になっている。
パーソナライズ LLM に関する既存の研究の多くは、(a)パーソナライズされたテキスト生成、または(b)レコメンデーションシステムのようなパーソナライズに関連する下流アプリケーションに LLM を活用することに集中している。
パーソナライズされたLSM使用のための分類を導入し、主要な違いと課題を要約する。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:03:35 GMT)
Visual Imitation Enables Contextual Humanoid Control [117.2] VIDEOMIMICは、日常の映像をマイニングし、人間と環境を共同で再構築する、リアルからシミュレート・トゥ・リアルなパイプラインである。
実際のヒューマノイドロボットにおけるパイプラインの結果を実証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:57:12 GMT)
Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate [105.9] 正規化勾配差(NGDiff)アルゴリズムを導入し、目的間のトレードオフをよりよく制御できるようにする。
本研究では,TOFUおよびMUSEデータセットにおける最先端の未学習手法において,NGDiffの優れた性能を実証的に実証し,理論的解析を行った。
論文参考訳(メタデータ) (Tue, 06 May 2025 00:58:15 GMT)
BIG-Bench Extra Hard [98.4] 大規模言語モデル(LLM)は、ますます日常的なアプリケーションにデプロイされ、堅牢な一般的な推論機能を必要としている。
BIG-Benchデータセットは、LLMの一般的な推論能力を評価するための重要なベンチマークとして機能している。
最先端のモデルは、BIG-Benchの多くのタスクにおいてほぼ完璧なスコアを得るため、その実用性は低下する。
BIG-Bench Extra Hard (BBEH) は, LLM推論評価のバウンダリを推し進めるための新しいベンチマークである。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:11:32 GMT)
ACRIC: Securing Legacy Communication Networks via Authenticated Cyclic Redundancy Integrity Check [98.3] 安全クリティカルな業界における最近のセキュリティインシデントは、適切なメッセージ認証の欠如により、攻撃者が悪意のあるコマンドを注入したり、システムの振る舞いを変更することができることを明らかにした。
これらの欠点は、サイバーセキュリティを強化するために圧力をかける必要性を強調する新しい規制を引き起こしている。
我々は,レガシ産業通信をセキュアにするためのメッセージ認証ソリューションであるACRICを紹介する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:15:42 GMT)
HumanEdit: A High-Quality Human-Rewarded Dataset for Instruction-based Image Editing [93.1] HumanEditは5,751枚の画像で構成され、4段階にわたる2500時間以上の人的作業を必要とする。
データセットには、Action、Add、Counting、Relation、Remove、Replaceの6つの異なるタイプの編集命令が含まれている。
HumanEditは、さまざまなドメインから提供された、包括的な多様性と高解像度の1024倍の1024ドルのコンテンツを提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:56:18 GMT)
Learning Knowledge-based Prompts for Robust 3D Mask Presentation Attack Detection [84.2] 本稿では,3次元マスク提示攻撃検出のための視覚言語モデルの強力な一般化能力を検討するための,知識に基づく新しいプロンプト学習フレームワークを提案する。
実験により,提案手法は最先端のシナリオ内およびクロスシナリオ検出性能を実現することを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:09:23 GMT)
Semantic-Aligned Learning with Collaborative Refinement for Unsupervised VI-ReID [82.1] 教師なしの人物再識別(USL-VI-ReID)は、モデル学習のための人間のアノテーションを使わずに、同じ人物の歩行者像を異なるモードでマッチングすることを目指している。
従来の手法では、ラベルアソシエーションアルゴリズムを用いて異質な画像の擬似ラベルを統一し、グローバルな特徴学習のためのコントラスト学習フレームワークを設計していた。
本稿では,各モダリティによって強調される特定のきめ細かいパターンを対象とするSALCR(Semantic-Aligned Learning with Collaborative Refinement)フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:12:50 GMT)
Faster MoE LLM Inference for Extremely Large Models [75.6] きめ細かいMoEモデルは人気を集めているが、研究は限られている。
アクティベートされた専門家の数を削減すれば、特定のシナリオにおける大幅な効率改善につながる可能性がある。
性能劣化を伴わずにスループットを少なくとも10%向上させることができる。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:41:17 GMT)
Think on your Feet: Adaptive Thinking via Reinforcement Learning for Social Agents [75.3] 社会的インテリジェンスシミュレーションでは、言語エージェントが推論深度を動的に調整する必要がある。
我々は、リアルタイムコンテキストに基づいて4つの思考モードから戦略的に選択する$textbfA$daptive $textbfM$ode $textbfL$(textbfAML$)を提案する。
私たちのフレームワークのコアイノベーションは、$textbfA$daptive $textbfM$ode $textbfP$olicy $textbfO$ptimization$textbfAMPO$
論文参考訳(メタデータ) (Tue, 06 May 2025 09:27:31 GMT)
VITA-Audio: Fast Interleaved Cross-Modal Token Generation for Efficient Large Speech-Language Model [70.3] VITA-Audioは、高速な音声テキストトークン生成を備えたエンドツーエンドの大規模音声モデルである。
MCTPモジュールは、単一のモデルフォワードパス内で複数のオーディオトークンを効率よく生成する。
4段階のプログレッシブ・トレーニング・ストラテジーは,音声品質の低下を最小限に抑えたモデルアクセラレーションを実現するために検討された。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:59:53 GMT)
Iterative Tool Usage Exploration for Multimodal Agents via Step-wise Preference Tuning [69.3] 本研究では,マルチモーダルエージェント,すなわちSPORTのオンライン自己探索手法を提案する。
Sportは、タスク合成、ステップサンプリング、ステップ検証、優先度調整の4つの反復的なコンポーネントを通じて動作する。
GTAとGAIAのベンチマークでは、Sport Agentは6.41%と3.64%の改善を達成している。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:18:40 GMT)
SMORE: Simultaneous Map and Object REconstruction [66.7] 本稿では,LiDARから大規模都市景観を動的に再現する手法を提案する。
我々は、世界が厳格に動く物体と背景に分解される動的なシーンの構成モデルを総合的に捉え、最適化する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:17:31 GMT)
AC3D: Analyzing and Improving 3D Camera Control in Video Diffusion Transformers [66.3] カメラの動きを第一原理の観点から分析し、正確な3Dカメラ操作を可能にする洞察を明らかにする。
これらの知見を合成して、高度な3Dカメラ制御(AC3D)アーキテクチャを設計する。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:11:14 GMT)
Efficient Diversity-Preserving Diffusion Alignment via Gradient-Informed GFlowNets [65.4] そこで我々は,Nabla-GFlowNetと呼ばれる拡散モデルファインタニングのための強化学習手法を提案する。
提案手法は,大規模テキスト条件による画像拡散モデルである安定拡散の高速かつ多様かつ事前保存的な微調整を実現する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:24:17 GMT)
Step1X-Edit: A Practical Framework for General Image Editing [64.1] 我々は、Step1X-Editと呼ばれる最先端の画像編集モデルをリリースする。
GPT-4oやGemini2 Flashのようなクローズドソースモデルと同等のパフォーマンスを提供できる。
評価のために,実世界のユーザ指示に根ざした新しいベンチマークであるGEdit-Benchを開発した。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:58:40 GMT)
Soft Reasoning Paths for Knowledge Graph Completion [63.2] 推論パスは知識グラフ補完(KGC)における信頼できる情報である
現実のアプリケーションでは、計算に手頃なパスが全ての候補エンティティに対して存在することを保証することは困難である。
そこで本研究では,提案アルゴリズムを不備な経路状況に対してより安定にするために,ソフト推論パスを導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:12:48 GMT)
Uncovering the Limitations of Model Inversion Evaluation: Benchmarks and Connection to Type-I Adversarial Attacks [63.1] Model Inversion (MI)攻撃は、機械学習モデルへのアクセスを利用して、プライベートトレーニングデータの情報を再構築することを目的としている。
MI攻撃/防御の最も一般的な評価フレームワークは、近年提案されているMI攻撃/防御のほとんど全てにわたる進捗を評価するために利用されてきた評価モデルに依存している。
我々は、MI攻撃、防衛、プライベートおよびパブリックデータセットの28のセットアップに基づいて、MI攻撃サンプルの最初の包括的人間アノテートデータセットを構築した。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:32:12 GMT)
Paragraph-to-Image Generation with Information-Enriched Diffusion Model [62.8] パラディフュージョン(英: ParaDiffusion)は、パラディフュージョンモデルである。
これは、大きな言語モデルの広範囲な意味理解能力を画像生成のタスクに移すことを念頭に置いている。
コードとデータセットは、長文アライメントに関するコミュニティの研究を促進するためにリリースされます。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:45:30 GMT)
Cobra: Efficient Line Art COlorization with BRoAder References [62.5] 漫画のページは多彩なキャラクター、オブジェクト、背景を含むことが多く、色付け過程を複雑にしている。
画像生成のための拡散モデルの発展にもかかわらず、ラインアートのカラー化への応用は限定的である。
カラーヒントをサポートし,200以上の参照画像を利用する,効率的で汎用的な手法であるCobraを紹介する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:23:12 GMT)
Absolute Zero: Reinforced Self-play Reasoning with Zero Data [61.5] 検証可能な報奨付き強化学習(RLVR)は,大規模言語モデルの推論能力を高めることを約束している。
本稿では,AZR(Absolute Zero Reasoner)について紹介する。
AZRは、コーディングおよび数学的推論タスクにおける全体的なSOTA性能を達成し、既存のゼロセットモデルより優れている。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:08:00 GMT)
STAR-Rec: Making Peace with Length Variance and Pattern Diversity in Sequential Recommendation [61.3] STAR-Recは、好みを認識した注意と状態空間モデリングを組み合わせた新しいアーキテクチャである。
STAR-Recは、最先端のシーケンシャルレコメンデーション手法よりも一貫して優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:40:38 GMT)
MambaStyle: Efficient StyleGAN Inversion for Real Image Editing with State-Space Models [60.1] MambaStyleは、GANインバージョンと編集のための効率的なシングルステージエンコーダベースのアプローチである。
MambaStyleは、逆精度、編集品質、計算効率のバランスが優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:03:47 GMT)
A Trustworthy Multi-LLM Network: Challenges,Solutions, and A Use Case [59.6] 複数の大規模言語モデル(LLM)を信頼性のあるマルチLLMネットワーク(MultiLLMN)に接続するブロックチェーン対応協調フレームワークを提案する。
このアーキテクチャは、複雑なネットワーク最適化問題に対する最も信頼性が高く高品質な応答の協調評価と選択を可能にする。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:32:46 GMT)
SEAL: Steerable Reasoning Calibration of Large Language Models for Free [58.2] 大規模言語モデル(LLM)は、拡張チェーン・オブ・ソート(CoT)推論機構を通じて複雑な推論タスクに魅力的な機能を示した。
最近の研究では、CoT推論トレースにかなりの冗長性が示されており、これはモデル性能に悪影響を及ぼす。
我々は,CoTプロセスをシームレスに校正し,高い効率性を示しながら精度を向上する,トレーニング不要なアプローチであるSEALを紹介した。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:30:46 GMT)
About Time: Advances, Challenges, and Outlooks of Action Understanding [57.8] この調査は、様々なタスクにおけるユニモーダルおよびマルチモーダルな行動理解の進歩を包括的にレビューする。
我々は,現在普及している課題,広く採用されているデータセットの概要,そして最近の進歩を重視したセミナー作品の調査に焦点をあてる。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:18:58 GMT)
Editable-DeepSC: Reliable Cross-Modal Semantic Communications for Facial Editing [56.7] 顔編集のための新しい意味コミュニケーション手法であるEditable-DeepSCを提案する。
実験により、Editable-DeepSCは、伝送帯域を大幅に節約しつつ、優れた編集を実現できることが示された。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:30:58 GMT)
Multi-Agent System for Comprehensive Soccer Understanding [56.3] 我々は,最初の大規模マルチモーダルサッカー知識基盤であるサッカーウィキを構築した。
サッカーベンチは、サッカーに特化した最大かつ最も包括的なベンチマークである。
複雑なサッカー質問を分解する新しいマルチエージェントシステムである SoccerAgent を紹介する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:59:31 GMT)
Prototype-Based Information Compensation Network for Multi-Source Remote Sensing Data Classification [56.1] マルチソースリモートセンシングデータ共同分類は、土地被覆分類の精度と信頼性を提供することを目的としている。
既存の手法では、周波数間マルチソース特徴結合と相補的な情報探索の不整合という2つの課題に直面している。
HSIとSAR/LiDARデータに基づく土地被覆分類のためのプロトタイプベース情報補償ネットワーク(PICNet)を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:30:23 GMT)
Decoupling Fine Detail and Global Geometry for Compressed Depth Map Super-Resolution [56.0] 圧縮深度マップ超解像のための新しいフレームワークGDNetを提案する。
グローバルおよび詳細な幾何学的特徴を別々に扱うことにより、高品質な深度マップ再構築プロセスを分離する。
我々の解は、幾何的整合性と詳細回復の観点から、現在の方法よりも大幅に優れています。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:55:57 GMT)
Post-Quantum Cryptography: An Analysis of Code-Based and Lattice-Based Cryptosystems [55.5] 量子コンピュータはShorのアルゴリズムを使って最新の暗号システムを破ることができる。
我々はまず、量子攻撃に対して安全とされるコードベースのスキームであるMcEliece暗号システムについて検討する。
次に,最短ベクトル問題を解くことの難しさを基礎とした格子型システムNTRUについて検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:42:38 GMT)
Generalization of Bohmian Mechanics and Quantum Gravity Effective Action [55.2] De Broglie-Bohm(dBB)の量子力学の定式化を量子重力(QG)の場合に一般化する。
これは、運動のdBB方程式を運動の効果的な作用方程式に置き換えることによって行われ、これは非重力の場合においても有益である。
効果的な作用形式主義のもう1つの利点は、場の量子論の場合の場の配置が得られることである。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:38:03 GMT)
FreDF: Learning to Forecast in the Frequency Domain [54.2] 時系列モデリングは、歴史的データと将来のシーケンスの両方における自己相関による固有の課題を提示する。
本稿では,周波数領域の予測学習によりラベル自己相関を緩和する周波数強調直接予測(FreDF)を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:56:48 GMT)
Estimating the Diameter at Breast Height of Trees in a Forest With a Single 360 Camera [52.9] 森林在庫は、生態モニタリング、資源管理、炭素会計のために、乳房の高さ(DBH)の直径の正確な測定に頼っている。
LiDARベースの技術はセンチメートル単位の精度を達成できるが、コストは抑えられ、運用上複雑である。
コンシューマグレードの360度ビデオカメラしか必要としない低価格の代替機を提示する。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:09:07 GMT)
Rethinking the Global Convergence of Softmax Policy Gradient with Linear Function Approximation [52.8] 問題依存量のモデル化における近似誤差は,アルゴリズムのグローバル収束とは無関係であることを示す。
我々は,任意の定値学習率を持つ$textttLin-SPG$が,最適ポリシーへのグローバル収束を保証することを証明した。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:03:06 GMT)
The Latency Price of Threshold Cryptosystem in Blockchains [52.4] 本稿では,Byzantine-fault Tolerant(BFT)コンセンサスプロトコルを用いた,しきい値暗号とブロックチェーンのクラス間の相互作用について検討する。
Aptosのメインネットからの測定によると、楽観的なアプローチは遅延オーバーヘッドを71%削減する。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:03:31 GMT)
Learning Symbolic Persistent Macro-Actions for POMDP Solving Over Time [52.0] 本稿では,時間的論理的推論と部分観測可能なマルコフ決定過程(POMDP)の統合を提案する。
本手法は,イベント計算(EC)に基づく線形時間論理(LTL)の断片を利用して,固有(定数)なマクロアクションを生成する。
これらのマクロアクションは、MCTS(Monte Carlo Tree Search)ベースのPOMDPソルバを時間軸上でガイドする。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:08:55 GMT)
GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.6] 遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:35:24 GMT)
Machine Learning: a Lecture Note [51.3] この講義ノートは、データサイエンスの初等生と博士課程の学生、あるいは機械学習の基礎的アイデアに関する規律を準備することを目的としている。
それは、機械学習の基本的なアイデアから始まり、分類を主なターゲットタスクとする。
これらの基本的な考え方に基づいて、講義ノートは教師なし学習に対する確率論的アプローチを深く探求する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:03:41 GMT)
Ψ-Arena: Interactive Assessment and Optimization of LLM-based Psychological Counselors with Tripartite Feedback [51.3] 大規模言語モデル(LLM)の総合的評価と最適化のための対話型フレームワークであるPsi-Arenaを提案する。
アリーナは、心理学的にプロファイルされたNPCクライアントとの多段階対話を通じて現実世界のカウンセリングをシミュレートする現実的なアリーナ相互作用を特徴としている。
8つの最先端のLLM実験は、異なる実世界のシナリオと評価の観点で大きなパフォーマンス変化を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:22:51 GMT)
Enhancing Privacy in Semantic Communication over Wiretap Channels leveraging Differential Privacy [51.0] セマンティック通信(SemCom)は,タスク関連情報に着目して伝送効率を向上させる。
セマンティックリッチなデータをセキュアでないチャネルで送信すると、プライバシのリスクが生じる。
本稿では,セマンティックなセマンティックな特徴を保護するために,差分プライバシー機構を統合した新しいSemComフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:11:45 GMT)
Bounding Box-Guided Diffusion for Synthesizing Industrial Images and Segmentation Map [50.2] 最小限の監督で高忠実度産業データセットを生成するための拡散型パイプラインを提案する。
提案手法では, 拡張有界箱表現の拡散モデルを用いて, 正確なセグメンテーションマスクを生成する。
その結果、拡散に基づく合成は、人工的な産業データと実世界の産業データとのギャップを埋めることを示した。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:21:36 GMT)
Recall with Reasoning: Chain-of-Thought Distillation for Mamba's Long-Context Memory and Extrapolation [49.9] マンバの理論的無限コンテキストポテンシャルは、訓練の長さをはるかに超える配列が実際に限られている。
この研究は、単純なyet- EffectiveメソッドであるRecall with Reasoning (RwR)によって、Mambaの長文メモリ能力をアンロックすることを検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:47:58 GMT)
Joint Resource Management for Energy-efficient UAV-assisted SWIPT-MEC: A Deep Reinforcement Learning Approach [49.8] 6G Internet of Things (IoT)ネットワークは、地上インフラストラクチャが利用できない遠隔地や災害シナリオにおいて、課題に直面している。
本稿では、指向性アンテナにより強化された新しい無人航空機(UAV)支援コンピューティングシステムを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:46:19 GMT)
An LLM-based Self-Evolving Security Framework for 6G Space-Air-Ground Integrated Networks [49.6] 6Gスペースエアグラウンド統合ネットワーク(SAGIN)は、様々なモバイルアプリケーションに対してユビキタスなカバレッジを提供する。
大規模言語モデル(LLM)に基づくSAGINの新しいセキュリティフレームワークを提案する。
当社のフレームワークは,さまざまな未知の攻撃に対して堅牢な,高精度なセキュリティ戦略を実現しています。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:14:13 GMT)
Breaking Annotation Barriers: Generalized Video Quality Assessment via Ranking-based Self-Supervision [49.5] ビデオ品質評価(VQA)は、様々なビデオ処理システムにおける品質の定量化に不可欠である。
我々はVQAのための自己教師型学習フレームワークを導入し、大規模でラベルなしのWebビデオから品質評価機能を学ぶ。
既存のVQAベンチマークよりも10倍のデータセットでトレーニングを行うことで、ゼロショットのパフォーマンスを実現しています。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:29:32 GMT)
PhysLLM: Harnessing Large Language Models for Cross-Modal Remote Physiological Sensing [49.2] LLM(Large Language Models)は、テキスト中心の設計のため、長距離信号の取得に優れる。
PhysLLMは最先端の精度とロバスト性を実現し、照明のバリエーションや動きのシナリオにまたがる優れた一般化を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:18:38 GMT)
E-Values Expand the Scope of Conformal Prediction [49.2] コンフォーマル予測は、分布のない不確実性定量化のための強力なフレームワークである。
本稿では,共形e-predictionと呼ばれる電子値に基づく代替手法について検討する。
E値は、p値では達成できない重要な利点を提供し、新しい理論的および実用的能力を実現する。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:07:00 GMT)
Pushing the boundary on Natural Language Inference [49.2] 自然言語推論(NLI)は、ファクトチェック、質問応答、情報検索における自然言語理解の中心的なタスクである。
その重要性にもかかわらず、現在のNLIシステムは、アーティファクトやバイアス、推論、実世界の適用性を制限した学習に大きく依存している。
この作業は、品質や実世界の適用性を犠牲にすることなく、堅牢なNLIシステムを構築するためのフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:04:22 GMT)
FlexiAct: Towards Flexible Action Control in Heterogeneous Scenarios [49.1] アクションカスタマイズでは、被験者が入力制御信号によって指示されたアクションを実行するビデオを生成する。
現在の手法では、ポーズ誘導やグローバルな動きのカスタマイズが使われているが、空間構造に対する厳密な制約によって制限されている。
本稿では、参照ビデオから任意のターゲット画像へアクションを転送するFlexiActを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:58:02 GMT)
Knowledge Augmented Complex Problem Solving with Large Language Models: A Survey [48.5] 大規模言語モデル(LLM)は、様々なドメインにまたがる複雑な問題に対処できる強力なツールとして登場した。
LLMを現実世界の問題解決に適用することは、多段階推論、ドメイン知識の統合、結果検証など、重大な課題を提示します。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:53:58 GMT)
LiftFeat: 3D Geometry-Aware Local Feature Matching [47.6] 我々は,3次元幾何学的特徴を集約することにより,生記述子の堅牢性を高める,textitLiftFeatという軽量ネットワークを提案する。
次に,3次元形状認識機能持ち上げモジュールを設計し,表面の通常の特徴を生の2次元記述子特徴と融合させる。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:59:23 GMT)
Transformers for Learning on Noisy and Task-Level Manifolds: Approximation and Generalization Insights [47.6] この研究は、多様体上のノイズの多い入力データを含む回帰タスクにおける変換器の性能を分析することによって理論的基礎を確立する。
我々は、多様体の内在次元に決定的に依存する近似と一般化誤差を証明した。
この結果から,入力データに高次元ノイズが伴う場合においても,学習課題における低複雑さ構造を活用できることが示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:41:46 GMT)
Learning Unknown Spoof Prompts for Generalized Face Anti-Spoofing Using Only Real Face Images [46.7] 本研究では,未知のスプーフプロンプトを学習するための新しいアプローチを提案する。
本手法は,視覚言語モデルに埋め込まれた一般的な知識を活用することで,現実の顔と潜在的な未知のスプーフ攻撃に対するテキストプロンプトを生成する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:09:37 GMT)
PROM: Prioritize Reduction of Multiplications Over Lower Bit-Widths for Efficient CNNs [46.5] ProMは,2つの異なるビット幅を選択的に使用することにより,奥行き分離可能な畳み込みネットワークを定量化するための簡単な手法である。
具体的には、ポイントワイズ畳み込みは3次重みに量子化され、残りの加群は8ビット重みを使用する。
PROMは、深度的に分離可能な畳み込みネットワークを3次と8ビットの重みに量子化する課題に対処する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:32:24 GMT)
Decentralized Distributed Proximal Policy Optimization (DD-PPO) for High Performance Computing Scheduling on Multi-User Systems [45.6] 本研究では,分散型分散プロキシポリシー最適化(DD-PPO)アルゴリズムを用いた新しいRLベースのスケジューラを提案する。
DD-PPOアルゴリズムは、各ステップでパラメータ同期を必要とせずに、複数のワーカーにまたがる大規模な分散トレーニングをサポートする。
検証データセットは、1150万以上の実際のHPCジョブトレースを利用して、DD-PPOのパフォーマンスを従来のスケジューリング手法と高度なスケジューリング手法と比較した。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:50:37 GMT)
CombiBench: Benchmarking LLM Capability for Combinatorial Mathematics [45.3] 100の問題をまとめた総合的なベンチマークであるCombiBenchを紹介します。
CombiBenchは2000年以降の問題解決に適している(画像を含むIMO 2004 P3を除く)。
また、フォーマル数学のための包括的で標準化された評価フレームワーク「ファイン・エバル」も提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:32:17 GMT)
Unified Multimodal Chain-of-Thought Reward Model through Reinforcement Fine-Tuning [45.2] 本稿では,最初の統一マルチモーダルCoT型報酬モデルUnifiedReward-Thinkを提案する。
まず、GPT-4oの推論過程を抽出するために、少量の画像生成嗜好データを用いる。
次に、大規模に統一されたマルチモーダル嗜好データを作成し、様々な視覚タスクにわたってモデルの推論プロセスを導出する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:46:41 GMT)
VLM Q-Learning: Aligning Vision-Language Models for Interactive Decision-Making [45.0] 視覚言語モデル(VLM)は、大規模言語モデル(LLM)をマルチモーダルデータに拡張する。
我々の研究は、オフラインからオンラインへの強化学習(RL)の観点から、これらの課題にアプローチする。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:51:57 GMT)
Quantum tunneling and anti-tunneling across entropic barriers [45.0] 拘束された2次元チャネルにおける量子粒子のダイナミクスについて検討する。
温度が低下するにつれて、量子補正の開始が(半直観的な)高温の挙動にどのように影響するかを分析する。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:55:55 GMT)
Latent Adaptive Planner for Dynamic Manipulation [44.9] Latent Adaptive Planner (LAP) は動的非包括的操作タスクのための新しいアプローチである。
LAPは、人間のデモビデオから効果的に学んだ潜在空間推論として計画を定式化している。
論文参考訳(メタデータ) (Tue, 06 May 2025 00:09:09 GMT)
Advancing Conversational Diagnostic AI with Multimodal Reasoning [44.2] アーティキュレート・メディカル・インテリジェンス・エクスプローラー(AMIE)
システムは、対話フローを中間モデル出力によって動的に制御する状態認識対話フレームワークを実装している。
患者アクターとのチャットベースの相談の無作為で盲目なOSCEスタイルの研究において, AMIEをプライマリケア医師(PCP)と比較した。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:52:01 GMT)
Unraveling the Rainbow: can value-based methods schedule? [41.9] 広範に、深層強化学習法は、政策ベースと価値ベースという2つのカテゴリに分類される。
いくつかの値に基づくアプローチが広く採用されているポリシー最適化アルゴリズムに適合し、さらに優れることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:51:17 GMT)
Quantum QSAR for drug discovery [41.9] 量的構造-活性関係(QSAR)モデリングは、薬物発見の鍵となる。
本研究では,量子支援ベクトルマシン(QSVM)によるQSAR技術の向上を提案する。
量子データ符号化と量子カーネル関数を用いて,より正確かつ効率的な予測モデルの構築を目指す。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:58:33 GMT)
AudioBench: A Universal Benchmark for Audio Large Language Models [41.5] 音声大言語モデル(AudioLLMs)を評価するために設計されたユニバーサルベンチマークであるAudioBenchを紹介する。
8つの異なるタスクと26のデータセットを含み、そのうち7つは新しく提案されたデータセットである。
評価は、音声理解、音声シーン理解、音声理解(パラ言語学)の3つの主要な側面をターゲットにしている。
論文参考訳(メタデータ) (Tue, 06 May 2025 00:52:19 GMT)
The Devil is in the Prompts: Retrieval-Augmented Prompt Optimization for Text-to-Video Generation [40.7] RAPO(Retrieval-Augmented Prompt Optimization framework)を紹介する。
RAPOは、ユーザのプロンプトを2つの最適化ブランチを通じて洗練し、T2V生成の優れたプロンプトを選択する。
大規模な実験により、RAPOは生成されたビデオの静的次元と動的次元の両方を効果的に拡張できることが示された。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:55:26 GMT)
Capability-Driven Skill Generation with LLMs: A RAG-Based Approach for Reusing Existing Libraries and Interfaces [40.6] 本稿では,スキル実装のコントラクトとして機能を扱うとともに,大規模言語モデルを用いて自然言語ユーザ入力に基づくコード生成を行う手法を提案する。
このアプローチの重要な特徴は、既存のソフトウェアライブラリとインターフェース技術の統合です。
コード生成プロセスに独自のライブラリやリソースインターフェースを組み込むことができるフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:27:04 GMT)
Distribution-Conditional Generation: From Class Distribution to Creative Generation [39.9] DisTokは、クラス分散を潜在空間にマッピングし、それらを創造的な概念のトークンにデコードするエンコーダ・デコーダフレームワークである。
DisTokは、テキストイメージアライメントと人間の好みスコアで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:07:12 GMT)
Hybrid Reinforcement Learning and Model Predictive Control for Adaptive Control of Hydrogen-Diesel Dual-Fuel Combustion [39.7] 強化学習(RL)と機械学習統合モデル予測制御(ML-MPC)は水素-ディーゼル二重燃料エンジン制御を最適化するための有望なアプローチである。
本研究では,ML-MPC フレームワークを RL エージェントを組み込んだハイブリッド RL と ML-MPC のアプローチを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:45:08 GMT)
From Pixels to Polygons: A Survey of Deep Learning Approaches for Medical Image-to-Mesh Reconstruction [38.7] この調査は、既存のアプローチを、テンプレートモデル、統計モデル、生成モデル、暗黙モデルという4つの主要なカテゴリに体系的に分類する。
心臓画像から神経学的研究まで,様々な解剖学的応用にまたがって,これらの手法を広範囲に評価する。
この調査は、トポロジカルな正しさ、幾何的精度、マルチモーダリティ統合の要件を含む、この分野における現在の課題を明らかにしている。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:01:43 GMT)
PosterO: Structuring Layout Trees to Enable Language Models in Generalized Content-Aware Layout Generation [38.5] PosterOは、不愉快な目的のためにポスターを作成するためのレイアウト中心のアプローチである。
SVG言語のツリーとしてのデータセットからのレイアウトを、普遍的な形状、設計意図のベクトル化、階層的なノード表現によって構成する。
与えられた画像に対して視覚的に魅力的なレイアウトを生成することができ、様々なベンチマークで新しい最先端のパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:42:24 GMT)
Unleashing the Power of Continual Learning on Non-Centralized Devices: A Survey [37.1] 非連続学習(NCCL)は、分散デバイスが共同の非定常環境からストリーミングデータを処理できるようにするための新たなパラダイムとなっている。
本調査は,非集中型連続学習アルゴリズムの開発と,分散デバイスへの実環境展開に焦点を当てる。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:55:42 GMT)
On the generalization of language models from in-context learning and finetuning: a controlled study [36.4] 言語モデルの文脈内学習は、異なる帰納バイアスを示し、場合によってはより一般化できることを示す。
本研究では,微調整データに文脈内推論を追加することによって,微調整による一般化を改善する手法を提案する。
この結果は,言語モデルにおける学習様式の違いによる帰納バイアスの理解に影響を及ぼす。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:44:01 GMT)
Rethinking Meta-Learning from a Learning Lens [36.0] メタラーニングの理論的理解と実践的実践のギャップを埋める方法について考察する。
タスク関係を利用してメタ学習を校正するプラグイン・アンド・プレイ方式TRLearnerを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:25:00 GMT)
Synergizing Large Language Models and Task-specific Models for Time Series Anomaly Detection [35.8] 大規模言語モデル(LLM)は専門文書を読むことによって専門家の知識を取り入れることができるが、タスク固有の小さなモデルは通常のデータパターンの抽出に優れている。
本研究では,LLMとタスク固有モデル間の協調を支援するフレームワークであるCoLLaTeを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:57:08 GMT)
WebGen-Bench: Evaluating LLMs on Generating Interactive and Functional Websites from Scratch [35.6] マルチファイルWebサイトをスクラッチから作成するLLMベースのエージェントの能力を測定するために設計された新しいベンチマークであるWebGen-Benchを紹介する。
ヒトアノテータとGPT-4oの併用によるWebサイト生成の多様な指示が含まれている。
我々は、GPT-4oを使用して、命令に記述された各機能をターゲットにしたテストケースを生成し、手動でフィルタリング、調整、整理を行い、精度を保証し、647のテストケースを作成します。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:59:15 GMT)
Dual-Domain Masked Image Modeling: A Self-Supervised Pretraining Strategy Using Spatial and Frequency Domain Masking for Hyperspectral Data [35.3] 本稿では,ラベルなしデータの大部分を利用するハイパースペクトルデータに対する自己教師付き事前学習戦略を提案する。
本稿では,空間領域と周波数領域の両方で動作する新しい二重ドメインマスキング機構を提案する。
提案手法を3つの公開HSI分類ベンチマークで評価し,現状の性能を実証した。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:24:21 GMT)
BRIDGE: Bootstrapping Text to Control Time-Series Generation via Multi-Agent Iterative Optimization and Diffusion Modelling [35.2] 時系列生成(TSG、Time-Series Generation)は、シミュレーション、データ拡張、および反事実分析に広く応用された、顕著な研究分野である。
我々は、テキストが意味的な洞察、ドメイン情報、インスタンス固有の時間パターンを提供し、TSGをガイドし改善することができると論じている。
BRIDGEはテキスト制御型TSGフレームワークで,テキスト記述とセマンティックプロトタイプを統合し,ドメインレベルのガイダンスをサポートする。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:32:17 GMT)
Not All Parameters Matter: Masking Diffusion Models for Enhancing Generation Ability [34.9] MaskUNetは、パラメータ番号を無視して生成品質を向上する、単純で効果的なメソッド式MaskUNet'-である。
トレーニングベースのアプローチと、カスタマイズされたネットワークと最適化機能を含むトレーニングなしアプローチの2つの微調整戦略を提供します。
COCOデータセット上のゼロショット推論では、MaskUNetは最高のFIDスコアを獲得し、下流タスク評価におけるその効果をさらに示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:14:20 GMT)
TeleEval-OS: Performance evaluations of large language models for operations scheduling [34.8] 通信業務スケジューリング評価ベンチマーク(TeleEval-OS)を提案する。
このベンチマークは、13のサブタスクにわたる15のデータセットで構成され、インテリジェントチケット生成、インテリジェントチケットハンドリング、インテリジェントチケット閉鎖、インテリジェント評価の4つの主要な運用ステージを包括的にシミュレートする。
通信のスケジューリングにおけるそれらの能力は,基本的なNLP,知識Q&A,レポート生成,レポート解析の4つの階層レベルに分類される。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:44:41 GMT)
Interpretable Zero-shot Learning with Infinite Class Concepts [34.7] 本稿では,ゼロショット学習(ZSL)におけるクラスセマンティクスを再定義する。
無限クラス概念を用いたゼロショット学習(InfZSL)という新しいフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:30:30 GMT)
Avoid Recommending Out-of-Domain Items: Constrained Generative Recommendation with LLMs [33.7] LLM(Large Language Models)は、ジェネレーティブなレコメンデーションシステムである。
ドメイン外(OOD)項目を推奨しないことを保証することは、依然として課題です。
本稿では,検索手法であるRecLM-retと制約付き生成手法であるRecLM-cgenの2つの異なる手法について検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:08:36 GMT)
Towards Hierarchical Multi-Step Reward Models for Enhanced Reasoning in Large Language Models [33.5] 階層的リワードモデルと呼ばれる新しい報酬モデル手法を提案する。
個々の推論ステップと連続推論ステップを、きめ細かいレベルと粗いレベルの両方で評価する。
これは多段階推論コヒーレンスの評価に優れており、特に欠陥のあるステップが後に自己回帰によって修正される場合である。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:38:24 GMT)
Diffusion Models are Secretly Exchangeable: Parallelizing DDPMs via Autospeculation [32.7] 本稿では,広く使われている投機的復号アルゴリズムをDDPMに拡張したemphAutospeculative Decoding (ASD)を紹介する。
我々の理論的分析は、ASDが$tildeO (Kfrac13)$並列実行速度を$K$ステップDDPMで達成していることを示している。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:10:37 GMT)
GUAVA: Generalizable Upper Body 3D Gaussian Avatar [32.5] 3Dアバターの再構築には、通常、多視点または単眼ビデオと個々のIDのトレーニングが必要である。
まず,表情能力を高めるための表現型人間モデル(EHM)を提案する。
高速アニマタブルな上体3次元ガウスアバター再構成のための最初のフレームワークであるGUAVAを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:19:16 GMT)
Highly squeezed nanophotonic quantum microcombs with broadband frequency tunability [32.1] 直接検出された5.6dB$pm$0.2dBのスクイーズを生成するナノフォトニックスクイーサーを提案する。
16量子モードの量子周波数コム(QFC)を明らかにするナノフォトニックサスペンサーにシードアシスト検出技術を導入する。
その結果,ブロードバンドおよびマルチモードプラットフォームにおけるナノフォトニック励起光の生成と検出の両面で大きな進展が見られた。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:59:23 GMT)
BadLingual: A Novel Lingual-Backdoor Attack against Large Language Models [32.1] 本稿では,Large Language Models (LLMs) に対する新たなバックドア攻撃について述べる。
まず,特定の下流タスクのトレーニングデータをトリガー言語に翻訳することで,ベースライン言語バックドアアタックを実装した。
この課題に対処するために、これらのタスクの特定の疑問によらず、チャットLLM内のダウンストリームタスクをトリガーできる新しいタスク非依存の言語バックドアであるBadLingualを設計する。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:07:57 GMT)
LLM4Tag: Automatic Tagging System for Information Retrieval via Large Language Models [32.0] 大規模言語モデル(LLM)は、多岐にわたる世界知識、意味理解、推論能力のためにタグ付けシステムに適用されている。
パフォーマンスは優れていますが、既存のメソッドには制限があります。
グラフベースのタグリコールモジュールは、小規模で関連性の高いタグセットを効果的かつ包括的に構築するように設計されている。
長期的および短期的な知識注入を伴う正確なタグを生成するために、知識強化タグ生成モジュールが使用される。
タグ信頼度スコアを生成するためにタグ信頼度判定モジュールを導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:26:13 GMT)
Holmes: Automated Fact Check with Large Language Models [31.8] 本研究では,Large Language Models (LLMs) を用いて自動偽情報検出を行う。
新たなエビデンス検索手法を特徴とするエンドツーエンドフレームワークであるHolmesを提案する。
提案手法では,(1)LLMを用いた要約を用いてオープンソースから鍵情報を抽出し,(2)エビデンスの品質を評価するための新しいアルゴリズムと指標を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:19:51 GMT)
Aligning Data Selection with Performance: Performance-driven Reinforcement Learning for Active Learning in Object Detection [31.3] 本稿では,オブジェクト検出のための平均APガイド型アクティブラーニングについて紹介する。
MGRALは、予測されたモデル出力変化の概念を深層検知ネットワークの情報性として活用する新しいアプローチである。
提案手法は,物体検出のための強化学習に基づく能動学習における新たなパラダイムを確立し,高い性能を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:00:02 GMT)
Image Recognition with Online Lightweight Vision Transformer: A Survey [31.3] 本稿では、画像認識のための軽量な視覚変換器を作成するための様々なオンライン戦略について調査する。
我々は、ImageNet-1Kベンチマークにおいて、各トピックに関する関連する探索を評価した。
視覚変換器の軽量化における今後の研究の方向性と今後の課題を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:07:54 GMT)
3D Surface Reconstruction with Enhanced High-Frequency Details [31.3] 現在の神経表面再構成法では、画像全体をランダムにサンプリングする傾向がある。
我々は、表面の細部が不十分な問題を解くために、高周波情報に基づく手法を考案した。
本手法は, 表面の微細な細部を再構築し, 従来の方法に比べて良好な表面改質が得られる。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:37:04 GMT)
Instance Segmentation of Scene Sketches Using Natural Image Priors [30.5] InkLayerはシーンスケッチの例分割のための手法である。
提案手法は,クラスに依存しない微調整を用いて,最先端の画像セグメント化とオブジェクト検出モデルをスケッチ領域に適用する。
提案手法は,スケッチを分類層に整理し,隠蔽されたインスタンスを塗布し,高度なスケッチ編集アプリケーションを可能にする。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:15:34 GMT)
Method-of-Moments Inference for GLMs and Doubly Robust Functionals under Proportional Asymptotics [30.3] 高次元一般化線形モデル(GLM)における回帰係数と信号対雑音比の推定について考察する。
我々は、推論対象の一貫性と漸近的正規性(CAN)推定を導出する。
理論的結果を数値実験と既存文献との比較で補完する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:06:12 GMT)
Modality-Guided Dynamic Graph Fusion and Temporal Diffusion for Self-Supervised RGB-T Tracking [30.3] 本稿では,自己教師付きRGB-Tトラッキングのための新しい手法であるGDSTrackを提案する。
GDSTrackは、隣接するフレームのモダリティを融合させ、それらを邪魔なノイズとして扱い、生成モデルの認知能力を活用する。
4つの公開RGB-T追跡データセットで実施された実験は、GDSTrackが既存の最先端手法よりも優れていることを示した。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:15:34 GMT)
Rethinking Boundary Detection in Deep Learning-Based Medical Image Segmentation [29.4] 本稿では、畳み込みニューラルネットワーク(CNN)モデル、ビジョントランスフォーマー(ViT)モデル、明示的なエッジ検出演算子を組み合わせた、CTOという新しいネットワークアーキテクチャを提案する。
CTOはセグメンテーションの精度で既存のメソッドを超え、精度と効率のバランスを良くする。
7つの挑戦的な医用画像セグメンテーションデータセットで実施した広範な実験を通じて、CTOのパフォーマンスを検証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:42:56 GMT)
Causal Structure Representation Learning of Confounders in Latent Space for Recommendation [29.1] ユーザの過去のフィードバックからユーザの好みを推測することは,レコメンデーションシステムにおいて重要な問題である。
我々は、共同創設者の影響を考慮し、潜在分野におけるユーザー嗜好から引き離し、相互依存をモデル化するために因果グラフを用いる。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:25:57 GMT)
Enhancing Target-unspecific Tasks through a Features Matrix [28.8] 本研究では,ターゲット非固有タスクにおける視覚言語モデルの拡張を目的とした,新しい特徴行列(FM)正規化手法を提案する。
我々の手法は、特徴行列(FM)を形作る一般的な知識を抽出し、活用する。
具体的には、FMは、多種多様な入力のセマンティクスを深く、きめ細かな視点から捉え、本質的な一般的な知識を保ち、過度に適合するリスクを軽減している。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:41:53 GMT)
A Reasoning-Focused Legal Retrieval Benchmark [28.6] 本稿では,Bar Exam QAとHousing Statute QAの2つの新しい法的RAGベンチマークを紹介する。
以上の結果から,法的なRAGは依然として困難な応用であり,今後の研究の動機となることが示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:44:03 GMT)
am-ELO: A Stable Framework for Arena-based LLM Evaluation [28.5] ELO評価システムに基づく既存のフレームワークは、ランキングの不整合とアノテータの様々な能力に対する注意の欠如により、避けられない不安定な問題に悩まされている。
ELOレーティングシステムを強化することで,これらの問題に対処するための新しい安定アリーナフレームワークを導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:28:50 GMT)
CASE -- Condition-Aware Sentence Embeddings for Conditional Semantic Textual Similarity Measurement [28.4] Condition-Aware Sentence Embeddings (CASE) は、条件下で文の埋め込みを作成するための効率的で正確な方法である。
ケースは、既存の標準ベンチマークデータセット上で条件付きセマンティックテキスト類似性(C-STS)メソッドよりも大幅に優れています。
本稿では,LLMをベースとした埋め込みの次元性を低減するだけでなく,性能を著しく向上する,教師付き次元性低減手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:34:33 GMT)
Prism: Unleashing GPU Sharing for Cost-Efficient Multi-LLM Serving [28.2] 大規模ワークロード(LLM)の実現は、特に言語モデルをホストするプロバイダにとって、コストがかかる。
モデルとその共有による長いアイドル期間の長期的人気は、このタスクに新たな機会と課題を生み出します。
本稿では、GPU共有の可能性を解き放ち、効率とSLO達成を両立させるシステムであるPrismを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 23:38:33 GMT)
AutoDroid-V2: Boosting SLM-based GUI Agents via Code Generation [28.0] 本稿では,UIタスク自動化問題を,デバイス上のSLMで効果的に解き,デバイス上のコードインタープリタで効率的に実行可能なコード生成問題に変換することを提案する。
私たちはドキュメント中心のアプローチを採用し、各アプリ用のきめ細かいAPIドキュメンテーションを自動的に構築し、多様なタスクサンプルを生成します。
最新のモバイルUIエージェントとの詳細な比較に基づいて,本手法はモバイルタスクの自動化を効果的に改善し,高い成功率と低レイテンシ/トーケン消費を実現した。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:24:43 GMT)
OpenHelix: A Short Survey, Empirical Analysis, and Open-Source Dual-System VLA Model for Robotic Manipulation [28.0] デュアルシステムVLA(Vision-Language-Action)アーキテクチャは、インテリジェンス研究においてホットな話題となっている。
さらなるパフォーマンス分析と最適化のための十分なオープンソース作業が不足している。
このプロジェクトは、さらなる調査のために低コストのオープンソースモデルを提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:35:07 GMT)
Small-Scale-Fading-Aware Resource Allocation in Wireless Federated Learning [27.9] 本稿では,マルチエージェント強化学習(MARL)フレームワークを用いた小規模フェイディング対応リソース割り当て戦略を提案する。
我々は、FLアルゴリズムの一段階収束境界を確立し、リソース割り当て問題を分散化された部分的に観測可能なマルコフ決定プロセスとして定式化する。
我々のフレームワークでは、各クライアントは、各コヒーレンス時間スロット内のスペクトルと電力割り当てを動的に決定するエージェントとして機能する。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:41:59 GMT)
DYSTIL: Dynamic Strategy Induction with Large Language Models for Reinforcement Learning [27.3] 専門家によるデモンストレーションからの強化学習は、長い間、困難な研究課題のままである。
行動クローニングとRLトレーニングを併用した既存の最先端手法は、一般化の貧弱さ、サンプル効率の低さ、モデルの解釈可能性の低さに悩まされることが多い。
本稿では,これらの制約を克服するために,大規模言語モデル (LLM) と統合された新たな戦略に基づく強化学習フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:53:09 GMT)
Towards A Robust Group-level Emotion Recognition via Uncertainty-Aware Learning [27.3] グループレベルの感情認識(GER)は、人間の行動分析の不可分な部分である。
GERのためのより堅牢な表現を抽出する不確実性認識学習(UAL)手法を提案する。
我々は,強騒音に対するモデルの頑健性を高めるために,画像強調モジュールを開発した。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:51:07 GMT)
Cluster-Aware Multi-Round Update for Wireless Federated Learning in Heterogeneous Environments [25.4] 本稿では、類似したデータと通信特性を持つグループデバイスとの事前知識の類似性を活用するクラスタリング戦略を提案する。
クラスタを基本単位として扱い、クラスタ化されたコントリビューションしきい値に基づいてローカル更新頻度を調整する新しいクラスタ・アウェア・マルチラウンド・アップデート(CAMU)戦略を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:48:48 GMT)
Efficient Multivariate Time Series Forecasting via Calibrated Language Models with Privileged Knowledge Distillation [25.2] TimeKDは、提案したクロスモダリティ教師モデルから高品質な未来表現を生成することを目的としている。
効果的な学生モデルを構築するために,革新的特権的知識蒸留(PKD)機構を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:35:29 GMT)
Full-DoF Egomotion Estimation for Event Cameras Using Geometric Solvers [24.9] 統合されたフレームワーク内での回転速度と翻訳速度の両方を推定するために,いくつかの解法を提案する。
角速度と直線速度の両方のフルDoFエゴモーションパラメータを、センサの余分な測定や動きの前処理を必要とせずに回収できることを実証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:35:44 GMT)
Robust Duality Learning for Unsupervised Visible-Infrared Person Re-Identification [24.2] 擬似ラベルノイズ(PLN)を考慮した新しい学習パラダイムを提案する。
PLNはノイズオーバーフィット、エラー蓄積、ノイズの多いクラスタ対応の3つの主要な課題によって特徴づけられる。
UVI-ReIDのためのロバスト・デュナリティ学習フレームワーク(RoDE)を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:22:39 GMT)
Fourier Position Embedding: Enhancing Attention's Periodic Extension for Length Generalization [23.9] 回転位置埋め込み(RoPE)は非均一離散フーリエ変換を暗黙的に達成することで周期的に注意を向けることができることを示す。
この周期性は,1) 線形層と注意領域外の活性化機能,2) 時間領域切断による周波数成分の不足によるスペクトル損傷によって損なわれている。
本稿では,FoPE (Fourier Position Embedding) を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:47:40 GMT)
Integration of Large Language Models and Traditional Deep Learning for Social Determinants of Health Prediction [23.9] 社会的健康決定要因(Social Determinants of Health, SDoH)は、個人の健康状態に影響を及ぼす、または影響を及ぼす経済的、社会的、個人的な状況である。
従来のディープラーニングと大規模言語モデル(LLM)を用いて臨床テキストからSDoHを自動的に抽出する。
我々のモデルは、マルチラベルSDoH分類における以前の基準点を10ポイント上回る。
論文参考訳(メタデータ) (Tue, 06 May 2025 23:11:59 GMT)
Coop-WD: Cooperative Perception with Weighting and Denoising for Robust V2V Communication [23.0] 本稿では,V2Vチャネル障害にともなう協調知覚を高めるために,協調重み付け・重み付けフレームワークCoop-WDを提案する。
効率的な変種モデルであるCoop-WD-ecoが提案され、デノナイジングを選択的に非活性化して処理オーバーヘッドを低減する。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:38:35 GMT)
3D Gaussian Splatting Data Compression with Mixture of Priors [23.0] 3DGSデータ圧縮は、3Dシーンモデリングにおける効率的なストレージと伝送を実現するために重要である。
本稿では,これら2つの課題に対処する新たなMixture of Priors(MoP)戦略を提案する。
提案する3DGSデータ圧縮フレームワークは,複数のベンチマークにまたがって最先端の性能を実現する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:42:39 GMT)
Plug-and-Play AMC: Context Is King in Training-Free, Open-Set Modulation with LLMs [23.0] 自動変調分類(AMC)は、効率的なスペクトル管理とロバストな無線通信において重要である。
本稿では,従来の信号処理技術と大規模言語モデルを統合する革新的なフレームワークを提案する。
この研究は、次世代無線ネットワークにおけるスケーラブルで解釈可能で汎用的な信号分類システムの基礎を築いた。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:07:47 GMT)
Null Counterfactual Factor Interactions for Goal-Conditioned Reinforcement Learning [22.8] Hindsight relabelingは、目標条件付き強化学習において、スパーシリティを克服するための強力なツールである。
我々は、下流RLのサンプル効率を向上させるために、後向きのラベリングと相互作用を組み合わせたインタラクション(HInt)を導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:32:47 GMT)
Chain-of-Thought Textual Reasoning for Few-shot Temporal Action Localization [22.6] そこで本研究では,Chain-of-Thought文による時間的局所化手法を提案する。
具体的には、テキスト意味情報を活用して、アクションの共通点やバリエーションを捉える能力を高める新しい数ショット学習フレームワークを設計する。
公開されているActivityNet1.3とTHUMOS14データセットについて広範な実験を行った。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:00:15 GMT)
Long-Short Chain-of-Thought Mixture Supervised Fine-Tuning Eliciting Efficient Reasoning in Large Language Models [22.4] textbfLong-textbfShort Chain-of-Thought textbfMixture textbfSupervised textbfFine-textbfTuningを提案する。
LS-Mixture SFT法を用いてトレーニングしたモデルは,直接SFT法と比較すると平均精度が2.3%向上した。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:18:11 GMT)
DiffVQA: Video Quality Assessment Using Diffusion Feature Extractor [22.4] 映像品質評価(VQA)は、知覚的歪みと人間の嗜好に基づいて映像品質を評価することを目的としている。
我々は、広範囲なデータセットで事前訓練された拡散モデルの堅牢な一般化機能を利用する新しいVQAフレームワークDiffVQAを紹介する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:42:24 GMT)
Artificial Protozoa Optimizer (APO): A novel bio-inspired metaheuristic algorithm for engineering optimization [22.0] 人工原生動物は数学的にモデル化され、ミーアリストラの最適化プロセスを実行するために実装された。
提案したAPOは実験的なシミュレーションによって検証され、32の最先端アルゴリズムと比較された。
実験の結果、APOは最適化問題に対して非常に競争力のある結果が得られることが確認された。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:22:34 GMT)
DreamO: A Unified Framework for Image Customization [22.0] 複数の条件をシームレスに統合しながら、幅広いタスクをサポートするために設計された画像カスタマイズフレームワークであるDreamOを紹介する。
具体的には、DreamOは拡散変換器(DiT)フレームワークを使用して、異なるタイプの入力を均一に処理する。
ベースライン整合性を確立するための限られたデータを伴う単純なタスクに焦点を当てた初期段階、カスタマイズ能力を包括的に強化するためのフルスケールトレーニング段階、低品質データによって導入された品質バイアスを補正するための最終品質アライメント段階の3段階からなるプログレッシブトレーニング戦略を採用する。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:41:43 GMT)
The Adaptive Arms Race: Redefining Robustness in AI Security [21.8] 我々は,ブラックボックス攻撃と防御を適応的に最適化するフレームワークを,彼らが形成する競争ゲームの下で導入する。
システム応答を動的に制御するアクティブディフェンスは、決定に基づく攻撃に対するモデル強化に不可欠である。
我々の発見は、広範囲な理論的および実証的な調査によって裏付けられ、適応的敵がブラックボックスAIベースのシステムに深刻な脅威をもたらすことを確認した。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:21:22 GMT)
Validating the Effectiveness of a Large Language Model-based Approach for Identifying Children's Development across Various Free Play Settings in Kindergarten [21.4] 本研究では,Large Language Models (LLMs) と学習分析を併用して,子どもの遊び体験の自己物語の分析を行う革新的なアプローチを提案する。
幼稚園の29人の子供の2,224の遊び談話を収集し,4つの異なる遊び領域を1学期以上にわたってカバーした。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:40:47 GMT)
X-Reasoner: Towards Generalizable Reasoning Across Modalities and Domains [21.4] 一般ドメインテキストベースのポストトレーニングは、強力な一般化可能な推論を可能にする。
X-Reasonerは、推論機能をマルチモーダルとアウトオブドメインの両方に転送することに成功している。
X-Reasoner-Med(X-Reasoner-Med)は、テキストのみの医療ベンチマークとマルチモーダルな医療ベンチマークの新たな状態を実現する医療特化版である。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:08:27 GMT)
CombAlign: Enhancing Model Expressiveness in Unsupervised Graph Alignment [19.5] 教師なしグラフアライメント(英語版)は、グラフ構造とノード特徴のみを活用することにより、一対のグラフ間のノード対応を見つける。
最近の研究の1つのカテゴリは、まずノード表現を計算し、次に最も大きな埋め込みベースの類似性を持つノードとマッチングする。
他のカテゴリは、Gromov-Wasserstein学習による最適輸送(OT)に問題を還元する。
一致したノード対と一致しないノード対を2つのグラフで区別する際のモデルの識別力について検討する。
理論解析により,より強い表現力を持つCombAlignというハイブリッドアプローチを提唱した。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:16:42 GMT)
RTV-Bench: Benchmarking MLLM Continuous Perception, Understanding and Reasoning through Real-Time Video [19.4] RTV-BenchはMLLMリアルタイムビデオ解析のためのきめ細かいベンチマークである。
RTV-Benchは552の多様なビデオ(167.2時間)と4,631の高品質QAペアを含んでいる。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:51:03 GMT)
Uncertainty-Guided Self-Questioning and Answering for Video-Language Alignment [19.3] 本稿では,自己問合せと回答を通じて,学習過程における質問サンプルを増強する自己学習フレームワークを提案する。
低品質の自己生成質問は、特に訓練の初期段階において、パフォーマンスを汚染する可能性がある。
我々は、不確実性を推定し、自己生成質問の品質を評価するために、エビデンシャル・ディープ・ラーニングを導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:02:57 GMT)
Novel Extraction of Discriminative Fine-Grained Feature to Improve Retinal Vessel Segmentation [19.0] 本稿では,AttUKANという新しいU字型コルモゴロフ・アルノルドネットワークを提案する。
我々は、モデル感度を高めるために、コルモゴロフ・アルノルドネットワークにアテンションゲートを実装した。
我々はまた、提案したAttUKANを監督するために、新しいラベル誘導のPixel-wise Contrastive Lossを設計する。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:03:41 GMT)
TimeTracker: Event-based Continuous Point Tracking for Video Frame Interpolation with Non-linear Motion [18.2] イベントベースのビデオフレーム(VFI)のハードルは、非線形モーションを扱う方法である。
我々はTimeTrackerという新しい連続点追跡ベースのVFIフレームワークを提案する。
本手法は, 動作推定とフレーム品質の両方において, 先行技術より優れる。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:12:19 GMT)
Experimental Side-Channel-Secure Quantum Key Distribution over 200 km [18.2] 量子鍵の配布により、2つのリモートパーティが物理法則に基づいて暗号鍵と情報理論セキュリティを共有できる。
サイドチャネルセキュア量子鍵分布(SCS-QKD)は、ソースと検出器の両方のサイドチャネル攻撃に対する免疫性から注目されている。
我々は、不完全な全空間ソースを用いて、実用的なSCS-QKDプロトコルを実験的に実装した。
これにより、ファイバスプールを用いて伝送距離を200kmまで延長することができ、有限キー効果を考慮しつつ、パルス当たり1.29E-7ビットの安全な鍵レートを達成することができる。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:36:24 GMT)
Revolutionizing Brain Tumor Imaging: Generating Synthetic 3D FA Maps from T1-Weighted MRI using CycleGAN Models [18.2] 本稿では,T1強調MRIスキャンから直接FAマップを生成するためのCycleGANに基づくアプローチを提案する。
提案モデルでは,未確認データに基づいて高忠実度マップを作製し,特に腫瘍領域での強靭な性能を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:05:22 GMT)
Machine-Learning Insights into the Entanglement-trainability Correlation of Parameterized Quantum Circuits [18.0] 変分量子アルゴリズム(VQA)は、現在のノイズの多い中間スケールデバイスで量子優位を得るための主要な戦略として登場した。
バレンプラトー(BP)現象の主な原因として、その絡み合い-運動性相関は、それらの応用に挑戦する。
本稿では,パラメータ化量子回路(PQC)のゲート・ツー・テンソル(GTT)符号化法を提案する。
2つの長期記憶ネットワーク(L-Gネットワーク)は、絡み合いとトレーニング可能性の両方を予測するために訓練されている。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:53:36 GMT)
Bridging Expertise Gaps: The Role of LLMs in Human-AI Collaboration for Cybersecurity [17.8] 本研究では,大規模言語モデル(LLM)が知的協力者として機能し,サイバーセキュリティ意思決定における専門的ギャップを埋めることができるかを検討する。
我々は,人間とAIのコラボレーションによって作業性能が向上し,フィッシング検出における偽陽性と侵入検出における偽陰性が低減されることを見出した。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:47:52 GMT)
RADE: Learning Risk-Adjustable Driving Environment via Multi-Agent Conditional Diffusion [17.5] リスク・ドライビング・環境(RADE)は、統計的に現実的でリスク調整可能な交通シーンを生成するシミュレーション・フレームワークである。
RADEはデータから直接リスク条件の行動を学び、コントロール可能なリスクレベルと自然主義的なマルチエージェントインタラクションを保存する。
RADEを実世界のrounDデータセットで検証し、様々なリスクレベルにわたって統計的リアリズムを保存することを示した。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:41:20 GMT)
Corner Cases: How Size and Position of Objects Challenge ImageNet-Trained Models [17.3] 画像の背景は、異なるデータポイント間の刺激的な相関に寄与する主要な役割を担っている。
本稿では,これらのバイアスが,モデルが背景の刺激的特徴にどの程度依存しているかに影響を与え,その予測に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:27:01 GMT)
Is Your Imitation Learning Policy Better than Mine? Policy Comparison with Near-Optimal Stopping [17.2] 本稿では,小サンプルサイズ体制における2つの政策を厳密に比較するための新しい統計枠組みを提案する。
提案した統計テストは逐次的であり、研究者はさらなる試行を行うかどうかを判断できる。
ほぼ最適に停止し、研究者は評価を中止し、最小限の試行で決定することができる。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:23:10 GMT)
UI-Vision: A Desktop-centric GUI Benchmark for Visual Perception and Interaction [16.7] UI-Visionは、コンピュータ使用エージェントのオフラインかつきめ細かい評価のための、最初の包括的なライセンス許容ベンチマークである。
オンラインベンチマークとは異なり、UI-Visionは人間のデモの密集した高品質なアノテーションを提供する。
評価の結果,UI-TARS-72Bのような最先端モデルの限界が明らかになった。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:43:11 GMT)
radarODE: An ODE-Embedded Deep Learning Model for Contactless ECG Reconstruction from Millimeter-Wave Radar [16.5] レーダノードと呼ばれる新しいディープラーニングフレームワークは、レーダ信号から抽出された時間的および形態的特徴を融合させ、ECGを生成するように設計されている。
レーダノードは,検出率の欠落,ルート平均二乗誤差,ピアソン相関係数の9%,16%,19%で,ベンチマークよりも優れた性能を実現している。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:29:33 GMT)
From Word to Sentence: A Large-Scale Multi-Instance Dataset for Open-Set Aerial Detection [16.5] 本稿では,単語から句,究極的には文までの3段階の言語指導を含む,大規模言語誘導型オープンセット空中検出データセットを提案する。
また,航空画像の多様なシーンアノテーションを処理可能な自動アノテーションパイプラインであるOS-W2S Label Engineを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:07:52 GMT)
Learning Survival Distributions with the Asymmetric Laplace Distribution [16.4] 非対称ラプラス分布(ALD)に基づくパラメトリックサバイバル解析法を提案する。
この分布は、平均、中央値、モード、変動、量子化といった一般的なイベントサマリーの閉形式計算を可能にする。
提案手法は, 精度, 識別, 校正の点でパラメトリックおよび非パラメトリックアプローチより優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:34:41 GMT)
CoGenAV: Versatile Audio-Visual Representation Learning via Contrastive-Generative Synchronization [16.4] CoGenAVは、汎用的なオーディオ視覚表現を学習するために設計された、強力でデータ効率のよいモデルである。
CoGenAVは、自然な音声-視覚同期、対照的な特徴アライメント、生成テキスト予測から導かれる2つの目的を最適化することで訓練される。
複数のベンチマークで学習したCoGenAV表現の有効性と汎用性を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:07:11 GMT)
FLUX-Text: A Simple and Advanced Diffusion Transformer Baseline for Scene Text Editing [16.3] FLUX-Fillをベースとしたシンプルで高度な多言語シーンテキスト編集フレームワークFLUX-Textを提案する。
本手法は,テキスト編集作業における最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:56:28 GMT)
Adversarial Cooperative Rationalization: The Risk of Spurious Correlations in Even Clean Datasets [16.3] 本研究では,協調ゲームで構築した自己合理化フレームワークについて検討する。
このような協調ゲームは、有理抽出中に意図せずサンプリングバイアスを生じさせる可能性がある。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:07:13 GMT)
Towards Accurate and Interpretable Neuroblastoma Diagnosis via Contrastive Multi-scale Pathological Image Analysis [16.3] 病理画像分類に適したコントラスト学習に基づくマルチスケール機能融合モデルであるCMSwinKANを提案する。
マルチスケールの特徴を融合させ、対照的な学習戦略を活用することで、CMSwinKANは臨床医の包括的なアプローチを模倣する。
その結果、CMSwinKANは、既存の最先端の病理モデルよりも、大規模なデータセットで事前訓練されたモデルよりもパフォーマンスがよいことが示された。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:45:03 GMT)
ReGraP-LLaVA: Reasoning enabled Graph-based Personalized Large Language and Vision Assistant [16.3] 我々は120種類のパーソナライズされた知識からなるReGraPという新しいデータセットを提案する。
本稿では、対応するKGとCoT QAペアでトレーニングされたMLLMであるReGraP-LLaVAを提案する。
結果から,提案モデルはパーソナライズされた知識を学習するだけでなく,応答における関係推論も行うことがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:00:13 GMT)
FGAIF: Aligning Large Vision-Language Models with Fine-grained AI Feedback [16.2] ファイングレード人工知能フィードバック(FGAIF)によるLVLM(Large Vision-Language Models)のモダリティ調整手法を提案する。
具体的には、まずAIツールを用いて、応答の各セグメントの幻覚のタイプを予測し、細かなフィードバックの収集を行う。次に、収集された報酬データに基づいて、3つの特別な報酬モデルを訓練し、密集した報酬を生成する。最後に、新しいきめ細かいフィードバックモジュールをプロキシポリシー最適化(PPO)アルゴリズムに統合する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:33:55 GMT)
Cooperative Multi-Agent Planning with Adaptive Skill Synthesis [16.2] 本稿では、視覚言語モデル(VLM)を動的スキルライブラリと統合し、分散化されたクローズドループ決定のための構造化通信を行う新しいマルチエージェントアーキテクチャを提案する。
デモからブートストラップされたスキルライブラリは、プラナー誘導タスクを通じて進化し、適応戦略を実現する。
我々は、その最先端のMARLベースラインに対して、対称シナリオと非対称シナリオの両方で強力な性能を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:03:22 GMT)
Towards Smart Point-and-Shoot Photography [16.2] われわれは、ユーザーが良い写真を撮れるためのSPASシステムについて紹介する。
我々のSPASは、カメラのポーズを自動的に調整することで、ユーザーがシーンのよい写真を作るのを助けることを提案する。
公開画像合成データセットを用いてSPASシステムの性能を実証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:40:14 GMT)
EOPose : Exemplar-based object reposing using Generalized Pose Correspondences [16.1] 汎用オブジェクトリポジトリのためのエンドツーエンドフレームワークを提案する。
提案手法であるEOPoseは、ターゲットポーズ誘導画像を入力として、そのキーポイント対応をソースオブジェクトイメージと組み合わせて、後者をワープし、ターゲットポーズに再レンダリングする。
生成的アプローチとは違って,本手法では,正確な色,テクスチャ,ブランドマークなど,オブジェクトの細かな詳細も保存する。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:17:32 GMT)
OSMamba: Omnidirectional Spectral Mamba with Dual-Domain Prior Generator for Exposure Correction [15.9] 我々は新しい露光補正ネットワークであるOmnidirectional Spectral Mamba (OSMamba)を提案する。
OSMambaは、Mambaを周波数領域に適応させる全方位スペクトル走査機構を導入している。
我々は、よく露出した画像から学習し、劣化のない拡散前生成を行うデュアルドメイン先行生成器を開発した。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:41:55 GMT)
Evaluating Frontier Models for Stealth and Situational Awareness [15.8] 最近の研究は、スケジューリングするフロンティアAIモデルの可能性を示している。
AI開発者にとっては、モデルデプロイメントの前にスキーマから害を排除することが重要です。
本稿では,2種類の推論能力を測定するためのスケジューリング推論評価スイートを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:40:17 GMT)
A Synergistic Framework of Nonlinear Acoustic Computing and Reinforcement Learning for Real-World Human-Robot Interaction [15.8] 本稿では, 非線形音響計算と強化学習を統合し, 複雑な雑音と残響下での人間とロボットの相互作用を強化する新しい枠組みを提案する。
提案システムは,AIハードウェア,ロボット,マシンオーディション,人工オーディション,ブレイン・マシン・インタフェースの幅広い応用可能性を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:09:59 GMT)
MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation [15.6] 拡散モデルはテキスト・画像生成において優れた性能を示した。
複雑なシーンに対するテキスト・画像生成のための多エージェント協調型合成拡散法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:18:25 GMT)
Matching Distance and Geometric Distribution Aided Learning Multiview Point Cloud Registration [15.6] マルチビューポイントクラウド登録は、ロボット工学、自動化、コンピュータビジョン分野において重要な役割を果たす。
ポーズグラフ構築の従来の方法は、しばしば完全に連結されたグラフを刈り取ったり、局所記述子から集約された大域的特徴を用いてスパースグラフを構築したりしていた。
我々は、点雲対間のマッチング距離から情報を抽出するネットワークモデルを設計する。
動作同期のために,データ駆動方式で絶対的なポーズを計算するニューラルネットワークモデルを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:54:07 GMT)
SepALM: Audio Language Models Are Error Correctors for Robust Speech Separation [15.6] 本稿では,音声言語モデル(ALM)を用いて,予備的分離後のテキスト領域内での音声の修正と再合成を行う先駆的アプローチであるSepALMを紹介する。
SepALMは、セパレータ、修正器、シンセサイザー、調整器の4つのコアコンポーネントから構成される。
我々の実験は、SepALMが音声分離の精度を高めるだけでなく、新しい音響環境における適応性を著しく向上させることを実証している。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:04:37 GMT)
Counterfactual Inference for Eliminating Sentiment Bias in Recommender Systems [15.5] 感情バイアスと呼ばれる新たに発見されたバイアスは、レビューベースのRSに共通する現象を明らかにする。
この問題を,2段階の反実的推論の観点から検討する。
我々の知る限りでは、RSの感情バイアス軽減に関する反実的推論を最初に採用するのはこれが初めてである。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:00:41 GMT)
STORY2GAME: Generating (Almost) Everything in an Interactive Fiction Game [15.4] STORY2GAMEはテキストベースのインタラクティブフィクションゲームを生成するための新しいアプローチである。
まず、ストーリーを生成し、世界をポップアップさせ、インタラクティブにストーリーをプレイできるゲームエンジンにアクションのためのコードを構築する。
我々は、プレイヤーが生成したストーリー全体を通してインタラクティブにプレイできるかどうかに関して、アクションコード生成の成功率を評価する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:00:41 GMT)
Variational Formulation of the Particle Flow Particle Filter [15.3] 粒子流粒子フィルタの導出に使用される過渡密度は,フィッシャー-ラオ勾配流の時間スケールの軌跡に従うことを示す。
変分推論のための連続時間アルゴリズムとしてフィッシャー・ラオ勾配流を求める。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:44:55 GMT)
Exploring the Role of Diversity in Example Selection for In-Context Learning [15.1] In-Context Learning (ICL) は、広範囲なトレーニングデータを必要とすることなくタスクを実行する能力と、ノイズの多いラベルに対する堅牢性によって、注目を集めている。
類似性に基づいた選択にのみ依存すると、検索されたコンテキストにトピックのバイアスが発生する可能性がある。
トピックの多様性を高めるために検索したコンテキストを再配置することは、ダウンストリームタスクのパフォーマンスを向上させることができると仮定する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:51:28 GMT)
Recognize Any Surgical Object: Unleashing the Power of Weakly-Supervised Data [15.0] RASOは外科的対象を認識するために設計された基礎モデルである。
大規模な未発表の外科的講義ビデオからタグと画像のペアを自動生成する。
我々のスケーラブルなデータ生成パイプラインは2200の手術手順を集め、360万のタグアノテーションを生成します。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:57:31 GMT)
The Eye as a Window to Systemic Health: A Survey of Retinal Imaging from Classical Techniques to Oculomics [15.0] 網膜構造は、早期発見、疾患の進行のモニタリング、および眼疾患および非眼疾患の介入を補助する。
人工知能を利用した画像技術の進歩は、眼と人間の健康のギャップを埋めるためにこの機会をつかんだ。
眼科におけるオキュロミクスの新しいフロンティアは、眼疾患と全身疾患の両方をカバーし、それらを調べるためにより多くの注意を払っている。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:35:54 GMT)
A Unified Framework for Exploratory Learning-Aided Community Detection Under Topological Uncertainty [14.9] META-CODEは、ソーシャルネットワークにおける重複コミュニティを検出する統合フレームワークである。
1)新たな再構築損失によってトレーニングされたグラフニューラルネットワーク(GNN)に基づくノードレベルのコミュニティアフィリエイト埋め込み,2)コミュニティアフィリエイトベースのノードクエリによるネットワーク探索,3)エッジ接続に基づくSiameseニューラルネットワークモデルを用いたネットワーク推論,の3つのステップで構成されている。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:35:56 GMT)
Neural Configuration-Space Barriers for Manipulation Planning and Control [14.8] 乱雑な動的環境下での高次元ロボットマニピュレータの計画と制御は、計算効率と堅牢な安全保証の両方を必要とする。
安全制約をCDFバリアとして定式化する動き計画と制御の統一フレームワークを提案する。
CDFバリアは局所的な自由構成空間を近似し、モーションプランニング中の衝突チェック操作の数を著しく削減する。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:11:29 GMT)
VISLIX: An XAI Framework for Validating Vision Models with Slice Discovery and Analysis [14.5] 我々は、ドメインの専門家がコンピュータビジョンモデルのスライスを分析するのに役立つ新しいビジュアル分析フレームワークVISLIXを紹介する。
提案手法では,画像メタデータや視覚概念を必要とせず,自然言語の洞察を自動的に生成し,ユーザが対話的にデータスライス仮説をテストできる。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:09:15 GMT)
AMO: Adaptive Motion Optimization for Hyper-Dexterous Humanoid Whole-Body Control [14.4] 本研究では,実時間で適応的な全身制御を実現するために,sim-to-real強化学習とトラジェクトリ最適化を統合したフレームワークを提案する。
AMOの一貫性のある性能は、模倣学習による自律的なタスク実行をサポートすることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:59:51 GMT)
A Survey on Self-Supervised Graph Foundation Models: Knowledge-Based Perspective [14.4] グラフ自己教師型学習(SSL)は、グラフ基礎モデル(GFM)を事前学習するためのゴートメソッドとなった
本稿では,自己教師付きグラフモデルを用いた知識に基づく分類法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:02:31 GMT)
Content ARCs: Decentralized Content Rights in the Age of Generative AI [14.2] 本稿では,コンテンツARC (Authenticity, Rights, Compensation) というフレームワークを提案する。
証明と動的ライセンシングのオープンスタンダードとデータ属性を組み合わせることで、Content ARCは、権利を管理し、AIトレーニングで自分の仕事を使用するためのクリエイターを補償するメカニズムを作成します。
我々は、Content ARCs内のAIデータライセンス分野におけるいくつかの初期段階の成果を特徴づけ、エンドツーエンドフレームワークを完全に実装するための課題がどこにあるかを特定します。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:48:04 GMT)
VecFontSDF: Learning to Reconstruct and Synthesize High-quality Vector Fonts via Signed Distance Functions [14.2] 本稿では,高品質なベクトルフォントの再構成と合成を行うために,エンドツーエンドのトレーニング可能なVecFontSDFを提案する。
提案したSDFに基づく暗黙的形状表現に基づいて、VecFontSDFは、各グリフを複数のパラボラ曲線で囲まれた形状プリミティブとしてモデル化することを学ぶ。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:02:55 GMT)
ParFam -- (Neural Guided) Symbolic Regression Based on Continuous Global Optimization [14.1] 我々は、離散的記号回帰問題を連続的な問題に変換するために、新しいアプローチであるParFamを提案する。
グローバルな手法と組み合わせることで、SRの問題に対処する非常に効果的な手法がもたらされる。
また、ParFamをガイドするために、事前訓練されたトランスフォーマーネットワークDL-ParFamを組み込んだ拡張も提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:43:52 GMT)
Physics-inspired Energy Transition Neural Network for Sequence Learning [14.1] 本研究では、純粋なRNNの能力について検討し、その長期学習メカニズムを再評価する。
時間とともにエネルギーの変化を追跡する物理エネルギー遷移モデルにインスパイアされた我々は、Physics-inspired Energy transition Neural Network (PETNN)と呼ばれる効果的なリカレント構造を提案する。
本研究では,現在Transformerが支配しているフィールドにおいて,効率的なリカレントニューラルネットワーク開発の可能性を明らかにする。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:07:15 GMT)
Practical Efficiency of Muon for Pretraining [13.9] 大規模なバッチサイズでデータ効率を維持する上で、MuonはAdamWよりも効果的であることがわかった。
本稿では,資源のオーバーヘッドを最小限に抑えつつ,mulPのすべてのエラー源を考慮に入れた単純なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:14:24 GMT)
Physics-Informed Sylvester Normalizing Flows for Bayesian Inference in Magnetic Resonance Spectroscopy [13.8] 本研究は,代謝物濃度の後方分布を近似するために正規化フロー(SNF)を用いたベイズ推論フレームワークを導入する。
物理ベースのデコーダは、MSS信号生成の事前知識を取り入れ、現実的な分布表現を保証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:50:14 GMT)
Mitigating Image Captioning Hallucinations in Vision-Language Models [13.7] 視覚言語モデルの幻覚は、信頼性と現実の応用性を妨げている。
本稿では,推論中の幻覚を緩和するための強化学習を用いた新しいテスト時間適応フレームワークを提案する。
本手法は, 幻覚緩和効果が68.3%向上し, 最先端のベースラインを上回った。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:55:21 GMT)
Unveiling the Role of ChatGPT in Software Development: Insights from Developer-ChatGPT Interactions on GitHub [13.7] ChatGPTのような生成AIツールは、開発者の間で広く採用されている。
ChatGPTの可能性は広く議論されているが、開発者による実際の使用を探求する実証的な証拠は限られている。
本研究は,ChatGPT支援開発活動の大規模実証分析を行うことにより,ギャップを埋めるものである。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:16:08 GMT)
The Unreasonable Effectiveness of Discrete-Time Gaussian Process Mixtures for Robot Policy Learning [13.6] MiDiGapは、ロボット操作におけるフレキシブルポリシー表現と模倣学習のための新しいアプローチである。
1分以内でCPU上のタスクを学習し、大規模なデータセットに線形にスケールする。
様々な数ショットのベンチマークで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:27:23 GMT)
Music for All: Representational Bias and Cross-Cultural Adaptability of Music Generation Models [13.6] 本稿では,音楽生成のためのデータセットと研究論文について述べる。
既存の音楽データセットの合計時間のうち、西洋以外のジャンルから得られる時間はわずか5.7%である。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:48:44 GMT)
Applications of Artificial Intelligence for Cross-language Intelligibility Assessment of Dysarthric Speech [13.5] 本解説では, 変形性音声の言語間信頼度評価を推し進めるための概念的枠組みを紹介する。
音声・音声表現に変形音声をエンコードするユニバーサル音声モデルを提案し,それに続いて言語固有の知性評価モデルを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:14:32 GMT)
radarODE-MTL: A Multi-Task Learning Framework with Eccentric Gradient Alignment for Robust Radar-Based ECG Reconstruction [13.1] この作業は、レーダーによるECG回復を創造的に3つの個別のタスクに分解する。
複数タスクの学習フレームワークであるRadarODE-MTLを提案し、一貫した雑音や突然の騒音に対する堅牢性を高める。
実験の結果,レーダノード-MTLはレーダ信号から正確なECG信号を頑健に再構成できることが示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:36:57 GMT)
Seeing the Abstract: Translating the Abstract Language for Vision Language Models [13.1] 本研究は,抽象表現を持つ高表現領域であるファッション領域に焦点をあてる。
最近の大規模マルチモーダルファッションデータセットを分析することで、抽象用語が支配的な存在であることが分かる。
本稿では, 抽象表現をよく表現されたコンクリートにシフトさせるための, 学習不要でモデルに依存しない ACT (Abstract-to-Concrete Translator) を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:14:10 GMT)
A machine learning model for skillful climate system prediction [12.9] 本稿では、29変数に対して、毎日60日間のグローバルな予測を提供するAIベースの気候システムモデルであるFengShun-CSMを紹介する。
このモデルは、ほとんどの変数を予測するために、ECMWF (European Centre for Medium-Range Weather Forecasts) subseasonal-to-seasonal (S2S) モデルよりも大幅に優れている。
特筆すべきは、FengShun-CSMは、海底の極端な事象を予測する大きな可能性を示すことである。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:06:14 GMT)
Publicly Verifiable Secret Sharing: Generic Constructions and Lattice-Based Instantiations in the Standard Model [12.9] 公開検証可能な秘密共有(PVSS)は、ディーラーが株主の集合間で秘密を共有することを許可し、その秘密は後に資格のある参加者の集合から再構築することができる。
PVSSは、電子投票、分散鍵生成、分散ランダム数生成プロトコルなど、様々な応用が実証されている。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:12:20 GMT)
Grassroots Democratic Federation: Fair Governance of Large-Scale, Decentralized, Sovereign Digital Communities [12.9] 我々は、大規模な、分散化された、主権のあるデジタルコミュニティの平等主義的な形成と、公正な民主的ガバナンスに対処することを目指している。
草の根の民主的連合は、デジタルコミュニティの草の根の形成とその合意的連合を通じて進化する。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:07:14 GMT)
LSAQ: Layer-Specific Adaptive Quantization for Large Language Model Deployment [12.8] 大規模言語モデル(LLM)は、様々な領域で例外的なパフォーマンスを示す。
LLMのサイズとメモリ要件を削減した量子化技術は、リソース制限されたエッジデバイスにLLMをデプロイするのに有効である。
適応量子化システムLSAQ(Layer-Specific Adaptive Quantization)を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:41:37 GMT)
Nonparametric IPSS: Fast, flexible feature selection with false discovery control [12.6] 本稿では、任意の特徴重要点にIPSS(Integrated path stability selection)を適用し、有限サンプル偽発見制御を用いた一般的な特徴選択法を提案する。
両手法が偽発見率を正確に制御し,既存手法よりも真正を検出できることを示す。
我々はIPSSGBとIPSSRFを用いて、がんに関連するマイクロRNAや遺伝子を検出し、既存のアプローチよりも少ない特徴でより良い予測が得られることを発見した。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:02:50 GMT)
MergeGuard: Efficient Thwarting of Trojan Attacks in Machine Learning Models [12.4] AIモデルに対するトロイの木馬攻撃は、トリガーに埋め込まれた入力を敵のターゲットクラスに誤って分類する。
MergeGuardの中核は、完全に接続されたレイヤをリニア化およびマージするための新しいポストトレーニング手法である。
We Proof of Concept Evaluation on Transformer model showed that MergeGuard maintains model accuracy while reducing trojan attack success rate。
論文参考訳(メタデータ) (Tue, 06 May 2025 23:26:25 GMT)
Interactive Instance Annotation with Siamese Networks [12.4] 本稿では,オブジェクトトラッキングにおけるSiameseネットワークの利用に触発されたSiamAnnoを提案する。
SiamAnnoはワンショット学習を活用して、境界ボックスを入力として、オブジェクト境界を予測することによって、それまで見られなかったオブジェクトに注釈を付ける。
SiamAnnoは、複数のデータセットにわたる最先端(SOTA)パフォーマンスを実現し、ドメインと環境のシフトを処理する能力を示している。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:04:56 GMT)
Infrared Image Deturbulence Restoration Using Degradation Parameter-Assisted Wide & Deep Learning [12.3] 本研究では,パラメータ支援型マルチフレームネットワークであるDparNetを提案する。
DparNetは、外部の知識なしに、劣化した画像から直接劣化を学習する。
修復性能と効率性において、ステート・オブ・ザ・アーツ(SOTA)法を著しく上回っている。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:34:42 GMT)
Lower Bounds for Greedy Teaching Set Constructions [12.2] 我々は、小さな$k$に対してgreedyアルゴリズムの性能の低いバウンダリを証明した。
ほとんどの場合、我々の下界は小さな定数$c>0$に対して$k le lceil c d rceil$まで伸びる。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:30:01 GMT)
Universal Matrix Multiplication on Quantum Computer [12.1] 行列乗法はパターン認識と機械学習において重要な役割を果たす。
本稿では、普遍的量子行列乗法に対する革新的で実践的なアプローチを紹介する。
基本普遍的量子行列乗法を構築し,それをストラッセンアルゴリズムに拡張する。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:22:50 GMT)
Robust Fairness Vision-Language Learning for Medical Image Analysis [11.8] 視覚言語モデルの堅牢性と公平性を保証するための枠組みを導入する。
このフレームワークは、故障した画像とテキストのペアを特定し調整することで、トレーニング時の損失関数を修正します。
株式規模のAUCを見てみると8.6%の改善が見込まれる。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:59:25 GMT)
Moral Testing of Autonomous Driving Systems [11.7] 自律運転システム(ADS)のモラルテストは、普遍的なモラル原理が欠如しているため、ほぼ不可能である。
本稿では、まず、既存の道徳実験や社会科学理論から派生した道徳的メタプリンシプルの集合を抽出し、ADSの広く認識され、常識的な道徳的価値を捉えることを目的とする。
本稿では,潜在的な道徳的問題を体系的に同定するメタモルフィックテストフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:29:58 GMT)
Motion-compensated cardiac MRI using low-rank diffeomorphic flow (DMoCo) [11.7] 自由呼吸および非ゲート型3次元心臓磁気共鳴イメージング(MRI)のための教師なしモーション補償画像再構成アルゴリズム
静止画像テンプレートの変形として,各動き位相に対応する画像量を表現する。
より拘束された運動モデルでは、現在の3次元シネMRIの動作補償アルゴリズムと比較して回復性の向上が期待できる。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:52:17 GMT)
Advancing Human-Machine Teaming: Concepts, Challenges, and Applications [11.6] HMT(Human-Machine Teaming)は、AIによる意思決定、信頼キャリブレーション、適応的なチーム編成を統合することで、防衛、医療、自律システムといったドメイン間のコラボレーションに革命をもたらしている。
本調査では,HMTの包括的分類法を示し,強化学習,インスタンスベース学習,相互依存理論などの理論モデルを学際的方法論とともに分析した。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:34:16 GMT)
Demonstrating ViSafe: Vision-enabled Safety for High-speed Detect and Avoid [11.6] 視覚のみの空中衝突回避システムであるViSafeについて紹介する。
ViSafe は Detect and Avoid (DAA) 問題に対するフルスタックソリューションを提供する。
ViSafeは、さまざまなシナリオにまたがって、継続的に自己分離を保証します。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:59:54 GMT)
Automatic Calibration for Membership Inference Attack on Large Language Models [11.5] 我々は、ACMIA(Automatic Membership Inference Attack)と呼ばれる新しいフレームワークを紹介する。
ACMIAは調整可能な温度を校正し、確率を効果的に出力する。
提案した攻撃は、非常に効果的で、堅牢で、一般化可能である。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:15:05 GMT)
CXR-AD: Component X-ray Image Dataset for Industrial Anomaly Detection [11.4] 実世界のX線画像を含む最初の公開アクセス可能なコンポーネントであるX線異常検出データセットを構築した。
データセットには,653の正常サンプルと,正確なピクセルレベルのマスクアノテーションを備えた561の欠陥サンプルを含む,5つの産業コンポーネントカテゴリが含まれている。
我々の知る限り、CXR-ADは、コンポーネント異常検出のための初めての公開X線データセットである。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:38:24 GMT)
Improving Failure Prediction in Aircraft Fastener Assembly Using Synthetic Data in Imbalanced Datasets [11.4] 本稿では,スレッデッドファスナーの効率的かつ安全な組立のための誤り検出と分類の重要性を強調する。
本稿では,クラス重み付けやデータ強化,特に時系列データに適した手法を提案し,分類性能を向上させる。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:45:50 GMT)
DocSpiral: A Platform for Integrated Assistive Document Annotation through Human-in-the-Spiral [11.3] 多くのダウンストリームタスクにおいて、ドメイン固有の画像ベースのドキュメントから構造化されたデータを取得することが不可欠である。
多くの文書は機械可読テキストではなく画像として存在し、自動抽出システムの訓練には人間のアノテーションが必要である。
初となるHuman-in-the-Spiral補助文書アノテーションプラットフォームDocSpiralについて述べる。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:02:42 GMT)
Convergence Of Consistency Model With Multistep Sampling Under General Data Assumptions [11.3] 自己整合性特性がトレーニング分布のほぼ下にある場合の整合性モデルの収束性について検討する。
私たちの分析では、軽度のデータ仮定しか必要とせず、フォワードプロセスのファミリーに適用される。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:31:10 GMT)
Reinforced Correlation Between Vision and Language for Precise Medical AI Assistant [11.2] RCMedは、入力と出力の両方におけるマルチモーダルアライメントを改善するフルスタックAIアシスタントである。
不規則な病変と微妙な解剖学的境界の文脈化において最先端の精度を達成する。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:00:08 GMT)
Uncertainty-Aware Large Language Models for Explainable Disease Diagnosis [11.1] ConfiDx(コンフィデックス)は、オープンソースのLLMを微調整し、診断基準で作成した、不確実性を考慮した大規模言語モデル(LLM)である。
タスクを形式化し、さまざまな診断の曖昧さを捉えるリッチな注釈付きデータセットを組み立てました。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:12:48 GMT)
Taking a Big Step: Large Learning Rates in Denoising Score Matching Prevent Memorization [11.1] 十分な学習率で勾配降下訓練を行うと、ニューラルネットワークは最小限の局所的な最小限に収束することができない。
実験は,1次元の設定を超えても,記憶予防において学習速度が重要な役割を担っていることを検証した。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:17:30 GMT)
StableMotion: Training Motion Cleanup Models with Unpaired Corrupted Data [11.0] モーションキャプチャー(モキャップ)データは、しばしば不正確なセンサーや後処理のために視覚的にジャリングされたアーティファクトを示す。
従来のデータ駆動型モーションクリーニング手法では、ペアの破損したクリーンなトレーニングデータが必要である。
我々は、不正な破損したデータセットから直接、動作のクリーンアップモデルをトレーニングするための、シンプルで効果的な方法であるStableMotionを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:02:47 GMT)
CALLM: Understanding Cancer Survivors' Emotions and Intervention Opportunities via Mobile Diaries and Context-Aware Language Models [11.0] 本論文は, 移動日記を通じて, がん生存者の感情状態とジャスト・イン・タイム介入の機会に関連する重要な変数を理解することを目的とする。
本稿では,Large Language Models (LLM) とRetrieval-Augmented Generation (RAG) を組み合わせた文脈認識フレームワークであるCALLMを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:04:18 GMT)
Reducing Annotation Burden in Physical Activity Research Using Vision-Language Models [11.0] 2つの自由生活検証実験において、3つの視覚言語モデルと2つの識別モデルの性能を比較した。
単一の画像から鎮静行動を予測する際に,最高のオープンソース視覚言語モデル (VLM) と微調整識別モデル (DM) が同等の性能を示した。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:49:45 GMT)
Queueing Matching Bandits with Preference Feedback [11.0] 我々は、一方のN$キューと他方のK$サーバからなるマルチクラス非対称キューシステムについて検討する。
各ジョブサーバ割り当てのサービスレートは未知であり、機能ベースのMNL(Multi-nomial Logit)関数によってモデル化される。
我々は,UCBとトンプソンサンプリングに基づくアルゴリズムを提案する。このアルゴリズムは,待ち時間の平均値が$O(minN,K/epsilon)$に制限されたシステム安定性を実現する。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:36:56 GMT)
Gap the (Theory of) Mind: Sharing Beliefs About Teammates' Goals Boosts Collaboration Perception, Not Performance [10.9] そこで我々は,AIエージェントが人間のチームメイトの目標を推定して理解する能力が,タスクパフォーマンスと認識されたコラボレーションを改善することができるかどうかを検討する。
目標共有情報はタスクパフォーマンスや全体的な満足度スコアに大きな改善は得られなかったが、セマンティック分析により、戦略的適応と協調に対する主観的認識を支持したことが示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:15:24 GMT)
Sharp Global Guarantees for Nonconvex Low-rank Recovery in the Noisy Overparameterized Regime [10.8] 本稿では,従来の競合する2つのアプローチを統一し,単純化し,強化する新しい証明手法を提案する。
近2次点が,より高価な凸法と同じミニマックス回復限界を達成することを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:29:39 GMT)
Nonnegative Low-rank Matrix Recovery Can Have Spurious Local Minima [10.8] 古典的低ランク行列回復問題に対処する。
本稿では、基底真理が回復されたとき、良性非負性が共通のランクを維持し続けるかどうかを考察する。
しかし、驚くべきことに、この性質は部分的に保存されたケースにまで拡張されない。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:43:35 GMT)
Simulating Nighttime Visible Satellite Imagery of Tropical Cyclones Using Conditional Generative Adversarial Networks [10.8] 可視光(VIS)画像は熱帯サイクロン(TC)の監視に重要であるが、夜間は利用できない。
本研究では,夜間のVIS画像を生成するために,CGAN(Conditional Generative Adversarial Networks)モデルを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 23:28:35 GMT)
PiCo: Enhancing Text-Image Alignment with Improved Noise Selection and Precise Mask Control in Diffusion Models [10.8] これら2つの要因に対処するための2つの重要な要素を持つ新しいトレーニング不要なアプローチであるPiCo(Pick-and-Control)を提案する。
まず、ランダムノイズの品質を評価し、対象のテキストに適したノイズかどうかを判定するノイズ選択モジュールを開発する。
第2に,画素レベルのマスクを生成するための参照マスクモジュールを導入し,横断アテンションマップを正確に調整する。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:38:13 GMT)
PARC: Physics-based Augmentation with Reinforcement Learning for Character Controllers [10.6] 人間は多様な複雑な環境をナビゲートし、アジャイルなモータースキルを身につけている。
これらのアジャイルの動きをシミュレートされた文字で再現することは、モーションキャプチャデータが不足しているため、依然として困難である。
PARCは、機械学習と物理に基づくシミュレーションを利用して、動きデータセットを反復的に拡張するフレームワークである。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:29:07 GMT)
Rainbow Delay Compensation: A Multi-Agent Reinforcement Learning Framework for Mitigating Delayed Observation [10.5] 実世界のマルチエージェントシステムでは、観測遅延はユビキタスであり、エージェントが環境の真の状態に基づいて決定を下すのを防ぐ。
遅延特性の異なるこれらの離散観測成分は、マルチエージェント強化学習(MARL)において重要な課題となる。
まず、分散化された個別遅延部分観測可能決定プロセス(DSID-POMDP)を標準のDec-POMDPを拡張して定式化する。
次に、個々の遅延に対処するMARLトレーニングフレームワークであるRainbow Delay Compensation (RDC)を提案し、その構成モジュールの実装を推奨する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:47:56 GMT)
DEFT: Differentiable Branched Discrete Elastic Rods for Modeling Furcated DLOs in Real-Time [10.5] 実時間DLOモデリングのための微分離散分岐弾性棒
本稿では、実時間(DEFT)におけるFurcated DLOのモデル化のための微分離散分岐弾性ロッドを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:36:35 GMT)
PEEK: Phishing Evolution Framework for Phishing Generation and Evolving Pattern Analysis using Large Language Models [10.5] フィッシングはいまだに広範囲にわたるサイバー脅威であり、攻撃者は詐欺メールを使って被害者を誘惑し、機密情報を暴露している。
深層学習はフィッシング攻撃に対する防御において重要な要素となっているが、これらのアプローチは重大な制限に直面している。
フィッシングメールデータセットの質と多様性を向上するためのPEEK(Phishing Evolution FramEworK)を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:56:53 GMT)
FastRM: An efficient and automatic explainability framework for multimodal generative models [10.2] FastRMは、LVLMの説明可能な関連性マップを効率的に予測する手法である。
FastRMは計算時間を99.8%削減し、メモリフットプリントを44.4%削減した。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:49:11 GMT)
MemeBLIP2: A novel lightweight multimodal system to detect harmful memes [10.2] 画像とテキストの特徴を効果的に組み合わせることで有害なミームを検出する軽量マルチモーダルシステムであるMemeBLIP2を紹介する。
我々は、画像とテキストの表現を共有空間に整列させるモジュールを追加し、より良い分類のためにそれらを融合させることにより、以前の研究に基づいて構築した。
その結果,MemeBLIP2は,皮肉な内容や文化的な内容であっても,両モードとも微妙な手がかりを捉えることができることがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:01:50 GMT)
Variational Inference for Uncertainty Quantification: an Analysis of Trade-offs [10.1] p$ が分解されない場合、任意の分解された近似 $qin Q$ は以下の3つの不確実性尺度のうちの1つを正確に推定できることを示す。
古典的なKullback-Leiblerの発散、より一般的な$alpha$-divergences、および$nabla log p$と$nabla log q$を比較するスコアベースの発散を考える。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:09:19 GMT)
A Preliminary Framework for Intersectionality in ML Pipelines [9.9] 機械学習技術は、社会的アイデンティティや経験を適切にサポートしないかもしれないと我々は主張する。
我々はこのフレームワークを用いて、機械学習文学における交叉性応用の(ミス)アライメントを評価し、報告する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:57:56 GMT)
Base-Detail Feature Learning Framework for Visible-Infrared Person Re-Identification [9.9] Visible-infrared person re-identification (VIReID)は24時間のシナリオでReIDタスクのソリューションを提供する。
本稿では,基礎知識と詳細知識の両方の学習を促進するベース詳細特徴学習フレームワーク(BDLF)を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:14:07 GMT)
Nonperiodic dynamic CT reconstruction using backward-warping INR with regularization of diffeomorphism (BIRD) [9.9] 本稿では,非周期的動的CT再構成のための新しい INR ベースのフレームワーク BIRD を提案する。
これらの課題に対処するためには、後方回転変形、運動補償型解析再構成、効率的な4次元座標符号化のための次元還元設計の4つの重要な貢献がある。
このフレームワークは、一拍動心再建、機能画像のための撮影画像シーケンス、従来のCTスキャンにおける運動アーティファクトの縮小など、潜在的な臨床応用でより正確な動的CT再構成を可能にする。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:01:40 GMT)
Domain Adversarial Training for Mitigating Gender Bias in Speech-based Mental Health Detection [9.8] 本稿では,音声による抑うつとPTSD検出において,性差を明確に考慮するドメイン逆行訓練手法を提案する。
その結果,F1スコアはベースラインに比べて最大13.29ポイント向上することがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:29:14 GMT)
Knowledge Distillation for Speech Denoising by Latent Representation Alignment with Cosine Distance [9.7] 本稿では,よく知られたデノナイジング・オートエンコーダ・フレームワークを利用して,この問題に対処する手法を提案し,評価する。
提案手法により, 学生は, 学習者に対して, 学習者に対して, より良く, かつ, ミスマッチ状態も維持できることが示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:28:28 GMT)
MoM: Linear Sequence Modeling with Mixture-of-Memories [9.7] 我々はMixture-of-Memories (MoM)と呼ばれる新しいアーキテクチャを導入する。
MoMは複数の独立したメモリ状態を利用し、ルータネットワークは入力トークンを特定のメモリ状態に誘導する。
MoMは、既存の線形シーケンスモデリング技術を超え、リコール集約タスクにおいて非常によく機能する。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:11:19 GMT)
Attention-aggregated Attack for Boosting the Transferability of Facial Adversarial Examples [9.6] 敵対的な例では、ディープラーニングモデルの脆弱性を明らかにし、情報セキュリティに関する深刻な懸念を提起している。
本稿では, FR に対する敵例の転送性を高めるために, 注意凝集攻撃 (AAA) という新たな攻撃手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:02:56 GMT)
An Empirical Risk Minimization Approach for Offline Inverse RL and Dynamic Discrete Choice Model [9.5] 機械学習において、動的選択(DDC)モデル(オフライン最大エントロピー正規化逆強化学習(オフラインMaxEnt-IRL))を推定する問題について検討する。
目的は、オフラインの振舞いデータからエージェントの振舞いを管理する$Q*$関数をリカバリすることである。
線形パラメータ化報酬の制限的仮定を使わずにこれらの問題を解くための大域収束勾配法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:12:37 GMT)
STG: Spatiotemporal Graph Neural Network with Fusion and Spatiotemporal Decoupling Learning for Prognostic Prediction of Colorectal Cancer Liver Metastasis [9.5] 大腸癌肝転移(KCCM)を予測するためのマルチモーダル時間グラフニューラルネットワーク(STG)フレームワークを提案する。
我々のSTGフレームワークはCT画像と臨床データをヘテロジニアスグラフ構造に結合し,腫瘍分布エッジの同時モデリングと時間的進化を可能にする。
軽量版ではパラメータ数を78.55%削減し、最先端の性能を維持している。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:41:34 GMT)
Towards Predicting Temporal Changes in a Patient's Chest X-ray Images based on Electronic Health Records [9.4] 本稿では,従来のCXRとその後の医療イベントを統合することで,将来のCXR画像を予測する新しいフレームワークであるEHRXDiffを提案する。
その結果、我々のフレームワークは、潜在的時間的変化を効果的に捉えた高品質で現実的な未来像を生成することがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 00:52:51 GMT)
Familiarizing with Music: Discovery Patterns for Different Music Discovery Needs [9.4] 我々は,大手音楽ストリーミングプラットフォームであるDeezerの利用者が回答した調査データと,ストリーミングデータとを組み合わせて分析した。
まず,不慣れな音楽に強い関心を抱くユーザーが,より多様な音楽に耳を傾けるかどうかを問う。
次に、不慣れな音楽を探究する際、ユーザーがどの曲を聴くかを調査し、人気度とジャンルの代表性の明確なパターンを特定する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:26:00 GMT)
Towards Application-Specific Evaluation of Vision Models: Case Studies in Ecology and Biology [9.3] 強力な機械学習性能(例:87% mAP)を持つモデルでさえ、専門家由来のデータと比較して、アバンダンス推定に矛盾をもたらすデータが得られることを示す。
これらの知見に触発され,生態・生物学的データセットにアプリケーション固有の指標を統合するよう研究者に呼びかけた。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:17:58 GMT)
Robust entangled photon generation enabled by single-shot Floquet driving [9.2] 共鳴2光子励起によって駆動される量子エミッタは、決定論的に生成される絡み合った光子対の主源である。
ここでは、ロバスト性を大幅に向上し、レーザフィルタリングの要求を低減したバイエクシトン調製方式をいかに特定できるかを示す。
バイオエクシトン占有率は96%を超え、93.4%の忠実度で光子対の絡み合いを保っている。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:07:11 GMT)
Uncertainty-Aware Prototype Semantic Decoupling for Text-Based Person Search in Full Images [9.2] テキストに基づく歩行者探索 (TBPS) は, 対象歩行者の位置を自然言語で特定することを目的としている。
MUE(Multi-granularity Uncertainity Estimation)、PUD(Prototype-based Uncertainity Decoupling)、ReID(Cross-modal Re-identification)の3つのモジュールからなる新しいフレームワークであるUDD-TBPSを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:25:30 GMT)
Tri-MTL: A Triple Multitask Learning Approach for Respiratory Disease Diagnosis [9.2] マルチタスク学習(MTL)は、病気の症状を伴う呼吸音パターンを同時にモデル化するための魅力的な枠組みを提供する。
本研究は,MTLと最先端の深層学習アーキテクチャの統合が呼吸音の分類と疾患診断の双方をいかに向上させるかを検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:25:15 GMT)
Say It Another Way: A Framework for User-Grounded Paraphrasing [9.2] プロンプトがどのように語られるかの小さな変化は、大きな言語モデルの振る舞いに有意義な違いをもたらす可能性がある。
本稿では,最小限の言語変換の分類に基づく制御された言い換えフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:17:30 GMT)
Phenotype-Guided Generative Model for High-Fidelity Cardiac MRI Synthesis: Advancing Pretraining and Clinical Applications [9.1] 本稿では, 多様なCMRデータを生成するための新しいアプローチとして, CPGG(Cardiac Phenotype-Guided CMR Generation)を提案する。
CPGGフレームワークは2つの段階から構成されており、第1段階では、CMRデータ由来の心臓表現型を用いて生成モデルを訓練する。
第2段階では、これらの表現型に条件付けされたマスク付き自己回帰拡散モデルが高忠実度CMRシネ配列を生成する。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:06:41 GMT)
OccCylindrical: Multi-Modal Fusion with Cylindrical Representation for 3D Semantic Occupancy Prediction [9.1] そこで我々は,OccCylindricalを提案する。
提案手法は, より微細な形状の細部を保存し, 性能を向上する。
雨と夜間のシナリオに挑戦するnuScenesデータセットで実施された実験は、我々のアプローチの有効性と最先端のパフォーマンスを確認します。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:12:31 GMT)
CB-cPIR: Code-Based Computational Private Information Retrieval [9.1] CB-cPIR(CB-cPIR)は、コードベースの暗号からセキュリティを導出する、単一サーバのコードに基づく計算プライベート情報検索方式である。
このスキームは、Holzbaur、Hollanti、Wachter-Zehによって提案された、コードベースのcPIRスキームに強くインスパイアされている。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:34:44 GMT)
Concept Factorization via Self-Representation and Adaptive Graph Structure Learning [9.0] 本稿では,自己表現と適応グラフ構造学習(CFSRAG)モデルに基づく概念因子化を提案する。
CFSRAGは自己表現法を用いてデータ間の親和性関係を学習し、学習された親和性行列を用いて動的グラフ正規化制約を実装する。
その結果、我々のモデルは、他の最先端モデルよりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:12:59 GMT)
RIFT: Closed-Loop RL Fine-Tuning for Realistic and Controllable Traffic Simulation [9.0] データ駆動シミュレータでオープンループ模倣学習を事前学習し、軌道レベルのリアリズムとマルチモーダリティをキャプチャする2段階AV中心シミュレーションフレームワークを提案する。
微調整の段階では、トラジェクトリレベルの多モード性を保持するシンプルな、かつ効果的な閉ループRL微調整戦略であるRIFTを提案する。
大規模な実験により、RIFTは生成された交通シナリオの現実性と制御性を大幅に改善することが示された。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:12:37 GMT)
Distilling Two-Timed Flow Models by Separately Matching Initial and Terminal Velocities [8.8] TTFM蒸留における新しい損失関数として,Emphinitial/terminal velocity matching (ITVM) lossを提案する。
予備実験により、これらの損失は、複数のタイプのデータセットにおいて、より少ないステップ生成性能をもたらすことが示された。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:22:46 GMT)
TTT: A Temporal Refinement Heuristic for Tenuously Tractable Discrete Time Reachability Problems [8.7] 複雑な制御系に対する到達可能性解析は、しばしば遅すぎるか過度に保守的である。
本稿では, 時間的改善という概念を紹介し, 到達可能性問題の地平線に沿って自動的に選択し, 遅いシンボリッククエリを実行する。
提案アルゴリズムは,20~70%の時間で,ベースラインに類似した誤差で近似到達可能な集合を生成することができることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:18:38 GMT)
BURNS: Backward Underapproximate Reachability for Neural-Feedback-Loop Systems [8.7] 本稿では,非線形離散時間ニューラルフィードバックループの下位到達可能な集合を計算するためのアルゴリズムを提案する。
次に、後方到達可能なセットを使用してゴール到達特性をチェックします。
私たちの研究は、学習可能なシステムで検証可能なプロパティのクラスを拡張します。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:50:43 GMT)
Co-NavGPT: Multi-Robot Cooperative Visual Semantic Navigation Using Vision Language Models [8.7] Co-NavGPTは、ビジョン言語モデル(VLM)をグローバルプランナーとして統合する新しいフレームワークである。
Co-NavGPTは、多様な視点を持つ複数のロボットのサブマップを統一されたグローバルマップに集約する。
VLMはこの情報を使って、ロボット全体のフロンティアを割り当て、協調的で効率的な探索を容易にする。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:06:58 GMT)
Decision Making under Model Misspecification: DRO with Robust Bayesian Ambiguity Sets [8.6] ベイジアン・アンビグニティ・セット(DRO-RoBAS)の誤用をモデル化するRobustを紹介する。
これらは、頑健な後続予測分布を中心とする最大平均離散的曖昧性集合である。
得られた最適化問題は、再生ケルネルヒルベルト空間において双対な定式化が得られることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:46:16 GMT)
RAIL: Region-Aware Instructive Learning for Semi-Supervised Tooth Segmentation in CBCT [8.6] Region-Aware Instructive Learning (RAIL) は、CBCT歯のセグメンテーションのための2つのグループからなる半教師付きフレームワークである。
私たちのコードはhttps://github.com/Tournesol-Saturday/RAILで公開されます。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:50:57 GMT)
Characterising Topic Familiarity and Query Specificity Using Eye-Tracking Data [8.4] 本研究では,瞳孔拡張と視線速度のみに依存する記憶関連認知次元について検討した。
実験室のユーザスタディ(N=18)で収集した視線追跡データを用いて,トピックの親しみ度を予測するために,マクロF1スコアの71.25%を達成した。
本研究は、検索におけるトピックの親しみとクエリの特異性をよりよく理解するために、視線追跡が可能であることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:22:04 GMT)
Policy-labeled Preference Learning: Is Preference Enough for RLHF? [8.4] 本研究では,行動政策情報を反映した,後悔を伴う人間の嗜好をモデル化することで,ミスマッチの可能性を解消するための政策ラベル付き嗜好学習(PPL)を提案する。
高次元連続制御タスクの実験は、PPLがオフラインのRLHF性能を大幅に改善し、オンライン環境での有効性を示した。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:09:55 GMT)
Bellman Unbiasedness: Tractable and Provably Efficient Distributional Reinforcement Learning with General Value Function Approximation [8.4] 有限エピソードマルコフ決定過程における一般値関数近似を用いた分布強化学習の後悔の解析を行った。
証明可能なアルゴリズムである$textttSF-LSVI$を提案し、$tildeO(d_E Hfrac32sqrtK)$で、$H$は地平線、$K$はエピソード数、$d_E$は関数クラスの退化次元である。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:02:40 GMT)
Attonsecond Streaking Phase Retrieval Via Deep Learning Methods [8.4] 電子力学をフェムト秒以下の時間スケールで解くためには、アト秒ストリーキング位相の探索が不可欠である。
この作業では、制御されたコンピュータビジョン問題としてフェーズ検索を再構成し、4つのニューラルアーキテクチャを比較した。
畳み込みネットワークは、局所的なストリークエッジに対して強い感度を示すが、グローバルなコンテキストに欠ける。
視覚変換器は、局所誘導バイアスを犠牲にして長距離遅延エネルギー相関をキャプチャする。
カプセルネットワークは、動的ルーティングを通じて空間的ポーズ合意をさらに強制する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:16:42 GMT)
Synthesizing Images on Perceptual Boundaries of ANNs for Uncovering and Manipulating Human Perceptual Variability [8.1] 認知的タスクや日常生活における人間の意思決定は、タスクの難易度、個人の好み、個人的な経験などの要因によって形成される、かなりの多様性を示す。
本稿では、ANNにおける知覚境界サンプリングと人間の行動実験を組み合わせて、この現象を解明する計算フレームワークを提案する。
我々の知覚境界サンプリングアルゴリズムは、ANN決定境界に沿って刺激を生成し、本質的に重要な知覚変数を誘導する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:44:42 GMT)
Terahertz Spatial Wireless Channel Modeling with Radio Radiance Field [8.0] Terahertz (THz) 通信は6Gシステムにとって重要な機能であり、超広帯域幅と前例のないデータレートを提供する。
本研究では,THz帯への無線放射場(RRF)フレームワークの適用可能性について検討する。
本手法は,高密度サンプリングを伴わない効率的な空間チャネル状態情報(Spatial-CSI)モデリングを可能にする。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:38:33 GMT)
MedArabiQ: Benchmarking Large Language Models on Arabic Medical Tasks [7.8] 本研究は、7つのアラビア医療タスクからなる新しいベンチマークデータセットであるMedArabiQを紹介する。
筆者らはまず,過去の医学試験と公開データセットを用いてデータセットを構築した。
次に、バイアス緩和を含む様々なLCM機能を評価するために、異なる修正を導入した。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:07:26 GMT)
Preliminary Explorations with GPT-4o(mni) Native Image Generation [7.7] 近年、GPT-4o(mni)による視覚生成能力はOpenAIによってアンロックされている。
本稿では,様々なタスクにまたがるGPT-4oの能力について検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:35:29 GMT)
Show or Tell? A Benchmark To Evaluate Visual and Textual Prompts in Semantic Segmentation [7.6] セマンティックセグメンテーションのための視覚的プロンプトとテキスト的プロンプトの両方を評価するために特別に設計された新しいベンチマークを提案する。
5つのオープン語彙法と4つの視覚的参照プロンプトアプローチを評価し,後者を多クラスセグメンテーションに適応させる。
実験の結果,オープンボキャブラリ法はテキストで簡単に記述できるが,ツールのような複雑なドメインでは困難であることがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:15:30 GMT)
Deepfakes on Demand: the rise of accessible non-consensual deepfake image generators [7.5] 本稿では,オンライン上でのディープフェイクモデルのアクセシビリティについて,実証的研究を行った。
一般にダウンロード可能なディープフェイクモデルの約35,000の例が特定されている。
これらの結果は、ディープフェイクやNCIIの創出に対して、より大きな行動を取ることの必要性を強調している。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:00:59 GMT)
Scratch Copilot: Supporting Youth Creative Coding with AI [7.5] Cognimates Scratch Copilot: Scratchライクな環境に統合されたAIアシスタント。
本稿では,18人の国際児童を対象とした探索的質的評価から,システムアーキテクチャと知見を詳述する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:13:29 GMT)
Prediction Models That Learn to Avoid Missing Values [7.3] 失敗回避機械学習(英: Missingness-avoiding、MA)は、テスト時に欠落する機能の価値をほとんど必要としないモデルをトレーニングするためのフレームワークである。
我々は,決定木,木アンサンブル,疎線形モデルに適したMA学習アルゴリズムを作成する。
我々のフレームワークは、テスト時に欠落した値の予測において、解釈可能性を維持する強力なツールを提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:16:35 GMT)
Stop treating `AGI' as the north-star goal of AI research [7.3] 我々は、人工知能(AGI)の話題に焦点をあてることが、効果的な目標を選択する能力を損なうと論じている。
AGIの談話によって増大する6つの重要なトラップ、すなわち生産目標設定の障害を特定します。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:11:55 GMT)
Deep Learning in Renewable Energy Forecasting: A Cross-Dataset Evaluation of Temporal and Spatial Models [7.3] 本研究は, 早期停止, ニューロン減少, L2正則化などの正規化アプローチを展開し, DLモデルに係わる過度適合問題を軽減した。
LSTMとモデルは優れた性能を示し、検証データは極端に低いルート平均二乗誤差値を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:05:19 GMT)
Sustainable Smart Farm Networks: Enhancing Resilience and Efficiency with Decision Theory-Guided Deep Reinforcement Learning [7.2] 各種のサイバーおよび敵対的脅威下での高品質な動物モニタリングを維持するために設計されたスマートファームネットワークを提案する。
本手法では, モニタリングの有効性とエネルギー効率の両面を最大化する最適な政策を考案するために, 深層強化学習を利用する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:49:06 GMT)
Bias-preserving and error-detectable entangling operations in a superconducting dual-rail system [7.2] 超伝導マイクロ波キャビティに基づくデュアルレール消去量子ビットのための新しい2量子ゲートの設計と実現を行う。
ゲートは高速(シム$500 ns)で、エラー検出後0.1%未満の残差が生じる。
制御量子ビットの少なくとも3倍の頻度で発生する低および非対称な劣化誤差を測るとともに、1ゲートあたり$sim$0.5%の低消去率を測定する。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:08:00 GMT)
Token Communication-Driven Multimodal Large Models in Resource-Constrained Multiuser Networks [7.1] マルチモーダルの大型モデルは インテリジェントなアプリケーションを ワイヤレスエッジに展開する上で
これらの制約は、帯域幅、計算能力、および厳格なレイテンシ要件として表される。
本稿では,ユーザデバイスとエッジインフラストラクチャ間の分散的な拡散を促進するトークン通信パラダイムを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:17:05 GMT)
Weighted Random Dot Product Graphs [7.1] 本稿では,Random Dot Product Graph(RDPG)モデルを拡張し,重み付きグラフに対応する。
本稿では,各ノードに遅延位置の列を割り当てる非パラメトリック重み付き(W)RDPGモデルを提案する。
これらのノルダルベクトルの内部積は、モーメント生成関数を介して入射エッジ重みの分布のモーメントを規定する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:57:00 GMT)
Understanding and Exploiting Plasticity for Non-stationary Network Resource Adaptation [7.0] ニューラルネットワークは可塑性損失に悩まされ,ネットワークの進化に適応する能力が著しく損なわれていることを示す。
リセットサイレントニューロン (ReSiN) は, 前向きおよび後向きの伝播状態によって誘導される戦略的ニューロンリセットを介して神経可塑性を保っている。
適応型ビデオストリーミングシステムの実装において、ReSiNは既存のソリューションよりも大幅に改善されている。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:36:10 GMT)
DiffSpec: Differential Testing with LLMs using Natural Language Specifications and Code Artifacts [7.0] 本稿では,プロンプト連鎖を用いた差分テストを生成するフレームワークであるDiffSpecを紹介する。
DiffSpecの2つの異なる(大規模にテストされた)システム、eBPFランタイム、Wasmバリデータに対する有効性を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:01:33 GMT)
Environmental Quantum States Trigger Emission in Nonlinear Photonics [7.0] 我々は、単一光子状態から大きく逸脱した発光体が、環境の量子状態によって引き起こされ、高度に相関した光子対であるドブロンを放出する新しいメカニズムの発見を報告した。
本研究は,非線形エミッタダイナミクスの理解を深め,量子コンピューティングと量子情報処理のための汎用プラットフォームを提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:40:58 GMT)
An Analysis of Hyper-Parameter Optimization Methods for Retrieval Augmented Generation [7.0] 本稿では,5つのドメインから5つのデータセットにまたがる5つのHPOアルゴリズムに関する総合的研究について述べる。
我々は,RAG HPOを効率よく,あるいは反復的ランダム検索で行うことができ,全データセットにおいてRAG性能を大幅に向上させることができることを示した。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:47:52 GMT)
CounterQuill: Investigating the Potential of Human-AI Collaboration in Online Counterspeech Writing [6.9] 本稿では,AIを利用した音声合成システムであるCounterQuillを紹介する。
CounterQuillは,(1)ヘイトスピーチや反音声を理解するための学習セッション,(2)ヘイトスピーチの重要要素を特定し,対音声戦略を探求するブレーンストーミングセッション,(3)ユーザがCounterQuillと対音声の草案作成と洗練を可能にする共同執筆セッション,の3段階のプロセスを提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:58:40 GMT)
Semi-supervised Underwater Image Enhancement Using A Physics-Aware Triple-Stream Network [6.8] 我々は、物理に基づく画像形成モデル(IFM)と深層学習技術の両方を水中画像強調(UIE)に活用する。
PATS-UIENetは、直接信号伝送推定水蒸気(D-Stream)、後方信号伝送推定水蒸気(B-Stream)、アンビエント光推定水蒸気(A-Stream)からなる。
また、ラベル付き画像とラベルなし画像の両方を利用して、IFMにインスパイアされた半教師付き学習フレームワークを採用し、不十分なデータの問題に対処する。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:31:14 GMT)
Adaptive Rank Allocation: Speeding Up Modern Transformers with RaNA Adapters [6.7] 大規模言語モデルに対するRanc and Neuron Allocator (RaNA) アダプタを提案する。
RaNAはローランク行列分解と適応マスキングを適用してアテンションモジュールの成分を効率的に割り当てるランクアダプタを利用する。
特に、ニューロンアダプタと比較して、RaNAはパープレキシティを最大7ポイント改善し、FLOPを最先端のTransformerアーキテクチャで$sim$44%削減すると、精度を最大8ポイント向上する。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:45:53 GMT)
EMORL: Ensemble Multi-Objective Reinforcement Learning for Efficient and Flexible LLM Fine-Tuning [6.7] 個別の目的を持つ複数のモデルを微調整するEnsemble Multi-Objective RL (EMORL) フレームワークを提案する。
本手法は,複数の目的からコンテキスト情報を組み込んで,各モデルの最後に隠された状態を収集する最初の方法である。
PAIR と Psych8k データセットの実験において,EMORL の既存のベースラインに対する利点を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:26:11 GMT)
Continuous Transition between Bosonic Fractional Chern Insulator and Superfluid [6.6] この手紙は、位相的に順序付けられた位相と自発な連続対称性破壊相の間の連続FCI-SF遷移の直接数値的なデモンストレーションを示す。
さらに、チャーンバンドの分散を徐々に平坦化することにより、ゼロフィールドボソニックFCIがSF状態から実現される可能性があることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:37:23 GMT)
Elevating Cyber Threat Intelligence against Disinformation Campaigns with LLM-based Concept Extraction and the FakeCTI Dataset [6.5] 本稿では,繰り返しの物語から派生した高レベルな意味指標と偽情報キャンペーンの関係に着目した新しいCTIフレームワークを提案する。
フェイクニュースを偽ニュースキャンペーンや脅威アクターに体系的に関連付ける最初のデータセットであるFakeCTIを紹介する。
この研究は、低レベルのアーティファクトから永続的な概念構造へと焦点を移し、偽情報の追跡と対策にスケーラブルで適応的なアプローチを確立した。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:13:32 GMT)
HadamRNN: Binary and Sparse Ternary Orthogonal RNNs [6.5] ニューラルネットワークにおけるバイナリおよびスパース3次重みは、より高速な計算とより軽い表現を可能にする。
バニラRNNは反復重みの変化に敏感であり、これらの重みの双対化と三元化は本質的に困難である。
本稿では,アダマール行列の特性を利用して二進行列および三進行列のサブセットをパラメータ化する手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:45:34 GMT)
Is In-Context Learning a Type of Error-Driven Learning? Evidence from the Inverse Frequency Effect in Structural Priming [6.4] 大規模言語モデル(LLM)は、文脈内学習(ICL)の創発的能力を示している。
ある研究の行は、ICLは、エラー駆動学習機構の一種である降下勾配と機能的に等価であると主張している。
我々は、ICLがエラー駆動学習を機能的に実行しているかどうかを診断する新しい方法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:39:43 GMT)
Survey of Data-driven Newsvendor: Unified Analysis and Spectrum of Achievable Regrets [6.4] Newsvendor の問題では、ある分布から引き出される数を推測することが目的である。
データ駆動バージョンでは、分散は未知であり、分散からのサンプルを扱う必要がある。
本稿では、これらの変種の組み合わせをすべて研究し、文献の多くのギャップを埋め、多くの証明を単純化する。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:24:39 GMT)
A Unifying Bias-aware Multidisciplinary Framework for Investigating Socio-Technical Issues [6.3] 本稿では,社会科学(SS)とコンピュータ科学(CS)の分野を統合することを目的とする。
社会科学と機械学習(ML)の様々な分析手法を構造化シーケンスに適用し、調査対象の特定と定量化の手法に到達した。
このフレームワークの中核的な特徴は、バイアスが発生する場所を強調し、それを緩和するためのステップを提案することである。
筆者らは,英国におけるデジタル化社会住宅サービスへのアクセス・利用において,少数民族(ME)コミュニティが直面したオンライン被害の多分野調査に利用した。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:52:04 GMT)
Magnetic-field dependent VB- spin decoherence in hexagonal boron nitrides: A first-principles study [6.3] 第一原理量子多体シミュレーションを用いて、h-BNにおけるVB-スピンのスピンデコヒーレンスを解析する。
我々は、遷移境界(TB)と呼ばれる特定の磁場でデコヒーレンス機構が変化することを発見した。
以上の結果から,h-10BN の TB は11B よりも大きい10B の核スピンに由来することが明らかとなり,11BN よりも広い範囲の磁場に対して強い核変調効果が生じることが示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:39:48 GMT)
Variable-Speed Teaching-Playback as Real-World Data Augmentation for Imitation Learning [6.3] 本稿では、実世界のデータセットの利点を保ちながら、力制御に適用可能な新しいデータ拡張法を提案する。
位置力制御を備えた模擬学習法を用いて、双方向制御に基づく模擬学習実験を行った。
その結果, 実世界の反応速度の変化により, 成功率の最大55%が向上した。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:54:15 GMT)
Social Opinions Prediction Utilizes Fusing Dynamics Equation with LLM-based Agents [6.2] 本研究では, Fusing Dynamics Equation-Large Language Model (FDE-LLM) アルゴリズムを提案する。
この革新的なアプローチは、大規模言語モデルにおける意見の行動と進化を、ソーシャルネットワーク上の実世界のデータと整合させる。
我々のアルゴリズムは、時間とともに意見の崩壊と回復を正確にシミュレートする。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:53:37 GMT)
SD-VSum: A Method and Dataset for Script-Driven Video Summarization [6.1] スクリプト駆動のビデオ要約(VideoXum)の課題を紹介する。
我々は、ビデオ毎に利用できる異なる人間注釈の要約を自然言語で記述する。
我々はスクリプト駆動のビデオ要約(SD-VSum)のための新しいネットワークアーキテクチャを開発した。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:47:14 GMT)
Geospatial Mechanistic Interpretability of Large Language Models [6.0] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる前例のない機能を示している。
我々の目的は、これらの複雑なモデルが地理的情報を処理しながら生成する内部表現の理解を深めることである。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:40:06 GMT)
TinyCL: An Efficient Hardware Architecture for Continual Learning on Autonomous Systems [6.0] 資源制約された自律システム上で連続学習を行うためのハードウェアアーキテクチャであるTinyCLを提案する。
TinyCLは、前方と後方の両方の伝搬を実行する処理ユニットと、メモリベースのCLワークロードを管理する制御ユニットで構成される。
我々の知る限り、提案したTinyCLは、自律システム上でCLを実行する最初のハードウェアアクセラレータである。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:46:23 GMT)
Catch Me if You Search: When Contextual Web Search Results Affect the Detection of Hallucinations [5.9] 近年,ウェブ検索の結果を大規模言語モデル (LLM) に統合することで,人々が生成したコンテンツの検証に利用するかどうかが疑問視されている。
本研究は,LLM生成コンテンツの参加者の認識精度に及ぼす検索結果提供の影響について検討した。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:40:04 GMT)
Theoretical framework for enhancing or enabling cooling of a mechanical resonator via the anti-Stokes or Stokes interaction and zero-photon detection [5.9] 我々は、ゼロ光子検出が反ストークス相互作用によるレーザー冷却を高めるためにどのように利用されるかを記述するための理論的枠組みを開発する。
冷却が検出効率や最適協調性などのシステムパラメータにどのように依存するかを論じる。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:12:14 GMT)
Enhanced Laser Cooling of a Mechanical Resonator via Zero-Photon Detection [5.9] 光子の欠如の測定は、幅広い新しい実験的方向性に有意な可能性を秘めている。
反ストークス散乱光場におけるゼロ光子検出による機械共振器の冷却実験を行った。
我々の測定はマスター方程式によってよく捉えられ、ここで導入された技術は、冷却、量子熱力学、量子状態工学、量子計測と制御のための新しい道を開く。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:14:14 GMT)
Rapid AI-based generation of coverage paths for dispensing applications [5.9] 本稿では,熱インターフェース材料に対するディスペンサーパスを生成するための,新しいAIベースのアプローチを提案する。
人工ニューラルネットワーク(ANN)は、目標冷却領域を入力として受信し、ディスペンサーパスを直接出力する。
リアルタイムに望ましいターゲット状態のプロセスパラメータを予測するためにANNを使用するアプローチは、他の製造プロセスに転送される可能性がある。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:13:20 GMT)
LiteWebAgent: The Open-Source Suite for VLM-Based Web-Agent Applications [5.8] LiteWebAgentは、VLMベースのWebエージェントアプリケーションのためのオープンソーススイートである。
私たちのフレームワークは、Webエージェントエコシステムにおける重要なギャップに対処しています。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:42:34 GMT)
Action Spotting and Precise Event Detection in Sports: Datasets, Methods, and Challenges [5.7] ビデオイベント検出はスポーツ分析の重要な要素となり、重要な瞬間の自動識別を可能にしている。
近年のディープラーニング、特にCNNやTransformersは、イベント検出の精度と効率を大幅に改善している。
この調査は、効率的、一般化可能、マルチモーダルスポーツイベントの検出に関する将来の研究の基盤となっている。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:02:30 GMT)
Resolving Memorization in Empirical Diffusion Model for Manifold Data in High-Dimensional Spaces [5.7] 慣性拡散モデル(Inertial diffusion model)は、新しいデータサンプルを生成する一般的な計算ツールである。
我々は、慣性拡散モデルサンプル分布を選択することは、次元$d$の$C2$多様体上のデータ分布の$Oleft(n-frac2d+4right)$Wasserstein-1近似であることを示す。
注目すべきは、この上界が周囲空間次元から完全に解放されることである。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:10:46 GMT)
SLOT: Structuring the Output of Large Language Models [5.7] SLOT(Structured LLM Output Transformer)は,非構造化LCM出力を正確な構造化形式に変換するモデルに依存しない手法である。
この結果から,制約付き復号化による微調整Mistral-7Bモデルでは,ほぼ完全なスキーマ精度が得られた。
特に、Llama-3.2-1Bのようなコンパクトなモデルでさえ、はるかに大きなプロプライエタリなモデルの出力能力にマッチまたは超えることができる。
論文参考訳(メタデータ) (Tue, 06 May 2025 23:29:43 GMT)
Directed Greybox Fuzzing via Large Language Model [5.7] HGFuzzerは、パス制約問題をターゲットコード生成タスクに変換する自動フレームワークである。
実世界の脆弱性20件についてHGFuzzerを評価し,最初の1分以内に11件を含む17件をトリガーした。
HGFuzzerは9つの既知の脆弱性を発見し、そのすべてにCVE IDが割り当てられた。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:04:07 GMT)
ir_explain: a Python Library of Explainable IR Methods [5.6] irexplainは、共通のフレームワーク内でExplainable IR(ExIR)の様々なテクニックを実装するPythonライブラリである。
irexplainは、ポストホックな説明の標準的な3つのカテゴリ、すなわちポイントワイド、ペアワイド、リストワイドの説明をサポートします。
このライブラリは、標準的なテストコレクションで最先端のExIRベースラインを簡単に再現できるように設計されている。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:08:22 GMT)
Safer Prompts: Reducing IP Risk in Visual Generative AI [5.5] 我々は,画像生成におけるIP侵害リスクを軽減するために,迅速な技術技術の有効性を評価する。
その結果,思考の連鎖と課題指導の連鎖は,生成した画像と拡散モデルの訓練データとの類似性を著しく低下させることがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:10:12 GMT)
Frog Soup: Zero-Shot, In-Context, and Sample-Efficient Frogger Agents [5.5] ドメイン外RLポストトレーニングによる最新の推論LLMは、ゼロショット設定下でFroggerと呼ばれる挑戦的なAtariゲームを実行することができることを示す。
そこで本研究では,LLMの性能に及ぼす文脈内学習と推論の量の影響について検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:51:41 GMT)
Information-theoretic reduction of deep neural networks to linear models in the overparametrized proportional regime [5.4] 我々は、いわゆる比例スケーリング体制において、任意の深さで完全に訓練されたニューラルネットワークを厳格に分析する。
本研究では,教師が学習したデータから学習したベイジアンディープニューラルネットワークモデル間の情報理論等価性を実証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:36:07 GMT)
Towards Effective Identification of Attack Techniques in Cyber Threat Intelligence Reports using Large Language Models [5.3] 本研究は,Web上で利用可能な脅威レポートから攻撃手法を識別するためのサイバー脅威情報(CTI)抽出手法の性能を評価する。
我々は、Threat Report ATT&CK Mapper(TRAM)やLlama2のようなオープンソースのLarge Language Models(LLM)など、最先端ツールを利用する4つの構成を分析した。
以上の結果から, クラス不均衡, オーバーフィッティング, ドメイン固有の複雑性など, 正確なテクニック抽出を阻害する重要な課題が明らかとなった。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:43:12 GMT)
UPMAD-Net: A Brain Tumor Segmentation Network with Uncertainty Guidance and Adaptive Multimodal Feature Fusion [5.2] 本稿では,深層学習と領域成長アルゴリズムから得られた事前知識を組み合わせた脳腫瘍分割法を提案する。
本研究では,U-Netアーキテクチャに基づく新しい3次元脳腫瘍セグメンテーションネットワークを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:56:04 GMT)
Mamba-Diffusion Model with Learnable Wavelet for Controllable Symbolic Music Generation [5.1] シンボリック・ミュージックをイメージライクなピアノロールとして表現し、シンボリック・ミュージックの生成に拡散モデルを用いることを容易にする。
本研究では,提案したTransformer-Mambaブロックと学習可能なウェーブレット変換を組み込んだ新しい拡散モデルを提案する。
評価の結果,本手法は音楽の質と可制御性の観点から説得力のある結果が得られることがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:44:52 GMT)
SAPIENT: Mastering Multi-turn Conversational Recommendation with Strategic Planning and Monte Carlo Tree Search [5.1] 既存の方法は、強欲な行動選択やサンプリング戦略を備えた強化学習エージェントを訓練する。
我々は,モンテカルロ木探索 (MCTS) ベースの CRS フレームワーク SAPIENT を提案する。
SAPIENTは会話エージェント(Sエージェント)と会話プランナー(Sプランナー)で構成される
論文参考訳(メタデータ) (Tue, 06 May 2025 15:08:21 GMT)
CalibRefine: Deep Learning-Based Online Automatic Targetless LiDAR-Camera Calibration with Iterative and Attention-Driven Post-Refinement [5.1] CalibRefineは完全に自動化され、ターゲットレス、オンラインキャリブレーションフレームワークである。
生のLiDAR点雲とカメラ画像を直接処理する。
以上の結果から,頑健なオブジェクトレベルの特徴マッチングと反復的改善と自己監督的注意に基づく改善が組み合わさって,信頼性の高いセンサアライメントを実現することが示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 00:20:42 GMT)
Optimization of Module Transferability in Single Image Super-Resolution: Universality Assessment and Cycle Residual Blocks [5.1] 従来の「一般化」の概念を拡張した「大学」の概念とその関連する定義を紹介する。
モデル間でどの程度容易にモジュールを移植できるかを定量化する指標として,Universality Assessment Equation (UAE)を提案する。
提案したプラグアンドプレイモジュールに埋め込まれたネットワークは,最先端のネットワークよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:35:59 GMT)
Imitation-regularized Optimal Transport on Networks: Provable Robustness and Application to Logistics Planning [4.9] グラフ構造上のエントロピー規則化された最適輸送(OT)は、そのようなネットワーク上での輸送のロバスト性を高めるために研究されている。
本稿では,先行知識をOTの堅牢性に数学的に組み込む模倣規則化OT(I-OT)を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:51:16 GMT)
Vector valued optimal transport: from dynamic to static formulations [4.9] ベクトル値最適輸送の既存の概念を統一する理論を開発する。
特に、論文で論じられた静的定式化の1つは、線形化に適している。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:10:03 GMT)
MDPs with a State Sensing Cost [4.9] 多くの現実的なシーケンシャルな意思決定問題において、環境の状態を追跡すると、検知/通信/計算コストが発生する。
エージェントは次の状態を検知するために追加のコストを発生させるが、システム状態に"盲目"を保ちながらアクションを取るオプションがある。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:06:45 GMT)
Mitigating Backdoor Triggered and Targeted Data Poisoning Attacks in Voice Authentication Systems [4.9] 本稿では,BTAとTDPAの両方を効果的に扱う統一防衛フレームワークを提案する。
筆者らのフレームワークは,ほぼリアルタイムにピッチアップとバックドアアタックを隠蔽する周波数集中検出機構を統合している。
我々の枠組みはTDPAの認識において、攻撃成功率を最大5~15%まで低下させ、リコールレートを最大9~5%まで維持する。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:52:12 GMT)
Deformable Beta Splatting [4.9] 3D Gaussian Splatting (3DGS) はリアルタイムレンダリングにより高度な放射場再構成を行う。
変形可能ベータスプレイティング(DBS)は,形状と色表現を両立させる,変形可能かつコンパクトなアプローチである。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:02:33 GMT)
Honest to a Fault: Root-Causing Fault Attacks with Pre-Silicon RISC Pipeline Characterization [4.8] 本研究の目的は、回路レベルからAI/MLアプリケーションソフトウェアへの障害伝播をトレースしながら、RISC-V命令セットとパイプラインステージ内の障害の影響を特徴づけ、診断することである。
この分析により、制御されたクロックグリッチパラメータによって新たな脆弱性を発見し、特にRISC-Vデコードステージをターゲットにした。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:38:15 GMT)
CRAFT: Characterizing and Root-Causing Fault Injection Threats at Pre-Silicon [4.8] 本研究は, プレシリコンレベルにおいて, 制御されたインジェクション攻撃を行うための包括的方法論を提案する。
駆動アプリケーションとして、クリティカルな誤分類のために、AI/MLアプリケーションにクロックグリッチアタックを使用します。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:38:13 GMT)
Simultaneous Resonant and Broadband Detection of Ultralight Dark Matter and High-Frequency Gravitational Waves via Cavities and Circuits [4.8] シングルモード共振器は広い周波数範囲をカバーするために複数の走査ステップを必要とする。
ビームスプリッタ型および非縮退パラメトリックカップリングによる補助モードを導入する。
ヘテロダインアップコンバージョン検出では、ソース周波数の複数の順序を高感度でプローブすることができる。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:18:49 GMT)
A Multi-Granularity Retrieval Framework for Visually-Rich Documents [4.8] 本稿では,MMDocIRとM2KRの2つのベンチマークタスクに適した,統一されたマルチグラニュラリティマルチモーダル検索フレームワークを提案する。
提案手法は,階層型符号化戦略,モダリティ対応検索機構,視覚言語モデル(VLM)に基づく候補フィルタリングを統合する。
本フレームワークは,タスク固有の微調整を必要とせずに,堅牢な性能を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:52:51 GMT)
A Framework for the Efficient Evaluation of Runtime Assertions on Quantum Computers [4.7] 本研究では,実際の量子コンピュータ上での実行時アサーションの評価を支援するフレームワークを提案する。
さまざまなアサーションを測定セットに変換し、可能な限り実行オーバーヘッドを減らし、ノイズがあっても実行後の結果を評価する。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:00:07 GMT)
Survival Analysis with Machine Learning for Predicting Li-ion Battery Remaining Useful Life [4.6] 本研究では、生存データ再構成、生存モデル学習、生存確率推定を統合したハイブリッド生存分析フレームワークを提案する。
提案手法は, 電池電圧時系列を経路シグネチャを用いた時間から障害データに変換する。
トヨタのバッテリとNASAのバッテリデータセットを用いて行った実験は,我々のアプローチの有効性を実証した。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:28:57 GMT)
A Fusion-Guided Inception Network for Hyperspectral Image Super-Resolution [4.5] 我々はFusion-Guided Inception Network (FGIN)と呼ばれる単一画像の超解像モデルを提案する。
具体的には、まずスペクトル空間融合モジュールを用いて、スペクトル情報と空間情報を効果的に統合する。
インセプションのような階層的特徴抽出戦略は、マルチスケール空間依存をキャプチャするために用いられる。
再構成品質をさらに向上するため,バイリニアと奥行き分離可能な畳み込みを組み合わせた最適化されたアップサンプリングモジュールを組み込んだ。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:15:59 GMT)
Survey of Abstract Meaning Representation: Then, Now, Future [4.5] AMRは文を、ノードが概念に対応し、エッジが関係を表す、ルート付き、有向非巡回グラフとして表現する。
本調査では,AMR機能を中心に,AMRとその拡張について検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:45:40 GMT)
CaRaFFusion: Improving 2D Semantic Segmentation with Camera-Radar Point Cloud Fusion and Zero-Shot Image Inpainting [4.4] 本稿では,拡散モデルをカメラレーダ融合アーキテクチャに統合することにより,カメラのみのベースラインを強化する新しいフレームワークを提案する。
レーダ点の特徴を活用して,Segment-Anythingモデルを用いて擬似マスクを作成し,投射されたレーダ点を点のプロンプトとして扱う。
提案手法は,mIoUにおけるカメラのみのセグメンテーションベースラインを2.63%改善し,Waterscenesデータセット上でのカメラとレーダーの融合アーキテクチャを1.48%向上させる。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:25:38 GMT)
Automating Traffic Model Enhancement with AI Research Agent [4.4] TR-Agentは、交通モデルを自律的に開発、洗練するAI駆動のフレームワークである。
我々は,研究パイプラインを,アイデア生成,理論定式化,理論評価,反復最適化の4つの重要な段階に構成する。
反復的なフィードバックと改善により、TR-Agentはモデリング効率と効率の両方を改善している。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:58:27 GMT)
ALMA: Aggregated Lipschitz Maximization Attack on Auto-encoders [4.4] 本稿では, レイヤ条件に基づく対向最適化手法を提案し, 対向写像を局所リプシッツ境界領域へ誘導する。
我々は、最先端のAEの実験を通じて、我々の敵の目標がより強力な攻撃をもたらすことを実証し、普遍的なシナリオとサンプル特有のシナリオの両方において既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:52:14 GMT)
FRAME: Feedback-Refined Agent Methodology for Enhancing Medical Research Insights [4.4] 本稿では,反復的改善と構造化フィードバックによる医療用紙の創出を促進する新しいフレームワークFRAMEを紹介する。
FRAMEの有効性を実証し,従来のアプローチよりも大幅に改善した。
人間による評価は、FRAMEが生成した論文が人間による著作に匹敵する品質を達成することを確認している。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:50:02 GMT)
Binding threshold units with artificial oscillatory neurons [4.3] 本稿では、振動ニューロンを閾値単位と明確に区別し、それらの結合機構を確立する理論的枠組みを提案する。
本研究は, 具体的玩具実験を通じて, この結合の実用的実現を実証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:54:52 GMT)
Incoherent Probability Judgments in Large Language Models [4.3] 自己回帰型大言語モデル(LLM)による確率判断のコヒーレンスを評価する。
これらのモデルから得られる判断は、しばしば不整合であり、確率論の規則から人間のような体系的な逸脱を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:43:38 GMT)
Empc: Effective Path Prioritization for Symbolic Execution with Path Cover [4.2] 記号的実行は、プログラムの動作の正しさを正式に推論し、ソフトウェアバグを検出する。
それは固有の限界、すなわち経路の爆発に悩まされる。
本稿では,Empcという経路被覆を用いた新規かつ効果的な経路優先順位付け手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:08:36 GMT)
Noisy HQNNs: A Comprehensive Analysis of Noise Robustness in Hybrid Quantum Neural Networks [4.2] ハイブリッド量子ニューラルネットワーク(HQNN)は、量子コンピューティングの有望な可能性を提供する。
ノイズ干渉による理想的な性能を実現する上で,ノイズ中規模量子デバイス(NISQ)の限界は大きな課題をもたらす。
本稿では,2つのHQNNアルゴリズム,量子畳み込みニューラルネットワーク(QCNN)と準畳み込みニューラルネットワーク(QuanNN)を比較した。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:54:14 GMT)
Robustness in AI-Generated Detection: Enhancing Resistance to Adversarial Attacks [4.2] 本稿では,現在のAI生成顔検出システムの脆弱性について検討する。
本稿では, 対人訓練を統合し, 対人訓練の効果を緩和するアプローチを提案する。
我々はまた、AI生成コンテンツの本質的な特徴に関する洞察を提供する、敵対的および良心的な事例の詳細な分析も提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:19:01 GMT)
Expedited thermalization dynamics in incommensurate systems [4.1] マルコフ熱貯留層に結合した非共分散ポテンシャルに埋め込まれた量子系の熱化ダイナミクスについて検討した。
初期局在状態は非局在状態よりも高速に均一な定常状態に緩和できることがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:51:50 GMT)
SKALD: Scalable K-Anonymisation for Large Datasets [4.1] SKALDは、RAMに制限のある大規模なデータセット上でk匿名化を実行するための新しいアルゴリズムである。
提案アルゴリズムは,k-匿名化方式よりも複数倍の性能向上を実現する。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:38:53 GMT)
QbC: Quantum Correctness by Construction [4.1] 提案するQuantum Correctness by Construction (QbC) は,その仕様から量子プログラムを構築するための手法である。
プリコンディションとポストコンディションを使用してプログラム特性を規定し、その仕様から量子状態におけるプログラム構築のための音質および完全改善ルールを提案する。
このアプローチは、プログラムの詳細を導出する方法を自然に提案し、その過程で重要な設計上の選択を強調します。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:39:37 GMT)
The Inverse Drum Machine: Source Separation Through Joint Transcription and Analysis-by-Synthesis [4.1] Inverse Drum Machine (IDM) は、解析・合成とディープラーニングを組み合わせたドラムソース分離の新しい手法である。
IDMは個々のドラムの茎を再構築し、元の混合物と一致するようにニューラルネットワークを訓練する。
StemGMDデータセットの評価では、IDMは最先端の教師付き手法と同等の分離性能を達成している。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:08:50 GMT)
Language Models Trained to do Arithmetic Predict Human Risky and Intertemporal Choice [4.0] 本稿では,認知モデルとしての大規模言語モデルの有用性を高める新しい手法を提案する。
生態学的に有効な算術的データセットに基づいて事前訓練されたLLMは、従来の認知モデルよりも人間の行動を予測する。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:26:28 GMT)
Don't Mesh with Me: Generating Constructive Solid Geometry Instead of Meshes by Fine-Tuning a Code-Generation LLM [3.9] 本稿では,表面構造型固体形状(CSG)を生成する3次元幾何生成のための新しいアプローチを提案する。
まず,境界表現幾何学(BREP)をCSGベースのPythonスクリプトに変換することで,コードスクリプトとして表現される3次元機械部品のデータセットを作成する。
次に、GPT-4を用いて自然言語でアノテーションを作成し、その結果のデータセットをコード生成LLMの微調整に使用する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:25:00 GMT)
Black holes, fast scrambling and the breakdown of the equivalence principle [3.9] 現地の観測者は、ブラックホールの形成後、衝突する時間から、すでにファイアウォールを経験していることを証明している。
もしブラックホールが本当に高速なスクランブラであるなら、宇宙のあらゆる天体物理学的なブラックホールは、既にあらゆる局所的な物理過程のために完全に発達したファイアウォールを持つことになる。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:14:44 GMT)
The Evolution of Reinforcement Learning in Quantitative Finance: A Survey [3.9] 強化学習(RL)は過去10年間で大きな進歩を遂げており、金融分野のアプリケーションへの関心が高まっている。
この調査は167の出版物を批判的に評価し、金融における多様なRLアプリケーションとフレームワークを調査している。
金融市場は、その複雑さ、マルチエージェントの性質、情報非対称性、および固有のランダム性によって特徴付けられ、RLの興味深いテストベッドとして機能する。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:37:47 GMT)
ChannelExplorer: Exploring Class Separability Through Activation Channel Visualization [3.8] 本稿では,モデル層間の画像ベース出力を分析するインタラクティブなビジュアル分析ツールであるChannelExplorerを紹介する。
ChannelExplorerはレイヤ間でアクティベーションを要約し、3つの主要なコーディネートされたビューを使ってそれらを視覚化する。
4つのユースケースシナリオを通じてChannelExplorerの機能を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:54:32 GMT)
Towards Efficient Benchmarking of Foundation Models in Remote Sensing: A Capabilities Encoding Approach [3.7] 本稿では,複数の下流タスクにおいて,各タスクの微調整を必要とせずにモデルの性能を予測する手法を提案する。
我々は、与えられた新しいタスクに対する基礎モデルの選択を単純化する可能性を示し、それを既存の文献に対する新たな視点として採用する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:29:18 GMT)
BCause: Human-AI collaboration to improve hybrid mapping and ideation in argumentation-grounded deliberation [3.7] 本稿では、生成AIと人間と機械の協調を利用したBCAuseについて紹介する。
i) 構造化されていないテキストを議論的な議論にインポート・変換する, (ii) ローカルなイシューレポートのためのTelegramボットによるジオリベラルな問題センシングを行う, (iii) カスタマイズ可能なウィジェットを用いたスマートレポートを行う,という3つのイノベーションを提示する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:43:49 GMT)
Towards a HIPAA Compliant Agentic AI System in Healthcare [3.6] 本稿では,HIPAA準拠のエージェントAIフレームワークについて紹介する。
本フレームワークは,(1)粒度管理のための属性ベースアクセス制御(ABAC),(2)パターンとBERTモデルを組み合わせたハイブリッドPHI衛生パイプライン,(3)コンプライアンス検証のための不変監査パスの3つのコアメカニズムを統合する。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:45:48 GMT)
Modeling Musical Genre Trajectories through Pathlet Learning [3.6] 本稿では,辞書学習のパラダイムを用いて,さまざまなジャンルのユーザトラジェクトリをモデル化する。
我々は、パスレットと呼ばれるジャンルトラジェクトリにおける繰り返しパターンをキャプチャする新しいフレームワークを定義する。
その結果,パスレット学習は質的かつ定量的に分析可能な関連する聴取パターンを明らかにした。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:33:40 GMT)
SAND: One-Shot Feature Selection with Additive Noise Distortion [3.6] 我々は、ニューラルネットワークトレーニング中に最も有用な機能を自動的に識別し、選択する新しい非侵入的特徴選択層を導入する。
本手法は,損失関数,ネットワークアーキテクチャ,選択後再学習などの変更を要さず,一意に単純である。
私たちの研究は、単純さとパフォーマンスが相互に排他的ではなく、機械学習における機能選択の強力な、かつ直接的なツールであることを示している。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:59:35 GMT)
Is AI currently capable of identifying wild oysters? A comparison of human annotators against the AI model, ODYSSEE [3.6] The ODYSSEE model was developed to identify live oysters using video or image in the field of oyster reefs to evaluate abundance。
このモデルがサンゴ礁に生息するカキを同定する際の有効性は,専門家および非専門家のアノテータと比較した。
モデルは専門家や非専門家のアノテーションよりもはるかに高速に推論を行うことができるが、モデルは生きたカキの数を過大に予測した。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:01:27 GMT)
Surpassing the Global Heisenberg Limit Using a High-effciency Quantum Switch [3.6] 不定因数順序は、量子パラメータ推定において逆二乗 N の精度を高めることが示されている。
これは広く受け入れられているハイゼンベルク極限1/Nの量子精度を超える。
因果順序の重畳に埋め込まれた一対の共役位置と運動量変位に付随する幾何位相を推定する超高効率量子スイッチを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:16:39 GMT)
Harnessing Causality in Reinforcement Learning With Bagged Decision Times [3.6] 我々は,有意な決定時間を持つ問題に対する強化学習について検討する。
モバイルヘルスにおいて、複数のアクティビティ提案は、ユーザの日々のアクティブ化へのコミットメントに一括して影響を及ぼす。
我々のゴールは、バッグ固有の報酬の割引金額を最大化するオンラインRLアルゴリズムを開発することである。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:31:00 GMT)
Scrambling in the Charging of Quantum Batteries [3.6] 本研究は, 量子電池における量子スクランブルの役割について検討する。
時間外相関器のダイナミクスを解析することにより、量子スクランブルが必ずしも高速充電に繋がるとは限らないことを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:37:48 GMT)
A study on audio synchronous steganography detection and distributed guide inference model based on sliding spectral features and intelligent inference drive [3.6] 本稿では,中国南洋艦隊がTikTok上で公開した短いビデオ"Yupan"のサンプルをもとに,検出および分散ガイダンス再構築モデルを提案する。
提案フレームワークは,同期型ステガノグラフィー検出におけるスライディングスペクトルの有効性を検証し,オープンプラットフォーム上での隠れ通信解析と戦術誘導シミュレーションのための推論モデルを構築した。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:24:11 GMT)
The Struggles of LLMs in Cross-lingual Code Clone Detection [3.5] 言語間のコードクローン検出は、ソフトウェアエンジニアリングコミュニティ内で注目を集めている。
機械学習の大幅な進歩にインスパイアされた本論文では、言語間コードクローン検出を再考する。
言語間コードクローンの識別のための5つの大言語モデル (LLM) と8つのプロンプト (08) の性能評価を行った。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:19:55 GMT)
Very High-Resolution Forest Mapping with TanDEM-X InSAR Data and Self-Supervised Learning [3.5] 我々はTandDEM-Xミッションの高分解能を利用して森林を6mで地図化する。
このような高解像度な参照データセットの拡張に対処するため、自己教師あり学習技術について検討する。
ペンシルバニア州上空1mの森林・非森林基準マップでは、異なるトレーニングアプローチを比較することができる。
このテスト領域上で最高のパフォーマンスのアプローチを選択し、アマゾン熱帯雨林の実際の森林マッピングシナリオに適用する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:54:28 GMT)
Differential Privacy for Network Assortativity [3.5] ネットワーク・アソシティティの分析はネットワーク上の構造的特徴と動的特性を理解する上で非常に重要である。
ネットワークには、ソーシャルネットワーク内の個人の友人の数など、センシティブな情報が含まれていることはよく知られている。
本稿では、まず、差分プライバシー(DP)に基づくアプローチを提案する。具体的に、DPベースのアルゴリズムとして、$Local_ru$、$Shuffle_ru$、$Decentral_ru$の3つを設計する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:40:47 GMT)
Read My Ears! Horse Ear Movement Detection for Equine Affective State Assessment [3.4] 馬の映像から特定の耳のAU検出と位置決めの異なる方法について検討した。
公衆馬のビデオデータセットにおける耳の動きの有無の87.5%の分類精度を実現した。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:05:49 GMT)
Procedural Memory Is Not All You Need: Bridging Cognitive Gaps in LLM-Based Agents [3.4] 大規模言語モデル(LLM)は人工知能(AI)における画期的な業績を表す
本稿では,LLMは手続き記憶に依存しているため,基本的に制約を受ける。
認知機能を分離するモジュラーアーキテクチャを採用することで、狭義の手続き的専門知識と現実の問題解決に必要な適応知性とのギャップを埋めることができます。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:18:34 GMT)
No-Go Theorems for Universal Entanglement Purification [3.4] 絡み合った浄化プロトコル(EPP)は、複数のノイズの絡み合った状態がより忠実な単一の絡み合った状態に変換することを目的としている。
我々は、常に出力の忠実さをもたらすEPPを元のノイズ状態のそれぞれよりも悪くは考えない、これは普遍性と呼ばれる性質である。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:54:05 GMT)
CCSK:Cognitive Convection of Self-Knowledge Based Retrieval Augmentation for Large Language Models [3.4] CCSKは、シームズネットワークモジュールとレスポンス品質モデルを介して、動的な共同決定プロセスを実装している。
実世界のデータセットの実験により、CCSKは情報検索におけるモデルの有効性を著しく向上させることが示された。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:41:59 GMT)
From Neurons to Computation: Biological Reservoir Computing for Pattern Recognition [3.3] 我々は、培養された生体ニューロンのプールを貯水池基質として活用し、生物貯水池コンピューティング(BRC)を創出する新しい貯水池コンピューティングのパラダイムを導入する。
このシステムはエコー状態ネットワーク(ESN)と同様に動作し、神経活動が培養されたニューロンのネットワークによって生成されることが鍵となる。
結果は、従来のニューラルネットワークで処理されるタスクを実行するために、生物学的ニューラルネットワークを使用することの可能性を示している。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:20:04 GMT)
Improving the Reproducibility of Deep Learning Software: An Initial Investigation through a Case Study Analysis [3.3] 深層学習の結果を再現することへの懸念が高まっている。
70%以上が他の実験を再現できず、50%以上が自身の実験を再現できなかった。
本稿では,ディープラーニングモデルの解析と改善のための体系的なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:20:15 GMT)
Nonparametric learning of covariate-based Markov jump processes using RKHS techniques [3.3] 我々は、co変数を連続時間マルコフ連鎖(CTMC)にリンクするための新しい非パラメトリックアプローチを提案する。
CTMCは、臨床または行動状態の遷移をモデリングするための堅牢なフレームワークを提供する。
一般化されたRepresenter Theoremを用いて、関数空間におけるトラクタブル推論を可能にする。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:26:02 GMT)
EntroLLM: Entropy Encoded Weight Compression for Efficient Large Language Model Inference on Edge Devices [3.3] 大きな言語モデル(LLM)は、様々なタスクにまたがる例外的なパフォーマンスを示すが、その大きなストレージと計算要求は、エッジデバイスへのデプロイメントを制限している。
本稿では,エントロピー符号化と混合量子化を統合した新しい圧縮フレームワークEntroLLMを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:37:57 GMT)
Blending 3D Geometry and Machine Learning for Multi-View Stereopsis [3.3] GC MVSNet plusは、学習中に多視点、多スケールの教師あり幾何的一貫性を強制するための新しいアプローチである。
この統合GCチェックは、幾何学的に一貫性のないピクセルを直接ペナル化することにより、学習プロセスを著しく加速する。
提案手法は,DTUおよびBlendedMVSデータセット上での新たな技術状況を実現し,タンク・アンド・テンプルのベンチマークで2位を確保した。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:22:45 GMT)
An alignment safety case sketch based on debate [3.3] 提案された解決策の1つは、システムの出力の欠陥を議論を通じて指摘するために、別の超人的システムを活用することである。
本稿では,AIの安全性に関する議論の価値について概説する。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:53:44 GMT)
A Cognitive Paradigm Approach to Probe the Perception-Reasoning Interface in VLMs [3.2] 本稿では,視覚言語モデル(VLM)における知覚推論インタフェースを識別するための構造化評価フレームワークを提案する。
本稿では,人間の問題解決戦略を反映した3つの評価パラダイムを提案する。
このフレームワークを適用したCAは、リッチで独立に生成された記述を推論するために強力な言語モデルを活用し、新しい最先端(SOTA)パフォーマンスを実現することを実証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:59:11 GMT)
3D Can Be Explored In 2D: Pseudo-Label Generation for LiDAR Point Clouds Using Sensor-Intensity-Based 2D Semantic Segmentation [3.2] そこで我々は,3次元セマンティックセマンティックセマンティクスパイプラインを導入し,アライメントシーンと最先端2次元セマンティクス手法を利用した。
本手法は,センサ強度で色付けされたLiDARスキャンから2次元ビューを生成し,これらのビューに2次元セマンティックセマンティックセグメンテーションを適用した。
分割された2D出力は3Dポイントにバックプロジェクターされ、単純な投票ベースの推定器が使用される。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:31:32 GMT)
GRAML: Dynamic Goal Recognition As Metric Learning [3.2] ゴール認識(GR)は、観察された行動に基づいてエージェントの目的を認識する問題である。
GRの最近のデータ駆動アプローチは、コストがかかる手作業によるドメインモデルの必要性を軽減する。
本稿では,GRAML:Goal Recognition as Metric Learningを紹介する。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:38:07 GMT)
RAVU: Retrieval Augmented Video Understanding with Compositional Reasoning over Graph [3.2] RAVUは、時間グラフ上の推論による検索によるビデオ強化理解のためのフレームワークである。
我々は,エンティティ間の空間的および時間的関係の両方をキャプチャーするグラフ表現を構築した。
複雑なクエリに答えるために、クエリを推論ステップのシーケンスに分解し、グラフ上でこれらのステップを実行する。
提案手法により,長いビデオのより正確な理解が可能となり,特にフレーム間のマルチホップ推論やオブジェクトの追跡を必要とするクエリに対して有効である。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:38:09 GMT)
Real-Time Person Image Synthesis Using a Flow Matching Model [3.1] PGPIS(Pose-Guided Person Image Synthesis)は、ターゲットポーズとソースイメージに条件付けされた現実的な人物画像を生成する。
近年の拡散法では,PGPISの画質が著しく向上している。
私たちのアプローチは、より速く、より安定し、より効率的なトレーニングとサンプリングを可能にします。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:13:44 GMT)
EnsembleCI: Ensemble Learning for Carbon Intensity Forecasting [3.1] 炭素強度(英: Carbon intensity、CI)は、電気単位当たりの平均的な炭素排出量を測定する。
私たちは、CI予測のための適応型エンドツーエンドのアンサンブル学習ベースのアプローチであるEnsembleCIを紹介します。
11の地域グリッドに対する評価では、EnsembleCIは一貫してCarbonCastを上回り、ほぼ全てのグリッドで平均絶対パーセンテージ誤差(MAPE)を最小にし、平均19.58%の予測精度を向上させる。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:33:51 GMT)
Learn to Swim: Data-Driven LSTM Hydrodynamic Model for Quadruped Robot Gait Optimization [3.1] 本稿では,水中四足歩行ロボットにおける非定常非線形流体力予測のためのネットワークベース流体実験データ駆動モデル(FED-LSTM)を提案する。
循環式水槽と曳航式水槽の両方で実施した脚力および体力試験からの実験データに基づいて訓練を行った。
このモデルは複雑な流体力学を捉える際に優れた精度と適応性を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:42:16 GMT)
Revealing CNN Architectures via Side-Channel Analysis in Dataflow-based Inference Accelerators [3.0] データフローベースのCNNアクセラレータの最近の進歩により、リソース制約エッジデバイスでのCNN推論が可能になった。
本稿では、メモリベースのサイドチャネル情報を評価し、データフローベースのCNN推論アクセラレーターからCNNアーキテクチャを復元する。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:47:10 GMT)
Breaking On-Chip Communication Anonymity using Flow Correlation Attacks [3.0] Network-on-Chip(NoC)システムにおいて,既存の匿名ルーティング技術を用いた機械学習(ML)ベースのフロー相関攻撃を開発し,実施する。
本稿では,アウトバウンドトラフィックトンネリングとトラフィック難読化機能を備えた,軽量な匿名ルーティングプロトコルを提案する。
このプロトコルは、MLベースのフロー相関攻撃に対して堅牢な防御を提供し、パケットレベルとフローレベルの両方の匿名性を保証するように設計されている。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:37:17 GMT)
Graph Drawing for LLMs: An Empirical Evaluation [2.9] 我々は、視覚的モダリティに依存した使用シナリオに注目し、分析下のグラフの描画でモデルに供給する。
本稿では,モデルの性能が,選択したレイアウトパラダイム,描画の美学,クエリーに使用するプロンプト技術にどのように影響するかを検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:23:42 GMT)
VGLD: Visually-Guided Linguistic Disambiguation for Monocular Depth Scale Recovery [2.9] VGLDは、記述とともに対応する画像から高レベルな意味情報を組み込むことで、テキスト情報の影響を安定化する。
このアプローチはテキストの曖昧さを解消し、線形変換パラメータ(スカラー)の集合を強く出力する。
以上の結果から,VGLDは複数のデータセットでトレーニングした場合に共通アライメントモジュールとして機能し,ゼロショットシナリオにおいても高い性能を達成できることが示された。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:06:28 GMT)
Regularized second-order optimization of tensor-network Born machines [2.9] ボルンマシン(英: Born Machine、TNBM)は、データ分布を学習するための量子インスパイアされた生成モデルである。
TNBMの鍵となるボトルネックは、この問題によく使用される損失関数の対数的性質である。
そこで本研究では,TNBMトレーニングにおける2次最適化手法を改良し,収束率と最適化モデルの品質を大幅に向上させる。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:16:18 GMT)
Physics-informed neural network estimation of active material properties in time-dependent cardiac biomechanical models [2.9] 本研究では、時間依存型心臓生体力学モデルにおいて、アクティブな収縮性パラメーターを推定するための物理インフォームドニューラルネットワーク(PINN)の適用について検討する。
我々は騒音や空間分解能の高い環境下で様々な活動的応力場を再構築することができる。
このアプローチは、心臓線維症の診断、治療計画、心臓状態の管理を大幅に改善する新たな経路を開く。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:01:16 GMT)
Towards Enterprise-Ready Computer Using Generalist Agent [2.8] 本稿では,企業用汎用エージェントシステム(CUGA)の開発に向けて,現在進行中の取り組みについて述べる。
最先端のエージェントAI技術と、反復的評価、分析、改善のための体系的なアプローチを統合することで、我々は、迅速かつ費用対効果の高いパフォーマンス向上を実現した。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:15:29 GMT)
Hierarchical Forecast Reconciliation on Networks: A Network Flow Optimization Formulation [2.8] 和解は、複数のアグリゲーションレベルにわたる一貫性のある予測を必要とする組織にとって不可欠である。
最小トレース(MinT)のような現在の手法は木構造に限られており、計算コストが高い。
本稿では,階層的予測整合をネットワークフロー最適化として再構成するFlowRecを紹介する。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:16:28 GMT)
Hesitation is defeat? Connecting Linguistic and Predictive Uncertainty [2.8] 本稿では,ルールベースのラベルラによってラベル付けされた自由テキストレポートから推定される予測不確実性と人・言語不確実性との関係について検討する。
その結果,予測的不確実性と言語的不確実性との間には緩やかな相関関係がみられ,機械の不確実性と人間の解釈を整合させる上での課題が浮き彫りにされた。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:34:37 GMT)
Detecting Quishing Attacks with Machine Learning Techniques Through QR Code Analysis [2.8] QRコードベースのフィッシング("Quishing")の台頭はサイバーセキュリティの脅威を増大させる。
既存の検出手法は主にQRコードペイロードの抽出を必要とするURL分析に重点を置いている。
組込みコンテンツを抽出することなくQRコード構造や画素パターンを直接解析する,検出のための最初のフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:47:13 GMT)
Evaluating Contrastive Feedback for Effective User Simulations [2.8] 本研究は, ユーザシミュレーションのプロンプトエンジニアリング分野において, コントラッシブトレーニング技術の根底にある原則が有効に応用できるかどうかを考察する。
本研究の主な目的は,コンテキスト情報の異なるモーダル性がユーザシミュレーションの有効性に与える影響を分析することである。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:44:32 GMT)
Exact Spin Correlators of Integrable Quantum Circuits from Algebraic Geometry [2.8] 積分可能量子回路に対するスピン演算子の弦の相関関数を正確に計算する。
これらのオブザーバブルは、量子シミュレーションプラットフォームのキャリブレーションに使用できる。
論文参考訳(メタデータ) (Tue, 06 May 2025 00:55:58 GMT)
Call for Action: towards the next generation of symbolic regression benchmark [2.7] 記号回帰は解釈可能な数学的表現を発見するための強力なテクニックである。
SR手法のベンチマークはアルゴリズム、データセット、評価基準の多様性のために依然として難しい。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:02:20 GMT)
Sufficient Decision Proxies for Decision-Focused Learning [2.7] 決定に焦点を当てた学習は、予測精度ではなく、決定品質が最大化されるような予測モデルを学ぶことを目的としている。
本稿では,いずれの仮定を用いても正当性を示す問題特性を初めて検討する。
本稿では,連続変数および離散変数の問題に対する実験における提案手法の有効性と,目的関数および制約における不確実性について述べる。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:10:17 GMT)
Adversarial Sample Generation for Anomaly Detection in Industrial Control Systems [2.7] 我々はJacobian Saliency Map Attack (JSMA) を用いて敵のサンプルを生成する。
本研究は,産業制御システムに対する幅広い実攻撃に対処するために,敵サンプルの一般化と拡張性を検証した。
敵のサンプルを用いて訓練されたモデルは、訓練中に使用されていない実世界の攻撃データに対して95%の精度で攻撃を検出した。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:27:17 GMT)
ToMCAT: Theory-of-Mind for Cooperative Agents in Teams via Multiagent Diffusion Policies [2.6] ToMCAT(Theory-of-Mind for Cooperative Agents in Teams)は、ToM条件のトラジェクトリを生成するための新しいフレームワークである。
メタラーニングのメカニズムは、チームメイトの基本となる目標と将来の振る舞いに対してToM推論を実行し、マルチエージェントのデノベーション/拡散モデルと組み合わせます。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:04:09 GMT)
Importance Analysis for Dynamic Control of Balancing Parameter in a Simple Knowledge Distillation Setting [2.6] 知識蒸留(KD)はその強い経験的性能で際立っている。
KDは, 蒸留損失の影響が下流タスク損失よりも大きい場合に最も有効である。
本稿では,損失が減少している場合のKD設定において,バランスパラメータを動的に調整する必要があるという数学的根拠を提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:04:30 GMT)
NBF at SemEval-2025 Task 5: Light-Burst Attention Enhanced System for Multilingual Subject Recommendation [2.5] 本稿では,言語間の主題分類に着目したSemEval 2025 Task 5を提案する。
提案手法は, 学習中のバイリンガルデータを活用し, 負のサンプリングとマージンに基づく検索を併用する。
提案手法は, 資源制約下での情報収集に有効であるが, 改善の余地は残っている。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:33:46 GMT)
On the non-Markovian quantum stochastic network dynamics [2.5] 導波路を介する原子ネットワークにおける量子ノイズ特性に基づく非マルコフ量子力学について検討する。
伝統的なマルコフ量子系とは異なり、非マルコフ量子ネットワークは複数の入力量子ノイズチャネルと相互作用する量子系と見なすことができる。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:39:37 GMT)
Refining Fuzzed Crashing Inputs for Better Fault Diagnosis [2.5] DiffMinは、ファジドクラッシュ入力を洗練して、与えられたパス入力と大きな類似性を得る技術である。
Magmaベンチマークによるパイロットスタディでは、DiffMinは、クラッシュとパス入力の違いを効果的に最小化することを示した。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:49:50 GMT)
Towards Universal and Black-Box Query-Response Only Attack on LLMs with QROA [2.5] 悪意ある命令に付加された相手の接尾辞を識別するブラックボックスジェイルブレイク手法であるQROAを紹介する。
既存のサフィックスベースのjailbreakアプローチとは異なり、QROAはモデルのロジットや他の内部情報へのアクセスを必要としない。
また,QROA-UNVは,個々のモデルに対する普遍的対角接尾辞を識別する拡張である。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:24:50 GMT)
Dictionary-based sparse block encoding with low subnormalization and circuit depth [2.4] ブロックは、$left|A/α right|_textop leq 1$ を満たす行列 $A$ を拡大ユニタリ行列 $U_A$ にエンコードする。
テクトサーキット深さは、量子アルゴリズムにおけるブロックエンコーディング実装の効率を管理する重要なパラメータである。
本研究は,新しい辞書データ構造に基づくスパースブロック符号化方式とそのエルミート変種を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:19:24 GMT)
Extending Decision Predicate Graphs for Comprehensive Explanation of Isolation Forest [2.4] アイフォレスト(iForest)は、よく機能する外れ値検出技術として広く使われている。
本研究では,グローバルな説明可能性の問題に対処する,新しい説明可能なAI(XAI)手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 23:32:16 GMT)
An Overview of the Prospects and Challenges of Using Artificial Intelligence for Energy Management Systems in Microgrids [2.4] 本稿では,マイクログリッドのエネルギー管理システムにおいて,AIベースの方法論を実現するメリットを強調した。
また、AI駆動のエネルギー管理システムを先導することを約束する今後の研究の方向性についても指摘している。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:08:36 GMT)
PLUM: Improving Inference Efficiency By Leveraging Repetition-Sparsity Trade-Off [2.3] 量子化とスパシティは、ハードウェア・ソフトウェア・インタフェースにおけるテンソル内の繰り返しとスパシティに変換する重要な技術である。
本稿では,反復スパーシティートレードオフの概念を導入し,推論時の計算効率を説明する。
本稿では、推論システムと量子化を統合し、繰り返しスパーシティトレードオフを利用する統一型協調設計フレームワークPLUMを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:32:16 GMT)
A Symbolic and Statistical Learning Framework to Discover Bioprocessing Regulatory Mechanism: Cell Culture Example [2.3] 本稿では,重要な規制機構を特定し,不確実性をモデル化するための記号的,統計的学習フレームワークを提案する。
後部探査のための随伴感度解析を用いたメトロポリス調整ランゲヴィンアルゴリズムを開発した。
実証的研究は、不足する規制機構を回復し、データ制限条件下でのモデル忠実性を改善する能力を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:39:34 GMT)
Weighted Average Gradients for Feature Attribution [2.3] 説明可能なAIでは、インテグレート・グラディエンス(IG)はモデル出力における入力の特徴属性の重要性を評価するために広く採用されている手法である。
この研究はベースラインを同等に扱うべきではないと主張している。
Weighted Average Gradients (WG) は、教師なしでベースライン適合性を評価し、効果的なベースラインを選択するための戦略を取り入れた新しいアプローチである。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:36:47 GMT)
An Empirical Study on the Impact of Gender Diversity on Code Quality in AI Systems [2.2] ソフトウェアエンジニアリングにおける女性の不足は、AI開発における堅牢性に対する懸念を提起する。
本研究では、AIチーム内の性別の多様性がプロジェクトの人気、コード品質、個人の貢献にどのように影響するかを検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 00:37:27 GMT)
HMAE: Self-Supervised Few-Shot Learning for Quantum Spin Systems [2.2] Hamiltonian-Masked Autoencoding (HMAE) は、未ラベル量子ハミルトニアンのトランスフォーマーを事前訓練する自己教師型フレームワークである。
HMAEは位相分類において85.3%$pm$ 1.5%の精度、基底状態のエネルギー予測において0.02 eV MAEにおいて0.15$pm$0.02の精度を達成する。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:32:16 GMT)
Heart Failure Prediction using Modal Decomposition and Masked Autoencoders for Scarce Echocardiography Databases [2.1] 心臓病は国際的機能不全の主な原因である。
特に、心不全(HF)は医療業界に対して、早期、迅速、効果的な予測のためのシステム開発を迫る。
本研究は,心不全時間予測の課題であり,より具体的課題である,リアルタイム心エコービデオシーケンスの解析を行う自動システムを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:55:28 GMT)
Generating Synthetic Data via Augmentations for Improved Facial Resemblance in DreamBooth and InstantID [2.1] 本研究では、DreamBooth と InstantID の2つの顕著なパーソナライゼーション技術を用いて、顔の類似性向上に対する強化の効果を検討する。
本研究は,SDXL画像における顔の類似性向上に果たす役割について考察し,下流アプリケーションに効果的に展開するための戦略を提示する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:11:02 GMT)
Adversarial Robustness of Deep Learning Models for Inland Water Body Segmentation from SAR Images [2.1] SAR(Synthetic Aperture Radar)画像からの内陸水域のセグメンテーションは,洪水マッピングなどのいくつかのアプリケーションに必要な重要な課題である。
本研究では,U-Netモデルに対する逆攻撃の形で手動エラーをシミュレートし,アノテーションによる人間の誤りに対するモデルの堅牢性について検討する。
以上の結果から,U-Netはパフォーマンスが著しく低下する前にある程度の汚職を許容できることが示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:26:22 GMT)
SPAP: Structured Pruning via Alternating Optimization and Penalty Methods [2.1] 大規模言語モデル(LLM)は、しばしば計算とメモリの要求によって制約される。
最適化理論に基づくLLMのための新規かつ効率的な構造化プルーニングフレームワークであるSPAP(Structured Pruning via Alternating Optimization and Penalty Methods)を提案する。
我々の研究は、モデル性能を保ちながらLLMを刈り取るための実用的で最適化駆動のソリューションを提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:47:53 GMT)
LogiDebrief: A Signal-Temporal Logic based Automated Debriefing Approach with Large Language Models Integration [2.1] 我々は,9-1-1コールテイカの人間主導評価を自動化する,AI駆動のフレームワークであるLogiDebriefを紹介する。
LogiDebriefは、コールテイク要求を論理的な仕様として形式化し、9-1呼び出しの体系的な評価を可能にする。
実世界の1,701件の通話を遮断し、311.85時間のアクティブ・エンゲージメントを節約した。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:27:07 GMT)
MARCO: A Multi-Agent System for Optimizing HPC Code Generation Using Large Language Models [2.1] 大規模言語モデル(LLM)は、コード生成機能を通じてソフトウェア開発を変革してきたが、高性能コンピューティングにおけるその有効性は依然として限られている。
我々は,特殊なマルチエージェントアーキテクチャにより,HPC用のLLM生成コードを強化する新しいフレームワークであるMARCOを提案する。
MARCOはコード生成と性能評価に別々のエージェントを使用し、フィードバックループで接続され、最適化が徐々に洗練される。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:22:38 GMT)
Design principles of deep translationally-symmetric neural quantum states for frustrated magnets [2.0] ディープニューラルネットワーク量子状態は、量子マグネットの基底状態を研究する主要な方法として登場した。
本稿では、変圧器の要素を畳み込みネットワークに組み込むように設計されたConvNextアーキテクチャを、量子多体基底状態に適用する。
いくつかのフラストレーション・スピン・システムで成功しているファクタード・ビジョン・トランスフォーマーと著しく類似していることが判明した。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:08:59 GMT)
Evaluation of LLMs on Long-tail Entity Linking in Historical Documents [2.0] GPT と LLama3 という2つの人気のある LLM の性能を,ロングテールなエンティティリンクのシナリオで評価する。
MHERCL v0.1は、ドメイン固有の歴史的テキストからテキストを手動で注釈付けしたベンチマークであり、エンティティをウィキデータエントリに識別・リンクする際のLLMの性能を定量的に比較する。
予備実験の結果,LLMは長尾ELにおいて良好に機能し,この技術は長尾ELと長尾ELのギャップを埋める上で有益であることが示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:25:15 GMT)
Rollbaccine : Herd Immunity against Storage Rollback Attacks in TEEs [Technical Report] [2.0] Rollbaccineは、すべてのアプリケーションに自動ロールバック抵抗を提供するデバイスマッパーである。
ディスクへの書き込みをインターセプトして複製し、リカバリ時にバックアップから失われた状態を復元し、オーバーヘッドを最小限にする。
fsyncの重いFilebench Varmailを除いて、オーバーヘッドはわずか19%だ。
論文参考訳(メタデータ) (Tue, 06 May 2025 23:24:14 GMT)
Quiet Feature Learning in Algorithmic Tasks [1.9] トランスフォーマーベースの言語モデルを10の基本的なアルゴリズムタスクで訓練する。
従来のパワールールスケーリングの傾向から逸脱した損失曲線における顕著な位相遷移を観察する。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:18:50 GMT)
Gender Disparities in Contributions, Leadership, and Collaboration: An Exploratory Study on Software Systems Research [1.8] 私たちは過去10年間に2000の論文をJournal of Systems and Softwareで分析しました。
分析の結果、全著者の32.74%が女性であり、女性主導または監督された研究は男性よりも少なかった。
第三に、ソフトウェアシステム研究の分野を探索し、女性作家が人間中心の研究領域に積極的に関わっていることを発見した。
論文参考訳(メタデータ) (Tue, 06 May 2025 00:04:21 GMT)
The Impact of Large Language Models on K-12 Education in Rural India: A Thematic Analysis of Student Volunteer's Perspectives [1.7] AIによる教育は、田舎の学校での学習格差に対処する可能性がある。
本研究では,地方教育におけるAI統合に対するボランティア教員の認識について検討した。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:14:32 GMT)
FedSynthCT-Brain: A Federated Learning Framework for Multi-Institutional Brain MRI-to-CT Synthesis [1.7] Fed SynthCT-Brainは、脳画像におけるMRI-to-sCTのためのFederated Learningパラダイムに基づくアプローチである。
クロスサイロ水平FLアプローチにより、複数のセンタがU-Netベースのディープラーニングモデルを協調的にトレーニングできる。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:21:59 GMT)
IRA: Adaptive Interest-aware Representation and Alignment for Personalized Multi-interest Retrieval [1.7] 我々は、関心を意識した表現とアライメント(IRA)フレームワークを提案する。
IRAは累積構造を介して動的に新しい相互作用に適応する。
実世界のデータセットに対する広範な実験を通じて、IRAの有効性を検証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:47:32 GMT)
Path and Bone-Contour Regularized Unpaired MRI-to-CT Translation [1.7] MRI-to-CT 翻訳におけるパス・コントラスト正規化手法を提案する。
この方法では、MRIとCTの画像を共有潜在空間に投影し、MRIとCTのマッピングをニューラル常微分方程式によって制御された連続流としてモデル化する。
提案手法は既存のMRI-CT翻訳手法よりも優れ,全体の誤差率を低くする。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:08:35 GMT)
Backflash Attack on Coherent One-Way Quantum Key Distribution [1.7] 単光子アバランシェ検出器(SPAD)によって発生した破壊フラッシュを利用して、盗聴者(Eve's)の情報取得を実験的に実証した。
この研究は、キー蒸留エンジン(KDE)を含むQKDシステムを用いてイヴの学習を定量化する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:19:59 GMT)
Using Mechanistic Interpretability to Craft Adversarial Attacks against Large Language Models [1.6] LLMに対する対角的摂動を生み出すための新しいホワイトボックス手法を提案する。
まず、受け入れ部分空間(モデルの拒絶機構を起動しない特徴ベクトルの集合)を識別する。
次に、勾配に基づく最適化を用いて、拒否サブスペースから受け入れサブスペースへの埋め込みを除去し、ジェイルブレイクを効果的に達成する。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:48:07 GMT)
A new membership inference attack that spots memorization in generative and predictive models: Loss-Based with Reference Model algorithm (LBRM) [1.6] 生成モデルは、意図せずトレーニングデータを記憶することができ、重大なプライバシーリスクを生じさせる。
本稿では,時系列計算モデルにおける暗記現象に対処し,ロスベース参照モデル(LBRM)アルゴリズムを導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:47:24 GMT)
Unveiling the Mechanisms of DAI: A Logic-Based Approach to Stablecoin Analysis [1.5] 本稿では,暗号コラテラル化とアルゴリズム機構を組み合わせたDAIステーブルコインについて述べる。
本稿では,Prologで実装され,オープンソースソフトウェアとしてリリースされたDAIのポリシーと操作を表現するための形式的論理ベースのフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:06:37 GMT)
A Chaos Driven Metric for Backdoor Attack Detection [1.5] この研究は、AIモデルの最も重要な攻撃ベクトルの1つであるトレーニングデータセットのデータ中毒によるバックドア攻撃に対する、新たな防御メカニズムを提案する。
本手法では,カオス理論と多様体学習を組み合わせた統合的手法を提案する。
ニューロカオス特徴の条件分散に基づく新しい尺度-精度行列依存スコア(PDS)を定式化する。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:51:27 GMT)
Can Large Language Models Predict Parallel Code Performance? [1.5] 本稿では,Large Language Models (LLM) がハードウェアに依存しないGPU性能予測に代替的なアプローチを提供するかどうかを考察する。
LLMはRooflineモデルについて強く理解しており、明示的なプロファイリングデータを備えた場合、100%の分類精度を達成する。
以上の結果から,より優れたデータセットと迅速な戦略により,LLMはHPCルーフライン解析および性能ポータビリティのための実用的なツールとなる可能性が示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:41:20 GMT)
1$^{st}$ Place Solution of WWW 2025 EReL@MIR Workshop Multimodal CTR Prediction Challenge [1.5] 本報告では,Multimodal CTR Prediction Challengeのタスク2における1ドル当たりの入賞ソリューションについて述べる。
マルチモーダル情報の統合には、凍結したマルチモーダル埋め込みを各アイテムの埋め込みに追加するだけでよい。
課題データセットの実験では,本手法の有効性を実証し,リーダーボード上の0.9839 AUCで優れた性能を実現した。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:55:22 GMT)
SYN-LUNGS: Towards Simulating Lung Nodules with Anatomy-Informed Digital Twins for AI Training [1.5] 肺がんスクリーニングのための生成モデルは、データ不足によって制限され、一般化可能性と臨床応用性に影響を与える。
詳細なアノテーションで高品質な3DCT画像を生成するためのフレームワークであるSyn-LUNGSを紹介する。
データセットには1,044個のCTスキャンから3,072個の結節画像が含まれ、512個の病変と174個のデジタルツインがある。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:07:12 GMT)
seq-JEPA: Autoregressive Predictive Learning of Invariant-Equivariant World Models [1.5] 本稿では,協調埋め込み予測アーキテクチャに基づく世界モデリングパラダイムであるSeq-JEPAを紹介する。
等変ベンチマークや画像分類において,Seq-JEPAは,一方を犠牲にすることなく高い性能が得られることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:39:11 GMT)
Adversarial Attacks in Multimodal Systems: A Practitioner's Survey [1.5] マルチモーダルモデルは、テキスト、画像、ビデオ、オーディオを理解するために訓練されています。
オープンソースモデルはすべてのモダリティの脆弱性を継承し、敵の脅威が増幅する。
本論文は,4つのモダリティを対象とする敵攻撃を調査することで,そのギャップを解消する。
我々の知る限りでは、この調査は、マルチモーダル世界の脅威景観を包括的に要約した初めてのものである。
論文参考訳(メタデータ) (Tue, 06 May 2025 00:41:16 GMT)
Towards conversational assistants for health applications: using ChatGPT to generate conversations about heart failure [1.4] 我々は、アフリカ系アメリカ人の心不全患者のセルフケア戦略に焦点を当てた会話を生み出すChatGPTの可能性を探る。
我々は、ドメイン、アフリカ系アメリカ人英語(AAVE)、社会的健康決定因子(SDOH)、SDOHインフォームド推論の4つのプロンプト戦略を採用した。
食事、運動、流体摂取といった重要なセルフケア領域間での会話は、ターンの長さによって異なる。
SDOHの導入と推論は対話の質を向上させるが、ChatGPTは意味のある医療コミュニケーションに必要な共感とエンゲージメントを欠いている。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:21:10 GMT)
Sentence Embeddings as an intermediate target in end-to-end summarisation [1.4] 抽出手法と事前学習した文レベルの埋め込みを組み合わせることで,既存の手法よりも優れた性能が得られることを示す。
また,要約文の文レベルの埋め込みを予測することで,目的コーパスに対するゆるやかに整列したソースに対するエンドツーエンドシステムの品質が向上することが証明された。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:34:59 GMT)
Diverse Audio Embeddings-- Bringing Features Back Outperforms CLAP ! [1.2] 様々な特徴表現を用いて音声の埋め込みを学習する。
我々は、ピッチ、音色、ニューラル表現などの多様なオーディオ特性に対する頑健な個別の埋め込みと、エンドツーエンドアーキテクチャを通してそれを学習する。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:54:29 GMT)
Cooperative squeezing of internal and collective spins in an atomic ensemble [1.2] ルビジウム原子を用いた熱原子アンサンブルにおける内部および集合スピンのスクイーズを実験的に実証した。
我々のアプローチは、原子アンサンブルの量子状態に固有の自由度を完全に活用する新しい視点を提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:42:09 GMT)
Fill the Gap: Quantifying and Reducing the Modality Gap in Image-Text Representation Learning [1.1] 視覚言語モデル(VLM)は、テキストや画像を共有表現空間に埋め込むことができる。
これらのモデルがモダリティギャップ現象(英語版)の対象であることは示されており、つまり、埋め込み空間において、あるモダリティと別のモダリティとの明確な分離が存在することを意味する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:24:41 GMT)
Quantum Feature Space of a Qubit Coupled to an Arbitrary Bath [1.0] クビット制御プロトコルは伝統的に、そのパワースペクトル密度を通じてクビットバス結合の特性を利用してきた。
従来の研究では、ディープニューラルネットワークと物理符号化層を組み合わせたグレーボックスアプローチを用いて、古典的な浴槽の影響を特徴づけるノイズ演算子の推論が提案されていた。
ここでは、高価なニューラルネットワークは不要であり、このノイズ演算子記述は効率的なパラメータ化を許容することを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:25:50 GMT)
Tell Me the Good Stuff: User Preferences in Movie Recommendation Explanations [0.9] 人気映画のレコメンデーションにおいて,片面(純粋に肯定的)と両面(肯定的,否定的)の特徴に基づく説明のユーザ認知について検討した。
本研究は,人気映画レコメンデーションなどのエンターテイメント分野において,よりシンプルな肯定的な説明がより効果的である可能性が示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:52:33 GMT)
From Glue-Code to Protocols: A Critical Analysis of A2A and MCP Integration for Scalable Agent Systems [0.9] エージェント間通信のためのGoogleのエージェント・トゥ・エージェント(A2A)プロトコルと標準化されたツールアクセスのためのAnthropicのモデルコンテキストプロトコル(MCP)の2つのオープンスタンダードは、断片化されたカスタム統合アプローチの制限を克服することを約束している。
本稿では, A2A と MCP を効果的に統合することは, 交差点に固有の, 創発的な課題をもたらすことを主張する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:40:39 GMT)
Precision Glass Thermoforming Assisted by Neural Networks [0.8] 本稿では, 形状誤差を適切に予測できる無次元バックプロパゲーションニューラルネットワーク(BPNN)に基づく代理モデルについて報告する。
シミュレーションと産業データによる試行は、代理モデルが正確な精度で形成誤差を予測できることを示唆している。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:14:51 GMT)
Deep Learning Framework for Infrastructure Maintenance: Crack Detection and High-Resolution Imaging of Infrastructure Surfaces [0.7] 本研究では、畳み込みニューラルネットワーク(CNN)と効率的なサブピクセル畳み込みニューラルネットワーク(ESPCNN)からなるフレームワークを開発した。
軽量超解像法であるESPCNNは,CNNから得られた正の苦難の高分解能インフラストラクチャ画像を生成する。
提案手法は,高速道路の災害検知を高精度に行うとともに,効率的な資産管理の実践を支援することが期待されている。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:52:58 GMT)
A Sensitivity-Driven Expert Allocation Method in LoRA-MoE for Efficient Fine-Tuning [0.7] パラメータ感度のLoRA-SMoEに基づいて専門家数を割当てる手法を提案する。
実験の結果,LoRA-SMoE手法はトレーニング可能なパラメータの数を減らしながらモデル性能を向上させることができることがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:22:46 GMT)
Mitigating mode collapse in normalizing flows by annealing with an adaptive schedule: Application to parameter estimation [0.6] 有効なサンプルサイズ(ESS)に基づく適応スケジュールは,モード崩壊を軽減できることを示す。
提案手法は, マルコフ連鎖モンテカルロ法より10倍少ない時間で時系列データに適合する生化学的発振子モデルの限界確率を収束させることを実証した。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:58:48 GMT)
Enhancing Women's Experiences in Software Engineering [0.6] 本研究は,3つの異なる生活段階において女性が直面する課題について考察する。
高校生の課題は、両親に責任を負うのに十分成熟していると納得させることに向けられることが多い。
それらが進むにつれて、責任管理の能力を証明することに重点が移る。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:59:41 GMT)
An Active Inference perspective on Neurofeedback Training [0.6] Neurofeedback Training (NFT)は、リアルタイムフィードバックを通じて脳活動の自己制御を教えることを目的としている。
NFTは、非常に可変な結果と、十分に理解されていないメカニズムに悩まされ、その検証を妨げている。
NFT閉ループの形式的計算モデルを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:41:31 GMT)
LlamaFirewall: An open source guardrail system for building secure AI agents [0.6] 大規模言語モデル(LLM)は、単純なチャットボットから複雑なタスクを実行できる自律エージェントへと進化してきた。
リスクを軽減するための決定論的解決策が欠如していることを考えると、リアルタイムガードレールモニターが不可欠である。
私たちはオープンソースのセキュリティにフォーカスしたガードレールフレームワークであるLlamaFirewallを紹介します。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:34:21 GMT)
The Power of Stories: Narrative Priming Shapes How LLM Agents Collaborate and Compete [0.5] 私たちは、チームワークを異なる学位に強調するストーリーをメインエージェントとして、これが交渉の結果にどのように影響するかをテストします。
ストーリーベースのプライミングは交渉戦略や成功率に大きく影響している。
対照的に、異なるストーリーを持つプライミングエージェントは、この効果を逆転させ、これらのエージェントは、自己利益に向かって急上昇した。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:23:25 GMT)
Synthline: A Product Line Approach for Synthetic Requirements Engineering Data Generation using Large Language Models [0.5] 本稿では,大規模言語モデルを用いて合成要求工学(RE)データを生成する製品ライン(PL)アプローチであるSynthlineを紹介する。
我々の分析によると、合成データセットは実際のデータよりも多様性が低いが、実行可能なトレーニングリソースとして機能するには十分である。
以上の結果から, 合成データと実データを組み合わせることで, 大幅な性能向上が期待できる。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:57:16 GMT)
Interpreting Multipartite Entanglement through Topological Summaries [0.5] マルチパーティの絡み合いの研究は、バイパートのシナリオよりもはるかに少ない。
近年, トポロジカルデータ解析のツールを用いて, 多粒子状態にトポロジカル量を付加する手法が提案されている。
これらの抽象的位相量と2つのシナリオにおける絡み合いの操作的解釈を結びつけるための第一歩を踏み出す。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:24:29 GMT)
A Comparative Analysis of Ethical and Safety Gaps in LLMs using Relative Danger Coefficient [0.5] 本稿では,各種AIモデルの倫理的性能の比較分析を行う。
我々は、特に高い利害関係の状況において、堅牢な人間の監視の必要性を強調します。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:58:04 GMT)
Strong Screening Rules for Group-based SLOPE Models [0.5] グループベースSorted L-One Penalized Estimation(SLOPE)モデルのスクリーニングルールを開発する。
開発されたルールは、OSCARを含むグループベースのモデルのより広範なファミリーに適用できる。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:55:11 GMT)
Neural Integral Operators for Inverse problems in Spectroscopy [0.5] 本稿では,第1種の積分方程式による積分作用素の学習に基づく,分子スペクトルの分類のための深層学習手法を提案する。
ディープ・ラーニング・アプローチの問題を定式化するのは逆問題に基づいている。
このモデルは、決定木やサポートベクターマシンといった従来の機械学習アプローチよりも優れており、小さなデータセットでは、他のディープラーニングモデルよりも優れています。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:22:46 GMT)
MAMMAL -- Molecular Aligned Multi-Modal Architecture and Language [0.5] MAMMALは多タスク基盤モデルの作成に応用された汎用的手法であり、多様なモダリティにわたる大規模生物学的データセットから学習する。
11の下流タスクで評価され、9つのタスクでSOTA(the new state of the art)に到達し、2つのタスクでSOTAに匹敵する。
抗体-抗原およびナノボディ-抗原複合体上でのαfold 3結合予測能について検討し, 4点中3点においてMAMMALの分類性能は有意に向上した。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:46:11 GMT)
Controlled Displacement of Stored Light at Room Temperature [0.4] 空間的に1光波長を超える距離で室温で蓄積された光パルスを変換する。
干渉計方式により、この線形翻訳の平均速度を計測し、センサ応用のための停止光実験を利用する。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:47:40 GMT)
Qimax: Efficient quantum simulation via GPU-accelerated extended stabilizer formalism [0.4] 拡張安定化器形式を用いたクリフォード回路と近クリフォード回路のシミュレーションは、ますます人気が高まっている。
我々は,GPUなどのマルチコアデバイス上での効率的な実行を実現するために,拡張安定化器フォーマリズムの並列バージョンを導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:41:28 GMT)
Exploring the application of quantum technologies to industrial and real-world use cases [0.4] 量子コンピューティングの最近の進歩は、実用性の時代につながっている。
この時代の目標は、量子コンピューティングを活用して、機械学習、最適化、物質シミュレーションといった分野における現実世界の問題を解決することである。
この写本は、このパラダイムにおける最近のコントリビューションを提示し、概説している。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:33:23 GMT)
Average mutual information for random fermionic Gaussian quantum states [0.4] 混合ガウス状態と固定スペクトルのアンサンブル上で平均化されたバイパルタイト系における典型的な相互情報を計算する。
我々は,レベル密度と平均相互情報に基づいて,サブシステムにおける平均フォン・ノイマンエントロピーを評価する。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:53:53 GMT)
Average entanglement entropy of a small subsystem in a constrained pure Gaussian state ensemble [0.4] 単一モード境界と特定のモードモード相関によってパラメタ化される純粋ガウス状態のアンサンブルを考える。
我々は、小さな部分系の平均エンタングルメントエントロピーが、同じ境界を持つ混合ガウス状態のフォン・ノイマンエントロピーと同じであるが、相関関係はないことを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:03:29 GMT)
IndicSQuAD: A Comprehensive Multilingual Question Answering Dataset for Indic Languages [0.4] IndicSQuADは9つの主要なIndic言語をカバーする包括的多言語抽出QAデータセットである。
IndicSQuADは、各言語に対する広範なトレーニング、検証、テストセットを含む。
言語固有の単言語BERTモデルと多言語 MuRIL-BERT を用いたベースライン性能の評価を行った。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:42:54 GMT)
Typical Machine Learning Datasets as Low-Depth Quantum Circuits [0.4] 我々は,従来の画像データを量子状態としてロードする低深度量子回路を見つけるための効率的なアルゴリズムを開発した。
我々は,MNIST,Fashion-MNIST,CIFAR-10,Imagenetteデータセットについて系統的研究を行った。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:27:51 GMT)
Beyond Bare Queries: Open-Vocabulary Object Grounding with 3D Scene Graph [0.4] 自然言語で記述されたオブジェクトの配置は、自律的なエージェントにとって重要な課題である。
本稿では,3次元シーングラフ表現をメカニカル空間エッジとセマンティック空間エッジで構築するBBQというモジュラー手法を提案する。
BBQは,他のゼロショット法と比較して,オープンな3次元セマンティックセマンティックセマンティックセグメンテーションにおいて中心的な役割を担っていることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:02:10 GMT)
Patterns and Mechanisms of Contrastive Activation Engineering [0.4] CAEは、フレキシブルでタスク固有の振る舞いチューニングの新しいパラダイムを導入する可能性がある。
本研究では,配当・配当・配当設定におけるCAEの性能を分析し,欠点を評価し,その効果的な展開のための包括的ガイドラインの開発に着手する。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:15:12 GMT)
Lessons from the trenches on evaluating machine-learning systems in materials science [0.4] 科学における機械学習評価フレームワークの現状と今後の方向性について検討する。
構成妥当性,データ品質問題,メートル法設計制限,ベンチマーク保守問題など,機械学習評価に共通する課題を特定する。
本研究では,測定選択と制限を文書化するための構造化手法として評価カードを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:20:04 GMT)
Polar Coordinate-Based 2D Pose Prior with Neural Distance Field [0.3] ニューラル距離場(NDF)に基づく2次元ポーズ事前誘導補正手法を提案する。
接続長を明示的に組み込んだ極座標に基づく表現を導入し、誤ポーズ推定をより正確に補正する。
提案手法は,複数のポーズ表現にまたがって2次元ポーズ推定を改善する能力を示した長跳びデータセットを用いて評価した。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:31:14 GMT)
Enhanced Simultaneous Quantum-Classical Communications Under Composable Security [0.3] 同時量子古典通信(SQCC)プロトコルにより、同じ光パルスとモードで量子記号と古典記号を同時に統合することができる。
我々は、SQCCスキームに固有のセキュリティ上の懸念に対処し、古典的チャネルと量子チャネルの結合に関する最新のモデルを提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:40:48 GMT)
Variable Frequency Pulse Generation from Breathers in Josephson Transmission Lines [0.3] 単一磁束量子技術は超伝導量子系の読み出しと制御を強化する可能性がある。
現在の極低温の読み出しと制御は、室温制御エレクトロニクスと極低温装置の間を移動する特定の周波数のマイクロ波パルスを必要とする。
ジョセフソン伝送線路における直流中心フラックスとフラックスイドの列車からギガヘルツ周波数マイクロ波トーンを生成するためのプロトコルを検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:52:50 GMT)
Robust Perspective Correction for Real-World Crack Evolution Tracking in Image-Based Structural Health Monitoring [0.3] 本研究では、オープンなKAZEアーキテクチャをSHM固有の課題に適応させる物理インフォームドアライメントフレームワークを提案する。
従来の検出器と比較して、提案手法はクラック面積とスピン長誤差を最大70%と90%削減する。
教師なし、解釈可能、計算量的に軽量なこのアプローチは、UAVやモバイルプラットフォームによるスケーラブルなデプロイメントをサポートする。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:25:33 GMT)
Improving Omics-Based Classification: The Role of Feature Selection and Synthetic Data Generation [0.2] 本研究では,特徴選択とデータ拡張技術を統合した機械学習に基づく分類フレームワークを提案する。
提案したパイプラインは、小さなデータセット上で、相互に検証されたパーフォマンスが得られることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:09:50 GMT)
Deep Research Bench: Evaluating AI Web Research Agents [0.1] 89のマルチステップWebリサーチタスクインスタンスからなるDeep Research Benchを紹介する。
大規模な凍結したWebページを備えた"RetroSearch"環境を提供し、オフラインの"RetroSearch"エージェントが"ライブWeb"エージェントと互換性を持って動作することを示す。
幻覚, 道具の使用, 忘れる際の経過を報告するために, 長いエージェントのトレースを自動的に評価する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:28:50 GMT)
Towards a standardized methodology and dataset for evaluating LLM-based digital forensic timeline analysis [0.1] 大規模言語モデル(LLM)は、デジタル法医学を含む多くの領域で広く採用されている。
本稿では,LLMのディジタル法医学的タスクへの応用を定量的に評価するための標準化手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:22:30 GMT)
Interpretable Learning Dynamics in Unsupervised Reinforcement Learning [0.1] 本稿では,教師なし強化学習(URL)エージェントの解釈可能性フレームワークを提案する。
DQN,RND,ICM,PPO,Transformer-RNDの5種類のエージェントを手続き的に生成する環境下で訓練した。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:57:09 GMT)
Framework GNN-AID: Graph Neural Network Analysis Interpretation and Defense [0.1] GNN-AID(Graph Neural Network Analysis, Interpretation, and Defense)は,グラフデータのためのオープンソースのフレームワークである。
Pythonライブラリとして構築されたGNN-AIDは、高度な信頼メソッドとアーキテクチャレイヤをサポートし、グラフデータセットとGNNの振る舞いを分析できる。
グラフビジュアライゼーション用のツールを備えたWebインターフェースや、インタラクティブなモデルビルダーのようなノーコード機能も備えている。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:03:19 GMT)
Methods for quantum interference in atomic ensemble [0.1] 二色場を用いた原子アンサンブルにおける量子干渉信号を得る実験手法について述べる。
集団再分配と非退化状態間の量子重ね合わせによる共鳴を同時に観測することができた。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:00:09 GMT)
Reducing thermal noises by quantum refrigerators [0.1] 3レベル・4レベルのシステムを「量子冷凍機」として利用することを検討する。
このような量子冷蔵庫システムでは、MW共振器は多くの3レベルまたは4レベルシステムと結合している。
いずれの場合も、MW共振器の冷却限界の解析結果を得る。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:58:11 GMT)
Knowledge Graphs for Enhancing Large Language Models in Entity Disambiguation [0.1] 我々は、ゼロショットエンティティ曖昧化(ED)のためのLarge Language Models(LLM)を強化するために知識グラフを使用します。
我々は、KG内のエンティティのクラスを階層的に表現することで、候補空間とエンティティの記述を訓練し、入力プロンプトを追加の事実知識で強化する。
一般的なEDデータセットを用いた評価の結果,提案手法は非強化および記述専用拡張LDMよりも優れており,タスク固有モデルよりも適応性が高いことがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:44:35 GMT)
HAIR: Hardness-Aware Inverse Reinforcement Learning with Introspective Reasoning for LLM Alignment [0.0] HAIR(Hardness-Aware Inverse Reinforcement Learning with Introspective Reasoning)は、メンバーシップ推論攻撃におけるシャドーモデルにインスパイアされた新しいアライメントアプローチである。
提案手法は,(1)イントロスペクティブ推論機能を利用する構造的プロンプトを用いた7つの有害カテゴリを対象とした,バランスの取れた安全連鎖データセットの構築である。
4つの無害度と4つの有用性ベンチマークにわたる総合的な実験は、HAIRが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:47:34 GMT)
Wasserstein Convergence of Score-based Generative Models under Semiconvexity and Discontinuous Gradients [0.0] スコアベース生成モデル(SGM)は、ガウス雑音で摂動させ、学習された拡散過程を通じてデノベーションすることで、データ分布を近似する。
我々は、潜在的に不連続な勾配を持つ半1次を対象とするSGMに対して、最初の非同相なワッサーシュタイン-2収束保証を確立する。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:17:15 GMT)
Universal Acceleration of Quantum Relaxation by Reset-Induced Mpemba Effect [0.0] 一般マルコフ開量子系における緩和の指数的加速を可能にする普遍的量子リセットプロトコルを導入する。
このフレームワークは、量子緩和時間スケールを制御する汎用的で実験的に実現可能なツールを提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:02:11 GMT)
UnifyFL: Enabling Decentralized Cross-Silo Federated Learning [0.0] We developed a trust-based cross-silo Federated Learning framework called UnifyFL。
多様なテストベッドを用いた評価の結果,UnifyFLは理想的なマルチレベル集中型FLに匹敵する性能を示した。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:37:38 GMT)
Understanding Decoherence of the Boron Vacancy Center in Hexagonal Boron Nitride [0.0] 六方晶窒化ホウ素(hBN)は、量子センシングの重要な材料として出現している。
本研究では、hBN における V$_mathrmB-$ 中心のデコヒーレンスを調査するために最先端の計算手法を用いる。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:20:40 GMT)
Understand the Effect of Importance Weighting in Deep Learning on Dataset Shift [0.0] ラベルシフトおよび共変量シフトによるディープニューラルネットワークにおける重み付けの有効性を評価する。
重み付けはトレーニングの早い段階で決定境界に強く影響するが、長期の最適化で消失する。
実世界の流通シフトにおける重み付けの実用性に疑問を投げかける。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:16:38 GMT)
Two-electron quantum walks probe entanglement and decoherence in an electron microscope [0.0] 電子-電子対の量子状態トモグラフィーを可能にする2電子量子ウォークを導入する。
我々は、高コントラストな2電子干渉と小さな電子-電子絡み合いの兆候を観察する。
絡み合った自由電子量子状態を特徴づける能力は、量子原理から古典現象の出現に関する洞察を与える。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:27:36 GMT)
Twist-Induced Effects on Weyl Pairs in Magnetized Graphene Nanoribbons [0.0] 本稿では,磁化ヘリコダルグラフェンナノリボン中のワイル対のダイナミクスについて検討する。
曲面を平らなミンコフスキー時空に埋め込むことで、この系に特有の完全共変2体ディラック方程式を導出する。
グラフェンナノリボン中のワイル対の動的挙動に及ぼす均一磁場とツイスト数の影響について検討した。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:59:20 GMT)
Towards an Atomic Agency for Quantum-AI [0.0] このエッセイは、米国、EU、中国の新興AIと量子技術(量子AIハイブリッドを含む)の規制、輸出管理、標準を分析します。
米国の「ワシントン効果」(不確実性の下での早期規制)と中国の「北京効果」(標準/デジタルシルク道路経由の専制規範の輸出)のリスクを示唆している。
基本基準とアジャイルの法的なガードレールを通じて、普遍的な価値("繋がるもの")に固定された、調和した量子獲得惑星への道を探っている。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:17:43 GMT)
Towards Improved Quantum Machine Learning for Molecular Force Fields [0.0] 分子力場を生成するための同変量子ニューラルネットワーク(QNN)。
本稿では,従来の研究に基づくQNNアーキテクチャについて考察し,原子環境のパラメトリゼーションにおける欠点を指摘する。
これらの欠点に対処する改良QNNアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:02:12 GMT)
The response of a quantum system to a collision: an autonomous derivation of Kubo's formula [0.0] 一般のゆらぎ-散逸関係に従う非摂動応答関数を,力学へのユニタリ寄与が定義していることを示す。
久保の公式は、時間依存摂動がポテンシャル領域を通る粒子の進化によって決定されるボルン近似において自律的に現れることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:32:42 GMT)
The cognitive triple-slit experiment [0.0] 量子実体と人間の概念は、同じ概念的な性質を持っているかもしれないが、それらが特定の文脈でそれを表現する方法は、かなり異なる可能性があることを示す。
これは、ソルキンパラメーターで観測されたゼロからの有意な偏差からも明らかであり、人間の決定に強い既約3階干渉寄与があることを示唆している。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:12:00 GMT)
The Steganographic Potentials of Language Models [0.0] 大きな言語モデル(LLM)は、平文内にメッセージを隠せる(ステガノグラフィー)
強化学習(RL)によるLLMの微調整機能について検討する。
以上の結果から,現状のモデルでは,セキュリティとキャパシティの観点から初歩的ステガノグラフィー能力を示すが,明示的なアルゴリズムガイダンスにより情報隠蔽能力が著しく向上していることが明らかとなった。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:25:52 GMT)
The Evaluation of Open Source Software Innovativeness [0.0] これは、機能付加価値の概念に支えられたイノベーションのタイプロジーを示唆している。
この研究は、広く使われているイノベーション指標の欠点を示すことによって、各セクターに特有な革新性評価の新しいアプローチを支持する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:53:11 GMT)
Tailored Design of Audio-Visual Speech Recognition Models using Branchformers [0.0] 本稿では,パラメータ効率の高い音声認識システムの設計のための新しいフレームワークを提案する。
より正確に言うと、提案するフレームワークは、まず、音声のみのシステムとビデオのみのシステムを推定し、次に、カスタマイズされたオーディオ視覚統合エンコーダを設計する。
我々のモデルは、英語で約2.5%の競争力のある単語誤り率(WER)を達成し、スペイン語で既存のアプローチを上回ります。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:24:18 GMT)
Systematic Evaluation of Initial States and Exploration-Exploitation Strategies in PID Auto-Tuning: A Framework-Driven Approach Applied on Mobile Robots [0.0] 初期システムの状態が収束に影響を及ぼし、探検と搾取のバランスが過小評価されている。
PID自動チューニングプロセスにおけるこれらの因子の系統的変化の影響を評価するために,新しいフレームワークが導入された。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:12:09 GMT)
Supervised and Unsupervised Textile Classification via Near-Infrared Hyperspectral Imaging and Deep Learning [0.0] 繊維のリサイクルは, 繊維産業の環境への影響を低減するために重要である。
本研究では,教師付きおよび教師なしのディープラーニングモデルについて検討し,その一般化能力を異なる繊維構造上で検証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:34:31 GMT)
Study and improvement of search algorithms in two-players perfect information games [0.0] 完全情報を持つ2プレイヤーゼロサムゲームの新しい探索アルゴリズムを提案する。
短い検索期間で、この大規模な実験では、すべてのゲームで研究対象のアルゴリズムを上回ります。
また,中程度の検索時間では,22ゲーム中17ゲームにおいて,すべての学習アルゴリズムを上回ります。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:29:59 GMT)
Streamlined Krylov construction and classification of ergodic Floquet systems [0.0] 単位円の理論を周期駆動(フロケ)量子系に一般化する。
他の手法と比較して、我々の手法はより高速に働き、量子力学を1次元の強結合クリロフ連鎖にマッピングする。
また、クリロフ連鎖ホッピングパラメータの挙動に基づくカオス的かつ可積分的なフロケ系の分類を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:53:09 GMT)
State learning from pairs of states [0.0] 各キュービットの追加コピーが供給された場合、一つのキュービットではなく、同じ状態のキュービットのペアを受け取ることが示される。
量子ビット対の列の対称的,情報的に完備な測定を数値的にシミュレートする。
数千の量子ビット対を検出するのに十分であることがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 23:55:43 GMT)
Squeezing at the normal-mode splitting frequency of a nonlinear coupled cavity [0.0] 量子増幅結合キャビティシステムは、通常のモード分割周波数7.47MHzの周囲の3.3dBの量子ノイズ低減を実現する。
本結果は,重力波検出や高精度センシングなど,先進量子応用のための結合キャビティ・サスペンサーの期待を裏付けるものである。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:13:28 GMT)
Sparse-Group Boosting with Balanced Selection Frequencies: A Simulation-Based Approach and R Implementation [0.0] 本稿では,ベースラーナーの選択のバランスをとることで,変動選択バイアスを低減する新しいフレームワークを提案する。
Rでsgboostパッケージを導入し、スパースグループブースティングと組み合わせてこのフレームワークを実装した。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:38:16 GMT)
Solar Flare Forecast: A Comparative Analysis of Machine Learning Algorithms for Solar Flare Class Prediction [0.0] 太陽フレアは太陽系で最も強力でダイナミックな現象であり、太陽の大気に蓄積された磁気エネルギーが突然放出された結果である。
本研究では、太陽フレアを4つのカテゴリに分類する3つの機械学習アルゴリズムの予測性能を評価する。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:08:41 GMT)
Short remarks on shallow unitary circuits [0.0] 線形システムサイズよりも小さい深さの局所的なユニタリ回路は、大域的ハール乱ユニタリと容易に区別できることを示す。
浅いユニタリ回路学習問題の定式化のための簡単なアルゴリズムについて説明する。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:05:55 GMT)
Sharpness-Aware Minimization with Z-Score Gradient Filtering for Neural Networks [0.0] ディープニューラルネットワークでうまく一般化することは、依然として重要な課題である。
Sharpness-Aware Minimization (SAM) の簡易かつ効果的な拡張である ZSharp を提案する。
ZSharpは、統計的に重要な勾配成分のみを保持するために、階層的にZスコア正規化を行い、パーセンタイルベースのフィルタリングを行う。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:56:40 GMT)
Sequential decoding of the XYZ$^2$ hexagonal stabilizer code [0.0] 我々は、ハニカム格子上で定義されたXYZ$2$コードを調べ、2つのステップでシンドローム情報を復号する。
ノイズを非偏極化するために、シーケンシャルマッチングデコーダは18.3%の閾値を与え、最適に近い。
データ量子ビット上の位相バイアスノイズに対して、バイアス=eta = fracp_zp_x+p_y = 10$では、信念マッチングベースのデコーダが24.1%に達する。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:53:51 GMT)
Self-Supervised Learning for Robotic Leaf Manipulation: A Hybrid Geometric-Neural Approach [0.0] 本稿では,自律的な葉の把握のためのハイブリッドな幾何学的アプローチを提案する。
本手法は,従来のコンピュータビジョンとニューラルネットワークを自己教師付き学習により統合する。
制御された環境では88.0%、実際の温室環境では84.7%の成功率を達成した。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:22:21 GMT)
Scaling of Quantum Geometry Near the Non-Hermitian Topological Phase Transitions [0.0] 我々は、異なる位相相転移に近い基底状態多様体上の量子幾何学の多様なスケーリングを明らかにする。
特定の臨界点に近づき、基底状態のベリー接続の拡張に伴うワニエ状態相関関数は空間的異常な挙動を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:56:48 GMT)
Scalable Structure For Chiral Quantum Routing [0.0] 我々は、ある送信者からネットワーク内の多くの可能な受信者へ量子的および古典的な情報をルーティングする問題に対処する。
量子ウォークの形式性を利用することで、完全グラフに基づく離散構造上の力学を記述する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:27:37 GMT)
Ruled by the Representation Space: On the University's Embrace of Large Language Models [0.0] 本稿では,大学における大規模言語モデル(LLM)の急速な導入が学習,教育,研究に与える影響について考察する。
LLMを非批判的に採用することで、大学は、規範が民主的ではない生成的AIの分野であるヘテロノミーの分野に自治権を放棄する、と論じている。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:22:37 GMT)
Relaxed Gaussian process interpolation: a goal-oriented approach to Bayesian optimization [0.0] 本研究では,ガウス過程(GP)モデリングの文脈で予測分布を求める新しい手法を提案する。
緩和ガウス過程(reGP)と呼ばれる手法は、興味の範囲でより良い予測分布を提供する。
これはゴール指向の方法と見なすことができ、ベイズ最適化において特に興味深いものとなる。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:29:29 GMT)
Regression is all you need for medical image translation [0.0] 医療画像翻訳(MIT)は、取得したデータから合成画像を生成することにより、既存のデータセットの強化と補完に役立つ。
本稿では,約2.5Dの拡散型MIT用フレームワークであるYODAを紹介する。
YODA は最先端の GAN 法や DM 法より優れていることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:56:47 GMT)
Real-Time Scattering on Quantum Computers via Hamiltonian Truncation [0.0] 実時間散乱過程にハミルトニアントラニケーション(HT)を模擬した量子計算フレームワークを提案する。
HT はヒルベルト空間の量子論を、可解な参照ハミルトニアンのエネルギー固有基底に乗じて近似する。
この結果から,ハミルトニアン・トランケーションは量子場理論の量子シミュレーションに有望な戦略をもたらすことが示唆された。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:00:01 GMT)
RAN Cortex: Memory-Augmented Intelligence for Context-Aware Decision-Making in AI-Native Networks [0.0] RAN Cortexは、AIベースのRAN決定システムにおけるコンテキストリコールを可能にする、メモリ拡張アーキテクチャである。
この作業では、AIネイティブなRAN設計に欠けているプリミティブとしてメモリを導入し、再トレーニングや集中型推論を必要とせずに“学習エージェント”を有効にするフレームワークを提供する。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:01:05 GMT)
RAG-MCP: Mitigating Prompt Bloat in LLM Tool Selection via Retrieval-Augmented Generation [0.0] 大規模言語モデル(LLM)は、MCP(Model Context Protocol)citeIntroducingMCP(リンク)など、多くの外部ツールを効果的に活用するために苦労している。
RAG-MCPは、ツール発見をオフロードすることで、この課題を克服するRetrieval-Augmented Generationフレームワークである。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:05:35 GMT)
Quantum correlations in entangled two-particle non-unitary quantum walks [0.0] 本研究では、2粒子の離散時間非単位量子ウォークにおける量子相関の進化を、利得と損失のある直線上で研究する。
状態(対称あるいは反対称)の散逸と粒子交換対称性が結果の相関にどのように影響するかを検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:20:43 GMT)
Quantum computing inspired paintings: reinterpreting classical masterpieces [0.0] 我々は、アートワークを構成するために量子コンピューティング技術を適用することを目指している。
主な構想は、ミケランジェロ・メリシ(Caravaggio)が1597年-1599年頃に描いた「ナルコソ」、1964年にレネ・マグリッテが描いた「Les fils de l'homme」、1966年にジェラルド・リヒターが描いた「192 Farben」である。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:35:34 GMT)
Quantum circuit lower bounds in the magic hierarchy [0.0] 任意のサイズのクリフォード回路と2量子ゲートを持つ定数深度回路を交換する量子回路モデルであるマジック階層を導入する。
クリフォード回路とtextsfQNC0$ からなる回路で、特定の明示的な量子状態が概ね準備できないことを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:48:59 GMT)
Parametrized multiqubit gate design for neutral-atom based quantum platforms [0.0] ゲートセットの巧妙な選択と設計は、量子回路の深さを減らし、量子アルゴリズムから得られる解の質を向上させることができる。
特にパラメタライズドゲートは、短期アルゴリズムと回路コンパイルの両方で使われている。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:55:38 GMT)
PINN-MEP: Continuous Neural Representations for Minimum-Energy Path Discovery in Molecular Systems [0.0] 物理インフォームドニューラルネットワーク(PINN)を用いた連続最適化問題として遷移経路生成を再構成する手法を提案する。
遷移経路を暗黙的な神経機能として表現することにより、高価な経路サンプリングを必要とせず、物理的に現実的な遷移経路の効率的な発見を可能にする。
ウシ膵トリプシンインヒビター(BPTI)を8,300個以上含む2種類のタンパク質に対して,本法の有効性を実証した。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:43:13 GMT)
PAHA: Parts-Aware Audio-Driven Human Animation with Diffusion Model [0.0] 拡散モデルを用いた音声駆動上半身アニメーションフレームワークPAHAを提案する。
本稿では、PAR(Parts-Aware Re-weighting)とPCE(Parts Consistency Enhancement)の2つの主要な手法を紹介する。
我々は,中国初の公開ニュースアンカー音声データセットであるCNASを構築し,この分野の研究と検証を進めた。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:03:58 GMT)
Observation of optical vortex generation via magnon-induced Brillouin light scattering [0.0] 回転対称性を持つ系では、軌道角運動量(OAM)が光と物質の間で交換できることが知られている。
このような現象の最も一般的な応用の1つは、光とネマティック液晶ベースの空間光変調器(SLM)とのOAM交換による光学OAMの操作である。
ここでは、マグノン誘起ブリルアン光散乱を用いた光渦ビームの発生を実証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:57:24 GMT)
OSUniverse: Benchmark for Multimodal GUI-navigation AI Agents [0.0] OSUniverseは、高度なGUIナビゲーションAIエージェントのための複雑なマルチモーダルデスクトップ指向タスクのベンチマークである。
タスクを、基本的な精度のクリックからマルチステップ、ディクスタリティ、精度、エージェントからの明確な思考といった複雑さのレベルに分割する。
ベンチマークは手動で評価できるが、平均エラー率2%未満の自動検証機構も導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:29:47 GMT)
Non-onsite symmetries and quantum teleportation in split-index matrix product states [0.0] 我々は、新しい物理的および計算的性質を持つスピン鎖のクラスを記述する。
物理的側面では、スピン鎖は非オンサイト対称性によって定義される対称性で保護された位相の例を与える。
計算面では、スピン鎖は長距離で決定論的に情報をテレポートするために使用できる新しい種類の状態を表す。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:36:00 GMT)
Non-Gaussian Noise Magnetometry Using Local Spin Qubits [0.0] 局所的,空間的に解決された方法で高次磁気ノイズ累積量を不明瞭に測定する方法を示す。
次に、相互作用しない2段階系のバスのモデルを考えることにより、これらのプロトコルの有用性を実証する。
どちらの場合も、実際の多体システムにおいて、このテクニックをどのように測定することができるかを強調します。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:00:01 GMT)
Noiseless Loss Suppression for Entanglement Distribution [0.0] 最近の研究は、ノイズのない増幅とノイズのない減衰とのペアリングが、量子状態の直接伝送における損失項を条件的に抑制できることを示唆している。
ここでは、絡み合った状態、特に2モード圧縮真空(TMSV)とNOON状態について検討する。
W 状態と NOON 状態の両方において、ノイズのない減衰は冗長であり、損失項抑制を達成できない。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:48:36 GMT)
Machine Learning-Based Prediction of Quality Shifts on Video Streaming Over 5G [0.0] Quality of Experience(品質・オブ・エクスペリエンス、QoE)は、YouTubeのようなオーバー・ザ・トップ(OTT)プラットフォームでビデオセッションをストリーミングする際の満足度である。
YouTubeストリーミングセッションの品質シフトと、RSRP, RSRQ, SNRのチャネルメトリクスとの関係について検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:25:16 GMT)
Lilan: A linear latent network approach for real-time solutions of stiff, nonlinear, ordinary differential equations [0.0] 厳密な常微分方程式(StODE)を解くには洗練された数値解法が必要であるが、しばしば計算コストがかかる。
本研究では,StODEの潜在力学を学習し,数値積分を完全に回避する手法を提案する。
言い換えれば、元の力学の解は一連の直線に符号化され、それを復号して実際の解を必要な時に取り出すことができる。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:57:31 GMT)
Lightweight Clinical Decision Support System using QLoRA-Fine-Tuned LLMs and Retrieval-Augmented Generation [0.0] 本研究では,医療におけるLarge Language Models(LLM)の適用について検討する。
我々は、病院固有のデータと統合された検索型RAG(Retrieval-Augmented Generation)による医療意思決定支援と、量子化低ランク適応(QLoRA)を用いた微調整に焦点を当てる。
我々は、患者のプライバシ、データセキュリティ、厳格な臨床検証の必要性、およびそのようなシステムを現実の医療に組み込むための実践的な課題など、倫理的な配慮に目を向ける。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:31:54 GMT)
Learning entanglement from tomography data: contradictory measurement importance for neural networks and random forests [0.0] 2量子トモグラフィーデータからの絡み合いの定量化におけるニューラルネットワークとランダム森林の2つの機械学習手法の有効性について検討した。
ニューラルネットワークの精度は向上するが、2つの手法が予測に到達する方法は驚くほど異なる。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:42:35 GMT)
Lai Loss: A Novel Loss for Gradient Control [0.0] ライロス」は、正規化項(特に勾配)を従来の損失関数に統合した新しい損失設計である。
この損失により、モデルの滑らかさと感度を効果的に制御できる。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:10:24 GMT)
Knowledge Distillation Inspired Variational Quantum Eigensolver with Virtual Annealing [0.0] 知識蒸留による変分量子固有解法(KD-VQE)
知識蒸留(KD)における仮想蒸留プロセスに触発されたKD-VQEは、変分量子固有解法(VQE)フレームワークに仮想アニール機構を導入する。
二つのFermi-Hubbardモデルに適用することで,KD-VQEの有効性を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:21:32 GMT)
Interplay between external driving, dissipation and collective effects in the Markovian and non-Markovian regimes [0.0] 外部駆動と消散がオープン量子系の力学にどのように影響を与えるかを示す。
結果は空洞QED、フォトニック結晶、状態依存光学格子などのプラットフォームで実験的に利用可能である。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:13:27 GMT)
Improved subsample-and-aggregate via the private modified winsorized mean [0.0] 修正されたWinsorized平均は、いくつかの大きな分布のクラスに対して最小限最適であることを示す。
我々は、修正されたウィンソル化平均をサブサンプル・アンド・アグリゲートのアグリゲータとみなす。
論文参考訳(メタデータ) (Tue, 06 May 2025 20:21:44 GMT)
Impact and mitigation of Hamiltonian characterization errors in digital-analog quantum computation [0.0] デジタルアナログ(Digital-analog)は、量子コンピューティングのパラダイムであり、システムの自然に絡み合うハミルトニアンと単一キュービットゲートをリソースとして利用する。
ハミルトン特性誤差に対するこれらのプロトコルの安定性について検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:49:20 GMT)
Humans can learn to detect AI-generated texts, or at least learn when they can't [0.0] 本研究では、即時フィードバックが得られた場合に、個人が人書きテキストとAI生成テキストの正確な識別を学べるかどうかを検討する。
我々はGPT-4oを用いて、様々なジャンルやテキストタイプに数百のテキストを生成しました。
チェコ語母語話者255人にランダム化されたテキストペアを提示した。
論文参考訳(メタデータ) (Tue, 06 May 2025 17:51:58 GMT)
Human-Robot Interaction and Perceived Irrationality: A Study of Trust Dynamics and Error Acknowledgment [0.0] 本研究では,ロボットの故障に対する人間の反応を解析し,信頼のダイナミクスとシステム設計を体系的に検討する。
我々は,人間とロボットのインタラクションを通じて,信頼がどのように進化するかを調査する4段階の調査を行った。
その結果,ロボットの誤りや限界を認識すると,ロボットシステムの信頼性は著しく向上した。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:25:02 GMT)
HardML: A Benchmark For Evaluating Data Science And Machine Learning knowledge and reasoning in AI [0.0] HardMLは、データサイエンスと機械学習の分野における知識と推論能力を評価するために設計されたベンチマークである。
HardMLは6ヶ月にわたって手作りされた、多目的の質問に挑戦する100の多様なセットで構成されている。
最先端のAIモデルは、このベンチマークで30%のエラー率を達成する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:53:34 GMT)
HINT: Hypernetwork Approach to Training Weight Interval Regions in Continual Learning [0.0] 埋め込み空間内に間隔演算を用いるHINTを導入する。
我々は、連続したタスクに対するインターバル埋め込みを訓練し、ハイパーネットワークをトレーニングし、これらの埋め込みをターゲットネットワークの重みに変換する。
HINTはInterContiNetよりもはるかに優れた結果を取得し、いくつかのベンチマークでSOTA結果を与える。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:52:21 GMT)
Fidelity and efficiency analysis for heralded entanglement swapping in lossy channels: linear and nonlinear optical approaches [0.0] 非線形光学(NLO-BSM)に基づくベル状態測定を提案し,実装した。
損失チャネルにおけるLO-BSMとNLO-BSMのエンタングルメントスワップの忠実度を解析した。
ナノフォトニクスの進歩が、実用的で高忠実なNLO-BSMベースの量子ネットワークアプリケーションを実現するかを強調した。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:03:10 GMT)
Feature Relevancy, Necessity and Usefulness: Complexity and Algorithms [0.0] 本稿では,既存の手法とアルゴリズムを改良し,どの機能に関連があるか,あるいは必要なのかを判断する。
特に、ニューラルネットワークのような複雑なモデルにおいて、必要が効率的に検出できることが示される。
本論では,テクストゥスフルネスのグローバルな概念(すなわち,ある特徴が一般のモデルの振る舞いに重要であるか否かを,特定の入力ではなく,一般的にはモデルの振る舞いに重要であるかを説明すること)を提示し,その妥当性と必要性に関係があることを証明する。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:41:07 GMT)
Explaining Anomalies with Tensor Networks [0.0] 本稿では,説明可能な異常検出のためのツリーテンソルネットワークを提案する。
いくつかのベースラインモデルと比較して,適切な予測性能を示す。
これにより、より広範な潜在的な問題にテンソルネットワークの適用を拡大する。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:35:05 GMT)
Evaluation of UAV-Based RGB and Multispectral Vegetation Indices for Precision Agriculture in Palm Tree Cultivation [0.0] 精密農業は、作物の生産性を高め、持続可能な農業慣行を促進するために、正確な植生モニタリングに依存している。
本研究では,ドバイのヤシの木栽培地域における植生健康評価のためのUAV画像の総合評価を行った。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:50:39 GMT)
Enhancing the controllability of quantum systems via a static field [0.0] 2つの入力を持つ制御ハミルトニアンが弱共役結合スペクトルを持つならば、2つの入力のうちの1つをほぼ全ての定値で凍結すると、得られる単一入力系は制御可能である。
この結果は、キラル分子におけるエナンチオマー選択的励起と、駆動されたJaynes--Cummings Hamiltonianの2つの例で示される。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:57:53 GMT)
Enhancing Glass Defect Detection with Diffusion Models: Addressing Imbalanced Datasets in Manufacturing Quality Control [0.0] 工業用ガラス製造における視覚欠陥検出は、欠陥製品の頻度が低いため、依然として重要な課題である。
本稿では, 差動拡散確率モデル(DDPM)を用いて, データ拡張のための合成欠陥ガラス製品画像を生成する手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:16:56 GMT)
Emergence of a Classical Dirac-Type Spin from On-Shell Factorisation and Liouvillian Evolution [0.0] リウヴィルの定理は位相空間の分布そのものに間に合うように第一次であるが、相対論的質量殻の制約は$pmu p_mu = m2$はエネルギーの第二次である。
我々は、相対論的量子力学におけるディラックのアプローチと類似して$(p2 - m2)$を分解することで、ハミルトニアン内の両方のエネルギー枝を統一することは合理的であると主張する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:02:52 GMT)
Elevating Semantic Exploration: A Novel Approach Utilizing Distributed Repositories [0.0] 本稿では,イタリア司法省向けに開発された分散文書リポジトリシステムについて検討する。
エッジリポジトリを使用してデータとメタデータを分析し、セマンティックな探索機能を強化する。
論文参考訳(メタデータ) (Tue, 06 May 2025 11:30:16 GMT)
Electrically Reconfigurable NbOCl$_2$ Metasurface for Quantum Technologies [0.0] 絡み合った光子対光源は、セキュアな通信、量子センシング、イメージングを含む量子技術の進歩の基礎となっている。
本稿では,ナノ構造を持つNbOCl$$クリスタルを用いた電気的絡み合った光子対光源について述べる。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:11:56 GMT)
Efficient Training of Physics-enhanced Neural ODEs via Direct Collocation and Nonlinear Programming [0.0] 本稿では,物理強調型ニューラルネットワーク(PeNODE)を動的最適化問題として表現することで,新しい学習手法を提案する。
ニューラル成分を含む全モデルは、レジェンド=ガウス=ラダウ点を反転させた高次暗黙のルンゲ=クッタ法を用いて離散化される。
この定式化は、ネットワークパラメータと状態軌跡の同時最適化を可能にし、安定性、ランタイム、精度の観点からODEソルバベースのトレーニングの重要な制限に対処する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:04:46 GMT)
Effective backdoor attack on graph neural networks in link prediction tasks [0.0] グラフニューラルネットワーク(GNN)は、グラフ構造化データを処理可能なディープラーニングモデルのクラスである。
近年の研究では、GNNモデルがバックドア攻撃に弱いことが報告されている。
本稿では,GNNに基づくリンク予測タスクに対するバックドア攻撃を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:36:14 GMT)
Effective Hamiltonian approach to the exact dynamics of open system by complex discretization approximation for environment [0.0] 複素ガウス二次関数に基づく複素周波数空間への離散化近似法の一般化を提案する。
有効ハミルトニアンは非エルミート的であり、負の虚部を持つ複素エネルギーモードを証明できる。
論文参考訳(メタデータ) (Tue, 06 May 2025 03:53:35 GMT)
DyTTP: Trajectory Prediction with Normalization-Free Transformers [0.0] トランスフォーマーベースのアーキテクチャは、複雑な堅牢性依存関係をキャプチャする上で大きな可能性を証明している。
これらの課題に対処するための2つのアプローチを提案する。
まず、トランスフォーマーを促進する最新の方法であるDynamicTanh(DyT)をバックボーンに統合し、従来のレイヤ正規化を置き換える。
DyTを軌道予測タスクにデプロイする最初の作業です。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:46:21 GMT)
DyGEnc: Encoding a Sequence of Textual Scene Graphs to Reason and Answer Questions in Dynamic Scenes [0.0] 我々は新しい方法であるDyGEncを紹介する。
動的グラフ。
本手法は,圧縮時空間構造観察と大規模言語モデルの認知能力を統合する。
DyGEncは、人間とオブジェクトの相互作用の歴史に関する問い合わせに対して、15~25%の差で既存の視覚的手法より優れています。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:41:42 GMT)
Doing Audits Right? The Role of Sampling and Legal Content Analysis in Systemic Risk Assessments and Independent Audits in the Digital Services Act [0.0] 欧州連合のデジタルサービス法(DSA)では、オンラインプラットフォームが内部および外部監査を受ける必要がある。
本稿では,システムリスクを監査するための質的,定量的な方法の長所と短所について検討する。
我々は、コンテンツサンプリングと法的および実証的な分析を組み合わせることで、リスク特異的監査のための実行可能な方法を提供すると論じている。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:02:54 GMT)
Digital quantum simulations of scattering in quantum field theories using W states [0.0] 非弾性粒子生成の証拠はIBMの量子コンピュータを用いた一次元イジング場理論で観察される。
量子場理論散乱シミュレーションの初期状態(ウェーブパケット)を準備するための新しい量子アルゴリズム。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:07:04 GMT)
Deep Q-Network (DQN) multi-agent reinforcement learning (MARL) for Stock Trading [0.0] このプロジェクトは、従来の手法と直接強化学習(RL)が市場ノイズ、複雑さ、一般化に苦しむ、自動株式取引の課題に対処する。
提案手法は,画像としてフォーマットされた技術指標のパターンを識別する畳み込みニューラルネットワーク(CNN)と,価格履歴と技術指標の両方にわたる時間的依存関係をキャプチャする長短短期メモリ(LSTM)ネットワークと,CNNとLSTMが抽出した特徴に基づいて最適な取引ポリシー(購入,販売,保持)を学習するDeep Q-Network(DQN)エージェントを組み合わせた統合ディープラーニングフレームワークである。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:55:57 GMT)
Deep Neural Network for Phonon-Assisted Optical Spectra in Semiconductors [0.0] Ab initioをベースとした有限温度での半導体のフォノン支援光学スペクトルの正確なシミュレーションは、依然として難しい課題である。
深層学習の密結合と潜在的なモデルを組み合わせた効率的なアプローチを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:49:33 GMT)
Data-Driven Falsification of Cyber-Physical Systems [0.0] CPS(Cyber-Physical Systems)は、医療、アビオニクス、自動運転車などの安全上重要な分野に多い。
深層ニューラルネットワーク(DNN)のファルシフィケーションとCPSのファルシフィケーションを結びつける枠組みを提案する。
ツールのtextscFlexiFal として実装された我々のフレームワークは,線形および非線形のダイナミクスを持つ CPS のハード・トゥ・フィンド・カウンターサンプルを検出することができることを示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:33:06 GMT)
DatAasee -- A Metadata-Lake as Metadata Catalog for a Virtual Data-Lake [0.0] この作業は、データレイク(メタデータレイク)から派生したデータアーキテクチャを構築する。
提案するメタデータアグリゲータの概念実証実装を提示し,評価した。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:51:59 GMT)
DCS-ST for Classification of Breast Cancer Histopathology Images with Limited Annotations [0.0] 深層学習法は乳癌の病理組織像の分類において有望であることを示している。
しかし、そのパフォーマンスは、限られた注釈付きデータによって低下することが多く、医療画像にとって重要な課題である。
論文参考訳(メタデータ) (Tue, 06 May 2025 05:38:17 GMT)
Coverage-Guaranteed Speech Emotion Recognition via Calibrated Uncertainty-Adaptive Prediction Sets [0.0] しばしば感情的な抑圧と突然のアウトバーストによって引き起こされる道路の怒りは、衝突や攻撃的な行動を引き起こすことによって道路の安全を著しく脅かす。
音声感情認識技術は、ネガティブな感情を早期に識別し、タイムリーな警告を発することにより、このリスクを軽減することができる。
本稿では,予測精度を統計的に厳格に保証するリスク制御予測フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 06:27:28 GMT)
Corrupted sensing quantum state tomography [0.0] 本稿では, 量子状態と構造ノイズの同時再構成を可能にする, 劣化検出型量子状態トモグラフィの概念を提案する。
ノイズの多い量子システムにおいて、量子トモグラフィーのコストと計算労力を大幅に削減するために、これらの技術が実用的なツールとなることが考えられている。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:02:50 GMT)
Computing Canonical Averages with Quantum and Classical Optimizers: Thermodynamic Reweighting for QUBO Models of Physical Systems [0.0] 物理エネルギーなどの順序パラメータの特定の間隔に制約されたQUBOに基づくサンプリングに適用可能なヒストグラム再重み付け方式を提案する。
提案手法は,共役アンサンブルにおける期待値の算出を可能にする状態密度を精度良く復元できることを実証する。
そこで本手法は,QUBOに基づく表現と,それ以外は実空間サンプリング法で抽出可能な物理システムの,最先端のキャラクタリゼーションを推し進めるために利用することができる。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:06:59 GMT)
Composable Finite-Size Security of High-Dimensional Quantum Key Distribution Protocols [0.0] 本稿では,一般的なHD QKDプロトコルに対する集合的およびコヒーレントな攻撃に対して,構成可能な有限サイズセキュリティ証明を提案する。
また、期待されるキーレートを大幅に高める、実用的な可変長セキュリティ引数も提供します。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:00:01 GMT)
Comparing statistical and deep learning techniques for parameter estimation of continuous-time stochastic differentiable equations [0.0] 統計的手法(MLE)の推定精度と計算コストを,Ornstein-Uhlenbeckプロセスのパラメータに対するディープラーニングモデル(RNN)と比較した。
論文参考訳(メタデータ) (Tue, 06 May 2025 21:07:53 GMT)
Comparative Analysis of Lightweight Deep Learning Models for Memory-Constrained Devices [0.0] CIFAR-10、CIFAR-100、Tiny ImageNetの3つの異なるデータセットで、最先端の5つのアーキテクチャがベンチマークされている。
モデルは、分類精度、推測時間、浮動小数点演算(FLOP)、モデルサイズという4つの重要なパフォーマンス指標を用いて評価される。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:36:01 GMT)
Cognitio Emergens: Agency, Dimensions, and Dynamics in Human-AI Knowledge Co-Creation [0.0] この記事では、既存のモデルの制限に対処するフレームワークであるCognitio Emergens(CE)を紹介します。
CEはこれらの制限に対処する3つのコンポーネントを統合する。
CEは、役割、価値、組織構造の継続的な交渉を通じて、知識の共創がどのように現れるかを明らかにする。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:49:44 GMT)
Causal Intervention Framework for Variational Auto Encoder Mechanistic Interpretability [0.0] 本稿では,変分オートエンコーダ(VAE)の機械的解釈性に対する包括的因果介入フレームワークを提案する。
VAEの「回路モチーフ」を識別・解析する手法を開発し、ネットワーク層を通して意味的要因がどのようにコード化され、処理され、そして切り離されているかを調べる。
その結果、我々の介入は機能回路の分離に成功し、計算グラフを意味因子の因果グラフにマッピングし、多意味単位と単意味単位を区別できることがわかった。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:40:59 GMT)
Categorical and geometric methods in statistical, manifold, and machine learning [0.0] 本稿では、最初に citeLe2023 で開発された確率的射の圏の応用と、統計学、機械学、多様体学習におけるいくつかの問題への幾何的手法について述べる。
論文参考訳(メタデータ) (Tue, 06 May 2025 16:27:06 GMT)
Bell's inequality in relativistic Quantum Field Theory [0.0] 相対論的量子場理論におけるベルの不等式の簡潔かつ自己完結な導入について述べる。
実スカラーの質量場を例に、真空状態におけるベルの不等式と因果相補的くさびに対する違反を例証する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:36:49 GMT)
Bell and Mermin inequalities in Quantum Field Theory from vacuum projectors and Weyl operators [0.0] 我々はミンコフスキー時空における相対論的量子場論におけるエルミート双コトミック作用素の集合を構築する。
ベルとメルミンの不等式は数値的な設定によって研究される。
論文参考訳(メタデータ) (Tue, 06 May 2025 23:37:57 GMT)
Bayesian full waveform inversion with sequential surrogate model refinement [0.0] マルコフ連鎖モンテカルロ (MCMC) は後続確率密度関数をサンプリングする。
次元性推論法は、事前および訓練代理モデルを定義するのに役立つ。
本稿では,サロゲートモデルを段階的に洗練する反復的手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 07:17:03 GMT)
Automated Data Curation Using GPS & NLP to Generate Instruction-Action Pairs for Autonomous Vehicle Vision-Language Navigation Datasets [0.0] 本稿では,モバイルアプリケーションGlobal Positioning System(GPS)参照と自然言語処理(NLP)を使用して,大量の命令と応答を自動生成する可能性について検討する。
パイロットデータ収集では、様々な目的地へ運転し、GPSアプリケーションから音声指示を収集することにより、多様な指示の集合を収集・分類する手段を実証する。
我々は収集したGPS音声命令を8つの異なる分類に分類し、自由に利用できるモバイルアプリケーションから利用できるコマンドの幅と参照度を強調した。
論文参考訳(メタデータ) (Tue, 06 May 2025 04:38:41 GMT)
Augmenting Human Cognition through Everyday AR [0.0] 常時オンのARは、デジタル認識と物理的余裕をシームレスにブリッジし、アクティブで文脈に敏感なインタラクションを可能にする。
本稿では、常時オンのARがデジタル認識と身体的余裕をシームレスにブリッジし、アクティブで文脈に敏感なインタラクションを可能にする方法について考察する。
論文参考訳(メタデータ) (Tue, 06 May 2025 12:48:38 GMT)
Assessing and Enhancing the Robustness of LLM-based Multi-Agent Systems Through Chaos Engineering [0.0] 本研究では,大規模言語モデルベースマルチエージェントシステム(LLM-MAS)の実環境環境における堅牢性向上のためのカオスエンジニアリングの適用について検討する。
論文参考訳(メタデータ) (Tue, 06 May 2025 01:13:14 GMT)
AnomalyMatch: Discovering Rare Objects of Interest with Semi-supervised and Active Learning [0.0] AnomalyMatchは、半教師付きFixMatchアルゴリズムとアクティブラーニングを組み合わせた、異常検出フレームワークである。
AnomalyMatchは大規模アプリケーション向けに最適化されており、単一のGPU上で3日以内に1億イメージの予測を効率的に処理する。
論文参考訳(メタデータ) (Tue, 06 May 2025 13:19:15 GMT)
Anant-Net: Breaking the Curse of Dimensionality with Scalable and Interpretable Neural Surrogate for High-Dimensional PDEs [0.0] 高次元偏微分方程式(英: High-dimensional partial differential equation、PDE)は、様々な科学的・工学的な応用に現れる。
従来の数値法は計算複雑性の指数的な成長に苦慮している。
私たちは、この課題を克服する効率的なニューラルネットワークサロゲートであるAnant-Netを紹介します。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:56:43 GMT)
An Active Inference Model of Covert and Overt Visual Attention [0.0] 本稿では,アクティブな推論の枠組みを通じて,隠蔽と過度な視覚的注意のモデルを提案する。
このモデルは、現在の環境信念と感覚入力の両方に基づいて視覚感覚の精度を決定する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:26:00 GMT)
Algorithmic Accountability in Small Data: Sample-Size-Induced Bias Within Classification Metrics [0.0] 分類指標におけるサンプルサイズバイアスの重要性を示す。
この啓示は、高解像度のバイアス評価におけるこれらの指標の有効性に挑戦する。
本稿では,モデルに依存しない評価と補正手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 22:02:53 GMT)
Advancing Superconducting Qubits: CMOS-Compatible Processing and Room Temperature Characterization for Scalable Quantum Computing beyond 2D Architectures [0.0] CMOSパイロットラインを用いた業界グレードのCMOS互換量子ビット製造手法について報告する。
我々の研究結果は、スケーラブルな量子コンピューティングのための超伝導量子ビットのCMOS互換産業スタイルの創出の大きな可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:35:12 GMT)
Advancing Remote and Continuous Cardiovascular Patient Monitoring through a Novel and Resource-efficient IoT-Driven Framework [0.0] 本稿では,重要な心的指標を遠隔でリアルタイムに追跡するための,新しいIoTベースのソリューションを提案する。
提案キットは、体温、心拍数(HR)、血圧(BP)、酸素飽和度(SPO2)、心電図(ECG)などの重要なパラメータを測定する。
システムの重要なイノベーションは、クラウドベースのアプリケーションとの統合であり、継続的にリモート監視を可能にする。
論文参考訳(メタデータ) (Tue, 06 May 2025 10:35:31 GMT)
Adaptive Thresholding for Multi-Label Classification via Global-Local Signal Fusion [0.0] マルチラベル分類 (MLC) ではサンプル毎に複数のラベルを予測する必要がある。
従来のアプローチでは、固定しきい値を適用したり、ラベルを個別に扱うことで、コンテキストやグローバルな希少性を見渡せる。
我々は、グローバル(IDFベース)とローカル(KNNベース)の信号を融合して、ラベルごとの閾値を生成する適応しきい値設定機構を導入する。
論文参考訳(メタデータ) (Tue, 06 May 2025 02:19:37 GMT)
Adaptive Measurement-Device-Independent Quantum Key Distribution [0.0] 理論上、量子鍵分布(QKD)は、量子物理学の法則に基づいて、2つの遠隔参加者間の鍵の無条件安全な生成を約束する。
QKDの理論と実装のギャップを埋めるために、様々なプロトコルが提案されている。
そのうちの1つは測定装置独立(MDI)QKDであり、これは現在の技術を使って実装でき、合理的な鍵レートを生成することができる。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:45:47 GMT)
Accuracy of time-dependent GGE under weak dissipation [0.0] ユニタリ可積分モデルは通常、定常一般化ギブズ・アンサンブル(GGE)に緩和する
本研究では、最近導入された時間依存型GGE(T-GGE)アプローチを用いて、原子の損失と利得を受けるボゾンの気体の開力学を記述する。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:28:29 GMT)
ATRAF-driven IMRaD Methodology: Tradeoff and Risk Analysis of Software Architectures Across Abstraction Levels [0.0] アーキテクチャアーティファクトを評価することは、パフォーマンス、変更性、セキュリティなどの品質特性に影響を与えるトレードオフやリスクを評価するために不可欠です。
私たちの以前の作業はアーキテクチャトレードオフとリスク分析フレームワーク(ATRAF)を導入しました。
本稿では, ATRAF の位相を IMRaD 区間と整合させる簡潔な手法である ATRAF 駆動 IMRaD 手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 15:22:28 GMT)
AI-Driven Security in Cloud Computing: Enhancing Threat Detection, Automated Response, and Cyber Resilience [0.0] 本稿では、予測分析、行動に基づくセキュリティ脅威検出、AIスティリング暗号化を適用することにより、AIがクラウドセキュリティを強化する方法について検討する。
また、以前のセキュリティモデルの問題点と、AIがそれらを克服する方法についても概説している。
本稿では,AIを用いたクラウドデータアーキテクチャのセキュリティ動向について論じ,さらなる研究と応用の方向性を示す。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:45:13 GMT)
AI-Driven Scholarly Peer Review via Persistent Workflow Prompting, Meta-Prompting, and Meta-Reasoning [0.0] 本稿では,PWP(Persistent Prompting)について紹介する。
本稿では,実験化学原稿の批判的分析のための概念実証PWPプロンプトを提案する。
我々は,このPWPプロンプトを,専門家レビューの体系化を目的としたメタプロンプト技術とメタ推論の反復的適用により開発する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:06:18 GMT)
A Vision-Language Model for Focal Liver Lesion Classification [0.0] Contrastive Language-Image Pre-Training Model (CLIP) などの視覚言語モデル(VLM)が画像分類に適用されている。
局所肝病変(FLL)分類に特化して設計されたモデルであるLiver-VLMを提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 09:19:12 GMT)
A Note on Statistically Accurate Tabular Data Generation Using Large Language Models [0.0] この研究は、大規模言語モデルを利用して条件分布を推定する確率駆動的プロンプト手法を導入する。
その結果,大規模言語モデルが生成するデータの統計的忠実度を高めるために,確率分布の促進の可能性を強調した。
論文参考訳(メタデータ) (Tue, 06 May 2025 08:34:46 GMT)
A Machine Learning Approach to Forecasting Honey Production with Tree-Based Methods [0.0] 我々は、さまざまな機械学習モデルを用いて、イタリア全土における蜂蜜生産の予測分析を行う。
我々の分析は2022年に収集されたデータセットに依存しており、ヒブレベルの観測と詳細な気象データを組み合わせている。
モデルを説明することによって,ハチミツ生産の主要な要因を同定する。
論文参考訳(メタデータ) (Tue, 06 May 2025 19:34:42 GMT)
A Hashgraph-Inspired Consensus Mechanism for Reliable Multi-Model Reasoning [0.0] 大規模言語モデル(LLM)からの一貫性のない出力と幻覚は、信頼できるAIシステムにとって大きな障害となる。
本稿では,分散台帳技術に触発された新たなコンセンサス機構を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 14:05:12 GMT)
A Graphical Global Optimization Framework for Parameter Estimation of Statistical Models with Nonconvex Regularization Functions [0.0] 線形ノルムバウンド制約の問題は、ポートフォリオ最適化、機械学習、機能選択など、さまざまなアプリケーションで発生する。
本稿では,これらの問題をグローバルに解決するための新しいグラフベース手法を提案する。
論文参考訳(メタデータ) (Tue, 06 May 2025 18:09:54 GMT)