In-person, Online and Back Again -- A Tale of Three Hybrid Hackathons [88.1] ハイブリッドハッカソンは、個人とオンラインの参加者を組み合わせて、主催者と参加者に固有の課題を提示している。
個人またはオンラインのみのイベントに対する既存の戦略は、ハイブリッドフォーマットの課題に対処できないことが多い。
我々の研究は、ハイブリッドハッカソンがどのように機能し、主催者がこれらのイベントをどのように構成し、参加者がハイブリッド固有の課題をナビゲートするかを分析する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:27:01 GMT)
Rejecting Hallucinated State Targets during Planning [84.2] 計画過程において、生成的または予測的モデルは、期待される状態や望ましい状態の集合を表す「ターゲット」を提案するためにしばしば用いられる。
残念ながら、学習したモデルは必然的に幻覚を与え、妄想的な行動や安全上の懸念を引き起こす可能性がある。
我々は、目標実現可能性評価器を学習することで、実現不可能な目標を特定し、拒否する戦略を考案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:33:50 GMT)
Unbiased Region-Language Alignment for Open-Vocabulary Dense Prediction [80.7] 事前訓練された視覚言語モデル(VLM)は、印象的なゼロショット認識能力を示したが、それでも高密度予測タスクでは性能が劣っている。
提案するDenseVLMは,非バイアスの領域言語アライメントを,強力な事前学習型VLM表現から学習するためのフレームワークである。
DenseVLMは、オープン語彙オブジェクト検出および画像分割法において、元のVLMを直接置き換えることができることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:17:34 GMT)
BadPatch: Diffusion-Based Generation of Physical Adversarial Patches [75.4] BadPatchは、自然主義的な逆パッチを生成するための新しい拡散ベースのフレームワークである。
本稿では,最初の物理対向TシャツデータセットであるAdvT-shirt-1Kを構築した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 03:36:55 GMT)
QuickSplat: Fast 3D Surface Reconstruction via Learned Gaussian Initialization [69.5] 表面再構成はコンピュータビジョンとグラフィックスの基本であり、3Dモデリング、混合現実、ロボット工学などの応用を可能にする。
レンダリングに基づく既存のアプローチは有望な結果を得るが、シーンごとに最適化されるため、テクスチャレスな領域をモデル化するのに苦労する可能性がある。
大規模屋内シーンの2次元ガウススプラッティング最適化のための高密度初期化を生成するために,データ駆動の先行処理を学習するQuickSplatを紹介する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:16:45 GMT)
WebDancer: Towards Autonomous Information Seeking Agency [69.3] エージェントシステムの最近の進歩は、自律的な多段階研究の可能性を強調している。
データ中心およびトレーニング段階の観点からエージェントを探索するエンドツーエンドのエージェント情報を構築するための凝集パラダイムを提案する。
我々はこのフレームワークを ReAct, WebDancer に基づいた Web エージェントでインスタンス化する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:05:46 GMT)
SpectrumFM: Redefining Spectrum Cognition via Foundation Modeling [65.7] 本稿ではスペクトル認識のための新しいパラダイムを提供するスペクトルFMと呼ばれるスペクトル基盤モデルを提案する。
畳み込みニューラルネットワークを利用した革新的なスペクトルエンコーダを提案し、スペクトルデータにおける微細な局所信号構造と高レベルのグローバルな依存関係の両方を効果的に捕捉する。
2つの新しい自己教師型学習タスク、すなわちマスク付き再構成と次のスロット信号予測が、SpectrumFMの事前学習のために開発され、モデルがリッチで伝達可能な表現を学習できるようにする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:34:55 GMT)
WebWalker: Benchmarking LLMs in Web Traversal [64.5] WebWalkerQAは,LLMがWebトラバースを実現する能力を評価するためのベンチマークである。
本稿では,WebWalkerを提案する。WebWalkerは,探索的・批判的パラダイムを通じて,人間のようなWebナビゲーションを模倣するマルチエージェントフレームワークである。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 05:59:20 GMT)
What One Cannot, Two Can: Two-Layer Transformers Provably Represent Induction Heads on Any-Order Markov Chains [64.3] インコンテキスト学習(ICL)は、入力コンテキストからの情報を活用することで、訓練されたモデルが新しいタスクに適応することを学習するトランスフォーマーの能力である。
1層に1つの頭を持つ2層トランスは、実際に任意の条件k-gramを表現可能であることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:03:01 GMT)
CoopDiff: Anticipating 3D Human-object Interactions via Contact-consistent Decoupled Diffusion [62.9] 3Dヒューマンオブジェクトインタラクション(HOI)は,人間の将来の動きとその操作対象を,歴史的文脈で予測することを目的としている。
そこで我々は,人間と物体の運動モデリングを分離するために,2つの異なる分岐を用いた接触非結合拡散フレームワークCoopDiffを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 03:29:17 GMT)
Learning from Reward-Free Offline Data: A Case for Planning with Latent Dynamics Models [61.1] 強化学習(Reinforcement Learning, RL)は、試行錯誤と最適制御を通じてポリシーを学習し、学習または既知の力学モデルを用いてアクションを計画する。
異なる品質のデータセットを用いて、異なるRLおよび制御に基づく手法の性能を系統的に解析する。
モデルベースプランニングは,新しい環境レイアウト,トラジェクトリー縫合,データ効率などへの一般化に優れる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:07:23 GMT)
VisR-Bench: An Empirical Study on Visual Retrieval-Augmented Generation for Multilingual Long Document Understanding [60.1] VisR-Benchは、長い文書における質問駆動型マルチモーダル検索のベンチマークである。
ベンチマークは、1.2Kドキュメントで35K以上の高品質なQAペアで構成されています。
テキストベースの手法,マルチモーダルエンコーダ,MLLMなど,さまざまな検索モデルを評価する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:44:43 GMT)
FlatQuant: Flatness Matters for LLM Quantization [58.3] 重みとアクティベーションの平坦性を高める新しいポストトレーニング量子化手法であるFlatQuantを提案する。
本手法では, 線形層毎の最適アフィン変換を, 軽量な目的により数時間で調整する。
LLaMA-3-70BモデルでのW4A4量子化の精度は1%以下で、SpinQuantを7.5%上回る。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:08:54 GMT)
RCR-Router: Efficient Role-Aware Context Routing for Multi-Agent LLM Systems with Structured Memory [57.4] RCRは、マルチエージェント大言語モデル(LLM)システムのためのロールアウェアコンテキストルーティングフレームワークである。
役割とタスクステージに基づいて、各エージェントに対して意味的に関連するメモリサブセットを動的に選択する。
軽量スコアリングポリシは、メモリ選択をガイドし、エージェント出力を共有メモリストアに統合する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:40:57 GMT)
Positional Biases Shift as Inputs Approach Context Window Limits [57.0] 入力がモデルのコンテキストウィンドウの最大50%を占める場合、LiM効果は最強となる。
関係情報が入力の終端に近づくと,モデルの性能が向上する,距離に基づくバイアスが観測される。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 20:40:24 GMT)
Active Advantage-Aligned Online Reinforcement Learning with Offline Data [57.0] A3RLは,アクティブアドバンテージアライメント・アライメント・サンプリング・ストラテジーを取り入れた新しい信頼度を取り入れた手法である。
本手法はオフラインデータを利用する競合するオンラインRL技術より優れていることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:43:52 GMT)
ForensicsSAM: Toward Robust and Unified Image Forgery Detection and Localization Resisting to Adversarial Attack [56.0] 高い転送性を持つ逆画像は上流モデルでのみ作成可能であることを示す。
本稿では,IFDLフレームワークを組み込んだForensicsSAMを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:03:44 GMT)
Can LLMs Identify Tax Abuse? [53.3] 大規模言語モデルが米国の税最小化戦略を発見・分析できるかどうかを検討する。
我々は,(1)税制戦略の解釈・検証能力,(2)部分的に指定された戦略のギャップを埋める能力,(3)完全なエンドツーエンド戦略をゼロから生成する能力について,最も先進的なLCMを評価した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:15:45 GMT)
Instruction Tuning for Large Language Models: A Survey [52.9] 我々は、教師付き微調整(SFT)の一般的な方法論を含む、文献の体系的なレビューを行う。
また、既存の戦略の欠陥を指摘しながら、SFTの潜在的な落とし穴についても、それに対する批判とともに検討する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 23:54:10 GMT)
EF-VI: Enhancing End-Frame Injection for Video Inbetweening [52.7] ビデオインテワイニングは、与えられた開始フレームと終了フレームに条件付き中間映像シーケンスを合成することを目的としている。
EF-VI と呼ばれる,近年,より強力なトランスフォーマーベースの I2V-DM に特化する新しいビデオインテグレーティングフレームワークを提案する。
拡張インジェクションを利用することで、エンドフレーム制約を効率的に強化する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:23:45 GMT)
SketchAnimator: Animate Sketch via Motion Customization of Text-to-Video Diffusion Models [52.2] 提案するスケッチアニメーションモデルSketchAnimatorは,あるスケッチに「ジャンプカー」のような創造的な動きを加えることができる。
ステージ1と2では、LoRAを用いて、参照ビデオからのスケッチの外観情報と動きのダイナミクスを事前訓練されたT2Vモデルに統合する。
第3段階では、取得した動作情報に基づいて、スコア蒸留サンプリング(SDS)を用いて、スケッチフレーム内のベジエ曲線のパラメータを更新する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:45:59 GMT)
Efficient Face Image Quality Assessment via Self-training and Knowledge Distillation [51.4] 顔画像品質評価(FIQA)は、様々な顔関連アプリケーションに不可欠である。
我々は,現実のアプリケーションに容易に展開可能な計算効率の良いFIQA手法の開発を目指している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:31:03 GMT)
SODiff: Semantic-Oriented Diffusion Model for JPEG Compression Artifacts Removal [50.9] SODiffはJPEGアーティファクト削除のためのセマンティック指向のワンステップ拡散モデルである。
我々の中核的な考え方は、効果的な復元ヒンジは、事前訓練された拡散モデルに対する意味指向的なガイダンスを提供することである。
SAIPEは、低品質(LQ)画像からリッチな特徴を抽出し、テキストエンコーダとセマンティックに整合した埋め込み空間に投影する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:48:07 GMT)
Improved Personalized Headline Generation via Denoising Fake Interests from Implicit Feedback [50.4] インシシットフィードバック(PHG-DIF)からフェイク関心を抽出するパーソナライズされた見出し生成フレームワークを提案する。
PHG-DIFは2段フィルタリングを用いて、短い居住時間と異常なクリックバーストによって識別されるクリックストリームノイズを効果的に除去する。
DT-PENSは、慎重にキュレートされた1,000人のユーザと、注釈付きパーソナライズされた1万近いパーソナライズされた見出しのクリック動作を含む、新しいベンチマークデータセットです。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:56:13 GMT)
Stackelberg Coupling of Online Representation Learning and Reinforcement Learning [49.0] 表現と政策の統合的エンドツーエンド学習は、深層強化学習(RL)の基盤のままである。
最近のトレンドは、複雑な補助的な目的や、2つのプロセスを完全に分離することへと移行している。
この研究は、性能を著しく改善できると主張し、疎結合と素直なエンドツーエンド学習の両方に代わるものを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:36:54 GMT)
Grounding Multilingual Multimodal LLMs With Cultural Knowledge [49.0] 本稿では,MLLMを文化的知識に根ざしたデータ中心型アプローチを提案する。
CulturalGroundは、42の国と39の言語にまたがる2200万の高品質で文化的に豊かなVQAペアで構成されている。
我々は,MLLM CulturalPangeaをCulturalGround上で学習し,汎用性を維持するために,標準の多言語指導訓練データをインターリーブする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:24:11 GMT)
Certifiably robust malware detectors by design [48.4] 設計によるロバストなマルウェア検出のための新しいモデルアーキテクチャを提案する。
すべての堅牢な検出器を特定の構造に分解することができ、それを経験的に堅牢なマルウェア検出器の学習に適用できることを示す。
我々のフレームワークERDALTはこの構造に基づいている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:19:29 GMT)
Think Before You Talk: Enhancing Meaningful Dialogue Generation in Full-Duplex Speech Language Models with Planning-Inspired Text Guidance [47.2] FD-SLM(Full-Duplex Speech Language Models)は、人間のような対話のためのニュアンスな2話者対話パターンをキャプチャする。
会話能力は、純粋なテキスト会話に比べて劣化することが多い。
そこで我々は,人間の会話計画を模倣する新しいプランニング・インスパイアされたアプローチであるTurnGuideを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:49:43 GMT)
Engagement Prediction of Short Videos with Large Multimodal Models [47.0] ビデオエンゲージメント予測のための大規模マルチモーダルモデル(LMM)の可能性について実験的に検討する。
VideoLLaMA2はキービデオフレーム、テキストベースのメタデータ、バックグラウンドサウンドを処理し、Qwen2.5-VLはキービデオフレームとテキストベースのメタデータのみを使用する。
2種類のモデルをアンサンブルすることで,本手法はICCV VQualA 2025 EVQA-SnapUGC Challengeにおいて,短時間のビデオエンゲージメント予測において第一位となる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:22:26 GMT)
DS$^2$Net: Detail-Semantic Deep Supervision Network for Medical Image Segmentation [46.3] 医用画像セグメンテーションのためのDetail-Semantic Deep Supervision Network (DS$2$Net)を提案する。
低レベルの詳細な機能と高レベルのセマンティック機能の両方をナビゲートする。
医用画像解析の最先端手法を一貫して上回っている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:13:42 GMT)
A Closer Look at Machine Unlearning for Large Language Models [46.2] 大型言語モデル(LLM)は機密または著作権のあるコンテンツを記憶し、プライバシーと法的懸念を高める。
LLMの機械学習におけるいくつかの問題について議論し、可能なアプローチについての洞察を提供する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:49:05 GMT)
When Is Prior Knowledge Helpful? Exploring the Evaluation and Selection of Unsupervised Pretext Tasks from a Neuro-Symbolic Perspective [45.4] 我々は、信頼できない知識のシナリオまで、信頼できる知識に基づくネッシー理論を拡張した。
そこで本稿では,これらの理論的メトリクスを運用するためのスキームを提案し,プリテキストタスクの有効性を事前に予測できる手法を開発した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:23:36 GMT)
MusiXQA: Advancing Visual Music Understanding in Multimodal Large Language Models [45.3] MusiXQAは、音楽シート理解におけるMLLMの評価と進歩のための、最初の包括的なデータセットである。
我々は、データセットに微調整されたMLLMであるPhi-3-MusiXを開発し、GPT法よりも大きな性能向上を実現した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:56:58 GMT)
Multi-task Adversarial Attacks against Black-box Model with Few-shot Queries [45.1] textbfCluster と textbfEnsemble textbfMulti-task Text Adrial textbfAttack (textbfCEMA) を提案する。
CEMAは、テキスト分類のためにtextitplug-and-play方法で訓練されたtextitdeepレベルの代替モデルを使用することで、複雑なマルチタスクシナリオを単純化し、被害者モデルを模倣することなく攻撃を可能にする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:46:47 GMT)
A Comprehensive Survey of Self-Evolving AI Agents: A New Paradigm Bridging Foundation Models and Lifelong Agentic Systems [44.2] 既存のAIシステムは、デプロイ後も静的な手作業による構成に依存している。
近年,インタラクションデータと環境フィードバックに基づいてエージェントシステムを自動拡張するエージェント進化手法が研究されている。
この調査は、自己進化型AIエージェントの体系的な理解を研究者や実践者に提供することを目的としている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:07:32 GMT)
Speckle2Self: Self-Supervised Ultrasound Speckle Reduction Without Clean Data [43.6] 単一雑音観測によるスペックル低減のための新しい自己教師型アルゴリズムであるSpeckle2Selfを紹介する。
鍵となる洞察は、マルチスケール摂動(MSP)操作を適用することで、異なるスケールにわたるスペックルパターンの組織依存性の変化がもたらされるということである。
これにより、クリーン画像を低ランク信号としてモデル化し、スパースノイズ成分を分離することにより、効果的なスペックル抑制を可能にする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:13:53 GMT)
Improving Your Model Ranking on Chatbot Arena by Vote Rigging [43.3] クラウドソーシングされた投票は、ターゲットモデル $m_t$ のランキングを改善するために適用可能であることを示す。
私たちはElo Arenaプラットフォームから約170万票の投票で実験を行います。
本研究は,投票のリグを防ぐための継続的な努力の重要性を浮き彫りにした。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:52:25 GMT)
Reflect then Learn: Active Prompting for Information Extraction Guided by Introspective Confusion [41.8] 大規模言語モデル(LLM)は、少数ショット情報抽出(IE)において顕著な可能性を示す
従来の選択戦略は、しばしば、モデル誤認の重要な原因を見落としているため、情報的なガイダンスの提供に失敗する。
本稿では,イントロスペクティブ・混乱(introspective confusion)という原則に導かれる新しいアクティブ・プロンプト・フレームワークであるActive Prompting for Information extract(APIE)を紹介する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:27:41 GMT)
Verbal Werewolf: Engage Users with Verbalized Agentic Werewolf Game Framework [40.6] Werewolfのような社会的推論ゲームは、伝統的に言葉によるコミュニケーションを通して行われており、Large Language Models (LLMs) の理想的な応用である。
textbf Verbal Werewolfは2つの並列パイプラインを最適化する新しいLLMベースのゲームシステムである。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:49:55 GMT)
Omni-SafetyBench: A Benchmark for Safety Evaluation of Audio-Visual Large Language Models [38.6] Omni-SafetyBenchは、OLLMの安全性評価のための最初の総合的な並列ベンチマークである。
24種類のモダリティの組み合わせと992のサンプルによるバリエーションがあり、それぞれに専用のオーディオ・ビジュアル・ハーネスケースが含まれている。
複雑なOmni-Modal入力に対するOLLMの理解上の課題と、相互整合性評価の必要性を考慮して、調整されたメトリクスを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:15:16 GMT)
Democratizing Diplomacy: A Harness for Evaluating Any Large Language Model on Full-Press Diplomacy [37.5] 本報告では,任意のローカル言語モデル(LLM)を,微調整や専門訓練を伴わずにフルプレッシャーの外交を行えるようにするための,最初の評価手法を提案する。
外交のゲーム状態の複雑さと情報密度が高いため、以前の作業ではフロンティアLSM(ファインチューニング)が必要だった。
我々のハーネスは、微調整の必要性を排除し、LLMの戦略的推論の評価を民主化し、これらの能力が広く使われているLLMからどのように自然に現れるかについての洞察を提供する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:07:08 GMT)
Decoding the Multimodal Mind: Generalizable Brain-to-Text Translation via Multimodal Alignment and Adaptive Routing [36.5] 本稿では,脳信号とテキスト,画像,音声を含む共有意味空間を連携させる統合フレームワークを提案する。
ルータモジュールは、各刺激の特性に応じて、モダリティ固有の脳の特徴を動的に選択、融合する。
テキスト、視覚、聴覚刺激を含む様々なfMRIデータセットの実験では、最先端のパフォーマンスを示し、最も一般的に使用されるベンチマークでは8.48%の改善が達成されている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:57:50 GMT)
Quantum MIMO Diversity over Discrete-Variable Crosstalk Channels [36.0] 本稿では,量子離散変数(DV)マルチインプット・マルチプル・アウトプット(MIMO)チャネルの多様性戦略を提案する。
特に, 完全チャネル状態情報(CSI)を活用できる場合には, クローン精製戦略が有利であることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:38:47 GMT)
CLUE: Leveraging Low-Rank Adaptation to Capture Latent Uncovered Evidence for Image Forgery Localization [35.7] 画像編集ツールや生成AIのアクセシビリティ向上は、視覚的に説得力のある偽造物の普及につながっている。
本稿では、その内部生成過程を利用して、最先端(SOTA)テキスト・画像合成モデルのメカニズムを再利用する。
本稿では,Low- Rank Adaptation (LoRA) を用いてパラメータ効率よく安定拡散3 (SD3) を法定特徴抽出器として構成するフレームワークであるCLUEを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:22:30 GMT)
Meta-Unlearning on Diffusion Models: Preventing Relearning Unlearned Concepts [34.7] メタ学習事前学習拡散モデル(DM)の枠組みを提案する。
我々のフレームワークは既存のほとんどの未学習メソッドと互換性があり、実装が容易なメタオブジェクトを追加するだけでよい。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:11:39 GMT)
Synthesize, Retrieve, and Propagate: A Unified Predictive Modeling Framework for Relational Databases [34.6] 本研究では,一元的依存関係を用いて特徴を合成する一元的予測モデリングフレームワークであるSRPを提案する。
SRPは、リレーショナルデータベース内の一元的および複合的依存関係の両方を完全にキャプチャするように設計されている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:59:41 GMT)
Dynamic Benchmark Construction for Evaluating Large Language Models on Real-World Codes [33.8] CODE2BENCHは、実世界のGitHubリポジトリから、堅牢で汚染に強いベンチマークを動的に構築するためのパイプラインである。
特に、CODE2BENCHは、(1) トレーニングデータの汚染を最小限に抑えるために、最近のコードの周期的取り込みによって達成される自動ダイナミズム、(2) 依存レベルの制御されたベンチマークインスタンスへの関数の構造化可能なスコープグラフベースの依存性分析、(3) 厳密なテストスイートの自動合成のためのプロパティベーステスト(PBT)の3つの重要なイノベーションを紹介している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 05:06:36 GMT)
Adapting LLMs to Time Series Forecasting via Temporal Heterogeneity Modeling and Semantic Alignment [32.4] 大規模言語モデル(LLM)は、最近、自然言語処理における印象的な能力を実証した。
時間的アライメントのモデル化と意味的アライメントの強化によりLLMに基づく予測を強化する統合フレームワークであるTALONを提案する。
7つの実世界のベンチマークの実験では、TALONはすべてのデータセットで優れたパフォーマンスを達成している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:06:19 GMT)
Finite-Time Convergence Analysis of ODE-based Generative Models for Stochastic Interpolants [32.3] インターポーラントは、任意のデータ分散間でサンプルを変換するための堅牢なフレームワークを提供する。
その可能性にもかかわらず、実用的な数値スキームに対する厳密な有限時間収束保証は、ほとんど未解明のままである。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:23:57 GMT)
Unleashing the Potential of Large Language Models for Text-to-Image Generation through Autoregressive Representation Alignment [32.1] Autoregressive Representation Alignment(ARRA)は,自己回帰型LLMにおけるグローバルコヒーレントなテキスト・ツー・イメージ生成をアーキテクチャ変更なしに解放する,新たなトレーニングフレームワークである。
ARRAは、LLMの隠れ状態と、グローバルな視覚的アライメントロスとハイブリッドトークン [オブジェクトオブジェクト]を介して、外部視覚基盤モデルからの視覚的表現とを一致させる
大規模な実験はARRAのプラグアンドプレイの汎用性を検証する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:40:25 GMT)
Efficient Edge LLMs Deployment via HessianAware Quantization and CPU GPU Collaborative [31.7] Mixture of Experts (MoE)アーキテクチャは、スパースアクティベーションによってモデルのキャパシティを向上させる。
MoEは実践的な展開において2つの大きな困難に直面している。
メモリ制限下では、専門家モジュールの効率的なオフロードと協調的な推論は、レイテンシとスループットのバランスをとるのに苦労する。
本稿では,Hessian-Aware Quantization (HAQ)とCPU-GPU協調推論に基づく効率的なMoEエッジ配置方式を提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:59:57 GMT)
Invert4TVG: A Temporal Video Grounding Framework with Inversion Tasks for Enhanced Action Understanding [31.5] 時間的ビデオグラウンド(TVG)は、与えられたテキストクエリと一致するビデオセグメントをローカライズする。
現在の手法では、ハイテンポラル・インターセクション・オーバ・ユニオン(IoU)を最適化する一方で、ビデオとクエリにおける意味的行動理解を妥協するこの指標に過度に適合することが多い。
Inversion Tasks for TVG (Invert4TVG) は,局部化精度と行動理解を付加データなしで向上する新しいフレームワークである。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:38:04 GMT)
DIP-GS: Deep Image Prior For Gaussian Splatting Sparse View Recovery [31.4] 3D Gaussian Splatting (3DGS) は3次元シーン再構築の先駆けとなる手法であり, リアルタイムレンダリング性能で高品質な再現を実現する。
多くのビューの存在下で優れたパフォーマンスを達成する一方で、3DGSはスパースビューの再構築に苦慮し、入力ビューはスパースで、シーンを完全にカバーせず、オーバーラップも少ない。
本稿では,Deep Image Prior (DIP) 3DGS表現であるDIP-GSを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:47:32 GMT)
CMAMRNet: A Contextual Mask-Aware Network Enhancing Mural Restoration Through Comprehensive Mask Guidance [30.9] 壁画のデジタル復元は、複雑な劣化パターンのために固有の課題に直面している。
本稿では,これらの制約に対処するコンテキストマスク対応Mural Restoration NetworkであるCMAMRNetを提案する。
1)Mask-Aware Up/Down-Sampler (MAUDS)。
CMAMRNetは,復元された壁画において,構造的整合性と芸術的細部の両方を効果的に保存し,最先端の手法より優れていることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:00:45 GMT)
Online Learning and Optimization for Queues with Unknown Demand Curve and Service Distribution [30.2] サービス提供者が最適なサービス料金 p とサービス容量 mu を選択する待ち行列システムにおける最適化問題について検討する。
本研究では,パラメータ推定誤差を自動的に解法に組み込むオンライン学習フレームワークを開発した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:06:05 GMT)
CoMoE: Collaborative Optimization of Expert Aggregation and Offloading for MoE-based LLMs at Edge [29.0] 大規模言語モデル(LLM)は、計算コストを制御しながらモデルキャパシティをスケールする有望なソリューションとして、Mixture-of-Experts (MoE)アーキテクチャを採用した。
リソース制約のあるモバイルエッジコンピューティング環境にMoEモデルをデプロイすることは、大きなメモリフットプリントと動的専門家アクティベーションパターンのため、大きな課題となる。
本稿では,エキスパートアグリゲーションとオフロード戦略を協調的に最適化する,動的リソース対応協調最適化フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:05:36 GMT)
Intrinsic training dynamics of deep neural networks [28.3] ディープラーニング理論の根本的な課題は、高次元パラメータ空間における勾配に基づくトレーニングが、より単純で低次元の構造によって達成できるかどうかを理解することである。
高次元変数上の勾配フローは、低次元変数 $z = phi(theta)$ 上の固有勾配フローを意味する。
いわゆる本質的動的性質を表現し, 因子化$phi$に関連する保存法則の研究との関連性を示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:39:35 GMT)
Rethinking Domain-Specific LLM Benchmark Construction: A Comprehensiveness-Compactness Approach [28.1] 既存のベンチマークは主にスケーリングの法則に重点を置いており、微調整や広範囲な質問セットの生成に大量のコーパスに依存している。
本稿では,スケーリング法則が特定の領域におけるベンチマーク構築の最適原則であるとは限らないことを実証する。
包括性-コンパクト性原理に基づく反復型ベンチマークフレームワークであるComp-Compを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:08:28 GMT)
LoRA.rar: Learning to Merge LoRAs via Hypernetworks for Subject-Style Conditioned Image Generation [28.1] 画像品質を向上し、マージ処理において4000ドルを超える驚くべきスピードアップを実現する方法であるLoRA$.$rarを紹介する。
本手法は,MLLMの評価と人的評価によって評価され,内容とスタイルの忠実さの両面で技術の現状を著しく上回っている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:09:36 GMT)
Small-Large Collaboration: Training-efficient Concept Personalization for Large VLM using a Meta Personalized Small VLM [27.1] 大規模VLMパーソナライゼーションのためのSLC(Small-Large Collaboration)という新しい協調フレームワークを提案する。
我々は、小型VLMの幻覚を防止し、テストタイムリフレクション戦略を開発する。
私たちの知る限りでは、これはオープンソースとクローズドソースの大規模VLMの両方をサポートする最初のトレーニング効率の高いフレームワークです。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:24:31 GMT)
Dual-domain Modulation Network for Lightweight Image Super-Resolution [27.0] 軽量画像超解像(SR)は、低解像度画像から限られた計算コストで高解像度画像を再構成することを目的としている。
既存の周波数ベースSR法では、全体構造と高周波部品の再構築のバランスが取れない。
本稿では,ウェーブレット情報とフーリエ情報の両方を導入することで,コスト削減を図りながら,高周波特徴と全体のSR構造再構築を両立させることができることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:30:28 GMT)
HiTeC: Hierarchical Contrastive Learning on Text-Attributed Hypergraph with Semantic-Aware Augmentation [26.8] テキスト分散ハイパーグラフを用いたスケーラブルで効果的な自己教師型学習のための意味認識機能を備えた2段階階層型コントラスト学習フレームワークであるHiTeCを紹介する。
最初の段階では、従来の手法のグラフに依存しない性質を克服するために、構造を意識したコントラスト目的でテキストエンコーダを事前訓練する。
第2段階では、情報的ビュー生成を容易にするために、アクセシブル・エンハンスド・テキスト・エンハンスメントとセマンティック・アウェア・ハイパーエッジ・ドロップを含む2つのセマンティック・アウェア・エンハンスメント戦略を導入する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 05:20:03 GMT)
FP4 All the Way: Fully Quantized Training of LLMs [26.2] 主に4ビット浮動小数点(FP4)の精度を用いて,大規模言語モデル(LLM)の完全量子化訓練(FQT)を実演する。
ブロックサイズ,スケーリングフォーマット,ラウンドメソッドなど,FP4の主要な設計選択について検討する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:10:29 GMT)
CCFQA: A Benchmark for Cross-Lingual and Cross-Modal Speech and Text Factuality Evaluation [26.1] CCFQAベンチマークには8言語にまたがる並列音声テキストの事実質問が含まれている。
実験の結果,現在のMLLMはCCFQAベンチマークにおいて大きな課題に直面していることがわかった。
本稿では,LLMの質問応答能力(QA)を多言語音声質問応答(SQA)タスクに効果的に伝達する,数発の翻訳学習戦略を提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:09:41 GMT)
TSPO: Temporal Sampling Policy Optimization for Long-form Video Language Understanding [25.7] MLLM(Multimodal Language Models)は、視覚タスクにおいて大きな進歩を見せている。
本稿では、MLLMの長文ビデオ言語理解を強化学習により促進する時間サンプリングポリシー最適化(TSPO)を提案する。
我々のTSPOは、複数の長いビデオ理解ベンチマークにまたがって最先端のビデオMLLM間での転送能力を示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:47:02 GMT)
Parity Requires Unified Input Dependence and Negative Eigenvalues in SSMs [24.1] 入力に依存しないSSMと非負のSSMを組み合わせることで、深さに関わらずパリティのような単純な状態追跡タスクを解くことができるかどうかを検討する。
実験では,S4D層とMamba層を組み合わせたSSMモデルを解析することにより,この結論を支持した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:49:44 GMT)
MobileViCLIP: An Efficient Video-Text Model for Mobile Devices [24.1] 本稿では,ゼロショット分類と検索機能を備えたモバイル端末上での効率的なビデオテキストモデルを提案する。
モバイルデバイスでの推論速度に関しては、MobileViCLIP-SmallはInternVideo2-L14より55.4倍、InternVideo2-S14より6.7倍高速です。
ゼロショット検索性能では,MobileViCLIP-Small は InternVideo2-L14 と同様の性能を示し,MSR-VTT では InternVideo2-S14 よりも 6.9% 向上した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:01:58 GMT)
Landmark Guided Visual Feature Extractor for Visual Speech Recognition with Limited Resource [24.0] 視覚音声認識は、無声音声における音声内容を特定する技術である。
深層学習法は雷などの視覚障害の影響を受けやすい。
本稿ではランドマーク付き視覚特徴抽出器を提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:26:55 GMT)
SynMatch: Rethinking Consistency in Medical Image Segmentation with Sparse Annotations [23.5] SynMatchは、イメージを合成することで擬似ラベルを改善する必要性を助長する、新しいフレームワークである。
我々は、半教師付き学習(SSL)、弱い教師付き学習(WSL)、ほとんど教師付き学習(BSL)設定の下で、多様な医用画像セグメンテーションタスクのSynMatchを広範囲に評価した。
その結果,SynMatchは特に難易度の高いBSL設定において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:19:31 GMT)
LET-US: Long Event-Text Understanding of Scenes [23.4] イベントカメラは、マイクロ秒レベルの時間分解能を備えたスパースで非同期なデータとしてイベントストリームを出力する。
長いイベントストリーム・テキスト理解のためのフレームワークであるLET-USを紹介する。
適応圧縮機構を用いて、重要な視覚的詳細を保存しながら入力イベントの量を削減する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:02:41 GMT)
FormCoach: Lift Smarter, Not Harder [23.2] FormCoachは、常にオンで対話的なAIトレーニングパートナで、微妙なフォームエラーを見つけ出し、リアルタイムで調整された修正を提供する。
我々は、Webインターフェースと最先端のビジョン言語モデル(VLM)を用いて、1,700人のエキスパートによる注釈付きユーザ参照ビデオペアのデータセット上で、この機能を実証する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 22:33:43 GMT)
Scene Summarization: Clustering Scene Videos into Spatially Diverse Frames [23.2] シーン要約(Scene summarization)は、連続した長いシーン映像を、グローバルな空間的推論を容易にする、空間的に多様なコンパクトなセットに凝縮するタスクである。
SceneSumは、まず視覚的位置認識を用いてビデオフレームをクラスタリングし、空間的多様性を促進し、リソース制約下で各クラスタから代表者を選択する。
実および模擬屋内データセットの実験により、SceneSumはより空間的に情報的な要約を生成し、既存のビデオ要約ベースラインを上回っていることが示された。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:57:49 GMT)
Consistent and Controllable Image Animation with Motion Linear Diffusion Transformers [23.2] 画像アニメーションにおける効率性, 外観の整合性, 動きの滑らかさを向上するフレームワークであるMiraMoを提案する。
具体的には,(1)ベニラ自己注意を効率的な線形注意に置き換えて生成品質を保ちながら計算オーバーヘッドを低減するための基本的テキスト・ビデオアーキテクチャ,(2)フレームを直接予測するのではなく動きのダイナミクスをモデル化する新たな動き残留学習パラダイム,(3)動きの滑らかさと表現性のバランスをとる動的制御モジュールによって補完された推論中のDCTに基づくノイズ改善戦略,の3つの重要な要素を紹介する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:59:32 GMT)
ASM-UNet: Adaptive Scan Mamba Integrating Group Commonalities and Individual Variations for Fine-Grained Segmentation [22.7] 微粒化は、小さな解剖学的構造の個体差が頻発しているため、困難である。
FGSのための新しいマンバベースのアーキテクチャであるASM-UNetを提案する。
適応的なスキャンスコアを導入し、グループレベルの共通性と個人レベルのバリエーションを組み合わせたスキャン順序を動的にガイドする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:33:03 GMT)
Extracting Probabilistic Knowledge from Large Language Models for Bayesian Network Parameterization [22.3] ベイジアンネットワーク(BN)構築におけるLLM(Large Language Models)の可能性について,ドメインエキスパートの事前の近似による検討を行った。
医療からファイナンスまで80の公開ベイズネットワークの実験は、事象の条件付き確率についてLLMに問い合わせることが有意義な結果をもたらすことを実証している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 23:38:19 GMT)
Deep Neural Networks Can Learn Generalizable Same-Different Visual Relations [22.2] 我々は、ディープニューラルネットワークが、分布内と分布外の両方において、同じ微分関係を取得および一般化できるかどうかを検討する。
ある事前学習された変換器は、ほぼ完全な精度で分布外刺激に一般化する同じ微分関係を学習できる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:40:45 GMT)
Less is More: Token-Efficient Video-QA via Adaptive Frame-Pruning and Semantic Graph Integration [21.7] 過剰なフレームが文脈の希釈によってパラドックス的に性能を低下させる「レスはそれ以上」現象である。
視覚エコー」は「視覚エコー」という時間的冗長性を有する
AFP"は、ResNet-50とCLIPの機能空間に適応的な階層的クラスタリングアルゴリズムを用いて、これらのエコーを単一の代表に識別し、マージする。
我々の完全なアプローチは、必要なフレームを86.9%まで、合計入力トークンを83.2%まで劇的に削減することを示しています。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 01:20:34 GMT)
EventRR: Event Referential Reasoning for Referring Video Object Segmentation [21.7] Referring Video Object (RVOS) は、式によって参照されるビデオ内のオブジェクトをセグメンテーションすることを目的としている。
現在のRVOSメソッドは、参照式を非構造化シーケンスと見なしている。
本稿では,Event Referential Reasoning(EventRR)フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:11:57 GMT)
Modeling and Detecting Company Risks from News: A Case Study in Bloomberg News [20.7] 我々は,ニュース記事から企業のリスク要因を自動的に抽出する計算フレームワークを構築した。
提案したスキーマは,サプライチェーン,規制,競争など,7つの異なる側面から構成される。
われわれはBloombergのニュース記事を277万件以上分析し、ニュースからリスク要因を特定することが企業や産業の運営に広範な洞察を与える可能性があることを実証した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 22:44:10 GMT)
CharacterShot: Controllable and Consistent 4D Character Animation [20.6] 制御可能で一貫した4Dキャラクタアニメーションフレームワークである textbfCharacterShot を提案する。
個々のデザイナーは、単一の参照文字画像と2Dポーズシーケンスから動的3D文字(つまり4Dキャラクターアニメーション)を作成することができる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:15:04 GMT)
How Relevance Emerges: Interpreting LoRA Fine-Tuning in Reranking LLMs [20.4] 我々は,大規模言語モデルによる関連信号の学習と展開方法を理解するため,LoRAファインチューニングLLMの動作探索を行う。
われわれは,LoRA変換のどの層と突起が精度を高める上で最も重要であるかを明らかにする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:17:58 GMT)
How Effectively Can Large Language Models Connect SNP Variants and ECG Phenotypes for Cardiovascular Risk Prediction? [20.3] 心疾患やSNPを予測するための微調整LDMの可能性を探る。
我々は、LLMが構造的および半構造的ゲノムデータから潜伏する生物学的関係を学習する方法を評価する。
この結果は、早期発見、リスクアセスメント、そして究極的には心臓医療におけるパーソナライズド医療の進歩に寄与するLSMsの可能性を浮き彫りにした。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:19:29 GMT)
Learning 3D-Gaussian Simulators from RGB Videos [20.3] 3DGSimは学習した3Dシミュレータで、マルチビューのRGBビデオから物理的相互作用を学習する。
3Dシーンの再構成、粒子動力学予測、ビデオ合成をエンドツーエンドのトレーニングフレームワークに統合する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:15:08 GMT)
Science Hierarchography: Hierarchical Organization of Science Literature [20.2] 我々は、科学文献を高品質な階層構造に整理する目的であるSCIENCE HIERARCHOGRAPHYを動機付けている。
我々は、効率的な埋め込みベースのクラスタリングとLLMベースのプロンプトを組み合わせたハイブリッドアプローチを開発した。
その結果,本手法は解釈可能性を改善し,科学的文献を探索するための代替経路を提供することがわかった。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 23:01:22 GMT)
HiGarment: Cross-modal Harmony Based Diffusion Model for Flat Sketch to Realistic Garment Image [20.2] HiGarmentは、テキストおよび視覚的モダリティ間のファブリック表現を強化する新しいフレームワークである。
本研究では,フラットスケッチとテキストガイダンスを統合し,リアルな衣料品画像を生成するFlat Sketch to Realistic Garment Image (FS2RG)を提案する。
衣料品生成のための最大のオープンソースデータセットであるMulti-modal Detailed Garmentを収集する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:39:05 GMT)
MCITlib: Multimodal Continual Instruction Tuning Library and Benchmark [20.1] 継続的な学習は、人間の学習と同様、これまで学んだ情報を忘れずに、新しい知識を継続的に獲得し、新しい知識に適応する能力を備えたAIシステムを提供することを目的としている。
マルチモーダル大規模言語モデルの出現は、視覚や言語などの複数のモーダルを含むマルチモーダル連続学習タスクに注目が集まるようになった。
MCITlibは,多モーダル大規模言語モデルの連続的命令チューニングのための包括的かつ絶え間なく進化するライブラリコードである。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:42:36 GMT)
Enhancing Rumor Detection Methods with Propagation Structure Infused Language Model [20.0] 本稿では,伝播構造から言語モデルに情報を注入する,PEP(Post Engagement Prediction)と呼ばれる継続事前学習戦略を提案する。
PEPは、ポスト間のルート、分岐、親関係を予測するモデルを作成し、噂の検出に不可欠なスタンスと感情の相互作用をキャプチャする。
TwitterCorpus(269GBテキスト)と、伝搬構造を持つ2つのラベルなしクレーム会話データセット(UTwitterとUWeibo)をキュレートしてリリースしています。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:04:50 GMT)
Integrating Neurosymbolic AI in Advanced Air Mobility: A Comprehensive Survey [20.0] ニューロシンボリックAIは、ニューラルネットワーク適応性とシンボリック推論を組み合わせる。
この調査は、主要なAdvanced Air Mobilityドメインにわたるアプリケーションについてレビューする。
我々は、現在の進歩を分類し、関連するケーススタディを提示し、今後の研究方向性を概説する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 03:30:06 GMT)
Algorithmic Fairness amid Social Determinants: Reflection, Characterization, and Approach [19.9] 社会的決定要因(Social Determinant)は、特定の個人に直接関係しないが、コンテキストや環境の重要な側面を捉える変数である。
それまでのアルゴリズムフェアネス文学は、主にセンシティブな属性に焦点を当てており、しばしば社会的決定要因の役割を見落としている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 23:55:16 GMT)
Incorporating Contextual Paralinguistic Understanding in Large Speech-Language Models [19.9] 本研究では,文脈パラ言語情報をモデル学習に組み込む2つの手法を提案する。
我々の暗黙的手法は、人間の注釈付きQAベンチマークでパフォーマンス(LLM-judged)を38.41%向上させ、明示的なアプローチと組み合わせると46.02%に達した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:03:30 GMT)
Beyond Content: How Grammatical Gender Shapes Visual Representation in Text-to-Image Models [19.8] 文法的性別がステレオタイプ性関連に矛盾する単語を比較検討する言語間ベンチマークを導入する。
我々のデータセットは5つのジェンダー言語(フランス語、スペイン語、ドイツ語、イタリア語、ロシア語)と2つのジェンダーニュートラル制御言語(英語、中国語)にまたがっている。
男性文法マーカーは平均で男性表現を73%(性中立英語と比較して22%)、女性文法マーカーは女性表現を38%(英語では28%)に増やす
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:30:51 GMT)
Instructor-Worker Large Language Model System for Policy Recommendation: a Case Study on Air Quality Analysis of the January 2025 Los Angeles Wildfires [19.6] ロサンゼルスの山火事における大気の質を調査するために,多エージェントの大規模言語モデルフレームワークを改良し,活用する。
我々は、インストラクタエージェントとWorkerエージェントからなるマルチエージェントの大規模言語システムを使用する。
本研究では,インストラクタ・ワークス LLM システムの健康基準を空気質に基づいて評価することにより,データに基づく政策推薦の能力をテストする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:44:32 GMT)
MathScape: Benchmarking Multimodal Large Language Models in Real-World Mathematical Contexts [18.9] 現実的な数学的文脈におけるMLLMの推論能力を評価することに焦点を当てた新しいベンチマークであるMathScapeを紹介する。
MathScapeは、1,369の高品質な数学問題と、人間のキャプチャーされた現実世界の画像からなる。
我々は,9つの主要なクローズドソースMLLM,200億以上のパラメータを持つ3つのオープンソースMLLM,そして7つの小規模MLLMに対して,徹底的な多次元評価を行う。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 23:30:39 GMT)
A Square Peg in a Square Hole: Meta-Expert for Long-Tailed Semi-Supervised Learning [18.9] 本研究では,Long-tailed semi-supervised learning (LTSSL) を分布ミスマッチを用いて検討し,そこでラベル付き学習データのクラス分布がLong-tailed Distributionに従っていることを示す。
サンプルのクラスメンバシップを推定できる動的専門家割当てモジュールを提案する。
異なる専門家の強みを統合することで、より小さな一般化誤差が生じることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:46:35 GMT)
NeRF: Neural Radiance Field in 3D Vision: A Comprehensive Review (Updated Post-Gaussian Splatting) [18.6] 2020年3月、Neural Radiance Field(NeRF)はコンピュータビジョンに革命を起こし、暗黙のニューラルネットワークベースのシーン表現と新しいビュー合成を可能にした。
NeRFモデルは、ロボット工学、都市マッピング、自律ナビゲーション、仮想現実/拡張現実など、さまざまな応用を見出している。
我々は過去5年間(2020-2025年)のNeRF論文の包括的調査を行う。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 19:08:12 GMT)
Generic Calibration: Pose Ambiguity/Linear Solution and Parametric-hybrid Pipeline [18.2] 本稿では,一般的なキャリブレーション法におけるポーズ解のあいまいさを明らかにする。
汎用モデルとパラメトリックモデルを統合するために,グローバル最適化ハイブリッドキャリブレーション手法を導入した。
シミュレーションおよび実世界の実験結果から、汎用パラメトリックハイブリッドキャリブレーション法は、様々なレンズタイプとノイズ汚染に対して一貫して優れることが示された。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:36:48 GMT)
Alignment-free Raw Video Demoireing [18.1] ビデオの削除は、スクリーンコンテンツのキャプチャ中に発生する望ましくない干渉パターンを取り除くことを目的としている。
本稿では,周波数アシスト型時間的マンバ(DemMamba)を用いたアライメントフリー生ビデオ復調ネットワークを提案する。
PSNRでは、最先端の手法を1.6dB超え、良好な視覚体験を提供する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:13:03 GMT)
LayerTracer: Cognitive-Aligned Layered SVG Synthesis via Diffusion Transformer [17.9] LayerTracerは拡散トランスフォーマーで、設計者の階層化された生成プロセスを、シーケンシャルな設計操作の新たなデータセットから学習することでギャップを埋める。
画像ベクトル化には,参照画像を潜在トークンにエンコードする条件拡散機構を導入する。
実験では、生成品質と編集性の両方において、最適化ベースとニューラルベースラインに対してLayerTracerの優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:12:10 GMT)
How Fair is Your Diffusion Recommender Model? [17.3] 本稿では拡散に基づく推薦の先駆的手法であるDiffRecの公正性に関する最初の実証的研究を提案する。
我々の研究では、DiffRecとその変種であるL-DiffRecが、2つのベンチマークデータセット上で9つの推奨システムに対してテストされた。
拡散モデルに関するより一般的な機械学習文献と一致した傾向を示す一方で、今後の研究における不公平問題に対処するための有望な方向性を示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:24:04 GMT)
Spatio-Temporal Representation Decoupling and Enhancement for Federated Instrument Segmentation in Surgical Videos [17.2] 我々は、パーソナライズされたFLスキーム、時空間表現デカップリングと拡張(FedST)を提案する。
FedSTは、局所サイトトレーニングとグローバルサーバトレーニングの両方において、外科的ドメイン知識を賢く活用し、セグメンテーションを強化する。
我々のモデルは、ローカルサイトトレーニングにおいてRepresentation separation and Cooperation(RSC)メカニズムを採用し、クエリの埋め込み層を個別に分離し、それぞれのバックグラウンドをエンコードする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:57:10 GMT)
NEXT: Multi-Grained Mixture of Experts via Text-Modulation for Multi-Modal Object Re-Identification [17.1] ReID(Multi-modal object Re-Identification)は、不均一なモーダルをまたいだ正確な同一性を実現することを目的としている。
本稿では属性信頼度に基づく信頼性の高いキャプション生成パイプラインを提案する。
また,多様なIDパターンをモデル化するための新しいReIDフレームワークであるNEXTを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:01:50 GMT)
SUIT: Spatial-Spectral Union-Intersection Interaction Network for Hyperspectral Object Tracking [17.1] 本稿では,建築と教育の両方の観点からのスペクトル相互作用について検討する。
まず、変換器を用いてテンプレートと検索領域間の帯域幅の長い空間関係を確立する。
次に、集合論から包含-排他原理を用いてスペクトル相互作用をモデル化し、これらを全帯域にわたる空間的相互作用の和として扱う。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:06:09 GMT)
From Spikes to Heavy Tails: Unveiling the Spectral Evolution of Neural Networks [17.0] 我々は、ディープニューラルネットワーク(NN)の実験的スペクトル密度における重尾の「製作」のための理論インフォームド構成を提案する。
また,勾配雑音を伴わないEDD発生の系統的解析を行った。
本研究は,教育の初期段階において,ESDのバルク・スパイクとHT形状における学習率の役割を強調した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 23:57:10 GMT)
Reinforcement Learning for Hybrid Charging Stations Planning and Operation Considering Fixed and Mobile Chargers [16.8] 車両の電気化は、効率的で適応可能な充電インフラに依存している。
固定位置充電ステーションは需要変動による不使用や混雑に悩まされることが多いが、移動充電ステーションは必要に応じて移動することで柔軟性を提供する。
本稿では,都市道路網内の固定充電器と移動充電器を併用したハイブリッド充電インフラの最適計画と運用について検討する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:48:58 GMT)
Let's Revise Step-by-Step: A Unified Local Search Framework for Code Generation with LLMs [16.8] 本稿では,ステップバイステップのコード修正を効果的に行う統一的なローカル検索フレームワークを提案する。
具体的には、ReLocは4つの主要なアルゴリズムコンポーネントを通して、一連のローカルリビジョンを探索する。
そこで我々は,修正距離に基づいてコード品質を評価できる特化リビジョン報酬モデルを構築し,微粒な選好を生成する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:11:56 GMT)
Uncertainty-Aware Semantic Decoding for LLM-Based Sequential Recommendation [16.8] 本稿では,不確実性を考慮したセマンティックデコーディングフレームワークを提案する。
ログベースのクラスタリングとアダプティブスコアリングを組み合わせて、次世代の予測を改善する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:10:59 GMT)
FlexCTC: GPU-powered CTC Beam Decoding with advanced Contextual Abilities [16.7] 本稿では、コネクショニスト時間分類(CTC)モデルのために設計された、完全ベースのビームデコーディングのためのオープンソースのFlexCTCツールキットを提案する。
PythonとPyTorchで完全に開発され、高速でユーザフレンドリで、従来のC++やWFSTベースのGPUに代わるものを提供する。
また、GPUによるN-gram言語モデルの融合やフレーズレベルの強化など、高度なコンテキスト化技術もサポートしている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:15:57 GMT)
Gradient Surgery for Safe LLM Fine-Tuning [16.7] ファインチューニング・アズ・ア・サービス(Funture-tuning-as-a-Service)は、ユーザのファインチューニングデータセットにいくつかの悪意のあるサンプルを混在させて、Large Language Models(LLM)の安全性アライメントを損なう重大な脆弱性を導入する。
既存のソリューションは有害比に非常に敏感であり、防御は有害比が増加するにつれて著しく低下する。
そこで本研究では,勾配手術を応用したSafeGradを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:13:41 GMT)
DuoCast: Duo-Probabilistic Diffusion for Precipitation Nowcasting [16.5] DuoCastは、降水予測を潜在部分空間でモデル化された低周波成分と高周波成分に分解する、二重拡散フレームワークである。
4つのベンチマークレーダデータセットの実験によると、DuoCastは最先端のベースラインを一貫して上回っている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:02:47 GMT)
Unsupervised Real-World Super-Resolution via Rectified Flow Degradation Modelling [16.5] 教師なしの現実世界の超解像(SR)は、複雑な未知の劣化分布のために重要な課題に直面している。
既存の手法では、合成低分解能(LR)と高分解能(HR)画像対から実世界のデータへの一般化に苦慮している。
実世界の劣化を効果的に捉え,モデル化するために,整流に基づく教師なし実世界のSR手法を提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:27:28 GMT)
Bridging Semantic Logic Gaps: A Cognition-Inspired Multimodal Boundary-Preserving Network for Image Manipulation Localization [16.2] 認知にインスパイアされたマルチモーダル境界保存ネットワーク(CMB-Net)を提案する。
CMB-Netは、視覚情報における意味的関係の欠如を補うために、プロンプトベースのテキスト情報を生成する。
テキスト特徴と画像特徴のあいまいさを定量化することで、テキスト特徴に重みを割り当てる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:36:44 GMT)
Towards Unveiling Predictive Uncertainty Vulnerabilities in the Context of the Right to Be Forgotten [16.0] 予測不確実性に対する悪質な未学習攻撃の新たなクラスを提案する。
我々の実験は、我々の攻撃が従来の攻撃よりも予測の不確実性を操作するのに効果的であることを示している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 19:08:18 GMT)
Similarity Matters: A Novel Depth-guided Network for Image Restoration and A New Dataset [15.8] 画像復元のためのDGN(Depth-Guided Network)を提案する。
ネットワークは、構造ガイダンスを提供する深さ推定ブランチと、コア復元タスクを実行する画像復元ブランチの2つの対話的ブランチで構成されている。
また,403種の高分解能画像9,205枚からなる新しい訓練・評価データセットも導入した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:17:31 GMT)
Zero-shot Compositional Action Recognition with Neural Logic Constraints [15.5] ZS-CARは、訓練中に学習した動詞とオブジェクトプリミティブの知識を活用することで、ビデオ中の未確認動詞の合成を識別することを目的としている。
構成的学習の進展にもかかわらず,(1)構成的構造的制約の欠如,(2)意味的階層的制約の無視,意味的曖昧さと訓練過程の障害という2つの重要な課題が続いている。
我々は、人間のような象徴的推論が、構成的および階層的構造的抽象を明示的にモデル化することによって、これらの課題に対する原則的な解決策を提供すると主張する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 05:44:02 GMT)
Fading the Digital Ink: A Universal Black-Box Attack Framework for 3DGS Watermarking Systems [15.3] 本稿では,グループベース多目的進化攻撃(GMEA)の第1次汎用ブラックボックス攻撃フレームワークを紹介する。
我々はこの攻撃を大規模多目的最適化問題として定式化し、透かし除去と視覚的品質のバランスをとる。
実験により,本フレームワークは主流3DGS透かし法から1Dと2Dの透かしを効果的に除去することを示した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:31:01 GMT)
OpenHAIV: A Framework Towards Practical Open-World Learning [15.3] 本稿では,オープンワールド認識のための新しいフレームワークであるOpenHAIVを提案する。
OOD検出、新しいクラスディスカバリ、インクリメンタルな微調整を統合パイプラインに統合する。
このフレームワークは、オープンワールド環境における知識を自律的に取得し、更新することを可能にする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:55:19 GMT)
Intention-Aware Diffusion Model for Pedestrian Trajectory Prediction [15.2] 本稿では,短期と長期の両方の動作意図を組み込んだ拡散型歩行者軌道予測フレームワークを提案する。
提案するフレームワークはETH, UCY, SDDのベンチマークで評価され, 最先端手法に対する競合性を実証した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:36:33 GMT)
MQuant: Unleashing the Inference Potential of Multimodal Large Language Models via Full Static Quantization [15.0] MQuantは、マルチモーダル大規模言語モデル(MLLM)の課題に取り組むために設計されたポストトレーニング量子化フレームワークである。
5つのメインストリームMLLMでは、W4A8のMQuantがほぼ浮動小数点精度を達成し、推論遅延を最大30%削減する。
我々のMQuantは、資源制約のあるデバイスにおいて、効率よく正確なMLLM推論のためのギャップを効果的に橋渡しします。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:13:03 GMT)
CoAR: Concept Injection into Autoregressive Models for Personalized Text-to-Image Generation [14.8] CoARは、最小数のパラメータだけで有効で特定の主題表現を学習する。
実験により,CoARは主観的パーソナライゼーションとスタイルパーソナライゼーションの両方において優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:36:39 GMT)
MV-Debate: Multi-view Agent Debate with Dynamic Reflection Gating for Multimodal Harmful Content Detection in Social Media [14.7] MV-Debateは、マルチモード有害コンテンツ検出のための動的リフレクションゲーティングを備えたマルチビューエージェント討論フレームワークである。
MV-Debateは4つの相補的な議論エージェント、表面分析者、深い推論者、モダリティコントラスト、社会的文脈主義者を集め、多様な解釈的視点からコンテンツを分析する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 19:17:33 GMT)
Dissipation-induced Half Quantized Conductance in One-dimensional Topological Systems [14.3] エッジ状態からの量子コンダクタンス(quantized conductance)は、2次元トポロジー位相の目印である。
一次元(1D)のトポロジカルシステムでは、エッジ状態は絶縁バルクを越えて電流を伝達することができず、そのトポロジカルな性質は輸送中に見えなくなる。
導電性は, 位相的に非自明な位相において半量子化され, 自明な位相に欠落する特徴を示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:57:32 GMT)
Large-scale Multi-sequence Pretraining for Generalizable MRI Analysis in Versatile Clinical Applications [14.0] 本研究では,大規模MultI-Sequence MRIを用いた基礎モデルであるPRISMを提案する。
本稿では,MRIの配列特異的な変化から解剖学的に不変な特徴を引き離す新しい事前訓練パラダイムを提案する。
PRISMは、非事前のモデルと既存の基礎モデルの両方を一貫して上回った。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 03:31:46 GMT)
Revisiting Data Attribution for Influence Functions [13.9] 本稿では,ディープラーニングにおける影響関数のデータ帰属能力について概説する。
提案手法の理論的基礎, 効率的な逆ヘッセンベクトル積推定のためのアルゴリズムの最近の進歩, およびデータ帰属と誤ラベル検出の有効性について考察する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:15:07 GMT)
Representation Understanding via Activation Maximization [13.9] 本稿では、畳み込みニューラルネットワーク(CNN)と視覚変換器(ViT)の両方に適用可能な統合された特徴可視化フレームワークを提案する。
従来のCNNと現代のViTの両方において、我々のアプローチの有効性を実証し、その一般化可能性と価値を強調した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:36:30 GMT)
FOBNN: Fast Oblivious Inference via Binarized Neural Networks [13.6] 本稿では,二元化ニューラルネットワークを用いた高速なOblivious推論フレームワークであるFOBNNを提案する。
我々はビット長境界(BLB)アルゴリズムを開発し,ビット表現の最小化と冗長計算の低減を図る。
また、リンク最適化と構造探索により、二項化ニューラルネットワーク構造も強化する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:35:03 GMT)
Planner-Refiner: Dynamic Space-Time Refinement for Vision-Language Alignment in Videos [13.6] Planner-Refinerは言語と視覚の間のセマンティックギャップを橋渡しするフレームワークである。
Plannerモジュールは複雑な言語的プロンプトを分解することで言語指導をスケジュールする。
Refinerは各短い文、名詞句と動詞句のペアを処理し、空間を横断する視覚トークンの自己注意を指示する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:03:40 GMT)
Less is More: Skim Transformer for Light Field Image Super-resolution [13.6] 我々は、光場超解像(LFSR)のための効率的かつ強力なネットワークであるSkimLFSRを提案する。
SkimLFSR は 2x と 4x のタスクでそれぞれ PSNR において 0.59 dB と 0.35 dB を平均で上回り、最先端の手法を上回る結果が得られる。
これらの知見は、光場画像処理における将来的なパラダイムとしての有効性と適応性を強調した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 03:42:07 GMT)
Simple Radiology VLLM Test-time Scaling with Thought Graph Traversal [13.2] テストタイムスケーリングは、追加のトレーニングなしで視覚言語による大規模モデル(VLLM)の推論性能を改善するための有望な方法を提供する。
医学的に整合した順序で臓器特異的な発見を通してモデルを推論するための軽量なThought Graph Traversalフレームワークを導入する。
このフレームワークは、構造化された医学的前提をプロンプトに統合し、基礎となるモデルを変更することなく、より深くより論理的な分析を可能にする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:28:29 GMT)
HealthBranches: Synthesizing Clinically-Grounded Question Answering Datasets via Decision Pathways [12.9] HealthBranchesは、医療質問回答(Q&A)のための新しいベンチマークデータセット
このデータセットは半自動パイプラインを通じて生成され、医療ソースから関連する質問や回答を持つ現実的な患者に明確な決定経路を変換する。
17の医療トピックにわたる4,063のケーススタディをカバーし、各データポイントは臨床的に検証された推論チェーンに基づいています。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:45:34 GMT)
Interpreting the linear structure of vision-language model embedding spaces [12.8] 我々は、4つの視覚言語モデルの埋め込み空間上でスパースオートエンコーダ(SAE)を訓練・リリースする。
学習方向の疎線形結合としてのSAEs近似モデル埋め込み、あるいは「概念」
異なる種や異なるデータダイエットでSAEをリトレーニングすることは、2つの発見につながる。SAEによって得られた稀で特異な概念は、劇的に変化するが、一般的に活性化される概念は、実行中に著しく安定していることも示している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:06:14 GMT)
Game Reasoning Arena: A Framework and Benchmark for Assessing Reasoning Capabilites of Large Language Models via Game Play [12.2] Game Reasoning Arenaライブラリは、Google OpenSpielライブラリに実装された戦略的ボードゲームを通じて、大きな言語モデル(LLM)の決定能力を評価するためのフレームワークを提供する。
本稿では,図書館の構造,鍵となる特徴,リポジトリのモチベーションを要約し,LLMの推論とゲーム理論的振る舞いの実証的評価にどのように貢献するかを明らかにする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:07:03 GMT)
Strategic Incentivization for Locally Differentially Private Federated Learning [12.1] フェデレートラーニング(FL)では、複数のクライアントが、生のデータではなく勾配情報を複数のラウンドでサーバと共有することで、機械学習モデルを共同でトレーニングする。
ローカル微分プライバシ(LDP)では、クライアントがサーバに送信する前に、勾配に選択的にノイズを付加する。
本稿では,このプライバシ・精度のトレードオフをゲームとしてモデル化し,より高い精度を達成するために,より低レベルのノイズを加えるようにクライアントにインセンティブを与える。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 01:57:47 GMT)
From Permissioned to Proof-of-Stake Consensus [11.6] 本稿では、任意の許可されたコンセンサスプロトコルを証明可能な無許可コンセンサスプロトコルに変換する最初のジェネリックコンパイラを提案する。
以下のプロパティのそれぞれについて、初期許可されたプロトコルが部分的に同期された設定でプロパティを満たす場合、そのプロパティを部分的に同期的で準パーミッションな設定で満足する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 22:13:43 GMT)
Dynamic Robot-Assisted Surgery with Hierarchical Class-Incremental Semantic Segmentation [11.6] クラスインクリメンタルセマンティックセグメンテーション(CISS)は、モデルが以前のデータをトレーニングすることなく、新しいクラスに継続的に適応できるようにする。
評価ベンチマークとしてオンラインでホストされたSyn-Mediverse合成データセットに144以上のクラスを持つ改良されたラベルセットを導入する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:57:30 GMT)
Addressing The Devastating Effects Of Single-Task Data Poisoning In Exemplar-Free Continual Learning [11.5] 連続学習(CL)におけるデータ中毒に関する見過ごされたセキュリティ上の懸念に対処する研究
データ中毒は最近、CLトレーニングの安定性に対する脅威であることが示されている。
以前提案された毒殺設定とは対照的に、敵はモデルへの知識やアクセスを欠いている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:06:21 GMT)
Mitigating Traffic Oscillations in Mixed Traffic Flow with Scalable Deep Koopman Predictive Control [11.4] 接続された自動車両(CAV)と人力車両(HDV)の交通振動の緩和は、交通の安定性を高めるために重要である。
本研究では,この問題に対処するための適応型深層クープマン予測制御フレームワーク(AdapKoopPC)を提案する。
このフレームワークは、自然データから適応的に学習することで、高次元空間における線形系として複雑なHDVカー追従ダイナミクスを表現する、新しいディープクープマンネットワークであるAdapKoopnetを特徴としている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:02:13 GMT)
"Pull or Not to Pull?'': Investigating Moral Biases in Leading Large Language Models Across Ethical Dilemmas [11.2] 本研究は,14大言語モデル(LLM)の包括的実証評価である。
我々は3,780の二項決定と自然言語の正当性を抽出し、決定的断定性、説明的回答の整合性、公的な道徳的整合性、倫理的に無関係な手がかりに対する感受性の軸に沿った分析を可能にした。
我々は、LLMのアライメントにおいて、道徳的推論が主軸となることを主張し、LLMが決定するものだけでなく、どのように、なぜかを評価する標準ベンチマークを要求している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:45:16 GMT)
A Taxonomy of Inefficiencies in LLM-Generated Python Code [11.2] 大きな言語モデル(LLM)は、将来性のある結果を伴う自動コード生成に広く採用されている。
以前の研究では、LLM生成コードを評価し、冗長性、保守性に乏しい、最適以下のパフォーマンスなど、さまざまな品質の問題を特定していた。
この研究は、コードLLMの改善、コード生成の品質と効率の向上も導くことができる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:09:42 GMT)
Accurate Measles Rash Detection via Vision Transformer Fine-Tuning [11.2] 麻疹は2000年8月5日に報告された1,356件の症例で2025年に復活した。
本研究では, 皮膚の異状を識別するために, 予め訓練したデータ効率画像変換器(DeiT)モデルに転写学習を適用した。
DeiTモデルは96.38%、精度96.24%、リコール96.38%、F1スコア96.23%という中央値の分類精度を達成した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:01:46 GMT)
Semantic Mapping in Indoor Embodied AI -- A Survey on Advances, Challenges, and Future Directions [10.7] セマンティックマップは、環境に関する情報を構造化された方法でキャプチャし、エージェントが高度な推論のためにそれを参照できるようにする。
本稿では,組み込みAIにおけるセマンティックマップ構築アプローチ,特に屋内ナビゲーションについて概説する。
フィールドはオープン語彙、クエリ可能、タスクに依存しないマップ表現の開発に向かっている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:26:36 GMT)
Selection and Exploitation of High-Quality Knowledge from Large Language Models for Recommendation [10.6] このフレームワークは、知識フィルタリングモジュールと埋め込み空間アライメントモジュールの2つの重要なコンポーネントで構成されている。
実験結果は知識フィルタリングとアライメントモジュールの両方の必要性と有効性を検証する。
抽出者のみのトレーニング戦略は、知識強化された推奨に対する新たな視点を提供する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:03:01 GMT)
Mean--Variance Portfolio Selection by Continuous-Time Reinforcement Learning: Algorithms, Regret Analysis, and Empirical Study [10.4] 株価が拡散過程である市場において、同時に拡散過程である観測可能な要因によって駆動される、持続時間平均変動ポートフォリオの選択について検討する。
本稿では,市場係数の学習や推定を行うことなく,事前委託投資戦略を直接学習する汎用データ駆動型RLアルゴリズムを提案する。
提案された連続時間RL戦略は、特に揮発性クマ市場において、一貫して最良であり、モデルベースの連続時間戦略よりもかなりのマージンで決定的に優れている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:53:23 GMT)
Toward AI Matching Policies in Homeless Services: A Qualitative Study with Policymakers [10.3] ロサンゼルスの政策立案者は、AIを住宅資源マッチングプロセスに組み込むという考えにオープンかどうかを検討する。
我々の質的な分析は、様々な複雑な要因に気付いても、政策立案者はAIマッチングツールのアイデアを歓迎することを示している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:33:03 GMT)
Grounding Natural Language for Multi-agent Decision-Making with Multi-agentic LLMs [10.2] 大規模言語モデル(LLM)の能力を多エージェント意思決定アルゴリズムに組み込むことにより拡張する。
本稿では,多言語大言語モデル (LLM) の設計のための体系的フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 19:53:23 GMT)
MDC-R: The Minecraft Dialogue Corpus with Reference [10.1] Minecraft Dialogue Corpus with Reference (MDC-R) について紹介する。
MDC-Rは、オリジナルのMinecraft Dialogue Corpus (MDC) を補完する新しい言語リソースであり、アナフォリックおよびデリケートな参照のエキスパートアノテーションを備えている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:28:05 GMT)
Overcoming Vocabulary Constraints with Pixel-level Fallback [9.8] 代名詞のトークン化には、計算効率と語彙カバレッジのバランスが必要である。
画素として描画されたテキストから入力埋め込みを生成する語彙自由エンコーダを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 19:37:16 GMT)
Hallucination as a Computational Boundary: A Hierarchy of Inevitability and the Oracle Escape [9.7] 大規模言語モデル(LLM)のイリュージョン現象は、信頼性の高いデプロイメントにおける中核的な障害である。
本稿では,「計算必要階層」を構築することにより,大規模言語モデルを確率的チューリングマシンとして定式化する。
2つの「エスケープルート」を提案する。1つは「コンピュータジャンプ」による絶対脱出を証明し、レトリーバル拡張世代(RAG)をオラクルマシンとしてモデル化することである。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:26:36 GMT)
Co-VisiON: Co-Visibility ReasONing on Sparse Image Sets of Indoor Scenes [8.9] 我々は,1000以上のスパースビュー屋内シナリオにおいて,人間にインスパイアされたコビジュアビリティ推論を評価するために設計されたCo-VisiONベンチマークを紹介する。
この結果から,コビジュアビリティは低レベルな特徴マッチングタスクとして扱われることが多いが,スパース条件下での既存の視覚モデルでは依然として困難であることがわかった。
本稿では,純視覚モデルにおける最高性能を達成し,プロプライエタリなVLMとのギャップを狭める,新しい多視点ベースラインであるCovisを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 19:17:54 GMT)
Lightweight Multi-Scale Feature Extraction with Fully Connected LMF Layer for Salient Object Detection [8.9] 本稿では,LMF層と呼ばれる,軽量なマルチスケール特徴抽出層を提案する。
複数のLMF層を統合することで,有能な物体検出に適した軽量ネットワークLMFNetを開発した。
LMFNetは、0.81Mパラメータしか持たない5つのベンチマークデータセットに対して、最先端または同等の結果が得られることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:06:48 GMT)
URO-Bench: Towards Comprehensive Evaluation for End-to-End Spoken Dialogue Models [8.9] 音声合成(S2S)シナリオの広範なベンチマークであるURO-Benchを提案する。
URO-BenchはS2Sベンチマークで、多言語主義、多ラウンド対話、パラ言語学の評価をカバーしている。
我々のベンチマークは、基本トラックとプロトラックの2つの難易度に分けられ、それぞれが20のテストセットで構成されている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:34:42 GMT)
Reward-Directed Score-Based Diffusion Models via q-Learning [8.7] 生成AIのための連続時間スコアベース拡散モデルのトレーニングのための新しい強化学習(RL)法を提案する。
ノイズ摂動データ分布の未知のスコア関数に対する事前学習モデルは含まない。
本稿では,その性能を2つの最先端RL法と比較することにより,本手法の有効性を示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:23:13 GMT)
Integrating Quantum Computing with Multiconfiguration Pair-Density Functional Theory for Biological Electron Transfer [8.7] VQE-PDFTは、変分量子固有解法と多重構成対密度汎関数理論を統合する量子古典ハイブリッドフレームワークである。
我々は, 複雑な生体システムに応用できる, ハードウェア効率の浅いアンサツ回路を開発した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:18:05 GMT)
Statistical Theory of Multi-stage Newton Iteration Algorithm for Online Continual Learning [8.5] 制約された記憶容量は、履歴データの完全保持を防ぎ、シーケンシャルなタスクトレーニング中に破滅的な忘れを招きます。
統計的観点から,新しい連続学習フレームワークを提案する。
我々は,特定のシナリオにおける計算コストを大幅に削減するマルチステップニュートンイテレーションアルゴリズムを開発した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:32:52 GMT)
ALOPE: Adaptive Layer Optimization for Translation Quality Estimation using Large Language Models [8.5] 大規模言語モデル(LLM)は、幅広い自然言語処理タスクで顕著なパフォーマンスを示している。
QE for Machine Translation (MT)は、参照翻訳に頼ることなく、ソースとターゲットのペアの品質を評価する。
本稿では,LCMベースのQE向上を目的とした適応層最適化フレームワークであるALOPEを紹介する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 20:59:44 GMT)
An Intelligent Mobile Application to Monitor and Correct Sitting Posture Using Raspberry Pi and MediaPipe Pose Detection [8.5] PoseTrackはRaspberry Pi CameraとMediapipe Poseのランドマークを使用してユーザの姿勢を監視し、リアルタイムフィードバックを提供するモバイルアプリである。
このシステムは、前方傾き、スラッシング、肩の膨らみ、足の交差など、姿勢の悪いものを検知する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 01:10:56 GMT)
FROSS: Faster-than-Real-Time Online 3D Semantic Scene Graph Generation from RGB-D Images [8.3] 本稿では,オンラインで高速な3D SSG生成技術であるFROSS(Faster-than-Real-Time Online 3D Semantic Scene Graph Generation)を提案する。
このフレームワークは、正確で計算集約的なポイントクラウド処理への依存を取り除く。
実験により、FROSSは従来の3次元生成法よりもはるかに高速に動作しながら、優れた性能が得られることが示された。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:36:35 GMT)
Multimodal Deception in Explainable AI: Concept-Level Backdoor Attacks on Concept Bottleneck Models [8.2] 概念ボトルネックモデル (Concept Bottleneck Models, CBM) は、人間の理解可能な概念を通じて解釈可能性を強制する。
CBMは、バックドア攻撃のようなセキュリティ上の脅威に弱いままである。
我々は,マルチモーダルXAIシステムにおける概念レベルのバックドア攻撃の未解決リスクに対処するため,CAT(Concept-level Backdoor ATtacks)を提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:54:16 GMT)
An Embodied AR Navigation Agent: Integrating BIM with Retrieval-Augmented Generation for Language Guidance [8.2] 本稿では,柔軟で言語駆動型の目標探索と経路計画を支援するARナビゲーションシステムを提案する。
このシステムは、大規模な言語モデルに基づいて構築された3つの言語エージェント、Triage, Search, Responseを編成する。
現実世界のユーザ調査では、システムユーザビリティ尺度(SUS)スコアが80.5に達し、優れたユーザビリティを示している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:13:23 GMT)
A novel language model for predicting serious adverse event results in clinical trials from their prospective registrations [8.1] 臨床治験における重症事象 (SAE) の予測法について, 登録情報のみを用いて検討した。
臨床Trials.govの2腕平行介入臨床試験を22,107回行った。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:39:11 GMT)
Probabilistic Optimality for Inference-time Scaling [8.1] 大規模言語モデル(LLM)の推論性能を向上させるための強力な手法として、推論時間スケーリングが登場した。
本稿では,並列サンプルが独立かつ同一分布であるという仮定の下で,推論時間スケーリングの最適性を定式化する確率的フレームワークを提案する。
サンプル応答の最適数を動的に決定する実用的なアルゴリズムである OptScale を開発した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:42:51 GMT)
Rapid and Stable Collective Charging and Discharge Suppression in Strongly Coupled Many-Body Quantum Batteries [7.9] 非摂動状態における集団充電と放電抑制を示す新しいQBモデルを提案する。
エルゴトロピーを用いて蓄えられたエネルギーを定量化し, トンネル, 駆動強度, スペクトル幅, 環境温度が充電性能に与える影響を解析した。
結果は、強結合熱力学の理論的な洞察を与え、堅牢なQBプラットフォームの設計を導く。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:04:46 GMT)
How Does a Deep Neural Network Look at Lexical Stress? [7.9] 英語の非音節単語のデータセットは、読み書き音声と自発音声から自動的に構築される。
CNNアーキテクチャは、最小のストレスペアを欠いた非音節単語のスペクトル表現から、ストレス位置を予測するために訓練された。
特徴特異的な関連分析を提案し,その結果から, 発声母音の第1および第2フォルマントの影響を強く受けていることが示唆された。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:13:40 GMT)
Policy Newton methods for Distortion Riskmetrics [7.8] 有限地平面マルコフ決定過程(MDP)において、割引報酬の歪みリスクメトリック(DRM)を最大化してリスク最適政策を求める。
そこで本研究では, MDP のサンプル軌跡から, 自然な DRM ヘッセン推定器を提案する。
提案アルゴリズムはDRM目標の2次定常点(epsilon$-SOSP)に収束することを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:03:32 GMT)
MAQuA: Adaptive Question-Asking for Multidimensional Mental Health Screening using Item Response Theory [7.6] 我々は,同時多次元メンタルヘルススクリーニングのための適応型質問応答フレームワークMAQuAを紹介する。
また,MAQuAは,ランダムな順序付けに比べて,スコア安定化に必要な評価質問数を50~87%削減することを示した。
MAQuAは内因性(抑うつ、不安)と外因性(物質使用、摂食障害)の両方で堅牢な性能を示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:33:16 GMT)
Training and Inference within 1 Second -- Tackle Cross-Sensor Degradation of Real-World Pansharpening with Efficient Residual Feature Tailoring [7.5] 既存のクロスセンサー劣化に対処する方法には、再訓練モデルやゼロショット法がある。
本手法は,深層学習に基づくパンシャーピングモデルにおいて,まずモジュラ分解を行う。
このインターフェースでFeature Tailorが統合され、機能レベルでのクロスセンサーの劣化に対処します。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:39:18 GMT)
$d+1$ Measurement Bases are Sufficient for Determining $d$-Dimensional Quantum States: Theory and Experiment [7.4] 任意の$d+1$次元の量子状態を完全に再構成するためには,射影基底を$d+1$でしか必要としない量子状態トモグラフィー方式を提案する。
このアプローチは、量子状態のキャラクタリゼーションと測定設計のための新しい視点を提供し、量子情報処理における将来の応用を約束する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:17:47 GMT)
Causal Negative Sampling via Diffusion Model for Out-of-Distribution Recommendation [7.4] ヒューリスティックな負サンプリングは、予め定義された候補プールから様々な硬度レベルの負のサンプルを選択することにより、推薦性能を高める。
候補プールにおける未観測環境共創者は、偽硬陰性(FHNS)をサンプリング法で導入する可能性がある
本稿では,この問題を解決するためにDiffusion (CNSDiff) を用いたCausal Negative Smpling という新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:55:21 GMT)
On Representation Learning with Feedback [7.4] このノートは、著者の最近の論文"Robust representation learning with feedback for single image deraining"を補完するものである。
フィードバックによる表現学習のメカニズム、すなわち本記事で提示された作品の本質的なメリットに関する理論的説明を提供する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:24:18 GMT)
Quantum-data-driven dynamical transition in quantum learning [7.3] 我々は、目標値とデータがトレーニングの収束を決定する量子データ駆動の動的遷移を明らかにする。
一般化されたハールアンサンブルによる遷移を説明する非摂動理論を提供する。
本研究は,QNNトレーニングにおける収束を加速するコスト関数の構築に関するガイダンスを提供する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 22:12:39 GMT)
Enhancing Systematic Interoperability: Convergences and Mismatches between Web 3.0 and the EU Data Act [7.3] 本稿では、Web 3.0における技術的相互運用性と、EUデータ法によって確立された法的相互運用性の理論的枠組みを比較する。
目標は、技術的な相互運用性を相互運用性の法的概念と整合させることで、次世代のWebにおける体系的な相互運用性の実践的実装を強化することである。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:14:46 GMT)
HSA-Net: Hierarchical and Structure-Aware Framework for Efficient and Scalable Molecular Language Modeling [7.3] 階層的特徴投影と融合を可能にする2つのモジュールを持つ新しいフレームワークである階層型・構造対応ネットワーク(HSA-Net)を提案する。
複数レベルの特徴を適応的にマージするために,アグリゲーションの特徴に基づいて,融合の専門家を柔軟に選択するSource-Aware Fusion (SAF) モジュールを設計する。
我々のHSA-Netフレームワークは、現在最先端(SOTA)手法よりも定量的に質的に優れていることを示した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:22:42 GMT)
Tight Bounds for Schrödinger Potential Estimation in Unpaired Image-to-Image Translation Problems [7.3] Schr"odingerブリッジと最適制御理論に基づく生成的モデリングと画像間変換
初期および最終分布からのi.d.サンプルしかアクセスできないと仮定する。これにより、生成的モデリングと画像間翻訳の両方に適合する。
最適制御アプローチに基づき、オルンシュタイン・ウレンベック過程を基準として選択し、対応するシュリンガーポテンシャルを推定する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:46:15 GMT)
Online Convex Optimization with Heavy Tails: Old Algorithms, New Regrets, and Applications [7.2] オンライン凸最適化 (Online Convex Optimization, OCO) では、勾配が有限な場合、多くのアルゴリズムは確実にサブ線形後悔を保証する。
この研究は、より困難な重み付け設定において、OCOの異なる古いアルゴリズムを調べる。
注目すべきは、これらの後悔境界は全てのパラメータで完全に最適であることである。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 20:17:38 GMT)
Zero-Shot Voice Conversion via Content-Aware Timbre Ensemble and Conditional Flow Matching [7.2] CTEFM-VCは、コンテント対応の音色アンサンブルモデリングと条件付きフローマッチングを統合するフレームワークである。
CTEFM-VCは、話者の類似性、音声の自然性、および知性を評価するすべての指標において、常に最高の性能を達成している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:48:33 GMT)
TraceLens: Question-Driven Debugging for Taint Flow Understanding [7.1] タント解析のための最初のエンドユーザー質問応答型デバッグインタフェースであるTraceLensを提案する。
疑わしい流れの存在を調査するために、なぜ、なぜ、何の質問をするのかをユーザが問うことができる。
TraceLensを使用するユーザは、CodeQLと比較して平均で21%高い精度を達成した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:39:11 GMT)
From Noise to Knowledge: Interactive Summaries for Developer Alerts [7.1] CLARITYは、インタラクティブな調査を通じてツール生成警告の解釈をサポートする。
CLARITYのルール推論アルゴリズムは、ユーザが警告を興味深くも興味も持たないものとしてマークするので、一般的な症状が現れる。
我々の評価は,CLARITYの能動的学習に基づく要約により,対話的警告感覚の創造が促進されることを示唆している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:04:15 GMT)
AutoAssert 1: A LoRA Fine-Tuned LLM Model for Efficient Automated Assertion Generation [7.1] ハードウェア記述言語(HDL)に基づく新たなアサーション生成手法を提案する。
この方法は、軽量でパラメータ調整可能な大規模言語モデル(LLM)とUnslothプラットフォームを組み合わせて、テストケースを自動的に生成する。
実験により,本手法はハードウェア論理に厳密に準拠するアサーションを効率的に生成できることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:43:54 GMT)
Understanding Dynamic Scenes in Ego Centric 4D Point Clouds [7.0] EgoDynamic4Dは、非常にダイナミックなシーンに関する新しいQAベンチマークである。
エージェントの動作,人間と物体の相互作用予測,関係,軌道の理解,時間・因果推論,詳細な指標を含む12の動的QAタスクを設計する。
提案手法は,エゴ中心の動的シーン理解のためのマルチモーダル時間モデルの有効性を検証し,ベースラインを一貫して上回る。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:08:04 GMT)
EndoAgent: A Memory-Guided Reflective Agent for Intelligent Endoscopic Vision-to-Decision Reasoning [7.0] EndoAgentは、視覚から決定への内視鏡分析のためのメモリ誘導剤である。
反復推論と適応的なツールの選択とコラボレーションを統合する。
一般的なマルチモーダルモデルと医療用マルチモーダルモデルの両方を一貫して上回っている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:02:57 GMT)
Are Multimodal Embeddings Truly Beneficial for Recommendation? A Deep Dive into Whole vs. Individual Modalities [6.8] マルチモーダルレコメンデーション(MMRec)は、テキストと視覚的な埋め込みを活用する主流パラダイムとして登場した。
本稿では,現代MMRecモデルにおけるテキストと視覚的埋め込みの役割を,全体としても個人的にも検討する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:59:21 GMT)
Pentest-R1: Towards Autonomous Penetration Testing Reasoning Optimized via Two-Stage Reinforcement Learning [6.5] Pentest-R1は、侵入テストタスクの推論機能を最適化するために設計されたフレームワークである。
環境フィードバックから直接学習し、堅牢なエラー自己補正と適応戦略を開発する。
AutoPenBenchでは、Pentest-R1は24.2%の成功率に達し、ほとんどの最先端モデルを上回っている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:14:05 GMT)
SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba [6.5] リアルタイムの外科的位相認識のための新しいフレームワークであるSPRMambaを提案する。
MambaアーキテクチャとScaled Residual TranMambaブロックを統合して、時間的モデリングと局所的な詳細抽出を相乗化する。
最先端のパフォーマンス(ESD385では87.64%、以前の方法では1.0%)を達成し、外科手術全体にわたって堅牢な一般化性を示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:24:25 GMT)
GS4Buildings: Prior-Guided Gaussian Splatting for 3D Building Reconstruction [6.4] 本稿では, より堅牢でスケーラブルな建物表面再構築のための, GS4Buildingsを提案する。
平面構造幾何から事前の深さと正規写像を生成し、それらを最適化プロセスに組み込む。
都市データセットの実験では、GS4Buildingsは再建完了度を20.5%改善し、幾何精度を32.8%改善している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:13:31 GMT)
Explainability-in-Action: Enabling Expressive Manipulation and Tacit Understanding by Bending Diffusion Models in ComfyUI [6.3] 我々は、Sch"onの「反省的行動(reflection-in-action)」と似た、長期的、ハンズオンなエンゲージメントに根ざした説明可能性へのクラフトベースのアプローチを提案する。
生成モデルの異なる部分をインタラクティブに操作することで、アーティストは各コンポーネントが出力にどのように影響するかについての直感を発達させることができることを実証する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 05:19:30 GMT)
Sample-based Hamiltonian and Lindbladian simulation: Non-asymptotic analysis of sample complexity [6.3] 本稿では、密度行列指数(DME)と波行列リンドブラッド化(WML)の詳細なサンプル複雑性解析について述べる。
どちらのアルゴリズムも原型的なサンプルベース量子アルゴリズムである。
リンドブラッド作用素が非自明に振る舞うとき、WMLはサンプルベースのリンドブラディアンシミュレーションに最適であることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 01:35:30 GMT)
AlphaEval: A Comprehensive and Efficient Evaluation Framework for Formula Alpha Mining [6.2] 金融データから予測信号を生成するフォーミュラアルファマイニングは、量的投資に不可欠である。
既存の評価指標には、主にバックテストと相関ベースの測定が含まれている。
自動アルファマイニングモデルのための統一的で並列化可能なバックテストフリー評価フレームワークであるAlphaEvalを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:19:24 GMT)
Activity Coefficient-based Channel Selection for Electroencephalogram: A Task-Independent Approach [6.1] 本研究では,アクティベーション係数に基づくチャネル選択法(ACCS)を提案する。
ACCSは、チャネル活動係数(Channel Activity Coefficient, CAC)と呼ばれる新しいメトリクスを使用して、活動レベルに基づいてチャネルユーティリティを定量化する。
CACがランク付けした上位16チャンネルを選択することで、ACCSは最大34.97%の改善を達成している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:40:41 GMT)
Can LLM-based Financial Investing Strategies Outperform the Market in Long Run? [6.0] 大規模言語モデル(LLM)は、資産価格のタスクや株式取引アプリケーションに利用されており、AIエージェントが非構造化の財務データから投資決定を生成することができる。
我々は、より長い期間にわたるタイミングベースの戦略とより大きなシンボルの宇宙を評価するバックテストフレームワークであるFINSABERを提案し、それらの一般化性と堅牢性を批判的に評価する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:06:51 GMT)
Arce: Augmented Roberta with Contextualized Elucidations for Ner in Automated Rule Checking [5.8] ARCE(Augmented RoBERTa with contextualized elucidations)は、この生成プロセスを体系的に探索し最適化する新しいアプローチである。
ARCEはベンチマークAECデータセットに新たな最先端技術を確立し、マクロF1スコアは77.20%に達した。
シンプルで説明に基づく知識は、このタスクの複雑なロールベースの論理よりも驚くほど効果的であることが証明されます。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:49:48 GMT)
The Dual Personas of Social Media Bots [5.5] ソーシャルメディアボットは、オンライン会話に参加するAIエージェントである。
ほとんどの研究は、一般的なボットとこれらのエージェントの悪意的な性質に焦点を当てている。
しかし、ボットは多くの異なるペルソナを持ち、それぞれが特定の行動特性やコンテンツ特性に特化している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:29:25 GMT)
Freeze and Reveal: Exposing Modality Bias in Vision-Language Models [5.4] 視覚言語モデルは、印象的なマルチモーダルパフォーマンスを達成するが、しばしばトレーニングデータから性別バイアスを継承する。
本研究では,これらのバイアスに対する視覚とテキストのバックボーンの寄与を,対象の偏りを適用して判別する。
我々の研究は、将来のマルチモーダルシステムにおけるより標的的で効果的なバイアス緩和戦略を可能にする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:08:10 GMT)
When Cars Have Stereotypes: Auditing Demographic Bias in Objects from Text-to-Image Models [5.3] このようなバイアスを測定するための新しいフレームワークであるSODA(Stereotyped Object Diagnostic Audit)を紹介する。
提案手法は, 対象物の視覚特性を人口統計学的手がかりと中性プロンプトとを比較した。
性別や民族によって引き起こされる色パターンの反復など、特定の人口集団と視覚特性の強い関連を明らかにする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:10:23 GMT)
Weather-Driven Agricultural Decision-Making Using Digital Twins Under Imperfect Conditions [5.3] デジタルツインは、農業気象データ測定の不整合を検出するのに有用である。
我々はCerealiaという名前のフレームワークを開発し、エンドユーザは完璧な天気予報が利用できないときにデータ不整合をチェックすることができる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:27:00 GMT)
Understanding and Mitigating Memorization in Generative Models via Sharpness of Probability Landscapes [5.1] 本稿では,ログ確率密度のシャープネスを用いて拡散モデルの記憶度を解析するための幾何学的枠組みを提案する。
本稿では,潜時拡散モデルにおける画像生成の初期段階におけるシャープネスを定量化する手法を提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 22:01:55 GMT)
Planning with Diffusion Models for Target-Oriented Dialogue Systems [5.1] 非逐次対話計画のための対話計画フレームワークDiffTODを導入する。
DiffTODは、条件付き誘導を用いた軌道生成問題として対話計画を定式化する。
我々は,DiffTODが筋視的でない視線探索を効果的に行え,長い地平線上での行動戦略を最適化できることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:00:39 GMT)
SOInter: A Novel Deep Energy Based Interpretation Method for Explaining Structured Output Models [4.9] 本稿では,構造化出力モデルの振る舞いを説明する新しい解釈手法を提案する。
出力の1つを対象とし、入力空間の各局所性における目標を決定するために構造化モデルが利用する最も重要な特徴を見つけ出そうとする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:28:38 GMT)
Learning How to Vote with Principles: Axiomatic Insights Into the Collective Decisions of Neural Networks [4.8] 我々は、好みを集約するニューラルネットワークを構築し評価するフレームワークである、公理的なディープ投票を提案する。
1) ニューラルネットワークは, 精度が高いにもかかわらず, 投票規則の中核となる公理と一致せず, 結果の模倣と推論の解離が明らかになることが多い。
単に公理満足度を最適化することによって、ニューラルネットワークは、しばしば既存のものと大きく異なる新しい投票規則を合成することができる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 22:36:30 GMT)
Levarging Learning Bias for Noisy Anomaly Detection [4.8] 本稿では、フル教師なし画像異常検出(FUIAD)の課題に対処する。
従来の方法では、異常のないトレーニングデータを仮定するが、実世界の汚染により、モデルは通常通り異常を吸収する。
モデルに固有の学習バイアスを利用する2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:47:21 GMT)
Bidirectional Hierarchical Protein Multi-Modal Representation Learning [4.7] 大規模タンパク質配列で事前訓練されたタンパク質言語モデル(pLM)は、配列ベースタスクにおいて大きな成功を収めた。
3次元構造情報を活用するために設計されたグラフニューラルネットワーク(GNN)は、タンパク質関連予測タスクにおいて有望な一般化を示している。
本稿では、よりリッチで包括的なタンパク質表現を捉えるために、双方向かつ階層的な(双階層的な)融合アプローチを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:27:55 GMT)
PrLM: Learning Explicit Reasoning for Personalized RAG via Contrastive Reward Optimization [4.6] 検索したユーザプロファイルを明示的に推論するために,LLMをトレーニングする強化学習フレームワークであるPrLMを提案する。
PrLMは、注釈付き推論パスを必要とせずに、ユーザの応答から効果的に学習する。
3つのパーソナライズされたテキスト生成データセットの実験は、PrLMが既存の手法より優れていることを示している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:37:26 GMT)
AgriVLN: Vision-and-Language Navigation for Agricultural Robots [4.6] VLN(Vision-and-Language Navigation)は、自然言語の指示に従って、ロボットが目標とする目的地への移動を可能にする。
既存のベンチマークや方法はいずれも、農業シーン用に特別に設計されていない。
我々は6つの多様な農業シーンにまたがる1,560エピソードを含む農業と農業のベンチマークを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:07:23 GMT)
Enhancing Privacy in Decentralized Min-Max Optimization: A Differentially Private Approach [4.5] 分散 min-max 最適化により、マルチエージェントシステムはグローバル min-max 最適化問題を協調的に解決できる。
このようなシステムにおけるモデル更新の共有は、機密性の高い推論攻撃のリスクを負う。
本稿では,非分散化min-max最適化に特化して設計された新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 23:24:27 GMT)
Channel Charting in Smart Radio Environments [4.4] 本稿では,静電スキン(EMS)を用いて,現実的な都市環境下でのチャネルチャート(CC)による堅牢なデバイスローカライゼーションを実現する。
チャネルの相似性と空間的フィンガープリントを強化するために,EMSを利用した厳密な最適化フレームワークを開発した。
最適化されたEMS構成は、平均位置決め誤差の大幅な改善に加えて、90パーセントの局所化誤差を60m以上(EMSなし)から25m未満に低減することを示した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:40:09 GMT)
SVarM: Linear Support Varifold Machines for Classification and Regression on Geometric Data [4.2] この研究は、形状の変数表現を測度として利用し、テスト関数 $h:mathbbRn times Sn-1 rightarrow mathbbR$ で双対性を求めるために textitSVarM を提案する。
トレーニング可能なテスト関数をニューラルネットワークで表現することで,形状データセットの分類と回帰モデルを構築した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:56:28 GMT)
A Spin Glass Characterization of Neural Networks [4.1] 本研究はスピングラスのレプリカ対称性破壊現象を動機としたニューラルネットワークの統計力学特性を示す。
所定のフィードフォワードニューラルネットワーク(FNN)からホップフィールド型スピングラスモデルを構築する
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:53:58 GMT)
Urbanite: A Dataflow-Based Framework for Human-AI Interactive Alignment in Urban Visual Analytics [4.1] 都市視覚分析は、現実世界の問題に対する洞察を導き出すのに欠かせないものとなっている。
多様なデータセットを管理し、複雑に蒸留し、様々な分析手法を統合する必要性は、参入の障壁を高くする。
都市視覚分析における人間とAIの協調のためのフレームワークであるUrbaniteを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:44:37 GMT)
Can Smaller Large Language Models Evaluate Research Quality? [4.0] この記事では、ダウンロード可能な LLM (60Gb) である Google の Gemma-3-27b-it を評価する。
104,187件の論文の結果から, Gemma-3-27b-itスコアは, UK Research Excellence Framework 2021の34単位(広視野)すべてに対して, 専門的な研究品質スコアプロキシと正の相関を示した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:18:40 GMT)
AURA: A Fine-Grained Benchmark and Decomposed Metric for Audio-Visual Reasoning [3.9] AURAは、Audio-Visual Large Language Models (AV-LLMs) とOmni-Modal Language Models (OLMs) のクロスモーダル推論能力を評価するためのベンチマークである。
AURAには、因果性、音色とピッチ、テンポとAV同期、未解決性、暗黙の気遣い、スキルプロファイリングといった6つの困難な認知領域に関する質問が含まれている。
本稿では,理性評価のための頑健なツールの欠如に対処する新しい計量AuraScoreを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 20:06:42 GMT)
Optimal Quantum Estimation with Stabilizer-Based Local Measurements [3.9] 局所測定を用いて量子クラム・ラオ境界(QCRB)を飽和させるための気象スキームの十分な基準を示す。
グラフ状態の族は、準最適精度のスケーリングを達成するプローブ状態として識別される。
プローブ状態のいくつかの部分空間を構築し、QCRBを局所的な測定で飽和させるだけでなく、ほぼ不変な精度のスケーリングも維持する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:51:07 GMT)
Graph Neural Network for Product Recommendation on the Amazon Co-purchase Graph [3.9] グラフニューラルネットワーク(GNN)は、グラフベースの学習を通じて構造的および意味的関係を活用することにより、大きな可能性を証明している。
本研究では,Amazon Product Co-purchase Network上での4つのGNNアーキテクチャ(LightGCN, GraphSAGE, GAT, PinSAGE)の能力を評価する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:12:04 GMT)
FancyVideo: Towards Dynamic and Consistent Video Generation via Cross-frame Textual Guidance [3.7] 我々は、既存のテキスト制御機構を改善する革新的なビデオジェネレータであるFancyVideoを紹介した。
CTGMは、TII(Temporal Information)とTAR(Temporal Affinity Refiner)をクロスアテンションの開始と終了に組み込んでいる。
提案手法は,EvalCrafterベンチマークを用いて,最先端のT2V生成結果を実現する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:29:44 GMT)
When Trackers Date Fish: A Benchmark and Framework for Underwater Multiple Fish Tracking [3.5] MFT25(Multiple Fish Tracking dataset 2025)は、水中の魚追跡用に設計された総合的なデータセットである。
我々のデータセットは、様々な水中環境、魚類種、そして閉塞、類似した外観、不規則な動きパターンを含む挑戦的な条件を捉えています。
魚の非線形水泳パターンに最適化されたUKF(Unscented Kalman Filter)を特徴とする特化追跡フレームワークであるSU-T(Scale-Aware and Unscented Tracker)を紹介する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:10:34 GMT)
Pref-GUIDE: Continual Policy Learning from Real-Time Human Feedback via Preference-Based Learning [3.5] リアルタイムスカラーフィードバックを優先データに変換するフレームワークであるPref-GUIDEを提案する。
Pref-GUIDE 個人は、短いウィンドウ内でのエージェントの挙動を比較することで時間的不整合を緩和する。
Pref-GUIDE Votingは、ユーザの集団間で報酬モデルを集約し、コンセンサス優先を形成することにより、ロバスト性を高める。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:18:44 GMT)
StreetWeave: A Declarative Grammar for Street-Overlaid Visualization of Multivariate Data [3.5] 都市計画家、気候研究者、健康専門家にとって重要な道路と歩行者のネットワークの可視化。
これらの視覚化を作成するための確立した設計フレームワークはありません。
多変量空間ネットワークデータのカスタム視覚化を設計するための宣言文法であるStreetWeaveを紹介する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:59:20 GMT)
Strategies of Code-switching in Human-Machine Dialogs [3.4] ほとんどの人は多言語で、ほとんどの人は多言語コードスウィッチです。
我々は,コードスイッチによるスペイン語と英語を用いたマップタスクを人間の参加者で完了できるボットを開発した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:41:46 GMT)
Schema Lineage Extraction at Scale: Multilingual Pipelines, Composite Evaluation, and Language-Model Benchmarks [3.4] セマンティックドリフト(Semantic drift)は、データとガバナンスを妥協し、テキストからRAGまでのサービスの有用性を損なう。
本稿では,多言語エンタープライズパイプラインスクリプトから細粒度スキーマを自動抽出するフレームワークを提案する。
結果:単一推論トレースを使用した32Bオープンソースモデルは、標準プロンプトの下でGPTシリーズに匹敵するパフォーマンスを達成することができる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 05:04:32 GMT)
Advancing AI-Powered Medical Image Synthesis: Insights from MedVQA-GI Challenge Using CLIP, Fine-Tuned Stable Diffusion, and Dream-Booth + LoRA [3.3] MEDVQA-GIチャレンジは、医療診断におけるAI駆動のテキスト・ツー・イメージ生成モデルの統合に対処する。
本研究では、テキスト記述から動的でスケーラブルで正確な画像を生成するための微調整生成モデルに基づく新しいアプローチを提案する。
我々のシステムは、安定拡散モデルとドリームブースモデルと、ローランド適応(LORA)を統合し、高忠実度医療画像を生成する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:07:55 GMT)
Towards Real-World Rumor Detection: Anomaly Detection Framework with Graph Supervised Contrastive Learning [3.3] WeiboとTwitterの2つの大規模会話データセットを構築した。
噂と非噂の分布には明らかな違いがある。
本稿では,異常検出フレームワークであるGraph Supervised Contrastive Learningを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:59:33 GMT)
Propagation Tree Is Not Deep: Adaptive Graph Contrastive Learning Approach for Rumor Detection [3.3] 既存のグラフベースのほとんどのモデルでは、RPT (presume rumor propagation tree) は深い構造を持ち、枝に沿ったシーケンシャルな特徴を学習している。
RPTは広い構造を示し、ほとんどのノードは浅い1レベルの応答である。
本稿では,ノード中心性によって誘導される適応的なビュー拡張を用いたRAGCL(Rumor Adaptive Graph Contrastive Learning)手法を提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:53:30 GMT)
PersianMedQA: Evaluating Large Language Models on a Persian-English Bilingual Medical Question Answering Benchmark [3.3] 大規模言語モデル(LLM)は、広範囲の自然言語処理(NLP)ベンチマークにおいて、顕著なパフォーマンスを実現している。
イランの14年間の医学試験から得られた,20,785名の専門資格を持つペルシア人医療質問の大規模データセットであるペルシャMedQAを紹介した。
我々は、ゼロショットとチェーンオブ思考の設定で、汎用、ペルシャ細調整、医療用LLMを含む40の最先端モデルをベンチマークする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:37:47 GMT)
ScaffoldGPT: A Scaffold-based GPT Model for Drug Optimization [3.2] 分子足場に基づく薬物最適化のためのGPT(Generative Pretrained Transformer)であるScaffoldGPTを紹介する。
3段階の薬物最適化アプローチは、事前訓練、微調整、復号最適化を統合している。
我々は、ScaffoldGPTが薬物最適化ベンチマークにおいて競合するベースラインを上回っている新型コロナウイルスとがんのベンチマークに関する総合的な評価を通じて、実証を行う。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:08:35 GMT)
Confidence-Based Annotation Of Brain Tumours In Ultrasound [3.2] 超音波検査における脳腫瘍の個別分節診断の課題の検討
この辺縁関係の不確実性を組み込んだセグメンテーションプロトコルと手法を提案する。
スパース信頼度に基づくアノテーションの提案と評価を行った。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:22:54 GMT)
Highly Fast Text Segmentation With Pairwise Markov Chains [3.2] 本稿では,NLPセグメンテーションタスクにおけるマルコフ連鎖モデル,Hidden Markov Chain (HMC) とPairwise Markov Chain (PMC) について検討する。
テキストセグメンテーションの特定の課題にこれらのモデルを適応させる独自の手法を開発し、非常に短いトレーニングと実行時間で関連するパフォーマンスを得る。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:58:28 GMT)
A Research Agenda for Usability and Generalisation in Reinforcement Learning [3.1] ユーザフレンドリーな記述言語を問題記述に活用することを中心に研究課題を提唱する。
本稿では,問題記述のためのユーザフレンドリな記述言語の利用を中心に研究課題を提起する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 19:30:14 GMT)
ObfusQAte: A Proposed Framework to Evaluate LLM Robustness on Obfuscated Factual Question Answering [3.1] 大規模言語モデル(LLM)は、現実的な質問応答が可能なAIシステムの開発に寄与している。
難解な質問が提示されたとき、LSMの堅牢性をテストする既知の研究はない。
本稿では,多層難読化レベルのフレームワークであるObfusQAを紹介し,LLMの能力について検討する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:27:52 GMT)
HaDM-ST: Histology-Assisted Differential Modeling for Spatial Transcriptomics Generation [3.1] 本稿では,H&E画像と低分解能STを条件とした高分解能ST生成フレームワークであるHaDM-STを提案する。
様々な組織や種にまたがる200の遺伝子に対する実験では、HDM-STは従来法よりも一貫して優れており、高分解能ST予測における空間的忠実度と遺伝子レベルのコヒーレンスを高めている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:09:06 GMT)
Structured Superposition of Autoencoders for UEP Codes at Intermediate Blocklengths [2.9] オートエンコーダ(AE)ベースのコード設計は、学習された平等エラー保護(EEP)コーディングスキームの文脈で有望であることが示されている。
我々は,AEベースのUPEコードを,効率的なトレーニングを維持しつつ,より大きなブロック長に拡張する構造化AEベースのアーキテクチャを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:09:30 GMT)
How Chinese are Chinese Language Models? The Puzzling Lack of Language Policy in China's LLMs [2.9] 18言語で中国語企業によって事前訓練された6つのオープンソース多言語LPMを評価した。
実験の結果,中国における多言語でのLLMのパフォーマンスは国際LLMと区別できないことがわかった。
われわれは、中国のLLM開発において、言語多様性のいずれに対しても、一貫した政策の兆候は見つからない。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:44:08 GMT)
Understanding NFTs from EIP Standards [2.6] 非偽造トークン(NFT)の技術的基盤は、いまだに不十分なままである、と我々は主張する。
改良提案レンズ(EIP)によるNFTの最初の研究について述べる。
191 NFT関連EIPと10K+Magiciansに関する大規模な実証分析を行った。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 05:46:11 GMT)
Learning Time-Varying Multi-Region Brain Communications via Scalable Markovian Gaussian Processes [2.6] 我々はマルコフ的ガウス過程を用いて時間変化の時間的遅延で脳のコミュニケーションを学習する新しい枠組みを提案する。
この研究は、分散ニューラルネットワークの理解を深め、動的脳ネットワークを解析するためのスケーラブルなツールを提供する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:05:38 GMT)
Energy-Aware Code Generation with LLMs: Benchmarking Small vs. Large Language Models for Sustainable AI Programming [2.6] 我々は,大規模言語モデル (LLM) に対するコード生成を明示的に訓練したオープンソースのSmall Language Models (SLM) と,効率的な人書きPythonコードの評価を行った。
我々はLeetCodeから150のコーディング問題を評価し、難易度、中性度、難易度という3つの難易度に均等に分散した。
LLMは全ての難易度で最高精度を達成するが、SLMは出力が正しければエネルギー効率が良くなる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:44:06 GMT)
Coupled Entropy: A Goldilocks Generalization for Complex Systems [2.2] Tsallisエントロピーは、textitq独立で同じ分散ランダム変数が同じ状態を共有するパワー確率$p_iq$を考えることから生まれた。
残念ながら、$q$-exponentialパラメータは、形とスケールの有効な代用として扱われた。
この欠陥は一般化温度の誤解釈と一般化エントロピーの不正確な導出を引き起こす。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:33:30 GMT)
DySK-Attn: A Framework for Efficient, Real-Time Knowledge Updating in Large Language Models via Dynamic Sparse Knowledge Attention [2.2] 大きな言語モデル(LLM)は、その知識が静的で、すぐに時代遅れになるという限界に悩まされる。
我々は,LLMが動的外部ソースからリアルタイム知識を効率的に統合できる新しいフレームワークであるDySK-Attnを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 05:22:38 GMT)
Multimodal Fact Checking with Unified Visual, Textual, and Contextual Representations [2.1] 我々は"MultiCheck"と呼ばれる微細なマルチモーダル事実検証のための統一的なフレームワークを提案する。
我々のアーキテクチャは、テキストと画像のための専用エンコーダと、要素間相互作用を用いた相互関係をキャプチャする融合モジュールを組み合わせる。
我々はFactify 2データセットに対する我々のアプローチを評価し、F1の重み付けスコア0.84を達成し、ベースラインを大幅に上回った。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:50:44 GMT)
From Knowledge to Conjectures: A Modal Framework for Reasoning about Hypotheses [2.1] 本稿では,主観的推論の形式化を目的とした認知モーダル論理の新たなファミリを紹介する。
導出論理は Axiom C と呼ばれる原理に依存しており、すべての確立された事実が仮説的な層にまたがって保存されることを保証する。
また、予想から受理事実への遷移を形式化する動的演算 $mathsfsettle(varphi)$ も導入する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:37:49 GMT)
Optimal differentially private kernel learning with random projection [2.0] ガウス過程を用いた再生カーネルヒルベルト空間におけるランダムプロジェクションに基づく新しい微分プライベートカーネルERMアルゴリズムを提案する。
本手法は,2乗損失とリプシッツ・スムース凸損失関数の双方に対して,極小最大超過リスクを実現する。
代替次元低減技術に基づく既存手法は、最適以下の性能を得る。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:51:47 GMT)
FLUID: Flow-Latent Unified Integration via Token Distillation for Expert Specialization in Multimodal Learning [1.9] token Distillation for Expert Components を用いた textscFLUID-Flow-Latent Unified Integration を提案する。
textscFLUID は,(1) emphQ-transforms, 学習可能なクエリトークン, (2) コントラストアライメントによる相互整合を強制する2段階の融合スキーム, (3) 予測時の軽量でロードバランスのMixture-of-Experts の3要素に寄与する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:34:17 GMT)
Reversible Video Steganography Using Quick Response Codes and Modified ElGamal Cryptosystem [1.9] DWTとQRコードに基づく可逆的ビデオステガノグラフィーの新しい解法を提案する。
これらのアプローチの視覚的受容性、堅牢性、および埋め込み能力は、すべて対処しなければならない課題である。
視覚障害の他に,提案手法はPSNR平均52.143dB,埋め込み容量1bppの現行手法を超越している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:56:10 GMT)
VA-Blueprint: Uncovering Building Blocks for Visual Analytics System Design [1.9] 本稿では,都市視覚分析システムの構築ブロックを体系的にレビューし分類する手法であるVA-Blueprintを提案する。
この方法論を20のシステムの初期セットに適用し、コアコンポーネントをマルチレベル構造に識別し、整理する。
我々の貢献はVAシステムの構成をより深く理解し、より構造化され再現可能で効率的なシステム開発を支援するための実践的な基盤を確立します。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 22:03:11 GMT)
FunGraph: Functionality Aware 3D Scene Graphs for Language-Prompted Scene Interaction [1.8] 本研究の目的は,ロボットが環境と直接対話できる表現を開発することである。
我々は、より細かな解像度でオブジェクトを検出し、保存することに集中し、価格関連部品に焦点をあてる。
現在利用可能な3Dリソースを活用して、2Dデータを生成し、検出器をトレーニングし、標準の3Dシーングラフ生成パイプラインを拡張するために使用します。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:16:03 GMT)
Extracting Overlapping Microservices from Monolithic Code via Deep Semantic Embeddings and Graph Neural Network-Based Soft Clustering [1.7] Mo2oMは、マイクロサービス抽出をソフトクラスタリング問題として定式化するフレームワークである。
Mo2oMは、構造モジュラリティ(結合と結合のバランス)の最大40.97%、サービス間コールの58%(通信オーバーヘッド)、インターフェイス番号の26.16%の改善を実現している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:07:20 GMT)
RORPCap: Retrieval-based Objects and Relations Prompt for Image Captioning [1.6] 画像キャプションのための検索型オブジェクトとリレーショナルプロンプト(RORPCap)を提案する。
RORPCapはオブジェクトとリレーション抽出モデルを使用して、画像からオブジェクトとリレーションワードを抽出する。
結果として生じる即時埋め込みと視覚テキスト埋め込みは、文字に富んだ特徴埋め込みであり、キャプション生成のためにGPT-2モデルに供給される。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:27:27 GMT)
Steering AI-Driven Personalization of Scientific Text for General Audiences [1.6] TranSliderはAIを利用したツールで、個々のユーザープロファイルに基づいて、科学テキストのパーソナライズされた翻訳を生成する。
我々のツールはインタラクティブなスライダを備えており、ユーザーはパーソナライゼーションの度合いを0から100まで(弱弱弱)に設定できる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:07:22 GMT)
From Time-series Generation, Model Selection to Transfer Learning: A Comparative Review of Pixel-wise Approaches for Large-scale Crop Mapping [1.6] 本研究は,大規模・画素単位の作物マッピングの総合的なレビューを初めて行ったものである。
我々は,広範に採用されている6つの衛星画像に基づく前処理手法と,11個の教師付き画素単位の分類モデルの比較実験を行った。
ドメインシフトの異なる大きさの最適転送学習手法を同定した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 03:45:28 GMT)
Lightning Prediction under Uncertainty: DeepLight with Hazy Loss [1.5] 我々は,雷発生を予測するための新しいディープラーニングアーキテクチャであるDeepLightを紹介する。
我々は,DeepLightが最先端手法よりもEquitable Threat Score(ETS)を18%-30%改善したことを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:59:03 GMT)
KLASSify to Verify: Audio-Visual Deepfake Detection Using SSL-based Audio and Handcrafted Visual Features [1.5] AV-Deepfake1M 2025チャレンジに対するマルチモーダルアプローチを提案する。
視覚的モダリティには手作りの機能を活用して解釈性と適応性を向上させる。
音声のモダリティには、グラフアテンションネットワークと組み合わせた自己教師付き学習バックボーンを適用し、リッチな音声表現をキャプチャする。
当社のアプローチでは、レジリエンスと潜在的な解釈可能性に重点を置いて、パフォーマンスと実世界のデプロイメントのバランスを取ります。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:29:08 GMT)
VFM-UDA++: Improving Network Architectures and Data Strategies for Unsupervised Domain Adaptive Semantic Segmentation [1.4] Unsupervised Domain Adaptation (UDA)は、ラベル付きソースドメインからラベルなしターゲットドメインへの強力な一般化を可能にする。
本稿では,VFM-UDA++を提案する。VFM-UDA++は,マルチスケール機能の役割を解明し,VTベースのVFMと互換性のある特徴距離損失に適応し,UDAが合成ソースや実際のターゲットデータの増加によるメリットを評価する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:29:00 GMT)
DragonFruitQualityNet: A Lightweight Convolutional Neural Network for Real-Time Dragon Fruit Quality Inspection on Mobile Devices [1.2] 本研究では,DragonFruitQualityNetを提案する。DragonFruitQualityNetは,モバイルデバイス上でのドラゴン果実のリアルタイム品質評価に最適化された軽量畳み込みニューラルネットワーク(CNN)である。
我々は13,789枚の画像の多種多様なデータセットをキュレートし、自己収集したサンプルを公開データセット(メンデレーデータからのデータ)と統合し、それらを4つのカテゴリ(新鮮、未熟、未熟、未熟、欠陥)に分類した。
提案モデルでは93.98%の精度を達成し,果実品質分類における既存手法よりも優れていた。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:41:23 GMT)
LLM-based Agents for Automated Confounder Discovery and Subgroup Analysis in Causal Inference [1.2] 本稿では,共同創設者の自動発見とサブグループ分析のための大規模言語モデルに基づくエージェントを提案する。
本フレームワークは,サブグループ識別と構造発見を体系的に行う。
以上の結果から,LSMをベースとしたエージェントは,スケーラブルで信頼性が高く,セマンティックに認識された因果推論へ有望な道をたどることが示唆された。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:45:49 GMT)
Decomposing Global AUC into Cluster-Level Contributions for Localized Model Diagnostics [1.1] Area Under the ROC Curve (AUC) はバイナリ分類器のパフォーマンス指標として広く使われている。
信用承認や不正検出といった高度なアプリケーションでは、これらの弱点は金融リスクや運用上の失敗につながる可能性がある。
本稿では,グローバルAUCをクラスタ内およびクラスタ間コンポーネントに形式的に分解する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:58:47 GMT)
aLLoyM: A large language model for alloy phase diagram prediction [1.0] 本稿では,合金組成,温度,およびそれに対応する位相情報に特化して訓練された,微調整大言語モデル (LLM) であるaLLoyMを紹介する。
我々は、オープンソースの事前学習型LLMであるMistralを、複数選択と短問合せの2つの異なるQ&Aフォーマット向けに微調整した。
ベンチマーク評価は、微調整が多点相図問題の性能を大幅に向上させることを示した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:46:28 GMT)
Fractured Glass, Failing Cameras: Simulating Physics-Based Adversarial Samples for Autonomous Driving Systems [1.0] ガラス破砕の物理過程を用いてシミュレーションに基づく研究を行い、摂動シナリオを作成する。
これらのガラスの破断効果を,広く使用されているオープンソースデータセット上の画像フィルタとして重畳する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 23:33:57 GMT)
BIGBOY1.2: Generating Realistic Synthetic Data for Disease Outbreak Modelling and Analytics [1.0] 我々はBIGBOY1.2を開発した。BIGBOY1.2は、パンデミック時系列と人口レベルの軌跡を生成するオープンな合成データセットジェネレータである。
このフレームワークは、SEIRおよびSIRライクなコンパートメンタルロジック、カスタム季節性、ノイズインジェクションをサポートし、実際のレポートアーティファクトを模倣する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:34:05 GMT)
Civil Servants as Builders: Enabling Non-IT Staff to Develop Secure Python and R Tools [1.0] 技術的に熟練した公務員が、正式なIT職外で働くという、成長中の中核に対処する奨学金は、ほとんどない。
本稿では、そのような公務員が小規模でドメイン固有のアプリケーションを開発、ピアレビュー、デプロイできる、制限対応、オープンソース、レプリケート可能なプラットフォームを紹介します。
ロー/ノーコードアプローチとは異なり、シビル・サーヴァントのプログラミングスキルを保ち、強化し、プライベート・セクターの仲間と技術的に競争力を保つ。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:56:22 GMT)
SCReedSolo: A Secure and Robust LSB Image Steganography Framework with Randomized Symmetric Encryption and Reed-Solomon Coding [0.9] 我々は、画像内の任意のバイナリデータを隠蔽する新しいフレームワークである$rm SCRsmall EEDSsmall OLO$を紹介した。
本稿では,RGB画像に対して1ピクセルあたり3ビットのデータペイロードを実現し,伝送成功確率を数学的に評価する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:21:20 GMT)
Multihead self-attention in cortico-thalamic circuits [0.8] 本稿では,マルチヘッド自己アテンションに類似した計算を実現するために,皮質視床回路の構造が適していることを示す。
この計算の構造は、視床から大脳皮質へのコアおよびマトリックス突起の微細な構造と一致している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 20:48:42 GMT)
PHIP Sequences and Dipolar Fields [0.8] パラ水素誘導偏極(PHIP)は、パラ水素の単一位を標的分子に移動させることで、核スピンの効率的な過分極を実現する。
しかし、現実的な条件下では、B0/B1の不均一性は偏光伝達効率を著しく低下させる。
高濃度試料では、試料の磁化から生じる双極子場は、偏光伝達効率を著しく低下させることができる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:10:02 GMT)
Accurate Gauge-Invariant Tensor Network Simulations for Abelian Lattice Gauge Theory in (2+1)D: ground state and real-time dynamics [0.8] 本研究では,(2+1)Dにおけるアベリア格子ゲージ理論(LGT)の高精度かつ効率的なシミュレーションを実現するための新しいネットワーク手法を提案する。
最初の鍵はゲージ不変テンソルネットワーク状態のゲージ標準形式(GCF)を同定することであり、これは既に (1+1)D LGTの既存のアルゴリズムを単純化している。
これはまた、ゲージ理論を超えて影響が広がるかもしれないPEPSのリアルタイム力学をシミュレーションするためにVMCを使用した最初の例である。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:19:56 GMT)
Perceptual Evaluation of GANs and Diffusion Models for Generating X-rays [0.8] 生成画像モデルは、自然画像と医療画像の両方において顕著な進歩を遂げている。
4つの異常を条件に胸部X線を合成するための最先端生成モデル-GAN(Generative Adversarial Networks)と拡散モデル(Diffusion Models)の有効性を評価する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:32:18 GMT)
Coherent States in Classical Field Theory [0.7] 我々は、コヒーレント状態の古典的類似の出現とその一般化を、純粋に古典的場の理論的な設定で示す。
我々のアプローチは、量子構造と完全に平行に、基礎となる場の理論のポアソンブラケットと対称性を利用する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:54:16 GMT)
Quanutm-State Texture as a Resource: Measures and Nonclassical Interdependencies [0.7] 本稿では,2つの新しい量子状態テクスチャ測度を提案し,凸屋根法を用いて量子状態テクスチャ測度を構築するための関数形式を提案する。
我々は、量子状態テクスチャと、コヒーレンス、想像、予測可能性といった、他の高度に評価された量子資源との関係を確立する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 20:50:11 GMT)
Universally Robust Control of Open Quantum Systems [0.6] ノイズによって引き起こされるデコヒーレンスを緩和することは、オープン量子システムの制御における中心的な課題である。
本稿では,環境騒音の事前評価を行なわずに高忠実度動作を実現する,ノイズ非依存の量子制御のための普遍的なフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 15:09:38 GMT)
Shaping a Profession, Building a Community: A Practitioner-Led Investigation of Public Interest Technologists in Civil Society [0.5] 公益技術(PIT)は、市民社会や非営利団体で働く技術実践者の間で人気が高まっている。
本稿では,北米と西欧における市民社会,公民権,および擁護団体の特定の文脈における技術者を特徴づける混成方法論の研究について述べる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:15:30 GMT)
Prompt Tuning for Few-Shot Continual Learning Named Entity Recognition [0.5] Few-Shot CLNER(FS-CLNER)タスクでは、新しいクラスのエンティティの不足により、トレーニングされたモデルが一般化することが難しくなる。
本稿では,これらの課題に対して,プロンプトチューニングパラダイムとメモリ実証テンプレート戦略を用いて対処する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:02:53 GMT)
Presburger Functional Synthesis: Complexity and Tractable Normal Forms [0.4] プレスバーグ関数合成 (PFnS) は EXPTIME で解くことができ, 指数的下界が一致することを示す。
次に、PSyNFと呼ばれる特殊正規形式を、PFnSのポリ時間およびポリサイズ可溶性を保証する仕様式として同定する。
我々はPSyNFのいくつかの特性を証明し、PSyNFにポリ時間でPSyNFのポリ時間可溶性を保証する他の形式をPSyNFにコンパイルできる条件について述べる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 07:00:34 GMT)
Fairness of Automatic Speech Recognition: Looking Through a Philosophical Lens [0.4] 特定の言語品種の体系的誤認識は、技術的な制限以上のものであると論じる。
我々は、ASRバイアスと他のアルゴリズム的公正度とを区別する音声技術の3つのユニークな倫理的次元を同定する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:26:47 GMT)
Efficient Reward Identification In Max Entropy Reinforcement Learning with Sparsity and Rank Priors [0.4] 本稿では,最大エントロピー強化学習問題から得られる最適方針や実演から,時変報酬関数を復元する問題を考察する。
この問題は、基礎となる報酬について追加の仮定なしで非常に不適切である。
どちらの場合も、これらの観測は効率的な最適化に基づく報酬同定アルゴリズムに繋がる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:01:48 GMT)
Bargmann invariants of Gaussian states [0.3] 任意の$m$モードのボソニックガウス状態$rho _j_j=1n$に対して、バーグマン不変量 tr($rho _1rho _2...rho _n$) の式を提供する。
また、この式を使ってボソニックガウス状態に対するバーグマン不変量の許容値を探る。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 03:05:53 GMT)
A Real-Time, Self-Tuning Moderator Framework for Adversarial Prompt Detection [0.2] 我々は、軽量なトレーニングフットプリントを維持しながら、敵攻撃を防御するリアルタイム自己チューニング(RTST)モデレータフレームワークを導入する。
われわれは、GoogleのGeminiモデルを使って、近代的で効果的なジェイルブレイクに対して、その効果を実証的に評価する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 01:59:07 GMT)
Reasoning Capabilities of Large Language Models on Dynamic Tasks [0.0] 大規模言語モデルは静的なベンチマークでは優れているが、動的環境における自己学習エージェントとしての能力は依然として不明である。
オープンソースモデルを用いた動的タスクにおける自己回帰、突然変異、計画という3つのプロンプト戦略を評価した。
より大きなモデルは一般的により小さなモデルよりも優れていますが、戦略的なプロンプトはこのパフォーマンスギャップを埋めることができます。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:28:40 GMT)
chebgreen: Learning and Interpolating Continuous Empirical Green's Functions from Data [0.0] メッシュに依存しない,データ駆動型ライブラリ chebgreen を1次元システムでモデル化する。
我々は、関連するが隠された境界値問題に対して、経験的グリーン関数を学習する。
適切なライブラリ内の左特異関数と右特異関数を補間することにより、グリーン関数を未知の制御パラメータ値で明らかにする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 20:41:30 GMT)
Zipping many-body quantum states: a scalable approach to diagonal entropy [0.0] ブルート・フォース・トモグラフィー手法に代わる,効率的かつスケーラブルな画像圧縮アルゴリズムとして,Lempel-Zivロスレス画像圧縮アルゴリズムについて検討する。
このアプローチは、一次元量子イジングモデルと、従来の対称性の破れを示す2次元状態の2つの例で検証する。
また, 対角エントロピー密度の特異部分を, 複製された作用に対する再正規化群を用いて解析した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:49:35 GMT)
Violation of Universal Operator Growth Hypothesis in $W_3$ Conformal Field Theories [0.0] 我々は、$W_3$対称性を持つ大きな中心電荷共形場理論が、Liouvillian が$W_3$ジェネレータを組み込むように修正された場合、予想される作用素成長境界の違反を示すことを示した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:12:47 GMT)
Unveiling the Potential of iMarkers: Invisible Fiducial Markers for Advanced Robotics [0.0] フィデューシャルマーカーは、ナビゲーション、オブジェクト認識、シーン理解を促進する様々なロボティクスタスクで広く使われている。
本稿では,特殊センサーを搭載したロボットでのみ検出可能な「iMarkers」のイノベーティブで邪魔にならないフィデューシャルマーカーを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:04:34 GMT)
Unsupervised operator learning approach for dissipative equations via Onsager principle [0.0] 我々は,散逸方程式を解くための新しい教師なしフレームワークであるDeep Onsager演算子学習法(DOOL)を提案する。
DOOL は O-defined Rayleigh 関数関数を最小化してディープネットワークを訓練し、ラベル付きデータを必要としない。
典型的な散逸方程式の数値実験により,DOOL法の有効性が検証され,教師付きDeepONetとMIONetとの系統的比較により性能が向上した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:44:49 GMT)
Tuning the band topology and topological Hall effect in skyrmion crystals via the spin-orbit coupling [0.0] 我々は、ラシュバスピン軌道結合(SOC)の強度を変化させることで、スカイミオン結晶中のバンドトポロジとトポロジカルホール伝導率(THC)を調整可能であることを示す。
我々の研究は、スカイミオン結晶における電荷輸送の制御のために、既存の経路を超える範囲を開放する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:50:55 GMT)
The simplest Kochen-Specker set [0.0] 我々は、他のどの例よりもはるかに対称で容易に証明できる新しいKS集合を提示する。
第134,010201号(2025年)では、最小のベース数14の新たなレコードを設定し、最小の入力数5〜9のクォート・クエトリット完全戦略の新たなレコードを設定する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:27:02 GMT)
The First Differentiable Transfer-Based Algorithm for Discrete MicroLED Repair [0.0] 本稿では,トランスファープラットフォームの離散シフトをモデル化する微分可能なトランスファーモジュールをベースとした,最初の修復アルゴリズムを提案する。
局所近接探索アルゴリズムと比較して,本手法はより優れた補修性能を実現し,より柔軟な客観設計を可能にする。
実験の結果、2000×2000アレイ上では転送ステップが50%減少し、2分以下の計画時間が短縮された。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:55:54 GMT)
The 2D+ Dynamic Articulatory Model DYNARTmo: Tongue-Palate Contact Area Estimation [0.0] このモデルは静的および動的(アニメーション化された)調音ディスプレイのための3つの同期ビュー(サジタル、グロタル、パラタル)をサポートする。
将来の作業には、顔(リップ)ビューの追加や、モデルリアリズムを定量的に評価するための調音-音響合成の実装が含まれる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:28:24 GMT)
Stability and performance guarantees for misspecified multivariate score-driven filters [0.0] 対数的仮定された観測密度の勾配を用いてパラメータ予測を更新するスコア駆動フィルタ(ISD, ESD)について検討した。
両方のフィルタタイプに対して、フィルタされたパラメータパスの指数的安定性を保証するための、新しい十分な条件を導出する。
ISDフィルタは精度と安定性の点でESDフィルタより優れていることを示すシミュレーション研究により理論的知見を検証した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:37:24 GMT)
Squeezed Coherent States in Supersymmetric Quantum Mechanics with Position-Dependent Mass [0.0] 超対称量子力学の枠組みの中で, 圧縮コヒーレント状態のクラスを構築し, 解析する。
結果として得られた状態は、スクイーズ、コヒーレンス、修正された不確実性関係など、古典的でない特徴を示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:13:15 GMT)
Spin textures in curved paths on a curved surface [0.0] 本研究では、曲がった経路に閉じ込められたスピン-1/2粒子の量子力学について検討する。
測地線曲率,正規曲率,測地線ねじりが創発的非アベリアゲージポテンシャルを支配していることを示す。
我々の理論は、ナノ構造チャネルを用いたスピン状態操作の枠組みを確立している。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 01:10:30 GMT)
SocRipple: A Two-Stage Framework for Cold-Start Video Recommendations [0.0] ソーシャルグラフベースのプラットフォーム上でのコールドスタートアイテム配信に適した,新たな2段階検索フレームワークであるSocRippleを提案する。
ステージ1は、クリエーターのソーシャルコネクションを活用して、ターゲットとする初期露光を狙う。ステージ2は、初期のエンゲージメント信号と、歴史的なインタラクションから学んだ安定したユーザ埋め込みに基づいて、K Nearest Neighbor (KNN)サーチを介して、外部に"リップ"する。
SocRippleは、コールドスタートアイテムのユーザエンゲージメント率を維持しながら、コールドスタートアイテムの配布を+36%向上させる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:37:36 GMT)
Scikit-fingerprints: easy and efficient computation of molecular fingerprints in Python [0.0] scikit-fingerprintsは、化学情報学の応用のための分子指紋の計算のためのPythonパッケージである。
当社のライブラリは業界標準のScikit-learnインターフェースを提供しており、直感的な使用と機械学習パイプラインとの統合が容易です。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:05:55 GMT)
SRAM-based Physically Unclonable Function using Lightweight Hamming-Code Fuzzy Extractor for Energy Harvesting Beat Sensors [0.0] 電池を交換することなく、ビートセンサーなどのIoTセンサノードを数百万個に展開することができる。
超低消費電力で費用効率のよいワイヤレスセンサノードで、メンテナンスコストがかからず、24時間/365日も使える。
データ暗号化と認証はビートセンサーアプリケーションを保護するために使用できるが、セキュアなキーを生成することは難しい。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 23:41:06 GMT)
SGD Convergence under Stepsize Shrinkage in Low-Precision Training [0.0] 勾配収縮モデルに基づく勾配勾配勾配の収束について検討する。
この縮小は、名目上のステップサイズを置き換えることと等価であることを示す。
理論的には、数値精度の低下がトレーニングを減速させるかを分析する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:25:48 GMT)
Robustness to Geographic Distribution Shift Using Location Encoders [0.0] 地理分布の変化は、トレーニングデータセットにおける地球上の位置の分布がテスト時に見られるものと異なるときに起こる。
本稿では,連続的な学習可能なドメイン割り当てをモデル化するための位置エンコーダを提案する。
非パラメトリックな正弦コサインエンコーダと事前訓練された位置エンコーダの両方が、地理的分布シフトに対するロバスト性を改善するための標準領域適応手法と併用可能であることを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:51:34 GMT)
Reduced density matrix and cumulant approximations of quantum linear response [0.0] 短期中間スケール量子コンピュータの現在の量子時代は、ノイズ、短いデコヒーレンス時間、遅い測定速度によって支配されている。
したがって、量子ワークロードを大幅に減らし、メソッドの品質にわずかに影響を及ぼす近似を見つけることは興味深い。
還元密度行列 (RDM) を直接近似するか, あるいはそれぞれの還元密度累積 (RDC) を通して間接的に近似することにより, 単数および倍数法 (qLRSD) を近似する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 11:11:02 GMT)
Real-Time Analysis of Unstructured Data with Machine Learning on Heterogeneous Architectures [0.0] この論文は、機械学習モデルをそのような環境に効率的にデプロイする方法を理解するのに役立ちます。
CERNにおけるLHCb実験において,荷電粒子軌道再構成のためのグラフニューラルネットワークを用いたパイプラインを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:45:10 GMT)
Quantum-Enhanced Generative Adversarial Networks: Comparative Analysis of Classical and Hybrid Quantum-Classical Generative Adversarial Networks [0.0] 高忠実度データサンプルを作成するための強力なパラダイムとして、GAN(Generative Adversarial Network)が登場した。
本研究では、パラメータ化量子回路を用いて実装された量子発生器が古典的判別器の潜在ベクトルを生成するハイブリッド量子古典型GAN(HQCGAN)について検討する。
我々は,Qiskit の AerSimulator を用いて,3,5,7量子ビットのHQCGAN 変種とともに古典的 GAN を評価する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:34:53 GMT)
PySeizure: A single machine learning classifier framework to detect seizures in diverse datasets [0.0] 我々は、様々な臨床データセット間で堅牢な発作検出を可能にする、革新的なオープンソースの機械学習フレームワークを導入する。
堅牢性を高めるため、このフレームワークは自動前処理パイプラインを組み込んで、データの標準化と過半数の投票機構を備えている。
データセット内のモデルをトレーニングし、チューニングし、評価し、データセット間の転送可能性を評価します。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:12:29 GMT)
ProteoKnight: Convolution-based phage virion protein classification and uncertainty analysis [0.0] 本稿では,既存の手法における空間制約に対処する画像ベース符号化手法であるProteoKnightを紹介する。
本研究はモンテカルロ・ドロップアウトによるバイナリPVP分類における予測の不確実性を評価する。
我々の実験は、最先端の手法に匹敵する二分法で90.8%の精度を達成した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:45:08 GMT)
Positive-divisibility of Subsystems in Quantum Dynamics [0.0] 連立量子状態が一元的に進化すれば,システムチャネルとその環境がP分割可能である必要があるが,P分割は不可能であることを示す。
特に、環境からの情報の逆流により、3ビットW状態の例に示すように、システムの量子性は増大する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 05:34:27 GMT)
Optimizing Districting Plans to Maximize Majority-Minority Districts via IPs and Local Search [0.0] 訴訟の再制限において、投票権法(英語版)の施行は、しばしば、現行の提案よりも多数派マイノリティ地区を多数示す地区計画を裁判所に提供することに関与している。
本稿では,複数データセット上の短いバーストを性能的に上回る整数型プログラミングを用いて,多数のマイノリティ領域を持つ州全体の計画を生成する階層列生成アルゴリズムを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 17:58:54 GMT)
Optimal bound on long-range distillable entanglement [0.0] 蒸留可能なエンタングルメントの上限を$D$次元で証明する。
回転不変な状態に対しては、境界は1/rD$に強化される。
皮肉なことに、共形場論における空間状態は飽和から遠く離れており、蒸留可能な絡み合いはどのものよりも早く崩壊する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 20:22:39 GMT)
Novel View Synthesis with Gaussian Splatting: Impact on Photogrammetry Model Accuracy and Resolution [0.0] 実世界のシーンから画像のデータセットを作成し、両方の方法で3Dモデルを構築しました。
構造類似度指数(SSIM)、ピーク信号対雑音比(PSNR)、学習画像パッチ類似度(LPIPS)、USAF解像度チャートに基づくlp/mm解像度を用いたモデルを比較した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 20:57:36 GMT)
Normative Moral Pluralism for AI: A Framework for Deliberation in Complex Moral Contexts [0.0] 本論文で提案される概念的枠組みは、熟考的道徳的推論システムの開発に焦点を当てている。
多様な倫理的視点から引き出された規範的議論を生成、フィルタリング、重み付けすることで、複雑な道徳的状況を処理するように設計されている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:52:23 GMT)
Nonparametric Reaction Coordinate Optimization with Histories: A Framework for Rare Event Dynamics [0.0] この研究は、トラジェクトリ履歴を組み込んだ非パラメトリックRC最適化フレームワークを導入している。
厳密な検証テストに合格し、高分解能自由エネルギープロファイルを生成する正確なコミッタ推定を提供する。
その結果, 希少事象の動態は, 徹底的なサンプリングを行なわずに正確に評価できることが示唆された。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 12:54:41 GMT)
Nonlinear Ringdowns as Sources and Detectors of Quantum Gravitational Waves [0.0] ブラックホールリングダウンの非線形効果は、非古典状態の重力波を発生させると主張する。
リングダウンの非線形性は、量子重力放射の強い結合検出器として使用できる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:51:53 GMT)
Nonequilibrium steady state in Lindblad dynamics for infinite quantum spin systems [0.0] 無限格子上の量子スピン系のリンドブラッド力学を考える。
非平衡定常状態 (NESS) と時間平均非平衡定常状態 (TANESS) を$C*$-代数的形式主義に基づいて定義する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:09:37 GMT)
N-BEATS-MOE: N-BEATS with a Mixture-of-Experts Layer for Heterogeneous Time Series Forecasting [0.0] マルチ層パーセプトロン(MLP)ブロックのスタック上に構築されたN-BEATSのような手法は、ベンチマークデータセットや競合に対して最先端の結果を得た。
N-BEATSは、トレンドや季節など、予測を異なる時系列コンポーネントに分解するため、他のディープラーニングアプローチと比較してより解釈可能である。
N-BEATS-MOEはゲーティングネットワークに基づく動的ブロック重み付け戦略を採用しており、各時系列の特徴により適応することができる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:25:11 GMT)
Multi-Dimensional Summarization Agents with Context-Aware Reasoning over Enterprise Tables [0.0] 本稿では,大規模言語モデル(LLM)に基づくエージェントを用いて,複数の次元にわたる構造化エンタープライズデータを要約する新しいフレームワークを提案する。
本手法では,スライシング,分散検出,コンテキスト構築,LLMに基づく生成を行うエージェントを用いて,多次元データの抽出,解析,要約を行うマルチエージェントパイプラインを提案する。
我々は、Kaggleデータセットのフレームワークを評価し、ベースラインテーブルの要約アプローチよりも忠実さ、妥当性、および洞察品質を大幅に改善したことを示す。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 05:27:42 GMT)
Leveraging LLMs for Formal Software Requirements -- Challenges and Prospects [0.0] VERIFAI1は、このギャップを埋めるための自動化および半自動化アプローチを調査することを目的としている。
本論文では, 課題の繰り返しと今後の研究方向性を明らかにするために, 関連文献の予備的な合成について述べる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 01:28:54 GMT)
Leveraging GNN to Enhance MEF Method in Predicting ENSO [0.0] アンサンブルの80人全員の類似性を直接モデル化するために,グラフ解析を用いたより良いフレームワークを提案する。
コミュニティ検出手法を用いて20名のメンバを最適化したサブセットを得る。
この方法は、ノイズ除去とアンサンブルコヒーレンスに重点を置くことにより予測スキルを向上させる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:16:58 GMT)
Ion Coulomb crystals: an exotic form of condensed matter [0.0] トラップ内でレーザー冷却したイオンによって形成されるウィグナー結晶は、伝統的な凝縮マター系である。
結晶構造はクーロン反発と外接電位との相互作用から生じる。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:49:37 GMT)
Investigating writing style as a contributor to gender gaps in science and technology [0.0] 文章のスタイルは性別によって大きく異なり、女性はより関連性のある特徴を用いている。
より関連性の高い論文や特許も女性によって引用される傾向にある。
以上の結果から, 科学的テキストは人格を欠くものではないことが示唆され, 評価のバイアスに寄与する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:05:04 GMT)
Inverted Oscillators for Testing Gravity-induced Quantum Entanglement [0.0] 我々はニュートン重力相互作用によって引き起こされる量子エンタングルメントを検証するための新しいセットアップを探索する。
反ばね効果を持つミラーの光浮上のセットアップを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 03:21:12 GMT)
Intersectoral Knowledge in AI and Urban Studies: A Framework for Transdisciplinary Research [0.0] 本稿では,AIおよび都市研究における学際的知識の妥当性の評価と強化のための6次元フレームワークを提案する。
具体的には、そのフレームワークは、オントロジ、オリエンテーション、方法論、実証学、公理学、およびバリゼーションの次元に基づいて研究を分類する。
理想主義、混合手法、文化的価値化など、あまり一般的でないスタンスも、知識生産を豊かにする可能性について検討されている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 23:35:09 GMT)
Information in quantum field theory simulators: Thin-film superfluid helium [0.0] 非相互作用量子場の実験シミュレータにおける相互情報の計測方法を提案する。
超流動ヘリウム薄膜によって提供される2 + 1) 次元時空のアナログを応用して提案する。
本研究では, ヘリウム試料の自然熱状態を取り入れた数値予測を行い, 相互情報の領域内スケーリングを実証する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 09:00:45 GMT)
Heisenberg-limited calibration of entangling gates with robust phase estimation [0.0] 頑健な位相推定により,複数ビットゲートにおけるコヒーレント誤差の高精度,ハイゼンベルク限定推定が可能となることを示す。
超伝導プロセッサ上での2ビット制御Zゲートの動作を改善することでキャリブレーションプロトコルを実験的に実証する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:35:29 GMT)
Health Care Waste Classification Using Deep Learning Aligned with Nepal's Bin Color Guidelines [0.0] 本研究では,ResNeXt-50,EfficientNet-B0,MobileNetV3-S,YOLOv8-n,YOLOv5-sの美術廃棄物分類モデルの現状をベンチマークする。
最高のパフォーマンスモデル(YOLOv5-s)は、ネパールのHCW管理標準を使用して、マップされたビンカラーでWebにデプロイされた。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:25:01 GMT)
Generative AI for Strategic Plan Development [0.0] 本稿では,大規模政府機関の戦略的計画策定にGA(Generative Artificial Intelligence)を活用するためのモジュールモデルを提案する。
これを達成するために、BERTopicとNMFモデルは、政府説明責任局(GAO)からの大量の報告を使用して訓練される。
その結果、これらの手法は、評価対象要素の100%に類似したテーマを生成することができることがわかった。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:07:07 GMT)
GPT-2 as a Compression Preprocessor: Improving Gzip for Structured Text Domains [0.0] GPT-2はドメイン固有のファイルを入力として取り込むが、gzipのようなパターンベースの圧縮機は作業が難しい。
前処理後、gzipはパイプラインの反対側で動作し、通常通りデータを圧縮する。
有望な結果と0.34パーセントの改善、HTMLファイルを5.8%改善しました。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 04:53:22 GMT)
GANime: Generating Anime and Manga Character Drawings from Sketches with Deep Learning [0.0] 本稿では,アニメキャラクタとスケッチ間の画像間変換の3つのモデルについて検討する。
C-GANは、人間によって作成された画像に近い高品質で高解像度の画像を生成することができる最も効果的なモデルである。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:20:19 GMT)
From Product Hilbert Spaces to the Generalized Koopman Operator and the Nonlinear Fundamental Lemma [0.0] 我々は、無限次元線型作用素、すなわち一般化されたクープマン作用素が存在することを証明した。
一般化されたクープマン作用素の有限次元近似を計算するスケーラブルなデータ駆動手法を提案する。
無限次元一般化クープマンモデルの双線型構造を利用して非線形基本補題を導出する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:57:16 GMT)
Fine-Tuning Large Language Models Using EEG Microstate Features for Mental Workload Assessment [0.0] 本研究では,脳波マイクロステートと大規模言語モデル(LLM)の交わりについて検討する。
この研究は、異なる認知状態、特に「Rest」と「Load」の予測を改善するためにLSMを微調整することを目的としている。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:43:09 GMT)
Exploration of Hepatitis B Virus Infection Dynamics through Physics-Informed Deep Learning Approach [0.0] 近年、ウイルス感染のダイナミクスを捉えるための有望なフレームワークとして物理情報ニューラルネットワーク(PINN)が登場している。
標準PINNは、フォワードモデリングによって疾患のダイナミクスをシミュレートするのに有効であるが、しばしば重要な生物学的パラメータを推定する際の課題に直面している。
DINNはパラメータ推定タスクに対して、より堅牢なアプローチを提供する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:28:19 GMT)
Event-Aware Sentiment Factors from LLM-Augmented Financial Tweets: A Transparent Framework for Interpretable Quant Trading [0.0] 本研究では,金融意味論とアルファ信号発見における大規模言語モデル(LLM)のユニークな有用性を示す。
LLMを使用して、マルチラベルイベントカテゴリを高感度のツイートに自動的に割り当てる。
実験の結果、特定のイベントラベルは負のアルファを連続的に生成し、シャープ比は-0.38、情報係数は0.05を超えることがわかった。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 16:09:14 GMT)
Enhancing Corrosion Resistance of Aluminum Alloys Through AI and ML Modeling [0.0] 本研究では, 耐食性予測と最適化のための機械学習アルゴリズムの適用について検討した。
データセットは、ユニットとフォーマットを標準化するために前処理された腐食率データと環境条件を含む。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 13:06:08 GMT)
EDGE: A Theoretical Framework for Misconception-Aware Adaptive Learning [0.0] EDGEは, 評価, 診断, 生成, 演習の4段階からなる, 誤解を考慮した適応学習フレームワークである。
We formalize a Composite Readiness metric, EdgeScore, prove its monotonicity and Lipschitz continuity, and der derived an index policy that is almost-optimal under mild assumptions on forgeting and learning gains。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:06:00 GMT)
Document Valuation in LLM Summaries: A Cluster Shapley Approach [0.0] 大規模言語モデル(LLM)は、複数のソースからコンテンツを検索して要約するシステムにおいて、ますます使われている。
本稿では,各文書の余剰貢献に基づいてクレジットを割り当てるゲーム理論のShapley値を提案する。
そこで我々は,文書間の意味的類似性を利用した効率的な近似アルゴリズムであるCluster Shapleyを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 06:04:48 GMT)
Ciphertext Malleability in Lattice-Based KEMs as a Countermeasure to Side Channel Analysis [0.0] 本稿では,Raviらによって公開されているいくつかのポスト量子暗号プリミティブの暗号文変換性に起因する脆弱性について論じる。
我々は,同じ暗号文の可読性を利用した新しい対策を提案し,その実用性をいくつかのPQCプリミティブに適用することについて議論する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 08:39:45 GMT)
Block encoding the 3D heterogeneous Poisson equation with application to fracture flow [0.0] 量子線形系(QLS)アルゴリズムは、古典的手法よりも指数関数的に高速に大規模線形系を解くことができる。
離散化3次元不均一ポアソン方程式の解法としてQLSアルゴリズムの適用可能性について検討する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:17:09 GMT)
Assessing and Mitigating Data Memorization Risks in Fine-Tuned Large Language Models [0.0] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにまたがる顕著な機能を示している。
トレーニングデータを記憶する傾向は、特に微調整プロセスにおいて、重大なプライバシーリスクを引き起こす。
本稿では、微調整LDMにおけるデータの包括的分析を行い、新しい多層プライバシー保護フレームワークを提案する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 10:26:55 GMT)
An Empirical Inquiry into Surveillance Capitalism: Web Tracking [0.0] 本稿では,Web追跡データのパターンと傾向を分析し,Surveillance Capitalismの抽出メカニズムの実証的証拠を確立する。
われわれの発見によると、GoogleのWeb上の全面的な位置、監視分野の企業間の3層構造、そして検出を回避するための追跡技術の進化を示す証拠が明らかになった。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 18:46:43 GMT)
Active Learning of Model Discrepancy with Bayesian Experimental Design [0.0] 逐次実験設計(BED)から得られたデータに基づいてモデル差分を効率的に学習する手法を提案する。
提案手法は, 逐次BEDによって提案されるデータを用いて, 高次元モデル差分率の能動的学習に対して, 効率的かつ堅牢であることを示す。
また,提案手法は古典的数値解法と近代自己微分可能解法の両方と互換性があることを実証した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 02:11:17 GMT)
A Stable and Principled Loss Function for Direct Language Model Alignment [0.0] 本稿では,RLHF最適条件から直接導出した新しい損失関数を提案する。
提案した損失は,その差ではなく,基礎となる報酬によって規定される,ロジットの特定の有限値を対象としている。
この固有の安定性は、報酬のハッキングを防ぎ、より効果的なアライメントをもたらす。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 01:56:58 GMT)
A Multi-Agent Approach to Neurological Clinical Reasoning [0.0] 大規模言語モデル(LLM)は医学領域において有望であるが、専門的な神経学的推論を扱う能力は体系的な評価を必要とする。
我々は,イスラエルの神経学の認定試験から305の質問を用いたベンチマークを開発した。
ベースモデル,検索拡張生成(RAG),新しいマルチエージェントシステムを用いて10個のLLMを評価した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 14:52:27 GMT)
A Method for Constructing Quasi-Random Peaked Quantum Circuits [0.0] 準ランダムな「ピーク」量子回路を構築するアルゴリズムを提案する。
このアルゴリズムは最終ピーク状態の確率を正確に制御する。
このアルゴリズムの修正版は、二重または多重ピーク量子回路の構築を可能にする。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:27:16 GMT)
A Graph Neural Network based on a Functional Topology Model: Unveiling the Dynamic Mechanisms of Non-Suicidal Self-Injury in Single-Channel EEG [0.0] 本研究は,非自殺性自己損傷(NSSI)の神経力学的メカニズムを明らかにするために,新しいFunctional-Energetic Topology Modelを提案する。
脳波データの収集にはスマートフォンアプリと携帯型Fp1脳波ヘッドバンドを用いたNSSIを用いた。
7つの機能ノードを持つ理論駆動型GNNが構築され、イントラオブジェクト(80/20分割)とLeft-one-subject-out Cross-validation(LOSOCV)によって性能評価された。
モデルによる物体内精度の向上
論文参考訳(メタデータ) (Sun, 10 Aug 2025 03:30:09 GMT)
A Globally Optimal Analytic Solution for Semi-Nonnegative Matrix Factorization with Nonnegative or Mixed Inputs [0.0] 我々はSemi-Non negative Factorization (semi-NMF)と呼ばれる新しいタイプの行列分解を開発する。
本手法が再構成誤差のグローバルな分解を実現することを実証する。
提案手法は, 理論的, 実証的両方の利点を提供する。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 01:15:29 GMT)
"Draw me a curator" Examining the visual stereotyping of a cultural services profession by generative AI [0.0] 本稿では,230のヴィジュアライゼーションに基づいて,一般的な生成人工知能(AI)モデルであるChatGPT4oによる博物館キュレーターの描写について検討する。
AIが生成した表現は、キュレーターの一般的なステレオタイプを、オタクで、ドレスに保守的で、コレクションを振り回す時間に悩まされていると繰り返してはいないが、現実の人口統計学とは対照的である。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 00:43:43 GMT)
$\ell_0$-Regularized Quadratic Surface Support Vector Machines [0.0] カーネルフリーの二次曲面支持ベクトルマシンは、カーネル関数に依存することなく非線形決定境界をモデル化する柔軟性により、近年注目を集めている。
本稿では,モデルパラメータに濃度制約を課すことにより,QSVMのスパース変種を提案する。
我々は,いくつかの実世界のデータセットに対するアプローチを検証し,高い分類性能を維持しながらオーバーフィッティングを低減できることを実証した。
論文参考訳(メタデータ) (Sun, 10 Aug 2025 21:41:44 GMT)