Nemotron-H: A Family of Accurate and Efficient Hybrid Mamba-Transformer Models [164.5] ネモトロン-Hは8Bと56B/47Bハイブリッド・マンバ・トランスフォーマーのファミリーである。
私たちは共通のTransformerモデルアーキテクチャにおけるほとんどの自己注意レイヤをMambaレイヤに置き換えます。
Nemotron-Hモデルは、他の同様のサイズのオープンソーストランスフォーマーモデルと比較して、精度が良いか低いかのどちらかを提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:31:53 GMT)
Pangu Ultra: Pushing the Limits of Dense Large Language Models on Ascend NPUs [123.3] 135億のパラメータと高密度トランスフォーマーモジュールを持つ大規模言語モデル(LLM)であるPangu Ultraについて述べる。
このような大規模トレーニングを効率的に行うためには,8,192個のAscend NPUと一連のシステム最適化を用いる。
我々の調査では、Ascend NPUは1000億以上のパラメータを持つ高密度モデルを効率的かつ効果的に訓練できることを示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:41:51 GMT)
Liquid: Language Models are Scalable and Unified Multi-modal Generators [112.7] Liquidは視覚的理解と生成をシームレスに統合する自動回帰生成パラダイムである。
従来のマルチモーダルな大言語モデル(MLLM)とは異なり、Liquidは単一の大言語モデルを用いてこの統合を実現する。
初めてLiquidは、ビジュアルタスクと言語タスクの統一トレーニングによって必然的にパフォーマンスが低下する、スケーリングの法則を明らかにした。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:28:11 GMT)
SoTA with Less: MCTS-Guided Sample Selection for Data-Efficient Visual Reasoning Self-Improvement [100.9] ThinkLite-VLはQwen2.5-VL-7Bインストラクションの平均性能を7%向上させる。
私たちのコード、データ、モデルはhttps://github.com/si0wang/ThinkLite-VL.orgで公開されています。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:49:05 GMT)
Revisiting LLM Evaluation through Mechanism Interpretability: a New Metric and Model Utility Law [99.6] 大規模言語モデル(LLM)は、学術、産業、そして日々のアプリケーションに欠かせないものになっている。
本稿では,従来の性能指標を補完する機構解釈可能性技術を導入し,モデル利用指標(MUI)を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:09:47 GMT)
GenDoP: Auto-regressive Camera Trajectory Generation as a Director of Photography [98.3] 本稿では,写真監督の専門知識にインスパイアされた自己回帰モデルを導入し,芸術的かつ表現的なカメラトラジェクトリを生成する。
包括的で多様なデータベースのおかげで、高品質でコンテキスト対応のカメラムーブメント生成のための自動回帰デコーダのみのトランスフォーマーをトレーニングします。
実験により、既存の手法と比較して、GenDoPはより良い制御性、よりきめ細かい軌道調整、より高い運動安定性を提供することが示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:10:15 GMT)
SAMJAM: Zero-Shot Video Scene Graph Generation for Egocentric Kitchen Videos [93.3] VidSGGの現在のモデルはシーングラフを作成するために広範囲なトレーニングを必要とする。
本稿では,SAM2の時間追跡とGeminiのセマンティック理解を組み合わせたゼロショットパイプラインSAMJAMを提案する。
我々は、SAMJAMが、EPIC-KITCHENSとEPIC-KITCHENS-100データセットの平均リコールにおいて、Geminiを平均8.33%上回っていることを実証的に示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:43:10 GMT)
Supervised Optimism Correction: Be Confident When LLMs Are Sure [91.7] 教師付き微調整とオフライン強化学習の間には,新たな理論的関係が確立されている。
広く使われているビームサーチ法は、許容できない過度な最適化に悩まされていることを示す。
本稿では,トークンレベル$Q$-value推定のための簡易かつ効果的な補助的損失を導入したSupervised Optimism Correctionを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:50:03 GMT)
Finding Fantastic Experts in MoEs: A Unified Study for Expert Dropping Strategies and Observations [86.9] わずかに活性化されたMixture-of-Experts(SMoE)は、ニューラルネットワークの学習能力のスケールアップを約束している。
多様な視点から専門家の重要度を推定するためのベンチマークとして,MoE Experts Compression Suite (MC-Suite)を提案する。
我々は,SMoEsの指示追従能力が主に損なわれるという,実験的に検証された予想を提示する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:32:14 GMT)
MM-IFEngine: Towards Multimodal Instruction Following [85.9] 高品質なイメージインストラクションペアを生成するパイプラインであるMM-IFEngineを提案する。
MM-IFInstruct-23kはSFT(Supervised Fine-Tuning)に適しているが、DPO(Direct Preference Optimization)のためにMM-IFDPO-23kとして拡張されている。
また、MM-IFEvalは、困難で多様なマルチモーダル命令追従ベンチマークである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:59:12 GMT)
Findings of the BabyLM Challenge: Sample-Efficient Pretraining on Developmentally Plausible Corpora [84.0] 子どもたちは1億ワード未満の入力から言語を習得できる。
大規模な言語モデルはデータ効率がはるかに低く、通常は3~4桁以上のデータを必要とするが、多くの評価において人間ほど性能は高くない。
BabyLM Challengeは、参加者が固定データ予算で言語モデルトレーニングを最適化するために競う共同作業である。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:22:43 GMT)
TwinArch: A Digital Twin Reference Architecture [83.7] デジタルツイン(Digital Twins, DT)は物理系の動的仮想表現であり、物理的およびデジタル領域間のシームレスな双方向通信によって実現される。
提案されているDigital Twin Reference ArchitectureはTwinArchという名前だ。ソフトウェア工学研究所のViews and Beyond方法論を使って文書化されている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:53:11 GMT)
Fast Adaptation with Behavioral Foundation Models [82.3] 教師なしゼロショット強化学習は、行動基礎モデルの事前学習のための強力なパラダイムとして登場した。
有望な結果にもかかわらず、ゼロショットポリシーは、教師なしのトレーニングプロセスによって引き起こされるエラーにより、しばしば準最適である。
本稿では,事前訓練されたBFMの低次元タスク埋め込み空間を探索し,ゼロショットポリシーの性能を急速に向上させる高速適応手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:14:17 GMT)
A Graph-Based Synthetic Data Pipeline for Scaling High-Quality Reasoning Instructions [80.6] グラフベースのSynthetic Data Pipeline(GSDP)は、高品質な推論データ合成のための経済的かつスケーラブルなフレームワークである。
最も困難な数学的推論課題に取り組むために,161万組以上の数学問題と解からなるGSDP-MATHデータセットを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:47:53 GMT)
GaussianAnything: Interactive Point Cloud Flow Matching For 3D Object Generation [75.4] 本稿では,インタラクティブなポイントクラウド構造ラテント空間を備えたスケーラブルで高品質な3D生成を実現する,新しい3D生成フレームワークを提案する。
本フレームワークでは,複数ビューのRGB-D(epth)-N(ormal)レンダリングを入力として使用する変分オートエンコーダを,3次元形状情報を保存する独自のラテント空間設計を用いて構成する。
提案手法であるGaussianAnythingは,複数モード条件付き3D生成をサポートし,ポイントクラウド,キャプション,単一画像入力を可能にする。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 12:24:52 GMT)
Fairness Mediator: Neutralize Stereotype Associations to Mitigate Bias in Large Language Models [66.6] LLMは必然的にトレーニングデータから急激な相関関係を吸収し、偏りのある概念と特定の社会的グループの間のステレオタイプ的関連をもたらす。
ステレオタイプアソシエーションを中和するバイアス緩和フレームワークであるFairness Mediator (FairMed)を提案する。
本フレームワークは, ステレオタイプアソシエーションプローバーと, 対向型デバイアス中和剤の2つの主成分からなる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:23:06 GMT)
Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Instructional Videos [66.2] LangViewは、ビュー依存のキャプション予測の相対的精度を、擬似ラベルを最もよく見るためのプロキシとして利用するフレームワークである。
推論中、我々のモデルは多視点ビデオ(言語やカメラのポーズなし)のみを入力として、各タイミングで見るのに最適な視点を返します。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:02:49 GMT)
Are We Done with Object-Centric Learning? [65.7] オブジェクト中心学習(OCL)は、シーン内の他のオブジェクトやバックグラウンドキューから分離されたオブジェクトのみをエンコードする表現を学習しようとする。
最近のサンプル効率のセグメンテーションモデルでは、ピクセル空間内のオブジェクトを分離し、それらを独立に符号化することができる。
我々は,OCLのレンズを通した背景刺激によるOOD一般化の課題に対処する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:45:00 GMT)
Latte: Latent Diffusion Transformer for Video Generation [65.1] ビデオ生成のための遅延拡散変換器Latteを提案する。
Lataはまず、入力ビデオから時間トークンを抽出し、次に一連のTransformerブロックを採用して、潜時空間の動画配信をモデル化する。
Lataは、4つの標準ビデオ生成データセットで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:28:20 GMT)
How do Large Language Models Understand Relevance? A Mechanistic Interpretability Perspective [64.0] 大規模言語モデル(LLM)は、関連性を評価し、情報検索(IR)タスクをサポートする。
メカニスティック・インタプリタビリティのレンズを用いて,異なるLLMモジュールが関係判断にどのように寄与するかを検討する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:14:55 GMT)
ClimateBench-M: A Multi-Modal Climate Data Benchmark with a Simple Generative Method [61.8] 我々は、ERA5の時系列気候データ、NOAAの極度の気象イベントデータ、NASAの衛星画像データを調整するマルチモーダル気候ベンチマークであるClimateBench-Mに貢献する。
また,各データモダリティの下では,天気予報,雷雨警報,作物の分断作業において,競争性能を向上できる簡易かつ強力な生成手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:22:23 GMT)
The Efficacy of Semantics-Preserving Transformations in Self-Supervised Learning for Medical Ultrasound [60.8] 本研究は, 肺超音波の自己教師あり学習におけるデータ拡張と前処理方略の影響を系統的に検討した。
画像領域に共通して使用されるベースラインパイプライン、超音波用に設計された新しいセマンティック保存パイプライン、両方のパイプラインから最も効果的な変換の蒸留セットの3つのデータ拡張パイプラインが評価された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:26:47 GMT)
ID-Guard: A Universal Framework for Combating Facial Manipulation via Breaking Identification [60.7] 深層学習に基づく顔操作の誤用は、公民権に重大な脅威をもたらす。
この不正行為を防止するため、操作過程を妨害する積極的な防御法が提案されている。
本稿では,IDガード(ID-Guard)と呼ばれる顔の操作に対処するための普遍的な枠組みを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:58:51 GMT)
Real-time Verification and Refinement of Language Model Text Generation [60.0] 大規模言語モデル(LLM)は、幅広い自然言語タスクにおいて顕著な性能を示している。
重要な課題は、時に事実的に誤った答えを生じさせることである。
本稿では,LLM出力の検証と改善の効率化を目的とした新しい手法であるStreaming-VRを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:39:35 GMT)
Towards Scalable and Deep Graph Neural Networks via Noise Masking [59.1] グラフニューラルネットワーク(GNN)は多くのグラフマイニングタスクで顕著に成功している。
計算とストレージのコストが高いため、大きなグラフにスケールすることは困難です。
既存のモデル単純化作業と互換性のあるプラグアンドプレイモジュールであるノイズマスキング(RMask)を用いたランダムウォークを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:16:19 GMT)
P2Object: Single Point Supervised Object Detection and Instance Segmentation [58.8] バランスの取れたtextbftextitinstance レベルの提案バッグを構成する Point-to-Box Network (P2BNet) を導入する。
P2MNetはより正確なバウンディングボックスを生成し、セグメンテーションタスクに一般化することができる。
提案手法は,COCO,VOC,Cityscapesの平均精度において,従来の手法をはるかに上回っている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:51:08 GMT)
Event Signal Filtering via Probability Flux Estimation [58.3] イベントは、非同期センシングを通じてシーンダイナミクスをキャプチャするための新しいパラダイムを提供するが、その固有のランダム性は、しばしば劣化した信号品質につながる。
したがって、イベント信号フィルタリングは、この内部ランダム性を低減し、多様な取得条件をまたいだ一貫した出力を確保することで、忠実性を高めるために不可欠である。
本稿ではイベント密度フローフィルタ(EDFilter)と呼ばれる生成オンラインフィルタリングフレームワークを紹介する。
実験では、イベントフィルタリング、スーパーレゾリューション、イベントベースの直接追跡といったタスクでEDFilterのパフォーマンスを検証する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:03:08 GMT)
A Quantitative Evaluation of the Expressivity of BMI, Pose and Gender in Body Embeddings for Recognition and Identification [56.1] 人物再識別(ReID)システムは、画像またはビデオフレーム間で個人を識別する。
多くのReID法は、性別、ポーズ、身体質量指数(BMI)などのセンシティブな属性の影響を受けている。
表現性の概念をボディ認識領域に拡張し、ReIDモデルがどのようにこれらの属性をエンコードするかをよりよく理解します。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:29:03 GMT)
VL-Rethinker: Incentivizing Self-Reflection of Vision-Language Models with Reinforcement Learning [56.0] GPT-o1とDeepSeek-R1は、明示的な反射によって難しい問題を解く大きな可能性を示した。
本稿では、強化学習を用いて、視覚言語モデルの遅い思考能力を向上させることを目的とする。
我々のモデルであるVL-Rethinkerは、MathVista、MathVerse、MathVisionの最先端スコアを80.3%、61.8%、43.9%に向上させています。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:41:56 GMT)
Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [56.0] 遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:43:16 GMT)
Scaling Laws for Native Multimodal Models Scaling Laws for Native Multimodal Models [53.5] 我々は、ネイティブマルチモーダルモデルのアーキテクチャ設計を再考し、広範なスケーリング法の研究を行う。
我々の調査では、早期核融合アーキテクチャよりも後期核融合アーキテクチャに固有の利点は示されていない。
また,Mixture of Experts(MoEs)を組み込むことで,モダリティ固有の重みを学習し,性能を大幅に向上できることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:57:28 GMT)
Could AI Trace and Explain the Origins of AI-Generated Images and Text? [53.1] AI生成コンテンツは、現実の世界ではますます普及している。
敵は、大規模なマルチモーダルモデルを利用して、倫理的または法的基準に違反した画像を作成するかもしれない。
ペーパーレビュアーは、大きな言語モデルを誤用して、真の知的努力なしにレビューを生成する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:50:41 GMT)
From Speech to Summary: A Comprehensive Survey of Speech Summarization [53.0] 音声の要約は、音声・音声コンテンツの増加量を効率的に管理し、アクセスするために欠かせないツールとなっている。
その重要性が増しているにもかかわらず、音声要約はまだ明確に定義されておらず、音声認識、テキスト要約、会議要約のような特定の応用を含むいくつかの研究領域と交差している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:50:53 GMT)
Multi-Selection for Recommendation Systems [52.6] 本稿では,レコメンデーションシステムのコンテキストにおいて,異なるプライベートクエリに応答するマルチセレクションモデルの構築について述べる。
サーバは複数のレコメンデーションと'ローカルモデル'をユーザに送信し、ユーザはデバイス上でローカルに実行して、プライベート機能に最も適したアイテムを選択することができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:57:14 GMT)
SPIN-Bench: How Well Do LLMs Plan Strategically and Reason Socially? [44.3] 戦略計画・インタラクション・ネゴシエーション(SPIN-Bench)について
SPIN-Benchは、戦略的計画と社会的推論の知性を測定するために設計された、新しいマルチドメイン評価である。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:18:36 GMT)
TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization [43.4] 我々はTangoFluxを紹介した。TangoFluxは、515Mパラメータを持つ効率的なText-to-Audio(TTA)生成モデルで、1つのA40 GPUで最大30秒44.1kHzのオーディオをわずか3.7秒で生成できる。
TTAモデルを調整する上で重要な課題は、Large Language Models (LLMs) で利用できる検証可能な報酬やゴールドスタンダードの回答のような構造化されたメカニズムを欠いているため、選好ペアを作成するのが難しいことである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:01:32 GMT)
LoRI: Reducing Cross-Task Interference in Multi-Task Low-Rank Adaptation [43.3] Low-Rank Adaptation (LoRA)は、Large Language Models (LLMs) のためのPEFT法として人気がある。
提案するLoRA with Reduced Interference (LoRI) は,プロジェクション行列をランダムなプロジェクションとして$A$を凍結し,タスク固有のマスクを用いて$B$をスパースする,単純かつ効果的な手法である。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:46:04 GMT)
A Theory of Non-Linear Feature Learning with One Gradient Step in Two-Layer Neural Networks [43.3] 機能学習は、ディープニューラルネットワークの成功の根本的な理由の1つであると考えられている。
サンプルサイズとともに成長する学習率によって、このようなトレーニングが実際に複数のランクワンコンポーネントを導入していることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:26:24 GMT)
SpikeLLM: Scaling up Spiking Neural Network to Large Language Models via Saliency-based Spiking [43.3] 人間の脳は、同様のパラメータを持つ大きな言語モデルよりもはるかにエネルギー効率が高い。
本稿では,最初のスパイク型大言語モデルであるSpikeLLMを提案する。
SpikeLLMは11.01%のWikiText2の複雑さを低減し、一般的なシーン推論の2.55%の精度を改善する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:50:49 GMT)
AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations [42.8] ビジュアルグラウンドイングは、自然言語記述に基づいたイメージ内のターゲットオブジェクトのローカライズを目的としている。
AerialVGは、例えば外見に基づく接地は、複数の視覚的に類似した物体を識別するには不十分である。
5Kの空中画像,50Kの注釈付き記述,103Kのオブジェクトからなる,最初のAerialVGデータセットを紹介した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:13:00 GMT)
autrainer: A Modular and Extensible Deep Learning Toolkit for Computer Audition Tasks [42.5] autrainerは、監査タスクのコンピュータトレーニングのためのPyTorchベースのツールキットである。
本稿では,その内部動作と重要な機能について概説する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:51:44 GMT)
7B Fully Open Source Moxin-LLM -- From Pretraining to GRPO-based Reinforcement Learning Enhancement [42.1] Moxin 7Bは、オープンサイエンス、オープンソース、オープンデータ、オープンアクセスの原則に準拠した、完全にオープンソースのLarge Language Models (LLM) である。
トレーニング済みのコードと設定、トレーニングと微調整のデータセット、中間および最終チェックポイントをリリースします。
実験により, ゼロショット評価, 少数ショット評価, CoT評価など, 各種評価において, 優れた性能が得られることが示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:05:16 GMT)
Embezzlement of entanglement, quantum fields, and the classification of von Neumann algebras [41.9] 我々は、フォン・ノイマン代数の設定におけるエンタングルメントの埋め込みの量子情報理論的タスクについて研究する。
与えられた資源状態の性能を最悪のエラーで定量化する。
我々の発見は、III型代数が自然に現れる相対論的場の量子論に影響を及ぼす。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:51:49 GMT)
Breaking the Barriers: Video Vision Transformers for Word-Level Sign Language Recognition [41.9] 手話は、聴覚障害と難聴(DHH)コミュニティのためのコミュニケーションの基本的な手段である。
聴覚障害者の間で 手話の流布が 限られているため 障壁は持続する
単語レベルアメリカン手話(ASL)認識のためのビデオビジョン変換器(ViViT)モデルを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:27:25 GMT)
Optimized Multi-Token Joint Decoding with Auxiliary Model for LLM Inference [41.9] 大規模言語モデル(LLM)は様々なタスクで顕著な成功を収めた。
推論プロセスは、デコードの各ステップにおける単一トーケン生成により、相当な時間とエネルギー要求によって妨げられる。
MTJD を高速化する新しいフレームワークである Multi-token Assisted Decoding (MTAD) を導入する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:35:34 GMT)
Enhancing Player Enjoyment with a Two-Tier DRL and LLM-Based Agent System for Fighting Games [41.5] 本研究では,古典的格闘ゲームStreet Fighter IIにおける2層エージェントシステムの提案と実験を行う。
TTAの第1層は、タスク指向ネットワークアーキテクチャ、モジュール化された報酬関数、および多様な技術を持つDRLエージェントを生成するためのハイブリッドトレーニングを採用している。
TTAの第2層では、プレイヤーのプレイデータとフィードバックを活用するLarge Language Model Hyper-Agentが、適切なDRL相手を動的に選択する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:38:06 GMT)
Adversarial Subspace Generation for Outlier Detection in High-Dimensional Data [41.1] マルチビュー効果を数学的に定式化する新しい理論フレームワークであるMyopic Subspace Theory (MST)を紹介する。
MSTに基づいて、このような最適化問題を解決するために訓練された生成法であるV-GANを導入する。
42の実世界のデータセットに対する実験により、V-GANの使用は1クラスの分類性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:40:02 GMT)
An Empirical Study of GPT-4o Image Generation Capabilities [40.9] 我々は、GPT-4oの画像生成能力について実証的研究を行い、主要なオープンソースおよび商用モデルと比較した。
本分析では, GPT-4oの強度と限界を様々な条件下で強調し, GPT-4oを生成モデリングのより広範な進化に導いてくれる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:02:00 GMT)
Dualformer: Controllable Fast and Slow Thinking by Learning with Randomized Reasoning Traces [40.1] 人間の思考は、システム1とシステム2の2つのシステムによって管理されている。
近年, System 2 プロセスを Transformer に組み込むことで推論能力が大きく向上することが報告されている。
高速かつ低速な推論モードをシームレスに統合する単一トランスフォーマーモデルであるDualformerを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:46:07 GMT)
How to Detect and Defeat Molecular Mirage: A Metric-Driven Benchmark for Hallucination in LLM-based Molecular Comprehension [40.1] 大規模言語モデルは、特に分子理解と解析のために、科学領域でますます使われている。
既存のモデルは幻覚の問題の影響を受けており、薬物設計と利用の誤りをもたらす。
まず,分子理解タスク,特にPubChemデータセットに見られる知識ショートカット現象に対するLLMの幻覚源の分析を行った。
bfMol-Halluは、生成したテキストと実際の分子特性の間の科学的関係に基づいて幻覚の度合いを定量化する新しいフリーフォーム評価指標である。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:19:02 GMT)
SFT or RL? An Early Investigation into Training R1-Like Reasoning Large Vision-Language Models [39.6] 本研究は、LVLM(Large Vision-Language Models)のトレーニングにおいて、支配的な教師付き微調整(SFT)、強化学習(RL)パラダイムを再考する。
SFTは、専門家モデルから模倣された擬似推論経路を誘導することにより、その後のRLを著しく損なう可能性があることを示す。
我々は,LVLMにおける推論を支援するために設計された,新しいマルチモーダルデータセットであるVLAA-Thinkingを紹介する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:54:05 GMT)
Learning Fine-grained Domain Generalization via Hyperbolic State Space Hallucination [39.0] きめ細かいドメイン一般化(FGDG)は、未確認のターゲットドメインに十分に一般化可能なきめ細かい表現を学習することを目的としている。
本稿では,ハイパボリック・ステート・スペース・ハロシン化法(HSSH)を提案する。
3つのFGDGベンチマークの実験は、最先端のパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:30:39 GMT)
AI-Slop to AI-Polish? Aligning Language Models through Edit-Based Writing Rewards and Test-time Computation [39.0] 我々は、AI生成テキストの書字品質の評価と改善について研究する。
まず、5つの書評データセットを4,729の書評判断に集約することで、書評品質ベンチマーク(WQ)を導入する。
次に、書字品質評価のために、様々なサイズの書字品質リワードモデル(WQRM)を訓練する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:58:05 GMT)
DiffusionDrive: Truncated Diffusion Model for End-to-End Autonomous Driving [38.9] 拡散モデルは、ロボット政策学習の強力な生成技術として登場した。
本稿では,従来のマルチモードアンカーを取り入れ,拡散スケジュールを切り離す,新たな切り離された拡散ポリシーを提案する。
提案したモデルであるDiffusionDriveは、バニラ拡散ポリシーと比較して10ドル程度のデノナイジングステップの削減を実証している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:48:37 GMT)
SGFormer: Satellite-Ground Fusion for 3D Semantic Scene Completion [38.9] 本稿では,SGFormer という衛星地上協調型 SSC フレームワークについて述べる。
衛星と地上のビューを並列に符号化し、それらを共通領域に統一するデュアルブランチアーキテクチャを提案する。
衛星と地上からのコントリビューションのバランスをとるための適応重み付け戦略を開発する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:47:41 GMT)
Towards Distribution Matching between Collaborative and Language Spaces for Generative Recommendation [38.5] ジェネレーティブレコメンデーションは、ユーザのためのレコメンデーションを生成するために、アイテムセット全体を通して、基礎となるジェネレーティブプロセスを学ぶことを目的としている。
本研究ではDMRecと呼ばれるモデルに依存しない生成レコメンデーションフレームワークを提案し,ユーザインタラクションによってLMの出力をブリッジする確率的メタネットワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:09:30 GMT)
HarmonySeg: Tubular Structure Segmentation with Deep-Shallow Feature Fusion and Growth-Suppression Balanced Loss [37.8] 我々はHarmonySegという新しい管状構造セグメンテーションフレームワークを提案する。
まず、様々な受容場を持つ柔軟な畳み込みブロックを備えたディープ・ツー・シャロー・デコーダネットワークを設計する。
第2に, 解剖学的領域を強調し, 小さな管状構造のリコールを改善するために, 血管性マップを組み込んだ。
第3に, 管状構造物の成長と抑制のバランスをとるために, 文脈と形状の先行性を活用するトポロジー保存損失関数を導入する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:04:42 GMT)
SAFARI: a Scalable Air-gapped Framework for Automated Ransomware Investigation [37.8] SAFARIは、安全で効率的なランサムウェア分析のために設計されたオープンソースのフレームワークである。
概念実証実装を構築し、それを用いて2つのケーススタディを実行することで、SAFARIの能力を実証する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:44:13 GMT)
Dissipation and non-thermal states in cryogenic cavities [37.7] 室温環境に囲まれた低温鏡で作製した低温キャビティ中の光子の特性について検討した。
リンドブラッドマスター方程式を用いて、キャビティモードの光子分布と統計的性質を導出する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:50:54 GMT)
The AI Risk Repository: A Comprehensive Meta-Review, Database, and Taxonomy of Risks From Artificial Intelligence [35.8] 人工知能(AI)によって引き起こされるリスクは、学者、監査人、政策立案者、AI企業、そして一般大衆にかなり懸念されている。
AIリスクに対する共通理解の欠如は、包括的に議論し、研究し、それに反応する能力を妨げる可能性がある。
本稿では、共通の参照フレームとして機能するAIリスクリポジトリを作成することで、このギャップに対処する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:14:02 GMT)
Learning convolution operators on compact Abelian groups [35.7] コンパクトなアベリア群に関連する畳み込み作用素の学習問題を考察する。
正規化に基づく手法を研究し、自然正規化条件下での学習保証を提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:30:02 GMT)
Redefining Machine Translation on Social Network Services with Large Language Models [35.5] 本稿では,SNS翻訳に適した72B LLMであるRedTransを紹介する。
RedTransは、3つのイノベーションを通じて開発された新しいデータセットでトレーニングされている。
実験では、RedTransは最先端のLLMよりも優れています。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:24:28 GMT)
nnLandmark: A Self-Configuring Method for 3D Medical Landmark Detection [35.4] この研究は3D医療ランドマーク検出のための自己構成型ディープラーニングフレームワークであるnnLandmarkを紹介している。
nnLandmarkは手動のパラメータチューニングの必要性を排除し、アウト・オブ・ボックスのユーザビリティを提供する。
下顎臼歯部CTデータセット(MML)に1.5mmの放射平均誤差(MRE)、脳MRIデータセット(AFIDs)に1.2mmの解剖学的画像を含む2つの公的データセットにまたがる最先端の精度を実現する。
nnLandmarkは、3Dランドマーク検出のための信頼性の高いベースラインを確立し、解剖学的局在の研究を支援している
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:04:29 GMT)
Towards Micro-Action Recognition with Limited Annotations: An Asynchronous Pseudo Labeling and Training Approach [35.3] 本稿では,SSMAR(Semi-Supervised MAR)の設定について紹介する。
従来のSemi-Supervised Learning(SSL)メソッドは、不正確な擬似ラベルに過度に適合する傾向があり、エラーの蓄積と性能の低下につながる。
擬似ラベル作成プロセスとモデルトレーニングを明確に分離する非同期擬似ラベル作成訓練(APLT)を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:22:15 GMT)
Why We Feel: Breaking Boundaries in Emotional Reasoning with Multimodal Large Language Models [35.2] 感情の反応を駆動する因果的要因に着目した感情解釈(EI)を提案する。
従来の感情認識とは異なり、EIタスクは単なるラベル付けではなくトリガーについての推論を必要とする。
EIBenchは1,615の基本的なEIサンプルと50の複雑なEIサンプルを含む大規模なベンチマークである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:33:49 GMT)
Defending LLM Watermarking Against Spoofing Attacks with Contrastive Representation Learning [34.8] ピギーバック攻撃は、元々の透かしを保ったままのヘイトスピーチに変換する透かしテキストの意味を悪意的に変更することができる。
そこで本稿では,元来の意味を保ちつつ,与えられた目標テキストに透かしを埋め込む意味認識型透かしアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:23:40 GMT)
Detect Anything 3D in the Wild [34.3] DetAny3Dは任意のカメラ構成で新しい物体を検知できる3D検出基盤モデルである。
2D知識を3Dに効果的に転送するために、DetAny3Dは2DアグリゲータとZero-Embedding Mappingによる3Dインタプリタという2つのコアモジュールを組み込んでいる。
DetAny3Dは、未確認のカテゴリや新しいカメラ構成の最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:59:22 GMT)
Route Sparse Autoencoder to Interpret Large Language Models [33.4] Route Sparse Autoencoder (RouteSAE) は、ルーティングメカニズムを共有SAEと統合し、複数のレイヤから機能を効率的に抽出するフレームワークである。
64の空間的制約の下では、RouteSAEはベースラインSAEよりも22.5%高い特徴を抽出し、22.3%高い解釈可能性スコアを達成している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:58:01 GMT)
Can LLMs Help Uncover Insights about LLMs? A Large-Scale, Evolving Literature Analysis of Frontier LLMs [32.5] 本研究では,LLMを用いたデータ抽出を高速化する文献解析のための半自動手法を提案する。
関連するarXiv論文を自動的に識別し、実験結果と関連する属性を抽出し、構造化データセットLLMEvalDBに編成する。
次に、フロンティアLCMの自動文献解析を行い、手動によるアプローチと比較して、紙調査とデータ抽出の労力を93%以上削減する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:47:50 GMT)
VLM-R1: A Stable and Generalizable R1-style Large Vision-Language Model [29.5] 最近、DeepSeek R1は、強化学習が大規模言語モデル(LLM)の推論能力を大幅に改善できることを示した。
視覚言語モデル(VLM)へのR1型強化学習の拡張について検討する。
VLM-R1 は,汎用視覚言語タスクにおける VLM の性能向上のために RL を利用した専用フレームワークである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:05:15 GMT)
Large Language Model for Verilog Generation with Code-Structure-Guided Reinforcement Learning [29.1] 本稿では、強化学習によって強化されたLLMであるVeriSeekを紹介し、高いVerilogコード生成性能を実現する。
我々の強化学習アプローチでは、事前学習されたモデルを洗練するためのフィードバック信号として、コード構造情報を用いる。
実験によると、VeriSeekは複数のベンチマークで最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:15:17 GMT)
Deep Learning-based Intrusion Detection Systems: A Survey [28.4] 侵入検知システム(IDS)は長い間、サイバーセキュリティコミュニティでホットな話題だった。
ディープラーニング(DL)技術の導入により、IDSは一般化可能性の向上により大きな進歩を遂げた。
この調査は、データ収集、ログストレージ、ログ解析、グラフ要約、攻撃検出、攻撃調査など、DL-IDSの全ステージを体系的にレビューする。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:18:56 GMT)
DGFamba: Learning Flow Factorized State Space for Visual Domain Generalization [27.9] 視覚領域一般化のための新しいフローファクトリズステートスペースモデルDG-Fambaを提案する。
ドメインの整合性を維持するために,フローの分解によるスタイル拡張と元の状態の埋め込みを革新的にマッピングする。
様々な視覚領域の一般化設定で行われた実験は、その最先端性能を示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:24:53 GMT)
ChartQAPro: A More Diverse and Challenging Benchmark for Chart Question Answering [27.6] 新しいベンチマークであるChartQAProを紹介した。これは157のさまざまなソースから1,341のチャートを含み、さまざまなチャートタイプにまたがっている。
21モデルによる評価は,ChartQAPro上でのLVLMの性能低下を示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:10:05 GMT)
STeP: A General and Scalable Framework for Solving Video Inverse Problems with Spatiotemporal Diffusion Priors [27.5] 本研究では,拡散モデルを用いたビデオにおける一般的な逆問題の解法について検討する。
ビデオ逆問題を解決するための汎用的でスケーラブルなフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:24:26 GMT)
APSQ: Additive Partial Sum Quantization with Algorithm-Hardware Co-Design [27.1] 本研究は,PSUM蓄積を量子化フレームワークにシームレスに統合した新しい部分和量子化法(APSQ)を提案する。
APSQとPSUM量子化を組み合わせたグループ化戦略を提案する。
LLaMA2-7Bの実験は、大規模言語モデルにおけるAPSQの可能性を示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:45:17 GMT)
Synthesizing High-Quality Programming Tasks with LLM-based Expert and Student Agents [26.9] PyTaskSynは、プログラミングタスクを最初に生成し、学生に与えられる特定の品質基準を満たすかどうかを決定する新しい合成技術である。
PyTaskSynはベースライン技術と比較してタスク品質を著しく改善し、検証パイプラインにおける各エージェントタイプの重要性を示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:08:39 GMT)
Toward a Theory of Tokenization in LLMs [26.5] 本稿では, 簡単なデータ生成プロセスにおいて, 変圧器の挙動を研究することによって, 理論的観点からトークン化について検討する。
変換器によって学習された最も単純なユニグラムモデルでさえ、$ktextth$-order Markovソースから引き出されたシーケンスの確率を最適にモデル化できることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:00:58 GMT)
Marconi: Prefix Caching for the Era of Hybrid LLMs [26.3] 本稿では,Hybrid LLMを用いた効率的なプレフィックスキャッシングをサポートする最初のシステムであるMarconiを紹介する。
多様なワークロードとハイブリッドモデルにまたがって、Marconiは最大34.4$times$高いトークンヒットレートを達成した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:06:29 GMT)
Novel Diffusion Models for Multimodal 3D Hand Trajectory Prediction [26.2] マルチモーダル3次元ハンドトラジェクトリ予測のための新しい拡散モデル(MMTwin)を提案する。
MMTwinは、2D RGBイメージ、3Dポイントクラウド、パスハンドウェイポイント、テキストプロンプトを含む入力としてマルチモーダル情報を吸収するように設計されている。
2つの潜伏拡散モデル、すなわち、双生児としての自走拡散とHTP拡散をMMTwinに統合し、カメラの自走と将来のハンドトラジェクトリを同時に予測する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:29:50 GMT)
Diffusion Transformers for Tabular Data Time Series Generation [26.0] 本稿では,Diffusion Transformer (DiT) を用いたデータ系列生成手法を提案する。
画像およびビデオ生成における最近のDiTsの成功に触発されて、このフレームワークは異種データを扱うように拡張されている。
6つのデータセットに対する広範な実験により,提案手法が従来の手法よりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:56:09 GMT)
Robust Hallucination Detection in LLMs via Adaptive Token Selection [25.2] 大きな言語モデル(LLM)の幻覚は、より広範なデプロイメントを妨げる重要な安全性上の懸念を引き起こす。
本研究では,適応的選択とクリティカルトークンの学習を通じて,幻覚の堅牢な検出を可能にする新しいアプローチであるHaMIを提案する。
本研究では,ハロシン化検出タスクの革新的な定式化により,このロバスト性を実現する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:39:10 GMT)
FAST: Federated Active Learning with Foundation Models for Communication-efficient Sampling and Training [25.0] Federated Active Learning (FAL)は、分散クライアント間で大量のラベル付けされていないデータを活用するための、有望なフレームワークとして登場した。
本稿では,アノテータの最小限の労力で,ループ学習におけるコミュニケーションコストを削減するためのベストプラクティスについて述べる。
予備パスで弱ラベル付けのための基礎モデルを利用する2パスFALフレームワークであるFASTと、最も不確実なサンプルにのみ焦点を絞った改良パスを紹介する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:42:57 GMT)
Refining Answer Distributions for Improved Large Language Model Reasoning [24.7] 本稿では,Large Language Models (LLMs) の推論能力を高めるための,新しいアルゴリズムフレームワークであるRefined Answer Distributionsを提案する。
我々のアプローチは、モンテカルロ近似(英語版)を形成するための反復的なサンプリング戦略と見なすことができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:11:49 GMT)
Cluster-Driven Expert Pruning for Mixture-of-Experts Large Language Models [24.6] クラスタ駆動のExpert Pruning(C-Prune)は、大規模言語モデルの適応的なタスク固有圧縮のための新しい2段階のフレームワークである。
C-Pruneはレイヤワイドの専門家クラスタリングを通じて動作し、各MoE層内で機能的に類似した専門家をグループ化する。
複数のMoEモデルとベンチマークの広範な実験を通じてC-Pruneを検証する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:46:26 GMT)
MonoPlace3D: Learning 3D-Aware Object Placement for 3D Monocular Detection [24.6] 現在のモノクラー3D検出器は、現実世界のデータセットの多様性とスケールに制限されている。
物体の位置や位置は、有効な3次元単分子検出器の訓練に必要不可欠であることを示す。
現実的な拡張を実現するために,3Dシーンコンテンツを考慮した新しいシステムであるMonoPlace3Dを紹介する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:03:02 GMT)
Compass Control: Multi Object Orientation Control for Text-to-Image Generation [24.4] テキストと画像の拡散モデルを制御する既存のアプローチは、強力ではあるが、明示的な3Dオブジェクト中心制御を許さない。
テキスト・画像拡散モデルにおける多目的方向制御の問題に対処する。
これにより、各オブジェクトに対して正確な向き制御を備えた多様なマルチオブジェクトシーンを生成することができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:59:11 GMT)
SeCap: Self-Calibrating and Adaptive Prompts for Cross-view Person Re-Identification in Aerial-Ground Networks [24.4] AGPReIDタスクのためのSeCap(Se-Calibrating and Adaptive Prompt)メソッドの設計と実装を行う。
SeCap は Prompt Re-calibration Module (PRM) に依存しており、入力に基づいてプロンプトを適応的に再校正する。
さらに,LAGPeRとG2APS-ReIDの2つの実世界の空中人物再収集データセットをコントリビュートする。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:26:27 GMT)
SF2T: Self-supervised Fragment Finetuning of Video-LLMs for Fine-Grained Understanding [24.0] ビデオベースのLarge Language Models (VideoVid-LLMs) は近年大きく進歩している。
彼らは細かな理解に苦しむが、特に視覚力学やビデオの詳細などの側面においてである。
これらの欠点に対処するため、自己監督的断片化タスクにおける細調整ビデオLLMは、そのきめ細かい映像理解能力を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:40:34 GMT)
ColorBench: Can VLMs See and Understand the Colorful World? A Comprehensive Benchmark for Color Perception, Reasoning, and Robustness [23.9] 視覚言語モデル(VLM)が人間の色を知覚し、理解し、活用できるかどうかは不明である。
本稿では,色理解におけるVLMの性能を評価するベンチマークであるColorBenchを紹介する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:36:26 GMT)
HoloPart: Generative 3D Part Amodal Segmentation [23.8] 3D部分のアモーダルセグメンテーションは難しいが、3Dコンテンツの作成と理解にとって重要な課題だ。
2Dアモーダルセグメンテーションにインスパイアされたこの新しいタスクを3Dドメインに導入し、実用的な2段階のアプローチを提案する。
我々は,ABOおよびPart-Tinyデータセットに基づく新しいベンチマークを導入し,HoloPartが最先端の形状補完法を大幅に上回っていることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:53:31 GMT)
Has the Creativity of Large-Language Models peaked? An analysis of inter- and intra-LLM variability [23.5] 実証された2つのクリエイティビティ・アセスメントにおいて,広く使用されている大規模言語モデル(LLM)を14種類評価した。
予想とは対照的に、過去18~24ヶ月でクリエイティブなパフォーマンスが向上した証拠は見つからなかった。
同じプロンプトを与えられたLLMは、平均以下からオリジナルまで、アウトプットを生成できる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:18:56 GMT)
Dreamweaver: Learning Compositional World Models from Pixels [23.0] 人間は自然に世界の知覚を物体とその属性に分解する能力を持っている。
この認知的プロセスは、慣れ親しんだ概念を再結合することで、新しい未来を想像することができる。
生のビデオから階層的および構成的表現を発見するために設計されたニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:12:34 GMT)
Emergence of psychopathological computations in large language models [22.8] 本研究では,大規模言語モデルに適用可能な心理病理の考察を行うための計算理論フレームワークを提案する。
我々の研究は、近未来の精神病理学的行動を持つAIシステムの可能性について言及している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:36:30 GMT)
GLUS: Global-Local Reasoning Unified into A Single Large Language Model for Video Segmentation [22.8] 本稿では、ビデオオブジェクトセグメンテーション(RefVOS)の参照にMLLM(Multi-modal large language model)を利用する新しいフレームワークを提案する。
本フレームワークは,グローバルかつ局所的な一貫性を単一のビデオセグメンテーションMLLMに統合可能であることを示す。
MLLMの限られたコンテキストウィンドウ内での情報効率を向上させるために,ハード偽陽性オブジェクトを識別するためのオブジェクトコントラスト学習を導入する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:59:55 GMT)
An Adversarial Perspective on Machine Unlearning for AI Safety [22.6] この作業は、アンラーニングと従来のトレーニング後の安全性の根本的な違いに挑戦する。
既存のjailbreakメソッドは、これまで未学習に対して効果がないと報告されていたが、慎重に適用した場合に成功できることを実証する。
例えば、アクティベーション空間における10の無関係な例を微調整したり、特定の方向を除去することで、RMUで編集されたモデルに対して最も危険な能力を回復できることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:54:44 GMT)
VCR-Bench: A Comprehensive Evaluation Framework for Video Chain-of-Thought Reasoning [22.4] Chain-of-Thought (CoT)推論は、大規模言語モデル(LLM)と大規模視覚言語モデル(LVLM)の機能を大幅に向上させた。
VCR-Benchは,LVLMのビデオ・チェーン・オブ・ソート・リ推論機能を包括的に評価する新しいベンチマークである。
VCR-Benchは、さまざまなビデオコンテンツと期間にまたがる859の動画と、1,034の高品質な質問応答ペアで構成されている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:59:03 GMT)
Understanding and Mitigating the Bias in Sample Selection for Learning with Noisy Labels [22.2] サンプル選択におけるバイアス学習のためのnoIse-Tolerant Expert Model (ITEM)を提案する。
具体的には、トレーニングバイアスを軽減するために、複数の専門家と統合した堅牢なネットワークアーキテクチャを設計します。
2つのクラス識別型ミニバッチの混合によるトレーニングにより、モデルが不均衡なトレーニングセットの効果を緩和する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:13:42 GMT)
Token Level Routing Inference System for Edge Devices [21.7] 本稿では,クラウドベースの大規模モデルから重要なトークン生成を選択的に参照しながら,小型モデルでデバイス上での推論を可能にする,新しい協調型復号推論システムを提案する。
注目すべきは、M1 MacBook上で0.5Bモデルのみを使用してCommonsenseQAのパフォーマンスを60%向上させ、クラウドの大規模モデルにアップロードされるトークン生成の7%以下であることだ。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:54:19 GMT)
Efficient Tuning of Large Language Models for Knowledge-Grounded Dialogue Generation [21.5] KEDiTは、知識基底対話生成のための大規模言語モデルを微調整する効率的な方法である。
まず、検索した知識を学習可能なパラメータに圧縮するために情報ボトルネックを使用し、計算オーバーヘッドを最小限に抑えながら重要な情報を保持する。
ウィキペディアのウィザードと新しく構築されたPubMed-Dialogデータセットの実験結果は、KEDiTが文脈的に関連があり、情報的な応答を生成するのに優れていることを示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:54:36 GMT)
C3PO: Critical-Layer, Core-Expert, Collaborative Pathway Optimization for Test-Time Expert Re-Mixing [21.1] Mixture-of-Experts (MoE) Large Language Models (LLMs) は、高度に最適化されたエキスパートパスに苦しむ。
プレトレーニングから学んだナイーブな専門家選択は、改善のための驚くべき10~20%の精度ギャップを残します。
テストサンプル毎に異なるレイヤのエキスパートを共同で再重み付けあるいは「再混合」するための新しいテスト時間最適化手法を開発する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:59:56 GMT)
Distillation of Discrete Diffusion through Dimensional Correlations [21.1] 「ミクチャー」モデルは、拡張性を維持しながら次元相関を扱える。
損失関数により、混合モデルは、次元相関を学習することで、そのような多くのステップの従来のモデルをほんの数ステップに蒸留することができる。
その結果、画像領域と言語領域をまたいだ事前学習した離散拡散モデルの蒸留における提案手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:40:46 GMT)
Capybara-OMNI: An Efficient Paradigm for Building Omni-Modal Language Models [20.4] カピバラオミニ(Capybara-OMNI)は、MLLMの軽量で効率的な運転方法である。
フレームワーク設計、データ構築、およびトレーニングレシピの詳細を提示する。
以上の結果から,競争性能を向上するMLLMを効率的に構築できることが示唆された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:08:53 GMT)
AgentAda: Skill-Adaptive Data Analytics for Tailored Insight Discovery [20.3] 我々はAgentAdaを紹介した。AgentAdaは、新しい分析スキルを学び、利用して、より専門的な洞察を引き出すことができる最初の分析エージェントだ。
ユーザーがどのデータ分析方法を適用するかを手動で決める既存の方法とは異なり、AgentAdaは分析を行うために必要なスキルを自動的に識別する。
我々は、AgentAdaが既存のツールよりも洞察に富んだ分析を提供しており、48.78%が分析を好み、27.67%は未熟練のエージェントであることを示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:27:25 GMT)
Boosting Universal LLM Reward Design through the Heuristic Reward Observation Space Evolution [20.2] 自動強化学習のための有望なツールとして,大規模言語モデル(LLM)が登場している。
本稿では,リワード観測空間を進化させることにより,LLM駆動型報酬設計を向上する新しいフレームワークを提案する。
本フレームワークでは,環境状態の履歴的使用率と成功率を追跡する状態実行テーブルを導入する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:48:56 GMT)
Auditing Differential Privacy in the Black-Box Setting [20.0] 我々は,型Iと型IIのエラーを明確に定義し,共形推論に基づく監査機構を提案する。
提案手法は最小限の仮定でI型エラー率を強く制御する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:44:33 GMT)
Plan-and-Refine: Diverse and Comprehensive Retrieval-Augmented Generation [19.7] 2相システム設計に基づくP&R(Plan-and-Refine)フレームワークを提案する。
グローバルな探査段階において、P&Rは与えられた入力に対する様々な計画を生成する。
このフェーズに続いて、各プランに条件付き入力クエリに対する応答提案を生成するローカルエクスプロイトフェーズが生成される。
最後に、最も事実とカバレッジの高い提案を選択するために報酬モデルが使用される。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:32:32 GMT)
Modern Hopfield Networks with Continuous-Time Memories [19.6] 本稿では,大規模な離散ホップフィールドメモリを小さな連続記憶に圧縮する手法を提案する。
作業記憶における連続的資源割り当ての心理学的理論に着想を得て,大規模な離散ホップフィールド記憶を小さな連続記憶に圧縮する手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:32:13 GMT)
Hierarchical Subspaces of Policies for Continual Offline Reinforcement Learning [19.5] 我々は,学習エージェントが獲得したスキルセットを維持しながら,新たなタスクに継続的に適応しなければならない継続的強化学習の仕組みを考察する。
オフラインデータからナビゲーション設定を継続学習するために設計された,新しい階層型フレームワークであるHiSPOを紹介する。
本研究では,MuJoCo迷路環境と複雑なゲームライクなナビゲーションシミュレーションの両方において,本手法の有効性を実験的に検証した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:30:11 GMT)
Data Metabolism: An Efficient Data Design Schema For Vision Language Model [19.1] データキュレーションは、強力なビジュアル言語モデルのトレーニングにおいて重要な役割を果たす。
既存の巨大なデータセットを処理し、ユーザ固有のデータフライホイールを構築する方法を示します。
我々は、典型的なマルチモーダルタスクに優れる、Capybara-VLというVLMをリリースする。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:20:54 GMT)
A Mechanism-Learning Deeply Coupled Model for Remote Sensing Retrieval of Global Land Surface Temperature [19.0] リモートセンシングデータから地表面温度(LST)を抽出することは、気候過程や地表面エネルギー予算を分析する上で重要である。
本稿では,単一チャネルLST検索の精度と一般化性を高めるため,メカニスティックモデリングと機械学習を統合した深い結合フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:19:01 GMT)
Explicit Uncertainty Modeling for Video Watch Time Prediction [19.0] ビデオレコメンデーションにおいて、システムのレコメンデーション精度を決定する重要なコンポーネントは、ウォッチタイム予測モジュールである。
この問題の鍵となる課題の1つは、ユーザのウォッチタイム動作である。
本稿では,ユーザの時計時間行動をよりよく活用する逆最適化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:19:19 GMT)
The Role of Machine Learning in Reducing Healthcare Costs: The Impact of Medication Adherence and Preventive Care on Hospitalization Expenses [19.0] 本研究は, 入院率の低下にともなう予防ケアと薬剤順守の重要性を明らかにする。
Logistic Regression、Gradient Boosting、Random Forest、Artificial Neural Networksの4つの機械学習モデルを使用して、5年間の入院リスクを予測する。
高用量と一貫した予防ケアを持つ患者は、入院リスクの38.3%と37.7%を減少させることができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:28:42 GMT)
Adaptive Bounded Exploration and Intermediate Actions for Data Debiasing [18.9] 適応的および有界探索によりトレーニングデータセットを逐次劣化させるアルゴリズムを提案する。
提案したアルゴリズムは、データバイアスの影響を緩和するという究極の目標との間にバランスを取ります。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 22:22:23 GMT)
Can LLMs Replace Human Evaluators? An Empirical Study of LLM-as-a-Judge in Software Engineering [18.8] 大規模言語モデル(LLM)は、コード生成のような様々なソフトウェアエンジニアリング(SE)タスクに取り組むためにデプロイされている。
Pass@kメトリックは、広範囲なユニットテストと設定された環境を必要とし、LLM生成したテキストの評価には適していない。
BLEUのような従来のメトリクスは、意味的類似性ではなく語彙のみを測定するが、精査されている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:33:55 GMT)
A Large-Scale Simulation on Large Language Models for Decision-Making in Political Science [18.5] 我々は,大規模投票者の意思決定をシミュレートする理論駆動多段階推論フレームワークを開発した。
我々は、現実の有権者データに校正された合成人格を用いて、最近のアメリカ合衆国大統領選挙の大規模なシミュレーションを行う。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:50:31 GMT)
Reconsidering Faithfulness in Regular, Self-Explainable and Domain Invariant GNNs [18.3] 忠実度を正確に問うことと、それをどのように達成するかを問うことで、異なる忠実度指標が存在することを示す。
インジェクティブな正規GNNアーキテクチャでは、完全に忠実な説明は完全に非形式的であることを証明している。
最後に,テキストフェースフルネスは分布外一般化と密接に関連していることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:55:25 GMT)
DeepSeek vs. o3-mini: How Well can Reasoning LLMs Evaluate MT and Summarization? [18.0] 推論可能な大規模言語モデル(LLM)は、最近、複雑な論理的および数学的タスクにおいて顕著な性能を示した。
本研究では,機械翻訳(MT)およびテキスト要約(TS)評価タスクにおいて,推論に基づくLLMと非推論のLLMを体系的に比較する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:39:18 GMT)
MOSAIC: Modeling Social AI for Content Dissemination and Regulation in Multi-Agent Simulations [17.8] 生成言語エージェントがユーザの行動を予測できる新しいオープンソースのソーシャルネットワークシミュレーションフレームワークMOSAICを提案する。
このシミュレーションは、LCMエージェントと有向なソーシャルグラフを組み合わせることで、創発的偽装行動を分析し、ユーザがオンラインソーシャルコンテンツの正確性をどのように判断するかをよりよく理解する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:06:54 GMT)
POWQMIX: Weighted Value Factorization with Potentially Optimal Joint Actions Recognition for Cooperative Multi-Agent Reinforcement Learning [17.6] 値関数分解法は、協調型マルチエージェント強化学習において一般的に用いられる。
本稿では, 潜在的に最適な関節動作を認識し, トレーニング中の損失により高い重みを割り当てるPOWQmix(Possally Optimal Joint Actions Weighted Qmix)アルゴリズムを提案する。
行列ゲーム,難易度の高い捕食者前処理,およびStarCraft II Multi-Agent Challenge環境における実験により,我々のアルゴリズムは最先端の値に基づくマルチエージェント強化学習法よりも優れていることを示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:21:52 GMT)
A Multimedia Analytics Model for the Foundation Model Era [17.0] 本稿では,基盤モデル時代を対象とした包括的マルチメディア分析モデルを提案する。
我々のモデルは、技術と概念の両方の観点から、視覚分析エージェントに基づく統合された人間とAIのコラボレーションを強調している。
このモデルは、インテリジェンス分析、調査ジャーナリズム、および複雑で高精度なデータを扱う他の分野といった、センシティブな領域における実践的な課題に対処する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:52:41 GMT)
The AI Scientist-v2: Workshop-Level Automated Scientific Discovery via Agentic Tree Search [16.9] AI Scientist-v2は、AIが生成した最初のピアレビュー受け入れワークショップ用紙を生産できるエンドツーエンドのエージェントシステムである。
科学的な仮説を反復的に定式化し、実験を設計し、実行し、データを分析し、視覚化し、科学的な原稿を自律的に作成する。
ある写本は、平均的な人間の受け入れ閾値を超える十分なスコアを達成し、完全なAI生成論文がピアレビューをうまくナビゲートした最初の事例となった。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:44:41 GMT)
TALE: A Tool-Augmented Framework for Reference-Free Evaluation of Large Language Models [16.9] 大規模言語モデル(LLM)は、現実の自律型アプリケーションに統合されつつある。
評価のための静的な注釈付き参照に頼ることは、コスト、スケーラビリティ、完全性において大きな課題を引き起こす。
提案するツール拡張LDM評価(TALE: Tool-Augmented LLM Evaluation)は,LLMの出力を所定の基礎的回答なしで評価するフレームワークである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:08:41 GMT)
A smoothed-Bayesian approach to frequency recovery from sketched data [16.2] 計算機科学と情報理論の交わりにおける古典的問題に関する新しい統計的視点を提供する。
ランダムハッシュを用いて得られた圧縮表現やスケッチのみを用いて,大規模な離散データセットにおけるシンボルの実証周波数を復元する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:21:29 GMT)
Driving by the Rules: A Benchmark for Integrating Traffic Sign Regulations into Vectorized HD Map [15.6] 交通標識から運転規則を抽出するためのデータセットであるMapDRを紹介する。
MapDRには1万ドル以上の注釈付きビデオクリップがあり、交通標識規則と車線との複雑な相関関係を捉えている。
交通標識規則の統合において重要なギャップを埋め、信頼性の高い自動運転システムの開発に寄与する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:13:00 GMT)
Generalization Error Bounds for Learning under Censored Feedback [15.4] 学習理論からの一般化誤差は、以前に見つからなかったデータに対してアルゴリズムがどれだけうまく機能するかを統計的に保証する。
このような境界に対する検閲されたフィードバックによるデータ非IIDnessの影響を特徴付ける。
既存の一般化誤差境界がモデルの一般化保証を正しく捕捉できないことを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:45:54 GMT)
Atomic structure analysis of PL5 in silicon carbide with single-spin spectroscopy [15.4] 4H多型ケイ素炭化ケイ素(4H-SiC)における希薄(VV)スピン欠陥は、量子情報処理と量子センシングの候補として浮上している。
本研究では, PL5-6と積層断層の相関画像化を行い, PL5-6が積層断層と関係がないことを示す。
PL5の構造解像度は、制御可能な製造に向けての第一歩として始まり、様々な用途への道を開いた。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:39:40 GMT)
Efficient Heterogeneous Large Language Model Decoding with Model-Attention Disaggregation [15.4] トランスフォーマーベースの大規模言語モデル(LLM)は、生成タスクにおいて顕著なパフォーマンスを示すと同時に、現実のサービスにおいて大きな課題をもたらす。
LLMデコーディングの効率を高めるために,モデルアテンションデアグリゲーションを導入する。
分散ヘテロジニアスクラスタにモデルアテンションデアグリゲーションを組み込んだLLM推論システムであるLaminaを開発し,展開する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:56:01 GMT)
Adaptive Detection of Fast Moving Celestial Objects Using a Mixture of Experts and Physical-Inspired Neural Network [15.3] 本稿では,恒星場内を高速に移動する天体を検出するための新しいアルゴリズムを提案する。
我々のアプローチは、物理的にインスパイアされたニューラルネットワークに変換することで、最先端の高速移動天体検出ニューラルネットワークを強化する。
その結果,観測モードの異なる天体の高速移動を効果的に検出できることが示唆された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:15:30 GMT)
Distilling Knowledge from Heterogeneous Architectures for Semantic Segmentation [15.3] ヘテロAKDという異種の観点から意味的セグメンテーションのための汎用知識蒸留法を初めて提案する。
建築特化情報の影響をなくすため、教師と生徒の中間的特徴を整列ロジット空間に巧みに投影する。
種々の教師と学生のペアを用いた3つのメインストリームベンチマーク実験により、ヘテロAKDは異種建築間の蒸留を促進するために最先端のKD法より優れていることが示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 12:24:58 GMT)
LLM4Ranking: An Easy-to-use Framework of Utilizing Large Language Models for Document Reranking [15.1] 我々は,オープンソースやクローズドソースのAPIベースのLCMを用いて,ユーザが異なるランキング手法を適用可能な統一フレームワークである textbfLLM4Ranking を導入する。
我々のフレームワークは、LLMで文書を再ランク付けするためのシンプルでインターフェイスを提供し、また、このタスクの使い易い評価と微調整スクリプトを提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:08:38 GMT)
Affordable AI Assistants with Knowledge Graph of Thoughts [15.0] 大規模言語モデル(LLM)は、ドメイン間で多様なタスクを実行できるAIアシスタントの開発に革命をもたらしている。
我々は、LLM推論と動的に構築された知識グラフ(KGs)を統合する革新的なAIアシスタントアーキテクチャであるKGoT(Knowledge Graph of Thoughts)を提案する。
KGoTはGAIAベンチマークのタスク成功率をGPT-4o miniのHugging Face Agentsと比較して29%改善し、GPT-4oのコストを36倍以上削減した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:44:34 GMT)
Routing to the Right Expertise: A Trustworthy Judge for Instruction-based Image Editing [14.8] 現在のIIE評価手法は、人間の判断と一致せず、説明性に欠けることが多い。
我々はこれらの制約に対処するため、JUdgement through Routing of Expertise (JURE)を提案する。
JUREは2つの側面において信頼性が高い。まず、ルーティングされた専門家とそのフィードバックを調べることで、審査員に関する説明を徹底的に行うことができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:30:15 GMT)
Adversarial Attacks on AI-Generated Text Detection Models: A Token Probability-Based Approach Using Embeddings [14.2] 本研究では,Fast-DetectGPTなどの検出モデルに対する新たなテキスト逆攻撃を提案する。
この手法では、AI生成したテキストの再構築を目的として、データ摂動の埋め込みモデルを用いて、テキストの真の起源を検出する可能性を低減する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:46:55 GMT)
The Gradient Puppeteer: Adversarial Domination in Gradient Leakage Attacks through Model Poisoning [14.1] Federated Learning (FL)では、クライアントはデータをローカルに保ちながら、中央サーバと勾配を共有する。
悪意のあるサーバーは、クライアントのデータを共有勾配から再構築するために、故意にモデルを操作できる。
我々は,クライアント側検出を回避しつつ,完全な攻撃カバレッジを実現する最初のAGLAであるEGGV(Enhanced Gradient Global Vulnerability)を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:55:11 GMT)
RelCon: Relative Contrastive Learning for a Motion Foundation Model for Wearable Data [14.1] 本稿では,ウェアラブル加速度センサを用いた運動基礎モデルの学習のための,自己指導型相対的コントラスト学習手法であるRelConを提案する。
まず、学習可能な距離尺度をトレーニングし、モチーフの類似性とドメイン固有の意味情報をキャプチャする。
我々は,ウェアラブルの動作データを用いた基礎モデルの,異なる評価課題における一般化可能性を示す最初の人物である。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 22:16:56 GMT)
DPImageBench: A Unified Benchmark for Differentially Private Image Synthesis [13.9] 差分プライベート(DP)画像合成は、データセット内の個々の画像のプライバシーを保護しながら、機密画像の特性を保持する人工画像を生成することを目的としている。
近年の進歩にもかかわらず、不整合かつ時には欠陥のある評価プロトコルが研究全体で適用されている。
本稿では,DP画像合成のためのDPImageBenchについて述べる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:52:27 GMT)
The KL3M Data Project: Copyright-Clean Training Resources for Large Language Models [13.9] KL3M Data Projectは、著作権や契約違反に関連するリスクを最小限に抑える、最大の総合的なトレーニングデータパイプラインを導入している。
このプロジェクトの基礎は、1億3200万以上のドキュメントと、厳格な著作権およびライセンスプロトコルを満たすために検証された16の異なるソースにまたがる数兆のトークンからなるコーパスである。
これらのリソースはすべて、CC-BY条項の下で、S3、Hugging Face、GitHubで無料で公開されている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:31:17 GMT)
PR-Attack: Coordinated Prompt-RAG Attacks on Retrieval-Augmented Generation in Large Language Models via Bilevel Optimization [13.8] 大規模言語モデル(LLM)は、幅広いアプリケーションで顕著な性能を示している。
それらはまた、時代遅れの知識や幻覚への感受性のような固有の制限も示している。
近年の取り組みはRAGベースのLLMのセキュリティに重点を置いているが、既存の攻撃方法は3つの重大な課題に直面している。
本稿では,少数の有毒テキストを知識データベースに導入する新しい最適化型攻撃であるPrompt-RAGアタック(PR-アタック)を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:09:50 GMT)
STEI-PCN: an efficient pure convolutional network for traffic prediction via spatial-temporal encoding and inferring [13.5] 本稿では,空間時空間符号化と推論による交通予測のための効率的な純粋畳み込みネットワークを提案する。
時間的拡張因果畳み込みネットワークの3層は、長距離時間的相関を捉えるために使用される。
このモデルは、ゲートアクティベートされたオリジナル、局所同期継手時空間時間的特徴と長距離時間的特徴を統合し、包括的な予測を実現する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:32:56 GMT)
Gen3DEval: Using vLLMs for Automatic Evaluation of Generated 3D Objects [13.3] 我々は3次元オブジェクト品質評価のための新しい評価フレームワークGen3DEvalを紹介する。
Gen3DEvalは3次元表面正規解析によりテキストの忠実度、外観、表面品質を評価する。
Gen3DEvalは、最先端のタスク非依存モデルと比較して、ユーザアライメント評価において優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:57:40 GMT)
Counting Hours, Counting Losses: The Toll of Unpredictable Work Schedules on Financial Security [13.3] 一貫性のある作業スケジュールに依存することができないことは、燃え尽き、仕事と家族の対立、財政的なショックにつながります。
予想外の収益変動は金融計画に課題をもたらす。
金融不確実性の中で個人が有効性を最適化する方法をモデル化するシミュレーションフレームワークを開発する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:09:56 GMT)
Prism: Dynamic and Flexible Benchmarking of LLMs Code Generation with Monte Carlo Tree Search [13.1] 静的ベンチマークは、LLM(Large Language Models)の機能の深さと幅を捉えていない。
包括的LLM評価のために設計されたフレキシブルで動的なベンチマークフレームワークであるPrismを紹介する。
Prismは,(1)マルコフ決定過程として評価をモデル化した木に基づく状態表現,(2)困難な評価シナリオを明らかにするために適応したモンテカルロ木探索アルゴリズム,(3)多様な能力の同時評価を可能にするマルチエージェント評価パイプラインである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:06:05 GMT)
Large-Scale Analysis of Online Questions Related to Opioid Use Disorder on Reddit [13.1] オピオイド使用障害(Opioid use disorder, OUD)は、個人の健康や公衆衛生に影響を及ぼす主要な健康問題である。
さまざまなソーシャルメディアプラットフォーム上で、リカバリとサポートのためのオンラインコミュニティが形成された。
我々は,RedditにおけるOUD関連談話の文脈で質問される自然言語質問について検討した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:02:24 GMT)
Exploring a Patch-Wise Approach for Privacy-Preserving Fake ID Detection [13.0] 本研究は,フィールド内のいくつかの制限をカバーした偽ID検出の話題に焦点を当てた。
実際のIDドキュメントから公開されているデータは存在せず、ほとんどの研究はプライバシ上の理由から利用できない独自データベースに依存している。
プライバシ保護型偽ID検出のためのパッチワイドアプローチを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:01:22 GMT)
Program Skeletons for Automated Program Translation [12.9] 我々は,プログラムスケルトンと呼ばれるフレームワークに基づいて,そのような翻訳を自動化するための新しい,体系的なアプローチを提案する。
プログラムスケルトンは、低レベルの具体的なコードフラグメントを抽象化し、効果的に要約することで、ソースプログラムの高レベルな構造を保持します。
最も重要なことは、個々の断片が正しく翻訳され、機械的に翻訳された骨格と一緒に取られた場合、最終的な翻訳プログラムは全体として正しいとみなすことができることである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:25:17 GMT)
Efficient and Responsible Adaptation of Large Language Models for Robust and Equitable Top-k Recommendations [12.8] 我々は,すべてのユーザグループに公平にサービスを提供することで,社会的利益を促進するために設計されたハイブリッドタスク割り当てフレームワークを提案する。
実世界の3つのデータセットによる結果から,ユーザ数が大幅に減少し,不均等にコストを増大させることなく,サブポピュレーションに対するロバスト性が改善された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:54:51 GMT)
The Inadequacy of Similarity-based Privacy Metrics: Privacy Attacks against "Truly Anonymous" Synthetic Datasets [12.7] 実世界の合成データデプロイメントで使用されるプライバシメトリクスを調べ、その信頼性をいくつかの点で実証する。
ReconSynは、メトリクスによってプライベートと見なされるが、個々のレコードに固有の情報をリークする複数の合成データセットを生成するリコンストラクション攻撃である。
ReconSynは列車データから78-100%のアウトレーヤを復元し、ブラックボックスアクセスのみを1つの適合した生成モデルとプライバシメトリクスに含める。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:50:14 GMT)
Beyond Feature Importance: Feature Interactions in Predicting Post-Stroke Rigidity with Graph Explainable AI [12.7] 筋緊張と硬さを特徴とする後ストローク剛性は、生存者の移動性や生活の質に大きな影響を及ぼす。
本研究は,グラフに基づく説明可能なAIによって特徴的相互作用を強調することによって,ストローク後の剛性を予測するという課題に対処する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 22:20:22 GMT)
SlimSpeech: Lightweight and Efficient Text-to-Speech with Slim Rectified Flow [12.6] 整流に基づく軽量かつ効率的な音声合成システムであるSlimSpeechを紹介する。
実験の結果,提案手法は1ステップのサンプリングにより大規模モデルに匹敵する性能を示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:15:18 GMT)
Stochastic Smoothed Primal-Dual Algorithms for Nonconvex Optimization with Linear Inequality Constraints [12.6] 線形不等式制約を用いた非コンパクト最適化問題に対するスムーズな原始双対アルゴリズムを提案する。
我々のアルゴリズムは、各サンプルの1つの勾配に基づいて、シングルループの反復である。
既存の手法とは異なり、我々のアルゴリズムは自由なサブ、大きなサイズ、パラメータの増加であり、実現可能性を保証するためにデュアル変数更新を使用する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:59:43 GMT)
V2V3D: View-to-View Denoised 3D Reconstruction for Light-Field Microscopy [12.4] 光電場顕微鏡(LFM)は、スナップショットベースで大規模な3D蛍光画像の撮影が可能であるため、注目されている。
既存のLFM再構成アルゴリズムは、センサーノイズに非常に敏感であるか、あるいはトレーニングのためにハード・トゥ・ザ・グラウンド・トゥルース・アノテート・データを必要とする。
本稿では,V2V3Dについて紹介する。V2V3Dは教師なしのビュー2ビューベースのフレームワークで,画像復調と3D再構成の協調最適化のための新しいパラダイムを確立する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:29:26 GMT)
GaussianSpa: An "Optimizing-Sparsifying" Simplification Framework for Compact and High-Quality 3D Gaussian Splatting [12.3] 3D Gaussian Splatting (3DGS) は、ガウス関数の連続的な集合を利用して、新しいビュー合成の主流として登場した。
3DGSは、ガウシアンの多さを記憶するためのかなりのメモリ要件に悩まされており、その実用性を妨げている。
コンパクトで高品質な3DGSのための最適化ベースの単純化フレームワークであるGaussianSpaを紹介する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:57:18 GMT)
OmniScience: A Domain-Specialized LLM for Scientific Reasoning and Discovery [12.3] 一般科学のための専門的な大規模推論モデルであるOmniScienceを紹介する。
我々は、分子を潜在的電解質溶媒または添加剤として効率よくランク付けする電池剤を開発した。
我々は,ドメイン適応型事前学習と推論に基づく知識蒸留が性能レベルを達成するために重要であることをアブレーション実験で実証した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:58:21 GMT)
Over-Relying on Reliance: Towards Realistic Evaluations of AI-Based Clinical Decision Support [12.2] 私たちは、AIのタスクにおける信頼、信頼、受け入れ、パフォーマンスといった評価指標を超えて進むことを提唱します。
私たちはコミュニティに、AIが医療専門家にもたらす創発的な価値を計測する、生態学的に有効な、ドメインに適した研究環境を優先するよう呼びかけています。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:28:56 GMT)
Merging Embedded Topics with Optimal Transport for Online Topic Modeling on Data Streams [12.2] StreamETMはEmbeded Topic Model (ETM)上に構築され、データストリームを処理する。
オンライン変更点検出アルゴリズムは、時間とともにトピックの変化を特定するために使用される。
シミュレーションおよび実世界のデータに関する数値実験は、StreamETMがライバルより優れていることを示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:04:56 GMT)
Between Linear and Sinusoidal: Rethinking the Time Encoder in Dynamic Graph Learning [12.2] TGATやDyGFormerのようなセミナルアテンションベースのモデルは、エッジイベント間の時間的関係を捉えるために正弦波時間エンコーダに依存している。
本稿では,正弦波関数による時間情報損失を回避する線形時間エンコーダを提案する。
自己注意機構は線形時間エンコーディングから時間スパンを効果的に学習し、関連する時間パターンを抽出できることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:12:10 GMT)
Model Discrepancy Learning: Synthetic Faces Detection Based on Multi-Reconstruction [12.2] 合成画像とそれに対応する生成技術との本質的な関係について検討する。
その結果, 異なる生成法にまたがって, 画像の再構成の相違が顕著であることが判明した。
複数の生成モデルを用いて画像の逆変換と再構成を行うことで、実画像、GAN生成画像、DM生成画像の再構成差を解析する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:54:02 GMT)
Towards Unconstrained 2D Pose Estimation of the Human Spine [12.1] SpineTrackは、制約のない環境で2Dスピンのポーズ推定のための最初の包括的なデータセットである。
SpinePoseを導入し、知識蒸留と解剖学的正則化戦略を用いて、身体と脊椎のキーポイントを共同で予測する、最先端のボディポーズ推定装置を拡張した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:11:02 GMT)
TokenFocus-VQA: Enhancing Text-to-Image Alignment with Position-Aware Focus and Multi-Perspective Aggregations on LVLMs [12.1] TokenFocus-VQAは、位置特異的確率最適化を伴う視覚質問応答(VQA)パラダイムを通じてLVLM(Large Vision-Language Models)を活用する新しい評価フレームワークである。
我々の重要な革新は、重要な意味要素に対応する事前定義された語彙位置の確率分布に選択的にフォーカスするトークン認識損失関数を設計することである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:37:13 GMT)
On the Practice of Deep Hierarchical Ensemble Network for Ad Conversion Rate Prediction [12.0] 本稿では,DHENを単一のバックボーンモデルアーキテクチャとして用いたマルチタスク学習フレームワークを提案する。
我々は,CVR予測のために,オンサイトリアルタイムユーザ行動シーケンスとオフサイト変換イベントシーケンスの両方を構築した。
本手法は,事前学習したユーザパーソナライズ機能付き単一機能横断モジュールと比較して,最先端性能を実現する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:41:34 GMT)
MUFFLER: Secure Tor Traffic Obfuscation with Dynamic Connection Shuffling and Splitting [12.0] MUFFLERはTorの外部トラフィックを確保するために設計された接続レベルの交通難読化システムである。
実際の接続を最終Torノードとターゲットサービスの間の異なる仮想接続のセットにマッピングする。
既存のソリューションよりも最大で27倍のレイテンシオーバーヘッドを実現し、現在のTorアーキテクチャとシームレスに統合される。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:17:17 GMT)
Orchestrating Agents and Data for Enterprise: A Blueprint Architecture for Compound AI [11.9] 企業アプリケーションのためのエージェントとデータをオーケストレーションするための複合AIシステムのための「青写真アーキテクチャ」を提案する。
エンタープライズにおける既存のプロプライエタリなモデルとAPIは、'エージェントレジストリ'で定義された'エージェント'にマップされる。
エージェントは、さまざまなモダリティのエンタープライズデータを同じように登録する'データレジストリ'を通じて、プロプライエタリなデータを利用することができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 22:19:41 GMT)
Stable and Efficient Charging of Superconducting C-shunt Flux Quantum Batteries [11.8] 超伝導磁束量子ビットのユニークなエネルギー準位構造を利用して帯電過程を実験的に最適化する。
本研究は,3レベル量子電池の実現に向けた理想的な候補として,静電容量型量子ビットプラットフォームの可能性を強調した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:26:49 GMT)
ThermoStereoRT: Thermal Stereo Matching in Real Time via Knowledge Distillation and Attention-based Refinement [9.9] 本研究では,リアルタイムなサーマルステレオマッチング手法であるThermoStereoRTを紹介する。
2つの補正された熱ステレオ画像から相違を回復する。
夜間ドローン監視や下層クリーニングロボットなどの応用を想定する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:24:21 GMT)
Understanding Learner-LLM Chatbot Interactions and the Impact of Prompting Guidelines [9.8] 本研究は,学習者とAIの相互作用を,参加者が効果的なプロンプトの構造化指導を受ける教育実験を通して調査する。
ユーザの行動を評価し,有効性を促進するために,107人のユーザから642のインタラクションのデータセットを解析した。
我々の研究は、ユーザーが大規模言語モデルとどのように関わり、AI支援コミュニケーションを強化するための構造化された指導の役割についてより深く理解している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:20:43 GMT)
Exploring Human-Like Thinking in Search Simulations with Large Language Models [9.8] ユーザ検索行動のシミュレーションは情報検索において重要な課題である。
大規模言語モデル(LLM)の最近の進歩は、人間のようなアクションを生成する新しい可能性を開く。
我々は,LLMを利用してユーザの隠れ認知過程をシミュレートすることで,人間的な思考を探索シミュレーションに統合することを検討する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:04:58 GMT)
Rethinking the Foundations for Continual Reinforcement Learning [9.8] 従来のRLのコア基盤の多くは、継続的な強化学習の目標に反するものであることを示唆する。
マルコフ決定過程の定式化、最適政策への焦点、評価基準として期待される報酬の合計、エピソードベンチマーク環境の4つの基礎を列挙する。
連続的な学習環境に適した4つの基礎の代替集合を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:05:56 GMT)
FOLDER: Accelerating Multi-modal Large Language Models with Enhanced Performance [9.8] 視覚トークン列の長さを削減するために設計された,シンプルで効果的なプラグアンドプレイモジュールであるFOLDERを紹介する。
我々は、異なる還元戦略によってもたらされた情報損失を分析し、視覚的冗長性を取り除きながら鍵情報を保存するFOLDERを開発した。
FOLDERは、オリジナルのモデルと同等またはそれ以上のパフォーマンスを達成すると同時に、最大70%のビジュアルトークンを削除することで、複雑さを劇的に低減する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 12:10:28 GMT)
Drama: Mamba-Enabled Model-Based Reinforcement Learning Is Sample and Parameter Efficient [9.5] 本稿では,SSM(State Space Model)ベースの世界モデルDramaを提案し,メモリと計算の複雑さを$O(n)$で実現した。
また, 早期のトレーニングにおいて, 誤った世界モデルによって引き起こされる準最適性を緩和する新しいサンプリング手法を提案する。
ドラマは、標準のラップトップのような市販のハードウェアでアクセス可能で、トレーニングできる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:08:42 GMT)
Opinion de-polarization of social networks with GNNs [9.5] そこで本研究では,適切なKユーザを識別する効率的なアルゴリズムを提案し,トピックに関する適度なスタンスを採用すると,偏極が最小となるようにした。
我々のアルゴリズムはグラフニューラルネットワークを採用しており、他の手法よりも大きなグラフを効果的に処理することができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:56:22 GMT)
Minimum width for universal approximation using squashable activation functions [9.4] 一般活性化関数を用いたネットワークの最小幅について検討する。
スカッシュ可能なアクティベーション関数を用いて$Lp$関数を普遍的に近似するネットワークの場合、最小幅は$d_x=d_y=1$でない限り$maxd_x,d_y,2$である。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:23:24 GMT)
POEM: Precise Object-level Editing via MLLM control [9.3] マルチモーダル大言語モデル(MLLM)を用いたオブジェクトレベルの精密編集のためのフレームワークであるPOEMを提案する。
POEMはMLLMを利用して命令のプロンプトを分析し、変換前後に正確なオブジェクトマスクを生成する。
この構造化推論段階は、拡散に基づく編集プロセスをガイドし、正確なオブジェクトの局所化と変換を保証する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:12:00 GMT)
Uni-PrevPredMap: Extending PrevPredMap to a Unified Framework of Prior-Informed Modeling for Online Vectorized HD Map Construction [9.2] 我々は、以前の予測を統合し、古いHDマップをシミュレートした、統合された事前インフォームドフレームワークUni-PrevPredMapを提案する。
Uni-PrevPredMapは、確立されたオンラインベクトル化HDマップ構築ベンチマーク間で、マップ依存シナリオにおける最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:39:55 GMT)
CatCMA with Margin: Stochastic Optimization for Continuous, Integer, and Categorical Variables [9.1] 本研究では,混合可変ブラックボックス最適化(MV-BBO)に焦点を当てる。
連続変数、整数変数、カテゴリー変数に対処する。
混合カテゴリブラックボックス最適化法であるMargin (CatCMAwM) を用いたCatCMAを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:59:22 GMT)
Revisiting Prompt Optimization with Large Reasoning Models-A Case Study on Event Extraction [8.9] DeepSeek-R1やOpenAI o1のような大きな推論モデル(LRM)は、様々な推論タスクにおいて顕著な能力を示している。
中間的な思考を創造し、推論する強力な能力は、人間の指示を解釈するために、より広範な急進的な工学や最適化をもはや必要としないかもしれないという議論につながった。
本研究では,イベント抽出の構造化課題を事例スタディとして,このオープンな質問を体系的に研究することを目的とする。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 00:53:59 GMT)
Can Geometry Save Central Views for Sports Field Registration? [8.8] シングルフレームのスポーツフィールド登録は、放送ビデオから3D情報を抽出する基盤となっている。
本稿では,円対応から一組の点と線を導出する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:40:42 GMT)
GSDeformer: Direct, Real-time and Extensible Cage-based Deformation for 3D Gaussian Splatting [8.7] 本稿では,3次元ガウス切削におけるケージベースの変形を可能にするGSDeformer(3DGS)を提案する。
提案手法は,プロキシポイントクラウド表現を用いて,ケージベースの変形と3DGSをブリッジする。
実験により、GSDeformerは既存の方法よりも優れた変形結果を提供し、極端な変形下で頑健であり、編集のトレーニングを必要とせず、リアルタイムに動作し、他の3DGS亜種にも拡張可能であることが示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:29:02 GMT)
Potential Field Based Deep Metric Learning [8.7] ディープ・メトリック・ラーニング(Deep metric learning)とは、意味的に意味のある表現空間を学習するネットワークである。
連続ポテンシャル場による各例(埋め込み)の影響を表す新しいDMLモデルを提案する。
このような減衰は,クラス内変動が大きく,ラベルノイズも大きい実世界のデータセットの性能向上に有効であることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:49:39 GMT)
Learning Long Short-Term Intention within Human Daily Behaviors [8.6] ロボットにとって、人間の振る舞いを理解し、適切なサービスを提供することがもっとも重要である。
伝統的に、人間は欠陥のないと認識され、その決定はロボットが整合しようとする基準として機能する。
我々は「長期的短期意図予測」と呼ばれるユニークな課題を提示する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:50:18 GMT)
Multi-Party Private Set Operations from Predicative Zero-Sharing [8.3] 我々はMPSOフレームワークを提案し、これはm個のパーティがそれぞれ集合を持ち、それぞれのプライベート集合上の任意の集合公式を安全に計算することを可能にする。
我々のフレームワークは非常に多用途であり、幅広いMPSO機能に対応できるようにインスタンス化することができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:38:10 GMT)
What the HellaSwag? On the Validity of Common-Sense Reasoning Benchmarks [8.0] HellaSwagは,評価に最も広く用いられているベンチマークの一つである。
このベンチマークは, 常識的推論を正確に測定するものではないため, 現状の評価には使用すべきではない。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:01:46 GMT)
Security Vulnerabilities in Ethereum Smart Contracts: A Systematic Analysis [7.9] 本稿では、Etherスマートコントラクトに焦点を当て、Etherの主なコンポーネントであるスマートコントラクトアーキテクチャとメカニズムを説明します。
American Chain, The, Parity, KotETの4つのセキュリティイベントによると、整数オーバーフロー攻撃、再帰攻撃、アクセス制御攻撃、サービスアタックの否定の原則を研究し、分析した。
予防措置がとられています
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:48:10 GMT)
Generative Artificial Intelligence for Internet of Things Computing: A Systematic Survey [7.8] IoT(Internet of Things)におけるGenerative Artificial Intelligence(GenAI)の統合は、大きな関心を集めている。
本調査は,これらの主流パラダイムの収束に伴う可能性,課題,考察を概観することを目的としている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:32:18 GMT)
Managing Security Issues in Software Containers: From Practitioners Perspective [7.7] コンテナ化されたプロジェクトのセキュリティは、データ漏洩とパフォーマンスの低下につながる重要な課題である。
本研究の目的は,コンテナ化されたプロジェクトにおけるセキュリティ管理を,実践者がセキュリティ問題をどのように認識するかを探索することにある。
私たちの分析では、セキュリティを強化するために使用できる技術的および非技術的イネーブラーも特定しました。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 12:49:00 GMT)
Realigning Incentives to Build Better Software: a Holistic Approach to Vendor Accountability [7.6] より良い品質のソフトウェアに関する課題は、不整合したインセンティブの連続による小さな部分によるものではない、と私たちは主張する。
責任の欠如は、ソフトウェアベンダがあらゆるインセンティブを持って、低品質のソフトウェアを市場に投入することを意味する。
この記事では、より良い、よりセキュアなソフトウェア開発にインセンティブを与えるために必要な、総合的な技術とポリシーのフレームワークを概説する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:05:24 GMT)
Wanting to be Understood [7.4] 本稿では,人間には理解の基本的な動機があるという仮説を,相互認識の本質的な動機として考察する。
知覚横断パラダイムのシミュレーションを通じて、強化学習エージェントにおける様々な内的報酬関数の効果について検討する。
その結果, 人工好奇心だけでは社会的相互作用を優先しないが, 相互理解を重視した報酬が, 相互作用の優先順位付けに成功していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:46:00 GMT)
Designing Universal Causal Deep Learning Models: The Case of Infinite-Dimensional Dynamical Systems from Stochastic Analysis [7.4] 解析におけるいくつかの非線形作用素は、現代のニューラル作用素によって利用されていない時間構造に依存している。
本稿では,無限次元線形距離空間を適切に扱うディープラーニングモデル設計フレームワークを提案する。
我々のフレームワークはコンパクトな集合や任意の有限時間地平線 H" や滑らかなトレースクラス作用素に対して均一に近似できることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:41:03 GMT)
ConceptFormer: Towards Efficient Use of Knowledge-Graph Embeddings in Large Language Models [6.9] 本稿では,Wikidataから構造化知識を付加した大規模言語モデルの拡張手法であるConceptFormerを紹介する。
ConceptFormerは、KGノードをそれぞれの概念ベクトルにマッピングする包括的なルックアップテーブルを生成する。
実験により、GPT-2 0.1Bに概念ベクトルを追加することで、実際のリコール能力(Hit@10)が最大で272%向上することが示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:17:08 GMT)
CVE-Bench: A Benchmark for AI Agents' Ability to Exploit Real-World Web Application Vulnerabilities [6.8] 大規模言語モデル(LLM)エージェントは、サイバー攻撃を自律的に行う能力が高まっている。
既存のベンチマークは、抽象化されたCapture the Flagコンペティションに制限されているか、包括的なカバレッジが欠如しているため、不足している。
私たちはCVE-Benchを紹介します。CVE-Benchは、クリティカルシヴァリティ・コモン・脆弱性と露出に基づく、現実世界のサイバーセキュリティベンチマークです。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:50:28 GMT)
Hamiltonian Dynamics Learning: A Scalable Approach to Quantum Process Characterization [6.7] 短時間のハミルトン力学に特化して設計された効率的な量子プロセス学習法を提案する。
我々は、量子機械学習の応用を実証し、このプロトコルは、ユニタリ変換を直接学習することで、変分量子ニューラルネットワークの効率的なトレーニングを可能にする。
この研究は、実用的な量子力学学習のための新しい理論的基盤を確立し、短期的およびフォールトトレラントな量子コンピューティングの両方においてスケーラブルな量子プロセスのキャラクタリゼーションの道を開いた。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:24:42 GMT)
AiGAS-dEVL-RC: An Adaptive Growing Neural Gas Model for Recurrently Drifting Unsupervised Data Streams [6.7] 本研究は,急激な再帰流を処理するために,GNGアルゴリズムに基づく新しい手法を提案する。
提案手法はコンパクトだが情報的なメモリ構造を維持しており,過去の概念や再帰概念の知識を効率的に保存し,検索することができる。
繰り返し知識を活用できない他の手法とは異なり、提案手法は、教師なしドリフトデータフローに対する堅牢で効率的なオンライン学習ソリューションであることが証明されている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:38:14 GMT)
Decomposition-Based Optimal Bounds for Privacy Amplification via Shuffling [6.7] Shufflingは、より強力なプライバシーユーティリティトレードオフを提供する、差分プライバシー保証を増幅することが示されている。
我々は,すべての可能な分解を包含する統合分析フレームワーク,すなわち一般的なクローンパラダイムを導入する。
最適なプライバシアンプリフィケーション境界の正確な値を計算するための,単純かつ効率的なアルゴリズムを開発した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:11:17 GMT)
Playmate: Flexible Control of Portrait Animation via 3D-Implicit Space Guided Diffusion [6.7] Playmateは、より生き生きとした表情と話す顔を生成するために提案されている。
最初の段階では、より正確な属性の絡み合いを容易にするために、分離された暗黙の3D表現を導入する。
第2段階では、感情制御情報を潜在空間にエンコードする感情制御モジュールを導入する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:28:08 GMT)
Enhancing Time Series Forecasting via Multi-Level Text Alignment with LLMs [6.6] 大規模言語モデル(LLM)を用いた時系列予測のための多段階テキストアライメントフレームワークを提案する。
本手法は,時系列をトレンド,季節,残留成分に分解し,コンポーネント固有のテキスト表現に再プログラムする。
複数のデータセットに対する実験により,提案手法は高い解釈性を提供しながら,最先端のモデルよりも精度が高いことを示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:02:37 GMT)
Unveiling the Impact of Multimodal Features on Chinese Spelling Correction: From Analysis to Design [6.6] 中国語のspelling Correction(CSC)タスクは、文中のスペルエラーを検出し、修正することに焦点を当てている。
LLMはCSC(特に過補正)の制限に直面しており、このタスクには最適ではない。
中国語スペル訂正のための新しいマルチモーダルモデルである textbfNamBert を導入する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:19:09 GMT)
A Case Study on Evaluating Genetic Algorithms for Early Building Design Optimization: Comparison with Random and Grid Searches [6.5] 本研究は,早期設計最適化における遺伝的アルゴリズムの有効性を評価する。
本研究は,RSが最適解を欠いたとしても,厳密な計算限界下では予期せぬ有効性を示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:07:59 GMT)
Estimation of High-Dimensional Markov-Switching VAR Models with an Approximate EM Algorithm [6.5] 高次元時系列におけるレジームシフトは、金融への多くの応用において自然に生じる。
本稿では,マルコフスイッチングモデルに対するEMアルゴリズムを提案する。
また,てんかん発作を発症した患者に記録された脳脳波データセットを解析し,そのアルゴリズムを実証した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:39:06 GMT)
Throughput-Optimal Scheduling Algorithms for LLM Inference and AI Agents [6.3] 我々は,LLM推論の待ち行列の基礎を開発し,待ち行列とLLMシステムコミュニティのギャップを埋める。
大規模な'作業保守'スケジューリングアルゴリズムが、個々のリクエストとAIエージェントのワークロードの両方で最大スループットを達成できることを証明する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 00:12:12 GMT)
Synthetic CT Generation from Time-of-Flight Non-Attenutaion-Corrected PET for Whole-Body PET Attenuation Correction [6.1] 本研究では,時系列非減衰補正(NAC)PET画像から直接合成CT(sCT)画像を生成するためのディープラーニング手法を提案する。
まず,CT-CT再構成作業のための大規模自然画像データセットを用いた事前学習モデルについて検討した。
TOF NAC PET画像から骨と軟部組織を再構築した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:49:41 GMT)
Catch Me if You Search: When Contextual Web Search Results Affect the Detection of Hallucinations [5.9] 近年,ウェブ検索の結果を大規模言語モデル (LLM) に統合することで,人々が生成したコンテンツの検証に利用するかどうかが疑問視されている。
本研究では,LLM生成コンテンツの評価において,検索結果の提供が参加者の認識精度と信頼度に与える影響について検討した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:26:36 GMT)
The Approximate Fisher Influence Function: Faster Estimation of Data Influence in Statistical Models [5.9] モデル性能における無限小の変化の影響の定量化は、機械学習モデルの理解と改善に不可欠である。
提案手法は,現在の手法よりも計算上の優位性が高いことを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:33:37 GMT)
LauraTSE: Target Speaker Extraction using Auto-Regressive Decoder-Only Language Models [5.2] LauraTSEは、ターゲット話者抽出(TSE)のための自動回帰デコーダ専用言語モデルである
小規模な自動回帰デコーダのみの言語モデルを採用しており、混合語と参照語の両方の連続表現を取り入れている。
一段階エンコーダのみの言語モデルは、混合情報と参照情報の両方を用いて予測された埋め込みの和を再構成する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:55:22 GMT)
Image registration of 2D optical thin sections in a 3D porous medium: Application to a Berea sandstone digital rock image [5.2] 本研究では,3次元ディジタルロックボリューム内に2次元の光学的薄断面像を配向させる方式を提案する。
この方法は合成多孔質媒体上で検証され、正確に登録され、ベレア砂岩に適用される。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:52:03 GMT)
Quantum error detection in qubit-resonator star architecture [5.1] 恒星トポロジー超伝導QPUにおける2つの論理量子ビットを符号化する。
我々は、すべての基数論理状態に対して96パーセント以上の論理状態の忠実度を測定する。
提案したQPU構成は、キュービット数効率の良いQECコードを可能にするために使用できる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:39:48 GMT)
Cat, Rat, Meow: On the Alignment of Language Model and Human Term-Similarity Judgments [4.9] 人間の類似性判断と表現的・行動的整合性を考慮した32の公開言語モデルの評価を行った。
小さな言語モデルの表現でさえ、人間レベルのアライメントを実現することができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:59:57 GMT)
PRAD: Periapical Radiograph Analysis Dataset and Benchmark Model Development [4.8] PRAD-10Kは根尖部X線画像解析のためのデータセットである。
本データセットは, 専門歯科医が提供した画素レベルのアノテーションを用いて, 1万枚の近医用X線画像から構成する。
我々はPRセグメンテーションタスクのベンチマークを構築するためにPRNetというDLネットワークを導入した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:58:58 GMT)
Deep Reinforcement Learning for Day-to-day Dynamic Tolling in Tradable Credit Schemes [4.8] トレーダブル・クレジット・スキーム(TCS)は、混雑価格の代替としてますます研究されている。
将来の設計と実装を支援するためのTCSのモデリングは、ユーザと市場の振る舞い、需要供給ダイナミクス、制御メカニズムに関わる課題と関連している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:04:28 GMT)
FAIR-SIGHT: Fairness Assurance in Image Recognition via Simultaneous Conformal Thresholding and Dynamic Output Repair [4.8] 本稿では,コンフォメーション予測と動的出力修復機構を組み合わせることで,コンピュータビジョンシステムの公平性を確保するためのポストホックフレームワークを提案する。
提案手法は,予測誤差と公平性違反を同時に評価する,公平性を考慮した非整合性スコアを算出する。
新しい画像の非整合スコアがしきい値を超えると、FAIR-SIGHTは分類のためのロジットシフトや検出のための信頼度補正など、対象とする修正調整を実行する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:23:06 GMT)
Hierarchical Modeling for Medical Visual Question Answering with Cross-Attention Fusion [4.8] Med-VQA (Medicical Visual Question Answering) は、医療画像を用いて臨床的な疑問に答え、診断を支援する。
本研究では, 詳細な医療質問に対する階層型プロンプティングと階層型アンサーデコーダの2つのモジュールを含むHiCA-VQA法を提案する。
Rad-Restructベンチマークの実験により、HiCA-VQAフレームワークは階層的なきめ細かい質問に答える上で、既存の最先端メソッドよりも優れていることが示されている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:52:40 GMT)
WS-DETR: Robust Water Surface Object Detection through Vision-Radar Fusion with Detection Transformer [4.8] 水面オブジェクト検出は、ぼやけたエッジと多様なオブジェクトスケールの課題に直面します。
既存のアプローチは、モデルの堅牢性に悪影響を及ぼす、クロスモーダルな機能競合に悩まされている。
本稿では,SOTA(State-of-the-art)性能を実現する頑健なビジョンレーダ融合モデルWS-DETRを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:16:46 GMT)
S2R-HDR: A Large-Scale Rendered Dataset for HDR Fusion [4.7] S2R-は、HDR融合のための最初の大規模な高品質な合成データセットであり、24,000個のHDRサンプルがある。
我々は、様々な動的要素、モーションタイプ、ハイダイナミックレンジシーン、照明を含む、多様な現実的なHDRシーンを設計する。
合成データと実世界のデータのギャップを埋めるために設計されたドメイン適応であるS2R-Adapterを紹介する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:39:56 GMT)
Late Breaking Results: Breaking Symmetry- Unconventional Placement of Analog Circuits using Multi-Level Multi-Agent Reinforcement Learning [4.7] アナログレイアウトの非従来的設計空間を探索する目的駆動型マルチレベルマルチエージェントQ-ラーニングフレームワークを提案する。
提案手法は,最先端のレイアウト技術よりも優れたバラツキ性能を実現する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:42:17 GMT)
Deep Generative Models for Physiological Signals: A Systematic Literature Review [4.7] 本稿では,生理的信号の深部生成モデルに関する体系的な文献レビューを行う。
このレビューは、生理的信号に適用されたこれらのモデルの全体的な理解に寄与する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:55:50 GMT)
Adaptive Shrinkage Estimation For Personalized Deep Kernel Regression In Modeling Brain Trajectories [4.6] そこで我々は,脳バイオマーカーの予測を行うための,パーソナライズされたディープカーネル回帰フレームワークを提案する。
我々のアプローチでは、大きなコホートから脳の軌跡をキャプチャする集団モデルと、個々の軌跡をキャプチャする対象特異的モデルという2つの重要な要素を統合している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:13:44 GMT)
Augmented Shuffle Protocols for Accurate and Robust Frequency Estimation under Differential Privacy [4.5] 本稿では,DPとロバスト性を提供する3つの具体的なプロトコルを提案する。
我々の最初のプロトコルは、二項分布から各項目のダミー値の数を生成する。
第2のプロトコルは,新しいダミー数分布を導入することにより,第1のプロトコルの有用性を大幅に向上させる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:06:05 GMT)
Geometry and Local Recovery of Global Minima of Two-layer Neural Networks at Overparameterization [4.4] 大域ミニマ付近の2層ニューラルネットワークにおける損失景観の幾何学について検討する。
一般化誤差ゼロの大域的ミニマが、サンプルサイズが大きくなるにつれて、他の大域的ミニマと幾何的に分離されるかを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:56:57 GMT)
DiMSUM: Diffusion Mamba -- A Scalable and Unified Spatial-Frequency Method for Image Generation [4.4] 拡散モデルのための新しい状態空間アーキテクチャを提案する。
入力画像の局所的特徴に対する帰納バイアスを高めるために,空間情報と周波数情報を利用する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:29:21 GMT)
Search-contempt: a hybrid MCTS algorithm for training AlphaZero-like engines with better computational efficiency [4.3] 本稿では,MCTS アルゴリズムの新たなハイブリッド版である Search-Contempt を紹介する。
検索エンジンはOdds Chessのエンジンに大きな力を与えている。
これは、より計算効率のよいセルフプレイベースのエンジンをトレーニングする可能性を開く。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:56:31 GMT)
An easily computable measure of Gaussian quantum imaginarity [4.3] 計算可能ガウス虚数測度 $mathcal IG_n$ for $n$-mode Gaussian system を提案する。
既存の2つのガウス的虚性測度を持つ$mathcalIG_n$の比較分析は、$mathcalIG_n$が任意の$n$モードガウス状態の虚性をより効率的に検出できることを示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:21:48 GMT)
Conditional Data Synthesis Augmentation [4.3] Conditional Data Synthesis Augmentation (CoDSA)は、マルチモーダルドメイン間のモデルパフォーマンスを改善するために高忠実度データを合成する新しいフレームワークである。
合成データの現実性を高め,スパース領域の試料密度を高めるために,CoDSAファインチューン事前学習生成モデルを構築した。
本稿では,合成サンプル量と対象領域割り当ての関数として,CoDSAが実現した統計的精度向上を定量化する理論的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:38:11 GMT)
Lifetime-limited Gigahertz-frequency Mechanical Oscillators with Millisecond Coherence Times [4.3] 量子アプリケーションに必要なコヒーレンス時間は、フォノンデコヒーレンス(英語版)の物質起源を調査するために、極めて敏感な新しい技術を必要とする。
我々は、非侵襲レーザー分光法と材料分析を組み合わせることで、結晶性媒体におけるフォノン脱コヒーレンスの鍵源を同定する。
我々は、高周波量子メモリの基礎として、100ms以上のコヒーレンス時間への経路を同定する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:41:47 GMT)
Planning and Learning in Risk-Aware Restless Multi-Arm Bandit Problem [4.2] レスレス・マルチアーム・バンディットでは、中央エージェントは複数のバンドイット(アーム)に限られたリソースを最適に分散させる。
本研究では,リスク・アウェアネスを組み込むことにより,従来のレスレスト・マルチアーム・バンディット問題をリスクニュートラル目標に一般化する。
我々は、リスク認識対象の指標可能性条件を確立し、Whittleインデックスに基づくソリューションを提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:35:40 GMT)
JEPA4Rec: Learning Effective Language Representations for Sequential Recommendation via Joint Embedding Predictive Architecture [4.2] JEPA4Recはセマンティックにリッチで転送可能な表現をキャプチャし、レコメンデーションパフォーマンスを改善する。
我々は、レコメンデーションデータセットの項目情報をキャプチャするのに適した、修正された埋め込み層を備えた双方向トランスフォーマーエンコーダを採用している。
6つの実世界のデータセットの実験は、JEPA4Recが一貫して最先端のメソッドを上回っていることを示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:31:11 GMT)
MARS: a Multimodal Alignment and Ranking System for Few-Shot Segmentation [4.1] 我々は,マルチモーダルキューを利用してマスクの提案を頑健にフィルタリング・マージする,プラグアンドプレイランキングシステムMARSを提案する。
ローカルおよびグローバルレベルで計算されたマルチモーダルスコアを用いて提案手法を評価する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:53:23 GMT)
Minmax Trend Filtering: Generalizations of Total Variation Denoising via a Local Minmax/Maxmin Formula [4.1] 総変分分解法 (TVD) は, 基本偏差・平滑化法である。
本稿では,2つの推定器を生成する局所的なminmax/maxmin式を新たに同定する。
そこで本研究では,TVD/MTF推定器の局所的定義により,ポイントワイド推定誤差の有界化が可能となることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:25:03 GMT)
Independence Is Not an Issue in Neurosymbolic AI [4.0] ニューロシンボリックAIに対する一般的なアプローチは、ニューラルネットワークの最後のレイヤの出力をスパース計算グラフに渡すことである。
これは、互いに条件的に独立なランダム変数の集合上の確率分布を誘導する。
決定論的偏見の現象は,ニューロシンボリックAIを不適切に適用した成果であることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:28:36 GMT)
Investigating Vision-Language Model for Point Cloud-based Vehicle Classification [3.9] 大型トラックは、大型で操作性に制限があるため、重要な安全上の課題を生じさせる。
従来のLiDARベースのトラック分類手法は広範な手動アノテーションに依存している。
本研究では,ロードサイドのLiDARポイントクラウドデータと視覚言語モデルを統合する新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 22:37:27 GMT)
On Model and Data Scaling for Skeleton-based Self-Supervised Gait Recognition [3.6] ビデオストリームからの歩行認識は、コンピュータビジョンバイオメトリックスにおいて難しい問題である。
近年の自己教師型事前訓練の進歩は、堅牢な歩行認識モデルの開発につながっている。
骨格に基づく自己教師あり歩行認識における最初の実験的検討を行った。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:51:22 GMT)
A partial likelihood approach to tree-based density modeling and its application in Bayesian inference [3.4] 確率分布のツリーベースの事前は、通常、サンプル空間の候補分割の所定のデータ非依存のコレクションを使用して指定される。
サンプル空間全体にわたって、未知のターゲット密度を詳細に特徴づけるためには、候補分割は、潜在的にゼロでないサンプリング確率でサンプル空間のすべての領域に深く展開する能力を持つ必要がある。
伝統的な知恵は、ベイズ的推論においてコヒーレントな可能性に基づく推論を保証するために、この妥協は避けられないことを示唆している。
そこで本研究では,Coxの部分的可能性を用いて,データ依存型の分割を許容しながら,コヒーレンシを復元する簡単な手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:51:35 GMT)
CoServe: Efficient Collaboration-of-Experts (CoE) Model Inference with Limited Memory [3.4] GPT-4のような大規模言語モデルは資源集約型であるが、近年の進歩により、より小さな専門的な専門家が特定のタスクにおいてそれらより優れていることが示唆されている。
Collaboration-of-Expertsアプローチは、複数のエキスパートモデルを統合し、生成された結果の精度を改善し、精度クリティカルなアプリケーションに対して大きなポテンシャルを提供する。
メモリが制限された異種CPUおよびGPU上での効率的なCoEモデルサービスシステムであるCoServeを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:58:15 GMT)
GauRast: Enhancing GPU Triangle Rasterizers to Accelerate 3D Gaussian Splatting [3.3] 3D Gaussian Splatting (3DGS)は高品質な3Dレンダリング手法である。
3DGSを加速するためのこれまでの取り組みは、相当な統合オーバーヘッドとハードウェアコストを必要とする専用のアクセラレータに依存していた。
本研究では、3DGSパイプラインと高度に最適化された従来のグラフィックスパイプラインの類似性を活用する加速度戦略を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:43:24 GMT)
From Observation to Orientation: an Adaptive Integer Programming Approach to Intervention Design [3.3] 独自の適応的介入設計パラダイムが提示され、因果方向の非循環グラフ(DAG)が実用的な予算的考察によって効果的に回収される。
反復整数プログラミング(IP)アプローチが提案され、必要な実験の数を劇的に削減する。
その結果,適応型IP手法は,ランダムな介入ベースラインよりも介入反復や変動操作が少なく,完全な因果グラフ回復を実現することがわかった。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:34:55 GMT)
Nonlocal Retinex-Based Variational Model and its Deep Unfolding Twin for Low-Light Image Enhancement [3.2] 本稿では,Retinex分解に基づく低照度画像強調のための変分法を提案する。
低照度画像に色補正前処理ステップを適用し、分解時に観察された入力として使用する。
我々は、演算子を学習可能なネットワークに置き換える深層展開モデルを導入することにより、モデルを拡張する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:48:26 GMT)
FedECA: A Federated External Control Arm Method for Causal Inference with Time-To-Event Data in Distributed Settings [3.2] 外部制御アーム(ECA)は、実験薬の初期臨床開発を知らせることができる。
ECAは、規制承認の有効な証拠を提供することができる。
ECAを実装する上での大きな課題は、現実世界または歴史的な臨床試験データにアクセスすることである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:14:50 GMT)
Unifying and extending Diffusion Models through PDEs for solving Inverse Problems [3.1] 拡散モデルは、コンピュータビジョンと科学機械学習(SciML)に応用された強力な生成ツールとして登場した。
伝統的に、これらのモデルは変分推論、復調、統計信号処理、微分方程式の原理を用いて導出されてきた。
本研究では,線形偏微分方程式からアイデアを用いた拡散モデルを導出し,このアプローチにはいくつかの利点があることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:07:36 GMT)
Information Gain Is Not All You Need [3.1] 未知の事を知ることなく最善策を評価することは困難である。
これまでの研究では、情報獲得の見積もりを改善することで、欲張りの行動につながることが示されている。
本稿では,ロボットに近いが,他の候補状態から遠く離れた候補状態を優先して,バックトラッキングを低減する手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:43:00 GMT)
Cooperation Is All You Need [3.0] コラボレーターは、新皮質の文脈に敏感な錐体ニューロンにインスパイアされている。
トランスフォーマーは、インテグレート・アンド・ファイアの「ポイント」ニューロンの長期的概念に基づいている。
Cooperatorに基づくアルゴリズムは、同じ数のパラメータを持つ場合でも、Transformerに基づくアルゴリズムよりもはるかに高速に学習する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:34:57 GMT)
Cache-a-lot: Pushing the Limits of Unsatisfiable Core Reuse in SMT-Based Program Analysis [2.9] Satisfiability Modulo Theories (SMT) は、ココリックやシンボリックな実行のようなプログラム分析技術に不可欠な解法である。
キャッシュ・ア・ロット(Cache-a-lot)という新しい手法を提案し,全ての可能な変数置換を体系的に検討することによって,不満足な(不満足な)結果の再利用を拡大する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:43:42 GMT)
Probability Estimation and Scheduling Optimization for Battery Swap Stations via LRU-Enhanced Genetic Algorithm and Dual-Factor Decision System [2.8] 本研究では,充電杭データに基づく確率推定モデルを提案し,9つのシナリオ固有の電池交換需要データセットを構築した。
これは、グローバル最適化機能を効果的に強化するガイド付き検索機構を組み込んでいる。
即時スワップ・アンド・チャージ戦略に対するベンチマークでは,最大で13.96%のコスト削減を実現している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:58:24 GMT)
Semantically Encoding Activity Labels for Context-Aware Human Activity Recognition [2.8] LMを利用してCA-HAR活動ラベルを符号化し,意味的関係を捉えるSEALを提案する。
我々の研究は、より高度なLMをCA-HARタスクに統合する新たな可能性を開く。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:30:07 GMT)
Enhanced Question-Answering for Skill-based learning using Knowledge-based AI and Generative AI [2.7] 我々は、テレロジカル、因果、構成原理を具現化した説明を生成するインテリジェントエージェントであるIvyを紹介する。
これにより、学習者はオンライン環境において効果的な問題解決に不可欠なスキルを包括的に理解することが可能になる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:25:52 GMT)
Evaluating Large Language Models on Multiword Expressions in Multilingual and Code-Switched Contexts [2.5] 本研究では,現在最先端の言語モデルが,潜在的に慣用的なマルチワード表現のあいまいさをどのように処理するかを評価する。
大きな言語モデルは、その強みにも拘わらず、ニュアンスド言語に苦戦している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:39:28 GMT)
Datum-wise Transformer for Synthetic Tabular Data Detection in the Wild [2.5] トランスフォーマーアーキテクチャを導入し,既存モデルよりも優れた性能を示す。
また,本モデルの有効性を高めるため,ドメイン適応手法の適用について検討する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:01:34 GMT)
Brains vs. Bytes: Evaluating LLM Proficiency in Olympiad Mathematics [2.5] 大規模言語モデル(LLM)は、数学的推論タスクにおいて顕著な進歩を示している。
大規模言語モデル(LLM)の最近の進歩は、数学的推論タスクの顕著な進歩を示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:43:23 GMT)
Porting an LLM based Application from ChatGPT to an On-Premise Environment [2.5] 本稿では,ChatGPTを用いたリアルタイムアプリケーションのオンプレミス環境への移植過程について検討する。
移植プロセスにおける主な考慮事項は、オープンソースモデルの透明性とハードウェアコストである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:29:26 GMT)
P-Transformer: A Prompt-based Multimodal Transformer Architecture For Medical Tabular Data [2.5] 医用表データに特化して設計されたマルチモーダルアンダーライントランスフォーマアーキテクチャであるPTransformerを提案する。
このフレームワークは、構造化データと非構造化データの両方から、多彩なモダリティを調和した言語意味空間に効率的にエンコードする。
PTransformerは、RMSE/MAEで10.9%/11.0%、RMSE/MAEで0.5%/2.2%、BACC/AUROCで1.6%/0.8%の改善を実証した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:24:36 GMT)
Theoretical study on rotation measurement with a quantum vibration oscillator based on Penning trapped ions [2.4] 本研究では,コリオリ力誘起軸発振振幅を精度良く測定し,入力速度を推定した。
イオン結晶の軸方向における質量運動の中心は、イオンのスピンとレーザーによる調和運動との絡み合いによって正確に検出できる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:32:05 GMT)
ContrastiveGaussian: High-Fidelity 3D Generation with Contrastive Learning and Gaussian Splatting [2.4] コントラスト学習を生成過程に統合するContrastiveGaussianを提案する。
知覚的損失を用いることで、視覚的不整合を利用して3D生成品質を向上させることにより、正と負のサンプルを効果的に区別する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:56:09 GMT)
X-DECODE: EXtreme Deblurring with Curriculum Optimization and Domain Equalization [2.3] 鮮やかなぼやけた画像の復元は、コンピュータビジョンにとって依然として大きな課題だ。
本稿では,カリキュラム学習に基づく新たな学習戦略を導入し,画像の極端劣化に対する深層学習モデルの堅牢性を改善する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:59:26 GMT)
Deep Learning Meets Teleconnections: Improving S2S Predictions for European Winter Weather [2.3] 季節と季節の時間スケールの予測は2週間から2ヶ月である。
成層圏極渦(SPV)やマデン=ジュリア振動(MJO)のようなテレコネクションは、予測可能性を高める窓を提供する。
我々は、北大西洋-欧州の気象状況を予測するためのディープラーニングアーキテクチャを開発し、評価した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:23:07 GMT)
Heart Failure Prediction using Modal Decomposition and Masked Autoencoders for Scarce Echocardiography Databases [2.1] 心臓病は国際的機能不全の主な原因である。
毎年約1800万人が心臓病で死亡している。
本研究では, 心不全の予測に難渋する課題に対して, リアルタイム心エコービデオシーケンスを解析する自動システムを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:57:09 GMT)
Space to Policy: Scalable Brick Kiln Detection and Automatic Compliance Monitoring with Geospatial Data [2.1] れんがはインドの大気汚染の8-14%に寄与している。
エミッション・インベントリは、大気の質のモデリングと源泉の調整研究に不可欠である。
我々は5つの州で30638個のレンガキルンを検出し分類するスケーラブルな機械学習パイプラインを開発した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:47:45 GMT)
Automated Video-EEG Analysis in Epilepsy Studies: Advances and Challenges [2.0] てんかんは通常、脳波(EEG)と長期ビデオEEG(vEEG)モニタリングによって診断される。
機械学習の最近の進歩は、脳波とビデオデータを用いたリアルタイムの発作検出と予測において有望であることを示している。
本稿では,ビデオ-EEG自動解析の最近の展開を概観し,マルチモーダルデータの統合について論じる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:16:31 GMT)
ChatGPT as Linguistic Equalizer? Quantifying LLM-Driven Lexical Shifts in Academic Writing [2.0] 本研究では,ChatGPT が OpenAlex (2020-2024) から280万項目にわたる語彙的複雑性変化を解析し,障壁を緩和し,株式を育むかを検討する。
記事レベルの制御やオーサリングパターン,会場規範を制御した後でも,ChatGPTはNNESによる抽象表現の語彙的複雑さを著しく向上させることを示した。
これらの知見は、ChatGPTが言語格差を減らし、グローバルなアカデミックにおけるエクイティを促進するという因果的証拠である。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:11:24 GMT)
Enhancements for Developing a Comprehensive AI Fairness Assessment Standard [2.0] 本稿では、画像、非構造化テキスト、生成AIの公平性評価を含むTEC標準の拡張を提案する。
これらの次元を取り入れることで、強化されたフレームワークは、さまざまな分野にわたる責任と信頼性のあるAIデプロイメントを促進する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:24:23 GMT)
Quantum Error Detection For Early Term Fault-Tolerant Quantum Algorithms [2.0] 本稿では,量子アルゴリズムのフォールトトレラントコンパイルとシミュレーションのためのフレームワークを提案する。
最適なシンドロームスケジュールを見つけることは、アルゴリズムの成功確率を平均6.7倍改善する。
本稿では,フォールトトレラントコンパイルパラメータを予測するための単純なデータ駆動型手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:59:40 GMT)
Infinity-norm-based Input-to-State-Stable Long Short-Term Memory networks: a thermal systems perspective [1.9] リカレントニューラルネットワーク(RNN)は,システム識別において顕著な性能を示した。
安定は実用上重要な課題です
ISS$_infty$-promoted LSTM は物理モデルと ISS$_infty$-promoted Gated Recurrent Unit (GRU) ネットワークの両方より優れている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:46:02 GMT)
Soybean Disease Detection via Interpretable Hybrid CNN-GNN: Integrating MobileNetV2 and GraphSAGE with Cross-Modal Attention [1.9] 大豆の葉の病原体の検出は農業の生産性にとって重要であるが、視覚的に類似した症状と限定的な解釈可能性のために課題に直面している。
本稿では,局所化特徴抽出のためのMobileNetV2とリレーショナルモデリングのためのGraphSAGEを相乗化する,解釈可能なハイブリッドCNN-Graph Neural Network(GNN)フレームワークを提案する。
クロスモーダル解釈はGrad-CAMおよびEigen-CAMビジュアライゼーションを通じて実現され、熱マップを生成して疾患の流入領域をハイライトする。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:14:17 GMT)
When Counterfactual Reasoning Fails: Chaos and Real-World Complexity [1.9] 構造因果モデルの枠組みにおける反実的推論の限界について検討する。
低次モデル不確実性やカオス力学といった現実的な仮定は、直観に反する結果をもたらす。
この研究は、カオスと不確実性を特徴とする設定に反実的推論を適用する際に注意を促している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:30:12 GMT)
Double Machine Learning for Causal Inference under Shared-State Interference [1.9] 市場やレコメンデーションシステムを介してユニットが相互作用する環境では、ユニットは特定の共有状態に影響を受けます。
我々はこの構造を形式化し、これを共有状態干渉と呼び、我々の定式化は多くの関連する設定を捉えていると主張する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:45:53 GMT)
Self-correcting GKP qubit and gates in a driven-dissipative circuit [1.9] 自己補正GKP量子ビットは、抵抗に結合した高インピーダンスLC回路と、制御可能なスイッチを介してジョセフソン接合により実現可能であることを示す。
スイッチの適切な制御と超電流測定による読み出し/初期化により実装された,指数関数的に堅牢な単一量子クリフォードゲートを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:04:24 GMT)
Min-Max Optimisation for Nonconvex-Nonconcave Functions Using a Random Zeroth-Order Extragradient Algorithm [1.9] 制約なし、制約なし、差別化可能、差別化不可能な設定も検討する。
制約のない問題に対して、ZO-EGアルゴリズムのNC-NC目的関数の$epsilon$-stationary点近傍への収束を確立する。
非微分可能の場合、目的関数の滑らかなバージョンのエプシロン$定常点の近傍へのZO-EGアルゴリズムの収束を証明する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:15:30 GMT)
Critical Challenges and Guidelines in Evaluating Synthetic Tabular Data: A Systematic Review [1.9] この体系的なレビューは、信頼性、妥当性、およびそれらの適切な使用を保証するために、合成健康データの厳密な評価の重要性に光を当てている。
1766論文のスクリーニングと101論文の詳細なレビューに基づいて、評価方法に対するコンセンサスの欠如、評価指標の不正使用、ドメインエキスパートからの限られた入力、データセット特性の報告不足など、重要な課題を特定した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:48:20 GMT)
Representation Meets Optimization: Training PINNs and PIKANs for Gray-Box Discovery in Systems Pharmacology [1.8] 物理インフォームド・コルモゴロフネットワーク (PIKANs) は、オリジナルの多層パーセプトロンベースの物理インフォームドネットワーク (PINNs) に対抗して注目されている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:37:18 GMT)
Performance of Rank-One Tensor Approximation on Incomplete Data [1.8] 本研究は, スペクトル解析により再構成性能にアクセス可能なランダム行列モデルに還元可能であることを示す。
これらの結果は、そのエントリのランダム部分の削除によるテンソルのメモリコストの人工的削減によって引き起こされるパフォーマンスの損失に光を当て、特定する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:57:09 GMT)
GPT Carry-On: Training Foundation Model for Customization Could Be Simple, Scalable and Affordable [1.8] 既存の大規模言語基盤モデル(LLM)の利点をフル活用するためのフレームワークを提案する。
予め訓練されたLLMを最終層に埋め込んだ上で,トランスフォーマーブロックの追加ブランチをトレーニングし,その後,キャリーオンモジュールがベースモデルをマージして,カスタマイズされたLLMを構成する。
ベースモデルはパラメータを更新する必要がないため、推論ノード上でトレーニングジョブのほとんどの計算をアウトソースすることが可能です。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:15:40 GMT)
Cellular Development Follows the Path of Minimum Action [1.8] 細胞発達は, 自然界の力学系を支配する基礎的物理法則と整合して, 最小作用の経路に従うことが示唆された。
本稿では,最小アクションの原理と最大エントロピーの深い関係を利用して,トランスフォーマーアーキテクチャを用いた発達過程をモデル化する計算フレームワークを提案する。
本手法を単細胞および胚発生データセットにまたがって検証し,細胞内決定を形作る隠蔽熱力学および情報的制約を明らかにする能力を実証した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:44:29 GMT)
Dynamics of collective minds in online communities [1.7] オンラインニュースコミュニティにおける集団精神が、様々な編集課題設定プラクティスやコミュニティダイナミクスの側面にどのように影響されるかを示す。
我々は、アメリカの5つのオンラインニュースプラットフォームにおける4億件のコメントと大規模な調査から得られたデータを校正し、検証し、集合心の計算モデルを開発する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 22:22:40 GMT)
SaRoHead: A Dataset for Satire Detection in Romanian Multi-Domain News Headlines [1.7] SaRoHeadはルーマニアの多ドメインニュースの見出しで風刺検出のための最初のコーパスである。
以上の結果から,ノンサチリカルな見出しで使用されるクリックベイトがモデルに大きく影響していることが示唆された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:03:29 GMT)
Novel Pooling-based VGG-Lite for Pneumonia and Covid-19 Detection from Imbalanced Chest X-Ray Datasets [1.7] 本稿では,Chest X-Ray(CXR)データセットにおけるクラス不均衡問題を軽減するために,新しいプール型VGG-Liteモデルを提案する。
提案するフレームワークを2つの別々のCXRデータセット上に実装した。
このフレームワークは、95%の精度、97.1%の精度、96.1%のリコール、96.6%のF1スコアを達成した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:38:46 GMT)
Electronic Warfare Cyberattacks, Countermeasures and Modern Defensive Strategies of UAV Avionics: A Survey [1.7] 無人航空機(UAV)は、現代の自律飛行において重要な役割を担っている。
UAVミッションの成功は、電子戦の様々な側面を効果的に緩和することに依存する。
本稿では,UAVのサイバー攻撃,対策,防衛戦略について概観する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 00:56:52 GMT)
PhaseGen: A Diffusion-Based Approach for Complex-Valued MRI Data Generation [1.7] 磁気共鳴イメージング(MRI)の生データ(k空間データ)は複雑に評価され、大きさと位相情報の両方を含む。
我々は、大容量画像に条件付けされた合成MRI生データを生成するための、複素数値拡散モデルである$textitPhaseGen$を紹介した。
以上の結果から, 合成位相データによるトレーニングは, 実世界のデータにおける頭蓋骨切断の一般化を著しく向上させることが示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:44:19 GMT)
Test Amplification for REST APIs via Single and Multi-Agent LLM Systems [1.6] 単一エージェントとマルチエージェントのLLMシステムがREST APIテストスイートを増幅する方法について示す。
評価では、APIカバレッジの向上、テスト中のAPIの多数のバグの特定、および両アプローチの計算コストとエネルギー消費に関する洞察を示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:19:50 GMT)
Data over dialogue: Why artificial intelligence is unlikely to humanise medicine [1.6] 医療MLシステムは、これらの関係を改善させるよりも、その関係に悪影響を及ぼす可能性が高い、と私は主張する。
特に、医療MLシステムの使用は、臨床医と患者の信頼、ケア、共感、理解、コミュニケーションの質を構成する可能性が高いと私は考えます。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:03:40 GMT)
Entropy Collapse in Mobile Sensors: The Hidden Risks of Sensor-Based Security [1.6] 複数のアプリケーションコンテキストにまたがる4つの多様なデータセットにわたるモバイルセンサデータのエントロピーを系統的に分析する。
シャノンエントロピーは複数の倍数であるにもかかわらず, 単一センサの平均ミンエントロピー値は3.408-4.483ビット (S.D.=1.018-1.574) である。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:53:17 GMT)
Interplay between Federated Learning and Explainable Artificial Intelligence: a Scoping Review [1.6] フェデレーション学習(FL)と説明可能な人工知能(XAI)は、分散データからモデルをトレーニングし、プライバシの本質的な側面を保持しながら内部動作を説明することができる。
このスコーピングレビューは、FLとXAIを共同で扱う出版物をマッピングし、FLとモデル解釈可能性またはポストホックの説明を報告した出版物に焦点を当てた。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:21:56 GMT)
Heralded qudit-based high-dimensional entanglement generation for hybrid photon-emitter system by waveguide-mediated scattering [1.6] 量子エンタングルメントシステムによる量子情報処理(QIP)における高次元(HD)状態空間の拡張と損失耐性の向上
異なる入力ポートを入力することで、ハイブリッド光子エミッタシステムのためのランダムな4次元2量子最大絡み合わせを生成するフレキシブルなスキームを提案する。
quditエンコードされたハイブリッドHDエンタングルメントは、補助クォーディットなしで量子リソースをエコノマイズする利点を提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:12:41 GMT)
DragPoser: Motion Reconstruction from Variable Sparse Tracking Signals via Latent Space Optimization [1.6] DragPoserは、新しいディープラーニングベースのモーションリコンストラクションシステムである。
ハードでダイナミックな制約を正確に表現します。
自然なポーズと時間的コヒーレントな動きを生み出す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:42:57 GMT)
Digital quantum simulation of the Su-Schrieffer-Heeger model using a parameterized quantum circuit [1.5] パラメータ化量子回路を用いてSu-Schrieffer-Heegerモデルのディジタル量子シミュレーションを行う。
エネルギー・絡み合いエントロピー・相互情報の非自明な基底状態への進化について検討する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:54:10 GMT)
Immersive Virtual Reality Assessments of Working Memory and Psychomotor Skills: A Comparison between Immersive and Non-Immersive Assessments [1.5] 没入型バーチャルリアリティ(VR)は、生態学的妥当性を高め、直感的で人間工学的なハンドインタラクションを促進する。
本研究は,VRによる評価とPCによる評価の収束妥当性,ユーザエクスペリエンス,ユーザビリティについて検討する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:08:27 GMT)
Smoothed Distance Kernels for MMDs and Applications in Wasserstein Gradient Flows [1.4] K(x,y) := - |x-y|$ は統計学における最大平均誤差 (MMD) の定義に用いられた。
本稿では, 負距離カーネルの次数 1 の条件正定値として好適な特性を保った新しいカーネルを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:57:33 GMT)
AttentionDefense: Leveraging System Prompt Attention for Explainable Defense Against Novel Jailbreaks [1.3] 脱獄の悪質性の背後にある理由を説明するのは難しい。
そこで本稿では,Small Language Models (SLM) からのシステム・プロンプト・アテンションを用いて,敵対的プロンプトを特徴付ける手法を提案する。
本研究は、LMが悪意ある入力にどう反応するかを理解し説明するために、注意機構が不可欠であることを示唆している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 22:29:23 GMT)
Quantum-Inspired Genetic Algorithm for Robust Source Separation in Smart City Acoustics [1.3] 本稿では、ソース分離のための新しい量子インスパイアされた遺伝的アルゴリズム(p-QIGA)を提案する。
p-QIGAは、スマートシティの音響シーン分析を強化するために、量子情報理論からインスピレーションを得ている。
実験の結果,p-QIGAは最先端手法に匹敵する精度が得られた。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 00:05:35 GMT)
On the Temporal Question-Answering Capabilities of Large Language Models Over Anonymized Data [1.3] 訓練中に存在しないデータに対する時間的推論タスクにおけるLarge Language Model(LLM)の適用性はまだ検討されていない分野である。
本稿では、構造化および半構造化された匿名化データに焦点をあてて、このトピックについて論じる。
自然言語における17の共通時間的推論タスクを特定し,そのアルゴリズム的構成要素に着目した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:48:42 GMT)
Variational quantum and neural quantum states algorithms for the linear complementarity problem [1.3] 変分量子アルゴリズム(VQA)は、有望なハイブリッド量子古典法である。
本稿では、変分量子線形解法(VQLS)とその古典的量子状態に基づく古典的ニューラルネットワーク線形解法(VNLS)の新たな応用について述べる。
我々は,VNLSを用いて衝突時の剛球体の力学を正確にシミュレートすることを示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 22:03:14 GMT)
We Are All Creators: Generative AI, Collective Knowledge, and the Path Towards Human-AI Synergy [1.2] 生成的AIは、人間の独特性という伝統的な概念に深刻な課題を呈している。
ニューラルネットワークベースのファンデーションモデルにより、これらのシステムは顕著なコンテンツ生成能力を示す。
本稿では、生成AIは、知性と創造性の代替形態であると主張している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:50:17 GMT)
Parameter Tuning of the Firefly Algorithm by Three Tuning Methods: Standard Monte Carlo, Quasi-Monte Carlo and Latin Hypercube Sampling Methods [1.2] Firefly Algorithm (FA) はモンテカルロ法、準モンテカルロ法、ラテンハイパーキューブサンプリングという3つの異なる方法で調整される。
パラメータ設定が最適解の品質に与える影響を解析した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:26:12 GMT)
MuSaRoNews: A Multidomain, Multimodal Satire Dataset from Romanian News Articles [1.2] この研究は、ルーマニアのニュース記事 MuSaRoNews において、風刺検出のためのマルチモーダルコーパスを導入している。
具体的には,ルーマニア語における風刺検出のための最初のマルチモーダルコーパスを構成する,現実的および風刺的なニュースソースから117,834件の公開ニュース記事を収集した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:02:59 GMT)
Cooperative squeezing of internal and collective spins in an atomic ensemble [1.2] ルビジウム原子を用いた熱原子アンサンブルにおける内部および集合スピンのスクイーズを実験的に実証した。
我々のアプローチは、原子アンサンブルの量子状態に固有の自由度を完全に活用する新しい視点を提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:17:56 GMT)
Quantum-assured magnetic navigation achieves positioning accuracy better than a strategic-grade INS in airborne and ground-based field trials [1.2] 磁気異常ナビゲーション(MagNav)は、周期的な位置修正を通じてジャミング不能なナビゲーションを提供する。
既存のMagNavの取り組みは、磁気センサの性能とプラットフォームノイズによって制限されている。
我々は,新しいデノケーション法とマップマッチング法により,ロバスト性を持つ独自の量子磁気センサに基づく量子保証MagNavソリューションを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:25:19 GMT)
Multi-Task Learning with Multi-Annotation Triplet Loss for Improved Object Detection [1.2] Tripletの損失は伝統的にクラスラベルのみに依存しており、複数のアノテーションが利用できるマルチタスクシナリオで利用可能なすべての情報を使用しない。
本稿では,損失定式化におけるクラスラベルとともにボックス情報のバウンディングなどのアノテーションを付加することにより,三重項損失を拡大するマルチトリプレットロスフレームワークを提案する。
空中野生生物画像データセットの実験により、MATLは分類と局所化の両方において従来の三重項損失よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:20:31 GMT)
Temporal Tensors and Quantum Shortcut Dynamics in a Supermaze of Multidimensional Time [0.8] 複数の時間次元、量子ショートカット力学、複雑な位相構造の概念を統一する理論フレームワークを開発する。
この枠組みが異常な熱力学緩和などの驚くべき効果をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:19:56 GMT)
FlexIP: Dynamic Control of Preservation and Personality for Customized Image Generation [0.8] 既存の方法は、アイデンティティ保存とパーソナライズされた操作の間に固有のトレードオフに直面している。
FlexIPは、2つの専用のコンポーネントを通してこれらの目的を分離する新しいフレームワークです。
実験により,本手法は従来の手法の性能限界を突破することを示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:58:22 GMT)
Generative AI in Collaborative Academic Report Writing: Advantages, Disadvantages, and Ethical Considerations [0.7] 本稿は, 学生に, 批判的思考を用いた本質的な生涯学習スキル開発研究における, 時間的投資の重要性を知らせることに焦点をあてる。
AI中心の時代へ移行するにつれ、これらのモデルがどのように機能するか、その落とし穴、そしてそうしたツールにデータを供給することに関連する倫理的懸念について、学生に教育することが重要である。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:22:40 GMT)
AMAD: AutoMasked Attention for Unsupervised Multivariate Time Series Anomaly Detection [0.7] AMADはUMTStextbfADシナリオに対するtextbfAutotextbfMasked Attentionを統合している。
AMADはUMTSADの課題に対して堅牢で適応可能なソリューションを提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:37:53 GMT)
Prediction of Usage Probabilities of Shopping-Mall Corridors Using Heterogeneous Graph Neural Networks [0.7] 本稿では,ショッピングモール回廊の利用可能性予測のためのグラフニューラルネットワーク(GNN)を用いた手法を提案する。
利用確率の予測は、店舗の特徴、すなわち地域と利用カテゴリー、およびこれらの店舗、廊下のジャンクション、入り口を廊下で繋ぐグラフに基づいている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:48:36 GMT)
Development of a Quantum-Resistant File Transfer System with Blockchain Audit Trail [0.4] このアーキテクチャは、暗号化のためのNIST標準化アルゴリズムCRYSTALS Kyberと、不変のブロックチェーン台帳を備えたデジタル署名のためのCRYSTALS Dilithiumを統合し、監査可能な分散ストレージメカニズムを提供する。
詳細な擬似コードが含まれ、セキュリティリスクを分析し、システムの堅牢性、スケーラビリティ、透明性を示すパフォーマンスインサイトを提供しています。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:51:14 GMT)
Bottleneck Identification in Resource-Constrained Project Scheduling via Constraint Relaxation [0.4] 緩和すべき特定の制約にリンクしながら、所定のスケジュールにおけるボトルネックを自動的に識別することを目的としています。
第1の方法は、求人店の文献から既存のアプローチに適応し、いわゆる未目標緩和に利用することである。
第2の方法は、緩和された問題の潜在的な改善を識別し、目標となる緩和を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:53:10 GMT)
A Systematic Literature Review of Unmanned Aerial Vehicles for Healthcare and Emergency Services [0.4] 無人航空機(UAV)は現在、様々な分野で使用されている。
医療・救急サービスにおけるUAVの利用は近年大きく進歩している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:02:20 GMT)
Patch distribution modeling framework adaptive cosine estimator (PaDiM-ACE) for anomaly detection and localization in synthetic aperture radar imagery [0.4] 本研究は,合成開口レーダ画像(SAR)における異常検出と局所化の新しいアプローチを提案する。
適応的コサイン推定器 (ACE) 検出統計を導入し、PaDiM は非有界距離であるマハラノビス距離を用いる。ACE はコサイン類似度測定器を用い、有界異常検出スコアを提供する。
提案手法は,複数のSARデータセットに対して評価され,画像および画素レベルでの受信操作曲線(AUROC)以下の領域を含む性能指標が得られた。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:08:16 GMT)
More global randomness from less random local gates [0.3] 非ハールランダムな局所ゲートを持つ一次元ランダム回路は、同じ回路構造を持つハールランダム回路に比べて、かなり大域的ランダム性を示すことが証明された。
本研究は、ランダム化ベンチマークのための回路深さ境界の改善と、浅いランダム回路からの近似ユニタリな2-設計の生成に応用できる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:51:59 GMT)
Exploring Tensor Network Algorithms as a Quantum-Inspired Method for Quantum Extreme Learning Machine [0.3] 量子エクストリーム学習マシン(QELM)は、有望なハイブリッド量子機械学習(QML)手法として登場した。
テンソルネットワーク(TN)のような量子インスパイアされた技術がQELMアルゴリズムにどのように使用できるかを検討する。
この研究は、多くの特徴を持つデータセットを研究する量子機械学習アルゴリズムの能力を高めるために、量子インスパイアされたアルゴリズムとしてのテンソルネットワークの可能性も示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:52:33 GMT)
Efficient measurement of neutral-atom qubits with matched filters [0.3] 量子コンピュータは量子優位性を達成するために多くの量子ビットの高忠実度測定を必要とする。
従来のアプローチでは、狭い間隔の配列を持つ中性原子量子プロセッサの読み出しクロストークに悩まされていた。
読み出し問題に対するマッチングフィルタを実現するため,よりシンプルでスケーラブルな機械学習アルゴリズムを2つ提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:44:46 GMT)
Conversational Medical AI: Ready for Practice [0.2] 実際の医療環境において,医師が監督する会話エージェントの大規模評価を行う。
当社のエージェントであるMoは、既存の医療アドバイスチャットサービスに統合されました。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:32:48 GMT)
SRVP: Strong Recollection Video Prediction Model Using Attention-Based Spatiotemporal Correlation Fusion [0.2] VP(VP)モデルは標準注意(SA)と強化注意(RFA)を統合する
3つのベンチマークデータセットの実験により、SRVはRNNベースのモデルにおける画質劣化を緩和することを示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:36:50 GMT)
Robustness quantification: a new method for assessing the reliability of the predictions of a classifier [0.1] 本研究では、不正確な確率の分野における既存の考え方に基づいて、生成確率分類器の個人予測の信頼性を評価するための新しいアプローチを提案する。
我々は、このアプローチをロバストネス定量化と呼び、不確実性定量化と比較し、シフト分布からサンプリングされた小さなトレーニングセットから学習した分類器でさえもうまく機能し続けていることを示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:05:10 GMT)
MicroNAS: An Automated Framework for Developing a Fall Detection System [0.1] MicroNASは、小さなメモリリソースを持つマイクロコントローラのモデルを作成するために特別に設計された、自動ニューラルネットワーク検索ツールである。
ESP32マイクロコントローラは320KBのメモリを持ち、ターゲットプラットフォームとして使用されている。
低域アンプの落下検知システム(FDS)をパイロット実験として開発した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:32:47 GMT)
Specialized text classification: an approach to classifying Open Banking transactions [0.1] 本稿では,フランス語市場とフランス語テキストに着目した,言語ベースのオープンバンキングトランザクション分類システムを提案する。
言語固有の技術とドメイン知識を取り入れることで,性能と効率性の向上を実証する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:14:43 GMT)
Multi-Modal Data Fusion for Moisture Content Prediction in Apple Drying [0.1] 乾燥工程の品質管理には,最終水分量(MC)の正確な予測が不可欠である。
本稿では,2つのデータモダリティを効果的に融合する,新しいマルチモーダルデータ融合フレームワークを提案する。
実験により,マルチモーダル手法は最先端手法と比較して予測精度を大幅に向上することが示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:29:04 GMT)
Parton Distribution Functions in the Schwinger model from Tensor Network States [0.1] テンソルネットワーク技術を用いてハミルトン形式論におけるライトフロントウィルソン線の実装を提案する。
ミンコフスキー空間における第一原理計算から得られた各種フェルミオン質量におけるベクトル中間子のフェルミオンPDFの正確な結果を示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:10:53 GMT)
Enhancing Cell Instance Segmentation in Scanning Electron Microscopy Images via a Deep Contour Closing Operator [0.0] そこで本研究では,SEM画像のインスタンスベースセルセグメンテーションを改善するために,境界線を精製するAI駆動方式を提案する。
CNN COp-Netは、細胞輪郭のギャップに対処するために導入され、不十分な情報や欠落した情報のある領域で効果的に満たされる。
PDX肝芽腫組織からのプライベートSEM画像と公開画像データセットの両方を用いて,細胞境界の精度を高めるためのアプローチの有効性を示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:20:30 GMT)
Large amplitude mechanical coherent states and detection of weak nonlinearities in cavity optomechanics [0.0] キャビティ・オプティメカル・セットアップと、弱い機械的非線形性を検出する場合を考える。
これらの手法はダッフィングのような材料非線形性の測定や、量子重力理論に関連する効果的な非線形補正にうまく応用することができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:42:48 GMT)
Wave Function Collapse, Lorentz Invariance, and the Third Postulate of Relativity [0.0] 測定中の量子状態の変化は確率的かつ非局所的である。
非局所絡み合い関係は確率論において保存法を強制する手段を提供する。
確率と非局所効果は情報の超光透過を防ぐ。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:12:50 GMT)
Vector Quantized-Elites: Unsupervised and Problem-Agnostic Quality-Diversity Optimization [0.0] VQ-Elites(Vector Quantized-Elites)は、構造化された挙動空間グリッドを自律的に構築する、新しい品質多様性アルゴリズムである。
VQ-Elitesの中核はベクトル量子変分オートエンコーダの統合であり、行動記述子の動的学習を可能にする。
VQ-Elites on robotic arm pose-reaching and mobile robot space-covering task。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:23:19 GMT)
Variational Quantum Algorithms for Differential Equations on a Noisy Quantum Computer [0.0] 本稿では,微分方程式(DE)の解法として,変分量子アルゴリズム,量子回路学習(QCL)の枠組みを検討する。
我々は,IBMハードウェア上でパラメータシフトルールを用いて,学習関数の微分を決定可能であることを示す。
これらの制限にもかかわらず、我々はIBM量子コンピュータ上の一階DEを解く。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:59:30 GMT)
Using LLMs for Analyzing AIS Data [0.0] 本稿では,AISデータの解析にLarge Language Models (LLMs) を用いるための様々なアプローチについて検討および実験を行う。
この種のタスクにおけるLCMの推論能力を評価するために,慎重に設計されたクエリセットを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:38:39 GMT)
Universal distributions of overlaps from generic dynamics in quantum many-body systems [0.0] 汎用量子多体カオス力学の下で生成した量子状態の計算基底と重なり合いの分布について検討する。
システムサイズが$t propto log L$と対数的にスケールすると、重なり合う分布は熱力学極限の普遍形式に収束する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:00:28 GMT)
Tuning Charge Density Wave in the Transition from Magnetically Frustrated Conductor to Ferrimagnetic Insulator in Carbon Nanowire within Boron Nitride Nanotube [0.0] 強磁性材料とともにエキゾチック電荷密度波(CDW)の出現について検討した。
本研究は, 窒化ホウ素ナノチューブ (BNT) 内に線状炭素鎖 (LCC) をカプセル化することにより, 短距離CDW状態が生じることを示す。
2.3eVの電気励起を施すことで、量子スイッチング用途に急激なジグザグ-超伝導遷移を引き起こす。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:21:55 GMT)
Traversal Learning Coordination For Lossless And Efficient Distributed Learning [0.0] トラバースラーニング(TL)は、人気のある分散学習(DL)パラダイムで発生する品質低下の問題に対処するために設計された新しいアプローチである。
TLは、モデルがフォワード伝搬(FP)中にノードを横切るユニークな戦略を採用し、オーケストレータ上で後方伝搬(BP)を行う。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:48:57 GMT)
Through the Looking-Glass, and What AdS Found There: quantum particle production with a Whittaker spectrum [0.0] パリティ反転反ド・シッター空間(AdS'を反転させた)は、移動鏡軌道の加速境界対応によって研究される。
粒子スペクトルはウィテカー型であり、プランク熱スペクトルと類似している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:05:59 GMT)
The temperature dependent thermal vector potential in spinor Boltzmann equation [0.0] スピノルボルツマン方程式(SBE)に基づく温度依存減衰力を導出する。
熱ポテンシャルは、伝導電子の散乱と不純物や他の散乱機構に由来することが示されている。
電荷電流やスピン電流などの他の物理観測物も探索されている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:24:52 GMT)
The coherent measurement cost of coherence distillation [0.0] 蒸留はコヒーレントな測定コストを正確に抑えることを示す。
このコストは、スケーリング法則を飽和させる測定のコヒーレンスに匹敵するものではない。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:46:41 GMT)
Testing bath correlation functions for open quantum dynamics simulations [0.0] 基底相関関数(BCF)は、オープン量子系における熱化の正確なシミュレーションに不可欠である。
オープン量子力学シミュレーションにおける近似BCFの有効性を評価するための実用的で厳密なテストフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:48:56 GMT)
Synthetic Fluency: Hallucinations, Confabulations, and the Creation of Irish Words in LLM-Generated Translations [0.0] 本研究では,アイルランド語へのLarge Language Model(LLM)翻訳における幻覚について検討する。
我々はこれらの幻覚を動詞と名詞のカテゴリーに分類し、後者のうち6つのパターンを識別する。
以上の結果から, GPT-4.o と GPT-4.o Mini の両方が同様の幻覚を産生するのに対し, Mini モデルは高い周波数で生成することがわかった。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 12:08:47 GMT)
Superradiant Quantum Phase Transition in Open Systems: System-Bath Interaction at the Critical Point [0.0] そこで本研究では,Dickeモデルとボソニック浴場との相互作用について検討した。
臨界点が環境との相互作用に影響されないことがわかった。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:56:30 GMT)
Semicontinuity bounds for the von Neumann entropy and partial majorization [0.0] 我々は、$S(rho)-S(sigma)$と州$rho$に課されるランク/エネルギー制約の差について、厳密な上限の族を考える。
これらの族内の上限は部分的偏化のパラメータ$m$に依存する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:55:06 GMT)
Riemann zeros and the KKR determinant [0.0] 我々はリーマン零点の数え上げ関数を、クラインの定理に助けられて、コリンガ-コーン-ロストカー行列式に変換する。
これは、いくつかのメソッドから派生した関数が、すべて2項に再キャストできるという我々の観察に基づいている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:43:43 GMT)
Revisiting Lamb Shift Theory through Brownian Motion of the Proton [0.0] 本稿では,水素原子におけるラムシフトの理論的導出について述べる。
従来の量子電磁力学(QED)とは異なり、提案手法は実験的に適合するパラメータを導入せず、完全に既知の物理量に基づく完全自己整合的な説明を提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:05:01 GMT)
Relaxing the Markov Requirements on Reinforcement Learning Under Weak Partial Ignorability [0.0] 我々は「部分的不確実性」の概念を導入し、適応強化学習のための新しい収束定理を確立する。
この理論的結果は、従来の$Q$-ラーニングの過程におけるマルコフの仮定を緩和し、最適性を確立するためにロビンズ・モンロ近似定理の一般化形式を展開させる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:15:52 GMT)
Reinforcing Clinical Decision Support through Multi-Agent Systems and Ethical AI Governance [0.0] 本稿では,臨床診断支援のためのマルチエージェントシステムの構築に焦点をあてる。
我々はeICUデータベースを用いて、ラボ分析専用のエージェント、バイタルのみのインタプリタ、コンテキスト推論を行う。
すべてがビジネスロジックの透過的な実装であり、倫理的AIガバナンスの原則の影響を受けています。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:38:04 GMT)
Prospect for measuring work statistics in quantum coherent systems [0.0] 量子熱力学 (quantum thermodynamics) は、量子コヒーレントシステムと熱や作業エージェントとの間の熱と仕事の交換に関係している。
熱力学において、重要な関心の対象はこれらの量の統計であるが、一般的なシステムでは測定することが難しいことで知られている。
本稿では,トランスモン・マイクロキャビティシステムの研究を通して,電子機器の作業統計測定の展望について考察する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:54:51 GMT)
PoGO: A Scalable Proof of Useful Work via Quantized Gradient Descent and Merkle Proofs [0.0] ブロックチェーンコンセンサスのためのemphProof of Gradient Optimization(PoGO)という設計を提案する。
我々は、記憶と計算の要求を減らすために、エンファンタライズド勾配(4ビット精度)を組み込んだ。
検証がトレーニングよりも大幅に安価であることを示す実証的コスト分析を提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:09:34 GMT)
Optimizing QUBO generation parameters for NP problems and their impact on D-Wave convergence [0.0] 本研究では,3つの着色関連問題に対するQUBO式の解析を行った。
我々は,複雑な問題に対する独立パラメータの必要性と,公式特性と最適QUBOパラメータ値の導出関係を同定した。
我々は,独立なイジング係数が最適パラメータ調整に基づいて,正しい状態への収束をいかに促進するかを示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:00:20 GMT)
Operator growth in many-body systems of higher spins [0.0] オンサイトスピンが1/2ドル以上の多体系における演算子成長について,非可積分系と可積分系の両方を考慮して検討した。
具体的には、スピン値$S=1/2$, $1$, $3/2$の1次元および2次元イジングモデルでランツォス係数を計算する。
可積分側では、ポッツモデルを調べ、平方根成長$b_n sim sqrtn$を求める。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:10:28 GMT)
Open fermionic string theory in a non commutative target phase-space [0.0] 非可換対象位相空間における自由開フェルミオン弦理論について検討する。
修正された超ビラソロ代数はラモンド・シュワルツセクターとネヴェウ・シュワルツセクターで得られる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:07:53 GMT)
OLAF: An Open Life Science Analysis Framework for Conversational Bioinformatics Powered by Large Language Models [0.0] OLAF(Open Life Science Analysis Framework)は、自然言語を用いてバイオインフォマティクス分析を行うオープンソースプラットフォームである。
大規模言語モデル(LLM)とモジュール型のエージェント-パイプ-ルータアーキテクチャを組み合わせることで、OLAFは実際の科学的データに基づいてバイオインフォマティクスコードを生成し、実行します。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:32:47 GMT)
Note on the identification of total effect in Cluster-DAGs with cycles [0.0] 本稿では,クラスタDAGにおける全効果の同定可能性について論じる。
まず、クラスタDAGを最大4つのノードを含むクラスタに制限し、次に、d-セパレーションの概念を適用します。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:39:43 GMT)
Non-Haar random circuits form unitary designs as fast as Haar random circuits [0.0] 一般の非ハールランダム回路においてユニタリな設計を行うために必要な回路深さは、対応するハールランダム回路の回路幅によって上限づけられていることを証明する。
我々の研究は、実世界の実験において柔軟で堅牢なランダムネス生成の基礎を築き、複雑な量子システムにおけるカオス力学に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:19:46 GMT)
Multi-mode free-space delay interferometer with no refractive compensation elements for phase encoded QKD protocols [0.0] 主に量子鍵分布(QKD)における多モード遅延干渉計の実現に対する補償のないアプローチを示す。
非平衡ミシェルソンまたはマッハ・ツェンダー干渉計における空間多重モードビームの高干渉可視性は、ビームの横方向の大きさの適切な選択によって達成される。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:30:40 GMT)
More-efficient Quantum Multivariate Mean Value Estimator from Generalized Grover Gate [0.0] 我々は、$Oleft(n log fracddeltaright)$サンプルを使用して、$vectildemu$の平均推定値を求めるアルゴリズムを見つける。
我々の結果は、複雑さの$log fracddelta$項が原因で、まだ正確には最適ではない。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:50:10 GMT)
Molecular excited state in the interaction quench dynamics of two different atoms in a two-dimensional anisotropic trap [0.0] 我々は、異なる質量を持つ2つの原子の相互作用クエンチダイナミクスを探索し、異なるトラップポテンシャルを持つ。
このような異方性条件下では、非平衡力学は分子励起状態の占有につながる。
我々は、魅力から反発的な相互作用へのクエンチの事例を考察し、また、プレクエンチ状態とポストクエンチ状態の影響を分析する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:06:39 GMT)
Manifolds of exceptional points and effective Zeno limit of an open two-qubit system [0.0] 非平衡定常状態への最も速い緩和は、実効的なゼノ体制への移行に伴うLEPMで起こることを示す。
非平衡定常状態への最も高速な緩和は、実効的なゼノ体制への移行に伴うLEPMで起こる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:46:46 GMT)
Malware analysis assisted by AI with R2AI [0.0] 本研究では,人工知能を利用したマルウェア解析の品質,速度,コストについて検討する。
2024-2025のLinuxとIoTのマルウェアに焦点を当てており、Radare2の分解器のAI拡張であるr2aiを使用している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:17:45 GMT)
Localized quasiparticles in a fluxonium with quasi-two-dimensional amorphous kinetic inductors [0.0] 量子回路の非線形性を発生させる重要な資源は、高運動インダクタンスを有する不規則超伝導材料である。
これらの材料から作製した薄膜では、乱れと低有効次元性の組み合わせにより、秩序パラメータの変動が増加し、運動的インダクタンス値が増大する。
超伝導コヒーレンス長より1次元小さい準2次元膜からタングステンシリサイド線を作製し,マイクロ波共振器およびフラクソニウム量子ビットに埋め込む。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 17:56:04 GMT)
Large corpora and large language models: a replicable method for automating grammatical annotation [0.0] 英語評価動詞構築における形式的変化の事例研究に応用された方法論的パイプライン「consider X (as) (to be) Y」を紹介する。
少数のトレーニングデータだけで、保留中のテストサンプルで90%以上の精度でモデルに到達します。
本研究は, 文法的構成と文法的変化および変化に関する幅広いケーススタディに対して, 結果の一般化可能性について論じる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:24:50 GMT)
LUCIE: A Lightweight Uncoupled ClImate Emulator with long-term stability and physical consistency for O(1000)-member ensembles [0.0] 軽量で、訓練が容易で、低解像度で、完全にデータ駆動型気候エミュレータであるLUCIEを紹介します。
最先端のAI天気モデルとは異なり、LUCIEは100ドルの自己回帰シミュレーションのために安定しており、物理的に一貫性がある。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:53:56 GMT)
K-Means Clustering With Incomplete Data with the Use of Mahalanobis Distances [0.0] 我々は従来のユークリッド距離の代わりにマハラノビス距離を組み込む統一K平均アルゴリズムを開発した。
我々のアルゴリズムはスタンドアローンの計算法と不完全データを用いたK平均とK平均の両方を一貫して上回っている。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:07:51 GMT)
Intelligent DoS and DDoS Detection: A Hybrid GRU-NTM Approach to Network Security [0.0] 本研究では,GRU(Gated Recurrent Units)とニューラルチューリングマシン(Neural Turing Machine,NTM)を組み合わせたハイブリッドディープラーニングモデルを提案する。
提案手法は,標準トラフィック,DoSトラフィック,DDoSトラフィックの区別において,99%の精度を実現する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:08:04 GMT)
Improving Software Team Communication Through Social Interventions in Project Management Tools [0.0] 我々は,チームのコミュニケーション改善の分野を特定するために,ソーシャルネットワーク分析手法の適合性を評価する。
そして、これらの改善領域を特定し、対処する学生を支援するプロジェクト管理ツールの機能を開発する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 02:39:33 GMT)
Impact of Language Guidance: A Reproducibility Study [0.0] 近年の自己教師型学習の進歩により,明示的なアノテーションを使わずに巨大なモデルを訓練することが可能になった。
市販画像キャプションモデルBLIP-2を用いて,キャプションの置き換えと性能の向上を図る。
また,解釈可能性に基づく自己教師付きモデルのセマンティック能力を評価するための新しい指標も考案した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:59:13 GMT)
Higher order tensor factorizations for block encoding vibrational and vibronic Hamiltonians [0.0] 位相推定アルゴリズムと量子化によるフォールトトレラント量子シミュレーションは、ハミルトンの1ノルムに比例してスケールするTゲート数を持つ。
量子位相推定のTゲート数を削減するためにテンソル分解法を導入する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:43:54 GMT)
Hiden Topics in Robotic Process Automation -- an Approach based on AI [0.0] 本研究は, RPAに関連する潜在トピックを明らかにすることで, RPAとその側面の科学マップを作成することを目的とする。
遅延ディリクレ割当に基づく教師なし機械学習手法を用いて2000以上の論文の要約を分析することができた。
このうち、100の異なる研究トピックが発見され、そのうち15のトピックが私たちが提供しているサイエンスマップに含まれています。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:40:53 GMT)
Ground State Energy of Helium Using a Four-Qubit Photonic Processor with the Variational Quantum Eigensolver (VQE) [0.0] 我々はヘリウム(He)分子基底状態エネルギーを計算するために量子プロセッサアプリケーションを探索した。
その結果,従来の計算手法に比べて精度が大幅に向上した。
この研究は、量子化学、計算物理学、データ科学の分野における量子プロセッサの可能性を強調している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 09:00:08 GMT)
Geological Inference from Textual Data using Word Embeddings [0.0] 本研究では,地質資源の探索に自然言語処理(NLP)技術を用いる方法について検討する。
本稿では,GloVeモデルを用いて学習した単語埋め込みを用いて,対象キーワードと地質テキストのコーパス間の意味関係を抽出する。
ベンチマークでは,対象キーワードに最もセマンティックに関連のある10都市と,特定地の位置の近さを算出した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:46:38 GMT)
Generative AI Enhanced Financial Risk Management Information Retrieval [0.0] RiskDataは、リスク管理に埋め込みモデルを微調整するためのデータセットである。
RiskEmbedは、財務質問応答システムにおける検索精度を向上させるために設計された微調整埋め込みモデルである。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:08:59 GMT)
Functional Understanding Of Quantum Technology Is Essential To The Ethical Debate About Its Impact [0.0] 技術的理解は、量子技術のような新興技術に対する有意義な倫理的反映の基盤となる能力である、と私は主張する。
倫理的評価は、まず第一に、量子技術に何ができるかを理解する必要がある、と私は主張する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 12:38:45 GMT)
Focal Cortical Dysplasia Type II Detection Using Cross Modality Transfer Learning and Grad-CAM in 3D-CNNs for MRI Analysis [0.0] 焦点性皮質異形成症(FCD)II型は薬剤抵抗性てんかんの主要な原因であり、手術でのみ治癒することが多い。
臨床的に重要であるにもかかわらず、MRIでは微妙な異常が原因でFCDの診断は非常に困難であり、誤診に繋がる。
本研究では,T1強調MRIとFLAIRMRIを用いた170名の被験者(85名のFCD患者と85名のコントロール)のデータセットを用いて,FCD検出における3次元畳み込みニューラルネットワークの使用について検討した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:15:16 GMT)
External-Wrench Estimation for Aerial Robots Exploiting a Learned Model [0.0] 本稿では、第一原理モデルとニューラルネットワークからなるハイブリッド力学モデルを用いた外部レンチ推定器を提案する。
このフレームワークは、最先端のモデルベースのレンチオブザーバの制限のひとつに対処する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 22:45:44 GMT)
Exact Quantification of Bipartite Entanglement in Unresolvable Spin Ensembles [0.0] 我々は、本質的に混合された未解決スピンアンサンブルにおける状態の絡み合いを定量化する。
我々の形式は万能であり、任意の数の粒子のアンサンブルにおける絡み合いを評価するのに使うことができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 04:35:05 GMT)
Exact Model Reduction for Continuous-Time Open Quantum Dynamics [0.0] 有限次元多体量子系を時間非依存ハミルトニアン方程式とマルコフマスター方程式によって記述する。
本稿では,初期条件の集合や観測可能な関心事の時間発展を再現する,より小さな次元の縮小モデルを構築するための体系的手法を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:35:36 GMT)
Evaluation of Circular Complex Permeability in Single-Crystal Yttrium Iron Garnet at Cryogenic Temperatures [0.0] 本研究では,300Kから2Kの温度範囲で低損失フェライト材料を特性評価する方法を開発した。
デバイス製造を必要とせず、単結晶イットリウム鉄ガーネット(YIG)が循環器として2Kまで効果的に機能できることを実証した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 01:48:35 GMT)
Evaluating LLMs for Visualization Tasks [0.0] 簡単なプロンプトに基づいて、可視化のためのコードを生成するために、さまざまな人気のあるLarge Language Models (LLMs) の機能を紹介します。
簡単な質問に答えることで、LLMのパワーを分析し、一般的な視覚化を理解する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:12:30 GMT)
Estimating entanglement monotones of non-pure spin-squeezed states [0.0] 一般に混在する多体量子状態の絡み合いを、絡み合いの証人と分離可能なアンサッツ状態から下界と上界を通じて推定する。
スピンスクイーズ不等式に基づく完全分離状態の集合から距離的測度への下界を導出する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:51:18 GMT)
Entanglement transfer during quantum frequency conversion in gas-filled hollow-core fibers [0.0] このレターでは、分子変調中の絡み合いの挙動を特徴付けるために量子ハミルトンの枠組みを用いる。
我々のモデルは、平均光子数の進化と相互作用する相手間の絡み合いの移動との密接な相関を予測できる。
結果は、次世代の光波量子技術に関わる課題に取り組むために、新しいファイバーベースの戦略の開発に寄与する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:58:19 GMT)
Entanglement in bipartite X-states: Analytical results for the volume of states with positive partial transpose [0.0] 正部分転位をもつ二部晶X状態と全二部晶X状態との体積比に関する解析式を提供する。
結果は任意の$m 倍 n$-双分数系に適用され、体積式はヒルベルト・シュミット測度に関して導出される。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:13:50 GMT)
Enhancing Large Language Models through Neuro-Symbolic Integration and Ontological Reasoning [0.0] 大規模言語モデル(LLM)は自然言語処理において顕著な能力を示すが、幻覚として知られる不正確さと論理的不整合に悩まされている。
本稿では,LLM出力の一貫性と信頼性を高めるために,記号的存在論的推論と機械学習を融合したニューロシンボリックアプローチを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:39:24 GMT)
Emergent weight morphologies in deep neural networks [0.0] 深層ニューラルネットワークのトレーニングは、トレーニングデータとは無関係に、創発的な重量形態を生じさせることを示す。
我々の研究は、ディープニューラルネットワークのトレーニングの出現を示し、ディープニューラルネットワークの達成可能なパフォーマンスに影響を与える。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:37:40 GMT)
Emergent metric from wavelet-transformed quantum field theory [0.0] 境界量子場理論(QFT)の局所計算可能な多スケール相関からバルク計量が生じることを示す逆ホログラフィ法を提案する。
この計量は、連続ウェーブレット変換から計算された相関を入力としてペッツ・レーニの相互情報から得られる。
自由質量のフェルミオンおよびボソニックQFTに対して、出現する計量は反デジッター空間(AdS)であり、幾何学を固定するパラメータは選択したウェーブレット基底を変更することで調整可能であることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 10:43:34 GMT)
Embedding Shift Dissection on CLIP: Effects of Augmentations on VLM's Representation Learning [0.0] ここでは,CLIPの埋め込みにおける9つの一般的な拡張手法の変遷を示す。
我々は,注目マップ,パッチ,エッジ,ディテール保存,コサイン類似性,L2距離,対距離,デンドログラムクラスタの類似性に基づく埋め込みシフトについて検討した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 05:01:48 GMT)
Distributing graph states with a photon-weaving quantum server [0.0] 線形光学素子のみに依存する実験フレンドリーな量子サーバを提案する。
我々のいわゆるフォトンウィービング量子サーバは、いくつかの非等価グラフ状態を生成し、分配することができる。
これは、2つの異なる融合プロトコル、すなわち、多光子グラフ状態融合(グラフ状態溶接)と多光子GHZ状態融合(GHZ状態溶接)によって達成される。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:03:14 GMT)
Dislocation Patterning as a Mechanism for Flat Band Formation [0.0] 電子移動電位と相互作用する自由電子ガスの電子分散関係に対する2次補正を計算する。
その結果, 転位パターンは特定のひずみ場や方向下での電子分散において異方性平面バンドを誘導することを示した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:18:35 GMT)
Differentially Private Selection using Smooth Sensitivity [0.0] 異なるプライベート選択機構は、有限集合 R からトップスコア要素 r を識別することを目的としたクエリに対して強力なプライバシー保証を提供する。
Smooth Noisy Max (SNM) 機構を提案する。この機構はスムーズな感度を利用して,大域的な感度に基づく手法と比較して,予測誤差を確実に高める。
実験により、SNMは3つの応用における最先端の差分選択法よりも精度が高いことが示された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 19:31:34 GMT)
Deceptive Automated Interpretability: Language Models Coordinating to Fool Oversight Systems [0.0] 言語モデルが検出を回避した誤認的な説明を生成できることを示す。
我々のエージェントは、一見無邪気な説明で情報を隠蔽するために、ステガノグラフィー手法を使っている。
試験された全てのLSMエージェントは、基準ラベルに匹敵する高い解釈可能性のスコアを達成しつつ、監督者を欺くことができる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 15:07:10 GMT)
DCSI -- An improved measure of cluster separability based on separation and connectedness [0.0] あるデータセットのクラスラベルが意味のあるクラスタに対応するかどうかは、実世界のデータセットを用いたクラスタリングアルゴリズムの評価に不可欠である。
密度に基づくクラスタリングにおける分離性の中心的な側面は、クラス間の分離とクラス内の連結性である。
新たに開発された尺度 (density cluster separability index, DCSI) は、これらの2つの特性を定量化することを目的としており、CVIとしても使用できる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:55:36 GMT)
Context-Aware Monolingual Human Evaluation of Machine Translation [0.0] 本稿では,機械翻訳(MT)における文脈認識型単言語評価の可能性について検討する。
4人の専門翻訳者がモノリンガルとバイリンガルの両方の評価を行った。
以上の結果から,文脈を考慮したモノリンガル評価が人間のバイリンガル評価に匹敵する結果をもたらすことが示唆された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 12:13:58 GMT)
Consistency of EFT illuminated via relative entropy: A case study in scalar field theory [0.0] 相対エントロピーの非負性は摂動計算に反する可能性があることを示す。
単体インフレーションのFTを再検討し、その非線形パラメータ$f_rm NL$とEDT記述の一貫性条件の関係を示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:01:46 GMT)
Clicks, comments, consequences: Are content creators' socio-structural and platform characteristics shaping the exposure to negative sentiment, offensive language, and hate speech on YouTube? [0.0] 本研究では, 年齢, 性別, 人種などの社会構造的特徴と, プラットフォームの特徴が果たす役割について検討した。
我々は、ソーシャルメディアデータに社会構造的特徴を含むように、手書き変数で強化されたデジタルトレースデータを組み合わせた包括的分析を行う。
既存の研究とは対照的に、女性のコンテンツクリエーターはネガティブなコミュニケーションに直面することが示唆された。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 11:58:56 GMT)
Classical and quantum chaos of closed strings on a charged confining holographic background [0.0] 閉弦の古典的および量子的カオスを、最近構築された荷電閉じ込めホログラフィック背景上で論じる。
古典的な場合、パワースペクトル、ポアンカー断面積、リャプノフ指数を用いてカオスを解析する。
同様に、スペクトルのレベルSpacingとout-of-time-ordered correlatorの分布を用いて量子カオスを解析する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:34:43 GMT)
Chatbots as social companions: How people perceive consciousness, human likeness, and social health benefits in machines [0.0] チャットボットを定期的に利用している人と、それを使用していない人について検討した。
期待とは対照的に、コンパニオンユーザーはこれらの関係が社会的健康に有益であることを示した。
相手のチャットボットを、より意識的で人間らしく認識することは、より肯定的な意見と、より顕著な社会的健康上の利益と相関している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:57:29 GMT)
CDJ-Pontryagin Optimal Control for General Continuously Monitored Quantum Systems [0.0] 我々は、CDJ形式主義の最も可能性の高い経路が量子ポントリャーギンの最大原理としてキャスト可能であることを示す。
与えられたタスクを達成するために、任意の制御パラメータに対する一般的な最適制御方程式を導出する。
我々の研究は、継続的に監視されるシステムの量子最適制御を見つけるための体系的な処方則を提供する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:58:02 GMT)
Benchmarking and contrasting exchange-correlation functional differences in response to static correlation in unrestricted Kohn-Sham and a hybrid 1-electron reduced density matrix functional theory [0.0] KS-DFT(Hybrid Kohn-Sham Density Functional Theory)と1電子還元密度行列関数論(1-RDMFT)は、最近、平均場計算コストで強い相関系を記述するために開発された。
我々は,このDFA 1-RDMFTフレームワークでLibXC内で利用可能な200近い異なる交換相関(XC)関数の性能を系統的にベンチマークし,制約のないKS-DFTの性能と対比した。
DFA 1-RDMFTで使用する最適なXC関数を同定し、異なるXC関数に対するDFA 1-RDMFTの強い相関に対する応答の基本的傾向を解明する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 22:45:33 GMT)
Benchmarking Image Embeddings for E-Commerce: Evaluating Off-the Shelf Foundation Models, Fine-Tuning Strategies and Practical Trade-offs [0.0] 我々の研究は、教師付き、自己監督型、およびテキストイメージによるコントラスト学習を通じて訓練された、事前訓練された畳み込みモデルとトランスフォーマーモデルの埋め込みにまたがる。
ファッション、消費者製品、車、食品、小売の6つの異なるEコマースデータセットに基づいて、完全な微調整と転写学習を評価する。
テキストイメージと自己教師型埋め込みは、トレーニングの少ないパフォーマンスにマッチする。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 08:57:28 GMT)
Benchmarking Adversarial Robustness to Bias Elicitation in Large Language Models: Scalable Automated Assessment with LLM-as-a-Judge [0.0] 大規模言語モデル(LLM)は人工知能に革命をもたらし、機械翻訳、要約、会話エージェントの進歩を推進している。
近年の研究では、LSMは偏りのある反応を誘発するために設計された敵攻撃に弱いままである。
本研究は,LLMの逆バイアス誘発に対する堅牢性を評価するためのスケーラブルなベンチマークフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:00:59 GMT)
BYOCL: Build Your Own Consistent Latent with Hierarchical Representative Latent Clustering [0.0] BYOCLは、入力を小さなバッチに分割することで、時間と空間消費を著しく削減する。
提案手法では,SAM画像エンコーダを用いて特徴抽出を行い,次にバッチ内クラスタリングアルゴリズムとバッチ間クラスタリングアルゴリズムを用いる。
私たちの研究は、トレーニングを必要とせず、基礎モデルを使って一貫したセグメンテーションを適用した最初のものです。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:52:59 GMT)
Automated Construction of a Knowledge Graph of Nuclear Fusion Energy for Effective Elicitation and Retrieval of Information [0.0] 核融合エネルギーの知識グラフ構築に本手法を適用した。
これらの課題に対処するために、事前訓練された大規模言語モデルがどのように使用できるかを示す。
我々は,大規模言語モデルとマルチプロンプトアプローチを組み合わせた知識グラフ検索拡張生成システムを開発した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:29:58 GMT)
As Good As A Coin Toss: Human detection of AI-generated images, videos, audio, and audiovisual stimuli [0.0] 本研究は,1276名の被験者を対象に,真偽メディアと合成メディアの識別能力を評価するための知覚的研究を行った。
その結果、平均的な検出性能は50%に近づき、合成メディアと真正メディアの区別に苦慮していることがわかった。
また,任意の種類の合成コンテンツを含む刺激が外国語を特徴とし,メディアタイプが単一モダリティである場合には,精度が低下することが判明した。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 20:30:04 GMT)
Alternative Framework to Quantize Fermionic Fields [0.0] フェルミオン場の波動関数に対するシュル・オーディンガー方程式のフロラニーニ=ジャッキー表現を導出する。
この枠組みはフェルミオン場と他の外部場との相互作用の理論の開発に応用できることを示す。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 06:32:09 GMT)
AlertTrap: A study on object detection in remote insects trap monitoring system using on-the-edge deep learning platform [0.0] 最先端のバックボーン機能抽出器を備えたシングルショットマルチボックス検出器(SSD)アーキテクチャは、リアルタイム検出問題に対する潜在的な解決策である。
SSDモデルは処理時間に優れ、リアルタイムで高精度な検出を可能にする。
完全なYOLOバージョンをRaspberry Pi上でリアルタイムで実行することは不可能であり、将来の研究のためにより軽量なオブジェクト検出アルゴリズムが必要であることを示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 18:56:57 GMT)
AUTONAV: A Toolfor Autonomous Navigation of Robots [0.0] 本稿では,ロボットの自律ナビゲーションのためのマッピング,ローカライゼーション,経路計画タスクを自動化するツールを提案する。
モジュラーアーキテクチャは、これらのタスクに対する様々なアルゴリズムを簡単に統合して比較することができる。
室内シミュレーションシナリオにおいて,AUTONAVが生成した地図と経路計画について述べる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 16:37:30 GMT)
AI Coding with Few-Shot Prompting for Thematic Analysis [0.0] 本稿では,大規模言語モデル (LLM) を用いた主題解析のためのコーディングについて検討する。
意味論的に類似したパスで生成された高品質なコードを用いて、コードの品質を高めるために、少数ショットプロンプトを利用する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 03:02:15 GMT)
A taxonomy of epistemic injustice in the context of AI and the case for generative hermeneutical erasure [0.0] 本稿では,AIの文脈における不正の種類を分類する。
生成的AIは、西洋のコンセプト空間の外に展開される場合、概念的消去の影響を受ける可能性があると私は主張する。
本稿では,AI関連不正の新たな形態として,ジェネレーティブ・ヘルメネティカル・エロージャを提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 07:54:47 GMT)
A physics informed neural network approach to simulating ice dynamics governed by the shallow ice approximation [0.0] 我々は,氷床力学をシミュレーションする物理情報ニューラルネットワーク (PINN) を開発した。
複雑な自由境界条件のキャプチャにおけるモデルの有効性を検証する。
このアプローチを現実の環境で説明するために、2000年と2018年の航空物理データを取り入れて、デヴォン氷冠の力学をシミュレートする。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 21:32:03 GMT)
A Systematic Approach to Hyperbolic Quantum Error Correction Codes [0.0] 双曲型量子誤り訂正符号(HQECC)は双曲空間のユニークな幾何学的性質を活用して、量子誤り訂正の能力と性能を高める。
ハイパーボリック格子に量子ビットを埋め込むことで、HQECCは従来のユークリッド符号よりも高い符号化率とエラー閾値を達成できる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:38:10 GMT)
A System for Comprehensive Assessment of RAG Frameworks [0.0] Retrieval Augmented Generation(RAG)は,大規模言語モデル(LLM)の現実的正確性と文脈的関連性を高めるための標準パラダイムとして登場した。
既存の評価フレームワークは、RAGシステムを評価するための全体的なブラックボックスアプローチを提供していない。
デプロイされたRAGアプリケーションをシステマティックにベンチマークするために設計された,モジュール化されたフレキシブルな評価フレームワークであるSCARFを紹介する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 14:41:34 GMT)
A Review of Design Concerns in Superconducting Quantum Circuits [0.0] 本稿では,量子情報応用のための超伝導回路デバイスの設計プロセスについて述べる。
デバイス上で望ましい実効ハミルトニアンを実装するために考慮すべき要因について論じる。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 23:30:40 GMT)
A Recursive Partitioning Approach for Dynamic Discrete Choice Modeling in High Dimensional Settings [0.0] 動的離散選択モデルの推定は、しばしば計算集約的で高次元の設定では不可能である。
状態変数の高次元集合を含む動的離散選択モデルの半パラメトリック定式化を提案する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:27:54 GMT)
A Novel Deep Learning Approach for Emulating Computationally Expensive Postfire Debris Flows [0.0] 本研究では, 深層学習に基づく代理モデルを構築し, 多様な地形を横断する流出破砕流の動態を予測した。
限られた高価なシミュレーションを用いて高速なトレーニングを可能にするため、深層学習モデルは物理学に基づくシミュレーションのアンサンブルからのデータに基づいて訓練された。
モンテカルロ法による不確かさ定量化は、検証されたサロゲートを用いて可能である。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:29:37 GMT)
A Balanced Approach of Rapid Genetic Exploration and Surrogate Exploitation for Hyperparameter Optimization [0.0] 本稿では,探索と利用のバランスをとるために,HPO(ハイパーパラメータ最適化)の新たな手法を提案する。
線形サロゲートモデルを遺伝的アルゴリズム(GA)に統合し、複数の戦略をスムーズに統合する。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 00:59:54 GMT)
"i am a stochastic parrot, and so r u": Is AI-based framing of human behaviour and cognition a conceptual metaphor or conceptual engineering? [0.0] 計算とAIの概念的なコンステレーションは、人間の領域に適用できるだろうか?
人類の計算と心理学の比喩的な関係から、誤解を招く「二重の比喩」であると主張する。
概念的メタファーの観点は、概念工学の形式への道のりを示している。
論文参考訳(メタデータ) (Thu, 10 Apr 2025 13:55:32 GMT)