Do "New Snow Tablets" Contain Snow? Large Language Models Over-Rely on Names to Identify Ingredients of Chinese Drugs [79.0] 伝統的な中国医学(TCM)は医療に採用され、臨床応用をサポートするために、LLM(Large Language Models)が出現している。
これらのモデルの基本的な要件は、TCM薬物成分の正確な同定である。
我々の系統的分析では、一貫した障害パターンが明らかである: モデルでは、しばしば文字通り、薬物名を理解し、関連性に関係なく共通のハーブを過剰に使用し、不慣れな定式化に直面した時に不規則な振る舞いを示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:33:54 GMT)
AdaSteer: Your Aligned LLM is Inherently an Adaptive Jailbreak Defender [73.1] 本稿では,入力特性に基づいてモデル動作を調整するアダプティブアクティベーションステアリング手法であるAdaSteerを提案する。
AdaSteer は Rejection Direction (RD) と Harmfulness Direction (HD) の両方に沿って入力表現を操る
本研究は,LLMにおけるリアルタイム・フレキシブル安全対策のための解釈可能なモデル内装の可能性を明らかにするものである。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 07:39:17 GMT)
MM-Ego: Towards Building Egocentric Multimodal LLMs for Video QA [72.5] 本研究の目的は,エゴセントリックな映像理解のためのマルチモーダル基盤モデルの構築である。
Ego4Dでは,人間による注釈付きデータに基づいて,30秒から1時間に及ぶエゴセントリックビデオの高品質なQAサンプルを自動生成する。
我々は、629の動画と7,026の質問でエゴセントリックなQAベンチマークを作成し、様々な長さのビデオで視覚的詳細を認識・記憶するモデルの能力を評価する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:27:56 GMT)
Distilling Transitional Pattern to Large Language Models for Multimodal Session-based Recommendation [67.8] セッションベースのレコメンデーション(SBR)は、匿名セッションに基づいて次の項目を予測する。
近年のMultimodal SBR法は、モダリティ学習に単純化された事前学習モデルを用いるが、セマンティック・リッチネスに制限がある。
蒸留パラダイムを拡張し,MSBRの促進のための遷移パターンを分離・整合させる多モードLCM拡張フレームワークTPADを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 07:49:08 GMT)
MLRC-Bench: Can Language Agents Solve Machine Learning Research Challenges? [64.6] MLRC-Benchは、機械学習(ML)リサーチコンペティションの挑戦において、言語エージェントがいかに効果的に対処できるかを定量化するために設計されたベンチマークである。
MLRC-Benchは以前の研究とは異なり、新しい研究手法を提案し、実装する上で重要なステップを計測する。
最も優れた試験薬でさえ、ベースラインとトップヒューマンのスコアの差の9.3%しか閉じていない。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 19:35:43 GMT)
SegEarth-R1: Geospatial Pixel Reasoning via Large Language Model [62.0] 暗黙的な問合せと推論を可能にし,対象領域のマスクを生成する新しいタスク,すなわち地理空間的画素推論を導入する。
我々は,5,434枚の手動アノテート画像マスクと3万枚以上の暗黙的な質問応答ペアからなる,EarthReasonという,最初の大規模ベンチマークデータセットを構築し,リリースする。
SegEarth-R1は、推論タスクと参照セグメンテーションタスクの両方で最先端のパフォーマンスを実現し、従来のLCMベースのセグメンテーション手法よりも大幅に優れている。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:36:47 GMT)
SD-ReID: View-aware Stable Diffusion for Aerial-Ground Person Re-Identification [61.8] 本稿では,AG-ReIDのためのSD-ReIDという2段階特徴学習フレームワークを提案する。
第1段階では、粗粒度表現と制御可能な条件を抽出するために、簡単なViTベースモデルを訓練する。
第2段階では、制御可能な条件で導かれる補完表現を学習するためにSDモデルを微調整する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:44:50 GMT)
Structure-Accurate Medical Image Translation based on Dynamic Frequency Balance and Knowledge Guidance [60.3] 拡散モデルは,必要な医用画像を合成するための強力な戦略である。
既存のアプローチはまだ、高周波情報の過度な適合による解剖学的構造歪みの問題に悩まされている。
本稿では,動的周波数バランスと知識指導に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:48:13 GMT)
Real-time Verification and Refinement of Language Model Text Generation [60.0] 大規模言語モデル(LLM)は、幅広い自然言語タスクにおいて顕著な性能を示している。
重要な課題は、時に事実的に誤った答えを生じさせることである。
本稿では,LLM出力の検証と改善の効率化を目的とした新しい手法であるStreaming-VRを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:22:51 GMT)
Syzygy of Thoughts: Improving LLM CoT with the Minimal Free Resolution [59.4] CoT(Chain-of-Thought)は、問題を逐次ステップに分解することで、大きな言語モデル(LLM)の推論を促進する。
思考のシジー(Syzygy of Thoughts, SoT)は,CoTを補助的,相互関連的な推論経路を導入して拡張する新しいフレームワークである。
SoTはより深い論理的依存関係をキャプチャし、より堅牢で構造化された問題解決を可能にする。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:35:41 GMT)
Two-Timescale Joint Transmit and Pinching Beamforming for Pinching-Antenna Systems [58.3] ピンチングアンテナシステム (PASS) は、多数の低Kuピンチングアンテナを介して、アクティベーション位置を調節可能なライン・オブ・ライト・リンクを容易にする革命的フレキシブルアンテナとして提案されている。
2時間スケール問題を2つのサブプロブレムに分離するために, 一次二重分解法を開発した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:58:35 GMT)
On the Cone Effect in the Learning Dynamics [57.0] 実世界の環境でのニューラルネットワークの学習力学を実証的に研究する。
第一相ではeNTKが著しく進化し、第二相ではeNTKが、第二相ではeNTKは進化し続けるが、狭い空間では制約される。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 10:24:49 GMT)
Toward 6G Native-AI Network: Foundation Model based Cloud-Edge-End Collaboration Framework [55.7] データ、AIモデル、運用パラダイムの観点から、6GネイティブAIを達成する上での課題を分析します。
基礎モデルに基づく6GネイティブAIフレームワークを提案し、専門家の知識の統合方法を提供し、2種類のPFMのカスタマイズを提示し、ネイティブAIフレームワークの新たな運用パラダイムを概説する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:40:40 GMT)
On the Wasserstein Convergence and Straightness of Rectified Flow [54.6] Rectified Flow (RF) は、ノイズからデータへの直流軌跡の学習を目的とした生成モデルである。
RFのサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する理論的解析を行った。
本稿では,従来の経験的知見と一致した1-RFの特異性と直線性を保証する一般的な条件について述べる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:13:45 GMT)
An Efficient Quantum Classifier Based on Hamiltonian Representations [50.5] 量子機械学習(QML)は、量子コンピューティングの利点をデータ駆動タスクに移行しようとする分野である。
入力をパウリ弦の有限集合にマッピングすることで、データ符号化に伴うコストを回避できる効率的な手法を提案する。
我々は、古典的および量子モデルに対して、テキストおよび画像分類タスクに対する我々のアプローチを評価する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 11:49:53 GMT)
Not All Edges are Equally Robust: Evaluating the Robustness of Ranking-Based Federated Learning [49.7] Federated Ranking Learning (FRL) は最先端のFLフレームワークであり、通信効率と中毒攻撃に対するレジリエンスで際立っている。
Vulnerable Edge Manipulation (VEM) 攻撃という, FRLに対する新たな局所モデル中毒攻撃を導入する。
我々の攻撃は、全体的な53.23%の攻撃効果を達成し、既存の方法よりも3.7倍のインパクトを与える。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:45:48 GMT)
Arbitrary state creation via controlled measurement [49.5] このアルゴリズムは、制御されたアシラ状態の測定を使用して、必要なアシラ状態を検出する小さな確率の問題を回避する。
このアルゴリズムは、様々なアルゴリズム、特に以前に開発された行列演算アルゴリズムにおいて必要な入力状態を生成するサブルーチンである。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 07:23:50 GMT)
CamMimic: Zero-Shot Image To Camera Motion Personalized Video Generation Using Diffusion Models [47.7] CamMimicは、所定のリファレンスビデオで観察されたカメラモーションを、ユーザの選択したシーンにシームレスに転送するように設計されている。
非関連シーン間のカメラの動き伝達を評価するための確立された指標が存在しないため,CameraScoreを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:04:11 GMT)
EmoAgent: Assessing and Safeguarding Human-AI Interaction for Mental Health Safety [47.6] EmoAgentは、人間とAIのインタラクションにおけるメンタルヘルスハザードの評価と緩和を目的とした、マルチエージェントAIフレームワークである。
EmoEvalは、精神的に脆弱な個人を含む仮想ユーザをシミュレートして、AI文字との対話前後のメンタルヘルスの変化を評価する。
EmoGuardは仲介役として機能し、ユーザーのメンタルステータスを監視し、潜在的な害を予測し、リスクを軽減するための修正的なフィードバックを提供する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 18:47:22 GMT)
BabyVLM: Data-Efficient Pretraining of VLMs Inspired by Infant Learning [47.5] ヒトの幼児は、最小限の入力から視覚的推論スキルを急速に発達させる。
最近の取り組みは、SAYCamのような幼児にインスパイアされたデータセットを活用している。
包括的ドメイン評価ベンチマークと合成トレーニングデータセットからなる新しいフレームワークであるBabyVLMを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 04:17:12 GMT)
On Language Models' Sensitivity to Suspicious Coincidences [47.1] 人間はデータに対して誘導的に一般化する際に不審な偶然に敏感である。
言語モデル(LM)の動作に不審な不審な結果が反映されているかどうかを解析する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 00:43:06 GMT)
DropoutGS: Dropping Out Gaussians for Better Sparse-view Rendering [45.8] 3D Gaussian Splatting (3DGS) は新規なビュー合成において有望な結果を示した。
トレーニングビューの数が減少するにつれて、新しいビュー合成タスクは、非常に過小評価された問題に格段に低下する。
オーバーフィッティングを緩和する低複雑さモデルの利点を生かしたランダムドロップアウト正規化(RDR)を提案する。
さらに、これらのモデルに高周波の詳細がないことを補うため、エッジ誘導分割戦略(ESS)を開発した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:17:21 GMT)
Reconstructing Satellites in 3D from Amateur Telescope Images [44.2] 本稿では,ハイブリッド画像前処理パイプラインを統合することで,障害を克服する新しい計算イメージングフレームワークを提案する。
我々は,中国の江東宇宙ステーションと国際宇宙ステーションの合成衛星データセットとオンスキー観測の両方にアプローチを検証した。
我々のフレームワークは地球からの高忠実度3D衛星監視を可能にし、宇宙状況認識のためのコスト効率の良い代替手段を提供する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:08:58 GMT)
Evaluating AI systems under uncertain ground truth: a case study in dermatology [43.8] 不確実性を無視することは、モデル性能の過度に楽観的な推定につながることを示す。
皮膚状態の分類では,データセットの大部分が重大な真理不確実性を示すことが判明した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 11:30:08 GMT)
EmbodiedOcc++: Boosting Embodied 3D Occupancy Prediction with Plane Regularization and Uncertainty Sampler [43.3] 本稿では,EmbodiedOcc++を紹介する。
Geometry-Guided Refinement Module (GRM) は、SUS(Semantic-Aware Uncertainty Sampler)とともに平面正規化によるガウス的更新を制約する
EmbodiedOcc-ScanNetベンチマークの実験は、EmbodiedOccがさまざまな設定で最先端のパフォーマンスを達成することを示した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:10:49 GMT)
InfoBound: A Provable Information-Bounds Inspired Framework for Both OoD Generalization and OoD Detection [42.0] 実世界のシナリオでは、分配シフトは、OoD(out-of-distribution)一般化とOoD検出という2つの問題の重要性をもたらす。
相互情報最小化(MI-Min)と条件エントロピー最大化(CE-Max)からなる統一的なアプローチを提供する。
競争のベースラインに比べて2つの課題間のトレードオフを緩和することに成功した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:13:37 GMT)
GMValuator: Similarity-based Data Valuation for Generative Models [41.8] 生成モデル評価器(GMValuator, Generative Model Valuator, GMValuator, GMValuator)は、画像生成タスクにデータバリュエーションを提供するための、トレーニング不要で、モデルに依存しない最初のアプローチである。
GMValuatorは、その有効性を示すために、ベンチマークと高解像度データセットで広範囲に評価されている。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:37:36 GMT)
Vision-Language Model for Object Detection and Segmentation: A Review and Evaluation [38.2] VLM(Vision-Language Model)は、OV(Open-Vocabulary)オブジェクトの検出とセグメンテーションタスクにおいて広く採用されている。
それらはOV関連タスクを約束しているにもかかわらず、従来のビジョンタスクの有効性は評価されていない。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:28:13 GMT)
Mitigating Long-tail Distribution in Oracle Bone Inscriptions: Dataset, Model, and Benchmark [36.5] オラクル骨碑文(OBI)の認識は、古代中国の歴史や文化を理解する上で重要な役割を担っている。
既存のOBIデータセットは長期分布の問題に悩まされ、多数派と少数派の間でOBI認識モデルの性能に偏りが生じる。
我々は,OBIの専門家によるドメイン知識を取り入れた14,542枚の画像からなる,OBI生成と復調のための構造整合型OBIデータセットであるOracle-P15Kを紹介する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:03:25 GMT)
UXAgent: A System for Simulating Usability Testing of Web Design with LLM Agents [33.9] 大規模言語モデルシミュレーションエージェント(textbfLLM Agent)研究の最近の進歩は、textbfUXAgentを設計するきっかけとなった。
システムにはペルソナジェネレータモジュール,LDMエージェントモジュール,ユニバーサルブラウザコネクタモジュールがあり,数千のシミュレーションユーザを自動的に生成する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 02:34:22 GMT)
Short-Path Prompting in LLMs: Analyzing Reasoning Instability and Solutions for Robust Performance [33.2] 大規模言語モデル (LLM) の推論は、主にチェーン・オブ・シント (CoT) のアプローチによるものである。
LLMは、推論に関連する質問に応答するときに、長くて詳細なCoT経路を提供するように、命令調整される。
人間は自然に認知的な惨事であり、言語モデルにかなり短い反応を与えるよう促す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:12:14 GMT)
CheatAgent: Attacking LLM-Empowered Recommender Systems via LLM Agent [33.0] 大言語モデル(LLM)を利用したレコメンデーションシステム(RecSys)は、パーソナライズされたユーザーエクスペリエンスに大きな進歩をもたらした。
LLMの人間的な能力を活用して、CheatAgentと呼ばれる新たな攻撃フレームワークを提案する。
提案手法は,入力修正の最小化による最大衝撃に対する挿入位置をまず同定する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:31:37 GMT)
Graph ODEs and Beyond: A Comprehensive Survey on Integrating Differential Equations with Graph Neural Networks [32.4] グラフニューラルネットワーク(GNN)と微分方程式(DE)は、近年顕著な相乗効果を示す研究分野として急速に進歩している。
既存の手法を分類し、その基礎となる原則を議論し、分子モデリング、交通予測、流行拡散といった分野にまたがる応用を強調します。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 18:48:24 GMT)
Tokens, the oft-overlooked appetizer: Large language models, the distributional hypothesis, and meaning [31.6] トークン化は多くの言語モデルの現在のアーキテクチャにおいて必要なコンポーネントである。
トークンと事前学習がバイアスやその他の望ましくないコンテンツのバックドアとして機能するかについて議論する。
トークン化アルゴリズムの目的関数が大規模言語モデルの認知に影響を及ぼす証拠を中継する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:17:45 GMT)
Unlearnable Examples Give a False Sense of Data Privacy: Understanding and Relearning [31.3] 学習不可能な例は、公開データに知覚不能な摂動を加えることで、学習不可能な例を生成する。
本稿では、学習不可能な例を打破するために特別に設計された自己適応型トレーニングフレームワークであるプログレッシブ・ステージド・トレーニングを提案する。
本手法は,文学におけるすべての最先端手法の難解性を回避している。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:18:15 GMT)
LightHeadEd: Relightable & Editable Head Avatars from a Smartphone [30.3] 本稿では,ポラロイドフィルタを搭載したスマートフォンのみで高品質なヘッドアバターを製作するための,新しい費用対効果のアプローチを提案する。
我々のアプローチは、単一点光源を持つ暗い部屋で、クロスポーラライズとパラレルポーラライズされたビデオストリームを同時にキャプチャすることである。
パラメトリックヘッドモデルのUV空間に2次元ガウスアンを埋め込んだハイブリッド表現を導入する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 17:51:56 GMT)
MMCLIP: Cross-modal Attention Masked Modelling for Medical Language-Image Pre-Training [29.0] 本稿では,MMCLIP(Masked Medical Contrastive Language- Image Pre-Training)フレームワークを提案する。
まず、注意マッピング画像モデリング(AttMIM)とエンティティ駆動マスキング言語モデリングモジュール(EntMLM)を紹介する。
第2に、MMCLIPは、病原性プロンプトを導入してマルチモーダル学習を強化するために、不適切なデータを大まかに活用する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:47:03 GMT)
KeyVID: Keyframe-Aware Video Diffusion for Audio-Synchronized Visual Animation [28.9] KeyVIDは、オーディオ信号のキーモーメントの生成品質を大幅に改善する、音声認識と視覚のアニメーションフレームワークである。
我々は、KeyVIDが複数のデータセット間でオーディオ-ビデオ同期とビデオ品質を大幅に改善することを実証した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 17:06:03 GMT)
Selective Query-guided Debiasing for Video Corpus Moment Retrieval [28.7] ビデオモーメント検索は、与えられたテキストクエリに関連する未編集ビデオのターゲットモーメントをローカライズすることを目的としている。
既存の検索システムは、ショートカットとして検索バイアスに依存する傾向にある。
選択型クエリ誘導型デバイアスネットワーク(SQuiDNet)を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:15:28 GMT)
A simulation-heuristics dual-process model for intuitive physics [28.7] 注ぐ角度の予測には,シミュレーション時間によって異なる2つの誤差パターンが認められた。
本稿では,シミュレーションのコストがかかるとシミュレーションに切り替えるシミュレーション・ヒューリスティックス・モデル (SHM) を提案する。
SHMは人間の行動とより正確に一致し、様々なシナリオにまたがる一貫した予測性能を示し、直感的な物理的推論の適応性に対する理解を深める。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:34:02 GMT)
Reduction of Supervision for Biomedical Knowledge Discovery [28.7] 知識抽出と処理に自動化手法を採用することが不可欠である。
監督レベルとモデルの有効性の間の適切なバランスを見つけることは、大きな課題である。
本研究は,非構造化テキストにおけるバイオメディカルエンティティ間の意味的関係の同定という課題に対処する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:05:40 GMT)
ERL-MPP: Evolutionary Reinforcement Learning with Multi-head Puzzle Perception for Solving Large-scale Jigsaw Puzzles of Eroded Gaps [28.0] マルチヘッド・プッフル・パーセプションを用いた進化的強化学習の枠組みを提案する。
提案したERL-MPPは、大きなギャップを持つJPLEG-5データセットと大規模なパズルを持つMITデータセットで評価される。
両方のデータセットのすべての最先端モデルよりも大幅に優れています。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:56:41 GMT)
AgentA/B: Automated and Scalable Web A/BTesting with Interactive LLM Agents [27.7] A/Bテストは、ヒトの大規模でライブなトラフィックに依存しているため、依然として制限されている。
本稿では,ユーザインタラクション行動と実際のWebページを自動的にシミュレートする新しいシステムであるAgentA/Bを提案する。
以上の結果から, エージェントA/Bは人間の行動パターンをエミュレートできる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 21:10:56 GMT)
Beyond Words: AuralLLM and SignMST-C for Sign Language Production and Bidirectional Accessibility [27.2] 7200万人の聴覚障害者にとって手話は主要なコミュニケーション手段である。
我々はCNText2SignとCNSignを導入し、中国手話における双方向アクセシビリティシステムをサポートするための最初の統合データセットを構成する。
本稿では,CNText2Signのポーズデータを用いた疎結合アーキテクチャを用いたAuraLLMモデルを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:50:16 GMT)
Online-Score-Aided Federated Learning: Taming the Resource Constraints in Wireless Networks [26.7] オンラインスコア支援連合学習(OSAFL)は、無線アプリケーションに関連するタスクを学習するように設計されている。
シミュレーションの結果,OSAFLの有効性を4つのMLモデルで検証した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 22:11:58 GMT)
Comorbidity-Informed Transfer Learning for Neuro-developmental Disorder Diagnosis [26.6] fMRIを用いた神経発達障害のコモビディティ・イン・トランスファー学習フレームワーク
新たに強化された表現生成ネットワークを提案する。
その結果、CITLは自閉症スペクトラム障害と注意欠陥高活動障害を検出するために76.32%と73.15%の競争的精度を達成した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 07:30:55 GMT)
Alleviating the Fear of Losing Alignment in LLM Fine-tuning [26.2] 大規模言語モデル(LLM)は倫理的でない、あるいは有害な質問に答え、アプリケーションに対する懸念を提起する。
本稿では、微調整中に失われたアライメントの回復に焦点を当てる。
本手法は, タスク性能を犠牲にすることなく, 有害な質問に対する回答の割合を33.25%から1.74%に削減できる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 23:47:16 GMT)
D$^2$iT: Dynamic Diffusion Transformer for Accurate Image Generation [26.0] 大きな圧縮は局所的リアリズムを制限し、小さな圧縮は計算の複雑さを増大させ、グローバルな一貫性を損なう。
本稿では,異なる領域の重要性を認識し,画像領域を動的に圧縮する手法を提案する。
本稿では,画像生成の有効性と効率を高めるために,新しい2段階のフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:33:28 GMT)
Causal integration of chemical structures improves representations of microscopy images for morphological profiling [25.0] そこで我々は, 化学化合物を細胞表現型の非現実的変換を誘導する処理としてモデル化する表現学習フレームワークMICONを紹介する。
化学物質情報を学習プロセスに組み込むことによって,評価設定の一貫性が向上することが実証された。
本研究は, 形態素プロファイリングにおける表現学習の新たな方向を示唆し, 顕微鏡スクリーニングデータのマルチモーダルな性質を明示的に考慮すべきであることを示唆した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:27:21 GMT)
MigGPT: Harnessing Large Language Models for Automated Migration of Out-of-Tree Linux Kernel Patches Across Versions [24.7] 大規模言語モデル(LLM)は、様々な領域で顕著な進歩を示している。
MigGPTは、コードスニペット情報を保持するために新しいコード指紋構造を使用するフレームワークである。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:08:37 GMT)
Enhancing Predictive Accuracy in Tennis: Integrating Fuzzy Logic and CV-GRNN for Dynamic Match Outcome and Player Momentum Analysis [24.4] 本稿では,マルチレベルファジィ評価モデルとCV-GRNNモデルを組み合わせたゲーム予測手法を提案する。
まず、主成分分析を用いて重要な統計指標を特定し、次にウィンブルドンデータに基づく2層ファジィモデルを開発する。
CV-GRNNモデルを統計的に有意な15指標を用いて改良し,精度は86.64%,MSEは49.21%向上した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:24:35 GMT)
Outage Probability Analysis for OTFS with Finite Blocklength [24.3] 本稿では,OTFS変調の停止確率を有限ブロック長で解析する。
解答パス数と符号化レートが停止確率に与える影響を解析した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 15:53:46 GMT)
Derm1M: A Million-scale Vision-Language Dataset Aligned with Clinical Ontology Knowledge for Dermatology [20.7] 本稿では,1029,761個の画像テキストペアからなる皮膚科における最初の大規模視覚言語データセットであるDerm1Mを提案する。
AI研究と臨床応用の進展におけるDerm1Mの可能性を示すために、我々はこのデータセット上で一連のCLIPライクなモデル(DermLIP)を事前訓練した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:27:33 GMT)
FRAG: Frequency Adapting Group for Diffusion Video Editing [20.3] 高周波漏れは、デノナイジング過程における高周波成分に由来することが多い。
我々は、一貫性と忠実度の観点からビデオ品質を向上させる周波数適応グループ(FRAG)を考案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 11:23:41 GMT)
How new data permeates LLM knowledge and how to dilute it [20.0] 大規模言語モデルは、勾配ベースの更新の蓄積を通じて学び、継続的に学習する。
新たな事実を学習することで、モデルは無関係な文脈でその知識を不適切に適用することができる。
学習前のキーワードのトークン確率を計測することにより,新しい情報学習後のプライミングの度合いを予測することができることを示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 11:25:04 GMT)
Beyond Memorization: Mapping the Originality-Quality Frontier of Language Models [19.7] 大型言語モデル(LLM)は、アイデアや科学的発見にますます利用されている。
以前の研究は、トレーニングデータに対する独創性としてノベルティを評価するが、元の出力は品質が低い可能性がある。
創発性と品質のバランスをとるLLM世代のための新しいノベルティ指標を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 00:48:58 GMT)
Conceptualizing Trustworthiness and Trust in Communications [17.7] 本稿では,コミュニケーションの文脈において,信頼度を体系的に扱うための新しい総合的アプローチを提案する。
本稿では,信頼性に基づく信頼を確立するために,客観的なシステム特性と主観的信念を取り入れた最初の試みを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 17:57:06 GMT)
Embodied Chain of Action Reasoning with Multi-Modal Foundation Model for Humanoid Loco-manipulation [17.4] 本稿では,ヒューマノイド・ロコ・マニピュレーションのためのテキスト・インストラクションからアクションを自律的に計画するために,行動推論手法の具体的連鎖を適用した新しい枠組みを提案する。
提案手法は,人型特有の思考方法論の連鎖を組み込んだもので,作業の細部や体の動きを解析し,作業の行程を移動行動と操作行動の連続に分解する。
本手法が上下半身制御における有効性を評価し,人間の指示を理解する上でのロボット行動推論戦略の連鎖の有効性を実証した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 11:37:32 GMT)
Plato: Plan to Efficiently Decode for Large Language Model Inference [17.3] 提案するPlatoは,セマンティック・アウェア・並列デコードのためのアルゴリズムとシステムの共同設計手法である。
Platoは、サブプロブレムを論理的および因果関係に基づいて依存グラフに整理する。
評価の結果,Platoは自己回帰復号化よりもスループットを68%向上することがわかった。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:17:57 GMT)
UltraFusion: Ultra High Dynamic Imaging using Exposure Fusion [16.9] ハイダイナミックレンジシーンのキャプチャは、カメラ設計において最も重要な問題の一つである。
差分9で入力をマージできる最初の露光融合技術であるモデルを提案する。
提案手法は最新のHDRベンチマークにおいてHDR-Transformerより優れている。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:07:07 GMT)
Tin-Tin: Towards Tiny Learning on Tiny Devices with Integer-based Neural Network Training [16.8] Tin-Tinは、低消費電力マイクロコントローラ(MCU)のための整数ベースのオンデバイストレーニングフレームワークである
本稿では,動的範囲を効率的に管理し,より効率的な重み更新を容易にする新しい整数再スケーリング手法を提案する。
実世界の小型デバイス上でのエンド・ツー・エンドアプリケーションによるTin-Tinの有効性を検証する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 02:21:24 GMT)
RANSAC Revisited: An Improved Algorithm for Robust Subspace Recovery under Adversarial and Noisy Corruptions [16.5] 破損しないサンプルのかなりの部分を含む低次元部分空間を復元することを目的としている。
この問題に対する既存のアプローチは、しばしば高い計算コストに悩まされるか、制限的な分布仮定に依存する。
本稿では,標準的なRANSACの障害モードを正確に特定し,修正する2段階アルゴリズムであるRANSAC+を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:47:03 GMT)
Leveraging Reasoning Model Answers to Enhance Non-Reasoning Model Capability [16.4] 我々は、推論集約モデルを利用して、計算負荷の少ない非推論モデルを改善することを提案する。
我々は、様々なベンチマークで一貫した改善を示し、モデルが直接質問に答える能力を向上するこのアプローチの可能性を強調した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:26:56 GMT)
AirVista-II: An Agentic System for Embodied UAVs Toward Dynamic Scene Semantic Understanding [16.4] AirVista-IIは、UAVのエンドツーエンドのエージェントシステムである。
システムはエージェントベースのタスク識別とスケジューリング、マルチモーダル認識機構、および区別された抽出戦略を統合する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:06:50 GMT)
LLMs Can Achieve High-quality Simultaneous Machine Translation as Efficiently as Offline [16.1] 大言語モデル(LLM)は、単純なプロンプトで「[src lang]から[tgt lang]に次の文を変換する」という単純なプロンプトでも、オフライン機械翻訳において優れた性能を発揮する。
我々は、同時機械翻訳(SiMT)のための教師付き微調整データの構築を含む新しいパラダイムを提案する。
提案手法は,様々なSiMTベンチマークにおける最先端性能を実現し,オフライン翻訳の本来の能力を維持する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:45:53 GMT)
Learning Dynamic Representations via An Optimally-Weighted Maximum Mean Discrepancy Optimization Framework for Continual Learning [16.1] 継続的な学習は、モデルを永続的に取得し、保持することを可能にする。
悲惨な忘れ物は モデルパフォーマンスを著しく損なう
本稿では,表現変更に対する罰則を課す,OPMMD(Optimally-Weighted Mean Discrepancy)と呼ばれる新しいフレームワークを紹介する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 15:38:39 GMT)
Ctrl-GenAug: Controllable Generative Augmentation for Medical Sequence Classification [16.0] Ctrl-GenAugは新規で汎用的な生成拡張フレームワークである。
高度に意味論的およびシーケンシャルな塩基配列合成を可能にし、誤って合成されたサンプルを抑圧する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 00:49:25 GMT)
From LLMs to LLM-based Agents for Software Engineering: A Survey of Current, Challenges and Future [15.6] 本稿では,大規模言語モデル (LLM) と LLM をベースとしたソフトウェア工学エージェントの実践とソリューションについて検討する。
特に、要件エンジニアリング、コード生成、自律的な意思決定、ソフトウェア設計、テスト生成、ソフトウェアメンテナンスの6つの主要なトピックを要約します。
我々は、使用するモデルとベンチマークについて論じ、ソフトウェア工学におけるそれらの応用と有効性について包括的に分析する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:42:30 GMT)
QM-ToT: A Medical Tree of Thoughts Reasoning Framework for Quantized Model [15.3] 大規模言語モデル(LLM)は、医学的推論に固有の複雑さのために、専門的な生物医学的タスクにおいて重大な課題に直面している。
パスベースの推論フレームワークであるQuantized Medical Tree of Thought (QM-ToT)を提案する。
LLaMA2-70bモデルでは34%から50%,LLaMA-3.1-8bでは58.77%から69.49%に顕著な精度向上を示した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:32:25 GMT)
ToolTipNet: A Segmentation-Driven Deep Learning Baseline for Surgical Instrument Tip Detection [15.2] ロボットによる根治的前立腺切除術では,超音波フレームを腹腔鏡カメラフレームに登録することが重要である。
長年の制限は、da Vinci APIから得られる楽器の先端位置が不正確であり、手眼の校正を必要とすることである。
そこで我々は,パートレベルの楽器セグメンテーションマスクを入力として,手術器具を用いたチップ検出手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 19:27:03 GMT)
A Multimodal Vision Foundation Model for Clinical Dermatology [14.5] PanDermは、200万以上の現実世界の皮膚疾患の画像に対する自己教師付き学習を通じて事前訓練されたマルチモーダル皮膚科学の基礎モデルである。
PanDermは、評価されたすべてのタスクで最先端のパフォーマンスを達成し、ラベル付きデータの10%しか使用していない場合、しばしば既存のモデルを上回った。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:58:18 GMT)
CBraMod: A Criss-Cross Brain Foundation Model for EEG Decoding [14.3] 初期のEEG復号法は教師付き学習に依存しており、特定のタスクやデータセットによって制限され、モデルの性能と一般化性を妨げる。
本稿では,空間的依存と時間的依存を別々にモデル化できるCBraModという新しい基礎モデルを提案する。
CBraModは、幅広いタスクにまたがって最先端のパフォーマンスを実現し、その強力な能力と一般化可能性を証明する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 10:02:56 GMT)
LoFi: Vision-Aided Label Generator for Wi-Fi Localization and Tracking [14.3] LoFiは、Wi-Fiのローカライゼーションとトラッキングのための視覚支援ラベルジェネレータである。
ESP32-S3とWebカメラを用いてWi-Fiトラッキングとローカライゼーションデータセットをコンパイルした。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:08:51 GMT)
HalluShift: Measuring Distribution Shifts towards Hallucination Detection in LLMs [14.0] 大規模言語モデル(LLM)は、最近、与えられたプロンプトに対する革新的な応答を生成できるため、広く注目を集めている。
本研究では,LLMの内部動態から幻覚が生じると仮定する。
本研究では,内部状態空間における分布変化を解析するための革新的アプローチであるHaluShiftを導入する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:35:22 GMT)
ChineseSafe: A Chinese Benchmark for Evaluating Safety in Large Language Models [13.9] 我々は,大言語モデルのコンテンツ安全性に関する研究を容易にするため,中国語安全ベンチマーク( Chinese safety benchmark, ChineseSafe)を提案する。
ChinaSafeには、4つのクラスに205,034のサンプルと10のサブクラスの安全問題が含まれています。
中国の文脈では、政治的感受性、ポルノグラフィー、変種/ホモフォニックな単語など、いくつかの特別な種類の違法コンテンツを追加します。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:16:49 GMT)
PLS-Assisted Offloading for Edge Computing-Enabled Post-Quantum Security in Resource-Constrained Devices [13.6] 量子後暗号(PQC)標準は、IoT(Internet of Things)のリソース制約デバイス(RCD)において必須となっている。
物理層セキュリティ(PLS)を利用したオフロード戦略を利用したエッジコンピューティング対応PQCフレームワークを提案する。
我々のフレームワークは2つのPLS技術を統合している: オフロードRCDは盗聴符号化を用いてデータ伝送をセキュアにし、非オフロードRCDは人工ノイズをブロードすることでフレンドリーなジャマーとして機能する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:14:17 GMT)
Evaluation Under Imperfect Benchmarks and Ratings: A Case Study in Text Simplification [13.4] 様々なサイズのモデルによって生成される単純化された文を特徴付けるテキスト単純化のための合成ベンチマークを提案する。
評価の結果,評価基準はアノテータ間の高い一致を示し,予想される傾向を反映していることがわかった。
第2に, LLM審査員(LLMs-as-a-jury)による自動評価は, テキスト簡易化評価において一貫した評価を得るのに十分であることを示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 01:36:47 GMT)
SPOT: Spatio-Temporal Pattern Mining and Optimization for Load Consolidation in Freight Transportation Networks [13.1] 効率的な負荷統合計画は、交通管理プロセスとの整合性を確保するために慎重に選択された統合ポイントに依存している。
従来の最適化に基づくアプローチは正確な解決策を提供するが、その計算複雑性は大規模インスタンスでは実用的ではない。
この研究は、機械学習(ML)の利点と負荷統合の最適化を統合するエンドツーエンドアプローチであるSPOTを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 18:14:38 GMT)
FROG: Effective Friend Recommendation in Online Games via Modality-aware User Preferences [12.9] 本研究では,エンド・ツー・エンドモデルのtextscFROG を提案する。
kwTencentのオフライン評価とオンラインデプロイメントに関する総合的な実験は、既存のアプローチよりもtextscFROGの方が優れていることを示した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 04:27:10 GMT)
Large Language Model-Enhanced Reinforcement Learning for Generic Bus Holding Control Strategies [12.6] 本研究では,Large Language Models(LLMs)の文脈内学習と推論機能を活用した自動報酬生成パラダイムを提案する。
提案するLLM拡張RLパラダイムの実現可能性を評価するため,バス路線数,停留所数,旅客需要数に異なる広範なバス保持制御シナリオに適用した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:17:56 GMT)
AgentDynEx: Nudging the Mechanics and Dynamics of Multi-Agent Simulations [12.5] 本稿では,AgentDynExを提案する。AgentDynExは,ユーザ特定力学とダイナミクスのシミュレーション構築を支援するAIシステムである。
ある技術的評価では、ヌードを使わずにシミュレーションがより複雑な力学を持ち、その顕著なダイナミクスを維持することができることがわかった。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 17:26:35 GMT)
Can you map it to English? The Role of Cross-Lingual Alignment in Multilingual Performance of LLMs [12.3] 大きな言語モデル (LLMs) は英語のテキストに基づいて事前訓練されており、驚くべき多言語機能を示している。
識別タスクのインスタンスレベルでのアライメントを定量化するために、言語間アライメントメトリクスを導入します。
言語間アライメントの指標は言語レベルでのタスク精度と強く相関するが,サンプルレベルのアライメントは誤予測と正しく区別できないことが多い。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 00:01:22 GMT)
Span-level Emotion-Cause-Category Triplet Extraction with Instruction Tuning LLMs and Data Augmentation [12.2] スパンレベルの感情-因果三重項抽出は、感情原因分析において、新しく複雑な課題である。
本研究では、スパンレベルの感情-因果三重項抽出に対するきめ細かいアプローチについて検討する。
提案手法では,タスク固有の三重項抽出命令を用い,細管大言語モデルへの低ランク適応を利用する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 07:31:09 GMT)
StarGen: A Spatiotemporal Autoregression Framework with Video Diffusion Model for Scalable and Controllable Scene Generation [12.0] StarGenは、トレーニング済みのビデオ拡散モデルを長距離シーン生成のために自動回帰的に利用するフレームワークである。
各ビデオクリップの生成は、隣接する画像の3Dワープと、以前に生成されたクリップから時間的に重なる画像とに条件付けされる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:21:42 GMT)
Fine-tuning an Large Language Model for Automating Computational Fluid Dynamics Simulations [11.9] 大規模言語モデル(LLM)は高度な科学計算を持つが、CFDでの使用は自動化されている。
ドメイン固有LLM適応に着目した新しいアプローチを提案する。
マルチエージェントフレームワークはプロセスをオーケストレーションし、入力を自律的に検証し、構成を生成し、シミュレーションを実行し、エラーを修正する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:35:30 GMT)
PCM-SAR: Physics-Driven Contrastive Mutual Learning for SAR Classification [11.8] SAR分類(PCM-SAR)のための物理駆動コントラスト相互学習法を提案する。
PCM-SARは、サンプル生成と特徴抽出を改善するために、ドメイン固有の物理的洞察を取り入れている。
実験の結果,PCM-SARは多種多様なデータセットとSAR分類タスクでSOTA法より一貫して優れていた。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:56:02 GMT)
Table Integration in Data Lakes Unleashed: Pairwise Integrability Judgment, Integrable Set Discovery, and Multi-Tuple Conflict Resolution [11.7] 対角的可積分性判定の課題に対処するために,二進的教師付き対角学習アルゴリズムを訓練する。
マルチタプルコンフリクト解決に対処する革新的なインコンテキスト学習手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:19:21 GMT)
HG2P: Hippocampus-inspired High-reward Graph and Model-Free Q-Gradient Penalty for Path Planning and Motion Control [10.7] ゴール条件付き階層強化学習(HRL)は、複雑な到達タスクを単純なサブゴール条件付きタスクのシーケンスに分解する。
本稿では,脳機構をグラフベースで計画するHRLを橋渡しし,海馬-線条体様の二重制御系仮説を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 18:55:06 GMT)
Can the capability of Large Language Models be described by human ability? A Meta Study [10.5] 37の評価ベンチマークで80以上のモデルのパフォーマンスデータを収集しました。
我々は, パラメータが100億未満の LLM のある種の機能について, 実際に記述できることを確認した。
一部の能力は人間では相互に関連があると考えられているが、LLMではほとんど関係がないように見える。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:34:11 GMT)
Metropolis-Hastings Captioning Game: Knowledge Fusion of Vision Language Models via Decentralized Bayesian Inference [10.2] 本稿では,複数の視覚言語モデル(VLM)の知識を相互に学習することで融合させるメトロポリス・ハスティングス・キャプションゲーム(MHCG)を提案する。
知識融合プロセスは、画像を交互にキャプションし、互いに学習する2つのVLMエージェント間の通信を確立する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 15:28:09 GMT)
EasyREG: Easy Depth-Based Markerless Registration and Tracking using Augmented Reality Device for Surgical Guidance [10.2] 我々はARデバイスの奥行きセンサーのみに依存するマーカーレスフレームワークを提案する。
登録モジュールは、深度センサの誤差補正、Human-in-the-loop領域フィルタリング技術、ロバストなグローバルアライメントを統合する。
トラッキングモジュールは高速で堅牢な登録アルゴリズムを使用し、登録モジュールの初期ポーズを使用して、ターゲットのポーズをリアルタイムで推定する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:48:33 GMT)
3D CoCa: Contrastive Learners are 3D Captioners [10.1] 3Dキャプション(3Dキャプション)は、自然言語による3Dシーンの内容を記述することを目的としている。
対照的な視覚言語学習と3Dキャプション生成をシームレスに組み合わせた,新しい統合フレームワークである3D CoCaを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 11:10:47 GMT)
ID-Booth: Identity-consistent Face Generation with Diffusion Models [10.0] 我々はID-Boothと呼ばれる新しい生成拡散に基づくフレームワークを提案する。
このフレームワークは、事前訓練された拡散モデルの合成能力を保ちながら、アイデンティティ一貫性のある画像生成を可能にする。
本手法は、画像の多様性を向上しつつ、競合する手法よりもアイデンティティ間の一貫性とアイデンティティ間の分離性を向上する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 20:39:40 GMT)
Deep Partially Linear Transformation Model for Right-Censored Survival Data [10.0] 本稿では,推定,推測,予測のための汎用かつ柔軟なフレームワークとして,深部部分線形変換モデル(DPLTM)を提案する。
総合シミュレーション研究は、推定精度と予測パワーの両方の観点から提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:26:44 GMT)
The fundamental localization phases in quasiperiodic systems: A unified framework and exact results [9.8] 混乱した量子系は、拡張、局所化、臨界の3種類の量子状態を持つ。
基本アンダーソン相のすべての実現を統一するスピンフル準周期系に基づく統一的枠組みを提案する。
我々は、正確に解けるアンダーソン相をホストするスピンフルシステムに由来するいくつかの新しい準周期モデルを同定する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 17:47:12 GMT)
Early-Bird Diffusion: Investigating and Leveraging Timestep-Aware Early-Bird Tickets in Diffusion Models for Efficient Training [9.7] 訓練拡散モデル(DM)は、かなりの計算資源を必要とする。
本稿では,新しい効率的なDMトレーニング手法であるEB-Diff-Trainを提案する。
このアプローチは、空間的にも時間的にも、トレーニング時間を著しく短縮することができる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:53:18 GMT)
Towards Automated Formal Verification of Backend Systems with LLMs [9.7] バックエンドのコードを形式的なリーン表現に変換するために,関数型プログラミングと型システムを活用する新しいフレームワークを提案する。
我々のパイプラインは、APIやデータベース操作の意図した振る舞いを規定する定理を自動生成し、LSMベースのプロバーを用いて検証する。
本手法を現実的なバックエンドシステム上で評価した結果,テスト要件の50%以上を正式に検証できることがわかった。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:49:37 GMT)
RAC3: Retrieval-Augmented Corner Case Comprehension for Autonomous Driving with Vision-Language Models [9.3] 視覚言語モデル(VLM)はシナリオ理解の促進に重要な役割を果たしている。
幻覚や現実世界の接地不足といった課題に直面している。
本研究では, コーナーケース理解におけるVLMの性能向上を目的としたRAC3を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:30:02 GMT)
Vision Language Models See What You Want but not What You See [9.3] 他人の意図を知り、他人の視点をとることは、人間の知性の2つの中核的な構成要素である。
このような能力を持つ機械を浸透させることは、人間レベルの人工知能を構築するための重要なステップである。
視覚言語モデルにおける意図理解とレベル2視点抽出について検討した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:41:27 GMT)
Vision Language Models Know Law of Conservation without Understanding More-or-Less [9.3] ConserveBenchは、物理量の4次元にわたる365の認知実験の電池である。
ビジョン言語モデルは一般的に変換タスクに長けているが、非変換タスクでは失敗する傾向にある。
操作の可逆性を理解することと量の概念を理解することには解離がある。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 04:31:37 GMT)
Probing Mechanical Reasoning in Large Vision Language Models [9.3] 我々は,26ビジョン言語モデル(VLM)におけるシステム安定性,ギア,プーリーシステムの理解,原理,慣性,運動,流体力学の検証を行った。
以上の結果から,VLMはすべての領域において人間よりも常に悪い性能を示す一方で,歯車システムや流体力学の推論が困難であることが示唆された。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:53:58 GMT)
CatCMA with Margin: Stochastic Optimization for Continuous, Integer, and Categorical Variables [9.1] 本研究では,混合可変ブラックボックス最適化(MV-BBO)に焦点を当てる。
連続変数、整数変数、カテゴリー変数に対処する。
混合カテゴリブラックボックス最適化法であるMargin (CatCMAwM) を用いたCatCMAを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 17:45:42 GMT)
Conditional Independence Test Based on Transport Maps [9.0] 本稿では,トランスポートマップを用いた条件付き独立性テストのための新しいフレームワークを提案する。
人口レベルでは、2つの明確に定義されたトランスポートマップが条件付き独立性テストから条件なし独立性テストに変換可能であることを示す。
置換に基づく手順を用いて、テストの重要性を評価する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:38:25 GMT)
Can LLMs Revolutionize the Design of Explainable and Efficient TinyML Models? [9.0] 本稿では,小さな機械学習(TinyML)プラットフォームに特化して,効率的なニューラルネットワークアーキテクチャを設計するための新しいフレームワークを提案する。
大規模言語モデル(LLM)をニューラルネットワーク探索(NAS)、視覚変換器(ViT)ベースの知識蒸留(KD)戦略、説明可能性モジュールに活用することにより、精度、計算効率、メモリ使用率の最適なバランスをとることができる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 18:36:03 GMT)
DFF: Decision-Focused Fine-tuning for Smarter Predict-then-Optimize with Limited Data [7.7] 意思決定中心学習(DFL)は、予測モデルを直接判断損失(DL)に基づいて訓練することにより、予測テーマ最適化(PO)フレームワークへのエンドツーエンドアプローチを提供する。
いくつかの予測モデルは微分不可能またはブラックボックスであり、勾配法では調整できない。
本稿では,DFLモジュールを新しいバイアス補正モジュールを介してPOパイプラインに埋め込む,DFF(Decision-Focused Fine-tuning)という新しいフレームワークを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:59:49 GMT)
Voltage and power-frequency electric field measurements with Rydberg-atom interferometry [7.6] 原子蒸気セルに埋め込まれた電極間の電圧測定のためのRydberg-atomインターフェロメトリに基づく手法を提案する。
準静電近似値を利用して電力周波数(PF)電界測定に拡張する。
これらの進歩は、トレーサブル電圧測定と高電圧基盤近傍のPF場の非侵襲的特性に直接的な意味を持つ。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 11:33:58 GMT)
Opportunistic Routing in Wireless Communications via Learnable State-Augmented Policies [7.5] 本稿では,大規模無線通信ネットワークにおけるパケットベースの情報ルーティングの課題に対処する。
機会的ルーティングは、無線通信の放送特性を利用して、最適な転送ノードを動的に選択する。
ネットワーク内のソースノードが処理する全情報の最大化を目的とした,状態拡張(SA)に基づく分散最適化手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 19:46:51 GMT)
Draw with Thought: Unleashing Multimodal Reasoning for Scientific Diagram Generation [7.5] そこで我々は,MLLMを指導し,図形を編集可能なmxGraph XMLコードに再構成する学習自由フレームワークDaw with Thought (DwT)を提案する。
DwTはモデル微調整なしで解釈可能で制御可能な出力を可能にする。
Plot2XMLは、ゴールドスタンダードのXMLアノテーションを備えた247の現実世界の科学図のベンチマークです。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:22:09 GMT)
Building AI Service Repositories for On-Demand Service Orchestration in 6G AI-RAN [7.4] 本稿では、6GネットワークにおけるAIサービスのオーケストレーションに影響を与える重要な属性を体系的に同定し分類する。
サービスパッケージング、デプロイメント、ランタイムプロファイリングを自動化する、オープンソースのLLM支援ツールチェーンを紹介します。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:40:58 GMT)
Sketched Adaptive Federated Deep Learning: A Sharp Convergence Analysis [7.3] 本研究では,周辺次元の対数的にのみ(線形ではなく)通信コストが保証される,特定のスケッチ適応型連邦学習(SAFL)アルゴリズムを提案する。
我々の理論的主張は、視覚と言語タスクに関する実証的研究と、微調整とスクラッチからのトレーニングの両方で支持されている。
驚いたことに,提案手法は,誤りフィードバックに基づく,最先端のコミュニケーション効率の高いフェデレーション学習アルゴリズムと競合する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 03:44:21 GMT)
An overview of condensation phenomenon in deep learning [7.3] ニューラルネットワークの非線形トレーニングの間、同じ層のニューロンは、同様の出力を持つグループに凝縮する傾向がある。
本稿では, トレーニング力学と損失景観の構造の観点から, 凝縮の基盤となるメカニズムについて検討する。
凝縮現象は、ニューラルネットワークの能力に関する貴重な洞察を与え、トランスフォーマーベースの言語モデルにおけるより強力な推論能力に相関する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:50:24 GMT)
Neural-Rendezvous: Provably Robust Guidance and Control to Encounter Interstellar Objects [7.2] 本稿では、高速移動物体に遭遇するためのディープラーニングに基づくガイダンスおよび制御フレームワークであるNeural-Rendezvousを提案する。
スペクトル正規化ディープニューラルネットワークによってモデル化されたガイダンスポリシの上に、ポイントワイズで最小限のノルムトラッキング制御を使用する。
ニューラルレンデブースは、期待される宇宙船の配送誤差に比例して高い確率指数を与えることを示した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 19:16:48 GMT)
Dynamik: Syntactically-Driven Dynamic Font Sizing for Emphasis of Key Information [7.1] 重要度を低くし,重要度を増大させることにより,読解時の認知負荷を低減させるシステムであるDynamikを提案する。
以上の結果から,ダイナマイクは認知負荷の特定の側面,特に英語能力の低い個人における参加者のパフォーマンスと努力を減少させる可能性が示唆された。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 21:46:11 GMT)
ClinicalGPT-R1: Pushing reasoning capability of generalist disease diagnosis with large language model [7.1] 臨床GPT-R1は疾患診断のための汎用的な大規模言語モデルである。
クリニカルGPT-R1は、2万件の実際の臨床記録に基づいてトレーニングされ、様々なトレーニング戦略を活用して診断の推論を強化する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 04:00:40 GMT)
Dual-Modality Computational Ophthalmic Imaging with Deep Learning and Coaxial Optical Design [7.0] 本研究は, 底面撮影と屈折誤差検出を統合プラットフォームに統合した, コンパクトでデュアルファンクションな光学デバイスを提案する。
提案されたフレームワークは、特にコミュニティの健康設定に適した、迅速でインテリジェントでスケーラブルな眼科検診のための有望なソリューションを提供する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:35:17 GMT)
IGDA: Interactive Graph Discovery through Large Language Model Agents [6.7] 大規模な言語モデル(textbfLLMs$)が発見の強力な方法として登場した。
我々は既存の数値駆動型手法を補完するグラフ発見のための強力な手法として$textbfIGDA$を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:26:06 GMT)
The Structural Safety Generalization Problem [6.6] LLMジェイルブレイクは幅広い安全上の課題である。この問題がまだ解決されていないことを踏まえ、重要な障害メカニズムをターゲットにすることを提案する。
我々は、マルチターン、マルチイメージ、翻訳ベースの攻撃に対する新たな脆弱性を明らかにすることで、このフレームワーク内でレッドチームを行う。
次に、このフレームワークがStructure Rewriting Guardrailを提案することによって、新たな防御を可能にする可能性を実証する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 20:21:08 GMT)
When to Truncate the Archive? On the Effect of the Truncation Frequency in Multi-Objective Optimisation [6.4] 興味深いことに、新しいソリューションが生成されるとアーカイブを停止させるのが最善である傾向があるのに対して、無制限のアーカイブを考えると、最悪の場合があります。
本結果は,効率的なサブセット選択手法の開発の重要性を強調した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 10:09:55 GMT)
A Secure Communication Protocol for Remote Keyless Entry System with Adaptive Adjustment of Transmission Parameters [6.2] 既存の暗号認証手法は、計算効率や電波干渉といった現実世界の制約に対処できない。
本稿では,RKEシステムのセキュリティと信頼性を高めるために,軽量車両鍵認証プロトコルを提案する。
本手法は,低計算オーバーヘッドを維持しながら通信の安全性と信頼性を大幅に向上させる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 11:28:24 GMT)
Hierarchical Quantum Optimization via Backbone-Driven Problem Decomposition: Integrating Tabu-Search with QAOA [6.1] 我々は、ノイズ中間スケール量子(NISQ)デバイスの限界を克服するためにBackbone-DrivenOAを提案する。
提案手法では, 適応型タブサーチによりバックボーン変数を動的に同定し, 固定し, 縮小次元部分空間を構築する。
提案手法は,量子資源と古典資源の割り当てを効果的に調整し,大規模最適化問題の解決を可能にする。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:50:38 GMT)
Navigating Image Restoration with VAR's Distribution Alignment Prior [6.1] 新しい画像生成パラダイムであるVARは、次世代の予測アプローチを適用することで、生成品質の拡散モデルを上回る。
VAR内の複数スケールの潜在表現を復元として定式化し、繊細に設計されたVarFormerフレームワークを前進させる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 03:11:43 GMT)
Adapting Robot's Explanation for Failures Based on Observed Human Behavior in Human-Robot Collaboration [6.0] 障害の種類や説明レベルの違いに応じて,人間の行動がどう変化したかを分析した。
我々は、ロボット故障の説明中に人間の混乱を予測するために、データ駆動予測器を定式化する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 20:49:43 GMT)
Decoding the mechanisms of the Hattrick football manager game using Bayesian network structure learning for optimal decision-making [6.0] 本研究はHattrickを構造学習技術とベイズネットワークを用いて探索した最初のものである。
本稿では,知識に基づく構造と構造学習アルゴリズムの有効性を総合的に評価する。
我々はHattrickコミュニティが使用するトップモデルのパフォーマンスにマッチする、完全に指定されたベイズネットワークモデルを導入し、公開する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:50:20 GMT)
Ges3ViG: Incorporating Pointing Gestures into Language-Based 3D Visual Grounding for Embodied Reference Understanding [5.6] 3次元身体的参照理解(3D-ERU)は、言語記述と付随するポインティングジェスチャーを組み合わせて、3Dシーンにおいて最も関連性の高い対象物を特定する。
データ拡張フレームワーク-Imputerを導入し、新しいベンチマークデータセット-ImputeRefer for 3D-ERUをキュレートする。
また,他の3D-ERUモデルと比較して30%の精度向上を実現し,他の純粋言語ベースの3Dグラウンドモデルと比較して9%の精度向上を実現した3D-ERUの新しいモデルGes3ViGを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 15:43:06 GMT)
Using machine learning to measure evidence of students' sensemaking in physics courses [5.5] 教育において、問題解決の正しさは、しばしば学生の学習と不適切に混同される。
本研究では,物理問題に対する解法を記述した説明書から,学生の身体感覚形成の証拠を定量化する手法を提案する。
我々は,ロジスティック回帰を用いた3つのユニークな言語エンコーダを実装し,2023年のタフツ大学の入門物理学講座の実際の学生385名について,デプロイ可能性の分析を行った。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 19:10:36 GMT)
DualPrompt-MedCap: A Dual-Prompt Enhanced Approach for Medical Image Captioning [5.5] 我々は、LVLM(Large Vision-Language Models)を拡張した新しいデュアルプロンプト拡張フレームワークであるDualPrompt-MedCapを紹介する。
医療用問合せペアを事前訓練した半教師付き分類モデルに基づくモダリティ認識プロンプトと,バイオメディカル言語モデル埋め込みを利用した質問誘導プロンプト。
本手法は,医療専門家の事前知識と下流視覚言語タスクの自動アノテーションとして機能する臨床的精度の高いレポートの作成を可能にする。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:31:55 GMT)
A risk model and analysis method for the psychological safety of human and autonomous vehicles interaction [5.4] 本稿では,自律走行車における心理的安全性を定義し,心理的リスクを特定し評価するためのリスクモデルを提案し,システム理論解析手法を採用する。
心理的安全性と身体的安全を兼ね備えた枠組みを確立することにより、自動運転車の安全な展開に関する幅広い議論に寄与する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 03:34:11 GMT)
Frequency-Aware Attention-LSTM for PM$_{2.5}$ Time Series Forecasting [5.1] FALNetは周波数対応LSTMネットワークであり、周波数領域の分解、時間的モデリング、注意に基づく改善を統合している。
実世界の都市大気質データセットで実施された実験は、FALNetが従来のモデルより一貫して優れていることを示した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:59:14 GMT)
Weakly-Supervised Learning via Multi-Lateral Decoder Branching for Tool Segmentation in Robot-Assisted Cardiovascular Catheterization [4.9] 心血管造影データセットにおけるツールセグメンテーションのための多面的擬似ラベリングを用いた弱教師付き学習法を提案する。
この方法は、1つのエンコーダと複数の横分岐デコーダを備えた改良されたU-Netアーキテクチャを利用する。
心血管カテーテル3例の血管造影データを用いて, エンド・ツー・エンドを訓練し, 評価した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 07:52:57 GMT)
The Problem of Social Cost in Multi-Agent General Reinforcement Learning: Survey and Synthesis [4.8] マルチエージェント環境における学習エージェントとユーティリティ最大化エージェントの行動から生じる社会的害の問題を考察する。
このような社会的損害のコストを定量化し、制御するための市場ベースメカニズムを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 01:25:54 GMT)
Federated Learning with Layer Skipping: Efficient Training of Large Language Models for Healthcare NLP [4.7] フェデレートラーニング(FL)は、生データを共有せずに組織間で協調的なモデルトレーニングを可能にする。
事前学習されたLLMの選ばれたレイヤのみをクライアント間で微調整し、他のレイヤは凍結したままにしておくレイヤ・スキャッピング・フェデレート・ラーニングを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 07:27:56 GMT)
Kongzi: A Historical Large Language Model with Fact Enhancement [4.7] Kongziは、歴史的分析のために特別に設計された大きな言語モデルである。
キュレートされた高品質の歴史的データと新しい事実強化学習戦略の統合により、コンジは強い事実整合性と洗練された推論深度を示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:01:05 GMT)
Detecting Localized Deepfake Manipulations Using Action Unit-Guided Video Representations [4.4] ディープフェイク技術は、実際のビデオと合成ビデオのギャップを狭め、プライバシーとセキュリティの深刻な懸念を生じさせている。
この研究は、ディープフェイクビデオにおける局所的な編集を一般化するために明示的に設計された最初の検出手法を示す。
提案手法は,現在の最先端検出法よりも精度が20%向上する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 18:17:29 GMT)
Polymer: Development Workflows as Software [4.3] ソフトウェア開発をソフトウェア(高分子)として書くことで、開発の初期段階をさらに自動化できることを示す。
ボルボでポリマーを採用することで、開発と展開に2ヶ月のコストで2--3 FTEを節約した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 04:35:24 GMT)
Nash Equilibrium Between Consumer Electronic Devices and DoS Attacker for Distributed IoT-enabled RSE Systems [4.3] 本稿では、IoT対応RSEシステムにおいて、消費者電子デバイスとDoS攻撃者間の敵対戦略に焦点を当てる。
まず,分散計測のためのリモートジョイント推定モデルを提案する。
さらに,高次元意思決定問題に対処するために,集中型かつ分散型のMinimax-DQNを含む高度な強化学習手法を導入する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 03:09:47 GMT)
Dissipation induced localization-delocalization transition in a flat band [4.1] 拡散は, 拡散相と局所相の遷移を誘導するために利用でき, フラットバンドシステムにおける量子輸送を操作する新しいアプローチを提供する。
この研究は、平らなバンド系における散逸によって引き起こされる現象の理解を深め、また開系における量子状態を制御するための新しい道を提供する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:02:16 GMT)
HELIOT: LLM-Based CDSS for Adverse Drug Reaction Management [3.3] ヘリオット(Heliot)は、薬物反応管理のための革新的な臨床診断支援システムである。
LLM(Large Language Models)と総合的な医薬データリポジトリを統合することで、フリーテキストの臨床情報を処理します。
Heliotは、過去の患者固有の薬剤耐性から学び、偽の警告を減らすことで、よりニュアンスで文脈的に有害な薬物イベント警告を可能にする。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 18:36:21 GMT)
Deep Learning-Based Automatic Diagnosis System for Developmental Dysplasia of the Hip [3.2] 股関節の発達性異形成の臨床的診断は、通常は手動で重要な放射線学的角度を計測する。
本研究の目的は,DDH診断の精度と整合性を高めるために,これらの測定値を統合する自動システムを開発することである。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:33:13 GMT)
A highly maneuverable flying squirrel drone with controllable foldable wings [3.2] 本稿では,軽量で持ち運びが容易な操作性を備えたバイオインスパイアされた新しいドローンを提案する。
ドローンの翼はシリコン膜で作られ、人間の実証データに基づいて強化学習によって高度に制御される。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:15:28 GMT)
Tokenize Image Patches: Global Context Fusion for Effective Haze Removal in Large Images [3.1] DehazeXLは、グローバルコンテキストとローカル特徴抽出のバランスをとるヘイズ除去手法である。
画像は最大10240$times$10240ピクセルまで推論でき、メモリは21GBしかない。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 15:41:25 GMT)
Generative Data Imputation for Sparse Learner Performance Data Using Generative Adversarial Imputation Networks [3.1] スキップや不完全な試みによるレスポンスの欠落は、データの疎結合を生み出す。
我々は、GAIN(Generative Adrial Imputation Networks)を用いた生成的計算手法を提案する。
提案手法は3次元のフレームワーク(学習者,質問,試行)を特徴とし,様々な空間レベルを柔軟に調節する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 21:04:27 GMT)
HD-RAG: Retrieval-Augmented Generation for Hybrid Documents Containing Text and Hierarchical Tables [2.9] 本稿では,行と列のテーブル表現を組み込んだ新しいフレームワークであるHD-RAGを紹介する。
我々はDocRAGLibを用いて総合的な実験を行い、HD-RAGは検索精度とQA性能の両方において既存のベースラインを上回っていることを示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:02:33 GMT)
Entanglement induced by quantum gravity in an infinite square well [2.9] 2つの巨大な粒子は重力によって誘導されるそれぞれの無限の正方形ポテンシャル井戸の中に閉じ込められている。
重力相互作用の結果,粒子間の絡み合いの形成について検討した。
従来の手法と比較して,本手法は粒子質量を大幅に減少させ,実験閾値を大幅に下げる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:14:59 GMT)
FVOS for MOSE Track of 4th PVUW Challenge: 3rd Place Solution [2.9] ビデオオブジェクトPV(VOS)はコンピュータビジョンにおける最も基本的で困難なタスクの1つである。
本稿では,挑戦シーンにおける映像オブジェクトの正確なセグメンテーションを実現することを目的とする。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 10:14:19 GMT)
Myanmar XNLI: Building a Dataset and Exploring Low-resource Approaches to Natural Language Inference with Myanmar [2.8] 我々は、より広範な低リソース言語のためのプロキシチャレンジとして、さらに1つの低リソース言語であるミャンマーに対するXNLIタスクを拡張します。
まず,コミュニティのクラウドソース手法を用いて,Myanmar XNLIというデータセットを構築した。
第2に、myXNLIベンチマークにおいて、最近の多言語言語モデルの評価を行い、モデル性能を改善するためのデータ拡張手法について検討する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:36:59 GMT)
Incubation and Beyond: A Comparative Analysis of ASF Projects Sustainability Impacts on Software Quality [2.7] フリー・アンド・オープンソース・ソフトウェア(FOSS)コミュニティのサステナビリティは、社会のデジタルインフラのレジリエンスと持続性に基礎を置いている。
本研究は,FOSSサステナビリティの異なる側面が,ライフサイクルの観点からソフトウェア品質に与える影響を理解することを目的とする。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 07:51:40 GMT)
Intelligent driving vehicle front multi-target tracking and detection based on YOLOv5 and point cloud 3D projection [2.7] YOLOv5とポイントクラウド3Dプロジェクションに基づく知的運転車の多対象追跡・検出手法を提案する。
Retinexアルゴリズムを使用して、車両前方の環境のイメージを強化し、画像内の光干渉を除去し、YOLOv5ネットワーク構造に基づいたインテリジェントな検出モデルを構築する。
実験結果から, 知的運転車前方多目標追尾・検出への本手法の適用により, 30以上のMOTA値が得られ, 優れた追尾・検出性能が示された。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 17:50:02 GMT)
Improving Colorectal Cancer Screening and Risk Assessment through Predictive Modeling on Medical Images and Records [2.7] 大腸内視鏡検査による大腸癌進展前のポリープの同定
現在のフォローアップガイドラインは、主に他の重要なリスク要因を見渡す機能に依存しています。
組織像解析にトランスフォーマーを用いたモデルを適用し,5年間のCRCリスクを予測した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 19:21:04 GMT)
Conditional Quantile Estimation for Uncertain Watch Time in Short-Video Recommendation [2.3] 本稿では,時計時間全体の条件分布をモデル化するための条件量子推定(CQE)を提案する。
CQEは、ユーザとビデオのペアごとに複雑なウォッチタイム分布を特徴付け、ユーザの振る舞いを理解するための柔軟で包括的なアプローチを提供する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:45:32 GMT)
Survival of the Optimized: An Evolutionary Approach to T-depth Reduction [2.1] 本稿では,回路層にまたがるほぼ最適Tゲートマージパターンを遺伝的アルゴリズム(GA)で探索する手法を提案する。
我々のフレームワークは、回路サイズやTゲート密度の異なる平均1.2倍の性能向上を実現している。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 00:55:18 GMT)
Enabling Scalable Evaluation of Bias Patterns in Medical LLMs [2.1] 大規模言語モデル(LLMs)は、多くの医学的課題に大きく貢献する可能性を示している。
主な関心領域の1つは、医学的応用におけるLSMの偏りのある行動に関連しており、個人の不公平な治療につながっている。
本稿では,厳密な医学的証拠に基づく検査ケースの自動生成により,そのようなバイアス評価をスケールアップする手法を提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 03:42:38 GMT)
Ask for More Than Bayes Optimal: A Theory of Indecisions for Classification [1.8] 選択的分類は、リスクの高いシナリオにおける自動意思決定のための強力なツールである。
私たちのゴールは、自動ではない観察である不確定の数を最小化することです。
不確定性を用いることで、ベイズ最適誤差率以下であっても、ユーザ指定レベルの誤分類率を制御することができる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:19:53 GMT)
The Beginner's Textbook for Fully Homomorphic Encryption [1.7] FHE(Fully Homomorphic Encryption)は、暗号化データ上で直接計算を行うことができる暗号方式である。
すべての計算が暗号化されたデータ上で実行されると、結果を明らかにするために復号化することができる。
FHEは機密ブロックチェーンサービスに適用可能で、スマートコントラクトの機密データが暗号化され、機密保持されることを保証する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:14:01 GMT)
Evaluating the Quality of Benchmark Datasets for Low-Resource Languages: A Case Study on Turkish [1.6] 本研究は、トルコの17のベンチマークデータセットの品質を評価することにより、堅牢で文化的に適切なベンチマークの必要性に対処する。
結果から,ベンチマークデータセットの70%が品質基準を満たしていないことがわかった。
GPT-4oは文法的および技術的なタスクに対してより強力なラベリング能力を持ち、Llama3.3-70Bは正確性と文化的知識の評価に優れる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 20:45:49 GMT)
FastRSR: Efficient and Accurate Road Surface Reconstruction from Bird's Eye View [1.5] 道路面の再構築は自動運転に不可欠である。
ビュービューをBird's Eye View (BEV)に変換する現在の手法は、情報損失や表現空間といった課題に直面している。
これらの課題に対処するために、我々は2つの効率的かつ正確なBEVベースのRSRモデルを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 11:48:52 GMT)
Composable NLP Workflows for BERT-based Ranking and QA System [1.4] 構成可能なNLPパイプラインを生成するツールキットであるForteを使用して,エンドツーエンドのランク付けと質問応答(QA)システムを構築した。
当社のパイプラインではBERTやRoBERTaといった最先端のディープラーニングモデルを使用しています。
パイプラインのモジュール化の性質とリランカの低レイテンシにより、複雑なNLPアプリケーションを簡単に構築できます。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 01:48:13 GMT)
Heralded qudit-based high-dimensional entanglement generation for hybrid photon-emitter system by waveguide-mediated scattering [1.3] 量子エンタングルメントシステムによる量子情報処理(QIP)における高次元(HD)状態空間の拡張と損失耐性の向上
異なる入力ポートを入力することで、ハイブリッド光子エミッタシステムのためのランダムな4次元2量子最大絡み合わせを生成するフレキシブルなスキームを提案する。
quditエンコードされたハイブリッドHDエンタングルメントは、補助クォーディットなしで量子リソースをエコノマイズする利点を提供する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 04:30:06 GMT)
A CNN-based Local-Global Self-Attention via Averaged Window Embeddings for Hierarchical ECG Analysis [1.1] 本稿では,この制限に対処するため,新しいLGA(Local-Global Attention ECG)モデルを提案する。
提案手法は,重なり合う畳み込みウィンドウから得られる埋め込みを平均化することでクエリを抽出する。
CODE-15データセットで行った実験は、LGA-ECGが最先端モデルより優れていることを示した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 01:21:18 GMT)
Proposing TAGbank as a Corpus of Tree-Adjoining Grammar Derivations [1.1] 本稿では,既存の構文木バンクから自動抽出されたTAG導出コーパスであるTAGbankを紹介する。
本稿では,句構造アノテーションをTAGの派生語にマッピングするための方法論を概説する。
また,木バンクスキーム間の一貫性を確保すること,言語固有の構文的慣用句を扱うことなど,抽出プロセスに関わる課題についても論じる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 00:01:05 GMT)
aweSOM: a CPU/GPU-accelerated Self-organizing Map and Statistically Combined Ensemble Framework for Machine-learning Clustering Analysis [1.0] 機械学習(ML)クラスタリングと分類のためのオープンソースのPythonパッケージであるaweSOMを紹介する。
自己組織化マップ(SOM)アルゴリズムを用いて、大規模な(N > 106$, where $N$ is the number of data points)、多次元データセットに対応する。
10-100倍のスピードアップとメモリ効率の大幅な向上は、いくつかの最適化が組み込まれているためである。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:17:35 GMT)
Offline Reinforcement Learning for Learning to Dispatch for Job Shop Scheduling [1.0] ジョブショップスケジューリング問題(JSSP)は複雑な最適化問題である。
オンライン強化学習(RL)は、JSSPの許容可能なソリューションを素早く見つけることで、有望であることを示している。
オフライン強化学習による分散学習(Offline-LD)について紹介する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:52:43 GMT)
Causal machine learning for heterogeneous treatment effects in the presence of missing outcome data [0.9] 条件付き平均治療効果(CATE)に対する因果的機械学習推定器に欠落した結果データが与える影響について論じる。
我々はCATE(mDR-learner)とmEP-learner(mEP-learner)の2つの非バイアス機械学習推定器を提案する。
妥当な条件下では,これらの推定器はオラクル効率が高く,シミュレーションデータ設定による良好な性能を示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 10:24:57 GMT)
The First Compute Arms Race: the Early History of Numerical Weather Prediction [0.9] この論文は、第2次世界大戦後の数十年間、初期の電子計算機を数値的な天気予報に適用する世界的競争を辿っている。
国の数値天気予報の発展を形作った3つの重要な要因を同定する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 04:08:29 GMT)
Integrating Large Language Models for Automated Structural Analysis [0.7] 本稿では,Large Language Models (LLM) と構造解析ソフトウェアを統合するフレームワークを提案する。
LLMはテキストから構造記述を解析し、それらをPythonスクリプトに変換する。
ドメイン固有のプロンプト設計とコンテキスト内学習戦略を採用し、LLMの問題解決能力と生成安定性を高める。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 23:10:33 GMT)
A Survey on Efficient Vision-Language Models [0.7] 視覚言語モデル(VLM)は視覚情報とテキスト情報を統合し、画像キャプションや視覚的質問応答などの幅広いアプリケーションを可能にする。
リアルタイムアプリケーションには高い計算要求が課題となる。
これにより、効率的な視覚言語モデルの開発に焦点が当てられている。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 21:12:24 GMT)
Efficient LLM Serving on Hybrid Real-time and Best-effort Requests [0.6] BROSは、RT/BEリクエストをコロケーションし、BEリクエストのスループットを維持しながらRTリクエストのレイテンシ要求を満たすことを目的とした、ハイブリッド言語モデル(LLM)サービスシステムである。
RTリクエストのレイテンシ(最大74.20%)を大幅に削減し、サービスレベル目標(SLO)の達成率(最大36.38倍)を改善し、BEリクエストのスループットを低下させる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:16:57 GMT)
A Two-Stage Interpretable Matching Framework for Causal Inference [0.6] 観測データからの因果推論のマッチングは、類似した共変量分布を持つ治療群と制御群を構築することを目的としている。
透過的かつ解釈可能な共変マッチングのための新しい2段階の解釈可能なマッチングフレームワークを提案する。
条件付き平均治療効果(CATE)を推定するために,これらの高品質なマッチングを用いる。
以上の結果から,TIMはCATE推定を改善し,多変量重なりを増大させ,高次元データに対して効果的にスケールできることが示唆された。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:17:52 GMT)
Spatially Directional Dual-Attention GAT for Spatial Fluoride Health Risk Modeling [0.5] SDD-GAT(Spatially Directional Dual-Attention Graph Attention Network)は、微小な健康リスク予測のために設計された空間グラフニューラルネットワークである。
広州省における5万件以上のフッ化物モニタリングサンプルとフルオロシス記録を対象とする大規模データセット上でSDD-GATを評価した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 03:15:15 GMT)
Building A Proof-Oriented Programmer That Is 64% Better Than GPT-4o Under Data Scarcity [0.5] 本稿では,プロジェクトレベルの証明指向プログラミングのための合成データ拡張について,生成と修復の両面について紹介する。
本手法は,その言語の習熟度に関する基礎的証明指向プログラミング問題を合成することにより,データの不足に対処する。
我々は,プロジェクトレベルでの証明指向プログラミングにおいて,GPT-4oよりも優れた性能を示すモデルとして,細調整した14BパラメータモデルPoPilotを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 23:38:44 GMT)
Dominated Actions in Imperfect-Information Games [0.5] 不完全情報ゲームにおける支配的行動の概念を定義し,研究する。
我々の主な成果は、アクションが混合戦略に支配されているかどうかを実証的に決定するアルゴリズムである。
我々は、"All In or Fold" No-Limit Texas Hold'em ポーカー変種における支配的な行動の役割を探求する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 20:48:44 GMT)
Enhancing Classifier Evaluation: A Fairer Benchmarking Strategy Based on Ability and Robustness [0.5] 本研究では,項目応答理論(IRT)とGlicko-2レーティングシステムを組み合わせた新しい評価手法を提案する。
IRTは難しいインスタンスよりもパフォーマンスに基づいて分類器の能力を評価し、Glicko-2はパフォーマンスメトリクスを更新します。
OpenML-CC18ベンチマークを使用したケーススタディでは、データセットの15%だけが本当に難しいことが判明した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 23:54:08 GMT)
Balancing Rigor and Utility: Mitigating Cognitive Biases in Large Language Models for Multiple-Choice Questions [0.5] 認知バイアスが合理的な偏差やショートカットによって意思決定効率を高めることを示す。
モデレーションと禁忌オプションを導入することで、エラー率を減らし、意思決定精度を改善し、意思決定率を最適化する。
このアプローチは、認知バイアスを活用する新しい方法を提供し、大きな言語モデルの実用性を改善する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:03:09 GMT)
To Spike or Not to Spike, that is the Question [0.5] SNNは生物学的ニューロンの時間的ダイナミクスをエミュレートし、リアルタイムのイベント駆動処理に適している。
SNNでは、学習規則はニューロンのスパイク行動に基づいており、ニューロンのスパイク閾値を超える膜電位によってスパイクが生じる場合である。
本研究は、SNNにおける重みとともに、ニューロン学習閾値の重要性に焦点を当てる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 01:39:25 GMT)
Efficient Spatio-Temporal Signal Recognition on Edge Devices Using PointLCA-Net [0.5] 本稿では、ポイントネットの特徴抽出とインメモリコンピューティング能力と時間信号認識のためのニューロモルフィックシステムのエネルギー効率を組み合わせたアプローチを提案する。
PointNetは、推定とトレーニングの両方において、同等のアプローチよりも高い精度とエネルギー負担を著しく低減します。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 01:40:34 GMT)
Neutrino Decoherence in kappa-Minkowski Quantum Spacetime: An Open Quantum Systems Paradigm [0.4] 量子時空のゆらぎはエネルギー依存のデコヒーレンス効果を誘導し、デコヒーレンスレートは$E-4$となる。
我々の結果は、量子時空変動がニュートリノ振動物理学に与える影響について光を当てた。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 10:33:11 GMT)
Question Tokens Deserve More Attention: Enhancing Large Language Models without Training through Step-by-Step Reading and Question Attention Recalibration [0.4] 大規模言語モデル(LLM)は、複雑な問題に対する深い理解を必要とするタスクに悩まされることが多い。
本研究では,現在のLLMの限界について考察する。
質問トークンを漸進的に処理し,それらの推論を入力構造と整合させるようにLCMを誘導するプロンプトベースの戦略のファミリーを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 02:10:18 GMT)
Non-Hermitian Hamiltonian Approach for Two-Dimensional Coherent Spectra of Driven Systems [0.2] 非エルミートハミルトニアン (NHH) 法と3レベル系における応答関数 (RF) の定式化を比較した。
以上の結果から, NHH法は2DCSによる緩和および制御フィールドを含むシステムを調べる上で, RFフォーマリズムよりも適していることが示された。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 07:49:48 GMT)
Bridging Immutability with Flexibility: A Scheme for Secure and Efficient Smart Contract Upgrades [0.2] FlexiContracts+は、履歴データを保存しながらセキュアでインプレースなアップグレードを可能にすることで、スマートコントラクトを再定義する。
FlexiContracts+は、不変性と柔軟性の実践的なバランスを達成し、スマートコントラクトシステムの能力を向上させることを示します。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:59:28 GMT)
GRPO-LEAD: A Difficulty-Aware Reinforcement Learning Approach for Concise Mathematical Reasoning in Language Models [0.2] GRPO-LEADは数学的推論に適した新しい拡張セットである。
本研究は,(1)正確で正確な解法を奨励する長さ依存的精度報酬,(2)誤った答えを判断境界を鋭くするための明示的なペナルティメカニズム,(3)困難問題に対する学習シグナルを増幅する難易度の高い優位性再重み付け戦略を導入する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 19:07:45 GMT)
Theoretical bound of the efficiency of learning [0.1] 学習効率を記述する統一熱力学形式論を提案する。
非平衡量子ドット系と生きた細胞のネットワークにおける効率の限界を実証する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:42:32 GMT)
Choose Your Explanation: A Comparison of SHAP and GradCAM in Human Activity Recognition [0.1] 本研究は,Shapley Additive Explanations (SHAP) と Gradient-weighted Class Activation Mapping (Grad-CAM) を比較した。
本研究では,これらの手法を定量的かつ定量的に比較し,摂動実験による特徴重要度ランキング,解釈可能性,モデル感度に着目した。
我々の研究は、SHAPとGrad-CAMが相互に補完し、より解釈可能で実行可能なモデル説明を提供する方法を示している。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:22:33 GMT)
A method of approximation of discrete Schrödinger equation with the normalized Laplacian by discrete-time quantum walk on graphs [0.1] 離散時間量子ウォークモデルによって誘導されるグラフ上の連続時間量子ウォークモデルのクラスを提案する。
誘導された連続時間量子ウォークは、正規化されたラプラシアンによって駆動される(自由な)離散シュリンガー方程式の拡張版である。
それぞれの離散時間量子ウォークがパラメータ $epsilon$ の適切な設定で、長い時間制限で、その連続時間量子ウォークによって識別されることを示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 03:47:59 GMT)
Where Should I Deploy My Contracts? A Practical Experience Report [0.0] OPネットワークは、スマートコントラクトを背景とした分散アプリケーション(DApp)に対する信頼性の高い信頼アンカーを提供する。
多くのレイヤ2 (L2) ロールアップソリューションが登場し、基盤となるレイヤ1 (L1) ネットワークをスケールした。
我々はDAppsの2つのユースケースの評価を行う。高いセキュリティ要求を持つ投票用DApp,L1デプロイメントに適したコスト依存型サプライチェーンのDAppである。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:44:43 GMT)
Vision Transformers Exhibit Human-Like Biases: Evidence of Orientation and Color Selectivity, Categorical Perception, and Phase Transitions [0.0] 本研究では、視覚変換器(ViT)が人間の脳で観察されるものと似た配向と色バイアスを発達させたかどうかを調べた。
ノイズレベル,角度,長さ,幅,色の変化を制御した合成データセットを用いて,LoRAで微調整したViTの挙動を解析した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 01:15:34 GMT)
ViT-LCA: A Neuromorphic Approach for Vision Transformers [0.0] 本稿では、視覚変換器と局所競合アルゴリズム(LCA)を組み合わせて、効率的なニューロモルフィック展開を容易にする新しいモデルを提案する。
実験の結果、VT-LCAはImageNet-1Kデータセット上で高い精度を実現し、他のスパイキング視覚変換器よりもはるかに少ないエネルギーを消費することがわかった。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 01:39:54 GMT)
Variational principle for the time evolution operator, its usefulness in effective theories of condensed matter systems and a glimpse into the role played by the quantum geometry of unitary transformations [0.0] ユニタリ作用素に対する量子幾何学的テンソルの一般化がパラメータ進化において中心的な役割を果たすことを示す。
また, 非摂動的手法による縮退摂動理論の改善にも有効であることを示す。
我々の研究は、量子幾何学のような数学的に美しい概念の出現が、典型的な摂動論を超えた近似を掘り下げる機会をいかに示しているかを示唆している。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 10:26:26 GMT)
Towards a Probabilistic Framework for Analyzing and Improving LLM-Enabled Software [0.0] 大規模言語モデル(LLM)対応システムは、ソフトウェア工学において重要な課題である。
本稿では,これらのシステムを体系的に解析し,改善するための確率的枠組みを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 21:33:13 GMT)
Time-of-Flow Distribution in Discrete Quantum Systems: From Experimental Protocol to Optimization and Decoherence [0.0] 本稿では,時間-流れ(TF)分布を用いて離散系における量子状態遷移のタイミングを定量化する。
本稿では、このフレームワークが量子制御プロトコルの最適化や、オープン量子システムにおけるデコヒーレンスを評価するための診断ツールにどのように利用できるかを示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:46:01 GMT)
Time series classification with random convolution kernels: pooling operators and input representations matter [0.0] 本稿では,SelF-Rocketと呼ばれるMiniRocketに基づく,高速時系列分類(TSC)のための新しいアプローチを提案する。
トレーニングプロセス中に最適な入力表現とプーリング演算子を動的に選択する。
カリフォルニア大学リバーサイド校(UCR)のベンチマークデータセットで最先端の精度を実現している。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 07:16:10 GMT)
The Quantum LLM: Modeling Semantic Spaces with Quantum Principles [0.0] 前回の記事では,Large Language Models (LLMs) における意味表現と処理をモデル化するための量子インスパイアされたフレームワークについて紹介した。
本稿では, LLMにおける意味表現, 相互作用, ダイナミクスを規定する6つの重要な原則を詳細に解説し, 本モデルの中核的な仮定を明らかにする。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 15:49:41 GMT)
Q-ball mechanism of electron transport properties of high-T$_c$ superconductors [0.0] 銅酸化物(2022)の擬ギャップ状態と高温超伝導のQボール機構をマイクロX線回折データで支持した。
本稿では, 比抵抗のT線温度依存性がQ-ボールガス相において自然に生じることを示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 15:03:17 GMT)
Psychological Effect of AI driven marketing tools for beauty/facial feature enhancement [0.0] AIを利用した顔評価ツールは、個人が外観を評価し、社会的判断を内部化する方法を変えつつある。
本研究は,このようなツールが自尊心,自尊心,感情的反応に与える影響について検討した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:42:06 GMT)
Positive and non-positive measurements in energy extraction from quantum batteries [0.0] 我々は、量子電池からのエネルギー抽出の概念を、正の演算子値(POV)と物理的に実現可能な非正の演算子値測定(NPOVM)の両方が、ノイズのある電池に接続された補助的な電池に適用されるシナリオに拡張する。
補助音に対して両タイプのPOVMとNPOVMを実行することで,最大準可除エネルギーの表現を見つけ,後者が適用雑音に依存しないことを示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:42:23 GMT)
Ordinary Least Squares as an Attention Mechanism [0.0] 制限された注意モジュールの出力として、通常の最小二乗予測(OLS)が書き換えられることを示す。
この接続は、従来の情報検索フレームワークを超えて、注目に対する代替的な視点を提供する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 17:26:44 GMT)
Optimal sparse phase retrieval via a quasi-Bayesian approach [0.0] 位相情報はアクセス不能のままでありながら、信号はその変換の大きさだけを使用して再構成する必要がある。
我々は,新しいスパース準ベイズ的アプローチを導入し,そのようなアプローチに対する最初の理論的保証を提供する。
この結果から,提案したベイズ推定器は準指数雑音下での最小最適収束率を達成することが確認された。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 10:21:35 GMT)
Nonviolation of the CHSH inequality under local spin-1 measurements on two spin qutrits [0.0] 我々は、純粋に分離不能な2量子状態の様々な状態と、ランダムに生成された純粋で分離不能な2量子状態の1000,000ドルを解析的に求める。
特に、最大絡み合っている2量子GHZ状態の場合、スピン-$1$CHSHパラメータは$sqrtfrac89$に等しいが、分離可能な純粋な2量子状態の場合、このパラメータはユニティに等しい。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 08:27:50 GMT)
Nonequilibrium plasmon fluid in a Josephson junction chain [0.0] ジョセフソン接合の長い鎖における一次元プラズモンの非平衡動力学を探索する。
弱駆動時のプラズマモード間の対結合から強駆動時の劇的で高次カスケード結合への進化を観察する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 21:04:24 GMT)
Migrating Code At Scale With LLMs At Google [0.0] Googleでは,大規模で費用がかかる従来型の手動マイグレーションプロジェクトについて論じている。
変更位置探索と大規模言語モデル(LLM)を用いて開発者が移行を行うのを支援する新しい自動アルゴリズムを提案する。
我々のLLM支援ワークフローは、同様のイニシアチブのモデルとして機能する可能性が示唆された。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 18:52:44 GMT)
Mathematical Modeling of Option Pricing with an Extended Black-Scholes Framework [0.0] 本研究では,ブラック・スコールズモデルを拡張し,ボラティリティと金利変動性を含むオプション価格の高騰について検討した。
拡張されたBlack-Scholesモデルと機械学習ベースのLSTMモデルを開発し、Googleストックオプションの価格で評価する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:42:54 GMT)
Leveraging Knowledge Graphs and Large Language Models to Track and Analyze Learning Trajectories [0.0] 大規模言語モデル(LLM)に基づく知識グラフ構築手法を提案する。
学習教材を構造化されたデータに変換し、学生のテストデータを分析して個別の学習軌跡グラフを生成する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:27:15 GMT)
KnowsLM: A framework for evaluation of small language models for knowledge augmentation and humanised conversations [0.0] 本研究は,LoRAランク,データセットスケール,プレフィックスデザインが知識保持とスタイルアライメントに与える影響について検討する。
LLMに基づく判断は、知識の正確さ、会話の質、簡潔さを考慮し、微調整が音調適応に最も適していることを示し、RAGはリアルタイムの知識増強に優れていた。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 14:53:45 GMT)
Ineffectiveness for Search and Undecidability of PCSP Meta-Problems [0.0] PCSPの最もよく知られたアルゴリズムは、そのエンフデシジョン変種のみを解き、それらがエンフサーチにも適応できるかどうかは不明である。
我々は、これらの解を適切な検索証明書に丸めることは、クラスTFNPのどの問題にも匹敵するほど難しいことを証明している。
我々のツールは,ミニオンを特徴とするアルゴリズムに適しており,メタプロブレムの判定不能な結果を証明するためにも使用できる。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 23:31:22 GMT)
Improving Multilingual Capabilities with Cultural and Local Knowledge in Large Language Models While Enhancing Native Performance [0.0] Hindi- English bi-lingual LLM textbfMantra-14B with 3% improve in benchmark scores over both languages。
我々は、Qwen-2.5-14B-InstructやPhi-4といったチューニングモデルに、英語とヒンディー語の両方のパフォーマンスを改善するよう指示した。
以上の結果から,文化的・局所的な情報を用いた微調整は,計算オーバーヘッドを伴わずに性能ギャップを埋めることが可能であることが示唆された。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 23:10:13 GMT)
Graviton induced decoherence of a composite particle [0.0] 我々は、線形近似における量子重力場と相互作用する、内部自由度が量子力学によって記述される複合粒子を考える。
重力波の量子ゆらぎによって引き起こされるデフォレンスについて詳述する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 13:57:17 GMT)
GitBugs: Bug Reports for Duplicate Detection, Retrieval Augmented Generation, Triage, and More [0.0] 私たちはGitBugsを紹介します。9つのアクティブにメンテナンスされているオープンソースプロジェクトから15万以上のバグレポートを収集し、簡潔で最新のデータセットです。
GitBugsはGithub、Bugzilla、Jiraのイシュートラッカからのデータを集約し、分類タスクの標準化されたカテゴリフィールドを提供する。
予報分析ノートや、重複率や解像度時間などの詳細なプロジェクトレベルの統計情報が含まれている。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 16:55:28 GMT)
Feedback Connections in Quantum Reservoir Computing with Mid-Circuit Measurements [0.0] フィードバック接続を統合する新しい量子貯水池計算方式について検討する。
モデルが過去の入力を記憶できるように,連続処理中にフィードバック接続が効果的に動作可能であることを示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 12:44:30 GMT)
Extending Behavioral Software Engineering: Decision-Making and Collaboration in Human-AI Teams for Responsible Software Engineering [0.0] この研究は、人-AIチーム内のソフトウェアエンジニアリング(SE)タスクとコラボレーションのための意思決定(DM)に焦点を当てている。
本研究の目的は、認知的観点から、HAICの課題とニュアンスを特定することである。
この研究は、BSEの個人、チーム、組織レベルでのHAICとその影響について論じている。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 09:40:25 GMT)
Evolution of a single spin in ideal Bose gas at finite temperatures [0.0] 非ゼロ接触ボソン不純物対相互作用はスピンアップ不純物状態に対してのみ仮定される。
不純物スピンの正確な時間進化は、状態の純粋および混合初期アンサンブルに対して計算される。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 15:23:43 GMT)
Entanglement dynamic of arbitrary number qubit in the open quantum systems [0.0] 共有散逸環境に結合したマルチキュービットシステムの絡み合いダイナミクスについて検討する。
リンドブラッドマスター方程式を用いて、密度行列の時間発展を導出する。
コンカレンス測度を用いて、キュービット対間の絡みを解析する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 21:23:29 GMT)
Ensemble-Enhanced Graph Autoencoder with GAT and Transformer-Based Encoders for Robust Fault Diagnosis [0.0] 本研究では,新しい断層分類フレームワークを提案する。
様々な馬力レベルで動作する機械の時系列振動データをグラフ表現に変換する。
ディープグラフ変換器エンコーダ、デコーダ、アンサンブルを備えたグラフオート(GAE)を開発し、潜在グラフ表現を学習し、故障を分類する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 04:21:11 GMT)
Enhancing Wide-Angle Image Using Narrow-Angle View of the Same Scene [0.0] そこで本研究では,通常,一次レンズで撮影される画像に関連付けられた,より微細な細部で広角ショットを注入する手法を提案する。
我々は、狭角ショットから視覚的品質パラメータを抽出し、それに対応するシーンの広角画像に転送することを学ぶために、GANベースのモデルを訓練する。
本稿では,画像の視覚的本質を分離し,他の画像に転送する手法について詳述した。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:36:18 GMT)
Enhancing Mathematical Reasoning in Large Language Models with Self-Consistency-Based Hallucination Detection [0.0] 数学的推論の信頼性を高めるために,構造化自己整合性フレームワークを導入する。
本手法は,中間ステップと最終出力の自己整合性を強制し,論理的不整合や幻覚を低減させる。
実験の結果,SCは証明精度,記号的推論精度,数値安定性を著しく向上することがわかった。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 05:47:52 GMT)
Dynamics of a Nonequilibrium Discontinuous Quantum Phase Transition in a Spinor Bose-Einstein Condensate [0.0] 本稿では, 1次量子相転移における臨界スケーリング挙動を汎用性から理解できる, テストベッドシステムとして, スピノルBose-Einstein凝縮体を提案する。
本研究では, この遷移に対するキブル・ズレック機構の適用性を示し, 1) 準安定状態の崩壊の開始時刻を短時間で決定し, 2) 相分離強磁性ドメインの出現回数を長時間で決定する。
この予測は平均場数値シミュレーションとよく一致しており、実験可能なシステムにおける準安定状態の崩壊を研究するためのパラダイムを提供する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 18:19:13 GMT)
Dynamical symmetries in the fluctuation-driven regime: an application of Noether's theorem to noisy dynamical systems [0.0] 非平衡物理学は、2つの状態の間で遷移する可能性が最も高いような、比較的一般的な雑音の力学系を記述する変分原理を提供する。
エネルギー,運動量,角運動量の保存の類似点を同定し,意思決定,リカレントニューラルネットワーク,拡散生成モデルといったモデルを用いて,それぞれの例について概説する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 23:56:31 GMT)
Domain-Adaptive Continued Pre-Training of Small Language Models [0.0] 小型言語モデルの事前学習は、限られた計算資源によるドメイン適応に有望な道を提供する。
私は、このアプローチを教育領域内で調査し、スクラッチからトレーニングモデルのリソース効率の良い代替品として評価しました。
私のアプローチには、包括的なデータ前処理、メモリ最適化トレーニング設定、ベンチマークベースの評価が含まれています。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 18:40:32 GMT)
Different Paths, Same Destination: Designing New Physics-Inspired Dynamical Systems with Engineered Stability to Minimize the Ising Hamiltonian [0.0] OIMと同様に、Ising Hamiltonian を最小化するが、動的特性が著しく異なる新しい力学系である Dynamical Ising Machine (DIM) を導入する。
本研究は,異なる性質を持つ複数の力学系を用いて同一のCOPを解くことにより,ロバストな解を生成するとともに,入力グラフに敏感でない効果的な手法が実現できることを示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 22:45:48 GMT)
Customer Validation, Feedback and Collaboration in Large-Scale Continuous Software Development [0.0] 10万人以上の従業員と数百のソフトウェア製品を抱える大規模なグローバル組織において、顧客からのフィードバックを継続的に取り入れるという課題について検討する。
顧客のフィードバックとバリデーションの継続的な取り込みを強化するためのモデルを提案する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 22:08:53 GMT)
Coupling and particle number intertwiners in the Calogero model [0.0] 我々は、結合定数の固定値と整数値に対して相互作用する粒子の数をエンハングする「新しい垂直」インタツツイン器を構築する。
副生成物として、非対称リウヴィル積分の新しい基底が現れ、代数的に標準対称積分と関係する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 15:40:30 GMT)
Comparing Performance of Preprocessing Techniques for Traffic Sign Recognition Using a HOG-SVM [0.0] CLAHE,HUE,YUVなどの技術が分類精度に与える影響について評価した。
その結果,特にYUVはHOG-SVM分類器の性能を著しく向上させることがわかった。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 04:13:12 GMT)
Cavity-Mediated Collective Resonant Suppression of Local Molecular Vibrations [0.0] 近年の分極化学の進歩は、化学反応が共振器内の集合振動強い結合(VSC)を介して制御できることを示唆している。
我々は,VSCの分子アンサンブルの集合振動が,集団真空ラビ分裂に反比例する周期のビートを行うことを示した。
この集合的ビートは局所力学に印加され、分子のごく一部が振動的に励起されたときに個々の分子振動を共鳴的に抑制する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 01:54:52 GMT)
Automatic Detection of Intro and Credits in Video using CLIP and Multihead Attention [0.0] 本稿では,シーケンス・ツー・シーケンスの分類タスクとして問題を定式化する深層学習に基づく手法を提案する。
提案手法は,フレームを1FPSの固定レートで抽出し,CLIPを用いて符号化し,マルチヘッドアテンションモデルを用いて特徴表現を処理する。
このシステムは91.0%のF1スコア、89.0%の精度、テストセットでの97.0%のリコールを実現し、リアルタイム推論に最適化されている。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 22:08:18 GMT)
Adaptive Insurance Reserving with CVaR-Constrained Reinforcement Learning under Macroeconomic Regimes [0.0] 本稿では、テールリスク感度、マクロ経済体制モデリング、規制コンプライアンスを統合した保険保留のための強化学習(RL)フレームワークを提案する。
このフレームワークは、固定ショックストレステストとシステマティック・ストラテライズド・アナリティクスに対応しており、不確実性の下での維持に原則的で原則化されたアプローチを提供する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 01:43:25 GMT)
Adapting to the Unknown: Robust Meta-Learning for Zero-Shot Financial Time Series Forecasting [0.0] ゼロショット設定において,学習した埋め込みを利用してより効果的なメタ学習を行うタスク構築手法を提案する。
提案手法は既存の手法よりも優れており,ゼロショットシナリオにおいてより優れた一般化能力を示す。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 17:27:07 GMT)
AGITB: A Signal-Level Benchmark for Evaluating Artificial General Intelligence [0.0] 本稿では,AGITB(Artificial General Intelligence Test Bed)を紹介する。
AGITBは、シンボル表現や事前訓練に頼ることなく、時間にわたってバイナリ信号を予測できるモデルの能力を通じて、インテリジェンスを評価する。
テストベッドは、事前のバイアスを前提とせず、意味的な意味から独立して動作し、残酷な力や記憶によって解決不可能性を確保する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 10:03:26 GMT)
A systematic review of research on large language models for computer programming education [0.0] 大規模言語モデル(LLM)は、コンピュータプログラミング教育において重要な役割を担っている。
本研究は,コンピュータプログラミング教育における LLM に関する経験的研究を体系的に検討する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 20:13:45 GMT)
A nonconvex entanglement monotone determining the characteristic length of entanglement distribution in continuous-variable quantum networks [0.0] 量子ネットワーク(QN)は、遠距離に絡み合った状態を分散することにより、近い将来に様々な量子技術の性能を高めることを約束する。
ここでは、純粋なガウス状態の連鎖上でのCV QNの指数的崩壊を分析する。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 06:25:12 GMT)
A Clue on Small-Capacitance Josephson Junction: What to Expect from Cooper Pair Ideal Conductor and Ohmic Resistor in Parallel? [0.0] 量子相ゆらぎと準粒子サブギャップ, 抵抗シャントが結合した量子相揺らぎによる小さな容量ジョセフソン接合への影響について検討した。
量子ジョセフソン接合における位相粒子運動は拡散性から局所化に変化せず、絶縁体-超伝導体遷移をもたらす。
論文参考訳(メタデータ) (Sun, 13 Apr 2025 17:58:39 GMT)