Open Problems in Technical AI Governance [102.2] テクニカルAIガバナンス(Technical AI Governance)は、AIの効果的なガバナンスを支援するための技術分析とツールである。
本論文は、AIガバナンスへの貢献を目指す技術研究者や研究資金提供者のためのリソースとして意図されている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:38:09 GMT)
ReGenesis: LLMs can Grow into Reasoning Generalists via Self-Improvement [70.1] 学習後の大規模言語モデル (LLM) は推論能力を高めることができる。
既存の自己合成手法は、一般化の貧弱さからドメイン外推論(OOD)タスクに悩まされる。
本稿では,学習後データとして推論経路を自己合成する手法であるSelf-Improvement (ReGenesis) による推論ジェネリストを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:50:12 GMT)
Elucidating the Design Space of Multimodal Protein Language Models [69.4] マルチモーダルタンパク質言語モデル(PLM)は、シーケンスとトークンに基づく構造情報を統合する。
本稿では,マルチモーダルPLMの設計空間を体系的に解明し,その限界を克服する。
我々の進歩はよりきめ細かな監督にアプローチし、トークンベースのマルチモーダルPLMが堅牢な構造モデリングを実現することを実証する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:35:11 GMT)
Zooming In on Fakes: A Novel Dataset for Localized AI-Generated Image Detection with Forgery Amplification Approach [69.0] textbfBR-Genは、さまざまなシーン認識アノテーションを備えた15万のローカル鍛造イメージの大規模なデータセットである。
textbfNFA-ViTはノイズ誘導フォージェリ増幅ビジョン変換器で、ローカライズされたフォージェリの検出を強化する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:57:23 GMT)
OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning [68.5] 本稿では,エージェントモデルと3次元駆動タスクを対応づける総合的視覚言語データセットを提案する。
提案手法は,代替行動を検討する人間ドライバーと同様,潜在的なシナリオとその成果を評価することによって意思決定を促進する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:00:11 GMT)
OmniDrive: A Holistic Vision-Language Dataset for Autonomous Driving with Counterfactual Reasoning [68.5] 本稿では,エージェントモデルと3次元駆動タスクを対応づける総合的視覚言語データセットを提案する。
提案手法は,代替行動を検討する人間ドライバーと同様,潜在的なシナリオとその成果を評価することによって意思決定を促進する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:12:21 GMT)
Cobra: Efficient Line Art COlorization with BRoAder References [62.5] 漫画のページは多彩なキャラクター、オブジェクト、背景を含むことが多く、色付け過程を複雑にしている。
画像生成のための拡散モデルの発展にもかかわらず、ラインアートのカラー化への応用は限定的である。
カラーヒントをサポートし,200以上の参照画像を利用する,効率的で汎用的な手法であるCobraを紹介する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:45:19 GMT)
MomentSeeker: A Comprehensive Benchmark and A Strong Baseline For Moment Retrieval Within Long Videos [62.0] 我々は、一般的な長時間ビデオモーメント検索タスクの処理において、検索モデルの性能を評価するベンチマークであるMomentSeekerを提案する。
平均で500秒を超える長いビデオが組み込まれており、長時間ビデオのモーメント検索に特化した最初のベンチマークとなっている。
幅広いタスクカテゴリ(Moment Search, Caption Alignment, Image-conditioned Moment Search, Video-conditioned Moment Searchなど)と多様なアプリケーションシナリオをカバーする。
さらに、MLLMベースのLVMRレトリバーを合成データ上に微調整し、ベンチマークで高い性能を示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:11:44 GMT)
Towards Realistic Low-Light Image Enhancement via ISP Driven Data Modeling [62.0] 深部ニューラルネットワーク(DNN)は近年,低照度画像強調(LLIE)の先導手法となっている。
大幅な進歩にもかかわらず、彼らの出力は、増幅ノイズ、誤ったホワイトバランス、または現実世界のアプリケーションに展開する際の不自然な拡張のような問題を示す可能性がある。
重要な課題は、低照度条件と撮像パイプラインの複雑さを捉える多様な大規模トレーニングデータの欠如である。
本稿では,この課題に対処し,無制限にペア化されたトレーニングデータを生成する,新しい画像信号処理(ISP)駆動型データ合成パイプラインを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:53:53 GMT)
Geolocation with Real Human Gameplay Data: A Large-Scale Dataset and Human-Like Reasoning Framework [59.4] 3つの重要なコンポーネントを持つ包括的位置決めフレームワークを導入する。
大規模データセットGeoComp、新しい推論手法GeoCoT、評価指標GeoEval。
また,GeoCoTは解釈可能性を高めつつ,位置情報の精度を最大25%向上させることを示した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:55:31 GMT)
Climbing the Ladder of Reasoning: What LLMs Can-and Still Can't-Solve after SFT? [59.4] AIME24データセット上でモデル性能の詳細な解析を行う。
我々は質問を4段階(易、中、硬、極度硬)に分類する。
我々は,SFT-1Kインスタンスが最小限であるR1推論スタイルを採用する必要があることを見出した。
エクレベルの質問は、根本的に異なる課題を示します。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:39:38 GMT)
Syzygy of Thoughts: Improving LLM CoT with the Minimal Free Resolution [59.4] CoT(Chain-of-Thought)は、問題を逐次ステップに分解することで、大きな言語モデル(LLM)の推論を促進する。
思考のシジー(Syzygy of Thoughts, SoT)は,CoTを補助的,相互関連的な推論経路を導入して拡張する新しいフレームワークである。
SoTはより深い論理的依存関係をキャプチャし、より堅牢で構造化された問題解決を可能にする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:02:01 GMT)
Neural Dueling Bandits: Preference-Based Optimization with Human Feedback [58.9] ニューラルネットワークを用いて、予め選択した腕の好みフィードバックを用いて報酬関数を推定する。
また、理論的結果を文脈的包括的問題に拡張し、二元的フィードバックは、それ自体は非自明な貢献である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:44:53 GMT)
Entropy-Guided Watermarking for LLMs: A Test-Time Framework for Robust and Traceable Text Generation [58.9] サンプルテキストの既存の透かし方式は、テキスト品質の維持と各種攻撃に対する堅牢な検出とのトレードオフに直面していることが多い。
累積透かしエントロピー閾値を導入することにより,検出性とテキスト品質を両立させる新しい透かし方式を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:16:38 GMT)
StreamingT2V: Consistent, Dynamic, and Extendable Long Video Generation from Text [58.5] 本稿では,80,240,600,1200以上のフレームをスムーズな遷移で自動回帰的に生成するStreamingT2Vを紹介する。
私たちのコードは、https://github.com/Picsart-AI-Research/StreamingT2V.comで利用可能です。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:38:58 GMT)
Transforming Science with Large Language Models: A Survey on AI-assisted Scientific Discovery, Experimentation, Content Generation, and Evaluation [58.1] 多くの新しいAIモデルとツールが提案され、世界中の研究者や学者が研究をより効果的かつ効率的に実施できるようにすることを約束している。
これらのツールの欠点と誤用の可能性に関する倫理的懸念は、議論の中で特に顕著な位置を占める。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:54:12 GMT)
A Midsummer Meme's Dream: Investigating Market Manipulations in the Meme Coin Ecosystem [57.9] 我々は,ミーム硬貨のトケノミクスを特徴付け,その成長を3ヶ月の縦断解析で追跡する。
市場関心の誤解を招きかねない外観を生み出すために設計された人工的な成長戦略の広範な活用の証拠を見いだす。
関連するトークンの多くは以前、洗面用トレーディング(LPI)を経験しており、初期操作が後の搾取の舞台となることがしばしばあったことを示している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:54:42 GMT)
Generative System Dynamics in Recurrent Neural Networks [57.0] リカレントニューラルネットワーク(RNN)の連続時間ダイナミクスについて検討する。
線形および非線形構成の両方において安定な極限サイクルを実現するためには,スキュー対称性の重み行列が基本であることを示す。
数値シミュレーションは、非線形活性化関数が極限周期を維持するだけでなく、システム統合プロセスの数値安定性を高めることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:39:43 GMT)
HiDe-PET: Continual Learning via Hierarchical Decomposition of Parameter-Efficient Tuning [55.9] 予備学習モデル(PTM)とパラメータ効率チューニング(PET)を組み合わせた連続学習(CL)統合フレームワークを提案する。
タスク固有知識とタスク共有知識を取り入れることで目的を明示的に最適化する革新的な手法である階層分解PET(HiDe-PET)を提案する。
提案手法は,近年の強いベースラインの幅広いスペクトルに対して,極めて優れた性能を示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 23:04:42 GMT)
SHeaP: Self-Supervised Head Geometry Predictor Learned via 2D Gaussians [55.8] モノクロ画像とビデオからの頭部の3次元再構成は、多くの視覚的応用の根底にある。
従来の手法は、豊富な2Dビデオから自己監督的な方法で学習しようとしてきた。
SHeaP (Self-supervised Head Geometry Predictor Learned through 2D Gaussian)を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:55:02 GMT)
Enhancing Web Agents with Explicit Rollback Mechanisms [55.3] 我々は、明示的なロールバック機構でWebエージェントを強化し、エージェントがナビゲーションの軌跡の前の状態に戻れるようにした。
このメカニズムは、モデルに検索プロセスを直接制御する柔軟性を与え、効果的で効率的なWebナビゲーション方法をもたらす。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:41:20 GMT)
AI threats to national security can be countered through an incident regime [55.2] 我々は、AIシステムからの潜在的な国家安全保障脅威に対抗することを目的とした、法的に義務付けられたポストデプロイAIインシデントシステムを提案する。
提案したAIインシデント体制は,3段階に分けられる。第1フェーズは,‘AIインシデント’とみなすような,新たな運用方法を中心に展開される。
第2フェーズと第3フェーズでは、AIプロバイダが政府機関にインシデントを通知し、政府機関がAIプロバイダのセキュリティおよび安全手順の修正に関与するべきだ、と説明されている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:24:21 GMT)
On Linear Representations and Pretraining Data Frequency in Language Models [54.8] 本研究では,事前学習データ周波数と実関係の線形表現との関係について検討する。
線形表現の形成が事前学習項周波数と強く結びついていることを示す。
LMにおける線形表現の強さは、モデルの事前学習コーパスに関する信号を含むと結論付けている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 19:50:03 GMT)
TacoDepth: Towards Efficient Radar-Camera Depth Estimation with One-stage Fusion [54.5] 一段核融合を用いた効率的かつ正確なレーダ・カメラ深度推定モデルであるTacoDepthを提案する。
具体的には、グラフベースのRadar構造抽出器とピラミッドベースのRadar融合モジュールを設計する。
従来の最先端のアプローチと比較して、TacoDepthは深さ精度と処理速度を12.8%、91.8%改善している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:25:04 GMT)
ToolRL: Reward is All Tool Learning Needs [54.2] 大規模言語モデル(LLM)は、ツールの使用能力を得るために、しばしば監督された微調整(SFT)を行う。
近年の強化学習(RL)の進歩は、有望な推論と一般化能力を示している。
本稿では、RLパラダイムにおけるツール選択とアプリケーションタスクに対する報酬設計に関する最初の総合的研究について述べる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:45:32 GMT)
The Jade Gateway to Trust: Exploring How Socio-Cultural Perspectives Shape Trust Within Chinese NFT Communities [53.8] 非偽造トークン(NFT)の出現は、デジタル資産と価値の扱い方を変えました。
初期の人気にもかかわらず、NFTは暗号通貨のボラティリティだけでなく、コミュニティ内の信頼のダイナミクスの影響も受けている。
我々の研究は、中国のNFT市場における3つの重要な信頼次元(技術、制度、社会)を特定している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:03:30 GMT)
A New Paradigm of User-Centric Wireless Communication Driven by Large Language Models [53.2] 次世代の無線通信は、人工知能とユーザー中心の通信ネットワークを深く統合しようとしている。
本稿では,構造化クエリ言語に対する自然言語を革新的に取り入れた,無線通信のための新しいパラダイムを提案する。
本稿では,物理層における動的意味表現ネットワークを符号化深度に適応させてユーザ要求を満たすプロトタイプシステムを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:43:36 GMT)
ACMamba: Fast Unsupervised Anomaly Detection via An Asymmetrical Consensus State Space Model [51.8] ハイパースペクトル画像(HSI)における教師なし異常検出は、背景から未知のターゲットを検出することを目的としている。
HSI研究は、HSIの高次元特性と高密度サンプリングベーストレーニングパラダイムにより、計算コストの急激さによって妨げられている。
計算コストを大幅に削減する非対称コンセンサス状態空間モデル(ACMamba)を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:33:42 GMT)
Metric-Solver: Sliding Anchored Metric Depth Estimation from a Single Image [51.7] Metric-rはスライディングアンカーを用いた新しい距離深さ推定法である。
我々の設計は多様な環境にまたがって統一的かつ適応的な深度表現を可能にする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:12:25 GMT)
Uncovering an Attractiveness Bias in Multimodal Large Language Models: A Case Study with LLaVA [51.6] マルチモーダル大言語モデル(MLLM)による評価と意思決定において魅力が果たす役割について検討する。
分析の結果,MLLMが行う決定には,80%以上のシナリオで魅力が影響していることが判明した。
性別、年齢、人種の偏見をそれぞれ83%、73%、57%のシナリオで明らかにしました。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:02:55 GMT)
Towards LLM Agents for Earth Observation [49.9] これは、NASAの地球観測所の記事から13のトピックと17の衛星センサーに関する140のイエス/ノーの質問のベンチマークである。
Google Earth Engine APIをツールとして使用すると、LLMエージェントは58%以上のコードを実行できないため、33%の精度しか達成できない。
我々は、合成データを微調整することで、オープンモデルの失敗率を改善し、より小さなモデルの方が、はるかに大きなモデルに匹敵する精度が得られるようにした。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:19:25 GMT)
The Digital Cybersecurity Expert: How Far Have We Come? [49.9] 我々は,サイバーセキュリティの専門家が期待する345の知識ポイントに基づいた,きめ細かいサイバーセキュリティ評価フレームワークであるCSEBenchmarkを開発した。
CSEBenchmarkで12のポピュラーな大言語モデル(LLM)を評価し、最高のパフォーマンスモデルでさえ全体の精度は85.42%に過ぎなかった。
各LSMにおける特定の知識ギャップを特定し,対処することにより,事前の誤り予測の修正において最大84%の改善が達成される。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:36:28 GMT)
Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.8] 本研究では,高次元非定常力学系のスケーラブルかつ柔軟なモデリングのための効率的な変換ガウス過程状態空間モデル(ETGPSSM)を提案する。
具体的には、ETGPSSMは、単一の共有GPと入力依存の正規化フローを統合し、複雑な非定常遷移ダイナミクスを捉える前に、表現的な暗黙のプロセスを生成する。
ETGPSSMは、計算効率と精度の観点から、既存のGPSSMとニューラルネットワークベースのSSMより優れています。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:24:54 GMT)
CodingHomo: Bootstrapping Deep Homography With Video Coding [49.7] ホログラフィー推定はコンピュータビジョンの基本課題であり、様々な分野で応用されている。
ディープラーニングの最近の進歩は、特に教師なし学習アプローチで、ホモグラフィー推定を改善している。
ホモグラフィー推定のための教師なしフレームワークであるCodingHomoを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:18:11 GMT)
BioMaze: Benchmarking and Enhancing Large Language Models for Biological Pathway Reasoning [49.5] 実際の研究から5.1Kの複雑な経路問題を持つデータセットであるBioMazeを紹介する。
CoT法やグラフ拡張推論法などの手法の評価は,LLMが経路推論に苦慮していることを示している。
そこで本稿では,インタラクティブなサブグラフベースのナビゲーションにより推論を強化するLLMエージェントであるPathSeekerを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:49:34 GMT)
Presto! Distilling Steps and Layers for Accelerating Music Generation [49.3] Presto!は、スコアベースの拡散変換器の推論加速度に対するアプローチである。
拡散モデルのEDM-ファミリーのための新しいスコアベース分布マッチング蒸留法(DMD)を開発した。
工程当たりのコストを削減するため,最近の層蒸留法において,単純だが強力な改良が加えられた。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:37:06 GMT)
EgoExo-Gen: Ego-centric Video Prediction by Watching Exo-centric Videos [49.2] エゴ中心の動画、対応するエゴ中心のビデオの最初のフレーム、テキストによる指示が与えられたら、エゴ中心のビデオの未来的なフレームを生成することが目的である。
EgoExo-Genは、クロスビュービデオ予測のための手動オブジェクトのダイナミクスを明示的にモデル化する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:12:39 GMT)
Sublinear Space Graph Algorithms in the Continual Release Model [48.7] 我々は,非プライベートなストリーミングと静的アルゴリズムからスペーシフィケーション手法を新たに利用して,サブ線形空間における新たな結果,連続的なリリース設定を実現する。
これには、最も高密度な部分グラフのためのアルゴリズム、最大マッチング、および最初の連続リリース$k$-core分解アルゴリズムが含まれる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:14:07 GMT)
ARES: An Efficient Algorithm with Recurrent Evaluation and Sampling-Driven Inference for Maximum Independent Set [48.6] 本稿では、2つの革新的な手法を取り入れたMIS問題に対する効率的なアルゴリズムを提案する。
提案アルゴリズムは、解の質、計算効率、安定性の点で最先端のアルゴリズムより優れている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:08:04 GMT)
Coding-Prior Guided Diffusion Network for Video Deblurring [47.8] 本稿では,コーディング先行と生成拡散先行の両方を有効活用して,高品質なデブロアリングを実現する新しいフレームワークを提案する。
実験では, IQA測定値の最大30%の改善により, 最先端の知覚品質が得られることを示した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:14:43 GMT)
BrowseComp: A Simple Yet Challenging Benchmark for Browsing Agents [47.4] BrowseCompは、エージェントがWebを閲覧する能力を測定するための、単純だが挑戦的なベンチマークである。
BrowseCompは1,266の質問からなる。
質問の難しさにもかかわらず、BrowseCompは単純で使いやすく、予測された回答は短く、参照された回答に対して容易に検証できる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 22:27:45 GMT)
Progent: Programmable Privilege Control for LLM Agents [46.5] LLMエージェントの最初の特権制御機構であるProgentを紹介する。
コアとなるのは、エージェント実行中に適用される権限制御ポリシを柔軟に表現するためのドメイン固有言語である。
これにより、エージェント開発者とユーザは、特定のユースケースに対して適切なポリシーを作成し、セキュリティを保証するために決定的にそれらを強制することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:58:40 GMT)
Transferable Deployment of Semantic Edge Inference Systems via Unsupervised Domain Adaption [45.9] ラベル付きデータサンプルを用いて特徴エンコーダ/デコーダの効率的なトレーニングにより推論精度を決定する。
センサデータと通信チャネルの分布の違いにより、新しい環境にシステムを展開すると、アノテートデータラベルのコストが高くなる可能性がある。
ラベル付きサンプルを必要とせずに,新しい環境下で高い推論精度を維持することができるセマンティックエッジ推論システム(DASEIN)のドメイン適応手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:50:51 GMT)
Plataforma para visualização geo-temporal de apinhamento turístico [45.5] 観光客の群集はビジター体験を低下させ、環境や住民に悪影響を及ぼす。
これは、観光のデジタルトランスフォーメーションに関連する欧州のレセッティングプロジェクトの枠組みの中で、この群集を視覚化するプラットフォームを開発する動機となった。
このプラットフォームは、混雑密度を計算する際に、対象サイトの搬送能力を考慮している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:11:11 GMT)
LO2: Microservice API Anomaly Dataset of Logs and Metrics [42.6] このデータセットは、マイクロサービスシステムの異常検出とアーキテクチャ劣化の研究を支援する。
プロダクションマイクロサービスシステムからログ、メトリクス、トレースの包括的なデータセットを生成します。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:21:56 GMT)
What, How, Where, and How Well? A Survey on Test-Time Scaling in Large Language Models [42.6] テストタイムスケーリング(TTS)が注目されている。
TTS研究の4つのコア次元に沿って構成された統一多次元フレームワークを提案する。
我々は, TTS の発達軌道を現在まで蒸留し, 実践的展開のための手動ガイドラインを提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:32:24 GMT)
Understanding Attention Mechanism in Video Diffusion Models [41.1] 我々は,T2Vモデルの空間的および時間的注意ブロックの深い摂動解析を行う。
その結果,時間的・空間的な注意マップはビデオのタイミングやレイアウトだけでなく,合成ビデオの美的品質にも影響を及ぼすことがわかった。
本稿では,映像品質の向上とテキスト誘導映像編集を可能にする2つの方法を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:37:08 GMT)
Dense Backpropagation Improves Training for Sparse Mixture-of-Experts [41.1] そこで本研究では,MoEルータのパラメータを緩やかに活性化しながら,高密度勾配更新を行う軽量近似法を提案する。
私たちのデフォルトのMoEは、計算オーバーヘッドをかなり必要とせずに、様々な設定で標準のTopKルーティングより優れています。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 19:55:36 GMT)
The Devil is in the Prompts: Retrieval-Augmented Prompt Optimization for Text-to-Video Generation [40.7] 大規模データセットでトレーニングされたテキスト・ツー・ビデオ(T2V)生成モデルは、入力プロンプトに敏感である。
textbfRAPO, a novel textbfRetrieval-textbfAugmented textbfPrompt textbfOptimization frameworkを紹介する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:33:25 GMT)
MotionStreamer: Streaming Motion Generation via Diffusion-based Autoregressive Model in Causal Latent Space [40.6] テキスト条件付きストリーミングモーション生成では、可変長の歴史的動きと入ってくるテキストに基づいて、次のステップの人間のポーズを予測する必要がある。
既存の方法は、例えば拡散モデルが予め定義された動き長によって制約されるような、ストリーミングモーション生成を達成するのに苦労している。
本研究では,連続因果遅延空間を確率論的自己回帰モデルに組み込む新しいフレームワークであるMotionStreamerを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:35:53 GMT)
AnomalyR1: A GRPO-based End-to-end MLLM for Industrial Anomaly Detection [40.3] 産業異常検出(IAD)は、欠陥サンプルの不足により深刻な課題となる。
従来のアプローチは、手作りの機能やドメイン固有のエキスパートモデルによって制約されることが多いが、この制限に対処するのに苦労している。
本稿では,マルチモーダル大規模言語モデル(MLLM)であるVLM-R1を活用する先駆的フレームワークであるAnomalyR1を紹介する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:48:41 GMT)
Unlocking the Power of Function Vectors for Characterizing and Mitigating Catastrophic Forgetting in Continual Instruction Tuning [39.8] 破滅的な忘れ(CF)は、機械学習において重要な課題であり、モデルは新しいタスクを学ぶ際に学習した情報を忘れる。
本研究はCFを様々な設定で探索し、モデル忘れは特定のトレーニングタスクとモデル自体の影響を受けていることを発見した。
本稿では,FVを安定させ,それを忘れるために正規化手法を取り入れた新しい関数ベクトル誘導訓練手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:22:41 GMT)
Search is All You Need for Few-shot Anomaly Detection [39.7] 産業検査において, FSAD (Few-shot Anomaly Detection) が重要な課題となっている。
本稿では,最も近い検索フレームワークが,単一クラスとマルチクラスの両方のFSADシナリオにおいて,最先端の性能を上回ることができることを示す。
画像レベルのAUROCスコアは97.4%,94.8%,70.8%であった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:21:34 GMT)
Parallel assembly of neutral atom arrays with an SLM using linear phase interpolation [39.6] 超高速空間光変調器で表示されたホログラムを更新することにより、光ツイーザ中の単一原子を任意のジオメトリに高速に並列に再配置する。
我々は、同じ原子サンプルを、再配置サイクル毎に0.997(2)の確率で複数のジオメトリーに分類する。
これにより、この手法は量子計算と量子シミュレーションのために大きな原子配列を再構成するための有用なツールとなる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:10:06 GMT)
Position: The Most Expensive Part of an LLM should be its Training Data [38.4] LLM(Large Language Model)のトレーニングは、計算、ハードウェア、エネルギ、エンジニアリングの要求が増大するため、ますますコストがかかる。
しかし、しばしば見過ごされる(そしてほとんど支払われない)費用は、これらのモデルのトレーニングデータの背後にある人的労働である。
このポジションペーパーは、この労働に金銭的価値を割り当てることを目的としており、LCM生産の最も高価な部分は、データ生産者のトレーニングに提供される報酬であるべきだと論じている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:56:14 GMT)
Flow-Based Sampling for Entanglement Entropy and the Machine Learning of Defects [38.2] 生成モデルを用いて格子量子場理論におけるR'enyiエンタンジメントエントロピーを数値計算する新しい手法を提案する。
本稿では,2つのレプリカを接続する格子欠陥を取り巻くニューラルネットワークアーキテクチャを用いて,フローベースのアプローチとレプリカのトリックを組み合わせる方法について述べる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:57:55 GMT)
RADLER: Radar Object Detection Leveraging Semantic 3D City Models and Self-Supervised Radar-Image Learning [37.6] まず,54Kの同期レーダイメージペアとセマンティック3D都市モデルからなるユニークなデータセットRadarCityを紹介する。
本稿では,コントラスト型自己教師型学習(SSL)とセマンティック3D都市モデルの有効性を活用した新しいニューラルネットワークRADLERを提案する。
収集したRadarCityデータセット上でRADLERを広範囲に評価し,従来のレーダオブジェクト検出法よりも平均平均平均平均精度(mAP)が5.46%,平均平均平均照度(mAR)が3.51%向上したことを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:18:56 GMT)
Negate or Embrace: On How Misalignment Shapes Multimodal Representation Learning [37.3] マルチモーダル表現学習は、モダリティ間でキューを整列させることにより、強力な表現を学習することを目的としている。
最近の研究では、実世界のデータセットがしばしば不一致を示すことが明らかになっている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:22:32 GMT)
Understanding the Limits of Vision Language Models Through the Lens of the Binding Problem [37.3] 現状の視覚言語モデルは、人間がほぼ完璧な精度で実行する基本的多目的推論タスクにおいて、驚くほどの失敗を示します。
我々は、最先端のVLMのファジィ障害の多くは、結合問題に起因するものだと説明でき、これらの障害モードは、ヒト脳における迅速なフィードフォワード処理によって引き起こされる制限と著しく類似していることを発見した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:59:00 GMT)
OpenSDI: Spotting Diffusion-Generated Images in the Open World [37.0] 本稿では,オープンワールド設定における拡散生成画像の発見に挑戦するOpenTrainingについて述べる。
オープンデータセット(OpenSDID)と呼ばれる新しいベンチマークを定義した。
Masked Autoencoder (MAE) と Contrastive Language- Image Pretrained (CLIP) を組み合わせた SPM ベースのモデルである MaskCLIP を導入する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:07:26 GMT)
Cyber Defense Reinvented: Large Language Models as Threat Intelligence Copilots [36.8] CYLENSは、大規模言語モデル(LLM)を利用したサイバー脅威情報通信システムである。
CYLENSは、脅威管理ライフサイクル全体を通じてセキュリティ専門家を支援するように設計されている。
脅威帰属、文脈化、検出、相関、優先順位付け、修復をサポートする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:18:52 GMT)
Logits DeConfusion with CLIP for Few-Shot Learning [36.6] 本稿では,ロジットのクラス間混乱を効果的に学習し,解消するLogits DeConfusionという新しい手法を提案する。
本手法は分類性能を大幅に向上させ,クラス間混同問題を緩和する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:12:56 GMT)
Conformal Calibration: Ensuring the Reliability of Black-Box AI in Wireless Systems [36.4] この論文は、計算量的に軽量で高度な統計ツールを採用することによって、芸術の状態を超越した一般的なフレームワークであるコンフォーマルキャリブレーションをレビューする。
コンフォーマルキャリブレーションをAIモデルライフサイクルに織り込むことで、ネットワークオペレータは、ブラックボックスAIモデルの信頼性を、無線システムの信頼性の高い実現技術として確立することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:25:54 GMT)
Mitigating Long-tail Distribution in Oracle Bone Inscriptions: Dataset, Model, and Benchmark [36.2] オラクル骨碑文(OBI)の認識は、古代中国の歴史や文化を理解する上で重要な役割を担っている。
既存のOBIデータセットは長期分布の問題に悩まされ、多数派と少数派の間でOBI認識モデルの性能に偏りが生じる。
我々は,OBIの専門家によるドメイン知識を取り入れた14,542枚の画像からなる,OBI生成と復調のための構造整合型OBIデータセットであるOracle-P15Kを紹介する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:29:01 GMT)
Finding Flawed Fictions: Evaluating Complex Reasoning in Language Models via Plot Hole Detection [35.6] ストーリーにおけるプロットホール検出は、大規模言語モデルにおける言語理解と推論を評価するためのプロキシである。
FlawedFictionsMakerは人書きストーリーのプロットホールを制御し、慎重に合成する新しいアルゴリズムである。
現状のLLMは、理屈によらず、FlawedFictionsを正確に解くのに苦労している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:25:54 GMT)
Natural Language Outlines for Code: Literate Programming in the LLM Era [35.5] 我々は、開発者がAI支援を提供するための新しいモダリティとインタラクションサーフェスとして、自然言語のアウトラインを使うことを提案する。
コード関数のNLアウトラインは、簡潔な散文で書かれた複数のステートメントを含み、コードを分割し、その主要なアイデアをリテラトプログラミングのスタイルで要約する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:09:59 GMT)
Evaluating Menu OCR and Translation: A Benchmark for Aligning Human and Automated Evaluations in Large Vision-Language Models [35.1] 異文化間コミュニケーションにおけるメニュー翻訳の重要な役割を強調する特化評価フレームワークを提案する。
MOTBenchは、それぞれの料理を正確に認識し翻訳するLVLMと、その価格とメニュー上のユニットアイテム、そして正確な人間のアノテーションを必要とする。
我々のベンチマークは中国語と英語のメニューのコレクションで構成されており、複雑なレイアウト、さまざまなフォント、さまざまな言語にまたがる文化的に特定の要素、そして正確な人間のアノテーションが特徴である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:08:57 GMT)
Knowledge-Driven Feature Selection and Engineering for Genotype Data with Large Language Models [35.1] FREEFORM, Free-flow Reasoning, Ensembling for Enhanced Feature Output and Robust Modeling。
https://github.com/PennShenLab/FREEFORM.com/FreeFORMはGitHubのオープンソースフレームワークとして利用可能だ。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:30:34 GMT)
Efficient Distributed Retrieval-Augmented Generation for Enhancing Language Model Performance [34.7] 小言語モデル(SLM)はリソース制約のあるエッジデバイスへの効率的なデプロイをサポートするが、その限られた能力は推論性能を損なう。
Retrieval-augmented Generation(RAG)は、デバイス上でのモデル再トレーニングを必要とせずに、外部データベースを統合することによってモデルパフォーマンスを向上させるための有望なソリューションである。
文書のプライバシーを漏洩させることなく、一般知識と個人知識の両方を通じてデバイス上のSLMを強化する分散RAGフレームワークであるDRAGONを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:32:23 GMT)
AI Behind Closed Doors: a Primer on The Governance of Internal Deployment [34.0] 内部デプロイメントは、フロンティアAIシステムによるメリットとリスクの主な源泉である。
このレポートは、内部デプロイメントのガバナンスに関する会話を予備して、この欠如に対処することを目的としている。
そこでは,AI研究開発パイプラインに対するAIシステムの内部適用による制御の喪失に関連するリスクについて論じる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:21:13 GMT)
Leveraging Social Determinants of Health in Alzheimer's Research Using LLM-Augmented Literature Mining and Knowledge Graphs [33.8] 成長する証拠は、社会的健康決定因子(SDoH)がアルツハイマー病(AD)と関連する認知症を発症する個人のリスクに影響を与えることを示唆している。
本研究は、SDoHの知識を広範囲にわたる文献から抽出し、AD関連生物学的実体と統合するための、新しい自動化された枠組みを提案する。
本フレームワークは,ADにおける知識発見の促進を約束し,他のSDoH関連研究領域に一般化することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:45:31 GMT)
DMM: Building a Versatile Image Generation Model via Distillation-Based Model Merging [33.0] スタイルベクトルの制御の下で任意のスタイルの画像を正確に生成できる、スタイルプロンプタブルな画像生成パイプラインを提案する。
この設計に基づいて,複数のモデルを1つの汎用T2Iモデルに圧縮する,スコア蒸留に基づくモデルマージパラダイム(DMM)を提案する。
実験により、DMMは複数の教師モデルからの知識をコンパクトに再構成し、制御可能な任意のスタイルの生成を実現することができることを示した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:09:45 GMT)
Agent Security Bench (ASB): Formalizing and Benchmarking Attacks and Defenses in LLM-based Agents [32.6] 我々は,LSMベースのエージェントの攻撃と防御を形式化し,ベンチマークし,評価するフレームワークであるAgen Security Bench (ASB)を紹介した。
ASBをベースとして、インジェクション攻撃10件、メモリ中毒攻撃、新しいPlan-of-Thoughtバックドア攻撃4件、混合攻撃11件をベンチマークした。
ベンチマークの結果,システムプロンプト,ユーザプロンプト処理,ツール使用量,メモリ検索など,エージェント操作のさまざまな段階における重大な脆弱性が明らかになった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:10:17 GMT)
Can Pre-training Indicators Reliably Predict Fine-tuning Outcomes of LLMs? [32.0] 本研究では,501BパラメータLLM変種を用いて,系統的な事前学習構成を持つデータセットを構築した。
本稿では,事前学習から得られた新しい教師なしおよび教師なしのプロキシメトリクスを導入し,相対的な性能予測誤差率を50%以上削減する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:19:09 GMT)
Taming Data and Transformers for Audio Generation [31.8] AutoReCap-XLは、4700万回以上のクリップを持つ、最大の環境オーディオテキストデータセットである。
AutoCapは高品質のオーディオキャプションモデルである。
GenAuはスケーラブルなトランスフォーマーベースのオーディオ生成アーキテクチャである。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:40:22 GMT)
UI-R1: Enhancing Action Prediction of GUI Agents by Reinforcement Learning [31.8] 図形ユーザインタフェース(GUI)の動作予測タスクにおいて,ルールベースの強化学習がMLLM(Multimodal Large Language Model)の推論能力を高める方法について検討する最初のフレームワークであるUI-R1を提案する。
具体的には、UI-R1が新しいルールベースのアクション報酬を導入し、グループ相対ポリシー最適化(GRPO)のようなポリシーベースのアルゴリズムによるモデル最適化を可能にする。
効率的なトレーニングのために、モバイルデバイス上で5つの一般的なアクションタイプを含む136の課題タスクからなる、小さくて高品質なデータセットをキュレートする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:06:40 GMT)
d1: Scaling Reasoning in Diffusion Large Language Models via Reinforcement Learning [31.5] 最近の大規模言語モデル(LLM)は、オンライン強化学習(RL)の恩恵を受ける強力な推論能力を示している。
教師付き微調整(SFT)とRLの組み合わせにより,事前学習したdLLMを推論モデルに適応するフレームワークであるd1を提案する。
d1は最高の性能を示し、最先端のdLLMの性能を大幅に向上させる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:08:45 GMT)
ToolSandbox: A Stateful, Conversational, Interactive Evaluation Benchmark for LLM Tool Use Capabilities [30.0] ToolSandboxは、大規模言語モデル(LLM)の評価フレームワークである。
ToolSandboxには、ステートフルなツール実行、ツール間の暗黙のステート依存性、オン・ポリケーションの会話評価をサポートする組み込みユーザシミュレータが含まれている。
オープンソースとプロプライエタリなモデルには大きなパフォーマンスギャップがあることを示し、ToolSandboxで定義された状態依存、正準化、不十分な情報といった複雑なタスクは、最も有能なSOTA LLMでさえも挑戦している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 22:20:21 GMT)
Multilingual Contextualization of Large Language Models for Document-Level Machine Translation [30.0] 大規模言語モデル (LLM) は文レベルの機械翻訳において高い性能を示している。
高品質な文書レベルのデータを対象とした微調整により,LLMに基づく長期文書翻訳を改善する手法を提案する。
提案手法は,文書から文書への直接翻訳やチャンクレベルの翻訳など,複数の翻訳パラダイムをサポートする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:52:22 GMT)
Towards Learning to Complete Anything in Lidar [29.9] 我々はライダーを用いた形状合成のためのCAL(Complete Anything in Lidar)を提案する。
我々のゼロショットアプローチは、マルチモーダルシーケンスからの時間的コンテキストを利用して、観測対象の形状と意味的特徴をマイニングする。
本稿では,セマンティック・パノプティクス・シーン・コンプリートのための標準ベンチマークを用いて,オブジェクトを(アモーダル)3次元境界ボックスとしてローカライズし,固定クラス語彙を超えたオブジェクトを認識できることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:21:55 GMT)
Self-alignment of Large Video Language Models with Refined Regularized Preference Optimization [29.7] 大規模ビデオ言語モデル(LVLM)は、微細な時間的理解と幻覚に苦慮し、単純なビデオ質問応答タスクでも単純な誤りを犯すことが多い。
本稿では,LVLMが自己の誤りから学習できる自己調整フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:43:56 GMT)
Enhancing Contrastive Learning Inspired by the Philosophy of "The Blind Men and the Elephant" [29.2] コントラスト学習において、挑戦的な正のペアを生成するために、JointCropとJointBlurを導入する。
プラグイン・アンド・プレイのフレームワークとして、JointCropとJointBlurは、SimCLR、BYOL、MoCo v1、MoCo v2、MoCo v3、SimSiam、Dinoのベースラインのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:12:31 GMT)
MMCLIP: Cross-modal Attention Masked Modelling for Medical Language-Image Pre-Training [29.0] 本稿では,MMCLIP(Masked Medical Contrastive Language- Image Pre-Training)フレームワークを提案する。
まず、注意マッピング画像モデリング(AttMIM)とエンティティ駆動マスキング言語モデリングモジュール(EntMLM)を紹介する。
第2に、MMCLIPは、病原性プロンプトを導入してマルチモーダル学習を強化するために、不適切なデータを大まかに活用する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:00:52 GMT)
Two Effects, One Trigger: On the Modality Gap, Object Bias, and Information Imbalance in Contrastive Vision-Language Models [27.6] コントラスト視覚言語モデル(VLM)は、様々な下流タスクに適用可能であることで人気を集めている。
ゼロショットオブジェクト認識のようないくつかのタスクで成功しているにもかかわらず、属性認識のような他のタスクでは驚くほど貧弱である。
これまでの研究では、これらの課題は、モダリティギャップ、共有表現空間における画像とテキストの分離、属性などの他の要因に対するオブジェクトに対するバイアスなどによるものだった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:50:18 GMT)
AnomalyGen: An Automated Semantic Log Sequence Generation Framework with LLM for Anomaly Detection [25.8] AnomalyGenは、異常検出用に特別に設計された最初の自動ログ合成フレームワークである。
本フレームワークは,プログラム解析とChain-of-Thought推論(CoT推論)を統合し,反復的なログ生成と異常アノテーションを実現する。
合成ログでベンチマークデータセットを増大させると、最大F1スコアの3.7%の改善が観測される。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:54:38 GMT)
AMPS: ASR with Multimodal Paraphrase Supervision [25.6] 本稿では,多言語多言語マルチモーダルASRシステムを拡張したAMPSを提案する。
参照転写のパラフレーズを,マルチモーダルASRモデルの訓練中に追加の指導として使用し,このパラフレーズの目的を,貧弱なASR性能の発話に対して選択的に呼び出す。
AMPSと最先端のマルチモーダルモデルSeamlessM4Tを用いて,単語誤り率(WER)を最大5%まで下げる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:54:05 GMT)
Diffusion Distillation With Direct Preference Optimization For Efficient 3D LiDAR Scene Completion [25.6] 本稿では,LiDARシーン完了のための拡散蒸留フレームワークであるDistillation-DPOを提案する。
本手法は, 蒸留における嗜好学習を最善に活用し, 選好整合蒸留に関する知見を提供するための最初の試みである。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:02:05 GMT)
SignDiff: Diffusion Model for American Sign Language Production [24.9] 本稿では,手話話者を骨格ポーズから生成できるSignDiffという2条件拡散事前学習モデルを提案する。
また,テキスト入力からASL骨格ポーズビデオを生成する,ASLP(American Sign Language Production)の新たな手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:14:30 GMT)
Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction [24.6] 文書解析は、構造化されていない半構造化された文書を構造化された機械可読データに変換するのに不可欠である。
本調査では,文書解析の現状を概観する。
モジュラーパイプラインシステムから、大規模なビジョン言語モデルによって駆動されるエンドツーエンドモデルまで、主要な方法論をカバーする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:01:20 GMT)
DM-OSVP++: One-Shot View Planning Using 3D Diffusion Models for Active RGB-Based Object Reconstruction [24.4] ワンショットビュープランニングは、すべてのビューを同時に予測することで、効率的なデータ収集を可能にする。
初期多視点画像の条件付けにより,3次元拡散モデルからの先行情報を利用して近似オブジェクトモデルを生成する。
シミュレーションと実世界の実験により,提案するアクティブオブジェクト再構築システムを検証する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 00:14:52 GMT)
InstantCharacter: Personalize Any Characters with a Scalable Diffusion Transformer Framework [24.3] InstantCharacterは、基礎拡散変換器上に構築された文字カスタマイズのためのスケーラブルなフレームワークである。
多様なキャラクターの外観、ポーズ、スタイルにまたがるオープンドメインのパーソナライゼーションを実現し、高忠実度な結果を維持する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:01:59 GMT)
zkFuzz: Foundation and Framework for Effective Fuzzing of Zero-Knowledge Circuits [24.2] ZK回路はプライバシー保護計算を可能にし、多くの暗号プロトコルの中心となっている。
既存のツールは、中間計算やプログラム中止など、いくつかの重要な動作を見落としている。
我々は、TCCT違反を検出するための新しいプログラム変異ベースのファジリングフレームワークであるzkFuzzを紹介する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:43:48 GMT)
Multi-modal vision-language model for generalizable annotation-free pathology localization and clinical diagnosis [24.1] 医療画像から病理を自動的に定義することは、疾患の出現と進展を理解するのに役立つ。
既存のディープラーニングモデルは専門家のアノテーションに依存しており、オープンな臨床環境での一般化機能が欠如している。
視覚言語モデルを提案する。
局在のない病理(AFLOC)
胸部X線画像の220万対のデータセットについて実験を行い、6つの外部データセットに対して広範囲な検証を行った。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:43:11 GMT)
GST: Precise 3D Human Body from a Single Image with Gaussian Splatting Transformers [24.0] 単眼画像からポーズ付き3次元モデルを構築することはスポーツ産業において重要な応用である。
人間の3次元ポーズと形状推定を3次元ガウススティング(3DGS)と組み合わせ,ガウスの混合シーンを表現した。
この組み合わせは、高価な拡散モデルや3Dポイントの監督なしに、1つの画像から3次元人間のモデルをほぼリアルタイムで推定できることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:37:31 GMT)
PCDiff: Proactive Control for Ownership Protection in Diffusion Models with Watermark Compatibility [23.6] PCDiffは、生成品質を規制することによってモデルの認可を再定義するプロアクティブアクセス制御フレームワークである。
PCDIFFはトレーニング可能なfuserモジュールと階層的な認証レイヤをデコーダアーキテクチャに統合する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:28:50 GMT)
LLM Unlearning Reveals a Stronger-Than-Expected Coreset Effect in Current Benchmarks [23.6] 大規模言語モデルアンラーニングは、安全性と制御モデル行動を保証する上で重要な課題となっている。
LLMのアンラーニングは、かなり小さなサブセット(コアセットとして機能する)で効果的に維持可能であることを示す。
これは、非常に低データ状態であっても、これらのベンチマークでのLLMアンラーニングが驚くほど容易に実行可能であることを示唆している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:45:55 GMT)
Boosting Multi-View Stereo with Depth Foundation Model in the Absence of Real-World Labels [23.4] DFM-MVSと呼ばれる新しい手法を提案する。
具体的には、現実的なステレオ通信をシミュレートするために、奥行き先ベース擬似教師付きトレーニング機構を開発した。
DTU と Tanks & Temples のデータセットによる実験結果から,提案した DFM-MVS は実世界のラベルを使わずに既存の MVS 手法を著しく上回っていることが示された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:07:09 GMT)
Beyond Words: Augmenting Discriminative Richness via Diffusions in Unsupervised Prompt Learning [23.1] 現在の擬似ラベル戦略は、しばしば意味情報と視覚情報のミスマッチに苦しむ。
textbfAugmenting Dtextbfiscriminative textbfRichness via Diffusions (AiR)
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:09:45 GMT)
Strategic Client Selection to Address Non-IIDness in HAPS-enabled FL Networks [21.4] 非IIDデータの悪影響を軽減するために,属性に基づく新たなクライアント選択手法を提案する。
シミュレーション結果は、FLモデルの精度と収束率を高めるために提案したクライアント選択戦略の有効性を裏付けるものである。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:14:34 GMT)
OMR-Diffusion:Optimizing Multi-Round Enhanced Training in Diffusion Models for Improved Intent Understanding [21.1] ループ内フィードバックを組み込んだビジュアルコ適応フレームワークを提案する。
このフレームワークは拡散モデルを洗練するために複数の報酬関数(多様性、一貫性、嗜好フィードバックなど)を適用している。
実験では、DALL-E 3(463勝)など、人間の評価において508勝を達成した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:09:58 GMT)
Think Before Recommend: Unleashing the Latent Reasoning Power for Sequential Recommendation [21.0] 提案するTextbfReaRecは,レコメンデータシステムのための最初の推論時間計算フレームワークである。
ReaRecはシーケンスの最後の隠された状態をシーケンシャルレコメンデータに自動的にフィードする。
本稿では2つの軽量推論に基づく学習手法,ERL(Ensemble Reasoning Learning)とPRL(Progressive Reasoning Learning)を紹介する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:20:11 GMT)
Towards Safe Synthetic Image Generation On the Web: A Multimodal Robust NSFW Defense and Million Scale Dataset [20.8] 安全かつNSFWなテキストとイメージを区別するためにマルチモーダルディフェンスが開発された。
我々のモデルは精度とリコールの観点から既存のSOTA NSFW検出手法に対して良好に機能する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:10:42 GMT)
Event Quality Score (EQS): Assessing the Realism of Simulated Event Camera Streams via Distances in Latent Space [20.5] イベントカメラは、低レイテンシ、高ダイナミックレンジ、非同期なイベントの性質でビジョンセンシングのパラダイムシフトを約束する。
本稿では,RVTアーキテクチャのアクティベーションを利用した品質指標であるイベント品質スコア(EQS)を紹介する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 22:25:57 GMT)
WORLDMEM: Long-term Consistent World Simulation with Memory [20.5] WorldMemは、メモリフレームとステートを格納するメモリユニットで構成されるメモリバンクでシーン生成を強化するフレームワークである。
本手法は,重要な視点や時間的ギャップの下でも,事前に観察されたシーンを正確に再構成することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:59:30 GMT)
A Scoping Review of Natural Language Processing in Addressing Medically Inaccurate Information: Errors, Misinformation, and Hallucination [20.3] 本稿では,自然言語処理による情報の検出,修正,医療的不正確な情報検出の可能性と課題について検討する。
これらの概念を統一することにより、レビューでは、共有された方法論の基礎と、医療への明確な影響を強調している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 22:27:10 GMT)
FocusedAD: Character-centric Movie Audio Description [20.3] Movie Audio Description (AD)は、対話のないセグメントで視覚コンテンツを語り、特に視覚障害者(BVI)の聴衆に利益をもたらすことを目的としている。
キャラクタ中心の映画音声記述を提供する新しいフレームワークであるFocusedADを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:04:14 GMT)
A Complex-valued SAR Foundation Model Based on Physically Inspired Representation Learning [20.0] SAR(Synthetic Aperture Radar)は、地球観測に重要な利点をもたらす全天候イメージング機能を提供する。
しかし,SAR画像解釈の基礎モデルを確立することは,情報利用の不十分さや解釈可能性の低下といった課題に必然的に直面する。
本研究では,プレトレーニングのための偏光分解過程をシミュレートした,複雑なSARデータに基づくリモートセンシング基盤モデルを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:51:34 GMT)
Can GPT tell us why these images are synthesized? Empowering Multimodal Large Language Models for Forensics [19.0] マルチモーダル大規模言語モデル(LLM)は、豊かな世界の知識を符号化しているが、局所的な偽造の詳細を理解するのに苦労している。
本稿では,画像の真正性評価,改ざん領域のローカライズ,エビデンスの提供,意味的改ざん手がかりに基づくトレース生成手法を提案する。
我々は定性的かつ定量的な実験を行い、GPT4VがAutospliceで92.1%、LaMaで86.3%の精度を達成できることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:02:46 GMT)
Synthetic Data for Blood Vessel Network Extraction [19.0] 脳内の血管ネットワークは脳卒中研究において重要な役割を担っている。
顕微鏡データから 詳細なトポロジカル血管網情報を抽出することは 重要な課題です
この研究は、合成データ生成とディープラーニングを組み合わせることで、体積顕微鏡データから容器ネットワークをグラフとして抽出する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:29:46 GMT)
Human Aligned Compression for Robust Models [19.0] 画像モデルに対する敵対攻撃は、誤った予測を引き起こす知覚できない摂動を導入することによって、システムの堅牢性を脅かす。
本研究では, 従来のJPEGと比較した2つの学習モデル(HiFiCとELIC)を, 様々な品質レベルで比較した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:05:58 GMT)
Imagery as Inquiry: Exploring A Multimodal Dataset for Conversational Recommendation [18.9] このデータセットはタイトル生成と複数選択という2つの推奨タスクをサポートする。
本稿では,画像の連鎖的プロンプトを提案し,その結果,顕著な改善が得られた。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:53:42 GMT)
CAGS: Open-Vocabulary 3D Scene Understanding with Context-Aware Gaussian Splatting [18.6] 3D Gaussian Splatting (3DGS) はシーン再構築のための強力な表現を提供するが、相互視の粒度の不整合は問題である。
空間コンテキストを3DGSに組み込んだ新しいフレームワークCAGSを提案する。
CAGSは3Dインスタンスのセグメンテーションを大幅に改善し、LERF-OVSやScanNetといったデータセットのフラグメンテーションエラーを低減する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:20:03 GMT)
Generating Pragmatic Examples to Train Neural Program Synthesizers [18.5] 優れたシンセサイザーは、与えられたサンプルセットと整合した多くのプログラムから意図したプログラムを選択する必要がある。
PraXは、この検索をニューラルネットワークで記憶させる新しい方法だ。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:08:02 GMT)
A Computationally Efficient Algorithm for Infinite-Horizon Average-Reward Linear MDPs [18.4] 線形MDPを用いた無限水平平均回帰設定における強化学習について検討した。
従来の作業では, 平均回帰設定を割引設定で近似し, クリッピングを用いて値反復関数の幅を制限し, 統計的効率を向上することで, この問題に対処している。
本稿では,効率的なクリッピング操作を施した値反復手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:47:41 GMT)
Soft Prompt Threats: Attacking Safety Alignment and Unlearning in Open-Source LLMs through the Embedding Space [18.1] 本稿では,入力トークンの連続的な埋め込み表現を直接攻撃する埋め込み空間攻撃を提案する。
組込み空間攻撃はモデルアライメントを回避し、離散攻撃やモデル微調整よりも有害な行動を効果的に引き起こすことを示す。
本研究は,スペースアタックをオープンソース LLM の重要な脅威モデルとして捉えたものである。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:15:56 GMT)
DVLTA-VQA: Decoupled Vision-Language Modeling with Text-Guided Adaptation for Blind Video Quality Assessment [17.9] 大規模マルチモーダルモデルの最近の進歩、特にContrastive Language-Image Pretraining (CLIP)は、CLIPをデュアルストリームベースのビデオ品質評価手法に組み込む動機となった。
本稿では,Blind Video Quality Assessment (DVLTA-VQA) のためのテキストガイド適応を用いたデカップリング型視覚言語モデルを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:20:28 GMT)
FedCanon: Non-Convex Composite Federated Learning with Efficient Proximal Operation on Heterogeneous Data [17.8] 複合学習は、追加の正規化用語で機械学習問題を解決するための一般的なフレームワークを提供する。
我々は非滑らかな正規化問題を解くためにFedCanonアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:28:26 GMT)
Learning What NOT to Count [17.6] 少ない/ゼロショットのオブジェクトカウント法は、細かなカテゴリを区別するのに苦労することが多い。
そこで本研究では,新たな細粒度カテゴリを,既存の少数/ゼロショットカウントモデルにシームレスに統合する,アノテーションのない手法を提案する。
提案手法では,合成擬似注釈データのみを用いて訓練した細粒度カテゴリ境界を同定するアテンション予測ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:05:47 GMT)
The Hitchhiker's Guide to Program Analysis, Part II: Deep Thoughts by LLMs [17.5] BugLensは、静的解析の精度を大幅に改善する、ポストリファインメントフレームワークである。
0.10 (raw) と 0.50 (半自動精製) から 0.72 に精度を上げ、偽陽性を著しく減少させる。
この結果から,構造化LCMベースのワークフローは静的解析ツールの有効性を有意に向上させることができることが示唆された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:17:06 GMT)
Self-Supervised Enhancement of Forward-Looking Sonar Images: Bridging Cross-Modal Degradation Gaps through Feature Space Transformation and Multi-Frame Fusion [17.4] 前向きのソナー画像の強調は、正確な水中目標検出に不可欠である。
本稿では,画素領域からソナー画像をロバストな特徴領域にマッピングする特徴空間変換を提案する。
提案手法は既存の手法よりも優れ,ノイズを効果的に抑制し,詳細なエッジを保ち,明るさを大幅に改善する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:58:55 GMT)
Co-Writing with AI, on Human Terms: Aligning Research with User Demands Across the Writing Process [17.3] AI記述支援のための4つの包括的な設計戦略を特定します。
著者が望むAI介入のレベルが、執筆プロセスによって異なることが明らかとなった。
我々の発見は、AIとの共同筆記のための人間中心の筆記ツールを開発するための実用的な設計ガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:05:46 GMT)
Learning to Learn Transferable Generative Attack for Person Re-Identification [17.3] 既存の攻撃は、異なるドメインでトレーニングされたモデルを摂動するクロステスト能力を無視して、クロスデータセットとクロスモデル転送可能性のみを考慮する。
実世界のre-idモデルのロバスト性を調べるために,MTGA法を提案する。
我々のMTGAは平均mAP低下率でSOTA法を21.5%、平均11.3%で上回っている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:53:31 GMT)
GaussVideoDreamer: 3D Scene Generation with Video Diffusion and Inconsistency-Aware Gaussian Splatting [17.2] GaussVideoDreamerは、画像、ビデオ、および3D生成のギャップを埋めることで、生成的マルチメディアアプローチを前進させる。
提案手法は,LLaVA-IQAスコアの32%,既存の手法に比べて少なくとも2倍の高速化を実現している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:43:01 GMT)
Déjà Vu: Multilingual LLM Evaluation through the Lens of Machine Translation Evaluation [17.2] 多言語大言語モデル(mLLM)の生成能力と言語カバレッジは急速に進歩している。
しかし、mLLMの評価方法には、包括性、科学的厳密性、研究機関間の一貫した採用の欠如がある。
同様の課題に直面し、何十年もの間、透過的なレポーティング標準を開発してきた分野である、機械翻訳(MT)評価と平行関係を描いています。
我々はこれらの知見を,mLLM研究・開発のための実行可能なレコメンデーションのチェックリストに抽出する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:38:19 GMT)
Evaluating the Goal-Directedness of Large Language Models [17.1] 我々は,情報収集,認知活動,計画実行を必要とするタスクに対して,目標指向性を評価する。
Google DeepMind、OpenAI、AnthhropicによるLCMの評価は、ゴール指向性はタスク間で比較的一貫性があることを示している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:07:08 GMT)
Saga: Capturing Multi-granularity Semantics from Massive Unlabelled IMU Data for User Perception [17.0] 本稿では,ユーザ認識の精度を高めるために,少量のラベル付きIMUデータしか必要としないSagaという,ユーザ認識のきめ細かいアプローチを提案する。
Sagaの中核となるアイデアは、大量のIMUデータに埋め込まれた様々なレベルのリッチな意味情報を利用して、バックボーンの特徴抽出モデルを事前訓練することである。
Sagaは1万以上のトレーニングサンプルでトレーニングされた本格的なモデルの90%以上の精度を、追加のシステムオーバーヘッドなしで達成することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:03:42 GMT)
MADGEN: Mass-Spec attends to De Novo Molecular generation [16.9] 質量分析データを用いたデノボ分子構造生成のための足場に基づく手法を提案する。
MADGENは、足場検索とスペクトル条件分子生成の2段階で動作する。
我々は3つのデータセット(NIST23、CANOPUS、MassSpecGym)上でMADGENを評価する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 19:10:41 GMT)
VGDFR: Diffusion-based Video Generation with Dynamic Latent Frame Rate [16.8] VGDFRは動的遅延フレームレートを持つ拡散型ビデオ生成のためのトレーニング不要のアプローチである。
VGDFRは、画質の劣化を最小限に抑えながら、ビデオ生成において最大3倍の高速化を実現することができることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:09:13 GMT)
A Survey on Decentralized Identifiers and Verifiable Credentials [16.8] SSI(Self-Sovereign Identity)は、ユーザのデータを完全にコントロールする。
SSIは分散識別子(DID)と検証資格(VC)を活用する
これらの技術は、よりセキュアで分散化されたデジタルIDシステムを構築する可能性を秘めている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:53:04 GMT)
Rethinking Trust in AI Assistants for Software Development: A Critical Review [16.8] 信頼は人間の意思決定とコラボレーションの基本的な概念である。
ソフトウェアエンジニアリングの記事は、しばしば非公式に「信頼」という言葉を使う。
共通の定義がなければ、信頼に関する真の二次研究は不可能である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 19:52:21 GMT)
Secure Transfer Learning: Training Clean Models Against Backdoor in (Both) Pre-trained Encoders and Downstream Datasets [16.6] 事前トレーニングと下流適応は、エンコーダとデータセットのレベルで洗練されたバックドア埋め込みにモデルを公開します。
本研究では,資源制約のある移動学習シナリオにおけるバックドアリスクを軽減する方法について検討する。
我々は,信頼性の高いデータとニューロンをピンポイントしてモデルセキュリティを強化することの重要性を強調する,Trusted Core (T-Core) Bootstrappingフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:33:03 GMT)
An Online Adaptation Method for Robust Depth Estimation and Visual Odometry in the Open World [16.4] 多様な新しい環境にオンラインで適応できるビジュアル・オドメトリーシステムの開発を行う。
本研究では,視覚計測システムの出力に基づいて,深度推定モジュールの自己教師型学習を目的とした。
提案手法のロバスト性と一般化能力について,都市,社内データセット,ロボットプラットフォームに対する最先端の学習ベースアプローチと比較した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:48:10 GMT)
Mirror: Multimodal Cognitive Reframing Therapy for Rolling with Resistance [16.4] 我々は、非言語的な手がかりを取り入れたマルチモーダルアプローチを提案し、AIセラピストは、クライアントのネガティブな感情状態に応答をより良く整合させることができる。
具体的には,新しい合成データセットであるMultimodal Interactive Rolling with Resistance (Mirror)を導入する。
このデータセットを用いて、顔の手がかりを分析し、感情を推測し、共感的な反応を生成し、抵抗を効果的に管理できるベースライン視覚言語モデル(VLM)を訓練する。
その結果、MirrorはAIセラピストの抵抗処理能力を大幅に向上させ、既存のテキストベースのCBTアプローチよりも優れていることが示された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:44:26 GMT)
MOS: Towards Effective Smart Contract Vulnerability Detection through Mixture-of-Experts Tuning of Large Language Models [16.2] スマートコントラクトの脆弱性は、ブロックチェーンシステムに重大なセキュリティリスクをもたらす。
本稿では,大規模言語モデルのミックス・オブ・エキスパート・チューニング(MOE-Tuning)に基づくスマートコントラクト脆弱性検出フレームワークを提案する。
実験の結果、MOSはF1のスコアが6.32%、精度が4.80%の平均的な改善で既存の手法よりも大幅に優れていた。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:33:53 GMT)
Incrementally Learning Multiple Diverse Data Domains via Multi-Source Dynamic Expansion Model [16.0] 継続学習は、事前知識を維持しつつ、新たな情報を漸進的に同化できるモデルの開発を目指している。
本稿では,複数の異なるドメインから抽出されたデータサンプルを特徴とする,より複雑で現実的な学習環境に焦点を移す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:21:23 GMT)
Extended Short- and Long-Range Mesh Learning for Fast and Generalized Garment Simulation [15.8] 3次元衣料シミュレーションは、布ベースのグラフィックを作る上で重要な要素である。
グラフニューラルネットワーク(GNN)の最近の進歩は、効率的な衣服シミュレーションに有望なアプローチを提供する。
我々は、最小限のオーバーヘッドでメッセージパス範囲を拡張するために、2つの重要なコンポーネントを持つ新しいGNNベースのメッシュ学習フレームワークを考案した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:56:01 GMT)
InfoNCE: Identifying the Gap Between Theory and Practice [15.7] 我々は、コントラスト学習が実際にどのように展開されるかという重要な側面を、理論は見落としていると論じる。
実際には、正の対は、少数のピクセルに対して強い収穫などの増量によって生成されることが多い。
本稿では、この異方性設定における潜伏因子を確実に発見できるInfoNCEの一般化であるAnInfoNCEを紹介する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:26:14 GMT)
SALAD: Improving Robustness and Generalization through Contrastive Learning with Structure-Aware and LLM-Driven Augmented Data [15.4] モデルロバスト性と一般化を向上する新しいアプローチであるSALADを提案する。
提案手法は,コントラスト学習のための構造認識および非実効的拡張データを生成する。
本研究のアプローチは,感性分類,性行為検出,自然言語推論の3つのタスクを用いて検証する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:40:10 GMT)
A Human-AI Comparative Analysis of Prompt Sensitivity in LLM-Based Relevance Judgment [15.3] 大規模言語モデル(LLM)は、情報検索(IR)タスクの関連判断を自動化するために、ますます使われている。
LLMに基づく妥当性判定の堅牢性と信頼性を評価するため,課題に対する迅速な感度の影響を系統的に検討した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:17:19 GMT)
Interpreting the Linear Structure of Vision-language Model Embedding Spaces [15.1] 我々は、4つの視覚言語モデルの埋め込み空間上でスパースオートエンコーダ(SAE)を訓練・リリースする。
SAEは実際の埋め込みを再構築するのに優れており、また最もスパース性を維持することができる。
また、SAEによって抽出される鍵となる活性化概念は、実行中において著しく安定であることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:40:06 GMT)
Science Out of Its Ivory Tower: Improving Accessibility with Reinforcement Learning [15.0] 言語モデルを微調整して、学術的な抽象語をより理解しやすいバージョンに書き換える強化学習フレームワークを導入する。
我々の最良のモデルは、学者抽象学の可読性レベルを、およそ6つの米国学級レベルに調整する。
我々は,学術研究と一般大衆のギャップを埋めるための一歩として,この研究を構想する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:00:53 GMT)
An LLM-as-a-judge Approach for Scalable Gender-Neutral Translation Evaluation [14.8] ジェンダーニュートラル翻訳(GNT)は、ソーステキストがそれらの参照者の性別に関する明示的な手がかりを欠いている場合に、人間の参照者の性別を表現することを避けることを目的としている。
大規模言語モデル(LLM)をGNTの評価器として用いることを検討する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:14:27 GMT)
Recent Advance in 3D Object and Scene Generation: A Survey [14.7] 本調査は,最先端の3D生成技術に関する構造化された理解を読者に提供することを目的としている。
本稿では,レイアウト誘導合成,2次元先行シーン生成,ルール駆動モデリングの3つの主要なパラダイムに着目した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:22:06 GMT)
ValueCompass: A Framework for Measuring Contextual Value Alignment Between Human and LLMs [14.6] 本稿では,心理学的理論と体系的レビューに基づく基本的価値の枠組みであるバリューを紹介する。
実世界の4つのシナリオにまたがって、人間と大規模言語モデル(LLM)の価値アライメントを測定するためにバリューを適用します。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:50:45 GMT)
Geometry-aware RL for Manipulation of Varying Shapes and Deformable Objects [14.5] 様々な地形と変形可能な物体で物体を操作することは、ロボット工学における大きな課題である。
我々は、より小さな部分グラフからなる不均一グラフのレンズを通してこの問題をフレーム化する。
本稿では,多種多様な物体の厳密な挿入を含む,新規で挑戦的な強化学習ベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:58:58 GMT)
How Do I Do That? Synthesizing 3D Hand Motion and Contacts for Everyday Interactions [13.9] 我々は,RGBビュー,アクションテキスト,オブジェクト上の3次元接触点を入力として,3次元手の動きと接触地図(または対話軌跡)を予測するという新たな課題に取り組む。
本手法は,(1)手ポーズと接触点の潜在コードブックを学習するVQVAEモデル,(2)対話軌跡を効果的にトークン化するInteraction Predictor: テスト時間入力から対話軌跡を予測するTransformer-Decoderモジュールから構成される。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:48:12 GMT)
Good Seed Makes a Good Crop: Discovering Secret Seeds in Text-to-Image Diffusion Models [13.5] 拡散推論におけるランダム種子の影響について,大規模な科学的研究を行う。
我々は、最も優れた'金'シードが21.60の印象的なFIDを達成したのに対し、最悪の'金'シードのFIDは31.97であることがわかった。
分類器は、わずか数回で99.9%以上の精度で画像を生成するために使用されるシード番号を予測することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 20:39:59 GMT)
Cross-Modal Mapping: Mitigating the Modality Gap for Few-Shot Image Classification [13.2] 画像分類のための新しいクロスモーダルマッピング(CMM)手法を提案する。
CMMは、画像特徴とテキスト特徴空間を線形変換により整列する。
11のベンチマークデータセットでは、Top-1の平均精度が1.06%向上している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:07:11 GMT)
You Don't Need All Attentions: Distributed Dynamic Fine-Tuning for Foundation Models [13.2] 本稿では,注目モジュール間の操作をオーケストレーションする分散動的ファインチューニングフレームワークを紹介する。
D2FTは微調整基礎モデルに必要な計算負荷を大幅に削減する。
その結果、D2FTは最新のパラメータ効率向上技術であるLoRAに効果的に拡張できることがわかった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 20:18:15 GMT)
Dynamics and Computational Principles of Echo State Networks: A Mathematical Perspective [13.1] 貯留層計算(Reservoir Computing, RC)は、状態遷移機構(貯留層)と、状態空間からマップされるフレキシブルな読み出し層を特徴とする状態空間モデル(SSM)のクラスである。
本研究はRCの系統的な探索を行い, エコー状態特性, フェージングメモリ, 貯水池容量などの基礎的特性を動的システム理論のレンズを通して論じる。
入力信号と貯水池状態の相互作用を形式化し、貯水池の安定性と表現力を示す条件を示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:28:05 GMT)
AI Safety Should Prioritize the Future of Work [13.1] AIの安全性に関する現在の取り組みは、有害なコンテンツのフィルタリングを優先し、人間の行動の操作を防止し、サイバーセキュリティやバイオセキュリティの既存のリスクを排除している。
この狭義の焦点は、社会の長期的な軌跡を形成する人間中心の批判的考察を見落としている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 23:12:30 GMT)
CSPLADE: Learned Sparse Retrieval with Causal Language Models [12.9] 学習スパース検索(LSR)のための大規模言語モデル(LLM)の訓練における2つの課題を特定する。
本研究では,(1)トレーニング不安定を解消するための軽量適応訓練フェーズ,(2)双方向情報を実現するための2つのモデル変種を提案する。
これらの手法により,LSRモデルを8BスケールのLLMで学習し,インデックスサイズを縮小した競合検索性能を実現することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:45:16 GMT)
Bridging the Semantic Gaps: Improving Medical VQA Consistency with LLM-Augmented Question Sets [12.9] 医用視覚質問応答システム (MVQA) は, 自然言語クエリに応答して, 医用画像の解釈を行うことができる。
言語的な多様性は、しばしばこれらのシステムの一貫性を損なう。
本稿では,意味的に等価な質問文を生成するためのSemantically Equivalent Question Augmentation(SEQA)フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:31:18 GMT)
RLSA-PFL: Robust Lightweight Secure Aggregation with Model Inconsistency Detection in Privacy-Preserving Federated Learning [12.8] フェデレートラーニング(FL)は、ローカルモデルを共有することで、中央サーバにプライベートデータを公開することなく、グローバルな機械学習モデルを協調的にトレーニングすることを可能にする。
FLでは、敵が共有モデルパラメータから機密情報を推測する可能性のあるプライバシー上の脆弱性が報告されている。
本稿では,軽量な暗号プリミティブをプライバシリスクに利用したマスキングに基づくセキュアアグリゲーション手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:52:45 GMT)
Towards Personalized Conversational Sales Agents : Contextual User Profiling for Strategic Action [12.6] 本稿では、嗜好の誘惑、推薦、説得を統一する新しいタスクである会話販売(CSales)を紹介する。
CSales の現実的な評価のために,実世界のデータから構築した LLM ベースのユーザシミュレータ CSUser を提案する。
また、対話型行動計画のための対話を通して文脈プロファイルを積極的に推測する対話型販売エージェントCSIを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:59:48 GMT)
Multi-Mission Tool Bench: Assessing the Robustness of LLM based Agents through Related and Dynamic Missions [12.2] 大規模言語モデル(LLM)は、高度な理解と計画能力のため、ツール呼び出しのエージェントとして強力な可能性を示している。
ベンチマークでは、各テストケースは複数の相互関連ミッションから構成される。
また,エージェント決定の精度と効率を動的決定木を用いて評価する手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:22:29 GMT)
Memorization vs. Reasoning: Updating LLMs with New Knowledge [12.2] 我々は、現実的な知識更新をシミュレートする自動パイプラインであるKUP(Knowledge Update Playground)を紹介する。
本稿では,自己生成した「メモリ」トークンの更新コーパスにトークンを条件付ける,MCT(Memory Conditioned Training)という軽量な手法を提案する。
以上の結果から,(1) KUPベンチマークは非常に困難であり, 最高のCPTモデルでは, 間接的推論設定(推論)で2%$を達成し, (2) MCTトレーニングでは, 先行事前学習(CPT)ベースラインよりも有意に優れていた。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 23:03:40 GMT)
FiSMiness: A Finite State Machine Based Paradigm for Emotional Support Conversations [11.7] 感情支援会話(ESC)は、効果的な会話を通じて個人の感情的苦痛を軽減することを目的としている。
我々は、FSM(Finite State Machine)を大規模言語モデルに活用し、FiSMinessと呼ばれるフレームワークを提案する。
我々のフレームワークは、単一のLCMがESC中のプランニングをブートストラップし、探索者の感情、支援戦略、そして各会話のターンに対する最終応答を自己推論することを可能にする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:52:06 GMT)
BPP-Search: Enhancing Tree of Thought Reasoning for Mathematical Modeling Problem Solving [11.6] 我々は、完全な数学的モデリングプロセスをキャプチャする包括的ラベルを付したStructuredORデータセットをリリースする。
本稿では,強化学習をツリー・オブ・シント構造に統合するアルゴリズムであるBPP-Searchを提案する。
木に基づく推論では、BPP-Searchは精度と効率が優れ、正しい解の高速な検索を可能にする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:21:29 GMT)
Code Improvement Practices at Meta [11.4] コード品質に関するエンジニアとのコラボレーションによるMetaの実践について検討する。
リッチなソースコード変更履歴を分析して、継続的な改善に使用されるさまざまなプラクティスを明らかにします。
再設計活動の影響を解析した結果,品質と速度が大幅に向上した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 22:30:54 GMT)
Neighbor-Based Feature and Index Enhancement for Person Re-Identification [11.3] 人物の再識別(Re-ID)は、異なるカメラとビューを備えた大きなギャラリーで同じ歩行者にマッチすることを目的としている。
既存の手法は通常、モデルアーキテクチャを改善することで特徴表現を改善する。
本稿では,特徴表現と指標性能の両立を図るため,潜伏した近傍情報を活用する新しいモデルDMON-AROを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:13:20 GMT)
Understanding and Optimizing Multi-Stage AI Inference Pipelines [11.3] HERMESは不均一な多段LPM推論実行シミュレータである。
HERMESは、以前のフレームワークとは異なり、複数のモデルを同時に実行する異種クライアントをサポートする。
我々は、推論ステージがエンドツーエンドのレイテンシ、ハイブリッドパイプラインの最適戦略、リモートKVキャッシュ検索のアーキテクチャ的影響について検討する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:34:04 GMT)
Thousand Voices of Trauma: A Large-Scale Synthetic Dataset for Modeling Prolonged Exposure Therapy Conversations [11.2] Thousand Voices of Traumaは、PTSDの長期露光療法プロトコルに基づく、3000件のセラピー会話の総合ベンチマークデータセットである。
データセットには500のユニークなケースが含まれており、それぞれが治療の進行を反映する6つの会話視点を通して探索されている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:29:05 GMT)
Regist3R: Incremental Registration with Stereo Foundation Model [11.2] コンピュータビジョンの分野では、マルチビュー3D再構成は不可欠だが難しい問題である。
本稿では,効率的かつスケーラブルな漸進的再構築に適した新しいステレオ基礎モデルであるRegist3Rを提案する。
カメラポーズ推定と3次元再構成のための公開データセット上でRegist3Rを評価する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:46:53 GMT)
SAM2MOT: A Novel Paradigm of Multi-Object Tracking by Segmentation [11.2] Segment Anything 2 (SAM2)は、セグメンテーションを使った堅牢な単一オブジェクト追跡を可能にする。
本稿では,多目的追跡のための新しいトラッキング・バイ・パラダイムであるSAM2MOTを提案する。
SAM2MOTはセグメンテーションマスクから直接トラッキングボックスを生成し、検出精度への依存を減らす。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:49:02 GMT)
Open-Medical-R1: How to Choose Data for RLVR Training at Medicine Domain [11.1] 本稿では,医療領域におけるReinforcement Learning with Verified Rewards(RLVR)トレーニングのための最適なデータ選択戦略について検討する。
Phi-4, Gemma-3-27b-it, Gemma-3-12b-itモデルを用いて, ランダムサンプリング(ベースライン)とフィルタリングを行う。
これらの結果から, フィルタデータを用いた学習モデルは, ランダムに選択したサンプルで学習したモデルよりも優れていた。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:16:12 GMT)
Beyond Text: Characterizing Domain Expert Needs in Document Research [11.0] 文書研究のプロセスを理解するために、2つのドメインにまたがる16のドメインエキスパートに頼みます。
参加者のプロセスは、慣用的で反復的で、文書の社会的文脈に大きく依存していることが分かりました。
我々はNLPコミュニティに、有用なツールを構築する上でのドキュメントの役割をより慎重に検討するよう呼びかける。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:24:41 GMT)
ChatTS: Aligning Time Series with LLMs via Synthetic Data for Enhanced Understanding and Reasoning [10.9] 本稿では,時系列解析用に設計された新しいMLLMであるChatTSを紹介する。
ChatTSは、視覚MLLMが画像を処理する方法と同様、時系列をモダリティとして扱う。
Time Series Evol-Instructは様々な時系列Q&Aを生成し、モデルの推論能力を高めます。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:18:01 GMT)
VIPO: Value Function Inconsistency Penalized Offline Reinforcement Learning [10.8] VIPOは、価値推定から自己教師付きフィードバックを取り入れて、モデルトレーニングを強化する、新しいモデルベースのオフラインRLアルゴリズムである。
VIPOはD4RLとNeoRLベンチマークのほぼすべてのタスクで最先端のパフォーマンスを実現している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:23:44 GMT)
Multimodal Lego: Model Merging and Fine-Tuning Across Topologies and Modalities in Biomedicine [10.8] マルチモーダルレゴ(MM-Lego)は、あらゆるエンコーダを最小限の微調整なしで競争力のあるマルチモーダルモデルに変換する汎用的な融合フレームワークである。
本研究では, MM-Legoをモデルマージ法として用いることで, 微調整を伴わずに, エンドツーエンド融合モデルとの競合性能を実現することができることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:43:35 GMT)
DG-MVP: 3D Domain Generalization via Multiple Views of Point Clouds for Classification [10.7] ディープニューラルネットワークは3Dポイントクラウド分類において大きな成功を収めている。
本稿では,3次元クラウド領域の一般化問題に焦点をあてる。
本稿では,3次元点雲領域の一般化手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 19:43:32 GMT)
3D-PointZshotS: Geometry-Aware 3D Point Cloud Zero-Shot Semantic Segmentation Narrowing the Visual-Semantic Gap [10.7] 3D-PointZshotSは、幾何学的なゼロショットセグメンテーションフレームワークである。
我々はLGPをクロスアテンション機構を介してジェネレータに統合し、微粒な幾何学的詳細で意味的特徴を豊かにする。
我々は、共有空間における視覚的特徴と意味的特徴を再表現し、意味と視覚的ギャップを埋め、未知のクラスへの知識伝達を促進する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 19:17:12 GMT)
A Comparative Study of Artificial Potential Fields and Reciprocal Control Barrier Function-based Safety Filters [10.5] 人工電位場(APF)によって設計されたコントローラは、相互制御バリア関数2次プログラム(RCBF-QP)の安全性フィルタから導出可能であることを示す。
さらに、補助関数の選択を制限することなく、APFベースのコントローラをより一般的なシナリオに一般化する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:37:28 GMT)
Rethinking the Generation of High-Quality CoT Data from the Perspective of LLM-Adaptive Question Difficulty Grading [10.5] 近年、DeepSeek-R1 (671B) (DeepSeek-AIet al., 2025) は複雑なタスクにおいて優れた推論能力を示している。
我々は,LLM-Adaptive Questiondifficultyレベルを用いた高品質なチェーン・オブ・シークレット(CoT)データを生成するための効率的な方法を模索する。
我々は、データ生成のコストを大幅に削減し、教師付き微調整モデルの効率を向上した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:55:34 GMT)
Self-Controlled Dynamic Expansion Model for Continual Learning [10.4] 本稿では, 自己制御型動的拡張モデル(SCDEM)を提案する。
SCDEMは複数のトレーニング可能なトレーニング済みのViTバックボーンを編成し、多様で意味的に豊かな表現を提供する。
提案手法の有効性を評価するため,幅広い実験が実施されている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:13:45 GMT)
Automatic Item Generation for Personality Situational Judgment Tests with Large Language Models [10.0] 本研究は,人格状況判断テスト(PSJT)を中国語で自動生成する GPT-4 の可能性を探るものである。
従来のSJT開発は労働集約的でバイアスが多いが、GPT-4はスケーラブルで効率的な代替手段を提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:53:03 GMT)
Emotion Alignment: Discovering the Gap Between Social Media and Real-World Sentiments in Persian Tweets and Images [9.9] 現実世界とオンラインプラットフォームの間の感情表現の相違が 現れます
革新的なパイプラインは、ソーシャルメディアと比較して現実世界の感情の類似度を測定するために設計された。
結果は、画像と現実世界の感情の間に28.67%の類似性を示し、ツイートは現実世界の感情と75.88%の一致を示した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 22:23:08 GMT)
Masked Autoencoders are Robust Data Augmentors [9.8] 本稿では,トレーニングプロセスの正規化に向けて,新たな拡張の視点を提案する。
マスク付き画像モデリングを自己教師付き学習に適用した最近の成功に触発され、自己教師付きマスク付きオートエンコーダを採用した。
このようなモデルに基づく非線形変換をデータ拡張として活用することで,高レベルの認識タスクを向上できることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:10:09 GMT)
Why Lift so Heavy? Slimming Large Language Models by Cutting Off the Layers [9.5] 大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクに対処する際、優れた能力を持っている。
これらのモデルの厳密なサイズは、ストレージ、トレーニング、推論において、層積み重ねによる数十億のパラメータを含むため、課題を生じさせる。
レイヤが少なくても、LLMは、特にテキスト分類タスクのプロンプトベースの微調整において、類似またはより良いパフォーマンスレベルを維持していることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:41:28 GMT)
Approximation Bounds for Transformer Networks with Application to Regression [9.5] H"older 関数と Sobolev 関数に対する Transformer ネットワークの近似機能について検討する。
シーケンス・ツー・シーケンス・マッピングを近似した標準トランスフォーマー・ネットワークのための新しい上限を確立する。
トランスフォーマーの自己アテンション層がカラム平均化を行うことができれば,ネットワークはシーケンス・ツー・シーケンスのH"older関数を近似することができることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:25:58 GMT)
MobilePoser: Real-Time Full-Body Pose Estimation and 3D Human Translation from IMUs in Mobile Consumer Devices [9.5] フルボディポーズとグローバル翻訳推定のためのリアルタイムシステムであるMobilePoserを紹介する。
MobilePoserは物理ベースのモーション推定を採用し、続いて深層ニューラルネットワークを用いてポーズ推定を行い、軽量のまま最先端の精度を達成している。
健康や健康、ゲーム、屋内ナビゲーションなど、さまざまな分野におけるMobilePoserのユニークな可能性を説明する一連のアプリケーションで締めくくります。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:19:47 GMT)
Quantum sensing with arbitrary frequency resolution via correlation measurements [9.3] 本稿では,量子センサを用いた高周波数スペクトル分解能を実現する新しいプロトコルを提案する。
本手法は,センサのダイナミックレンジをシステムのRabi周波数よりも高めに拡張する。
我々のアプローチは磁場の振幅に関してより頑健に機能する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:48:23 GMT)
A Multivocal Review of MLOps Practices, Challenges and Open Issues [9.2] MLOpsは、MLモデルを本番環境に導入する、多くの社会技術的課題に対処するための重要なソリューションとして登場した。
MLOpsの実用性にもかかわらず、MLOpsに関する統合された知識体系は、それが対処するML生産化の課題の多様性のために、依然として解明されている。
本稿では,150のピアレビューと48のグレー文学のコーパスを体系的に解析し,MLOpsの統一的な概念化を合成する多言語文献レビューを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:18:37 GMT)
Unsupervised Classification of English Words Based on Phonological Information: Discovery of Germanic and Latinate Clusters [9.2] 言語横断的に、母語と借用語は異なる音韻規則に従う。
英語の語彙におけるゲルマン語とラテン語の区別は、個々の単語の音韻情報から学べる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:20:08 GMT)
CatCMA with Margin: Stochastic Optimization for Continuous, Integer, and Categorical Variables [9.1] 本研究では,混合可変ブラックボックス最適化(MV-BBO)に焦点を当てる。
連続変数、整数変数、カテゴリー変数に対処する。
混合カテゴリブラックボックス最適化法であるMargin (CatCMAwM) を用いたCatCMAを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:08:10 GMT)
From job titles to jawlines: Using context voids to study generative AI systems [8.9] 生成AIシステムの振る舞いを研究するための投機的設計手法を提案する。
我々は,意図的文脈空白を生成するために,一見無関係な領域をブリッジすることを提案する。
この文脈では、AIシステムは偏りのある表現を生成する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:51:12 GMT)
H$^3$GNNs: Harmonizing Heterophily and Homophily in GNNs via Joint Structural Node Encoding and Self-Supervised Learning [8.8] グラフニューラルネットワーク(GNN)は、表現学習においてヘテロフィリとホモフィリのバランスをとるのに苦労する。
両構造特性を調和させるエンドツーエンドの自己教師型学習フレームワークであるH$3$GNNを提案する。
クロスアテンション機構は、ヘテロフィリーおよびホモフィリーに対する認識と適応性を高める。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:51:25 GMT)
"It's not approved, but many, like myself, ignore the rule": Investigating the Landscape and Consequences of Unsanctioned Technology Use in Educational Institutes [8.8] 重要なことにもかかわらず、教育者の立場からの採用やリスクを理解することは、ほとんど検討されていない。
本研究は,教育者による494個のユニークな応用,主に教育的有用性について検討した。
また、教育者の3分の1が、無許可の技術利用に関する制度的な方針に気づいていないこともわかりました。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 23:55:27 GMT)
Future Aware Safe Active Learning of Time Varying Systems using Gaussian Processes [8.7] 本稿では,時間変動システムに適した安全な能動学習フレームワークを提案する。
時間認識型平均二乗予測誤差(T-IMSPE)法は,現在および将来の状態に対する後方分散を最小化する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:24:39 GMT)
RAB$^2$-DEF: Dynamic and explainable defense against adversarial attacks in Federated Learning to fair poor clients [8.6] 異なるソースデータシナリオから派生した、データのプライバシに関する問題に対する解決策として、フェデレートラーニング(Federated Learning)が提案されている。
RAB$2$-DEF, a $textbfr$esilient $textbfa$gainst $textbfbtextyzantine$および $textbfb$ackdoor 攻撃を提案する。
画像データセットにおけるRAB$2$-DEFの性能と、最先端の防御を考慮したバイザンチンおよびバックドアアタックの性能を検証した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:54:52 GMT)
Instruction-augmented Multimodal Alignment for Image-Text and Element Matching [8.5] 本稿では、画像テキストと要素マッチング(iMatch)のためのインストラクション強化マルチモーダルアライメントと呼ばれる改善された評価手法を提案する。
iMatchは、微調整された多モーダルな言語モデルにより、画像テキストのセマンティックアライメントを評価する。
実験の結果,iMatch法は既存の手法をはるかに上回り,その有効性と実用性を確認した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:21:49 GMT)
Cross-Frequency Collaborative Training Network and Dataset for Semi-supervised First Molar Root Canal Segmentation [8.4] 根管治療は臨床的に非常に繊細で技術的に複雑である。
ディープラーニングはコンピュータ支援診断(CAD)の分野で大きな進歩を遂げている。
RC処理におけるその応用は、この分野での公開データセットの欠如が主な理由として、いまだに比較的稀である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:24:42 GMT)
Understanding the Effect of GCN Convolutions in Regression Tasks [8.3] グラフ畳み込みネットワーク(GCN)は、グラフ上の関数をモデル化する機械学習において重要な手法となっている。
グラフ構造が近隣ノードに類似した信号を示すことを示すネットワークを考える。
一般的な2つの畳み込み(元のGCNとGraphSAGEの畳み込み)が学習エラーにどのように影響するかを検討する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:55:46 GMT)
Proximal Inference on Population Intervention Indirect Effect [8.3] 人口介入間接効果 (PIIE) は、人口介入効果の間接成分を表す新しい媒介効果である。
本研究は、PIIE識別を、未測定の共同創業者が被曝・被曝・被曝・被曝・被曝・被曝・被曝関係に影響を及ぼすような設定に拡張する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:14:55 GMT)
On the Feasibility of Using MultiModal LLMs to Execute AR Social Engineering Attacks [8.3] マルチモーダル大規模言語モデルを用いたAR駆動型社会工学攻撃の組織化のためのフレームワークを提案する。
以上の結果から,SEARはリスクの高い行動を引き出すのに極めて有効であることが示唆された。
また, 「時折人工的な」 などの特徴的限界は, 正当性差の認識によるものである。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:18:36 GMT)
Variance-Aware Estimation of Kernel Mean Embedding [8.3] 再生カーネルヒルベルト空間における分散情報を利用して収束を高速化する方法を示す。
このような情報が未知の事前情報であっても、効率的にデータから推定できることが示される。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:23:46 GMT)
Adapting a World Model for Trajectory Following in a 3D Game [8.2] Inverse Dynamics Models with different encoder and policy heads to trajectory following a modern 3D video game -- Bleeding Edge。
基準とエージェントの軌道との間の軌道偏差距離と第1の有意偏差点の両方を測定し,最適構成が選択した設定に依存することを示す。
以上の結果から, 多様なデータ設定において, ゼロから訓練したエンコーダを用いた GPT 方式のポリシヘッドが最良であり, GPT 方式のポリシヘッドを用いた DINOv2 エンコーダが低データ方式で最良となること, GPT 方式と GPT 方式のポリシヘッドの両方が最良であることがわかった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:59:54 GMT)
WalletProbe: A Testing Framework for Browser-based Cryptocurrency Wallet Extensions [8.1] WalletProbeは、視覚レベルのオラクルに基づいた突然変異ベースのテスティングフレームワークである。
我々は、暗号通貨ウォレットを悪用し、21の具体的な攻撃戦略を公開するために、攻撃者が悪用できる13の攻撃ベクトルを特定した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:24:30 GMT)
UFGraphFR: An attempt at a federated recommendation system based on user text characteristics [8.0] 本稿では,クライアントの埋め込みテキスト機能に基づいてユーザグラフを構成する,グラフベースのフェデレーションレコメンデーションフレームワークを提案する。
UFGraphFRは、集中型および最先端のフェデレーションベースラインと比較して、ユーザのプライバシを保ちながら、競争精度を達成する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:34:25 GMT)
Earth-Adapter: Bridge the Geospatial Domain Gaps with Mixture of Frequency Adaptation [7.8] 本研究では,リモートセンシング(RS)シナリオに特化して設計された最初のPEFT方式であるEarth-Adapterを紹介する。
DFTを利用することで、Earth-Adapterは特徴を異なる周波数成分に分解し、アーティファクトを元の特徴から正確に分離することができる。
ベースラインのReinと比較して、Earth-AdapterはDAで9.0% mIoU、DGベンチマークで3.1% mIoUを大幅に改善している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:23:59 GMT)
Long-time soliton dynamics via a coarse-grained space-time method [7.7] 我々はミンコフスキー計量に基づく二重メッシュ構造を用いて粗粒化法を時空に拡張する。
我々は、ソリトンが固定された中心電荷によって閉じ込められる長寿命な境界状態、すなわち「シュウィンガー原子」を発見した。
また, 相対論的量子場理論の量子シミュレーションの可能性も示唆した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:51:51 GMT)
Diffusion Based Robust LiDAR Place Recognition [7.7] 建設現場の移動ロボットは、自律的な測量および検査ミッションを行うために正確なポーズ推定を必要とする。
本稿では,LiDARデータのみを用いた建物の正確な走査メッシュに対して,ロボットのグローバルな再配置に着目した。
私たちは、単一のLiDARポイントクラウドから複数の位置候補をモデル化できるPointNet++バックボーンで拡散モデルをトレーニングします。
得られたモデルは、知覚的エイリアシングの悪影響にもかかわらず、閉じ込められた、複雑な場所でのLiDARのグローバルな位置を予測できる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:23:17 GMT)
Unified World Models: Coupling Video and Action Diffusion for Pretraining on Large Robotic Datasets [7.7] 我々は、ビデオとアクションデータの両方を政策学習に活用できるフレームワークUnified World Models (UWM)を提案する。
各拡散時間ステップを単純に制御することで、UWMはポリシー、フォワードダイナミクス、逆ダイナミクス、ビデオジェネレータを柔軟に表現することができる。
以上の結果から,UWMは大規模で異種なデータセットをスケーラブルなロボット学習に活用する上で,有望なステップとなることが示唆された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 20:27:54 GMT)
Sequence-Level Leakage Risk of Training Data in Large Language Models [7.6] この研究は、シーケンスレベルの確率を用いて、大規模言語モデルからデータ漏洩を訓練するリスクを定量化する。
我々はデコード方式,モデルサイズ,プレフィックス長,部分シーケンスリーク,トークン位置の影響を再解析する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:30:56 GMT)
GrabS: Generative Embodied Agent for 3D Object Segmentation without Scene Supervision [7.5] 複雑な点雲における3次元物体のセグメンテーションの難しさについて,人間の3次元シーンのラベルを監督のために必要とせずに検討した。
事前訓練された2D特徴の類似性や3Dポイントをオブジェクトとしてグループ化する動きなどの外部信号に頼ることで、既存の教師なし手法は車のような単純な物体を識別することに限定される。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:13:53 GMT)
Steering Prosocial AI Agents: Computational Basis of LLM's Decision Making in Social Simulation [7.5] 大規模言語モデル(LLM)は、社会科学や応用環境における人間のような意思決定エージェントとしての役割を担っている。
本研究では,ディクタゲームにおけるLLMの内部表現の探索,定量化,修正を行う手法を提案する。
モデルの推論中にこれらのベクトルを操作することは、それらの変数がモデルの意思決定とどのように関係するかを大幅に変えることができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 00:02:28 GMT)
SpiritSight Agent: Advanced GUI Agent with One Look [7.5] 理想的なグラフィカルユーザインタフェース(GUI)エージェントは、高い精度、低レイテンシ、互換性を実現することが期待されている。
最近のビジョンベースアプローチは、高度なビジョン言語モデル(VLM)を活用することで、将来性を示している。
本稿では,GUIナビゲーションタスクに優れた視覚ベースのエンドツーエンドGUIエージェントであるtextbfSpiritSight$を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:34:51 GMT)
Asymptotic Optimism of Random-Design Linear and Kernel Regression Models [7.4] ランダムな設計の下で線形回帰モデルの閉形式最適化を導出した。
本研究では,線形回帰モデル,タンジェントカーネル(NTK)回帰モデル,三層完全連結ニューラルネットワークの基本的挙動について検討した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:14:07 GMT)
Support is All You Need for Certified VAE Training [7.4] 変分オートエンコーダ(VAE)はますます普及し、安全クリティカルなアプリケーションにデプロイされている。
本稿では,VAEの認定トレーニングのための新しい手法であるCIVETを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:41:40 GMT)
Exploring the Role of Knowledge Graph-Based RAG in Japanese Medical Question Answering with Small-Scale LLMs [7.2] 大規模言語モデル(LLM)は,医学的QAにおいて良好に機能するが,プライバシの制約により,日本語の文脈における有効性は制限される。
近年の取り組みは, オープンソース LLM に重点を置いているが, 検索強化世代 (RAG) と組み合わせる可能性はまだ未定である。
我々は,日本の医療用QA小規模オープンソースLLMのための知識グラフベースRAGフレームワークを初めて検討した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:42:26 GMT)
Broadening Participation through Physical Computing: Replicating Sensor-Based Programming Workshops for Rural Students in Sri Lanka [7.2] 本研究では,スリランカの農村の学生を対象に,センサを用いたプログラミングワークショップを実施している。
両グループの学生はワークショップ後のScratchでのプログラミングに対する自信が著しく高かったと報告した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:47:41 GMT)
Predicting Change, Not States: An Alternate Framework for Neural PDE Surrogates [7.1] ニューラルソルバが時間微分を予測し、ODE積分器が時間内に解を前進させる枠組みを評価する。
トレーニング対象を変更するだけで、推論中に数値積分を導入することで、ニューラルネットワークのサロゲートは精度と安定性を得ることができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:55:25 GMT)
Formal Verification of Graph Convolutional Networks with Uncertain Node Features and Uncertain Graph Structure [7.1] グラフニューラルネットワークは、機械学習の分野でますます人気が高まっている。
これらは、摂動が本質的に起こる安全クリティカルな環境に適用されている。
本研究は、基礎となる計算におけるすべての要素の依存関係を保存することによって、非通過ギャップに対処する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:23:25 GMT)
Leveraging Large Language Models for Multi-Class and Multi-Label Detection of Drug Use and Overdose Symptoms on Social Media [6.8] ソーシャルメディアは、自己報告された物質の使用と過剰摂取症状に対するリアルタイムな洞察を提供する。
本研究は、アノテーション付きソーシャルメディアデータに基づいてトレーニングされたAI駆動NLPフレームワークを用いて、一般的に使用される薬物および関連する過剰摂取症状を検出することを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:33:19 GMT)
Taxonomy and Analysis of Sensitive User Queries in Generative AI Search [6.7] 私たちは、全国規模の検索エンジンで生成AIモデルを開発、運用した経験を共有します。
本稿では、センシティブな検索クエリのための分類法を提案し、我々のアプローチの概要と、実際のユーザからのセンシティブなクエリに関する包括的な分析報告を示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:59:52 GMT)
A Unified Framework and Efficient Computation for Privacy Amplification via Shuffling [6.7] 本稿では,全分解分析を捉える統一的な視点-テキストジェネラル・クローン・パラダイム-を提示する。
このフレームワーク内での最適分解を同定し、厳密なプライバシー増幅境界を計算するために、FFT(Fast Fourier Transform)に基づく単純で効率的なアルゴリズムを設計する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:16:33 GMT)
Poem Meter Classification of Recited Arabic Poetry: Integrating High-Resource Systems for a Low-Resource Task [6.6] アラビア語の詩は、言語学から何十年にもわたって大きな注目を集めてきた。
詩のメーターを特定することは長く複雑なプロセスである。
我々は、暗唱されたアラビア詩の詩のメーターを特定するための最先端の枠組みを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:25:45 GMT)
WMNav: Integrating Vision-Language Models into World Models for Object Goal Navigation [6.5] WMNavは視覚言語モデル(VLM)を利用した新しい世界モデルベースのナビゲーションフレームワークである。
決定の結果を予測し、ポリシーモジュールへのフィードバックを提供するためにメモリを構築する。
人間のような思考プロセスに従って分解することにより、WMNavはモデル幻覚の影響を効果的に緩和する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:23:05 GMT)
Refining the Understanding of Operator Size Dynamics in Open Quantum Systems [6.2] 情報スクランブル(英: information scrambling)とは、多体系における局所的な量子情報が一元的進化の下でシステム全体に分散する現象である。
作用素サイズ分布の2つの異なる定義は、作用素サイズダイナミクスの研究をオープン量子システムに拡張する際に現れる。
我々は、開量子系における演算子サイズダイナミクスの統一図を作成するために、一般システムサイズにおける可解ブラウンSYKモデルを用いている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:10:15 GMT)
A Semi-Self-Supervised Approach for Dense-Pattern Video Object Segmentation [6.1] 本稿では,多タスク学習による拡散法を用いて,高密度VOS(DVOS)に対する半自己教師型アプローチを提案する。
本手法は, ブースステージから小麦熟成, ハーベスト熟成まで多種多様なビデオから, 小麦頭部分画のDVOS法を評価した。
本手法はコムギの頭部区分けで評価されるが,群集分析や微視的画像解析など他の作物や領域にも適用可能である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:37:56 GMT)
RSTeller: Scaling Up Visual Language Modeling in Remote Sensing with Rich Linguistic Semantics from Openly Available Data and Large Language Models [6.0] 我々は,Google Earth Engine (GEE) プラットフォームから取得した画像に対して,平易な OpenStreetMap (OSM) データから,意味的に豊富なキャプションを持つマルチモーダルデータセットを大規模に生成するワークフローを提案する。
本稿では,13万以上のRS画像からなるマルチモーダルデータセットであるRSTellerについて述べる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:02:25 GMT)
Emergence of Computational Structure in a Neural Network Physics Simulator [5.9] 粒子系の物理をシミュレートするために訓練された変圧器様モデルにおける計算構造の出現について検討する。
a) 粒子衝突の検出を学習する変圧器の注目ヘッドに構造が出現し, (b) 粒子衝突の出現は損失地形の退化に関連し, (c) この現象のダイナミクスは力則に従うことを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:38:51 GMT)
Cost-Efficient LLM Serving in the Cloud: VM Selection with KV Cache Offloading [5.5] 本稿では,クラウドベースのLLM推論のための費用効率の高いVM選択フレームワークであるInferSaveを提案する。
InferSaveはService Level Objectives(SLO)とWorkload charac teristicsに基づいてKVキャッシュのオフロードを最適化する。
AWSの実験によると、KVキャッシュのオフロードなしで低コストのインスタンスを選択することで、オンラインワークロードのコスト効率が最大73.7%向上する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:02:38 GMT)
The Dual Personas of Social Media Bots [5.5] ソーシャルメディアボットは、オンライン会話に参加するAIエージェントである。
ほとんどの研究は、一般的なボットとこれらのエージェントの悪意的な性質に焦点を当てている。
しかし、ボットは多くの異なるペルソナを持ち、それぞれが特定の行動特性やコンテンツ特性に特化している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:30:41 GMT)
Gauging Overprecision in LLMs: An Empirical Study [5.4] この研究は、テクストオーバー精度と呼ばれる認知科学における過信の異なる側面から着想を得ている。
生成段階では、一定の信頼度を持つ間隔で数値的な質問に対する回答を生成するようにLCMに促す。
精錬段階では、前フェーズからの回答を精錬してより良い回答を生成する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:02:21 GMT)
Resilience of Rademacher chaos of low degree [5.3] ラデマッハカオスのレジリエンスは、カオスが持続できる敵のサインフリップの最大数である。
我々はRadecherカオスの弾力性に関する確率的低バウンド保証を提供する。
次数2のラデマッハカオスと次数2のラデマッハカオスは,同じ概念的枠組みで確立されているが,大きな違いがある。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:25:06 GMT)
ADAPT: An Autonomous Forklift for Construction Site Operation [5.3] ADAPT(Autonomous Dynamic All-terrain Pallet Transporter)は、建設環境向けに設計された完全自動オフロードフォークリフトである。
我々のシステムは、AI駆動の知覚技術と、意思決定、計画、制御のための伝統的なアプローチを統合する。
実世界の広範囲なテストを通じてシステムの検証を行い、その連続的な性能を経験豊富な人間のオペレータと比較する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:22:12 GMT)
How Inclusively do LMs Perceive Social and Moral Norms? [5.3] 言語モデル(LM)は意思決定システムや対話型アシスタントとして使用される。
人口集団間でLMがノルムを包括的に知覚する方法について検討する。
LM応答に顕著な相違がみられ, 若年層群, 高所得層群が近縁であった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:32:55 GMT)
Level-anticrossing in B(E2) anomaly (I) [5.3] Pan emphet al. (PRC, 110, 054324, 2024)によりB(E2)異常を説明する新しいメカニズムが与えられた
新しいメカニズムは、SU(3)対称性の極限におけるレベル交差現象に関連するレベル交差現象と関連している。
B(E2) Anomaly in $170$Os この一般的なフレームワーク内でも議論されている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:15:58 GMT)
Clarifying Ambiguities: on the Role of Ambiguity Types in Prompting Methods for Clarification Generation [5.3] 我々は、明確化のためのあいまいさの概念に注目し、明確化プロセスにおいてあいまいさをモデル化し統合することを模索する。
我々はこの新しいプロンプトスキームをAmbiguity Type-Chain of Thought (AT-CoT)と名付けた。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:21:02 GMT)
Unveiling Hidden Collaboration within Mixture-of-Experts in Large Language Models [5.2] 本稿では,専門家間の協調パターンを明らかにする階層型スパース辞書学習法を提案する。
また、コントリビューション・アウェア・エキスパート・プルーニング(CAEP)アルゴリズムを導入し、低コントリビューション・エキスパートを効果的に育成する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:06:15 GMT)
Control of Rayleigh-Bénard Convection: Effectiveness of Reinforcement Learning in the Turbulent Regime [5.1] 乱流下での対流熱伝達低減のための強化学習(RL)の有効性について検討した。
単エージェントプロキシポリシー最適化(PPO)によって訓練されたRLエージェントは、線形比例微分(PD)コントローラと比較される。
RL剤は、ヌッセルト数によって測定された対流を、適度な乱流系では最大33%減らし、高乱流環境では10%減らした。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:51:59 GMT)
DTFSal: Audio-Visual Dynamic Token Fusion for Video Saliency Prediction [5.1] 映像中の有声領域を識別することで人間の視覚的注意を模倣することを目的としている。
本稿では,精度と計算効率の両立を図った新しいオーディオ・ビジュアル・サリエンシ予測フレームワークであるDFTSalを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:02:02 GMT)
Bridging the Gap: A Comparative Study of Academic and Developer Approaches to Smart Contract Vulnerabilities [5.1] スマートコントラクトのセキュリティ脆弱性を修正するために,Solidity開発者が採用した戦略について検討する。
非整合性コミットから文献ではこれまで議論されていなかった27の新たな定着戦略を特定した。
これらの新興パターンは、未調査領域におけるスマートコントラクトを確保するための実行可能なソリューションを提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 19:20:00 GMT)
Shared Disk KV Cache Management for Efficient Multi-Instance Inference in RAG-Powered LLMs [5.0] 最近の大規模言語モデル(LLM)は、入力コンテキストの長さとモデルサイズが大きくなるにつれて、推論遅延が増加する。
本稿では,ディスクベースのキー値(KV)キャッシュを利用して,プリフィル時の計算負担を軽減することによるTTFT削減手法を提案する。
また、マルチインスタンスLLM RAGサービス環境のためのディスクベースの共有KVキャッシュ管理システムであるShared RAG-DCacheを導入する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:59:18 GMT)
HLS-Eval: A Benchmark and Framework for Evaluating LLMs on High-Level Synthesis Design Tasks [4.7] HLS-Evalは、HLS駆動設計のための最初の完全なベンチマークおよび評価フレームワークである。
ベンチマークには、標準のHLSベンチマークと新しいソースから描かれた94のユニークな設計が含まれている。
ベンチマーク以外にも、HLS-Evalは、ローカルおよびホストされたLLMの自動化、並列評価のためのモジュール型のPythonフレームワークを提供している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:30:36 GMT)
Cavity-Vacuum-Induced Chiral Spin Liquids in Kagome Lattices: Tuning and Probing Topological Quantum Phases via Cavity Quantum Electrodynamics [4.7] フラストレーション量子磁気システムのトポロジカルフェーズは、何十年もの間研究者を魅了してきた。
キラルスピン液体(CSL)は最も説得力のある例の一つである。
単一モードのカイラルキャビティ内における真空量子ゆらぎにより,カゴメ格子内にCSLが出現することを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:03:11 GMT)
SoK: Decentralized AI (DeAI) [4.7] ブロックチェーンベースのDeAIソリューションのためのSoK(Systematization of Knowledge)を提案する。
この分類に基づいて、我々はDeAIプロトコルの展望を明らかにするための構造化された方法を提供する。
我々は、ブロックチェーン機能がAIプロセスのセキュリティ、透明性、信頼性の向上にどのように貢献するかを調査する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:51:11 GMT)
Intelligent road crack detection and analysis based on improved YOLOv8 [4.6] 本稿では,改良型YOLOv8深層学習フレームワークに基づく,インテリジェントな道路亀裂検出・解析システムを提案する。
道路のひび割れ領域を効率よく正確に認識できる4029画像の訓練により,目標セグメンテーションモデルを開発した。
モデルはまた、分割された領域を分析して、クラックの最大および最小の幅とその正確な位置を正確に計算する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:50:28 GMT)
VeriMind: Agentic LLM for Automated Verilog Generation with a Novel Evaluation Metric [4.6] We propose VeriMind, a agentic LLM framework for Verilog code generation。
本稿では,従来のpass@k測度とARC(Average Refinement Cycles)を組み合わせた新しい評価手法を提案する。
様々なハードウェア設計タスクの実験結果によると、我々のアプローチはpass@kメトリックで最大8.3%、pass@ARCメトリックで最大8.1%向上した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:58:48 GMT)
VoteFlow: Enforcing Local Rigidity in Self-Supervised Scene Flow [4.5] シーンフロー推定は、2つの隣接するLiDARスキャンから点当たりの動きを復元することを目的としている。
自律運転のような現実世界のアプリケーションでは、ポイントが他と独立して動くことは滅多にない。
ニューラルネットワーク設計に軽量なアドオンモジュールを導入し、エンドツーエンドの学習を可能にした。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:36:24 GMT)
RDI: An adversarial robustness evaluation metric for deep neural networks based on sample clustering features [4.4] ディープニューラルネットワーク(DNN)は、敵のサンプルに対して非常に感受性が高い。
本稿では,新しい対向ロバスト性評価指標であるロバスト性差指数(RDI)を提案する。
実験により、RDIはアタック成功率(ASR)の金標準対向ロバストネス指標とより強い相関を示すことが示された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:05:37 GMT)
Factor-MCLS: Multi-agent learning system with reward factor matrix and multi-critic framework for dynamic portfolio optimization [4.4] 各ポートフォリオ資産に対するリスク回避のレベルが異なることから、投資家がトレーニングに介入することは困難である。
既存の強化学習(DRL)エージェントは、ポートフォリオのリターンとリスクに対する要因の理解を深めることができない。
本稿では,各ポートフォリオの資産を解明するための報酬係数行列を提案する。
このように、DRLに基づく学習システムは、ポートフォリオのリターンとリスクに影響を与える要因を効果的に学習することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:51:09 GMT)
Higher-Order Binding of Language Model Virtual Personas: a Study on Approximating Political Partisan Misperceptions [4.2] 大規模言語モデル(LLM)は、人間の振る舞いをシミュレートする能力が高まっている。
本稿では, マルチターンインタビュー文として, 合成ユーザバックストリーを用いた仮想ペルソナ構築手法を提案する。
我々の生成したバックストリーは、より長く、細部が豊富であり、従来の方法と比較して、特定の個人を記述するのに一貫性がある。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 00:10:34 GMT)
Fine-Grained Rib Fracture Diagnosis with Hyperbolic Embeddings: A Detailed Annotation Framework and Multi-Label Classification Model [4.2] 骨折分類に適した新しいリブ骨折アノテーションプロトコルを提案する。
放射線画像と臨床像を橋渡しするクロスモーダル埋め込みを利用して骨折分類を強化した。
本手法では, フラクチャーの階層的性質を捉え, 視覚的特徴やテクスチャ記述を共有非ユークリッド多様体にマッピングするために, 双曲的埋め込みを用いる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:29:02 GMT)
Probing the Unknown: Exploring Student Interactions with Probeable Problems at Scale in Introductory Programming [4.1] 本研究では、意図的な曖昧さや不完全な仕様を持つ自動段階的タスクであるProbeable Problems'の使用について検討する。
このような問題に対して、学生はテストのインプットを提出するか、あるいは「調査」し、実施前の要件を明らかにする必要がある。
コーディング前に期待される振る舞いを徹底的に探求するなど、体系的な戦略は、間違ったコードへの提出を減らし、コースの成功と相関する結果となった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:50:00 GMT)
Discrete Distribution Networks [4.1] 本稿では,階層的な離散分布を用いてデータ分布を近似する新しい生成モデルであるDcrete Distribution Networks (DDN)を導入する。
CIFAR-10 および FFHQ における実験により,DDN の有効性とその興味深い性質を実証した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:46:04 GMT)
Independence Is Not an Issue in Neurosymbolic AI [4.0] ニューロシンボリックAIに対する一般的なアプローチは、ニューラルネットワークの最後のレイヤの出力をスパース計算グラフに渡すことである。
これは、互いに条件的に独立なランダム変数の集合上の確率分布を誘導する。
決定論的偏見の現象は,ニューロシンボリックAIを不適切に適用した成果であることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:29:19 GMT)
Non-uniform Point Cloud Upsampling via Local Manifold Distribution [3.9] 本稿では, 多様体分布の観点から制約を課すことにより, 雲のアップサンプリングを指示する新しい手法を提案する。
本研究では,スパースおよび非一様入力を処理する際に,より高品質で均一に分布する高密度点雲を生成することを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:54:33 GMT)
Analysis of Pseudo-Labeling for Online Source-Free Universal Domain Adaptation [3.1] トレーニングデータとテストデータのシフトは、ディープニューラルネットワークの実際のパフォーマンスを妨げることが多い。
オンラインソースフリーユニバーサルドメイン適応(SF-UniDA)はこの課題に対処する。
既存の手法は主に擬似ラベルによる自己学習に依存しているが、擬似ラベルと適応結果の関係は研究されていない。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:34:18 GMT)
On the generalized Friedrichs-Lee model with multiple discrete and continuous states [3.1] 複数の離散状態および連続状態を持つ非相対論的フリードリヒス=リーモデルの改良を提案する。
本研究は,様々なチャネルにまたがる複数の干渉状態を含むシナリオにおいて,共振現象の探索のための確かな理論的基礎を確立した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 00:35:49 GMT)
Accelerating Multiscale Modeling with Hybrid Solvers: Coupling FEM and Neural Operators with Domain Decomposition [3.1] 本研究は、物理インフォームドDeepONetとFEMをドメイン分解を通じて統合する新しいハイブリッドフレームワークを紹介する。
提案するハイブリッドソルバは,サブドメインインターフェース間の解の連続性を維持し,メッシュの細かな要求を排除して計算コストを低減し,時間依存シミュレーションにおけるエラーの蓄積を軽減する。
この研究は、数値的手法とAI駆動のサロゲートのギャップを埋め、工学と科学の応用における高忠実性シミュレーションのためのスケーラブルな経路を提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:26:48 GMT)
Accelerating MCMC with Quantum Walks: Design, Implementation, and Results [3.0] 本稿では、離散量子ウォーク(DQW)アルゴリズムに基づく新しいMCMCアルゴリズムの設計と実装について述べる。
量子重ね合わせを利用してターゲット分布の構造を効果的に捉えることを実証する。
さらに,コンバージェンス速度を大幅に向上する回路拡張を導入し,アルゴリズムのスケーラビリティを向上する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:53:32 GMT)
On the Problem of Best Arm Retention [3.0] BAR(Best Arm Retention)の問題について検討し、最近マルチアームバンディットのストリーミングアルゴリズムに応用されている。
まず,異なる基準下でのBAR問題の純粋探索と,特定の制約による後悔の最小化について検討する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:41:20 GMT)
Geographical Context Matters: Bridging Fine and Coarse Spatial Information to Enhance Continental Land Cover Mapping [2.9] BRIDGE-LCは,土地被覆分類プロセスに大規模地理空間情報を統合する,新しい深層学習フレームワークである。
その結果,地理空間情報の統合により土地被覆マッピング性能が向上することが示唆された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:42:46 GMT)
A Comprehensive Study of Machine Learning Techniques for Log-Based Anomaly Detection [2.8] システム複雑性の増大により、ログベースの異常検出(LAD)のような自動ログ解析技術の必要性が高まっている。
現在の評価は主に検出精度に重点を置いているが、与えられたLADタスクに対するテクニックの適合性を決定するには不十分である。
本稿では,4つの基準にまたがる多種多様な教師付き,半教師付き,伝統的,深層ML手法を総合的な実証研究により評価した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 20:57:44 GMT)
Benchmarking Mutual Information-based Loss Functions in Federated Learning [2.8] フェデレートラーニング(FL)は、プライバシー規制の増大により、かなりの関心を集めている。
本稿では、これらの問題に対処するための相互情報に基づく損失関数の使用について検討する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:58:44 GMT)
Generalization in medical AI: a perspective on developing scalable models [2.7] 医療用AIモデルの配布外一般化性能を特徴付ける3段階尺度が導入された。
このスケールは、現実世界の医療シナリオの多様性と、対象のドメインデータとラベルがモデル再分類に利用できるかどうかに対処する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:07:16 GMT)
Mapping Controversies Using Artificial Intelligence: An Analysis of the Hamas-Israel Conflict on YouTube [2.5] この記事では、2023年10月から2024年1月までに投稿されたスペインとYouTubeのコメント253,925件を通して、ハマスとイスラエルの論争を分析します。
この研究は、学際的なアプローチを採用し、科学技術研究の論争の分析と高度な計算手法を組み合わせたものである。
結果は、親パレスチナ派コメントの優位性を示しているが、親イスラエル派コメントと反パレスチナ派コメントはより「いいね!
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:27:57 GMT)
Forest Proximities for Time Series [2.5] PF-GAPは、RF-GAPの近縁林への拡張である。
森林の近縁性は, 近隣の分類器に比べて, 誤分類点と外れ値との間には強い関係があることが示唆された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:28:59 GMT)
Mitigating LLM Hallucinations with Knowledge Graphs: A Case Study [2.4] LinkQは、LLMに質問応答(QA)中の地文データに対する知識グラフをクエリさせ、幻覚と戦うために開発されたオープンソースの自然言語インタフェースである。
我々は、よく知られたKGQAデータセットを用いてLinkQの定量的評価を行い、システムがGPT-4より優れているが、まだ特定の質問カテゴリに苦慮していることを示す。
実際のサイバーセキュリティKGを使用して、2つのドメインの専門家とLinkQの質的研究を議論し、これらの専門家のフィードバック、提案、認識された制限、LinkQのようなシステムの将来的な機会について概説する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:40:01 GMT)
Modality-Independent Explainable Detection of Inaccurate Organ Segmentations Using Denoising Autoencoders [2.3] 放射線治療計画において、臓器の不正確な分節は、最適な治療のデリバリーをもたらす可能性がある。
我々は,不正確な臓器セグメントを検出するために,自己エンコーダをベースとしたデノイング法を開発した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:53:40 GMT)
A Survey on Archetypal Analysis [2.3] Archetypal analysis (AA) は1994年にアデル・カトラーとレオ・カトラーによって提唱された。
AAは、抽出と次元縮小のための構造、解釈可能、説明可能な表現を提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:01:05 GMT)
Care for the Mind Amid Chronic Diseases: An Interpretable AI Approach Using IoT [2.3] 既存の健康センシング研究は、主に身体性慢性疾患の予測に焦点を当てている。
しかし、慢性疾患の広範な合併症であるうつ病が検討されている。
我々は解釈可能な深層学習モデルを開発する:時間的プロトタイプネットワーク(TempPNet)
患者、医師、介護者は、我々のモデルをモバイルデバイスにデプロイし、患者のうつ病リスクをリアルタイムで監視することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:54:53 GMT)
Chemical Language Model Linker: blending text and molecules with modular adapters [2.3] 我々は、ChemLML(ChemLML)という、軽量なアダプタベースの戦略を提案する。
ChemLMLは2つの単一ドメインモデルをブレンドし、テキスト記述から条件付き分子生成を得る。
SMILESとSELFIESのChemLMLにおける分子表現の選択は,条件付き分子生成性能に強い影響を及ぼすことがわかった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:19:29 GMT)
Dependency Dilemmas: A Comparative Study of Independent and Dependent Artifacts in Maven Central Ecosystem [2.0] Maven Centralエコシステムは、採用、セキュリティ、エコシステムの役割において大きく異なるJavaアーティファクトをホストしている。
本研究では,658,078個のアーティファクトを解析し,そのうち635,003は少なくとも1つのリリースを持っていた。
このうち93,101個の人工物(15.4%)は独立(in-degree = 0)とされ、残りは依存物として分類された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:15:58 GMT)
Causality-enhanced Decision-Making for Autonomous Mobile Robots in Dynamic Environments [2.0] 本稿では,電池使用量や人体障害を予測するための因果判定フレームワークを提案する。
また,文脈に敏感な人間とロボットの空間的相互作用をモデル化するために,ガゼボをベースとした新しいシミュレータを開発した。
我々の研究は、自律ロボットが人間と共有する動的環境において、因果推論によってより効率的かつ安全に操作できることを強調した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:26:04 GMT)
A Real-time Anomaly Detection Method for Robots based on a Flexible and Sparse Latent Space [2.0] ロボット工学におけるディープラーニングベースのモデルは、限られたトレーニングデータと非常にノイズの多い信号機能のために、課題に直面している。
本稿では,これらの問題に対処するために,スパースマスク型自己回帰型フローベース適応型オートエンコーダモデルを提案する。
我々のモデルは1ミリ秒以内の推論を行い、リアルタイムな異常検出を確実にする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:50:55 GMT)
AI and the Transformation of Accountability and Discretion in Urban Governance [1.9] この研究は洞察を合成し、意思決定プロセスにおける責任あるAI統合のための指針原則を提案する。
分析によると、AIは単に判断を制限したり、強化したりするのではなく、制度レベルで再配布する。
同時に管理の監督を強化し、意思決定の整合性を高め、運用効率を向上させることができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:16:21 GMT)
Topological Analysis of Mixer Activities in the Bitcoin Network [1.9] 本稿では,ミキサーの操作をアドレス-応答グラフを用いて解析する手法を提案する。
ミキサーのmodus operandiを定義できる共通パターンを識別する。
このアプローチは、Bitcoinブロックチェーン内のBlender.ioミキサーアクティビティを識別するために適用される。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:58:59 GMT)
Unique ID based Trust Scheme for Improved IoV Wireless Sensor Network Security Against Power Controlled Sybil Attacks [1.9] 無線センサネットワーク(WSN)は、車両間通信(V2X)をサポートするために車両ネットワークで広く利用されている。
WSNは、分散した性質とリソース制限のあるモジュールのため、セキュリティ上の課題に直面します。
本稿では,Sybil攻撃を回避するために,ユニークな識別に基づく信頼経路ルーティング方式(UITrust)を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:24:07 GMT)
Ryu-Takayanagi Formula for Multi-Boundary Black Holes from 2D Large-\textbf{$c$} CFT Ensemble [1.9] 本稿では,AdS$_3$/CFT$$における複数の絡み合ったCFTを含む量子状態のクラスについて検討する。
遠絡エントロピーのRyu-Takayanagi(RT)式は境界CFTデータのみを用いて導出可能であることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:00:06 GMT)
"Good" and "Bad" Failures in Industrial CI/CD -- Balancing Cost and Quality Assurance [1.9] 継続的インテグレーションと継続的デプロイメント(CI/CD)パイプラインは、ソフトウェア開発を自動化して、エンジニアリングソフトウェアをスピードアップし、効率を高める。
コードマージと製品リリースは、プロセスの最適化とリスク管理において、より効果的なマイルストーンとして役立ちます。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:56:36 GMT)
Agentic AI Optimisation (AAIO): what it is, how it works, why it matters, and how to deal with it [1.8] 本稿では、WebサイトとエージェントAIシステムとの効果的な統合を保証するための重要な方法論として、エージェントAI最適化(AAIO)を紹介します。
ウェブサイトの最適化とエージェントAIの成功の相互依存関係を調べることで、AIOが生み出す悪循環を浮き彫りにする。
この記事は、自律型デジタルエージェントの時代における基本的なデジタル基盤の一部としてのAIOの本質的な役割を肯定し、その利益への公平かつ包括的アクセスを提唱することで締めくくっている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 20:38:09 GMT)
Quantum simulations of nuclear resonances with variational methods [1.7] この研究は、非エルミート・ハミルトニアンと互換性のある変分フレームワークを開発することで、量子アルゴリズムを用いて核共鳴をシミュレートすることを目的としている。
複雑なスケーリング手法を用いて、古典的な共鳴位置を抽出し、2段階のアルゴリズムを用いて量子シミュレーションに適応する。
その結果、核系の共鳴現象をシミュレートするためのスケーラブルで効率的な量子フレームワークが確立された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:01:56 GMT)
ChaosEater: Fully Automating Chaos Engineering with Large Language Models [1.7] Chaos Engineering(CE)は、分散システムのレジリエンスを改善するための技術である。
手動操作のコストを削減するため,CE操作全体を自動化したChaosEaterを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:33:29 GMT)
Don't Just Translate, Agitate: Using Large Language Models as Devil's Advocates for AI Explanations [1.7] 大型言語モデル(LLM)は、特徴量などの説明可能性のテクニックから、自然言語の説明への変換に使用される。
最近の知見は、人間のような説明に翻訳することは、必ずしもユーザーの理解を高めるものではなく、代わりにAIシステムへの過度な信頼につながる可能性があることを示唆している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:45:18 GMT)
Exceptional deficiency of non-Hermitian systems: high-dimensional coalescence and dynamics [1.7] 異常欠損(ED)の概念への一般化の発見を報告する。
EDの特性は片方向結合したエルミート格子と非エルミート格子を用いて研究される。
EDの条件はまた、非エルミート系における局所化と伝播のかつてない制御のためにも検討されている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:43:42 GMT)
Direct Gradient Computation for Barren Plateaus in Parameterized Quantum Circuits [1.7] ヴァレンプラトー現象は パラメタライズド量子回路が 消滅する場所です
ウィンガルテン式を用いて,バレン高原現象の解明を試みた。
我々の手法は、量子回路最適化を解析するためのより正確なフレームワークを提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:42:49 GMT)
Voice Conversion with Diverse Intonation using Conditional Variational Auto-Encoder [1.6] 条件変分オートエンコーダ(CVAE)を用いた多様なインネーションを用いた音声変換手法を提案する。
我々は、逆自己回帰流(IAF)により潜伏空間の後方を複雑にすることで、より多様なイントネーションで音声を変換することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:59:56 GMT)
Emergence of meta-stable clustering in mean-field transformer models [1.6] 我々は、トランスフォーマー層の深いスタック内のトークンの進化を、単位球上の連続時間フローとしてモデル化する。
我々は,メタ安定相の出現と持続性,クラスタリング現象,次世代予測などのアプリケーションにおける重要な要素に注目した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:07:50 GMT)
Efficient identification of linear, parameter-varying, and nonlinear systems with noise models [1.6] 本稿では、状態空間の力学モデルの幅広いスペクトルを推定できる一般的なシステム同定手法を提案する。
この一般的なモデル構造に対して、モデル力学は決定論的過程とノイズ部分に分離できることを示す。
人工ニューラルネットワーク(ANN)を用いた非線形機能関係のパラメータ化
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:23:30 GMT)
Noise-based Local Learning using Stochastic Magnetic Tunnel Junctions [1.6] 多層ニューラルネットワークを実装した物理システムに対して,新しい雑音に基づく学習手法を提案する。
スピントロニクスのハードウェア実装を用いて、物理磁気トンネル接合からなる小さなネットワークにおいて学習が達成できることを実験的に実証した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:16:31 GMT)
From Data Behavior to Code Analysis: A Multimodal Study on Security and Privacy Challenges in Blockchain-Based DApp [1.6] 最近のブロックチェーンベースの分散アプリケーション(DApp)の普及は、分散システムにおけるトランスフォーメーションの進歩を触媒している。
本研究は,経験的DAppデータセットから得られた行動パターンの系統的解析から開始する。
次に、Solidityを通じて開発された脆弱性ベースのスマートコントラクトにおける主要なセキュリティ脆弱性を批判的に検証する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:30:43 GMT)
I Know What You Bought Last Summer: Investigating User Data Leakage in E-Commerce Platforms [1.5] 電子商取引プラットフォーム上で共有される個人情報のプライバシーとセキュリティに関する懸念が高まっている。
人気の高いE-Shopsの選び方を調べたところ、30%近くが個人情報を第三者に開示することでユーザーのプライバシーを侵害していることが判明した。
Facebookのようなプラットフォームでは、個人情報を使ってユーザープロフィールを作成し、それらをソーシャルメディアアカウントにリンクする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:52:04 GMT)
DelGrad: Exact event-based gradients for training delays and weights on spiking neuromorphic hardware [1.5] スパイキングニューラルネットワーク(SNN)は本質的には情報表現と処理のための信号のタイミングに依存している。
我々は,シナプス重みと遅延の両方について,正確な損失勾配を計算するイベントベース手法であるDelGradを提案する。
ノイズの多い混合信号ハードウェア上でSNNに遅延を追加する際のメモリ効率と精度の利点を実験的に示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:42:10 GMT)
Resonances in reflective Hamiltonian Monte Carlo [1.5] 反射ハミルトニアン・モンテカルロは不正確な反射を持つが、高次元では遅い混合を示す。
本研究は, 流体様挙動と離散化支配行動の集団的移動遷移を示す。
動力学の低次元玩具モデルを構築し、高次元問題の支配的特徴を再現する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:00:00 GMT)
Emergence of the Primacy Effect in Structured State-Space Models [1.5] 人工ニューラルネットワーク(ANN)モデルは通常、時間とともに単調に崩壊するメモリで設計される。
構造化状態空間モデル(Structured state-space model)と呼ばれる最近開発されたANNアーキテクチャは、トレーニングと評価の際、予備効果を示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:53:21 GMT)
Deep Anatomical Federated Network (Dafne): An open client-server framework for the continuous, collaborative improvement of deep learning-based medical image segmentation [1.4] Dafneは、放射線画像のセマンティックセグメンテーションのためのクライアントサーバアーキテクチャを備えたフリーソフトウェアである。
Dafneは、下肢の38MRIデータセット上で、モデル世代間でのパフォーマンス向上を評価することにより、局所的に評価された。
Dafne氏は時間とともにセグメンテーションの品質を改善し、学習と一般化の可能性を示した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:17:51 GMT)
Understanding the Performance Horizon of the Latest ML Workloads with NonGEMM Workloads [1.4] 我々はHugging FaceとTorchvisionで広く採用されている17のMLモデルのパフォーマンス解析を行った。
非GEMMパフォーマンスボトルネックは平均して11.3%から73.6%である。
我々は、モデルとデプロイメントソフトウェアごとに、GEMM以外の最も支配的な演算子をデミストする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:47:53 GMT)
Scalability Optimization in Cloud-Based AI Inference Services: Strategies for Real-Time Load Balancing and Automated Scaling [1.4] 本研究では,クラウドAI推論サービスのための拡張性最適化フレームワークを提案する。
提案モデルは,適応負荷分布に対する強化学習と,正確な需要予測のためのディープニューラルネットワークを組み合わせたハイブリッドアプローチである。
実験の結果,提案モデルでは負荷分散効率を35倍に向上し,応答遅延を28。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:00:04 GMT)
Constructing Decision Trees from Data Streams [1.4] 決定木学習のための最適分割計算アルゴリズムを提案する。
目的は、データを2つのセットに分割する最適な分割(j)を特定することである。
サブ線形空間を必要とし,少数のパスを使用する効率的なストリーミングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:09:26 GMT)
Agile Retrospectives: What went well? What didn't go well? What should we do? [1.4] アジャイル/スクラムソフトウェア開発では、レトロスペクティブミーティング(レトロスペクティブ)という考え方がプロジェクトプロセスの中核的な要素の1つです。
振り返りミーティングにおける情報インタラクションにおける生成AIの可能性分析と,レトロ情報のソフトウェア開発チームへの可視化である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:33:35 GMT)
When Should I Run My Application Benchmark?: Studying Cloud Performance Variability for the Case of Stream Processing Applications [1.3] 本稿では,クラウド性能の変動がベンチマーク結果に与える影響を実証的に定量化する。
約591時間の試験、AWS上の789クラスタのデプロイ、2366ベンチマークの実行などにより、この種の調査としては最大のものと思われる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:22:44 GMT)
From Cyber Threat to Data Shield: Constructing Provably Secure File Erasure with Repurposed Ransomware Cryptography [1.3] 本稿では,セキュアかつ効率的な暗号化ベースの消去システムであるSEER(Secure and Efficient Encryption-based Erasure via Ransomware)について述べる。
提案システムは, 理論的基礎と実用的検証の両面を通じて, 信頼性の高いデータを安全に破壊するための, 効率的かつレジリエントなソリューションを提供することによって, 証明可能なセキュリティを確保する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:47:17 GMT)
Efficient Contrastive Decoding with Probabilistic Hallucination Detection - Mitigating Hallucinations in Large Vision Language Models - [1.2] 効率的なコントラストデコーディング(ECD)は、確率的幻覚検出を利用して、推定時に出力分布を文脈的に正確な解へとシフトする単純な方法である。
実験の結果,LCDは幻覚を効果的に軽減し,LVLMベンチマークの性能や計算時間に対して最先端の手法より優れることがわかった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:50:25 GMT)
Detectors for local discrimination of sets of generalized Bell states [1.2] 量子情報処理の根本的な問題は、局所演算および古典通信(LOCC)の下での量子状態の集合の識別である。
本研究では、与えられた一般化ベル状態(GBS)集合に対する全ての検出器を決定する方法を示す。
量子系$mathbbC6otimesmathbbC6$の4-GBS集合の場合、検出器は一方通行のLOCC識別にほぼ必要である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:55:53 GMT)
Non-orientable Exceptional Points in Twisted Boundary Systems [1.2] 非配向閉ループに沿った例外点の断熱輸送について検討する。
グローバルな配向の欠如によるトポロジカルな応答を明らかにする。
組込み散乱器を用いたマイクロディスクキャビティでこれらのアイデアを数値的に実装する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:26:05 GMT)
Large Language Models for Drug Overdose Prediction from Longitudinal Medical Records [1.1] 大規模言語モデル(LLM)は予測性能を向上させる機会を提供する。
本研究では,オープンAIのGPT-4o LLMによる薬物過剰事象の予測の有効性について検討した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:52:22 GMT)
An Attentive Graph Agent for Topology-Adaptive Cyber Defence [1.1] 我々は,ネットワーク状態を有向グラフとして符号化するCyber Operations Research Gym(CybORG)環境のカスタムバージョンを開発する。
我々は、ノード、エッジ、グローバル機能を処理するために、グラフ注意ネットワーク(GAT)アーキテクチャを使用し、その出力を強化学習におけるポリシー勾配手法と互換性に適応させる。
我々は,シミュレーション中に予期せぬ接続が発生した場合でも,低レベル指向グラフ観測を用いてGAT防御ポリシーを訓練できることを実証した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:11:32 GMT)
Manifold meta-learning for reduced-complexity neural system identification [1.0] 低次元多様体を発見するメタラーニングフレームワークを提案する。
この多様体は、関連する力学系のクラスによって生成される入力出力シーケンスのメタデータセットから学習される。
両レベルメタラーニングアプローチとは異なり,本手法では,学習多様体に直接データセットをマッピングする補助的ニューラルネットワークを用いる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:49:56 GMT)
MALADY: Multiclass Active Learning with Auction Dynamics on Graphs [1.0] 効率的なアクティブラーニングのためのマルチクラスアクティブラーニングとオークション・ダイナミクス・オン・グラフ(MALADY)フレームワークを提案する。
我々は[24]における半教師付き学習のための類似性グラフ上のオークションダイナミクスアルゴリズムを一般化し、より一般的な最適化関数を組み込む。
また,オークションアルゴリズムの双対変数を用いて,分類器内の不確実性を測定し,異なるクラス間の決定境界付近のクエリを優先順位付けする,新しい能動的学習獲得関数を導入する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:28:06 GMT)
Coherent States in Classical Field Theory [0.7] 我々は、コヒーレント状態の古典的類似の出現とその一般化を、純粋に古典的場の理論的な設定で示す。
我々のアプローチは、量子構造と完全に平行に、基礎となる場の理論のポアソンブラケットと対称性を利用する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:14:20 GMT)
Eigenvalue analysis of three-state quantum walks with general coin matrices [0.7] 我々は、一般的なコイン行列を用いた3状態量子ウォークに適用可能な、より洗練された転送行列フレームワークを開発する。
我々は,これまで難解と考えられていたモデルに対して,正確な固有値を導出するための数値解析を行った。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:51:43 GMT)
BoTTA: Benchmarking on-device Test Time Adaptation [0.7] テスト時間適応(TTA)は、ラベル付きテストデータやオリジナルのトレーニングセットへのアクセスを必要とせずに、推論中にモデルを適用することでこの問題に対処する。
本稿では,モバイルおよびエッジデバイス上での実用的制約下でのTTA手法の評価を目的としたベンチマークであるBoTTAを提案する。
我々は,これらのシナリオ下での最先端のTTA手法をベンチマークデータセットを用いて評価し,実際のテストベッド上でシステムレベルのメトリクスを報告する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:16:19 GMT)
Learning Strategies in Particle Swarm Optimizer: A Critical Review and Performance Analysis [0.6] 素粒子群最適化(PSO)はその単純さと効率性からSIアルゴリズムに広く採用されている。
我々は、このギャップに対処するために様々な学習戦略をレビューし、分類し、最適化性能への影響を評価した。
我々は、自己適応的でインテリジェントなPSO変種の必要性を強調し、オープンな課題と今後の方向性について議論する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:50:02 GMT)
A Review of YOLOv12: Attention-Based Enhancements vs. Previous Versions [0.6] YOLOv12は、リアルタイムのパフォーマンスを維持しながら注意ベースの拡張をうまく組み込む、新しいアプローチを導入している。
本稿では、計算効率のよい自己注意領域を含む、YOLOv12のアーキテクチャ革新を包括的にレビューする。
従来のYOLOバージョンと競合するオブジェクト検出器に対してYOLOv12をベンチマークし、精度、推論速度、計算効率の改善点を分析した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:40:55 GMT)
RoboMorph: Evolving Robot Morphology using Large Language Models [0.5] RoboMorphはモジュラーロボットの設計を自動生成し最適化するためのアプローチである。
我々は,それぞれのロボットデザインを文法として表現し,大規模言語モデル(LLM)の能力を活用して,ロボットデザインの広い範囲をナビゲートする。
実験の結果、RoboMorphは異なる地形に最適化された非自明なロボットをうまく生成できた。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:31:06 GMT)
Remote sensing colour image semantic segmentation of trails created by large herbivorous Mammals [0.5] 放牧道は、裸地の線路の複雑なネットワークを発生させる大きな草食動物の連続的な活動によって形成される。
そこで我々は,放牧経路を識別する機械学習技術に基づいて,異なるアルゴリズムの評価を行った。
これは我々の知る限りでは初めてであり、大型の草食性哺乳動物の足跡の検出とデライン化のために、競争力のある画像セグメンテーションの結果が得られている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:33:57 GMT)
Non-Markovian two-time correlation functions for optomechanical systems [0.5] 空洞光学系の2時間相関関数(TTCF)について検討した。
数値シミュレーションは,(1)マルコフ政権と非マルコフ政権の長期定常状態が異なること,(2)時間依存TTCFが環境に関する情報を明らかにすること,の2つの主要な結論を支持する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:24:06 GMT)
Who Said Only Military Officers Can Deal with Uncertainty? On the Importance of Uncertainty in EdTech Data Visualisations [0.5] 本稿では,教育用予測分析プラットフォームからデータ視覚化を初めて分析するための重要な投機的アプローチについて述べる。
教育における不確実性の可視化はまれである。
第2に、他の分野(防衛、気候変動、医療)における不確実性可視化について検討する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:11:33 GMT)
Electric field tunable spin-orbit gap in a bilayer graphene/WSe$_{2}$ quantum dot [0.4] 二層グラフェン(BLG)とジエレン化タングステン(WSe$$$)のヘテロ構造における近接誘起スピン軌道結合(SOC)の研究について報告する。
少数粒子状態のBLG量子ドット(QD)は、誘導SOCの感度プローブとして機能する。
この調整性は、WSe$$$ から離れた BLG 層上の QD 状態の局所化の増大によるものである。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:59:35 GMT)
Exact noise and dissipation operators for quantum stochastic thermodynamics [0.4] 熱雑音を伴う量子散逸の厳密な定式化は、現在も活発な研究のトピックである。
量子レベルでの熱雑音は多次元の幾何量子化過程として現れることを示す。
この結果は量子系における散逸の理解を前進させ、量子スケールにおける非平衡熱力学に関する新たな知見を提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:16:33 GMT)
SceneFactory: A Workflow-centric and Unified Framework for Incremental Scene Modeling [0.4] SceneFactoryはインクリメンタルなシーンモデリングのための統合されたフレームワークである。
マルチビュー深度推定、LiDAR完了、RGB-D/RGB-L/Mono/Depth のみの再構築、SLAM など、幅広いアプリケーションをサポートしている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:50:15 GMT)
Using customized GPT to develop prompting proficiency in architectural AI-generated images [0.4] 本研究は,AI駆動画像生成におけるアーキテクチャ学生の習熟度を高めるため,カスタマイズされたGPTモデルの利用について検討する。
ANOVAの結果は単語数,類似性,具体性において統計的に有意な改善を示し,特にAIペルソナと構造化プロンプトガイドが支持した群で有意な改善を示した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:03:18 GMT)
Measuring Global Migration Flows using Online Data [0.4] プライバシー保護された30億人のFacebookユーザーの記録を用いて、月間181カ国の国間移動フローを推定する。
我々は2022年に3910万人が海外に移住したと見積もっている(我が国の人口の0.63%)。
研究・政策介入を支援するため、人道データ交換を通じてこれらの見積もりを公開します。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:19:26 GMT)
Geometric Analysis of the Stabilizer Polytope for Few-Qubit Systems [0.4] 数量子ビット量子系における安定化器ポリトープの幾何学について検討する。
量子状態のランダムサンプリングにより、純粋状態と混合状態の両方の魔法の分布を分析する。
我々は,安定剤ポリトープの面に対応するベル様不等式を分類し,魔法と絡み合いを結合する一般濃度結果を確立する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 22:34:52 GMT)
Robust and Fine-Grained Detection of AI Generated Texts [0.3] 既存のシステムは、短いテキストよりもAI生成したコンテンツを正確に識別するのに苦労することが多い。
本稿では,トークン分類のタスクのために構築されたモデルについて紹介する。
また,23言語以上のプロプライエタリなLLMが主に共著する2.4M以上のテキストのデータセットも導入した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:29:30 GMT)
A complete theory of the Clifford commutant [0.3] クリフォード群は量子情報科学において中心的な役割を果たす。
多くの誤り訂正スキームのビルディングブロックであり、ユニタリ群に対するハール測度の最初の3つのモーメントと一致する。
クリフォード群の多くの性質の理解の中心はクリフォード可換である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:21:34 GMT)
Characterizing physical and logical errors in a transversal CNOT via cycle error reconstruction [0.2] フォールトトレラントな量子コンピューティングに進むためには、論理プリミティブの根底にあるエラーメカニズムを理解する必要がある。
本稿では,サイクルエラー再構成によるフォールトトレラント動作に関連する物理誤差特性を特徴付ける新しい能力を示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:22:32 GMT)
ARCeR: an Agentic RAG for the Automated Definition of Cyber Ranges [0.2] 本稿では,Cyber Rangesの自動生成と展開のための革新的なソリューションとしてARCeRを提案する。
ARCeRはAgentic RAGパラダイムに依存しており、最先端のAI技術を完全に活用することができる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:53:28 GMT)
Multi-qubit nanoscale sensing with entanglement as a resource [0.2] 我々は,光学的に未解決なNV中心対と核スピンを,相関ノイズを測定するためのマルチキュービットセンサとして使用するプロトコルについて述べる。
長さ10nmのスケールでは、2つのNV中心を双極子-双対結合することでベル状態が最大に絡み合う。
これにより、読み出しノイズによるスケーリング感度が2次から線形に変化する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 23:52:27 GMT)
Large Visual-Language Models Are Also Good Classifiers: A Study of In-Context Multimodal Fake News Detection [0.2] 本稿ではまず,CLIPモデルと比較し,LVLMとGPT4VのFND特性について検討する。
次に,標準文脈学習(ICL)をLVLMと統合し,FND性能の向上に言及する。
textbfIn-context textbfMultimodal textbfFake textbfNews textbfD
論文参考訳(メタデータ) (Wed, 16 Apr 2025 00:26:13 GMT)
Hardware Co-Designed Optimal Control for Programmable Atomic Quantum Processors via Reinforcement Learning [0.2] 本稿では,古典的制御ハードウェアに固有の欠陥に対処する,ハードウェア共同設計の量子制御フレームワークを提案する。
提案手法により,高忠実かつ並列な単一ビットゲート操作が可能となることを示す。
システム複雑性が増加するにつれてPPO性能は低下するが、エンドツーエンドの微分可能なRLは99.9$%以上のゲート忠実度を一貫して達成する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:30:40 GMT)
SRVP: Strong Recollection Video Prediction Model Using Attention-Based Spatiotemporal Correlation Fusion [0.2] VP(VP)モデルは標準注意(SA)と強化注意(RFA)を統合する
3つのベンチマークデータセットの実験により、SRVはRNNベースのモデルにおける画質劣化を緩和することを示した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:18:13 GMT)
Towards Conversational AI for Human-Machine Collaborative MLOps [0.2] 本稿では,MLOpsにおける人間と機械の協調性向上を目的としたLarge Language Model (LLM)に基づく対話エージェントシステムを提案する。
Swarm Agentは、自然言語インタラクションを通じてMLを作成し管理するための特殊なエージェントを統合するアーキテクチャである。
アーキテクチャ、実装の詳細を説明し、この会話型MLOpsアシスタントが複雑さを減らし、さまざまな技術スキルレベルにわたるユーザへの参入を減少させる方法について説明する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 20:28:50 GMT)
Integrating Structural and Semantic Signals in Text-Attributed Graphs with BiGTex [0.2] BiGTexは、スタック化されたGraph-Text Fusion Unitを通じてGNNとLLMを密に統合する新しいアーキテクチャである。
BiGTexはノード分類における最先端性能を実現し、リンク予測に効果的に一般化する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 20:25:11 GMT)
Clustering and analysis of user behaviour in blockchain: A case study of Planet IX [0.1] このタイプの情報を抽出し分析する方法を示すために,ユーザ行動分析パイプラインを提案した。
パイプラインは、Planet IXと呼ばれるブロックチェーンベースのゲームから収集されるスマートコントラクトを含むトランザクションデータの収集から始まる。
このデータから、別個のゲームアクションを作成でき、それらを利用してユーザーがゲーム内活動を行う方法と時期を提示する。
その結果,これらのクラスタに属するユーザについて,行動情報を抽出できることが判明した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:57:33 GMT)
Leveraging Machine Learning Models to Predict the Outcome of Digital Medical Triage Interviews [0.1] 決定木モデル、特にLGBMClassifierとCatBoostClassifierは、完全なインタビューの結果を予測する上で80%以上の精度を達成する。
本研究は,決定木モデルのインタビュー完全性と予測力の線形相関性を明らかにする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:17:23 GMT)
Accelerating Clinical NLP at Scale with a Hybrid Framework with Reduced GPU Demands: A Case Study in Dementia Identification [0.1] 本稿では,ルールベースのフィルタリング,サポートベクトルマシン(SVM)分類器,BERTモデルを統合するハイブリッドNLPフレームワークを提案する。
我々はこの枠組みを、重篤な高血圧を持つ490万人の退役軍人の認知症鑑定ケーススタディに応用し、210億の臨床記録を分析した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:24:38 GMT)
Predictive control of blast furnace temperature in steelmaking with hybrid depth-infused quantum neural networks [0.1] 伝統的な方法では、高炉内の温度変動の複雑で非線形の性質に苦しむことが多い。
本稿では,ハイブリッド量子機械学習と微粉炭噴射制御を組み合わせた新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:00:46 GMT)
pix2pockets: Shot Suggestions in 8-Ball Pool from a Single Image in the Wild [0.0] 我々は、RLアシストプールコーチの基礎となるピクス2ポケットを紹介した。
プールテーブルの1つの画像が与えられた場合、まずテーブルとボールを検出し、次に最適なショット提案を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:01:44 GMT)
WikiReddit: Tracing Information and Attention Flows Between Online Platforms [0.0] このデータセットは、Reddit 2020-2023の投稿やコメントで共有されているウィキペディアの言及やリンクをすべてキャプチャする。
Redditとのリサーチ契約を通じて、私たちのデータセットは、RedditとWikipedia APIを統合したクエリとIDメカニズムを提供しながら、ユーザのプライバシを保証する。
これらのプラットフォーム上で共有された情報と議論された情報の関係を分析することで、我々のデータセットは、ソーシャルメディアの談話と協調的な知識消費と生産との相互作用を調べる基盤を提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:10:21 GMT)
What do people expect from Artificial Intelligence? Public opinion on alignment in AI moderation from Germany and the United States [0.0] 我々は,ドイツと米国におけるAI対応システムの主要な機能的特徴に対する公的な嗜好に関する2つの調査から得られた証拠を提示する。
我々は,AIモデレーションにおける4種類のアライメント(精度と信頼性,安全性,バイアス緩和,想像の促進)のサポートについて検討する。
どちらの国でも、正確さと安全性は最強の支持を享受する一方、より規範的な目標(公平さや想像力など)はより慎重な支持を受ける。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 20:27:03 GMT)
What Do Large Language Models Know? Tacit Knowledge as a Potential Causal-Explanatory Structure [0.0] 大型言語モデル(LLM)は言語を知っていると仮定されることもある。
LLMはMartin Davies (1990) によって定義された暗黙の知識を得ることができると私は主張する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:42:33 GMT)
Wasserstein Distributionally Robust Regret Optimization [0.0] We provide a systematic analysis of Wasserstein DRRO, paralleling known results for Wasserstein DRO。
滑らかさと規則性条件下では、ワッサーシュタインDRROは経験的リスク最小化(Empirical Risk Minimization:ERM)と1次項に一致することを示す。
2つの1次元凹関数を最大化することにより、後悔を計算できることが示される。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:02:18 GMT)
W-Kernel and Its Principal Space for Frequentist Evaluation of Bayesian Estimators [0.0] 各観測の対数類似度を用いて定義される後続共分散行列Wに焦点をあてる。
We show that the principal space of W is also relevant to frequentist evaluation。
W の主空間へのブートストラップ投影が頻繁な評価を促進することを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:30:31 GMT)
Visual Language Models show widespread visual deficits on neuropsychological tests [0.0] 神経心理学のツールキットを用いて3つの最先端ビジュアル言語モデル(VLM)の能力を評価する。
臨床的に有意と思われる低位・中位の視覚能力に広範な欠陥がみられた。
これらの選択的欠陥は、検証されたテストバッテリーを通してプロファイルされ、人間には明示的な訓練を必要としない基礎的な視覚概念を発達させることなく、人工知能が複雑な物体認識を達成できることを示唆している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 01:27:42 GMT)
Variational Quantum Optimization Benchmark Suite for Airline Crew Pairing and More [0.0] 量子最適化のためのフレームワークを構成するオープンソースパッケージのセットを紹介する。
システムの1つのゴールは、実験をセットアップするためのコマンドラインベースの構成システムを含めることである。
本稿では,Airline Crew Pairing問題,高関連産業問題,MaxCut問題を通じて,管理可能なサイズのインスタンスが容易に利用可能となるシステムの利用例を示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:25:50 GMT)
Valley Splitting Correlations Across a Silicon Quantum Well [0.0] インテルが製造した1次元量子ドットアレイにおける谷分割のばらつきについて検討する。
本研究は,スケーラブルデバイス設計に必要なSi/SiGeヘテロ構造をメソスコピックで理解する手法を開発した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 19:41:11 GMT)
Universal work extraction in quantum thermodynamics [0.0] ナノスケール量子システムから抽出可能な最大作業量を評価することは、量子熱力学における中心的な問題の一つである。
以前の研究は、入力状態の自由エネルギーを決定的な仮定の下で抽出可能な作業の最適速度として特定した:実験者は与えられた量子状態の記述を知っている。
ここでは,この最適抽出作業は入力状態を知ることなく実現可能であることを示し,基本的操作制限を除去する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:00:00 GMT)
UniqueNESS: Graph Theory Approach to the Uniqueness of Non-Equilibrium Stationary States of the Lindblad Master Equation [0.0] リンドブラディアン超作用素のカーネルの次元性は、平衡から外れた様々なシナリオに物理的に興味を持つ。
リンドブラッドマスター方程式の特異な固定点に関する文献で確立された既知の基準は、グラフ理論の枠組みでよりよく扱うことができることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:59:05 GMT)
Unified Multipole Bott Indices for Non-Hermitian Skin Effect in Different Orders [0.0] 我々は,異なる順序の皮膚効果を診断できる非エルミート多極性ボット指標のセットを開発した。
提案手法は,非エルミート系における1次および高次皮膚効果の包括的理解を提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:17:42 GMT)
Unconditional robustness of multipartite entanglement of superposition [0.0] 生成物純状態と重畳した多粒子純状態の真の多粒子絡みの堅牢性と分離性について検討する。
マルチパーティイト状態に対する最大値と最小値のシュミット階数の概念を導入する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:40:31 GMT)
Ultrafast switching of telecom photon-number states [0.0] 単一モードファイバにおける光カー効果を用いて,光子数状態の超高速全光スイッチングを示す。
99%のスイッチング効率は32,000の信号対雑音比で達成される。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:00:00 GMT)
Trusting CHATGPT: how minor tweaks in the prompts lead to major differences in sentiment classification [0.0] 本研究では,インプットの構造の微妙な変化が,感情極性分析の分類結果に有意な変化をもたらすことはないという仮説を検証した。
ラテンアメリカの4人の大統領に対するスペイン語で10万件のコメントのデータセットを用いて、このモデルは10回ごとに肯定的、否定的、中立的なコメントを分類し、それぞれのプロンプトをわずかに変化させた。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:37:09 GMT)
Towards an Account of Complementarities and Context-Dependence [0.0] 波動-粒子の双対性、ブラックホールの相補性、ウンルー効果の解釈は、系がどのように観測されるかによって変化することを要求している。
本稿では, 物理的法則を, 与えられた文脈で実際に観測できる部分集合に再編成する枠組みである, 文脈依存マッピングを紹介する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:20:37 GMT)
Towards an AI Observatory for the Nuclear Sector: A tool for anticipatory governance [0.0] 我々は、原子力セクターにおけるAIのための予測的なガバナンスシステムの構築を要求します。
本稿は,原子力AI観測所の輪郭と,ガバナンスの予測システムについて考察する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 03:43:15 GMT)
Towards a Foundation Model for Physics-Informed Neural Networks: Multi-PDE Learning with Active Sampling [0.0] 物理インフォームドニューラルネットワーク(PINN)は、物理法則をニューラルネットワークトレーニングに埋め込むことで偏微分方程式(PDE)を解くための強力なフレームワークとして登場した。
本研究では,統一アーキテクチャ内で複数のPDEを解決可能な基礎PINNモデルの可能性について検討する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:40:37 GMT)
Time Advance in PT-Symmetric Quantum Mechanics and Negative Time Delay [0.0] Anguloらは原子散乱実験において負の時間遅延を報告している。
これはPT対称性理論で予想される時間進行であり、PTが時間遅れに対応する可能性がある。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:24:07 GMT)
The Evolution of Zero Trust Architecture (ZTA) from Concept to Implementation [0.0] Zero Trust Architecture (ZTA) はサイバーセキュリティのパラダイム変更のひとつだ。
この記事では、ZTAの中核となる概念、その始まり、いくつかのユースケースと今後のトレンドについて研究する。
ZTAは、クラウド環境、教育、職場環境(自宅を含む)を強化するとともに、横動きやインサイダーの脅威といった他のリスクを制御することが期待されている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:26:54 GMT)
The Balancing Act of Policies in Developing Machine Learning Explanations [0.0] 本研究では、政策設計が機械学習モデルにおける説明の質にどのように影響するかを検討する。
政策長はいくつかの要件への関与に影響を与えるが、政策目的には効果がなく、説明の質は概して劣っている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:46:52 GMT)
TextDiffSeg: Text-guided Latent Diffusion Model for 3d Medical Images Segmentation [0.0] テキスト誘導拡散モデルフレームワークであるTextDiffSegは、3Dボリュームデータを自然言語記述と統合する。
複雑な解剖構造を認識するモデルの能力を高めることで、TextDiffSegは革新的なラベル埋め込み技術を取り入れている。
実験の結果、TextDiffSegは腎臓と膵腫瘍を含む分節作業において、既存の方法よりも一貫して優れていることが示された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:17:36 GMT)
Tests of quantum contextuality in particle physics [0.0] 量子文脈性(Quantum contextuality)とは、あらかじめ定義された本質的な値を物理的性質に割り当てることができないことを指す。
衝突機で生成する単一スピン-1大粒子の偏極状態は、文脈性をテストするのに理想的な設定である。
スピン粒子によって形成される二部晶系のスピン状態における量子的文脈性の存在について論じる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:00:01 GMT)
Task Memory Engine (TME): A Structured Memory Framework with Graph-Aware Extensions for Multi-Step LLM Agent Tasks [0.0] 階層型タスクメモリツリー(TMT)を用いてタスク実行を追跡する軽量で構造化されたメモリモジュールを提案する。
TMEはグラフ対応に設計されており、再利用可能なサブステップ、タスクパスの収束、依存関係の共有をサポートする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:48:13 GMT)
Statistical mechanics model for Clifford random tensor networks and monitored quantum circuits [0.0] 我々は、統計力学モデルに、クリフォード(安定化器)ランダムテンソルネットワーク(RTN)と監視量子回路の正確なマッピングを導入する。
ボルツマン重みは有限数体 $bf F_p$ の成分を持つ行列を含む対称性群の下で不変であることを示す。
我々は、オンサイトヒルベルト空間次元$d=pM$のクリフォードモニタ回路が、(a)$p=$固定だが$Mto infty$である極限$d to infty$のパーコレーションによって記述されることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:23:28 GMT)
Spectral densities of a dispersive dielectric sphere in the modified Langevin noise formalism [0.0] 我々は, 分散誘電体物体のスペクトル密度を, 微視的量子電磁力学の枠組みで扱う。
これらの場が量子エミッタの力学に与える影響は、2つの独立した連続ボソニック貯水池によって説明できる。
本研究では, 電磁環境の温度依存性有効スペクトル密度を導入した2つの貯水池と量子エミッタの相互作用について検討した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 20:42:07 GMT)
Résumé abstractif à partir d'une transcription audio [0.0] これらの手法を用いて,E2E(End to End)音声要約モデルを提案する。
本稿では,これらの手法の有効性を考察し,これらの手法の適用性について結論を導出する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:24:49 GMT)
Rényi security framework against coherent attacks applied to decoy-state QKD [0.0] 我々は、コヒーレント攻撃下で量子鍵分布プロトコルの有限サイズセキュリティ証明のためのフレキシブルで堅牢なフレームワークを開発する。
提案手法は,最小限の要件を課しながら,幅広いプロトコルのクラスにわたる高い有限サイズ鍵レートを実現する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:54:23 GMT)
RiboGen: RNA Sequence and Structure Co-Generation with Equivariant MultiFlow [0.0] RiboGenはRNA配列と全原子3D構造を同時に生成する最初のディープラーニングモデルである。
実験の結果,RiboGenは化学的に可塑性かつ自己持続的なRNAサンプルを効率的に生成できることがわかった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:41:37 GMT)
Replicating ReLM Results: Validating Large Language Models with ReLM [0.0] このプロジェクトは、オリジナルのReLM論文の重要な成果を再現し、機械学習のシステム分野に重点を置いて、アプローチと応用について解説する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:58:48 GMT)
Relaxing the Markov Requirements on Reinforcement Learning Under Weak Partial Ignorability [0.0] 我々は「部分的不確実性」の概念を導入し、適応強化学習のための新しい収束定理を確立する。
この理論的結果は、従来の$Q$-ラーニングの過程におけるマルコフの仮定を緩和し、最適性を確立するためにロビンズ・モンロ近似定理の一般化形式を展開させる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:57:23 GMT)
Reinforcement Learning from Human Feedback [0.0] 人間からのフィードバックからの強化学習(RLHF)は、重要な技術およびストーリーテリングツールとなっている。
この本では、ある程度の量的背景を持つ人々に対して、コアメソッドについて穏やかに紹介したいと思います。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:36:46 GMT)
Reasoning-Based AI for Startup Evaluation (R.A.I.S.E.): A Memory-Augmented, Multi-Step Decision Framework [0.0] 本稿では,意思決定ツリーの解釈可能性と大規模言語モデル(LLM)の高度な推論能力のギャップを埋めて,スタートアップの成功を予測する新しいフレームワークを提案する。
我々の手法はチェーン・オブ・ソート・プロンプトを利用して詳細な推論ログを生成し、その後、構造化された人間の理解可能な論理ルールに蒸留する。
我々の手法は、従来の意思決定プロセスを強化するだけでなく、専門家の介入や継続的な政策改善を促進する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:53:42 GMT)
RAIN: Reinforcement Algorithms for Improving Numerical Weather and Climate Models [0.0] 現在の気候モデルは、サブグリッドスケールのプロセスを表現するために複雑な数学的パラメータ化に依存している。
本研究は,重要なパラメータ化課題に対処するために,強化学習と理想的な気候モデルを統合することを検討する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:56:58 GMT)
Quantum vs. classical: A comprehensive benchmark study for predicting time series with variational quantum machine learning [0.0] 時系列予測のための有望なツールとして、変分量子機械学習アルゴリズムが提案されている。
本稿では,時系列予測のための変分量子アルゴリズムと古典的機械学習モデルの比較を行った。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:29:00 GMT)
Quantum thermodynamics as a gauge theory [0.0] ゲージ不変な仕事と熱を定義する量子熱力学のゲージ理論が導入された。
我々はこの理論を2つの重要な方法で拡張し、以前は見過ごされていたエネルギースペクトルの退化を取り入れた。
この結果、ゲージ不変性の原理に基づく量子熱力学の完全な枠組みが導かれる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:25:05 GMT)
Quantum random power method for ground state computation [0.0] 本稿では、ハミルトニアンを近似した量子古典的ハイブリッドランダムパワー法を提案する。
我々は、よく知られたモデルハミルトニアンに対して、この疎度条件を数値的に検証する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 10:08:48 GMT)
Quantum algorithm for the gradient of a logarithm-determinant [0.0] スパースランク入力演算子の逆を効率的に決定することができる。
入力演算子のすべての$N2$要素の代わりに、量子状態の期待値を測定することは、$O(ksigma)$ timeで実現できる。
このアルゴリズムは、完全に誤り訂正された量子コンピュータ向けに構想されているが、短期的なマシンで実装可能である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:16:13 GMT)
QEGS: A Mathematica Package for the Analysis of Quantum Extended Games [0.0] 近年、量子ゲームは意思決定ジレンマを解く能力から注目されている。
本研究では、EWLスキームに基づく古典的な2時間2ドルゲームにおける量子拡張の研究専用のMathematicaパッケージを紹介する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:43:01 GMT)
Purposefully Induced Psychosis (PIP): Embracing Hallucination as Imagination in Large Language Models [0.0] 大規模言語モデル(LLM)における幻覚は、広く誤りとみなされている。
創造的あるいは探索的な文脈では、これらの「間違い」はイノベーションの予期せぬ道を表しているかもしれない。
PIP(Powposefully induced Psychosis)は,LLM幻覚を視覚的タスクに増幅する新しいアプローチである。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:13:02 GMT)
Prognosis Of Lithium-Ion Battery Health with Hybrid EKF-CNN+LSTM Model Using Differential Capacity [0.0] リチウムイオン(Liイオン)電池2種類の電池を用いた電池劣化試験モデルを開発した。
提案モデルでは,平均二乗誤差(MSE)とルート平均二乗誤差(RMSE)に基づいて,優れたモデリング結果が得られる。
全体として、LiFePO4電池は、負荷条件の異なる(LiNiCoAlO2)電池よりも頑丈で一貫して動作する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:43:03 GMT)
Profile control of fibre-based micro-mirrors using adaptive laser shooting with $\textit{in situ}$ imaging [0.0] ファイバーファブリペロキャビティ(FFPC)はキャビティ量子電磁力学(CQED)や量子技術において様々な研究で用いられている。
我々は,光ファイバーの端面によく制御された表面形状を合成する,新しい$textCO$レーザー加工法を開発した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:16:41 GMT)
Probing the Abyss of the Quantum Vacuum: A Quest for Fluctuation-Free Domains [0.0] 熱雑音の高周波(RF)測定を利用して,真空変動の空間分布を間接的に探究する手法を提案する。
我々は、真空モードの対応する修正を推測し、その結果、真空のゆらぎ自体を推測する。
本研究は、制約環境におけるQED効果を研究するための新しい実験フレームワークを確立する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 04:59:14 GMT)
Predictive Multiplicity in Survival Models: A Method for Quantifying Model Uncertainty in Predictive Maintenance Applications [0.0] 我々は、生存に基づくモデルにおいて、予測的乗法が重要な関心事であると考えている。
あいまいさ、不明瞭さ、不明瞭さという形式的な尺度を導入し、それを定量化します。
これは特にメンテナンススケジューリングなどの下流タスクに関係している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:04:00 GMT)
Phonon-Coupled Hole-Spin Qubits in High-Purity Germanium: Design and Modeling of a Scalable Architecture [0.0] 本稿では,ゲート制御されたゲルマニウム(Ge)量子ドットで定義されたホールスピン量子ビットを用いたスケーラブル量子プロセッサアーキテクチャの設計とモデル化を行う。
このアーキテクチャはGeの孔状態に固有の強い電気的に調節可能なスピン軌道相互作用を利用し、高品質のフォノン結晶キャビティ(PnCC)と統合して完全電気量子ビット制御とフォノンを介する結合を可能にする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:14:30 GMT)
Pair Production in time-dependent Electric field at Finite times [0.0] 真空中におけるペア生成の有限時間挙動を時間依存性のソーターパルス電場を用いて検討する。
粒子の長手運動量スペクトルにおける振動を有限時間で観測する。
これらの振動は、様々な動的過程/チャネルから生じる量子干渉効果によって生じる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:31:05 GMT)
Optimizing the quantum interference between single photons and local oscillator with photon correlations [0.0] 量子ドットキャビティデバイスとパルスレーザー光の重なりを正確に測定できる2つのホモダイン光子相関技術について報告する。
干渉場の異なる統計は、干渉ビームスプリッターの出力における光子相関に対する量子干渉の特定のシグネチャをもたらす。
両出力間でのHong-Ou-Mandel可視性, あるいは光子束を1出力で測定し, 最大重なりの挙動を比較した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 14:19:51 GMT)
On the similarity of bandwidth-tuned quantum kernels and classical kernels [0.0] 量子カーネル(QK)は量子機械学習アプリケーションで広く使われている。
しかし、古典的データセット上の古典的機械学習手法を超える可能性については、まだ不明である。
放射基底関数(RBF)カーネルによく似たQKの帯域幅調整結果を示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:57:18 GMT)
On the photon energy conservation in stimulated emission. Experiment [0.0] 量子電磁力学は、励起放出における入射光子と放出光子の同一性を予測する。
本研究では、GaAs半導体増幅器の励起発光を調べた結果、増幅ビームの正の周波数シフトが検出された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:17:28 GMT)
On the calibration of Just-in-time Defect Prediction [0.0] 我々は,3つのJIT DP手法の校正評価を行い,校正が不十分であるかどうかを判断した。
その結果、評価されたJIT DPモデルはすべてある程度の誤校正を示し、ECEは2~35%であった。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:06:20 GMT)
On Revealing the Hidden Problem Structure in Real-World and Theoretical Problems Using Walsh Coefficient Influence [0.0] グレーボックス最適化では、非線形変数依存を得るためにウォルシュ分解を用いる。
いくつかの問題では、全ての変数は非線形に依存せず、前述のマスクは役に立たない。
このような問題の実際の事例の特徴を解析し、それらの依存関係の多くはノイズのような起源を持つ可能性があることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:22:59 GMT)
Nuclear Excitation by Near-Resonant Electron Transition in $^{229}$Th$^{39+}$ Ions [0.0] 基底状態からSb型トリウムイオンの近共鳴電子遷移による8eV229m$Th異性体への励起について研究した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:43:36 GMT)
Nonequilibrium Casimir pressure for two graphene-coated plates: Quantum field theoretical approach [0.0] 2つのグラフェン被覆板系における非平衡カシミール圧力を考慮する。
非ゼロエネルギーギャップと化学ポテンシャルを特徴とするグラフェンコーティングの電磁応答について述べる。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 09:04:09 GMT)
Non-Markovian Quantum Master and Fokker-Planck Equation for Gravitational Systems and Gravitational Decoherence [0.0] 量子マスター方程式は、量子重力場と相互作用する量子質量系の力学を記述する。
電磁場による量子系のデコヒーレンスの研究は、低い温度環境が量子情報処理実験の成功に寄与することを示した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:33:23 GMT)
Non-Hermitian Numerical Renormalization Group: Solution of the non-Hermitian Kondo model [0.0] 非エルミート的(NH)ハミルトニアン(英語版)は開量子系、非平衡力学、散逸過程を記述している。
強相関物理学の重要なパラダイムである近藤効果は、最近、NH設定で検討されている。
ここでは,数値再正規化群 (NRG) の NH 一般化を開発し,それを NH Kondo モデルの解法として利用する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:56:48 GMT)
No equivalence between hydrodynamic and dispersive mass of the charged polaron [0.0] 荷電不純物が周囲に弱く緩やかに崩壊する力を発揮するという問題を考察する。
特に、中密度のフェルミ・ポーラロン有効質量のスケーリングは、量子的および古典的なシナリオでは反対である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 12:54:46 GMT)
Naming is framing: How cybersecurity's language problems are repeating in AI governance [0.0] この論文は、サイバーセキュリティや人工知能(AI)のようなミスノマーは意味論以上のものだと論じている。
これらのミスノマーは、人事機関を隠蔽し、期待を膨らませ、説明責任を歪ませることで、重大なガバナンスリスクを負うと主張している。
この論文は、AIガバナンスに対する言語第一のアプローチを提唱している: 支配的な比喩を尋問し、人間の役割を予見し、正確で包括的で反射的なレキシコンを共同開発する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 20:58:26 GMT)
Moving between high-quality optima using multi-satisfiability characteristics in hard-to-solve Max3Sat instances [0.0] トンネリングが失敗するMax3Satインスタンスに焦点をあて、局所最適高品質ソリューションとグローバル最適ソリューションの領域間の移動を改善する。
本稿では,高品質な解を解空間から遠ざかる接続を可能にする,節適合性特性の操作を提案する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:38:08 GMT)
Language Models as Quasi-Crystalline Thought: Structure, Constraint, and Emergence in Generative Systems [0.0] このエッセイは,大規模言語モデル(LLM)と準結晶の類似性を提案する。
LLMは周期的反復のないグローバルコヒーレンスを示すシステムであり、局所的な制約によって生成される。
このシフトは生成言語を創発的パターン化の空間として再編成する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:27:47 GMT)
KPC-cF: Aspect-Based Sentiment Analysis via Implicit-Feature Alignment with Corpus Filtering [0.0] 本研究は,韓国語などの低リソース言語におけるABSAの直感的で効果的な枠組みを提案する。
翻訳されたベンチマークと未ラベルの韓国データを統合することで、予測ラベルを最適化する。
英語のABSAと比較すると,F1スコアと精度に約3%の差が認められた。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:18:10 GMT)
Joule expansion of a quantum gas [0.0] 古典的なジュール膨張実験を再考し、現在は量子分解性原子ボースガスを用いている。
温度変化が観測されなかった古典ガス実験とは対照的に, 冷却効果と加熱効果の両方を観察, 定量的に説明する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:56:18 GMT)
Is Trust Correlated With Explainability in AI? A Meta-Analysis [0.0] 我々は、AI説明可能性と信頼の関係を探るため、既存の文献を網羅的に調査する。
我々の分析では、90の研究データを取り入れた結果、AIシステムの説明可能性と彼らが与える信頼との間に統計的に有意だが適度な正の相関関係が明らかとなった。
この研究は、特に説明責任の促進と、医療や司法などの重要な領域におけるユーザの信頼の促進において、社会技術的に幅広い影響を強調している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 23:30:55 GMT)
Interpretable AI-driven Guidelines for Type 2 Diabetes Treatment from Observational Data [0.0] 我々は,2型糖尿病治療の進行に関する正確な,構造化された,データ支援のガイドラインを作成している。
治療変更を処方するために、AIが支援するツリーベースのモデルをトレーニングします。
このプロセスでは、アグレッシブな選択肢を考慮せずに、よりアグレッシブな治療を優先します。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:29:45 GMT)
Intelligence of Things: A Spatial Context-Aware Control System for Smart Devices [0.0] インテリジェンス・オブ・モノ(INOT)は、直感的な空間推論を通じてスマートホームの自動化を強化する新しい空間文脈認識制御システムである。
INOTは、ビジョン言語モデルとIoTコントロールシステムを統合するモジュールアーキテクチャによる制限に対処する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 00:45:05 GMT)
InjectLab: A Tactical Framework for Adversarial Threat Modeling Against Large Language Models [0.0] 本稿では、言語モデルを操作するために使用される実世界の手法をマッピングする構造化オープンソースのマトリックスとして、InjectLabを紹介する。
このフレームワークはMITRE ATT&CKにインスパイアされ、プロンプト層における敵の振る舞いに特化している。
6つのコア戦略の下で編成された25以上のテクニックが含まれており、命令のオーバーライド、アイデンティティスワップ、マルチエージェントのエクスプロイトといった脅威をカバーしている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 05:00:56 GMT)
Impossibility of Quantum Private Queries [0.0] シンメトリ・プライベート情報検索(Symmetric private information retrieve)は、ユーザがデータベースに問い合わせて、アクセスしたデータベースの所有者に知らせることなく、正確に1つのエントリを取得できるようにする暗号化タスクである。
我々は,ユーザに対して安全であるプロトコルが,データベースの所有者に対して非自明なセキュリティ保証を持つことができないことを示すため,不正に敏感な対称なプライベート情報検索プロトコルに対して明示的な攻撃を行う。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:49:06 GMT)
Graphical Models for Decision-Making: Integrating Causality and Game Theory [0.0] 因果性やゲーム理論は、様々な領域における意思決定に大きく貢献する影響力のある分野である。
本稿では,ゲーム理論における重要な概念と,それらの交差に不可欠な因果関係を明らかにする。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:25:59 GMT)
Generative Deep Learning Framework for Inverse Design of Fuels [0.0] 燃料の高速な逆設計を可能にするために、生成的深層学習フレームワークが開発された。
このフレームワークは、共最適化変分オートエンコーダ(Co-VAE)アーキテクチャと定量的構造-プロパティ関係(QSPR)技術を組み合わせたものである。
生成モデルは、広大な化学空間を体系的に探索するための柔軟なツールを提供し、優れた抗ノック特性を持つ燃料を発見するための道を開く。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:32:25 GMT)
Generalization through variance: how noise shapes inductive biases in diffusion models [0.0] 我々は「分散による一般化」現象を部分的に説明できる数学的理論を開発した。
分布拡散モデルでは, トレーニング分布に類似したサンプルを効果的に学習する。
また、この帰納バイアスが特徴に関連した帰納バイアスとどのように相互作用するかを特徴付ける。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 23:41:10 GMT)
Gaussian states in quantum field theory: Exact representations of relative phase in superpositions of Gaussian states [0.0] 近年のqubit-CVハイブリッドモデルへの関心は、私たちの知識の単純かつ重要なギャップを明らかにしている。
フォック基底において二次ガウス状態をどのように忠実に表現するかを示す。
次に、この手法を用いて2次検出器を用いた単純な量子場理論通信プロトコルをモデル化する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:13:36 GMT)
From Requirements to Architecture: Semi-Automatically Generating Software Architectures [0.0] この方法は、アーキテクトがLLMを燃料とするツールとプロセス全体にわたる密接なコラボレーションを伴います。
アーキテクトはドメインモデルの作成、ユースケース仕様、アーキテクチャ決定、アーキテクチャ評価を通じてガイドされる。
予備的な結果は、このプロセスの実現可能性を示し、アーキテクトにとって大きな時間を節約できることを示している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:46:56 GMT)
First Measurement of Entanglement Dynamics in the SYK Model using Quantum Computers [0.0] 我々は、IBMの超伝導量子コンピュータをプログラム可能な量子プラットフォームとして使用し、SYKハミルトニアンの下での絡み合いエントロピー成長の最初の測定を行った。
この研究はカオス量子力学を探求する方法を開拓し、現在の量子プラットフォーム上での複雑な絡み合う成長を研究するスケーラブルな方法を確立する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:03:34 GMT)
Existence of unbiased resilient estimators in discrete quantum systems [0.0] Bhattacharyyaのバウンダリは、事前の正確性に関して、より堅牢な推定フレームワークを提供する。
制約数が測定結果を超えると、有限分散の推定器は存在しないことが示される。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:19:07 GMT)
EngramNCA: a Neural Cellular Automaton Model of Memory Transfer [0.0] 本研究では、公開状態とプライベートな細胞内記憶チャネルの両方を統合する神経細胞オートマトン(NCA)であるEngramNCAを紹介する。
提案モデルでは、不変な「遺伝子」エンコーディングを含む種子細胞から異なる形態を発達させる訓練を受けたNCAであるGeneCAと、その可視状態を変化させることなく、細胞のプライベートな「遺伝子」記憶を調節する補助的なNCAであるGenePropCAの2つのコンポーネントから構成される。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:23:09 GMT)
Dysarthria Normalization via Local Lie Group Transformations for Robust ASR [0.0] スペクトルのリー群変換を用いた変形音声の正規化法を提案する。
時間、周波数、振幅歪みは滑らかで可逆な変形としてモデル化され、スカラー場によってパラメータ化され指数写像を介して適用される。
ニューラルネットワークは、あらゆる病理データを用いて、典型的な音声の合成歪みからこれらのフィールドを推論するように訓練されている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 17:41:19 GMT)
Double-bracket algorithm for quantum signal processing without post-selection [0.0] 量子信号処理(QSP)は、様々な量子アルゴリズムにおいて基本的なプリミティブである。
汎用性にも拘わらず、QSPを実装するためのすべての体系的なプロトコルがポストセレクションに依存している。
我々は、補助量子ビットもポストセレクションも必要としないエルミート行列のQSP変換を実装するための新しい公式を導入する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 11:49:19 GMT)
Deep Variational Multivariate Information Bottleneck -- A Framework for Variational Losses [0.0] 従来の手法と最先端手法の両方を一般化する統一フレームワークを導入する。
我々は最先端のモデルに対してベンチマークを行い、優れた精度または競争的な精度を達成する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:58:58 GMT)
Deep Learning Based Dynamics Identification and Linearization of Orbital Problems using Koopman Theory [0.0] 本稿では,円・制限・摂動二体問題の同時同定と大域線形化のためのデータ駆動型フレームワークを提案する。
また,Circular Restricted Three-Body Problem を近似したクープマン演算子を正確に学習するために,同じアーキテクチャが利用できることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 15:28:12 GMT)
Decentralised collaborative action: cryptoeconomics in space [0.0] 我々は「半位相」と呼ぶ位相空間の概念を提案する。
私たちは参加者を「行動可能な連立」として組織された空間のポイントとして扱う。
システムに関する有用な情報は、それをセミトポロジーとして見ることで得られることが判明した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 21:22:32 GMT)
Comparative Evaluation of Radiomics and Deep Learning Models for Disease Detection in Chest Radiography [0.0] 本研究は,胸部X線撮影における疾患検出のための放射線治療と深層学習によるアプローチの包括的評価である。
新型コロナウイルス、肺不透明症、ウイルス性肺炎に焦点が当てられている。
臨床実習におけるAI駆動診断ツールの統合について報告する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 16:54:37 GMT)
Collective nuclear excitation and pulse propagation in single-mode x-ray waveguides [0.0] 我々は、放射光の短パルスによる集団励起下で、M"オスバウアー核と結合した平面薄膜導波路のX線伝播を示す。
我々の研究は、硬X線状態における導波路量子電磁力学の新しいプラットフォームを形成し、ナノメートルスケールでX線のコヒーレントな狭帯域源を提供する可能性を秘めている。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:51:35 GMT)
Coarsening of binary Bose superfluids: an effective theory [0.0] 古典的二元流体のケーン・ヒリアード記述を超流動系に一般化する二元系混合に対する効果的な運動方程式を導出する。
超流動混合物で観測されるドメイン成長法則$L(t)sim t2/3$は流体流によって駆動されるのではなく、相互作用と量子圧の競合によって生じることを示す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 19:53:37 GMT)
Causality, localisation, and universality of monitored quantum walks with long-range hopping [0.0] 最適リセット率は格子の大きさに依存して$alphato 0$として発散することを示す。
数値結果を再現し、長距離コヒーレント力学、対称性、局所量子計測過程の相互作用に光を当てる単純なモデルから導出する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:08:42 GMT)
A tensor network approach to sensing quantum light-matter interactions [0.0] 我々は、光が失われても、光によって探る量子物質系のパラメータを推定する精度の限界を提示する。
我々は検出された光の最終量子状態を行列積演算子として表現することに成功している。
我々の手法は、量子光-物質相互作用、量子光分光、量子熱力学、量子時計の研究に有用である。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:06:10 GMT)
A study on B-cell epitope prediction based on QSVM and VQC [0.0] 本研究では,量子支援ベクトルマシン(QSVM)と変分量子(VQC)を用いたB細胞予測における量子コンピューティングの役割について検討する。
バイオインフォマティクスにおける量子機械学習の可能性を強調し、データの複雑さが増大するにつれて、従来の手法の計算効率の限界に対処する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 08:09:34 GMT)
A Self-Supervised Reinforcement Learning Approach for Fine-Tuning Large Language Models Using Cross-Attention Signals [0.0] 本稿では,ループフィードバックにおいて人間に依存しない大規模言語モデルのための新しい強化学習フレームワークを提案する。
代わりに、我々のアプローチでは、モデル自体内のクロスアテンション信号を使用して、自己教師付き報酬を導き出す。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 18:56:58 GMT)
A Scalable Framework for Post-Quantum Authentication in Public Key Infrastructures [0.0] 本研究は,自動証明書発行を伴う階層型認証機関フレームワークの性能と拡張性について検討する。
このシステムは、古典的アルゴリズムとPQCアルゴリズムの両方との互換性を念頭に設計されており、量子ベースの脅威に対する堅牢なセキュリティを確保しながら、暗号アジェリティを促進している。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 13:18:11 GMT)
A Method for Handling Negative Similarities in Explainable Graph Spectral Clustering of Text Documents -- Extended Version [0.0] 本稿では,従来の用語ベクトル空間とは異なる文書埋め込みから生じる,負の類似性を持つグラフスペクトルクラスタリングの問題について検討する。
実験により,本研究において提案される6つの異なる解の利点と欠点が示された。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 06:03:02 GMT)
A Framework for Information Disorder: Modeling Mechanisms and Implications Based on a Systematic Literature Review [0.0] 本稿では,情報障害のフルライフサイクルを捉えた5段階のフレームワークを提案する。
このアプローチでは、断片化された介入から、より包括的でシステムレベルのポリシーレスポンスへの移行が求められます。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 23:57:21 GMT)
A Computational Framework for Efficient Model Evaluation with Causal Guarantees [0.0] 与えられた評価モデルの一般化誤差と一般化因果効果誤差の上限を証明した。
また,提案手法の効率性や,推定因果効果の予測値との整合性についても検証した。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 07:26:19 GMT)
$q$-Heisenberg Algebra in $\otimes^{2}-$Tensor Space [0.0] テンソル積空間 $otimes2$ に$q$-ハイゼンベルク代数を導入する。
我々の結果は、$q$の変形代数における既知の構成を拡張し、非可換な設定における函数解析に関する新しい洞察を提供する。
論文参考訳(メタデータ) (Wed, 16 Apr 2025 02:13:32 GMT)