Overview of AI and Communication for 6G Network: Fundamentals, Challenges, and Future Research Opportunities [148.6] 人工知能(AI)と第6世代(6G)ネットワークのための通信の統合は、革命的アーキテクチャとして現れつつある。
本稿では,6GネットワークにおけるAIとコミュニケーションの概要を概観し,基本原理,固有の課題,今後の研究機会を強調した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:36:34 GMT)
SoK: Watermarking for AI-Generated Content [112.9] ウォーターマーキングスキームは、AI生成コンテンツに隠された信号を埋め込んで、信頼性の高い検出を可能にする。
透かしは、誤情報や偽造と戦ってAIの安全性と信頼性を高める上で重要な役割を果たす。
本研究の目的は、研究者が透かし法や応用の進歩を指導し、GenAIの幅広い意味に対処する政策立案者を支援することである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:49:00 GMT)
Large Language Models can Learn Rules [106.4] 大規模言語モデル(LLM)を用いた推論のためのルールライブラリを学習するフレームワークであるHtTを提案する。
リレーショナル推論、数値推論、概念学習に関する実験は、HtTが既存のプロンプト法を改善することを示す。
学習されたルールは、異なるモデルや同じ問題の異なる形式にも転送可能である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:16:27 GMT)
LLMs instead of Human Judges? A Large Scale Empirical Study across 20 NLP Evaluation Tasks [106.1] 人間の判断の代わりにLPMを用いてNLPモデルを評価する傾向が高まっている。
JUDGE-BENCHは20個のNLPデータセットのコレクションで、人間のアノテーションで、幅広い評価された特性やデータの種類をカバーしています。
アノテーションを複製できるため、オープンウェイトモデルとプロプライエタリモデルの両方をカバーする11の現在のLCMを評価します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:07:09 GMT)
AutoTrust: Benchmarking Trustworthiness in Large Vision Language Models for Autonomous Driving [106.0] 自動運転における大規模ビジョン言語モデル(DriveVLM)のための総合的信頼度ベンチマークであるAutoTrustを紹介する。
シナリオを駆動する際の信頼性問題を調べるために,最も大きな視覚的質問応答データセットを構築した。
私たちの評価では、DriveVLMの脆弱性を信頼性の脅威に対して明らかにしました。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:33 GMT)
DiffusionTrend: A Minimalist Approach to Virtual Fashion Try-On [103.9] DiffusionTrendは、事前情報に富んだ潜伏情報を利用して、衣服の詳細のニュアンスをキャプチャする。
視覚的に魅力的な試行体験を提供し、トレーニング不要の拡散モデルの可能性を強調します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:24:35 GMT)
VISA: Retrieval Augmented Generation with Visual Source Attribution [100.8] RAGの既存のアプローチは主に生成されたコンテンツをドキュメントレベルの参照にリンクする。
本稿では,視覚的ソース属性と解答生成を組み合わせた新しい手法として,視覚的ソース属性を用いた検索補助生成(VISA)を提案する。
本手法の有効性を評価するため,ウィキペディアのWebページスクリーンショットをクロールしたWiki-VISAとPubLayNetから派生したPaper-VISAの2つのデータセットを作成した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:17:35 GMT)
Efficient Fine-Tuning and Concept Suppression for Pruned Diffusion Models [93.8] 本稿では,2段階の拡散モデルに対する新しい最適化フレームワークを提案する。
このフレームワークは、微調整と未学習のプロセスを統一的なフェーズに統合する。
様々なプルーニングや概念未学習の手法と互換性がある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:13:18 GMT)
HashAttention: Semantic Sparsity for Faster Inference [91.5] HashAttentionは、推奨問題としてピボットトークンの識別をキャストする原則的なアプローチである。
ビットワイズ演算を用いて、このハミング空間における所定のクエリに対する重要なトークンを効率的に識別する。
これはLongBenchとLlama-3.1-8Bモデルの1/32times$で使用されるトークンの数を減らすことができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:34:15 GMT)
IntroStyle: Training-Free Introspective Style Attribution using Diffusion Features [90.0] 本稿では,拡散モデルのみによって生成された特徴を用いて,スタイル帰属問題を解決するための学習自由フレームワークを提案する。
これはイントロスペクティブなスタイル属性(IntroStyle)と表現され、スタイル検索の最先端モデルよりも優れたパフォーマンスを示す。
また,芸術的スタイルを分離し,きめ細かなスタイル帰属性能を評価するために,スタイルハック(SHacks)の合成データセットも導入した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:21:23 GMT)
Agent Planning with World Knowledge Model [88.5] エージェント計画を容易にするためにパラメトリック世界知識モデル(WKM)を導入する。
我々はWKMを開発し,グローバルプランニングと動的状態知識を指導し,地域プランニングを支援する。
本手法は, 各種の強靭なベースラインと比較して, 優れた性能が得られる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:35:48 GMT)
Data for Mathematical Copilots: Better Ways of Presenting Proofs for Machine Learning [85.6] 我々は,大規模言語モデルの能力向上には,数学的データセットの設計におけるパラダイムシフトが必要であると論じる。
1949年にG. P'olyaが導入した「動機付き証明」の概念は、より良い証明学習信号を提供するデータセットの青写真として機能する。
数学データセットに特化して設計されたアンケートでは、クリエーターにデータセットを含めるよう促します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:55:17 GMT)
Video-RAG: Visually-aligned Retrieval-Augmented Long Video Comprehension [83.0] Video-RAGはトレーニング不要で費用対効果の高いパイプラインで、視覚的に整列した補助テキストを使って、モダリティ間のアライメントを促進する。
72Bモデルを用いた場合,Gemini-1.5-Pro や GPT-4o などのプロプライエタリモデルよりも優れた性能を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:17:13 GMT)
Consistent Human Image and Video Generation with Spatially Conditioned Diffusion [82.4] 一貫性のある人中心画像とビデオ合成は、所定の参照画像との外観整合性を維持しつつ、新しいポーズを持つ画像を生成することを目的としている。
我々は,課題を空間条件付き塗装問題とみなし,対象画像をインペイントして参照との外観整合性を維持する。
このアプローチにより、参照機能により、統一された認知ネットワーク内でのポーズ準拠のターゲットの生成をガイドすることができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:02:30 GMT)
LlamaFusion: Adapting Pretrained Language Models for Multimodal Generation [81.8] LlamaFusionは、事前訓練されたテキストのみの大規模言語モデル(LLM)にマルチモーダル生成機能を持たせるためのフレームワークである。
LlamaFusionは画像理解を20%改善し,画像生成を3.6%改善し,FLOPの50%しか利用していない。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:56:24 GMT)
Multi-Level Optimal Transport for Universal Cross-Tokenizer Knowledge Distillation on Language Models [81.7] マルチレベル最適輸送(MultiLevelOT)は、普遍的なクロストケナイザー知識蒸留のための最適な輸送を促進する新しいアプローチである。
本手法は,教師と生徒のロジット分布をトークンレベルとシーケンスレベルの両方で整列する。
トークンレベルでは、MultiLevelOTはグローバルとローカルの両方の情報を統合する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:51:06 GMT)
Drive-1-to-3: Enriching Diffusion Priors for Novel View Synthesis of Real Vehicles [81.3] 本稿では,実世界の課題に対して,大規模な事前学習モデルを微調整するための一連の優れたプラクティスを統合する。
具体的には,合成データと実運転データとの相違を考慮に入れたいくつかの戦略を開発する。
我々の洞察は、先行芸術よりも新しいビュー合成のためのFIDを68.8%値下げする効果のある微調整につながる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:39:13 GMT)
Pitfalls of topology-aware image segmentation [81.2] 我々は、不適切な接続選択、見過ごされたトポロジカルアーティファクト、評価指標の不適切な使用を含むモデル評価における致命的な落とし穴を同定する。
本稿では,トポロジを意識した医用画像分割手法の公正かつ堅牢な評価基準を確立するための,行動可能なレコメンデーションセットを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:11:42 GMT)
LeviTor: 3D Trajectory Oriented Image-to-Video Synthesis [80.2] 本研究では,新しい次元,すなわち深度次元との相互作用を増大させ,ユーザが軌道上の各点に対して相対的な深度を割り当てることを許す。
本稿では,オブジェクトマスクを数個のクラスタポイントに抽象化することで,画像から映像への3次元トラジェクトリ制御の先駆的手法を提案する。
静的画像から実写映像を生成する際の物体の動きを正確に操作する手法であるLeviTorの有効性を検証する実験を行った。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:56 GMT)
DNS-Rec: Data-aware Neural Architecture Search for Recommender Systems [79.8] 本稿では,SRS(Sequential Recommender Systems)における計算オーバーヘッドと資源非効率性について述べる。
本稿では, プルーニング法と高度なモデル設計を組み合わせた革新的な手法を提案する。
我々の主な貢献は、リコメンダシステム(DNS-Rec)のためのデータ対応ニューラルアーキテクチャ検索の開発である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:28:19 GMT)
EnvGS: Modeling View-Dependent Appearance with Environment Gaussian [78.7] EnvGSは、環境の反射を捉えるための明示的な3D表現として、ガウスプリミティブのセットを利用する新しいアプローチである。
これらの環境を効率的にレンダリングするために,高速レンダリングにGPUのRTコアを利用するレイトレーシングベースのリフレクションを開発した。
複数の実世界および合成データセットから得られた結果は,本手法がより詳細な反射を生成することを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:57 GMT)
WISE: Rethinking the Knowledge Memory for Lifelong Model Editing of Large Language Models [78.2] 大規模言語モデル(LLM)は、成長を続ける世界の事実に適合し、幻覚的応答を修正するために知識更新を必要とする。
更新された知識が記憶にどこに存在するかは、モデル編集の基本的な問題である。
記憶のギャップを埋めるためにWISEを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:18:54 GMT)
Preventing Local Pitfalls in Vector Quantization via Optimal Transport [77.2] 我々はシンクホーンアルゴリズムを用いて最適な輸送問題を最適化する新しいベクトル量子化法であるOptVQを紹介する。
画像再構成タスクの実験では,OptVQが100%のコードブック利用を実現し,現在最先端のVQNを超越していることが示された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:58:14 GMT)
Continual Learning: Forget-free Winning Subnetworks for Video Representations [75.4] タスク性能の面でのサブネットワーク(WSN)の勝利は、様々な連続学習タスクに対して考慮される。
タスクインクリメンタルラーニング(TIL)とタスク非依存インクリメンタルラーニング(TaIL)のシナリオにおいて,既存のネットワークからの重み付けを活用して,効率的な学習を実現する。
ビデオインクリメンタルラーニング(VIL)におけるWSN内のフーリエサブニューラル演算子(FSO)の利用
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:29:38 GMT)
LongBench v2: Towards Deeper Understanding and Reasoning on Realistic Long-context Multitasks [75.0] 本稿では,LongBench v2を提案する。LongBench v2は,LLMが長期コンテキスト問題に対処する能力を評価するためのベンチマークである。
LongBench v2は、503の挑戦的な複数選択の質問で構成され、コンテキストは8kから200M語で、6つの主要なタスクカテゴリにまたがる。
我々は、品質と難易度を維持するために、自動レビュープロセスと手動レビュープロセスの両方を使用し、その結果15分間の制約の下で、人間の専門家は53.7%の精度しか達成できなかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:17 GMT)
Agent-SafetyBench: Evaluating the Safety of LLM Agents [72.9] 我々は,大規模言語モデル(LLM)の安全性を評価するための総合ベンチマークであるAgent-SafetyBenchを紹介する。
Agent-SafetyBenchは349のインタラクション環境と2,000のテストケースを含み、安全リスクの8つのカテゴリを評価し、安全でないインタラクションで頻繁に発生する10の一般的な障害モードをカバーする。
16 名の LLM エージェントを評価した結果,いずれのエージェントも 60% 以上の安全性スコアを達成できないことがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:35:15 GMT)
Length Controlled Generation for Black-box LLMs [70.6] 大規模言語モデル (LLM) は印象的な命令に従う能力を示しているが、生成したテキストの長さを正確に管理することは困難である。
本稿では,Metropolis-Hastingsアルゴリズムと重要なサンプリング高速化戦略を組み合わせた,テキスト長制御のための新しい反復サンプリングフレームワークを提案する。
このフレームワークは,Llama3.1における長さ制御の抽象的要約などのタスクに対して,ほぼ100%の成功率を達成する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:07:38 GMT)
Metric Compatible Training for Online Backfilling in Large-Scale Retrieval [67.7] バックフィルは、画像検索システムにおいて、アップグレードされたモデルからすべてのギャラリー埋め込みを再抽出するプロセスである。
本稿では,オンラインのバックフィルアルゴリズムを提案し,バックフィル処理の進行的な性能向上を実現する。
我々は、逆変換モジュールをより効果的で効率的なマージに組み込み、メトリック互換のコントラスト学習アプローチを採用することでさらに強化する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:45:52 GMT)
Bridging the Data Provenance Gap Across Text, Speech and Video [67.7] 我々は、人気テキスト、音声、ビデオデータセットのモダリティにまたがって、最大かつ第1級の経時的監査を行う。
私たちの手動分析では、1990年から2024年の間に、608言語、798のソース、659の組織、67の国で4000近い公開データセットをカバーしています。
マルチモーダル機械学習アプリケーションは、トレーニングセットのために、YouTubeのようなWebcrawled、synthetic、ソーシャルメディアプラットフォームに圧倒的に移行した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:30:19 GMT)
Adaptive Pruning for Large Language Models with Structural Importance Awareness [66.3] 大規模言語モデル(LLM)は言語理解と生成能力を大幅に改善した。
LLMは、高い計算およびストレージリソース要求のため、リソース制約のあるエッジデバイスにデプロイするのは難しい。
モデル性能を維持しつつ,計算コストとメモリコストを大幅に削減する構造的適応型プルーニング(SAAP)を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:08:04 GMT)
ANAH-v2: Scaling Analytical Hallucination Annotation of Large Language Models [65.1] 大規模言語モデル (LLM) は、様々な領域や広範囲のアプリケーションにまたがる、長い形式の質問応答タスクにおいて幻覚を示す。
現在の幻覚検出と緩和データセットはドメインやサイズによって制限されている。
本稿では,幻覚アノテーションデータセットを同時に,段階的にスケールアップする反復的自己学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:11:47 GMT)
Progressive Multimodal Reasoning via Active Retrieval [64.7] 多段階多モーダル推論タスクは、大規模言語モデル(MLLM)に重大な課題をもたらす
本稿では,MLLMの推論能力の向上を目的とした汎用フレームワークAR-MCTSを提案する。
我々は,AR-MCTSがサンプリングの多様性と精度を最適化し,信頼性の高いマルチモーダル推論を実現することを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:25:39 GMT)
Activity Recognition on Avatar-Anonymized Datasets with Masked Differential Privacy [64.3] プライバシを保存するコンピュータビジョンは、機械学習と人工知能において重要な問題である。
本稿では,ビデオデータセット中の感性のある被験者を文脈内の合成アバターに置き換える匿名化パイプラインを提案する。
また、匿名化されていないがプライバシーに敏感な背景情報を保護するため、MaskDPを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:03:18 GMT)
Knowing Where to Focus: Attention-Guided Alignment for Text-based Person Search [64.2] 本稿では,AGM(Atention-Guided Mask)モデリングとTEM(Text Enrichment Module)という,2つの革新的なコンポーネントを備えたAGA(Atention-Guided Alignment)フレームワークを紹介する。
AGA は CUHK-PEDES と ICFG-PEDES と RSTP でそれぞれ78.36%、67.31%、67.4% に達した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:51:49 GMT)
Think&Cite: Improving Attributed Text Generation with Self-Guided Tree Search and Progress Reward Modeling [64.0] 大型言語モデル(LLM)は幻覚を起こし、事実的に誤った情報を生み出す傾向にある。
我々はThink&Citeと呼ばれる新しいフレームワークを提案し、検索と統合された多段階推論問題として属性付きテキスト生成を定式化する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:55:48 GMT)
Efficient Self-Supervised Video Hashing with Selective State Spaces [63.8] 自己監督型ビデオハッシュ(SSVH)は,ビデオインデックス作成と検索の実践的課題である。
本稿では,マンバをベースとしたビデオハッシュモデルであるS5VHを紹介する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:33:22 GMT)
LLMs Lost in Translation: M-ALERT uncovers Cross-Linguistic Safety Gaps [63.1] M-ALERTは、英語、フランス語、ドイツ語、イタリア語、スペイン語の5言語で大言語モデルの安全性を評価するベンチマークである。
M-ALERTは、ALERTの詳細な分類に従って、言語ごとの高品質なプロンプトが15kあり、合計で75kである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:46:54 GMT)
Experimental Demonstration of Logical Magic State Distillation [62.8] 中性原子量子コンピュータ上での論理量子ビットによるマジック状態蒸留の実験的実現について述べる。
提案手法では,多くの論理量子ビット上で並列に量子演算を符号化し,実行するために動的に再構成可能なアーキテクチャを用いる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:38:46 GMT)
DavIR: Data Selection via Implicit Reward for Large Language Models [62.6] DavIRは、学習後の大規模言語モデルのためのモデルベースのデータ選択手法である。
DavIRで選択したAlpacaデータセットの6%は、LLaMAモデルとGemmaモデルの両方を操り、フル52Kデータセットでトレーニングされたモデルと比較すると、優れたパフォーマンスが得られる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:54:42 GMT)
Jet: A Modern Transformer-Based Normalizing Flow [62.3] 本稿では,結合型正規化フローモデルの設計を再考する。
よりシンプルなアーキテクチャで、最先端の定量的、質的なパフォーマンスを実現しています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:09:42 GMT)
CausalDiff: Causality-Inspired Disentanglement via Diffusion Model for Adversarial Defense [61.8] 人間は、本質的な要因のみに基づいて判断するので、微妙な操作によって騙されるのは難しい。
この観察に触発されて、本質的なラベル因果因子を用いたラベル生成をモデル化し、ラベル非因果因子を組み込んでデータ生成を支援する。
逆の例では、摂動を非因果因子として識別し、ラベル因果因子のみに基づいて予測することを目的としている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:18:58 GMT)
RefHCM: A Unified Model for Referring Perceptions in Human-Centric Scenarios [60.8] RefHCM(Referring Human-Centric Model)は、人間中心の幅広い参照タスクを統合するためのフレームワークである。
RefHCMは、画像、テキスト、座標、パースマップを含む生のマルチモーダルデータをセマンティックトークンに変換するためにシーケンスマージを採用している。
この研究は、一般的なフレームワークで人間の知覚を参照しようとする最初の試みである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:51:57 GMT)
Fundamental Risks in the Current Deployment of General-Purpose AI Models: What Have We (Not) Learnt From Cybersecurity? [60.6] 大規模言語モデル(LLM)は、幅広いユースケースで急速にデプロイされている。
OpenAIs Alteraは、自律性の向上、データアクセス、実行機能の一例に過ぎない。
これらの方法には、さまざまなサイバーセキュリティ上の課題が伴う。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:44:41 GMT)
Safetywashing: Do AI Safety Benchmarks Actually Measure Safety Progress? [60.0] 我々は、より有意義な安全指標を開発するための実証的な基盤を提案し、機械学習研究の文脈でAIの安全性を定義する。
我々は、AI安全研究のためのより厳格なフレームワークを提供し、安全性評価の科学を前進させ、測定可能な進歩への道筋を明らかにすることを目指している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:39:01 GMT)
FaceXFormer: A Unified Transformer for Facial Analysis [59.9] FaceXFormerは、9つの顔分析タスクを実行することができるエンドツーエンドの統一トランスフォーマーモデルである。
これらのタスクには、顔解析、ランドマーク検出、頭部ポーズ推定、属性予測、年齢、性別、人種、表情、顔の可視性などが含まれる。
本稿では,顔トークンとタスクトークンを共同処理し,汎用的で堅牢な顔表現を学習する新しいパラメータ効率デコーダFaceXを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:48:46 GMT)
SimAvatar: Simulation-Ready Avatars with Layered Hair and Clothing [59.4] テキストプロンプトからシミュレーション可能な3次元アバターを生成するためのフレームワークであるSimAvatarを紹介する。
提案手法は, 現実的で, 完全にシミュレーション可能な3Dアバターを製作し, 現行のアプローチの能力を上回った最初の手法である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:30:08 GMT)
Next Patch Prediction for Autoregressive Visual Generation [58.7] 自動回帰画像生成のためのNPP(Next Patch Prediction)パラダイムを提案する。
私たちのキーとなるアイデアは、画像トークンを高情報密度のパッチトークンにまとめて集約することです。
パッチトークンを短い入力シーケンスとして、自己回帰モデルを訓練して次のパッチを予測することにより、計算コストを大幅に削減する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:36 GMT)
MMLU-CF: A Contamination-free Multi-task Language Understanding Benchmark [58.0] 我々は,MMLU-CFと呼ばれる汚染のない,より困難なベンチマークを提案する。
このベンチマークは、意図しないデータ漏洩と悪意のないデータ漏洩の両方を回避することで、LLMの世界の知識に対する理解を再評価する。
GPT-4o は 5 ショットスコア73.4% と 0 ショットスコア71.9% しか達成できない。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:58:04 GMT)
Self-Generated Critiques Boost Reward Modeling for Language Models [57.6] Critic-RMは、余分な監督なしに自己生成した批評を使って報酬モデルを改善するフレームワークである。
実験の結果、Critic-RMは標準報酬モデルやLLM審査員と比較して報酬モデリングの精度を3.7%-7.3%改善していることがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:50:45 GMT)
ID-Sculpt: ID-aware 3D Head Generation from Single In-the-wild Portrait Image [57.5] 従来の3Dヘッド生成法はテキスト記述によって制限されており、画像ベースの手法は高品質なヘッドジオメトリを作成するのに苦労していた。
高品質な3Dヘッドを生成できる新しいフレームワークID-Sculptを提案する。
広汎な実験により、1枚の画像から正確な形状とテクスチャで高品質な3Dヘッドを生成できることが実証された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:28:26 GMT)
QADM-Net: Quality-adaptive Dynamic Network for Reliable Multimodal Classification [57.1] 本稿では,多様なサンプルから信頼性の高い結果を提供する上で,ネットワークダイナミクスと適応性の重要性に焦点をあてる。
品質適応型動的マルチモーダルネットワーク(QADM-Net)と呼ばれるマルチモーダルな分類のための新しいフレームワークを提案する。
4つのデータセットで行った実験により、QADM-Netは分類性能において最先端の手法を大幅に上回っていることが示された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:26:51 GMT)
Taming Multimodal Joint Training for High-Quality Video-to-Audio Synthesis [56.0] マルチモーダル・ジョイント・トレーニング・フレームワークであるMMAudioを用いて、高品質で同期化された音声、ビデオ、オプションのテキスト条件を合成することを提案する。
MMAudioは大規模で手軽に利用できるテキストオーディオデータを共同でトレーニングし、セマンティックに整合した高品質なオーディオサンプルを生成する。
MMAudioはテキスト・オーディオ・ジェネレーションにおいて驚くほどの競争力を発揮し、ジョイントトレーニングが単一モダリティのパフォーマンスを妨げないことを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:55 GMT)
Understanding the Dark Side of LLMs' Intrinsic Self-Correction [55.5] LLMの応答を改善するために,本質的な自己補正法が提案された。
近年の研究では、LLMの内在的な自己補正は、フィードバックのプロンプトとして、オラクルラベルなしで失敗することが示されている。
内在的な自己補正は、中途半端な回答と最終回答の両方を LLM が揺らぎ、単純な事実的質問に対する素早い偏見をもたらす可能性がある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:39:31 GMT)
Can Modern LLMs Act as Agent Cores in Radiology Environments? [54.4] 大規模言語モデル(LLM)は、様々な領域にわたる精度と解釈性の向上を提供する。
本論文は, コンクリートラジオロジー剤構築の前提条件について検討することを目的とする。
LLMをベースとしたエージェントのための総合的な総合的総合評価データセットRadABench-Dataを提案する。
第二にRadABench-EvalPlatは、プロンプト駆動ワークフローを特徴とするエージェントのための新しい評価プラットフォームである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:05:27 GMT)
Spectral Motion Alignment for Video Motion Transfer using Diffusion Models [54.3] スペクトル運動アライメント(英: Spectral Motion Alignment、SMA)は、フーリエ変換とウェーブレット変換を用いて運動ベクトルを洗練・整列するフレームワークである。
SMAは周波数領域の正規化を取り入れて動きパターンを学習し、全体フレームのグローバルな動きのダイナミクスの学習を容易にする。
大規模な実験は、様々なビデオカスタマイズフレームワーク間の計算効率と互換性を維持しながら、モーション転送を改善するSMAの有効性を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:30:55 GMT)
Prompt-A-Video: Prompt Your Video Diffusion Model via Preference-Aligned LLM [54.2] テキスト・ビデオ・モデルは高品質のテキスト・ビデオ・ペアを最適化することで顕著な進歩を遂げた。
現在の精製の自動化手法は、モダリティ・一貫性、コスト分散、モデルウナウエアといった課題に直面する。
Prompt-A-Videoは、特定のビデオ拡散モデルに合わせた、ビデオ中心、労働自由、調整されたプロンプトの製作に優れる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:32:21 GMT)
Quantized Decentralized Stochastic Learning over Directed Graphs [54.0] 有向グラフ上で通信する計算ノード間でデータポイントが分散される分散学習問題を考える。
モデルのサイズが大きくなるにつれて、分散学習は、各ノードが隣人にメッセージ(モデル更新)を送信することによる通信負荷の大きなボトルネックに直面します。
本稿では,分散コンセンサス最適化におけるプッシュサムアルゴリズムに基づく有向グラフ上の量子化分散学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:39:57 GMT)
Grimm: A Plug-and-Play Perturbation Rectifier for Graph Neural Networks Defending against Poisoning Attacks [54.0] 近年の研究では、ノード分類タスクに対する敵対的中毒攻撃に対するグラフニューラルネットワーク(GNN)の脆弱性が明らかにされている。
ここでは、最初のプラグアンドプレイディフェンスモデルであるGrimmを紹介します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:12:38 GMT)
ScopeQA: A Framework for Generating Out-of-Scope Questions for RAG [52.3] 会話AIエージェントはRetrieval Augmented Generation(RAG)を使用して、ユーザからの問い合わせに対して検証可能なドキュメント地上応答を提供する。
本稿では,多様な境界線外質問を効率よく生成する,ガイド付き幻覚に基づく新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:49:04 GMT)
Multimodal Latent Diffusion Model for Complex Sewing Pattern Generation [52.1] テキストプロンプト,体形,着物スケッチによって制御される縫製パターンを生成するマルチモーダル生成モデルであるSwingLDMを提案する。
潜伏空間における縫製パターンの分布を学習するために,2段階のトレーニング戦略を設計する。
総合的定性的および定量的実験により,提案手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:05:28 GMT)
M$^3$-VOS: Multi-Phase, Multi-Transition, and Multi-Scenery Video Object Segmentation [51.8] 本稿では,その視覚的特徴と潜在的な形態的・外見的変化に基づいて,現実世界の物体を分類するセグメンテーションにおける位相の概念を紹介する。
本稿では,Multi-Phase,Multi-Transition,Multi-Scenery Video Object (M$3$-VOS) という新しいベンチマークを提案し,モデルが対象相を理解する能力を検証する。
本稿では,リバーサルリファインメントによりその性能を向上させる新しいプラグアンドプレイモデルであるReVOSを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:31:34 GMT)
MRWeb: An Exploration of Generating Multi-Page Resource-Aware Web Code from UI Designs [50.3] マルチページリソース対応Webページ(MRWeb)生成タスクは、UIデザインをマルチページ、内部/外部ナビゲーション、イメージローディング、バックエンドルーティングを備えた機能的なWebUIに変換する。
本稿では,500のWebサイト(300の合成,200の現実世界)を新たにキュレートしたデータセットを用いて既存のMRWeb問題に適用する。特に,Web UIの類似性を評価し,MRWeb生成に対するリソースリストの影響を評価し,MLLMの制約を分析し,MRWebツールの有効性を評価する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:02:33 GMT)
Explainable Tampered Text Detection via Multimodal Large Models [49.9] 本稿では,大規模なマルチモーダルモデルを用いて,自然言語による改ざんテキスト検出の基礎を説明する。
本稿では,テキスト領域の改ざんを示す画素レベルのアノテーションを含む大規模かつ包括的なデータセットETTDを提案する。
我々はまた,GPT4oに改ざんされたテキストを認識し,OCRの精度が低い応答をフィルタリングすることを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:10:03 GMT)
AV-Link: Temporally-Aligned Diffusion Features for Cross-Modal Audio-Video Generation [49.7] AV-Linkは、ビデオ・トゥ・オーディオとオーディオ・トゥ・ビデオ生成のための統合されたフレームワークである。
バックボーンビデオとオーディオ拡散モデル間の双方向情報交換を可能にするFusion Blockを提案する。
設計選択を評価し,同期・高品質な映像コンテンツを実現するための手法の有効性を実証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:57:21 GMT)
Generative Adversarial Networks for Image Super-Resolution: A Survey [49.6] 単一画像超解像(SISR)は画像処理の分野で重要な役割を果たしている。
近年のGAN(Generative Adversarial Network)は,小サンプルを用いた低解像度画像に対して優れた結果が得られる。
本稿では,異なる視点からGANの比較研究を行う。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:08:42 GMT)
Img-Diff: Contrastive Data Synthesis for Multimodal Large Language Models [49.4] コントラスト学習と画像差分キャプションにインスパイアされた新しいデータ合成手法を提案する。
私たちのキーとなるアイデアは、マッチングと異なる要素の両方を識別するためにモデルに挑戦することです。
我々は、この生成されたデータセットを利用して、最先端(SOTA)MLLMを微調整する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:04:20 GMT)
ProsodyFM: Unsupervised Phrasing and Intonation Control for Intelligible Speech Synthesis [49.3] 韻律は、言葉の文字通りの意味を超えた豊富な情報を含んでいる。
現在のモデルでは、フレーズやイントネーションが不足している。
本稿では,韻律を意識した音声合成モデルProsodyFMを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:21:44 GMT)
SafeAligner: Safety Alignment against Jailbreak Attacks via Response Disparity Guidance [48.8] SafeAlignerは、ジェイルブレイク攻撃に対する防御を強化するためのデコード段階で実装された方法論である。
安全性を高めるために訓練されたセンチネルモデルと、よりリスクの高い応答を生成するように設計されたイントルーダモデルである。
SafeAlignerは有害なトークンの発生を低減しつつ、有益トークンの可能性を高めることができることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:37:00 GMT)
Knowledge Injection via Prompt Distillation [48.7] 本稿では,新しい知識を学習するための新しい微調整手法を提案し,RAGの性能に到達できることを示す。
提案手法は, 急速蒸留と呼ばれる自己蒸留法に基づいている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:44:01 GMT)
Learning Discretized Neural Networks under Ricci Flow [48.5] 低精度重みとアクティベーションからなる離散ニューラルネットワーク(DNN)について検討する。
DNNは、訓練中に微分不可能な離散関数のために無限あるいはゼロの勾配に悩まされる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:05:03 GMT)
Dynamic Planning for LLM-based Graphical User Interface Automation [48.3] LLMベースのGUIエージェントのための動的思考計画(D-PoT)と呼ばれる新しいアプローチを提案する。
D-PoTは環境フィードバックと実行履歴に基づいて計画の動的調整を行う。
実験の結果、提案されたD-PoTは強いGPT-4Vベースラインを+12.7%上回った。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:29:31 GMT)
SolidGS: Consolidating Gaussian Surfel Splatting for Sparse-View Surface Reconstruction [48.2] この問題に対処するために,SolidGSと呼ばれる新しい手法を提案する。
再構成された幾何は多視点では非常に不整合であることがわかった。
幾何学的正規化と単分子正規化の助けを借りて,スパース面の再構成における優れた性能を実現する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:04:43 GMT)
3D Registration in 30 Years: A Survey [48.2] 3Dポイントクラウドの登録は、コンピュータビジョン、コンピュータグラフィックス、ロボティクス、リモートセンシングなどの基本的な問題である。
本稿では,ペアワイズ粗い登録,ペアワイズ細粒度登録,マルチビュー登録,クロススケール登録,マルチインスタンス登録など,一連のサブ領域を網羅した3Dポイントクラウド登録に関する総合的な調査を行う。
本調査では, データセット, 評価指標, 方法分類, メリットとデメリットの議論, 今後の方向性についての洞察に富んだ考察を包括的に紹介する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:59:31 GMT)
VHM: Versatile and Honest Vision Language Model for Remote Sensing Image Analysis [48.1] 本稿では,リモートセンシング画像解析のためのVersatile and Honest Vision Language Model (VHM) を提案する。
VHMは、リッチコンテンツキャプション(VersaD)を備えた大規模リモートセンシング画像テキストデータセットと、事実と偽造的質問(HnstD)の両方からなる正直な命令データセット上に構築されている。
実験では,VHMはシーン分類,視覚的質問応答,視覚的接地といった共通タスクにおいて,様々な視覚言語モデルよりも優れていた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:46:40 GMT)
Quantifying detection rates for dangerous capabilities: a theoretical model of dangerous capability evaluations [47.7] 危険なAI能力を時間とともに追跡する定量的モデルを提案する。
私たちのゴールは、ポリシーと研究コミュニティが、いかに危険な能力テストがAIのリスクに近づくかを早期に警告できるかを可視化するのを支援することです。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:31:34 GMT)
Generative Multiview Relighting for 3D Reconstruction under Extreme Illumination Variation [47.7] 異なる環境で撮影された写真から物体の形状や外観を再構成することは困難である。
異なる照明下で撮影された画像からオブジェクトを再構成する手法を提案する。
提案手法を合成データと実データの両方で検証し,既存の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:51 GMT)
IDOL: Instant Photorealistic 3D Human Creation from a Single Image [47.5] この作業は、データセット、モデル、表現の観点からタスクを再考する。
大規模なHUman中心のGEnerated GEnerated データセットであるHuGe100Kを紹介した。
我々は、与えられた人間の画像から一様空間における3次元ガウス表現を予測するスケーラブルなフィードフォワードトランスフォーマーモデルを開発した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:43:05 GMT)
Re-evaluating Group Robustness via Adaptive Class-Specific Scaling [47.4] 群分散ロバスト最適化は、スプリアス相関とアドレスデータセットバイアスを軽減するために使われる顕著なアルゴリズムである。
既存のアプローチでは、堅牢なアキュラシーの改善が報告されているが、固有のトレードオフのため、平均的な精度が犠牲になっている。
本稿では,既存のデバイアスアルゴリズムに直接適用可能なクラス固有のスケーリング戦略を提案する。
我々は、このトレードオフを軽減するために、インスタンスワイド適応スケーリング技術を開発し、堅牢性と平均的アキュラシーの両方の改善に繋がる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:01:51 GMT)
Knowledge Circuits in Pretrained Transformers [47.3] 現代の大言語モデルが知識をいかに保存するかという内部的な研究は、長い間、研究者の間で激しい関心と調査の対象となっていた。
本稿では,言語モデルのグラフを掘り下げて,特定の知識を明確にするための知識回路を明らかにする。
これらの知識回路に対する現在の知識編集技術の影響を評価し,これらの編集手法の機能や制約についてより深い知見を提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:10:00 GMT)
CORD: Balancing COnsistency and Rank Distillation for Robust Retrieval-Augmented Generation [47.1] 本稿では, 増量蒸留による整合正則化を提案する。
我々は,Consistency と Rank Distillation のバランスをとる CORD を提案する。
実証的な結果は、このバランスにより、CORDは様々なRAGベンチマークにおいて一貫して性能を向上できることを示している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:01:25 GMT)
Fast and Efficient: Mask Neural Fields for 3D Scene Segmentation [47.1] 本稿では,新しい視点から3次元オープン語彙セグメンテーションを実現するMaskFieldを提案する。
MaskFieldは、マスクの特徴フィールドとクエリを定式化することによって、基礎モデルからマスクと意味的特徴の蒸留を分解する。
実験の結果,MaskFieldは従来の最先端手法を超越するだけでなく,極めて高速な収束を実現することがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:16:19 GMT)
EarthDial: Turning Multi-sensory Earth Observations to Interactive Dialogues [46.6] EarthDialは、地球観測(EO)データ用に特別に設計された会話アシスタントである。
複雑な多感覚地球観測を対話的な自然言語対話に変換する。
EarthDialはマルチスペクトル、マルチテンポラル、マルチレゾリューション画像をサポートする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:57:13 GMT)
AceMath: Advancing Frontier Math Reasoning with Post-Training and Reward Modeling [46.5] AceMathは、複雑な数学問題の解法に優れたフロンティア数学モデルのスイートである。
我々は報酬モデルとしてAceMath-72B-InstructとAceMath-72B-RMを開発した。
AceMath-72B-RMとAceMath-72B-RMを組み合わせると、数学推論ベンチマークの平均rm@8スコアが得られる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:29:44 GMT)
Disentangling Reasoning Tokens and Boilerplate Tokens For Language Model Fine-tuning [46.4] 特に、トークンとボイラープレートトークンの推論は、重要性と学習の複雑さにおいて大きく異なります。
本稿では,適応トークン識別のための新しいShuffle-Aware Discriminator (SHAD)を提案する。
SHADを用いて、微調整中の推論トークンを適応的に強調するReasoning-Highlighted Fine-Tuning (RFT)法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:06:24 GMT)
Diff-Shadow: Global-guided Diffusion Model for Shadow Removal [46.4] シャドー除去のためのグローバル誘導拡散モデルDiff-Shadowを提案する。
影のない復元を実現するために,拡散モデルとグローバルガイダンスの利点を組み合わせる。
ISTDデータセットでは,PSNRが32.33dBから33.69dBに向上した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:50:06 GMT)
DirectorLLM for Human-Centric Video Generation [46.4] ビデオ内の人間のポーズを整理するために,大規模言語モデル(LLM)を用いた新しいビデオ生成モデルである DirectorLLM を紹介する。
我々のモデルは、人間の動きの忠実度を高め、迅速な忠実度を向上し、被写体自然性を向上する上で、既存のものよりも優れています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:10:26 GMT)
GURecon: Learning Detailed 3D Geometric Uncertainties for Neural Surface Reconstruction [46.3] 本稿では,幾何整合性に基づく神経表面の幾何不確実性場を確立する新しいフレームワークGUReconを提案する。
様々なデータセットの実験は、GUReconの3次元幾何学的不確かさのモデル化における優位性を示している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:15:03 GMT)
Revisiting Machine Unlearning with Dimensional Alignment [46.3] そこで本研究では,未知の固有空間間のアライメントを計測し,データセットの保持を行う,機械学習のための新しい評価基準を提案する。
筆者らの枠組みは, 忘れ物から情報を効果的に排除し, 保持物から知識を保存している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:48:59 GMT)
Towards Scalable and Deep Graph Neural Networks via Noise Masking [45.4] グラフニューラルネットワーク(GNN)は多くのグラフマイニングタスクで顕著に成功している。
計算とストレージのコストが高いため、大きなグラフにスケールすることは困難です。
既存のモデル単純化作業と互換性のあるプラグアンドプレイモジュールであるノイズマスキング(RMask)を用いたランダムウォークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:48:14 GMT)
Universal quantum computation via scalable measurement-free error correction [45.3] 本研究では,中間回路計測を行なわずに誤り訂正を行うシナリオにおいて,普遍的な量子計算をフォールトトレラントにすることができることを示す。
論理的な$mathitCCZ$ゲートを実現するため,Bacon-Shor符号の無測定変形プロトコルを導入する。
特に,回路レベルのエラーレートが10~3ドル以下であれば,破れない論理性能が達成可能であることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:55:44 GMT)
Dissipation-induced Quantum Homogenization for Temporal Information Processing [45.0] 量子貯水池は、ハミルトニアンパラメータの精密な制御や微調整なしに、情報処理やターゲット時系列生成に量子システムの複雑なリアルタイム散逸ダイナミクスを利用するため、大きなポテンシャルを持つ。
本稿では, 分散量子ホモジェナイザーを代替プラットフォームとして提案し, 貯水池力学の必要十分かつ十分な条件 – 安定性と収縮性 – を満たすことを証明する。
その結果、核磁気共鳴アンサンブルまたはフォトニック系として物理的に実装可能な量子均質化プロトコルが、貯水池コンピュータとして機能する可能性が示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:42:10 GMT)
All-in-One Tuning and Structural Pruning for Domain-Specific LLMs [44.7] ATP-オールインワンチューニングと構造プランニングを統一した1段階構造プランニングと微細チューニングのアプローチとして提案する。
ATPは、法律および医療分野におけるタスクにおいて、最先端の2段階のプルーニング手法より優れている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:41:40 GMT)
A parametric algorithm is optimal for non-parametric regression of smooth functions [44.3] PADUAは、この設定に最適なサンプル複雑性を持つ最初のパラメトリックアルゴリズムである。
PADUAは最先端の手法に匹敵する性能を示すが,計算時間はごくわずかである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:22:52 GMT)
Exploring Scalability of Self-Training for Open-Vocabulary Temporal Action Localization [44.0] 時間的行動ローカライゼーション(OV-TAL)のためのラベルなしYouTubeビデオによる自己学習のスケーラビリティについて検討する。
提案手法は,(1)分類に依存しない行動ローカライザを人間のラベル付きtalデータセット上でトレーニングし,未ラベル付きビデオの擬似ラベルを生成し,(2)大規模擬似ラベル付きデータセットを用いてローカライザのトレーニングを行う。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:07:44 GMT)
Enhanced Entanglement in the Measurement-Altered Quantum Ising Chain [43.8] 局所的な量子測定は単に自由度を乱すのではなく、システム内の絡みを強める可能性がある。
本稿では,局所測定の有限密度が与えられた状態の絡み合い構造をどのように修正するかを考察する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:20:33 GMT)
Lightning IR: Straightforward Fine-tuning and Inference of Transformer-based Language Models for Information Retrieval [43.4] 検索シナリオにトランスフォーマーベースの言語モデルを適用するための,使い易いフレームワークであるLightning IRを紹介する。
Lightning IRは、細調整やインデックス付けから検索と再ランク付けまで、検索パイプラインのすべてのステージをサポートするモジュラーとアーキテクチャを提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:08:31 GMT)
UltraEdit: Instruction-based Fine-Grained Image Editing at Scale [43.2] 本稿では,大規模(約400万の編集サンプル)な画像編集のためのデータセットを自動生成するUltraEditを提案する。
私たちのキーとなるアイデアは、InstructPix2PixやMagicBrushといった既存の画像編集データセットの欠点に対処し、大規模で高品質な画像編集サンプルを作成するための体系的なアプローチを提供することです。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:42:41 GMT)
PC-BEV: An Efficient Polar-Cartesian BEV Fusion Framework for LiDAR Semantic Segmentation [42.9] 本稿では,ハイパフォーマンスを実現するためにマルチビュー融合が不可欠である,という一般的な概念に挑戦する。
ポラリとカルテシアンの分配戦略を直接融合させることで, 顕著な利得を実現することができることを示す。
提案手法は高密度な特徴融合を促進し, 疎点に基づく代替手法と比較して, よりリッチな文脈情報を保存する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:12:15 GMT)
Dehallucinating Parallel Context Extension for Retrieval-Augmented Generation [42.8] 大規模言語モデル(LLM)は、検索強化世代(RAG)の統合にもかかわらず、幻覚情報を生成することができる
本稿では,文脈認識型ネガティブトレーニングと情報校正アグリゲーションによる幻覚問題を緩和するDePaCを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:37:11 GMT)
Stack Trace Deduplication: Faster, More Accurately, and in More Realistic Scenarios [42.8] 大規模なソフトウェアシステムでは、エラーが発生した時に人による記述が書かれた完全なバグレポートは存在しないことが多い。
この場合、開発者はスタックトレース、すなわち一連の関数呼び出しに頼り、エラーを引き起こした。
近年の研究では、これに対する強力な深層学習に基づくアプローチが提案されているが、実際のカテゴリーから独立して評価され、比較されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:48:17 GMT)
HarmonicEval: Multi-modal, Multi-task, Multi-criteria Automatic Evaluation Using a Vision Language Model [42.6] 視覚言語モデル(VLM)は、テキストや画像理解において印象的な能力を示している。
VLMが生成したテキストを評価するための既存のメトリクスは、全体的な品質にのみフォーカスする。
本研究では,評価基準のない評価指標であるHarmonicEvalを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:03:16 GMT)
Quantum Homogenization as a Quantum Steady State Protocol on NISQ Hardware [42.5] 量子ホモジェナイゼーション(quantum homogenization)は、貯水池に基づく量子状態近似プロトコルである。
我々は、標準的な量子同化プロトコルを、動的に等価(mathttSWAP$)$alpha$の定式化に拡張する。
提案プロトコルは,コード部分空間の修正が可能な完全正のトレース保存(CPTP)マップを生成する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:50:54 GMT)
BayLing 2: A Multilingual Large Language Model with Efficient Language Alignment [42.2] 本稿では,ハイソース言語から低ソース言語へ効率的に生成能力と知識を伝達するBayLing 2を紹介する。
100以上の言語にまたがる多言語翻訳では、BayLingは同様のスケールのオープンソースモデルよりも優れたパフォーマンスを示している。
BayLingのデモ、ホームページ、コード、モデルが利用可能だ。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:11:46 GMT)
Multi-Scale Contrastive Learning for Video Temporal Grounding [42.2] 自然言語クエリに関連する映像モーメントをローカライズする時間的グラウンドリングは、視覚言語学習とビデオ理解の中核的な問題である。
本稿ではビデオモーメント間の有能な意味を捉えるための対照的な学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:53:53 GMT)
An $\mathbf{L^*}$ Algorithm for Deterministic Weighted Regular Languages [41.9] 我々は、FSAを学習するためのAngluin (1987) $mathbfL*$アルゴリズムの重み付き変種を示す。
我々は、$mathbfL*$がターゲット言語に対して最小限のオートマトンを直接学習する方法を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:57:05 GMT)
Arti-PG: A Toolbox for Procedurally Synthesizing Large-Scale and Diverse Articulated Objects with Rich Annotations [41.5] 本稿ではArticulated Object Procedural Generation Toolbox(Articulated Object Procedural Generation Toolbox)を提案する。
Arti-PGは26種類の音節オブジェクトの手続き生成をサポートし、視覚と操作タスクの両方でアノテーションを提供する。
Arti-PGツールボックスをコミュニティで使用するために公開します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:48:51 GMT)
Recoverable Compression: A Multimodal Vision Token Recovery Mechanism Guided by Text Information [41.5] トレーニングを必要としないテキスト情報誘導動的視覚トークン回復機構を提案する。
提案手法は,視覚トークンを平均10%まで圧縮しながら,従来の手法に匹敵する性能を実現する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:26:04 GMT)
Motion-aware Contrastive Learning for Temporal Panoptic Scene Graph Generation [41.0] 本研究では,時間的シーングラフ生成のための動きパターンに着目したコントラスト表現学習フレームワークを提案する。
我々の枠組みは,類似の主題関係オブジェクト三重項のマスクチューブの近接表現をモデルに学習させることを奨励する。
また、同じビデオに属するマスクチューブの遠隔表現も学習します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:48:45 GMT)
Disentangled Motion Modeling for Video Frame Interpolation [40.8] ビデオフレーム補間(VFI)は、既存のフレーム間の中間フレームを合成し、視覚的滑らかさと品質を高めることを目的としている。
中間動作モデリングに着目して視覚的品質を高めるVFIの拡散に基づく手法であるDistangled Motion Modeling (MoMo)を導入する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:05:58 GMT)
TurboSVM-FL: Boosting Federated Learning through SVM Aggregation for Lazy Clients [40.7] TurboSVM-FLは、クライアント側で追加の計算負荷を発生させることのない、新しい統合集約戦略である。
我々は、FEMNIST、CelebA、シェークスピアを含む複数のデータセット上でTurboSVM-FLを評価する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:15:27 GMT)
Overcoming the Zero-Rate Hashing Bound with Holographic Quantum Error Correction [40.7] バイアスノイズの下で最適な量子コードを見つけることは難しい問題である。
この能力のベンチマークは ハッシュ・バウンドによって与えられる
双曲型テンソルネットワークから構築したゼロレートホログラフィック符号が両方の条件を満たすことを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:33:16 GMT)
Learning from Linear Algebra: A Graph Neural Network Approach to Preconditioner Design for Conjugate Gradient Solvers [40.7] 大規模線形系は現代の計算科学と工学においてユビキタスである。
深層学習モデルは線形解法の反復中に非線形プレコンディショナーとして使用できる。
小グラフニューラルネットワーク(GNN)は、プリコンディショナーを設計するための有望なツールであることが示されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:32:43 GMT)
Sign-IDD: Iconicity Disentangled Diffusion for Sign Language Production [40.7] Sign-IDDは、関節間の相対的な位置のギャップを埋める新しいIconicity Disentanglement (ID)モジュールを組み込んでいる。
IDモジュールは従来の3D関節表現を4D骨表現に切り離す。
属性分離層は骨方向と長さ特性を分離することを目的としており、属性制御層はポーズ生成を導くように設計されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:12:19 GMT)
Sliding Windows Are Not the End: Exploring Full Ranking with Long-Context Large Language Models [40.2] LLM(Long-context Language Models)は、単一の推論内で全ての節の完全なランク付けを可能にする。
教師付き微調整環境において,LLMの完全ランク付けにより優れた性能が得られることを示す。
本稿では,リストワイドなラベル構築手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:44:59 GMT)
LiON: Learning Point-wise Abstaining Penalty for LiDAR Outlier DetectioN Using Diverse Synthetic Data [40.1] LiDARに基づくセマンティックシーン理解は、現代の自律運転認識スタックにおいて重要なモジュールである。
LiDARポイントクラウドのアウトリーチポイントを特定することは、意味的に豊富な情報が不足しているため、難しい。
我々の解決策は、不適切なカテゴリの選択を控えるという基本的な考え方に基づいているが、マージンベースの損失を伴うポイントワイドなペナルティを学習する。
我々は,異なる種類の(合成された)アウトレイアに対して,ポイントワイドなペナルティ以外の異なる禁罰を学習することが,パフォーマンスをさらに向上させることを示した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:31:05 GMT)
Efficient Neural Network Encoding for 3D Color Lookup Tables [40.1] 3Dカラールックアップテーブル(LUT)は、入力RGB値を特定の出力RGB値にマッピングすることで、正確な色操作を可能にする。
LUTは、ビデオ編集、カメラ内処理、写真フィルター、コンピュータグラフィックス、ディスプレイのカラー処理など、様々な用途で有効である。
この研究は、数百のLUTを単一のコンパクト表現でエンコードできるニューラルネットワークアーキテクチャを開発することを目的としている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:41:26 GMT)
Ultralight dark matter detection with levitated ferromagnets [40.0] 印加された交流磁場に対する強磁性体の応答について検討する。
既存の誘電体強磁性体は、既に軸-電子結合に匹敵する感度を持つことを示す。
将来の設定は、軸-電子カップリング、暗-光子運動混合、および軸-光子カップリングの感度の高いプローブとなる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:39:40 GMT)
S$^{2}$FT: Efficient, Scalable and Generalizable LLM Fine-tuning by Structured Sparsity [39.7] LLMのための構造化スパースファインチューニング(S$2$FT)手法のファミリーを提案する。
S$2$FTは、"スパースと密度の高い計算を選択"することでこれを達成します。
S$2$FTはトレーニングメモリを最大3$times$まで節約し、フルFTと比較して1.5-2.7$times$のレイテンシを改善することを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:47:54 GMT)
RoCOCO: Robustness Benchmark of MS-COCO to Stress-test Image-Text Matching Models [39.4] 我々はMS-COCOテストセットにテキストと画像の新しい変種を作成し、新しいデータを用いて最先端(SOTA)モデルを再評価する。
具体的には、単語を置換することでテキストの意味を変更し、視覚的なコンテキストを維持する視覚的に変化した画像を生成する。
提案したベンチマークによる評価の結果,多くのSOTAモデルの性能劣化が確認された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:34:56 GMT)
Learning Cortico-Muscular Dependence through Orthonormal Decomposition of Density Ratios [39.4] 本研究では,皮質振動と筋振動の関係をモデル化するために,密度比の正則分解に基づく統計的依存推定器の新たな応用を提案する。
本研究では,皮質筋接続から学習した固有関数が,運動と被験者を正確に分類できることを実験的に実証した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:44:23 GMT)
DI-PCG: Diffusion-based Efficient Inverse Procedural Content Generation for High-quality 3D Asset Creation [39.1] Inverse Procedural Content Generationは入力条件下で最適なパラメータを自動的に見つけることを目的としている。
一般画像からの逆PCGの新規かつ効率的な方法であるDI-PCGを提案する。
7.6Mのネットワークパラメータとトレーニングに30GPU時間しか必要とせず、パラメータを正確に回復する際の優れたパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:58:46 GMT)
WiFi CSI Based Temporal Activity Detection Via Dual Pyramid Network [38.9] WiFiによる時間的活動検出の課題に対処する。
本稿では,時間信号セマンティックスと局所感性応答を統合した効率の良いデュアルピラミッドネットワークを提案する。
553個のWiFi CSIサンプルに対して,2,114以上のアクティビティセグメントを持つデータセットを導入しました。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:00:45 GMT)
Point Cloud Semantic Segmentation with Sparse and Inhomogeneous Annotations [38.7] 弱教師付き学習におけるアノテーション間隔と不均一性の影響を解析するために、勾配サンプリング近似法に確率密度関数を導入する。
任意に分散されたスパースアノテーションで頑健に学習できる適応分布ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:38:47 GMT)
AI-Driven Mobility Management for High-Speed Railway Communications: Compressed Measurements and Proactive Handover [38.6] 高速鉄道(英語版) (HSR) の通信は、鉄道安全、運行、保守、旅客情報の提供を確実にするために重要である。
我々は,HSR通信に適したAIベースのビームレベルとセルレベルのモビリティ管理について検討する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:40:36 GMT)
AI-Enhanced Sensemaking: Exploring the Design of a Generative AI-Based Assistant to Support Genetic Professionals [38.5] 生成AIは、知識労働を変革する可能性があるが、生成AIの使用と相互作用を知識労働者がどのように想定するかを理解するためには、さらなる研究が必要である。
本研究は、ゲノム全配列(WGS)およびその他の臨床データを分析して稀な疾患診断を行う際に、遺伝専門家を支援するための生成AIアシスタントを設計することに焦点を当てた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:54:49 GMT)
Is AI Robust Enough for Scientific Research? [38.1] ニューラルネットワークは、微小摂動に対する高い感受性を示し、出力から大きく逸脱する。
この啓示は、重要な科学的計算にニューラルネットワークに依存するという隠れたリスクを露呈する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:10:05 GMT)
Quantum computation over the vibrational modes of a single trapped ion [37.7] トラップイオンシステムは、長いコヒーレンス時間と正確な量子ビット制御を備えた堅牢なプラットフォームを提供する。
閉じ込められたイオン系で生成できる量子演算は、連続可変量子系における状態準備を目的とした応用を研究するために用いられる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:38:24 GMT)
Individual assembly of two-species Rydberg molecules using optical tweezers [37.7] 我々は、光学的ツイーザを用いた個々のRb$*$Csリドベルグ分子の形成とキャラクタリゼーションを実証することにより、リドベルク分子を研究するための新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:21:16 GMT)
Coherent spin-1 dynamics encoded in the rotational states of ultracold molecules [37.7] 超低温の極性分子の回転状態は、長い放射寿命、マイクロ波-ドメイン結合、調整可能な双極子相互作用を持つ。
一対の回転状態間のコヒーレントダイナミクスは、量子磁性の単純なモデルを示し、量子ビットとして格納された量子情報を操作するために用いられる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:35:57 GMT)
CLDG: Contrastive Learning on Dynamic Graphs [37.5] グラフコントラスト学習は、統計グラフの拡張ビュー間の相互情報を最大化することにより、自己教師付き信号を構成する。
セマンティクスとラベルは拡張プロセス内で変更され、下流タスクのパフォーマンスが大幅に低下する可能性がある。
この問題に対処するため,我々はCLDGというシンプルなフレームワークを設計した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:59:24 GMT)
How to Synthesize Text Data without Model Collapse? [37.2] 合成データのモデル崩壊は、自己生成データに対する反復的なトレーニングが徐々に性能を低下させることを示している。
半合成データを得るために,人為的データに対するトークン編集を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:43:39 GMT)
Unveiling Uncertainty: A Deep Dive into Calibration and Performance of Multimodal Large Language Models [36.8] MLLM(Multimodal large language model)は、画像キャプションや視覚的質問応答といったタスクの視覚的データとテキスト的データを組み合わせたモデルである。
医療や自動運転などの分野において、適切な不確実性校正は不可欠だが難しい。
本稿では,MLLMの代表例について,様々なシナリオにおけるキャリブレーションに着目して検討する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:10:07 GMT)
An Immersive Multi-Elevation Multi-Seasonal Dataset for 3D Reconstruction and Visualization [36.5] 我々は、ジョンズ・ホプキンス・ホームウッド・キャンパスの画像集を紹介し、様々な季節、日時、複数の標高、大規模に取得した。
我々は、携帯電話やドローンカメラからカメラパラメータを効率よく回収する多段キャリブレーションプロセスを実行する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:16:07 GMT)
GeoPro-Net: Learning Interpretable Spatiotemporal Prediction Models through Statistically-Guided Geo-Prototyping [36.3] 深層学習とマルチソース時間予測のギャップを埋めるため,GeoPro-Netを提案する。
GeoPro-Netは、異なる概念の集合を本質的に学習し、それらを現実世界のケースに解釈する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:39:16 GMT)
LTLf Synthesis Under Unreliable Input [36.0] 我々は、信頼できない入力変数の場合、少なくとも anf のバックアップ仕様が満たされることを保証しながら、 anf 目標仕様の戦略を実現する問題について検討する。
1つは2EXPTIME、もう1つは信頼できない入力変数を無視する3EXPTIME、もう1つは2次量子化f(QLTLf)を利用する3つの異なる解法を考案した。
興味深いことに、理論上の最悪のケース境界は観測性能に変換されず、MSO技術は最もよく機能し、次いで信念構築と直接オートマチック操作が続く。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:54:17 GMT)
Self-Evolution Knowledge Distillation for LLM-based Machine Translation [36.0] 我々は、自己進化KDと呼ばれる蒸留戦略を提案する。
このアプローチの核心は、教師の分布と基礎的真理の1ホット分布を、事前知識として学生の分布に動的に統合することである。
実験の結果,WMT22テストセットでは,4つの翻訳方向の約1.4のSacreBLEU点が平均的に改善されていることがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:24:15 GMT)
LLM Processes: Numerical Predictive Distributions Conditioned on Natural Language [35.8] 我々のゴールは、数値データを処理し、任意の場所で確率的予測を行うレグレッションモデルを構築することである。
まず、大規模言語モデルから明示的で一貫性のある数値予測分布を抽出する戦略を探求する。
本研究では,テキストを数値予測に組み込む能力を示し,予測性能を改善し,定性的な記述を反映した定量的な構造を与える。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:25:57 GMT)
AI-Enabled Rapid Assembly of Thousands of Defect-Free Neutral Atom Arrays with Constant-time-overhead [35.6] 本稿では,AI対応,高速,定時オーバヘッド・アレンジメントプロトコルを提案する。
最大2024個の原子からなる欠陥のない2Dおよび3D原子配列を一定時間60msで組み立てる実験を行った。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:56:28 GMT)
Towards Friendly AI: A Comprehensive Review and New Perspectives on Human-AI Alignment [35.6] フレンドリーAI(FAI)は、AIのより公平で公平な開発を提唱するために提案されている。
本稿では、FAIの概観を概観し、その開発に対する理論的視点と反対的視点に焦点をあてる。
主要なアプリケーションは、XAI、プライバシ、公平性、情緒的コンピューティングの観点から議論される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:56:08 GMT)
Guiding a Diffusion Model with a Bad Version of Itself [35.6] 非条件モデルではなく、より小さく、訓練の少ないモデル自体を用いて、生成を誘導することで、画像品質の変動量を補うことなく、画像品質を制御できることを示す。
これによりImageNetの生成が大幅に改善され、64x64で1.01、公開ネットワークで512x512で1.25のFIDが設定された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:43:11 GMT)
Active Geospatial Search for Efficient Tenant Eviction Outreach [35.5] 本稿では,AGS(Active Geospatial Search)モデリングフレームワークを提案する。
AGSは、不動産レベルの情報を検索ポリシーに統合し、貸し出しユニットのシーケンスをキャンバスに識別し、その排除リスクを決定する。
提案手法は,基本手法よりも退行事例の逐次同定に有効であることが実証された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:40:36 GMT)
PA-RAG: RAG Alignment via Multi-Perspective Preference Optimization [35.5] 検索拡張世代(RAG)は、大規模言語モデル(LLM)における時代遅れおよび幻覚的内容の問題を軽減する。
RAGジェネレータは、不適切な応答情報、応答堅牢性、および励振品質に悩まされることが多い。
本稿では,PA-RAG要求を包括的に整合させるため,複数視点優先アライメント(PA-RAG)を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:18:51 GMT)
GaraMoSt: Parallel Multi-Granularity Motion and Structural Modeling for Efficient Multi-Frame Interpolation in DSA Images [35.4] Digital Subtraction Angiography (DSA) 画像は複雑な血管構造と様々な動きを含んでいる。
自然シーンビデオフレーム補間法(VFI)を適用すると、動きのアーティファクト、構造的散逸、ぼやけが生じる。
MoSt-DSAはこれらの問題に初めて対処し、SOTAの結果を得た。
我々は,これらの問題に同じ計算時間スケールで対処するGalaMoStを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:18:57 GMT)
Improving Geometry in Sparse-View 3DGS via Reprojection-based DoF Separation [35.2] 最近の学習型マルチビューステレオモデルでは、スパースビュー3次元再構成における最先端性能が実証されている。
本研究では,不確実性の観点から位置対応型DoFを識別する手法として,再プロジェクションに基づくDoF分離を提案する。
ガウシアンの位置のDoFを分離し、対象とする制約を適用することで、幾何学的アーティファクトを効果的に抑制できることが示される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:39:28 GMT)
The Digital Ecosystem of Beliefs: does evolution favour AI over humans? [35.1] Digicoは、シミュレートされたソーシャルネットワークにおける多集団間相互作用による制御実験のための最初の進化的フレームワークである。
このフレームワークは、進化的更新によってメッセージ戦略を変えるエージェントの集団をモデル化する。
実験によると、プロパガンダ用に設計されたAIは、人間の50%が極端な信念を採用することを説得できる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:48:23 GMT)
GBRIP: Granular Ball Representation for Imbalanced Partial Label Learning [34.6] 不均衡学習のための新しいフレームワークGBRIP(Granular Ball Representation for Im Balanced)を導入する。
GBRIPは粗粒粒状球表現と多中心損失を利用して、教師なし学習を通して粒状球ベースのnfeature空間を構築する。
新たな多中心損失関数は, 粒状球内のサンプルと各中心の関係を強調することによって学習を促進する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:26:16 GMT)
ZAHA: Introducing the Level of Facade Generalization and the Large-Scale Point Cloud Facade Semantic Segmentation Benchmark Dataset [34.5] ファサードセマンティックセグメンテーションは、フォトグラムとコンピュータビジョンにおける長年の課題である。
本稿では,国際都市モデリング標準に基づく新しい階層型ファサードクラスであるLoFG(Level of Facade Generalization)を紹介する。
現在までに最大のセマンティック3Dファサードセグメンテーションデータセットであり、LoFG2とLoFG3の5クラスと15クラスで6100万のアノテートポイントを提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:45:39 GMT)
POPoS: Improving Efficient and Robust Facial Landmark Detection with Parallel Optimal Position Search [34.5] 本稿では,高精度符号化・復号化フレームワークであるParallel Optimal Position Search (POPoS)を紹介する。
Pseudo-range multilaterationは、ヒートマップエラーの修正に使われ、ランドマークのローカライゼーション精度が向上する。
1ステップの並列計算アルゴリズムを導入し、計算効率を高め、処理時間を短縮する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:21:43 GMT)
Prototypical Calibrating Ambiguous Samples for Micro-Action Recognition [34.4] MAR(Micro-Action Recognition)は、社会的相互作用における非言語コミュニケーションの一形態として重要な役割を担っているため、注目を集めている。
現在のアプローチは、広範囲のカテゴリ範囲と微妙な視覚的差異から生じる、マイクロアクションの固有のあいまいさをしばしば見落としている。
我々は,MARのあいまいさを解消し緩和するための,新しいプロトタイプキャリブレーション・アンビグラス・ネットワーク(textbfPCAN)を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:41:24 GMT)
WildSAT: Learning Satellite Image Representations from Wildlife Observations [33.7] 衛星画像と何百万ものジオタグ付き観測データを組み合わせ、市民科学プラットフォームで容易に利用できるWildSATを紹介した。
本研究では,WildSATが他の形態のクロスモーダル監視手法よりも優れた表現を実現していることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:52:25 GMT)
DocKylin: A Large Multimodal Model for Visual Document Understanding with Efficient Visual Slimming [33.4] DocKylinは文書中心のMLLMで、ピクセルレベルとトークンレベルの両方でビジュアルコンテンツをスリム化する。
本稿では,ピクセルレベルのスリム化を行うためのAPSプリプロセッシングモジュールを提案する。
また,トークンレベルスライミングを行う新しい動的トークンスライミング(DTS)モジュールを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:00:44 GMT)
Value-Spectrum: Quantifying Preferences of Vision-Language Models via Value Decomposition in Social Media Contexts [33.1] 本稿では、視覚言語モデル(VLM)の評価を目的とした、新しい視覚質問回答(VQA)ベンチマークであるValue-Spectrumを紹介する。
我々は、ビデオブラウジングをシミュレートするVLMエージェントパイプラインを設計し、TikTok、YouTube Shorts、Instagram Reelsの5万本以上のショートビデオからなるベクトルデータベースを構築した。
Value-Spectrumのベンチマークでは、VLMがバリュー指向のコンテンツをどのように扱うかについて、顕著なバリエーションが強調されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:14:07 GMT)
StrandHead: Text to Strand-Disentangled 3D Head Avatars Using Hair Geometric Priors [33.0] ストランドヘッド(StrandHead)は3次元頭部アバター生成法である。
StrandHeadが生成した3D頭部と毛髪の最先端の現実と多様性を実現することを示す。
生成された3Dヘアは、物理シミュレーションやその他の用途のために、Unreal Engineで容易に実装できる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:43:18 GMT)
Towards Projected and Incremental Pseudo-Boolean Model Counting [32.9] Pseudo-Boolean(PB)モデルカウンタは,プロジェクションとインクリメンタルモデルカウントをサポートする。
我々の評価では、PBCount2は、投影されたモデルカウントの競合するメソッドのベンチマーク数を少なくとも1.40倍、インクリメンタルモデルカウントにおける競合するメソッドの少なくとも1.18倍のベンチマークを完了した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:11:33 GMT)
SLAM3R: Real-Time Dense Scene Reconstruction from Monocular RGB Videos [32.7] SLAM3Rは、リアルタイムかつ高品質な高密度3D再構成のための、新規で効果的な単分子式RGB SLAMシステムである。
従来のポーズ最適化方式とは異なり、SLAM3Rは各ウィンドウのRGB画像から直接3Dポイントマップを回帰する。
SLAM3Rは、20FPS以上のリアルタイム性能を維持しながら、最先端の復元精度と完全性を達成することを示す実験が一貫して行われている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:23:39 GMT)
MegaPairs: Massive Data Synthesis For Universal Multimodal Retrieval [32.6] MegaPairsは視覚言語モデル(VLM)とオープンドメイン画像を利用する新しいデータ合成手法である。
実験により,MegaPairsは高品質なデータを生成し,マルチモーダルレトリバーがベースラインモデルを大幅に上回ることを示す。
このデータを使って、600万以上のトレーニングインスタンスを生成し、さまざまなサイズのモデルをトレーニングしました。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:49:55 GMT)
From Training-Free to Adaptive: Empirical Insights into MLLMs' Understanding of Detection Information [32.6] 視覚検出モデルは、きめ細かい画像の詳細を認識するのに優れている。
1つの効果的な戦略は、シンプルで効果的なテキスト形式で検出情報を注入することである。
本稿では,MLLMのテキスト検出情報に対する理解に,学習はどのような影響を与えるのか,という疑問に対処する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:25:34 GMT)
Generalization Analysis for Deep Contrastive Representation Learning [32.6] 本稿では,Deep Contrastive Representation Learningフレームワークにおける教師なしリスクの限界について述べる。
我々は損失増大手法を用いて、行列ノルムへの依存性とネットワーク深さへの暗黙的依存を減らす。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:21:35 GMT)
CodeLutra: Boosting LLM Code Generation via Preference-Guided Refinement [32.5] 大規模言語モデル(LLM)はコード生成に革命をもたらしたが、かなりのリソースを必要とし、しばしば過度に一般化する。
私たちは、正しいコード試行と間違ったコード試行の両方を活用するフレームワークであるCodeLutraを紹介します。
成功と失敗の両方から学ぶことで、CodeLutraは、高品質なコード生成へのスケーラブルで効率的なパスを提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:46:21 GMT)
Chameleon: A Data-Efficient Generalist for Dense Visual Prediction in the Wild [32.3] 大規模言語モデルは、汎用言語インタフェースと大規模事前学習の恩恵を受け、データ効率のジェネラリストを進化させてきた。
しかし、濃密な視覚予測のためにデータ効率のよいジェネラリストを構築することは、異なるタスクにまたがるラベル構造の変化が原因で、大きな課題となる。
本研究では,不明瞭なラベル構造に柔軟に適用可能な普遍モデルについて,いくつかの例を挙げて検討する。
我々は,ビデオ,3D,医療,生物学的,ユーザインタラクションタスクなど,ローショット学習が望ましい実世界のシナリオの範囲で,我々のモデルを評価した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:47:07 GMT)
PsyDraw: A Multi-Agent Multimodal System for Mental Health Screening in Left-Behind Children [32.0] 左隣の子供(LBC)は、仕事の親の移動によって深刻なメンタルヘルスに悩まされる。
本稿では,HTP図面解析におけるメンタルヘルス専門家を支援するマルチモーダル大規模言語モデルに基づくマルチエージェントシステムであるPsyDrawを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:51:57 GMT)
Cirbo: A New Tool for Boolean Circuit Analysis and Synthesis [32.0] ブール回路を操作するためのオープンソースツールを提案する。
これは、様々な頻繁に使用される回路タスクに対して、既存および新規両方の効率的なアルゴリズムを実装している。
このツールは、IWLS 2024 Programming Contestの優勝に役立ちました。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:10:31 GMT)
Simulation-Free Hierarchical Latent Policy Planning for Proactive Dialogues [31.9] 本稿では,新たな対話政策計画フレームワークLDPPを紹介する。
対話記録のマイニングポリシから学習ポリシ計画まで,プロセスを完全に自動化する。
実験により,LDPPは2つの前向きシナリオにおいて既存手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:06:01 GMT)
Language Models as Continuous Self-Evolving Data Engineers [31.9] 大規模言語モデル(LLM)は、様々なタスクにおいて顕著な能力を示している。
本稿では, LLM がデータの自動生成, クリーニング, レビュー, 注釈付けにより, 自己学習を可能にする新しいパラダイムを提案する。
我々のアプローチは、LLMが継続的自己進化型データエンジニアとして機能することを示し、トレーニング後のデータ構築プロセスの時間とコストを大幅に削減する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:28:41 GMT)
EnergyMoGen: Compositional Human Motion Generation with Energy-Based Diffusion Model in Latent Space [31.9] 本稿では,エネルギーベースモデルの2つのスペクトルを含むEnergyMoGenを提案する。
クロスアテンションに基づくセマンティック・アウェア・エネルギーモデルを提案する。
この設計により、運動潜伏拡散モデルは高品質で複雑な運動を合成することができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:19:43 GMT)
LiDAR-RT: Gaussian-based Ray Tracing for Dynamic LiDAR Re-simulation [31.8] LiDAR-RTは、リアルタイムで物理的に正確なLiDARの再シミュレーションをサポートする新しいフレームワークである。
私たちの主な貢献は、効率的で効果的なレンダリングパイプラインの開発です。
我々のフレームワークは、フレキシブルなシーン編集操作と様々なセンサー構成でリアルなレンダリングをサポートしています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:58:36 GMT)
DynamicKV: Task-Aware Adaptive KV Cache Compression for Long Context LLMs [31.6] 既存のKVキャッシュ圧縮手法は、タスク固有の特性を無視し、必須情報の保持を減らす固定パターンを強制する。
本研究では,各層に保持されるトークンの数を調整することで,トークン保持を動的に最適化するDynamicKVを提案する。
本手法は,LongBench上でのフルKVキャッシュ性能の85%を達成しながら,KVキャッシュサイズの1.7%しか保持しない。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:28:42 GMT)
Deep Learning-based Non-Intrusive Multi-Objective Speech Assessment Model with Cross-Domain Features [31.6] 我々はMOSA-Netと呼ばれるクロスドメイン多目的音声アセスメントモデルを提案し、同時に複数の音声アセスメント指標を推定できる。
実験の結果, 音声品質(PESQ)予測の知覚評価において, MOSA-Net は線形相関係数 (LCC) を 0.026 (0.990 vs 0.964) と 0.012 (0.969 vs 0.957) で改善できることがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:18:11 GMT)
DAMPER: A Dual-Stage Medical Report Generation Framework with Coarse-Grained MeSH Alignment and Fine-Grained Hypergraph Matching [31.2] DAMPERは、医療報告作成のための2段階のフレームワークであり、レポート作成の2段階における臨床パイプラインを模倣している。
第1段階では、MCG(MeSH-Guided Coarse-Grained Alignment)ステージは、胸部X線像の特徴と、MeSH(Messical subject Heads)特徴とを一致させて、全体的な印象の粗いキーフレーズ表現を生成する。
第2段階では、ハイパーグラフ強化ファイングラインドアライメント(HFG)ステージは、画像パッチとレポートアノテーションのためのハイパーグラフを構築し、各モダリティ内の高次関係をモデル化し、セマンティックをキャプチャするためにハイパーグラフマッチングを実行する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:23:49 GMT)
OnlineVPO: Align Video Diffusion Model with Online Video-Centric Preference Optimization [30.6] 本稿では,ビデオ拡散モデルに特化した嗜好学習手法であるOnlineVPOを紹介する。
OnlineVPOは、ビデオ報酬モデルを使用して、簡潔なビデオフィードバックをオンザフライで提供することにより、効率的かつ効率的な選好ガイダンスを提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:34:50 GMT)
Diversifying Query: Region-Guided Transformer for Temporal Sentence Grounding [30.3] 時間的文接頭辞は言語記述に関連するモーメントをローカライズすることを目的とした課題である。
最近のDETRベースのモデルは、複数の学習可能なモーメントクエリを活用することで、顕著な進歩を遂げている。
時間的文接地のための地域ガイド型TRansformer(RGTR)を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:58:15 GMT)
Efficient Few-Shot Neural Architecture Search by Counting the Number of Nonlinear Functions [29.8] 探索空間を分割するために非線形関数の数を利用する新しい数ショットNAS法を提案する。
空間を分割するためにスーパーネットの勾配を比較する必要はないため,本手法は効率的である。
さらに、空間を分割することで、各スーパーネットに必要なチャネル次元を削減できることがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:31:53 GMT)
Tracing the Roots: Leveraging Temporal Dynamics in Diffusion Trajectories for Origin Attribution [29.7] 拡散モデルは画像合成に革命をもたらし、近年は重要な研究の関心を集めている。
拡散軌跡に基づく識別アルゴリズムについて検討する。
われわれの手法は、分類に活用できるステップにまたがるパターンの存在を実証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:51:28 GMT)
Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards for Hallucination Mitigation [29.7] 自己校正型報酬(TPO)を用いた新しいToken Preference Optimizationモデルを提案する。
具体的には,生画像に条件付された生成トークンのロジスティック分布と劣化したトークンの対数分布の差として,トークンレベルのアンカレート・アンカレート・アンフレワードを導入する。
より正確なトークンレベルの最適化を実現するために,視覚認識型学習目標を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:21:01 GMT)
Quantum Algorithms for Stochastic Differential Equations: A Schrödingerisation Approach [29.7] 線形微分方程式に対する量子アルゴリズムを提案する。
アルゴリズムのゲートの複雑さは$mathcalO(dlog(Nd))$d$とサンプルサイズ$N$に依存する。
アルゴリズムはOrnstein-Uhlenbeck過程、ブラウン運動、L'evy飛行に対して数値的に検証される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:04:11 GMT)
KARRIEREWEGE: A Large Scale Career Path Prediction Dataset [29.2] 我々は500万以上のキャリアパスを含む包括的な公開データセットであるKARRIEREWEGEを紹介する。
履歴書に典型的に見られる自由テキスト入力の問題に対処するために,職名や記述を合成することで,それを強化する。
これにより、非構造化データからの正確な予測が可能になり、実際のアプリケーションの課題と密接に一致します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:02:08 GMT)
The Current Challenges of Software Engineering in the Era of Large Language Models [29.0] 本稿では,大規模言語モデル (LLM) の下でのソフトウェア開発ライフサイクル (SDLC) の見直しを目的とする。
ソフトウェア要件と設計、コーディングアシスト、コード生成のテスト、コードレビュー、コードメンテナンス、データ、トレーニング、評価を含む7つの側面から、26の重要な課題を達成しています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:10:40 GMT)
SCONE: A Novel Stochastic Sampling to Generate Contrastive Views and Hard Negative Samples for Recommendation [28.9] グラフベースのコラボレーティブフィルタリング(CF)は、レコメンダシステムにおいて有望なアプローチとして登場した。
その成果にもかかわらず、グラフベースのCFモデルは、データの分散性と負のサンプリングによる課題に直面している。
本稿では,これらの課題を克服するために,<i>Contrastive view and ii) hard NEgative sample (SCONE)を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:48:08 GMT)
ReMoE: Fully Differentiable Mixture-of-Experts with ReLU Routing [28.7] 計算予算を増大させることなく、モデルキャパシティをスケールアップするために、緩やかに活性化されたMixture-of-Experts (MoE)モデルが広く採用されている。
我々は,従来のTopK+Softmaxルーティングの簡易かつ効果的なドロップイン置換を提供する,完全に微分可能なMoEアーキテクチャであるReMoEを提案する。
ReMoEは、さまざまなモデルサイズ、専門家数、粒度のレベルにおいて、バニラTopKのMoEを一貫して上回る。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:21:20 GMT)
Outcome-Refining Process Supervision for Code Generation [28.7] 大規模言語モデルは、深いアルゴリズム推論を必要とする複雑なプログラミングタスクに苦しむ。
本稿では,成果改善自体を監督するプロセスとして扱う新しいパラダイムであるアウトカム・リフィニング・プロセス・スーパービジョンを提案する。
このアプローチは,5つのモデルと3つのデータセットに対して,平均26.9%の精度向上と42.2%の効率向上を実現している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:59:42 GMT)
DS$^2$-ABSA: Dual-Stream Data Synthesis with Label Refinement for Few-Shot Aspect-Based Sentiment Analysis [28.4] DS$2$-ABSAは、数ショットの感情分析のためのデュアルストリームデータ合成フレームワークである。
低リソース環境で多様な高品質のABSAサンプルを生成する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:39:47 GMT)
Characterising Simulation-Based Program Equilibria [28.3] Tennenholtz (2004) は、プログラムゲームに対する民意定理を証明しているが、構築された平衡は非常に不安定である。
対戦者のプログラムを実行することで動作するシミュレーションベースのプログラムについて検討する。
本研究では,共用ランダム性にアクセスできることなく,シミュレーションに基づくプログラムによってテンネンホルツの民話が達成できないことを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:41:06 GMT)
Scaling Laws for Imitation Learning in Single-Agent Games [28.3] 我々は,モデルとデータサイズを慎重にスケールアップすることで,シングルエージェントゲームにおける模倣学習環境に類似した改善がもたらされるかどうかを検討する。
われわれはまずAtariのさまざまなゲームについて実験を行い、その後NetHackの非常に挑戦的なゲームに焦点を当てた。
IL損失と平均戻り値は計算予算とスムーズに一致し,相関関係が強く,計算最適ILエージェントの訓練には電力法則が適用されることがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:10:18 GMT)
Differentially Private Release and Learning of Threshold Functions [27.6] 我々は、$(epsilon, delta)$微分プライベートアルゴリズムのサンプル複雑性に対して、新しい上界と下界を証明した。
完全に順序付けられたドメイン上のしきい値関数$c_x$は$c_x(y) = 1$ if $y le x$と評価され、$0$と評価される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:22:37 GMT)
ScaMo: Exploring the Scaling Law in Autoregressive Motion Generation Model [27.5] 本稿では,モーショントークン機構であるMotionQ-VAEと,テキストFS-VAE変換器を備えるスケーラブルなモーション生成フレームワークを提案する。
運動生成の文脈におけるスケーリング法則の存在を初めて確認する。
計算予算が1e18$である場合、最適なトランスフォーマーサイズ、語彙サイズ、およびデータ要求を予測する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:22:19 GMT)
Samudra: An AI Global Ocean Emulator for Climate [27.2] 我々は、最先端の気候モデルにおける海洋成分のグローバルエミュレータを構築した。
マルチディープスレベルの海洋データに基づいてトレーニングされた改良型ConvNeXt UNetアーキテクチャを使用する。
海洋エミュレータ - Samudra は, 海洋変数の深さ構造と年次変動を再現できることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:43:00 GMT)
Super-intelligence or Superstition? Exploring Psychological Factors Influencing Belief in AI Predictions about Personal Behavior [27.1] AI予測の信条は、占星術とパーソナリティ心理学に基づく予測の信条と正に相関している。
意外なことに、認知スタイルが架空のAI生成予測の信念に影響を与えているという証拠は見つからなかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:50:44 GMT)
Does VLM Classification Benefit from LLM Description Semantics? [26.7] そこで本研究では,クラス名認識効果とは無関係に機能する識別記述を学習不要に選択する手法を提案する。
提案手法では,ローカルなCLIPラベル近傍のクラスを効果的に区別する記述を同定し,分類精度を7つのデータセットで向上する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:57:59 GMT)
Selective Uncertainty Propagation in Offline RL [26.7] 我々は、有限水平オフライン強化学習(RL)の設定を考察し、動的プログラミング(DP)アルゴリズムにおいて、任意のステップhでポリシーを学習することの難しさを動機としている。
本研究では, 分散シフトの難易度に適応する信頼区間構築のための, 選択的不確実性伝播というフレキシブルで汎用的な手法を開発した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:52:07 GMT)
Smoothness Really Matters: A Simple Yet Effective Approach for Unsupervised Graph Domain Adaptation [26.7] Unsupervised Graph Domain Adaptation (UGDA)は、ラベル付きソースグラフからの知識をラベル付きターゲットグラフに転送することで、ドメイン間の分散シフトをブリッジする。
TDSS(Target-Domain Structure Smoothing)と呼ばれるUGDAのための新しいアプローチを提案する。
TDSSは、ターゲットグラフ上で直接構造的滑らか化を行うための、シンプルで効果的な方法である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:47:34 GMT)
ORBIT: Cost-Effective Dataset Curation for Large Language Model Domain Adaptation with an Astronomy Case Study [26.4] ORBITは、ノイズの多いWebソースから大量の高品質なドメイン固有データセットをキュレートするための費用効率のよい手法である。
1Bの天文学部分集合上の微調整テキストscLLaMA-3-8Bは、MMLUの天文学ベンチマークの性能を69%から76%に改善した。
このモデル (Orbit-LLaMA) はtextscLLaMA-3-8B-base より優れており, GPT-4o の評価では1000の天文学的な質問に対して 73% のケースで好んでいる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:35:47 GMT)
Why language models collapse when trained on recursively generated text [26.1] 言語モデル(LM)は、インターネット上でテキストを生成するために広く使われている。
本稿では2つの側面から既存の知識に貢献する。
LM崩壊の理論的証明を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:11:15 GMT)
LoLaFL: Low-Latency Federated Learning via Forward-only Propagation [26.0] フェデレートラーニング(FL)は,分散データによるエッジラーニングを実現するためのパラダイムとして広く採用されている。
バックプロパゲーションによってトレーニングされたディープニューラルネットワークを持つ従来のFLは、第6世代(6G)モバイルネットワークの低レイテンシ学習要件を満たすことはほとんどできない。
我々は、線形識別特徴を学習し、その結果のホワイトボックスニューラルネットワークをFLに拡張するために、最大符号化率削減の最先端原理を採用する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:20:27 GMT)
Dream to Manipulate: Compositional World Models Empowering Robot Imitation Learning with Imagination [25.6] 世界モデルはエージェントに環境の表現を提供し、アクションの因果関係を予測できる。
実世界とそのダイナミクスの明示的な表現である世界モデルを構築するための新しいパラダイムを導入する。
DreMaは観察された世界とそのダイナミクスを再現し、オブジェクトの新たな構成を想像し、ロボットアクションの将来の結果を予測する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:38:15 GMT)
Measuring, Modeling, and Helping People Account for Privacy Risks in Online Self-Disclosures with AI [25.2] Redditのような匿名のオンラインフォーラムでは、自己開示の利点はしばしばユーザーに明らかだが、プライバシーリスクはより抽象的だ。
これまでの研究は、ユーザーがテキスト中の潜在的に危険な自己開示を特定するのに役立つ自然言語処理ツールの開発に取り組んできた。
保護したいユーザーのためにデザインされたり評価されたりした人はいません。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:53:40 GMT)
On Verbalized Confidence Scores for LLMs [25.2] 大規模言語モデル(LLM)の不確実性定量化は、その応答に対するより人間的な信頼を確立することができる。
この研究は、出力トークンの一部として信頼度スコアで不確実性を言語化するようLLM自身に求めることに重点を置いている。
我々は、異なるデータセット、モデル、およびプロンプトメソッドに関して、言語化された信頼度スコアの信頼性を評価する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:10:36 GMT)
A Black-Box Evaluation Framework for Semantic Robustness in Bird's Eye View Detection [24.7] 我々は,BEVモデルを騙すために3つの一般的な意味摂動を逆向きに最適化するロバストネス評価フレームワークを開発する。
セマンティック摂動を最適化することで生じる課題に対処するため、mAPメトリックを置き換えるスムーズな距離に基づく代理関数を設計する。
最近の10種類のBEVモデルのセマンティックロバスト性に関するベンチマークを提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:41:08 GMT)
HippoRAG: Neurobiologically Inspired Long-Term Memory for Large Language Models [24.5] 我々は,ヒトの長期記憶の海馬索引付け理論に触発された新しい検索フレームワークであるHippoRAGを紹介する。
その結果,本手法は最先端の手法を最大20%向上させることができた。
提案手法は,既存の手法に及ばない新たなシナリオに対処することができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:23:59 GMT)
Su-RoBERTa: A Semi-supervised Approach to Predicting Suicide Risk through Social Media using Base Language Models [24.3] 本稿では,Redditデータを用いた自殺リスク評価について検討した。
我々は、より小さな言語モデル、すなわち5億未満のパラメータの使用も効果的であることを示した。
本研究では,自殺リスク予測タスクにおける細調整RoBERTaであるSu-RoBERTaを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:10:18 GMT)
Exploration of the Dynamics of Buy and Sale of Social Media Accounts [24.1] 本研究は,ソーシャルメディアアカウントの売買を可能にするマーケットプレースを包括的に分析する。
2024年2月から6月にかけて、11のオンラインマーケットプレースで38,253のアカウントアカウントが販売された。
マーケティングされたソーシャルメディアアカウントの総額は6400万ドルを超え、1アカウントあたりの平均価格は157ドルだった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:58:37 GMT)
Nonstationary Sparse Spectral Permanental Process [24.1] 非定常カーネルのスパーススペクトル表現を利用した新しい手法を提案する。
この手法はカーネルタイプと定常性の制約を緩和し、より柔軟なモデリングを可能にする。
合成と実世界の両方のデータセットに対する実験結果から,本手法の有効性が示された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:24:54 GMT)
CONNECTOR: Enhancing the Traceability of Decentralized Bridge Applications via Automatic Cross-chain Transaction Association [23.9] クロスチェーントランザクションアソシエーションは、ブリッジDAppによって実行されるユニークなトランザクションを特定し、マッチングする。
橋梁スマートコントラクトに基づくクロスチェーントランザクションアソシエーション分析手法であるCONNECTORを提案する。
各種橋梁における実環境実験を行い, 実環境における CONNECTOR の有効性を実証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:41:32 GMT)
SPICA: Retrieving Scenarios for Pluralistic In-Context Alignment [23.6] 本研究では,文脈内サンプル検索におけるグループレベルの差異を考慮に入れたSPICAを提案する。
SPICAはシナリオバンク、グループインフォームド検索メトリクス、コンテキスト内アライメントプロンプトの3つの設計を導入している。
また,SPICAは類似度に基づく検索よりも高い評価を受けており,5点スケールで最大0.16点の改善が見られた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:20:49 GMT)
Spatiotemporally Coherent Probabilistic Generation of Weather from Climate [23.5] 本稿では,高分解能リアナリシスデータに基づいて学習したスコアベース拡散モデルを用いて,局所気象力学の統計的特性を抽出する新しい生成手法を提案する。
本研究では,地球規模の気候出力と一致した空間的・時間的気象動態をモデル化した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:47:35 GMT)
GraphEQA: Using 3D Semantic Scene Graphs for Real-time Embodied Question Answering [23.5] EQA(Embodied Question Answering)では、エージェントは、位置した質問に自信を持って答えるために、目に見えない環境の意味的な理解を探求し、発展させなければならない。
本稿では,リアルタイムな3次元メトリセマンティックシーングラフ(3DSG)とタスク関連画像をマルチモーダルメモリとして利用して視覚言語モデル(VLM)を構築する新しいアプローチであるGraphEQAを提案する。
我々は,3DSGの階層性を利用した階層的計画手法を用いて,構造化計画と意味誘導探索を行う。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:04:34 GMT)
RobustFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response [23.5] 監視された微調整(SFT)は、特定のドメインやタスクに大規模言語モデル(LLM)を適用する上で重要な役割を果たす。
本稿では,下流のタスクデータに対してノイズ検出とレバーベリングを行う頑健なSFTフレームワーク(RobustFT)を提案する。
5つのデータセットにわたる複数のLLMで実施された大規模な実験は、ノイズの多いシナリオにおけるRobostFTの例外的なパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:00:18 GMT)
Transcribing and Translating, Fast and Slow: Joint Speech Translation and Recognition [22.9] このモデルはトランスデューサベースで、ASRとSTの両方の目標を同時に最適化する多目的トレーニング戦略を使用する。
JSTARをスマートグラスを用いたバイリンガルな会話音声設定に適用し、そのモデルはまた、着用者と会話相手の異なる方向からの発話を区別するように訓練する。
BLEUスコアと待ち時間の両方において、強いカスケードSTモデルと比較して、JSTARの優れた性能を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:57:01 GMT)
Why We Build Local Large Language Models: An Observational Analysis from 35 Japanese and Multilingual LLMs [22.6] 日本語,英語,多言語LLMを19種類の評価ベンチマークで評価した。
英語のテキストによる学習は,日本語の学習者のスコアを向上できることがわかった。
日本語のコード生成、算術的推論、常識、読解作業の能力を高めるために、特に日本語のテキストを訓練することは不要である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:39:26 GMT)
SageAttention2: Efficient Attention with Thorough Outlier Smoothing and Per-thread INT4 Quantization [22.6] そこで我々は,より高速な4ビット行列乗算(Matmul)と精度向上手法を併用したSageAttention2を提案する。
実験により、我々のアプローチは様々なモデルにまたがって無視できるエンドツーエンドのメトリクス損失を引き起こすことを確認した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:26:20 GMT)
MaFeRw: Query Rewriting with Multi-Aspect Feedbacks for Retrieval-Augmented Large Language Models [22.5] 現実世界のRAGシステムでは、現在のクエリは会話コンテキストからの音声楕円とあいまいな参照を含むことが多い。
本稿では,検索プロセスと生成結果の両方からマルチアスペクトフィードバックを統合することにより,RAG性能を向上させる新しいクエリ書き換え手法MaFeRwを提案する。
2つの対話型RAGデータセットの実験結果から、MaFeRwはベースラインよりも優れた生成指標と安定したトレーニングを達成できることが示された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:16:40 GMT)
DepthFM: Fast Monocular Depth Estimation with Flow Matching [22.2] 現在の識別的深さ推定法は、しばしばぼやけた人工物を生成するが、生成的アプローチはノイズ・ツー・ディープ・トランスポートの曲率によるサンプリングが遅い。
本手法は,画像と深度分布間の直接輸送として深度推定をフレーミングすることで,これらの課題に対処する。
提案手法は, 複雑な自然シーンの標準ベンチマークにおいて, サンプリング効率を向上し, 学習に最小限の合成データしか必要とせず, 競争力のあるゼロショット性能を実現する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:51:42 GMT)
Offline Safe Reinforcement Learning Using Trajectory Classification [22.0] 我々は、望ましい軌跡を生成し、望ましくない軌跡を避ける政策を学ぶ。
オフライン安全なRLのためのDSRLベンチマークを用いて,本手法を広範囲に評価した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:29:03 GMT)
Replacing Paths with Connection-Biased Attention for Knowledge Graph Completion [21.7] 知識グラフ(KG)の完成は、KGの既存の事実から推測できる追加の事実を特定することを目的としている。
この研究は、経路エンコーディングを明示的に使用することなく、帰納的設定でのKG補完に焦点を当てている。
接続バイアスによる注意とサブグラフエンコーディングモジュールへのエンティティロールの埋め込みを導入し、高価で時間を要するパスエンコーディングモジュールの必要性を解消する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:34:15 GMT)
Optimizing FTQC Programs through QEC Transpiler and Architecture Codesign [21.4] 本稿では,クリフォードコスト削減のためのフレームワークであるTACOを紹介する。
コードサインを通じて、FTQCアーキテクチャに根ざした洞察は、新しい回路レベルの最適化を知らせることができる。
評価の結果、TACOは様々な量子回路でクリフォードゲートを平均91.7%削減することがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:33:21 GMT)
Overview of the 2024 ALTA Shared Task: Detect Automatic AI-Generated Sentences for Human-AI Hybrid Articles [21.3] 2024年、このタスクの目的は、人文の一部と機械生成部分を含むことができるハイブリッド環境で、機械生成テキストを検出することである。
本稿では,共有タスクに参加するシステムの課題,評価基準,結果について述べる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:50:06 GMT)
Learning to Generate Research Idea with Dynamic Control [21.3] 大規模言語モデル (LLM) は仮説や研究のアイデアを生み出すことを約束している。
SFT(Supervised Fine-Tuning)とRL(Reinforcement Learning)を組み合わせた2段階のアプローチによる新しいフレームワークを提案する。
本フレームワークは, 新規性, 実現可能性, 有効性の間のトレードオフを動的にナビゲートすることで, 高品質な成果を達成し, 研究アイデアに対するバランスのとれたアプローチを提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:28:18 GMT)
Quantum machine learning for multiclass classification beyond kernel methods [21.2] 本稿では,実世界の応用において,量子カーネル法がマルチクラス分類の効率を高めることを示す量子アルゴリズムを提案する。
量子シミュレーションの結果は、量子アルゴリズムが6つの実世界のマルチクラス分類問題に対処する際の古典的手法よりも優れていることを示している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:11:25 GMT)
LiftRefine: Progressively Refined View Synthesis from 3D Lifting with Volume-Triplane Representations [21.2] 単視点または少数視点の入力画像から3次元のニューラルフィールドを用いた新しいビュー合成法を提案する。
我々の再構成モデルはまず、粗いスケールの3D表現として1つ以上の入力画像をボリュームから3D空間に持ち上げる。
我々の拡散モデルは、三面体からのレンダリング画像に欠けている詳細を幻覚させる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:23:55 GMT)
EZ-HOI: VLM Adaptation via Guided Prompt Learning for Zero-Shot HOI Detection [21.1] 本稿では,効率的なゼロショットHOI検出(EZ-HOI)のための新しい学習フレームワークを提案する。
まず、学習可能なプロンプトに対してLarge Language Model(LLM)とVLMガイダンスを導入し、詳細なHOI記述と視覚的セマンティクスを統合して、VLMをHOIタスクに適用する。
我々は,既存の手法と比較して,トレーニング可能なパラメータの10.35%から33.95%しか持たない,さまざまなゼロショット設定における最先端性能を実現していることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:20:09 GMT)
Granger Causality Detection with Kolmogorov-Arnold Networks [21.0] 本研究は神経顆粒因性モデルの定義に寄与する。
我々は,Granger Causality Kan(GC-KAN)と呼ばれるフレームワークを開発し,Granger Causality Detectionに特化したトレーニング手法を開発した。
以上の結果から, Kas が Kolmogorov-Arnoldgressive Network (KAN) より優れている可能性が示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:10:34 GMT)
Piece of Table: A Divide-and-Conquer Approach for Selecting Sub-Tables in Table Question Answering [20.9] PieTa - サブテーブルベースの質問応答(QA)のための新しいフレームワーク
テーブルを小さなウィンドウに分割する反復的なプロセスを通じて動作し、LMを使用して各ウィンドウ内で関連する細胞を選択し、これらの細胞をサブテーブルにマージする。
複数の行や列にまたがる依存関係をキャプチャし、長いコンテキスト入力による制限を回避する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:53:37 GMT)
Improving Retrieval Augmented Language Model with Self-Reasoning [20.7] 本稿では,ALMの信頼性とトレーサビリティ向上を目的とした,新たな自己推論フレームワークを提案する。
このフレームワークは、関連性を認識したプロセス、エビデンスを認識した選択プロセス、軌跡解析プロセスの3つのプロセスで自己推論軌道を構築することを含む。
提案手法の優位性を示すため,4つの公開データセットにまたがるフレームワークの評価を行った。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:27:44 GMT)
Qua$^2$SeDiMo: Quantifiable Quantization Sensitivity of Diffusion Models [20.7] 量子化は、推論コストを軽減し、DMデノイザネットワークのサイズを小さくする主要な技術である。
Qua$2$SeDiMoは、様々なモデルの量化手法の費用対効果に関する説明可能な洞察を生成する混合精度のポストトライニング量子化フレームワークである。
2$SeDiMo は PixArt-$alpha$, PixArt-$Sigma$, Hunyuan-DiT and SDXL 上で 3.4-bit, 3.9-bit, 3.65-bit, 3.7-bit の重み量子化を構成可能であることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:30:54 GMT)
AniSora: Exploring the Frontiers of Animation Video Generation in the Sora Era [20.7] 本稿では,アニメーション映像生成のための総合システムAniSoraを提案する。
1000万以上の高品質なデータでデータ処理パイプラインがサポートしています。
また,様々なアニメーションビデオの評価ベンチマークも収集した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:31:44 GMT)
MonoPCC: Photometric-invariant Cycle Constraint for Monocular Depth Estimation of Endoscopic Images [20.4] 光度制約は自己教師付き単眼深度推定には不可欠である。
内蔵された光は、大きな明るさの変動を引き起こし、光度制限が信頼性を損なう。
本稿では,光度制約を周期形式に変換することにより,輝度の不整合を根本的に解消するMonoPCCを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:47:05 GMT)
VLM-AD: End-to-End Autonomous Driving through Vision-Language Model Supervision [20.4] 教師としての視覚言語モデル(VLM)。
VLM-ADは、nuScenesデータセットの計画精度と衝突率の大幅な改善を実現している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:53:36 GMT)
Explicit Relational Reasoning Network for Scene Text Detection [20.3] 後処理なしでコンポーネント関係をエレガントにモデル化するための明示的推論ネットワーク(ERRNet)を導入する。
ERRNetは、高い競争力を持つ推論速度を保持しながら、最先端の精度を一貫して達成する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:51:45 GMT)
A2H: A UI Converter from Android to HarmonyOS Platform [20.3] A2H Converterは,AndroidユーザインターフェースをHarmonyOSに移行する自動化ツールである。
このツールは、Android XMLレイアウトをHarmonyOS ArkUIレイアウトに変換するために、LLM(Big Language Model)駆動のマルチエージェントフレームワークを使用している。
A2H Converterは、コンポーネント、ページ、プロジェクトレベルでそれぞれ90.1%、89.3%、89.2%以上のマイグレーション成功率を達成する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:45:34 GMT)
A Super-pixel-based Approach to the Stable Interpretation of Neural Networks [20.3] そこで本研究では,勾配型サリエンシマップの安定性と一般化性を高めるための新たな画素戦略を提案する。
画素のグルーピングは,サリエンシマップのばらつきを低減し,解釈法の一般化動作を改善することを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:17:32 GMT)
Event-assisted 12-stop HDR Imaging of Dynamic Scene [20.1] 本稿では,イベントカメラとRGBカメラを備えたデュアルカメラシステムを利用して,ダイナミックシーンのための新しい12ストップHDRイメージング手法を提案する。
イベントカメラは、時間的に密度が高く、ダイナミックレンジの信号を提供し、LDRフレーム間のアライメントを大きな露出差で改善し、動きによって引き起こされるゴーストアーティファクトを減らす。
本手法は,動的シーンにおけるHDRイメージングを12停止まで拡張し,最先端の性能を実現する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:17:50 GMT)
Dimension Reduction with Locally Adjusted Graphs [20.1] LocalMAPは、この課題に対処するためにグラフを動的かつ局所的に調整する次元削減アルゴリズムである。
生物データセットのケーススタディを通じて、ローカルマップの利点を実証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:21:39 GMT)
DiffSim: Taming Diffusion Models for Evaluating Visual Similarity [20.0] 本稿では,生成モデルにおける視覚的類似度を測定するDiffSim法を提案する。
Denoising U-Netの注目層に特徴を合わせることで、DiffSimは外観とスタイルの類似性の両方を評価する。
また,Sref と IP ベンチマークを導入し,視覚的類似性の評価を行った。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:00:03 GMT)
Review-Then-Refine: A Dynamic Framework for Multi-Hop Question Answering with Temporal Adaptability [19.7] Retrieve-augmented Generation (RAG) フレームワークがマルチホップ質問応答(QA)タスクの有望なソリューションとして登場した。
既存のRAGフレームワークは、通常、検索対象のパラダイムに従っており、時間情報を持つマルチホップQAと競合することが多い。
本稿では,マルチホップQAシナリオにおけるLLMの性能向上を目的とした,Review-then-refineと呼ばれる新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:48:23 GMT)
Hierarchical Subspaces of Policies for Continual Offline Reinforcement Learning [19.5] 自律型ロボット工学やビデオゲームシミュレーションのような動的ドメインでは、エージェントは、以前獲得したスキルを維持しながら、新しいタスクに継続的に適応する必要がある。
継続的強化学習(Continuous Reinforcement Learning)として知られるこの継続的なプロセスは、過去の知識を忘れるリスクを含む重要な課題を提示します。
オフラインナビゲーション設定における連続学習を目的とした新しいフレームワークであるHILOW(HIerarchical LOW-rank Subspaces of Policies)を紹介する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:00:03 GMT)
Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations [19.5] ビデオ拡散モデル(VDM)は、将来の画像シーケンスを正確に予測する能力を示した。
本稿では,VDMからの視覚的表現を前提とした汎用ロボット政策であるビデオ予測ポリシーを提案する。
VPPは、2つのシミュレーションと2つの実世界のベンチマークで、既存のメソッドを一貫して上回っている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:48:40 GMT)
Topological eigenvalues braiding and quantum state transfer near a third-order exceptional point [19.3] 非エルミート量子系における例外点(EP)の囲みから生じる固有値と状態伝達について実験的に検討する。
本研究は,非エルミート位相構造理解と量子状態の動的操作による操作に関する知見を提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:02:49 GMT)
SqueezeMe: Efficient Gaussian Avatars for VR [19.2] ガウシアン・スプレイティングは、前例のないレベルの視覚的品質を持つリアルタイムの3Dアバターを可能にした。
我々は、複数のガウスアバターをリアルタイムにドライビング可能なバーチャルリアリティーヘッドセットに詰め込むことを目標としている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:46:55 GMT)
Learning Visual Composition through Improved Semantic Guidance [19.2] ラベル付けされたデータを大幅に改善することで、標準的なコントラスト学習手法の性能を大幅に改善できることを示す。
本結果は,DOCCIから得られた比較的新しいキャプションベンチマークで紹介する。
拡張されたデータでトレーニングされた標準的なCLIPモデルは、画像検索タスクにおいて印象的なパフォーマンスを示すかもしれない。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:58:26 GMT)
Benign Overfitting in Out-of-Distribution Generalization of Linear Models [19.2] 我々は、アウト・オブ・ディストリビューション(OOD)体制における良心過剰の理解に向けて、最初の一歩を踏み出した。
我々は、標準的な隆起回帰において良性過剰適合が生じることを証明する非漸近保証を提供する。
また、より一般的な目標共分散行列の族についても理論的結果を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:47:39 GMT)
Accelerating Diffusion Transformers with Token-wise Feature Caching [19.1] 拡散変換器は、膨大な計算コストを犠牲にして、画像合成とビデオ合成の両方において有意な効果を示した。
トークンワイズ機能キャッシングを導入し、キャッシングに最も適したトークンを適応的に選択できるようにします。
PixArt-$alpha$、OpenSora、DiTの実験では、トレーニングの必要なく、画像生成とビデオ生成の両方の有効性を実証しています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:38:23 GMT)
Progressive Multi-granular Alignments for Grounded Reasoning in Large Vision-Language Models [19.1] 本稿では,プログレッシブ・マルチグラニュラー・ビジョン・ランゲージアライメント(PromViL)を紹介する。
提案手法は, 単純な概念から複雑な概念まで, 多モードアライメントの階層構造を構築する。
テキスト記述と対応する視覚領域を段階的に整合させることで,低レベルからの文脈情報を活用して高レベルな推論を行う。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:46:29 GMT)
Cal-DPO: Calibrated Direct Preference Optimization for Language Model Alignment [19.0] 大規模言語モデルと人間の嗜好データとの整合性について検討する。
我々は、単純で効果的なアルゴリズムである直接選好最適化(Cal-DPO)を提案する。
各種標準ベンチマーク実験の結果,Cal-DPOは市販の手法を著しく改善することが示された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:31:56 GMT)
An Explorative Study of Pig Butchering Scams [19.0] 本研究は,豚肉のスカムについて,複数の点から総合的に検討した最初の例である。
本研究は、複数のソーシャルメディアプラットフォーム上で共有された直接被害者の物語、公害報告データベース、ニュースメディアからの事例研究を分析した。
総じて5億2100万ドル以上の損失をその詐欺に関連するものと推定した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:15:50 GMT)
RemoteTrimmer: Adaptive Structural Pruning for Remote Sensing Image Classification [19.0] リモートセンシング画像分類のための効率的な構造解析手法を提案する。
具体的には、モデルのチャネル重要度の違いを増幅するプルーニング戦略を導入する。
プルーンドモデルの微調整プロセスに適応的なマイニング損失関数を設計する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:57:56 GMT)
Deep CLAS: Deep Contextual Listen, Attend and Spell [18.7] CLAS(Contextual-LAS)は,まれな単語の自動音声認識の改善に有効であることが示されている。
本研究では,文脈情報をよりよく利用するための深層CLASを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:39:05 GMT)
Answer Set Networks: Casting Answer Set Programming into Deep Learning [18.6] ASNは、ASPベースのDeep Probabilistic Logic Programming (DPPL)に対するスケーラブルなアプローチである。
我々は、ASPをASNに変換する方法を示し、GPUと並列化機能を活用して、ASNがエンコードされた問題を効率的に解く方法を示す。
我々はまず、DPPLによる大規模言語モデルの微調整を示し、ASNを用いてロジックによるトレーニングを指導する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:09:06 GMT)
InstructMol: Multi-Modal Integration for Building a Versatile and Reliable Molecular Assistant in Drug Discovery [18.5] LLM(Large Language Models)は、複雑な分子データとの相互作用の再構築を約束する。
我々の新しい貢献であるInstructMolは、インストラクションチューニングアプローチを通じて、分子構造と自然言語を効果的に整合させる。
InstructMolは、薬物発見関連分子タスクの大幅なパフォーマンス向上を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:47:14 GMT)
Each Fake News is Fake in its Own Way: An Attribution Multi-Granularity Benchmark for Multimodal Fake News Detection [18.5] ソーシャルプラットフォームは偽ニュースの多さで飽和し、ネガティブな結果をもたらしている。
既存のマルチモーダルフェイクニュースデータセットは、実または偽のバイナリラベルのみを提供する。
そこで,本研究では,マルチグラニュラリティ・マルチモーダル・フェイクニュース検出データセットamgを構築し,固有のフェイク・パターンを明らかにした。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:40:17 GMT)
Zero-Shot Artifact2Artifact: Self-incentive artifact removal for photoacoustic imaging without any data [18.2] ZS-A2Aは超軽量ネットワークをベースとしたゼロショット自己監督型アーティファクト除去手法である。
ZS-A2Aは、既存のゼロショット法と比較して、最先端(SOTA)性能を達成する。
インビボで$1のラット肝臓では、ZS-A2Aはわずか8秒でCNRを17.48から43.46に改善する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:11:49 GMT)
ScamChatBot: An End-to-End Analysis of Fake Account Recovery on Social Media via Chatbots [18.1] 本研究は,アカウントの復旧に問題を抱えているユーザを対象に,偽の技術的支援を行うスキャマーに焦点を当てた。
私たちの仕事の主な貢献は、スキャマーと対話する自動化システムの開発です。
以上の結果から,スキャマーはユーザに対して,いくつかのコミュニケーションチャネルを通じて連絡を依頼するソーシャルメディアプロファイルを多数採用していることがわかった。
この自動化アプローチは、詐欺師がロールプレイングなどさまざまな戦略を使って、被害者に個人情報や財務情報を開示させる方法を強調している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:22:35 GMT)
Automatic Spectral Calibration of Hyperspectral Images:Method, Dataset and Benchmark [18.0] ハイパースペクトル画像(HSI)は、空間と周波数領域の両方で世界を密にサンプリングする。
通常、HSIは様々な照明条件の影響を最小限に抑えるために校正する必要がある。
本稿では,HSIを自動的に校正する学習手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:02:50 GMT)
Skeleton-OOD: An End-to-End Skeleton-Based Model for Robust Out-of-Distribution Human Action Detection [17.9] そこで我々はSkeleton-OODと呼ばれる新しい骨格モデルを提案する。
Skeleton-OODは、ID認識の精度を確保しつつ、OODタスクの有効性を向上させる。
本研究は,骨格型行動認識タスクの文脈における従来のOOD検出技術の有効性を裏付けるものである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:22:05 GMT)
Erase then Rectify: A Training-Free Parameter Editing Approach for Cost-Effective Graph Unlearning [17.9] グラフアンラーニングは、訓練されたグラフニューラルネットワーク(GNN)からノード、エッジ、属性の影響を排除することを目的としている。
既存のグラフアンラーニング技術は、しばしば残りのデータに対する追加のトレーニングを必要とし、かなりの計算コストをもたらす。
本稿では,2段階の学習自由アプローチであるETR(Erase then Rectify)を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:18:15 GMT)
Alignment-Free RGB-T Salient Object Detection: A Large-scale Dataset and Progressive Correlation Network [17.8] UVT20Kという大規模かつ高多様性なRGB-T SODデータセットを構築し,2万枚の画像ペア,407シーン,1256個のオブジェクトカテゴリからなる。
さらなる研究を支援するために、UVT20Kの各サンプルには、サリエンシマスク、スクリブル、バウンダリ、チャレンジ属性を含む、包括的な真実のセットが注釈付けされている。
さらに,非整合画像ペアにおける正確な予測を実現するために,明示的なアライメントに基づいてモーダル間相関とモーダル内相関をモデル化するプログレッシブ相関ネットワーク(PCNet)を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:52:12 GMT)
Knowledge Tagging with Large Language Model based Multi-Agent System [17.5] 本稿では,従来のアルゴリズムの限界に対処するマルチエージェントシステムについて検討する。
我々は,従来の手法が抱えていた課題を克服する上で,LLMベースのマルチエージェントシステムの可能性を強調した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:09:47 GMT)
Cross-System Software Log-based Anomaly Detection Using Meta-Learning [17.4] AIOpsツールは、ソフトウェアシステムのログベースの異常検出プロセスを自動化するために開発されている。
この分野では、高いデータラベリングコスト、動的システムのログの進化、異なるシステム間の適応性という、3つの実践的な課題が広く認識されている。
これらの課題に対応するために特別に設計された,ログイベントレベルの異常検出のためのAIOpsツールであるCroSysLogを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:55:45 GMT)
From Bench to Bedside: A Review of Clinical Trials in Drug Discovery and Development [17.0] 臨床試験は、薬物開発プロセスに欠かせない部分である。
本論文は, 倫理的問題, 対象採用困難, 多様性, 代表性の懸念など, 臨床試験で直面する主な課題について論じる。
本論は,臨床治験の将来,特に遺伝子治療や免疫療法が臨床設計に及ぼす影響を楽しみにしている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:14:18 GMT)
MoCha-Stereo: Motif Channel Attention Network for Stereo Matching [16.9] MoCha-Stereoは学習ベースのステレオマッチングネットワークである。
MoCha-Stereoは、KITTI-2015とKITTI-2012のリフレクティブ・リーダーボードで1位にランクインした。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:45:43 GMT)
A Comprehensive Forecasting Framework based on Multi-Stage Hierarchical Forecasting Reconciliation and Adjustment [16.9] 本稿では,季節性維持,コヒーレンス確保,精度向上という課題に対処する新しい枠組みを提案する。
提案されたフレームワークは、Walmartの広告、営業、運用チームが将来の要求を追跡するためにデプロイされ、活用されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:33:19 GMT)
Posterior Mean Matching: Generative Modeling through Online Bayesian Inference [16.8] 後部平均マッチング (PMM) はベイズ推定に基づく新しい生成モデリング手法である。
PMMは共役対の分布を用いて、画像やテキストのような様々なモダリティの複雑なデータをモデル化する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:02:07 GMT)
FRIDAY: Mitigating Unintentional Facial Identity in Deepfake Detectors Guided by Facial Recognizers [16.7] 従来のディープフェイク検出方法はトレーニング領域内では良好に機能するが、新しい合成技術によってその効果は著しく低下する。
近年の研究では、検出モデルが合成人工物ではなく、顔の同一性に基づく決定境界をしばしば生成していることが判明している。
本稿では,顔認識による顔認証の影響を緩和する新たな訓練手法であるFRIDAY(Falcial Recognition Identity Attenuation)を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:21:28 GMT)
RAZOR: Sharpening Knowledge by Cutting Bias with Unsupervised Text Rewriting [16.6] 手動で構築されたデータセットで一般的なバイアスは、トークンとラベルの間に急激な相関をもたらす可能性がある。
既存のデバイアス法は、しばしば特定のデータセットバイアスに関する事前の知識に依存している。
本稿では,ショートカット緩和のためのテキスト書き直しに基づく,新規で教師なし,データ重視のデバイアス処理手法であるRAZORを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:11:42 GMT)
A Survey of RWKV [16.6] Receptance Weighted Key Value (RWKV)モデルは、Transformerアーキテクチャに代わる新しい選択肢を提供する。
自己アテンションに大きく依存する従来のトランスフォーマーとは異なり、RWKVは最小限の計算要求で長距離依存を捕捉する。
本稿では,このギャップを,RWKVアーキテクチャとその基本原理,および様々な応用の総合的なレビューとして埋めようとしている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:39:24 GMT)
Spike2Former: Efficient Spiking Transformer for High-performance Image Segmentation [16.5] スパイキングニューラルネットワーク(SNN)は、低消費電力の利点があるが、画像セグメンテーションタスクでは不十分である。
さまざまなセマンティックセグメンテーションデータセットにSNNの最先端を新たに設定した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:13:15 GMT)
DG-Mamba: Robust and Efficient Dynamic Graph Structure Learning with Selective State Space Models [16.4] 選択状態空間モデル(Mamba)を用いた動的グラフ構造学習フレームワークを提案する。
我々のフレームワークは、敵攻撃に対する最先端のベースラインよりも優れている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:01:27 GMT)
Agents Are Not Enough [16.1] 人間のために行動する自律プログラムは、メインストリームのAIムーブメントに新しくも排他的でもない。
現在のエージェントの波を効果的かつ持続可能なものにするために,ユーザの好みや行動を表すSimsや,直接ユーザと対話し,エージェントの助けを借りてユーザタスクの実行をコーディネートするAssistantsを含むエコシステムを構想する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:54:17 GMT)
UOR: Universal Backdoor Attacks on Pre-trained Language Models [16.1] 既存のトレーニング済み言語モデル(PLM)に対するバックドア攻撃のほとんどは、未ターゲットでタスク固有のものである。
まず, PLMに対するより脅迫的なバックドア攻撃が満足すべき要件をまとめた上で, UORと呼ばれる新たなバックドア攻撃手法を提案する。
具体的には,各種PLMに対するトリガのより均一で普遍的な出力表現を自動的に学習できる有毒な教師付きコントラスト学習を定義する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:35:08 GMT)
RWKV-edge: Deeply Compressed RWKV for Resource-Constrained Devices [16.0] 本稿では,RWKVアーキテクチャに適した効率的な圧縮手法を提案する。
本手法ではRWKVモデルを4.95-3.8x圧縮し,2.95ppの精度で精度を低下させる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:34:57 GMT)
G-VEval: A Versatile Metric for Evaluating Image and Video Captions Using GPT-4o [15.9] G-VEvalはG-Evalにインスパイアされた新しい測度であり、新しい GPT-4o で駆動される。
G-VEvalは、大規模なマルチモーダルモデルでチェーン・オブ・シント推論を使用しており、参照フリー、参照オンリー、組み合わせの3つのモードをサポートしている。
また,ビデオキャプション評価のための新しいデータセットであるMSVD-Evalを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:37:55 GMT)
Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference [15.9] ModernBERTを導入し、エンコーダのみのモデルにモダンなモデル最適化をもたらす。
ModernBERTモデルは、大規模な評価のプールに最先端の結果を示す。
ModernBERTは、最も高速かつメモリ効率の良いエンコーダでもある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:32:26 GMT)
Synchronized and Fine-Grained Head for Skeleton-Based Ambiguous Action Recognition [15.9] GCNを用いた骨格に基づく行動認識は目覚ましい性能を達成しているが、"Wving"や"Saluting"といったあいまいな行動を認識することは大きな課題である。
既存の手法はGCNとTCNのシリアルな組み合わせに依存しており、空間的特徴と時間的特徴は独立して抽出される。
本稿では,GCN層とTCN層の間に挿入されたSynchronized and Fine-fine Head (SF-Head) と呼ばれる軽量なプラグアンドプレイモジュールを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:21:04 GMT)
Doubly-Universal Adversarial Perturbations: Deceiving Vision-Language Models Across Both Images and Text with a Single Perturbation [15.9] VLM(Large Vision-Language Models)は、視覚エンコーダとLLM(Large Language Model)を統合することで、マルチモーダルタスクにまたがる顕著な性能を示す。
VLMに特化して設計された新しいUAPについて紹介する:Douubly-Universal Adversarial Perturbation (Douubly-UAP)
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:01:33 GMT)
HardRace: A Dynamic Data Race Monitor for Production Use [15.6] データレースはマルチスレッドプログラムにおいて重要な問題であり、予測できない、破滅的な、診断が難しい問題を引き起こします。
我々は、十分なランタイムオーバーヘッドと高い検出能力を持ちながら、オンザフライでのレースを検出するデータレースモニターであるHardRaceを紹介した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:57:49 GMT)
Learning Infinitesimal Generators of Continuous Symmetries from Data [15.4] 1-パラメータ群で定義された変換に基づく新しい対称性学習アルゴリズムを提案する。
この手法は最小限の帰納バイアスに基づいて構築され、リー群に根付いた一般的な対称性だけでなく、非線形発生器由来の対称性にまで拡張される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:39:24 GMT)
SATA: A Paradigm for LLM Jailbreak via Simple Assistive Task Linkage [15.3] 本稿では,LLMの安全対策を効果的に回避できる新しいジェイルブレイクパラダイムであるSimple Assistive Task (SATA)を提案する。
SATAは、マスク付き言語モデルタスクや位置タスクによる要素検索のような単純な補助タスクを使用して、マスク付きキーワードのセマンティクスを符号化する。
実験の結果、SATAは最先端の性能を達成し、ベースラインを大きなマージンで上回ることがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:57:37 GMT)
DroidSpeak: KV Cache Sharing for Cross-LLM Communication and Multi-LLM Serving [15.1] DroidSpeakは、微調整言語モデル(LLM)間のコンテキスト共有を最適化するフレームワークである。
DroidSpeakのスループットは最大で3倍,プリフィル時間は2.6倍に向上する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:52:16 GMT)
How Does the Smoothness Approximation Method Facilitate Generalization for Federated Adversarial Learning? [15.1] 一般化は、目に見えないデータに基づいてアルゴリズムのパフォーマンスを評価するために重要である。
2つのFALアルゴリズムの一般化性能を評価するアルゴリズム安定性尺度を開発した。
一般化誤差を低減するための最も効果的な方法としてRSAを同定する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:35:21 GMT)
Sometimes I am a Tree: Data Drives Unstable Hierarchical Generalization [15.0] 我々は、英語文法のケーススタディを用いて、OODを一般化するために、いかに複雑で多様なトレーニングデータがモデルを動かすかを探る。
これらの因子はニュアンス的であり、中間レベルの多様性と複雑性がランダムな種子間の不整合性に繋がることを示した。
本研究は, 一般化パターン形成におけるトレーニングデータの重要性を強調し, 競合するモデル戦略が無作為な種子に対して不整合な一般化結果をもたらすかを明らかにした。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:51:34 GMT)
Alignment-Enhanced Decoding:Defending via Token-Level Adaptive Refining of Probability Distributions [14.9] 本稿では,アライメント・エンハンスメント・デコーディング(Alignment-Enhanced Decoding, AED)を提案する。
5つのモデルと4つの一般的なジェイルブレイク実験を行い、その結果、我々のアプローチの有効性を検証した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:34:31 GMT)
A First Introduction to Cooperative Multi-Agent Reinforcement Learning [14.9] マルチエージェント強化学習(MARL)は近年急速に普及している。
MARLアプローチは、集中型トレーニングと実行(CTE)、分散型実行(CTDE)のための集中型トレーニング(CTDE)、分散型トレーニングと実行(DTE)の3つの主なタイプに分類される。
このテキストはMARLの紹介であり、すべてのエージェントが単一の共同報酬を共有するMARLである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:51:49 GMT)
TOMG-Bench: Evaluating LLMs on Text-based Open Molecule Generation [14.9] LLMのオープンドメイン分子生成能力を評価するためにテキストベースのオープン分子生成ベンチマーク(TOMG-Bench)を提案する。
TOMG-Benchは、分子編集(MolEdit)、分子最適化(MolOpt)、カスタマイズされた分子生成(MolCustom)の3つの主要なタスクのデータセットを含んでいる。
25 LLMのベンチマークでは、テキスト誘導分子発見における現在の限界と潜在的な領域が明らかにされている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:51:16 GMT)
SafeDrive: Knowledge- and Data-Driven Risk-Sensitive Decision-Making for Autonomous Vehicles with Large Language Models [14.8] SafeDriveは、自律運転の安全性と適応性を高めるための、知識とデータ駆動型リスクに敏感な意思決定フレームワークである。
知識駆動型洞察と適応学習機構を統合することにより、不確実な条件下での堅牢な意思決定を保証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:30:24 GMT)
Uni-Renderer: Unifying Rendering and Inverse Rendering Via Dual Stream Diffusion [14.8] レンダリングと逆レンダリングはコンピュータビジョンとグラフィックスにおいて重要なタスクである。
本稿では、2つの条件生成タスクとしてレンダリングと逆レンダリングを共同でモデル化するデータ駆動手法を提案する。
トレーニングと推論のコードをオープンソースとして公開し、この分野のさらなる研究と開発を後押しします。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:57:45 GMT)
LISA: Learning-Integrated Space Partitioning Framework for Traffic Accident Forecasting on Heterogeneous Spatiotemporal Data [14.7] 交通事故の予測は、インテリジェントな交通管理と緊急対応システムにとって重要な課題である。
既存のデータ駆動手法では、異なるスケールの空間上の異種事故パターンを処理できない。
本稿では,モデルの学習中に分割を同時に学習するLearning-Integrated Space Partition Framework(LISA)を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:52:19 GMT)
ECLIPSE: Contrastive Dimension Importance Estimation with Pseudo-Irrelevance Feedback for Dense Retrieval [14.7] 近年のInformation Retrievalは、高次元埋め込み空間を活用して、関連文書の検索を改善している。
これらの高次元表現にもかかわらず、クエリに関連する文書は、低次元のクエリ依存多様体に存在する。
本稿では,関連文書と非関連文書の両方からの情報を活用することによって,これらの制約に対処する手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:45:06 GMT)
GenHMR: Generative Human Mesh Recovery [14.7] GenHMRは、単分子HMRを画像条件による生成タスクとして再構成する新しい生成フレームワークである。
ベンチマークデータセットの実験では、GenHMRが最先端のメソッドよりも大幅に優れていることが示されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:45:58 GMT)
Identifying Query-Relevant Neurons in Large Language Models for Long-Form Texts [14.7] 本稿では,大規模言語モデルにおけるクエリ関連ニューロンの同定が可能な,アーキテクチャに依存しない新しいフレームワークを提案する。
検出されたニューロンの知識編集およびニューロンによる予測への応用の可能性を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:22:07 GMT)
Opportunities and limitations of explaining quantum machine learning [14.7] 本稿では,量子機械学習モデルに特化して2つの説明手法を提案する。
量子機械学習における説明可能性の研究により、この分野の持続可能な発展に寄与することができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:34:22 GMT)
Multimodal Hypothetical Summary for Retrieval-based Multi-image Question Answering [14.6] QAの学習目標が探索段階の最適化に失敗するため, 「検索・回答」パイプラインはカスケードエラーに悩まされることが多い。
本稿では,検索した情報をQAに効果的に導入し,参照するための新しい手法を提案する。
提案手法は,RETVQAの最先端手法よりも3.7%,CLIPよりも14.5%,絶対的な改善を実現している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:17:09 GMT)
Cycle Pixel Difference Network for Crisp Edge Detection [14.6] エッジ検出はコンピュータビジョンの基本課題である。
近年の深層学習手法は,1)大規模事前学習重量への依存,2)太いエッジの生成という2つの重大な課題に直面している。
CPD-Netと呼ばれるU字型エンコーダデコーダモデルを構築し、これら2つの問題に同時に対処する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:02:37 GMT)
Flowing from Words to Pixels: A Framework for Cross-Modality Evolution [14.6] クロスモーダルフローマッチングのための汎用的でシンプルなフレームワークであるCrossFlowを提案する。
本稿では、入力データに変分法を適用することの重要性を示し、フリーガイダンスを実現する方法を提案する。
また,本手法の一般化可能性を示すため,CrossFlowは多種多様なクロスモーダル/イントラモーダルマッピングタスクの最先端性に匹敵する性能を示した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:56 GMT)
Real-Time Damage Detection in Fiber Lifting Ropes Using Lightweight Convolutional Neural Networks [14.6] 軽量畳み込みニューラルネットワークを用いた合成繊維ロープ画像の損傷検出システム
ケネクラネスの専門家は、ロープの状態に応じて収集した画像に注釈を付け、正常または損傷を与えた。
モデルは96.5%の精度、94.8%の精度、98.3%のリコール、96.5%のF1スコア、99.3%のAUCで他の類似の手法より優れている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:13:46 GMT)
Eliciting Causal Abilities in Large Language Models for Reasoning Tasks [14.5] 我々は,LLMが高品質で低品質な観測データを生成することができる自己因果的指導強化法(SCIE)を導入する。
SCIEでは、命令は治療として扱われ、自然言語を処理するためにテキストの特徴が使用される。
提案手法は,プロンプトのトレーニングコストを削減し,推論性能を向上させる命令を効果的に生成する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:03:02 GMT)
SkyDiffusion: Ground-to-Aerial Image Synthesis with Diffusion Models and BEV Paradigm [14.5] 地上から地上への画像合成は、対応する地上の景観画像から現実的な空中画像を生成することに焦点を当てている。
本研究では,ストリートビュー画像から航空画像を合成する新しいクロスビュー生成手法であるSkyDiffusionを紹介する。
地上から地上までの多様な画像合成用途のために設計された新しいデータセット「Ground2Aerial-3」を紹介した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:29:09 GMT)
Face the Facts! Evaluating RAG-based Fact-checking Pipelines in Realistic Settings [14.4] この作業は、Retrieval-Augmented Generationパラダイムに基づいた自動ファクトチェックのための現在の最先端パイプラインのいくつかの制約を取り上げる。
我々のゴールは、より現実的なシナリオの下で、予測の生成のためのRAGベースのメソッドをベンチマークすることです。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:57:11 GMT)
Parastatistics and a secret communication challenge [14.2] 本稿では,パラ粒子をホストする物理システムでのみ勝利できるチャレンジゲームを提案する。
勝利戦略はノイズに対して頑健であり、局所的な測定による盗聴の最も関連性の高いクラスである。
これは、秘密通信における潜在的な応用と同様に、パラ粒子の操作定義と実験的なアイデンティティテストの両方を提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:37:24 GMT)
Simplicity over Complexity: An ARN-Based Intrusion Detection Method for Industrial Control Network [14.1] 産業制御ネットワーク(ICN)は、リアルタイムの応答性と信頼性を特徴とする。
ICNは悪意のあるユーザー侵入やハッカー攻撃など、いくつかの問題に悩まされている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:20:39 GMT)
Agent-Temporal Credit Assignment for Optimal Policy Preservation in Sparse Multi-Agent Reinforcement Learning [14.0] マルチエージェント環境では、エージェントはスパースや遅れたグローバル報酬のために最適なポリシーを学ぶのに苦労することが多い。
本稿では,エージェント・テンポラル・アジェント・リワード再分配(TAR$2$)を導入し,エージェント・テンポラル・クレジット割り当て問題に対処する新しいアプローチを提案する。
TAR$2$は、粗末なグローバル報酬をタイムステップ固有の報酬に分解し、エージェント固有の報酬を計算します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:05:13 GMT)
DialSim: A Real-Time Simulator for Evaluating Long-Term Multi-Party Dialogue Understanding of Conversational Agents [13.9] リアルタイム対話シミュレータであるDialSimを紹介する。
本シミュレータでは、人気番組のキャラクターの役割をエージェントに割り当てる。
DialSimの主な特徴は、適切な時間内に応答するエージェントの能力を評価することである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:14:09 GMT)
From Human Annotation to LLMs: SILICON Annotation Workflow for Management Research [13.8] SILICON(textbfSystematic textbfInference with textbfLLMs for textbfInformation textbfClassificatitextbfon and textbfNotation)ワークフローを紹介する。
このワークフローは、人間のアノテーションの確立した原則と、体系的な迅速な最適化とモデル選択を統合している。
SILICONのワークフローは、共通管理研究タスクをカバーする7つのケーススタディを通して検証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:21:41 GMT)
Automatic Extraction of Metaphoric Analogies from Literary Texts: Task Formulation, Dataset Construction, and Evaluation [13.7] 本研究は,文学テキストにおける比喩的類推を形成する概念の抽出に焦点を当てた。
ドメインの専門家の助けを借りて、このドメインに新しいデータセットを構築します。
我々は近年の大規模言語モデルのアウト・オブ・ボックス能力とメタファマッピングの構成を比較した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:11:04 GMT)
Reconciling Human Development and Giant Panda Protection Goals: Cost-efficiency Evaluation of Farmland Reverting and Energy Substitution Programs in Wolong National Reserve [13.7] グライン・トゥ・グリーン(G2G)とファイアウッド・トゥ・エレクトリシティ(F2E)の2つの主要な生態保全プログラムの費用効果を評価する。
G2Gプログラムは、約500CNY/Muで最適の金融効率を達成し、1000CNY/Muを超えるリターンを減少させる。
最も財政的なコスト効率のよい選択肢は、補助電力価格が0.4-0.5CNY/kWhであるのに対して、さらに0.1CNY/kWh以下に値下げされた場合である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:19:18 GMT)
On the Expressivity of Persistent Homology in Graph Learning [13.6] 計算トポロジのテクニックである永続化ホモロジーは、最近、グラフ分類の文脈において、強い経験的性能を示した。
本稿では、グラフの文脈における永続的ホモロジーの簡単な紹介と、グラフ学習タスクにおけるその表現性に関する理論的議論と実証分析について述べる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:07:06 GMT)
Fixing Large Language Models' Specification Misunderstanding for Better Code Generation [13.5] muFiXは、大きな言語モデル(LLM)のコード生成性能を改善する新しいプロンプト技術である。
まず、テストケース分析を利用して仕様の理解を得、自己改善プロセスを可能にする。
muFiXはさらに、提供された理解と実際の理解の間のギャップを減らす方向に向けた仕様理解を修正している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:18:33 GMT)
Progressive Fine-to-Coarse Reconstruction for Accurate Low-Bit Post-Training Quantization in Vision Transformers [13.3] 後トレーニング量子化(PTQ)は視覚変換器(ViT)の圧縮に広く採用されている。
低ビット表現に量子化されると、完全精度の表現に比べて大きな性能低下がしばしば起こる。
低ビット量子化ビジョントランスの性能を大幅に向上させるPFCR法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:38:59 GMT)
SLIFER: Investigating Performance and Robustness of Malware Detection Pipelines [12.9] アカデミアは、モデル1つまたはアンサンブル内の静的解析と動的解析を組み合わせることに焦点を当てる。
本稿では,多種多様な解析手法を用いて構築したマルウェア検知器の特性について検討する。
私たちが知る限り、我々はシーケンシャルなマルウェア検知器の特性を初めて調査し、実際の生産環境での行動に光を当てています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:56:51 GMT)
Leveraging Anthropometric Measurements to Improve Human Mesh Estimation and Ensure Consistent Body Shapes [12.9] 推定した3次元キーポイント位置の精度に関して,SOTA 3D人間ポーズ推定(HPE)モデルがHMEモデルより優れていることがわかった。
A2Bと呼ばれるモデルを作成し、人間のメッシュモデルの基本形状パラメータに変換する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:19:41 GMT)
Benchmarking Large Language Models for Math Reasoning Tasks [12.9] 我々は、4つの強力な基礎モデル上の5つの広く使われている数学的データセットの数学的問題解決のための、最先端の文脈内学習アルゴリズムを7つ比較した。
以上の結果から, GPT-4o や LLaMA 3-70B のような大規模基盤モデルでは, 具体的なプロンプト戦略とは独立に数学的推論を解くことが可能であることが示唆された。
将来の研究で追加モデルの統合をサポートするために、ベンチマークコードをオープンソースにしています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:25:41 GMT)
Assessing Modality Bias in Video Question Answering Benchmarks with Multimodal Large Language Models [12.8] 我々は、VidQAベンチマークとデータセットのバイアスを特定するために、MIS(Modality importance score)を導入する。
また,最新のMLLMを用いてモダリティの重要度を推定する手法を提案する。
以上の結果から,既存のデータセットでは,モダリティの不均衡による情報統合が効果的に行われていないことが示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:37:44 GMT)
Error Bounds For Gaussian Process Regression Under Bounded Support Noise With Applications To Safety Certification [12.8] 本稿では,ガウス過程回帰(GPR)を有界支持雑音下で適用するための新しい誤差境界を提案する。
これらのエラーは、既存の最先端境界よりもかなり強く、特にニューラルネットワークカーネルのGPRに適していることを示す。
これらの境界を障壁関数と組み合わせて、未知の力学系の安全性確率を定量化する方法について説明する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:46:32 GMT)
A Large-scale Empirical Study on Large Language Models for Election Prediction [12.6] 我々は、人口統計学、イデオロギー、時間に敏感な要因を統合した、選挙予測のための多段階推論フレームワークを導入する。
我々は2024年のアメリカ合衆国大統領選挙に我々のアプローチを適用し、観測された歴史的データを超えてその一般化能力を示す。
我々は、事前訓練されたコーパスに埋め込まれた潜在的な政治的バイアスを特定し、どのように人口動態が誇張されるかを調べ、これらの問題を緩和するための戦略を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:10:51 GMT)
Global Spatio-Temporal Fusion-based Traffic Prediction Algorithm with Anomaly Aware [12.6] 本稿では,異常認識を取り入れた時空間融合に基づく交通予測アルゴリズムを提案する。
本稿では,交通流の正確な予測のために,トランスフォーマアーキテクチャに基づくマルチスケール時空間融合モジュール(MTSFFL)を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:40:21 GMT)
Online Policy Learning and Inference by Matrix Completion [12.5] 我々は、集団的嗜好に基づく意思決定のための協調フィルタリングアプローチを採っている。
本稿では,意思決定のための$varepsilon$-greedyポリシーと,帯域パラメータ推定のためのオンライン降下アルゴリズムを組み合わせた政策学習手法を提案する。
推論のために,逆ポリシー重み付けに基づくオンラインデバイアス法を開発し,その正規性を確立する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:45:16 GMT)
A hybrid framework for effective and efficient machine unlearning [12.5] マシン・アンラーニング(MU)は、既に訓練済みのモデルパラメータから取り消されたサンプルのインプリントを取り除くために提案されている。
我々は、その上で、全体的な成功を達成するために、新しいハイブリッド戦略を提示する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:59:26 GMT)
From Programming Bugs to Multimillion-Dollar Scams: An Analysis of Trapdoor Tokens on Uniswap [12.5] 最近登場した、Trapdoorと呼ばれる詐欺 ERC-20トークンは、2020年から2023年にかけて、最大の分散型取引所であるUnixwapに数十億ドルを投じた。
本質的には、Trapdoorトークンはユーザーが購入できるが、論理的なバグやオーナー専用の機能をスマートコントラクトに埋め込むことで販売を妨げている。
多数のTrapdoorサンプルを手動で検査することで、Trapdoorトークンの最初の体系的な分類と、悪意のあるコードの埋め込みと隠蔽に使用される詐欺師の包括的なテクニックのリストを確立しました。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:36:39 GMT)
Entropy Regularized Task Representation Learning for Offline Meta-Reinforcement Learning [12.4] オフラインのメタ強化学習は、エージェントに異なるタスクのセットからのデータに基づいてトレーニングすることで、新しいタスクに迅速に適応する能力を持たせることを目的としている。
コンテキストベースのアプローチでは、状態-アクション-リワード遷移の履歴を利用して現在のタスクの表現を推測し、タスク表現に対してエージェント、すなわちポリシーと値関数を条件付ける。
残念ながら、オフラインデータのコンテキストはテスト時にコンテキストと一致しないため、コンテキストベースのアプローチは配布ミスマッチに悩まされる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:24:01 GMT)
Optimizing Personalized Federated Learning through Adaptive Layer-Wise Learning [12.4] ローカルモデルは、トレーニングプロセス中にデータを過剰にパーソナライズする傾向があり、以前取得したグローバルな情報を減少させる可能性がある。
我々は,局所モデルパーソナライズ性能を最適化する,pFLのための新しいレイヤワイズ学習手法であるFLAYERを提案する。
6つの最先端のpFL法と比較して、FLAYERは平均して推論精度を7.21%改善する(最大14.29%)。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:05:53 GMT)
MetaSymNet: A Tree-like Symbol Network with Adaptive Architecture and Activation Functions [12.3] そこで我々はMetaSymNetを提案する。MetaSymNetは,その構造をリアルタイムで調整し,拡張と収縮の両立を可能にするニューラルネットワークである。
我々は,MetaSymNetの性能を,10以上の公開データセットにわたる4つの最先端のシンボル回帰アルゴリズムと比較した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:41:28 GMT)
Analyzing Consumer IoT Traffic from Security and Privacy Perspectives: a Comprehensive Survey [12.1] この調査では、2018年1月から2024年6月までに、CIoTセキュリティとプライバシドメイン内のトラフィック分析に関する303のパブリッシュをレビューする。
CIoTのセキュリティとプライバシのリスクを研究するために、トラフィック分析ツールの応用を理解する研究者を支援することを目的としている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:34:15 GMT)
Mediation Analysis for Probabilities of Causation [12.1] われわれはPoC制御された直接的, 自然的, 自然的間接的必要十分性(PNS)の新たな変種を導入する。
これらの指標は、異なる因果経路を考慮し、結果を生み出すための治療の必要性と不十分さを定量化する。
我々は、これらの新しいPoC測度に対する同定定理を開発し、観測データからそれらの推定を可能にする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:28:13 GMT)
Fields of The World: A Machine Learning Benchmark Dataset For Global Agricultural Field Boundary Segmentation [12.0] Fields of The World (FTW)は、農業分野のインスタンスセグメンテーションのための新しいベンチマークデータセットである。
FTWは70,462個のサンプルを持つ以前のデータセットよりも桁違いに大きい。
FTWで訓練されたモデルは、留保国において、ゼロショットと微調整性能が向上していることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:41:29 GMT)
Energy consumption of code small language models serving with runtime engines and execution providers [12.0] 小言語モデル(SLM)は、リソース要求を減らすための有望なソリューションを提供する。
私たちのゴールは、ディープラーニングエンジンと実行プロバイダがエネルギー消費、実行時間、コンピューティング-リソース利用に与える影響を分析することです。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:44:02 GMT)
Multi-concept Model Immunization through Differentiable Model Merging [11.9] モデル免疫は、オープンソースモデルに関連する誤用の潜在的なリスクを軽減することを目的としている。
モデル免疫に関する最近の研究は、シングルコンセプト設定に焦点を当てている。
そこで本研究では,一組の概念を用いた適応法について,単一の難易度初期化'を学習する免疫アルゴリズムを提案する。
複数の概念に適応したモデルの重みの集合を組み合わせた、微分可能なマージ層を組み込むことで、これを実現する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:05 GMT)
Relational Programming with Foundation Models [11.9] 基礎モデルを用いたプログラミングのための宣言型フレームワークであるVieiraを提案する。
Vieiraは基礎モデルをリレーショナルインプットとアウトプットを備えたステートレス関数として扱う。
これは、そのようなモデルと論理プログラムをシームレスに組み合わせることによって、ニューロシンボリックな応用をサポートする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:26:45 GMT)
Web Scraping for Research: Legal, Ethical, Institutional, and Scientific Considerations [11.9] 本稿では,アメリカの研究者を対象とした社会科学研究におけるWebスクレイピングの包括的枠組みを提案する。
我々は、研究者がスクラップを通じてデータにアクセスし、収集し、保存し、共有する方法に影響を及ぼす現在の規制環境の概要を述べる。
次に、科学的に合法的で倫理的な方法でスクレーピングを行うための推奨事項を研究者に提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:09:59 GMT)
Toward Falsifying Causal Graphs Using a Permutation-Based Test [11.8] 既存のメトリクスは、グラフと観測データの間の不整合の数に対して$textitabsolute$を提供する。
本稿では,ノード置換によるベースライン構築による新しい一貫性指標を提案する。
基準線上のものとの不整合の数を比較することにより、解釈可能な計量を導出する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:27:40 GMT)
Stable-V2A: Synthesis of Synchronized Sound Effects with Temporal and Semantic Controls [11.8] サウンドデザイナーやフォーリーアーティストは、通常、映画やビデオゲームのようなシーンを手動でアノテートし、ビデオに対する各アクションをソノエートすることによって、ソノエートする。
本稿では、入力ビデオに関連する音響特性のエンベロープを推定するRMS-Mapperと、対象ビデオに意味的かつ時間的に一致した音声を生成する拡散モデルであるStable-Foleyの2段階モデルを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:37:19 GMT)
DriveGPT: Scaling Autoregressive Behavior Models for Driving [11.7] 本稿では、自律運転のためのスケーラブルな行動モデルDriveGPTを提案する。
我々は,未来のエージェント状態をトークンとして自動回帰的に予測するトランスフォーマーモデルを学習する。
モデルのパラメータをスケールアップし、データを桁違いにトレーニングすることで、スケーリング特性の探索を可能にします。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:06:09 GMT)
LEDiff: Latent Exposure Diffusion for HDR Generation [11.7] LEDiffは、遅延空間露光融合技術により、HDRコンテンツを生成する生成モデルを実現する方法である。
また、LDR-to-fusionコンバータとしても機能し、既存の低ダイナミックレンジ画像のダイナミックレンジを拡張する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:15:55 GMT)
Towards Fair Machine Learning Software: Understanding and Addressing Model Bias Through Counterfactual Thinking [11.7] 本稿では,機械学習ソフトウェアにおけるバイアスの根本原因に対処するための新しい対策手法を提案する。
提案手法は,性能と公平性の両方に最適化されたモデルを組み合わせることで,両面において最適解となる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:10:21 GMT)
KnowledgePrompts: Exploring the Abilities of Large Language Models to Solve Proportional Analogies via Knowledge-Enhanced Prompting [11.6] 比例アナロジー補完のための15K多重質問回答データセットを提案する。
様々な知識を付加したプロンプト設定において,現代大規模言語モデル(LLM)の性能を評価する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:38:59 GMT)
DisCo: Graph-Based Disentangled Contrastive Learning for Cold-Start Cross-Domain Recommendation [11.6] クロスドメインレコメンデーション(CDR)が有望なソリューションとして登場した。
しかし、ソースドメインに類似した好みを持つユーザは、ターゲットドメインに対して異なる関心を示す可能性がある。
そこで本稿では,ユーザ意図の微粒化を捉えるために,グラフに基づく非交叉型コントラスト学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:20:42 GMT)
TrimLLM: Progressive Layer Dropping for Domain-Specific LLMs [11.6] ドメイン固有のユースケースにおけるローカルデプロイメントのための大規模言語モデル(LLM)の専門化は、強力なパフォーマンスを実現する上で必要である。
我々は,現代のLLMで経験的に観察し,検証した層ワイド特殊化現象に基づいてTrimLLMを開発した。
特定のドメインにおけるLLMの能力を維持し、ハードウェアやディープラーニングフレームワークに関係なく、推論スピードアップが達成できることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:33:13 GMT)
AdaCred: Adaptive Causal Decision Transformers with Feature Crediting [11.5] AdaCredは、短時間のアクション・リワード状態列から構築された因果グラフとして軌跡を表す新しいアプローチである。
実験により,AdaCredをベースとしたポリシでは,より短い軌道列が必要であり,オフライン強化学習と模倣学習環境の両方において従来手法よりも一貫して優れていたことが実証された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:22:37 GMT)
ResoFilter: Rine-grained Synthetic Data Filtering for Large Language Models through Data-Parameter Resonance Analysis [11.3] モデル,データ,タスクを統合してデータセットを洗練するための新しい手法であるResoFilterを提案する。
我々の実験は、ResoFilterがフルスケールの微調整に匹敵する結果が得られることを示した。
この方法は、合成データセットの構築と高品質なデータ評価に有用な洞察を提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:57:47 GMT)
RU-AI: A Large Multimodal Dataset for Machine-Generated Content Detection [11.3] 本稿では,テキスト,画像,音声中の機械生成コンテンツの堅牢かつ効率的な検出のための大規模マルチモーダルデータセットであるRU-AIを紹介する。
私たちのデータセットは、Flickr8K、COCO、Places205という3つの大きな公開データセットに基づいて構築されています。
その結果、既存のモデルは、データセットのトレーニング後に正確で堅牢な分類を達成するのに依然として苦労していることが明らかとなった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:09:02 GMT)
A Light-Weight Framework for Open-Set Object Detection with Decoupled Feature Alignment in Joint Space [11.2] オープンセット物体検出(OSOD)は、非構造環境におけるロボット操作に非常に望ましい。
既存のOSOD法は、計算負荷と複雑な展開のために、ロボットアプリケーションの要求を満たすことができないことが多い。
本稿では,ロボットシステムにおけるリアルタイムOSODタスクを支援するために,Decoupled OSOD(DOSOD)と呼ばれる軽量フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:32:53 GMT)
CodeRepoQA: A Large-scale Benchmark for Software Engineering Question Answering [11.1] ソフトウェア工学におけるリポジトリレベルの質問応答能力を評価するための大規模なベンチマークであるCodeRepoQAを紹介する。
CodeRepoQAは5つのプログラミング言語を含み、幅広いシナリオをカバーし、言語モデルの包括的な評価を可能にする。
CodeRepoQAは585,687のエントリを持ち、さまざまなソフトウェアエンジニアリングシナリオをカバーするマルチターン質問答えベンチマークである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:48:01 GMT)
From Expectation to Habit: Why Do Software Practitioners Adopt Fairness Toolkits? [11.1] 本研究では,公正度ツールキットの導入に影響を与える要因を個人的視点から検討した。
以上の結果から,期待度と習慣がフェアネスツールキット採用の主要な要因であることが判明した。
実践的な推奨事項としては、ツールキットのユーザビリティの向上、バイアス軽減プロセスの定期的な開発への統合、継続的なサポートの提供などがある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:22:55 GMT)
Towards Adversarially Robust Dataset Distillation by Curvature Regularization [11.0] 蒸留したデータセットに対向ロバスト性を組み込むことで、これらのデータセットでトレーニングされたモデルが高い精度を維持し、より良い対向ロバスト性を得る。
そこで本研究では, 従来の逆算法よりも計算オーバーヘッドの少ない蒸留プロセスに曲率正規化を組み込むことにより, この目標を達成する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:39:24 GMT)
Do Parameters Reveal More than Loss for Membership Inference? [10.8] 最適メンバーシップ推論には、ホワイトボックスアクセスが本当に必要であることを示す。
我々の理論的結果は、新しいホワイトボックス推論攻撃、IHA(Inverse Hessian Attack)につながる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:33:00 GMT)
Enhancing Masked Time-Series Modeling via Dropping Patches [10.7] 本稿では,時系列のサブシーケンスレベルパッチをランダムにドロップすることで,既存のマスク付き時系列モデリングの強化方法について検討する。
DropPatchと呼ばれる手法が提案され、二乗レベルの利点によって事前学習効率が向上する。
ドメイン内、クロスドメイン、少数ショット学習、コールドスタートといったシナリオでのモデリングには、さらにメリットがある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:21:34 GMT)
Downscaling Precipitation with Bias-informed Conditional Diffusion Model [10.5] 現在のグローバル気候モデルでは、局所分析には大きすぎる空間分解能で運用されている。
ディープラーニングに基づく統計的ダウンスケーリング手法は、有望なソリューションを提供する。
降水の統計的ダウンスケーリングのためのバイアスインフォームド条件拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:36:52 GMT)
DCRA-Net: Attention-Enabled Reconstruction Model for Dynamic Fetal Cardiac MRI [10.5] 動的心再建注意ネットワーク (DCRA-Net) は空間的・時間的領域における注意機構を利用した新しい深層学習モデルである。
DCRA-Netは,42例の胎児と153例の成人の心MRIで再検討した。
格子アンダーサンプリング、データの一貫性、時間周波数表現を使用する場合、最高性能が達成された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:17:26 GMT)
Making Transparency Advocates: An Educational Approach Towards Better Algorithmic Transparency in Practice [10.5] 人工知能(AI)によって引き起こされるリスクと害に関する懸念は、アルゴリズムの透明性について大きな研究結果をもたらしている。
XAIにおける10年の開発にもかかわらず、研究の進歩はアルゴリズムの透明性の実装に完全には翻訳されていない。
透明性の擁護者を作成することによって、この問題に対処するためのアプローチをテストします。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:49:59 GMT)
Unleashing the Unseen: Harnessing Benign Datasets for Jailbreaking Large Language Models [10.5] GPT-4やLLaMA 3のような大規模言語モデル(LLM)は、ジェイルブレイク攻撃に弱いままである。
ジェイルブレイク攻撃によって生じる敵の接尾辞には有意義な特徴がある可能性が示唆された。
その結果,ブラックボックス設定でGPTの安全アライメントを完全に排除できることがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:32:59 GMT)
Do Influence Functions Work on Large Language Models? [10.5] 影響関数は、個々のトレーニングデータポイントがモデルの予測に与える影響を定量化する上で重要である。
我々は,複数のタスクにまたがる影響関数を評価し,ほとんどの設定において不整合なパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:33:43 GMT)
DroughtSet: Understanding Drought Through Spatial-Temporal Learning [10.4] 干ばつは最も破壊的で高価な自然災害の1つである。
我々は,関連する予測機能と3つの干ばつ指標を統合した新しいデータセットDroughtSetを提案する。
本モデルは物理・生物学的特徴の空間的・時間的情報から学習し,3種類の干ばつを同時に予測する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:24:15 GMT)
Revisiting Concept Drift in Windows Malware Detection: Adaptation to Real Drifted Malware with Minimal Samples [10.4] 本研究では,ドリフトマルウェアの検出と分類を行う新しい手法を提案する。
グラフニューラルネットワークと対向ドメイン適応を利用して、マルウェア制御フローグラフのドリフト不変性を学習する。
当社のアプローチは,公開ベンチマークや,セキュリティ企業によって毎日報告されている実世界のマルウェアデータベース上でのドリフトマルウェアの検出を大幅に改善する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:05:59 GMT)
VisualRWKV: Exploring Recurrent Neural Networks for Visual Language Models [10.3] 線形RNNモデルのマルチモーダル学習タスクへの最初の応用であるVisualRWKVを紹介する。
モデリング能力を高めるために,データ依存の再現とサンドイッチプロンプトを提案する。
VisualRWKVは、様々なベンチマークでLLaVA-1.5のようなTransformerベースのモデルと比較して、競争力がある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:26:14 GMT)
Generalizing Denoising to Non-Equilibrium Structures Improves Equivariant Force Fields [10.3] 本稿では,非平衡構造(DeNS)を補助的タスクとして活用し,トレーニングデータの活用と性能向上を提案する。
DeNSを用いたトレーニングでは,まず3次元座標にノイズを加え,そのノイズを予測することで3次元構造を破損させた。
OC20,OC22,MD17データセット上で,DeNSを用いた同変ネットワークのトレーニングの有効性を検討した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:29:47 GMT)
FiVL: A Framework for Improved Vision-Language Alignment [10.2] 本稿では,LVLMを学習するための新しいデータセット構築手法であるFiVLを紹介する。
これらのデータセットは、LVLMのイメージコンテンツを実体的証拠として使用する能力のトレーニングと評価の両方に使用することができる。
提案するデータセットの有用性を実証するために,検証手法と説明可能性の応用とともに,ベースラインを向上する革新的なトレーニングタスクを導入する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:24:10 GMT)
Fast inverse lithography based on a model-driven block stacking convolutional neural network [10.2] 本稿では,光近接補正(OPC)に対する新しい逆リソグラフィー手法を提案する。
モデル駆動でブロックを積み重ねるディープラーニングフレームワークを採用しており、製造に寄与するマスクの生成を迅速化する。
数値実験により,提案手法の有効性が実証された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:42:07 GMT)
Quantum circuit synthesis with SQiSW [10.1] iSWAPゲートの平方根としても知られるSQiSWゲートは、優れた実験性能のためにかなりの注目を集めている。
本研究では,8つのSQiSWゲートのみを用いたトフォリゲートの正確な合成手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:17:43 GMT)
Tokenphormer: Structure-aware Multi-token Graph Transformer for Node Classification [10.0] 構造対応マルチトークングラフ変換器(Tokenphormer)を提案する。
複数のトークンを生成し、局所的および構造的な情報をキャプチャし、異なるレベルの粒度でグローバルな情報を探索する。
実験により,提案したTokenphormerのノード分類タスクにおける最先端性能を実現することができることを示した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:44:18 GMT)
Graph-Convolutional Networks: Named Entity Recognition and Large Language Model Embedding in Document Clustering [9.9] 本稿では、文書クラスタリングのためのグラフベースのフレームワークに、名前付きエンティティ認識(NER)とLarge Language Models(LLM)を組み込む新しいアプローチを提案する。
グラフ畳み込みネットワーク(GCN)を用いて最適化された名前付きエンティティ類似性によって重み付けされた文書とエッジのノードでグラフを構築する。
実験結果から,本手法はクラスタリングにおける従来の共起型手法,特に名前付きエンティティに富んだ文書よりも優れていたことが示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:03:22 GMT)
Iterative Methods for Full-Scale Gaussian Process Approximations for Large Spatial Data [9.9] 本稿では, FSAを用いた確率, 勾配, 予測分布の計算コストの削減に, 反復法をどのように利用できるかを示す。
また,推定法や反復法に依存する予測分散を計算する新しい,正確かつ高速な手法を提案する。
すべてのメソッドは、ハイレベルなPythonとRパッケージを備えたフリーのC++ソフトウェアライブラリで実装されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:46:02 GMT)
HiCM$^2$: Hierarchical Compact Memory Modeling for Dense Video Captioning [9.9] 密度ビデオキャプション(DVC)への関心が高まっている。
いくつかの研究は、事前学習や外部記憶など、事前知識を活用する上での課題を強調している。
本稿では,人間指向階層型コンパクトメモリの事前知識を活用するモデルを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:06:25 GMT)
THESAURUS: Contrastive Graph Clustering by Swapping Fused Gromov-Wasserstein Couplings [9.8] We present conTrastive grapH clustEring by SwApping fUsed gRomov-wasserstein couplingS (THESAURUS)
本手法では,コンテキスト情報を提供するためのセマンティックプロトタイプを導入し,クロスビュー代入予測プレテキストタスクを採用する。
これはGromov-Wasserstein Optimal Transport (GW-OT) と提案したプロトタイプグラフを利用して、グラフ構造のクラスタ情報を徹底的に活用する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:00:59 GMT)
Quantum Compilation Toolkit for Rydberg Atom Arrays with Implications for Problem Hardness and Quantum Speedups [9.8] 我々は、Rydberg atom array に基づく量子ハードウェア上での最大独立集合(MIS)問題を解決するための量子コンパイルツールキットを提案し、実装する。
第1のモジュール(リデューサ)はハードウェアに依存しない決定論的還元論理を提供し、遅延斜め除去による問題サイズを反復的に減少させる。
第2モジュール(互換性チェッカー)はハードウェア互換性チェッカーを実装し、与えられた入力グラフがRydberg量子ハードウェアの制約と互換性があるかどうかを素早く判定する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:51:33 GMT)
Robust and Communication-Efficient Federated Domain Adaptation via Random Features [9.6] フェデレートされたドメイン適応(FDA)は、この課題に対処するための強力なアプローチとして現れます。
RF-TCAは、理論的および経験的性能を損なうことなく計算を著しく高速化する標準転送成分分析手法の拡張である。
我々は,FedRF-TCAの優れた性能とロバスト性(ネットワーク状態への)を示す広範囲な実験を行った。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:09:23 GMT)
Successive optimization of optics and post-processing with differentiable coherent PSF operator and field information [9.5] 我々は正確な光学シミュレーションモデルを導入し、パイプライン内の全ての操作は微分可能である。
様々な劣化に効率的に対処するために,フィールド情報を活用する共同最適化手法を設計する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:49:40 GMT)
DLCRec: A Novel Approach for Managing Diversity in LLM-Based Recommender Systems [9.4] LLMに基づくレコメンデーションにおいて,多様性のきめ細かい制御を可能にする新しいフレームワークを提案する。
従来の方法とは異なり、DLCRecはきめ細かいタスク分解戦略を採用し、推奨プロセスを3つのサブタスクに分割する。
本稿では,ノイズやアウト・オブ・ディストリビューションデータに対するモデルの堅牢性を高める2つのデータ拡張手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:26:32 GMT)
Human-Humanoid Robots Cross-Embodiment Behavior-Skill Transfer Using Decomposed Adversarial Learning from Demonstration [9.4] 本稿では,デジタル人間モデルを共通プロトタイプとして使用することにより,データのボトルネックを低減するための転送可能なフレームワークを提案する。
このモデルは、人間による実演から、敵対的な模倣を通して行動プリミティブを学習し、複雑なロボット構造を機能的な構成要素に分解する。
本フレームワークは,多種多様な構成のヒューマノイドロボット5体を用いて検証した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:41:45 GMT)
Bag of Tricks for Multimodal AutoML with Image, Text, and Tabular Data [9.3] 本稿では,自動機械学習(AutoML)のベストプラクティスについて検討する。
実世界の様々なアプリケーションから22のマルチモーダルデータセットからなるベンチマークをキュレートする。
大規模な実験と分析を通じて、有効な戦略のコレクションを蒸留し、それらを統一されたパイプラインに統合する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:52:10 GMT)
Single-Loop Federated Actor-Critic across Heterogeneous Environments [9.3] エージェントが2段階のフェデレート方式でアクター・クリティカル・ラーニングを行うためのテキストサイトSingle-loop Federated Actor Critic (SFAC) について検討する。
SFACの収束誤差は環境に比例してほぼ定常点に収束することを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:13:59 GMT)
OpenEMMA: Open-Source Multimodal Model for End-to-End Autonomous Driving [9.1] マルチモーダル大言語モデル(MLLM)に基づくオープンソースのエンドツーエンドフレームワークであるOpenEMMAを提案する。
OpenEMMAは、Chain-of-Thought推論プロセスを導入することで、ベースラインよりも大幅に改善されている。
OpenEMMAは、様々な挑戦的な運転シナリオにおいて、有効性、一般化可能性、堅牢性を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:40 GMT)
Advances in Artificial Intelligence forDiabetes Prediction: Insights from a Systematic Literature Review [9.0] この体系的なレビューでは、データセット、アルゴリズム、トレーニング方法、評価指標に重点を置いた、糖尿病の予測における機械学習(ML)の使用について検討する。
このレビューは、CNN、SVM、ロジスティック回帰、XGBoostといったMLアルゴリズムのパフォーマンスを糖尿病の結果を予測するために評価する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:09:10 GMT)
Neural diversity is key to collective artificial learning [8.9] 集合的人工知能のいくつかの側面における行動多様性の影響について検討する。
チームの成果を改善するために、偏見のない行動の役割が出現することを示します。
また, 多様なエージェントが協調的ソリューションの発見にいかに効果的かを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:13:32 GMT)
Who is Helping Whom? Student Concerns about AI- Teacher Collaboration in Higher Education Classrooms [8.9] 本稿では,授業におけるAIの意義を,教室の協調的ダイナミクスの観点から理解することを目的としている。
我々は65人の参加者の物語を分析し、教育コンテキストのAI非コンテクスト化、バイアスの懸念に対するAI-Teacherの協力、パワー格差の3つの課題を強調した。
効果的な倫理的AI実践型協調教育には、将来のAIEd設計は実装の在り方に影響を及ぼす必要があると論じる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:35:01 GMT)
STRAP: Robot Sub-Trajectory Retrieval for Augmented Policy Learning [8.9] STRAPは、トレーニング済みの視覚基盤モデルと動的時間ワープを利用して、大規模なトレーニングコーパスからトラジェクトリのサブシーケンスを堅牢に検索する技術である。
本研究では、事前学習された視覚基盤モデルと動的時間ワープを活用して、大規模学習コーパスからのトラジェクトリのサブシーケンスをロバストに検索するSTRAPを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:54:06 GMT)
Typhoon 2: A Family of Open Text and Multimodal Thai Large Language Models [8.8] 本稿ではタイ語に最適化されたテキストとマルチモーダルな大規模言語モデルであるTyphoon 2を紹介する。
Typhoon2-Text は Llama 3 や Qwen2 のような最先端のオープンモデルに基づいて構築され、英語とタイ語のデータを混合して連続的な事前学習を行う。
Typhoon2-Visionは、画像キャプションなどの一般的な視覚能力を維持しながら、タイ語の文書理解を改善する。
Typhoon2-Audioは、音声、音声、テキスト入力を処理し、テキストと音声の両方の出力を生成することができるエンドツーエンドの音声音声合成モデルアーキテクチャを導入している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:36:38 GMT)
Unified Image Restoration and Enhancement: Degradation Calibrated Cycle Reconstruction Diffusion Model [8.7] CycleRDMは、復元および拡張タスクを統合するために設計された新しいフレームワークである。
分解された領域、粗い正規領域、および正規領域の間の写像関係を学習する。
復元品質を向上させるため,分解ウェーブレット高周波領域の特徴ゲインモジュールを設計した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:33:33 GMT)
Bright-NeRF:Brightening Neural Radiance Field with Color Restoration from Low-light Raw Images [8.7] 本稿では,低照度原画像から高輝度・高画質の放射場を教師なしで学習するBright-NeRFを提案する。
本手法は,色復元,デノナイズ,新規なビュー合成の促進を同時に実現している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:55:18 GMT)
PEFT-as-an-Attack! Jailbreaking Language Models during Federated Parameter-Efficient Fine-Tuning [8.6] 本稿では,PEFT-as-an-Attack(PaaA)と呼ばれる新たなセキュリティ脅威をFedPEFTに導入する。
PaaAの評価では、モデルのパラメータの1%未満がトレーニング可能であり、クライアントの少数のサブセットが悪意を持って行動しているため、LoRAなどの代表PEFT手法を用いて攻撃成功率が約80%に達することが判明した。
この結果から,FedPEFTパラダイムの安全性確保と性能維持を同時に行う,より効果的な防衛機構の必要性が示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:30:23 GMT)
Online MDP with Transition Prototypes: A Robust Adaptive Approach [8.6] オンラインのロバストなマルコフ決定プロセス(MDP)について検討し、基礎となる遷移カーネルの有限個のプロトタイプに関する情報を得る。
本稿では,対応するロバストポリシーの性能を保証しつつ,真の基盤となるトランジションカーネルを効率的に同定するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:41:03 GMT)
Constrained LTL Specification Learning from Examples [8.5] 制約学習と呼ばれる新しいタイプの学習問題を提案する。
肯定的な例と否定的な例に加えて、ユーザーは公式の特性に関する1つ以上の制約を指定できる。
実験により、ATLASは、最先端の学習ツールよりも優れた性能を保ちながら、新しいタイプの学習問題を解決することができることを示した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:49:59 GMT)
IOHunter: Graph Foundation Model to Uncover Online Information Operations [8.5] ソーシャルメディアプラットフォームは、社会的物語に幅広い声が影響を及ぼす現代アゴラスとして機能し、公共の場として欠かせない場所となっている。
偽情報、偽ニュース、誤解を招く主張の拡散は民主的プロセスと社会的結束を脅かす。
本稿では,様々なインフルエンスキャンペーンを通じて,情報操作を編成するユーザ,すなわちtextitIOドライバを識別する手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:14:24 GMT)
TDCNet: Transparent Objects Depth Completion with CNN-Transformer Dual-Branch Parallel Network [8.5] 透明物体深度を補完する2分岐CNN-Transformer並列ネットワークであるTDCNetを提案する。
本モデルは,複数の公開データセットにまたがって最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:42:21 GMT)
Langevin dynamics for high-dimensional optimization: the case of multi-spiked tensor PCA [8.4] 本研究では,最大SNRに伴うスパイクの回復に必要なサンプルの複雑さが,シングルスパイクの場合のよく知られたアルゴリズムしきい値と一致することを示す。
重要なステップとして、高次元の軌道力学を捉えるスパイクと相互作用の詳細なキャラクタリゼーションを提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:30:05 GMT)
Probabilistic Strategy Logic with Degrees of Observability [8.4] 情報透明性特性の推論は、セキュリティ、プライバシ、意思決定を含む多くの領域で有用である。
エージェントによる時間的特性の観測可能性の度合いを計測する新しい可観測性演算子を用いて確率論的戦略論理を拡張した。
結果の論理に対するモデルチェックの問題が決定可能であることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:17:04 GMT)
Federated Learning for Coronary Artery Plaque Detection in Atherosclerosis Using IVUS Imaging: A Multi-Hospital Collaboration [8.4] 経皮的冠動脈インターベンション(PCI)における血管内超音波(IVUS)画像の従来的解釈は時間集約的かつ矛盾する。
多段階セグメンテーションアーキテクチャを持つ並列2次元U-Netモデルを開発した。
0.706のDice similarity Coefficient (DSC) は、プラークを効果的に識別し、リアルタイムで円形の境界を検出する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:06:28 GMT)
Sum of Squares Circuits [8.3] 確率回路(PC)は、このトラクタビリティvs表現性トレードオフを理論的に分析できる枠組みを提供する。
負のパラメータによる減算混合を符号化する正方形PCは単調PCよりも指数関数的に表現可能であることを示す。
我々は、二乗PCと単調PCの両方よりも指数関数的に表現できる新しい種類のPCを定式化する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:34:56 GMT)
Color Enhancement for V-PCC Compressed Point Cloud via 2D Attribute Map Optimization [8.2] ビデオベースのポイントクラウド圧縮(V-PCC)は、動的ポイントクラウドデータをビデオシーケンスに変換する。
本稿では,V-PCC圧縮点雲の色質向上を目的としたフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:58:00 GMT)
Active Inference and Human--Computer Interaction [8.1] 我々は、Active Inferenceと、それが人間とコンピュータの相互作用ループのモデル化にどのように適用できるかをレビューする。
Active Inferenceは、人間の生成モデルを管理するコヒーレントなフレームワークを提供する。
オフラインデザインを通知し、リアルタイム、オンライン適応をサポートする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:17:31 GMT)
GSRender: Deduplicated Occupancy Prediction via Weakly Supervised 3D Gaussian Splatting [7.9] それまでの弱い監督されたNeRF法では、カメラ線に沿ったサンプリング数によってmIoUが5~10ポイント変化し、効率と精度のバランスが取れていた。
本稿では,GSRenderを提案する。GSRenderは自然に3次元ガウススプラッティングを用いて占有率予測を行い,サンプリングプロセスを簡素化する。
提案手法は,RayIoU (+6.0) においてSOTAを達成し,そのギャップを3次元監視法で狭める。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:57:37 GMT)
Promptable Representation Distribution Learning and Data Augmentation for Gigapixel Histopathology WSI Analysis [7.8] 本稿では,パッチレベルの表現学習とWSIレベルのデータ拡張のためのPRDL(Promptable Representation Distribution Learning)を提案する。
提案手法は最先端の手法よりも安定して性能を向上する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:47:17 GMT)
Latent Variable Sequence Identification for Cognitive Models with Neural Network Estimators [7.7] 本稿では,ニューラルベイズ推定を拡張して,実験データと対象変数空間との直接マッピングを学習する手法を提案する。
我々の研究は、リカレントニューラルネットワークとシミュレーションベースの推論を組み合わせることで、潜在変数配列を特定することで、研究者がより広範な認知モデルにアクセスできるようになることを強調している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:37:38 GMT)
Time Will Tell: Timing Side Channels via Output Token Count in Large Language Models [7.7] 本稿では,大規模言語モデル(LLM)における推論入力に関する機密情報を敵が抽出できる新しいサイドチャネルを示す。
我々は,このサイドチャネルを用いた攻撃を,機械翻訳タスクのターゲット言語を復元し,分類タスクの出力クラスを復元する2つの共通LLMタスクで構築する。
実験の結果,3つの異なるモデルに対して75%以上の精度で,翻訳タスクの出力言語を学習できることが判明した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:29:58 GMT)
ST-ReP: Learning Predictive Representations Efficiently for Spatial-Temporal Forecasting [7.6] 自己監督的手法は空間的時間的表現の学習にますます適応している。
現在の値再構成と将来の値予測は、事前学習フレームワークに統合される。
予測能力を高めるために,マルチタイムスケール分析を自己監督的損失に組み込む。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:33:55 GMT)
Federated Heavy Hitter Analytics with Local Differential Privacy [7.6] フェデレートされたヘビーヒットター分析により、サービスプロバイダは、最も頻繁なアイテムを分析して、サードパーティユーザの好みをよりよく理解することができる。
ローカルディファレンシャルプライバシ(LDP)は、プライバシ保存データ収集のテキストファクトスタンダードとして、各ユーザがデータをローカルに摂動させ、衛生バージョンを報告することによって、プライバシの課題を解決する。
本稿では,フェデレートヘビーヒッタ解析のための,$epsilon$-LDPを満たす新規なターゲットアライニングプレフィックスツリー機構を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:20:32 GMT)
A Universal Model for Human Mobility Prediction [7.5] 個人軌跡と群集の流れの両方に適用可能なユニバーサルな人体移動予測モデル(UniMob)を提案する。
このモデルでは,MAPE と Accuracy@5 で 14% 以上,25% 以上のパフォーマンス向上を実現している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:38:13 GMT)
Non-intrusive and Unconstrained Keystroke Inference in VR Platforms via Infrared Side Channel [7.5] メインストリームVRプラットフォームの星座追跡システムに,新たなサイドチャネルリークを新たに提示する。
コントローラとヘッドセットのインタラクションのためにVRコントローラから出力される赤外線(IR)信号は悪意的に悪用され、制約のない入力キーストロークを再構築することができる。
本稿では,この新しい赤外線側チャネルの実現可能性と実用性を示すために,VRecKeyという新しいキーストローク推論攻撃を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:09:46 GMT)
FSL-Rectifier: Rectify Outliers in Few-Shot Learning via Test-Time Augmentation [7.5] FSL(Few-shot Learning)は通常、トレーニング中に目に見えないクラスに属する画像(クエリ)を識別するモデルを必要とする。
生成画像コンバインダを用いて、原サンプルと適切な列車クラスサンプルを組み合わせることで、追加のテストクラスサンプルを生成する。
我々は、平均化によってより典型的な表現をもたらす拡張子を介して平均化された特徴を得る。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:03:58 GMT)
99.9%-fidelity in measuring a superconducting qubit [7.5] 量子状態測定ラグは、速度と忠実性において量子ゲート演算の約1桁遅れている。
そこで我々は、量子ビットと共振器の長寿命相互作用方式を実装するために、新しいアーキテクチャを設計する。
実験の結果,第1段増幅を必要としない202nsで99.8%の測定精度が得られた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:04:28 GMT)
LLMs as Zero-shot Graph Learners: Alignment of GNN Representations with LLM Token Embeddings [7.3] Token Embedding-Aligned Graph Language Model (TEA-GLM) という新しいフレームワークを紹介する。
我々はGNNを事前訓練し、その表現をLLMのトークン埋め込みと整列する。
次に、GNNの表現を固定数のグラフトークン埋め込みに変換する線形プロジェクタを訓練する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:37:00 GMT)
Low-resource Machine Translation: what for? who for? An observational study on a dedicated Tetun language translation service [7.3] 本稿では,Timor-LesteのTetun言語におけるMTサービスの実際の利用パターンについて考察する。
10万件の翻訳要求を解析した結果,既存のコーパスに基づいて仮定に挑戦するパターンが明らかになった。
この結果から,テトゥーンのような少数言語のためのMTシステムは,教育的文脈に関連する領域の精度を優先すべきであることが示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:29:23 GMT)
FaultExplainer: Leveraging Large Language Models for Interpretable Fault Detection and Diagnosis [7.2] 本稿では,テネシー・イーストマン・プロセス(TEP)における障害検出,診断,説明の改善を目的とした対話型ツールであるFactExplainerを提案する。
FaultExplainerは、リアルタイムセンサデータ可視化、主成分分析(PCA)に基づく障害検出、および大規模言語モデル(LLM)を利用した対話型ユーザインタフェースにおける上位コントリビューション変数の識別を統合する。
2つのシナリオでLLMの推論能力を評価する。1つは歴史的根本原因が提供される場合であり、もう1つは以前に見つからなかった障害の課題を模倣しない場合である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:35:06 GMT)
HSEvo: Elevating Automatic Heuristic Design with Diversity-Driven Harmony Search and Genetic Algorithm Using LLMs [7.0] ヒューリスティック・デザインは、複雑な探索とNP-ハード最適化の問題を解くのに有用であることから、活発な研究分野である。
適応型LLM-EPSフレームワークであるHSEvoを導入する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:07:00 GMT)
ConfliBERT: A Language Model for Political Conflict [7.0] 紛争学者は、政治暴力に関する情報をニュースやテキストから抽出するためにルールに基づくアプローチを用いてきた。
我々は、最近のConfliBERT言語モデルについて、政治的および暴力に関するテキストを処理するためにレビューする。
微調整すると、ConfliBERTは他の大規模言語モデルよりも精度、精度、リコールが優れていることが分かる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:08:11 GMT)
Leveraging Color Channel Independence for Improved Unsupervised Object Detection [7.0] コンピュータビジョンにおける教師なし学習において,RGB画像が最適な色空間であるという一般的な仮定に挑戦する。
新たなカラーチャネルの予測を行う場合には,モデルの改善が期待できる。
合成色空間の使用は、基本的に計算オーバーヘッドを伴わずに実装することができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:28:37 GMT)
FedPIA -- Permuting and Integrating Adapters leveraging Wasserstein Barycenters for Finetuning Foundation Models in Multi-Modal Federated Learning [7.0] FLとPEFTの単純な組み合わせを改善したFedPIAという新しいフレームワークを提案する。
我々は、5つの異なる医療ビジョン言語FLタスク設定で48の医療画像データセットを用いて2000以上のクライアントレベルの実験を行う。
実験の結果,FedPIAは最先端のPEFT-FLベースラインより一貫して優れていた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:24:00 GMT)
DCTdiff: Intriguing Properties of Image Generative Modeling in the DCT Space [7.0] 本稿では、離散コサイン変換(DCT)空間の画像を効率的にモデル化する、エンドツーエンドの拡散生成パラダイムであるDCTdiffを紹介する。
異なるフレームワーク(UViT, DiT)、生成タスク、および様々な拡散サンプリング実験により、DCTdiffは、生成品質とトレーニング効率に関する画素ベースの拡散モデルより優れていることが示された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:44:01 GMT)
Alt-MoE: Multimodal Alignment via Alternating Optimization of Multi-directional MoE with Unimodal Models [6.9] そこで我々は、MoE(Mixture of Experts)をモダリティにまたがる統一多方向コネクタとして利用する、新しいトレーニングフレームワークAlt-MoEを紹介する。
我々の手法は、いくつかの優れたユニモーダルモデルで検証されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:31:18 GMT)
Position: A taxonomy for reporting and describing AI security incidents [6.8] 業界,プロバイダ,ユーザ,研究者といった,さまざまな利害関係者の関心やニーズを考慮した提案を行うべきだ,と私たちは主張する。
本稿では,マシンの可読性や既存のデータベースとのリンク性といった要求に沿った分類法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:50:26 GMT)
Deep learning in motion deblurring: current status, benchmarks and future prospects [6.8] ブラインド・モーション・デブロワーリングは、ぼやけの種類を事前に知ることなく、鮮明で詳細な画像を復元することを目的としている。
本稿では,過去6年間に開発されたデータセット,評価指標,手法を網羅し,視覚障害者の深層学習の役割を概観する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:11:39 GMT)
Utilizing Causal Network Markers to Identify Tipping Points ahead of Critical Transition [6.8] 本稿では因果性指標を取り入れた因果性ネットワークマーカー(CNM)の枠組みを提案する。
臨界遷移に先立って先端点を検出し同定するために、2つのマーカーを設計する。
応用の最も可能性の高い方向は、臨床疾患の尖点の同定である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:10:47 GMT)
FROC: Building Fair ROC from a Trained Classifier [6.7] 実践者がどんなしきい値を使っても、その分類器は保護されたグループの両方に公平であるべきである。
我々は、ある分類器の出力を$varepsilon_p$-Equalized ROCを満たす確率的分類器に変換するために、線形時間アルゴリズム、すなわち textttFROC を設計する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:47:31 GMT)
Leveraging Group Classification with Descending Soft Labeling for Deep Imbalanced Regression [6.6] ディープ・インバランス・レグレッション(DIR)は、機械学習において興味深いが未探索の課題である。
まず、DIRの目的とベイズ的観点からの分類の関連性を橋渡しする。
具体的には、近隣のラベルのデータを同じグループに集約することにより、順序付きグループ認識学習損失を導入する。
また,データ間の固有類似性を生かした対称な下降型ソフトラベリング手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:34:30 GMT)
Mixed Semi-Supervised Generalized-Linear-Regression with Applications to Deep-Learning and Interpolators [6.5] 本稿では、ラベルのないデータを用いて、半教師付き学習法(SSL)を設計する手法を提案する。
それぞれに$alpha$という混合パラメータが含まれており、ラベルのないデータに与えられる重みを制御する。
我々は,標準教師付きモデルと比較して,大幅な改善を実現するための方法論の有効性を実証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:22:30 GMT)
Comparing noisy neural population dynamics using optimal transport distances [6.5] 既存のメトリクスは、ノイズのある動的応答を持つニューラルネットワーク間の重要な違いを捉えるのに失敗する可能性があることを示す。
次に,雑音性ニューラルトラジェクトリの幾何を比較するためのメトリクスを提案する。
本研究では,運動系の異なる領域における神経応答モデルの比較と,テキスト・ツー・イメージ合成における潜時拡散モデルのダイナミクスの比較を行う。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:20:24 GMT)
LiHi-GS: LiDAR-Supervised Gaussian Splatting for Highway Driving Scene Reconstruction [6.4] そこで本研究では,LiDARの監視とLiDARレンダリングによるシーン再構成を改良した動的シーン合成と編集のための新しい手法を提案する。
都市部のデータセットで主にテストされている以前の作業とは異なり、私たちの知る限りでは、私たちは自動運転のためのより困難で非常に関連性の高いハイウェイシーンに最初に焦点を当てています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:59:55 GMT)
Bel Esprit: Multi-Agent Framework for Building AI Model Pipelines [6.4] 本稿では,ユーザ定義要求に基づいてAIモデルパイプラインを構築するための対話エージェントであるBel Espritを紹介する。
あいまいなユーザクエリからパイプラインを生成する上で,このフレームワークの有効性を示す。
詳細なエラー解析では、パイプライン構築における進行中の課題を強調している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:36:33 GMT)
Rethinking Uncertainty Estimation in Natural Language Generation [6.3] 大規模言語モデル(LLM)は、現実のアプリケーションにますます採用されている。
不確実性推定法は複数の出力シーケンスを生成し解析し、LCMの不確実性を決定する。
単一出力シーケンスのみを用いて得られる利点を持つG-NLLを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:51:06 GMT)
Generalizing Constraint Models in Constraint Acquisition [6.3] 制約獲得(CA:Constraint Acquisition)は、モデリングプロセスにおいてユーザを支援することによって制約プログラミングの利用を拡大することを目的としている。
多くのCAメソッドは、特定の問題インスタンスに対して1組の個々の制約を学習するが、これらの制約を問題のパラメータ化された制約仕様に一般化することはできない。
我々は、同じ問題の様々なインスタンスをモデル化できるパラメータ化制約モデルを学ぶための新しい手法GenConを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:31:29 GMT)
Uncertainty Estimation for Super-Resolution using ESRGAN [6.1] SRGANやESRGANのようなモデルは、最高の画像SRツールの間で常にランク付けされている。
我々はモンテカルロ・ドロップアウトとディープ・アンサンブルを用いてこれらのモデルを強化し、予測の不確実性の計算を可能にした。
以上の結果から,これらの不確実性評価は十分に校正されており,この目標を達成できることが示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:42:29 GMT)
Associative memory inspires improvements for in-context learning using a novel attention residual stream architecture [6.1] 大規模言語モデル(LLM)において、文脈内学習(ICL)が可能な連想記憶モデルを導入する。
我々はこれを、情報を直接アテンションヘッド間で流れる新しい残差ストリームアーキテクチャのインスピレーションとして利用する。
我々はこのアーキテクチャを2層トランスのトレーニング中にテストし、ICLの能力は修正なしではより高速に発揮できることを示した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:55:42 GMT)
Continuous-Time Analysis of Adaptive Optimization and Normalization [6.0] 適応最適化アルゴリズム、特にAdamとその変種AdamWは、現代のディープラーニングの基本コンポーネントである。
この研究は、AdamとAdamWの連続的な時間的定式化を示し、トレーニングダイナミクスの抽出可能な解析を容易にする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:24:51 GMT)
Mention Attention for Pronoun Translation [5.9] ソース参照に余分な注意を払うために、デコーダに追加の参照注意モジュールを導入します。
注記参照モジュールは、ソース参照から特徴を抽出するだけでなく、代名詞翻訳の恩恵を受けるターゲット側コンテキストも考慮する。
我々は、WMT17英語-ドイツ語翻訳タスクの実験を行い、一般的な翻訳と代名詞翻訳のモデルを評価する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:19:19 GMT)
Learning Deep Dissipative Dynamics [5.9] 分散性は、安定性と入出力安定性を一般化する力学系にとって重要な指標である。
本稿では,ニューラルネットワークで表現される任意のダイナミクスを散逸型プロジェクションに変換する微分可能プロジェクションを提案する。
本手法は, 訓練された力学系の安定性, 入力出力安定性, エネルギー保存を厳密に保証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:21:11 GMT)
AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation [5.8] AGFSyncは、AI駆動のアプローチでDPO(Direct Preference Optimization)を通じてT2I拡散モデルを強化するフレームワークである。
AGFSyncのT2I拡散モデルの精製方法は、スケーラブルなアライメント手法の道を開く。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:57:25 GMT)
Balanced Gradient Sample Retrieval for Enhanced Knowledge Retention in Proxy-based Continual Learning [5.8] 勾配を補正することで干渉を減らすことができるため、勾配に整列したサンプルが選択される。
勾配に沿ったサンプルは、タスク間の安定した共有表現を強化するために組み込まれます。
提案手法は,検索したインスタンス間の多様性を高め,パラメータ空間において優れたアライメントを実現する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:08:09 GMT)
Efficient Ranking, Order Statistics, and Sorting under CKKS [5.5] ホモモルフィック暗号化(FHE)は、暗号化されたデータの操作を可能にするため、プライバシ保護アプリケーションに極めて有用である。
計算オーバーヘッドの増大とFHEのネイティブ操作の制限により、これらのタスクの効率的な実装には大きな課題が生じる。
我々は、ランク付け、順序統計、ソートのための解を示し、いずれもO(1)の比較深度を達成している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:06:25 GMT)
Beyond Dataset Creation: Critical View of Annotation Variation and Bias Probing of a Dataset for Online Radical Content Detection [5.5] 我々は、ラディゼーションレベル、行動呼び出し、英語、フランス語、アラビア語で名前付きエンティティを注釈付けした、一般公開された多言語データセットを紹介します。
このデータセットは、コンテキスト情報を保持しながら個人のプライバシを保護するために匿名化される。
我々はアノテーションのプロセスを分析し、アノテータ間のバイアスと不一致を強調し、それらがモデル性能に与える影響を明らかにする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:55:45 GMT)
MAPFAST: A Deep Algorithm Selector for Multi Agent Path Finding using Shortest Path Embeddings [5.5] MAPF(Multi-Agent Path Finding)問題を最適に解くことは、make-spanと総到着時間最小化の両方においてNP-Hardであることが知られている。
最適なMAPFアルゴリズムは、あらゆる種類の問題でうまく機能し、そのアルゴリズムをいつ使用するかに関する標準ガイドラインは存在しない。
我々は、MAPF問題インスタンスを取り込み、アルゴリズムポートフォリオから最も高速なアルゴリズムを選択しようとする、深層畳み込みネットワークMAPFASTを開発した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:16:44 GMT)
AI-Powered Intracranial Hemorrhage Detection: A Co-Scale Convolutional Attention Model with Uncertainty-Based Fuzzy Integral Operator and Feature Screening [5.5] 頭蓋内出血(ICH、Intracranial hemorrhage)とは、頭蓋内の血液の漏れや蓄積を指す用語である。
本研究の主な目的は、ICHの発生または非発生を検出し、次いで、硬膜下出血(SDH)の種類を決定することである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:06:44 GMT)
Enhancing dynamic range through quantum deamplification [5.5] 広ダイナミックレンジ(DR)で高感度をバランスさせることは、測定科学における基本的な課題である。
我々は、DRを最小限の感度で拡張する新しい量子デアンプリフィケーション機構を導入する。
我々のプロトコルは、最先端の原子分子-光学プラットフォームの範囲内にあります。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:08:27 GMT)
GFormer: Accelerating Large Language Models with Optimized Transformers on Gaudi Processors [5.4] ガウディプロセッサのような不均一なハードウェアは、計算を強化するために開発されている。
トランスフォーマーは、このような新興ハードウェアに完全に最適化されていない。
疎線形アテンション機構をマージする統合アプローチ(GFormerと呼ばれる)。
GFormerは、Gaudiプロセッサ上の様々なタスクにおける効率とモデルパフォーマンスを大幅に改善する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:50:11 GMT)
Moving Beyond LDA: A Comparison of Unsupervised Topic Modelling Techniques for Qualitative Data Analysis of Online Communities [5.3] ソーシャルメディアは質的な研究者にとって豊かで影響力のある情報源となっている。
トピックモデリングのような計算技術は、ソーシャルメディアコンテンツの量と多様性を管理するのに役立ちます。
本稿では,高度大規模言語モデル(LLM)に基づくトピックモデリング技術であるBERTopicが,ソーシャルメディアの質的データ分析をどのようにサポートするかを検討する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:19:18 GMT)
CitaLaw: Enhancing LLM with Citations in Legal Domain [5.2] CitaLaw は LLM が適切な引用で合法的に音声応答を生成できる能力を評価するために設計された最初のベンチマークである。
CitaLawは、法記事の包括的コーパスと、前例をリファレンスプールとして組み合わせた、平民と実践者の両方に多様な法的質問を特徴としている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:14:20 GMT)
RAD: Region-Aware Diffusion Models for Image Inpainting [5.2] 本研究では,バニラ拡散モデルの簡易かつ効果的な再構成による塗装用領域認識拡散モデル(RAD)を提案する。
RADは、最先端のアプローチよりも100倍高速な推論時間を実現する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:44:14 GMT)
FedMUP: Federated Learning driven Malicious User Prediction Model for Secure Data Distribution in Cloud Environments [5.1] 本稿では,クラウド環境におけるセキュアなデータ配信のためのフェデレート学習駆動型悪意ユーザ予測モデルを提案する。
ユーザ行動を分析して、複数のセキュリティリスクパラメータを取得する。その後、フェデレートされた学習駆動の悪意のあるユーザ予測アプローチを用いて、疑わしいユーザを積極的に明らかにする。
悪質なユーザ予測精度、精度、リコール、f1スコアの14.32%、17.88%、14.32%、および18.35%といった主要なパフォーマンス指標では、大幅な改善が見られた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:39:47 GMT)
Investigating Relational State Abstraction in Collaborative MARL [5.1] 本稿では,協調型マルチエージェント強化学習における状態抽象化がサンプル効率と性能に与える影響について考察する。
提案する抽象化は,エージェント間の直接通信が許されていない環境での空間的関係に基づいている。
MARC(Multi-Agent Critic)を導入し、状態から空間グラフに変換し、リレーショナルグラフニューラルネットワークを介して処理することで、帰納バイアスを取り入れた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:34:00 GMT)
AndroidWorld: A Dynamic Benchmarking Environment for Autonomous Agents [5.0] 私たちは、20の現実世界のAndroidアプリに116のプログラムタスクに対して報酬信号を提供する、完全に機能するAndroid環境であるAndroidWorldを紹介します。
静的テストセットを提供する既存のインタラクティブ環境とは異なり、AndroidWorldはパラメータ化され自然言語で表現されるタスクを動的に構築する。
私たちの最高のエージェントは、AndroidWorldのタスクの30.6%を完了できます。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:19:02 GMT)
Till the Layers Collapse: Compressing a Deep Neural Network through the Lenses of Batch Normalization Layers [5.0] textbfLayers textbfCollapse (TLC) と呼ばれる手法を導入し、バッチ正規化層のレンズを通してディープニューラルネットワークを圧縮する。
我々は,画像分類と自然言語処理(NLP)タスクの両面で,Swin-T,MobileNet-V2,RoBERTaなどの人気モデル上で本手法の有効性を検証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:26:07 GMT)
Guided Diffusion Model for Sensor Data Obfuscation [4.9] PrivDiffuserは、デノナイジング拡散モデルに基づく新しいデータ難読化手法である。
PrivDiffuserは、最先端の難読化モデルよりも優れたプライバシーとユーティリティのトレードオフをもたらすことを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:47:12 GMT)
A Cross-Domain Study of the Use of Persuasion Techniques in Online Disinformation [4.9] 本研究では,現在最先端の説得技術を用いて,偽情報物語における16の説得技術の役割を大規模・多領域で分析する。
これは、異なる偽情報領域で異なる説得技術がどのように不均等に使用されるかを示す。
また、気候変動の偽情報に関する詳細なケーススタディも含み、言語的、心理的、文化的要因が、ユニークなテーマの文脈に適合する説得戦略の適応をいかに形作るかを強調している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:46:13 GMT)
LAMA-UT: Language Agnostic Multilingual ASR through Orthography Unification and Language-Specific Transliteration [4.9] 正書法統一とLAMA-UT(Language-Agnostic Multilingual ASR Pipeline)による言語に依存しないASRパイプラインを提案する。
LAMA-UTは、最小限のデータ量でトレーニングされた最先端モデルのパフォーマンスに適合しながら、言語固有のモジュールなしで動作します。
パイプラインはWhisperと比較して45%の相対誤差低減率を実現し,MMSと相容れない性能を示した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:39:08 GMT)
Operationalising Rawlsian Ethics for Fairness in Norm-Learning Agents [4.9] 倫理的規範学習エージェントを作成するためのRAWL-Eを提案する。
RAWL-Eエージェント社会に出現する規範は,社会福祉,公正性,堅牢性を高めている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:38:13 GMT)
Mitigating Spurious Correlations via Disagreement Probability [4.9] 経験的リスク最小化(ERM)で訓練されたモデルは、ターゲットラベルとバイアス属性の急激な相関に偏りがちである。
すべてのデータサンプルのモデル性能を堅牢に向上する訓練目標を導入する。
次に, バイアスラベルを必要としない脱バイアス法DPR(Disagreement Probability based Resampling for Debiasing)を導出する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:38:31 GMT)
On the Use of Deep Learning Models for Semantic Clone Detection [4.8] 既存のベンチマークデータセットを利用した5つの最先端クローン検出モデルに対する多段階評価手法を提案する。
具体的には,BigCloneBench,SemanticCloneBench,GPTCloneBenchの3つの高性能単一言語モデル(ASTNN,GMN,CodeBERT)について検討する。
単一言語モデルはBigCloneBenchのF1スコアが高いが、SemanticCloneBenchのパフォーマンスは20%まで異なる。
興味深いことに、クロス言語モデル(C4)は他のモデルよりもSemanticCloneBenchの方が優れたパフォーマンス(約7%)を示している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:15:02 GMT)
Head and Neck Tumor Segmentation of MRI from Pre- and Mid-radiotherapy with Pre-training, Data Augmentation and Dual Flow UNet [4.7] 放射線前療法 (pre-RT) と中放射線中療法 (mid-RT) のセグメンテーションに対する複数戦略の効果を検討した。
そこで我々は,中RT画像の分離エンコーダとラベル付きPre-RT画像の登録を行う,新しい計算フレンドリなネットワークアーキテクチャを導入した。
我々のモデルは,HiLabとして集計したDice similarity Coefficient (DSC)上で,プレRTでは82.38%,ミッドRTでは72.53%のセグメンテーション性能を達成した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:38:20 GMT)
Can We Get Rid of Handcrafted Feature Extractors? SparseViT: Nonsemantics-Centered, Parameter-Efficient Image Manipulation Localization Through Spare-Coding Transformer [4.7] 非意味的特徴は文脈非関連であり、操作に敏感である。
スパースビジョントランス (Sparse Vision Transformer, SparseViT) は、ViTの密集したグローバルな自己意識をスパースな個別の方法で再構成する。
既存のIMLモデルと比較して、スパース自己注意機構はモデルサイズを大幅に削減した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:39:06 GMT)
PRIMA: Multi-Image Vision-Language Models for Reasoning Segmentation [4.6] PRIMAはLVLM(Large Vision-Language Models)で、ピクセルレベルのグラウンドと堅牢なマルチイメージ推論機能を統合する。
PRIMAは複数の画像にわたる細粒度の視覚表現をクエリし、TFLOPを25.3%値下げした。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:59:44 GMT)
Tree-of-Code: A Tree-Structured Exploring Framework for End-to-End Code Generation and Execution in Complex Task Handling [4.6] Tree-of-Codeは1/4回転未満でCodeActよりも精度を20%近く向上させる。
いくつかのLDMは、マルチターンのCodeActよりも、1ターンのCodeProgramの方がパフォーマンスが良い。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:31:22 GMT)
MAIDS: Malicious Agent Identification-based Data Security Model for Cloud Environments [4.6] 悪意のあるエージェントは、クラウド環境からアウトソースされたデータにアクセスすることができる。
悪意のあるエージェントは、意図的にデータを侵害するエンティティである。
本稿では,MAIDS(Malicious Agent Identification-based Data Security)モデルを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:27:14 GMT)
Enhancing Ethereum Fraud Detection via Generative and Contrastive Self-supervision [4.5] 本稿では,メタIFD(Meta-IFD)という2つの自己スーパービジョン強化詐欺検出フレームワークを提案する。
この枠組みは、最初はアカウントの相互作用を増強する生成的自己スーパービジョン機構を導入し、続いて様々な行動パターンを区別する対照的な自己スーパービジョン機構を導入した。
生成モジュールは、データ周波数の相互作用分布の不均衡を効果的に軽減し、対照的なモジュールは、異なる動作パターンを識別するフレームワークの能力を著しく向上させる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:42:00 GMT)
Neuromorphic Spiking Neural Network Based Classification of COVID-19 Spike Sequences [4.5] 本稿では,SARS-CoV-2データの効率的な解析を行うニューラルネットワークベース(NN)機構を提案する。
本稿では、まずスパイクタンパク質配列を固定長の数値表現に変換し、次にニューロモルフィックスパイキングニューラルネットワークを用いてそれらの配列を分類するパイプラインを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:26:31 GMT)
Beyond the Hype: A Comprehensive Review of Current Trends in Generative AI Research, Teaching Practices, and Tools [4.4] 2024年、コンピュータ教室におけるGenAI利用の効果に関する新たな研究が生まれ始めた。
新しいデータには、GenAIを使って教室の授業を大規模にサポートし、学生にGenAIでプログラミングの仕方を教えることが含まれる。
プログラミングの課題について、生徒にパーソナライズされたフィードバックを提供したり、プログラミングとスキルを同時に教える新しい種類のツールが登場している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:01:11 GMT)
Multipartite Entanglement Routing as a Hypergraph Immersion Problem [4.3] 複数ノードを同時にリンクするマルチパーティの絡み合いは、量子ネットワーク(QN)におけるペア接続よりも有利な高次相関である。
ここでは,QNを絡み合うルーティングによって,位相的に別のQNに変換できるかどうかという問題に対処する。
我々の重要な結果は、マルチパーティ・エンタングルメント・ルーティングから、ハイパーグラフに拡張されたナッシュ・ウィリアムズのグラフ浸漬問題への正確なマッピングである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:47:00 GMT)
Systematic Evaluation of Long-Context LLMs on Financial Concepts [4.3] LC LLMの最先端GPT-4スイートの性能評価を行い,課題を段階的に解決する方法について検討した。
LC LLMは, 簡単な作業であっても, より長いコンテキスト長で脆性を示すことが示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:26:55 GMT)
Attentive Eraser: Unleashing Diffusion Model's Object Removal Potential via Self-Attention Redirection Guidance [4.3] Attentive Eraser は、安定かつ効果的な物体除去のために、事前訓練された拡散モデルを強化するチューニング不要な手法である。
本稿では、自己注意機構を再設計するASS(Attention Activation and Suppression)を紹介する。
また、ASSによる自己注意リダイレクトを利用して生成プロセスのガイドを行う自己注意リダイレクトガイダンス(SARG)についても紹介する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:41:19 GMT)
Fearless Unsafe. A More User-friendly Document for Unsafe Rust Programming Base on Refined Safety Properties [4.3] 人気の高いシステムレベルのプログラミング言語であるRustは、実行時の効率性とメモリ安全性を達成するという特徴から、広く注目を集めている。
Rustを採用する現実世界のプロジェクトが増えているため、プログラマが安全でないコードを書くのを助ける方法を理解することが大きな課題となっている。
私たちの観察によると、現在の標準ライブラリは多くの安全でないAPIを持っていますが、それらの記述は均一で、完全で、直感的ではありません。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:02:19 GMT)
Agent-OM: Leveraging LLM Agents for Ontology Matching [4.2] 本研究では,オントロジーマッチングシステムのための新しいエージェント駆動設計パラダイムを提案する。
本稿では,検索とマッチングのための2つのシームズエージェントからなるAgent-OM (Agent for Ontology Matching) フレームワークを提案する。
本システムは,OMタスクにおける長年の最高性能に非常に近い結果が得られる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:07:38 GMT)
Distribution-Level Feature Distancing for Machine Unlearning: Towards a Better Trade-off Between Model Utility and Forgetting [4.2] 本稿では,タスク関連特徴相関を保ちつつ,効率的にインスタンスを破棄する新しい手法である分散レベル特徴分散(DLFD)を提案する。
提案手法は, 特徴分布を忘れ試料と明確に異なるように最適化し, 単一の学習エポック内で有効結果を得る。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:25:07 GMT)
Dynamic User Interface Generation for Enhanced Human-Computer Interaction Using Variational Autoencoders [4.2] 本研究では,変分オートエンコーダ(VAE)モデルに基づく,インテリジェントなユーザインタラクションインタフェース生成と最適化のための新しいアプローチを提案する。
VAEベースのアプローチは、オートエンコーダ(AE)、生成敵ネットワーク(GAN)、条件付きGAN(cGAN)、ディープ信頼ネットワーク(DBN)、VAE-GAN(VAE-GAN)などの他の手法と比較して、インタフェース生成の品質と精度を著しく向上させる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:37:47 GMT)
CAP: A General Algorithm for Online Selective Conformal Prediction with FCR Control [4.1] 全体の誤発見レベルを測定するために,FCR (Real-time false coverage-statement rate) を制御することが重要である。
キャリブレーションセットを構築するために,過去のデータに対して適応的なピックルールを実行するCAPというフレームワークを開発した。
我々は,CAPが有限サンプルおよび分布自由な状態において,厳密な選択条件のカバレッジ保証を達成できることを証明した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:51:17 GMT)
Generative AI for Banks: Benchmarks and Algorithms for Synthetic Financial Transaction Data [4.1] 本研究では、合成金融取引データを生成するための効率的なアルゴリズムを同定する。
フィデリティ、合成品質、効率性、プライバシ、グラフ構造という5つの基準で5つの主要なモデルを評価する。
CTGANは5つの基準のバランスを保ち、適度なプライバシー上の懸念のある一般的なアプリケーションに適している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:56:18 GMT)
Statistical Undersampling with Mutual Information and Support Points [4.1] 大規模データセットにおけるクラス不均衡と分布差は、機械学習の分類タスクにおいて重要な課題である。
本研究は2つの新しいアンダーサンプリング手法,すなわち相互情報に基づく階層化単純ランダムサンプリングとサポートポイント最適化を導入する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:48:29 GMT)
Permutation recovery of spikes in noisy high-dimensional tensor estimation [4.0] マルチスパイクテンソル問題に対する高次元流れのダイナミクスについて検討する。
我々の研究は, 正確な回収に必要なSNRの試料分離条件を決定する論文[Ben A, Gerbelot, Langevin]に基づく。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:59:49 GMT)
Optimal estimates of trace distance between bosonic Gaussian states and applications to learning [4.0] 第1と第2のモーメントがエラー$varepsilon$まで認識されている場合、状態のトレース距離エラーも$varepsilon$にスケールする。
この証明は、2つのガウス状態の間のトレース距離を、その第1モーメントと第2モーメントのノルム距離の観点から厳密な境界を定めている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:51:17 GMT)
IDEA: Enhancing the Rule Learning Ability of Large Language Model Agent through Induction, Deduction, and Abduction [4.0] 対話型環境下での大規模言語モデルのルール学習能力を評価するためにRULEARNを導入する。
誘導, 誘引, アブダクションのプロセスを統合する新しい推論フレームワークであるIDEAを提案する。
5つの代表的なLCMを含むIDEAフレームワークの評価は,ベースラインよりも大幅に改善されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:45:35 GMT)
Knowledge Distillation in RNN-Attention Models for Early Prediction of Student Performance [4.0] RNN-Attention-KD (knowledge distillation) フレームワークを導入し,リスクの高い学生を早期に予測する。
経験的評価では、RNN-Attention-KDはリコールとF1尺度で従来のニューラルネットワークモデルより優れている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:46:06 GMT)
Computing Gram Matrix for SMILES Strings using RDKFingerprint and Sinkhorn-Knopp Algorithm [3.9] 分子構造データでは、SMILES (Simplified Molecular Input Line Entry System) 文字列を用いて分子構造設計を分析する。
本研究では、SMILES文字列から分子構造を符号化・解析するためのカーネルベースのアプローチを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:31:25 GMT)
Helping LLMs Improve Code Generation Using Feedback from Testing and Static Analysis [3.9] 大規模言語モデル(LLM)は人工知能分野における最も有望な発展の1つである。
開発者は定期的にLCMにコードスニペットの生成を依頼し、生産性の向上に加えて、オーナシップ、プライバシ、正確性、セキュリティ問題も導入する。
以前の作業では、商用のLLMによって生成されたコードが、脆弱性やバグ、コードの臭いなど、安全でないことが強調されていた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:34:14 GMT)
Stochastic first-order methods with multi-extrapolated momentum for highly smooth unconstrained optimization [3.9] 目的関数の高次滑らかさを$f$で利用することにより,マルチスペクトル運動量を持つSFOMの最適化を高速化できることを示す。
本手法は, 対象関数の任意の順序の滑らかさを加速度に利用した最初のSFOMである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:22:47 GMT)
Recurrence method in Non-Hermitian Systems [3.9] 開境界条件下での非エルミート系のエネルギースペクトルの新規かつ体系的な再帰法を提案する。
我々の定式化は、数値対角化や非ブロックバンド理論よりも、マルチバンド非エルミート系の精度と性能を示す。
我々の反復法は、開境界条件下での非エルミート系の興味深い物理学に、新しく好意的な定式化を提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:44:42 GMT)
Feature selection in linear SVMs via a hard cardinality constraint: a scalable SDP decomposition approach [3.8] 本稿では, 線形支援ベクトルマシン(SVM)において, 濃度制約が適用された場合の組込み特徴選択問題について検討する。
この問題は、元の線形SVMが時間内に解決可能な問題に等しいにもかかわらず、濃度制約が存在するためNPハードである。
この問題に対処するために、まず2つの混合整数式を導入し、新しい半定緩和法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:06:39 GMT)
CUAOA: A Novel CUDA-Accelerated Simulation Framework for the QAOA [3.8] 量子近似最適化アルゴリズム(Quantum Approximate Optimization Algorithm, QAOA)は、最適化問題の近似解を見つけるために設計された顕著な量子アルゴリズムである。
既存の最先端のシミュレーションフレームワークは、長い実行時間や包括的な機能が欠如している。
ランタイム・ザ・アート・ツールキットを用いたGPUアクセラレーションQAOAシミュレーションフレームワークを開発した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:11:57 GMT)
A Proposal for Extending the Common Model of Cognition to Emotion [3.7] 本稿では、感情に対する認知の共通モデルの拡張を提案する。
これには、感情とメタ認知評価のための一連のモジュールが含まれる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:54:32 GMT)
Cherry on the Cake: Fairness is NOT an Optimization Problem [3.7] 公正なAI文学では、不正なモデルを悪質に作成するプラクティスは「チェリーピッキング」として知られている。
チェリーピッキングモデル(英: cherry-picking model)は、意図的にミスをし、同じ少数派の候補者ではなく、少数層の悪い個人を選択するモデルである。
フェアネスの指標を最小限に抑えるために最適化されたモデルを示す一方で、性能を最大化するためには、チェリーピックをある程度強制されることがしばしばある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:53:52 GMT)
MultiverSeg: Scalable Interactive Segmentation of Biomedical Imaging Datasets with In-Context Guidance [3.7] 既存のラベル付きデータへのアクセスを必要とせずに、新しいデータセット全体を迅速にセグメント化するシステムを導入する。
画像のセグメント化とともに、クリックやバウンディングボックス、スクリブルといったユーザインタラクションを入力として取り、セグメント化を予測する。
我々は,MultiverSegによって,画像毎のインタラクション数を減らし,正確なセグメンテーションを実現することにより,対話的に新しいデータセットを効率的にセグメント化できることを実証した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:06:53 GMT)
Is This You, LLM? Recognizing AI-written Programs with Multilingual Code Stylometry [3.7] 我々は,LLMが生成するコードと人間が記述したコードとを区別する,AIコードスタイメトリーの技法を紹介する。
H-AIRosettaMPもリリースしました。H-AIRosettaMPはAIコードスタイメトリータスクのための新しいオープンデータセットで、10の人気のあるプログラミング言語で121の247のコードスニペットで構成されています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:00:20 GMT)
DualDynamics: Synergizing Implicit and Explicit Methods for Robust Irregular Time Series Analysis [3.7] NDE法とニューラルフロー法を組み合わせた新しいフレームワークである「DualDynamics」を紹介する。
このアプローチは計算要求のバランスを保ちながら表現力を高め、既存の手法の限界に対処する。
以上の結果から,DualDynamicsが不規則時系列解析を飛躍的に進める可能性が示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:33:48 GMT)
Shape error prediction in 5-axis machining using graph neural networks [3.6] 本稿では, グラフニューラルネットワークを用いた5軸加工における形状誤差の予測手法を提案する。
グラフ構造は、表面点と隣接する関係を表すノードで定義される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:03:10 GMT)
SCB-dataset: A Dataset for Detecting Student Classroom Behavior [3.6] 学生クラスルーム行動データセット(SCBデータセット)には、11,248のラベルと4,003のイメージが含まれている。
データセットには11,248のラベルと4,003のイメージが含まれており、手作り行動に焦点を当てている。
YOLOv7アルゴリズムを用いてデータセットを評価し,平均精度(マップ)を85.3%まで向上させた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:00:35 GMT)
Exploring Machine Learning Engineering for Object Detection and Tracking by Unmanned Aerial Vehicle (UAV) [3.6] この研究は、自動化の増大に伴う保証手法の導入を強調した機械学習パイプラインの開発に焦点を当てている。
新しいデータセットは、ルンバの掃除機のような移動物体のビデオを収集し、屋内環境の探索・救助(SAR)をエミュレートすることで作成されている。
データセットの改良後、第2のYOLOv4とMask R-CNNモデルでトレーニングされた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:27:31 GMT)
AIArena: A Blockchain-Based Decentralized AI Training Platform [3.6] 我々は,AI開発とアライメントを,オンチェーンインセンティブ機構を通じて民主化するように設計された分散AIトレーニングプラットフォームであるAIArenaを提案する。
我々は、公開ベースブロックチェーンSepolia testnet上でAIArenaをインスタンス化し、実装し、実世界のアプリケーションでAIArenaが実現可能であることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:35:54 GMT)
Dataset Augmentation by Mixing Visual Concepts [3.5] 本稿では,事前学習した拡散モデルの微調整によるデータセット拡張手法を提案する。
我々は、拡散モデルに実際の画像と新しいテキスト埋め込みを条件付けすることで適応する。
提案手法は,ベンチマーク分類タスクにおける最先端の強化手法より優れている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:42:22 GMT)
Learning charges and long-range interactions from energies and forces [3.5] 我々は、原子電荷や電荷平衡を明示的に学習することなく、長距離静電気を捕捉するラテント・エワルド・サミエーション法を導入する。
荷電分子, イオン液体, 電解質溶液, 極性ジペプチド, 表面吸着剤, 電解質/固体界面, 固体界面など, 多様な, 困難なシステムについてLESをベンチマークした。
以上の結果から, LESは物理的部分電荷, 双極子モーメント, 四極子モーメントを効果的に推算できるとともに, 電荷を明示的に学習する手法と比較して精度が向上することが示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:24:44 GMT)
Introducing Interactions in Multi-Objective Optimization of Software Architectures [3.5] 本研究では,設計者のインタラクションがソフトウェアアーキテクチャの最適化に与える影響について検討する。
関心のある領域に探索を向けることで、完全に自動化されたプロセスで探索されていないアーキテクチャを明らかにする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:20:11 GMT)
Gauss-Newton Dynamics for Neural Networks: A Riemannian Optimization Perspective [3.5] 我々は,スムーズな活性化関数を持つニューラルネットワークを学習するためのガウスニュートン力学の収束性を分析する。
適切に選択された減衰係数を持つレバンス・マルカルト力学は、不条件カーネルに対してロバスト性をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:21:15 GMT)
Scalable Acceleration for Classification-Based Derivative-Free Optimization [3.4] RACE-CARS というアルゴリズムを提案し、SRACOS と比較してランダムな領域収縮ステップを付加する。
言語モデル・アズ・ア・サービスのためのブラックボックスチューニングと合成機能の実験は、RAS-CARSの効率を実証的に示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:58:39 GMT)
ClusterTalk: Corpus Exploration Framework using Multi-Dimensional Exploratory Search [3.4] ClusterTalkは多次元探索探索を用いたコーパス探索のためのフレームワークである。
本システムでは,文書クラスタリングと顔検索を統合し,対話的に探索を洗練し,コーパスや文書レベルのクエリを問うことができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:11:16 GMT)
Uncertainty-Guided Cross Attention Ensemble Mean Teacher for Semi-supervised Medical Image Segmentation [3.4] 本研究は,医用画像セグメンテーションにおける最先端のパフォーマンスを実現するための新しいフレームワーク,Uncertainty-Guided Cross Attention Ensemble Mean Teacher (UG-CEMT)を提案する。
UG-CEMTは10%のラベル付きデータのみを用いて,完全教師付き手法の性能にアプローチした。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:16:58 GMT)
Towards trustable SHAP scores [3.4] 本稿では, SHAPスコアをXAIのShapley値にまで拡張するために, SHAPスコアをどのように修正するかを検討する。
SHAPスコアの新たな定義は、不満足な結果が特定された既知のすべてのケースを避ける。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:29:41 GMT)
Mapping and Influencing the Political Ideology of Large Language Models using Synthetic Personas [3.3] 政治コンパステスト(PCT)を用いたペルソナに基づく大規模言語モデルの政治的分布をマッピングする。
実験の結果, 合成ペルソナは左リバタリアン・クアドラントに主に集合しており, 明示的なイデオロギー記述子による刺激による応答性の変化を示すモデルが得られた。
すべてのモデルは、右権威主義的位置への顕著なシフトを示すが、左リバタリアン位置へのより限定的なシフトを示し、モデルトレーニングの固有のバイアスを反映するイデオロギー的操作に対する非対称な反応を示唆している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:36:18 GMT)
LLaVA Needs More Knowledge: Retrieval Augmented Natural Language Generation with Knowledge Graph for Explaining Thoracic Pathologies [3.2] 医用画像のための自然言語記述(NLE)を生成するために,知識グラフ(KG)ベースのデータストアを付加したビジョンランゲージフレームワークを提案する。
本フレームワークでは,生成した説明の精度を向上するだけでなく,直接データ検索を回避してデータのプライバシーを保護できるKGベースの検索機構を採用している。
これらのフレームワークはMIMIC-NLEデータセット上で検証され、最先端の結果が得られる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:41:40 GMT)
Design of Secure, Privacy-focused, and Accessible E-Payment Applications for Older Adults [3.2] 我々は60歳以上の高齢者400名を対象に,e-payment Mobile アプリケーションの高忠実度プロトタイプの評価を行った。
調査の結果から,この人口動態の具体的なニーズを満たすため,アプリケーションをカスタマイズしたベータ版を開発した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:30:57 GMT)
Stitch Contrast and Segment_Learning a Human Action Segmentation Model Using Trimmed Skeleton Videos [3.1] 本稿では,短いトリミングスケルトンビデオに基づいてトレーニングされた骨格に基づくアクションセグメンテーションのための新しいフレームワークを提案する。
Stitch、Contrast、Segmentの3つのステップで実装されている。
実験には、トリミングされたソースデータセットと、トリミングされていないターゲットデータセットが含まれる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:00:10 GMT)
Robust PCA Based on Adaptive Weighted Least Squares and Low-Rank Matrix Factorization [3.0] 本稿では,初期コンポーネント不安定時の適応重み係数更新を統合する新しいRPCAモデルを提案する。
提案手法は既存の非インスパイアされた正規化手法よりも優れた性能と効率を提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:31:42 GMT)
How to Re-enable PDE Loss for Physical Systems Modeling Under Partial Observation [2.9] RPLPO(Re-enable PDE Loss)と呼ばれる新しいフレームワークを提案する。
RPLPOは学習可能な高解像度状態を再構築するための符号化モジュールと、将来の状態を予測するための遷移モジュールを組み合わせる。
各種物理系で実験を行い,RPLPOが疎外,不規則,ノイズ,PDEが不正確であっても,一般化において顕著に改善されていることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:27:49 GMT)
Why Do Large Language Models (LLMs) Struggle to Count Letters? [2.8] 大規模言語モデル(LLM)は多くの複雑なタスクにおいて前例のない性能を達成した。
彼らは、単語中の文字の発生を数えるなど、他の単純なタスクと苦労する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:47:08 GMT)
GenAIOps for GenAI Model-Agility [2.7] 我々は、モデルプロバイダやバージョンと同じくらい多様な基礎モデルに柔軟に適応する準備が整った、いわゆるGenAI Model-agilityについて議論する。
まず、生成AI特有の問題に対処するため、まずGenAIOpsとしてGenAIアプリケーションの開発と運用の方法論を定義し、基礎となる基盤モデルの変更によるアプリケーション品質劣化の問題を特定する。
本稿では,この問題に対処する上で有望と思われるプロンプトチューニング技術について検討し,既存のツールを用いたケーススタディを通じて,その有効性と限界について考察する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:29:03 GMT)
Multi-Level Embedding and Alignment Network with Consistency and Invariance Learning for Cross-View Geo-Localization [2.7] CVGL(Cross-View Geo-Localization)は、最もよく似たGPSタグ付き衛星画像を取得することで、ドローン画像のローカライゼーションを決定する。
既存の手法は、モデルの性能を改善する際に、計算と記憶の要求が増大する問題をしばしば見落としている。
マルチレベル・エンベディング・アライメント・ネットワーク(MEAN)と呼ばれる軽量なアライメント・ネットワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:10:38 GMT)
Quantum teleportation of cat states with binary-outcome measurements [2.7] 本稿では,ビーム分割操作とバイナリアウトカム計測を含むテレポーテーションプロトコルを提案する。
これらの操作は、Jaynes-Cummings Hamiltonian(英語版)の分散系を用いた簡単な実装を持つ。
様々なシナリオ下での忠実度を最大化するために最適なパラメータについて考察する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:22:52 GMT)
Fairness in Large Language Models: A Taxonomic Survey [2.7] 大規模言語モデル(LLM)は、様々な領域で顕著な成功を収めている。
多くの実世界のアプリケーションで有望な性能を示したにもかかわらず、これらのアルゴリズムのほとんどは公平さを考慮に入れていない。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:05:46 GMT)
LDP: Generalizing to Multilingual Visual Information Extraction by Language Decoupled Pretraining [2.7] 単言語事前学習データをよりよく活用するための多言語学習パラダイム LDP (Language Decoupled Pre-training) を提案する。
提案したモデル LDM はまず言語に依存しないデータに基づいて事前訓練され,言語知識は拡散モデルによって分離され,次に下流言語で微調整される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:31:40 GMT)
Testing the presence of balanced and bipartite components in a sparse graph is QMA1-hard [2.6] 符号付きグラフにおけるバランス成分の存在と符号なしグラフにおけるバイパートイト成分の存在をテストするなど、重要なスペクトル特性はQMA1-hardであることを示す。
両部テストの硬さは量子ハミルトニアン複雑性に関係しており、確率ハミルトニアンの固有空間に関連する別の性質のテストの例は、グラフのスパース入力モデルにおいて量子的に困難である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:10:04 GMT)
Quantum SWAP gate realized with CZ and iSWAP gates in a superconducting architecture [2.6] 量子回路をコンパイルする際、任意の量子プロセッサが2量子ビットの量子論理ゲートの異なるクラスをサポートするのが有利である。
CZタイプのサポートを含むゲートセットへのアクセスは、iSWAPタイプとSWAPタイプのゲートファミリを肯定し、コンパイル中にこれらのゲートファミリ間の変換を不要にする。
SWAP ゲートを 1 つの iSWAP ゲートに分割し,CZ ゲートを 1 つの CZ ゲートに分割し,より効率的なコンパイル戦略を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:32:36 GMT)
A Retrieval-Augmented Generation Framework for Academic Literature Navigation in Data Science [2.5] 本稿では、データサイエンティストが正確な文脈に関連のある学術リソースにアクセスするのを支援するために設計された人工知能(AI)ベースの拡張検索・拡張生成アプリケーションを提案する。
このAIを利用したアプリケーションは、情報抽出のための書誌データ生成(GROBID)技術を含む高度な技術を統合している。
Retrieval-Augmented Generation Assessment System (RAGAS) フレームワークを用いた総合評価では,重要な指標の大幅な改善が示されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:14:54 GMT)
A Novel Pseudo-Spectral Time-Domain Theory of Magnetic Neutron Scattering Illustrated Using A Uniformly Magnetized Sphere [2.5] 磁気中性子散乱の研究のために普遍的な数値計算法を開発した。
擬スペクトル時間領域アルゴリズムをシュリンガー方程式のスピノルバージョンに適用することにより、散乱波のスピン状態の進化を全空間と時間で解くことができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:11:00 GMT)
News Deja Vu: Connecting Past and Present with Semantic Search [2.4] News Deja Vuは、歴史的ニュース記事のセマンティック検索ツールである。
歴史的かつオープンソースなニュース記事の大規模なコーパスにどのように展開できるかを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:54:59 GMT)
Creation of AI-driven Smart Spaces for Enhanced Indoor Environments -- A Survey [2.4] スマートスペースはユビキタスコンピューティング環境であり、多様なセンシングと通信技術を統合し、空間機能を強化し、エネルギー利用を最適化し、ユーザーの快適さと幸福を向上させる。
これらの環境への新興AI方法論の統合は、AI駆動のスマートスペースの形成を促進する。
本稿では,センサ技術,データ通信プロトコル,センサネットワーク管理とメンテナンス戦略,データ収集,処理,分析などを含む,AI駆動型スマートスペースの基礎的コンポーネントに関する既存研究を体系的に調査する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:20:34 GMT)
Are Longer Prompts Always Better? Prompt Selection in Large Language Models for Recommendation Systems [2.4] 推薦精度において,プロンプトとデータセット特性の関係について検討した。
最小限のバリデーションデータを用いて精度の高いプロンプト選択法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:09:59 GMT)
Rotational stability in nanorotor and spin contrast in one-loop interferometry in the Stern-Gerlach setup [2.4] 本稿では, スピン埋め込みナノ回転子のためのナノ粒子回転動力学について述べる。
すべてのオイラー角の量子進化が干渉によるスピンコヒーレンス損失をもたらすかを研究する。
特に、磁場の方向に沿って回転を与えることにより、ナノロータのリブレーションモードを安定化できることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:04:46 GMT)
Categorical Symmetries in Spin Models with Atom Arrays [2.3] カテゴリー対称性は近年、物質の相の分類を一般化することが示されている。
本稿では,すべての相のギャップと2次相転移を包含する単純なスピンチェーンモデルを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:37:21 GMT)
Extending TWIG: Zero-Shot Predictive Hyperparameter Selection for KGEs based on Graph Structure [2.3] トポロジカル・ウェイト・インテリジェンス・ジェネレーション(TWIG)モデルは、これらの要素がどのように関連しているかをモデル化するソリューションとして提案されている。
我々はTWIGに関する以前の研究を拡張し、KGEモデルComplExの出力をクロスKG設定でシミュレートする能力を評価する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:47:21 GMT)
Contextualized Counterspeech: Strategies for Adaptation, Personalization, and Evaluation [2.2] 本研究では,モデレーションコンテキストに適応し,適度なユーザ向けにパーソナライズされたコーディネート音声を生成するための戦略を提案し,評価する。
以上の結果から, 文脈的反音声は, 精度と説得力において, 最先端の一般音声よりも有意に優れることが示された。
コンテンツモデレーションにおける、文脈化されたAI生成の逆音声の有効性と、人間とアルゴリズムによる評価の相違は、人間とAIの協調の増大の重要性を浮き彫りにする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:41:44 GMT)
Boosting GNN Performance via Training Sample Selection Based on Adversarial Robustness Evaluation [2.2] 本稿では,ノイズに最も敏感なグラフ内のノードを識別するために,逆評価手法を用いる新しい手法を提案する。
これらのノイズが発生しやすいノードからなるトレーニングセットを選択して構築することにより、グラフ畳み込みネットワーク(GCN)のトレーニングに使用する。
この戦略がGCNの性能を大幅に向上させることを示す実験結果を得た。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:10:48 GMT)
Fabrication of low-loss Josephson parametric devices [2.2] GHz帯で動作する低損失ジョセフソンパラメトリックデバイスの作製と特性について報告する。
これらの低損失デバイスは、高性能量子回路の実現において重要な一歩を踏み出した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:30:20 GMT)
Accelerating AI Performance using Anderson Extrapolation on GPUs [2.1] Anderson外挿を利用したAI性能向上のための新しい手法を提案する。
混合ペナルティが生じるクロスオーバー点を特定することにより、反復を収束に還元することに焦点を当てる。
高速コンピューティングの領域におけるスケーラビリティと効率性の拡張を動機とした,トレーニングと推論の両面での大幅な改善を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:49:52 GMT)
Spatially-aware station based car-sharing demand prediction [2.1] 本稿では,空間認識学習アルゴリズムを用いて,駅型カーシェアリングサービスにおける月平均需要を分析することを提案する。
まず、異なるモデリング手法の性能を比較し、入力機能の一部としてグローバルなランダムフォレストとジオコーディネートを組み合わせることで、最高の予測性能が得られることを示す。
SHAP値とGWRモデルとMGWRモデルの係数によるランダムフォレストの解析により、人口密度とカーシェアリングの供給に加えて、周囲のPOIなどの空間的特徴も重要な役割を担っていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:06:45 GMT)
AI and Cultural Context: An Empirical Investigation of Large Language Models' Performance on Chinese Social Work Professional Standards [2.0] 本研究は、中国と西欧の大規模言語モデルがどのように中国社会労働の原則を理解し、適用するかを考察する。
発展途上国の文化的文脈がモデル推論と精度に影響を及ぼすかどうかを検証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:48:27 GMT)
Tests for model misspecification in simulation-based inference: from local distortions to global model checks [2.0] 我々は、広範囲のモデル不一致分析タスクに対して、堅牢で柔軟な基盤を提供する。
我々は、異常検出、モデル検証、良質な残差分析といった古典的手法に明確な分析接続を行う。
本稿では, 実際の重力波データ, 特にGW150914について, このような歪み駆動型モデルの不特定試験を行う方法を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:48:03 GMT)
Ultimate precision limit of quantum thermal machines [2.0] 熱力学的不確実性関係は、エントロピーの生成が増加するにつれて、熱力学的電流の相対的な分散が減少することを示している。
無限大のエントロピー生成を実現することは現実には不可能であることは明らかである。
我々は、合成系の任意のユニタリ進化に適用できる、相対的分散と可観測物の期待に基づく境界を導出する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:52:33 GMT)
Adaptive Urban Planning: A Hybrid Framework for Balanced City Development [1.9] 都市計画は、都市全体のインフラ需要と地域住民の嗜好のバランスをとる上で重要な課題に直面している。
都市部における基本的なインフラ要件を最適化する決定論的解決器を用いた2層アプローチを提案する。
4つの特別計画エージェントは、それぞれ異なるサブリージョンを代表し、マスタープランナーに人口動態固有の修正を提案する。
マスタープランナーはこれらの提案を評価し、統合し、結束的な都市開発を保証する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:30:42 GMT)
MicroFlow: An Efficient Rust-Based Inference Engine for TinyML [1.9] 我々は、Rustプログラミング言語を使用した組み込みシステムにニューラルネットワーク(NN)をデプロイするためのオープンソースのフレームワークであるMicroFlowを紹介する。
提案するフレームワークは、リソース制約の高いデバイスへのNNのデプロイを成功させる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:16:32 GMT)
Space-time Peer-to-Peer Distribution of Multi-party Entanglement for Any Quantum Network [1.9] 従来のピアツーピア(P2P)ネットワークにインスパイアされたP2PGSDと呼ばれる新しい量子ネットワークプロトコルを提案する。
一般グラフ状態分布問題に対する明示的な数学的モデルも構築されている。
数値シミュレーションでは、一般的なスパースグラフ状態に対して最大50%の改善が示されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:37:32 GMT)
A Unified Framework for Context-Aware IoT Management and State-of-the-Art IoT Traffic Anomaly Detection [1.8] 我々は、IoT管理タスクのためのコンテキスト駆動型大規模言語モデル(LLM)と、ネットワークトラフィック分析のための微調整された異常検出モジュールを組み合わせた統合フレームワークを提案する。
このフレームワークは、IoTマニュアルや運用データからコンテキスト知識を活用することにより、デバイス管理やトラブルシューティング、セキュリティ執行といった管理プロセスを合理化する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:38:41 GMT)
DeepClean: Integrated Distortion Identification and Algorithm Selection for Rectifying Image Corruptions [1.8] 画像歪みの自動分類と修正のための2段階逐次計画手法を提案する。
提案手法の利点は、入力画像に条件付けされた動的再構成と、推論時に未確認候補アルゴリズムの一般化である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:14:03 GMT)
How good is GPT at writing political speeches for the White House? [1.8] 大規模言語モデル(LLM)を使用することで、コンピュータは us er 要求に応じてテキストを生成することができる。
本研究は、GPTと呼ばれる1つのLPMの書き方について、その生成した音声と最近のアメリカ合衆国大統領との書き方を比較して分析する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:06:09 GMT)
Automated Root Cause Analysis System for Complex Data Products [1.7] 本稿では,高速な診断実装と低学習曲線のための診断プラットフォームARCAS(Automated Root Cause Analysis System)を提案する。
アルカスは自動トラブルシューティングガイド(Auto-TSG)のコンステレーションで構成されており、製品テレメトリを使用して問題を検出し、ほぼリアルタイムで緩和することができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:10:54 GMT)
GeoTransformer: Enhancing Urban Forecasting with Dependency Retrieval and Geospatial Attention [1.7] 本研究では,高次元空間埋め込みと動的空間モデリングを組み合わせたフレームワークを提案する。
GeoTransformer は,(1) 空間的依存を特定できる依存検索モジュール,(2) グローバルな都市情報を活用した地理空間的アテンション機構の2つの革新を特徴としている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:55:02 GMT)
HPC-Coder-V2: Studying Code LLMs Across Low-Resource Parallel Languages [1.7] 大規模言語モデル(LLM)ベースのコーディングツールは、ソフトウェア開発アシスタントとして非常に成功しています。
汎用的なプログラミングタスクのために設計され、ハイパフォーマンスコンピューティングのような専門分野では性能が良くない。
課題をより深く理解するために,HPC LLMを微調整する多数の軸について詳細な研究を行う。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:52:05 GMT)
Accelerated Patient-Specific Calibration via Differentiable Hemodynamics Simulations [1.7] パーソナライズドメディカルの目標の1つは、個々の患者に診断をカスタマイズすることである。
計算モデルをパーソナライズすることは、患者固有のフロー条件を考えることにつながる。
微分可能な0D-1D Navier-Stokesリダクションモデル解法に基づくパーソナライズされた診断手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 06:42:57 GMT)
Universal graph representation of stabilizer codes [1.6] 半二部グラフとして$[[n, k]]$安定化器符号の表現を導入する。
グラフは特に小さな(漸近的でない)スケールでコードを構築するための柔軟なプラットフォームを提供する、と私たちは主張する。
距離、重み、符号化回路深さなどの鍵符号特性はすべてグラフ次数によって制御される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:07:48 GMT)
ObjVariantEnsemble: Advancing Point Cloud LLM Evaluation in Challenging Scenes with Subtly Distinguished Objects [1.5] 3Dシーンの理解は重要な課題であり、近年、エンボディドAIを強化するために、ポイントクラウドの3D表現とテキストとの整合性に関する研究の関心が高まっている。
総合的な3Dベンチマークが欠如しているため、現実世界のシーン、特に微妙に区別されたオブジェクトに挑戦するシーンにおける3Dモデルの能力はいまだに十分に調査されていない。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:27:58 GMT)
TalkWithMachines: Enhancing Human-Robot Interaction for Interpretable Industrial Robotics Through Large/Vision Language Models [1.5] 本稿では,Large Language Models (LLMs) とVision Language Models (VLMs) の最近の進歩について検討する。
この統合により、ロボットは自然言語で与えられたコマンドを理解し、実行し、視覚的および/または記述的な入力を通じて環境を認識することができる。
本稿は、低レベル制御を探索するLLM支援型ロボット制御4つについて概説し、(ii)ロボットの内部状態を記述した言語に基づくフィードバックの生成、(iii)視覚情報の追加入力としての利用、(iv)タスク計画とフィードバックを生成するロボット構造情報の利用について述べる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:43:40 GMT)
Noisy certification of continuous variables graph states [1.5] ノイズや不完全な設定であっても,CVグラフの状態を効率よく検証し,検証することができることを示す。
次に、異なるアプリケーションのためのプロトコルの後に得られた状態のユーザビリティに、我々の研究結果がどのように影響するかについて議論する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:45:52 GMT)
Robust Federated Learning in the Face of Covariate Shift: A Magnitude Pruning with Hybrid Regularization Framework for Enhanced Model Aggregation [1.5] Federated Learning(FL)は、共有モデルの共同開発を目指す個人に対して、有望なフレームワークを提供する。
クライアント間のデータの分散の変化は、主に集約プロセスの不安定性によって、FL方法論に大きく影響します。
本稿では,個々のパラメータのプルーニングと正規化技術を組み合わせて,個々のクライアントモデルのロバスト性を向上する新しいFLフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:22:37 GMT)
Boundaries of universality of thermal collisions for atom-atom scattering [1.5] 我々は、原子-原子衝突における温度平均速度係数の相互作用ポテンシャルの変化に対する応答を調べるために、厳密な量子散乱計算を用いる。
光, 少数電子原子, 重く偏光可能な原子を分離し, 結果として生じる速度係数の分布に特徴的な変化が認められた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:24:25 GMT)
Born With a Silver Spoon? Investigating Socioeconomic Bias in Large Language Models [1.4] 大規模言語モデルで表現される社会経済的バイアスの度合いと,この度合いの変動をモデルサイズの関数として評価した。
分析の結果, 社会的に劣悪な言語モデルでは, 社会経済的に劣悪な言語モデルに共感できないことが判明した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:13:50 GMT)
No Free Lunch: Research Software Testing in Teaching [1.4] 本研究は,研究ソフトウェア教育に組み込んだ研究ソフトウェアテストの効果について検討する。
In-vivo experimentでは、大規模なネットワークシミュレーションのためのテストスイートのエンジニアリングをグループプロジェクトとして、スウェーデンのBlekinge Institute of Technologyのソフトウェアテストコースに統合しました。
調査ソフトウェアは、ドキュメントを大幅に改善し、ハードウェアやソフトウェアの依存関係を少なくすることで、統合の恩恵を受けていることが分かりました。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:47:47 GMT)
Deep Learning Based Recalibration of SDSS and DESI BAO Alleviates Hubble and Clustering Tensions [1.4] バリオン音響振動(BAO)データの従来のキャリブレーションは、初期の宇宙観測からドラグエポック$r_d$の音の地平線の推定に依存する。
本稿では、モデルに依存しない$r_d$の推定に深層学習技術を用いて、SDSSとDESIという2つの独立したBAOデータセットを再検討する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:29:57 GMT)
From Point to probabilistic gradient boosting for claim frequency and severity prediction [1.4] 我々は、決定木アルゴリズムの既存の点と確率的勾配を全て向上させる統一的な表記法と対照的に提示する。
クレーム頻度と重大度を5つの公開データセットで比較した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:50:10 GMT)
Treatment Effects Estimation on Networked Observational Data using Disentangled Variational Graph Autoencoder [1.4] 観察データから個別治療効果(ITE)を推定する手法が,各領域で注目されている。
本稿では,ネットワーク化された観測データに対する処理効果推定のための非絡み付き因子を学習する,新しい非絡み付き変分グラフオートエンコーダを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:44:49 GMT)
MixLLM: LLM Quantization with Global Mixed-precision between Output-features and Highly-efficient System Design [1.4] 我々は,その精度,メモリ消費,システム効率の三角形に対する効果に関する一般量子化原理を包括的に分析する。
出力特徴間の混合精度量子化の新しい最適化空間を探索するMixLLMを提案する。
本稿では,アルゴリズム-システム共設計の量子化構成のスイートスポットについて述べる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:15:15 GMT)
Deep reinforcement learning with time-scale invariant memory [1.3] 我々は、スケール不変メモリの計算神経科学モデルを深部強化学習(RL)エージェントに統合する。
このようなエージェントは、広範囲の時間スケールで頑健に学習できることを示す。
この結果は、神経科学と認知科学の計算原理をディープニューラルネットワークに組み込むことで、複雑な時間力学への適応性を高めることを示唆している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:20:03 GMT)
Unveiling the Importance of Non-Shortest Paths in Quantum Networks [1.3] 我々は、スケールフリーネットワーク上での強い接続の起源を明らかにするために、統計物理学モデル(コンカレンスパーコレーション)を適用した。
以上の結果から,QN設計における重要な原則が浮かび上がっている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:47:10 GMT)
Large Language Models on Small Resource-Constrained Systems: Performance Characterization, Analysis and Trade-offs [1.3] 我々はNVIDIA Jetsonデバイスの最新ライン(Jetson Orin)と、7000万から14億のパラメータで公開されているLLM(Pythia)のセットに焦点を当てています。
我々は,Jetsonハードウェア上でのバッチLLMテストを含むさらなる研究を促進するために,テスト構造を設計する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:38:33 GMT)
Discovering Continuous-Time Memory-Based Symbolic Policies using Genetic Programming [1.3] 遺伝的プログラミングは最適化に使われ、象徴的な表現からなる解釈可能なポリシーをもたらす。
この結果から,記憶の象徴的ポリシーは,様々な制御タスクにおけるブラックボックスポリシーと比較できることがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:16:21 GMT)
Recovering WPA-3 Network Password by Bypassing the Simultaneous Authentication of Equals Handshake using Social Engineering Captive Portal [1.2] WPA3ネットワークのブリーチは、2021年にWPA3で公開された様々なセキュリティ欠陥の上に構築することで可能である。
提案した中間攻撃では、レース条件を用いてWPA3ネットワークを消音し、Raspberry Piを用いてルージュWPA3ネットワークを生成する。
本研究は, 保護管理フレームが実装されていない場合に, パスワードをソーシャルエンジニアリングキャプチャポータルから回収できることを確認した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:19:34 GMT)
A Multi-Fidelity Graph U-Net Model for Accelerated Physics Simulations [1.2] 本稿では,GNNモデルの性能向上のための多元性手法の利点を生かした,新しいGNNアーキテクチャであるMulti-Fidelity U-Netを提案する。
提案手法は精度とデータ要求において有意に優れた性能を示すことを示す。
また,提案アーキテクチャの高速バージョンであるMulti-Fidelity U-Net Liteを35%高速化し,精度を2~5%削減した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:09:38 GMT)
GAProtoNet: A Multi-head Graph Attention-based Prototypical Network for Interpretable Text Classification [1.2] GAProtoNetは、新しいホワイトボックスマルチヘッドグラフアテンションベースのプロトタイプネットワークである。
提案手法は,元のブラックボックスLMの精度を犠牲にすることなく,優れた結果が得られる。
プロトタイプクラスタのケーススタディと可視化は,LMを用いて構築したブラックボックスモデルの決定を効率的に説明できることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:45:59 GMT)
Surrogate-assisted multi-objective design of complex multibody systems [1.2] 本稿では,サロゲートモデリングと多目的最適化の相反するアプローチを提案する。
我々は多目的最適化、サンプリングおよび代理モデリングに関する異なる戦略を比較した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:48:49 GMT)
GRAF: Graph Retrieval Augmented by Facts for Romanian Legal Multi-Choice Question Answering [1.1] この研究は、低リソース言語のための法的ドメインであるMultiple-Choice QA(MCQA)を探求する。
JuROは3つの異なる試験と合計10,836の質問からなるルーマニア初の公開法的MCQAデータセットである。
我々はルーマニア語のための知識グラフであるLaw-RoGを最初に提案し、このKGは前述のコーパスから派生したものである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:11:00 GMT)
Northeastern Uni at Multilingual Counterspeech Generation: Enhancing Counter Speech Generation with LLM Alignment through Direct Preference Optimization [1.1] 対音声の自動生成は,構築的および情報的応答を提供することにより,ヘイトスピーチに対処するための重要な戦略である。
既存の手法は、高品質でインパクトがあり、スケーラブルなCSを生成するのに失敗することが多い。
本稿では,大規模言語モデル (LLM) をスーパーバイザード・ファインチューニング (SFT) と直接選好最適化 (DPO) で整列させることによりCS生成を向上させる新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:22:11 GMT)
Leveraging Weak Supervision for Cell Localization in Digital Pathology Using Multitask Learning and Consistency Loss [1.1] 本研究は,デジタル病理学におけるマルチタスクネットワークのトレーニングのための混合スーパービジョン手法を提案する。
眼球形成過程に由来する細胞数、つまり病理学者がよく使う迅速な視覚的推定法が組み込まれている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:45:29 GMT)
ViFactCheck: A New Benchmark Dataset and Methods for Multi-domain News Fact-Checking in Vietnamese [1.0] ViFactCheckはベトナムのファクトチェック用に設計された最初のベンチマークデータセットである。
このデータセットには、信頼できるベトナムのオンラインニュースから得られた7,232組の請求-証拠の組み合わせが含まれている。
Gemmaモデルは優れた効果を示し、マクロF1スコアは89.90%であった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:41:59 GMT)
MARIA: a Multimodal Transformer Model for Incomplete Healthcare Data [1.0] MARIAはトランスフォーマーベースのディープラーニングモデルであり、欠けているデータ問題に対処するために設計されている。
命令に依存する従来のアプローチとは異なり、MARIAはマスク付き自己注意機構を使用している。
MARIAは、さまざまなレベルのデータ不完全性に対するパフォーマンスとレジリエンスの観点から、既存のメソッドよりも優れています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:00:03 GMT)
A Comparative Study of DSPy Teleprompter Algorithms for Aligning Large Language Models Evaluation Metrics to Human Evaluation [1.0] 我々は、宣言的自己改善Python(DSPy)は、大きな言語モデル(LLM)のプロンプトとその評価を人間のアノテーションに合わせる方法であると主張している。
本稿では,人間の評価に適合する5つのテレプロンプタアルゴリズムの比較分析を行った。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:38:46 GMT)
Taming the Memory Beast: Strategies for Reliable ML Training on Kubernetes [1.0] 本稿では、メモリ要求、制限、Quality of Serviceクラス、MLワークロードの排除ポリシーの扱い方法について概説する。
オーバーコミットやメモリリーク,一時容積の枯渇など,一般的な落とし穴について検討した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:10:57 GMT)
A Full Transformer-based Framework for Automatic Pain Estimation using Videos [1.0] 本稿では,トランスフォーマーモデル(TNT)と,クロスアテンションブロックと自己アテンションブロックを利用するトランスフォーマーで構成される,新しいフルトランスフォーマーベースのフレームワークを提案する。
本研究は、すべての主痛推定タスクにおける有効性、効率、一般化能力を示す、最先端のパフォーマンスを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:45:08 GMT)
AICat: An AI Cataloguing Approach to Support the EU AI Act [1.0] 欧州連合の人工知能法(AI Act)は、リスクの高いAIアプリケーションのプロバイダとデプロイ者に、自分たちのシステムをEUデータベースに登録することを要求する。
他のEUリポジトリに対するオープンデータとセマンティックWebベースのアプローチの取り込みを考えると、リスクの高いAIシステムのEUデータベースを管理するための同様のソリューションが必要である。
本稿ではAIシステムのカタログを表すためのDCATの拡張であるAICatを紹介する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:48:20 GMT)
Capturing the Page Curve and Entanglement Dynamics of Black Holes in Quantum Computers [0.9] 量子コンピュータを用いて、量子ビット輸送モデルを用いてホーキング放射のエントロピーを調べる。
我々は,効率的なランダムユニタリ回路を用いて,ブラックホールのスクランブルダイナミクスの量子シミュレーションを実装した。
両エンタングルメントエントロピー測定プロトコルは数値シミュレーションにおいてR'enyiエントロピーを正確に推定するが、ランダム化測定プロトコルは、IBMの超伝導量子コンピュータにおけるスワップベースの多体干渉プロトコルよりも特に有利である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:53:05 GMT)
PhotoHolmes: a Python library for forgery detection in digital images [0.9] PhotoHolmesは、デジタル画像の偽造検出を簡単に実行し、ベンチマークするために設計されたオープンソースのライブラリである。
PhotoHolmesにはコマンドラインインターフェース(CLI)が含まれており、不審なイメージでライブラリに実装されたメソッドを簡単に実行することができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:47:31 GMT)
AI-assisted summary of suicide risk Formulation [0.9] 本研究では,人工知能(AI)の分野である高度自然言語処理(NLP)アルゴリズムの開発について述べる。
自殺リスクアセスメント(英: suicide risk Assessment)とは、個人が抱える問題の性質と発展を理解するための個別化プロセスである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:43:39 GMT)
Graph-Structured Topic Modeling for Documents with Spatial or Covariate Dependencies [0.9] 文書レベルのメタデータをトピックモデリングに組み込むという課題に対処する。
高速グラフ正規化反復特異値分解に基づく新しい推定器を提案する。
合成データセットと実世界の3つのコーパスに関する包括的実験により,本モデルの有効性を検証した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:00:26 GMT)
To Word Senses and Beyond: Inducing Concepts with Contextualized Language Models [0.9] 多義語と同義語は、語彙的曖昧性の2つの重要な相互関係の面である。
本稿では,単語間のソフトクラスタリングを学習する教師なしタスクである概念誘導について紹介する。
本稿では、局所的なレムマ中心ビューとグローバルなクロスレキシコンビューの両方を活用して概念を誘導する概念誘導のバイレベルアプローチを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:30:40 GMT)
A Shapley Value Estimation Speedup for Efficient Explainable Quantum AI [0.9] 古典的な文脈では、シャプリー値の協調ゲーム理論の概念はポストホックな説明に自然に適応する。
そこで我々は,ある信頼区間内でShapley値を抽出できる量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:50:46 GMT)
Arbitrary Polynomial Separations in Trainable Quantum Machine Learning [0.9] 量子機械学習の最近の理論的結果は、量子ニューラルネットワーク(QNN)の表現力とトレーニング可能性との一般的なトレードオフを示している。
我々は、文脈性が表現性分離の源であることを示し、この性質を持つ他の学習タスクが量子学習アルゴリズムの使用の自然な設定である可能性を示唆している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:05:31 GMT)
TinyLLM: A Framework for Training and Deploying Language Models at the Edge Computers [0.8] 言語モデルは、モデルがますます大きなパラメータサイズに拡大されるにつれて出現する汎用機能のために、大きな関心を集めている。
大規模モデルはコンピュータシステムに厳格な要求を課し、推論に重要なメモリと処理の要求を必要とする。
これにより、モバイルとエッジデバイスでの推論が難しくなり、しばしばネットワークコールを介してリモートホストされたモデルを呼び出す必要がある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:28:27 GMT)
Query pipeline optimization for cancer patient question answering systems [0.8] Retrieval-augmented Generation (RAG)は、クエリパイプラインを使用して関連する外部情報を取得することで、Large Language Models (LLM)における幻覚を緩和する。
本稿では,癌問合せシステムにおけるRAGクエリパイプラインの3視点最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:30:07 GMT)
Accuracy Limits as a Barrier to Biometric System Security [0.8] False Match Rate FMRは生体認証システムの精度と信頼性を評価するための重要な指標である。
本稿では,そのFMRに基づく生体計測システムについて,主に2つの寄与点について分析する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:23:45 GMT)
Chain-of-MetaWriting: Linguistic and Textual Analysis of How Small Language Models Write Young Students Texts [0.8] 本稿では,多言語小言語モデル(SLM)の詳細な言語的およびテキスト的分析について紹介する。
主に、小学生と大学生のフランス語による短編とエッセイの執筆に焦点をあてた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:58:53 GMT)
Short two-qubit pulse sequences for exchange-only spin qubits in 2D layouts [0.8] 量子ドット内の交換専用(EO)スピンキュービットは、スケーラブルなデバイスレイアウトを設計するための広大なデザインランドスケープを提供する。
我々は,CX,CZ,iSWAP,リーク制御CX,リーク制御CZ2量子ゲートの完全なパルス列を生成する。
私たちの研究は、スケーラブルな量子ドットアーキテクチャの将来の実装のためのハードウェアとソフトウェア設計の選択をガイドします。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:54:54 GMT)
SKETCH: Structured Knowledge Enhanced Text Comprehension for Holistic Retrieval [0.7] 本稿では、意味テキスト検索と知識グラフを統合することにより、RAG検索プロセスを強化する新しい手法であるSKETCHを紹介する。
SKETCHは、p answer_relevancy, faithfulness, context_precision, context_recallといった主要なRAGASメトリクスのベースラインアプローチを一貫して上回っている。
結果は、SKETCHがより正確で文脈的に関連する応答を提供する能力を強調し、将来の検索システムに新しいベンチマークを設定する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:51:56 GMT)
Enhanced second-order sideband generation and slow-fast light via coupled opto- and magnomechanical microspheres [0.7] 2つの結合したオプト・メカニカル・マイクロスフィアとマグノメカニカル・マイクロスフィアからなるハイブリッドシステムを用いて,2階サイドバンド生成(SSG)と低速光について検討した。
伝送速度とSSGは、2つのマイクロスフィア間の磁気力学、光学力学、機械力学結合強度(MMCS)に強く依存する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:26:17 GMT)
URIEL+: Enhancing Linguistic Inclusion and Usability in a Typological and Multilingual Knowledge Base [0.7] ELは、7970言語のための地理、系統学、およびタイプ論的ベクトル表現を提供する知識ベースである。
lang2vecツールを介してアクセス可能な4005言語のベクトル間の距離測定が含まれている。
これらの課題に対処するために、これらの制限に対処するELとlang2vecの拡張バージョンであるEL+を紹介します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:57:43 GMT)
Human and LLM Biases in Hate Speech Annotations: A Socio-Demographic Analysis of Annotators and Targets [0.7] 我々は、アノテータとターゲットの両方の社会デマトグラフィー情報を豊富なデータセットで活用する。
分析の結果,その強度と有病率に基づいて定量的に記述し,特徴付ける広範囲なバイアスの存在が明らかになった。
私たちの研究は、ヘイトスピーチアノテーションにおける人間のバイアスに関する新しい、そして、AI駆動のヘイトスピーチ検出システムの設計に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:16:49 GMT)
Quantum Gravity, Hydrodynamics and Emergent Cosmology: A Collection of Perspectives [0.7] このパースペクティブ・ピースのコレクションは、量子重力、流体力学、創発的な宇宙論をブリッジする研究コミュニティの最近の進歩とリフレクションを捉えている。
a) アナログ重力系を含む流体力学と宇宙学の相互作用、(b) 相転移、連続極限、量子重力における創発的幾何学、(c) 重力と量子重力における関係的な視点、(d) 量子重力の枠組みに根ざした宇宙学モデルの出現である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:43:50 GMT)
Energy and polarization based on-line interference mitigation in radio interferometry [0.7] 電波干渉 (Radio frequency interference, RFI) は、地上の電波天文学において持続的な汚染物質である。
本稿では,このような干渉計の相関器で動作可能なオンラインRFI緩和方式を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:59:17 GMT)
Review of Fruit Tree Image Segmentation [0.7] 本論文は,新たに設計されたクローリングレビュー手法を用いて収集した158件の関連論文に基づいている。
我々のレビューでは、これまでの研究で最も目立った欠陥は、汎用的なデータセットが欠如していることが判明した。
今後の6つの重要な研究課題が提案され、これらが万能な木分割モジュールを構築するための道を開くことが期待されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:36:32 GMT)
PCA-Featured Transformer for Jamming Detection in 5G UAV Networks [0.6] ジャミング攻撃は無人航空機(UAV)無線通信システムに脅威をもたらす。
現在の検出アプローチは、高度な人工知能(AI)ジャミング技術に苦慮している。
本稿では,検出をジャムするトランスフォーマーに基づく新しいディープラーニングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:13:04 GMT)
Developing and Evaluating a Design Method for Positive Artificial Intelligence [0.5] AI for Good"の開発は、複雑な人間の価値とシステムの整合性に関する課題を提起する。
本稿では,このギャップに対処するPositive AI設計手法を提示し,評価する。
この方法は、幸福な願望を具体的な実践に翻訳する人間中心のプロセスを提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:58:47 GMT)
Single-Photon Advantage in Quantum Cryptography Beyond QKD [0.5] 単一光子状態を用いた量子強いコインフリッププロトコルを実験的に実装する。
我々の研究は、将来の量子インターネットにおける複雑な暗号処理の実装に向けた大きな進歩を表している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:06:07 GMT)
mRNA2vec: mRNA Embedding with Language Model in the 5'UTR-CDS for mRNA Design [0.5] 本稿では,新しい文脈言語モデル(LM)に基づく埋め込み手法mRNA2vecを提案する。
既存のmRNA埋め込み手法とは対照的に,本手法はData2vecの自己教師型学習フレームワークをベースとしている。
mRNA2vecは翻訳効率(TE)と発現レベル(EL)予測タスクを大幅に改善している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 22:38:35 GMT)
Exploiting sparse structures and synergy designs to advance situational awareness of electrical power grid [0.5] この論文は、二重折り畳み寄与による堅牢性と効率ギャップに対処する。
まず、既存の物理とデータ駆動の世界に固有の制限に対処する。
次に、従来のアルゴリズム設計の境界を新しいパラダイムである物理-MLシナジーの方向に超越する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:51:43 GMT)
Holdouts set for safe predictive model updating [0.4] リスクスコアによって導かれる介入を受けない集団のサブセットであるホールドアウトセット(holdout set)の使用を提案する。
予防接種前の症例数を最小化するためには,約1万件のホールドアウトセットを用いて実施することが最善であることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:12:00 GMT)
CAE-T: A Channelwise AutoEncoder with Transformer for EEG Abnormality Detection [0.4] CAE-Tは、チャネルワイズCNNベースのオートエンコーダと、効率的なEEG異常検出のためのシングルヘッドトランスフォーマー分類器を組み合わせた、新しいフレームワークである。
TUH異常脳波コーパスを用いて、提案モデルは85.0%の精度、76.2%の感度、91.2%の特異性を達成する。
この枠組みはチャネル設計を通じて解釈可能性を維持しており、神経科学研究や臨床実践における将来の応用の可能性を示している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:38:34 GMT)
Robust spectral clustering with rank statistics [0.4] 固有ベクトルに基づくクラスタリングは、原データ行列からエントリーワイドに導出される非パラメトリックランク統計の行列に適用される。
我々の主な理論的貢献は3倍であり、柔軟なデータ生成条件の下で保持される。
人間のコネクトームのデータセットの場合,本手法は相似次元の減少と,地中神経解剖学的クラスター構造の回復を改善させる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:23:48 GMT)
Maximising Histopathology Segmentation using Minimal Labels via Self-Supervision [0.4] UNetのような最先端のディープラーニングセグメンテーション手法には、広範なラベルが必要である。
MDS1やUDAGANのようなマルチスタンスセグメンテーション手法が開発されている。
本稿では,SimCLR,BYOL,HR-CS-COなどの自己指導型事前学習を通じて,95%少ないラベルでもセグメンテーション手法の性能を維持することができることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:43:22 GMT)
Critical-Questions-of-Thought: Steering LLM reasoning with Argumentative Querying [0.4] State-of-the-art Large Language Model (LLM) は論理的および数学的推論を行う際にも苦戦している。
本稿では、議論論に関する文献からの批判的質問の概念を利用し、特にトゥールミンの議論モデルに焦点を当てる。
これらの重要な質問を取り入れることで,LLMの推論能力が向上することを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:51:30 GMT)
Cherry-Picking in Time Series Forecasting: How to Select Datasets to Make Your Model Shine [0.4] 本研究では,データセット選択バイアス,特にチェリーピッキングデータセットの実践が予測手法の性能評価に与える影響について検討する。
4つのデータセットを選択的に選択することで、46%のメソッドがクラスでベストと判断され、77%が上位3つにランク付けできた。
その結果、ベンチマークのサブセットで予測アルゴリズムを実証的に検証する場合、3から6までのデータセット数の増加は、アルゴリズムを正しいものと誤識別するリスクを約40%削減することを示した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 01:34:17 GMT)
Conceptual In-Context Learning and Chain of Concepts: Solving Complex Conceptual Problems Using Large Language Models [0.4] 大規模言語モデル(LLM)は複雑な概念的問題を解決するための有望なエージェントである。
しかし、オープンワールドのデータに基づいてトレーニングされたバニラLSMには、必要な概念情報が欠けている。
LLMのための2つの新しいSCMアルゴリズムを提案し、LLMをCIで拡張し、LLMが複雑な概念的問題を解くことを可能にする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:54:33 GMT)
Enhancing Trust in Autonomous Agents: An Architecture for Accountability and Explainability through Blockchain and Large Language Models [0.3] この研究は、ROSベースの移動ロボットに実装された説明可能性と説明可能性のアーキテクチャを示す。
提案されたソリューションは2つの主要コンポーネントで構成されている。まず、説明責任を提供するブラックボックスのような要素で、ブロックチェーン技術によって達成されるアンチタンパ特性を特徴とする。
第二に、前述のブラックボックスに含まれるデータに対して、Large Language Models(LLM)の機能を利用することで、自然言語の説明を生成するコンポーネントである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:08:29 GMT)
A Deep Learning-Based and Fully Automated Pipeline for Regurgitant Mitral Valve Anatomy Analysis from 3D Echocardiography [0.3] 3D経食道心エコー法(DTEE)は僧帽弁閉鎖不全症(MR)の診断に有用である
手動TEEセグメンテーションは時間を要するため、運用内の変動が原因で、測定の信頼性に影響を及ぼす。
我々は,3次元畳み込みニューラルネットワーク(CNN)を用いて,MVサブ構造を分割し,MV解剖を定量化する完全自動パイプラインを開発した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:41:57 GMT)
Islands, Double Holography, and the Entanglement Membrane [0.3] 量子極端島則により、ホーキング放射のページ曲線を半古典重力で計算することができる。
これらの計算とカオス量子多体系の熱化の関連について検討する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:21:18 GMT)
LG-Sleep: Local and Global Temporal Dependencies for Mice Sleep Scoring [0.3] この研究は、脳波(EEG)信号による睡眠スコアリング用に設計された、新しい主題に依存しないディープニューラルネットワークアーキテクチャであるLG-Sleepを紹介した。
LG-Sleepは脳波信号内の局所的および大域的時間的遷移を抽出し、睡眠データを3段階(覚醒、急速眼球運動(REM)睡眠、非急速眼球運動(NREM)睡眠)に分類する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:39:57 GMT)
Corn Ear Detection and Orientation Estimation Using Deep Learning [0.3] 本稿では,コーンの耳を画像シーケンスで検出・追跡するコンピュータビジョンに基づくシステムを提案する。
提案システムは、耳の向きを正確に検出し、追跡し、予測することができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:36:30 GMT)
On Generalization and Regularization via Wasserstein Distributionally Robust Optimization [0.2] Wassersteinの分散ロバスト最適化(DRO)は、オペレーションリサーチと機械学習で注目されている。
一般化境界と正則化同値性は,より広い設定で得られることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:39:38 GMT)
Efficient Network Embedding by Approximate Equitable Partitions [0.2] 等価パーティションの近似変分に基づく簡便で効率的な埋め込み手法を提案する。
マルコフ連鎖の等間隔分割と同値関係と常微分方程式の関係を利用して分割精算アルゴリズムを開発する。
ビジュアライゼーション、分類、レグレッションのタスクにおいて、1~3桁のコストで同等のパフォーマンスを報告します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:21:49 GMT)
A purely geometrical Aharonov-Bohm effect [0.1] 共変アフィン積分量子化を2次元句読面の運動の研究に応用する。
句読点付近では、量子ゆらぎに影響を及ぼす位相がアフィンベクトルポテンシャルをもたらすことが観察される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:43:02 GMT)
Performance of Variational Algorithms for Local Hamiltonian Problems on Random Regular Graphs [0.1] グラフ上に定義された2-局所ハミルトニアンを最適化する2つの変分アルゴリズムを設計する。
無限大極限におけるランダム正則グラフに対して,これらのアルゴリズムによって達成されるエネルギーを高い確率で解析する公式を開発する。
アルゴリズムの5つの層だけで、QMCの基底状態エネルギーの1.62%の誤差を無限の1Dリングで生成できることが示される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:27:39 GMT)
FLAMe: Federated Learning with Attention Mechanism using Spatio-Temporal Keypoint Transformers for Pedestrian Fall Detection in Smart Cities [0.1] 本稿では,FLAMe(Federated Learning with Attention Mechanism)を用いた転倒検出システムを提案する。
AI-Hubの“Fall Accident Risk Behavior Video-Sensor data”データセットから22,672本のビデオサンプルを用いて,実験を検証した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:51:45 GMT)
von Neumann entropy and quantum version of thermodynamic entropy [0.0] フォン・ノイマン(VN)エントロピーが熱力学(TH)エントロピーの適切な量子バージョンであるかどうかという議論は長い歴史を持っている。
大規模熱化系の小さなサブシステムのVNエントロピーは、そのサブシステムの量子統計エントロピーに比例することを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:51:44 GMT)
Zero Shot Time Series Forecasting Using Kolmogorov Arnold Networks [0.0] 異なる市場における市場不変の表現を学習することにより、エネルギー価格を予測するために設計されたクロスドメイン適応モデルを導入する。
Kolmogorov-Arnoldネットワークを利用することで、我々のモデルはエネルギー価格データの複雑なパターンを捉える能力を高めることができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 20:23:46 GMT)
YOLOv11 Optimization for Efficient Resource Utilization [0.0] We developed size-specific modified version of the architecture of You Only Look Once (YOLOv11)
提案された各バージョンは、小さなものから大きなものまで、特定のサイズ範囲のオブジェクトを検出するように調整されている。
実験結果は,計算資源効率の大幅な向上を浮き彫りにした。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:29:31 GMT)
When Every Token Counts: Optimal Segmentation for Low-Resource Language Models [0.0] 最適Byte-Pair(BPE)構成は,グリーディセグメンテーションに比べてトークン数を大幅に削減することを示す。
この結果から,圧縮最適化トークン化戦略が多言語および低リソース言語アプリケーションに多大なメリットをもたらす可能性が示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:24:39 GMT)
Web Privacy based on Contextual Integrity: Measuring the Collapse of Online Contexts [0.0] 我々はプライバシの理論をコンテキスト統合として運用し、Webコンテキスト内およびWebコンテキスト間の永続的なユーザ識別を測定する。
健康、金融、ニュース&メディア、LGBTQ、eコマース、アダルト、教育のWebサイトなど、トップ700のWebサイトを27日間クロールする。
この結果から,ユーザIDを異なる距離に拡散し,Webサイトをまたがる既知のトラッキング分布と対比し,クッキーIDとJSフィンガープリントによる共同作業,あるいは別の作業として実施した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:30:29 GMT)
Wave function evolution from source to detection and the measurement [0.0] 波動関数の進化を解明するために,2つのスリットの間に余分な開口スリットを考える。
すべてのスリットが長くて薄いとき、1Dシュレーディンガー方程式は最後の検出まで波動関数の進化を与える。
この関数は振幅と位相情報を持つ実数値であり,波動関数と密接に関連していることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:30:24 GMT)
Wave Function Collapse, Lorentz Invariance, and the Third Postulate of Relativity [0.0] 測定中の量子状態の変化は確率的かつ非局所的である。
非局所的な絡み合い関係は、保護法を施行する手段を提供する。
確率は、空間的分離作用素(および測定)が可換であるという仮定を実装する方法を提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:12:16 GMT)
Unveiling social vibrancy in urban spaces with app usage [0.0] アプリ利用データをデジタル署名として利用し、オンラインアプリの利用状況と都市の活力との関係を調査する。
これを実現するために、フランスの18都市にわたるモバイルサービスレベルのトラフィックボリュームの高解像度データソースを使用します。
都市全体では、多次元特性によって特徴づけられる空間的行動的アーチタイプがあった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:23:26 GMT)
Unitary twirling with supermaps [0.0] 私は、超写像形式を利用してユニタリ行列を構成するスキームを導入し、キュービットユニタリ群に関してツワールを実装する。
応用として、ノイズゲートの平均ゲート忠実度を推定するためにこの構成を用いる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:58:51 GMT)
Truth, beauty, and goodness in grand unification: a machine learning approach [0.0] 超対称$SU(5)$Grand Unified Theory(GUT)モデルのフレーバーセクターを機械学習技術を用いて検討する。
最小の$SU(5)$モデルは、自然界で観測された値に反するフェルミオン質量を予測することが知られている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:11:05 GMT)
Transparency, Security, and Workplace Training & Awareness in the Age of Generative AI [0.0] AI技術の進歩に伴い、倫理的考慮、透明性、データのプライバシー、そして人間の労働への影響は、イノベーションと効率の推進力と交差する。
我々の研究は、主流の精査から離れて、しばしば周辺で機能する公開アクセス可能な大規模言語モデル(LLM)を探索する。
具体的には、制限のないコミュニケーションとプライバシを中心としたプラットフォームであるGab AIを調べ、検閲なしで自由に対話できるようにします。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:40:58 GMT)
Transformer models are gauge invariant: A mathematical connection between AI and particle physics [0.0] 素粒子物理学において、基本力はゲージ不変性と呼ばれる対称性に属する。
変圧器のアーキテクチャが同じ特性を示すことを実証し、変圧器のデフォルト表現が部分的には存在するが、ゲージの不変性を完全には取り除いていないことを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:49:31 GMT)
Training Datasets Generation for Machine Learning: Application to Vision Based Navigation [0.0] 視覚ベースのナビゲーションは、画像から情報を抽出した後、GNCの精密センサーとしてカメラを利用する。
宇宙アプリケーションにおける機械学習の採用を可能にするために、利用可能なトレーニングデータセットがアルゴリズムの検証に適していることの実証が障害のひとつだ。
本研究の目的は,機械学習アルゴリズムの学習に適した画像とメタデータのデータセットを作成することである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:12:30 GMT)
Trainable Adaptive Activation Function Structure (TAAFS) Enhances Neural Network Force Field Performance with Only Dozens of Additional Parameters [0.0] TAAFS(Treatable Adaptive Function Activation Structure)
非線形なアクティベーションのための数学的定式化を選択する方法を提案する。
本研究では、TAAFSを様々なニューラルネットワークモデルに統合し、精度の向上を観察する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:06:39 GMT)
Towards an optimised evaluation of teachers' discourse: The case of engaging messages [0.0] 本研究では,教師の言論評価を最適化するための新しい手法を提案する。
最初の研究は、2年間にわたる音声録音による実例に基づく2つの大きな言語モデルを訓練することであった。
第2の研究では、これらのモデルを第3学年の音声録音授業の書き起こしに適用し、メッセージタイプの頻度と分布について検討した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:27:54 GMT)
Towards an identity management solution on Arweave [0.0] 本稿では、Arweaveネットワークを用いてID管理ソリューションを開発する可能性について検討する。
Arweaveの永続ストレージを活用することで、当社のソリューションは、ユーザにSSI(Self-Sovereign Identity)フレームワークを提供します。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:58:03 GMT)
Towards an Environmental Ethics of Artificial Intelligence [0.0] 本稿では,AIシステムの設計における人工知能(AI)の環境影響の倫理的意義について考察する。
環境正義文学は3つのカテゴリーの正義を区別し、不公平な3つの要素を参照する。
このような正義感に基づいて、環境に配慮したAIシステムを開発するための基準を概説する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:48:54 GMT)
Towards Provable Security in Industrial Control Systems Via Dynamic Protocol Attestation [0.0] サイバー攻撃者は産業制御システム(ICS)に侵入し、悪意ある行動を実行することができる。
これらの攻撃は、物理的損害、経済損失、環境災害などの劇的な結果をもたらした。
本稿では,プロトコルを用いた動作を制限する手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:28:35 GMT)
TorchQC -- A framework for efficiently integrating machine and deep learning methods in quantum dynamics and control [0.0] TorchQCはPythonで完全に書かれた新しいライブラリで、PyTorchディープラーニングライブラリをベースとしている。
PyTorchとそのテンソル機構を利用して量子状態と演算子をテンソルとして表現し、量子系の力学をシミュレートするために必要なすべてのツールも組み込んでいる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:19:55 GMT)
Time-Reversal Symmetry-Protected Coherent Control of Ultracold Molecular Collisions [0.0] 原子および分子散乱のコヒーレント制御は、内部状態の重畳における衝突粒子の調製に依存する。
時間反転対称性は、S-行列要素の相対位相を制限することによって制限を克服することができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:26:59 GMT)
Thermalization and hydrodynamic long-time tails in a Floquet system [0.0] 古典的流体力学場理論が多粒子量子系の長時間力学を予測できるかどうかを考察する。
場の理論的解析と対称性の議論に基づいて、スピンモデルの各作用素を流体力学の対応する場にマッピングする。
流体力学で守られていないすべての作用素が指数関数的に減衰し、緩やかな崩壊する作用素の集合を探索する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:34:01 GMT)
Task Adaptation of Reinforcement Learning-based NAS Agents through Transfer Learning [0.0] 異なるタスク間を移動させる強化学習エージェントの能力を評価する。
1つのタスクを除いて1つのタスクでエージェントを事前訓練することは、他のタスクにおけるエージェントのパフォーマンスに有益であることがわかった。
また、エージェントのトレーニング手順を、他のタスクで事前訓練することで、大幅に短縮できることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:51:33 GMT)
T-JEPA: Augmentation-Free Self-Supervised Learning for Tabular Data [0.0] 自己教師付き学習(SSL)は一般的に同じサンプルの異なるビューを生成するため、データ拡張が必要である。
本研究では,構造化データに対する拡張不要なSSL方式を提案する。
我々のアプローチであるT-JEPAは、JEPA(Joint Embedding Predictive Architecture)に依存しており、潜伏した空間における再構築のマスクに似ている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:49:25 GMT)
Summary of Point Transformer with Federated Learning for Predicting Breast Cancer HER2 Status from Hematoxylin and Eosin-Stained Whole Slide Images [0.0] 本研究では,ヘマトキシリンおよびエオシン全スライド画像(WSI)からHER2状態を予測するためのフェデレート学習に基づくアプローチを提案する。
多地点データセットにおけるラベルの不均衡と特徴表現の問題に対処するために,点変換器を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:51:46 GMT)
Soft edges: the many links between soft and edge modes [0.0] また,その一方では,症状の対称性と,その突発性との間には,より興味深い関係があることが示唆された。
我々の研究は境界対称性の研究と動的参照フレームのプログラムを組み合わせることで、コアインサイトがヤン・ミルズ理論と重力に拡張されることを期待している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 05:57:12 GMT)
Second-law-allowed temporal cooling of the coldest reservoir without external refrigeration [0.0] オープン量子系に結合したフェルミオン型貯水池の温度と化学的ポテンシャルのダイナミクスについて検討した。
得られた結果は量子熱機械やナノエレクトロニクスデバイスの設計に利用できる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:40:31 GMT)
Scaling theory of fading ergodicity [0.0] 我々は,多体エルゴディディティ破砕の前駆体であるフェーディングエルゴディディティのスケーリング理論を導入する。
我々の理論フレームワークは多体系の2パラメータスケーリング理論のためのビルディングブロックとして機能するかもしれない。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:00:05 GMT)
Rydberg states and new resonant states of the imidogen molecule NH: pathways for nitrogen release [0.0] 分子のニュートラル共鳴状態は解離ダイナミクスにおいて非常に重要な役割を果たす。
e + NH+ システム上で詳細な R-行列計算を行った。
9つの対称性の有界状態は詳細であり、特に一重項状態は以前にも研究されていない。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:19:42 GMT)
Robust quantum gap estimation with a noise-resilient hybrid algorithm [0.0] 本稿では,多体エネルギースペクトルのギャップを推定するためのハイブリッド量子アルゴリズムを提案する。
我々の分析は、数値的手法を用いてより広範なマルコフノイズのクラスに拡張する。
アルゴリズムの堅牢性は、Qiskit AerシミュレータのノイズシミュレーションとIBM Quantumプロセッサのデモによって実証される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:36:20 GMT)
Rigged Hilbert Space formulation for quasi-Hermitian composite systems [0.0] ディラックのブラケット形式は、非ハーマイト合成系のためのブラとケットベクトルを構築するために用いられる。
準エルミート作用素に関する対称関係は双対空間に拡張可能であることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:20:06 GMT)
Revealing Hidden States in Quantum Dot Array Dynamics: Quantum Polyspectra Versus Waiting Time Analysis [0.0] 本稿では、最近導入された輸送測定の量子多スペクトル分析により、多電子QDシステムの複素輸送測定をいかに分析するかを示す。
この方法は、実量子点接触(QPC)電流の高次時間相関を直接、測定された量子系のリウビリアンに関連付ける。
QPC電流測定の統計は、異なる3状態マルコフモデルで同一に記述できることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:22:11 GMT)
Reservoir engineering to protect quantum coherence in tripartite systems under dephasing noise [0.0] 強調は量子状態のコヒーレンスを破壊し、量子情報の喪失につながる。
マルコフでは、記憶のない環境では、純粋な状態と混合状態の両方のコヒーレンスが崩壊する一方、コヒーレンスは貯水池メモリの存在下で保存される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:28:32 GMT)
Reliable quantum advantage in quantum battery charging [0.0] エネルギー変動は充電効率に大きな影響を及ぼす。
本研究では,フライングキュービットが単一モード光キャビティとコヒーレントに相互作用するモデルについて検討する。
真に量子的な非ガウスのフォック状態で後者を準備することは、決定的かつ(原理上)測定可能な優位性をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:11:50 GMT)
Reliable Breast Cancer Molecular Subtype Prediction based on uncertainty-aware Bayesian Deep Learning by Mammography [0.0] 深層学習法は, 種々の医用画像を用いた乳癌分類作業において, 良好な成績を示した。
完全なマンモグラム画像を用いた不確実性を考慮したベイズ深層学習モデルを提案する。
各サブタイプに対して提案されたモデルのAUCはそれぞれ0.71、0.75、0.86である。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:52:56 GMT)
Relational Observables in Group Field Theory [0.0] 我々は、共変正作用素値測度(POVM)の観点から、群場理論(GFT)における関係観測値を構築する。
我々は、物質量子参照フレームに注目し、同じPOVMベースのフレームワーク内の他の種類のフレームに一般化することができる。
量子参照フレームに基づくリレーショナルオブザーバブルは,従来の提案の本質的な制約を克服するとともに,コヒーレントな状態における数と体積演算子の期待値に関する同じ制限結果を再現する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:19:38 GMT)
Quantum simulating continuum field theories with large-spin lattice models [0.0] マルチレベルシステムやquditシステムを用いてスカラーQFTの正規化を行う方法を示す。
積分可能なsine-Gordon (sG) QFTに対する可観測物の定量的な一致につながる外挿の列を数値的に示す。
我々の手法は、最先端アナログ量子シミュレーターに直接適用できる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:00:01 GMT)
Quantum reference frames, measurement schemes and the type of local algebras in quantum field theory [0.0] 我々は相対論的量子測定理論と量子参照フレーム(QRF)を結合する
対称性を持つ背景上の量子場の局所的な測定は、QRFに対して行われる。
これにより、時空等距離群の自然な作用の下で不変である量子場と参照フレームの合同代数が得られる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:46:19 GMT)
Quantum expectation value estimation by doubling the number of qubits [0.0] 最大12量子ビットの分子ハミルトニアンのエネルギー推定効率について検討した。
対象精度が数十ミリハーツリー以下である場合,本手法は従来のサンプリング法よりも少ない精度で測定できることが示されている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:27:42 GMT)
Quantum entanglement and Bell inequality violation at colliders [0.0] エンタングルメントは、標準モデルを超える新しい粒子や場を制限するための新しいツールとして提案されている。
このレビューでは、これらの開発を理解するのに必要な定義、ツール、基礎的な結果について紹介する。
我々は、量子ビット系と量子ビット系の両方、すなわちスピン1/半とスピン1粒子を含む最終状態の結果に関する詳細な議論を含む。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:29:51 GMT)
Quantum computing in spin-adapted representations for efficient simulations of spin systems [0.0] 本稿では,全スピン演算子の固有ベイジで直接量子アルゴリズムを設計するための新しい定式化を導入する。
この形式主義は各トランケーションしきい値に対してスピン適応ハミルトニアンの階層を生成する。
これらの歪んだハミルトニアンは、量子シミュレーションに適したスパースおよび局所クビットハミルトニアンで符号化することができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:38:20 GMT)
Quantum chaos, localization and phase transitions in random graphs [0.0] ランダムグラフのランダムな幾何学は、様々な量子カオスおよび局所化相とそれらの間の遷移をもたらす。
解析により, ランダムな幾何学を持つ物理系, 例えばゆらぎ・動力学的空間次元を持つ系は, 新たな普遍相転移特性を有することが示された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:44:53 GMT)
Quantum chaos on the separatrix of the periodically perturbed Harper model [0.0] 位相空間上のトーラス上の古典的周期ハミルトニアン系と関連する離散量子系との関係について検討する。
量子系に対するフロケプロパゲータの固有状態を数値計算する。
我々は、セパラトリクスに近いエネルギーを持つ状態で評価された相互作用表現における平均摂動から、関連する量子系の関連式を導出した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:04:21 GMT)
Quantum Walk and Quantum Billiards. Towards a better understanding of Quantum Chaos [0.0] この研究は、2つの1次元量子ウォークのテンソル積を通じて、他の著者によって既に得られている量子ビリヤードに基づいている。
カオスビリヤードと非カオスビリヤードが試験される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:47:23 GMT)
Quantum Frequency Conversion of $μs$-long Photons from the Visible to the Telecom-C-Band [0.0] 量子周波数変換(Quantum Frequency Conversion、QFC)は、光ファイバーの長距離伝播を容易にするために、原子系と通信帯域を結合する技術である。
単一光子レベルで606nmから1552nmのマイクロ秒長の弱コヒーレントパルスの差周波変換を実証した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:57:52 GMT)
Quantum Data Centers in the Presence of Noise [0.0] シングルプロセッサのモノリシック量子コンピュータは、クロストークの増加と、キュービット数が増加するとゲートの実装が困難になる。
QDCでは、複数の量子処理ユニット(QPU)が短距離で連結され、任意のプロセッサ上のキュービット数を増やすことなく計算キュービットの総数を増やすことができる。
これにより、各QPUの操作で発生するエラーを小さく抑えることができるが、QPU間の絡み合い分布中に発生する遅延コストとエラーのために、システムに追加のノイズを加えることができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:12:28 GMT)
QOSST: A Highly-Modular Open Source Platform for Experimental Continuous-Variable Quantum Key Distribution [0.0] 量子鍵分布(Quantum Key Distribution, QKD)は、量子物理学の法則に根ざした情報理論セキュリティを持つ2つのリモートパーティ間の秘密鍵交換を可能にする。
私たちは、原則的にハードウェアに依存しず、複数の構成で使用可能な、高度にモジュール化されたオープンソースソフトウェアを提供しています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:35:26 GMT)
Probability Distribution Learning and Its Application in Deep Learning [0.0] 本稿では,確率分布学習(PD Learning)と呼ばれる理論学習フレームワークを紹介する。
PD学習は確率分布の学習に重点を置いており、確率の単純さの中で確率変数としてモデル化される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:13:26 GMT)
Photocurrent-induced harmonics in nanostructures [0.0] 光電流による高調波は、強磁場中の電子のトンネル電離によってガスや固体に現れる。
強磁場中における金属ナノ構造において,同じ機構が高調波を発生させることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:59:15 GMT)
Persistent current in a non-Hermitian Hatano-Nelson ring: Disorder-induced amplification [0.0] 非相互ホッピングは、非エルミート的アハロノフ・ボーム効果をもたらす合成磁束を誘導する。
反エルミタン性二量体ホッピングをともなう無秩序な波多野・ネルソン環における持続電流の挙動について検討した。
相関性障害の存在下では, 実電流と虚電流が増幅されることが判明した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:26:55 GMT)
Operator K-complexity in DSSYK: Krylov complexity equals bulk length [0.0] ホログラフィック双対を持つカオス量子系における時間進化の下での複雑性の概念を研究する。
我々は、クリロフ複雑性が、理論のヒルベルト空間に作用する長さ作用素の期待値によって与えられることを証明する。
K-複素性の半古典的極限に対する解析的表現を見つけ、作用素のサイズがスクランブル力学をエンコードする方法を研究する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:54:30 GMT)
Opening the Black Box: predicting the trainability of deep neural networks with reconstruction entropy [0.0] 本稿では,ディープフィードフォワードニューラルネットワーク(DNN)のパラメータ空間におけるトレーニング可能な状態予測手法を提案する。
トレーニングの1つのエポックは、データセットの幅でディープフィードフォワードネットワークのトレーニング可能性を予測するのに十分であることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:33:28 GMT)
One Pixel is All I Need [0.0] 視覚変換器(ViT)は様々な視覚的タスクにおいて記録破りのパフォーマンスを達成した。
バックドア攻撃は、特定のトリガーとターゲットラベルを関連付けることを含み、トリガーが存在するときにモデルが攻撃者特定ラベルを予測する。
その結果, 準トリガー(トレーニングトリガーと異なるが, 元々のトレーニングトリガーと似ている)に対して, CNNと比較して, ViTsは高い攻撃成功率を示すことがわかった。
クリーンサンプルのバックドア機能は、元のトリガーを抑えることができ、準トリガーをより効果的にする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:59:24 GMT)
On the applicability of Kolmogorov's theory of probability to the description of quantum phenomena. Part I: Foundations [0.0] コルモゴロフの公理と物理的に自然な確率変数に基づいて数学的に厳密な理論を構築することができることを示す。
このアプローチは原則として、量子力学モデルの他のクラスに適応することができる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:37:09 GMT)
Neutral atom transport and transfer between optical tweezers [0.0] 我々は中性原子輸送の最適化と光ツイーザ間の移動に焦点を当てる。
静的トラップの効果を組み込むプロトコルを開発した。
提案するSTAプロトコルは、実験的にインスパイアされたパルスよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:48:31 GMT)
Nano-ESG: Extracting Corporate Sustainability Information from News Articles [0.0] 我々は、2023年1月から2024年9月までにドイツの大手企業向けに収集された、84万件以上のニュース記事からなる新しいデータセットを提示する。
自然言語処理を併用することにより,まず関連項目を識別し,それらを要約し,持続可能性に関する感情や側面を抽出する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:43:27 GMT)
NIPG-DG schemes for transformed master equations modeling open quantum systems [0.0] 本研究では、オープン量子系をモデル化した変換マスター方程式に対する不連続ガレルキン法(DG)の数値解析を行う。
提案した変換マスター方程式は, 同一系のウィグナー・フォッカー・プランクモデルと比較して計算コストが低いことを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:07:25 GMT)
Multiplexed Readout of Superconducting Qubits Using a 3D Re-entrant Cavity Filter [0.0] 超伝導量子ビットの周波数多重読み出しのための3次元再入射キャビティフィルタを提案する。
キャビティフィルタは、キュービット回路の平面外に配置され、大きなキュービットアレイにスケール可能な方法で、オンチップ読み出し共振器のアレイに容量的に結合する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:48:17 GMT)
Multidimensional quantum dynamics with explicitly correlated Gaussian wave packets using Rothe's method [0.0] ローテの手法は任意の数の複素、明示的に相関したガウス函数を伝播できることを示す。
関連する多次元力学は、少数のECGだけで高品質に記述できる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:05:10 GMT)
Movie2Story: A framework for understanding videos and telling stories in the form of novel text [0.0] 本稿では,音声,ビデオ,文字認識を組み合わせることで,新しい長文を生成するM2Sというフレームワークを紹介する。
M2Sには、ビデオの長文記述と理解のためのモジュール、感情、発話率、文字アライメントの音声ベースの分析、視覚ベースの文字認識アライメントが含まれる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:44:04 GMT)
Measuring Social Biases in Masked Language Models by Proxy of Prediction Quality [0.0] トランスフォーマーベースの言語モデルは、コンテキスト対応のトークン埋め込みを生成し、様々な自然言語タスクに対して最先端のパフォーマンスを実現している。
マスク付き言語モデリングの目的によって訓練されたトランスフォーマーによって符号化された社会的バイアスを評価する。
一方のデータセットでは、考察対象の宗教的・障害者的偏見が比較的高く、性別的偏見が低いことが判明した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:35:36 GMT)
MUSTER: Longitudinal Deformable Registration by Composition of Consecutive Deformations [0.0] 本研究は,医用画像の経時的変化解析手法であるMulti-Session Temporal Registration (MUSTER)を紹介する。
MUSTERは、縦方向の変形を回復するために、2つ以上のイメージングセッションを組み込むことで、従来のペアの登録を改善する。
MUSTERはT1強調画像から神経変性のパターンを効果的に同定し,これらの変化が認知の変化と相関していることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:22:19 GMT)
Log-Time K-Means Clustering for 1D Data: Novel Approaches with Proof and Implementation [0.0] この論文は1D$k$-meansクラスタリングの理論と実践を橋渡しし、JIT最適化オープンソースのPythonライブラリで実装された効率的で健全なアルゴリズムを提供する。
ベンチマークでは、大規模データセットのScikit-learnと比較して4500倍以上のスピードアップを示しながら、クラスタ内総和(WCSS)によって測定されたクラスタリング品質を維持している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:03:39 GMT)
Leveraging Time Series Categorization and Temporal Fusion Transformers to Improve Cryptocurrency Price Forecasting [0.0] 資産の最適選択は、暗号通貨の価格の正確な予測を必要とする主な課題の1つである。
サブシリーズの各カテゴリに対して、各サブシリーズの次のステップを予測するために、アテンションメカニズムに基づくディープラーニングモデルを作成する。
この課題を克服するために、他の暗号通貨の時系列データを組み合わせて、各カテゴリのデータ量を増やすことを提案し、したがって、各カテゴリに対応するモデルの精度を高める。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 04:57:55 GMT)
Latent Ewald summation for machine learning of long-range interactions [0.0] 本稿では,局所的な原子ディスクリプタから潜時変数を学習することにより,長距離相互作用を考慮した簡便かつ効率的な手法を提案する。
荷電および極性分子二量体、バルク水、水蒸気界面などのシステムでは、標準の短距離MLIPが非物理的予測に繋がることを示した。
長距離モデルはこれらのアーティファクトを効果的に排除し、短距離MLIPの計算コストの約2倍に過ぎなかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:11:11 GMT)
Large-scale School Mapping using Weakly Supervised Deep Learning for Universal School Connectivity [0.0] 弱教師付き深層学習技術を用いて高解像度衛星画像に学校を配置するコスト効率でスケーラブルな手法を提案する。
ビジョントランスフォーマーと畳み込みニューラルネットワークを組み合わせた私たちの最良のモデルは、10のパイロットアフリカ諸国で0.96以上のAUPRC値を達成しています。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:06:56 GMT)
Large Language Models and Code Security: A Systematic Literature Review [0.0] 大規模言語モデル(LLM)は、様々なプログラミングタスクを自動化する強力なツールとして登場した。
LLMはプログラマが知らない脆弱性を導入する可能性がある。
コードを解析する際には、明確な脆弱性を見逃したり、存在しない脆弱性を通知する可能性がある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:20:22 GMT)
LLMs as mediators: Can they diagnose conflicts accurately? [0.0] OpenAIの大規模言語モデル GPT 3.5 と GPT 4 は因果関係と道徳的関係を確実に区別できる。
会話における不一致の原因の診断を求めると、LLMは人間と比較して、因果不一致の程度を過大評価する傾向がある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:29:08 GMT)
LLM-SEM: A Sentiment-Based Student Engagement Metric Using LLMS for E-Learning Platforms [0.0] LLM-SEM (Language Model-Based Students Engagement Metric) は,ビデオメタデータと学生コメントの感情分析を利用してエンゲージメントを測定する手法である。
我々は、テキストの曖昧さを軽減し、ビューやいいね!といった重要な特徴を正規化するために、高品質な感情予測を生成する。
包括的メタデータと感情極性スコアを組み合わせることで、コースと授業レベルのエンゲージメントを測定する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:50:54 GMT)
Joint Models for Handling Non-Ignorable Missing Data using Bayesian Additive Regression Trees: Application to Leaf Photosynthetic Traits Data [0.0] 欠落したデータに対する対処は、予測分析において大きな課題となる。
データがランダムに欠落している場合、データのモデリングとデータインジケータの欠落が不可欠である。
本稿では,データ不足を伴うデータ処理のための選択モデルに基づく2つの手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:26:55 GMT)
Interaction-induced phase transitions and critical phases in nonreciprocal non-Hermitian quasicrystals [0.0] 相互作用と非相互ホッピングが準周期格子上の2つのボソンの挙動にどのように影響するかを示す。
我々の研究は非エルミート系における局所化と位相位相の理解を前進させる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 02:36:34 GMT)
Information-Theoretic Limits and Strong Consistency on Binary Non-uniform Hypergraph Stochastic Block Models [0.0] 非一様ハイパーグラフブロックモデル(HSBM)の下でのランダムハイパーグラフの教師なし分類問題
本稿では,クラスタリング精度と強い一貫性しきい値に対する情報理論の限界を確立する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:23:57 GMT)
Individual Addressing and State Readout of Trapped Ions Utilizing Radio-Frequency Micromotion [0.0] 局所的な静電場を調整し, 個々のイオンの超過マイクロモーションを高精度に誘導する。
マイクロモーションはイオンとレーザー場の結合を変調し、理想的には最大値からゼロに調整する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:49:00 GMT)
Impact of Josephson junction array modes on fluxonium readout [0.0] 我々は,フラキソニウム量子ビットの分散読み出しにおける測定誘起状態遷移(MIST)を理論的に解析した。
これらの新しい種類のMISTプロセスは、リアルな回路パラメータと比較的低いリードアウト駆動パワーを用いることで、関連性があることが示される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:28:46 GMT)
Hybridization of Persistent Homology with Neural Networks for Time-Series Prediction: A Case Study in Wave Height [0.0] 本稿では,ニューラルネットワークモデルの予測性能を向上させる機能工学手法を提案する。
具体的には、計算トポロジ手法を利用して、入力データから貴重なトポロジ的特徴を導出する。
タイムアヘッド予測では、FNN、RNN、LSTM、GRUモデルにおいて、R2$スコアの強化が重要だった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:26:22 GMT)
How to Manage My Data? With Machine--Interpretable GDPR Rights! [0.0] EUは、個人が情報を取得し、個人情報がどのように処理されているかを制御するためのいくつかの権利を導入した、目覚ましい規制である。
各組織が権利宣言と管理のためのカスタムメソッドを開発するため、権利の有効利用にはギャップがある。
本稿では、セマンティックWeb標準に基づく機械解釈可能なフォーマットにおける権利の行使と管理のための仕様を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:09:17 GMT)
Harnessing energy transitions for low-temperature thermometry [0.0] 本研究では,ハイゼンベルク$XX$とジアロシンスキー=モリヤ相互作用によって支配されるクビット鎖を用いた温度測定の範囲と精度を拡大する手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:28:04 GMT)
Graph-neural-network predictions of solid-state NMR parameters from spherical tensor decomposition [0.0] 核磁気共鳴(NMR)は、物質の局所的な原子構造に敏感な強力な分光法である。
機械学習(ML)は、このような予測を行うための効率的なルートとして登場した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:11:07 GMT)
Generalized Hertz action and quantum criticality of two-dimensional Fermi systems [0.0] 二次元フェルミ系の実効作用と量子臨界特異点の構造を再評価する。
我々はヘルツ作用の一般化形式を導出するが、これは特異な有効相互作用の問題に悩まされない。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:03:09 GMT)
General tradeoff relation of fundamental quantum limits for linear multiparameter estimation [0.0] 線形測定は、重力波(GW)、暗黒物質、赤外線、回転速度などを含む古典的な信号を検出するための重要な分類である。
線形量子デバイスで検出された単色古典信号において、2つの独立パラメータの基本量子限界を厳しく制限する一般的なトレードオフ関係を確立する。
この結果は多くの応用に関係しており、特に遅延周波数と不整合係数の直接関係により、解離後の残余を探索するための解離したGWセンサがある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:43:19 GMT)
Gaussian boson sampling for binary optimization [0.0] 本稿では,2値最適化問題に対処するために,しきい値検出器を備えたパラメトリゼーションガウスボソンサンプリング(GBS)を提案する。
3SATおよびグラフ問題に関する数値実験は、ランダムな推測よりも顕著な性能向上を示した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:12:22 GMT)
GIRAFE: Glottal Imaging Dataset for Advanced Segmentation, Analysis, and Facilitative Playbacks Evaluation [0.0] GIRAFEはセマンティックセグメンテーションの高度な技術開発を容易にするために設計されたデータリポジトリである。
このレポジトリには、50人の患者からなるコホートからの65の高速ビデオ内視鏡記録が含まれている。
このデータセットは、健康的なコントロールから15の録音、診断された音声障害の26の録音、未知の健康状態の24の録音を含む。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:02:03 GMT)
From black hole interior to quantum complexity through operator rank [0.0] ブラックホールの内部の大きさは、基礎となる境界の進化の量子ゲートの複雑さを捉えていると推測されている。
量子回路の内部を横切るコメンジョン2面の面積を量子回路の深さと直接関連付けることで、さらに微細な証拠を提供することを目指している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:54:24 GMT)
Foundation of statistical mechanics under even more experimentally realistic conditions [0.0] 有限時間摂動下であっても、多くの重要なエネルギー準位を投入すれば、系は平衡する。
この結果は、孤立量子系における熱化を理解するための、より広く、より現実的な枠組みを提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:42:20 GMT)
Formation, Prevalence, and Stability of Bouncing-Ball Scars [0.0] 量子傷は不安定な古典周期軌道に沿った高密度の確率密度に対応する。
この研究は、二次元(2D)量子井戸における線形「バウンシングボール」(BB)傷の生成、有病率、安定性に焦点をあてる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:53:46 GMT)
Fietje: An open, efficient LLM for Dutch [0.0] 本稿では、オランダ語用に特別に設計された小型言語モデル(SLM)ファミリーであるFietjeを紹介する。
Fietjeは、より大きな言語モデルと競合する結果を公開してみせた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 23:06:01 GMT)
Faulty States can be used in Cat Code Error Correction [0.0] 猫符号は、フォールトトレラント量子アーキテクチャ、量子強化センシング、絡み合い分布など、様々な応用への関心が復活している。
猫符号量子誤り訂正のためのテレポーテーションに基づく補正回路について検討する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:15:55 GMT)
Extended Wannier-Stark ladder and particle-pair Bloch oscillations in dimerized non-Hermitian systems [0.0] エネルギー準位は複雑であるが、真のブロッホ周波数で等しく空間化されていることを示す。
そこで本研究では,2種類の非エルミート系について述べる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:11:18 GMT)
Exploring the Accuracy of Interferometric Quantum Measurements under Conservation Laws [0.0] Wigner-Araki-Yanase定理とその一般化は測定誤差(大沢境界)に基づいて下界を予測する
測定誤差である$varepsilon$は、測定された可観測物の非定常性質とどのように関連しているかを示す。
本研究は,量子技術における最適資源管理に重要な実践的結果をもたらすものである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:21:46 GMT)
Event-based backpropagation on the neuromorphic platform SpiNNaker2 [0.0] EventPropはスパイクニューラルネットワーク(SNN)におけるイベントベースのバックプロパゲーションのためのアルゴリズム
本実装では, 微分方程式とその共役の離散バージョンを用いて, 漏洩した積分・発火ニューロンの多層ネットワークを計算した。
我々は,Yin Yangデータセットを用いたSNNのバッチ並列化オンチップトレーニングの概念実証を行った。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 16:31:42 GMT)
Estimating the impact of light pollution on quantum communication between QEYSSat and Canadian quantum ground station sites [0.0] 我々は、量子地上局(QGS)サイトが量子信号の交換に有効かどうかを、今後の量子暗号化および科学衛星(QEYSSat)ミッションで判定する方法を比較した。
異なる手法を用いて、衛星地上の量子チャネルにリークする可能性のあるバックグラウンドカウントを推定し、ノイズレベルが量子鍵転送を阻止できるかどうかを判定する。
我々の結果は、ウォータールー、カルガリー、プリディスのQGSサイトは、都市部に近いにもかかわらず、量子アップリンクとQEYSSatとのダウンリンクの両方を許容すべきであることを示している。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:24:11 GMT)
Entanglement asymmetry in periodically driven quantum systems [0.0] 周期的に駆動される量子系における絡み合い非対称性のダイナミクスについて研究する。
我々は、周期的に駆動されるXY鎖を駆動可積分量子系のモデルとして使用する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:50:04 GMT)
Enhancing Diffusion Models for High-Quality Image Generation [0.0] 本稿では,拡散確率モデル(DDPM)と拡散確率モデル(DDIM)の総合的な実装,評価,最適化について述べる。
推論中、これらのモデルはランダムノイズを入力とし、高画質な画像を出力として繰り返し生成する。
この研究の背景にあるのは、さまざまなデータセットをまたいだリアルなイメージを生成可能な、効率的でスケーラブルな生成AIモデルの需要が高まっていることだ。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:23:15 GMT)
Emergence of unidirectionality and phase separation in optically dense emitter ensembles [0.0] 一次元幾何学において、2レベルエミッタのアンサンブルを通して光の透過を研究する。
熱力学の限界では、空間秩序の度合いに依存する臨界値を持つ相分離の出現が観測される。
我々は,一方向導波路を用いた一次元系を効果的にモデル化することができると結論付けた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:07:22 GMT)
Eigenstate Preparation on Quantum Computers [0.0] 本論文は, 短期量子コンピューティングデバイスを用いた固有状態生成アルゴリズムについて検討する。
最適制御を伴う量子断熱的進化, ロデオアルゴリズム, 変動ロデオアルゴリズムの3つの手法を詳述する。
本稿では,本手法が固有状態の生成に有効であることを示す結果を示すが,その実用性は,所望の固有状態と重なり合う初期状態の作成を前提としている。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 17:28:21 GMT)
Efficient optical cat state generation using squeezed few-photon superposition states [0.0] 光シュリンガー猫状態(英: Optical Schr"odinger cat state)は、量子技術に応用された非ガウス状態である。
我々は、高忠実度猫状態を効率的に生成するためのプロトコルの材料として、ゼロと2つの光子の圧縮重ね合わせ、$|thetarangle = cos(theta/2)|0rangle + sin(theta/2)|2rangle$を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:38:25 GMT)
Efficient Experimental Qudit State Estimation via Point Tomography [0.0] ポイントトモグラフィーは状態推定問題に対する新しいアプローチである。
ここでは,ポイントトモグラフィの実験的生存可能性を示す。
我々は,Gill-Massar限界に近い精度で,単一の結果測定を行う。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:49:36 GMT)
Efficient Classical Computation of Single-Qubit Marginal Measurement Probabilities to Simulate Certain Classes of Quantum Algorithms [0.0] 我々は、ニューラルネットワークを利用してユニタリ変換を生成する新しいCNOT"機能"を導入する。
ランダム回路シミュレーションでは,QC-DFTの修正により,単一キュービットの辺り測定確率の効率的な計算が可能となった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:06:21 GMT)
Dynamics of Quantum Coherence and Non-Classical Correlations in Open Quantum System Coupled to a Squeezed Thermal Bath [0.0] 圧縮熱貯留層に結合した2ビット開放量子系の量子コヒーレンスと非古典的相関のダイナミクスについて検討する。
その結果, 量子共鳴, 量子不協和, 局所的量子不確実性, および量子フィッシャー情報などの非古典的相関は, 集合的状態に非常に敏感であることがわかった。
この研究は理論的な進歩を現実世界の応用に橋渡しし、環境デコヒーレンスの影響下で量子資源を活用するための包括的な枠組みを提供する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:46:09 GMT)
Dynamic Realization of Majorana Zero Modes in a Particle-Conserving Ladder [0.0] マヨラナゼロモードをサポートするトポロジカル超伝導系の実現手法を提案する。
この結果から,マヨラナゼロモードは大きなパラメータ空間で安定化可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:19:51 GMT)
Do Large Language Models Defend Inferentialist Semantics?: On the Logical Expressivism and Anti-Representationalism of LLMs [0.0] 本稿では,大規模言語モデル(LLM)の特徴が,言語哲学における主流の仮定に挑戦していることを論じる。
本研究は,LLMの特性と振舞いの解釈において,推論的意味論の反表現主義と論理的表現主義,および準合成性が有用であることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:48:40 GMT)
Dissipation-induced bound states as a two-level system [0.0] 反パリティ時対称系は1対の実エネルギー準位を持つことができるが、残りの全ての準位はエネルギーの負の虚部のために不安定である。
本研究では,高調波想像ポテンシャルによって誘導される強結合鎖における束縛状態の形成について検討する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:26:15 GMT)
Diffusion priors for Bayesian 3D reconstruction from incomplete measurements [0.0] ベイズフレームワーク内の実験データと組み合わせた拡散モデルについて検討する。
中分解能で粗粒3次元構造を生成する拡散モデルを訓練し、これらを不完全でノイズの多い実験データと統合する。
拡散モデルによる後方サンプリングにより,低分解能,低分解能,部分的な観察から3次元再構成が可能であることが判明した。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:28:00 GMT)
Derivative coupling enables genuine entanglement harvesting in causal communication [0.0] 粒子検出器は, 平面時空において因果接触中であっても, その導体を介して無質量場の量子場に結合し, 実際にエンタングルメントを形成することができることを示す。
これは、微分カップリングモデルがいくつかの興味深い実験可能なシステムを捕捉し、収穫された絡み合いが全光接触でピークとなるため、特に関係がある。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:28:42 GMT)
Derivation of Lorentz-Drude undamped oscillator hierarchical equations of motion [0.0] この新しいアプローチは、低減衰スペクトル密度に固有の超流動減衰のアーティファクトを避ける。
HEOMは縮合相分子における分子内振動のモデルとして有用であることを示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:51:29 GMT)
Decade of Natural Language Processing in Chronic Pain: A Systematic Review [0.0] 慢性痛におけるNLPの約束にもかかわらず、文献は様々な分野に分散している。
本総説は、慢性痛研究におけるNLPによる介入研究の現状について検討することを目的とする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:46:09 GMT)
Counterexample Guided Program Repair Using Zero-Shot Learning and MaxSAT-based Fault Localization [0.0] 導入プログラミング課題(IPAs)のための自動プログラム修復(APR)は、多数の学生の参加によって動機付けられている。
本稿では,FMに基づく障害局所化とLarge Language Models(LLMs)の長所を組み合わせた新しいアプローチを提案する。
提案手法では,MaxSATに基づく障害位置定位法を用いて,プログラムのバグ部分を特定し,これらのバグ文を欠いたプログラムスケッチをLLMに提示する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 12:08:44 GMT)
Cosmology with Persistent Homology: Parameter Inference via Machine Learning [0.0] 我々は、PS/BS(Power Spectrum and Bispectrum)と比べ、パラメーターを推測する持続画像(PI)の能力を評価する。
PIはパラメータが制約される場合のPS/BSと比べ、常により良い予測につながる。
PI は $f_rm NLrm loc$ に対して特によく機能し、原始的非ガウス性を制限する上での永続的ホモロジーの約束を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 21:18:43 GMT)
Continuous latent representations for modeling precipitation with deep learning [0.0] シミュレーション降水データのプロキシとして,スムーズで時間的に連続的な変数を生成するためにディープラーニングをどのように利用できるかを検討する。
我々は,不連続降水シミュレーションの代替として,擬似降水(PP)と呼ばれる通常分布のフィールドを開発する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:13:20 GMT)
Content-style disentangled representation for controllable artistic image stylization and generation [0.0] 制御可能な芸術的イメージスタイリングと生成は、テキストや画像が提供するコンテンツを学習された芸術的スタイルでレンダリングすることを目的としている。
本稿では,芸術的イメージのスタイル化と生成を制御可能なコンテンツスタイルの表現分離手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 03:42:58 GMT)
Confidence in the Reasoning of Large Language Models [0.0] 信頼度は、再考を促す際に、答えを維持するための永続性の観点から測定される。
信頼は、基礎となるトークンレベルの確率によってのみ部分的に説明される。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:04:29 GMT)
Computational Sociology of Humans and Machines; Conflict and Collaboration [0.0] 本章では,人間機械システムにおける紛争と協力のダイナミクスについて考察する。
大規模なインターネットベースのコラボレーションプラットフォームに焦点を当てている。
シリアルアタック、相互復讐、サードパーティによる介入など、繰り返し発生する相互作用パターンを識別する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 07:55:56 GMT)
Complete Rabi oscillations in the ion-laser interaction [0.0] 我々は、レーザーと相互作用する単一の調和に閉じ込められたイオンのダイナミクスを提示する。
システムの進化を可能にする物理パラメータの条件について論じる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:42:15 GMT)
Compact Neural Network Algorithm for Electrocardiogram Classification [0.0] 不整脈の自動分類のための小型心電図システムを提案する。
このシステムはMIT-BIH不整脈データベース上で97.36%の精度を達成する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:55:22 GMT)
Clustering of timed sequences -- Application to the analysis of care pathways [0.0] 典型的なケアパスの発見は、クラスタリングによって達成できる。
タイムスタンプされたイベントのシーケンスで表されるクラスタリングケアパスの難しさは、意味的に適切なメトリックとクラスタリングアルゴリズムを定義することである。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 15:54:17 GMT)
Characterizing the Multipartite Entanglement Structure of Non-Gaussian Continuous-Variable States with a Single Evolution Operator [0.0] 連続変数系における多部絡み構造を効率的に検出する手法を提案する。
ランダムに生成した105ドル以上の多モード量子状態に対して,本手法の有効性を示す。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 14:45:50 GMT)
Beyond the Sum: Unlocking AI Agents Potential Through Market Forces [0.0] AIエージェントは、デジタルマーケット内で独立した経済アクターとして機能する理論的能力を持っている。
既存のデジタルインフラストラクチャは、彼らの参加に大きな障壁をもたらします。
これらのインフラの課題に対処することは、新しい形態の経済組織を実現するための基本的なステップである、と我々は主張する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:40:40 GMT)
BATIS: Bootstrapping, Autonomous Testing, and Initialization System for Quantum Dot Devices [0.0] 本稿では,QDデバイスの評価と校正の効率化を目的としたブートストラップ,自律テスト,初期化システム(BATIS)を提案する。
BATISは高次元ゲート電圧空間をナビゲートし、漏れ試験やゲートキャラクタリゼーションといった重要なステップを自動化する。
クアッドQD Si/Si$_x$Ge$_1-x$デバイス上で1.3Kで実証された。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:18:15 GMT)
Audio Captioning RAG via Generative Pair-to-Pair Retrieval with Refined Knowledge Base [0.0] Retrieval-Augmented Generation (RAG)は、知識ベースから音声テキストペアを検索し、クエリオーディオで拡張し、正確なテキスト応答を生成する。
生成したキャプションをテキストクエリとして使用して,関連する音声テキストペアを正確に検索する生成ペア対検索を提案する。
提案手法は,AudioCaps,Clotho,Auto-ACDといったベンチマークの最先端結果を実現する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 00:34:45 GMT)
Analysis and Visualization of Linguistic Structures in Large Language Models: Neural Representations of Verb-Particle Constructions in BERT [0.0] 本研究では,大言語モデル(LLM)における動詞-助詞の組み合わせの内部表現について検討する。
我々は'agree on'、'come back'、'give up'といった様々な動詞粒子構築のための各層の表現効果を分析する。
その結果,BERTの中間層は,各動詞カテゴリの表現精度に有意なばらつきがあり,構文構造を効果的に捉えていることがわかった。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 09:21:39 GMT)
Algorithmic construction of SSA-compatible extreme rays of the subadditivity cone and the ${\sf N}=6$ solution [0.0] 強い部分付加性に相反する6次元部分付加性円錐の極端光線の集合を計算する。
総じて、208個の新しい6つの軌道を同定し、そのうち52個は少なくとも1つのホログラフィックエントロピー不等式に違反している。
最後の6つの軌道については、ホログラフィックであるかどうかの疑問が残る。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:51:02 GMT)
Adaptive Prompt Tuning: Vision Guided Prompt Tuning with Cross-Attention for Fine-Grained Few-Shot Learning [0.0] コンピュータビジョンにおける微妙な分類は、限られたデータで微妙な分類を区別する必要があるため、大きな課題となる。
本稿では,適応的なプロンプトチューニングにより,コントラスト言語画像事前学習モデルを強化する手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 08:51:01 GMT)
Abelian Spectral Topology of Multifold Exceptional Points [0.0] 局所対称性を持つ汎用システムやシステムにおけるEP$n$sの分類を再考する。
我々の研究は、EP$n$sの位相的性質が持つ数学的基礎を明らかにする。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 19:00:00 GMT)
ASTM :Autonomous Smart Traffic Management System Using Artificial Intelligence CNN and LSTM [0.0] 本稿では,AIを用いて交通流量を改善する自律型スマートトラヒック管理システムを提案する。
このシステムは、交通管理画像中の車両を検出するために、YOLO V5 Convolutional Neural Networkを使用している。
また、長い短期記憶を備えたリカレントニューラルネットワークを使用して、次の12時間の車両数を予測する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:39:55 GMT)
ALKAFI-LLAMA3: Fine-Tuning LLMs for Precise Legal Understanding in Palestine [0.0] 本研究は,パレスチナの法域に大規模言語モデルを適用することの課題に対処する。
政治的不安定、断片化された法的なフレームワーク、限られたAIリソースは、効果的な機械学習アプリケーションを妨げる。
Llama-3.2-1B-Instructの量子化バージョンに基づく微調整モデルを提案する。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 11:55:51 GMT)
A statistical model for quantum spin and photon number states [0.0] 量子論で生じる確率は、より基本的なオンティック状態のカウントに還元できることを示す。
完全に自己包含された形式主義は、これらのオンティックな状態を整理し、数えることを目的として開発されている。
この形式は、2つの回転するスターン・ゲラッハ検出器のシーケンスと相互作用する任意のスピンの粒子の確率分布を計算するために用いられる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:11:57 GMT)
A jury evaluation theorem [0.0] MVがいつグループ決定に最適かを考える理論は、コンドルセットの1785年の陪審決定定理にさかのぼる。
アメリカコミュニティサーベイの人口統計データセットにラベルをつける実験は、MVとAEをほぼエラー非依存のアンサンブルで比較するために行われた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 13:01:21 GMT)
A correspondence between quantum error correcting codes and quantum reference frames [0.0] ゲージ理論では、ゲージ不変量の少ない情報を冗長に記述するために、運動学的な自由度の集まりが用いられる。
量子参照フレーム(QRF)は、対称性の存在下での量子化のための普遍的なツールキットである。
その結果、制約系に対する視点ニュートラルフレームワーク内のQECCとQRFの正確な辞書が得られた。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:52:38 GMT)
A brief history of quantum vs classical computational advantage [0.0] 量子計算の利点を今日まで主張する全ての実験を要約する。
また,近似最適化やレコメンデーションシステムといった問題における理論的計算上の優位性についても論じる。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 10:16:49 GMT)
A Finite-Time Quantum Otto Engine subject to Control Noise and Enhancement Techniques [0.0] 制御ノイズが量子オットーサイクルに与える影響を評価する。
コントロールにおける白色ノイズの存在は、平均的なエンジン性能に悪影響を及ぼす。
論文参考訳(メタデータ) (Thu, 19 Dec 2024 18:58:14 GMT)