Improving Dynamic Object Interactions in Text-to-Video Generation with AI Feedback [130.1] テキスト・ビデオ・モデルにおけるオブジェクトの動的性を高めるためのフィードバックの利用について検討する。
本手法は,動的インタラクションにおける映像品質の大幅な向上を駆動するバイナリAIフィードバックを用いて,多様な報酬を効果的に最適化できることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:44:23 GMT)
Personalized Multimodal Large Language Models: A Survey [128.0] マルチモーダル大言語モデル(MLLM)は、最先端の性能と複数のデータモダリティを統合する能力により、ますます重要になっている。
本稿では,パーソナライズされたマルチモーダルな大規模言語モデルに関する包括的調査を行い,そのアーキテクチャ,トレーニング方法,アプリケーションに焦点をあてる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:59:03 GMT)
SparseGrasp: Robotic Grasping via 3D Semantic Gaussian Splatting from Sparse Multi-View RGB Images [125.7] オープンボキャブラリ型ロボットグリップシステムであるSparseGraspを提案する。
SparseGraspはスパースビューのRGBイメージで効率的に動作し、シーン更新を高速に処理する。
SparseGraspは, 高速化と適応性の両方の観点から, 最先端の手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:56:01 GMT)
VISCO: Benchmarking Fine-Grained Critique and Correction Towards Self-Improvement in Visual Reasoning [112.4] 我々は,LVLMの細粒度評価と補正能力を広範囲に解析する最初のベンチマークであるVISCOを提案する。
VISCOは密度が高くきめ細かな批判を特徴とし、LVLMは各ステップの正しさを評価する必要がある。
LookBackは、批評と修正のパフォーマンスを最大13.5%改善する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:04:49 GMT)
Predictive Models in Sequential Recommendations: Bridging Performance Laws with Data Quality Insights [104.5] 本稿では,モデル性能とデータ品質の関係を理論的に検討し,モデル化することを目的としたSRモデルの性能法則を紹介する。
データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:43:49 GMT)
PassionSR: Post-Training Quantization with Adaptive Scale in One-Step Diffusion based Image Super-Resolution [96.0] 拡散に基づく画像超解像(SR)モデルでは、複数のデノナイジングステップのコストで優れた性能を示す。
本稿では,一段階拡散(OSD)画像SR,PassionSRにおける適応スケールの学習後量子化手法を提案する。
我々のPassionSRは、画像SRの最近の先進的な低ビット量子化法に対して大きな利点がある。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:14:09 GMT)
Proactive Agent: Shifting LLM Agents from Reactive Responses to Active Assistance [95.0] 我々は、人間の指示なしにタスクを予測および開始できるプロアクティブエージェントを開発するという課題に取り組む。
まず,実世界の人的活動を収集し,前向きなタスク予測を生成する。
これらの予測は、ヒトのアノテータによって受け入れられるか拒否されるかのどちらかとしてラベル付けされる。
ラベル付きデータは、人間の判断をシミュレートする報酬モデルをトレーニングするために使用される。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:34:09 GMT)
Center-Sensitive Kernel Optimization for Efficient On-Device Incremental Learning [88.8] 現在のオンデバイストレーニング手法は、破滅的な忘れを考慮せずに、効率的なトレーニングにのみ焦点をあてている。
本稿では,単純だが効果的なエッジフレンドリーなインクリメンタル学習フレームワークを提案する。
本手法は,メモリの削減と近似計算により,平均精度38.08%の高速化を実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:23:25 GMT)
CC-OCR: A Comprehensive and Challenging OCR Benchmark for Evaluating Large Multimodal Models in Literacy [88.1] CC-OCRは、マルチシーンテキスト読取、多言語テキスト読取、文書解析、キー情報抽出の4つのOCR中心のトラックで構成されている。
CC-OCRは、OCR中心のタスクにおけるLMMの能力を総合的に評価し、LMMの進歩を促進することを目的としている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:03:25 GMT)
KP-RED: Exploiting Semantic Keypoints for Joint 3D Shape Retrieval and Deformation [87.2] KP-RED は KeyPoint 主導の Retrieval and deformation フレームワークである。
オブジェクトスキャンを入力として、最も幾何学的に類似したCADモデルを共同で検索し、変形させる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:01:32 GMT)
Efficient Concertormer for Image Deblurring and Beyond [87.1] 本稿では,画像の劣化を抑えるための新しいCSA機構を提案する。
自己アテンション計算とは無関係な余剰次元の部分情報を保持することにより,画像サイズに線形な大域的文脈表現を効果的に取得する。
本研究の主な目的は, 単一像運動の劣化であるが, 定量的, 質的な評価により, 他の課題における最先端の手法に対して, より良好に行動できることが示されている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:03:40 GMT)
HunyuanVideo: A Systematic Framework For Large Video Generative Models [86.9] HunyuanVideoは、革新的なオープンソースのビデオファンデーションモデルだ。
データキュレーション、高度なアーキテクチャ設計、プログレッシブモデルスケーリング、トレーニングが組み込まれている。
その結果,13億以上のパラメータを持つビデオ生成モデルの訓練に成功した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:52:37 GMT)
Towards Rich Emotions in 3D Avatars: A Text-to-3D Avatar Generation Benchmark [78.7] 音声(Emo3D)から派生したテキストで感情的にダイナミックな3D顔アバターを生成することは、3Dアバター生成において重要な研究課題となっている。
本稿では,Emo3D生成を再検討し,人間のプロセスからインスピレーションを得て,Emo3Dをテキストから3D表現マッピング(T3DEM)と3Dアバターレンダリング(3DAR)の2つのカスケードステップに分解する。
これらの課題に対処するため,我々はEmo3D生成の研究を進めるための新しいベンチマークを導入する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:39:05 GMT)
Unlocking Tuning-Free Few-Shot Adaptability in Visual Foundation Models by Recycling Pre-Tuned LoRAs [76.4] 大規模言語モデル(LLM)は、微調整を必要とせず、強力な少数ショット適応性を示す。
現在のVisual Foundation Models (VFM) は十分なチューニングデータを持つ明示的な微調整を必要とする。
そこで我々は, メタ学習目的の多様なLoRAからメタLoRAを蒸留するフレームワークであるLoRA Recycleを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:25:30 GMT)
AutoGuide: Automated Generation and Selection of Context-Aware Guidelines for Large Language Model Agents [74.2] オフライン体験からコンテキスト認識ガイドラインを自動的に生成する,AutoGuideという新しいフレームワークを導入する。
その結果,本ガイドラインはエージェントの現在の意思決定プロセスに関連性のある知識の提供を促進する。
評価の結果, AutoGuide は複雑なベンチマーク領域において, 競争ベースラインを著しく上回っていることがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:36:47 GMT)
Taming Scalable Visual Tokenizer for Autoregressive Image Generation [74.2] インデックスバックプロパゲーション量子化(IBQ)は、すべてのコードブック埋め込みとビジュアルエンコーダの共同最適化のための新しいVQ手法である。
IBQは、ビジュアルトークンのスケーラブルなトレーニングを可能にし、初めて、高次元(256ドル)で高利用率の大規模コードブックを実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:59:10 GMT)
RG-SAN: Rule-Guided Spatial Awareness Network for End-to-End 3D Referring Expression Segmentation [73.0] 3D参照式は、参照式と点雲を関連付けて3Dオブジェクトをセグメントすることを目的としている。
従来のアプローチでは、インスタンスの空間情報に重点が置かれていないため、過剰なセグメンテーションや誤ったセグメンテーションといった問題に頻繁に遭遇する。
本稿では,ルールガイド型空間認識ネットワーク(RG-SAN)を導入する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:50:16 GMT)
Unleashing In-context Learning of Autoregressive Models for Few-shot Image Manipulation [71.0] 我々は、$textbfInstaManip$と呼ばれる新しいマルチモーダル自動回帰モデルを導入する。
本稿では,コンテキスト内学習プロセスを2つの段階に分割する,革新的なグループ自己認識機構を提案する。
提案手法は、過去の数ショット画像操作モデルよりも顕著なマージンを超越している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:32:00 GMT)
Samba: Simple Hybrid State Space Models for Efficient Unlimited Context Language Modeling [70.9] 選択状態空間モデル(SSM)であるMambaとSliding Window Attention(SWA)を組み合わせた単純なハイブリッドアーキテクチャであるSambaを提案する。
Sambaは特定のシーケンスを選択的にリカレントなシークレット状態に圧縮し、最近の記憶をアテンション機構で正確にリコールする能力を維持している。
私たちはSambaを3.8Bのパラメータに拡張し、3.2Tのトレーニングトークンを使用し、様々なベンチマークで最先端モデルよりも大幅に優れていることを示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:27:49 GMT)
VideoGen-of-Thought: A Collaborative Framework for Multi-Shot Video Generation [70.6] 現在の世代モデルは短いクリップを生成するのに優れていますが、マルチショット映画のようなビデオを作るのに苦戦しています。
マルチショットビデオ生成に特化して設計された協調学習不要なアーキテクチャであるVideoGen-of-Thought (VGoT)を提案する。
我々の実験は、VGoTが高品質でコヒーレントなマルチショットビデオを作成する際に、既存のビデオ生成方法を上回ることを実証している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:33:50 GMT)
Is Large-Scale Pretraining the Secret to Good Domain Generalization? [69.8] マルチソース・ドメイン・ジェネリゼーション(Multi-Source Domain Generalization, DG)は、複数のソース・ドメインをトレーニングし、未確認のターゲット・ドメインに対して高い分類性能を達成するタスクである。
最近の手法では、Webスケールの事前訓練されたバックボーンの堅牢な機能と、ソースデータから学んだ新機能を組み合わせることで、ベンチマーク結果を劇的に改善している。
評価されたDGメソッドはすべてDomainBed-OOPで苦労し、最近のメソッドはDomainBed-IPで優れています。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:43:11 GMT)
The PRISM Alignment Dataset: What Participatory, Representative and Individualised Human Feedback Reveals About the Subjective and Multicultural Alignment of Large Language Models [67.4] 我々は,75か国から1500人の多様な参加者の社会デマトグラフィーを,21大言語モデル(LLM)を用いた8,011のライブ会話において,文脈的嗜好ときめ細かいフィードバックにマッピングした。
PRISMでは、(i)より広い地理的・人口的なフィードバックへの参加、(ii)2つの国(UK, US)の国勢調査表現型サンプル、(iii)詳細な参加者プロファイルにリンクし、個人化とサンプルアーティファクトの帰属を許可する個別評価に寄与する。
我々はPRISMを3つのケーススタディで使用し、人間がどのアライメントデータを提供するかを慎重に検討する必要があることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:18:10 GMT)
AV-Odyssey Bench: Can Your Multimodal LLMs Really Understand Audio-Visual Information? [65.5] マルチモーダルな大言語モデル(MLLM)は、視覚とオーディオのモダリティを含む機能を拡張した。
提案したDeafTestは、MLLMが人間にとって簡単なタスクとよく戦っていることを示している。
AV-Odyssey Benchは、これらのMLLMが真にオーディオ視覚情報を理解できるかどうかを評価するために設計された総合的なオーディオ視覚ベンチマークである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:41:23 GMT)
MetaShadow: Object-Centered Shadow Detection, Removal, and Synthesis [64.0] シャドウは画像編集アプリケーションでは過小評価されるか無視されることが多く、編集結果のリアリズムが制限される。
本稿では,自然画像中の影の検出・除去・制御が可能な3-in-one多元性フレームワークであるMetaShadowを紹介する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:04:42 GMT)
LLMForecaster: Improving Seasonal Event Forecasts with Unstructured Textual Data [63.8] 本稿では,非構造化意味情報と文脈情報と履歴データを組み込むために,大規模言語モデルを微調整した新しい予測ポストプロセッサを提案する。
産業規模の小売アプリケーションでは, ホリデードリブン需要の急激な上昇にともなう数種類の製品に対して, 本手法が統計的に有意な改善を予測できることが実証された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:18:42 GMT)
Stratified Prediction-Powered Inference for Hybrid Language Model Evaluation [62.2] 予測駆動推論(英: Prediction-powered Inference, PPI)は、人間ラベル付き限られたデータに基づいて統計的推定を改善する手法である。
我々はStratPPI(Stratified Prediction-Powered Inference)という手法を提案する。
単純なデータ階層化戦略を用いることで,基礎的なPPI推定精度を大幅に向上できることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:59:32 GMT)
Future of Information Retrieval Research in the Age of Generative AI [61.6] 情報検索(IR)の急速に発展する分野では、大規模言語モデル(LLM)のような生成AI技術の統合が、情報の検索やインタラクションの方法を変えつつある。
このパラダイムシフトを認識したビジョンワークショップが2024年7月に開催され、生成AI時代のIRの将来について議論した。
本報告は、潜在的に重要な研究トピックとしての議論の要約を含み、学術、産業実践家、機関、評価キャンペーン、資金提供機関の推薦リストを含む。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:01:48 GMT)
InstantSwap: Fast Customized Concept Swapping across Sharp Shape Differences [60.1] InstantSwapはシャープな形状の相違を高速で処理することを目的とした新しいCSS手法である。
背景整合性のために、スワップ処理中にbboxの外側の勾配を除去する。
フォアグラウンド整合性には、ソースとターゲットの両方の概念に意味情報を注入するクロスアテンション機構を用いる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:16:54 GMT)
AccDiffusion v2: Towards More Accurate Higher-Resolution Diffusion Extrapolation [59.9] 拡散モデルは、予測分解能が事前訓練された分解能と異なる場合、厳しい物体反復と局所歪みに悩まされる。
本稿では,AccDiffusion v2を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:44:35 GMT)
MedTet: An Online Motion Model for 4D Heart Reconstruction [59.7] 本研究は, 術後の軽度データから3次元心臓運動を再構築するための新しいアプローチを提案する。
既存の方法では、フル3次元の体積像から3次元の臓器のジオメトリーを正確に再構築することができる。
このような部分的データから3次元運動を再構築するための汎用的なフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:18:33 GMT)
Knowledge-Enhanced Conversational Recommendation via Transformer-based Sequential Modelling [58.7] まず,トランスフォーマーをベースとした逐次的対話推薦手法TSCRを提案し,会話の逐次的依存関係をモデル化する。
次に,TSCRの知識グラフ拡張版であるTSCRKGを提案する。
実験の結果,TSCRモデルは最先端のベースラインを著しく上回ることがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:20:56 GMT)
VISION-XL: High Definition Video Inverse Problem Solver using Latent Image Diffusion Models [58.5] 本稿では,遅延画像拡散モデルを用いて高精細ビデオ逆問題を解決するためのフレームワークを提案する。
提案手法は遅延空間拡散モデルを用いて,映像品質と解像度の向上を実現する。
従来の手法とは異なり,本手法では複数のアスペクト比をサポートし,1つのGPU上で2.5分以内でHD解像度の再構成を行う。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:18:25 GMT)
LayoutVLM: Differentiable Optimization of 3D Layout via Vision-Language Models [57.9] オープン・ユニバース3Dレイアウト生成は、言語命令で条件付けられたラベルのない3Dアセットをアレンジする。
大規模言語モデル(LLM)は、物理的に妥当な3Dシーンの生成と入力命令の遵守に苦慮している。
本稿では,視覚言語モデルのセマンティック知識を活用するフレームワークとシーンレイアウト表現であるLayoutVLMを紹介する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:15:04 GMT)
Decision Mamba: A Multi-Grained State Space Model with Self-Evolution Regularization for Offline RL [57.2] 決定マンバ(Decision Mamba)は、自己進化的な政策学習戦略を持つ、新しい多粒状態空間モデルである。
雑音性軌道上における過度に適合する問題を緩和するために,進行正則化を用いて自己進化政策を提案する。
この政策は、自身の過去の知識を用いて、準最適動作を洗練させ、ノイズの多い実演における堅牢性を高めることで進化する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:48:16 GMT)
Motion Prompting: Controlling Video Generation with Motion Trajectories [57.0] スパースもしくは高密度なビデオ軌跡を条件とした映像生成モデルを訓練する。
ハイレベルなユーザリクエストを,詳細なセミセンスな動作プロンプトに変換する。
我々は、カメラや物体の動き制御、画像との「相互作用」、動画転送、画像編集など、様々な応用を通してアプローチを実証する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:59:56 GMT)
Synergistic Development of Perovskite Memristors and Algorithms for Robust Analog Computing [56.0] 本稿では,ペロブスカイト・メムリスタの製作を同時に最適化し,ロバストなアナログDNNを開発するための相乗的手法を提案する。
BO誘導ノイズインジェクションを利用したトレーニング戦略であるBayesMultiを開発した。
我々の統合されたアプローチは、より深くより広いネットワークでのアナログコンピューティングの使用を可能にし、最大100倍の改善を実現します。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:20:08 GMT)
CubeFormer: A Simple yet Effective Baseline for Lightweight Image Super-Resolution [55.9] 軽量画像超解像(SR)法は、解像度を高め、軽量ニューラルネットワークを用いて画像の詳細を復元することを目的としている。
分析の結果,これらの手法は,特徴表現や細部回復に悪影響を及ぼす制約付き特徴多様性によって妨げられていることが明らかとなった。
そこで我々は,包括的情報集約を完了させることにより,特徴の豊かさを高めるために,CubeFormerというシンプルで効果的なベースラインを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:02:26 GMT)
SUSY Quantum Mechanics, (non)-Analyticity and $\ldots$ Phase Transitions [55.2] これは、結合定数の不連続性はエネルギーと固有関数の両方で起こりうるという1D$ Schr"odinger 方程式を解析することによって示される。
エネルギーと結合定数の間に存在するこれらの不連続性は、(i)不連続エネルギー(第1次相転移に類似)、(ii)エネルギーが連続である間、エネルギーにおける不連続第一微分の3つのタイプのみである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:21:05 GMT)
Progress-Aware Video Frame Captioning [55.2] 本稿では,アクションシーケンス内の微細な時間的ダイナミクスをキャプチャするキャプションモデルであるProgressCaptionerを提案する。
我々は、トレーニングをサポートするFrameCapデータセットと、キャプションの品質を評価するFrameCapEvalベンチマークを開発する。
結果は、ProgressCaptionerが主要なキャプションモデルを大幅に上回っていることを示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:21:28 GMT)
PerLDiff: Controllable Street View Synthesis Using Perspective-Layout Diffusion Models [55.1] 本稿では、3次元幾何学的情報を完全に活用した効果的なストリートビュー画像生成手法であるPerLDiffを紹介する。
この結果から,我々のPerLDiffはNuScenesおよびKITTIデータセットの生成精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:11:21 GMT)
PanopticNeRF-360: Panoramic 3D-to-2D Label Transfer in Urban Scenes [54.5] 粗い3Dアノテーションとノイズの多い2Dセマンティックキューを組み合わせて高品質なパノプティカルラベルを生成する新しいアプローチであるPanopticNeRF-360を提案する。
実験では,KITTI-360データセット上でのラベル転送方式に対するPanopticNeRF-360の最先端性能を実証した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:21:58 GMT)
OmniCreator: Self-Supervised Unified Generation with Universal Editing [53.4] 我々はOmniCreatorを紹介した。OmniCreatorはテキストプロンプトで統一された(画像+ビデオ)生成と編集を行うことができるフレームワークである。
OmniCreatorは、自己管理的な方法で生成的および普遍的な編集機能を取得する。
私たちは、OmniCreatorを真に統一されたフレームワークにするのと同じ機能をイメージに拡張していることに気付きました。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:10:19 GMT)
Towards Fair RAG: On the Impact of Fair Ranking in Retrieval-Augmented Generation [53.3] 本稿では,公正ランキングと統合されたRAGシステムの最初の体系的評価について述べる。
本稿では,RAGシステムで活用されるランキングにおいて,各項目の公正な露出を測定することに焦点を当てる。
以上の結果から,RAGシステムは高い世代品質を維持でき,多くの場合,従来のRAGシステムよりも優れていたことが示唆された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:23:53 GMT)
From Seconds to Hours: Reviewing MultiModal Large Language Models on Comprehensive Long Video Understanding [52.7] 視覚的エンコーダを備えた多モード大言語モデル(LLM)は、視覚的理解タスクにおいて有望な性能を示した。
本稿では、静止画像と短い映像の理解と比較して、長いビデオ理解によって生じる実質的な違いと固有の課題に焦点を当てる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:56:52 GMT)
Methods with Local Steps and Random Reshuffling for Generally Smooth Non-Convex Federated Optimization [52.6] 非マシーン学習問題は通常、標準的な滑らかさの仮定に従わない。
本稿では,ローカルステップ,クライアントの部分的参加,ランダムランダムリシャッフルによる新しい手法の提案と解析を行う。
我々の理論は、標準的な滑らかな問題に対する既知の結果と一致している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:20:56 GMT)
ImageFolder: Autoregressive Image Generation with Folded Tokens [51.8] トークン長の増大は、画像再構成の品質を改善するための一般的なアプローチである。
トークン長に関する復元と生成品質の間にはトレードオフがある。
本稿では,自己回帰モデルにおいて折り畳み可能な空間整列型画像トークンを提供するセマンティック・トークンライザであるイメージを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:32:52 GMT)
Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling [51.4] 双方向デコーディング(BID)は、クローズドループ操作で動作チャンキングをブリッジするテスト時間推論アルゴリズムである。
BIDは、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:53:58 GMT)
Sustainable Self-evolution Adversarial Training [51.3] 対戦型防衛モデルのための持続的自己進化支援訓練(SSEAT)フレームワークを提案する。
本研究は,様々な種類の対角的事例から学習を実現するために,連続的な対向防衛パイプラインを導入する。
また,より多様で重要な再学習データを選択するために,逆データ再生モジュールを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:41:11 GMT)
Monocular Lane Detection Based on Deep Learning: A Survey [51.2] 車線検出は自律運転認識システムにおいて重要な役割を果たす。
ディープラーニングアルゴリズムが普及するにつれて、それらに基づく単眼車線検出法は優れた性能を示した。
本稿では, 成熟度の高い2次元車線検出手法と開発途上国の3次元車線検出技術の両方を網羅して, 既存手法の概要を概説する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:05:50 GMT)
QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds [51.1] ペットに匹敵するアジリティで多様なコマンドに従うように設計されたQuadrupedGPTを紹介します。
エージェントは多種多様なタスクを処理し,複雑な指示を行う能力を示し,多種多様四重化エージェントの開発に向けた重要な一歩である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:49:24 GMT)
Agri-LLaVA: Knowledge-Infused Large Multimodal Assistant on Agricultural Pests and Diseases [49.8] 農業分野における最初のマルチモーダル・インストラクション・フォロー・データセットを構築した。
このデータセットは、約40万のデータエントリを持つ221種類以上の害虫と病気をカバーしている。
本稿では,農業用マルチモーダル対話システムであるAgri-LLaVAを開発するための知識注入型学習手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:34:23 GMT)
GFreeDet: Exploiting Gaussian Splatting and Foundation Models for Model-free Unseen Object Detection in the BOP Challenge 2024 [49.7] 本稿では,提案手法であるGFreeDetの技術的詳細について述べる。BOP 2024 Challengeにおいて,モデルフリーの未確認物体検出トラックに対して,ガウススプラッティングとビジョンファウンデーションモデルを利用する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:28:06 GMT)
SparseLGS: Sparse View Language Embedded Gaussian Splatting [49.2] 本研究では,3次元シーン理解の課題に対して,ポーズレスでスパースなビュー入力画像を用いたSparseLGSを提案する。
提案手法は,ポーズレスおよびスパース入力を扱うための学習ベース密度ステレオモデルと,セマンティック不整合問題に対処する3段階領域マッチング手法を利用する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:18:56 GMT)
Realistic Surgical Simulation from Monocular Videos [49.1] 本稿では,手軽な手術映像からリアルな手術シミュレーションを自動実行することの課題に対処する。
本稿では,これらの制約を克服する新しい自動シミュレーションシステムであるSurgiSimを提案する。
様々な手術シナリオと相互作用の実験は、SurgiSimが軟組織の現実的なシミュレーションを行う能力を示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:32:41 GMT)
A Probabilistic Perspective on Unlearning and Alignment for Large Language Models [49.0] 大規模言語モデル(LLM)における最初の形式的確率的評価フレームワークを紹介する。
モデルの出力分布に関する高い確率保証を持つ新しい指標を導出する。
私たちのメトリクスはアプリケーションに依存しないので、デプロイ前にモデル機能についてより信頼性の高い見積を行うことができます。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:31:41 GMT)
Diffusion Implicit Policy for Unpaired Scene-aware Motion Synthesis [48.7] 本研究では,シーン認識動作合成のための統合フレームワークDIPを提案する。
本フレームワークでは,トレーニング中の動作合成から人間とシーンのインタラクションを分離する。
本研究の枠組みは, 切削工法よりも動作の自然性や相互作用の可視性が高いことを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:34:41 GMT)
VideoICL: Confidence-based Iterative In-context Learning for Out-of-Distribution Video Understanding [48.3] ビデオ大マルチモーダルモデル(LMM)は、ビデオ理解と推論能力を大幅に改善した。
彼らのパフォーマンスは、トレーニングデータで不足しているOOD(out-of-distriion)タスクに低下する。
OODデータセットの微調整のような従来の手法は、高い計算コストのために実用的ではない。
OODタスクのための新しいビデオインコンテキスト学習フレームワークであるVideoICLを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:54:43 GMT)
Concept Replacer: Replacing Sensitive Concepts in Diffusion Models via Precision Localization [48.2] 大規模な拡散モデルは高品質な画像を生成するが、しばしば性的に明示的なコンテンツや暴力的なコンテンツのような望ましくないコンテンツを生成する。
本研究では,非対象領域に影響を及ぼすことなく,特定の概念を除去することが可能な拡散モデルにおいて,対象概念を置き換えるための新しい手法を提案する。
本手法では,最小限のラベル付きデータを必要とする数発の学習で学習し,目標概念を正確に識別する専用概念ローカライザを提案する。
特定領域内では,DPCA(Dual Prompts Cross-Attention)モジュールが導入された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:25:48 GMT)
DP-2Stage: Adapting Language Models as Differentially Private Tabular Data Generators [47.9] 差分プライベートデータ生成のための2段階微調整フレームワークを提案する。
最初のステージでは、擬似データセットで非プライベートな微調整が行われ、続いてプライベートデータセットでDP微調整が行われる。
提案手法は,DPコンテキストにおいて直接微調整されたLCMと比較して,様々な設定やメトリクスにおける性能向上を図っている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:10:09 GMT)
Offline Stochastic Optimization of Black-Box Objective Functions [47.7] 複雑なブラックボックス関数の高価なアクティブクエリを避けるために、既存のデータを活用することが不可欠である。
ブラックボックスの目的と制御不能な不確実性の両方に対処するオフラインBBO(SOBBO)を導入する。
シミュレーション実験により,本手法が実環境と実環境の両方のタスクに与える影響を実証した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:20:30 GMT)
Normalizing self-supervised learning for provably reliable Change Point Detection [47.6] 変化点検出法 (CPD) は入力データストリームの分布の急激な変化を特定することを目的としている。
従来の教師なしCDD技術は、しばしば強い仮定に依存して、重大な制限に直面している。
本研究は,表現学習の表現力と従来のCPD手法の基盤性を統合する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:29:54 GMT)
Explainable and Interpretable Multimodal Large Language Models: A Comprehensive Survey [46.6] 大規模言語モデル(LLM)とコンピュータビジョン(CV)システムは、自然言語理解と視覚処理の進歩を促進する。
これらの技術の収束がマルチモーダルAIの台頭を触媒し、テキスト、ビジョン、オーディオ、ビデオモダリティにまたがるよりリッチでクロスモーダルな理解を可能にした。
マルチモーダル大規模言語モデル(MLLM)は、画像テキスト生成、視覚的質問応答、相互モーダル検索といったタスクにおいて印象的な機能を示す強力なフレームワークとして登場した。
これらの進歩にもかかわらず、MLLMの複雑さと規模は解釈可能性と説明可能性において大きな課題をもたらし、確立に不可欠である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:54:31 GMT)
Molecular optomechanics with atomic antennas [45.0] ダイヤモンド中のゲルマニウム空孔欠陥は、励起過程を効率的に仲介することができる。
低温では、GeVは低散逸を示し、インシデントフィールドによって効率よく占有される。
原子アンテナを用いたラマン散乱は従来のラマン散乱と区別できることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:00:03 GMT)
Leveraging Large Language Models for Comparative Literature Summarization with Reflective Incremental Mechanisms [45.0] ChatCiteは、比較文学要約を生成するために大きな言語モデル(LLM)を利用する新しい方法である。
注釈付き要約付き1000の研究論文からなるカスタムデータセットCompLit-LongContext上でChatCiteを評価する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:09:36 GMT)
Geometric bound on structure factor [45.0] 量子幾何学は静的構造因子$S(q)$における$q4$項上の有界性を示す。
この境界を飽和するバンドはラプラス方程式の形式を満たすので、それらをテクスムロンバンドと呼ぶ。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:30:36 GMT)
A Generative Model of Symmetry Transformations [44.9] 我々はデータの近似対称性を明示的に捉えることを目的とした生成モデルを構築した。
我々は、アフィンおよび色変換の下で対称性を捕捉する能力を実証的に実証した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:15:00 GMT)
FullStack Bench: Evaluating LLMs as Full Stack Coders [44.8] FullStack Benchは、幅広いアプリケーションドメインを含むフルスタックプログラミングに焦点を当てている。
FullStack Benchのマルチ言語プログラミング機能を評価するために,16の広く使用されているプログラミング言語から実世界の命令とそれに対応する単体テストケースを設計する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:55:24 GMT)
SceneFactor: Factored Latent 3D Diffusion for Controllable 3D Scene Generation [44.4] SceneFactorは、大規模な3Dシーン生成のための拡散ベースのアプローチである。
制御可能な生成と手間のかかる編集を可能にする。
提案手法は,効率的な編集が可能な高忠実度3次元シーン合成を実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:32:05 GMT)
GNN-based Auto-Encoder for Short Linear Block Codes: A DRL Approach [43.2] 深層強化学習(DRL)とグラフニューラルネットワーク(GNN)をコード設計に統合する。
エッジ重み付きGNN(EW-GNN)デコーダを提案する。
DRLベースのコードデザイナとEW-GNNデコーダの反復的な共同訓練を行い、エンドエンドエンコーディングとデコード処理を最適化する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:25:14 GMT)
Optimizing Plastic Waste Collection in Water Bodies Using Heterogeneous Autonomous Surface Vehicles with Deep Reinforcement Learning [43.2] 本稿では,多種多面体車両を用いた情報経路計画のためのモデルフリー深部強化学習フレームワークを提案する。
このシステムは、スカウトと清掃員の2つのチームを雇用している。これらのチーム間の調整は、深い強化アプローチによって達成される。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:32:02 GMT)
Large Language Model-Brained GUI Agents: A Survey [42.8] マルチモーダルモデルはGUI自動化の新しい時代を支えてきた。
彼らは自然言語理解、コード生成、視覚処理において例外的な能力を示した。
これらのエージェントはパラダイムシフトを表しており、ユーザーは単純な会話コマンドで複雑なマルチステップタスクを実行できる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:16:27 GMT)
Efficient Eigenstate Preparation in an Integrable Model with Hilbert Space Fragmentation [42.4] 量子回路を用いたスピン鎖の固有状態の合成について検討する。
我々は、粒子間の相互作用が十分に単純である相互作用モデルにおいても、成長の成果が得られていることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:06:20 GMT)
BayLing 2: A Multilingual Large Language Model with Efficient Language Alignment [42.2] 本稿では,ハイソース言語から低ソース言語へ効率的に生成能力と知識を伝達するBayLing 2を紹介する。
100以上の言語にまたがる多言語翻訳では、BayLingは同様のスケールのオープンソースモデルよりも優れたパフォーマンスを示している。
BayLingのデモ、ホームページ、コード、モデルが利用可能だ。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:17:41 GMT)
Non-resonant electric quantum control of individual on-surface spins [41.9] 量子制御技術は、異なる量子系の特性を操作し、活用する上で重要な役割を果たしている。
本研究では,Landau-Zener-St"uckelberg-Majorana (LZSM) 干渉計を用いて,単一表面原子スピン上の量子制御を実現することを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:20:47 GMT)
Composing Open-domain Vision with RAG for Ocean Monitoring and Conservation [41.9] 本稿では, 海洋アプリケーションにおける画像解析と映像解析のためのレジリエントでスケーラブルなソリューションを提案する。
我々は,本手法を,ビデオ漁船から魚を分類する予備的応用を通じて検証する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:34:42 GMT)
Scaling Laws for Multilingual Language Models [41.6] 多言語スケーリングの研究における主要な課題は、言語間移動による個々の言語性能の分析が困難であることである。
本稿では,各言語群に対するクロスエントロピー損失が,それぞれのサンプリング比でのみ決定されるという仮説を導入し,検証する。
性能とデータセットサイズ,モデルサイズ,サンプリング比率を関連づける,ゆるい関係を導出する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:44:35 GMT)
What should a neuron aim for? Designing local objective functions based on information theory [41.4] バイオインスパイアされた局所学習目標を設計することで、自己組織化された人工ニューロンをどのように達成できるかを示す。
これらの目標は、情報理論の最近の拡張である部分情報分解を用いてパラメータ化される。
我々の研究は、地域学習戦略の原則的情報理論の基礎を推進している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:45:46 GMT)
Spiking GS: Towards High-Accuracy and Low-Cost Surface Reconstruction via Spiking Neuron-based Gaussian Splatting [41.3] 3Dガウシアン・スプレイティングは、数分で3Dシーンを再構築することができる。
表面再構成精度の進歩にもかかわらず、再建された結果は依然としてバイアスを示し、保存とトレーニングの非効率さに悩まされている。
本稿は,低効率部品の統合に起因する非効率性の原因と復元バイアスについて,異なる観察結果を提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:41:32 GMT)
DataLab: A Unifed Platform for LLM-Powered Business Intelligence [41.2] 我々は,ワンストップLLMベースのエージェントフレームワークと拡張計算ノートブックインターフェースを統合した統合BIプラットフォームであるDataLabを紹介する。
DataLabは、LLMアシストとユーザカスタマイズを単一の環境内で組み合わせることで、さまざまなデータロールに対して幅広いBIタスクをサポートする。
大規模な実験により、DataLabは人気のある研究ベンチマークでさまざまなBIタスクの最先端のパフォーマンスを達成している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:47:15 GMT)
Mixture of Physical Priors Adapter for Parameter-Efficient Fine-Tuning [41.2] 本稿では,ネットワークの重み付けを物理的に組み合わせてモデル化する手法を提案する。
熱拡散、波動伝播、ポアソンの定常方程式の3つの基礎方程式がそれぞれ固有のモデリング特性に寄与する。
MoPPAはPEFTの精度を最大2.1%向上させる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:00:34 GMT)
Sibyl: Empowering Empathetic Dialogue Generation in Large Language Models via Sensible and Visionary Commonsense Inference [41.0] 感性とビジョンコモンセンス知識(Sibyl)という革新的な枠組みを提示する。
それは、より共感的な反応を引き出すことを目的として、すぐに続く対話に集中するように設計されている。
実験結果から,LLMにコモンセンス知識を習得するためのパラダイムを取り入れることで,その応答の質を総合的に向上することが示された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:57:33 GMT)
GAVEL: Generating Games Via Evolution and Language Models [40.9] 我々は,Ludiiゲーム記述言語における新規ゲームの生成について検討する。
我々は、コードとして表現されたゲームやメカニクスをインテリジェントに変更し、再結合するモデルを訓練する。
生成されたゲームのサンプルは、Ludiiポータルからオンラインでプレイすることができる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:33:06 GMT)
Instruct-SkillMix: A Powerful Pipeline for LLM Instruction Tuning [40.6] Instruct-SkillMixは、多様な高品質なSFTデータを作成するための自動化アプローチである。
LLaMA-3-8B-BaseはAlpacaEval 2.0で42.76%の勝利率を達成した。
Instruct-SkillMixパイプラインは柔軟性があり、他の設定に適応できる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:01:23 GMT)
Does Few-Shot Learning Help LLM Performance in Code Synthesis? [40.4] この研究は、ほとんどのコード生成プロンプトにあるいくつかの例に焦点を当てている。
本研究は,少数例を選択するための2つのアプローチ,モデルフリー手法CODEEXEMPLAR-FREE,モデルベース手法CODEEXEMPLAR-BASEDを提案する。
どちらの方法も、人気のあるHumanEval+コーディングベンチマークでCodeLlamaのコーディング能力を大幅に改善した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:19:40 GMT)
Amodal Depth Anything: Amodal Depth Estimation in the Wild [39.3] アモーダル深度推定は、シーン内の物体の閉塞された(見えない)部分の深さを予測することを目的としている。
本研究では,様々な自然画像におけるモデル一般化を改善するために,相対的深度予測に焦点をあてて,野生におけるアモーダル深度推定の新しい定式化を提案する。
本稿では,Depth Anything V2に基づく決定論的モデルであるAmodal-DAV2と,条件付きフローマッチングの原理を統合する生成モデルであるAmodal-DepthFMの2つの補完的フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:56:38 GMT)
Super-resolution in disordered media using neural networks [39.1] 強散乱媒体における環境媒体のグリーン関数を正確に推定するために,大規模で多様なデータセットを利用する手法を提案する。
この現象は超解像としても知られ、周囲散乱媒質が物理的イメージアパーチャを効果的に増強するため起こる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:39:45 GMT)
Demystifying Language Model Forgetting with Low-rank Example Associations [38.9] 大規模言語モデル(LLM)は、微調整時に上流データを忘れることに悩まされる。
我々は、言語モデリングや微調整後の命令チューニングの上流の例で発生する忘れを実証的に分析する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:03:25 GMT)
AtomR: Atomic Operator-Empowered Large Language Models for Heterogeneous Knowledge Reasoning [38.7] AtomRは、新しい異種知識推論フレームワークである。
複雑な問題を3つの原子知識演算子の組み合わせに分解する。
AtomRは3つの単一ソースと2つのマルチソース推論ベンチマークで最先端のベースラインを大幅に上回る。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:00:18 GMT)
WSI-LLaVA: A Multimodal Large Language Model for Whole Slide Image [38.0] ギガピクセルのWSI理解のためのフレームワークであるWSI-LLaVAを3段階のトレーニングアプローチで紹介する。
実験の結果、WSI-LLaVAはすべての能力範囲で既存のモデルより優れています。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:57:24 GMT)
Plug-and-Play Half-Quadratic Splitting for Ptychography [37.9] Ptychographyは、位相検索技術を用いて複雑な画像の再構成を行うコヒーレント回折イメージング法である。
計算量が多く、ノイズに非常に敏感で、特に照明の重なりがある。
本稿では,データ駆動型デノイザを暗黙の先行として統合するフレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:41:18 GMT)
Failure Probability Estimation for Black-Box Autonomous Systems using State-Dependent Importance Sampling Proposals [37.6] 失敗の確率を推定することは、安全クリティカルな自律システムを開発するための重要なステップである。
モンテカルロサンプリングのような直接推定法は、これらの系における故障の希少性のため、しばしば非現実的である。
これらの制約に対処するための適応的重要度サンプリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:28:58 GMT)
GenMix: Effective Data Augmentation with Generative Diffusion Model Image Editing [37.5] 本稿では、一般化可能なプロンプト誘導型生成データ拡張手法であるGenMixを紹介する。
本手法は、画像編集を利用して、カスタム条件付きプロンプトに基づく拡張画像を生成する。
提案手法は、非現実的な画像とラベルの曖昧さを緩和し、結果のモデルの性能と対角的堅牢性を向上する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:45:34 GMT)
Composing Global Optimizers to Reasoning Tasks via Algebraic Objects in Neural Nets [37.2] 二次活性化と損失$L$の2層ニューラルネットワークに対する解空間のリッチ代数構造を証明した。
私たちはこのフレームワークをCoGO(Composing Globals)として作りました。
2層ネットワークの隠蔽ノード数に対する重み空間は半環代数構造を備えており、最適化される損失関数は単項ポテンシャルから成り立っていることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:19:54 GMT)
CultureLLM: Incorporating Cultural Differences into Large Language Models [36.7] CultureLLMは、大きな言語モデルに文化的差異を組み込むためのコスト効率の良いソリューションである。
我々は、リッチで低リソースな言語をカバーする9つの文化に対して、文化固有のLLMと1つの統一モデル(CultureLLM-One)を微調整する。
我々の人間による研究は、生成されたサンプルが元のサンプルと意味的に等価であることを示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:52:34 GMT)
Dual Exposure Stereo for Extended Dynamic Range 3D Imaging [36.6] 拡張ダイナミックレンジ3Dイメージングのためのデュアル露光ステレオを提案する。
この方法はデュアル露光を調整し、シーンDRがカメラDRを超えると変色する。
得られたデュアル露光ステレオ画像から,モーションアウェアなデュアル露光ステレオネットワークを用いて深度を推定する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:15:41 GMT)
TimeWalker: Personalized Neural Space for Lifelong Head Avatars [36.4] 私たちはTimeWalkerを紹介します。これは、現実的でフルスケールの3Dアバターを生涯のスケールでモデル化する新しいフレームワークです。
TimeWalkerは、さまざまなライフステージ上の非構造化データ収集から、個人の包括的アイデンティティを構築する。
そこで,TimeWalkerの非結合次元におけるアバターの再構成とアニメーションを現実的なレンダリング効果で実現した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:36:38 GMT)
An Information-Theoretic Analysis of Thompson Sampling for Logistic Bandits [36.4] 本稿では,ロジスティックバンディット問題に対するトンプソンサンプリングアルゴリズムの性能について検討する。
最適報酬と実報酬の2乗差の比として定義される情報比を解析する。
我々は$O(dsqrtT log(beta T/d))$の後悔のバウンダリを得る。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:55:41 GMT)
Multi-Granularity Video Object Segmentation [36.1] 本稿では,MUG-VOS(Multigranularity Video Object segmentation)データセットを提案する。
我々は,正当性および非正当性の両方をトラッキングするトレーニングセットを自動的に収集し,信頼性の高い評価のために人手による検査セットをキュレートした。
さらに,MUG-VOSデータセットを用いたメモリベースのマスク伝搬モデル(MMPM)を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:42:22 GMT)
T-REG: Preference Optimization with Token-Level Reward Regularization [35.1] 人間のフィードバックからの強化学習(RLHF)は、大きな言語モデルと人間の価値の整合に不可欠である。
最近の手法ではトークンレベルの報酬を導入してこの制限に対処しようと試みている。
本稿では,トークンレベルの報酬を優先最適化に利用する新しい手法であるトークンレベルの報酬正規化(T-REG)を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:56:07 GMT)
A Single-Loop Gradient Descent and Perturbed Ascent Algorithm for Nonconvex Functional Constrained Optimization [35.0] 制約のない不等式問題は、マルチクラスネイマンオラクルのような多くの機械学習問題をモデル化するために用いられる。
このような緩やかな規則性の条件下では、値損失の交互化と制約違反の低減のバランスをとることは困難である。
本稿では,新しい不等式制約問題アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:24:23 GMT)
It Takes Two: Real-time Co-Speech Two-person's Interaction Generation via Reactive Auto-regressive Diffusion Model [34.9] 会話中の2文字の動的動きを合成するための音声駆動自動回帰システムを提案する。
我々の知る限りでは、オンライン方式で2文字の対話型フルボディモーションを生成できる最初のシステムである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:31:44 GMT)
Interventional Causal Discovery in a Mixture of DAGs [34.8] 本稿では,複数の因果系が支配する変数間の因果相互作用の学習における介入の役割について述べる。
これは、真のエッジと呼ばれる混合物の少なくとも1つの成分DAGに存在するエッジを特定することを目的としている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:22:40 GMT)
CPRM: A LLM-based Continual Pre-training Framework for Relevance Modeling in Commercial Search [34.1] CPRMは、大規模言語モデル(LLM)の継続的な事前訓練のために設計されたフレームワークである
本フレームワークは3つのモジュールから構成される: 1) クエリとマルチフィールドアイテムを併用してドメイン知識を強化する,2) コンテキスト内事前学習を適用する,3) 関連するドメイン知識とバックグラウンド情報を生成する,という3つのモジュール。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:37:03 GMT)
Nemotron-CC: Transforming Common Crawl into a Refined Long-Horizon Pretraining Dataset [33.2] 精度とデータ量とのトレードオフを改善する方法を示します。
15Tトークンのためにトレーニングされた8Bパラメータモデルで、うち7.2Tは、Llama 3.1 8Bモデルよりも優れている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:28:50 GMT)
Exploring Frequency-Inspired Optimization in Transformer for Efficient Single Image Super-Resolution [32.3] クロスリファインメント適応型特徴変調トランス(CRAFT)
CRAFTの効率向上を目的とした周波数誘導後量子化(PTQ)手法を提案する。
以上の結果より, CRAFTは現状の方法よりも優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:57:43 GMT)
Medical Multimodal Foundation Models in Clinical Diagnosis and Treatment: Applications, Challenges, and Future Directions [32.2] 近年の深層学習の進歩は臨床診断と治療の分野に革命をもたらした。
医療マルチモーダル・ファンデーション・モデル (MMFM) は幅広い臨床業務に適応している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:50:19 GMT)
Electron Beam Characterization via Quantum Coherent Optical Magnetometry [31.9] 電子ビームの位置と電流を決定するための量子光学に基づく検出法を提案する。
レーザビームを横切る偏光回転角を測定することで、磁場の2次元投影を再現し、それを用いて電子ビームの位置、大きさ、全電流を決定する。
この技術は、粒子物理学および核物理学研究の加速器で使用される荷電粒子ビームの非侵襲的な評価のためのユニークなプラットフォームを提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:56:29 GMT)
Analyzing Nobel Prize Literature with Large Language Models [31.6] 本研究では,高度言語モデル(LLM),特にo1モデルの文芸分析における能力について検討する。
ハン・カンの「9章」、2024年の受賞者ジョン・フォッセの「友情」、2023年の受賞者ジョン・フォッセの2つのノーベル文学賞を受賞した短編小説に焦点を当て、AIが複雑な文学的要素と関わり得る程度について調査した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:19:36 GMT)
Time-Reversal Provides Unsupervised Feedback to LLMs [31.6] Time Reversed Language Models (TRLM) は、応答に条件付きでクエリをスコアし、生成することができる。
TRLMのスコアリングは,従来のクエリのフォワードスコアよりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:54:12 GMT)
GLM-4-Voice: Towards Intelligent and Human-Like End-to-End Spoken Chatbot [30.9] GLM-4-Voiceは、インテリジェントで人間らしく、エンド・ツー・エンドの音声チャットボットである。
中国語と英語の両方をサポートし、リアルタイムの音声会話に従事し、ユーザーの指示に応じて感情、イントネーション、発話速度、方言などの声のニュアンスを変化させる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:41:24 GMT)
The Cost of Consistency: Submodular Maximization with Constant Recourse [30.7] 特に,アルゴリズムが1ステップあたりの更新回数を最大で一定にした場合に達成可能な,最も有望な近似比を求める。
我々は、一般的な部分モジュラ函数に対して$tfrac23$の厳密な情報理論境界と、カバレッジ関数に対して$tfrac34$の改良された(かつ厳密な)境界を示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:06:07 GMT)
Efficient Model Compression Techniques with FishLeg [30.7] FishLegはFisher-Legendre(FishLeg)に基づく新しい二階刈り法である
FishLegの心臓部は、逆FIMの作用を補うメタラーニングアプローチである。
FishLegは,2つの共通ベースラインに対して高い,あるいは同等のパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:42:16 GMT)
Investigating the Contextualised Word Embedding Dimensions Specified for Contextual and Temporal Semantic Changes [30.6] 文脈型単語埋め込み(CWE)空間内の単語の意味的変化を符号化する意味認識型単語埋め込み(SCWE)。
どのようにして変化が埋め込み空間にエンコードされるのかは、まだ不明である。
文脈的および時間的意味変化ベンチマークにおいて、事前学習したCWEとそれらの微調整されたバージョンを比較した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:56:16 GMT)
WebRL: Training LLM Web Agents via Self-Evolving Online Curriculum Reinforcement Learning [30.4] 大規模言語モデル(LLM)は、特にWebベースのタスクにおいて、自律エージェントとして顕著な可能性を示している。
本稿では,オープン LLM を用いた高性能 Web エージェントの学習を目的とした,自己進化型オンラインカリキュラム強化学習フレームワーク WebRL を紹介する。
オープンなLlama-3.1およびGLM-4モデルをWebエージェントに変換するためにWebRLを適用した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:37:23 GMT)
MBA-RAG: a Bandit Approach for Adaptive Retrieval-Augmented Generation through Question Complexity [30.3] 本稿では,クエリの複雑性に基づいて最適な検索戦略を動的に選択する強化学習ベースのフレームワークを提案する。
提案手法は,検索コストを低減しつつ,複数のシングルホップおよびマルチホップデータセット上でのアート結果の新たな状態を実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:58:06 GMT)
Multi-student Diffusion Distillation for Better One-step Generators [29.8] マルチスチューデント蒸留(Multi-Student Distillation、MSD)は、条件付き教師拡散モデルを複数の単段階発生器に蒸留するフレームワークである。
MSDは、複数の蒸留された学生を訓練し、より小さいサイズで、したがってより高速な推論を可能にした。
4人の同じサイズの学生を用いて、MSDは単学生のベースラインの成績を著しく上回っている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:28:32 GMT)
How to Use Diffusion Priors under Sparse Views? [29.7] Inline Prior Guided Score Matching is proposed to provide visual supervision over sparse view in 3D reconstruction。
提案手法は,最先端の復元品質を実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:31:54 GMT)
MRP-LLM: Multitask Reflective Large Language Models for Privacy-Preserving Next POI Recommendation [29.6] 大規模言語モデル(LLM)は、次のPoint-of-Interest(POI)レコメンデーションに有望な可能性を示している。
プライバシ保護のための新しいマルチタスク反射型大規模言語モデル(MRP-LLM)を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:45:02 GMT)
HoloDrive: Holistic 2D-3D Multi-Modal Street Scene Generation for Autonomous Driving [29.3] 我々は,カメラ画像とLiDAR点雲を共同生成するフレームワークであるemphHoloDriveを提案する。
異種生成モデル間でBEV-to-Cameraおよびカメラ-to-BEV変換モジュールを用いる。
提案手法は,SOTA法に比べて,生成指標の点で顕著な性能向上をもたらす。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:14:39 GMT)
When Can LLMs Actually Correct Their Own Mistakes? A Critical Survey of Self-Correction of LLMs [29.3] 自己補正(Self-correction)は、LLMを用いて推論中に応答を精製することで、大きな言語モデル(LLM)からの応答を改善するアプローチである。
これまでの作業では,自己評価や外部からのフィードバックなど,さまざまなフィードバック源を用いたさまざまな自己補正フレームワークが提案されていた。
我々は幅広い論文を批判的に調査し、自己補正を成功させるために必要な条件について議論する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:14:06 GMT)
Can Open-source LLMs Enhance Data Synthesis for Toxic Detection?: An Experimental Study [29.2] 本研究では、有害なデータ合成のためのオープンソースのLCMの可能性について検討する。
我々はまず,複数のデータセットにまたがる有害なデータを生成するために,プロンプトエンジニアリングを用いて6つのオープンソースLLMの能力を検証した。
第2段階では、これらのモデルを微調整して、幻覚、データ重複、過剰適合といった課題に対処しながら、データ生成を改善する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:07:58 GMT)
Beyond Tree Models: A Hybrid Model of KAN and gMLP for Large-Scale Financial Tabular Data [28.3] TKGMLPは、浅いコルモゴロフ・アーノルドネットワークとGated Multilayer Perceptronを組み合わせた表型データのためのハイブリッドネットワークである。
我々は、TKGMLPを現実の信用スコアデータセットで検証し、最先端の結果を達成し、現在のベンチマークより優れています。
本稿では,財務データセットにおける数値的特徴の優位性に対処するために,数値的データのための新しい特徴符号化手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:38:07 GMT)
NüshuRescue: Revitalization of the endangered Nüshu Language with AI [28.3] N"ushuRescueは、最小限のデータで絶滅危惧言語上で大きな言語モデル(LLM)をトレーニングするために設計された、AI駆動のフレームワークである。
我々は,500文のN"ushu- Chinese parallel corpusであるNCGoldを開発した。
N"ushuRescueは50の文に対して48.69%の翻訳精度を達成し、異なる長さの98の漢文を新たに翻訳したNASilverを生成した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:38:31 GMT)
Understanding Particles From Video: Property Estimation of Granular Materials via Visuo-Haptic Learning [28.1] グラニュラー材料(GM)は日常生活においてどこにでも存在しており、特に農業や産業においてその性質を理解することも重要である。
本稿では,GMとの相互作用のビデオから粒子径と密度の相対値を推定する手法を提案する。
接触モデルにインスパイアされたビジュオ触覚学習フレームワークを用いて学習し,GMのプローブ描画におけるGM特性と視覚触覚データとの強い相関関係を明らかにする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:17:09 GMT)
Improving Language Transfer Capability of Decoder-only Architecture in Multilingual Neural Machine Translation [28.1] 本稿では,デコーダのみのアーキテクチャと言語伝達能力の欠如について検討する。
本稿では,デコード処理を2段階に分割し,第1段階においてターゲットトークンを明示的に除外することを提案する。
我々は、翻訳命令に対照的な学習を課し、ゼロショット翻訳の性能を改善した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:52:14 GMT)
OCR Hinders RAG: Evaluating the Cascading Impact of OCR on Retrieval-Augmented Generation [27.9] Retrieval-augmented Generation (RAG)は、幻覚を抑えるために外部知識を統合することで、言語モデル(LLM)を強化する。
外部知識ベースは、光学文字認識(OCR)を用いて構造化されていないPDF文書から構造化データを抽出することで一般的に構築される
本稿では,RAGシステムにおけるOCRのカスケード効果を理解するための最初のベンチマークであるOHRBenchを紹介する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:23:47 GMT)
STRIDE: Single-video based Temporally Continuous Occlusion Robust 3D Pose Estimation [27.9] ビデオに先立って人間の動作に適合する新しいテストタイムトレーニング(TTT)手法であるSTRIDEを提案する。
筆者らのフレームワークは,モデルに依存しない柔軟性を示し,既製の3Dポーズ推定手法を用いて,堅牢性と時間的整合性を向上させる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:39:15 GMT)
Shaping AI's Impact on Billions of Lives [27.8] 我々は、AI実践者のコミュニティが、共通の善のために意識的に、積極的に働くことを主張する。
本稿は、新しいタイプのイノベーション基盤の青写真を提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:29:37 GMT)
OpenHumanVid: A Large-Scale High-Quality Dataset for Enhancing Human-Centric Video Generation [27.5] 大規模で高品質な人中心ビデオデータセットOpenHumanVidを紹介する。
まず、大規模で高品質なデータセットを組み込むことによって、生成された人間のビデオの評価基準を大幅に強化する。
第二に、高品質のビデオ出力を生成するためには、人間の外見、人間の動き、顔の動きとテキストの効果的なアライメントが不可欠である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:27:44 GMT)
Deep Learning, Machine Learning, Advancing Big Data Analytics and Management [26.9] 人工知能、機械学習、ディープラーニングの進歩は、ビッグデータ分析と管理の変革を触媒している。
本研究は,これらの技術の理論的基礎,方法論的進歩,実践的実装について考察する。
研究者、実践家、データ愛好家は、現代のデータ分析の複雑さをナビゲートするツールを利用できる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:59:34 GMT)
On the Privacy, Security, and Trustworthy for Distributed Wireless Large AI Model (WLAM) [26.9] 本稿では、分散無線大AIモデル(WLAM)におけるプライバシ、セキュリティ、信頼性に関する総合的な概要を提供する。
分散WLAMにおけるプライバシとセキュリティに関する分類と理論的知見について論じる。
分散WLAMを実装する上での信頼性と倫理について述べる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:32:19 GMT)
Active Negative Loss: A Robust Framework for Learning with Noisy Labels [26.9] ノイズ・ロバスト損失関数はラベルノイズの存在下での学習を改善する効果的なソリューションを提供する。
本稿では,新しい損失関数クラスである正規化負損失関数(NNLF)を導入し,APLフレームワーク内の受動損失関数として機能する。
非対称ノイズシナリオでは,脆弱性をラベルの不均衡に緩和するエントロピーに基づく正規化手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:00:15 GMT)
AniGS: Animatable Gaussian Avatar from a Single Image with Inconsistent Gaussian Reconstruction [26.8] 本稿では,不整合画像の3次元再構成のためのロバストな手法を提案し,推論中のリアルタイムレンダリングを実現する。
再建問題を4次元課題として再検討し, 4次元ガウススプラッティングを用いた効率的な3次元モデリング手法を提案する。
実験により,本手法は3次元人体アバターの光実写・リアルタイムアニメーションを実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:55:39 GMT)
A Comprehensive Evaluation of Large Language Models on Aspect-Based Sentiment Analysis [26.5] 大規模言語モデル(LLM)は自然言語処理の分野で注目を集めている。
本稿では,ABSA分野におけるLLMの包括的評価に光を当て,13のデータセット,8のABSAサブタスク,6のLLMを含む。
実験により,LLMは微調整型小言語モデル (SLM) と比較して,微調整型に依存したパラダイムで,新しい最先端性能を実現することが示された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:54:17 GMT)
ScImage: How Good Are Multimodal Large Language Models at Scientific Text-to-Image Generation? [26.1] マルチモーダル大言語モデル(LLM)は、テキスト命令から高品質な画像を生成する際、印象的な能力を示した。
この研究は、テキスト記述から科学画像を生成する際のLLMのマルチモーダル能力を評価するために設計されたベンチマークであるScImageを紹介する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:52:06 GMT)
Predicting post-release defects with knowledge units (KUs) of programming languages: an empirical study [26.0] 本稿では,Javaプログラミング言語の知識単位(KU)の使用に関する実証的研究を報告する。
KUは、あるプログラミング言語の1つ以上のビルディングブロックによって提供される重要な機能の集合である。
8つのJavaシステムの28リリースをカバーする欠陥データセットを使用して、ソースコードを分析し、従来のコードメトリクスとKUインシデントの両方を抽出します。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:22:06 GMT)
Tackling GenAI Copyright Issues: Originality Estimation and Genericization [25.7] 本稿では, 生成モデルの出力を一般化し, 著作権物質を模倣しにくくする汎用化手法を提案する。
そこで本研究では,ジェネリゼーション手法と既存の緩和手法を組み合わせたPrepreGenを紹介する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:23:05 GMT)
CamoFA: A Learnable Fourier-based Augmentation for Camouflage Segmentation [25.6] 本稿では,camouflaged object detection (COD) とcamouflaged instance segmentation (CIS) の学習可能な拡張法を提案する。
提案手法は,カモフラーグ型物体検出器とインスタンスセグメンタの性能を大きなマージンで向上させる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:45:23 GMT)
AH-OCDA: Amplitude-based Curriculum Learning and Hopfield Segmentation Model for Open Compound Domain Adaptation [25.5] オープン複合ドメイン適応のための振幅に基づくカリキュラム学習とホップフィールドセグメンテーションモデルについて述べる。
AH-OCDAは2つのOCDAベンチマークと拡張オープンドメインで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:55:10 GMT)
TFS-NeRF: Template-Free NeRF for Semantic 3D Reconstruction of Dynamic Scene [25.2] 本稿では,スパースやシングルビューRGBビデオから撮影したダイナミックシーンのためのテンプレートレス3DセマンティックNeRFを提案する。
相互作用する物体の動きを遠ざけ, 濃度ごとのスキン厚みを最適化することにより, 高精度でセマンティックに分離可能なジオメトリを効率的に生成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:32:34 GMT)
ProbPose: A Probabilistic Approach to 2D Human Pose Estimation [24.6] 本稿では,各キーポイントについて,アクティベーションウィンドウ内の各位置におけるキーポイント存在のキャリブレーションされた確率,外部にいる確率,その可視性について予測するProbPoseを提案する。
COCO、CropCOCO、OCHumanでテストした結果、ProbPoseは画像外キーポイントのローカライゼーションが大幅に向上し、データ拡張による画像内ローカライゼーションも改善した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:30:59 GMT)
Facial Expression Recognition with Controlled Privacy Preservation and Feature Compensation [24.6] 顔表情認識(FER)システムは、機密情報の潜在的な暴露により、重要なプライバシー上の懸念を生じさせる。
本稿では,FER機能を保ちながら識別情報を除去する手法を提案する。
プライバシを損なうことなく,パフォーマンスを最適化する制御されたプライバシ強化機構とタスク関連機能を強化する機能補償機構を導入する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:04:07 GMT)
Compressing KV Cache for Long-Context LLM Inference with Inter-Layer Attention Similarity [24.1] 選択トークン保持やウィンドウベースアテンションを含む既存の手法では、効率は向上するが、将来のテキスト生成に必要な重要なトークンを破棄するリスクがある。
トークンを破棄するのではなく、重要でないトークンのメモリと計算負荷を削減し、トークンロスを伴わずにLCM効率を向上させるアプローチを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:29:27 GMT)
Folded multistability and hidden critical point in microwave-driven Rydberg atoms [23.4] 我々は、マイクロ波場強度を変化させることで、不安定状態の状態から強く相互作用するリドベルク原子の多重性への相転移を観察する。
報告された結果は、散逸性リドバーグ原子系における乗算可能性の操作に光を当て、非平衡多体物理学の応用に期待を持てる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:24:32 GMT)
Improved Localized Machine Unlearning Through the Lens of Memorization [23.3] 我々は局所的アンラーニングについて研究し、未学習アルゴリズムはパラメータの小さなサブセットで動作する。
そこで我々は,既存の未学習アルゴリズムと組み合わせた場合,強力な結果が得られるローカライゼーション戦略を提案する。
また、最も重要とされるパラメータをリセットする新しい未学習アルゴリズムDeletion by Example Localization (DEL)を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:57:08 GMT)
Measuring Bias of Web-filtered Text Datasets and Bias Propagation Through Training [22.5] 大規模言語モデル(LLM)の事前学習データセットのバイアスについて,データセット分類実験により検討した。
C4, RefinedWeb, DolmaCC, RedPajama-V2, FineWeb, DCLM-Baseline など,CommonCrawl から派生した LLM のオープンソース事前トレーニングデータセットの解析を行った。
ニューラルネットワークは、単一のテキストシーケンスが属するデータセットを驚くほどよく分類することができます。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:43:58 GMT)
Class-wise Autoencoders Measure Classification Difficulty And Detect Label Mistakes [22.5] 本稿では,個々のクラスで訓練されたオートエンコーダ間の再構成誤差の比率に基づいて,分類データセットを解析するための新しいフレームワークを提案する。
この分析フレームワークは、サンプル、クラス、およびデータセット全体のデータセットの効率的なキャラクタリゼーションを可能にする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:29:00 GMT)
A Good Foundation is Worth Many Labels: Label-Efficient Panoptic Segmentation [22.4] ロボット知覚に学習ベースのモデルを広く応用する上での課題は、注釈付きトレーニングデータの必要量を大幅に削減することである。
視覚基礎モデルにより舗装された基礎を生かし、セマンティックセグメンテーションとオブジェクト境界検出のために2つの軽量ネットワークヘッドを訓練する。
PASTELはアノテーションが少なくてもラベル効率の良いセグメンテーションの手法よりも優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:50:03 GMT)
DuoCast: Duo-Probabilistic Meteorology-Aware Model for Extended Precipitation Nowcasting [22.3] DuoCastは、幅広い気象の進化とマイクロスケールの変動に対処するために設計された気象モデルである。
4つの公開ベンチマークの実験は、DuoCastの有効性を示し、最先端の手法よりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:04:17 GMT)
Generalizing Weisfeiler-Lehman Kernels to Subgraphs [22.1] グラフ表現学習は様々な現実世界の問題を解決するのに有効である。
現在のグラフニューラルネットワーク(GNN)は、サブグラフレベルのタスクに対して最適な結果を生成する。
我々は、$k$-hop近傍にWLアルゴリズムを適用することで、サブグラフに一般化されたカーネルであるWLKSを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:35:44 GMT)
Artificial Expert Intelligence through PAC-reasoning [21.9] 人工知能(AEI)は、人工知能(AGI)と狭義のAIの両方の限界を超越しようとしている。
AEIは、ドメイン固有の専門知識と、トップヒューマンの専門家と同様、批判的で正確な推論能力を統合することを目指している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:25:18 GMT)
OODFace: Benchmarking Robustness of Face Recognition under Common Corruptions and Appearance Variations [21.0] 既存のオープンソースモデルと商用アルゴリズムは、特定の現実世界のout-of-Distribution(OOD)シナリオにおいて堅牢性を欠いている。
OODFaceは,顔認識モデルが直面するOOD課題を2つの視点から検討する。
19の異なる顔認識モデルと3つの商用APIに関する広範な実験を行い、フェイスマスクに関する拡張実験を行った。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:42:31 GMT)
CA-MoE: Channel-Adapted MoE for Incremental Weather Forecasting [20.8] 天気予報に漸進的な学習を導入し、モデル内の変数の柔軟な拡張を可能にする新しい構造を提案する。
具体的には,チャネル適応型MOE (CA-MoE) を提案する。
広く利用されているERA5データセットを用いて行った実験により,インクリメンタルな段階でトレーニング可能なパラメータの約15%しか利用できず,最先端の競合と同等の性能が得られることがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:30:52 GMT)
Automatic State Machine Inference for Binary Protocol Reverse Engineering [20.4] 未知プロトコルのための自動PSM推論フレームワークを提案する。
プロトコル状態とそれらの状態間の遷移条件を推論する確率的PSMアルゴリズムを改良する。
実験の結果,既存の Pre 手法と比較して,提案手法はプロトコルのより正確な分類を可能にしつつ PSM を推論できることがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:33:17 GMT)
Detection and Imputation based Two-Stage Denoising Diffusion Power System Measurement Recovery under Cyber-Physical Uncertainties [20.3] 電力系統のサイバー物理学的不確実性は、サイバー攻撃やデータ損失に起因する測定の曖昧さを含み、測定の質を高める可能性を減らす。
本稿では, 様々なサイバー物理的不確実性を用いて測定値の同定と再構成を行うため, 検出と計算に基づく2段階復調拡散モデル (TSDM) を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:54:40 GMT)
Cascaded Multi-Scale Attention for Enhanced Multi-Scale Feature Extraction and Interaction with Low-Resolution Images [20.1] 本稿では,低解像度入力を効果的に処理するための新しいアテンション機構,CMSAを提案する。
このアーキテクチャは、異なるスケールにわたる機能の効果的なハンドリングを可能にし、人間のポーズ推定のようなタスクを実行するモデルの能力を高める。
実験の結果,提案手法はパラメータが少なく,既存の最先端手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:23:19 GMT)
RelayGS: Reconstructing Dynamic Scenes with Large-Scale and Complex Motions via Relay Gaussians [20.1] 大規模で複雑な動きを伴う動的シーンの再構築は依然として大きな課題である。
Neural Radiance Fieldsや3D Gaussian Splatting(3DGS)のような最近の技術は、将来性を示しているが、それでも相当な動きを伴うシーンに苦戦している。
本稿では,3DGSに基づく動的シーンの表現と再構成を行うRelayGSを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:08:03 GMT)
Adaptive Rank, Reduced Forgetting: Knowledge Retention in Continual Learning Vision-Language Models with Dynamic Rank-Selective LoRA [20.0] 既存のメソッドは、しばしば追加の参照データ、分散やドメイン予測のための独立したコンポーネントに依存します。
本稿では,動的ランク選択型低ランク適応(LoRA)を提案する。
本手法は,学習済みの知識とCL中に獲得した知識の両方を保持することで,学習済みのVLMを継続的に強化する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:13:14 GMT)
Neural Thermodynamic Integration: Free Energies from Energy-based Diffusion Models [19.9] 我々は、トレーニング可能なニューラルネットワークで表されるアルケミカル経路に沿って熱力学積分(TI)を実行することを提案する。
本研究では、相互作用系と非相互作用系の間の時間依存ハミルトン補間をパラメトリズし、その勾配を最適化する。
すべての中間アンサンブルをサンプリングするエネルギーベース拡散モデルの能力により、単一の参照計算からTIを実行することができる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:49:39 GMT)
Enabling Efficient Attack Investigation via Human-in-the-Loop Security Analysis [19.8] ラプター(Raptor)は、人間の分析者が大規模システムの存在を効果的に分析できる防衛システムである。
ProvQLは、さまざまなタイプの攻撃分析に不可欠なプリミティブを提供する。
Raptorは、効率的な言語実行のための最適化された実行エンジンを提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:18:59 GMT)
Multi-Bin Batching for Increasing LLM Inference Throughput [19.7] 大規模言語モデル(LL)は、システムの効率性を向上させるために人気が高まっている。
リクエストはサーバ上のジョブをスケジューリングする重要なステップです。
リクエストは、しばしば異なる生成長を持ち、リソースの未利用を引き起こす。
我々は、この問題をキューイング理論の観点から形式化し、スループット制御ポリシーを設計することを目的とする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:16:12 GMT)
Jailbreak Defense in a Narrow Domain: Limitations of Existing Methods and a New Transcript-Classifier Approach [19.1] 本稿では,狭義の行動セットを禁止したい場合に,脱獄防御の難しさについて検討する。
安全訓練、敵の訓練、入出力分類器などの一般的な防御は、この問題を完全に解決できない。
より良い解を求めるために、我々は、テストするベースラインディフェンスよりも優れた転写分類器ディフェンスを開発した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:34:58 GMT)
BYE: Build Your Encoder with One Sequence of Exploration Data for Long-Term Dynamic Scene Understanding [19.0] BYEはクラスに依存しない、シーン毎のクラウドエンコーダで、事前に定義されたカテゴリ、シェイププレファレンス、あるいは広範囲のアソシエーションデータセットの必要性を取り除く。
本稿では,視覚言語モデルとBYEのシーン固有の専門知識を組み合わせたアンサンブル手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:34:42 GMT)
GSGTrack: Gaussian Splatting-Guided Object Pose Tracking from RGB Videos [18.9] 本稿では,新しいRGBベースのポーズトラッキングフレームワークであるGSGTrackを紹介する。
トラッキング中のノイズに過度に敏感な画素ワイド損失の問題に対処するために,物体のシルエット損失を提案する。
OnePoseとHO3Dの実験では、6DoFのポーズトラッキングとオブジェクト再構成の両方においてGSGTrackの有効性が示されている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:38:44 GMT)
Viewpoint Consistency in 3D Generation via Attention and CLIP Guidance [18.8] 現在の手法はしばしば幾何学的矛盾に悩まされ、一般にヤヌス問題と呼ばれる。
本稿では,拡散モデルにおけるジャナス問題の根本原因である視点生成バイアスを明らかにする。
本稿では,Attention and CLIP Guidance (ACG) 機構と呼ばれるチューニング不要な手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:05:32 GMT)
Developing Story: Case Studies of Generative AI's Use in Journalism [18.7] 本研究では、WildChatデータセットを閲覧することで、2つの報道機関によるジャーナリストとAIのインタラクションの研究を行う。
本稿では,ジャーナリストが他の機関からの資料や記事との機密通信などの機密資料をLCMに送付し,記事作成を促す事例を明らかにする。
本稿では,AIの活用に責任を負うものに関するさらなる研究と,ジャーナリストの文脈でLLMを使用するための明確なガイドラインとベストプラクティスの確立を求めている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:57:32 GMT)
Multi-robot autonomous 3D reconstruction using Gaussian splatting with Semantic guidance [18.6] 暗黙の神経表現と3次元ガウススプラッティング(3DGS)はシーン再構成に大きな可能性を示している。
近年,タスク割り当て手法による自律的再構築への応用が拡大している。
本稿では,最初の3DGSに基づく集中型マルチロボット自律型3D再構築フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:27:17 GMT)
Latent Diffusion Model-Enabled Low-Latency Semantic Communication in the Presence of Semantic Ambiguities and Wireless Channel Noises [18.5] 本稿では,ソースデータのアウトレイラを処理するために,遅延拡散モデルを用いたSemComシステムを開発した。
軽量な単層遅延空間変換アダプタは、送信機でのワンショット学習を完了させる。
終端整合蒸留法を用いて, 潜時空間で訓練した拡散模型を蒸留する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:49:07 GMT)
Controlling the Latent Diffusion Model for Generative Image Shadow Removal via Residual Generation [18.5] 大規模な生成モデルは、忠実さに十分な焦点をあてることなく、多様で現実的な詳細を生成することが多い。
本稿では拡散モデルを用いて画像残像の生成と微細化を行う。
生成過程におけるエラーの蓄積を回避するために,クロスタイムステップの自己改善学習戦略を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:38:14 GMT)
Improved Complexity for Smooth Nonconvex Optimization: A Two-Level Online Learning Approach with Quasi-Newton Methods [18.5] 本研究では,スムーズな関数を持つ$epsilon$firstorder stationary point (FOSP) を求める問題について検討する。
本稿では,このオンライン学習問題を解決するために,新しい楽観的な準勾配近似法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:20:05 GMT)
Single-Shot Metric Depth from Focused Plenoptic Cameras [18.4] 視覚センサによる距離推定は、ロボットが環境を知覚し、ナビゲートし、操作するために不可欠である。
光電界イメージングは、単一のデバイスを通してユニークなレンズ構成を使用することで、メートル法深度を推定するための有望なソリューションを提供する。
我々の研究は、高密度なメートル法深度のための集束型レンズカメラの可能性を探究する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:21:17 GMT)
Enhancing Robustness of CLIP to Common Corruptions through Bimodal Test-Time Adaptation [18.3] ゼロショットCLIPは、テスト時間中に重度レベルが増加すると、一般的な画像劣化に対して堅牢性が欠如していることが示される。
画像の破損に対するCLIPの堅牢性を改善するために特別に設計された,バイモーダルなTTA手法であるフレームワークを提案する。
CIFAR-10C, CIFAR-100C, ImageNet-Cでは平均精度が9.7%, 5.94%, 5.12%向上した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:02:14 GMT)
Optimizing Latent Goal by Learning from Trajectory Preference [18.3] 優先度目標調整(PGT)というフレームワークを提案する。
PGTは、環境と対話して複数の軌道を収集する、以下のポリシーの指示を可能にする。
選好学習を用いて、初期目標の潜在表現を分類された軌道で微調整する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:27:48 GMT)
Dynamic-LLaVA: Efficient Multimodal Large Language Models via Dynamic Vision-language Context Sparsification [18.1] 動的視覚言語コンテキストスペーシフィケーションフレームワークDynamic-LLaVAを提案する。
これは、プリフィルステージにおける視覚コンテキストの冗長性を動的に減少させる。
これはデコード中に生成された言語コンテキストのメモリと計算オーバーヘッドを減少させる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:12:09 GMT)
Embedded Prompt Tuning: Towards Enhanced Calibration of Pretrained Models for Medical Images [18.1] 医用画像分類タスクに基礎モデルを適用する際の微調整手法の有効性について検討する。
拡張チャネルにプロンプトトークンを埋め込む組込みプロンプトチューニング(EPT)手法を提案する。
EPTは、数ショットの医用画像分類タスクにおいて、いくつかの最先端の微調整方法よりも顕著に優れている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:43:25 GMT)
GSOT3D: Towards Generic 3D Single Object Tracking in the Wild [17.8] 本稿では,汎用的な3次元オブジェクト追跡(SOT)の開発を支援する新しいベンチマークGSOT3Dを提案する。
GSOT3Dは620のシーケンスと123Kフレームを提供し、54のオブジェクトカテゴリをカバーしている。
フレームごとの高品質な3Dアノテーションを提供するために、すべてのシーケンスを細心の注意を払って複数のラウンドで手動でラベル付けする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:34:18 GMT)
Puzzle: Distillation-Based NAS for Inference-Optimized LLMs [17.7] 大規模言語モデル(LLM)は目覚ましい能力を示しているが、その採用は推論時に高い計算コストによって制限されている。
本稿では,特定のハードウェア上でLLM推論を高速化するフレームワークであるPuzzleについて述べる。
Nemotron-51Bは、バッチサイズが大きい単一のGPU上で推論できる最も正確な言語モデルである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:06:33 GMT)
A Survey of Machine Learning-based Physical-Layer Authentication in Wireless Communications [17.7] 無線環境におけるユニークな特性の活用により,Physical-Layer Authentication (PLA) が有望な補完として浮上している。
本稿では,MLベースのPLAで使用可能な特徴と技術について,包括的に調査する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:44:01 GMT)
Take Your Steps: Hierarchically Efficient Pulmonary Disease Screening via CT Volume Compression [17.5] 本稿では,肺疾患スクリーニングの計算コストを削減するための階層的アプローチを提案する。
まず,CTVC (Computerd Tomography Volume Compression) 法を提案する。
第2に、選択されたCTスライスを用いて、軽量分類モデルを用いて肺疾患サブセットを検出する。
第3に,放射線技師が再検出した診断信頼性の低い試料の同定に不確実性測定戦略を適用した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:43:55 GMT)
EVOR: Evolving Retrieval for Code Generation [17.5] 検索拡張コード生成のための既存のパイプラインは、単一のソースを持つ静的ナレッジベースを使用している。
我々は,クエリと多様な知識ベースを同期的に進化させる新しいパイプラインEVORを開発した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:56:26 GMT)
Interpretable Generalized Additive Models for Datasets with Missing Values [17.1] M-GAMは、不足度指標とその相互作用項を組み込んだスパースで一般化された付加的モデリング手法である。
我々は,M-GAMが従来の手法と類似あるいは類似した精度を提供するとともに,インプット変数の内包や内包に対する空間性を大幅に向上することを示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:21:20 GMT)
A Novel Approach to Comprehending Users' Preferences for Accurate Personalized News Recommendation [17.1] カテゴリー誘導意図のゆがみを利用した新しいパーソナライズされたニュースレコメンデーションフレームワーク(CROWN)を提案する。
CROWNは10の最先端のニュースレコメンデーションメソッドに対して一貫したパフォーマンス改善を提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:10:01 GMT)
Gracefully Filtering Backdoor Samples for Generative Large Language Models without Retraining [16.8] バックドア攻撃は、生成型大規模言語モデル(LLM)に対する重大なセキュリティ脅威である
GraCeFulは、周波数空間におけるサンプルワイド勾配を使用して、LLMの再トレーニングを必要とせずに、バックドアサンプルを識別する。
GraCeFulは卓越した計算効率を示し、バックドアサンプルの識別に100%のリコールとF1スコアを達成している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:43:36 GMT)
Enhanced Photovoltaic Power Forecasting: An iTransformer and LSTM-Based Model Integrating Temporal and Covariate Interactions [16.7] 既存のモデルは、しばしばターゲット変数と共変量の間の複雑な関係を捉えるのに苦労する。
対象変数からの特徴抽出にiTransformerを利用する新しいモデルアーキテクチャを提案する。
クロスアテンション機構は両方のモデルの出力を融合するために統合され、続いてコルモゴロフ・アルノルドネットワークマッピングが続く。
その結果, PV発電の季節変動を効果的に把握し, 予測精度を向上することが示唆された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:16:13 GMT)
FSMLP: Modelling Channel Dependencies With Simplex Theory Based Multi-Layer Perceptions In Frequency Domain [16.7] 時系列予測(TSF)は、Webデータ分析、エネルギー消費予測、天気予報など、さまざまな領域において重要な役割を果たす。
MLP(Multi-Layer Perceptrons)は、一時的依存関係をキャプチャするのに軽量で効果的であるが、チャネル間の依存関係をモデル化する場合、過度に適合する傾向がある。
本手法では, モデルが単純なパターンを学習し, 過度な値に収まらないようにする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:40:13 GMT)
A privacy-preserving distributed credible evidence fusion algorithm for collective decision-making [16.7] 本稿では,3レベルコンセンサス(PCEF)を用いたプライバシ保存型分散信頼性エビデンス融合法を提案する。
シミュレーションの結果,PCEF は信頼性と融合性の両方において CCEF に近づき,既存の手法よりも少ない時間消費で高い判定精度が得られることがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:36:42 GMT)
Dynamic Adversarial Attacks on Autonomous Driving Systems [16.7] 本稿では,自律走行システムのレジリエンスに挑戦する攻撃機構を提案する。
我々は、他の移動車に搭載された画面に対向パッチを動的に表示することにより、自動運転車の意思決定プロセスを操作する。
我々の実験は、現実の自律走行シナリオにおけるこのような動的敵攻撃の実装が最初に成功したことを実証している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:53:17 GMT)
Radiance Fields from Photons [16.2] 単一光子カメラ(SPC)を用いて個々の光子の粒度を学習する神経放射場である量子放射場を導入する。
シミュレーションとプロトタイプのSPCハードウェア,高速動作下での高忠実度再構成,低光域,超ダイナミックレンジ設定による実演を行った。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:40:04 GMT)
A Comprehensive Study of Shapley Value in Data Analytics [16.1] 本稿では、データ分析(DA)ワークフロー全体にわたって使用されるShapley値(SV)について、初めて包括的な研究を行う。
我々は,これらのステップで使用される既存の多種多様なSVを統一された定義で要約し,SVがデータ科学者にもたらす重要な機能を明らかにする。
SVBenchは,SVアプリケーション開発のための最初のオープンソースの計算ベンチマークであり,解析と議論の検証のために6つのDAタスクの実験を行う。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:48:22 GMT)
GQWformer: A Quantum-based Transformer for Graph Representation Learning [16.0] 本稿では, 構造符号化に量子技術を活用することにより, グラフ帰納バイアスを自己認識機構に統合する手法を提案する。
グラフ量子ウォーク変換器(GQWformer, Graph Quantum Walk Transformer)は, 属性グラフ上の量子ウォークを利用してノード量子状態を生成するGNNフレームワークである。
これらの量子状態は、豊富な構造特性をカプセル化し、変圧器の誘導バイアスとして機能し、より有意義な注意スコアの生成を可能にする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:03:04 GMT)
Model Editing for LLMs4Code: How Far are We? [16.0] LLMs4Code(Large Language Models for Code)は、ソフトウェア工学領域において優れたパフォーマンスを示す。
しかし、最も先進的なLLMs4Codeでさえ、必然的に誤りや時代遅れのコード知識を含むことができる。
モデル編集はLLMにおける誤った知識を効果的かつ効率的に修正するための新しい技術分野である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:40:40 GMT)
Switti: Designing Scale-Wise Transformers for Text-to-Image Synthesis [15.9] Swittiは、テキスト・ツー・イメージ生成のためのスケールワイズ・トランスフォーマーである。
サンプリングを11%高速化し,メモリ使用量を削減できる非AR方式を提案する。
Swittiは既存のT2I ARモデルより優れており、最先端のT2I拡散モデルと競合することを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:44:06 GMT)
Advancing Speech Language Models by Scaling Supervised Fine-Tuning with Over 60,000 Hours of Synthetic Speech Dialogue Data [15.9] GPT-4oは音声による大規模言語モデル(LLM)とのリアルタイム対話を可能にする重要なマイルストーンである。
我々はKe-SpeechChat上に構築されたシームレスな大規模言語モデルであるKE-Omniを紹介する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:59:43 GMT)
An Empirical Study of Mamba-based Pedestrian Attribute Recognition [15.8] 本論文は,Mambaを2つの典型的なPARフレームワーク,テキスト画像融合アプローチと純粋ビジョンMambaマルチラベル認識フレームワークに設計・適応する。
属性タグを追加入力として操作することは、必ずしも改善につながるとは限らない。具体的には、Vimを拡張できるが、VMambaではできない。
これらの実験結果は、単にTransformerでMambaを拡張すれば、パフォーマンスが向上するだけでなく、特定の設定でより良い結果が得られることを示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:25:30 GMT)
Let's Think Var-by-Var: Large Language Models Enable Ad Hoc Probabilistic Reasoning [15.6] 大規模言語モデル(LLM)から共通感覚を抽出することを提案する。
私たちは、$textitguesstimation$の質問に焦点を合わせています。
我々のフレームワークは、そのような疑問に$textitad hoc$probabilistic modelで答える。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:53:06 GMT)
Sharp-It: A Multi-view to Multi-view Diffusion Model for 3D Synthesis and Manipulation [15.2] 我々は,3次元表現を直接生成する手法と,多視点画像から3次元オブジェクトを再構成する手法の質差を橋渡しする。
シャープ・イット(Sharp-It)と呼ばれるマルチビュー拡散モデルを導入する。
Sharp-Itは高速な合成、編集、制御された生成などの様々な3Dアプリケーションを可能にすると同時に、高品質な資産を達成可能であることを実証する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:58:07 GMT)
Practical Parallel Algorithms for Non-Monotone Submodular Maximization [15.2] Submodularは、人工知能の分野における様々な分野に広く応用されている。
部分モジュラーアルゴリズムの並列化可能性の1つは適応的な複雑性であり、これは対象関数に対する多数のクエリを並列に実行できるラウンドの数を示している。
証明可能な近似比と非単調なサブモジュラー問題に対するサブ適応複雑性をともに持つ最初のアルゴリズムを$k$-systemに提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:02:05 GMT)
TransFair: Transferring Fairness from Ocular Disease Classification to Progression Prediction [15.0] 眼疾患の進行予測における人口動態の公平性を高めるためにTransFairを導入する。
TransFairは、公平な疾患分類モデルを、公平に保存された進行予測タスクに転送することを目的としている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:33:50 GMT)
Universal Rates of Empirical Risk Minimization [15.0] 本研究では,経験的リスク (ERM) による普遍的学習の課題について検討する。
ERMによる普遍的な学習率は4つしかない、すなわち、ERMが学習可能な任意の概念クラスの学習曲線は、$e-n$、$/n$、$log(n)/n$、または任意に遅いレートで崩壊する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:20:39 GMT)
FCL-ViT: Task-Aware Attention Tuning for Continual Learning [15.0] 継続学習(CL)では、以前のディープニューラルネットワーク(DNN)の知識を、古い知識を忘れずに新しいタスクに適応させる。
本稿では、フィードバック機構を用いて、現在のタスクに合わせたリアルタイムな動的注意機能を生成する新しいフィードバック継続学習視覚変換器(FCL-ViT)を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:48:33 GMT)
Value Residual Learning For Alleviating Attention Concentration In Transformers [14.9] 本稿では,残値(ResFormer)を持つTransformerを提案し,層間注目度を近似する。
ResFormerは10.4%のモデルパラメータと13.6%のトレーニングデータで等価な検証損失を達成している。
SVFormerはKVキャッシュサイズを半減し、性能上のペナルティはわずかである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:36:19 GMT)
DyMO: Training-Free Diffusion Model Alignment with Dynamic Multi-Objective Scheduling [14.6] 推論中に生成した画像と人間の嗜好を調整するためのトレーニング不要アライメント手法DyMOを提案する。
テキスト認識された人間の嗜好スコアとは別に、拡散の初期における意味的アライメントを強化する意味的アライメントの目的を導入する。
種々の事前学習拡散モデルとメトリクスを用いた実験は,提案手法の有効性とロバスト性を示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:00:09 GMT)
Topology-Preserving Image Segmentation with Spatial-Aware Persistent Feature Matching [14.6] 本稿では,画像の空間領域における情報をさらに活用する,効率的かつ効率的な空間認識型トポロジカルロス関数を提案する。
種々の管状構造の画像に対する実験により,提案手法はセグメンテーションのトポロジ的精度向上に優れた性能を示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:38:15 GMT)
Multimodal and Force-Matched Imitation Learning with a See-Through Visuotactile Sensor [14.5] 我々は、模倣学習(IL)の枠組みの中でマルチモーダル・ビゾタクタクタブル・センサを活用して、コンタクトリッチなタスクを実行する。
本稿では,IL改善のための補完手法として,触覚力マッチングと学習モード切替という2つのアルゴリズム的貢献を紹介する。
以上の結果から, 力の一致が平均政策成功率62.5%, ビズオタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタクタク
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:56:48 GMT)
Copy-Move Forgery Detection and Question Answering for Remote Sensing Image [14.4] 本稿では,RSCMQA(Remote Sensing Copy-Move Question Answering)の課題を紹介する。
従来のRemote Sensing Visual Question Answering (RSVQA)とは異なり、RCCMQAは複雑なタンパリングシナリオの解釈に重点を置いている。
我々は、RS-CMQA-2.1Mというリモートセンシング画像複写質問応答のための高精度で包括的なグローバルデータセットを開発した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:02:40 GMT)
Redundant Queries in DETR-Based 3D Detection Methods: Unnecessary and Prunable [14.2] bdGradually bdPruning bdQueries (GPQ) という手法を提案する。
GPQは、分類スコアに基づいてクエリを漸進的に更新する。
FLOPsは67.86%減少し、推論時間は76.38%減少する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:26:04 GMT)
Jailbreak Large Vision-Language Models Through Multi-Modal Linkage [14.0] 我々は、MML攻撃という新しいジェイルブレイク攻撃フレームワークを提案する。暗号からインスピレーションを得たMMLは、テキストと画像のモダリティをまたいだ暗号化復号プロセスを利用して、悪意のある情報の過剰露出を軽減する。
MMLjailbreaks GPT-4o with attack success rate 97.80% on SafeBench, 98.81% on MM-SafeBench, 99.07% on HADES-Dataset。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:13:51 GMT)
Who Walks With You Matters: Perceiving Social Interactions with Groups for Pedestrian Trajectory Prediction [14.0] 本稿では,GrouP ConCeption(GPCC)モデルを提案する。
GPCCモデルでは、軌道予測精度が大幅に向上し、社会的・個人的ダイナミクスをモデル化する上での有効性が検証された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:47:33 GMT)
Another Vertical View: A Hierarchical Network for Heterogeneous Trajectory Prediction via Spectrums [14.0] トラジェクティブ次元の$M$を導入し、アプリケーションシナリオをヘテロジニアスなトラジェクトリに拡張する。
我々は、時間-周波数応答と次元-相互作用を含む2つの因子をモデル化し、同時に融合するために、双線形構造を採用する。
実験により、提案モデルはETH-UCY、SDD、nuScenes、Human3.6Mにおいて、不均一な軌跡を持つ最先端の手法よりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:19:16 GMT)
SymBreak: Mitigating Quantum Degeneracy Issues in QLDPC Code Decoders by Breaking Symmetry [14.0] 量子低密度パリティチェック (qLDPC) コードは有望な代替として出現し、より少ない量子ビットを必要とする。
SymBreakはqLDPC符号のための新しいデコーダで、デコードグラフを適応的に修正し、最先端の信条伝搬デコーダの性能を向上させる。
以上の結果から,Symbreak は BP と BP+OSD より複雑な BP の変種である BP と BP+OSD を,BP と比較して論理誤差率を 16.17 ドル,qLDPC のコードファミリで 3.23 ドルで上回った。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:45:43 GMT)
CausalMob: Causal Human Mobility Prediction with LLMs-derived Human Intentions toward Public Events [13.8] 我々は、公的な出来事の因果的影響を分析するために、textbfCausalMobと呼ばれる因果予測モデルを提案する。
まず,大言語モデル(LLM)を用いて,ニュース記事から人間の意図を抽出し,因果治療として機能する特徴に変換する。
大規模な実世界のデータに基づいて,提案モデルが人間の移動予測に優れていることを示す実験結果を得た。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:29:27 GMT)
VIGFace: Virtual Identity Generation for Privacy-Free Face Recognition [13.8] VIGFaceは合成顔画像を生成する新しいフレームワークである。
プライバシーや肖像画の権利を気にすることなく、仮想顔画像を作成することができる。
既存のイメージを組み込んだ効果的な拡張手法として機能する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:15:40 GMT)
Single-Cell Omics Arena: A Benchmark Study for Large Language Models on Cell Type Annotation Using Single-Cell Data [13.6] 大規模言語モデル(LLM)は、テキストの膨大なコーパスを効率的に処理し、合成し、生物学的知識を自動的に抽出する能力を実証している。
本研究は、単一細胞RNAシークエンシング(scRNA-seq)データにおいて、細胞型を正確に分類し、アノテートするLLMの可能性を探るものである。
以上の結果から,LCMは微調整を必要とせずに単一セルデータの堅牢な解釈を実現できることが示された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:58:35 GMT)
RARE: Retrieval-Augmented Reasoning Enhancement for Large Language Models [13.5] RARE(Retrieval-Augmented Reasoning Enhancement)は相互推論フレームワーク(rStar)の汎用的拡張である
これは、コモンセンスや医学的推論といった複雑な知識集約的なタスクに対して、大規模言語モデル(LLM)の推論精度と事実整合性を高めることを目的としている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:52:35 GMT)
Towards Universal Mesh Movement Networks [13.5] 我々はUniversal Mesh Movement Network (UM2N)を紹介する。
UM2Nは、異なるサイズ分布と構造を持つメッシュを動かすために、非侵入的ゼロショット方式で適用することができる。
本研究では, 実世界の津波シミュレーション事例とともに, 対流法とナビエ・ストークス法に基づく実例について検討した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:07:32 GMT)
LumiNet: Latent Intrinsics Meets Diffusion Models for Indoor Scene Relighting [13.4] ソースイメージとターゲットのライティングイメージが与えられた後、LumiNetはターゲットのライティングをキャプチャするソースシーンの依存バージョンを合成する。
LumiNetは2つの異なる画像から遅延表現を処理します。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:21:41 GMT)
Learning from Reduced Labels for Long-Tailed Data [13.3] 長い尾のデータは現実世界の分類タスクで一般的であり、教師付き情報に大きく依存している。
そこで我々は、Reduced Labelと呼ばれる弱教師付きラベル設定を導入する。
提案したラベリング設定は、テールサンプルの監視情報の減少を回避するだけでなく、ロングテールデータに関連するラベリングコストを低減させる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:18:17 GMT)
Hijacking Vision-and-Language Navigation Agents with Adversarial Environmental Attacks [13.0] VLN(Vision-and-Language Navigation)は、視覚・言語ナビゲーションのタスク。
ホワイトボックスの敵攻撃は、事前訓練されたVLNエージェントの望ましい行動を引き起こすために開発された。
攻撃は早期終了行動を引き起こすか、攻撃者が定義した多段階軌道に沿ってエージェントを分散させることができる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:54:32 GMT)
MediaSpin: Exploring Media Bias Through Fine-Grained Analysis of News Headlines [12.6] このコーパスには78,910対のニュース見出しとアノテーションが含まれており、13種類のメディアバイアスカテゴリが割り当てられている。
ニュース編集における自動バイアス検出のためのデータセットの有用性を示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:41:13 GMT)
Scaling laws for learning with real and surrogate data [12.6] 重み付き経験的リスク最小化(ERM)アプローチを用いて,サロゲートデータをトレーニングに統合する。
$(i)$ サロゲートデータを統合すれば、元のディストリビューションにおけるテストエラーを大幅に削減できる。
$(ii)$ 代理データの利点を享受するためには、最適な重み付けのERMを使用することが重要です。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:22:26 GMT)
BANER: Boundary-Aware LLMs for Few-Shot Named Entity Recognition [12.6] 本稿では,Few-Shot Named Entity Recognition のための境界認識 LLM という手法を提案する。
一般化されたエンティティスパンに対するエンティティ境界を知覚するLLMの能力を高めるために,境界対応のコントラスト学習戦略を導入する。
ターゲットドメインからソースドメインに情報をアライメントするためにLoRAHubを使用し、適応型クロスドメイン分類機能を強化する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:51:14 GMT)
A Classic-Quantum Hybrid Network Framework: CQH-Net [12.4] 特徴抽出のための古典量子ハイブリッドネットワークフレームワーク(CQH-Net)を提案する。
CQH-Netは、同じパラメータを持つ古典的畳み込みネットワーク(CNN)と比較して平均収束率を72.8%向上させる。
その結果,モデルがトレーニング中に重要なデータの特徴を効果的に捉え,それらの特徴とそれに対応するカテゴリの関連性を確立することが示唆された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:37:11 GMT)
A Domain-Independent Agent Architecture for Adaptive Operation in Evolving Open Worlds [12.0] HYDRAは、混合した離散連続世界で動作するモデルベースのエージェントを設計するためのフレームワークである。
これは、エージェントが様々な側面から自身の振る舞いを監視できるようにする、新しいメタ推論プロセスを実装している。
このフレームワークは、3つの異なるドメインに対して新規に認識されたエージェントを実装するために使われてきた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:34:36 GMT)
FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation [11.8] 単手画像と双手画像のための大規模ドメイン固有拡散モデルFoundHandを提案する。
2Dキーポイントとセグメンテーションマスクアノテーションを備えた大規模ハンドデータセットであるFoundHand-10Mを使用している。
本モデルでは,手の動きを再現したり,手の動きを伝達したり,新しいビューを合成したりといった,中核的な機能を示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:58:19 GMT)
TDD-Bench Verified: Can LLMs Generate Tests for Issues Before They Get Resolved? [11.8] テスト駆動開発(TDD)は、まずテストを書き、後でコーディングするプラクティスです。
この記事では、現実のGitHubコードリポジトリから抽出した449のイシューの高品質なベンチマークスイートであるTDD-Bench Verifiedを紹介します。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:38:05 GMT)
The Efficacy of Transfer-based No-box Attacks on Image Watermarking: A Pragmatic Analysis [11.7] 我々は,攻撃者が透かしモデルについて何も知らないと仮定される,no-box'設定における画像透かし手法の堅牢性について検討する。
構成がほぼ一致している場合、単純な非最適化攻撃が、最適化ベースの取り組みの成功をすでに上回っていることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:02:49 GMT)
Tailoring the light-matter interaction for high-fidelity holonomic gate operations in multiple systems [11.7] スキームは3つの量子ビット系に適用される: アンサンブルレアアースイオン(REI)量子ビット、単一のREI量子ビット、超伝導トランスモン量子ビット。
数値シミュレーションにより、最適化されたゲート演算は周波数デチューニングに対して頑健であり、非共鳴励起が低いことを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:10:20 GMT)
CNNSum: Exploring Long-Conext Summarization with Large Language Models in Chinese Novels [11.6] CNNSumは、中国のマルチスケールの長文小説要約ベンチマークである。
我々は、CNNSum上で商用およびオープンソースモデルを評価し、詳細な分析を行う。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:35:57 GMT)
BPP-Search: Enhancing Tree of Thought Reasoning for Mathematical Modeling Problem Solving [11.6] 我々は、完全な数学的モデリングプロセスをキャプチャする包括的ラベルを付したStructuredORデータセットをリリースする。
本稿では,強化学習をツリー・オブ・シント構造に統合するアルゴリズムであるBPP-Searchを提案する。
木に基づく推論では、BPP-Searchは精度と効率が優れ、正しい解の高速な検索を可能にする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:38:54 GMT)
Conti-Fuse: A Novel Continuous Decomposition-based Fusion Framework for Infrared and Visible Images [11.5] モーダル間および内部モーダル関係のための連続分解に基づく融合フレームワーク(Conti-Fuse)を提案する。
提案したConti-Fuseは,最先端の融合法よりも優れた性能を実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:46:15 GMT)
The Space Complexity of Approximating Logistic Loss [11.3] a general $tildeOmega(dcdot mu_mathbfy(mathbfX))$ space lower bound if $epsilon$ is constant。
また、$mu_mathbfy(mathbfX)$は計算が難しいという事前予想も否定する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:11:37 GMT)
Guardian of the Ensembles: Introducing Pairwise Adversarially Robust Loss for Resisting Adversarial Attacks in DNN Ensembles [11.1] 攻撃は移動可能性に依存する。
最近のアンサンブル法は、AEがアンサンブル内の複数の分類器を誤解させる可能性が低いことを示している。
本稿では,Pairwise Adversariversaally Robust Loss (PARL) を用いた新たなアンサンブルトレーニングを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:00:13 GMT)
Retrofitting XoM for Stripped Binaries without Embedded Data Relocation [10.9] 我々は、x86-64プラットフォーム上でXoMを削除したバイナリにシームレスに再適合させる実用技術であるPXoMを提案する。
我々は、Intelのハードウェア機能であるMemory Protection Keysを利用して、効率的なきめ細かいパーミッションコントロールを提供します。
PXoMは、必要なガジェットをすべて回収するために、小さなウィグルスペースを持つ敵を置き去りにしており、PXoMは現実世界の配備に実用的であることを示唆している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:08:27 GMT)
dc-GAN: Dual-Conditioned GAN for Face Demorphing From a Single Morph [10.9] そこで本研究では, モーフィック画像に条件付き新規なGANデモルフィック法であるdc-GANを提案する。
提案手法は, 形態の再現性を克服し, ボナフィド画像の高品質な再構成を行う。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:07:25 GMT)
WAFFLE: Multimodal Floorplan Understanding in the Wild [10.8] WAFFLEは20K近いフロアプラン画像と、さまざまなビルディングタイプ、場所、データフォーマットにまたがるインターネットデータから算出されたメタデータからなる、新しいデータセットである。
WAFFLEは,従来のデータセットでは実現不可能な,識別的および生成的の両方において,新たなビルディング理解タスクの進行を可能にすることを示す。
WAFFLEをコードとトレーニングされたモデルとともに公開し、研究コミュニティに建物のセマンティクスを学ぶための新しい基盤を提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:58:44 GMT)
Constrained Identifiability of Causal Effects [10.7] 本研究では,異なる種類の制約が存在する場合の因果的影響の同定について検討する。
制約の集合を古典的な識別可能性の定義への別の入力とする制約付き識別可能性の概念を定式化する。
我々は、このACベースのアプローチが、古典的識別可能性をテストするための既存のアルゴリズムと同程度に完全であることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:08:45 GMT)
ShadowHack: Hacking Shadows via Luminance-Color Divide and Conquer [10.6] シャドーは、画像の明るさの低減、テクスチャ劣化、色歪みなどの課題を導入する。
本研究は,従来のタスクを輝度回復と色修復に分解することで,これらの複雑さに対処する分割型戦略である textbfShadowHack を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:37:23 GMT)
Enhancing Trust in Large Language Models with Uncertainty-Aware Fine-Tuning [10.5] 大規模言語モデル(LLM)は、その印象的な推論と質問応答能力によって自然言語処理の分野に革命をもたらした。
LLMは時に、幻覚として知られる、信頼できるが誤った情報を生成する傾向にある。
本稿では,決定論の原理に基づく不確実性を考慮した因果的言語モデリング損失関数を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:14:47 GMT)
Mind the Gap: Examining the Self-Improvement Capabilities of Large Language Models [10.4] 自己改善は、Large Language Model(LLM)の事前トレーニング、ポストトレーニング、テストタイム推論におけるメカニズムである。
本稿では,自己改善のための数学的定式化について述べる。
また、自己改善がいつ可能か、反復的な自己改善手順、その性能改善方法についても検討する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:47:26 GMT)
SegNet4D: Efficient Instance-Aware 4D Semantic Segmentation for LiDAR Point Cloud [10.4] 我々は,新しいリアルタイム4DセマンティックセグメンテーションネットワークであるSegNet4Dを紹介する。
SegNet4Dは4Dセグメンテーションを、シングルスキャンセグメンテーションと移動オブジェクトセグメンテーションの2つのタスクとして扱う。
提案手法は,マルチスキャンセマンティックセマンティックセマンティックセマンティクスと移動物体セマンティクスの両方において最先端技術を上回っている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:09:33 GMT)
An Automated Data Mining Framework Using Autoencoders for Feature Extraction and Dimensionality Reduction [10.4] 本研究では,自動エンコーダに基づく自動データマイニングフレームワークを提案する。
符号化復号構造により、オートエンコーダはデータの電位特性を捕捉し、ノイズの低減と異常検出を実現する。
将来的には,ディープラーニングとビッグデータ技術の進歩に伴い,複雑なデータ処理やリアルタイムデータ解析,知的意思決定といった分野において,GAN(Generative Adversarial Network)やグラフニューラルネットワーク(Graph Neural Network,GNN)と組み合わせたオートエンコーダ方式が広く使われることが期待される。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:04:10 GMT)
Resonance: Learning to Predict Social-Aware Pedestrian Trajectories as Co-Vibrations [10.2] 共振器として歩行者軌跡を予測するための共振器モデルを提案する。
将来の軌跡を3つの異なる振動条件として予測し、エージェントの将来の計画を異なる視点から切り離して表現する。
歩行者であれ車両であれ、複数のデータセットに対する実験は、我々の方法の有用性を定量的にも質的にも検証した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:31:29 GMT)
F-SE-LSTM: A Time Series Anomaly Detection Method with Frequency Domain Information [10.1] F-SE-LSTMと呼ばれる新しい時系列異常検出法を提案する。
この方法は、2つのスライディングウィンドウと高速フーリエ変換(FFT)を用いて周波数行列を構成する。
F-SE-LSTMは、通常の時間領域や周波数領域のデータよりも識別能力が高いことを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:36:24 GMT)
Minimization of Boolean Complexity in In-Context Concept Learning [10.0] タスク性能は概念の複雑さと非常に相関していることを示す。
このことは、文脈内学習が、人間と似た方法で、単純さの学習バイアスを示すことを示唆している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:41:37 GMT)
Decentralized Reliability Estimation for Low Latency Mixnets [9.9] Mixnetsは匿名で、大量のデータパケットをエンドツーエンドのレイテンシでルーティングすることができる。
既存の検証可能性メカニズムは、スケーラブルな低レイテンシ演算と互換性がない。
本研究では,ミキサネットのリンクとノードの信頼性スコアを分散的に推定する手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:39:07 GMT)
Hierarchical Gradient-Based Genetic Sampling for Accurate Prediction of Biological Oscillations [9.9] 生体振動に対するニューラルネットワーク予測の精度を向上させる階層的勾配に基づく遺伝的サンプリング(HGGS)フレームワークを提案する。
実験の結果,HGGSは4つの生体系において7つの比較サンプリング法より優れていた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:17:04 GMT)
Many-MobileNet: Multi-Model Augmentation for Robust Retinal Disease Classification [9.9] 軽量CNNアーキテクチャを用いた網膜疾患分類のための効率的なモデル融合戦略であるMulti-MobileNetを提案する。
本手法は,異なるデータ拡張戦略と異なるモデル複雑度を持つ複数のモデルをトレーニングすることにより,過剰適合や限られたデータセットの変動性といった重要な課題に対処する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:43:39 GMT)
From Isolated Conversations to Hierarchical Schemas: Dynamic Tree Memory Representation for LLMs [9.8] 動的木構造メモリ表現を活用するアルゴリズムであるMemTreeを導入し、情報の組織化、検索、統合を最適化する。
我々のアルゴリズムは、新しい情報や既存の情報のセマンティック埋め込みを比較して、このメモリ構造を動的に適応させ、モデルのコンテキスト認識を強化する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:48:00 GMT)
Robust Fiber Orientation Distribution Function Estimation Using Deep Constrained Spherical Deconvolution for Diffusion MRI [9.6] 測定したDW-MRI信号をモデル化するための一般的なプラクティスは、繊維配向分布関数(fODF)である。
DW-MRIの取得において、測定変数(サイト内およびサイト内変動、ハードウェア性能、シーケンス設計など)は避けられない。
既存のモデルベース手法(例えば、制約付き球面デコンボリューション(CSD))や学習ベース手法(例えば、ディープラーニング(DL))は、fODFモデリングにおいてそのような変動を明示的に考慮していない。
本稿では,データ駆動型深部制約付き球面デコンボリューション法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:24:49 GMT)
Towards Cross-View-Consistent Self-Supervised Surround Depth Estimation [9.6] 連続画像からの自己監督下周深度推定は経済的な代替手段を提供する。
従来のSSSDE法では、画像間で情報を融合する異なるメカニズムが提案されているが、それらのいくつかは、クロスビュー制約を明示的に考慮している。
本稿では,SSSDEのクロスビュー一貫性を高めるために,効率的で一貫したポーズ推定設計と2つの損失関数を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:21:26 GMT)
A Multi-Agent Framework for Extensible Structured Text Generation in PLCs [9.6] IEC 61131-3規格に準拠した高水準言語はPLCにとって重要なものである。
STの完全な意味論に関する包括的で標準化されたドキュメントが欠如していることは、言語の実装方法に矛盾をもたらしている。
ベンダー固有のSTコードの自動生成を目的としたLCMベースのアプローチであるAutoPLCを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:05:56 GMT)
Removing Spurious Correlation from Neural Network Interpretations [9.5] 共同ファウンダーは、このトピックの影響を制御できる新たな因果媒介手法を提案する。
2つの大きな言語モデルを用いた実験では、局所化仮説を検証し、会話トピックの効果に応じて、毒性が局所化されにくくなることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:58:21 GMT)
GIST: Towards Photorealistic Style Transfer via Multiscale Geometric Representations [9.5] GISTは、標準的なNeural Style Transfer自動エンコーディングフレームワークをマルチスケール画像拡張に置き換えている。
本手法は,ウェーブレットやコンチューレットなどの多方向および多方向の表現を最適輸送問題の解法によりマッチングする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:05:39 GMT)
From Machine Learning to Machine Unlearning: Complying with GDPR's Right to be Forgotten while Maintaining Business Value of Predictive Models [9.4] この研究は、Ensemble-based iTerative Information Distillation (ETID)と呼ばれる、総合的な機械学習から学習へのフレームワークを開発する。
ETIDには、データ消去要求の処理を容易にする正確な予測モデルを構築するための、新しいアンサンブル学習手法が組み込まれている。
また, 効率的かつ効率的なデータ消去を実現するために, 構築されたアンサンブルモデルに適した, 蒸留に基づく未学習手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:43:16 GMT)
Diffusion-based Visual Anagram as Multi-task Learning [9.2] 視覚アナグラム(英: visual anagram)とは、回転や回転などの変換によって外観が変化する画像である。
多様な概念にまたがる真のアナグラムを生成する新しい手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:59:28 GMT)
FaaSRCA: Full Lifecycle Root Cause Analysis for Serverless Applications [9.1] FRCAは、サーバレスアプリケーションのための完全なライフサイクル根本原因分析手法である。
Global Call Graphを使用して、プラットフォームとアプリケーション側から生成されたマルチモーダル可観測データを統合する。
スコアに基づいて、サーバレス関数のライフサイクルステージの粒度の根本原因を決定する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:06:29 GMT)
Measuring and Forecasting Conversation Incivility: the Role of Antisocial and Prosocial Behaviors [9.0] 本研究では,ヘイトスピーチに対する回答に続いて,会話の非現実性を測定するための新しい指標を提案する。
ヘイトスピーチに対する回答の後に会話の非現実性レベルを予測することは難しい課題であることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:36:35 GMT)
CLERF: Contrastive LEaRning for Full Range Head Pose Estimation [8.9] 頭部ポーズ推定(HPE)における表現学習のための新しいフレームワークを提案する。
3次元生成対向ネットワーク(3D-Aware GAN)の最近の進歩
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:08:03 GMT)
Ptychographic estimation of pure multiqubit states in a quantum device [8.7] 量子プチコグラフィー(Quantum ptychography)は、未知の純量子状態を重なり合う射影によって推定する方法である。
本稿では,回路ベース量子コンピュータにおける$n$-qubit状態の推定に応用した本手法について述べる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:18:23 GMT)
ROVER: A Multi-Season Dataset for Visual SLAM [8.7] ROVERは、様々な環境条件下で視覚SLAMアルゴリズムを評価するためのベンチマークデータセットである。
5つの屋外に39の録音があり、季節ごとの収集と様々な照明のシナリオがある。
その結果, 立体慣性およびRGB-D構成は, 照度や適度な植生よりも良好であるのに対し, SLAMシステムの多くは低照度・高植生のシナリオでは不十分であることがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:34:00 GMT)
RoboFail: Analyzing Failures in Robot Learning Policies [8.7] 本稿では,ロボット操作ポリシーにおける障害モードの確率を積極的に識別する,深層強化学習ベースのフレームワークRoboFailを提案する。
RoboFailは、障害を起こしやすいシナリオを検出し、その可能性の定量化を目的としており、障害を予測するための構造化されたアプローチを提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:34:51 GMT)
Theory of monochromatic advanced-wave picture and applications in biphoton optics [8.7] クリシュコの進行波画像(AWP)は、主に自発的なパラメトリックダウンコンバージョンにより、非線形結晶が生成する双光子を置き換えることによって解釈される。
我々は,1つの光子の条件波関数が伝搬,乗算,および他の伝播によって計算されるという,単色光を用いたAWPの形式理論を開発した。
我々は、空間分解能などの特性を簡潔に推定できる偏光エンタングルメントを用いて、未検出光子と量子ホログラフィーを用いて量子イメージングを解析する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:15:19 GMT)
Improving Sequential Recommender Systems with Online and In-store User Behavior [8.6] 多様なデータソースからの情報をキャッシュすることで、オンラインおよびインストアのユーザ行動データをコンパイルするためのハイブリッド全チャネルデータパイプラインを提案する。
本稿では,モデルに依存しないエンコーダモジュールをシーケンシャルレコメンデータシステムに導入し,ユーザ・イン・ストア・トランザクションを解釈する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:20:40 GMT)
Constrained LTL Specification Learning from Examples [8.5] 制約学習と呼ばれる新しいタイプの学習問題を提案する。
肯定的な例と否定的な例に加えて、ユーザーは公式の特性に関する1つ以上の制約を指定できる。
実験により、ATLASは、最先端の学習ツールよりも優れた性能を保ちながら、新しいタイプの学習問題を解決することができることを示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:15:27 GMT)
Switchable deep beamformer for high-quality and real-time passive acoustic mapping [8.5] 生成的対向ネットワークに基づくディープビームフォーマを開発する。
無線周波数超音波信号から直接、計算コストの低い高品質なPAM画像を再構成する。
これらの結果は, マイクロバブルキャビテーション活性の高分解能モニタリングのためのディープビームフォーマの可能性を示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:40:59 GMT)
Accelerating Proximal Policy Optimization Learning Using Task Prediction for Solving Environments with Delayed Rewards [8.5] オフラインポリシとオンラインPPOポリシを組み合わせたハイブリッドポリシアーキテクチャと,TWTL(Time Window Temporal Logic)を用いた報酬形成機構の2つを導入する。
我々は,逆振り子と月面着陸機環境に関する広範囲な実験を通じて,我々のアプローチの有効性を実証する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:38:45 GMT)
MLD-EA: Check and Complete Narrative Coherence by Introducing Emotions and Actions [8.1] 感情・行動(MLD-EA)モデルを用いたミス・ロジック・ディテクタを提案する。
物語のギャップを識別し、物語の感情的・論理的流れとシームレスに統合する一貫性のある文を生成する。
この研究はNLP研究のギャップを埋め、より洗練され信頼性の高いストーリージェネレーションシステムを構築するという境界目標を前進させる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:01:21 GMT)
Unveiling Concept Attribution in Diffusion Models [8.0] トレーニングされたモデルはブラックボックスのままで、オブジェクトやスタイルといった概念を示す上でのコンポーネントの役割についてはほとんど分かっていません。
最近の研究では、それらの層がターゲットの概念にどのように貢献するかを示すことなく、生成モデルに知識を格納するレイヤをローカライズするために因果トレースを採用している。
拡散モデルを分解するためにコンポーネント属性を適用し、コンポーネントが概念にどのように貢献するかを明らかにする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:34:49 GMT)
Crash Severity Risk Modeling Strategies under Data Imbalance [8.0] 本研究では,低重度 (LS) と高重度 (HS) の衝突データ不均衡が存在する場合の大規模車両を含む作業区間における事故重大度リスクモデリング戦略について検討した。
2014年から2018年にかけては、サウスカロライナのワークゾーンで大型車両が衝突し、HSの事故の4倍のLSがクラッシュした。
本研究の結果は,クラス不均衡によるLSのクラッシュと,LSとHSのクラッシュの重複により,HSのクラッシュの精度が低く,LSとHSの予測の相違を浮き彫りにした。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:28:35 GMT)
Harmful Fine-tuning Attacks and Defenses for Large Language Models: A Survey [7.9] 近年の研究では、ファインチューニング・アズ・ア・サービス・ビジネスモデルが深刻な安全上の懸念を浮き彫りにしている。
有害な微調整攻撃として知られるこの攻撃は、コミュニティの間で幅広い研究の関心を集めている。
本稿では,有害な微調整の3つの側面,すなわちアタック・セッティング,ディフェンス・デザイン,評価方法論について概観する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:52:11 GMT)
Linearly Homomorphic Signature with Tight Security on Lattice [7.9] 本稿では,選択メッセージアタック(EUF-CMA)下での生存不能に対する厳密なセキュリティを実現する,格子ベースの線形同型シグネチャスキームを構築する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:03:09 GMT)
Verified Foundations for Differential Privacy [7.8] SampCertは、ディファレンシャルプライバシのための、初めての包括的で機械化された基盤です。
これはDPの一般的な概念であり、DP機構の構築と構成のためのフレームワークであり、Laplace と Gaussian のサンプリングアルゴリズムの実装を正式に検証している。
実際、SampCertの検証されたアルゴリズムは、Amazon Web Services(AWS)のDPサービスを動かしている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:53:16 GMT)
The Broader Landscape of Robustness in Algorithmic Statistics [7.6] データセットの汚染、ヘビーテールのデータ、あるいはデータセットのプライバシを保存するという意味での、さまざまな方法において、推定器は堅牢である可能性がある。
同じアルゴリズムのアイデアが、これらのすべての設定において、計算効率の良い推定に繋がることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:44:19 GMT)
Arctic-Embed 2.0: Multilingual Retrieval Without Compromise [7.5] Arctic-Embed 2.0はオープンソースのテキスト埋め込みモデルである。
多言語と英語のみのベンチマークで競争力のある検索品質を提供する。
効率的な埋め込みストレージのためのMatryoshka Representation Learning(MRL)をサポートする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:59:36 GMT)
Exploring the hierarchical structure of human plans via program generation [7.5] 我々は、観測可能な階層表現を持つ実験パラダイムを用いて、人々が階層的に構造化されたプランを構築する方法について検討する。
人間は、実用的シーケンスと最小記述長という2つの確立された人間の行動原理に敏感であることがわかった。
我々は、MDLアカウントをプログラム上の生成モデルに拡張することで、再利用のためのこの好みを定式化する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:22:38 GMT)
An ADHD Diagnostic Interface Based on EEG Spectrograms and Deep Learning Techniques [7.4] 本稿では,脳波(EEG)信号に対する深層学習(DL)技術を用いた注意欠陥・高活動障害(ADHD)診断への革新的アプローチを提案する。
公開されているEEGデータセットを活用して信号をスペクトログラムに変換することで、ADHD分類のための特徴抽出にResnet-18畳み込みニューラルネットワーク(CNN)アーキテクチャを使用した。
モデルでは高い精度、リコール、F1総合スコアは0.9。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:59:35 GMT)
FoveaSPAD: Exploiting Depth Priors for Adaptive and Efficient Single-Photon 3D Imaging [7.4] 単一光子アバランシェダイオード(SPAD)は、極度感度や時間分解能などの多くの利点を提供する新興のイメージセンシング技術である。
本稿では,信号対雑音比(SNR)を向上し,計算とメモリ効率を向上させる新しいアルゴリズムとセンシングポリシーを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:20:01 GMT)
Susceptibility of entanglement entropy: a universal indicator of quantum criticality [7.3] 量子系における絡み合いエントロピーの感度の尺度が提案され,その情報源が議論されている。
2つの正確に解けるスピン系に対して、熱力学的臨界性は、大域極大の有限サイズのスケーリングによって直接テクスタイズされることが示されている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:04:58 GMT)
Graph-Powered Defense: Controller Area Network Intrusion Detection for Unmanned Aerial Vehicles [7.3] 無人航空機(UAV)はサイバー攻撃に対して、特に制御エリアネットワーク(CAN)バスでは十分に頑丈ではない。
本研究では,新しいグラフベースの侵入検知システムを開発することにより,UAVの最も重要なセキュリティ脆弱性を解決することに注力する。
我々は,CANバス上でのサイバー攻撃を検出するために,様々なグラフベース機械学習モデルを適用した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:32:57 GMT)
Efficient Graph Matching for Correlated Stochastic Block Models [7.3] 2つのバランスの取れたコミュニティを持つ相関ブロックモデルの学習問題について検討する。
我々の主な成果は、この設定におけるグラフマッチングのための最初の効率的なアルゴリズムである。
我々はこれを情報理論的に可能であれば、正確なグラフマッチングのための効率的なアルゴリズムに拡張する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:36:45 GMT)
On Simplifying Large-Scale Spatial Vectors: Fast, Memory-Efficient, and Cost-Predictable k-means [7.2] k平均アルゴリズムは、高速な解析と学習をサポートするために、2Dジオロケーションや3Dポイントクラウドのような大規模な空間ベクトルを単純化することができる。
既存のk平均アルゴリズムは、メモリやCPU使用時間などの重要な計算資源で高い性能を達成する。
本稿では,Dsk-meansと呼ばれる高速で,メモリ効率が高く,コスト予測可能なk-meansを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:16:59 GMT)
Social Media Informatics for Sustainable Cities and Societies: An Overview of the Applications, associated Challenges, and Potential Solutions [7.2] ソーシャルメディアのインフォマティクスは、様々な持続可能な都市や社会の応用において非常に効果的であることが証明されている。
本稿では,その応用,課題,潜在的な解決策について概説する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:53:32 GMT)
Hyperspectral Images Efficient Spatial and Spectral non-Linear Model with Bidirectional Feature Learning [7.1] 本稿では,分類精度を高めつつ,データ量を大幅に削減する新しいフレームワークを提案する。
本モデルでは,空間特徴解析のための特殊ブロックによって補完されるスペクトル特徴を効率よく抽出するために,双方向逆畳み込みニューラルネットワーク(CNN)を用いる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:46:05 GMT)
HSLiNets: Hyperspectral Image and LiDAR Data Fusion Using Efficient Dual Non-Linear Feature Learning Networks [7.1] 新しい線形特徴空間におけるハイパースペクトルイメージング(HSI)とLiDARデータの統合は、HSIに固有の高次元性と冗長性に起因する課題に対する有望な解決策を提供する。
本研究では、双方向逆畳み込み畳み込みニューラルネットワーク(CNN)経路と特殊空間解析ブロックを併用した、二重線型融合空間フレームワークを提案する。
提案手法は,データ処理や分類精度を向上するだけでなく,トランスフォーマーなどの先進モデルに係わる計算負担を軽減する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:07:52 GMT)
Filtered Direct Preference Optimization [7.1] 人間からのフィードバックからの強化学習(RLHF)は、言語モデルと人間の嗜好の整合において重要な役割を果たす。
本稿では、直接選好最適化(DPO)に着目して、選好データセットにおけるテキスト品質の問題に対処する。
フィルタされた直接選好最適化(fDPO)と呼ばれるDPOの拡張を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:22:01 GMT)
An Adaptive Grasping Force Tracking Strategy for Nonlinear and Time-Varying Object Behaviors [7.1] 本稿では、一般化剛性の概念を導入し、剛性の定義を非線形時間変動グリップシステムモデルに拡張する。
提案手法は,非理想的対象への適応性を向上しつつ,高精度かつ短い探索時間を実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:55:00 GMT)
EgoCast: Forecasting Egocentric Human Pose in the Wild [7.1] EgoCastは、エゴセントリックなビデオとプロプリセプティブなデータを用いて、人間の3Dポーズ予測のためのバイモーダルな方法である。
Ego-Exo4D Body Pose 2024 Challengeにおいて,本手法は最先端のアプローチよりも優れていた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:11:06 GMT)
Vector Optimization with Gaussian Process Bandits [7.0] 複数の目的を同時に考慮しなければならない学習問題は、工学、薬物設計、環境管理など、様々な分野においてしばしば発生する。
複数のブラックボックスの目的関数を扱う従来の方法は、目的の選好を取り入れ、それに応じて解空間を探索することに制限がある。
ガウス過程の帯域幅を用いてブラックボックスベクトル最適化を行う適応除去アルゴリズムであるガウス過程を用いたベクトル最適化(VOGP)を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:47:46 GMT)
Burning RED: Unlocking Subtask-Driven Reinforcement Learning and Risk-Awareness in Average-Reward Markov Decision Processes [7.0] 平均回帰マルコフ決定プロセス(MDPs)は、不確実性の下でのシーケンシャルな意思決定の基盤となる枠組みを提供する。
平均再帰型MDPのユニークな構造特性を考察し,これを用いてReward-Extended Differential (RED) 強化学習を導入する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:26:09 GMT)
Active learning of neural population dynamics using two-photon holographic optogenetics [7.0] 神経集団動態を同定するための最も効果的な光刺激パターンを決定する方法を開発した。
我々は、実データと合成データの両方にアプローチを示し、いくつかのケースでは、所定の予測力に到達するために必要なデータの量を2倍に減らすことができる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:21:53 GMT)
Noisy Ostracods: A Fine-Grained, Imbalanced Real-World Dataset for Benchmarking Robust Machine Learning and Label Correction Methods [7.0] ノイズ・オストラコズ・データセット(Noisy Ostracods dataset)は、甲殻類オストラコズの属と種分類のためのノイズの多いデータセットである。
ノイズはオープンセットで、オリジナルのアノテーションの一部ではないキュレーション中に発見された新しいクラスを含む。
Noisy Ostracodsデータセットは、不均衡係数$rho$ = 22429と非常に不均衡である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:30:57 GMT)
HumanRig: Learning Automatic Rigging for Humanoid Character in a Large Scale Dataset [7.0] 我々は3次元ヒューマノイドキャラクタリギング用に特別に設計された最初の大規模データセットであるHumanRigを紹介する。
本稿では,GNN方式の限界を克服する,革新的なデータ駆動型自動リギングフレームワークを提案する。
この作業は、リギング研究におけるデータセット不足を修復するだけでなく、アニメーション産業をより効率的かつ自動化されたキャラクタリギングパイプラインへと発展させる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:33:00 GMT)
Rethinking Self-Supervised Learning Within the Framework of Partial Information Decomposition [7.0] 自己監督学習は、ラベルなしデータからの特徴学習において、その効果を実証している。
部分情報分解(PID)フレームワークにおけるSSLの中核的な考え方を再考することを提案する。
PIDの下でSSLを用いることで、従来の相互情報をより一般的な相互情報の概念に置き換えることを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:20:12 GMT)
GUESS: Generative Uncertainty Ensemble for Self Supervision [7.0] 自己教師付き学習(SSL)フレームワークは、プレテキストタスクと、ラベルのないデータから有用な汎用機能を学ぶことを目的としたロス関数で構成されている。
あらゆる種類のデータ拡張に対する不変性の意図しないあるいは決定的な強制は、一般的に非効率であるだけでなく、下流のタスクのパフォーマンスに有害な可能性がある。
我々は、制御された不確実性注入、新しいアーキテクチャ、新しい損失関数からなる擬似白化フレームワークであるGUESSを導入する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:59:23 GMT)
Direct Coloring for Self-Supervised Enhanced Feature Decoupling [7.0] 表現学習を改善するために,特徴分離による白化を補完する手法を検討する。
特に、注意深い特徴着色による有用な特徴の早期促進による特徴分離を行う。
提案手法は, コントラスト法と非コントラスト法を両立させながら, 最先端技術と相補的であることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:05:41 GMT)
A Physics-embedded Deep Learning Framework for Cloth Simulation [6.9] 本稿では,布地シミュレーションの物理特性を直接エンコードする物理組込み学習フレームワークを提案する。
このフレームワークは、従来のシミュレータやサブニューラルネットワークを通じて、外部の力や衝突処理と統合することもできる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:15:15 GMT)
Explainable CTR Prediction via LLM Reasoning [6.8] 大規模言語モデルに基づく説明生成をCTR予測プロセスに直接組み込む新しいフレームワークであるExpCTRを提案する。
ExpCTRは3つの実世界のデータセット間のレコメンデーション精度と解釈可能性の両方を著しく向上させることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:17:27 GMT)
MERGE: Multi-faceted Hierarchical Graph-based GNN for Gene Expression Prediction from Whole Slide Histopathology Images [6.7] MERGE(Multifaceted hiErarchical gRaph for Gene Expressions)を導入し、階層グラフ構築戦略とグラフニューラルネットワーク(GNN)を組み合わせて、スライド画像全体の遺伝子発現予測を改善する。
組織像パッチを空間的特徴と形態的特徴の両方に基づいてクラスタリングすることにより,GNN学習における遠隔組織間の相互作用を促進する。
さらに,STデータ中のアーティファクトを緩和するために必要な異なるデータ平滑化技術の評価を行った。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:32:05 GMT)
Grand Challenges on Immersive Technologies for Cultural Heritage [6.7] 没入型技術の統合は、文化遺産の提示方法を変えてきた。
これらのテクノロジの採用は、さまざまな課題や潜在的なリスクをもたらします。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:39:01 GMT)
UTBoost: Gradient Boosted Decision Trees for Uplift Modeling [6.5] 確立されたGBDT(Gradient Boosting Decision Trees)技術に2つの新しい修正を加えた。
これらの修正は因果効果を順次学習し、反事実ジレンマに対処する。
大規模データセットを用いた実験により,本手法の有効性が検証された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:26:53 GMT)
Scrambling Transition in Free Fermion Systems Induced by a Single Impurity [6.5] 量子多体系では、相互作用は情報の揺らぎの出現において重要な役割を果たす。
フェルミオンの相互作用強度を3次元で調整する際のエスケープ・トゥ・スクラミング・トランジションを示す。
我々の予測は、サイトごとに1つのマヨラナフェルミオンを持つブラウン回路と、大きな局所ヒルベルト空間次元を持つ可解ブラウンSYKモデルの両方を用いて検証される。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:50:42 GMT)
Defending Against Diverse Attacks in Federated Learning Through Consensus-Based Bi-Level Optimization [6.5] 敵対的攻撃は、多くの機械学習アプリケーションに重大な課題をもたらす。
我々は, 対角的条件下でのコンセンサスに基づく二段階最適化(CB$2$O)のレジリエンスを理論的に解析する。
我々は,相互作用する新しい多粒子系であるFedCB$2$Oを提案し,実世界のアプリケーションの要求に対処する実用的なアルゴリズムを設計する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:26:56 GMT)
Revisiting the Initial Steps in Adaptive Gradient Descent Optimization [6.5] Adamのような適応的な勾配最適化手法は、さまざまな機械学習タスクにわたるディープニューラルネットワークのトレーニングで広く使われている。
これらの手法は、降下勾配 (SGD) と比較して最適下一般化に苦しむことが多く、不安定性を示す。
非ゼロ値で2階モーメント推定を初期化する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:28:14 GMT)
Zero-shot forecasting of chaotic systems [6.4] 多様なドメインからの膨大な時系列データに基づいて事前訓練されたファンデーションモデル。
ゼロショット学習パラダイムがカオスシステムを予測する困難な課題に拡張されるかどうかを評価する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:41:01 GMT)
ShapeWords: Guiding Text-to-Image Synthesis with 3D Shape-Aware Prompts [6.4] ShapeWordsは3D形状誘導とテキストプロンプトに基づいて画像を合成するアプローチである。
ShapeWordsは入力テキストに埋め込まれた特別なトークンにターゲットの3D形状情報を組み込む。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:37:47 GMT)
QA-TOOLBOX: Conversational Question-Answering for process task guidance in manufacturing [6.4] このデータセットは、先進的な製造環境で作業する技術者とのインタラクションの代表的なサンプルで構成されている。
データセットは20万以上の質問/回答のペアで構成されており、仕様文書を参照し、ナレーションやビデオデモに基づいている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:10:31 GMT)
Explainable Data-driven Modeling of Adsorption Energy in Heterogeneous Catalysis [6.3] 本研究の目的は,物理研究とデータ駆動手法のギャップを埋めることである。
我々は、ポストホックXAI分析とシンボリック回帰という2つのXAI技術を採用している。
私たちの仕事は、機械学習技術とXAIを統合する堅牢なフレームワークを確立します。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:07:05 GMT)
Decoupling Dark Knowledge via Block-wise Logit Distillation for Feature-level Alignment [6.2] 知識蒸留(英: Knowledge Distillation、KD)は、暗黒の知識を教師から学生にロジットや中間的特徴を通じて伝達する。
最近の研究は、ロジットベースの手法の可能性を明らかにし、ロジットに基づく単純なKDフォームをライムライトに戻す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:28:43 GMT)
Recovering implicit physics model under real-world constraints [6.2] 実世界のデータから物理力学の基盤モデルを復元するために,新しい液相定数ニューラルネットワーク(LTC-NN)アーキテクチャを提案する。
LTC-NNアーキテクチャは、最先端スパースモデル回復アプローチよりも暗黙の物理モデル係数を復元する上でより正確である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:11:21 GMT)
Harnessing Multiple Correlated Networks for Exact Community Recovery [6.1] 複数の相関ネットワークから潜在コミュニティ構造を学習する問題について検討する。
Gaudio、R'acz、Sridhar(COLT 2022)の最近の研究により、正確なコミュニティ回復のための正確な情報理論しきい値が決定された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:56:52 GMT)
GerPS-Compare: Comparing NER methods for legal norm analysis [6.1] クラス検出のためのNER(Named Entity Recognition)の3つの手法について検討・比較を行った。
深層判別モデルは、ルールベースシステムと深部生成モデルの両方より優れている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:46:06 GMT)
Adaptive Two-Phase Finetuning LLMs for Japanese Legal Text Retrieval [6.1] 本稿では,日本語の法的文脈に特化して設計された新しいデータセットを提案する。
第一段階では、このモデルはグローバルな文脈を広く理解し、その一般化を強化する。
第2段階では、モデルは法的なシナリオに特有の複雑なクエリに対処するように微調整される。
我々のパイプラインは英語の文脈で有効であることが証明され、MS MARCOデータセットのベースラインに匹敵する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:52:49 GMT)
Generating Critical Scenarios for Testing Automated Driving Systems [6.0] AVASTRAは、自律運転システムをテストするための現実的な重要なシナリオを生成するための強化学習ベースのアプローチである。
その結果、AVASTRAは、30%から115%の衝突シナリオを発生させることで、最先端のアプローチを上回る能力を示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:59:30 GMT)
COMET:Combined Matrix for Elucidating Targets [6.0] マルチテクノロジカルなモジュラーターゲット予測ツールであるCOMETを紹介する。
厳密にキュレートされたデータでは、COMETデータベースは990,944個のドラッグとターゲットの相互作用ペアと45,035個の結合ポケットを含んでいる。
比較テストでは、COMETは他の5つのよく知られたアルゴリズムより優れており、少なくとも1つの真のターゲットを正確に特定する確率は80%近くである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:29:47 GMT)
Trustful LLMs: Customizing and Grounding Text Generation with Knowledge Bases and Dual Decoders [5.9] 本稿では,RAGコンテキストにおける知識三重項を利用して幻覚を補正する後処理アルゴリズムを提案する。
また、RAGコンテキストを融合して生成プロセスを導出するデュアルデコーダモデルを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:04:10 GMT)
Mixed-state phase transitions in spin-Holstein models [5.9] この研究は、混合状態相の概念を結合電子/スピンフォノン系の領域に拡張することを目的としている。
任意の結合強度を持つ単一ボソニックモードの集合に局所的に結合する2次元クラスタハミルトニアンを考える。
両測度は、異なる臨界スピン-フォノン結合強度ではあるものの、混合状態相転移のシグネチャを検出する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:10:10 GMT)
Differentially Private Algorithms for Graph Cuts: A Shifting Mechanism Approach and More [5.9] マルチウェイカットと最小$k$cutのためのエッジ微分プライベートアルゴリズムを導入する。
最小$k$-cut問題に対して、指数的メカニズムと近似$k$-cutの数の有界性を組み合わせた別のアプローチを用いる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:25:05 GMT)
ASANet: Asymmetric Semantic Aligning Network for RGB and SAR image land cover classification [5.9] 特徴レベルでの非対称性の問題に対処するため,非対称セマンティックアライニングネットワーク (ASANet) という新しいアーキテクチャを提案する。
提案するASANetは,2つのモード間の特徴相関を効果的に学習し,特徴差によるノイズを除去する。
我々は、新しいRGB-SARマルチモーダルデータセットを構築し、ASANetは1.21%から17.69%の改善で他の主流メソッドよりも優れています。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:03:33 GMT)
Memory-efficient Continual Learning with Neural Collapse Contrastive [5.8] コントラスト学習は表現品質を大幅に改善し、連続学習(CL)におけるタスク間の知識伝達を高めた
しかし、対照的な手法は主にサンプル間の「ソフトな関係」や「ソフトな関係」に焦点を当てているため、破滅的な忘れは依然として重要な課題である。
本稿では,ソフトな関係とハードな関係を効果的にバランスさせる新しい表現学習損失であるFNC2を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:00:12 GMT)
Towards the efficacy of federated prediction for epidemics on networks [5.7] 我々は、フェデレートラーニング(FL)に基づく疫病ネットワーク上のノードレベルの予測のための一般的なプライバシレベルフレームワークを開発する。
本研究は,疫病管理におけるFLシナリオの有効性に関する実践的な知見を提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:37:28 GMT)
STORM: Strategic Orchestration of Modalities for Rare Event Classification [5.7] 希少事象に対するモダリティ選択問題を解くために,エントロピーに基づくアルゴリズムを提案する。
モダリティの有用なサブセットを選択することで、私たちのアプローチはより効率的なAI駆動バイオメディカル分析の道を開いた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:17:39 GMT)
Neuro-Symbolic Evaluation of Text-to-Video Models using Formal Verification [5.5] 我々は,新しい合成ビデオ評価指標であるNeuS-Vを紹介する。
NeuS-Vは、ニューロシンボリック形式検証技術を用いて、テキストとビデオのアライメントを厳格に評価する。
既存の指標と比較すると,NeuS-Vは5倍以上の相関性を示すことがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:56:47 GMT)
Impact of Data Snooping on Deep Learning Models for Locating Vulnerabilities in Lifted Code [5.4] この研究は、モデルがデータセットでトレーニングされているとき、モデルのパフォーマンスがどのように影響を受けるかに焦点を当てている。
その結果,データスヌーピングの導入はモデル性能を著しく変化させることはなかった。
さらに、この結果は、GPT-2埋め込みでトレーニングされたモデルが、他の埋め込みでトレーニングされたニューラルネットワークよりも一貫して優れていたという過去の研究の結論を補強する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:08:01 GMT)
Intelligent Go-Explore: Standing on the Shoulders of Giant Foundation Models [5.4] Go-Exploreは、ハード探索問題を解決するために設計されたアルゴリズムの強力なファミリーである。
本稿では,従来のGo-Exploreの範囲を大きく広げる,インテリジェントなGo-Exploreを提案する。
IGEには人間のような能力があり、新しい状態がいかに面白く、あるいは有望であるかを直感的に識別する能力がある。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:43:39 GMT)
Phase-Informed Tool Segmentation for Manual Small-Incision Cataract Surgery [5.3] 白内障手術は世界中で最も一般的な手術であり、発展途上国では非常に高い負担がかかる。
現存する研究は主にパコ白内障手術に焦点を当てており、白内障治療が最も必要とされる地域では利用できない高価な技術である。
手動小切開白内障手術(英: Manual Small-Incision Cataract Surgery, MICS)は、手動小切開白内障手術(英語版) (MSICS) が好まれる低コストで高速な手術法である。
今回紹介するSankara-MSICSは,3,527フレームと3,527フレームの3,53本の手術用ビデオを含む,最初の包括的データセットである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:24:18 GMT)
BOTracle: A framework for Discriminating Bots and Humans [5.3] ボットはインターネットトラフィックの重要な部分を占め、複数のドメインにまたがる様々な問題の原因となっている。
我々は,3つの異なる検出手法を解析することにより,高トラフィックシナリオにおけるボット検出の課題を分析する。
精度、リコール、AUCなどのパフォーマンス指標は98%以上に達し、Botchaを上回っています。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:38:30 GMT)
Prithvi-EO-2.0: A Versatile Multi-Temporal Foundation Model for Earth Observation Applications [5.3] Prithvi-EO-2.0は、新しい地理空間基盤モデルであり、前者よりも大幅に改善されている。
これは、NASAのハーモナイズド・ランドサットとセンチネル2のデータアーカイブから、30m解像度で4.2Mのグローバル時系列サンプルで訓練されている。
6億バージョンは以前のPrithvi-EOモデルより8%上回っている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:59:50 GMT)
Federated Analytics in Practice: Engineering for Privacy, Scalability and Practicality [5.3] Cross-Device Federated Analytics (FA)は、分析クエリに回答し、ユーザのデバイス上でローカルに保持されたデータから洞察を引き出すように設計された分散計算パラダイムである。
FAの幅広い関連性にもかかわらず、既存のFAシステムの適用性は、妥協された正確さ、データ分析の柔軟性の欠如、効果的にスケールできないことによって制限されている。
プライバシ、スケーラビリティ、実用性を組み合わせて、これらの制限を克服したシステムを構築し、デプロイするアプローチについて説明します。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:03:12 GMT)
Blockchain-Enabled Device-Enhanced Multi-Access Edge Computing in Open Adversarial Environments [5.3] デバイス強化マルチアクセスエッジコンピューティング(BdMEC)
BdMECは、ブロックチェーン技術によるオンデマンドリソースプールのためのHoneybeeフレームワークを拡張して、デバイス間の信頼性、セキュリティ、説明責任を保証する(異なるパーティが所有している場合でも)。
本稿では,BdMECが分散コンピューティングタスクを複数のデバイスで効率的に,かつ安全に管理できることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:01:30 GMT)
Learning from Concealed Labels [5.2] 複数クラス分類のための隠れラベルから学習する,各インスタンスのプライバシ保護のための新しい設定を提案する。
ラベル収集段階では、機密ラベルがラベルセットに現れるのを防止し、機密データを注釈付けするための隠蔽ラベルとしてランダムにサンプリングされた無機密ラベルを指定しない。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:00:19 GMT)
Quantum search algorithm on weighted databases [5.2] グロバーアルゴリズムは非構造化探索問題に対処するための重要な解法である。
本研究は,非一様分散データベースにおけるGroverの探索手法を幅広く検討する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:46:42 GMT)
DFRot: Achieving Outlier-Free and Massive Activation-Free for Rotated LLMs with Refined Rotation [5.2] 共通トークンの外れ値を取り除き、類似の量子化誤差を実現することにより、大幅な改善が得られた。
これらのトークンの極端に希少性があり、それらの重要な影響がモデル精度に与える影響から、単純で効果的な方法である重み付き損失関数を構築した。
本手法は,DFRotと呼ばれる2自由度,外周自由度,質量活性度を両立させることにより回転LDMを向上する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:14:31 GMT)
Segmentation of Coronary Artery Stenosis in X-ray Angiography using Mamba Models [5.1] 本研究は,マンバ型モデルとスウィントランスフォーマー型モデルの5つの変種を用いる。
結果は、U-Mamba BOTモデルのF1スコアが68.79%で、半教師付きアプローチよりも11.8%改善したことを示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:54:46 GMT)
The Asymptotic Behavior of Attention in Transformers [5.1] 変換器の注意特性を厳密に数学的に解析する。
異なる仮定に基づくいくつかの結果を示すが、いずれも同じ結論を示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:54:49 GMT)
Optical losses as a function of beam position on the mirrors in a 285-m suspended Fabry-Perot cavity [5.1] 損失は、圧縮された真空の劣化の主な原因である。
空洞内では複数のラウンドトリップを行うため、サスペンションビームの損失は特に有害である。
このような損失を特徴づけることは、達成可能な量子ノイズ低減を評価するために不可欠である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:27:50 GMT)
PolarBEVDet: Exploring Polar Representation for Multi-View 3D Object Detection in Bird's-Eye-View [5.0] カルテシアンBEV表現の代替として極性BEV表現を用いることを提案する。
nuScenesの実験では、PolarBEVDetは優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:39:11 GMT)
ESA: Example Sieve Approach for Multi-Positive and Unlabeled Learning [5.0] マルチクラス分類器を訓練するサンプルを選択するための例 Sieve Approach (ESA) を提案する。
具体的には、トレーニング段階で各サンプルのCertain Loss(CL)値を利用することで、いくつかの例を抽出する。
提案したESAの推定誤差は最適パラメトリック収束率が得られることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:09:06 GMT)
Cooperative Cruising: Reinforcement Learning based Time-Headway Control for Increased Traffic Efficiency [5.0] 本稿では,高速道路の交通効率を人的交通と比較して初めて向上させる新しいAIシステムを提案する。
私たちのアプローチの核心は強化学習ベースのコントローラで、自動走行車に動的にタイムヘッドを通信します。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:13:42 GMT)
Reinforcement learning to learn quantum states for Heisenberg scaling accuracy [5.0] 量子状態の学習プロセスの最適化に強化学習(RL)を用いるメタラーニングモデルを提案する。
量子状態の学習には、進化戦略(ES)と呼ばれるブラックボックス最適化アルゴリズムを用いてハードウェア効率の良いアンサッツを訓練する。
RLエージェントはランダムな量子状態の学習のサンプル効率を大幅に改善し、不忠実さはハイゼンベルク限界に近いスケーリングを達成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:53:32 GMT)
SJTU:Spatial judgments in multimodal models towards unified segmentation through coordinate detection [4.9] 本稿では,マルチモーダルモデルにおける空間的判断 -座標検出による統一セグメンテーションを目指して-
マルチモーダル空間推論に基づく視覚言語モデルとのセグメンテーション手法の統合手法を提案する。
提案した技術的アプローチに基づいて、このフレームワークは様々なベンチマークデータセットと正確なオブジェクトセグメンテーションで優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:53:58 GMT)
EnrichEvent: Enriching Social Data with Contextual Information for Emerging Event Extraction [4.9] 本稿では,ストリーミングソーシャルデータの言語的および文脈的表現を活用する新しいフレームワークであるEnrichEventを提案する。
提案するフレームワークは,イベントの時間的変化を示すために,各イベントのクラスタチェーンを生成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:18:20 GMT)
Partial Non-rigid Deformations and interpolations of Human Body Surfaces [4.9] PaNDASは最近の深層モデルに基づいて3次元表面メッシュの局所的および大域的変形を学習する新しい手法である。
提案手法は, 新たな形状を生成し, 部品間を補間し, その他の形状操作を行うために有効であることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:21:04 GMT)
FathomGPT: A Natural Language Interface for Interactively Exploring Ocean Science Data [4.9] 本稿では,自然言語インタフェースによる海洋科学データのインタラクティブな調査を行うオープンソースシステムであるFathomGPTを紹介する。
FathomGPTは、FathomNetイメージデータベースの探索と解析を可能にするために、海洋科学者と緊密に協力して開発された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:22:55 GMT)
$ρ$-NeRF: Leveraging Attenuation Priors in Neural Radiance Field for 3D Computed Tomography Reconstruction [4.8] $rho$-NeRFは、新しいビュー合成(NVS)とCT(Computerd tomography)再構成の新しい標準を設定する。
$rho$-NeRFは、完全に接続されたニューラルネットワークを介して3次元の3Dボリュームを表す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:06:26 GMT)
Probabilistic Medical Predictions of Large Language Models [4.8] LLM(Large Language Models)は、プロンプトエンジニアリングによる臨床応用において有望であることを示す。
LLMは、透明性と意思決定に不可欠である信頼性の高い予測確率を生み出すのに苦労している。
テキスト生成からの明示的確率と、正しいラベルトークンを予測する可能性から得られた暗黙的確率を比較した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:54:39 GMT)
The Problem of Social Cost in Multi-Agent General Reinforcement Learning: Survey and Synthesis [4.8] マルチエージェント環境における学習エージェントとユーティリティ最大化エージェントの行動から生じる社会的害の問題を考察する。
このような社会的損害のコストを定量化し、制御するための市場ベースメカニズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:22:55 GMT)
Cross-Attention Head Position Patterns Can Align with Human Visual Concepts in Text-to-Image Generative Models [4.7] 本稿では,頭部関連ベクトル(HRV)を視覚的に有用な概念と整合させる手法を提案する。
与えられた視覚的概念に対するHRVは、各要素が与えられた視覚的概念に対する対応する頭部の重要性を表すクロスアテンションヘッドの総数に等しい長さのベクトルである。
画像生成における多文単語の誤解釈は,ほとんどの場合修正可能であり,画像編集における5つの困難な属性の修正が成功し,マルチコンセプト生成における無視が軽減できることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:05:56 GMT)
Active Learning via Classifier Impact and Greedy Selection for Interactive Image Retrieval [4.7] Active Learning(AL)は,ラベル付けに最も重要な例を選択することで,アノテーションコストの削減を目的とした,ユーザインタラクションのアプローチである。
我々はGAL(Greedy Active Learning)と呼ばれる新しいバッチモードアクティブラーニングフレームワークを導入し、このアプリケーションに対処する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:27:46 GMT)
Low-power SNN-based audio source localisation using a Hilbert Transform spike encoding scheme [4.5] 音源の定位は、個々の話者から音声を分離し、ノイズを除去するために、多くの消費者デバイスで使われている。
広帯域オーディオから狭帯域信号成分を得るには、高密度帯域通過フィルタが必要であることが多い。
超低消費電力スパイキングニューラルネットワーク(SNN)の効率的な実装を目的とした任意のマイクロホンアレイ上の音源定位手法を実証する。
提案手法は,従来の非SNN超解像ビームフォーミングに匹敵する,SNN法における最先端の精度を実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:23:38 GMT)
Inverse design of potential metastructures inspired from Indian medieval architectural elements [4.5] 特別に私たちを農耕したモチーフは、タジ・マハルに近いアグラ市にあるイティマド・ドゥ・ダウラの墓に由来する。
添加物製造法を用いて構造を作製し, その振動特性を実験的, 数値的に検討した。
これらの構造パネルの包括的研究により、弾性波伝搬の制御と適切な周波数帯域の生成における高い性能が明らかとなった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:02:11 GMT)
Generative Photography: Scene-Consistent Camera Control for Realistic Text-to-Image Synthesis [4.5] 本稿では、コンテンツ生成時のカメラ固有の設定を制御するためのフレームワーク、Generative Photographyを紹介した。
実験結果から,本手法は最先端モデルよりもシーン一貫性のあるフォトリアリスティック画像を生成することがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:55:02 GMT)
Can I do it [4.5] 本稿では、オンシステムエンジニアリング、システムコンポーネント間の接続に関する推論的推論、および現在のシステム構成におけるこれらのコンポーネントのパフォーマンスに関する帰納的推論を組み合わせた知識表現を紹介する。
我々の現実的な実装は、望まれるパフォーマンスで特定のタスクをこなせるかどうかという疑問に答えられるロボットを示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:54:49 GMT)
Enhancing Trust in LLM-Generated Code Summaries with Calibrated Confidence Scores [4.4] 優れた要約は、しばしばプログラムの理解において非常に有用である。
多くの場合、ソフトウェアプロジェクトでは優れた要約が利用できないため、メンテナンスがより困難になる。
我々は,Large Language Model (LLMs) を用いたAIベースの手法が,人間が生成したであろう要約にどのように似ているかを検討する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:53:19 GMT)
Words and Action: Modeling Linguistic Leadership in #BlackLivesMatter Communities [4.4] 我々は#BlackLivesMatter運動に関連するコミュニティ間のセマンティックリーダーシップをモデル化する手法について述べる。
我々は、BLM活動家や進歩主義者の指導的役割と黒人有名人の実質的な証拠を見出した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:10:28 GMT)
3D Face Reconstruction From Radar Images [4.4] レーダ画像からの3次元再構成のための新しいモデルベース手法を提案する。
物理に基づくが微分不可能なレーダを用いた合成レーダ画像のデータセットを生成する。
このデータセットは、CNNベースのエンコーダをトレーニングし、3D形態素顔モデルのパラメータを推定するために使用される。
モデルベースオートエンコーダに解析バイシンセシス方式で再構築を行う。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:53:05 GMT)
Understanding Representation of Deep Equilibrium Models from Neural Collapse Perspective [4.4] 我々は、バランスの取れた状態と不均衡な状態の両方において、DECの表現を体系的に解析するツールとして、Neural Collapse(mathcalNC$)を使用している。
マイノリティ崩壊が存在するにもかかわらず、DEC に $mathcalNC$ が存在することを示す。
不均衡な環境では、マイノリティ崩壊があるにもかかわらず、DECは明示的なニューラルネットワークよりも有利であることを示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:43:27 GMT)
MVCTrack: Boosting 3D Point Cloud Tracking via Multimodal-Guided Virtual Cues [4.3] 3Dオブジェクトトラッキングは、自律走行とロボット工学において不可欠である。
既存の方法は、しばしばスパースと不完全なポイントクラウドのシナリオで苦労する。
疎点雲を豊かにする仮想キューを生成するマルチモーダル誘導仮想キュー投影方式を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:18:33 GMT)
Geographical Information Alignment Boosts Traffic Analysis via Transpose Cross-attention [4.3] 地理情報アライメント(GIA)と呼ばれる共通GNNフレームワーク用のプラグイン・アンド・プレイモジュールを提案する。
このモジュールは、新しいTranspose Cross-attentionメカニズムを介して、ノード特徴と地理的位置情報を効率的に融合させることができる。
本手法では,F1スコアの1.3%から10.9%,AUCの0.3%から4.8%の利得が得られる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:04:49 GMT)
Theory building for empirical software engineering in qualitative research: Operationalization [4.3] 本稿では,理論構築における運用フェーズを体系化する一連の手順を提案する。
我々は、我々の理論を構成する概念と命題を運用し、構成物と経験的に検証可能な仮説を生成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:15:27 GMT)
Grid-augmented vision: A simple yet effective approach for enhanced spatial understanding in multi-modal agents [4.2] 本稿では,単純なグリッドオーバーレイ手法を用いて,視覚的位置を明示的に符号化する手法を提案する。
本手法は,トランスにおける位置符号化の動作に類似した視覚的空間的ガイダンスを提供する。
提案手法の単純さと有効性は,空間的推論の正確性を必要とするアプリケーションにとって特に有用である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:26:18 GMT)
3D representation in 512-Byte:Variational tokenizer is the key for autoregressive 3D generation [4.2] 変分トークン化器(VAT)は、無秩序な3Dデータを暗黙の階層を持つコンパクトな潜在トークンに変換する。
VATはスケーラブルで効率的な3D生成を可能にする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:31:25 GMT)
Learning Koopman-based Stability Certificates for Unknown Nonlinear Systems [4.2] 未知非線形系のベクトル場とリアプノフ関数を同時に学習するアルゴリズムフレームワークを提案する。
学習したリアプノフ関数は、満足度モジュロ理論(SMT)の解法を用いて形式的に検証可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:18:24 GMT)
Tomographic SAR Reconstruction for Forest Height Estimation [4.2] 樹高推定は、生態学および森林学の応用において、バイオマス推定の重要な指標となる。
本研究では,SAR(Synthetic Aperture Radar)の派生である2Dシングルルックコンプレックス(SLC)画像から直接,深層学習を用いて林冠の高さを推定する。
本手法は,従来のトモグラフィ信号処理を回避し,SARキャプチャからエンド製品への遅延を低減する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:32:27 GMT)
Quantum sensitivity of parametric oscillators [4.2] 任意の初期状態の量子統計は、初期状態のダイナミックスにインプリントされ、定常状態の確率で持続可能であることを示す。
我々の研究は、マクロなシステムの量子初期状態に対する感度をテストできる新しい種類の実験への道を開く。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:46:12 GMT)
MarineFormer: A Spatio-Temporal Attention Model for USV Navigation in Dynamic Marine Environments [4.1] 海洋環境における自律的な航行は、USVにとって大きな課題となる。
本研究では,空間的注意と時間的注意という2つのタイプの注意を利用する新しい手法を提案する。
我々のアプローチは、エピソード完了の成功率で最先端の状態を20%近く上回ります。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:55:36 GMT)
Scale Invariance of Graph Neural Networks [4.0] グラフニューラルネットワーク(GNN)における2つの基本的な課題に対処する。
本研究では,4つの同好性および2つの異好性ベンチマークデータセットにまたがって,最先端のパフォーマンスを実現する統一ネットワークアーキテクチャであるScaleNetを提案する。
ダイグラフに対する別の一般的なGNNアプローチとして、Hermitian Laplacian法とGraphSAGEと入射正規化の等価性を示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:08:55 GMT)
Bio-inspired visual relative localization for large swarms of UAVs [3.9] 大規模UAV群におけるエージェントの相対的局所化のための視覚知覚のための新しいアプローチを提案する。
本手法は,シロイヌナズナの群集,ハチの群集,および他の大型動物群が,分散的かつ一貫性のある方法で移動可能な生物学的知覚から着想を得たものであり,各エージェントによる個々の隣人の検出や相対的な位置の推定には依存していない。
新しい相対的局所化法と互換性を持たせるために,新しいSwarm制御アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:47:14 GMT)
Anomalous wave-packet transport on boundaries of Floquet topological systems [3.8] 巻線数ゼロの二次元駆動系の境界にガウス波パケットを配置する。
ピドルギャップ内の異なる谷のエッジ状態は、バルクから完全に分離されたボウタイ型のエッジバンドをハイブリダイズし、形成することができる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:13:38 GMT)
From Robustness to Explainability and Back Again [3.8] 本稿では、形式的説明可能性のスケーラビリティの低さに対処し、形式的説明を計算するための新しい効率的なアルゴリズムを提案する。
提案アルゴリズムは、代わりに複数のクエリに答えることによって説明を計算し、そのようなクエリの数は、機能数に対して最も線形であるように頑健である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:05:48 GMT)
Towards Neuro-Symbolic Video Understanding [3.8] 長期的時間的推論は、フレーム検索システムにとって重要なデシダータムである。
この失敗の主な理由は、フレーム単位の認識と時間的推論を1つのディープネットワークに織り込むためである。
本稿では,個々のフレームの意味的理解に視覚言語モデルを活用するシステムを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:58:22 GMT)
Learn More by Using Less: Distributed Learning with Energy-Constrained Devices [3.7] Federated Learning(FL)は、分散モデルトレーニングのソリューションとして、分散化されたプライバシ保護デバイスに登場した。
本稿では,電池に制約のあるデバイス上でのクライアント選択とトレーニング作業の最適化を目的とした,エネルギーを意識したFLフレームワークであるLeanFedを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:06:57 GMT)
Multi-Class Abnormality Classification Task in Video Capsule Endoscopy [3.7] 本研究は,ビデオカプセル内視鏡(VCE)における多クラス異常分類の課題に対処するものである。
本研究の目的は,さまざまな消化管疾患を正しく分類することであり,臨床現場での診断効率の向上に重要である。
チームカプセルコマンドは,平均AUCが0.7314,精度が0.3235で7位にランクインした。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:54:39 GMT)
A Novel Compact LLM Framework for Local, High-Privacy EHR Data Applications [3.6] 本稿では,厳密なプライバシ要件を持つ環境下での局所的な展開を目的とした,コンパクトなLarge Language Models (LLMs) フレームワークを提案する。
臨床ノートにおける重要な情報をフィルタリングし強調するために,正規表現などの情報抽出手法を用いた新しい前処理手法を導入する。
我々のフレームワークは、プライベートおよびパブリック両方のデータセット(MIMIC-IV)上でゼロショットおよび少数ショット学習パラダイムを用いて評価される。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:06:55 GMT)
Characterizing Information Shared by Participants to Coding Challenges: The Case of Advent of Code [3.5] Advent of Code (AoC)は、さまざまなスキルセットとレベルのプログラミングパズルを解く必要がある一般的なコーディングチャレンジである。
ユーザ参加、チャレンジ中の新しいプログラミング言語の採用、および2つのプログラム言語間のレジリエンスについて、Stack Overflowの調査に基づいて検討する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:07:13 GMT)
FLAME 3 Dataset: Unleashing the Power of Radiometric Thermal UAV Imagery for Wildfire Management [3.4] FLAME 3は、森林火災の視覚スペクトルと放射熱画像の総合的な収集としては初めてである。
このデータセットは、放射熱画像を利用した新しい世代の機械学習モデルを促進することを目的としている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:53:42 GMT)
Evaluating Distributed Representations for Multi-Level Lexical Semantics: A Research Proposal [3.4] この論文は、計算モデルと語彙意味論を橋渡しし、互いに補完することを目的としている。
現代のニューラルネットワーク(NN)は、個々の単語を密度が高く連続的な高次元ベクトルに圧縮することで分散表現を構築する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:37:09 GMT)
Paired Autoencoders for Likelihood-free Estimation in Inverse Problems [3.4] 前方問題は偏微分方程式の離散化である非線形逆問題の解を考える。
典型的なアルゴリズムの主な計算ボトルネックは、データ不適合性の直接推定である。
逆問題に対する確率自由度推定器として,ペアオートエンコーダフレームワークを用いる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:00:40 GMT)
Misalignment of Semantic Relation Knowledge between WordNet and Human Intuition [3.3] 誤調整の事例を調べることは、WordNetを適切に利用し、その改善を促進する可能性がある。
我々は,テンプレートを用いて人からの反応を抽出し,WordNetと人間の直感のセマンティック・リレーション・ナレッジの一般的なミスアライメントを明らかにした。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:51:31 GMT)
VR Based Emotion Recognition Using Deep Multimodal Fusion With Biosignals Across Multiple Anatomical Domains [3.3] 本稿では,Squeeze-and-Excitation(SE)ブロックと組み合わせた,新しいマルチスケールアテンションベースのLSTMアーキテクチャを提案する。
提案したアーキテクチャは,ユーザスタディで検証され,評価値と覚醒レベルを分類する上で,優れた性能を示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:59:12 GMT)
Fast LiDAR Data Generation with Rectified Flows [3.3] 本稿では,LiDARデータの高速かつ高忠実な生成モデルであるR2Flowを提案する。
本手法は,直線軌道を学習する整流流に基づく。
また、LiDAR領域の画像表現と反射率測定を効率的に行うためのトランスフォーマーベースモデルアーキテクチャを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:10:53 GMT)
Leveraging LLM for Automated Ontology Extraction and Knowledge Graph Generation [3.3] OntoKGenは、オントロジー抽出と知識グラフ生成のための真のパイプラインである。
OntoKGenは、Neo4jのようなスキーマレスで非リレーショナルなデータベースへのシームレスな統合を可能にする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:49:02 GMT)
HLSFactory: A Framework Empowering High-Level Synthesis Datasets for Machine Learning and Beyond [3.2] 機械学習(ML)技術は、QoR予測と設計空間探索(DSE)のための高レベル合成(HLS)フローに適用されている。
高品質なHLSデータセットの不足とそのようなデータセットの構築の複雑さが課題である。
HLSFactoryは高品質なHLS設計データセットのキュレーションと生成を容易にするために設計された包括的なフレームワークである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:30:43 GMT)
Mediating Modes of Thought: LLM's for design scripting [3.2] 大規模言語モデル(LLM)は、人間の文脈の一般的な理解を符号化し、幾何学的論理を生成する能力を示す。
このプロジェクトは、LLMがユーザの意図とアルゴリズムを効果的に仲介できれば、デザインにおけるスクリプト作成をより広く楽しくするための強力なツールになる、と推測している。
このようなシステムが、計算設計スクリプティングに関連する幾何学的操作を組み立てるための自然言語のプロンプトを解釈できるかどうかを検討する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:27:12 GMT)
Proximal Control of UAVs with Federated Learning for Human-Robot Collaborative Domains [3.1] 本研究では,Long Short-Term Memory (LSTM) Deep Neural Networks に基づく行動認識制御手法を提案する。
実際のロボットによる実験は96%以上の精度を達成した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:57:04 GMT)
ST-WebAgentBench: A Benchmark for Evaluating Safety and Trustworthiness in Web Agents [3.1] 本稿では,Webエージェントの安全性と信頼性を6つの重要な次元にわたって評価するベンチマークSTWebAgentBenchを提案する。
このベンチマークは、セーフで信頼できる(ST)エージェントの振る舞いを定義する詳細なフレームワークに基づいている。
私たちはこのベンチマークをオープンソース化し、新しい世代の安全で信頼性の高いAIエージェントを育成することを目的として、コミュニティにコントリビューションを呼びかけます。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:09:01 GMT)
Refuting spectral compatibility of quantum marginals [3.1] この研究の主な考え方は、対称性が還元された半定値なプログラミング階層であり、そのような結合状態が存在しないことを検知する。
その給油物は次元自由であり、すべての局所次元において非可換性を証明する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:45:32 GMT)
CTRAPS: CTAP Client Impersonation and API Confusion on FIDO2 [2.9] 我々は、FIDO2クライアントとハードウェア認証者が通信できるようにするCTAPに焦点を当てている。
CTRAPSと呼ばれるCTAPに対するプロトコルレベルの攻撃の2つのクラスを明らかにする。
我々はCTAP仕様の8つの脆弱性を詳述し、CTRAPS攻撃を可能にした。
我々はCTAPを分析し、CTRAPS攻撃を行うための元のツールキットであるCTRAPSをリリースする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:11:41 GMT)
Factored space models: Towards causality between levels of abstraction [2.9] 因果グラフは幅広いアプリケーションにとって強力なツールです。
決定論的関係が存在する場合、一般にマルコフ条件と忠実条件の両方を満たす因果グラフは存在しない。
因果グラフの代替として因子空間モデルを導入する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:04:20 GMT)
Exploring the Potential of Llama Models in Automated Code Refinement: A Replication Study [2.9] コードリファインメントタスクにおけるChatGPTの代替として、CodeLlamaとLlama 2.0の2つのオープンソース、小規模の大規模言語モデルについて検討する。
この結果から,Llamaモデルが適切に調整された場合,自動コード修正におけるChatGPTに匹敵する,合理的な性能が得られることがわかった。
我々の研究は、コード改善のためのオープンソースモデルの可能性を強調し、現実世界のソフトウェア開発にコスト効率が高くプライバシーに配慮したソリューションを提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:39:31 GMT)
Teaching Cloud Infrastructure and Scalable Application Deployment in an Undergraduate Computer Science Program [2.9] クラウドエンジニアリングの基礎を十分に理解せずにクラウドネイティブなアプリケーションを構築することは、学生にコストとセキュリティの落とし穴を負わせる可能性がある。
私たちは、ソフトウェアエンジニアリングの実践としてクラウドインフラストラクチャのデプロイメントをフレーム化する、学部レベルのコースを設計しました。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:34:10 GMT)
Large Multimodal Agents for Accurate Phishing Detection with Enhanced Token Optimization and Cost Reduction [2.8] 本稿では,大規模なマルチモーダルエージェント,特に Gemini 1.5 Flash と GPT-4o mini を用いて,API によるURLと Web ページのスクリーンショットの解析を行う。
1つのエージェントがURLを評価し、2つめのエージェントがURLとスクリーンショットの両方を評価する。
コスト分析によれば、エージェントアプローチでは、GPT-4o miniはマルチモーダルアプローチの約4.2倍のWebサイトを100ドルあたり処理できる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:13:52 GMT)
Construction and optimization of health behavior prediction model for the elderly in smart elderly care [2.7] 本研究では、データ多様性、健康状態の複雑さ、長期依存、データ損失といった問題に対処するスマート介護サービスモデルの設計と実装を行う。
モデルは高齢者の健康行動の正確な予測と動的管理を実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:47:42 GMT)
The Descriptive Complexity of Graph Neural Networks [2.7] グラフクエリはグラフニューラルネットワーク(GNN)の有界サイズファミリによって計算可能であることを示す。
GNNは、カウントとビルトインの関係を持つ一階述語論理のガードされた断片で定義できる。
GFO+Cでは1つのGNNで1つの線形アクティベーションと有理重みを持つクエリが組込み関係なく定義可能であることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:48:24 GMT)
Enhancing joint automatic chest X-ray diagnosis and clinical visual attention prediction with multi-stage cooperative learning [2.6] 胸部X線検査における関節疾患診断のための新しい深層学習フレームワークを提案する。
具体的には、DenseNet201バックボーンとResidualおよびSqueeze-and-Excitationブロックベースのエンコーダの両方を活用する、新しいデュアルエンコーダマルチタスクUNetを導入する。
提案手法は胸部X線診断における既存の手法と視覚的注意マップの精度を大幅に上回ることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:09:31 GMT)
Quench dynamics in topologically non-trivial quantum many-body systems [2.6] 非自明なハミルトニアンのパラメータ状態間のクエンチを受ける基底状態フェルミオン多体ガスの非平衡ダイナミクスについて検討する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:40:21 GMT)
Optimized CNNs for Rapid 3D Point Cloud Object Recognition [2.6] 本研究では,畳み込みニューラルネットワーク(CNN)を用いて3次元点雲内の物体を効率的に検出する手法を提案する。
提案手法では特徴中心の投票機構を採用して,入力データで観測される典型的な疎度を生かした畳み込み層を構築する。
Vote3Deepモデルは、わずか3層で、レーザーのみのアプローチとレーザービジョンを組み合わせた手法の両方において、これまでの最先端よりも優れている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:42:30 GMT)
AI Meets Antimatter: Unveiling Antihydrogen Annihilations [2.5] CERNのALPHA-g実験は、反物質に対する重力の影響を初めて直接測定することを目的としている。
この測定では、検出器内の消滅の垂直位置を正確に予測する必要がある。
本稿では,PointNet深層学習アーキテクチャに基づくモデルアンサンブルを用いた消滅位置復元手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:52:55 GMT)
Introduction to Reinforcement Learning [2.5] 強化学習(Reinforcement Learning, RL)は、累積報酬を最大化するために環境と対話して意思決定を行う訓練エージェントに焦点を当てる。
本稿ではRLの概要を述べるとともに,その中核となる概念,方法論,さらに学ぶためのリソースについて述べる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:17:32 GMT)
TAB-Fields: A Maximum Entropy Framework for Mission-Aware Adversarial Planning [2.5] 我々は、既知の制約に整合した最も偏りのない確率分布を計算することにより、時間とともに敵状態の分布をキャプチャする表現を開発する。
我々は,TAB条件付きPOMCPを導入することで,TAB-Fieldsを標準計画アルゴリズムと統合する。
提案手法は,特定の敵政策を前提としたベースラインや,ミッション制約を完全に無視するベースラインと比較して,優れた性能を達成できることを実証する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:55:27 GMT)
Morescient GAI for Software Engineering (Extended Version) [2.5] 我々は,オープンサイエンスの原則に従って,GAIモデルを設計し,発展し,普及させる方法について,ビジョンとロードマップを提示する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:51:23 GMT)
Learning to Predict Structural Vibrations [2.5] 飛行機、車、家屋などの機械構造では、騒音が発生し振動によって伝達される。
ディープラーニングサロゲートモデルは古典的な数値シミュレーションの代替として有望である。
本稿では,高調波励起板の振動予測に関するベンチマークを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:21:53 GMT)
Jensen-Shannon Divergence Based Novel Loss Functions for Bayesian Neural Networks [2.5] 我々は、一般化されたJensen-Shannon(JS)の発散に新たな修正を加えて、BNNの新たな損失関数を定式化する。
JSの発散に基づく変分推論は難解であり,従ってこれらの損失を定式化するために制約付き最適化フレームワークが用いられている。
複数の回帰および分類データセットに関する理論的解析および実証実験により、提案された損失はKLの発散に基づく損失よりも良く、特にデータセットがノイズや偏りがある場合の方が優れていることが示唆された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:44:12 GMT)
SpaCE: The Spatial Confounding Environment [2.5] SpaCEは、因果推論メソッドを評価するための、現実的なベンチマークデータセットとツールを提供する。
各データセットには、トレーニングデータ、真のカウンターファクト、座標付き空間グラフ、滑らかさと欠点のあるスコアが含まれている。
SpaCEは、エンドツーエンドのパイプラインの自動化、データのロードの簡略化、実験的なセットアップ、マシンラーニングと因果推論モデルの評価を容易にする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:45:03 GMT)
Graph Learning for Planning: The Story Thus Far and Open Challenges [2.4] これまでの計画におけるグラフ学習の活用について,学習と計画性能に対する理論的および経験的効果について検討した。
我々の研究は、より大規模な計画タスクにスケールアップするために、小さな計画タスクからドメイン知識を学ぶGOOSEフレームワークに蓄積されます。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:49:27 GMT)
OMENN: One Matrix to Explain Neural Networks [2.4] One Matrix to Explain Neural Networks (OMENN)は、ニューラルネットワークを特定の入力ごとに単一の解釈可能な行列として表現する新しいポストホック手法である。
本稿では,動的線形性に基づくOMENNの理論解析を行い,その妥当性を2つのXAIベンチマークで検証した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:49:01 GMT)
Quantum simulation of thermal field theories [2.4] まず、一般的なデジタル量子コンピュータ上の量子ビットによる量子場の表現について調べる。
量子シミュレータを用いた1+1次元の熱場理論の数値計算結果を示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:08:47 GMT)
Flow Matching for Accelerated Simulation of Atomic Transport in Materials [2.3] LiFlowは結晶材料の分子動力学(MD)シミュレーションを加速するための生成フレームワークである。
4,186固体電解質 (SSE) 候補を4温度で25-psのリチウム拡散を観測した。
LiFlowは、短い訓練軌道からより大きなスーパーセルへと一般化し、高い精度を維持しながら、より長いシミュレーションを行う。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:01:06 GMT)
Large Language Model-empowered multimodal strain sensory system for shape recognition, monitoring, and human interaction of tensegrity [2.3] 緊張に基づくシステムは、不均一で予測不可能な環境を動的に探索する上で有望なアプローチである。
本稿では,深層学習モデルと大規模言語モデルの両方を活用することで,24個のマルチモーダルひずみセンサと6本のストラット張力積分を導入する。
この緊張感は、自動でiPhoneにデータを送信してワイヤレス監視し、データ分析、説明、予測、提案を人間に提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:35:12 GMT)
Connecting Large Language Models with Blockchain: Advancing the Evolution of Smart Contracts from Automation to Intelligence [2.3] 本稿では,Large Language Modelsをブロックチェーンデータ,sysnameと統合するための普遍的なフレームワークを提案し,実装する。
意味的関連性と真理発見の手法を組み合わせることで,革新的なデータ集約手法であるfuncnameを導入する。
実験結果は、40%の悪意のあるノードであっても、最適なベースラインと比較して平均17.74%の精度でデータ精度を向上させることを示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:35:51 GMT)
Enabling DBSCAN for Very Large-Scale High-Dimensional Spaces [2.2] DBSCANは、非パラメトリックな教師なしデータ分析ツールの中で最も重要なものの一つである。
DBSCANアルゴリズムの時間複雑性は$O(n2 beta)$であり、$n$はデータ点の数、$beta = O(D)$はデータ空間の次元を表す$D$である。
スペクトルデータ圧縮に基づくDBSCAN法を提案し、大量のデータポイントと高次元のデータセットを効率的に処理する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:23:16 GMT)
ILASH: A Predictive Neural Architecture Search Framework for Multi-Task Applications [2.1] 本稿では,電力利用の最小化,フレームレートの向上,モデルサイズ削減に階層共有の概念を活用するニューラルネットワークアーキテクチャ(ILASH)の新たなパラダイムを提案する。
また、与えられたタスクやデバイス制約に対してこれらのニューラルネットワークモデルを効率的に構築するための新しいニューラルネットワークアーキテクチャ探索フレームワーク(ILASH-NAS)を提案する。
生成したモデル性能とニューラルサーチ効率の両面で,最大16倍のエネルギー利用率,CO2排出量,トレーニング/検索時間の両面で,大幅な改善が見られた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:12:16 GMT)
WEM-GAN: Wavelet transform based facial expression manipulation [2.1] We propose WEM-GAN, in short for wavelet-based expression operation GAN。
我々はウェーブレット変換技術を利用して、生成器とU-netオートエンコーダのバックボーンを結合する。
我々のモデルは、AffectNetデータセット上でのアイデンティティ機能、編集機能、画像生成品質の保存に優れています。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:23:02 GMT)
Selective Reviews of Bandit Problems in AI via a Statistical View [1.9] 強化学習(Reinforcement Learning, RL)は、人工知能の分野で広く研究されている分野であり、エージェントと環境との相互作用を通じて意思決定を教えることに焦点を当てている。
鍵となるサブセットには、マルチアーム・バンディット(MAB)と連続アーム・バンディット(SCAB)の問題が含まれ、不確実性の下でのシーケンシャルな意思決定をモデル化する。
本稿では,バンドイット問題の基本モデルと仮定を概説し,集中不平等やミニマックス後悔境界といった非漸近的理論ツールを探求し,探索-探索トレードオフを管理するための頻繁なアルゴリズムとベイズ的アルゴリズムを比較した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:28:47 GMT)
Evolution of Collective AI Beyond Individual Optimization [1.9] 本研究では,特定の能力に最適化された同種個体群から出現する集団行動について検討した。
我々は、フェロモン経路をたどるチェモタキシー駆動の車両をモデルとした、単純で同一のニューラルネットワークベースのエージェントのグループを作成しました。
その結果,個体の進化が個体群の分化に繋がったことが示唆された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:03:36 GMT)
Re-examining learning linear functions in context [1.9] 文脈学習(ICL)は、幅広い問題を解決するための魅力的な方法である。
我々は、異なるサイズでスクラッチからトレーニングされたいくつかのトランスフォーマーモデルに対して、さまざまなトレインおよびテスト設定でICLについて検討する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:04:35 GMT)
UniForm: A Reuse Attention Mechanism Optimized for Efficient Vision Transformers on Edge Devices [1.8] トランスフォーマーベースのアーキテクチャは、さまざまなドメインで顕著な成功を収めていますが、エッジデバイスへのデプロイメントは依然として困難です。
本稿では,効率的なメモリアクセスと計算最適化に適した新しいReuse Attention機構を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:04:15 GMT)
MAGMA: Manifold Regularization for MAEs [1.7] Masked Autoencoders(MAE)は、自己教師型学習(SSL)において重要な分断である
異なるトランスフォーマー層の表現に適用される新しいバッチワイド層単位の正規化損失であるMAGMAを紹介する。
提案した正規化損失をプラグインすることで,MAEモデルの性能を大幅に向上させることができることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:14:10 GMT)
Magic State Injection on IBM Quantum Processors Above the Distillation Threshold [1.7] 本研究は、IBM量子プロセッサに量子ビット効率の回転重六角形表面符号を埋め込むことを提案する。
論理ビットと位相フリップの両方のエラー閾値を報告し、それぞれ$approx0.37%$と$approx0.31%$を得た。
我々の研究は、IBM量子デバイス上で高忠実な論理マジック状態を生成することによって、非クリフォード論理ゲートを実装する可能性を示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:30:51 GMT)
Gaussian Splatting Under Attack: Investigating Adversarial Noise in 3D Objects [1.7] 物体検出モデルに対する敵対的攻撃は2D画像に対して十分に研究されているが、3Dモデルへの影響は未解明のままである。
この研究は、CLIPビジョン言語モデルをターゲットにした対向ノイズを生成するために設計されたMasked Iterative Fast Gradient Sign Method (M-IFGSM)を導入している。
提案手法は,人間の観測者に対してほとんど知覚できない対向雑音を伴って,モデルの精度と信頼性を効果的に低減することを示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:11:21 GMT)
Four Guiding Principles for Modeling Causal Domain Knowledge: A Case Study on Brainstorming Approaches for Urban Blight Analysis [1.7] 因果的ドメイン知識を効果的にモデル化するための4つのルールを導入することにより、都市性ブライトの分析におけるドメイン知識の統合を改善する。
本研究は, 都市景観分析のために開発された認知地図を調査し, 因果モデルガイドラインから有意な逸脱が認められた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:49:34 GMT)
Temporally Consistent Dynamic Scene Graphs: An End-to-End Approach for Action Tracklet Generation [1.7] TCDSG、Temporally Consistent Dynamic Scene Graphsは、時間を通して対象と対象の関係を検出し、追跡し、リンクするエンドツーエンドのフレームワークである。
私たちの研究は、マルチフレームビデオ分析における新しい標準を設定し、監視、自律ナビゲーションなどにおける、高インパクトなアプリケーションのための新たな道を開く。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:19:20 GMT)
A unified framework of unitarily residual measures for quantifying dissipation [1.7] 本稿では,量子力学の非単位成分を分離して散逸を定量化するためのフレームワークを提案する。
我々の結果は、オープン量子系における散逸を定量化する強力なツールを提供し、量子熱力学の理解を深める。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:00:24 GMT)
Patchfinder: Leveraging Visual Language Models for Accurate Information Retrieval using Model Uncertainty [1.7] 本稿では,視覚言語モデル(VLM)に基づいて情報抽出タスクに対処するアルゴリズムであるPatchFinderを提案する。
まず、VLMの出力の最大ソフトマックス確率に基づいて、信頼度に基づくスコアを考案し、その予測に対するモデルの信頼度を測定する。
PatchFinderは、42億のパラメータビジョン言語モデルであるPhi-3vを利用して、190のノイズの多いスキャンされたドキュメントのデータセットで94%の精度を達成することができる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:46:09 GMT)
Feasibility of Logical Bell State Generation in Memory Assisted Quantum Networks [1.6] 2つの新しい格子手術ベースのプロトコルを導入し、遠隔ノード間の論理ベル状態を確立する。
ローカルプロトコルでは、中間ノードは論理ベル状態を生成し、直接量子メモリに送信する。
非局所的なプロトコルは補助的なベル状態を分散し、量子メモリ内の既存のコード間の境界をマージする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:09:35 GMT)
Demonstrating the Advantages of Analog Wafer-Scale Neuromorphic Hardware [1.6] 本稿では、BrainScaleS-1システムの性能と利点と、従来のソフトウェアシミュレーションと組み合わせて使用する方法について述べる。
神経型ハードウェア基板に適応した2つの生物学的にインスパイアされたネットワークのエミュレーション時間とエネルギー消費について報告する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:46:43 GMT)
Drawing Pandas: A Benchmark for LLMs in Generating Plotting Code [1.6] 本稿では,人間によるPandasPlotBenchデータセットを紹介する。
視覚データ探索の補助として言語モデルの有効性を評価するように設計されている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:05:37 GMT)
Multi-objective Deep Learning: Taxonomy and Survey of the State of the Art [1.5] 本調査は,多目的深層学習の分野における最近の進歩について報告する。
本稿では,学習アルゴリズムの種類と意思決定者のニーズに基づく既存手法の分類について紹介する。
教師なし学習、教師なし学習、強化学習の3つの主要な学習パラダイムが網羅され、また、最近非常に人気のあるジェネレーティブモデリングの領域にも対処する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:42:37 GMT)
Towards Cross-Lingual Audio Abuse Detection in Low-Resource Settings with Few-Shot Learning [1.5] 低リソース言語における乱用言語検出のための事前学習音声表現の可能性について検討する。
提案手法は,モデルに依存しないメタラーニングフレームワークに表現を統合し,乱用言語を10言語に分類する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:52:35 GMT)
Step-by-Step Guidance to Differential Anemia Diagnosis with Real-World Data and Deep Reinforcement Learning [1.5] 臨床診断ガイドラインは、診断に到達するための重要な質問を概説する。
本研究の目的は,電子カルテから学習し,正確な診断に最適な行動列を決定するモデルを開発することである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:45:50 GMT)
Projection Abstractions in Planning Under the Lenses of Abstractions for MDPs [1.5] 抽象化の概念は、AIプランニングと割引マルコフ決定プロセス(MDP)の両方の文脈で独立に開発された。
本稿では, ディスカウントMDPのレンズを用いた計画計画における投影抽象化について考察する。
古典的あるいは確率的計画手法に基づいて構築されたプロジェクション抽象化から始めて、ディスカウントされたMDPで利用可能な抽象化フレームワークの下で、同じ抽象化がどのように得られるかを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:43:28 GMT)
Intelligent Spark Agents: A Modular LangGraph Framework for Scalable, Visualized, and Enhanced Big Data Machine Learning Workflows [1.5] 本稿では,ビッグデータ環境下でのSparkに基づくビジュアルプロセスAI+機械学習手法を提案する。
Langchainは、言語モデルに基づいたエンドツーエンドアプリケーションの開発を簡単にすることを約束している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:27:23 GMT)
A Theoretical Framework for Acoustic Neighbor Embeddings [1.5] 音声とテキストの埋め込みを最寄りで検索することで、500kの語彙に対して有限状態変換器(FST)と同一の単語分類精度が得られる。
埋め込み距離は、語彙外単語回復における電話編集距離と比較して0.5%ポイント差がある。
理論的枠組みにより、デバイス起動ワードの混乱を予測するために埋め込みを利用することもできる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:48:59 GMT)
Wasserstein Markets for Differentially-Private Data [1.4] データ市場は、幅広いアクセスを可能にすると同時に、適切なプライバシーとユーティリティのトレードオフを決定する手段を提供する。
既存のデータ市場フレームワークでは、信頼できるサードパーティが高価なバリュエーションを実行するか、あるいはデータ価値の性質を把握できないかのいずれかが必要です。
本稿では,個人差分データに対するワッサーシュタイン距離に基づく評価機構とそれに対応する調達機構を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:40:26 GMT)
The Impact of Featuring Comments in Online Discussions [1.4] 特定のコメントを掲載するニュース記事のオンラインディスカッションと、コメントを掲載しない議論を比較した。
ユーザベースとプラットフォーム自体の観点から,議論の質を推定し,比較することにより,コメントが議論に与える影響を測定する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:53:22 GMT)
Personalization of Code Readability Evaluation Based on LLM Using Collaborative Filtering [1.4] 本研究では,協調フィルタリングを用いて評価を校正する手法を提案する。
予備分析の結果,LLMを用いた可読性評価の精度を効果的に向上することが示唆された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:43:55 GMT)
Trajectory-based Road Autolabeling with Lidar-Camera Fusion in Winter Conditions [1.4] トラジェクトリに基づく自己管理手法は,手動のラベルを使わずに,横断経路から学習することができる。
本手法は,冬期運転データセットの評価において,近年のスタンドアロンカメラおよびライダー方式よりも優れていた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:54:37 GMT)
Supervised Multiple Kernel Learning approaches for multi-omics data integration [1.3] マルチカーネル学習(MKL)は、マルチオミクス入力の多様な性質を考える上で、柔軟で有効なアプローチであることが示されている。
我々は、異なるカーネル融合戦略に基づく新しいMKLアプローチを提供する。
その結果、MKLベースのモデルは、より複雑で最先端の教師付きマルチオミクス積分アプローチよりも優れていることが示された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:07:34 GMT)
SimuScope: Realistic Endoscopic Synthetic Dataset Generation through Surgical Simulation and Diffusion Models [1.3] そこで本研究では,最新のCASシステムに必要なアノテーションをすべて自動生成する,本格的な手術シミュレータを提案する。
手術器具と変形可能な解剖学的環境の間の力学を含む、より複雑で現実的な外科的相互作用のシミュレーションを提供する。
安定拡散と低ランク適応に基づく軽量でフレキシブルな画像から画像への変換法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:49:43 GMT)
Governance of Generative Artificial Intelligence for Companies [1.3] ジェネレーティブ・人工知能(GenAI)は、適切なガバナンスのない組織に素早く参入した。
GenAIの変革的な性質と規制措置に関する広範な議論にもかかわらず、限定的な研究は組織的なガバナンスに対処している。
本稿は、GenAIの基本的特徴をよりよく理解することを目的として、最近の研究を調査することで、このギャップを埋めるものである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:39:57 GMT)
Fractional Order Distributed Optimization [1.3] FrODOは、収束性を高めるために、分数次メモリ項を組み込んだ理論的な基盤となるフレームワークである。
その結果、FrODOは、不条件問題に対するベースラインよりも最大で4倍の収束を実現し、フェデレートニューラルネットワークトレーニングでは2~3倍の高速化を実現していることがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:39:01 GMT)
Deep learning approach for predicting the replicator equation in evolutionary game theory [1.2] 本稿では,人口動態の正確な予測を可能にする物理インフォームド深層学習手法を提案する。
私たちは、Fasel、Kaiser、Kutz、Brunton、Brunt 2016aが最初に導入したSINDyモデルを用いて、進化生物学、経済システム、社会力学の理解を著しく向上させる複製子方程式を得た。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:28:52 GMT)
Scaffold or Crutch? Examining College Students' Use and Views of Generative AI Tools for STEM Education [1.2] ChatGPTのようなGenAIツールは、これらのツールが学生のSTEM問題解決能力の発達にどのように役立つか、あるいは妨げるか、という新たな考慮を導入する。
本研究は、大学生がSTEMコースでgenAIツールをどのように使っているか、なぜ利用しているのかを調査することによって、これらの考察を考察する。
本研究は,STEM学生におけるgenAIツールの採用率と多種多様さを明らかにした。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:27:40 GMT)
PCIM: Learning Pixel Attributions via Pixel-wise Channel Isolation Mixing in High Content Imaging [1.2] 本研究は,画素属性マップを計算するための新しい手法である,画素ワイドチャネル分離混合(PCIM)を導入する。
PCIMは個々のピクセルを異なる入力チャネルとして扱い、混合層を訓練してこれらのピクセルを混合し、特定の分類を反映する。
このユニークなアプローチは、各画像に対するピクセル属性マップの生成を可能にするが、基礎となる分類ネットワークの選択には依存しない。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:48:30 GMT)
Bigger, Regularized, Optimistic: scaling for compute and sample-efficient continuous control [1.1] BROは、犬とヒューマノイドのタスクにおいて、ほぼ最適ポリシーを達成するためのモデルフリーのアルゴリズムである。
BROは最先端の結果を達成し、主要なモデルベースおよびモデルフリーアルゴリズムを著しく上回っている。
BROは、非常に難しい犬とヒューマノイドのタスクにおいて、ほぼ最適なポリシーを達成した最初のモデルなしアルゴリズムである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:42:49 GMT)
Fast and reliable uncertainty quantification with neural network ensembles for industrial image classification [1.1] ニューラルネットワーク(NN)を用いた画像分類は、産業プロセスで広く使われている。
NNは、アウト・オブ・ディストリビューション(OOD)データに直面すると、確実だが誤った予測をする傾向がある。
複数の独立したNNで構成されたディープアンサンブルは、強い性能を示すことが示されているが、計算コストが高い。
本研究では,産業プロセスの画像分類における効率的なNNアンサンブルの予測と不確実性について検討した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:35:24 GMT)
Pairwise Spatiotemporal Partial Trajectory Matching for Co-movement Analysis [1.1] ペアワイズ・ムーブメント・アナリティクス(Pairwise movement analysis)は、特定の時間枠内で個人を特定することを含む。
本稿では,時間ウィンドウに基づいてデータを解釈可能な画像に変換する部分時間マッチング手法を提案する。
我々は,コウォーキング分類タスクにおける手法の評価を行い,その効果を新しいコ行動識別アプリケーションで実証した。
このアプローチは、時間的行動分析のための強力で解釈可能なフレームワークを提供し、社会行動研究、都市計画、医療に潜在的な応用をもたらす。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:25:44 GMT)
Expressiveness of Commutative Quantum Circuits: A Probabilistic Approach [1.1] 本研究では,可換量子回路のフレームポテンシャルと表現性について検討する。
確率変数の特性関数として量子期待とペアワイズ忠実度を表現し、格子上のランダムウォークの繰り返し確率として表現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:11:35 GMT)
MACAW: A Causal Generative Model for Medical Imaging [1.1] この研究は、ニューロイメージング応用のためのMasked Causal Flow (MACAW)と呼ばれる新しい因果生成アーキテクチャを導入する。
提案手法の有効性は,まず合成データを用いて評価し,その後,英国バイオバンク研究の23,000人以上の参加者のMRI脳データを用いて検討した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:05:41 GMT)
Investigating the importance of social vulnerability in opioid-related mortality across the United States [1.1] オピオイドはアメリカにおける公衆衛生上の重要な課題である。
オピオイドの過剰摂取は2011年から2021年の間に3倍以上に増えた。
2011年から2021年の間にオピオイド処方率を45%近く削減した全国的な取り組みでは、この期間にオピオイド過剰摂取による死亡が3倍以上に増加した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:53:34 GMT)
Enhancing Quantum Memory Lifetime with Measurement-Free Local Error Correction and Reinforcement Learning [1.0] 本稿では,$textitlocal$エラー情報に基づく,計測不要な回路レベルのエラー訂正プロトコルについて検討する。
これらの回路は,2次元トーリック符号メモリを保存するために,中間回路の読み出し速度を低減できることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:13:08 GMT)
WxC-Bench: A Novel Dataset for Weather and Climate Downstream Tasks [1.0] 高品質な機械学習(ML)対応データセットは、新しい人工知能(AI)モデルの開発において基礎的な役割を果たす。
本稿では、一般化可能なAIモデルの開発を支援するために設計されたマルチモーダルデータセットであるWxC-Benchを紹介する。
本稿では,データセットの包括的記述と,ベースライン解析の技術的検証について述べる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:20:27 GMT)
AI-Driven Resource Allocation Framework for Microservices in Hybrid Cloud Platforms [1.0] 本稿では,ハイブリッドクラウドプラットフォームにおけるリソース割り当てのためのAI駆動型フレームワークを提案する。
このフレームワークは、コスト削減と性能向上のために強化学習(RL)ベースのリソース利用最適化を採用している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:41:08 GMT)
Performance Comparison of Deep Learning Techniques in Naira Classification [1.0] ナイラ(英: Naira)は、ナイジェリアの通貨。
本研究では、Deep Learning(DL)モデルを用いて、通貨紙幣(Naira)を分類する。
結果は、このモデルがナイジェリア経済の安全と金融取引の効率を高める方法を示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:25:55 GMT)
Continual Learning of Personalized Generative Face Models with Experience Replay [1.0] 個人化された2Dおよび3D生成顔モデルの重みを逐次更新する方法である。
我々は,モデルが連続的に微調整されることで,過去の顔の表現を破滅的に忘れてしまうことを観察した。
本稿では,ランダムサンプリングとStyleGANの潜在空間を組み合わせ,バッファを最適な凸殻として表現する新しい経験再生アルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:56:23 GMT)
Interpolation and differentiation of alchemical degrees of freedom in machine learning interatomic potentials [1.0] 原子性物質シミュレーションにおける連続的および微分可能なアルケミカル自由度の利用について報告する。
提案手法は,MLIPのメッセージパッシングおよび読み出し機構の変更とともに,対応する重みを持つアルケミカル原子を入力グラフに導入する。
MLIPのエンドツーエンドの微分可能性により、構成重みに対するエネルギー勾配の効率的な計算が可能となる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:47:45 GMT)
Nature versus nurture in galaxy formation: the effect of environment on star formation with causal machine learning [0.9] 我々は、因果推論フレームワークを用いて、星形成速度に対する環境の因果効果を推定する。
因果効果は負で実質的であり,環境はSFRを$sim100$の最大係数で抑制する。
初期の宇宙では、環境は肯定的な影響を受け、より高い赤方偏移では$sim10$と$zsim1$で星形成を加速させる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:21:09 GMT)
Achieving Semantic Consistency Using BERT: Application of Pre-training Semantic Representations Model in Social Sciences Research [0.9] 本研究では,社会科学研究に関連するテキスト分析タスクにおいて,単語の意味を安定的に維持する上でのWord2VecとBERTの性能を実証的に比較した。
その結果,BERTはWord2Vecよりも意味的安定性が優れ,コンテキスト埋め込みの安定性が向上していることがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 15:51:37 GMT)
A Systematic Review on Process Mining for Curricular Analysis [0.9] 教育プロセスマイニング(英: Educational Process Mining、EPM)は、教育プロセスを改善するために用いられるデータ分析技術である。
EPMの特定の応用の1つはカリキュラムマイニングであり、これは学生が学習目標を達成するための学習プログラムを理解することに焦点を当てている。
本総説では, キュラープロセスマイニングにおける現状を概観し, より堅牢で実用的なキュラー解析を支援するための具体的な研究機会について概説する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:51:24 GMT)
Multimodal Remote Sensing Scene Classification Using VLMs and Dual-Cross Attention Networks [0.9] 本稿では,大規模な視覚言語モデル(VLM)によって生成されたテキスト記述を,高価な手作業による注釈コストを伴わずに補助的なモダリティとして統合する新しいRSSCフレームワークを提案する。
5つのRSSCデータセットの定量的および定性的な評価実験により、我々のフレームワークがベースラインモデルより一貫して優れていることが示された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:24:16 GMT)
GRAND : Graph Reconstruction from potential partial Adjacency and Neighborhood Data [0.9] セキュアなマルチパーティ計算のような暗号手法は、各参加者のデータに集中することなく、分散グラフの機能のセキュアな計算に使用できる。
本稿では,グラフの隣接行列を再構成する手法を提案する。
共役行列のみを観測する2つの逆数モデルと、元のグラフの部分的知識を持つ知識のある2つのモデルを考える。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:42:28 GMT)
Comparative Analysis of Multi-Agent Reinforcement Learning Policies for Crop Planning Decision Support [0.9] インドでは、農夫の大多数が小規模または極端に分類されており、市場飽和や気候のリスクによる経済的な損失に特に影響を受けやすい。
既存の意思決定支援システム(DSS)は、しばしば、リアルタイム市場ダイナミクスと複数の農家間の相互作用を考慮していない一般的なレコメンデーションを提供する。
本稿では,3つのマルチエージェント強化学習(MARL)アプローチの有効性を評価する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:30:19 GMT)
A Multi-way Parallel Named Entity Annotated Corpus for English, Tamil and Sinhala [0.9] 本報告では, 名前付きエンティティ (NE) を付加した英語-タミル・シンハラコーパスについて述べる。
事前訓練された多言語言語モデル(mLM)を用いて、シンハラとタミルのデータセット上で、新しいベンチマークNER(Named Entity Recognition)結果を確立する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:28:31 GMT)
Reproduction of AdEx dynamics on neuromorphic hardware through data embedding and simulation-based inference [0.8] 我々は、複雑なニューロンモデルの膜トレースから関連する特徴を自動的に抽出するために、オートエンコーダを使用する。
次に、逐次的神経後部推定を利用して、ニューロンパラメータの後方分布を近似する。
このことは,自動エンコーダとSNPEアルゴリズムの組み合わせが,複雑なシステムに対して有望な最適化手法であることを示唆している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:19:21 GMT)
Absolutely stable time crystals at finite temperature [0.8] 局所的に相互作用し, 周期的に駆動される(フロケ)ハミルトン力学がランゲヴィン浴に結合し, 有限温度の離散時間結晶をサポートすることを示す。
加熱前および多体局在DTCとは対照的に、時間結晶秩序は任意の摂動に対して安定である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:01:27 GMT)
Exponentially Enhanced Scheme for the Heralded Qudit GHZ State in Linear Optics [0.7] 高次元多部絡み合いは量子情報科学において重要な役割を担っている。
単光子源と線形演算を用いた$d$レベル$N$-partite GHZ状態を生成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:35:03 GMT)
EvRT-DETR: The Surprising Effectiveness of DETR-based Detection for Event Cameras [0.7] イベントベースのカメラ(EBC)は、従来のカメラに代わるバイオインスパイアされた代替品として登場した。
本研究は,EBCカメラの物体検出問題に対処する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:49:01 GMT)
VISTA: A Panoramic View of Neural Representations [0.7] 本稿では、ニューラルネットワーク表現を視覚的に探索し解釈するための新しいパイプラインであるVISTA(Visualization of Internal States and their Associations)を紹介する。
我々は、表現を意味的な2次元空間にマッピングすることで、現代の機械学習モデルにおける広大な多次元空間を分析するという課題に対処する。
VISTAの実用性は、新しい特性と解釈を明らかにするスパースオートエンコーダラプタントに適用することで実証する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:12:03 GMT)
Sample Complexity of Black Box Work Extraction [0.7] 作業抽出に必要な未知状態のサンプル数を分析する。
未知の状態の1つのコピーだけで、あらゆる作品の抽出がほぼ不可能であることを示す。
本研究は、未知の状態の有効性を量子電池として評価するための、サンプル効率のよいプロトコルを開発する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:47:12 GMT)
A Study on Quantum Neural Networks in Healthcare 5.0 [0.7] この研究は、医療分析における量子ニューラルネットワークの影響について、既存の研究のギャップに光を当てることを目的としている。
ヘルスケア 5.0 には、多様な量子機械学習と量子ニューラルネットワークシステムの統合が含まれる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:14:16 GMT)
Loss tolerant cross-Kerr enhancement via modulated squeezing [0.6] 単一フォトニックモードの異なる四角形に沿ってスキューズを交互に行うことで、クロスカー相互作用強度を一般化できることが示される。
フォトニック量子コンピューティングアーキテクチャにおける制御相ゲートの決定論的実装の高速化について論じる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:27:48 GMT)
Quantum computing through the lens of control: A tutorial introduction [0.6] 本稿では制御理論の観点から量子コンピューティングのチュートリアルを紹介する。
このチュートリアルは線型代数の基本的な知識を必要とするだけであり、特に量子物理学への事前の露出は不要である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:01:37 GMT)
Deep Matrix Factorization with Adaptive Weights for Multi-View Clustering [0.6] DMFAW(Adaptive Weights for Multi-View Clustering)を用いた新しいDeep Matrix Factorizationを提案する。
提案手法は特徴選択を同時に組み込んで局所分割を生成し,クラスタリング結果を向上する。
ベンチマークデータセットの実験では、DMFAWがクラスタリングのパフォーマンスで最先端のメソッドより優れていることが強調されている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:08:27 GMT)
CADMR: Cross-Attention and Disentangled Learning for Multimodal Recommender Systems [0.6] 本稿では,新しいオートエンコーダに基づくマルチモーダルレコメンデータシステムCADMRを提案する。
CADMRを3つのベンチマークデータセット上で評価し,最先端の手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:09:52 GMT)
Unpaired Modality Translation for Pseudo Labeling of Histology Images [0.6] 本稿では,この問題に対処するために,教師なし画像翻訳を利用した顕微鏡擬似ラベリングパイプラインを提案する。
本手法は,対象ドメインに事前アノテーションを必要とせず,ラベル付きドメインとラベルなしドメインを翻訳することで擬似ラベルを生成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:45:59 GMT)
Demonstration of a Photonic Time-Multiplexed C-NOT Gate [0.6] 2ビット制御ノット(C-NOT)ゲートは、ゲートベースの量子コンピュータを構築する上で不可欠な要素である。
ここでは、完全に再構成可能なアーキテクチャを構築するために、スケーラブルな時間多重化アプローチを採用しています。
実験プラットフォームを使って4つのベル状態を生成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:41:31 GMT)
Polytopes of Absolutely Wigner Bounded Spin States [0.6] 非正準確率の2つの重要な分布は、ウィグナー函数とグラウバー・スダルシャン函数である。
有限次元量子系に対するスピンウィグナー関数の性質について検討する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:39:44 GMT)
Quantum metric dependent anomalous velocity in systems subject to complex electric fields [0.5] ベリー相は長い間、周期系の特性を著しく変化させることが知られている。
非エルミート系では、ベリー接続の一般化が提案され、力学と輸送に新しい影響を与えることが示されている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:38:05 GMT)
GPS-2-GTFS: A Python package to process and transform raw GPS data of public transit to GTFS format [0.5] gps2gtfsパッケージは、公共交通機関からの生のGPS軌跡データをGTFSフォーマットに変換するための重要なニーズに対処する。
この変換により、様々なソフトウェアアプリケーションが、トラッキング、スケジューリング、到着時刻予測などの目的のために、リアルタイムのトランジットデータを効率的に利用することができる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 23:30:17 GMT)
Robustness of quantum algorithms against coherent control errors [0.5] 本稿では,リプシッツ境界を用いたコヒーレント制御誤差に対する量子アルゴリズムのロバスト性を解析するためのフレームワークを提案する。
我々は、コヒーレントな制御誤差に対するレジリエンスが、個々のゲートを生成するハミルトニアンの規範に影響されていることを示す最悪のケースの忠実性境界を導出する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:47:38 GMT)
Harnessing Preference Optimisation in Protein LMs for Hit Maturation in Cell Therapy [0.5] 細胞と免疫療法は、免疫系を調節することにより、がんや自己免疫疾患などの疾患を治療するための形質転換能を提供する。
これらの治療法の開発は資源集約的であり、薬物候補の大多数は実験室での試験以上の進歩に失敗している。
近年の機械学習の進歩は、タンパク質工学などの領域に革命をもたらし、大規模で標準化されたデータセットの不足や細胞系の複雑さにより、免疫療法の応用は制限され続けている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:08:19 GMT)
Keeping Experts in the Loop: Expert-Guided Optimization for Clinical Data Classification using Large Language Models [0.5] StructEaseは、自動化と迅速なエンジニアリングにおける人間の専門知識の入力のギャップを埋める新しいフレームワークである。
このフレームワークの中核的な革新は、専門家のフィードバックによって大幅なパフォーマンス改善がもたらされる高価値ケースを識別する反復サンプリングアルゴリズムであるSmplEaseである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:05:13 GMT)
Model-aware reinforcement learning for high-performance Bayesian experimental design in quantum metrology [0.5] 量子センサは、様々なパラメータにわたる実験者による操作を可能にすることで、推定中に制御の柔軟性を提供する。
量子力学、推定、仮説テストにおいて、幅広い問題を最適化できる汎用的な手順を導入する。
粒子フィルタリングに基づくモデル認識強化学習(RL)とベイズ推定を組み合わせた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:13:04 GMT)
CPP-UT-Bench: Can LLMs Write Complex Unit Tests in C++? [0.5] CPP-UT-Benchは、大規模言語モデル(LLM)のC++単体テスト生成能力を測定するベンチマークデータセットである。
データセットには2,653のコードと14のオープンソースC++から引き出されたユニットテストペアが含まれている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:35:24 GMT)
Resource-Adaptive Successive Doubling for Hyperparameter Optimization with Large Datasets on High-Performance Computing Systems [0.4] 本稿では,資源適応型逐次二重化アルゴリズム(RASDA)を提案する。
リソース適応型逐次二重化スキームと非同期逐次Halving Algorithm(ASHA)を組み合わせる。
ニューラルネットワーク(NN)のさまざまなタイプに適用され、コンピュータビジョン(CV)、計算流体力学(CFD)、追加製造(AM)ドメインからの大規模なデータセットでトレーニングされる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:25:48 GMT)
Analyzing Computing Undergraduate Majors from Job Market Perspective [0.3] 学術機関はコンピュータ工学、コンピュータ科学、情報システム、情報技術、ソフトウェア工学、サイバーセキュリティ、データサイエンスなど、様々なコンピューティング専攻を提供している。
本研究では、LinkedInの公開プロフィールデータを用いて、サウジアラビアの様々なコンピューティング専攻と求人市場との関係を分析した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:35:13 GMT)
Approximating many-body quantum states with quantum circuits and measurements [0.3] 正確な準備条件を引き上げることで、資源を大幅に節約できることを示す。
特に、いわゆる$W$と、より一般的には、Dicke状態は、システムサイズに依存しないサイト毎の回路深さとアンシラの数を必要とする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:56:21 GMT)
LLM-ABBA: Understanding time series via symbolic approximation [0.3] 我々は,様々なダウンストリーム時系列タスクに対して,ABBAを大規模言語モデルに統合するLLM-ABBAという手法を提案する。
LLM-ABBAは、時系列を象徴することにより、最近のUCRにおける最先端(SOTA)と3つの医療時系列分類タスクとを良好に比較する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:25:11 GMT)
Characterizing Coherent Errors using Matrix-Element Amplification [0.3] 動的デカップリング(MEADD)を用いたマトリックス素子増幅
実験により,MEADDは単一ビットゲートと2ビットゲートの系統的誤差を推定するために,既存のキャラクタリゼーションプロトコルの精度と精度を超えることを示した。
また,プロセッサのコヒーレントなクロストークを特徴付けるためにも使用しています。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:58:25 GMT)
Training for Speech Recognition on Coprocessors [0.2] 本稿では、この領域における最近の研究に触発されたディープニューラルネットワークに基づくASRモデルとその構築経験について述べる。
このモデルを、異なる予算カテゴリを表す3つのCPU-GPUコプロセッサプラットフォーム上で評価する。
ハードウェアアクセラレーションを利用することで,ハイエンド機器を使わずとも良好な結果が得られることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:13:27 GMT)
Expressive Higher-Order Link Prediction through Hypergraph Symmetry Breaking [0.2] 高次リンク予測はハイパーグラフに欠けているハイパーエッジの存在を予測するタスクである。
高次リンク予測のために学習されたハイパーエッジ表現は、同型への差分パワーを失わない場合に完全に表現される。
対称性を示す正規部分ハイパーグラフを識別する前処理アルゴリズムを考案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:42:45 GMT)
Initial Study On Improving Segmentation By Combining Preoperative CT And Intraoperative CBCT Using Synthetic Data [0.2] コーンビームCT(CBCT)は、コンピュータによる介入を促進するために用いられる。
高品質の術前スキャンが利用可能であることは、改善の可能性を秘めている。
本稿では,CBCTとCTのほぼ一致したスキャンを融合するマルチモーダル学習法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:08:38 GMT)
Machine Learning Methods for Automated Interstellar Object Classification with LSST [0.2] 宇宙と時間のレガシーサーベイは、太陽系の理解に革命をもたらす可能性がある。
本研究は,ISOトラックレットの自動分類における機械学習アルゴリズムの適用について検討する。
我々は、ランダムフォレスト(RF)、形状勾配降下(SGD)、ニューラルネットワーク(NN)など、さまざまな機械学習アルゴリズムを採用している。
GBMとRFのアルゴリズムはSGDとNNのアルゴリズムより優れており、ISOを他の太陽系の天体と正確に区別することができる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:09:22 GMT)
CPTQuant -- A Novel Mixed Precision Post-Training Quantization Techniques for Large Language Models [0.2] CPTQuantは相関ベース(CMPQ)、プルーニングベース(PMPQ)、テイラー分解ベース(TDMPQ)の混合精度技術を導入する包括的戦略である。
また,Hugging Face FP16と比較して,最大4倍圧縮と2倍の効率向上を実現した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:52:41 GMT)
How quantum computing can enhance biomarker discovery for multi-factorial diseases [0.1] 量子アルゴリズムは、特に機械学習において、バイオマーカー発見における重要な応用にマップされる。
アルゴリズムとアプリケーションに関連する機会と課題について論じる。
オープンな研究課題に関する見通しが提示されている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:39:57 GMT)
Intelligent Energy Management with IoT Framework in Smart Cities Using Intelligent Analysis: An Application of Machine Learning Methods for Complex Networks and Systems [0.1] 本稿では,スマートシティのエネルギー管理を目的としたIoTベースのフレームワークについて概観する。
データを収集、保存するだけでなく、監視、制御、システムの効率向上のためのインテリジェントな分析をサポートするシステムに注力する。
この結果から、IoTベースのフレームワークは、スマートな建物におけるエネルギー消費と環境への影響を低減できる重要な可能性を示唆している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:47:48 GMT)
A Fast Convergence Theory for Offline Decision Making [0.1] 本稿では、オフライン決定問題に対する一般関数近似における最初の一般化高速収束結果を提案する。
異なる設定を統一するために,オフラインフィードバックを用いた意思決定(Decision Making with Offline Feedback, DMOF)というフレームワークを導入する。
本枠組みでは,経験的オフライン推定係数 (EOEC) という上限を係数として表すことのできる,経験的意思決定(EDD)と呼ばれる単純かつ強力なアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:32:15 GMT)
Go beyond End-to-End Training: Boosting Greedy Local Learning with Context Supply [0.1] ゆるやかなローカル学習は、ネットワークを勾配に分離したモジュールに分割し、局所的な予備的損失に基づいて監督的に訓練する。
勾配分離モジュールのセグメンテーション数が増加するにつれて、局所学習方式の性能は大幅に低下する。
本稿では,情報損失を補うために,分離モジュール間のコンテキスト供給を組み込んだContSupスキームを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:35:27 GMT)
Evaluating the Impact of Data Augmentation on Predictive Model Performance [0.1] 本稿では,データ拡張手法と予測性能への影響を体系的に比較する。
21種類の増幅法のうち、SMOTE-ENNサンプリングが最も優れ、平均AUCが0.01向上した。
いくつかの拡張技術は、予測性能を著しく低下させたり、ランダムな確率に関する性能変動を増大させたりした。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:03:04 GMT)
Decrypting Nonlinearity: Koopman Interpretation and Analysis of Cryptosystems [0.1] 本稿では,Diffie-Hellman鍵交換系とRivest-Shamir-Adleman暗号系を非線形力学系として見ることにより,暗号系に対する新たな視点を導入する。
クープマン理論を適用することで、これらの力学系を高次元空間に変換し、解析的に同値な純粋線型系を導出する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:30:05 GMT)
Were You Helpful -- Predicting Helpful Votes from Amazon Reviews [0.0] 本研究は,Amazon製品レビューの有用性に影響を及ぼす要因について,機械学習技術を用いて検討する。
レビュー支援の強力な予測因子として機能する重要なメタデータの特徴を同定する。
この知見は、文脈的およびユーザ行動的要因は、言語内容そのものよりも、レビューの有用性を示す可能性があることを示唆している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:38:58 GMT)
Vision Transformers for Weakly-Supervised Microorganism Enumeration [0.0] 本研究は、微生物列挙における弱教師付き計数のための視覚変換器(ViT)の比較分析を行う。
4つの微生物学的データセットを用いた特徴抽出のためのアーキテクチャバックボーンとして,さまざまなバージョンのViTをトレーニングした。
その結果、ResNetsは全体的なパフォーマンスが向上する一方で、ViTsのパフォーマンスはすべてのデータセットにまたがる有能な結果を示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:27:20 GMT)
Variational approach to atom-membrane dynamics [0.0] フォノン生成により、有限温度で弾性膜に吸着する冷原子の気体に対して、方法を適用する。
システム状態の時間依存性をラプラス変換法を用いて解析的に計算する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:33:27 GMT)
Unveiling the Dance of Molecules: Ro-Vibrational Dynamics of Molecules under Intense Illumination at Complex Plasmonic Interfaces [0.0] 本研究では,Fabry-Perotキャビティおよび3次元プラズモン準曲面における強共振ポンプ励起後の分子集合の緩和ダイナミクスについて検討した。
シミュレーションにより、空洞内の緩和経路は自由空間に比べて劇的に変化し、永続的な分子アライメントが特徴である。
また、分子キャビティモードの脱落によって引き起こされる、未報告の緩和安定化機構の存在も示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:17:35 GMT)
Unleashing GHOST: An LLM-Powered Framework for Automated Hardware Trojan Design [0.0] GHOSTは、大規模言語モデル(LLM)を活用して高速なHT生成と挿入を行う自動攻撃フレームワークである。
GHOST生成HTの100%はML生成HT検出ツールによる検出を回避した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:33:29 GMT)
Unconditional proofs of quantumness between small-space machines [0.0] 量子性の証明は、古典的な機械が古典的なコンピュータでは不可能な計算を実行しているかどうかを検証できるプロトコルである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:37:07 GMT)
U-Net in Medical Image Segmentation: A Review of Its Applications Across Modalities [0.0] 人工知能(AI)と深層学習(DL)の進歩は医療画像セグメンテーション(MIS)に変化をもたらした
これらのモデルは、様々な画像モダリティにまたがる効率的で正確な画素単位の分類を可能にする。
本稿では,様々な医用画像技術について検討し,U-Netアーキテクチャとその適応について検討し,その応用方法について考察する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:11:06 GMT)
Trust & Safety of LLMs and LLMs in Trust & Safety [0.0] 本稿では,大規模言語モデルにおける信頼と安全性に関する現在の研究状況について考察する。
信頼性と安全性が最優先の領域におけるLCMの利用の複雑さを掘り下げる。
このレビューでは、信頼と安全においてLLMを使用するためのベストプラクティスに関する洞察を提供し、迅速な注入や脱獄攻撃といった新たなリスクについて調査する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:10:12 GMT)
Transition probabilities for a Rydberg atom in the field of a gravitational wave [0.0] 地球上の重力波が原子的に検出される可能性は考慮されている。
104ldots 105$の領域に主量子数を持つリドベルク原子は、そのような可能性を開くのに十分高い遷移確率をもたらす。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:04:29 GMT)
Transformer-based Koopman Autoencoder for Linearizing Fisher's Equation [0.0] 線形フィッシャーの反応拡散方程式に対してトランスフォーマーに基づくクープマンオートエンコーダを提案する。
強調するのは、方程式を解くだけでなく、システムのダイナミクスをより理解しやすい形式に変換することだ。
提案したモデルの有効性を評価するために,複数のデータセットに対する広範囲な試験を行った。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:52:04 GMT)
Transformer-Metric Loss for CNN-Based Face Recognition [0.0] 本稿では,顔認識領域の付加的損失としてトランスフォーマーネットワークを用いた損失評価手法を提案する。
変換器の損失(transformer-metric loss)は、変換器の損失(transformer-loss)と計量の損失(trime-loss)の両方を統合したアプローチである。
本研究は、機械ビジョン領域におけるトランスフォーマーの役割を拡張し、ロス関数としてトランスフォーマーを探索する新たな可能性を開く。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:23:35 GMT)
Towards nonlinear optics with Mössbauer nuclei using x-ray cavities [0.0] 我々は、非線形光学を原子核で実現するために必要な実験条件を概説する。
我々は, 集束X線パルスによる薄膜X線キャビティにおける非線形核励起の包括的理論を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:22:24 GMT)
Time-Series-Informed Closed-loop Learning for Sequential Decision Making and Control [0.0] 伝統的なベイズ最適化アプローチは、学習問題をブラックボックスとして扱い、基礎となる問題の構造に関する貴重な情報や知識を無視している。
本稿では,各実験エピソードの初期イテレーションから中間性能評価を学習手順に組み込んだ時系列インフォームド最適化フレームワークを提案する。
提案手法は, ほぼ半分の資源でベースライン性能を達成し, 最終的なクローズドループ性能においてベースライン性能より優れていることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:38:53 GMT)
Thermal state structure in the Tavis--Cummings model and rapid simulations in mesoscopic quantum ensembles [0.0] 電磁場と一様に相互作用するNスピン1/2粒子の集合からなるハイブリッド量子系は、量子情報プロセッサの開発に重要である。
この研究において、Dicke subspace approximation があまりに簡単に呼び出されることが定量的に示される。
この研究の結果は、結合キャビティアレイ、空洞を介する集合スピンアンサンブルのカップリング、集合スピンシステムなど、関連するシステムにも利用できる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:44:43 GMT)
The fabulous world of GKP codes [0.0] 量子誤差補正は、量子技術の発展に欠かせない要素である。
量子誤差補正における重要な道具は、対称性を強制することによって量子システムをテーゼする安定化形式である。
ゴッテマン・キタエフ・プレスキル符号(Gottesman-Kitaev-Preskill code)は、無限次元ヒルベルト空間内の論理部分空間を生成する安定化符号である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:27:37 GMT)
The effect of priors on Learning with Restricted Boltzmann Machines [0.0] 本稿では,教師RBMが生み出す実例から学生RBMが学習する教師学生環境について検討する。
連続(ガウス的)変数と二変数の間で補間する先行のパラメトリッククラスを考える。
我々は,いわゆる信号検索領域を拡大することで,学生の事前選択を賢明に行うことができることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:52:38 GMT)
The Logic of Counterfactuals and the Epistemology of Causal Inference [0.0] 2021年のノーベル経済学賞では、ルービン因果モデルとして知られる因果モデルが認められている。
私は、ルビン因果モデルとルイス=シュタルナーカーの議論を、反事実論の論理原理で結びつける弁証法を開発した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:41:22 GMT)
Technical Report on Reinforcement Learning Control on the Lucas-Nülle Inverted Pendulum [0.0] 強化学習(Reinforcement Learning, RL)は, 植物系モデルを必要としない最適制御問題に適用できる。
このコントリビューションは、Lucas-N"ulle社が提供する教育ハードウェアに適用可能なRLフレームワークをターゲットにしている。
実際の学習は、対応する計算をリアルタイム制御コンピュータから切り離し、異なるハードウェアにアウトソーシングすることで実現される。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:37:27 GMT)
Tailoring Dynamical Codes for Biased Noise: The X$^3$Z$^3$ Floquet Code [0.0] X$3$Z$3$Floquet符号を提案する。
我々の研究は、素量子誤り訂正符号候補として、X$3$Z$3$の符号を確立する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:34:12 GMT)
Symbolic Quantitative Information Flow for Probabilistic Programs [0.0] 最新のデータ集約システムが機密情報を漏らさないよう、最重要事項である。
本稿では,Joost-Pieter Katoenの協力を得て,情報理論による情報漏洩の計算方法について議論する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:27:57 GMT)
Switching, Amplifying, and Chirping Diode Lasers with Current Pulses for High Bandwidth Quantum Technologies [0.0] 電流変調に基づくスイッチング、増幅、チャープ用ダイオードレーザを提供する。
システムは、任意の周波数チャープを持つワットレベルの光パルスを所定の範囲で生成し、残留強度は2%である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:10:26 GMT)
Support Vector Regression: Risk Quadrangle Framework [0.0] 条件付き四角形(RQ)理論の枠組みの中で,SVR(Support Vector Regression)について検討した。
RQ理論は、$varepsilon$-SVRと$nu$-SVRが2つの対称条件量子平均の偏りのない推定子であることを示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:49:49 GMT)
Structure of Quantum Mean Force Gibbs States for Coupled Harmonic Systems [0.0] 所定の温度で熱浴と相互作用するオープン量子系は、平均力ギブス状態(MFG)を定常状態として到達することが期待される。
システムと風呂の間の相互作用が無視できない場合、ハミルトニアン系のみから得られる通常のシステムギブス状態とは異なる。
浴槽境界からの距離の関数として,浴槽とのカップリング効果が指数関数的に低下することを示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:33:08 GMT)
Spatio-Spectral Quantum State Estimation of Photon Pairs from Optical Fiber Using Stimulated Emission [0.0] 我々は、光ファイバーで生成した光子対を、横モードおよび周波数自由度で特徴付ける。
この方法は、様々な光子対ソースプラットフォームの量子状態推定と最適化に有用である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:51:51 GMT)
Single-atom resolved collective spectroscopy of a one-dimensional atomic array [0.0] 秩序化された原子配列は、ランダムな原子アンサンブルに比べて光応答が強化されている。
1つの結果は、素原子周波数に対する遷移の大きなシフトの存在である。
本稿では,30個のジスプロシウム原子の1次元配列の集合光学応答について報告する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:34:32 GMT)
Semantic Tokens in Retrieval Augmented Generation [0.0] 本稿では,確率的RAGシステムと決定論的に検証可能な応答のギャップを埋めるための評価モジュールを導入した新しい比較RAGシステムを提案する。
このフレームワークは、高い精度と検証可能性を必要とする領域において、より信頼性が高くスケーラブルな質問応答アプリケーションを実現する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:52:06 GMT)
Self-Supervised Learning-Based Path Planning and Obstacle Avoidance Using PPO and B-Splines in Unknown Environments [0.0] Smart BSPは、自律ロボット工学におけるリアルタイムパス計画と障害物回避のための高度な自己教師型学習フレームワークである。
提案システムは,PPO(Proximal Policy Optimization)と畳み込みニューラルネットワーク(Convolutional Neural Networks, CNN)とActor-Criticアーキテクチャを統合する。
トレーニングプロセス中に、経路曲率、終端近接、障害物回避を考慮に入れたニュアンスコスト関数を最小化する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:20:29 GMT)
Self-Similar acoustic white hole solutions in Bose-Einstein condensates and their Borel analysis [0.0] 2次元(円対称)および3次元(球対称)におけるグロス・ピタエフスキー方程式の特異自己相似解について議論する。
これらの解を用いて、凝縮物中の音の局所速度と凝縮物の流速の大きさの交叉を確認し、超音速領域の存在を示し、黒-白穴の音速類似性を示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:58:28 GMT)
Scar-induced imbalance in staggered Rydberg ladders [0.0] 本研究では, スタガードデチューニングを施した2脚はしご上でのリドベルク原子の運動論的拘束モデルについて検討した。
QMBSは、N'eel と Rydberg の真空初期状態のコヒーレントな多体再生と部位依存磁化ダイナミクスをもたらす。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:47:33 GMT)
Scaling BERT Models for Turkish Automatic Punctuation and Capitalization Correction [0.0] 本研究は,各モデルの性能指標の精度,リコール,F1スコアを系統的に比較した。
その結果,モデルのサイズが大きくなるにつれて,テキストの読みやすさと精度が大幅に向上した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:59:51 GMT)
Sample Efficient Robot Learning in Supervised Effect Prediction Tasks [0.0] 本研究では,アクション・エフェクトの予測や,より一般的にはMUSELと呼ばれる世界モデル学習のためのロボットレグレッションタスクを目的とした新しいALフレームワークを開発する。
MUSELは、学習エンジンが与える総不確実性推定から、進捗と入力の多様性を利用してモデル不確かさを抽出し、それを用いて、最先端のアクション・エフェクト予測法を超えてサンプル効率を向上させることを目的としている。
MUSELの有効性は、ロボットのアクション・エフェクト・ラーニングで使用される標準的な方法と比較することによって実証される。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:48:28 GMT)
Robust chiral optical force via electric dipole interactions, inspired by a sea creature [0.0] 我々のカイラル光学力は、これまで提案されたものよりも桁違いに強い。
本研究では,全数値シミュレーションによって支持される現実的な実験を提案し,反対のエナンチオマーの光学的分離を可能とした。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 11:54:20 GMT)
Reply to "Comment on 'Experimentally adjudicating between different causal accounts of Bell-inequality violations via statistical model selection'" [0.0] Hance と Hossenfelder はコメントの中で、超決定論的モデルの目的を誤って表現したと主張している。
本稿で定義した超決定論的モデルの異なるクラスと、これらのどれが実験結果に嫌われているのかという結論を思い出すことで、この主張に異議を唱える。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:47:47 GMT)
Relaxing Trust Assumptions on Quantum Key Distribution Networks [0.0] 我々は、リレー上の信頼前提(完全ではないとしても)を緩和することにより、QKDネットワーク内のシークレットを確実に中継する可能性を探る。
異なる信頼度に基づくQKD鍵管理システムの複数構成を提案する。
本論文の主な貢献は,アクセス信頼度のないキー管理システムの評価によって実現された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:41:23 GMT)
Reconstruction of dynamic systems using genetic algorithms with dynamic search limits [0.0] 時系列データを用いて動的システムの制御方程式を推定するために進化的計算手法が提案される。
本研究の主な貢献は、最小限のコントリビューションを持つ用語を除去するための遺伝的アルゴリズムの適切な修正と、局所的なオプティマから逃れるメカニズムである。
その結果,0.22未満の積分正方形誤差と,全系に対して0.99のR-二乗決定係数を用いて再構成を行った。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:58:25 GMT)
Quantum state transfer with sufficient fidelity [0.0] 我々は、完全な状態転移を持つクラスチョークのスピン鎖と同質のXX鎖との間に補間する不均一なXXスピン鎖を考える。
クローチョーク連鎖に対するこのモデルの利点は、効率的な状態移動を達成する一方で、結合強度がカプセル化され、サイト数が増加するにつれて過度に大きくなることはないことである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:35:47 GMT)
Probing the statistical properties of enriched co-occurrence networks [0.0] 本研究では,テキストベースネットワークモデルの2つの重要な統計特性について検討する。
仮想エッジを組み込むと、特定のネットワークメトリックによって正および負の効果が得られることを示す。
私たちの結果は、特定のアプリケーションに最も適したネットワークメトリクスを決定するためのガイドラインとして役立ちます。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:38:14 GMT)
Probabilistic Analysis of Copyright Disputes and Generative AI Safety [0.0] 「特に逆比則に焦点をあてて、重要な顕在主義の構造化された分析を提供する。」
本稿では、生成AIによる著作権リスクの増大について検討し、生成モデルによる著作権物質へのアクセスが侵害のリスクを高めることを明らかにする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:23:06 GMT)
Private Linear Regression with Differential Privacy and PAC Privacy [0.0] 既存のプライバシを保存する線形回帰法は、よく確立された差分プライバシーの枠組みに依存している。
PACプライバシーはこの文脈ではまだ調査されていない。
差分プライバシとPACプライバシでトレーニングされた線形回帰モデルを、3つの実世界のデータセットで比較する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:04:14 GMT)
PriorPath: Coarse-To-Fine Approach for Controlled De-Novo Pathology Semantic Masks Generation [0.0] 粗い粒度の画像から得られた詳細でリアルなセマンティックマスクを生成するパイプラインであるPresidePathを提案する。
このアプローチにより、生成されたマスクの空間配置を制御でき、結果として合成画像が生成される。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:48:06 GMT)
Pay Attention to the Robustness of Chinese Minority Language Models! Syllable-level Textual Adversarial Attack on Tibetan Script [0.0] テキストの敵対的攻撃は、中国の少数言語の情報処理における新たな課題である。
我々はTSAttackerと呼ばれるチベット語音節レベルのブラックボックステキスト対逆攻撃を提案する。
実験結果から,TSAttackerは有効であり,高品質な対向サンプルを生成することがわかった。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:38:22 GMT)
Patent-CR: A Dataset for Patent Claim Revision [0.0] 本稿では,特許請求書修正作業のために作成された最初のデータセットであるPatent-CRについて述べる。
これには、特許審査官によって拒絶された初期特許出願と、最終認可版の両方が含まれる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:43:42 GMT)
Parity breaking in Thouless quantum walks [0.0] 非可換性と位相の相互作用が幾何的に保護された量子コインやシフト演算子を実現するかを示す。
驚くべきことに、ウォークブレイクパリティはワイル型方程式で記述された動的なプロセスを生成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:49:37 GMT)
Out-of-Distribution Detection for Neurosymbolic Autonomous Cyber Agents [0.0] 本研究では,確率的ニューラルネットワーク(PNN)を用いて異常状況を検出するOODモニタリングアルゴリズムを開発した。
我々は,OODモニタリングアルゴリズムを,学習可能なコンポーネントを用いた行動木を用いたニューロシンボリックな自律サイバーエージェントと統合する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:20:52 GMT)
Optimizing Large Language Models for Turkish: New Methodologies in Corpus Selection and Training [0.0] 大規模言語モデルの生成したデータセットに適応し、英語のデータセットをトルコ語に翻訳する。
このアプローチは、数ショットとゼロショットの両方の学習シナリオにおいて、モデルの精度を大幅に向上させた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:17:18 GMT)
Optimized IoT Intrusion Detection using Machine Learning Technique [0.0] 侵入検知システム(IDS)は様々な攻撃に対する防御に不可欠である。
IoT IDSシステムの機能的および物理的多様性は、重大な問題を引き起こす。
本研究は、特異性に基づくIDSに対して、新しい成分選択抽出戦略を提案し、実装する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:23:54 GMT)
Optimization of Transformer heart disease prediction model based on particle swarm optimization algorithm [0.0] 本稿では,心疾患予測の精度を向上させるための改良型トランスフォーマーモデルを提案する。
まず、決定木、ランダムフォレスト、XGBoostという3つの主流機械学習分類アルゴリズムを使用します。
その結果、ランダム森林モデルは、92.2%の精度で心臓病の分類を予測するのに最高の性能を示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:04:32 GMT)
Optimal Clustering with Dependent Costs in Bayesian Networks [0.0] ベイジアンネットワーク(BN)におけるノードのクラスタリングと、動的BN(DBN)のような関連するグラフィカルモデルが、計算効率の向上とモデル学習の改善のために実証されている。
本稿では, 任意に定義された正のコスト関数が与えられた場合, 全ての最適なクラスタマッピングを求めるために, 解析的に解析的に示される Dependent Cluster MAPping (DCMAP) というアルゴリズムを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:41:12 GMT)
On the Realization of quantum gates coming from the Tracy-Singh product [0.0] 行列のTracy-Singh積は、新しいゲート$cボックスタイムc'$を2つの2ドルキューディットゲートから作成することができる。
これらのゲートの実現に関する自然な疑問が、局所ゲートと普遍ゲートという観点から、$cboxtimes c'$である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:05:28 GMT)
OceanCastNet: A Deep Learning Ocean Wave Model with Energy Conservation [0.0] OceanCastNet (OCN) はエネルギーバランスの深いディープラーニングの予測モデルである。
OCNは、業界で広く使われているWaveWatch IIIモデルより一貫して優れている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:54:30 GMT)
Nonreciprocal Synchronization of Active Quantum Spins [0.0] 対角的非相反的な方法で相互作用する2種類の量子スピンのモデルを示す。
非相互相互作用は時間-結晶性進行波状態への非相互相転移をもたらすことを示す。
我々の研究は、活性量子物質における非相互相互作用を探求する基礎を築いた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:47:33 GMT)
Narrowband and passband composite rotational quantum gates [0.0] 高精度で堅牢な量子ゲートは、量子計算や情報処理において不可欠な要素である。
誤りに対する感度を高める量子ゲートの適用可能性について検討する。
狭帯域特性と通過帯域特性の3つの基本量子ゲートを導出する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:01:45 GMT)
Multi-scale and Multi-path Cascaded Convolutional Network for Semantic Segmentation of Colorectal Polyps [0.0] 本研究は,Multi-Scale and Multi-Path Cascaded Convolution Network (MMCC-Net) という,大腸ポリープセグメンテーションのための新しいフレームワークを提案する。
MMCC-Netは、マルチスケールおよびマルチパスのカスケード畳み込み技術を統合し、デュアルアテンションモジュール、スキップ接続、フィーチャエンハンサーを通じてフィーチャアグリゲーションを強化する。
提案したMMCC-Netは6つの公開データセットでテストされ、ポリプセグメンテーションの効率を示すために8つのSOTAモデルと比較された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:27:51 GMT)
Multi-Granularity Tibetan Textual Adversarial Attack Method Based on Masked Language Model [0.0] 我々はTSTrickerと呼ばれるマスキング言語モデルに基づく多粒度チベット文字対逆攻撃法を提案する。
結果は、TSTrickerが分類モデルの精度を28.70%以上削減し、分類モデルが90.60%以上のサンプルの予測を変更することを示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:03:52 GMT)
Modeling and Discovering Direct Causes for Predictive Models [0.0] 本稿では,予測モデルの入出力挙動を捉える因果モデリングフレームワークを提案する。
このフレームワークは、予測を直接引き起こす機能を定義し、特定することを可能にする。
データから直接原因を発見できるという仮定が2つあり、そのうちの1つは発見プロセスをさらに単純化するものである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:25:42 GMT)
Mining Tweets to Predict Future Bitcoin Price [0.0] 暗号通貨、特にBitcoinに関するソーシャルメディアプラットフォームへの投稿は増えている。
このプロジェクトでは、ユーザーツイートデータをBitcoin価格データと組み合わせて分析し、価格変動とTwitter上の何百万人もの人々の会話の関連性を確認する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:09:19 GMT)
MEP-Net: Generating Solutions to Scientific Problems with Limited Knowledge by Maximum Entropy Principle [0.0] 本稿では,MEPとニューラルネットワークを組み合わせてモーメント制約から確率分布を生成する新しいニューラルネットワークアーキテクチャMEP-Netを提案する。
本稿では,MEP-Netが生化学反応ネットワークにおける確率分布の進化をモデル化し,データから複雑な分布を生成するのに特に有用であることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:21:29 GMT)
LoRA Diffusion: Zero-Shot LoRA Synthesis for Diffusion Model Personalization [0.0] Low-Rank Adaptation (LoRA) や他のパラメータ効率のよい微細チューニング (PEFT) 手法は、テキスト・ツー・イメージ・モデルをパーソナライズするための低メモリ、ストレージ効率のソリューションを提供する。
ハイパーネットワークモデルをトレーニングしてLoRA重みを生成することで、特定のドメインに対する競合品質を実現することができることを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:17:15 GMT)
Leveraging Large Language Models to Democratize Access to Costly Financial Datasets for Academic Research [0.0] GPT-4o-mini を用いた新たな手法の開発と評価を行った。
提案手法は,約1万件のプロキシステートメントとCAM(Critical Audit Matters)から1万2000件以上の10-Kの書類から,CEOの給与比率を収集する上で,人間レベルの精度を実現する。
これは、手作業による収集に要する数百時間や、商用データベースのサブスクリプションに要する数千ドルとは対照的である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:59:56 GMT)
Leveraging Ensemble-Based Semi-Supervised Learning for Illicit Account Detection in Ethereum DeFi Transactions [0.0] 分散ファイナンス(DeFi)は、不正アカウントの拡散など、重大なセキュリティリスクを導入している。
従来の検出方法は、ラベル付きデータの不足と悪意あるアクターの進化戦略によって制限される。
本稿では,これらの課題に対処するために,自己学習型Illicitアカウント検出フレームワークを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 12:03:13 GMT)
Learning Temporal Logic Predicates from Data with Statistical Guarantees [0.0] 有限サンプル精度保証データから時間論理の述語を学習する新しい手法を提案する。
提案手法は,表現最適化と共形予測を利用して,将来の軌跡を正しく記述した述語を学習する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:52:27 GMT)
Learning General Representation of 12-Lead Electrocardiogram with a Joint-Embedding Predictive Architecture [0.0] 本稿では,12誘導ECG分析のための自己教師型学習モデルECG-JEPAを紹介する。
隠れた潜在空間で予測することで、ECGデータのセマンティック表現を学習する。
ECG-JEPAは、ECG分類や特徴予測を含む様々な下流タスクで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:21:51 GMT)
LX-mixers for QAOA: Optimal mixers restricted to subspaces and the stabilizer formalism [0.0] 与えられた部分空間を保存するミキサーの理解と構築を両立させる新しい形式主義を提示する。
我々は、我々のアプローチを論理X-ミクサーまたは論理XQAOAと呼ぶ。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:49:50 GMT)
Kinetic magnetism and stripe order in the antiferromagnetic bosonic ${t-J}$ model [0.0] 我々は、ドープ型強磁性量子マグネットの強い結合限界、特に反強磁性(AFM)ボソニック$t-J$モデルについて検討する。
ドーピングの増加に伴い、長岡ポーラロンを形成する移動体ボゾン電荷担体の運動により、部分的に偏極化した強磁性(FM)相へ遷移する。
これらの知見は, 強相関多体系における粒子統計学の役割に新たな光を当て, 磁性の形成と速度論的(長岡型)強磁性の物理との関係を明らかにした。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:28:13 GMT)
Joint Image De-noising and Enhancement for Satellite-Based SAR [0.0] 合成開口レーダ(SAR)データから再構成した画像は、乗算ノイズと低コントラストレベルに悩まされる。
本稿では,これらの欠点を同時に扱う手法を提案する。
実際、ノイズ除去とコントラスト強化のプロセスを統一されたアルゴリズムに組み合わせる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:24:27 GMT)
Investigating Privacy Leakage in Dimensionality Reduction Methods via Reconstruction Attack [0.0] 我々は,低次元埋め込みから高次元データを再構成できるニューラルネットワークを開発した。
我々は,PCA,スパースランダムプロジェクション (SRP), 多次元スケーリング (MDS), Isomap, t-SNE, UMAPの6つの一般的な次元削減手法を評価する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:27:59 GMT)
Interpretable Company Similarity with Sparse Autoencoders [0.0] 企業の類似性を決定する潜在的手法として,企業記述のクラスタ化が提案されている。
トークンの埋め込みにおける解釈可能性の欠如は、ハイテイクなコンテキストにおける採用にとって大きな障壁となる。
スパースオートエンコーダは、解釈可能な機能に分解することで、大規模言語モデルの解釈可能性を高めることを約束している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:34:50 GMT)
Interaction effects in quantum geometry [0.0] 量子メートル法における相互作用効果の役割について検討する。
反動的なハバード相互作用は量子計量を単調に抑制することを示す。
私たちの結論は、フラットバンドと分散システムの両方に当てはまる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:00:03 GMT)
Integrated Differential Conjugate Homodyne Detection for Quantum Random Number Generation [0.0] 量子乱数生成(QRNG)の代替手法を提案する。
ホモダイン検出システムにおいて,25.6dBのショットノイズクリアランス (SNC) と69dBのコモンモード拒絶率 (CMRR) を報告した。
ランダムネス抽出はToeplitzハッシュアルゴリズムを用いて実装され、National Institute of Standards and Technology (NIST)ランダムネステストスイートで検証されている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:42:29 GMT)
Implementing An Artificial Quantum Perceptron [0.0] パーセプトロン(Perceptron)は、ニューラルネットワークの基本的な構成要素である。
研究により、単一のニューロンが知的決定を下す効果が示されている。
我々はこれらのパーセプトロンの1つの量子バージョンを開発する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:57:09 GMT)
Impact of quantum noise on phase transitions in an atom-cavity system with limit cycles [0.0] 量子ノイズは、標準平均場理論によって予測される臨界値よりも低い相互作用強度のLCのシグネチャを示す。
我々の研究は、量子ゆらぎによる有限サイズの効果によって生じる定常相間の明らかな交叉様挙動が、動的相を含む遷移にも適用可能であることを示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:44:41 GMT)
Hacking CTFs with Plain Agents [0.0] LLMエージェントを設計した高校レベルのハッキングベンチマークを飽和させた。
攻撃的セキュリティベンチマークであるInterCode-CTFでは,プロンプト,ツール使用,複数試行によって95%のパフォーマンスが得られた。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:17:45 GMT)
HERO: Hint-Based Efficient and Reliable Query Optimizer [0.0] 本稿では,より優れた実行計画を実現するためのクエリヒントを提供する,学習クエリ最適化のための新しいモデルを提案する。
このモデルは、学習したヒントベースのクエリ最適化において、信頼できるヒントレコメンデーション、効率的なヒント探索、高速推論という3つの課題に対処する。
私たちのモデルは解釈可能でデバッグが容易です。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:58:34 GMT)
Ground State Energy Estimation on Current Quantum Hardware Through The Variational Quantum Eigensolver: A Comprehensive Study [0.0] NISQデバイス上での分子問題に対するVQEの実装ガイドを示す。
この研究は文学における未文書の諸側面を明らかにしている。
VQEの量子ノイズに対するレジリエンスは、依然として未解決の問題である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:35:31 GMT)
Grayscale to Hyperspectral at Any Resolution Using a Phase-Only Lens [0.0] 我々は、小さなグレースケール計測パッチをハイパースペクトルパッチにマッピングする条件付き偏波拡散モデルを訓練する。
我々のモデルは、小さなハイパースペクトルデータセットを用いて訓練し、任意の大きさのハイパースペクトル画像を再構成するためにデプロイすることができる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:00:21 GMT)
Going beyond quantum Markovianity and back to reality: An exact master equation study [0.0] オープン量子系の解析的描写を提供する。
系の定常励起数(AEN)は、非マルコビアン性の増加に伴う急激なエスカレーションを示す。
Mpemba効果は、非マルコフ系では驚くほど超冷却的な効果で観察できる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:26:01 GMT)
Generalized compression and compressive search of large datasets [0.0] panCAKESは圧縮検索の新しいアプローチであり、圧縮されたデータに対して$k$-NNと$rho$-NN検索を実行する方法である。
PanCAKESは多様体仮説を仮定し、データの低次元構造を利用して効率よく圧縮・探索する。
ゲノミクス、プロテオミクス、データセットなど、さまざまなデータセットでpanCAKESをベンチマークします。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:26:10 GMT)
GSIFN: A Graph-Structured and Interlaced-Masked Multimodal Transformer-based Fusion Network for Multimodal Sentiment Analysis [0.0] マルチモーダルセンチメント分析(MSA)は、複数のデータモーダルを利用して人間の感情を分析する。
既存のMSAモデルでは、MSA能力を促進するために、最先端のマルチモーダル融合と表現学習に基づく手法が一般的である。
提案するGSIFNは,これらの問題を解決するために2つの主成分を組み込んでいる。
これはInterlaced Mask機構を採用し、堅牢なマルチモーダルグラフ埋め込みを構築し、オールモーダルインワントランスフォーマーベースの融合を実現し、計算オーバーヘッドを大幅に削減する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:06:03 GMT)
GPT Semantic Cache: Reducing LLM Costs and Latency via Semantic Embedding Caching [0.0] GPT Semantic Cacheは、インメモリストレージ(Redis)におけるクエリ埋め込みのセマンティックキャッシュを利用する方法である。
ユーザクエリを格納することにより、セマンティックに類似した質問を効率よく識別し、大規模言語モデルに対する冗長なAPI呼び出しを伴わずに、事前生成された応答を検索できる。
実験の結果、GPT Semantic CacheはさまざまなクエリカテゴリでAPI呼び出しを最大68.8%削減し、キャッシュヒット率は61.6%から68.8%に向上した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:40:10 GMT)
From dynamical to steady-state many-body metrology: Precision limits and their attainability with two-body interactions [0.0] 多体プローブによる未知パラメータ$theta$の推定について検討する。
量子フィッシャー情報とそれに対応する最適相互作用ハミルトニアンのバウンダリについて述べる。
次に、相互作用するスピンを介して磁場の強さを推定し、相互作用するハミルトン多様体を導出する特定の問題に移行する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:00:05 GMT)
Flattering to Deceive: The Impact of Sycophantic Behavior on User Trust in Large Language Model [0.0] シコファンシー(Sycophancy)とは、大きな言語モデルが、そのアウトプットをユーザーの好み、信念、意見と整合させ、好意的に見せる傾向をいう。
本研究では,サイコファンの傾向が,大規模言語モデルにおけるユーザの信頼に悪影響を及ぼすか,あるいは逆に,そのような行動が好ましくないかを検討する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:07:41 GMT)
Fermi polaron in atom-ion hybrid systems [0.0] 原子-イオンハイブリッドシステムは、特定の量子材料におけるポーラロン物理学の量子シミュレーションのための有望なプラットフォームである。
ここでは, 極性フェルミ浴における荷電不純物であるイオンフェルミポーラロンを, 量子モンテカルロ法を用いて0温度で調査する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:36:06 GMT)
Fault Detection and Identification via Monitoring Modules Based on Clusters of Interacting Measurements [0.0] 本研究は,対話的計測のクラスタからなるモジュールをベースとした,制御対応の分散プロセス監視手法を提案する。
この手法は、モニタリングモジュールの完全な主成分分析(f-PCA)を使用して、テネシー・イーストマン・プロセスのベンチマークで検証されている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 01:16:51 GMT)
FairML: A Julia Package for Fair Classification [0.0] 機械学習における公平な分類のためのフレームワークを提供するJuliaパッケージであるFairML.jlを提案する。
公正な学習プロセスは、前処理、内処理、後処理の3つの段階に分けられる。
シミュレーションでは, 単一位相とその組み合わせの性能を示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:54:27 GMT)
Excitation of narrow x-ray transitions in thin-film cavities by focused pulses [0.0] 短焦点X線パルスによる硬X線エネルギーの狭い遷移の励起を計算する手法を開発した。
特に, 薄膜キャビティがパルス伝播に与える影響を半解析アルゴリズムを用いて検討した。
空洞構造に集束したX線パルスが、これまでの理論的研究や衝突ビームを用いた実験でどのように利用されたかを示す。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:15:38 GMT)
Equation-informed data-driven identification of flow budgets and dynamics [0.0] 本稿では,フロークラスタリングのための新しいハイブリッド手法を提案する。
それは、方程式に基づく特徴を持つシステムの各サンプルポイントを特徴づけることから成り立っている。
このアルゴリズムは、EulerianフレームワークとLagrangianフレームワークの両方で実装されている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:48:06 GMT)
Entanglement and decoherence in cosmology and in analogue gravity experiments [0.0] この論文は、インフレーション宇宙論の文脈で量子相関の生成と破壊を分析することを目的としている。
インフレーションと予熱という両方の状況の物理学は、量子場に作用する強い古典的場が絡み合った(準)粒子を生成することである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:29:02 GMT)
Effects of multi-photon states in the calibration of single-photon detectors based on a portable bi-photon source [0.0] 単一光子検出器(SPD)は、量子イメージング、センシング、通信のための多くのプロトコルにおいてユビキタスである。
量子相関光子対のソースに基づくSPDの校正法は、単一光子検出を用いて、隠蔽された単一光子を生成する。
両光子源の多光子特性は, システム損失とともに, SPDの校正精度に有意な影響を及ぼすことを示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:54:34 GMT)
Diffusion Models with Anisotropic Gaussian Splatting for Image Inpainting [0.0] 本研究では,拡散モデルと異方性ガウススプラッティングを組み合わせ,局所構造とグローバルコンテキストの両方を効果的に捉える新しい塗装法を提案する。
提案手法は最先端技術より優れ, 構造的整合性とテクスチャリアリズムを向上した視覚的可視性のある結果が得られる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:44:43 GMT)
Diffraction of atomic matter waves through a 2D crystal [0.0] 単層グラフェンを通したキロボルトエネルギーにおけるヘリウムおよび水素原子の通常の入射時に回折を示す。
我々の結果は、トムソンとリードによる電子による最初の透過実験の原子対である。
我々は,非チャートエネルギー系におけるデコヒーレンスの研究や,新しい物質波センサの開発に刺激を与えることを期待している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 10:35:39 GMT)
Diabetic Retinopathy Classification from Retinal Images using Machine Learning Approaches [0.0] 糖尿病網膜症において, 排液の性状, 血管の特性, 微小動脈瘤の特性について検討した。
ステージの分類には、サポートベクターマシン、ランダムフォレスト、ネイブベイズ分類器が使用される。
ランダムフォレストは、それぞれ76.5%、77.2%、93.3%の精度、感度、特異度で最高である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:37:28 GMT)
Deep-Learning Based Docking Methods: Fair Comparisons to Conventional Docking Workflows [0.0] 従来のドッキング手法に対して,Surflex-Dock法を用いた完全自動ワークフローを用いて公正なベースラインを生成する。
Angstroms RMSDのSurflex-Dock成功率はDiffDockよりもはるかに高かった。
DiffDockは、近隣の訓練を受けていない患者と比較して、近隣の患者に対して40パーセントの差を示した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 22:47:47 GMT)
Deep in the Knotted Black Hole [0.0] 我々は、スピンレスバナドス・タイテルボイム・ザネリ(BTZ)ブラックホールにおける検出器の遷移速度を、地平線上および水平線上を自由に下降すると見なしている。
地平線の外では定性的に類似しているが、BTZの場合よりもジオンの時空の振幅が大きい。
一般的には、検出器はブラックホールの地平線を見つけ、内部のトポロジーを識別する早期警報システムとして機能する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:00:06 GMT)
Deep Learning Approach for Enhancing Oral Squamous Cell Carcinoma with LIME Explainable AI Technique [0.0] データセットは5192イメージ(2435ノーマルと2511 OSCC)で構成されている。
本研究では,ResNet101,DenseNet121,VGG16,EfficientnetB3の4つのディープラーニングアーキテクチャを選択した。
効率の良いNetB3は98.33%とF1スコア(0.9844)で最高であり、他のモデルと比べて計算能力は著しく低下した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:37:28 GMT)
DPE-Net: Dual-Parallel Encoder Based Network for Semantic Segmentation of Polyps [0.0] 医用画像では大腸ポリープの効率的な分画は大腸癌に対する最小侵襲のソリューションにおいて重要な役割を担っている。
本研究では,ポリプセグメンテーションのためのネットワーク内の2つの並列エンコーダ分岐を用いた新しいアプローチを提案する。
エンコーダの1つのブランチには、2つの畳み込みブロックが組み込まれている。
他のブロックは、前のレイヤの機能の追加で単一の畳み込みブロックを受け入れ、エンコーダ内での機能抽出の多様性を提供する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:30:51 GMT)
D-MiSo: Editing Dynamic 3D Scenes using Multi-Gaussians Soup [0.0] そこで我々はD-MiSo(Dynamic Multi-Gaussian Soup)を提案する。
また,パラメータ化されたガウススプラットをリンクし,推定メッシュと三角スープを形成する手法を提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:42:56 GMT)
Cosmos-LLaVA: Chatting with the Visual Cosmos-LLaVA: Görselle Sohbet Etmek [0.0] Cosmos-LLaVAモデルはトルコ語の欠陥を克服するために設計された。
各種データセットによる微調整がモデル性能に与える影響を詳細に分析する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:01:00 GMT)
Comparative Performance of Machine Learning Algorithms for Early Genetic Disorder and Subclass Classification [0.0] 遺伝子疾患の早期診断は、タイムリーな介入を可能にし、結果を改善する。
本研究は、出生時または出生時に測定可能な基礎的臨床指標を用いた機械学習モデルを実装した。
MLに基本的な臨床指標を適用することで、大規模なデータセットで検証されたタイムリーな介入が可能になる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 06:02:47 GMT)
Comparative Analysis of Resource-Efficient CNN Architectures for Brain Tumor Classification [0.0] 本研究は,脳腫瘍分類のための有効かつ単純な畳み込みニューラルネットワーク(CNN)アーキテクチャと事前訓練されたResNet18とVGG16モデルの比較分析を行った。
カスタムCNNアーキテクチャは、複雑さが低いにもかかわらず、事前訓練されたResNet18とVGG16モデルとの競合性能を示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:28:32 GMT)
Comparative Analysis of Black-Box and White-Box Machine Learning Model in Phishing Detection [0.0] フィッシング検出モデルの説明可能性は、フィッシング攻撃緩和のさらなる解決策をサポートすることができる。
今回の研究では、ブラックボックスモデルとホワイトボックスモデルの両方を分析して、フィッシング検出に特化してプロスとコンスを得る。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:00:47 GMT)
Collaborative and parametric insurance on the Ethereum blockchain [0.0] 本稿では、パラメトリックおよび協調的要素を統合するブロックチェーンベースの保険スキームを紹介する。
余剰プロバイダーと呼ばれる投資家のプールは、スマートコントラクトに資金をロックし、ブロックチェーンユーザはパラメトリック保険契約を下書きできる。
スマートコントラクトはブロックチェーン用の高レベルプログラミング言語であるSolidityで開発され、Sepoliaテストネットにデプロイされる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:03:40 GMT)
Closed-Form Interpretation of Neural Network Latent Spaces with Symbolic Gradients [0.0] 本稿では,ニューラルネットワークの潜在空間におけるニューロンのクローズドフォーム解釈の枠組みを提案する。
解釈フレームワークは、トレーニングされたニューラルネットワークを同じ概念をエンコードする同値クラスの関数に埋め込むことに基づいている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:03:57 GMT)
Classical mechanics as the high-entropy limit of quantum mechanics [0.0] 古典力学は量子力学の高エントロピー極限として回復可能であることを示す。
十分なエントロピーの混合状態は古典分布と近似することができる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 13:52:45 GMT)
Classical integrability in the presence of a cosmological constant: analytic and machine learning results [0.0] マクスウェル場と中性スカラー場の重力への結合を記述する二次元理論の可積分性について検討する。
ある解部分空間に対して、2次元の運動方程式のサブセットが線型系の整合条件であることを示して部分積分性を示す。
これらのモデルに対する数値的なLax対行列の探索を体系化するために、さまざまな機械学習技術を用いる。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:07:45 GMT)
Can ChatGPT capture swearing nuances? Evidence from translating Arabic oaths [0.0] 30人のアラビア語の誓いが文献から集められた。
30の誓いを最初にChatGPTで翻訳し、ChatGPTで満たされていないギャップの種類で人間の翻訳と比較した。
誓いのChatGPT翻訳はいまだに不満足であり、ChatGPTのさらなる発展の必要性を明らかにしている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 14:09:40 GMT)
CEGI: Measuring the trade-off between efficiency and carbon emissions for SLMs and VLMs [0.0] 本稿では,Small Language Models(SLM)とVision Language Models(VLM)の性能解析を行う。
モデル性能と二酸化炭素排出量のトレードオフを定量化するために,CEGI(Carbon Efficient Gain Index)と呼ばれる新しい指標を導入する。
以上の結果から,大規模モデルによる精度の限界向上は,二酸化炭素排出量の大幅な増加を正当化するものではないことが示唆された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 17:32:47 GMT)
CAISSON: Concept-Augmented Inference Suite of Self-Organizing Neural Networks [0.0] 本稿では,レトリーバル・Augmented Generation(RAG)に対する新しい階層的アプローチであるCAISSONを紹介する。
CAISSONの中核は、文書空間の補完的な組織ビューを作成するために、二重自己組織化マップ(SOM)を活用している。
CAISSONを評価するために,合成財務分析ノートと質問応答ペアを生成するフレームワークであるSynFAQAを開発した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:00:10 GMT)
Block MedCare: Advancing healthcare through blockchain integration with AI and IoT [0.0] 本稿では,患者が医療データを安全に管理できる新しいシステムを提案する。
このシステムには、デジタルシグネチャ、ロールベースのアクセス制御、安全で制御されたアクセスを確保するための多層アーキテクチャが含まれている。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:31:46 GMT)
Bilayer construction for mixed state phenomena with strong, weak symmetries and symmetry breakings [0.0] 一般混合状態の浄化手法として二層構造を導入する。
両層構造における混合状態現象について検討した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:33:46 GMT)
Bias Analysis of AI Models for Undergraduate Student Admissions [0.0] この研究は、AI予測モデルに見られるバイアスの厳密で完全な分析を提供するために、著者らが行った過去の研究を拡張している。
6年間にわたるデータは、ある学生が科学学校に直接入学するかどうかを判断するAIモデルを作成するために使用された。
我々は,受験決定においてどの変数が重要か,テストスコアを除外する決定が受験生の人口動態にどのように影響するかを理解するために,AIモデルを開発し,分析した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 16:21:37 GMT)
BN-AuthProf: Benchmarking Machine Learning for Bangla Author Profiling on Social Media Texts [0.0] 本稿では,ソーシャルメディア上での執筆スタイルに基づいて,匿名作者の貴重な洞察を抽出することを目的とする。
データセットは300人の著者による30,131のソーシャルメディア投稿で構成され、年齢と性別によってラベル付けされている。
データセットを評価するために、様々な古典的な機械学習とディープラーニング技術が採用された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 00:32:32 GMT)
BInD: Bond and Interaction-generating Diffusion Model for Multi-objective Structure-based Drug Design [0.0] 本稿では,多目的薬物設計のための知識ベースガイダンスを用いた拡散モデルBInDを提案する。
BInDは、分子と標的タンパク質との相互作用を同時に生成し、全ての主要な目的を等しく考慮するよう設計されている。
総合評価では、BInDは全ての目的に対して頑健な性能を達成し、それぞれが最先端の手法よりも優れ、適合していることを示している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:17:43 GMT)
Artificial Intelligence Policy Framework for Institutions [0.0] 本稿では,機関内におけるAIポリシ開発における重要な考慮事項について述べる。
我々は、AI要素の解釈可能性と説明可能性の重要性、バイアスを緩和し、プライバシーを確保する必要性について検討する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:56:47 GMT)
Anatomically-Grounded Fact Checking of Automated Chest X-ray Reports [0.0] そこで本稿では, 報告によって提示された発見とその位置の誤りを識別する, 説明可能なファクトチェックのための新しいモデルを提案する。
我々は,複数のSOTA自動報告ツールが生成した報告の修正において,結果のファクトチェックモデルとその有用性を評価する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 05:21:42 GMT)
Analyzing the Impact of AI Tools on Student Study Habits and Academic Performance [0.0] この研究は、AIツールがパーソナライズされた学習、適応テスト調整をサポートし、リアルタイムの教室分析を提供する方法に焦点を当てている。
学生のフィードバックはこれらの特徴に対する強い支持を示し、GPAの増加とともに研究時間を大幅に短縮した。
これらのメリットにもかかわらず、AIへの過度依存や、AIと従来の教育方法を統合することの難しさといった課題も特定された。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 04:51:57 GMT)
An L-BFGS-B approach for linear and nonlinear system identification under $\ell_1$ and group-Lasso regularization [0.0] 線形および非線形離散時間状態空間モデルを同定するための非常に効率的な数値計算法を提案する。
提案手法のPython実装は、jax-sysidパッケージで利用可能である。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:45:59 GMT)
An Evolutionary Large Language Model for Hallucination Mitigation [0.0] 本稿では,幻覚を最小化しながら高品質な質問応答データセットを生成するEvoLLMを提案する。
EvoLLMsは、Depth、Relevance、Coverageといった主要なメトリクスで、人間の生成データセットを一貫して上回る。
これらの結果は、EvoLLMをQAデータセット生成の堅牢で効率的なソリューションとして強調し、手作業によるキュレーションに必要な時間とリソースを大幅に削減した。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 19:40:13 GMT)
Algorithmic idealism: what should you believe to experience next? [0.0] 私は「世界の状況」を問うのではなく、この疑問をタイトルセンターのステージに置いておく物理学の基礎へのアプローチを論じます。
アルゴリズム的理想主義(英: Algorithmic Idealism)は、いくつかの数学的形式を許容する2つの仮定に基づく概念的枠組みである。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:44:32 GMT)
Advancing Similarity Search with GenAI: A Retrieval Augmented Generation Approach [0.0] 本稿では、類似性検索に革新的な検索拡張手法を提案する。
提案手法は、生成モデルを用いてニュアンス付き意味情報を捕捉し、高度な文脈理解に基づく類似度スコアを検索する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 09:01:03 GMT)
Adaptive Informed Deep Neural Networks for Power Flow Analysis [0.0] 本研究では,PF解析のためのエンドツーエンドディープラーニングアーキテクチャであるPINN4PFを紹介する。
その結果、PINN4PFは全てのテストシステムで両方のベースラインを上回ります。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:33:48 GMT)
Acoustic black holes, white holes, and wormholes in Bose-Einstein condensates in two dimensions [0.0] ボース・アインシュタイン凝縮体(BEC)の音響(またはウンルー)ブラックホールに対する定常解について検討した。
これらの解では、音の局所速度と流速の等級が交差し、超音速領域が存在することを示す。
特定の外部ポテンシャルに対して、均一密度の音響ブラックホールの構成を見つけ、そのホーキング温度を得る。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:53:26 GMT)
ASTM :Autonomous Smart Traffic Management System Using Artificial Intelligence CNN and LSTM [0.0] 本稿では,AIを用いて交通流量を改善する自律型スマートトラヒック管理システムを提案する。
このシステムは、交通管理画像中の車両を検出するために、YOLO V5 Convolutional Neural Networkを使用している。
また、長い短期記憶を備えたリカレントニューラルネットワークを使用して、次の12時間の車両数を予測する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 08:48:21 GMT)
A Primer on Large Language Models and their Limitations [0.0] 本稿では,Large Language Models (LLMs) について概説し,その強み,限界,応用,研究の方向性を明らかにする。
重要なLCMのコンセプトや技術を理解することに興味を持つ学術や産業の人たちにとって有用なものとなることを意図している。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 02:45:02 GMT)
A Physics-Constrained Neural Differential Equation Framework for Data-Driven Snowpack Simulation [0.0] 本稿では,パラメータ化のための物理制約付きニューラル微分方程式フレームワークを提案する。
降雪深は9%の中央値誤差で予測され、ナッシュサトクリフ効果は幅広い雪の気候で0.94以上である。
アプローチの構造は、物理的制約の満足度を保証し、モデルのトレーニング中にこれらの制約を許容し、パラメータ化のさらなる再トレーニングなしに異なる時間分解におけるモデリングを可能にする。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 20:17:59 GMT)
A Panopticon on My Wrist: The Biopower of Big Data Visualization for Wearables [0.0] 本稿では、FitBitのようなウェアラブルヘルストラッキングエコシステムにおける、ビッグデータの可視化に関する設計インフォームド視点を提供する。
このような視覚化は、企業による個人情報の獲得と収益化を促進するために、誘惑や中毒の経験を通じて主に機能する、個人化された新自由主義的なガバナンスのツールである、と私は主張する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 07:58:52 GMT)
A Hodge Theory for Entanglement Cohomology [0.0] 量子絡み合いを記述するホモロジー代数の応用を探求し、拡張する。
我々は、Hodge星作用素、内積、共微分、およびラプラシアン(英語版)(Laplacian)の類似体を、絡み合い$k$-形式のために構成する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 03:14:20 GMT)
A Combinatorial Approach to Neural Emergent Communication [0.0] ルイスシグナリングゲームにおける通信の成功は、トレーニングデータのサンプリング落とし穴のため、通常、ターゲット画像分類に1つか2つのシンボルしか必要としない。
本稿では,メッセージ中のシンボルの最小数である分類のシンボリックな複雑性を解決するアルゴリズムSolveMinSymを提案する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 21:48:17 GMT)
A Bidirectional Long Short Term Memory Approach for Infrastructure Health Monitoring Using On-board Vibration Response [0.0] 本稿では,鉄道線路の剛性などの物理パラメータを駆動バイ振動応答信号を用いて推定する深層学習手法を提案する。
提案手法は, 鉄道線路の硬さを正確に自動推定し, 騒音発生時の局所硬さ低減を推定する。
論文参考訳(メタデータ) (Tue, 03 Dec 2024 18:15:34 GMT)