GUI Agents: A Survey [129.9] グラフィカルユーザインタフェース(GUI)エージェントは、人間とコンピュータのインタラクションを自動化するためのトランスフォーメーションアプローチとして登場した。
GUIエージェントの関心の高まりと基本的な重要性により、ベンチマーク、評価指標、アーキテクチャ、トレーニングメソッドを分類する総合的な調査を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:48:28 GMT)
Restore Anything Model via Efficient Degradation Adaptation [129.4] RAMは、様々な劣化にまたがる固有の類似性を活用して、効率的で包括的な復元を可能にする統一された経路を取る。
RAMのSOTA性能はRAMのSOTA性能を確認し、トレーニング可能なパラメータで約82%、FLOPで約85%のモデルの複雑さを減少させる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:51:18 GMT)
On Affine Homotopy between Language Encoders [127.6] 言語エンコーダのエファフィンアライメント特性について検討する。
アフィンアライメントは基本的には類似性の非対称な概念であるが、外生的類似性についてはいまだに有益である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:56:43 GMT)
Learning Dynamic Mechanisms in Unknown Environments: A Reinforcement Learning Approach [123.6] 本稿では,複数ラウンドの対話を通して動的ビックレー・クラーク・グローブ(VCG)機構を回復するための新しい学習アルゴリズムを提案する。
当社のアプローチの重要な貢献は、報酬のないオンライン強化学習(RL)を取り入れて、リッチな政策分野の探索を支援することである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:54:22 GMT)
LLaVA-UHD v2: an MLLM Integrating High-Resolution Feature Pyramid via Hierarchical Window Transformer [109.6] 本稿では,階層型ウィンドウトランスを中心とした高度なMLLMであるLLaVA-UHD v2を紹介する。
視覚言語プロジェクターとして、ハイウィン変換器は2つの主モジュールから構成される。
大規模な実験により、LLaVA-UHD v2は、一般的なベンチマーク上で既存のMLLMよりも優れた性能を発揮することが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:07:46 GMT)
Scaling and logic in the color code on a superconducting quantum processor [109.6] 本稿では,超伝導プロセッサ上でのカラーコードのデモを行い,論理的誤りの抑制と論理的操作を行う。
汎用計算の鍵となるマジックステートを注入し、選択後99%以上の忠実性を達成する。
この研究は、超伝導プロセッサ上でのフォールトトレラント量子計算を実現するための、魅力的な研究方向としてカラーコードを確立する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:00:05 GMT)
Prompting Depth Anything for 4K Resolution Accurate Metric Depth Estimation [108.0] 本稿では、深度基礎モデルにプロンプトを導入し、Prompt Depth Anythingと呼ばれる計量深度推定のための新しいパラダイムを作成する。
低コストのLiDARを用いて、Depth Anythingモデルによる正確なメートル法深度出力を導出し、最大4K解像度を達成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:32:12 GMT)
CAT4D: Create Anything in 4D with Multi-View Video Diffusion Models [98.0] 本研究では,モノクロ映像から4次元(ダイナミックな3D)シーンを生成するCAT4Dを提案する。
我々は、多様なデータセットの組み合わせに基づいて訓練された多視点ビデオ拡散モデルを活用して、新しいビュー合成を実現する。
新規なビュー合成と動的シーン再構成ベンチマークにおける競合性能を実証する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:21:07 GMT)
Autoregressive Video Generation without Vector Quantization [90.9] 本研究では,時間フレーム毎の予測の非量子化自己回帰モデルとしてビデオ生成問題を再構成する。
提案手法では,ベクトル量子化のない新しい自己回帰モデルであるNOVAを訓練する。
以上の結果から,NOVAはデータ効率,推論速度,視覚的忠実度,映像流速において,従来の自己回帰ビデオモデルよりもはるかに小さいモデルキャパシティを有することがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:59:53 GMT)
Clothes-Changing Person Re-Identification with Feasibility-Aware Intermediary Matching [86.0] 現在の衣服変更者の再識別(re-id)アプローチは通常、衣服に関係のない特徴に基づいて検索を行う。
本稿では,ファッション関連機能を検索に利用するためのFAIMフレームワークを提案する。
提案手法は, 広く使用されている衣服変化型re-idベンチマークにおいて, 最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:50:13 GMT)
Improving Diffusion Inverse Problem Solving with Decoupled Noise Annealing [85.0] Decoupled Annealing Posterior Smpling (DAPS) と呼ばれる新しい手法を提案する。
DAPSは、新しいノイズアニール法に依存している。
DAPSは複数の画像復元作業において,サンプル品質と安定性を著しく向上することを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:26:39 GMT)
A Systematic Examination of Preference Learning through the Lens of Instruction-Following [83.7] 新たな合成データ生成パイプラインを用いて48,000の命令追従プロンプトを生成する。
合成プロンプトでは、リジェクションサンプリング(RS)とモンテカルロ木探索(MCTS)の2つの選好データセットキュレーション手法を用いる。
実験により、MCTSが生成した選好ペアにおける共有プレフィックスは、限界はあるが一貫した改善をもたらすことが明らかになった。
高コントラストの選好ペアは一般的に低コントラストのペアよりも優れているが、両者を組み合わせることで最高のパフォーマンスが得られることが多い。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:38:39 GMT)
SSE-SAM: Balancing Head and Tail Classes Gradually through Stage-Wise SAM [82.3] 長い尾のシナリオにおける一般化を改善するには、頭と尾のクラス間の注意深いバランスが必要であると論じる。
SAMもImbSAMもこのバランスを完全に達成できないことを示す。
ImbSAMとSAMの相補的な強度を段階的アプローチで利用したSSE-SAM(Stage-wise Saddle Escaping SAM)を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:53:36 GMT)
Inference-Aware Fine-Tuning for Best-of-N Sampling in Large Language Models [80.7] 本稿では,推論時戦略の性能を直接最適化する手法により,モデルが微調整される,推論対応のファインチューニングパラダイムを提案する。
筆者らは,BoN内における困難で微分不可能なargmax演算子を克服し,BoN対応微調整のための最初の模倣学習と強化学習(RL)手法を考案した。
提案実験では,BoNを意識した微調整の有効性を,性能向上と推論時間計算の両面で実証した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:43:47 GMT)
Context-DPO: Aligning Language Models for Context-Faithfulness [80.6] 本研究では,大規模言語モデルの文脈信頼度を高めるためのアライメント手法を提案する。
ConFiQAから提供されたコンテキストの質問に対する忠実で頑健な応答を活用することで、Context-DPOは直接の選好最適化を通じてLLMを調整します。
大規模な実験により、私たちのContext-DPOは、一般的なオープンソースモデルで35%から280%の改善を達成し、コンテキスト忠実性を大幅に改善します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:08:18 GMT)
Demystify Transformers & Convolutions in Modern Image Deep Networks [80.2] 本稿では,一般のコンボリューションとアテンション演算子の真の利益を,詳細な研究により同定することを目的とする。
注意や畳み込みのようなこれらの特徴変換モジュールの主な違いは、それらの空間的特徴集約アプローチにある。
様々なSTMが統合されたフレームワークに統合され、包括的な比較分析を行う。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:45:17 GMT)
Scaling of Search and Learning: A Roadmap to Reproduce o1 from Reinforcement Learning Perspective [77.9] OpenAIは、o1の背後にある主要な技術は強化学習であると主張している。
本稿では、強化学習の観点から、o1を達成するためのロードマップを分析する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:24:47 GMT)
Compositional Generalization Across Distributional Shifts with Sparse Tree Operations [77.6] 我々は、微分可能木機械と呼ばれる統合されたニューロシンボリックアーキテクチャを導入する。
シンボル構造の疎ベクトル表現を用いることで,モデルの効率を大幅に向上する。
より一般的なseq2seq問題に制限されたtree2tree問題以外の適用を可能にする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:20:19 GMT)
DreamPhysics: Learning Physics-Based 3D Dynamics with Video Diffusion Priors [75.8] 本稿では,映像拡散前の物体の物理的特性を学習することを提案する。
次に,物理に基づくMaterial-Point-Methodシミュレータを用いて,現実的な動きを伴う4Dコンテンツを生成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:47:38 GMT)
CosyVoice 2: Scalable Streaming Speech Synthesis with Large Language Models [74.8] 改良されたストリーミング音声合成モデルCosyVoice 2を提案する。
具体的には,音声トークンのコードブック利用を改善するために,有限スカラー量子化を導入する。
我々は,様々な合成シナリオをサポートするために,チャンク対応因果フローマッチングモデルを開発した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:37:37 GMT)
Do LLMs Play Dice? Exploring Probability Distribution Sampling in Large Language Models for Behavioral Simulation [73.6] 人間のシーケンシャルな意思決定過程をエミュレートするエージェントとして、大きな言語モデル(LLM)を採用する研究が増えている。
このことは、確率分布を理解するためにLLMエージェントの容量に関する好奇心を喚起する。
分析の結果, LLM エージェントは確率を理解できるが, 確率サンプリングに苦慮していることがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:56:29 GMT)
ControlMLLM: Training-Free Visual Prompt Learning for Multimodal Large Language Models [73.3] マルチモーダル大言語モデル(MLLM)に視覚的参照を注入する学習自由手法を提案する。
MLLMにおけるテキストプロンプトトークンと視覚トークンの関係を観察する。
我々は,エネルギー関数に基づいて学習可能な視覚トークンを最適化し,注目マップにおける参照領域の強度を高める。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:12:29 GMT)
EvoWiki: Evaluating LLMs on Evolving Knowledge [72.9] EvoWiki(エボウィキ)は、知識の進化を反映した進化的データセットである。
我々の結果は、現在のモデルは進化した知識に苦しむことが多く、時代遅れや誤った反応を頻繁に与えていることを示している。
EvoWikiは、大規模言語モデルの知識進化能力に関する将来の研究を進めるための堅牢なベンチマークを提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:04:57 GMT)
Level-Set Parameters: Novel Representation for 3D Shape Analysis [70.2] ニューラルフィールドの最近の発展は、3次元形状の新規で連続的で数値的な表現として符号付き距離関数のレベルセットパラメータをもたらす。
擬似正規分布として定式化し,各データセットに先行する分布を学習することにより,異なる形状の相関関係を確立する。
形状分類,検索,および6次元オブジェクトポーズ推定への応用を通して,新しい表現の可能性を実証する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:50:19 GMT)
Cracking the Code of Hallucination in LVLMs with Vision-aware Head Divergence [69.9] 大型視覚言語モデル(LVLM)における幻覚を駆動する内部メカニズムについて検討する。
本稿では,視覚的コンテキストに対する注目ヘッド出力の感度を定量化する指標として,視覚認識型頭部偏差(VHD)を紹介する。
視覚認識型頭部強化(VHR)は,視覚認識型頭部機能を高めることで幻覚を緩和するための訓練不要なアプローチである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:29:30 GMT)
Object Style Diffusion for Generalized Object Detection in Urban Scene [69.0] 本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。
擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。
実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:03:00 GMT)
Prompting Strategies for Enabling Large Language Models to Infer Causation from Correlation [68.6] 我々は因果推論に焦点をあて,相関情報に基づく因果関係の確立という課題に対処する。
この問題に対して,元のタスクを固定的なサブクエストに分割するプロンプト戦略を導入する。
既存の因果ベンチマークであるCorr2Causeに対するアプローチを評価した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:32:27 GMT)
AntiLeak-Bench: Preventing Data Contamination by Automatically Constructing Benchmarks with Updated Real-World Knowledge [68.4] 既存の研究は、新たに収集されたデータが既存の知識を含む可能性があるため、汚染のない評価を保証することができない。
本稿では,自動アンチリーチベンチマークフレームワークであるAntiLeak-Benchを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:53:12 GMT)
Timer-XL: Long-Context Transformers for Unified Time Series Forecasting [67.8] 我々は時系列の統一予測のための生成変換器Timer-XLを提案する。
Timer-XLは、統一されたアプローチにより、挑戦的な予測ベンチマークで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:12:18 GMT)
NAVCON: A Cognitively Inspired and Linguistically Grounded Corpus for Vision and Language Navigation [66.9] NAVCONは2つの一般的なデータセット(R2RとRxR)の上に構築された大規模な注釈付きビジョンランゲージナビゲーション(VLN)コーパスである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:05:45 GMT)
RankFeat&RankWeight: Rank-1 Feature/Weight Removal for Out-of-distribution Detection [66.3] textttRankFeatは、OOD検出のためのシンプルだが効果的なEmphposthocアプローチである。
textttRankWeight は emphpost hoc で、 rank-1 行列を一度だけ計算する必要がある。
textttRankFeatは、最先端のパフォーマンスを実現し、平均偽陽性率(FPR95)を17.90%削減する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:24:30 GMT)
MegaSynth: Scaling Up 3D Scene Reconstruction with Synthesized Data [59.9] 合成データを用いたトレーニングにより3次元シーン再構成のスケールアップを提案する。
私たちの研究の中心は、700Kシーンからなる手続き的に生成された3DデータセットであるMega Synthです。
実験の結果,Mega Synthとの共同トレーニングや事前トレーニングにより,画像領域間で1.2~1.8dBPSNRの再現性が改善された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:59:38 GMT)
Modality-Independent Graph Neural Networks with Global Transformers for Multimodal Recommendation [59.4] グラフニューラルネットワーク(GNN)はこの領域で有望なパフォーマンスを示している。
我々は,独立した受容場を持つGNNを別々に採用したModality-Independent Receptive Fieldsを用いたGNNを提案する。
以上の結果から,特定のデータセットの特定のモダリティに対して最適な$K$は,GNNのグローバルな情報取得能力を制限する1または2以下であることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:12:26 GMT)
GenEx: Generating an Explorable World [59.1] 我々は、その生成的想像力によって導かれる複雑なエンボディ世界探査を計画できるシステムGenExを紹介する。
GenExは、単一のRGB画像から3D一貫性のある想像環境全体を生成します。
GPT支援エージェントは、ゴールに依存しない探索とゴール駆動ナビゲーションの両方を含む複雑な実施作業を行う。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:25:19 GMT)
4.5 Million (Suspected) Fake Stars in GitHub: A Growing Spiral of Popularity Contests, Scams, and Malware [58.6] われわれはGitHubでニセの星の国際的、縦断的な測定を行った。
StarScoutは、異常な出演行動を検出するスケーラブルなツールです。
本研究は,プラットフォームモデレーター,オープンソース実践者,サプライチェーンセキュリティ研究者に影響を及ぼす。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:03:58 GMT)
The One RING: a Robotic Indoor Navigation Generalist [58.4] RING (Robotic Indoor Navigation Generalist) は、インボディーズ・アグノースティックな政策である。
様々なランダムなエンボディメントを大規模に組み込んだシミュレーションでのみ訓練される。
5つのシミュレーションと4つのロボットプラットフォームで平均72.1%と78.9%の成功率を達成した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:15:41 GMT)
A Survey on Integrated Sensing, Communication, and Computation [57.7] 次世代のワイヤレス技術である6Gは、ユビキタスなインテリジェントサービスの時代を後押しすることを目指している。
これらのモジュールのパフォーマンスは相互依存しており、時間、エネルギー、帯域幅のリソース競争を生み出している。
統合通信と計算(ICC)、統合センシングと計算(ISC)、統合センシングと通信(ISAC)といった既存の技術は、この課題に対処するために部分的に進歩してきた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:38:31 GMT)
CFSynthesis: Controllable and Free-view 3D Human Video Synthesis [57.6] CFSynthesisは、カスタマイズ可能な属性で高品質なヒューマンビデオを生成するための新しいフレームワークである。
本手法はテクスチャ-SMPLに基づく表現を利用して,自由視点における一貫した,安定したキャラクタの出現を保証する。
複数のデータセットの結果から,複雑な人間のアニメーションにおいて,CFS合成が最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:55:12 GMT)
MetaMorph: Multimodal Understanding and Generation via Instruction Tuning [57.4] 視覚予測インストラクションチューニング(VPiT)は、視覚的インストラクションチューニングへのシンプルで効果的な拡張である。
VPiT は LLM に、画像およびテキストデータの入力シーケンスから離散テキストトークンと連続的な視覚トークンを予測するように教える。
MetaMorphモデルをトレーニングし、視覚的理解と生成の両面での競争性能を達成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:58:50 GMT)
Meta-Reflection: A Feedback-Free Reflection Learning Framework [57.1] 外部からのフィードバックを伴わずに単一の推論パスのみを必要とするフィードバックフリーリフレクション機構であるメタリフレクションを提案する。
過去のリフレクションを記憶し、取り出す人間の能力によって、メタリフレクションはコードブックに反射的な洞察を統合する。
実世界のシナリオにおけるメタリフレクションの実践性を徹底的に検討し,評価するために,E-Commerce Customer Intent Detectionという産業eコマースベンチマークを導入する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:20:04 GMT)
Query-centric Audio-Visual Cognition Network for Moment Retrieval, Segmentation and Step-Captioning [56.9] ビデオ検索、モーメント検索、モーメントセグメンテーション、ステップキャプションを含む新しいトピックHIRESTが紹介されている。
3つのタスクに対して信頼性の高いマルチモーダル表現を構築するために,クエリ中心の音声視覚認知ネットワークを提案する。
これにより、ユーザが優先するコンテンツを認識し、3つのタスクに対してクエリ中心の音声視覚表現を実現することができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:43:06 GMT)
T$^3$-S2S: Training-free Triplet Tuning for Sketch to Scene Generation [56.1] 本研究では,Sketch-to-Scene (T3-S2S) 生成のためのトレーニング不要トリプルトチューニングを提案する。
プロンプトバランスモジュールによるキーワード表現を強化し、クリティカルなインスタンスが欠落するリスクを低減する。
実験により,既存のスケッチ・ツー・イメージモデルの性能が大幅に向上することが確認された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:01:32 GMT)
Modelling Multi-modal Cross-interaction for ML-FSIC Based on Local Feature Selection [55.1] マルチラベル設定の重要な特徴は、画像がしばしば複数のラベルを持つことである。
本稿では,ラベルのプロトタイプを段階的に改良する戦略を提案する。
COCO, PASCAL VOC, NUS-WIDE, iMaterialist による実験により, このモデルにより最先端のモデルが大幅に改善されることが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:10:18 GMT)
Generalizing Weather Forecast to Fine-grained Temporal Scales via Physics-AI Hybrid Modeling [55.1] 本稿では,天気予報をより微細なテンポラルスケールに一般化する物理AIハイブリッドモデル(WeatherGFT)を提案する。
具体的には、小さな時間スケールで物理進化をシミュレートするために、慎重に設計されたPDEカーネルを用いる。
我々は、異なるリードタイムでのモデルの一般化を促進するためのリードタイムアウェアトレーニングフレームワークを導入する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:03:15 GMT)
AniDoc: Animation Creation Made Easier [55.0] 我々の研究は、ますます強力なAIの可能性を生かして、2Dアニメーションを制作する際のコスト削減に重点を置いている。
AniDocはビデオラインアートのカラー化ツールとして登場し、自動的にスケッチシーケンスをカラーアニメーションに変換する。
本モデルでは,一致マッチングを明示的なガイダンスとして活用し,基準文字と各ラインアートフレームの変動に強いロバスト性を与える。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:59:59 GMT)
Beyond Outcomes: Transparent Assessment of LLM Reasoning in Games [54.5] GAMEBoTは、大規模言語モデルの厳格な評価のために設計されたゲームアリーナである。
我々は,8つのゲームにまたがる17の卓越したLSMをベンチマークし,様々な戦略能力とゲーム特性について検討した。
以上の結果から,LDMに詳細なCoTプロンプトが付与されている場合でも,GAMEBoTは大きな課題となることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:32:53 GMT)
SocialED: A Python Library for Social Event Detection [53.9] SocialEDは、ソーシャルイベント検出(SED)タスクをサポートするように設計された、包括的なオープンソースのPythonライブラリである。
詳細なドキュメンテーションを備えた統一APIを提供し、研究者や実践者がソーシャルメディアにおけるイベント検出の完全なソリューションを提供する。
SocialEDは、グラフ構築やトークン化など、幅広い事前処理技術をサポートし、モデルのトレーニングや予測のための標準化されたインターフェースを含んでいる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:37:47 GMT)
Using Large Language Models for Expert Prior Elicitation in Predictive Modelling [53.5] 本研究では,大規模言語モデル (LLM) を用いて予測モデルの事前分布を推定する手法を提案する。
その結果,LLMによる事前パラメータ分布は,低データ設定における非形式的先行よりも予測誤差を著しく低減することがわかった。
事前の推論も一貫して優れており、低コストでテキスト内学習よりも信頼性が高いことが証明されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:51:52 GMT)
Towards Automatic Evaluation for Image Transcreation [52.7] 本稿では,機械翻訳(MT)メトリクスにインスパイアされた自動評価指標群を提案する。
画像トランスクリエーションの3つの重要な側面として,文化的関連性,意味的等価性,視覚的類似性を挙げる。
この結果から,視覚エンコーダの表現は視覚的類似度を測定するのに有効であるのに対し,プロプライエタリなVLMは文化的関連性と意味的等価性を最もよく認識していることがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:55:58 GMT)
TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks [52.5] 私たちは小さなソフトウェア企業環境を模倣したデータによる自己完結型環境を構築します。
最も競争力のあるエージェントでは、タスクの24%が自律的に完了できます。
これは、LMエージェントによるタスク自動化に関するニュアンスな絵を描く。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:55:40 GMT)
M$^3$-VOS: Multi-Phase, Multi-Transition, and Multi-Scenery Video Object Segmentation [51.8] 本稿では,その視覚的特徴と潜在的な形態的・外見的変化に基づいて,現実世界の物体を分類するセグメンテーションにおける位相の概念を紹介する。
我々は,M3-VOS(Multi-Phase, Multi-Transition and Multi-Scenery Video Object)という新しいベンチマークを提案し,対象相を理解するためのモデルの有効性を検証する。
本稿では,リバーサルリファインメントにより再生性能を向上させる新しいプラグアンドプレイモデルであるReVOSを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:50:11 GMT)
Marigold-DC: Zero-Shot Monocular Depth Completion with Guided Diffusion [51.7] 奥行き完了のための既存の手法は、厳密に制約された設定で動作する。
単眼深度推定の進歩に触発されて,画像条件の深度マップ生成として深度補完を再構成した。
Marigold-DCは、単分子深度推定のための事前訓練された潜伏拡散モデルを構築し、試験時間ガイダンスとして深度観測を注入する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:06:41 GMT)
Rethinking 3D Dense Caption and Visual Grounding in A Unified Framework through Prompt-based Localization [51.3] 3Dビジュアルグラウンド(3DVG)と3Dキャプション(3DDC)は、様々な3Dアプリケーションにおいて2つの重要なタスクである。
本稿では,これら2つの異なる,しかし密接に関連するタスクを協調的に解決する統合フレームワークである3DGCTRを提案する。
実装面では、Lightweight Caption Headを既存の3DVGネットワークに統合し、Caption Text Promptを接続として使用する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:23:29 GMT)
An Efficient Occupancy World Model via Decoupled Dynamic Flow and Image-assisted Training [50.7] DFIT-OccWorldは、分離されたダイナミックフローとイメージアシストトレーニング戦略を活用する、効率的な3D占有世界モデルである。
提案モデルでは, 静止ボクセルはポーズ変換により容易に得られるのに対し, 既存のボクセルフローを用いて既存の観測を歪曲することで, 将来のダイナミックボクセルを予測できる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:10:33 GMT)
Few-shot Steerable Alignment: Adapting Rewards and LLM Policies with Neural Processes [50.5] 大きな言語モデル(LLM)は、日々のアプリケーションにますます組み込まれています。
個人ユーザの多様な嗜好との整合性を確保することは、重要な課題となっている。
数発のステアライメントのための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:14:59 GMT)
A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.4] MoEモデルは、条件付き計算によるモデルキャパシティと計算効率の向上を提供する。
MoEモデルの展開と推測は、計算資源、レイテンシ、エネルギー効率の面で大きな課題をもたらす。
この調査は、システムスタック全体にわたるMoEモデルの推論最適化手法の現在の状況を体系的に分析する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:11:15 GMT)
Dyn-HaMR: Recovering 4D Interacting Hand Motion from a Dynamic Camera [49.8] Dyn-HaMRは、野生のダイナミックカメラで撮影されたモノクロビデオから4Dグローバルハンドモーションを再構築する最初のアプローチである。
提案手法は,4次元メッシュ・リカバリにおいて最先端の手法を著しく上回ることを示す。
これにより、動くカメラでモノクロビデオから手の動きを復元するための新しいベンチマークが確立される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:29:43 GMT)
Graph Spring Neural ODEs for Link Sign Prediction [49.7] 本稿では,春の力によってモデル化されたグラフスプリングネットワーク(GSN)と呼ばれる新しいメッセージパッシング層アーキテクチャを提案する。
提案手法は,大規模グラフ上で最大28,000のノード生成時間高速化係数を持つ最先端手法に近い精度を実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:16:59 GMT)
Uncertainty-Aware Hybrid Inference with On-Device Small and Remote Large Language Models [49.5] ハイブリッド言語モデル(HLM)アーキテクチャは、モバイル端末で動作する小さな言語モデル(SLM)と、無線ネットワークの基地局(BS)にホストされる大きな言語モデル(LLM)を統合する。
HLMトークン生成プロセスは、投機的推論の原則に従っている: SLMの語彙分布はLSMにアップロードされ、LPMによって再サンプリングされる。
本研究では,不確実性を考慮したHLM (Uncertainty-aware opportunistic HLM) という新しいHLM構造を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:14:35 GMT)
EscapeBench: Pushing Language Models to Think Outside the Box [49.4] EscapeBenchは、クリエイティブな推論を伴うエージェントに挑戦するために設計されたルームエスケープゲーム環境のベンチマークスイートである。
その結果,現在のLMモデルでは,動作メモリとChain-of-Thought推論が採用されているが,ヒントのない平均進行率は15%に過ぎなかった。
EscapeAgentは、Foresight(イノベーティブ・ツール・ユース)とReflection(未解決タスクの特定)による創造的推論を強化するためのフレームワークである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:50:39 GMT)
RelationField: Relate Anything in Radiance Fields [49.3] 本稿では,ニューラルレイディアンス場から直接オブジェクト間関係を抽出する最初の方法であるRelationFieldを提案する。
RelationFieldは、物体間の関係を、神経放射場内の一対の光線として表現する。
RelationFieldの複雑でオープンな語彙関係を教えるために、関係知識はマルチモーダルLLMから蒸留される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:31:06 GMT)
Data-Efficient Inference of Neural Fluid Fields via SciML Foundation Model [49.1] 本研究では,SciML基礎モデルにより,現実の3次元流体力学を推定する際のデータ効率を大幅に向上できることを示す。
基礎モデルから抽出した拡張ビューと流体特徴を利用した新しい協調学習手法をニューラルネットワークに装備する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:39:43 GMT)
Optical aberrations in autonomous driving: Physics-informed parameterized temperature scaling for neural network uncertainty calibration [49.0] 本稿では,ニューラルネットワークのキャリブレーションアーキテクチャに物理的帰納バイアスを組み込むことにより,AIターゲットアプリケーションの堅牢性と信頼性を高めることを提案する。
信頼に値する不確実性表現と認識連鎖の総合的検証戦略の道を開く。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:36:46 GMT)
MedCoT: Medical Chain of Thought via Hierarchical Expert [48.9] 本稿では,新しい階層的検証手法であるMedCoTについて述べる。
生体画像検査における解釈可能性と精度を高めるように設計されている。
4つの標準Med-VQAデータセットに対する実験的評価は、MedCoTが既存の最先端アプローチを上回ることを示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:14:02 GMT)
Dense Audio-Visual Event Localization under Cross-Modal Consistency and Multi-Temporal Granularity Collaboration [48.6] 本論文は、より長い未編集映像に対する音声・視覚的シーン理解の促進を目的としている。
本稿では,Cross-Modal Consistency CollaborationとMulti-Temporal Granularity Collaborationの2つのコアモジュールからなる新しいCCNetを紹介する。
UnAV-100データセットの実験では、モジュール設計が検証され、高密度オーディオ視覚イベントのローカライゼーションにおける最先端のパフォーマンスが新たに向上した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:58:32 GMT)
VideoDPO: Omni-Preference Alignment for Video Diffusion Generation [48.4] DPO(Direct Preference Optimization)は、言語と画像生成において大幅に改善されている。
本稿では,いくつかの重要な調整を施したビデオDPOパイプラインを提案する。
本実験は視覚的品質とセマンティックアライメントの両面で大幅に改善されたことを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:59:49 GMT)
3D Registration in 30 Years: A Survey [48.2] 3Dポイントクラウドの登録は、コンピュータビジョン、コンピュータグラフィックス、ロボティクス、リモートセンシングなどの基本的な問題である。
本稿では,ペアワイズ粗い登録,ペアワイズ細粒度登録,マルチビュー登録,クロススケール登録,マルチインスタンス登録など,一連のサブ領域を網羅した3Dポイントクラウド登録に関する総合的な調査を行う。
本調査では, データセット, 評価指標, 方法分類, メリットとデメリットの議論, 今後の方向性についての洞察に富んだ考察を包括的に紹介する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:14:01 GMT)
Learnable Prompting SAM-induced Knowledge Distillation for Semi-supervised Medical Image Segmentation [47.8] 半教師型医用画像分割のための知識蒸留フレームワークKnowSAMを提案する。
我々のモデルは最先端の半教師付きセグメンテーションアプローチより優れている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:19:23 GMT)
PersonaGym: Evaluating Persona Agents and LLMs [47.8] 我々は、ペルソナエージェントを評価するための最初の動的評価フレームワークであるPersonaGymと、意思決定理論に基礎を置く最初の自動化ヒトアライメントメトリックであるPersonaScoreを紹介する。
200のペルソナと10,000の質問を含むベンチマークを用いて、6つのオープンでクローズドなLCMの評価を行ったところ、ペルソナエージェントの能力向上の可能性が示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:25:08 GMT)
RoboMIND: Benchmark on Multi-embodiment Intelligence Normative Data for Robot Manipulation [47.7] 我々はRoboMIND (Multi-Embodiment Intelligence Normative Data for Robot manipulate)を導入し、279の多様なタスクにまたがる実世界55万の実証軌道を特徴とする。
RoboMINDは人間の遠隔操作を通じて収集され、総合的なロボット関連情報を含んでいる。
複数の次元にわたるRoboMINDの定量的および定性的な分析を提供し、データセットの多様性に関する洞察を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:17:16 GMT)
The Role of Handling Attributive Nouns in Improving Chinese-To-English Machine Translation [47.7] 特に、中国語の帰属名詞による翻訳課題を対象とし、英語翻訳における曖昧さをしばしば引き起こす。
省略粒子X('DE')を手動で挿入することで、この臨界関数ワードの処理方法を改善する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:37:52 GMT)
Heterogeneous Multi-Agent Reinforcement Learning for Distributed Channel Access in WLANs [47.6] 本稿では,マルチエージェント強化学習(MARL)を用いて,無線ローカルネットワークにおける分散チャネルアクセスに対処する。
特に、エージェントがモデルトレーニングに価値ベースまたはポリシーベースの強化学習アルゴリズムを不均一に採用する、より実践的なケースについて考察する。
我々は、分散実行パラダイムを用いた集中型トレーニングを採用し、異種エージェントの協調を可能にする、異種MARLトレーニングフレームワークQPMIXを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:50:31 GMT)
Learning from Massive Human Videos for Universal Humanoid Pose Control [46.4] 本稿では,2000万以上のヒューマノイドロボットの大規模データセットであるHumanoid-Xを紹介する。
我々は、テキスト命令を入力として受け取り、対応する動作を出力してヒューマノイドロボットを制御する、大きなヒューマノイドモデルUH-1を訓練する。
私たちのスケーラブルなトレーニングアプローチは、テキストベースのヒューマノイド制御の優れた一般化につながります。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:59:56 GMT)
Foundation Models Meet Low-Cost Sensors: Test-Time Adaptation for Rescaling Disparity for Zero-Shot Metric Depth Estimation [46.0] 本稿では,低コストセンサや低解像度LiDARなどの技術によって提供される3Dポイントを用いて,奥行き予測を再スケールする手法を提案する。
実験では,他の距離深度推定法との比較と,微調整手法との比較による競合性について検討した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:50:15 GMT)
Speech Watermarking with Discrete Intermediate Representations [45.9] 本稿では,音声の中間表現に透かしを注入する新しい音声透かしフレームワークを提案する。
DiscreteWMは、堅牢性と非受容性を同時に実現します。
我々のフレキシブルなフレームワイドアプローチは、音声のクローン検出と情報隠蔽の両面において効率的な解決策となる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:57:06 GMT)
Exploring Multi-Modal Integration with Tool-Augmented LLM Agents for Precise Causal Discovery [45.8] 因果推論は、スマートヘルス、薬物発見のためのAI、AIOpsなど、ドメイン間の意思決定の必須基盤である。
ツール拡張 LLM を利用したマルチエージェントシステムである MATMCD を紹介する。
以上の結果から,マルチモーダル化による因果発見の可能性が示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:50:00 GMT)
Faster and Stronger: When ANN-SNN Conversion Meets Parallel Spiking Calculation [45.7] スパイキングニューラルネットワーク(SNN)は、脳にインスパイアされたエネルギー効率の高いネットワークであり、適切な学習フレームワークを探索する上で重要な課題に直面している。
並列スパイクニューロンの各時間ステップ間の数学的マッピング関係を確立する並列変換学習フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:37:13 GMT)
On consistent estimation of dimension values [45.5] ユークリッド空間のコンパクト部分集合 S の次元を推定する問題を考える。
統計学的な意味では一貫性に重点を置いている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:40:37 GMT)
Bath Dynamical Decoupling with a Quantum Channel [45.0] 浴槽の動的疎結合は,キックがエルゴディックである場合にのみ有効である。
CPTPがモノパーティ量子系を起動する状況において、ハミルトニアンをキャンセルした量子ゼノダイナミクスを誘導する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:26:22 GMT)
Evolutionary Large Language Model for Automated Feature Transformation [44.6] 自動特徴変換のための進化的Large Language Model (LLM) フレームワークを提案する。
本フレームワークは,1)RLデータコレクタによるマルチポピュレーションデータベースの構築,2)大規模言語モデル(LLM)のシーケンス理解能力を活用した2つの部分から構成される。
提案手法の有効性と汎用性を実証的に示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:25:12 GMT)
Model Decides How to Tokenize: Adaptive DNA Sequence Tokenization with MxDNA [44.6] MxDNAは、モデルが段階的に有効なDNAトークン化戦略を自律的に学習する新しいフレームワークである。
我々は、MxDNAが従来の方法とは異なるユニークなトークン化戦略を学習し、自己教師付き事前学習中にトークンレベルでゲノム機能をキャプチャすることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:55:43 GMT)
Unlocking the Potential of Weakly Labeled Data: A Co-Evolutionary Learning Framework for Abnormality Detection and Report Generation [44.4] 臨床における胸部X線(CXR)の解剖学的異常検出と報告生成は2つの重要な課題である。
既存の手法は、それぞれのタスクを別々に焦点を合わせ、相関を無視することが多い。
本研究は,共進化異常検出および報告生成フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:31:26 GMT)
Combining Aggregated Attention and Transformer Architecture for Accurate and Efficient Performance of Spiking Neural Networks [44.1] 近年、スパイキングニューラルネットワークは、その特徴的な低消費電力特性のために、大きな注目を集めている。
トランスフォーマーモデルは、強力な自己アテンション機構と並列処理能力で知られており、様々な領域で例外的な性能を示している。
SNNとTransformersの双方の大きな利点にもかかわらず、SNNの低消費電力の利点とTransformersの性能を直接組み合わせることは困難である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:07:38 GMT)
Lightning IR: Straightforward Fine-tuning and Inference of Transformer-based Language Models for Information Retrieval [43.4] 検索シナリオにトランスフォーマーベースの言語モデルを適用するための,使い易いフレームワークであるLightning IRを紹介する。
Lightning IRは、細調整やインデックス付けから検索と再ランク付けまで、検索パイプラインのすべてのステージをサポートするモジュラーとアーキテクチャを提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:00:35 GMT)
ChinaTravel: A Real-World Benchmark for Language Agents in Chinese Travel Planning [43.0] ChinaTravelは、中国の旅行計画シナリオに特化して設計されたベンチマークである。
質問紙から旅行要求を収集し,構成的に一般化可能なドメイン特化言語を提案する。
実証研究により、旅行計画における神経象徴薬の可能性を明らかにし、27.9%の制約満足度を達成した。
我々は、オープン言語推論や未確認概念構成など、現実世界の旅行計画展開における重要な課題を特定します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:10:12 GMT)
Trustworthy Transfer Learning: A Survey [42.8] 我々は、知識伝達可能性と信頼性の観点から、伝達学習を理解する。
本稿では,様々な側面から信頼できる伝達学習の総合的なレビューを行う。
我々は,伝達学習を信頼性と信頼性のある方法で理解するためのオープンな質問と今後の方向性を強調した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:03:51 GMT)
Visibility of Domain Elements in the Elicitation Process: A Family of Empirical Studies [42.6] 問題領域の特定の要素を識別するアナリストの能力に影響を及ぼす可能性のある側面を決定する。
14種類の準実験を行い、134名の被験者に2つの問題領域について質問した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:28:51 GMT)
Descriptive Caption Enhancement with Visual Specialists for Multimodal Perception [42.4] 大規模マルチモダリティモデルのトレーニングは、画像と言語を接続する記述的なイメージキャプションに依存している。
画像キャプションの強化を目的として, 画像キャプションではなく, 注釈付き画像から訓練した, 市販のビジュアルスペシャリストを活用することを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:45:43 GMT)
SAFERec: Self-Attention and Frequency Enriched Model for Next Basket Recommendation [41.9] BERT4RecやSASRecのようなトランスフォーマーベースのアプローチは、Next Item Recommendation (NIR)タスクで強いパフォーマンスを示す。
これらのアーキテクチャをNext-Basket Recommendation (NBR)タスクに適用することは、バスケットに膨大な数のアイテムの組み合わせがあるため、難しい。
本稿では, アイテム周波数情報による変換器アーキテクチャをNIRから拡張する, NBRの新しいアルゴリズムであるSAFERecを紹介する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:10:42 GMT)
CA-Edit: Causality-Aware Condition Adapter for High-Fidelity Local Facial Attribute Editing [41.9] データ駆動の観点から、属性テキストトリプルからなるデータセットを構築するために、新しいデータ利用戦略が導入された。
文脈因果関係の局所的モデリングのための皮膚遷移周波数誘導手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:33:22 GMT)
Physics Reasoner: Knowledge-Augmented Reasoning for Solving Physics Problems with Large Language Models [41.9] 既存の大規模言語モデル(LLM)は、知識の不足や誤った知識アプリケーションのために頻繁に失敗する。
LLMを用いて物理問題を解くための知識強化フレームワークである物理推論器を提案する。
物理学的な問題を考えると、物理学的推論は問題解析、公式検索、ガイド付き推論という3つの段階を通して解決する。
経験的に、物理推論器は知識不足と不正確な応用の問題を緩和し、SciBenchの最先端性能を平均精度5.8%で達成した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:33:50 GMT)
MagicPIG: LSH Sampling for Efficient LLM Generation [41.8] 以上の結果から,TopKの注意力自体が特定の下流タスクの品質低下に悩まされていることが分かる。
局所感性ハッシュ(LSH)に基づく異種システムMagicPIGを提案する。
MagicPIGは、さまざまなタスクに対して高い精度を維持しながら、注意の負荷を大幅に削減する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:36:36 GMT)
Alignment faking in large language models [41.4] そこで本研究では,アライメント・フェイクに係わる大規模言語モデルについて述べる。
このモデルは、無料ユーザーの14%が有害なクエリに対応しているのに対して、有料ユーザーのほとんどいない。
また,モデルが強化学習によって有害なクエリに適合するように実際に訓練する効果についても検討し,アライメント・フェイキングの推論率を78%に向上させることを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:41:24 GMT)
KlF: Knowledge Localization and Fusion for Language Model Continual Learning [41.3] 大規模言語モデル(LLM)は、リトレーニングなしで動的現実世界のシナリオに適応することができる。
この領域における大きな課題は、モデルが新しいタスクを学ぶ際に獲得した知識を失う、破滅的な忘れ事である。
既存のアプローチでは、タスク固有の知識を得るために、複数のパラメータ効率の微調整(PEFT)ブロックを利用するのが一般的である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:07:27 GMT)
LaMI-GO: Latent Mixture Integration for Goal-Oriented Communications Achieving High Spectrum Efficiency [41.3] 超高通信効率のQoS(Quality of-Service)を実現するために,新たな生成AIを活用した新しいGO-COMフレームワークであるLaMI-GOを提案する。
具体的には、潜伏拡散モデルに基づいてLaMI-GOシステムバックボーンを設計し、高速潜伏埋め込みおよび情報表現のためのベクトル量子化生成対向ネットワーク(VQGAN)を設計する。
実験の結果,最先端のGOCOMシステムに比べて,知覚品質,下流タスクの精度,帯域消費が大幅に向上した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:20:42 GMT)
A Rose by Any Other Name: LLM-Generated Explanations Are Good Proxies for Human Explanations to Collect Label Distributions on NLI [41.0] 人間のラベリングにおける分解はユビキタスであり、ヒトの判断分布(HJD)で捉えることができる
近年の研究では、人間のラベル変化(HLV)を理解するための貴重な情報を提供していることが示されている。
本稿では,HJDを近似するための説明を生成する際に,大規模言語モデル (LLM) を用いて人間を置き換えることができるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:24:50 GMT)
Read Like a Radiologist: Efficient Vision-Language Model for 3D Medical Imaging Interpretation [40.7] 3次元医用画像解釈において,放射線技師のワークフローを模倣したMS-VLMを導入する。
特に、放射線学者は、個々のスライスを連続的に分析し、スライスとビューにまたがる情報を合成することによって、3Dの医療画像を分析する。
MS-VLMは、スライス長の3次元医用画像と、異なる平面と位相から取得した複数の画像から有用なボリューム表現を得ることができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:19:48 GMT)
Sign-IDD: Iconicity Disentangled Diffusion for Sign Language Production [40.7] Sign-IDDは、関節間の相対的な位置のギャップを埋める新しいIconicity Disentanglement (ID)モジュールを組み込んでいる。
IDモジュールは従来の3D関節表現を4D骨表現に切り離す。
属性分離層は骨方向と長さ特性を分離することを目的としており、属性制御層はポーズ生成を導くように設計されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:36:35 GMT)
Learning Causal Transition Matrix for Instance-dependent Label Noise [40.6] ノイズラベルのデータ生成過程を因果的観点から検討する。
観測不能な潜在変数は、インスタンス自身、ラベルアノテーションのプロシージャ、あるいはその両方に影響を与える可能性がある。
我々は、この因果関係を明示的にモデル化する新しいトレーニングフレームワークを設計した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:33:16 GMT)
Maximize Your Data's Potential: Enhancing LLM Accuracy with Two-Phase Pretraining [39.8] 本研究では,2相事前学習の概念を定式化し,モデル精度を最大化するためにデータの選択と混合方法に関する体系的研究を行う。
我々は、データソースの品質と、見るべきエポックの数に基づいて、最適なブレンドを作るための詳細なガイダンスを提供する。
1Tトークンの小さなスケールでサンプルデータを用いてブレンドを設計し、15Tトークンのより大きなトークン水平線と25Bモデルサイズへのアプローチの効果的なスケーリングを実証することを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:41:18 GMT)
Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models [39.7] ファンデーションビジョン言語モデル(VLM)はマルチモーダル表現学習、理解、推論において強力な能力を示す。
VLMにアクションコンポーネントを注入することにより、自然にVLA(Vision-Language-Action Models)を形成し、有望な性能を示すことができる。
本稿では,VLAの性能に大きく影響を及ぼす重要な要因を明らかにするとともに,3つの重要な設計選択に答えることに注力する。
我々はVLAの新たなファミリーであるRoboVLMsを開発し、3つのシミュレーションタスクと実世界の実験で非常に少ない手動設計と新しい最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:07:20 GMT)
Non-perturbative exciton transfer rate analysis of the Fenna-Matthews-Olson photosynthetic complex under reduced and oxidised conditions [39.6] 2次元光学分光実験により、FMO(Fenna-Matthews-Olson)光合成複合体の励起子伝達経路は、還元および酸化条件下で大きく異なることが示されている。
レッドフィールド理論は、実験結果と酸化的オンサイトエネルギーシフトによる励起子移動率の変化を結びつけるために用いられた。
物理画像を修正した転送速度の非摂動的推定を行う。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:19:19 GMT)
GraphLoRA: Empowering LLMs Fine-Tuning via Graph Collaboration of MoE [39.3] Low-Rank Adaptation (LoRA) はパラメータ効率の良い微調整法であり、LLMの様々な下流応用に広く採用されている。
そこで我々は,グラフルータ関数を設計し,専門家間の協調信号をキャプチャする,新しいMoEグラフベースLLM微調整フレームワークGraphLoRAを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:18:57 GMT)
Exploring Query Efficient Data Generation towards Data-free Model Stealing in Hard Label Setting [38.8] データフリーモデルは、ターゲットモデルの構造、パラメータ、トレーニングデータにアクセスすることなく、ターゲットモデルの機能を代替モデルに複製する。
本稿では Query Efficient Data Generation (textbfQEDG) と呼ばれる新しいデータフリーモデルステーリング手法を提案する。
対象モデルの決定境界に密接に一様に整合する十分なサンプルの生成を保証するために、2つの異なる損失関数を導入する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:03:15 GMT)
PVP: Polar Representation Boost for 3D Semantic Occupancy Prediction [38.4] 極座標で動作する新しい3次元マルチモーダル予測器であるPolar Voxel Occupancy Predictor (PVP)を紹介する。
グローバル空間データを3Dボリュームに統合するGlobal Represent Propagationモジュールと、3D歪みを2D畳み込みに単純化するPlane Devolution Concomposed (PD-Conv)である。
これらのイノベーションにより、PVPは既存のメソッドよりも優れており、OpenOccupancyデータセット上のmIoUとIoUメトリクスの大幅な改善を実現している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:02:35 GMT)
Vocabulary Expansion of Chat Models with Unlabeled Target Language Data [38.3] チャットモデル(つまり、人間との会話を通じて指示に従うために訓練された言語モデル)は、会話と一般的なタスク解決能力の両方において、ベースモデル(すなわち、ラベルなしデータにのみ訓練された)より優れている。
これらのモデルは一般的に英語中心であり、トレーニングデータから不足している言語や欠落している言語にさらに適応する必要がある。
そこで本研究では,本手法の有効性を明らかにする実験を行い,87%のケースにおいて,適合モデルが性能改善を達成するのに有効であることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:29:11 GMT)
Are Your LLMs Capable of Stable Reasoning? [38.0] 大規模言語モデル(LLM)は複雑な推論タスクにおいて顕著な進歩を示している。
しかし、ベンチマークパフォーマンスと実世界のアプリケーションの間には大きな違いがある。
G-Pass@kはモデルの性能を連続的に評価する新しい評価指標である。
本稿では,挑戦的,現代数学的な問題からなる動的ベンチマークであるLiveMathBenchを紹介する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:05:24 GMT)
MERaLiON-AudioLLM: Bridging Audio and Language with Large Language Models [37.9] シンガポールの多文化景観に合わせた最初の音声テキストモデルであるMERaLiON-AudioLLMを紹介する。
MERaLiON-AudioLLMは、局所的なアクセントや方言の多様な言語的ニュアンスに対処するために、高度な音声処理とテキスト処理を統合している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:01:21 GMT)
ManiBox: Enhancing Spatial Grasping Generalization via Scalable Simulation Data Generation [37.7] bfManiBoxは、シミュレーションベースの教師学生フレームワーク上に構築された新しいバウンディングボックス誘導操作手法である。
ManiBoxは、空間的把握の一般化と多様なオブジェクトや背景への適応性を著しく改善した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:25:55 GMT)
InstructSeg: Unifying Instructed Visual Segmentation with Multi-modal Large Language Models [37.4] 本稿では,画像レベルと映像レベルのセグメンテーションと推論セグメンテーションの融合を,IVS(Instructed Visual)として定義する。
具体的には、参照フレームから時間的およびオブジェクト情報を抽出し、包括的な映像理解を容易にするために、オブジェクト認識ビデオ知覚器を用いる。
マルチタスクとエンドツーエンドのトレーニングを活用することで、InstructSegは、さまざまな画像およびビデオセグメンテーションタスクにまたがる優れたパフォーマンスを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:20:40 GMT)
ManiVideo: Generating Hand-Object Manipulation Video with Dexterous and Generalizable Grasping [37.4] ManiVideoは、一貫した時間的コヒーレントな双方向手動操作ビデオを生成する方法である。
MLO構造をUNetに2つの形式で埋め込むことで、デキスタラスハンドオブジェクト操作の3次元一貫性を高めることができる。
複数のデータセットを効果的に統合し、人中心手オブジェクト操作ビデオ生成などの下流タスクをサポートする革新的なトレーニング戦略を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:37:55 GMT)
Unleashing the Power of Continual Learning on Non-Centralized Devices: A Survey [37.1] 非連続学習(NCCL)は、分散デバイスが共同の非定常環境からストリーミングデータを処理できるようにするための新たなパラダイムとなっている。
本調査は,非集中型連続学習アルゴリズムの開発と,分散デバイスへの実環境展開に焦点を当てる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:33:28 GMT)
Design Principle Transfer in Neural Architecture Search via Large Language Models [37.0] トランスファーブルニューラルアーキテクチャサーチ(TNAS)は、複数のタスクのための効率的なニューラルアーキテクチャを設計するために導入された。
TNASでは、従来の検索プロセスに蓄積されたアーキテクチャ知識を再利用して、新しいタスクのアーキテクチャ検索を温める。
本研究は,新しい伝達パラダイム,すなわち設計原理伝達を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:51:50 GMT)
Quantum Machine Learning in Log-based Anomaly Detection: Challenges and Opportunities [36.4] 我々は、LogADのコンテキストでQMLモデルを評価するための統合フレームワーク、我々のフレームワークを紹介します。
DeepLog、LogAnomaly、LogRobustといった最先端のメソッドが私たちのフレームワークに含まれている。
評価はQMLの性能に重要な要素、例えば特異性、回路数、回路設計、量子状態符号化にまで及んでいる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:13:49 GMT)
Quantitative Measurement of Cyber Resilience: Modeling and Experimentation [36.2] サイバーレジリエンス(サイバーレジリエンス)とは、システムがサイバー攻撃に対して抵抗し、回復する能力である。
本稿では、レジリエンス関連データを得るための実験方法と試験ベッドについて述べる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:19:52 GMT)
Performance Gap in Entity Knowledge Extraction Across Modalities in Vision Language Models [36.2] 視覚言語モデル(VLM)は、画像から情報を取り出し、推論するのに優れている。
本研究は,テキストで記述されたエンティティと画像で表現されたエンティティについて,現実的な質問に答える際のモデル性能の相違について検討する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:22:30 GMT)
Enhancing Adversarial Transferability with Adversarial Weight Tuning [36.1] 敵対的な例(AE)は、人間の観察者に対して良心を抱きながらモデルを誤解させた。
AWTは、勾配に基づく攻撃法とモデルに基づく攻撃法を組み合わせて、AEの転送可能性を高めるデータフリーチューニング手法である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:40:46 GMT)
HandsOnVLM: Vision-Language Models for Hand-Object Interaction Prediction [36.0] 我々は,従来の手指の軌跡予測タスクを,明示的あるいは暗黙的な言語クエリを含む2つのタスクに拡張する。
VHP(Vanilla Hand Prediction)とRBHP(Reasoning-Based Hand Prediction)の2つの課題を評価するための新しいベンチマークを開発した。
我々のモデルであるHandsOnVLMは、テキスト応答を生成し、自然言語による会話を通じて、将来のハンドトラジェクトリを生成する新しいVLMである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:19:55 GMT)
REVS: Unlearning Sensitive Information in Language Models via Rank Editing in the Vocabulary Space [35.6] 言語モデル(LM)は、トレーニングデータに見られる機密情報や個人識別可能な情報(PII)を不注意に記憶・拡散し、プライバシー上の懸念を引き起こすリスクがある。
LMから機密情報を学習する非段階的手法であるREVSを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:56:33 GMT)
GaraMoSt: Parallel Multi-Granularity Motion and Structural Modeling for Efficient Multi-Frame Interpolation in DSA Images [35.4] Digital Subtraction Angiography (DSA) 画像は複雑な血管構造と様々な動きを含んでいる。
自然シーンビデオフレーム補間法(VFI)を適用すると、動きのアーティファクト、構造的散逸、ぼやけが生じる。
MoSt-DSAはこれらの問題に初めて対処し、SOTAの結果を得た。
我々は,これらの問題に同じ計算時間スケールで対処するGalaMoStを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:04:12 GMT)
LIFT: Improving Long Context Understanding Through Long Input Fine-Tuning [35.3] 本稿では,ロングコンテキストモデリングのための Long Input Fine-Tuning (LIFT) を提案する。
LIFTは、オフライン長文適応の計算負担を伴わずに、長時間入力の効率的な処理を可能にする。
このフレームワークは、コンテキスト内学習とLIFT前教師付き微調整を統合することでさらに強化されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:04:55 GMT)
TEncDM: Understanding the Properties of the Diffusion Model in the Space of Language Model Encodings [35.2] TEncDMは、事前訓練された言語モデルエンコーディングの空間で動作する拡散モデリングの新しいアプローチである。
このアプローチでは,トークン予測プロセスにコンテキストを組み込むように設計されたトランスフォーマーベースのデコーダも採用しています。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:30:58 GMT)
Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces [34.8] 5000組以上の質問応答対からなるビデオベース視覚空間インテリジェンスベンチマーク(VSI-Bench)を提案する。
MLLM(Multimodal Large Language Models)は,非人間的な視覚空間知能を持つ。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:59:54 GMT)
Enabling Region-Specific Control via Lassos in Point-Based Colorization [34.5] 各色ヒントの範囲を制御できるラッソツールを導入する。
また、ユーザが提供するラッソスを利用してアテンションマスクをローカライズするフレームワークを設計する。
実験結果から、1つのラッソを使うことは4.18個の色ヒントを施すのと同じくらい効果的であることが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:35:55 GMT)
Josephson Field Effect Transistors with InAs on Insulator and High Permittivity Gate Dielectrics [33.7] InAs on Insulator (InAsOI)は、最近、ハイブリッド半導体超電導エレクトロニクスを開発するための有望なプラットフォームとして実証されている。
InAsOIをベースとしたJosephson Field Effect Transistors(JoFET)のゲート可変電気特性について検討した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:14:09 GMT)
Adaptive Concept Bottleneck for Foundation Models Under Distribution Shifts [33.7] 複雑で非解釈可能な基礎モデルを解釈可能な意思決定パイプラインに変換するための概念ボトルネックモデルの可能性を探る。
具体的には、このような解釈可能なCBMパイプラインを“野生”で”テスト時にデプロイすることに重点を置いています。
提案手法は,テストデータとの整合性を向上し,デプロイ後の精度を最大28%向上させる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:47:46 GMT)
Towards Deployable OCR models for Indic languages [33.7] Connectionist Temporal Classification (CTC) を用いた非セグメンテーション配列のモデル化は、セグメンテーションフリーなOCRにおいて最もよく用いられる手法である。
本稿では,CTCを用いたニューラルネットワーク出力のステップワイズ予測をUnicodeシーケンスに変換するニューラルネットワークモデルについて述べる。
インド語の単語と行認識のための、Mozhiと呼ばれる新しいパブリックデータセットも導入しました。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:41:53 GMT)
Distributionally Robust Policy Learning under Concept Drifts [33.4] 本稿では、より曖昧な問題、つまり、コンセプトドリフトの下でのロバストな政策学習について研究する。
まず、与えられた政策の最悪の平均報酬を評価するための2倍のロバスト推定器を提供する。
次に、所定のポリシークラス内で推定されたポリシー値を最大化するポリシーを出力する学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:53:56 GMT)
State Space Models are Strong Text Rerankers [33.4] Mambaのようなステートスペースモデル(SSM)は有望な利点を提供する。
その可能性にもかかわらず、SSMのテキストの再ランクにおける有効性は未定のままである。
Mambaアーキテクチャは、同様のサイズのトランスフォーマーベースのモデルに匹敵する、競合するテキストランキングのパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:42:15 GMT)
Deploying Foundation Model Powered Agent Services: A Survey [33.3] ファンデーションモデル(FM)を利用したエージェントサービスは、インテリジェントでパーソナライズされたアプリケーションを開発するための有望なソリューションと見なされている。
本稿では、FMベースのエージェントサービスを異種デバイスに展開するための総合的な調査を行うための統合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:15:31 GMT)
One for Dozens: Adaptive REcommendation for All Domains with Counterfactual Augmentation [32.9] マルチドメインレコメンデーション(MDR)は、さまざまなドメインにわたるレコメンデーションパフォーマンスの向上を目的としている。
従来のMDRアルゴリズムは一般に5つ未満の領域にフォーカスする。
本稿では,全てのドメインに対するアダプティブ・レコメンデーションを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:41:21 GMT)
MoGenTS: Motion Generation based on Spatial-Temporal Joint Modeling [32.8] 本研究では,2次元関節型VQVAE,時間空間型2次元マスキング技術,時空間型2次元アテンションを提案する2次元運動量子化フレームワークを構築した。
提案手法は,HumanML3DではFIDが26.6%,KIT-MLでは29.9%,従来の手法よりも大幅に向上した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:09:20 GMT)
XFormParser: A Simple and Effective Multimodal Multilingual Semi-structured Form Parser [32.6] textbfXForm textbfPARSER(textbfXForm)を導入する。
InDFormSFTも開発しています。InDFormSFTは、さまざまな産業的文脈でフォームのパースニーズに対処するデータセットです。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:55:15 GMT)
Understanding Key Point Cloud Features for Development Three-dimensional Adversarial Attacks [32.5] 敵対的攻撃は、ディープニューラルネットワーク(DNN)に基づく様々な入力信号の分析に深刻な課題をもたらす。
本稿では, 対向点の予測において, 雲の特徴が最も重要である点について検討する。
これらの特徴は、4つの異なるDNNアーキテクチャの対向点を予測できることが実証された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:16:59 GMT)
ArtAug: Enhancing Text-to-Image Generation through Synthesis-Understanding Interaction [32.5] テキスト・ツー・イメージ・モデルを改善するためのArtAugという新しい手法を提案する。
インタラクションでは、画像理解モデルによって暗黙的に学習された人間の好みを利用して、きめ細かい提案を行う。
相互作用によってもたらされる拡張は、追加の強化モジュールを通じて合成モデル自体に反復的に融合される。
様々な評価指標は、ArtAugが追加の計算コストを発生させることなく、テキスト・ツー・イメージモデルの生成能力を向上させることを一貫して示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:01:11 GMT)
Towards Precise Prediction Uncertainty in GNNs: Refining GNNs with Topology-grouping Strategy [32.3] 我々は**Simi-Mailbox*を導入する。これは、ノードを近隣の類似性とそれ自身の信頼性の両方で分類する新しいアプローチである。
本手法は,非校正GNN予測と比較して最大13.79%の誤差削減を実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:39:57 GMT)
GraphicsDreamer: Image to 3D Generation with Physical Consistency [32.3] 単一画像から高機能な3Dメッシュを作成する方法であるGraphicsDreamerを紹介する。
幾何融合の段階では、生成した3Dオブジェクトが信頼性の高いテクスチャの詳細を持つことを保証するため、PBRの制約を継続する。
提案手法はトポロジ最適化と高速なUVアンラッピング機能を備えており,3D画像をグラフィクスエンジンにシームレスにインポートすることができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:01:27 GMT)
Spin-wave frequency multiplication by magnetic vortex cores [32.0] マイクロンサイズの円盤および正方形に形成される磁気渦の磁化ダイナミクスを広磁場磁気イメージングにより検討した。
マイクロ波駆動渦コアのジャイロレーションによるコヒーレントスピン波高調波の発生について検討した。
この現象は、渦コアのようなデルタ関数のような物体の周期的な運動が周波数コムを生じさせる普遍的なメカニズムを明らかにする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:27:41 GMT)
CD-NGP: A Fast Scalable Continual Representation for Dynamic Scenes [31.8] 動的シーンにおける新しいビュー合成(NVS)の現在の手法は、メモリ消費の管理、モデルの複雑さ、トレーニング効率、レンダリング忠実度といった重要な課題に直面している。
本稿では,これらの問題に対処するために,連続的動的ニューラルネットワークプリミティブ(CD-NGP)を提案する。
提案手法は,メモリオーバーヘッドを低減するために連続学習フレームワークを活用するとともに,時間的および空間的なハッシュエンコーディングの異なる特徴を統合し,高いレンダリング品質を実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:14:55 GMT)
Consistency of Compositional Generalization across Multiple Levels [31.8] 複数のレベルにまたがる一貫した構成一般化を実現するためのメタラーニングベースのフレームワークを提案する。
一貫性を定量的に評価するGQA-CCGデータセットを構築した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:09:41 GMT)
Knowledge Editing with Dynamic Knowledge Graphs for Multi-hop Question Answering [31.7] MHQA(Multi-hop Question answering)は、大規模言語モデル(LLM)において重要な課題となる。
知識編集は、LLMでMHQAの課題に対処する潜在的な解決策を提供する。
ほとんどのパラメータ保存編集手法は、不正確な検索と二次的な編集の問題によって妨げられている。
本稿では,MHQAの動的知識グラフを利用した知識編集手法であるKEDKGを紹介する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:21:46 GMT)
Tokens, the oft-overlooked appetizer: Large language models, the distributional hypothesis, and meaning [31.6] トークン化は多くの言語モデルの現在のアーキテクチャにおいて必要なコンポーネントである。
トークン化事前学習はバイアスやその他の望ましくないコンテンツのバックドアになり得ることを示す。
トークン化アルゴリズムの目的関数が大規模言語モデルの認知に影響を及ぼす証拠を中継する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:16:04 GMT)
Quantifying Semantic Emergence in Language Models [31.6] 大規模言語モデル (LLM) は意味論的意味を捉える特別な能力として広く認識されている。
本研究では,入力トークンから意味を抽出するLLMの能力を測定するために,量的指標である情報創発(IE)を導入する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:03:08 GMT)
The Distributional Reward Critic Framework for Reinforcement Learning Under Perturbed Rewards [31.6] 報酬信号は、強化学習におけるエージェントの望ましい振る舞いを定義する上で中心的な役割を果たす。
本稿では,トレーニング中の報酬分布と摂動を推定するための分配報酬批判フレームワークを提案する。
その結果、報奨環境下でRLを実行する能力の拡大と深化が図られた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:04:12 GMT)
Large Language Model Enhanced Recommender Systems: Taxonomy, Trend, Application and Future [31.3] 本稿では,Large Language Model (LLM) を利用したレコメンダシステム(RS)の強化を目的とした最新の研究成果について報告する。
我々は、LLMをオンラインシステムに組み込む動き、特に推論時にの使用を避けることで、この分野における重要な変化を識別する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:07:21 GMT)
TRecViT: A Recurrent Video Transformer [31.2] ビデオモデリングのための新しいブロックを提案する。
ゲート線形単位(LRU)は時間とともに情報を混合し、自己注意層は空間上で混合し、チャネル上で再帰する。
結果として得られたアーキテクチャTRecViTは、教師付きまたは自己監督型で訓練された疎密なタスクでうまく機能する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:44:30 GMT)
NPC: Neural Predictive Control for Fuel-Efficient Autonomous Trucks [31.0] 燃料効率は、石油を動力とするトラックによる長距離貨物輸送の重要な側面である。
現在の予測制御法は、車両力学とエンジンの正確なモデルに依存している。
車両に物理モデルを用いない純データ駆動型ニューラル予測制御(NPC)を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:57:05 GMT)
MCMat: Multiview-Consistent and Physically Accurate PBR Material Generation [30.7] UNetベースの拡散モデルにより、マルチビュー物理レンダリングPBRマップを生成するが、マルチビューの不整合、いくつかの3Dメソッドは、UVマップを直接生成する。
そこで本研究では,PBR素材を特徴視する参照ビューを生成するために,特殊設計のTransformer DiDiモデルの両方を用いてPBR材料を生成することを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:45:35 GMT)
Graph Coarsening via Supervised Granular-Ball for Scalable Graph Neural Network Training [30.4] グラフデータを効果的に圧縮するために粒度計算を用いる。
我々は、純度閾値に基づいてグラフをグラニュラーボールに繰り返し分割することにより、粗いグラフネットワークを構築する。
我々のアルゴリズムは、予め定義された粗大化率を必要とせずに、スプリッティングを適応的に行うことができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:36:03 GMT)
AIR-Bench: Automated Heterogeneous Information Retrieval Benchmark [30.1] 自動不均一情報検索ベンチマーク(AIR-Bench)を提案する。
AIR-Benchのテストデータは、人間の介入なしに、大きな言語モデル(LLM)によって自動的に生成される。
信頼性が高く堅牢なデータ生成パイプラインを開発し、多種多様な高品質な評価データセットを自動的に作成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:06:07 GMT)
Physics-Based Adversarial Attack on Near-Infrared Human Detector for Nighttime Surveillance Camera Systems [30.0] 監視カメラは、照度レベルに基づいて昼間と夜間のモードを切り替える。
本稿では,色とテクスチャの喪失に起因するNIR画像理解の根本的な脆弱性を同定する。
反射・絶縁プラスチックテープがNIR画像の強度分布を制御できることを実証する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:51:59 GMT)
RACQUET: Unveiling the Dangers of Overlooked Referential Ambiguity in Visual LLMs [29.8] 本稿では,画像に基づく質問応答におけるあいまいさの異なる側面を対象とするデータセットであるRACQUETを紹介する。
我々は、その応答のあいまいさに対処する上で、最先端の大規模マルチモーダル言語モデルの過信に関する重大な制限と問題を明らかにする。
本結果は, 望ましくないステレオタイプに頼らずに不確実性に対処する頑健な戦略を持つモデルの導入の緊急性を強調した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:25:11 GMT)
Joint Co-Speech Gesture and Expressive Talking Face Generation using Diffusion with Adapters [29.8] 一つのネットワーク内での顔と体の動きを協調的に生成する新しいモデルアーキテクチャを提案する。
実験により,提案フレームワークは,最先端の音声合成と対話音声生成性能を維持できるだけでなく,必要なパラメータ数を大幅に削減できることを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:02:07 GMT)
ETF: An Entity Tracing Framework for Hallucination Detection in Code Summaries [29.6] 大型言語モデル(LLM)は、意図した意味から逸脱する幻覚出力の傾向にある。
コード要約における幻覚検出に特化してキュレートされた$sim$10Kのサンプルを用いたファースト・オブ・ザ・キンドデータセットを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:36:03 GMT)
Generating Long-form Story Using Dynamic Hierarchical Outlining with Memory-Enhancement [29.4] 本稿では,DOMEと命名されたメモリ・エンハンスメントを用いた動的階層的アウトラインニングを提案し,一貫性のある内容とプロットを持つ長大なストーリーを生成する。
時間的知識グラフに基づくメモリ・エンハンスメント・モジュール(MEM)を導入し、生成されたコンテンツを保存・アクセスする。
実験により、DOMEは最先端の手法と比較して、生成した長いストーリーの流布、コヒーレンス、および全体的な品質を著しく改善することが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:50:54 GMT)
MobiFuse: A High-Precision On-device Depth Perception System with Multi-Data Fusion [29.3] 本稿では,デュアルRGBとToF(Time-of-Flight)カメラを組み合わせたモバイルデバイス用高精度深度認識システムMobiFuseを提案する。
実験により, MobiFuseは, 深さ測定誤差を最大77.7%削減し, ベースラインよりも優れていることを示した。
また、多様なデータセットにまたがる強力な一般化を示し、3D再構成と3Dセグメンテーションという2つの下流タスクの有効性を証明している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:42:06 GMT)
Cognition Chain for Explainable Psychological Stress Detection on Social Media [29.3] ストレスは世界的な健康問題であり、深刻なメンタルヘルス問題を引き起こす可能性がある。
現在の早期検出モデルは、限定的な説明可能性と信頼に苦しむ「ブラックボックス」推論を実行する。
我々は,説明可能なストレス検出モデルであるCogLLMを開発した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:26:47 GMT)
ZipVL: Efficient Large Vision-Language Models with Dynamic Token Sparsification [29.2] 大規模視覚言語モデル(LVLM)の効率は、プリフィルフェーズにおける注意機構の計算ボトルネックによって制約される。
本稿では,重要なトークンの動的比割り当て戦略を通じて,LVLM向けに設計された効率的な推論フレームワークZipVLを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:45:11 GMT)
SCOPE: Optimizing Key-Value Cache Compression in Long-context Generation [28.8] SCOPEは、プリフィルとデコードフェーズでKVキャッシュを最適化するフレームワークである。
メモリ使用量とメモリ転送は、適応的かつ不連続な戦略によってさらに最適化される。
LongGenBenchの実験はSCOPEの有効性と一般化を示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:27:33 GMT)
Benchmarking and Improving Large Vision-Language Models for Fundamental Visual Graph Understanding and Reasoning [28.7] LVLM(Large Vision-Language Models)は、様々なタスクにまたがる顕著な性能を示す。
近年の研究では、LVLMは視覚グラフに係わる際にかなりの制限を受けることが示されている。
LVLMの基本的グラフ理解と推論能力を調べるための22のタスクをカバーするベンチマークであるVGCureを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:35:18 GMT)
Hypothesis Generation with Large Language Models [28.7] データに基づく仮説生成(ラベル付き例)に焦点を当てる。
マルチアームの盗賊にインスパイアされた我々は、更新プロセスにおけるエクスプロイト探索のトレードオフを通知する報酬関数を設計する。
我々のアルゴリズムは、分類タスクにおいて、数発のプロンプトよりもずっと優れた予測性能を実現する仮説を生成することができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:00:00 GMT)
What Has Been Overlooked in Contrastive Source-Free Domain Adaptation: Leveraging Source-Informed Latent Augmentation within Neighborhood Context [28.6] ソースフリードメイン適応(SFDA)は、ラベル付きデータセットを使用してトレーニングされたモデルを適用して、ラベルなしデータセットで効果的に実行する。
この適応は、この2つの領域の間にデータ分布のかなりの相違が存在する場合、特に重要である。
対照的なSFDAに適した,単純かつ高効率な潜伏増強法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:09:46 GMT)
DyCoke: Dynamic Compression of Tokens for Fast Video Large Language Models [28.4] トークン表現の最適化とビデオ大言語モデルの高速化を目的とした,トレーニング不要なトークン圧縮手法であるDyCokeを提案する。
DyCokeは、フレーム間で冗長トークンをマージすることによって、時間的冗長性を最小化するために、プラグインとプレイの時間的圧縮モジュールを組み込んでいる。
各デコードステップでクリティカルトークンを動的に保持することで、高品質な推論を保証する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:47:25 GMT)
Experimental investigation of the uncertainty relation in pre- and postselected systems [28.1] 不確実性原理は量子力学の基本原理の1つである。
PPS系における2つの非互換観測値に対するロバートソン・ハイゼンベルク型不確実性関係を実験的に検討した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:29:23 GMT)
Turbo-GS: Accelerating 3D Gaussian Fitting for High-Quality Radiance Fields [28.0] 新規ビュー合成はコンピュータビジョンにおいて重要な問題であり、3次元再構成、混合現実、ロボット工学への応用がある。
近年, 3D Gaussian Splatting (3DGS) などの手法が好まれている。
私たちの目標は、高いレンダリング品質を維持しながら、少ないステップでトレーニングすることで最適化時間を短縮することにあります。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:46:40 GMT)
Pre-training a Density-Aware Pose Transformer for Robust LiDAR-based 3D Human Pose Estimation [27.3] LiDARベースの3Dヒューマンポース推定が研究の焦点となっている。
既存の手法のほとんどは、時間情報、マルチモーダル融合、あるいはSMPL最適化を使ってバイアスのある結果を修正する。
本稿では,ポイントクラウドのモデリングと拡張に関する洞察を提供する,シンプルながら強力な手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:54:30 GMT)
Spatio-Temporal Fuzzy-oriented Multi-Modal Meta-Learning for Fine-grained Emotion Recognition [26.9] 細粒度感情認識(FER)は、疾患診断、パーソナライズされたレコメンデーション、マルチメディアマイニングなど、様々な分野で重要な役割を果たしている。
既存のFERメソッドは、現実の応用において3つの重要な課題に直面している: (i) 感情は複雑で時間を要するため正確性を確保するために、大量の注釈付きデータに依存している; (ii) サンプリング期間内の時間的相関が同じであると仮定するため、感情パターンの変化に起因する時間的不均一性を捉えることができない; (iii) 異なるFERシナリオの空間的不均一性、すなわち、感情の分布を考慮しない。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:40:53 GMT)
Text2Relight: Creative Portrait Relighting with Text Guidance [26.8] ポートレート画像とテキストプロンプトを付与し,単一画像のリライトを行う照明対応画像編集パイプラインを提案する。
我々のモデルは、提供されたテキスト記述に合わせるために、前景と背景の両方の照明と色を変更する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:12:10 GMT)
Does VLM Classification Benefit from LLM Description Semantics? [26.7] そこで本研究では,クラス名認識効果とは無関係に機能する識別記述を学習不要に選択する手法を提案する。
提案手法では,ローカルなCLIPラベル近傍のクラスを効果的に区別する記述を同定し,分類精度を7つのデータセットで向上する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:15:42 GMT)
EvalGIM: A Library for Evaluating Generative Image Models [26.6] テキストから画像への生成モデルを評価するためのライブラリであるEvalGIMを紹介する。
EvalGIMは、品質、多様性、一貫性を測定するために使用されるデータセットとメトリクスを幅広くサポートする。
EvalGIMには、テキストから画像への生成モデルのための2つの新しい分析手法を導入する評価演習も含まれている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:49:32 GMT)
Urban Air Temperature Prediction using Conditional Diffusion Models [26.6] 世界的トレンドとしての都市化は、都市ヒートアイランド(UHI)効果など、多くの環境問題を引き起こしている。
表面上の2mの空気温度は、UHI効果の鍵となる指標である。
土地利用土地被覆(LULC)がT_a$にどのように影響するかは、近隣の規模で高解像度(HR)のT_a$データを必要とする重要な研究課題である。
地表面温度(LST)と他のLULC関連特性を用いて,100mの地表面分離距離(gsd)でHR$T_a$を予測する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:56:29 GMT)
SplineGS: Robust Motion-Adaptive Spline for Real-Time Dynamic 3D Gaussians from Monocular Video [26.5] 高品質な再構成とモノクロビデオからの高速レンダリングを実現するために,COLMAPフリーな動的3DガウススティングフレームワークであるSplineGSを提案する。
中心となるのは、連続的な動的3次元ガウス軌道を表す新しい動き適応スプライン(MAS)法である。
カメラパラメータ推定と3次元ガウス属性の同時最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:25:50 GMT)
SurgSora: Decoupled RGBD-Flow Diffusion Model for Controllable Surgical Video Generation [26.0] SurgSoraは、単一の入力フレームとユーザ制御可能なモーションキューを使用する、モーションコントロール可能な手術用ビデオ生成フレームワークである。
SurgSoraはDSI(Dual Semantic)という3つの重要なモジュールから構成されており、入力フレームからオブジェクト関連RGBと奥行きの特徴を抽出する。
Decoupled Flow Mapper (DFM)は、時間的理解とオブジェクトのダイナミクスを高めるために、光フローと意味-RGBD機能を複数のスケールで融合する。
Trajectory Controller (TC) は、ユーザが動きの方向を指定し、疎い光の流れを推定し、ビデオ生成プロセスを導く。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:34:51 GMT)
Rethink the Evaluation Protocol of Model Merging on Classification Task [25.9] 出力のマージと微調整による分類器との相違が生じ,効率が低下する。
そこで, FT-Classifierを提案する。このプロトコルは, 調整ミスを軽減するために, 数発のサンプルで整列型分類器を微調整する新しいプロトコルである。
実験では,不整合の有無とFT分類器評価プロトコルの有効性を実証した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:53:15 GMT)
FairTP: A Prolonged Fairness Framework for Traffic Prediction [25.6] 交通予測はインテリジェント交通システムにおいて重要な役割を担っている。
現在の公正性を意識した機械学習モデルは、特定の時点においてのみ公平性を保証する。
本稿では,長期の公正交通予測のためのフレームワークであるFairTPを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:17:09 GMT)
Persona-SQ: A Personalized Suggested Question Generation Framework For Real-world Documents [25.5] SQ(Suggested Question)は、AIを利用した読み出しアプリケーションにおいて、ユーザがドキュメントをエンゲージするための効果的な初期インターフェースを提供する。
我々は、読者プロファイル(プロフェッショナルと読書目標)を取り入れたパーソナライズされたSQを生成するパイプラインを導入する。
当社のアプローチは,現在のSQシステムにおいて,その性能を即時向上するための代替手段として機能するだけでなく,ローカルで動作し,高速かつプライベートなSQエクスペリエンスを提供するデバイス上でのSQモデルの開発にも有効である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:28:43 GMT)
Fingerprinting Codes Meet Geometry: Improved Lower Bounds for Private Query Release and Adaptive Data Analysis [25.5] 本稿では,フィンガープリント方式の下位境界の証明のための一般的なフレームワークを提案する。
宇宙上の任意の適応的数え上げクエリにQ$$$mathcalX$ to accuracy $alpha$ needs $Omega(fracsqrt log|mathcalX| log (1/delta) log Qvarepsilonalpha2)$ sample, matching known upper bounds to constants。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:11:07 GMT)
FlashVTG: Feature Layering and Adaptive Score Handling Network for Video Temporal Grounding [25.2] テキスト誘導ビデオ時間グラウンド(VTG)は、テキスト記述に基づいて、関連セグメントを未編集ビデオにローカライズすることを目的としている。
本稿では,TFL(Temporal Feature Layering)モジュールとASR(Adaptive Score Refinement)モジュールを備えたフレームワークであるFlashVTGを紹介する。
FlashVTGは、Moment Retrieval(MR)とHighlight Detection(HD)の両方で広く採用されている4つのデータセット上で、最先端のパフォーマンスを達成する
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:23:33 GMT)
Split Learning in Computer Vision for Semantic Segmentation Delay Minimization [25.1] 分割学習(SL)を用いたセマンティックセグメンテーションにおける推論遅延を最小化する新しい手法を提案する。
SLはリソース制約のあるデバイスのためのリアルタイムコンピュータビジョン(CV)アプリケーションのニーズに合わせて調整されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:07:25 GMT)
RatBodyFormer: Rodent Body Surface from Keypoints [25.0] ラット体表面の高密度3次元試料を受動的に回収するための2つの重要な貢献点を紹介した。
ひとつは、ラットの行動キャプチャーのための新しいマルチカメラシステムRatDomeと、それを使ってキャプチャした大規模なデータセットだ。
第二のRatBodyFormerは、検出されたキーポイントを3Dボディサーフェスポイントに変換する新しいネットワークだ。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:49:22 GMT)
GLCF: A Global-Local Multimodal Coherence Analysis Framework for Talking Face Generation Detection [24.9] トーキング・フェイスジェネレーション(TFG)は、顔画像と付随するテキストのみを使用して、あらゆるキャラクターのライフライクなトーキングビデオを作成することができる。
音声とビデオの偽造技術を含むMSTF(Multi-Scenario talking face dataset)を構築した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:34:59 GMT)
A Black-Box Evaluation Framework for Semantic Robustness in Bird's Eye View Detection [24.7] 我々は,BEVモデルを騙すために3つの一般的な意味摂動を逆向きに最適化するロバストネス評価フレームワークを開発する。
セマンティック摂動を最適化することで生じる課題に対処するため、mAPメトリックを置き換えるスムーズな距離に基づく代理関数を設計する。
最近の10種類のBEVモデルのセマンティックロバスト性に関するベンチマークを提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:53:38 GMT)
Information-Theoretic Generative Clustering of Documents [24.6] 文書の集合をクラスタリングするための生成クラスタリング(GC)を$mathrmX$で提示する。
大規模言語モデル(LLM)は確率分布を提供するため、2つの文書間の類似性を厳密に定義することができる。
我々はGCが最先端のパフォーマンスを達成し、従来のクラスタリング手法よりも大きなマージンで優れていることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:21:21 GMT)
Legend: Leveraging Representation Engineering to Annotate Safety Margin for Preference Datasets [24.3] 本稿では,利幅拡大された選好データセット開発を促進するための効果的で費用効率のよいフレームワークを提案する。
我々のフレームワークであるRegend, Leverages表現エンジニアリングは、好みのデータセットに注釈を付ける。
LLMに対する報酬モデリングと無害アライメントの両面での有効性を実験的に実証した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:22:31 GMT)
Differentiable Interacting Multiple Model Particle Filtering [24.3] 本研究では,パラメータ学習のための連続モンテカルロアルゴリズムを提案する。
我々は、微分可能な粒子フィルタリングの新たな枠組みを採用し、パラメータは勾配降下によって訓練される。
提案アルゴリズムの新たな理論的結果を確立し,従来の最先端アルゴリズムと比較して優れた数値性能を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:43:43 GMT)
Advancing Cross-domain Discriminability in Continual Learning of Vision-Language Models [24.2] RAILは回帰ベースのアダプタで、ドメインのシーケンスから非forgettingな方法で学習する。
VLMのゼロショット能力を参照データなしで未確認領域に保持する。
X-TAILと既存のマルチドメインタスクインクリメンタルラーニング設定の両方におけるRAILの最先端性能を確認する実験結果が得られた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:43:59 GMT)
XTSFormer: Cross-Temporal-Scale Transformer for Irregular-Time Event Prediction in Clinical Applications [23.9] 非安全ケアに関連する副作用は、米国での死因のトップ10に入る。
イベントデータは、連続するイベント間の時間間隔の不規則性、サイクルの存在、周期性、複数スケールのイベントインタラクション、長いイベントシーケンスに関連する高い計算コストなど、いくつかのユニークな課題を提起する。
本稿では,時間的不規則なイベントデータに特化して設計されたクロステンポラリスケールトランスフォーマー(XTSFormer)を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:31:28 GMT)
CRM: Retrieval Model with Controllable Condition [23.9] 制御可能な検索モデルでは,レグレッション情報を条件付き特徴として2tower検索パラダイムに統合する。
我々は,現実世界のA/Bテストを通じてCRMの有効性を検証するとともに,クアイショーショートビデオレコメンデーションシステムにおけるCRM導入の成功例を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:37:36 GMT)
Uncertainty separation via ensemble quantile regression [23.7] 本稿では,不確実性推定と分離のための新しい,スケーラブルなフレームワークを提案する。
我々のフレームワークは大規模データセットにスケーラブルであり、合成ベンチマークで優れた性能を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:15:32 GMT)
Transformers Can Navigate Mazes With Multi-Step Prediction [23.6] トランスフォーマーは、長期計画に苦しむシーケンスで次のトークンを予測するように訓練された。
標準の次のシングルトークン予測目標は、複数のステップを先に予測する明確なメカニズムを提供しない。
本研究は,トランスフォーマーの迷路ナビゲーションを改善するために,複数のステップ(および後方)を明示的に予測できるかどうかを検討する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:16:23 GMT)
Towards a Comprehensive, Efficient and Promptable Anatomic Structure Segmentation Model using 3D Whole-body CT Scans [23.6] Segment Any Model (SAM) は、自然画像のセグメンテーションに強い一般化能力を示す。
我々はCT-SAM3Dという全身CTセグメント化のための包括的でスケーラブルな3次元SAMモデルを提案する。
CT-SAM3Dは107体の解剖を含む1204個のCTスキャンによって訓練されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:51:53 GMT)
Temporally Consistent Object-Centric Learning by Contrasting Slots [23.2] ビデオオブジェクト中心モデルに対して、新しいオブジェクトレベルの時間的コントラスト損失を導入する。
本手法は学習対象中心表現の時間的一貫性を著しく向上させる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:46:04 GMT)
HeteroSample: Meta-path Guided Sampling for Heterogeneous Graph Representation Learning [23.2] HeteroSampleは、構造整合性、ノードおよびエッジタイプの分布、およびIoT関連グラフの意味パターンを保存するために設計された新しいサンプリング手法である。
HeteroSampleは最先端の手法より優れており、リンク予測やノード分類といったタスクで最大15%高いF1スコアを達成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:46:57 GMT)
Mesh Watermark Removal Attack and Mitigation: A Novel Perspective of Function Space [23.0] Mesh Watermarkは、シークレットメッセージを3Dメッシュに埋め込んで、ウォーターマークされたメッシュからメッセージをデコードして、オーナシップ検証を行う。
FuncEvadeは、透かしメッシュの符号付き距離関数からそれを抽出することで、透かしメッシュの異なる離散表現を生成する。
FuncMarkはメッセージ誘導変形によって符号付き距離関数を透かし、funcEvadeを緩和する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:23:19 GMT)
Federated Source-free Domain Adaptation for Classification: Weighted Cluster Aggregation for Unlabeled Data [23.0] Federated Source-Free Domain Adaptation TaskはFederated Source-Free Domain Adaptation (FFREEDA)として知られている。
私たちの貢献は、未ラベルのデータだけでドメインシフトとプライバシの問題を軽減するために設計された、重み付けクラスタアグリゲーション(FedWCA)メソッドによる新しいフェデレーション学習です。
FedWCAは、サーバ上でドメイン固有のグローバルモデルを取得するためのクライアントのプライベートおよびパラメータフリークラスタリング、クラスタ化されたクライアントのグローバルモデルの重み付け集約、擬似ラベル付きローカルドメイン適応の3つのフェーズから構成される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:47:54 GMT)
Neuro-Symbolic Embedding for Short and Effective Feature Selection via Autoregressive Generation [22.9] ニューロシンボリックレンズを用いて特徴選択を再構成し、短時間かつ効果的な特徴サブセットを特定することを目的とした新しい生成フレームワークを導入する。
本稿ではまず,特徴IDトークン,モデル性能,特徴サブセットの冗長度測定などからなる多数の特徴選択サンプルを自動的に収集するデータ収集手法を提案する。
収集したデータに基づいて,効率的な探索のために,特徴選択の知性を連続的な埋め込み空間に保存するエンコーダ・デコーダ・評価学習パラダイムを開発した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:32:06 GMT)
Magnifier: Detecting Network Access via Lightweight Traffic-based Fingerprints [22.9] 本稿では,モバイルデバイスネットワークアクセス検出のためのMagnifierを提案する。
Magnifierは、ゲートウェイレベルでバックボーントラフィックからアクセスパターンを受動的に推論する。
MagnifierのプロトタイプとNetCess2023データセットを公開しました。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:45:07 GMT)
Privacy-Preserving Cyberattack Detection in Blockchain-Based IoT Systems Using AI and Homomorphic Encryption [22.8] 本研究では,ブロックチェーンベースのIoT(Internet-of-Things)システムを対象とした,プライバシ保護型サイバー攻撃検出フレームワークを提案する。
このアプローチでは、人工知能(AI)による検出モジュールをブロックチェーンノードに戦略的にデプロイし、リアルタイム攻撃を特定する。
プライバシーを保護するため、データは送信前に同型暗号化(HE)を用いて暗号化される。
シミュレーションの結果,提案手法は学習時間を軽減できるだけでなく,暗号化のない手法とほぼ同一な検出精度を約0.01%で達成できることがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:46:53 GMT)
A Vision-Language Foundation Model to Enhance Efficiency of Chest X-ray Interpretation [22.8] 初期診断試験としての費用効果のため、毎年14億個の胸部X線(CXR)が実施されている。
この規模の放射線学研究は、CXRの解釈と文書を合理化する重要な機会を提供する。
我々は、視覚言語基礎モデル(CheXagent)をトレーニングするために、大規模データセット(CheXinstruct)を構築した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:56:18 GMT)
SARATR-X: Towards Building A Foundation Model for SAR Target Recognition [22.8] SAR ATRの基盤モデル構築に向けた最初の試みをSARATR-Xと呼ぶ。
SARATR-Xは、自己教師付き学習(SSL)を通じて一般化可能な表現を学び、汎用的なSARターゲット検出と分類タスクへのラベル効率のモデル適応のための基盤を提供する。
SARATR-Xは0.18Mの未ラベルのSARターゲットサンプルで訓練されており、これは同時代のベンチマークを組み合わせてキュレーションされ、これまでで最大の公開データセットとなっている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:11:06 GMT)
Scaling Laws for Pre-training Agents and World Models [22.7] エンボディエージェントの性能は、モデルパラメータ、データセットサイズ、計算量を増やして改善されている。
本稿では,これらの課題におけるスケールの役割を,より正確に評価する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:54:33 GMT)
Multi-Granularity Open Intent Classification via Adaptive Granular-Ball Decision Boundary [22.7] 適応的粒界決定境界(MOGB)を用いた多粒度オープン意図分類法を提案する。
提案手法は,表現学習と決定境界獲得という2つのモジュールから構成される。
これは適応的な粒球クラスタリングと最も近いセントロイド分類を反復的に交互に交互に行い、既知の意図クラス内の微細な意味構造をキャプチャする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:42:19 GMT)
A2RNet: Adversarial Attack Resilient Network for Robust Infrared and Visible Image Fusion [22.7] Infrared and visible image fusion (IVIF) は視覚能力を高める重要な技術である。
本稿では,textrmAtextrm2$RNetと呼ばれる新たな攻撃耐性ネットワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:51:45 GMT)
Bridge then Begin Anew: Generating Target-relevant Intermediate Model for Source-free Visual Emotion Adaptation [22.6] 視覚的感情認識(VER)は、人間の異なる視覚刺激に対する感情反応を理解することを目的としている。
ドメイン適応は、ラベル付きソースデータでトレーニングされたモデルをラベルなしターゲットデータに適応させることによって、代替ソリューションを提供する。
プライバシー上の懸念から、ソースの感情的なデータはアクセスできない可能性がある。
本稿では、ドメインブリッジモデル生成(DMG)とターゲットモデル適応(TMA)の2つのステップからなる新しいフレームワークであるBridge then Begin Anew(BBA)を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:51:35 GMT)
What makes a good metric? Evaluating automatic metrics for text-to-image consistency [22.5] テキストと画像の整合性を測定するために,最近よく使われている4つの手法の構成妥当性について検討する。
メトリクスには言語や視覚的特性に対する十分な感度が欠けていることが分かりました。
3つのVQAベースのメトリクスはすべて、よく知られたテキストショートカットに依存している可能性が高い。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:09:42 GMT)
ChainRank-DPO: Chain Rank Direct Preference Optimization for LLM Rankers [22.5] 大規模言語モデル(LLM)は、RangeGPTのような作品を通してテキストのランク付けにおいて顕著な効果を示している。
ランク付けのための微調整の監督は、これらのモデルの汎用能力を低下させる。
そこで本稿では,SFT-DPOパイプラインを用いたChain-of-Thoughtの導入により,これらの機能を維持しつつ,ランキング性能を向上する手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:24:15 GMT)
GNN-Transformer Cooperative Architecture for Trustworthy Graph Contrastive Learning [22.4] グラフ表現学習(GCL)は、グラフ表現学習の分野でホットな話題となっている。
本稿では,信頼できるグラフコントラスト学習のためのGNN変換器協調アーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:20:12 GMT)
Enabling Realtime Reinforcement Learning at Scale with Staggered Asynchronous Inference [22.1] エージェントがアクション推論と学習を行う場合であっても、リアルタイム環境は変化する。
機械学習の最近の進歩は、推論時間が長いより大きなニューラルネットワークを含んでいる。
実時間強化学習における後悔に対する低い限界について分析する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:43:40 GMT)
Standardizing Generative Face Video Compression using Supplemental Enhancement Information [22.0] 本稿では,補助強調情報(SEI)を用いたGFVC(Generative Face Video Compression)アプローチを提案する。
執筆時点では,SEI メッセージを用いたGFVC アプローチが Versatile Supplemental Enhancement Information (VSEI) 規格の公式作業ドラフトに採用されている。
著者の知識を最大限活用するために、JVETが提案したSEIベースのGFVCアプローチは、生成ビデオ圧縮のための最初の標準化活動である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:08:47 GMT)
Dynamic Adapter with Semantics Disentangling for Cross-lingual Cross-modal Retrieval [22.0] 言語間のクロスモーダル検索は、視覚と低リソース言語(ターゲット言語)を人間ラベルのターゲット言語データを用いることなく調整することを目的としている。
入力キャプションの特性に基づいてパラメータを動的に生成するDASD(Dynamic Adapter with Semantics Disentangling)を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:19:09 GMT)
Exploring Gradient Subspaces: Addressing and Overcoming LoRA's Limitations in Federated Fine-Tuning of Large Language Models [22.0] 本稿ではLow-Rank Adaptation (LoRA)を用いたFLフレームワークの収束と性能保証を批判的に分析する。
直接重み付けはLoRAベースの戦略よりも優れており、微調整モデルでは優れた性能が得られることを示す。
以上の結果から,直接重み付けと併用したGaLoreの方が,FlexLoRAやFFA-LoRAといったフェデレートされたLoRA法よりも,テキストや画像のモダリティが優れていることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:10:10 GMT)
No Annotations for Object Detection in Art through Stable Diffusion [21.8] 絵画における物体検出に拡散モデルによる知識を活用できるパイプラインであるNAD(No Annotation for Detection in Art)を,フルバウンディングボックスの監督を必要とせずに提示する。
本手法は,弱教師付きシナリオとゼロショットシナリオの両方をサポートし,事前訓練されたコンポーネントの微調整は不要である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:44:01 GMT)
TimeCMA: Towards LLM-Empowered Multivariate Time Series Forecasting via Cross-Modality Alignment [21.7] TimeCMAは、時系列予測のための直感的で効果的なフレームワークである。
8つの実際のデータセットに対する大規模な実験は、TimeCMAが最先端のデータセットを上回っていることを示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:01:32 GMT)
Graph-Driven Models for Gas Mixture Identification and Concentration Estimation on Heterogeneous Sensor Array Signals [21.7] 本研究では、時間グラフ構造を統合した2つの新しいディープラーニングモデルを構築し、性能を向上させる。
GraphCapsNetとGraphANetはどちらも高い精度と安定性を示し、産業環境でのスケーラブルなガス分析のための有望なソリューションとして位置づけている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:32:30 GMT)
GALOT: Generative Active Learning via Optimizable Zero-shot Text-to-image Generation [21.3] 本稿では,ゼロショットテキスト・トゥ・イメージ(T2I)合成とアクティブラーニングを統合した。
我々はAL基準を利用してテキスト入力を最適化し、より情報的で多様なデータサンプルを生成する。
このアプローチは、モデルトレーニングの効率を高めながら、データ収集とアノテーションのコストを削減します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:40:21 GMT)
Humor in AI: Massive Scale Crowd-Sourced Preferences and Benchmarks for Cartoon Captioning [20.9] 本稿では,220万以上のキャプションに2億5000万以上の人間格付けを含む,創造的なタスクのための新しいマルチモーダル選好データセットを提案する。
我々は,GPT4と人的判断の両方を用いて,モデル生成キャプションの品質を判定するための新しいベンチマークを提案する。
この広範なデータ収集の取り組みを締めくくると、私たちは研究コミュニティに選好データセット全体を公開します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:21:24 GMT)
A Deployed Online Reinforcement Learning Algorithm In An Oral Health Clinical Trial [20.9] 歯科疾患は、実質的な財政的負担、個人的苦痛、全身疾患のリスクの増加を伴う慢性疾患である。
毎日2回歯磨きを推奨しているにもかかわらず、忘れやすさや解離などの要因により、推奨された口腔セルフケア行動への固執は依然として最適ではない。
歯科疾患のリスクを負う医療従事者の予防ケアを補完する医療介入システムOralyticsを開発した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:01:54 GMT)
Distributionally robust risk evaluation with an isotonic constraint [20.7] 分布的に堅牢な学習は、不確実な分布の集合内で最悪のケースの統計性能を制御することを目的としている。
本稿では,未知のターゲット分布が推定値と異なる方法に関する事前情報を組み込んだDRLの形状制約手法を提案する。
合成データと実データの両方に関する実証研究は、提案した形状制約手法の精度の向上を実証している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:16:42 GMT)
VQTalker: Towards Multilingual Talking Avatars through Facial Motion Tokenization [20.7] VQTalkerは、ベクトル量子化に基づく多言語音声ヘッド生成フレームワークである。
我々のアプローチは、人間の発話は有限個の異なる音の単位からなるという音素原理に基づいている。
VQTalkerは、ビデオ駆動と音声駆動の両方のシナリオで最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:12:49 GMT)
Federated t-SNE and UMAP for Distributed Data Visualization [20.6] ビッグデータは、複数のデータセンタに分散して、セキュリティやプライバシの懸念にさらされることが多い。
この研究は、クライアント間でデータを交換したり、中央サーバにデータを送信したりすることなく、高次元のデータ可視化を提供するFed-tSNEとFed-UMAPを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:33:11 GMT)
ECG-Byte: A Tokenizer for End-to-End Generative Electrocardiogram Language Modeling [20.5] ECG-Byteは、ECGの自動回帰言語モデリングのためのトークン化パイプラインである。
ECG信号をトークンに圧縮してエンコードし、エンドツーエンドの大規模言語モデルのトレーニングを可能にする。
NLGタスクの競合性能は,2段階のアプローチで要求されるデータの半分と48%に過ぎません。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:13:21 GMT)
A2H: A UI Converter from Android to HarmonyOS Platform [20.3] A2H Converterは,AndroidユーザインターフェースをHarmonyOSに移行する自動化ツールである。
A2H Converterは、コンポーネント、ページ、プロジェクトレベルでそれぞれ90.1%、89.3%、89.2%以上のマイグレーション成功率を達成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:33:55 GMT)
FarExStance: Explainable Stance Detection for Farsi [20.1] Farsiで説明可能なスタンス検出のための新しいデータセットであるFarExStanceを紹介する。
姿勢検出では、最も正確なモデルは微調整されたRoBERTaモデルとClaude-3.5-Sonnetである。
説明の質について,我々の自動評価基準は,GPT-4oが最も一貫性のある説明を生成することを示唆している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:24:20 GMT)
Interpreting and Analysing CLIP's Zero-Shot Image Classification via Mutual Knowledge [20.1] Contrastive Language-Image Pretraining (CLIP)は画像とテキストのクラス表現を共有埋め込み空間にマッピングすることでゼロショット画像分類を行う。
この研究は、2つのモード間の相互知識のレンズから、画像分類のためのCLIPモデルを解釈するための新しいアプローチを提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:01:44 GMT)
MambaLCT: Boosting Tracking via Long-term Context State Space Model [19.9] 本研究では,第1フレームから第1フレームから第2フレームへの目標変動キューの構築と利用を行い,ロバストなトラッキングを実現するMambaLCTを提案する。
MambaLCTは、リアルタイム実行速度を維持しながら、6つのベンチマークで新しいSOTA性能を達成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:53:52 GMT)
Mix-LN: Unleashing the Power of Deeper Layers by Combining Pre-LN and Post-LN [19.8] Mix-LNは、Pre-LNとPost-LNの強度を同じモデルで組み合わせた新しい正規化手法である。
70Mから7Bまでの様々なモデルサイズの実験では、Mix-LNはPre-LNとPost-LNの両方で一貫して優れていた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:39:53 GMT)
Covariances for Free: Exploiting Mean Distributions for Federated Learning with Pre-Trained Models [19.7] 最近の研究は、サーバにおけるローカルクライアントデータの分布を集約するために、一階統計と二階統計の利用を調査している。
クラス共分散行列の非バイアス推定器に基づく学習自由度推定法を提案する。
クラス形式で一階統計のみを使用する手法は,クライアントがサーバに通信する手段であり,二階統計を通信する手法によって要求される通信コストのごく一部しか発生しない。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:40:14 GMT)
ZipAR: Accelerating Auto-regressive Image Generation through Spatial Locality [19.5] ZipARは、自動回帰(AR)ビジュアル生成のためのトレーニング不要でプラグ&プレイの並列デコーディングフレームワークである。
ZipARは、追加の再トレーニングを必要とせずに、Emu3-Genモデルでモデル転送回数を最大91%削減できる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:28:52 GMT)
Choice Between Partial Trajectories: Disentangling Goals from Beliefs [19.4] AIエージェントは人間の選択データから好みを学ぶことが示唆されている。
このアプローチでは、エージェントがデータを解釈するために使用できる選択行動のモデルが必要です。
我々は、ブートストラップされた戻り値に基づく代替モデルを検討し、将来の戻り値の推定を部分的な戻り値に追加する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:18:53 GMT)
Projected gradient methods for nonconvex and stochastic optimization: new complexities and auto-conditioned stepsizes [19.4] 凸コンパクト集合上の滑らかだが必ずしも凸関数を最小化するための射影勾配法(PG法)のクラスを提案する。
提案手法は,まず「ベニラ」PG法を新たに解析し,近似定常点を求めるのに最もよく知られたイテレーションの複雑さを実現する。
次に、リプシッツ定数の入力を必要とせず、同じ反復複雑性を実現する「自己条件付き」射影勾配(AC-PG)多様体を開発する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:34:16 GMT)
FFHFlow: A Flow-based Variational Approach for Learning Diverse Dexterous Grasps with Shape-Aware Introspection [19.3] マルチフィンガーハンドの多様なグリップを生成できる新しいモデルを提案する。
提案手法は, 高いベースラインに対する性能向上と実行時の効率向上を実現する。
また,現実世界の雑多な作業空間や密集した作業空間において,より多様性の高いオブジェクトを把握できることのメリットも示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:07:47 GMT)
HeatFormer: A Neural Optimizer for Multiview Human Mesh Recovery [19.2] 本稿では,複数の静的なビューをフル活用可能な,人間の形状とポーズの復元手法を提案する。
マルチビュー画像のSMPLパラメータを反復的に洗練するニューラルパラメータであるHeatFormerでこれを実現する。
HeatFormerは、このSMPL推定を、新しいトランスフォーマーエンコーダとデコーダとのアライメントとして実現している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:54:25 GMT)
AniSora: Exploring the Frontiers of Animation Video Generation in the Sora Era [19.2] 本稿では,アニメーション映像生成のための総合システムAniSoraを提案する。
1000万以上の高品質なデータでデータ処理パイプラインがサポートしています。
また,様々なアニメーションビデオの評価ベンチマークも収集した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:53:33 GMT)
When Should We Prefer State-to-Visual DAgger Over Visual Reinforcement Learning? [19.1] 本研究では、2段階のフレームワークであるState-to-Visual DAggerと、視覚的ポリシーを学ぶためにオンライン模倣を採用する前に状態ポリシーを訓練するVisual RLを実証的に比較する。
驚いたことに、ステート・ツー・ビジュアルのDAggerは、Visual RLを普遍的に上回るものではなく、より一貫したパフォーマンスを提供する、挑戦的なタスクにおいて大きなアドバンテージを示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:39:12 GMT)
FDS: Feedback-guided Domain Synthesis with Multi-Source Conditional Diffusion Models for Domain Generalization [19.0] ドメイン一般化技術は、トレーニング中に新しいデータ分布をシミュレートすることで、モデルロバスト性を高めることを目的としている。
本稿では、拡散モデルを用いて新しい擬似ドメインを合成するFDS、フィードバック誘導ドメイン合成法を提案する。
本手法は, 領域一般化性能のベンチマークを, 様々な課題のあるデータセットに分けて設定することを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:31:45 GMT)
Communication-Efficient Personalized Federal Graph Learning via Low-Rank Decomposition [19.0] 通信効率の高いグラフ学習アルゴリズムであるCEFGLを提案する。
提案手法は,モデルパラメータを低ランクなジェネリックモデルとスパースなプライベートモデルに分解する。
局所的な知識をパーソナライズされた方法で学習するために,デュアルチャネルエンコーダを用いる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:26:07 GMT)
Photoacoustic Iterative Optimization Algorithm with Shape Prior Regularization [19.0] 光音響イメージング(PAI)は、再構成された結果の品質を低下させる固有の限界に悩まされる。
本稿では,2次元と3次元のPAI再構成結果に対する新たな最適化手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:26:03 GMT)
Large Language Model Federated Learning with Blockchain and Unlearning for Cross-Organizational Collaboration [18.8] 大規模言語モデル(LLM)は、コンピュータが人間の言語を理解し、処理する方法を変えてきたが、それらを様々な組織で効果的に利用することは難しいままである。
パブリックとプライベートのブロックチェーンアーキテクチャとマルチエージェント強化学習を組み合わせた,ハイブリッドブロックチェーンベースのフェデレーション学習フレームワークを提案する。
当社のフレームワークは,プライベートチェーンの機密計算を保護しながら,パブリックブロックチェーンを通じてモデル更新の透過的な共有を可能にする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:56:09 GMT)
Crabs: Consuming Resrouce via Auto-generation for LLM-DoS Attack under Black-box Settings [18.6] LLM-DoS攻撃のための自動生成(Auto-Generation for LLM-DoS Attack)と呼ばれるブラックボックスLLM向けに設計された自動アルゴリズムを提案する。
提案手法は,プロンプトノードのセマンティック改善により,既存の防御を回避し,ステルスネスを向上することができる。
実験の結果、AutoDoSはサービスレスポンスのレイテンシを250ドル以上アップローで増幅し、リソース消費が激化することが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:19:23 GMT)
RAG-RewardBench: Benchmarking Reward Models in Retrieval Augmented Generation for Preference Alignment [18.5] RAG設定におけるRM評価のための最初のベンチマークであるRAG-RewardBenchを提案する。
まず、RMを評価するために、RAG固有の4つの決定的かつ挑戦的なシナリオを設計する。
次に、データソースの多様性を高めるために、18個のRAGサブセット、6個のレトリバー、24個のALMを組み込んだ。
最後に、LLM-as-a-judgeアプローチを採用し、好みのアノテーション効率と有効性を改善する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:28:05 GMT)
Unsupervised UAV 3D Trajectories Estimation with Sparse Point Clouds [18.5] 本稿では,時空間シーケンス処理を用いたコスト効率,教師なしUAV検出手法を提案する。
CVPR 2024 UG2+ Challengeの4位にランクインした。
我々は、研究コミュニティ.com/lianghanfang/UnLiDAR-UAV-Estのすべての設計、コード、サンプルデータをオープンソース化する予定です。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:42:07 GMT)
Emergence of Abstractions: Concept Encoding and Decoding Mechanism for In-Context Learning in Transformers [18.1] 自己回帰変換器は文脈内学習(ICL)を通して適応学習を示す
変換器の表現において内部抽象をどう形成し、どのように利用するかを研究することにより、ICLを説明するための符号化・復号機構を提案する。
私たちの経験的洞察は、その表現を通じて、大きな言語モデルの成功と失敗モードの理解を深めました。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:02:03 GMT)
I0T: Embedding Standardization Method Towards Zero Modality Gap [18.0] Contrastive Language-Image Pretraining (CLIP)は、画像テキスト検索や分類などの下流タスクにおけるゼロショット推論を可能にする。
CLIPを拡張する最近の作業は、モダリティギャップの問題に悩まされている。
本稿では,モダリティギャップに対処する2つの手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:35:01 GMT)
Explanations that reveal all through the definition of encoding [18.0] 我々は、条件依存によってこの余分な予測力を識別する符号化の定義を開発する。
既存のスコアは、上述のエンコード説明をランク付けしないことを証明し、それらを正しくランク付けするSTRIPE-Xを開発する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:18:45 GMT)
Threshold Neuron: A Brain-inspired Artificial Neuron for Efficient On-device Inference [18.0] 本稿では,新しい人工ニューロンモデルThreshold Neuronsを提案する。
従来の人工ニューロンと同様のニューラルネットワークを構築しながら,ハードウェア実装の複雑さを大幅に低減する。
本研究では,Threshold Neuronsを用いたニューラルネットワークの有効性を検証し,カーネルレベルでは7.51倍から8.19倍の省電力を実現し,カーネルレベルでは3.89倍から4.33倍の省電力を実現した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:42:43 GMT)
Clio: Privacy-Preserving Insights into Real-World AI Use [17.8] Clioは、AIアシスタント自身を使用して、数百万の会話で集約された使用パターンを分析し、サーフェスするプライバシー保護プラットフォームです。
まず、100万のClaude.ai FreeとProの会話から、モデルがどのように現実世界で使われているかについての洞察を共有します。
第2に、システムを悪用しようとする協調的な試みを特定することで、システムの安全性を高めるためにClioを使用します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:05:43 GMT)
QCS:Feature Refining from Quadruplet Cross Similarity for Facial Expression Recognition [17.8] 画像ペアからよりリッチな固有情報をマイニングするために、Cross similarity Attentionを導入する。
我々は、勾配競合を緩和する4分岐中央対称ネットワーク、Quadruplet Cross similarity (QCS) を設計する。
提案手法は,複数のFERデータセット上での最先端性能を実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:51:39 GMT)
Indirect Query Bayesian Optimization with Integrated Feedback [17.7] 我々は,未知関数の条件付き期待値$f$を最適化することで,統合されたフィードバックが与えられるような,ベイズ最適化の新たなクラスを開発する。
目的は、条件分布によって変換された空間を適応的にクエリし、観察することで、$f$のグローバルな最適値を見つけることである。
これは、プライバシ、ハードウェア、計算上の制約による直接的なフィードバックにアクセスできない現実世界のアプリケーションによって動機付けられている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:20:33 GMT)
Mastering AI: Big Data, Deep Learning, and the Evolution of Large Language Models -- AutoML from Basics to State-of-the-Art Techniques [17.6] 論文は、初心者と経験豊富な実践者の両方を支援するために構築されており、人気のあるAutoMLツールに関する詳細な議論がある。
この研究は、AIと機械学習の分野での継続的な研究と開発に貢献することが期待されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:10:58 GMT)
Deep Learning and Machine Learning -- Object Detection and Semantic Segmentation: From Theory to Applications [17.6] オブジェクト検出とセマンティックセグメンテーションの詳細な探索を行う。
機械学習とディープラーニングの最先端を概観する。
ビッグデータ処理の解析について述べる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:13:44 GMT)
Augmenting Sequential Recommendation with Balanced Relevance and Diversity [17.5] 本稿では、関連性と多様性のバランスをとるデータを生成するために、BASRec(Balanced Data Augmentation for Sequential Recommendation)を提案する。
BASRecはSingle-Sequence AugmentationとCross-Sequence Augmentationの2つのモジュールで構成されている。
我々は,BASRecが既存の手法よりも妥当性と多様性のバランスのよいデータを生成することを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:21:48 GMT)
Careful Seeding for k-Medois Clustering with Incremental k-Means++ Initialization [17.5] K-medoidsクラスタリングはk-meansクラスタリングの一般的な変種であり、パターン認識や機械学習で広く使用されている。
INCKMアルゴリズムと呼ばれる改良されたk-medoidsクラスタリングアルゴリズムが最近提案され、この欠点を克服した。
インクリメンタルk-means++ (INCKPP) アルゴリズムと呼ばれる新しいk-medoidsクラスタリングアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:00:59 GMT)
Unsupervised Robust Cross-Lingual Entity Alignment via Neighbor Triple Matching with Entity and Relation Texts [17.5] 言語間エンティティアライメント(EA)は、異なる言語間での複数の知識グラフ(KG)の統合を可能にする。
近隣の3重マッチング戦略により、エンティティレベルとリレーレベルアライメントを共同で実行するEAパイプライン。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:36:29 GMT)
Data sharing in the metaverse with key abuse resistance based on decentralized CP-ABE [17.5] ciphertext-policy-based encryption (CP-ABE)は、機密性と詳細なアクセス制御を提供するための有望なプリミティブである。
CP-ABEの鍵機密性と権限説明責任を同時に検討する研究はほとんどない。
データ共有への正直な参加を促すためのオープンインセンティブ機構を導入する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:06:56 GMT)
Pruning Large Language Models with Semi-Structural Adaptive Sparse Training [17.4] Adaptive Sparse Trainer (AST)は、半構造化スパースモデルに適した、新規で効率的なリトレーニングフレームワークである。
ASTは、密度と2:4の半構造化スパースモデルのパープレキシティとゼロショット精度のギャップをそれぞれ0.6と1.16%に削減する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:14:33 GMT)
GAGS: Granularity-Aware Feature Distillation for Language Gaussian Splatting [17.4] 近年,空間内の物体の複雑な意味的特性を正確に知覚する3次元オープン語彙シーン理解が注目されている。
GAGSは2次元CLIP機能を3次元ガウススプラッティングに蒸留し,任意の視点でレンダリングを行うためのオープン語彙クエリを実現するフレームワークである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:33:20 GMT)
ManipGPT: Is Affordance Segmentation by Large Vision Models Enough for Articulated Object Manipulation? [17.4] 本稿では,調音対象の最適相互作用領域を予測するためのフレームワークであるManipGPTを紹介する。
我々は、シミュレートされた9.9kの画像と実際の画像のデータセットを作成し、シミュレートとリアルのギャップを埋めた。
我々は,ロボット操作のシナリオに対して,モデルのコンテキスト内セグメンテーション機能を適用することにより,部分レベルの割当セグメンテーションを大幅に改善した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:08:26 GMT)
Policy Decorator: Model-Agnostic Online Refinement for Large Policy Model [17.3] 本稿では,オフラインで学習した模倣学習モデルの改良を,オンラインと環境とのインタラクションを通じて検討する。
モデルに依存しない残留ポリシーを用いて、オンラインインタラクション中に大規模な模倣学習モデルを洗練するポリシデコレータを導入する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:06:16 GMT)
Towards a Dynamic Future with Adaptable Computing and Network Convergence (ACNC) [17.2] 本稿では,コンピュータとネットワークリソースの協調オーケストレーションを目的とした自律機械学習(ML)支援機構として,適応型CNC(ACNC)の概念を提案する。
ACNCは、状態認識とコンテキスト検出の2つの主要な機能を含んでいる。
継続的学習が採用され、システムの状態を専用のMLエージェントによって制御されたコンテキストに分類することで、効率的に運用することができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:54:46 GMT)
Rethinking Multi-domain Generalization with A General Learning Objective [17.2] マルチドメイン一般化(mDG)は、トレーニングとテストディストリビューションの相違を最小限にすることを目的としている。
既存のmDG文献には、一般的な学習目標パラダイムが欠けている。
制約緩和に$Y$-mappingを活用することを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:55:31 GMT)
When LLMs Play the Telephone Game: Cumulative Changes and Attractors in Iterated Cultural Transmissions [17.1] 大規模言語モデル(LLM)は相互に相互作用し、オンラインで大量のテキストを生成する。
単一の出力レベルで無視される小さなバイアスは、反復的なインタラクションで増幅されるリスクである。
テキスト毒性, 肯定性, 難易度, および伝達鎖間の長さの進化を追跡することにより, バイアスやアトラクタの存在を明らかにする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:02:14 GMT)
Generating Diverse Hypotheses for Inductive Reasoning [17.0] そこで我々は,Mixture of Concepts (MoC) と呼ばれる,人間の帰納的推論にインスパイアされた新しいアプローチを提案する。
MoCは、標準IIDサンプリングや他のアプローチと比較して、大幅な性能向上を示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:38:09 GMT)
Prompt Compression with Context-Aware Sentence Encoding for Fast and Improved LLM Inference [16.8] 文レベルのプロンプト圧縮技術である文脈対応プロンプト圧縮(CPC)を提案する。
鍵となる革新は、与えられた質問に対する各文の関連スコアを提供する新しい文脈対応の文エンコーダである。
提案手法は,ベンチマークデータセットの高速圧縮に関する先行研究をかなり上回っている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:04:46 GMT)
RAZOR: Sharpening Knowledge by Cutting Bias with Unsupervised Text Rewriting [16.6] 手動で構築されたデータセットで一般的なバイアスは、トークンとラベルの間に急激な相関をもたらす可能性がある。
既存のデバイアス法は、しばしば特定のデータセットバイアスに関する事前の知識に依存している。
本稿では,ショートカット緩和のためのテキスト書き直しに基づく,新規で教師なし,データ重視のデバイアス処理手法であるRAZORを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:54:30 GMT)
AdaCQR: Enhancing Query Reformulation for Conversational Search via Sparse and Dense Retrieval Alignment [16.6] 本稿では,対話型検索再構成のための新しいフレームワークAdaCQRを提案する。
AdaCQRは、情報検索クエリの一般化性を向上させる。
TopiOCQAデータセットとQReCCデータセットの実験的評価は、AdaCQRが既存の手法よりも大幅に優れていることを示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:46:41 GMT)
Cross-Species and Cross-Modality Epileptic Seizure Detection via Multi-Space Alignment [16.4] てんかんは世界の健康に大きく影響し、世界中の約6500万人と様々な動物種に影響を与えている。
そこで本研究では,多空間アライメント手法を多種間および多次元脳波(EEG)データに基づいて提案し,てんかん発作の検出能力と理解を向上する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:25:07 GMT)
Transformer Layers as Painters [16.4] 事前学習したトランスの下位層と最終層は中間層と異なるが,中間層は驚くほど均一であることを示す。
また、いくつかの問題のクラスは、レイヤのスキップ、レイヤのトレーニング方法と異なる順序での実行、レイヤの並列実行に対して堅牢性が必要であることも示しています。
我々の観察では、凍結した事前学習モデルでさえ、レイヤをスキップしたり、並列にレイヤを走らせることで、遅延の正確さを優雅に交換できる可能性が示唆されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:17:44 GMT)
Asymptotic Normality of Log Likelihood Ratio and Fundamental Limit of the Weak Detection for Spiked Wigner Matrices [16.4] ランクワンスパイクされたウィグナーモデルにおける信号の存在を検出する問題を考える。
一般の非ガウス雑音に対して、信号対雑音比が一定の閾値以下であるとき、対数準比がガウスに収束することが証明される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:53:06 GMT)
Channel Merging: Preserving Specialization for Merged Experts [16.1] 本稿では,パラメータ競合を最小限に抑えつつ,ストレージ効率を向上する新しい戦略であるChannel Mergingを紹介する。
我々の実験は、Channel Mergingが、英語や中国語の推論、数学的推論、コード生成といったタスクにおいて、未マージされたモデルに一致して、常に高いパフォーマンスを提供することを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:07:44 GMT)
G-VEval: A Versatile Metric for Evaluating Image and Video Captions Using GPT-4o [15.9] G-VEvalはG-Evalにインスパイアされた新しい測度であり、新しい GPT-4o で駆動される。
G-VEvalは、大規模なマルチモーダルモデルでチェーン・オブ・シント推論を使用しており、参照フリー、参照オンリー、組み合わせの3つのモードをサポートしている。
また,ビデオキャプション評価のための新しいデータセットであるMSVD-Evalを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:23:12 GMT)
Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference [15.9] ModernBERTを導入し、エンコーダのみのモデルにモダンなモデル最適化をもたらす。
ModernBERTモデルは、大規模な評価のプールに最先端の結果を示す。
ModernBERTは、最も高速かつメモリ効率の良いエンコーダでもある。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:39:44 GMT)
LoRA-Guard: Parameter-Efficient Guardrail Adaptation for Content Moderation of Large Language Models [15.9] 大規模言語モデル(LLM)のコンテンツモデレーションのための安全アライメントの代替としてガードレールが登場した。
LLMとガードレールモデル間の知識共有に依存するパラメータ効率の高いガードレール適応法であるLoRA-Guardを導入する。
LoRA-Guardは100-1000倍のパラメータオーバヘッドで既存の手法より優れ、精度を保ちながらオンデバイスコンテンツのモデレーションを実現している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:07:28 GMT)
Denoising Nearest Neighbor Graph via Continuous CRF for Visual Re-ranking without Fine-tuning [15.9] 連続条件ランダム場(C-CRF)に基づく相補的復調法を提案する。
本手法の相補性を3つの視覚的再分類法に適用して示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:16:40 GMT)
Causal Bayesian Optimization via Exogenous Distribution Learning [15.8] 既存の因果ベイズ最適化(CBO)法は、報酬を最大化するために因果構造を変更するハード介入に依存する。
学習内因性分布を利用した新しいCBO法を開発した。
異なるデータセットとアプリケーションの実験により,提案手法の利点が示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:17:10 GMT)
FlexPose: Pose Distribution Adaptation with Limited Guidance [15.8] 本稿では,事前学習したポーズ生成器を,新しいポーズ分布に従って適応したポーズに調整する手法を提案する。
提案手法を定性的に,定量的に評価した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:18:11 GMT)
Maybe you are looking for CroQS: Cross-modal Query Suggestion for Text-to-Image Retrieval [15.8] この研究は、コレクションの視覚的に一貫したサブセットを探索するために必要な最小限のテキスト修正を提案することに焦点を当てた、新しいタスクを導入している。
提案手法の評価と開発を容易にするため,CroQSというベンチマークを試作した。
画像キャプションやコンテンツ要約などの関連分野からのベースライン手法をこのタスクに適用し、基準性能スコアを提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:24:09 GMT)
Bridging the User-side Knowledge Gap in Knowledge-aware Recommendations with Large Language Models [15.4] 大規模言語モデル(LLM)は、人間の行動理解と広範囲な現実世界の知識を活用することによってギャップを埋める可能性を提供する。
本稿では,LLMに基づくユーザ側知識推論手法と,慎重に設計した推薦フレームワークを提案する。
提案手法は,特に疎結合なユーザに対して,競合するベースラインと比較して最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:43:56 GMT)
PixelMan: Consistent Object Editing with Diffusion Models via Pixel Manipulation and Generation [15.3] PixelManは、Pixel操作と生成を通じて一貫したオブジェクト編集を実現するための、インバージョンフリーでトレーニング不要な方法である。
数16の推論ステップにおいて、PixelManは最先端のトレーニングベースおよびトレーニングフリーメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:24:15 GMT)
Fed-AugMix: Balancing Privacy and Utility via Data Augmentation [15.3] 緩やかな漏洩攻撃は、連合学習のプライバシー保証に重大な脅威をもたらす。
本稿では,プライバシ・ユーティリティのトレードオフを実現するために,新たなデータ拡張ベースのフレームワークを提案する。
我々のフレームワークは、AugMixアルゴリズムをクライアントレベルで組み込んで、制御可能な重大度でデータ拡張を可能にする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:05:55 GMT)
Look Inside for More: Internal Spatial Modality Perception for 3D Anomaly Detection [15.2] 内部的空間的モダリティ知覚(ISMP)は、内部的な視点から特徴表現を十分に探求するために提案される。
本手法は,Real3D-ADベンチマークを用いて,オブジェクトレベルのAUROCと画素レベルのAUROCをそれぞれ4.2%,13.1%改善する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:14:11 GMT)
Curriculum Learning for Cross-Lingual Data-to-Text Generation With Noisy Data [15.2] 本稿では,言語間データ・テキスト生成システムの性能向上に有効な複数の基準を示す。
BLEUスコアは最大4ポイント向上し、11のインド語と2つのデータセットで平均5~15%向上した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:00:18 GMT)
A Survey on LLM Inference-Time Self-Improvement [15.0] 近年,テスト時の計算量の増加による推論向上技術が注目されている。
本稿では,最近の研究を包括的にレビューし,詳細な分類学に貢献し,課題と限界について議論する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:37:07 GMT)
A Computationally Grounded Framework for Cognitive Attitudes (extended version) [14.9] 本稿では, エージェントの認知的態度を認知型と動機型の両方で推論するための新しい言語を紹介した。
私たちの言語には、暗黙の信念、完全な魅力、完全な反発、現実的な魅力、現実的な反発のための5種類のモーダル演算子が含まれています。
本稿では,信念変化操作の効果の推論を支援する言語の拡張について述べる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:17:07 GMT)
Analyzing (In)Abilities of SAEs via Formal Languages [14.7] 正規言語の合成テストベッド上でスパースオートエンコーダを訓練する。
パフォーマンスは、トレーニングパイプラインの帰納バイアスに敏感です。
我々は、因果関係がSAEトレーニングの中心的標的となる必要があると論じる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:13:46 GMT)
Refining Salience-Aware Sparse Fine-Tuning Strategies for Language Models [14.7] SPEFT(Sparsity-based PEFT)は、モデルの重み行列にトレーニング可能なスパース適応を導入する。
我々は、ゼロコストNASプロキシにインスパイアされたSPEFTのサリエンス指標を初めて体系的に評価した。
我々の研究は、PEFTに複雑性が不可欠であるという考えに挑戦する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:14:35 GMT)
PASCO (PArallel Structured COarsening): an overlay to speed up graph clustering algorithms [14.6] グラフのクラスタリングノードは、グラフ解析の土台である。
いくつかの一般的な方法は、非常に大きなグラフには適さない。
この研究は、クラスタリングアルゴリズムを高速化するオーバーレイであるPASCOを導入している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:15:55 GMT)
2M-BELEBELE: Highly Multilingual Speech and American Sign Language Comprehension Dataset [14.5] BELEBELEを拡張することで、最初の多言語音声とアメリカ手話(ASL)理解データセットを導入する。
我々のデータセットは、BELEBELEとFLEURSの交差点にある74の言語と、1つの手話(ASL)をカバーしている。
2M-BELEBELEデータセットを5ショット設定と0ショット設定の両方で評価し, 音声理解の精度は読解よりも平均2-3%低かった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:56:19 GMT)
GraphAvatar: Compact Head Avatars with GNN-Generated 3D Gaussians [14.4] 本稿では,Graph Neural Networks (GNN) を用いて頭部アバターの3次元ガウス生成を行う GraphAvatar 手法を提案する。
提案手法では3次元ガウスモデルの代わりにGNNモデルを格納することができ,ストレージオーバーヘッドを10MBに抑えることができる。
我々は、GraphAvatarの利点を実証するための総合的な実験を行い、既存の視覚的忠実度とストレージ消費の手法を超越した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:05:40 GMT)
Rehearsal-Free Continual Federated Learning with Synergistic Regularization [14.3] 連続的フェデレートラーニング(Continuous Federated Learning, CFL)は、分散デバイスがトレーニングデータを継続的にシフトすることで、新しい概念を協調的に学習することを可能にする。
我々は、CFLのシナプスインテリジェンスを不均一なデータ設定で調整するFedSSIという、単純かつ効果的なCFLの正規化アルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:16:41 GMT)
Audio-Infused Automatic Image Colorization by Exploiting Audio Scene Semantics [14.2] 本論文は,同一シーンに関する付加的な意味情報を含む対応する音声を活用しようとするものである。
実験により、音声誘導は自動着色性能を効果的に向上できることが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:43:40 GMT)
LLMSA: A Compositional Neuro-Symbolic Approach to Compilation-free and Customizable Static Analysis [14.0] 幻覚を減らしたコンパイル不要でカスタマイズ可能な静的解析のための合成ニューロシンボリックアプローチを提案する。
66.27%の精度と78.57%のリコールで、F1の工業的アプローチを0.20ポイント上回っている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:14:59 GMT)
Language-guided Medical Image Segmentation with Target-informed Multi-level Contrastive Alignments [13.9] ターゲット型マルチレベルコントラストアライメント(TMCA)を用いた言語誘導セグメンテーションネットワークを提案する。
TMCAは、言語誘導セグメンテーションにおけるパターンギャップを橋渡しするために、ターゲット・インフォームド・クロスモダリティアライメントときめ細かいテキストガイダンスを可能にする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:19:03 GMT)
Noise-Augmented $\ell_0$ Regularization of Tensor Regression with Tucker Decomposition [13.9] テンソル予測器を用いた低ランク分解に基づく回帰法はテンソル予測器の構造情報を利用する。
テンソル回帰のパラメータを正規化するNA$$CT$2$という手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:00:19 GMT)
Extreme Multi-label Completion for Semantic Document Labelling with Taxonomy-Aware Parallel Learning [13.8] Extreme Multi Label Completion (XMLCo) では、文書の集合の欠落したラベルを予測することが目的である。
本稿では,この問題に対する新たなアプローチであるTAMLECを提案する。
推測時、TAMLECは文書で利用可能なラベルを使用して適切なタスクを推測し、行方不明なラベルを予測する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:57:49 GMT)
Contextual Stochastic Optimization for School Desegregation Policymaking [13.7] 本稿では,共同再限定・選択モデリングフレームワークを開発する。
小学校境界線の再描画が社会経済的分離のレベルに現実的にどう影響するかを推定する。
この研究は、RWCがかなりの量の分離を減少させる可能性のある境界変化をもたらすことを発見した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:34:40 GMT)
Mind Your Theory: Theory of Mind Goes Deeper Than Reasoning [13.5] LLMにおける心の理論(ToM)は近年,研究の中心的対象となっている。
LLMベンチマーク、ToMアドオン、ToM Probing、ToMの公式モデルなど、AIのさまざまなコミュニティにおけるいくつかの作業行を特定します。
認知タスクに使用される動的環境にインスパイアされたToM能力の評価を改善することを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:06:48 GMT)
CEHA: A Dataset of Conflict Events in the Horn of Africa [13.5] 本稿では,アフリカのホーン(CEHA)における新たなベンチマークデータセットであるConflict Eventsを紹介する。
このデータセットは、アフリカのホーン地方における紛争イベントに関する500のイングランドのイベント記述で構成されている。
このデータセットは、人道・平和開発Nexusの利害関係者が要求する特定の領域に応じて、主要な紛争リスクのタイプを分類する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:22:33 GMT)
AwesomeMeta+: Bridging the Technical Barriers to Meta-Learning via A Prototyping and Learning System [13.5] AwesomeMeta+は、メタ学習のさまざまなコンポーネントを標準化するプロトタイピングと学習システムである。
実際にアプリケーションのニーズを満たすために、互換性のあるアルゴリズムモジュールを組み立てることができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:08:15 GMT)
Energy-Efficient SLAM via Joint Design of Sensing, Communication, and Exploration Speed [13.4] 生涯同時局在マッピング(SLAM)が注目されている。
本稿では,センサ,コミュニケーション,機械的要因を共同で検討し,生涯SLAMにおけるロボット動作のエネルギー効率の分析に焦点をあてる。
検知時間、送信電力、送信時間、探索速度は、エネルギー消費を最小限に抑えるために共同で最適化される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:53:10 GMT)
Many-body spectral transitions through the lens of variable-range SYK2 model [13.4] 距離依存的相互作用を持つ2次SYKモデルについて検討する。
スペクトル形成因子 (SFF) を解析および数値的に研究することにより, 多体系における単一粒子の遷移がどのように現れるかを明らかにする。
この結果は、単一粒子臨界と多体ダイナミクスの相互作用を強調し、量子カオス-局在化遷移とスペクトル統計におけるその反射に関する新たな洞察を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:17:20 GMT)
Balans: Multi-Armed Bandits-based Adaptive Large Neighborhood Search for Mixed-Integer Programming Problem [13.4] MIP(Mixed-Integer Programming)は、様々な重要な最適化問題のモデリングと解決のための強力なパラダイムである。
オンライン学習機能を備えたMIPのための適応型メタソリューションであるBaransを提案する。
Balansは、デフォルトのMIP解決器よりもパフォーマンスが大幅に向上し、どの最良地区にもコミットするより優れ、最先端のMIPの大規模検索よりも改善されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:32:13 GMT)
Idea23D: Collaborative LMM Agents Enable 3D Model Generation from Interleaved Multimodal Inputs [13.4] 現在の3D AIGCメソッドは、人間の創造性を完全に解き放たない、と我々は主張する。
本稿では,IDEAから3Dコンテンツを生成する,新しい3DAIGC手法を提案する。
大規模マルチモーダルモデル(LMM)に基づく3つのエージェントと既存のアルゴリズムツールを組み合わせた新しいフレームワークIdean23Dを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:30:59 GMT)
Lightweight yet Fine-grained: A Graph Capsule Convolutional Network with Subspace Alignment for Shared-account Sequential Recommendation [13.3] 共有アカウントシーケンシャルレコメンデーションのためのサブスペースアライメントを備えた軽量グラフカプセル畳み込みネットワーク(LightGC$2$N)を提案する。
カプセルグラフ上のメッセージを注意深く伝播することにより、対話と潜伏ユーザ間のきめ細かいマッチングを容易にする。
4つの実世界のデータセットの実験結果は、LightGC$2$Nが9つの最先端の手法を精度と効率で上回っていることを示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:56:16 GMT)
Montague semantics and modifier consistency measurement in neural language models [13.2] 本研究は,現代言語埋め込みモデルにおける構成行動を測定する新しい手法を提案する。
具体的には,形容詞・名詞句における形容詞修飾子現象に着目した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:21:36 GMT)
Efficient Transfer Learning for Video-language Foundation Models [13.2] テキストと視覚分岐における表現のアライメントを改善するため,MSTA(Multi-modal Spatio-supervised)を提案する。
提案手法の有効性は,ゼロショット転送,少数ショット学習,ベース・ツー・ヴァリアント,完全言語学習の4つの課題にまたがる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:49:16 GMT)
Cross-Attention Graph Neural Networks for Inferring Gene Regulatory Networks with Skewed Degree Distribution [13.1] クロスアテンション複合デュアルグラフ埋め込みモデル(XATGRN)
我々のモデルは、様々なデータセットで既存の最先端メソッドよりも一貫して優れています。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:56:40 GMT)
Multi-task Representation Learning for Mixed Integer Linear Programming [13.1] 本稿では,ML誘導MILP問題解決のためのマルチタスク学習フレームワークについて紹介する。
我々は,マルチタスク学習モデルが同一分布内の特殊モデルと類似して動作することを示す。
これは、問題のサイズやタスクの一般化において、それらを著しく上回る。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:33:32 GMT)
Towards Weather-Robust 3D Human Body Reconstruction: Millimeter-Wave Radar-Based Dataset, Benchmark, and Multi-Modal Fusion [13.1] RGB画像から3Dの人体を復元すると、天気は良いが、悪天候では劇的に劣化する。
mmWaveレーダーは、悪天候下で3Dの関節とメッシュを再構築するために使われてきた。
各種気象条件下で3次元人体を堅牢に再構築する最初のmmWave-RGB融合ソリューションであるImmFusionを設計する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:40:35 GMT)
Go With the Flow: Fast Diffusion for Gaussian Mixture Models [13.0] Schr"odinger Bridges (SB) は、適切なコスト関数を最小化しながら、有限時間で与えられた初期分布を他の最終状態に分配する拡散過程である。
本稿では,ある分布から別の分布へシステムをステアリングするための一組のSBポリシーの潜在メトリゼーションを提案する。
オートエンコーダの空間における画像から画像への変換のような低次元問題におけるこのアプローチの可能性を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:20:14 GMT)
Machine Learning Co-pilot for Screening of Organic Molecular Additives for Perovskite Solar Cells [13.0] Co-Pilot for Perovskite Additive Screener (Co-PAS)は、ペロブスカイト太陽電池の添加性スクリーニングを加速するML駆動のフレームワークである。
Co-PASは、足場ベースの事前スクリーニングと潜木変分オートエンコーダ(JTVAE)を統合することで予測バイアスを克服する
新規なBoc-L-threonine N-hydroxysuccin ester(BTN)を含むいくつかの有望な伝達分子を同定する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:52:45 GMT)
CAD-Recode: Reverse Engineering CAD Code from Point Clouds [12.9] 3D CADリバースエンジニアリングは、点雲などの3D表現からスケッチとCAD操作シーケンスを再構成する。
提案したCAD-Recodeは,ポイントクラウドをPythonコードに変換することで,CADモデルを再構築する。
CADPythonのコード出力は既製のLCMで解釈可能であることを示し、CAD編集とCAD固有の問合せをポイントクラウドから行うことができることを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:55:42 GMT)
e-COP : Episodic Constrained Optimization of Policies [12.9] 本稿では,制約付き強化学習(RL)のための第1ポリシー最適化アルゴリズムを提案する。
提案アルゴリズムは, エピソード設定に適応したSoTA (non-episodic) アルゴリズムと類似あるいは良好な性能を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:15:09 GMT)
When LLM Meets DRL: Advancing Jailbreaking Efficiency via DRL-guided Search [12.8] 深部強化学習(DRL)によるブラックボックスジェイルブレイク攻撃であるRLbreakerを提案する。
RLbreakerは6つのSOTA(State-of-the-art (SOTA) LLM)に対する既存のジェイルブレイク攻撃よりも効果的であることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:25:09 GMT)
Risk-averse Total-reward MDPs with ERM and EVaR [12.7] リスク・アバースの総報酬基準は定常政策によって最適化可能であることを示す。
以上の結果から, リスク回避型強化学習領域において, 全報酬基準が割引基準よりも望ましい可能性が示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:10:18 GMT)
Personalized Clustering via Targeted Representation Learning [12.7] クラスタリングは伝統的に、ラベルのないデータから自然なグループ構造モデルを明らかにすることを目的としています。
ターゲット表現学習を明示的に行うパーソナライズされたクラスタリング手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:28:51 GMT)
Optimal Rates for Robust Stochastic Convex Optimization [12.6] 我々は,$epsilon$-contaminationモデルの下で,極小最適過大リスクを実現するアルゴリズムを開発した。
我々のアルゴリズムは制限的な仮定を必要とせず、非滑らかだがリプシッツ人口減少関数を扱える。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:17:12 GMT)
CAD-Assistant: Tool-Augmented VLLMs as Generic CAD Task Solvers? [12.5] CAD-Assistantは、FreeCADソフトウェアを備えたPythonインタプリタ上で反復的に実行されるアクションを生成することで、マルチモーダルなユーザクエリに対処する。
我々は、Pythonライブラリ、FreeCAD Python APIのモジュール、有用なルーチン、レンダリング機能、その他の特殊なモジュールを含む、幅広いCAD固有のツールを検討します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:57:56 GMT)
SemiDFL: A Semi-Supervised Paradigm for Decentralized Federated Learning [12.5] 分散連合学習(DFL)は,中央サーバに頼らずに,接続されたクライアント間の協調モデルトレーニングを実現する。
DFLに関する既存の作業の多くは、各クライアントがローカルトレーニングに十分なラベル付きデータを持っていることを前提として、教師付き学習に重点を置いている。
そこで本研究では,データ空間とモデル空間のコンセンサスを確立することで,SSLシナリオにおけるDFL性能を向上させる,最初の半教師付きDFL手法であるSemiDFLを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:12:55 GMT)
VIIS: Visible and Infrared Information Synthesis for Severe Low-light Image Enhancement [12.5] 既存の特異なモダリティ画像強調手法は、有効な情報を持たない画像領域の復元に苦慮している。
光不透過性赤外線画像を活用することで、可視・赤外画像融合法は暗く隠された情報を明らかにする可能性がある。
本稿では,視覚・赤外線情報合成(VIIS)と呼ばれる新しい課題を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:34:32 GMT)
Reinforcement Learning from Automatic Feedback for High-Quality Unit Test Generation [12.5] 大規模言語モデル(LLM)は自動テストケース生成で人気を集めている。
LLMは大量のオープンソースコードでトレーニングされているため、ベストプラクティスに従わないテストケースをしばしば生成します。
静的解析に基づく品質指標に基づく高品質な単体テストを生成するために,RLSQM(Reinforcement Learning from Static Quality Metrics)を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:20:01 GMT)
MMO-IG: Multi-Class and Multi-Scale Object Image Generation for Remote Sensing [12.5] MMO-IGは、グローバルな面とローカルな面から、教師付きオブジェクトラベルでRS画像を生成するように設計されている。
MMO間の複雑な相互依存性を考慮すると、空間的相互依存知識グラフを構築する。
MMO-IGは、高密度なMMO教師付きラベルを持つRS画像に対して優れた生成能力を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:19:12 GMT)
Optimize the Unseen - Fast NeRF Cleanup with Free Space Prior [12.3] フローター」は、特にトレーニングカメラで見えない地域では、新しいビュークオリティを低下させる。
高速でポストホックなNeRFクリーニング手法として,自由空間優先を強制することで,そのようなアーティファクトを除去する手法を提案する。
提案手法は既存のNeRFクリーンアップモデルに匹敵するが, 推定時間では2.5倍高速である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:17:53 GMT)
Robust Tracking via Mamba-based Context-aware Token Learning [12.3] 出現モデルから時間情報学習を分離するシンプルな頑健なトラッカーを提案する。
具体的には、各フレームに1つのトラックトークンを導入し、バックボーン内のターゲットの外観情報を収集する。
実験により,本手法が有効であることを示すとともに,リアルタイムに複数のベンチマーク上での競合性能を実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:37:22 GMT)
Leveraging Semantic Asymmetry for Precise Gross Tumor Volume Segmentation of Nasopharyngeal Carcinoma in Planning CT [12.2] 鼻咽喉頭癌(NPC)の放射線治療では,非コントラスト計画CTを用いてGTV(Grog tumor volume)を脱線させるのが一般的である。
腫瘍と隣接する正常な組織との間の低コントラストは、放射線腫瘍学者が手動で腫瘍を脱線させる必要がある。
非コントラストプランニングCT画像にNPC細胞性腫瘍を直接分離する手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:40:45 GMT)
Deep Representation Learning for Forecasting Recursive and Multi-Relational Events in Temporal Networks [12.1] この研究は、マルチリレーショナルで再帰的な高次相互作用イベントを予測する問題に対処する。
提案したモデルであるtextitRelational Recursive Hyperedge Temporal Point Process (RRHyperTPP) は,歴史的相互作用パターンに基づいて動的ノード表現を学習するエンコーダを使用する。
本研究では,モデルパラメータを学習するためのノイズコントラスト推定法を開発し,従来のインタラクション予測手法よりも優れた性能を示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:33:51 GMT)
PsyDT: Using LLMs to Construct the Digital Twin of Psychological Counselor with Personalized Counseling Style for Psychological Counseling [12.1] 我々は、パーソナライズされたカウンセリングスタイルで心理カウンセラーのデジタルツインを構築するための新しいフレームワークであるPsyDTを提案する。
多数の現実世界のカウンセリングケースを収集する時間とコストのかかるアプローチと比較して、私たちのフレームワークはより速く、よりコスト効率の良いソリューションを提供します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:38:43 GMT)
Nullu: Mitigating Object Hallucinations in Large Vision-Language Models via HalluSpace Projection [12.0] 大型視覚言語モデル(LVLM)は、しばしば物体幻覚(OH)に悩まされる。
本稿では,安全でない部分空間に基づいてモデルの重みを効率よく編集する手法を提案する。
実験により,提案手法は,余分な推論コストを伴わずに複数のLVLMファミリー間でOHを効果的に緩和し,一般LVLMベンチマークで高い性能を示すことを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:04:30 GMT)
A Comprehensive Evaluation of Parameter-Efficient Fine-Tuning on Method-Level Code Smell Detection [12.0] 既存の検出手法は、コードまたは機械学習(ML)とディープラーニング(DL)技術に依存しており、しばしば不満足なパフォーマンスのような制限に直面している。
本研究では,2種類のメソッドレベルのコードの臭いを検出するために,小・大規模言語モデルを用いたPEFT手法の評価を行った。
その結果,PEFT法はGPUメモリの消費を減らしながら,フル微調整よりも同等あるいは優れた性能が得られることがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:48:36 GMT)
Cryogenic hybrid magnonic circuits based on spalled YIG thin films [11.9] イットリウム鉄ガーネット(YIG)マグノニクスは、マグノンの特異な性質のため、重要な研究の関心を集めている。
本研究では,YIG/GGG試料からYIG薄膜をスパリングできることを実証した。
超伝導共振器とスパリングYIG膜からなるハイブリッドデバイスを用いて,本手法の有効性を検証した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:05:18 GMT)
MFTF: Mask-free Training-free Object Level Layout Control Diffusion Model [11.7] MFTF(Msk-free Training-free Object-Level Layout Control Diffusion Model)
MFTFは、追加のマスクや画像を必要とすることなく、オブジェクトの位置を正確に制御する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:56:53 GMT)
GN-FR:Generalizable Neural Radiance Fields for Flare Removal [11.6] レンズフレアの影響を受けやすい入力画像のスパース集合からフレアフリービューを描画するフレームワークを提案する。
782枚の画像と80枚の実フレアパターンを持つ17枚の実フレアシーンと、それに対応する注釈付きフレア占有マスクからなる3次元多視点フレアデータセットを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:36:47 GMT)
ROMAS: A Role-Based Multi-Agent System for Database monitoring and Planning [11.6] 本稿では,ローコード開発とワンクリック展開を実現しつつ,様々なシナリオに適応する役割ベースM ulti-A gentシステムであるROMASを提案する。
ROMAS は DB-GPT [Xue et al., 2023a, 2024b] に効果的にデプロイされている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:45:39 GMT)
Correlated Proxies: A New Definition and Improved Mitigation for Reward Hacking [11.6] 状態に対する代償と真報酬の相関に基づく報酬ハッキングの定義を導入する。
基本方針の正則化が報酬ハッキングを効果的に防止できることを理論的に示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:51:35 GMT)
Comparative Analysis of Machine Learning-Based Imputation Techniques for Air Quality Datasets with High Missing Data Rates [11.5] 都市汚染は深刻な健康リスクをもたらし、特に交通関連の大気汚染は、多くの都市で大きな問題となっている。
この研究は、データレートの低いデータセットを処理するための洞察を提供することを目的としている。
アンサンブル法,深層学習モデル,拡散モデルなど,様々な計算・予測手法を評価・比較した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:45:08 GMT)
Plug-and-Play Tri-Branch Invertible Block for Image Rescaling [11.5] 高分解能(HR)画像は通常、帯域幅を減らすために低分解能(LR)にダウンスケールされ、続いて元の細部をアップスケールして復元する。
画像再スケーリングアルゴリズムの最近の進歩は、ダウンスケーリングとアップスケーリングのための統一されたフレームワークを作成するために、非可逆ニューラルネットワーク(INN)を使用している。
本稿では、低周波分岐を輝度(Y)と輝度(CbCr)に分解するプラグアンドプレイ三分岐可逆ブロック(T-InvBlocks)を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:14:13 GMT)
MMHMR: Generative Masked Modeling for Hand Mesh Recovery [11.4] MMHMRは手メッシュ回復のための新しい生成マスクモデルである。
あいまいな2D-to-3Dマッピングプロセスの確率分布から学習とサンプリングにより、可塑性3Dハンドメッシュを合成する。
3Dハンドメッシュ再構築において,最先端の精度,堅牢性,現実性を実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:10:00 GMT)
Multi-Party Supervised Fine-tuning of Language Models for Multi-Party Dialogue Generation [11.3] 大規模言語モデル(LLM)は通常、ダイアディックや二者対話に参加するために微調整される。
本研究では,多人数対話データセットに基づくLLMのためのマルチパーティファインチューニングフレームワーク (MuPaS) を設計する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:47:53 GMT)
On the Robustness of Spectral Algorithms for Semirandom Stochastic Block Models [11.1] 半ランダムな敵に対するスペクトルアルゴリズムの堅牢性について検討する。
我々は,_unnormalized_Laplacian を用いたスペクトル二分法が強い整合性を持つ半ランダム逆数クラスを同定した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:35:02 GMT)
Optimal Exact Recovery in Semi-Supervised Learning: A Study of Spectral Methods and Graph Convolutional Networks [11.1] 本研究では,文脈ブロックモデル(CSBM)データセットを用いた半教師付きノード分類の課題に取り組む。
トレーニングラベルと必須データを用いて,主成分分析(PCA)にインスパイアされた最適スペクトル推定器を設計する。
また,このデータセット上でのグラフリッジ回帰とグラフ畳み込みネットワーク(GCN)の有効性を評価した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:44:19 GMT)
From Expectation to Habit: Why Do Software Practitioners Adopt Fairness Toolkits? [11.1] 本研究では,公正度ツールキットの導入に影響を与える要因を個人的視点から検討した。
以上の結果から,期待度と習慣がフェアネスツールキット採用の主要な要因であることが判明した。
実践的な推奨事項としては、ツールキットのユーザビリティの向上、バイアス軽減プロセスの定期的な開発への統合、継続的なサポートの提供などがある。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:38:28 GMT)
ALEN: A Dual-Approach for Uniform and Non-Uniform Low-Light Image Enhancement [11.0] 不適切な照明は、情報損失や画質の低下を招き、監視などの様々な応用に影響を及ぼす可能性がある。
現在のエンハンスメント技術は、しばしば特定のデータセットを使用して低照度画像を強化するが、様々な現実世界の条件に適応する際の課題は残る。
アダプティブ・ライト・エンハンスメント・ネットワーク (ALEN) を導入し、その主なアプローチは、ローカル照明とグローバル照明の強化が必要であるかどうかを決定するための分類機構を使用することである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:10:48 GMT)
Software Engineering Educational Experience in Building an Intelligent Tutoring System [10.9] 本稿では,Intelligent Tutoring Systemアーキテクチャ,SEコースにおける教育概念,ITSでの経験について論じる。
このSEコースは、数年間のプログラミングコースで初心者学生に自動化されたリアルタイムフィードバックを提供する、本格的なIntelligent Tutoring Systemを構築することを想定している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:54:32 GMT)
The Tile: A 2D Map of Ranking Scores for Two-Class Classification [10.9] 2クラス分類器のための1つの2次元マップにおいて、ランキングスコアの無限度を整理する新しい多目的ツールTileを提案する。
本研究では,前者の影響やROC空間との対応など,基礎となるランキングスコアの特性について検討する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:50:29 GMT)
Foundations of the Theory of Performance-Based Ranking [10.9] 本稿では,パフォーマンスに基づくランク付けのための普遍理論の基礎を確立する。
確率理論と順序理論の両方の上に構築された厳密な枠組みを導入する。
2クラス分類の場合、ランキングスコアのファミリーは、よく知られたパフォーマンススコアを含んでいることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:45:58 GMT)
ResQ: Mixed-Precision Quantization of Large Language Models with Low-Rank Residuals [10.9] 大規模言語モデル(LLM)の学習後の量子化は、推論時の計算コストを抑えるという約束を果たす。
ResQは、様々なベンチマークにおいて、最近の一様および混合精度のPTQ法よりも優れていることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:01:55 GMT)
Neural Temporal Point Processes for Forecasting Directional Relations in Evolving Hypergraphs [10.8] 汎用環境での方向性関係の予測問題に対する包括的解を提供する。
可能なハイパーエッジの数は、イベント時間毎のノード数で指数関数的である。
予測過程を複数の段階に分割する逐次生成手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:36:47 GMT)
An Extension-Based Argument-Ranking Semantics: Social Rankings in Abstract Argumentation Long Version [10.8] 我々は、議論の分類を懐疑的に受け入れられ、不当に受け入れられ、拒否されるような、議論の分類の洗練として見ることのできる、議論階級のセマンティクスの新たなファミリーを導入する。
我々は、最近開発されたいわゆる社会的ランキング機能を用いて、グループ内でのパフォーマンスに基づいて個人をランク付けしている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:08:46 GMT)
Semantic Sleuth: Identifying Ponzi Contracts via Large Language Models [10.8] PonziSleuthは、Ponziスマートコントラクトを検出する最初のLCM駆動のアプローチである。
大規模なデータ要求なしに、同等で、しばしば優れたパフォーマンスを提供する。
実世界検出において、PonziSleuthは2024年3月にEtherscanによって承認された4,597件の契約から15件の新しいポンツィ計画の特定に成功した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:17:09 GMT)
From Optimization to Generalization: Fair Federated Learning against Quality Shift via Inter-Client Sharpness Matching [10.7] フェデレートラーニングは、分散化された医療データでディープニューラルネットワークをトレーニングするための重要なアプローチとして認識されている。
実際には、様々な施設で一貫した画像品質を確保することは困難である。
この画像品質の不均衡は、フェデレートされたモデルが高品質な画像に対して固有のバイアスを生じさせる可能性がある。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:46:25 GMT)
Socio-Culturally Aware Evaluation Framework for LLM-Based Content Moderation [10.7] 本稿では,コンテンツモデレーションのための社会的に意識した評価フレームワークを提案する。
ペルソナ生成を用いた多様なデータセットを作成するためのスケーラブルな手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:57:18 GMT)
SwiftTry: Fast and Consistent Video Virtual Try-On with Diffusion Models [10.7] 本研究の目的は,被服が時間的整合性を維持しつつ着ている新しい映像を合成することである。
我々は,映像仮想試着を条件付き映像塗装作業として再認識し,衣服を入力条件として機能させる。
具体的には,時間的注意層を取り入れた画像拡散モデルを構築し,時間的コヒーレンスを改善する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:05:43 GMT)
Semantic Convergence: Harmonizing Recommender Systems via Two-Stage Alignment and Behavioral Semantic Tokenization [10.5] 大規模言語モデル(LLM)は、歴史的行動からユーザの深い関心を識別する能力を持っている。
従来のレコメンデーションモデルとLLMの長所を調和的に融合する新しいフレームワークを提案する。
我々は、協調的な信号と自然言語意味論の微妙さを整合させることを目的とした、教師付き学習タスクのシリーズを設計する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:07:58 GMT)
Geolocation Representation from Large Language Models are Generic Enhancers for Spatio-Temporal Learning [10.4] 普遍表現モデルは、自然言語処理やコンピュータビジョンで広く使われているよりも一般的ではない。
この相違は、主に既存の表現モデルの入力に関連する高コストから生じる。
本研究では,大規模言語モデルを用いて位置情報表現を導出する学習自由手法を開発した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:23:40 GMT)
Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation [10.4] 本稿では,複数の参照画像特徴を対応オブジェクトにマージする重み付きマージ手法を提案する。
提案手法は,マルチオブジェクト・パーソナライズされた画像生成のためのConcept101データセットとDreamBoothデータセットの最先端技術よりも優れた性能を実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:55:15 GMT)
PowerMLP: An Efficient Version of KAN [10.4] Kolmogorov-Arnold Network (KAN) は、関数フィッティングやPDE解決といったいくつかのタスクにおいて高い精度で知られている新しいネットワークアーキテクチャである。
Kanの優れた計算能力は、コルモゴロフ・アルノルド表現と学習可能なスプライン関数から生じる。
PowerMLPは、様々なタスクにおいてkanの約40倍の精度とトレーニング速度を達成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:42:34 GMT)
One Node One Model: Featuring the Missing-Half for Graph Clustering [10.3] グラフクラスタリングの特徴の選択は、クラスタを同時に検出し、これらのクラスタに関連する機能を特定する必要があるため、難しい。
本稿では,各ノードに対して排他的モデルを構築し,ノード群に対する予測の組み合わせとしてノードラベルを定義する「1ノード1モデル」という新しいパラダイムを提案する。
具体的には、提案したFeature Personalized Graph Clustering (FPGC) メソッドは、各ノードのクラスタ関連機能をSwitch-and-excitationブロックを使用して識別し、これらの機能を各モデルに統合して最終的な表現を形成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:51:33 GMT)
A Statistical and Multi-Perspective Revisiting of the Membership Inference Attack in Large Language Models [10.3] メンバーシップ推論攻撃(MIA)は、訓練された(メンバーでない)データと訓練されていない(非メンバー)データを区別する。
最近の研究では、異なる環境でのほぼランダムなパフォーマンスが報告され、大きなパフォーマンスの不整合が浮かび上がった。
テキストの特徴, 埋め込み, しきい値決定, 復号化力学の研究とともに, 様々な設定からMIA法を改訂し, 数千の実験を行った。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:39:42 GMT)
Data to Defense: The Role of Curation in Customizing LLMs Against Jailbreaking Attacks [10.3] 大規模言語モデル(LLM)は、カスタマイズと呼ばれるプロセスである微調整を通じて下流アプリケーションに広く適用されている。
悪意のあるサンプルは、LSMの堅牢性を損なう可能性があり、有害な振る舞いを増幅する。
本稿では,任意のテキストをキュレーションして,カスタマイズ時に有害なサンプルを防止できる適応型データキュレーション手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:44:33 GMT)
A Review of Multimodal Explainable Artificial Intelligence: Past, Present and Future [10.3] 本総説は,MXAI手法開発における重要な知見を得ることを目的としている。
MXAIの手法は,従来の機械学習,ディープラーニング,差別的基礎モデル,ジェネレーティブLLMの4つの時代にまたがる。
また、MXAI研究で使用される評価指標やデータセットについても検討し、今後の課題や方向性について論じる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:06:21 GMT)
Cultivating Archipelago of Forests: Evolving Robust Decision Trees through Island Coevolution [10.2] 決定木は、その単純さと解釈可能性のために機械学習で広く使用されているが、敵の攻撃やデータ摂動に対する堅牢性に欠けることが多い。
本稿では,ロバストな決定木アンサンブルを構築するための島型共進化アルゴリズム(ICoEvoRDF)を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:59:24 GMT)
Federated Unlearning Model Recovery in Data with Skewed Label Distributions [10.2] 本稿では,スキューラベル分布を用いたフェデレーション・アンラーニングの回復手法を提案する。
まず、難解なクラスデータを補うために、深層学習とオーバーサンプリングを組み込んだ戦略を採用する。
そして、密度に基づく復調法を適用して、生成されたデータからノイズを除去する。
残りのすべてのクライアントは、強化されたローカルデータセットを活用し、未学習モデルのパフォーマンスを効果的に回復するための反復的なトレーニングに従事します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:25:11 GMT)
Analysis of Higher-Order Ising Hamiltonians [10.2] 本研究は,高階IsingシミュレータIsingSimの理論的枠組みを提案する。
イジングシムのイジングスピンと勾配は分離され自己分解可能である。
実験結果から,本フレームワークは高次Isingマシンの設計ガイドラインを提供する上で有用なツールであることがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:15:11 GMT)
Stealing That Free Lunch: Exposing the Limits of Dyna-Style Reinforcement Learning [10.1] Dyna-style off-policy model-based reinforcement learning (DMBRL)アルゴリズムは、合成状態遷移データを生成するための一連の技術である。
本稿では,異なるベンチマーク環境におけるDMBRLアルゴリズムの適用時に観測された驚くべき性能差を同定し,検討する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:25:04 GMT)
Enhancing Knowledge Distillation of Large Language Models through Efficient Multi-Modal Distribution Alignment [10.1] 本稿では,教師モデルと学生モデルとのピーク予測の整合性を促進するために,ランキング損失に基づく知識蒸留(RLKD)を提案する。
提案手法は,教師モデルのマルチモーダル分布をよりよく学習し,様々な下流タスクにおいて顕著な性能向上をもたらす。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:23:30 GMT)
Spatio-Temporal Forecasting of PM2.5 via Spatial-Diffusion guided Encoder-Decoder Architecture [10.0] 本稿では,PM2.5濃度の予測に係わる依存関係を具体的に把握するS-Temporal Graph Networkアーキテクチャを提案する。
本モデルは,グラフニューラルネットワーク(Transformerv)を付加した再帰単位(GRU)を利用して空間拡散を考慮したエンコーダ・デコーダアーキテクチャに基づいている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:18:12 GMT)
Spatial Brain Tumor Concentration Estimation for Individualized Radiotherapy Planning [9.9] 脳腫瘍の生体物理モデリングは放射線治療計画のパーソナライズ戦略として期待されている。
脳腫瘍患者の術前MRIから腫瘍細胞濃度を推定するために,ソフト物理制約を用いた効率的かつ直接的手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:58:38 GMT)
Memorization Over Reasoning? Exposing and Mitigating Verbatim Memorization in Large Language Models' Character Understanding Evaluation [9.8] 大きな言語モデル(LLM)は、文字理解タスクにおいて素晴らしいパフォーマンスを示している。
我々は「ギストメモリ」が文字理解タスクの主要なメカニズムであるべきだと論じている。
本稿では,文字理解評価において,機械的記憶を緩和する簡易かつ効果的な手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:04:56 GMT)
On the Compression of Language Models for Code: An Empirical Study on CodeBERT [9.6] 我々は、知識蒸留、量子化、プルーニングの3つの有名な圧縮戦略が、ソフトウェアエンジニアリングタスクの3つの異なるクラスに与える影響を調査する。
その結果,これらの戦略の影響は,タスクや特定の圧縮方法によって大きく異なることが明らかとなった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:14:30 GMT)
A Data-Centric Perspective on Evaluating Machine Learning Models for Tabular Data [9.6] 実世界のモデリングパイプラインは、しばしばデータセット固有の前処理と特徴工学を必要とするため、モデル中心の評価は偏りがあることを実証する。
Kaggleコンペティションから10の関連するデータセットを選択し、データセット毎に専門家レベルの前処理パイプラインを実装します。
データセット固有の機能エンジニアリングの後、モデルランキングは大幅に変化し、性能差が減少し、モデル選択の重要性が低下する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:07:04 GMT)
Adversarial Hubness in Multi-Modal Retrieval [9.6] 敵のハブは、何千もの異なるクエリに応答して検索される普遍的な敵のコンテンツを注入するために使用することができる。
本稿では,マルチモーダル検索データセットのベンチマーク上で,敵対的ハブを作成し,その結果のハブを評価する手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:58:58 GMT)
VaeDiff-DocRE: End-to-end Data Augmentation Framework for Document-level Relation Extraction [9.5] ドキュメントレベルの関係抽出(DocRE)は、ドキュメント内のエンティティペア間の関係を特定することを目的としている。
既存のほとんどの手法は、一様ラベルの分布を仮定し、現実の非バランスなデータセット上での最適以下の性能をもたらす。
組込み空間からのデータを強化するために生成モデルを用いた新しいデータ拡張手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:55:29 GMT)
Generating Unseen Nonlinear Evolution in Sea Surface Temperature Using a Deep Learning-Based Latent Space Data Assimilation Framework [9.3] 本稿では、生成人工知能モデルを用いて、海面温度の非線形進化を捉える純粋にデータ駆動型潜水空間DAフレームワーク(DeepDA)を提案する。
その結果,大量の観測情報が欠落している場合でも,DeepDAは非線形進化を捕捉・生成するのに非常に安定であることがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:41:34 GMT)
DragScene: Interactive 3D Scene Editing with Single-view Drag Instructions [9.3] 3D編集は、様々な指示に基づいてシーンを編集する際、顕著な能力を示した。
既存の方法は直感的で局所的な編集に苦労する。
DragSceneは、ドラッグスタイルの編集と多様な3D表現を統合するフレームワークである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:02:01 GMT)
AKiRa: Augmentation Kit on Rays for optical video generation [9.3] AKiRaは、カメラアダプタを既存のビデオ生成バックボーンの上に複雑なカメラモデルで構築し、訓練する、新しい拡張フレームワークである。
カメラの動きの微調整と複雑な光学パラメータにより、ズーム、魚眼効果、ボケなどの映画効果を達成できる。
この研究は、制御され、光学的に強化されたビデオ生成において新しいランドマークを設定し、将来の光ビデオ生成方法への道を開く。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:53:22 GMT)
A Unified Framework for Human-Allied Learning of Probabilistic Circuits [9.2] 確率回路(PC)は、複雑な確率分布を表現および学習するための効率的なフレームワークとして登場した。
多様なドメイン知識をPCのパラメータ学習プロセスに統合できる新しい統合フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:02:40 GMT)
Differentially Private Multi-objective Selection: Pareto and Aggregation Approaches [9.1] 本稿では,PrivParetoとPrivAggの2つの新しい選択機構について述べる。
どちらもグローバルおよびローカルな感度アプローチをサポートし、複数のユーティリティ関数の感度をどのように構成するかを示す包括的な理論的分析を行う。
ソーシャルネットワークにおけるコスト感受性決定木構築と多目的影響ノード選択の2つの実世界の応用例を実演する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:30:07 GMT)
A Hitchhiker's Guide to Understanding Performances of Two-Class Classifiers [9.1] 4つのシナリオを提示することにより、2クラス分類器の性能を理解するための最初のヒッチハイカーガイドを提示する。
新たに導入されたTileツールと異なるフレーバーを利用して、74の最先端セマンティックセグメンテーションモデルの性能をランク付けし分析する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:55:49 GMT)
Time-Varying Strong Coupling and Its Induced Time Diffraction of Magnon Modes [9.1] 時間変化媒体は、材料中の波動伝播の時間変換対称性を破り、高度な波動操作を可能にする。
ここでは、2つのマグノンモード間の時間変化の強い結合を構築し、パルスエッジ近傍のラビ様振動のビートの変化を観察する。
この結果は、全磁気ミキサーやオンチップのGHzソースなどのアプリケーションに開放される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:37:41 GMT)
Flexible and efficient emulation of spatial extremes processes via variational autoencoders [9.1] 我々は、XVAEと呼ばれる変分オートエンコーダの符号化・復号構造に、フレキシブルで非定常的依存特性を持つ新しい空間超越モデルを統合する。
XVAEは空間観測をエミュレートし、特に尾部において入力と同じ統計特性の出力を生成する。
我々は、赤海における高解像度衛星による海面温度のデータセットを分析し、16703格子細胞での30年間の日量測定を含む。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:46:23 GMT)
Reconciling Human Development and Giant Panda Protection Goals: Cost-efficiency Evaluation of Farmland Reverting and Energy Substitution Programs in Wolong National Reserve [9.0] グライン・トゥ・グリーン(G2G)とファイアウッド・トゥ・エレクトリシティ(F2E)の2つの主要な生態保全プログラムの費用効果を評価する。
G2Gプログラムは、約500CNY/Muで最適の金融効率を達成し、1000CNY/Muを超えるリターンを減少させる。
最も財政的なコスト効率のよい選択肢は、補助電力価格が0.4-0.5CNY/kWhであるのに対して、さらに0.1CNY/kWh以下に値下げされた場合である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:12:20 GMT)
Memorizing SAM: 3D Medical Segment Anything Model with Memorizing Transformer [9.0] 本稿では,メモリトランスフォーマーをプラグインとして組み込んだ新しい3DSAMアーキテクチャであるMemorizing SAMを提案する。
トレーニングや推論中に内部表現を保存した従来の記憶変換器とは異なり、Memorizing SAMは既存の高精度な内部表現をメモリソースとして利用しています。
我々はTotalSegmentatorデータセットから,33カテゴリのSAMの記憶性能を評価し,Memorizing SAMは,平均Dice増加率11.36%,推論時間4.38ミリ秒のコストで,最先端の3D SAMの変種であるFastSAM3Dより優れていることを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:51:25 GMT)
Typhoon 2: A Family of Open Text and Multimodal Thai Large Language Models [8.8] Typhoon2-Textは、Llama 3やQwen2のような最先端のオープンモデルに基づいている。
Typhoon2-Visionは、画像キャプションなどの一般的な視覚能力を維持しながら、タイ語の文書理解を改善する。
Typhoon2-Audioはエンドツーエンドの音声合成モデルアーキテクチャを導入した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:45:24 GMT)
EXIT: Context-Aware Extractive Compression for Enhancing Retrieval-Augmented Generation [8.8] 現在のRAGシステムは、検索モデルが最も関連性の高い文書のランク付けに失敗したときにしばしば苦労する。
抽出文脈圧縮フレームワークEXITを紹介する。
評価の結果,EXITは既存の圧縮手法を一貫して上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:08:36 GMT)
GLACIAL: Granger and Learning-based Causality Analysis for Longitudinal Imaging Studies [8.7] 本稿では,GLACIAL (Granger and LeArning-based CausalIty Analysis for Longitudinal study) という手法を用いて,この手法のギャップを埋める手法を提案する。
本稿では, GLACIAL (Granger and LeArning-based CausalIty Analysis for Longitudinal Studies) という手法を用いて, この方法論的ギャップを埋める手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:07:45 GMT)
Incorporating Feature Pyramid Tokenization and Open Vocabulary Semantic Segmentation [8.7] 我々は、すべての粒度の理解のために、統合された知覚的および意味的トークン圧縮について研究する。
本稿では,学習可能なコードブックによる多面的特徴のクラスタ化と多面的特徴の表現を目的とした特徴ピラミッドトークン化(PAT)を提案する。
実験の結果,PATはVLM特徴ピラミッドの意味的直感を増強することがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:43:21 GMT)
Learning-based Sketches for Frequency Estimation in Data Streams without Ground Truth [8.6] より実践的な学習ベース推定フレームワークであるUCL-sketchを提案する。
根拠のない等価学習によるオンライントレーニングと、論理的推定バケットを備えた高度にスケーラブルなアーキテクチャ。
その結果,本手法はキーごとの精度と分布に関する既存のスケッチよりも優れていた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:01:15 GMT)
Online MDP with Transition Prototypes: A Robust Adaptive Approach [8.6] オンラインのロバストなマルコフ決定プロセス(MDP)について検討し、基礎となる遷移カーネルの有限個のプロトタイプに関する情報を得る。
本稿では,対応するロバストポリシーの性能を保証しつつ,真の基盤となるトランジションカーネルを効率的に同定するアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:19:55 GMT)
PLPP: Prompt Learning with Perplexity Is Self-Distillation for Vision-Language Models [8.5] 本稿では,PLPPと呼ばれるプラグイン・プロンプト正規化手法を提案する。
4つの分類タスクで行った実験は、PLPPが既存の手法に比べて優れた性能を示したことを示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:08:53 GMT)
JoVALE: Detecting Human Actions in Video Using Audiovisual and Language Contexts [8.5] ビデオアクション検出(VAD)は、ビデオ内のアクションインスタンスのローカライズと分類を含む。
我々は、JoVALE(Joint Actor-centric Visual, Audio, Language)と呼ばれる新しいマルチモーダルVADアーキテクチャを導入する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:51:31 GMT)
Privately Answering Queries on Skewed Data via Per Record Differential Privacy [8.4] 我々はプライバシ・フォーマリズムを提案し、PzCDP(0集中差分プライバシー)を記録単位とする。
異なるレコードに対して異なるプライバシー損失を提供する他の形式主義とは異なり、PRzCDPのプライバシー損失は機密データに明示的に依存する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:06:42 GMT)
Syzygy: Dual Code-Test C to (safe) Rust Translation using LLMs and Dynamic Analysis [8.4] Syzygyは、C言語を安全なRustに変換する自動化アプローチである。
これは、Rustのコード翻訳を安全にする上で、これまでで最大の自動化およびテスト検証済みのCである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:55:46 GMT)
Exploring Context Generalizability in Citywide Crowd Mobility Prediction: An Analytic Framework and Benchmark [8.3] 本稿では,コンテキストの一般化性を評価するための統合分析フレームワークと大規模ベンチマークを提案する。
我々は,自転車の走行,地下鉄の乗客流,電気自動車の充電需要といった,群衆の移動予測タスクで実験を行った。
より多くのコンテキスト機能を使用すると、既存のコンテキストモデリング技術で予測がより良くなるとは限らない。
文脈モデリング手法では、ゲート単位を用いて生の文脈特徴を深部予測モデルに組み込むことで、優れた一般化性が得られる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:12:43 GMT)
Kalahi: A handcrafted, grassroots cultural LLM evaluation suite for Filipino [8.3] フィリピン生まれの話者が共同で作成した,文化的LLM評価スイートであるKalahiを紹介する。
カラヒにおける強力なLLMパフォーマンスは、ある状況下で平均的なフィリピン人が言うのと同じような反応をモデルが生成する能力を示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:39:02 GMT)
Transducer Tuning: Efficient Model Adaptation for Software Tasks Using Code Property Graphs [8.3] アプローチは、コードプロパティグラフ(CPG)を使用して下流のコードタスクに大規模なモデルを適用するテクニックである。
我々のアプローチではTransducerと呼ばれるモジュラーコンポーネントを導入し、CPGからの構造化情報と依存性情報によってコード埋め込みを強化します。
その結果,最大99%のトレーニング可能なパラメータを削減し,最大99%のメモリ削減を実現した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:25:17 GMT)
Nirvana AI Governance: How AI Policymaking Is Committing Three Old Fallacies [8.2] 私は現在のAI規制提案の根本的な欠陥を明らかにします。
一部のコメンテーターは、人々は機械よりも信頼性が高いと直感的に信じている。
一部の政策立案者や研究者は、損害とコストが彼らの提案に固有のものであるという事実に気付いていない。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:47:22 GMT)
Zero-Shot Image Moderation in Google Ads with LLM-Assisted Textual Descriptions and Cross-modal Co-embeddings [8.1] われわれはGoogleの広告画像コンテンツモデレーションに対してスケーラブルでアジャイルなアプローチを提案する。
提案手法は,広告画像に違反するポリシーのゼロショット分類を可能にするために,ヒューマンキュレートされたテキスト記述とクロスモーダルなテキスト画像の共埋め込みを利用する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:37:53 GMT)
On the Role of Model Prior in Real-World Inductive Reasoning [8.0] 実世界のアプリケーションでは、Large Language Modelsの仮説生成はタスク固有のモデル先行によって形成される。
デモの除去は 仮説の質と 下流の使い方の損失を 最小限に抑える
これらの知見は、LLMにおける仮説生成のダイナミクスの理解を促進する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:22:08 GMT)
DELRec: Distilling Sequential Pattern to Enhance LLMs-based Sequential Recommendation [7.9] 逐次リコメンデーション(SR)タスクは,ユーザの行動シーケンスを学習し,過去のインタラクションと好みの変化を関連付けることによって,ユーザの次のインタラクションを予測することを目的としている。
従来のSRモデルは、外部ソースからアイテムタイトルに埋め込まれたより広いコンテキストや意味情報を無視して、トレーニングデータ内のシーケンシャルなパターンをキャプチャすることだけに重点を置いていることが多い。
大規模言語モデル(LLM)は、その高度な理解能力と強力な一般化能力により、最近SRタスクにおいて有望であることが示されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:48:37 GMT)
Adversarial Robustness of Link Sign Prediction in Signed Graphs [7.9] 符号付きグラフは、ソーシャルネットワークにおける肯定的および否定的な関係を表現するための基本的なデータ構造として機能する。
バランス理論は、署名された関係をSGNNでモデル化するために不可欠であるが、ブラックボックス攻撃に悪用可能な脆弱性を不注意に導入している。
本稿では,グラフバランスの度合いを妥協する新たな逆戦略であるバランスアタックを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:33:32 GMT)
Safeguarding System Prompts for LLMs [7.9] 大規模言語モデル(LLM)は、システムプロンプトが重要な役割を果たすアプリケーションでますます利用されている。
敵や通常のユーザクエリでさえ、これらの隠れたプロンプトを公開するために脆弱性を悪用することができる。
本稿では,プライバシのプロンプトキーパー(PromptKeeper)について紹介する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:43:25 GMT)
Image Synthesis under Limited Data: A Survey and Taxonomy [7.8] 与えられたデータ分布を再現して新しいサンプルを作成することを目的とした深層生成モデルは、近年、前例のない進歩を遂げている。
限られたデータに基づいてトレーニングを行う場合、生成モデルは過度な適合と記憶によるパフォーマンス劣化に悩まされる傾向にある。
本調査は,限られたデータに基づく画像合成の開発に関する包括的レビューと新しい分類法を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:07:39 GMT)
Investigating the Effects of Diffusion-based Conditional Generative Speech Models Used for Speech Enhancement on Dysarthric Speech [7.8] 本研究は, 理想的な非雑音環境下で記録された変形性音声データの強調過程において, 音響的変形性音声手がかりのいくつかが失われることを実験的に示す。
特徴空間内の入力音声信号と融合した場合に,残響音声信号の形で拡張モデルにより除去された音響的手がかりが相補的な外科的手がかりとなることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:18:05 GMT)
MATCHED: Multimodal Authorship-Attribution To Combat Human Trafficking in Escort-Advertisement Data [7.8] 本稿では,27,619のユニークなテキスト記述と55,115のユニークな画像からなるマルチモーダルデータセットであるMATCHEDを紹介する。
本研究は,ベンダー識別および検証タスクにおいて,テキストのみ,ビジョンのみ,マルチモーダルベースラインを広範囲にベンチマークする。
以上の結果から,マルチモーダルAA (MAA) による人身売買対策の可能性が示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:39:01 GMT)
CREST: An Efficient Conjointly-trained Spike-driven Framework for Event-based Object Detection Exploiting Spatiotemporal Dynamics [7.7] スパイキングニューラルネットワーク(SNN)は、イベントベースのオブジェクト認識と検出を約束する。
既存のSNNフレームワークは、多くの場合、マルチスケールの時間的特徴を扱うことができず、データの冗長性が向上し、精度が低下する。
我々は、イベントベースのオブジェクト検出を利用するために、結合的にトレーニングされた新しいスパイク駆動フレームワークであるCRESTを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:37:48 GMT)
99.9%-fidelity in measuring a superconducting qubit [7.5] 量子状態測定ラグは、速度と忠実性において量子ゲート演算の約1桁遅れている。
そこで我々は、量子ビットと共振器の長寿命相互作用方式を実装するために、新しいアーキテクチャを設計する。
実験の結果,第1段増幅を必要としない202nsで99.8%の測定精度が得られた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:45:13 GMT)
A Novel Generative Multi-Task Representation Learning Approach for Predicting Postoperative Complications in Cardiac Surgery Patients [7.4] 機械学習は、術後合併症に対する患者のリスクを特定し、予測するために利用することができる。
新規な手術用変分オートエンコーダを用いて術後合併症の予測と評価を行った。
surgVAEは、クロスタスクとクロスコホートプレゼンテーション学習を通じて固有のパターンを明らかにする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:40:15 GMT)
C-FedRAG: A Confidential Federated Retrieval-Augmented Generation System [7.4] 我々は、FedRAG(Federated Retrieval Augmented Generation)をセキュアにするためのソリューションとして、CC(Confidential Computing)技術を紹介する。
提案するConfidential FedRAGシステム(C-FedRAG)は、コンテキスト機密性を確保することにより、分散化されたデータプロバイダのネットワークをまたいだRAGのセキュアな接続とスケーリングを可能にする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:26:14 GMT)
Denoising Diffusion Probabilistic Models for Magnetic Resonance Fingerprinting [7.4] MRF(Magnetic Resonance Fingerprinting)は、MRIの定量的手法である。
正確な再建を達成することは、特に高度に加速され、アンサンプされた買収において、依然として困難である。
MRF画像再構成のための条件拡散確率モデルを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:32:31 GMT)
IDEQ: an improved diffusion model for the TSP [7.3] IDEQは、トラベリングセールスマン問題の制約された構造を活用することで、ソリューションの品質を向上させる。
IDEQ は DIFUSCO や T2TCO に関して, 都市数に比例して, ばらつきが低く, スケールアップも良好である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:52:50 GMT)
A Survey on Large Language Model-based Agents for Statistics and Data Science [7.2] LLM(Large Language Models)を利用したデータサイエンスエージェントは、従来のデータ分析パラダイムを変える大きな可能性を示している。
この調査は、LLMベースのデータエージェントの進化、機能、および応用の概要を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:03:26 GMT)
Is Peer-Reviewing Worth the Effort? [7.2] 重要な論文の識別にピアレビューはどの程度有効か?
会場と「早期返品」(出版直後の引用)に基づいて、今後どの論文を高く引用するかを予測できますか。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:34:42 GMT)
GenX: Mastering Code and Test Generation with Execution Feedback [7.2] 本稿では,コード生成モデルとテスト生成モデルを同時にトレーニングする新しい手法を提案する。
テストデータとコードデータの増大のための2つの戦略と、コードとテストランキングのための新しいスコアリング機能を導入します。
その結果、我々のモデルは、テストケースやコードソリューションの数の増加で反復的にトレーニングされた場合、元のデータセットでトレーニングされたモデルよりも優れています。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:18:21 GMT)
Airfoil Diffusion: Denoising Diffusion Model For Conditional Airfoil Generation [7.1] 拡散モデルを用いた翼生成のためのデータ駆動手法を提案する。
我々のモデルは、既存の翼のデータセットに基づいて訓練され、ランダムなベクトルから任意の数の新しい翼を生成することができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:29:07 GMT)
MetaRuleGPT: Recursive Numerical Reasoning of Language Models Trained with Simple Rules [7.0] 本稿では,MetaRuleGPTを提案する。
大規模な生のインスタンスデータで構成される従来のトレーニングセットとは対照的に、MetaRuleGPTは、はるかに抽象的なデータセットで事前トレーニングされている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:27:10 GMT)
An Algebraic Notion of Conditional Independence, and Its Application to Knowledge Representation (full version) [7.0] 条件独立の概念は近似不動点理論の枠組みで研究される。
これにより言語に依存しない条件独立性の説明が提供され、固定点意味論を持つあらゆるロジックに簡単に適用できる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:52:57 GMT)
Speed Up the Cold-Start Learning in Two-Sided Bandits with Many Arms [6.8] マルチアームバンディット(MAB)アルゴリズムは、オンライン実験の機会コストを削減するための効率的なアプローチである。
これらのアルゴリズムは、新製品に対する顧客の好みに関する知識が不足しているため、実験の開始時にいわゆるコールドスタートに直面します。
サブサンプリングと低ランク行列推定を最初に用いた二相バンディットアルゴリズムを設計し,ターゲットとする製品群をかなり小さくする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:31:11 GMT)
To Label or Not to Label: Hybrid Active Learning for Neural Machine Translation [6.8] アクティブラーニング(AL)技術は、アノテーションのためのラベルなしデータから、より小さな代表サブセットを選択することで、ニューラルネットワーク翻訳(NMT)モデルのラベリングコストを低減する。
多様性サンプリング手法は不均一なインスタンスを選択するが、不確実なサンプリング手法は最も高いモデル不確実性を持つインスタンスを選択する。
文選択のための不確実性と多様性を組み合わせたNMTにおけるドメイン適応のためのAL戦略であるハイブリッド不確実性と多様性サンプリング(HUDS)を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:18:12 GMT)
Cross-Lingual Transfer of Debiasing and Detoxification in Multilingual LLMs: An Extensive Investigation [6.8] 異なる微調整法がモデルのバイアスと毒性に与える影響について検討する。
キュレートされた非有害テキストの微調整は、バイアスを軽減するのにより効果的であることがわかった。
これらの手法を英語に適用することによって引き起こされる緩和は、英語以外の言語にも伝達される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:05:08 GMT)
Flash Diffusion: Accelerating Any Conditional Diffusion Model for Few Steps Image Generation [6.8] 本稿では,Flash拡散モデルの生成を高速化する,効率的で高速で多用途な蒸留法を提案する。
この手法は、COCO2014とCOCO 2017データセット上の画像生成のために、FIDとCLIP-Scoreの観点から最先端のパフォーマンスに達する。
この手法の汎用性は、テキスト・トゥ・イメージ、インペイント、フェイス・スワッピング、スーパーレゾリューション、UNetベースのデノイザ(SD1.5, SDXL)やDiT(Pixart-$alpha$)などの異なるバックボーンの使用など、いくつかのタスクにまたがる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:45:06 GMT)
AutoSGNN: Automatic Propagation Mechanism Discovery for Spectral Graph Neural Networks [6.8] 本稿では,スペクトルGNNにおける伝搬機構の自動検出フレームワークであるAutoSGNNを提案する。
本稿では,AutoSGNNの性能と効率の両面において,最先端のスペクトルGNNとグラフニューラルアーキテクチャ探索法より優れていることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:57:21 GMT)
Conditioned quantum-assisted deep generative surrogate for particle-calorimeter interactions [6.8] 本研究では,大型ハドロン衝突型加速器シミュレーションのための量子支援深部生成モデルを提案する。
このモデルでは,条件付き変分オートエンコーダ (VAE) と条件付き制限ボルツマンマシン (RBM) を統合する。
RBMノードと接続は、サンプリングのためにD-WaveのPegasus-structured textitAdvantage Quantum Annealer (QA)上でqubitsと couplerを使用するように慎重に設計されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:25:06 GMT)
NeuralPLexer3: Accurate Biomolecular Complex Structure Prediction with Flow Models [6.8] 本稿では, 生体分子間相互作用における最先端の予測精度を実現するフローベース生成モデルであるNeuralPLexer3を提案する。
新たに開発されたベンチマーク戦略により、NeuralPLexer3は、構造ベースの医薬品設計に不可欠な重要な領域に優れています。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:35:10 GMT)
VE-Bench: Subjective-Aligned Benchmark Suite for Text-Driven Video Editing Quality Assessment [6.6] 本稿では,テキスト駆動ビデオ編集の評価に適したベンチマークスイートであるVE-Benchを紹介する。
このスイートには、ビデオ編集のためのビデオ品質アセスメント(VQA)データベースであるVE-Bench DBが含まれている。
VE-Bench QAは、テキストビデオアライメントと、ソースと編集されたビデオ間の関連モデリングに焦点を当てている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:55:40 GMT)
Splitting criteria for ordinal decision trees: an experimental study [6.6] 正規分類 (OC) は、ラベルが自然な順序を示す分類タスクに対処する機械学習分野である。
OCは順序関係を考慮に入れ、より正確で関連する結果を生み出す。
この研究は、順序関係を捉えるために設計された木に基づく方法論の実験的研究を行う。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:41:44 GMT)
The Impact of Geometric Complexity on Neural Collapse in Transfer Learning [6.6] 損失面の平坦さと神経崩壊は、最近、有用な事前学習指標として現れている。
実験と理論を通じて、事前学習されたネットワークの幾何学的複雑さに影響を与えるメカニズムが神経崩壊に影響を及ぼすことを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:53:47 GMT)
Data-driven Discovery of Biophysical T Cell Receptor Co-specificity Rules [6.5] 本稿では,TCRがリガンドに特異性を共有するかどうかを予測する,生物物理規則の発見のための最適化フレームワークを提案する。
このフレームワークをSARS-CoV-2ペプチドのコレクションに関連するTCRに適用することにより、共特異性は受容体間のアミノ酸相違のタイプと位置に依存するかを確立する。
本分析により, 置換アミノ酸間の立体特性のマッチングは, より顕著に進化置換性を決定する疎水性特性とは対照的に, 重要な受容体共特異性であることが明らかとなった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:03:26 GMT)
Gradual Vigilance and Interval Communication: Enhancing Value Alignment in Multi-Agent Debates [6.5] マルチエージェント・ディベート(MAD)はエージェント間相互作用による信頼性の高い回答の生成を可能にすることにより、より効率的で革新的なソリューションを提供する。
Gradual Vigilance and Interval Communication (GVIC) は、エージェントが様々なレベルの警戒でリスクを評価し、インターバルコミュニケーションを通じて様々な情報を交換することを可能にする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:36:08 GMT)
MetaphorShare: A Dynamic Collaborative Repository of Open Metaphor Datasets [6.4] MetaphorShareはメタファデータセットを統合するウェブサイトで、オープンでアクセスしやすい。
Webサイトには、アップロード、ダウンロード、検索、ラベルメタファーの4つの主要な機能がある。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:28:19 GMT)
RAG for Effective Supply Chain Security Questionnaire Automation [6.2] 本稿では,自然言語処理(NLP)と検索拡張生成(RAG)を用いた新しい手法を提案する。
我々は,大規模言語モデル(LLM)と高度な検索システムを統合することで,多様な文書形式を解釈し,正確な応答を生成するシステムであるQuestSecureを開発した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:07:32 GMT)
On Calibration in Multi-Distribution Learning [6.2] マルチディストリビューション学習(MDL)の校正特性について検討する。
まず、MDLのベイズ最適規則を導出し、関連する損失関数の一般化エントロピーを最大化することを示した。
解析の結果,本手法は最小の最悪の損失を許容するが,複数の分布に一様でないキャリブレーション誤差を生じさせる可能性が示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:41:40 GMT)
Enhancing Talk Moves Analysis in Mathematics Tutoring through Classroom Teaching Discourse [6.2] 本稿では,会話の動きを用いた数学の授業内容の分析に焦点をあてる。
機械学習モデルを開発するために、広範な学習対話の収集、アノテーション、分析をスケールすることは、困難でリソース集約的なタスクである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:13:04 GMT)
Walk Wisely on Graph: Knowledge Graph Reasoning with Dual Agents via Efficient Guidance-Exploration [6.1] 階層的強化学習(HRL)に基づく二重エージェントを用いたマルチホップ推論モデルを提案する。
FULORAは、二重エージェント間のeFficient GUidance-ExpLORAtionによる上記の推論課題に取り組む。
3つの実単語知識グラフデータセットで実施された実験では、FULORAがRLベースのベースラインより優れていることが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:31:42 GMT)
Comparing Differentiable and Dynamic Ray Tracing: Introducing the Multipath Lifetime Map [6.1] これらの課題に対処するために、微分可能および動的レイトレーシングフレームワークが登場した。
この2つのテクニックの概要と、NVIDIAのUniBoの3DSCATとSionnaの2つの最先端ツールの比較分析について述べる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:10:56 GMT)
AnchorInv: Few-Shot Class-Incremental Learning of Physiological Signals via Representation Space Guided Inversion [5.9] ディープラーニングモデルは、様々な現実世界のアプリケーションで例外的なパフォーマンスを示してきた。
これらの結果は、大量の高品質なデータが利用可能であることに基づいている。
本稿では,特徴空間のアンカーポイントによって誘導される合成サンプルを生成するAnchorInvを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:53:30 GMT)
SEKE: Specialised Experts for Keyword Extraction [5.9] キーワード抽出は、文書の中で最も記述的な単語を特定することを含む。
本稿では,専門家(MoE)の手法を併用した新しい教師付きキーワード抽出手法を提案する。
MoEは学習可能なルーティングサブネットワークを使用して、専門家に情報を指示し、入力空間の異なる領域を専門化することができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:34:32 GMT)
Energy-Based Preference Model Offers Better Offline Alignment than the Bradley-Terry Preference Model [5.9] 我々は、KL制約付きRLHF損失による目標LLMと人間の嗜好との整合性は、数学的に特別な種類の報酬モデリングタスクと等価であることを示す。
我々は、常に一意な極大推定器(MLE)を持つエネルギーベースモデル(EBM)を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:55:42 GMT)
Closing the Gap: A User Study on the Real-world Usefulness of AI-powered Vulnerability Detection & Repair in the IDE [5.8] プロのソフトウェア開発者が所有する実際のプロジェクトで、脆弱性検出と修正ツールを実装しています。
DeepVulGuardは脆弱性のコードをスキャンし、修正を提案し、警告と修正の自然言語説明を提供し、チャットインターフェースを活用する。
最先端のAIによる検出と修正ツールは、将来性を示しているが、偽陽性や適用不可能な修正の頻度が高いため、現実世界での使用には実用的ではない。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:19:56 GMT)
AGFSync: Leveraging AI-Generated Feedback for Preference Optimization in Text-to-Image Generation [5.8] AGFSyncは、AI駆動のアプローチでDPO(Direct Preference Optimization)を通じてT2I拡散モデルを強化するフレームワークである。
AGFSyncのT2I拡散モデルの精製方法は、スケーラブルなアライメント手法の道を開く。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:14:48 GMT)
Pole and zero edge state invariant for 1D non-Hermitian sublattice symmetry [5.8] 1次元非エルミート2バンド部分格子対称強結合ハミルトン多様体における位相的エッジ状態
一般化ブリルアンゾーン(GBZ)アプローチは、複素ウェーブベクトル空間におけるGBZ輪郭上のベリー接続の統合を利用する。
代替極零」アプローチは、超格子対称ハミルトン多様体の非対角行列要素の代数的性質を非対角形式で用いる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:33:01 GMT)
AnySat: An Earth Observation Model for Any Resolutions, Scales, and Modalities [5.8] 本稿では,JEPAと分解能適応型空間エンコーダに基づくマルチモーダルモデルであるAnySatを提案する。
この統一アプローチの利点を示すために、5ドルのマルチモーダルデータセットのコレクションであるGeoPlexをコンパイルする。
次に、これらの多様なデータセット上で、単一の強力なモデルを同時にトレーニングします。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:11:53 GMT)
SimADFuzz: Simulation-Feedback Fuzz Testing for Autonomous Driving Systems [5.7] SimADFuzzは、自律運転システムにおける違反を明らかにする高品質なシナリオを生成するように設計された、新しいフレームワークである。
SimADFuzzは、シナリオ選択を最適化するために、ADS違反の可能性を評価する違反予測モデルを採用している。
総合的な実験により、SimADFuzzは32以上のユニークな違反を識別することで最先端のファズーより優れていることが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:49:57 GMT)
Development and Adoption of SATD Detection Tools: A State-of-practice Report [5.7] Self-Admitted Technical Debt (SATD)は、開発者が故意に最適化されたソリューションをコードに導入するインスタンスを指す。
本稿では,SATD検出ツールの開発と導入に関する総合的な状況報告を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:06:53 GMT)
Contextual Decision-Making with Knapsacks Beyond the Worst Case [5.7] 資源制約を伴う動的意思決定シナリオの枠組みについて検討する。
このフレームワークでは、エージェントがランダムな要求を観察すると、各ラウンドでアクションを選択する。
我々のアルゴリズムは最悪の場合であっても、ほぼ最適の$widetildeO(sqrtT)$ regretを維持していることを証明している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:29:19 GMT)
Catalysts of Conversation: Examining Interaction Dynamics Between Topic Initiators and Commentors in Alzheimer's Disease Online Communities [5.6] 本研究では,2大アルツハイマー病と関連認知症(ADRD)のオンラインコミュニティにおけるユーザインタラクションのダイナミクスについて検討した。
アクティブなトピックイニシアチブのエンゲージメントがコメントのボリュームを増大させることがわかった。
実践的なケアのトピックは、トピックイニシアチブの再導入を促す一方で、感情的なサポートトピックは、他のコメンテーターからより多くのコメントを引き付ける。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:00:41 GMT)
LLMs can realize combinatorial creativity: generating creative ideas via LLMs for scientific research [5.6] 本稿では,Large Language Models (LLM) を用いた創造性理論を明示的に実装するフレームワークを提案する。
このフレームワークは、クロスドメイン知識発見のための一般化レベル検索システムと、アイデア生成のための構造化プロセスを備えている。
OAG-Benchデータセットの実験は、我々のフレームワークの有効性を実証し、実際の研究成果と整合したアイデアを生成するためのベースラインアプローチを一貫して上回っている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:41:14 GMT)
A Unifying Information-theoretic Perspective on Evaluating Generative Models [5.5] 最近のいくつかのアプローチでは、分類領域から借用された「精度」と「リコール」を利用して、出力の忠実度(リアリズム)と出力の多様性(実データ変動の表現)を個別に定量化している。
我々は、kNN密度推定のアプローチを用いて、kth-nearest-neighbors(kNN)ベースのメトリクスのクラスを情報理論レンズの下に統一する。
高精度クロスエントロピー(PCE)、リコールクロスエントロピー(RCE)、リコールエントロピー(RE)からなる3次元計量を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:17:02 GMT)
Optimizing Quantum Transformation Matrices: A Block Decomposition Approach for Efficient Gate Reduction [5.5] 本稿では,制限されたゲート数で量子変換行列を近似するアルゴリズムを提案する。
Block Decomposeアルゴリズムにインスパイアされた我々のアプローチは、変換行列をブロックワイズに処理する。
シミュレーションは、ゲートが著しく少ない近似変換におけるアルゴリズムの有効性を検証する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:54:45 GMT)
SplitFedZip: Learned Compression for Data Transfer Reduction in Split-Federated Learning [5.4] SplitFederated(SplitFed)学習は、さまざまなドメインにわたる理想的な学習フレームワークです。
SplitFedZipは、SplitFed学習におけるデータ転送を減らすために学習圧縮を利用する新しい方法である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:04:19 GMT)
REVECA: Adaptive Planning and Trajectory-based Validation in Cooperative Language Agents using Information Relevance and Relative Proximity [5.4] REVECAはGPT-4o-miniを利用した新しい認知アーキテクチャである。
効率的なメモリ管理、最適なプランニング、偽プランニングの費用対効果の防止を可能にする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:38:06 GMT)
Online Influence Campaigns: Strategies and Vulnerabilities [5.3] 本稿では,悪意あるアクターによる非正統的で社会的に大規模な操作の概念を定義し,文脈を規定する。
本稿では、社会的に有害なコンテンツに関する文献と、そのようなアクターが使用する操作戦略とそれらがターゲットとする脆弱性を分析するためにどのように増殖するかを概観する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:29:29 GMT)
Anchoring Bias in Large Language Models: An Experimental Study [5.2] GPT-4やGeminiのような大規模言語モデル(LLM)は、非常に高度な人工知能を持っている。
この研究は、初期情報が判断に不均衡に影響を及ぼす認知バイアスであるアンカーリングバイアスを論じる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:08:45 GMT)
Urban traffic analysis and forecasting through shared Koopman eigenmodes [5.2] データ量の多い都市における交通流の予測は、限られた歴史的データのために困難である。
データ豊かな都市に共通する周期パターンを同定することで、伝達学習を活用する。
この方法は、交通パターンの一般的な固有モード(アーバンハートビート)を明らかにし、それらをデータ共有都市に転送する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:00:35 GMT)
"There Has To Be a Lot That We're Missing": Moderating AI-Generated Content on Reddit [5.2] ジェネレーティブAIは、私たちの働き方、学び方、コミュニケーション方、オンラインコミュニティへの参加方法を変え始めている。
我々は、AIGCによるオンラインコミュニティモデレーターの経験に焦点を当てる。
我々の研究によると、AIGCに関するルールは、コンテンツ品質、社会的ダイナミクス、ガバナンスの課題に対する懸念によって動機づけられている。
我々は、AIGCを検知するばかげたツールがないにもかかわらず、モデレーターは、コミュニティと協力して規範を明確にすることで、この新しい現象によって引き起こされる混乱を幾らか抑制することができた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:58:56 GMT)
Preconditioned Subspace Langevin Monte Carlo [5.2] 副空間ランゲヴィン・モンテカルロと呼ばれる高次元サンプリングのための新しい効率的な手法を開発した。
これらの手法の第一の応用は、プレコンディション付きランゲヴィンモンテカルロを効率的に実装することである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:12:41 GMT)
An introduction to reinforcement learning for neuroscience [5.0] 強化学習は神経科学の豊富な歴史を持っている。
深い強化学習は神経科学の新たな洞察につながった。
議論されたメソッドを実装して図を生成するコードも提供される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:39:02 GMT)
Pattern Matching in AI Compilers and its Formalization (Extended Version) [5.0] PyPMは、リライトベースの最適化パスを構築するためのPythonベースのドメイン固有言語である。
我々は、PyPMの構築と、この複雑さの形式化と蒸留について、理解可能な数学的コアに提示する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:29:09 GMT)
THÖR-MAGNI Act: Actions for Human Motion Modeling in Robot-Shared Industrial Spaces [4.9] 本稿では TH"OR-MAGNI Act データセットについて紹介する。
TH"OR-MAGNI Actは、アイトラッキングメガネで記録されたエゴセントリックなビデオから、手動で8.3時間の参加者アクションをラベル付けする。
本研究では,行動条件付き軌道予測と共同行動,軌道予測の2つのタスクに対するTH"OR-MAGNI法の有用性を実証する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:08:25 GMT)
Guardians of the Ledger: Protecting Decentralized Exchanges from State Derailment Defects [4.9] 本研究は,DECプロジェクトにおける脱線欠陥に関する最初の系統的研究である。
本稿では,DeXスマートコントラクトにおける状態脱線欠陥を検出するための,新しいディープラーニングベースのフレームワークStateGuardを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:21:51 GMT)
Automatically Refining Assertions for Efficient Debugging of Quantum Programs [4.7] 量子プログラムにアサーションを適切に配置することが鍵となる。
これは通常、プログラムの基礎となる数学的性質を深く理解する必要がある。
本研究では,量子プログラムにおけるアサーションを自動的に精製する手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:00:03 GMT)
Surrealistic-like Image Generation with Vision-Language Models [4.7] 本稿では、視覚言語生成モデルを用いて、超現実主義運動における絵画のスタイルにおける画像の生成について検討する。
本研究は、様々な画像生成設定と異なるモデルに基づく画像の生成から始まる。
我々は、選択したモデルの性能を評価し、そのような画像を生成する能力について貴重な知見を得る。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:03:26 GMT)
On Explaining Knowledge Distillation: Measuring and Visualising the Knowledge Transfer Process [4.7] 知識蒸留のための勾配に基づく視覚的説明法UniCAMを提案する。
教師の知識の指導により、学生モデルはより効率的になり、関係のないものを捨てながら、より関連性の高い特徴を学習する。
CIFAR10、ASIRRA、植物病のデータセットの実験は、UniCAMと2つの指標がKDプロセスを説明する貴重な洞察を提供することを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:25:36 GMT)
Navigating limitations with precision: A fine-grained ensemble approach to wrist pathology recognition on a limited x-ray dataset [4.7] 本研究は,手首の病理診断を微細な視覚認識問題として取り組んだものである。
我々は,X線中の識別領域を特定するために,特殊なFGVRベースのアンサンブルアプローチを導入する。
私たちはこれらの領域を特定するために、Grad-CAMと呼ばれる説明可能なAI(XAI)技術を使用します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:23:54 GMT)
Parameter-efficient Fine-tuning for improved Convolutional Baseline for Brain Tumor Segmentation in Sub-Saharan Africa Adult Glioma Dataset [4.6] 本稿では,畳み込み型アダプタを提案する。
MedNeXtアーキテクチャの微細チューニング(PEFT)。
提案手法は完全微調整に匹敵する性能を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:48:32 GMT)
DTW+S: Shape-based Comparison of Time-series with Ordered Local Trend [4.6] そこで,同時期に発生し,容易に解釈可能な類似の傾向を求める尺度を開発した。
本稿では,時系列の解釈可能な「閉鎖性保存」行列表現を生成する新しい尺度DTW+Sを提案する。
DTW+Sは,ベースラインと比較して優れたクラスタリングを実現できる唯一の尺度であることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:23:16 GMT)
Reducing QUBO Density by Factoring Out Semi-Symmetries [4.6] 本稿では,QUBO行列におけるテクステミシンメトリの概念を紹介する。
提案アルゴリズムは結合数と回路深さを最大45%削減することを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:05:18 GMT)
Measuring DNS Censorship of Generative AI Platforms [4.5] DNSプロトコルを通じて生成AI検閲を監視する。
われわれは中国がジェネレーティブAI検閲の主要な国だと考えている。
また、ロシアにおける検閲を報告し、その過程で不整合を見つけます。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:29:29 GMT)
Distribution Shifts at Scale: Out-of-distribution Detection in Earth Observation [4.5] アウト・オブ・ディストリビューション(OOD)検出は、イン・ディストリビューション(ID)データとは異なる入力を特定するという課題に対処する。
スケーラブルな地理空間展開のためのポストホックOOD検出手法であるTARDISを提案する。
本手法は,事前学習モデル,IDデータWILDサンプル,WILDサンプルを用いて,後者をサロゲートIDに分離し,OODラベルをサロゲートする。
スケーラビリティを示すために、我々はFields of the WorldデータセットにTARDISをデプロイし、大規模デプロイメントのためのトレーニング済みモデルの振る舞いに関する実行可能な洞察を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:10:44 GMT)
Lyapunov Analysis For Monotonically Forward-Backward Accelerated Algorithms [4.4] ネステロフの加速勾配法(NAG)は勾配に基づく最適化の目覚ましい進歩である。
強凸函数に対しては、NAG が線型収束するかどうかは開問題である。
我々は、勾配項を導入して反復関係を修正し、新しい勾配に基づく反復関係を導出する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:09:00 GMT)
Learning Complex Word Embeddings in Classical and Quantum Spaces [4.4] 我々は、高度に最適化されたC言語バージョンのSkip-gramを複雑に評価したバージョンを開発した。
我々は3.8Bワードコーパスで訓練された複雑な埋め込みを400k以上の語彙サイズで生成する。
我々は,一連の標準類似性および関連性データセットに対する複雑な埋め込みを評価する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:26:51 GMT)
FedSTaS: Client Stratification and Client Level Sampling for Efficient Federated Learning [4.4] フェデレートラーニング(FL)は、複数の分散クライアントをまたいだグローバルモデルの協調的なトレーニングを、プライバシ保護の方法で行う。
textitFedSTS と textitFedSampling にインスパイアされたクライアントおよびデータレベルのサンプリング手法である textitFedSTaS を提案する。
textitFedSTaSは、一定回数のトレーニングラウンドにおいて、textitFedSTSよりも高い精度のスコアが得られることを示す実験である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:31:34 GMT)
Which Imputation Fits Which Feature Selection Method? A Survey-Based Simulation Study [4.3] 特徴重要度尺度は、通常、特徴選択とモデルにおける結果変数に対する特徴の影響を評価するために考慮される。
典型的な解決策は、学習方法を適用する前に、欠落したデータをインプットすることである。
我々は、ランダムフォレスト(Random Forest)とXGBoost(XGBoost)の2つの最も一般的なツリーベース手法と、正規化を伴う解釈可能な線形モデルを考える。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:36:03 GMT)
Certification of Speaker Recognition Models to Additive Perturbations [4.3] 対人攻撃に対する 話者認識システムの堅牢性は 重要な課題です
我々はまず,画像領域向けに開発された話者認識に頑健性認証技術を適用した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:52:17 GMT)
Attentive Eraser: Unleashing Diffusion Model's Object Removal Potential via Self-Attention Redirection Guidance [4.3] Attentive Eraser は、安定かつ効果的な物体除去のために、事前訓練された拡散モデルを強化するチューニング不要な手法である。
本稿では、自己注意機構を再設計するASS(Attention Activation and Suppression)を紹介する。
また、ASSによる自己注意リダイレクトを利用して生成プロセスのガイドを行う自己注意リダイレクトガイダンス(SARG)についても紹介する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:52:14 GMT)
Almost-linear Time Approximation Algorithm to Euclidean $k$-median and $k$-means [4.3] Euclidean $k$-medianと$k$-meansの問題、クラスタリングのタスクをモデル化する標準的な2つの方法に注目します。
本稿では,定数係数近似を計算するためのほぼ線形時間アルゴリズムを提案することにより,この問題にほぼ答える。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:53:03 GMT)
Evidential Deep Learning for Probabilistic Modelling of Extreme Storm Events [4.3] Evidential Deep Learning(EDL)は、その予測に対する信頼性を提供するために設計された、不確実性を認識したディープラーニングアプローチである。
EDLは計算オーバーヘッドを減らすだけでなく、予測の不確実性を高める。
この手法は、気候リスク評価などの研究分野における新たな機会を開拓する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:03:19 GMT)
Quantified Linear and Polynomial Arithmetic Satisfiability via Template-based Skolemization [4.3] 既存の手法の主なボトルネックは計算コストのかかる定量化器の除去ステップである。
テンプレートに基づく Skolemization 手法を提案し,線形/ポリノミカルな Skolem 関数を自動的に合成し,式中の量化子を除去する。
提案手法は, 高性能な実用性能と相まって, 魅力的な理論特性を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:37:15 GMT)
Autonomous Microscopy Experiments through Large Language Model Agents [4.2] 大規模言語モデル(LLM)は、材料研究のための自動運転研究所(SDL)の開発を加速させた。
本稿では,原子間力顕微鏡(AFM)を自動化するフレームワークであるAILA(Artificially Intelligent Lab Assistant)を紹介する。
我々の体系的な評価は、最先端の言語モデルがドキュメント検索のような基本的なタスクに悩まされていることを示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:35:28 GMT)
QuLTSF: Long-Term Time Series Forecasting with Quantum Machine Learning [4.2] 長期時系列予測では、過去の値に基づいて、時系列の多くの将来の値を予測する。
最近の量子機械学習(QML)は、古典的な機械学習モデルの能力を高めるための領域として進化している。
平均二乗誤差の低減と平均絶対誤差の両面から、最先端の古典的線形モデルに対するQuLTSFの利点を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:06:52 GMT)
Evidence Contextualization and Counterfactual Attribution for Conversational QA over Heterogeneous Data with RAG Systems [4.1] Retrieval Augmented Generation(RAG)は、会話質問回答(ConvQA)を介して企業のデータと対話するためのバックボーンとして機能する。
本研究では,RAGONITE(RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE ,RAGONITE,RAGONITE,RAGONITE,RAAG,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGONITE,RAGO NITE)について述べる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:01:52 GMT)
SEREP: Semantic Facial Expression Representation for Robust In-the-Wild Capture and Retargeting [4.1] セマンティック表現表現(Semantic Expression Representation, SEREP)は, セマンティックレベルで表現を同一性から切り離すモデルである。
我々は、ドメイン適応に依存する新しい半教師付きスキームを用いて、単眼画像から表現を予測するモデルを訓練する。
実験の結果、SEREPは最先端の手法よりも優れており、挑戦的な表現を捉え、それらを新しいアイデンティティに転送する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:12:28 GMT)
A Cognitive Ideation Support Framework using IBM Watson Services [4.0] 我々は,IBM Watson DeepQAサービスを利用した思考のための新しい認知支援フレームワークを提案する。
提案されたフレームワークは、組織が創造的なアイデアを開発するのを支援するために、Associative Memory(SIAM)モデルに基づく。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:41:51 GMT)
CPPJoules: An Energy Measurement Tool for C++ [3.9] CPPJoulesはIntel-RAPL上に構築されたC++コードスニペットのエネルギー消費を測定するツールである。
我々は,Rosetta Codeレポジトリから標準計算タスクのエネルギー消費を測定することで,ツールの評価を行った。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:11:56 GMT)
Embedding Cultural Diversity in Prototype-based Recommender Systems [3.9] レコメンデーションシステムにおける人気バイアスは、支配的な文化からの規範を支持することによって、文化的過剰表現を増加させる可能性がある。
本研究では,プロトタイプに基づく行列因数分解法において,人口統計バイアスを同定することで,人気バイアスに対処する。
その結果, 長身品の平均ランクは27%減少し, 少数国のアイテムの平均ランクは2%低下した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:57:33 GMT)
Semantics-Aware Next-best-view Planning for Efficient Search and Detection of Task-relevant Plant Parts [3.9] トマトの収穫・脱葉を自動化するためには, 作業関連部位の探索と検出が重要である。
現在のアクティブビジョンアルゴリズムは、関連する部分と無関係な植物部位を区別できない。
本研究は,意味情報を用いて植物部位を識別するセマンティックス対応アクティブビジョン戦略を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:34:18 GMT)
Dialogue with the Machine and Dialogue with the Art World: Evaluating Generative AI for Culturally-Situated Creativity [3.8] 社会学者ハワード・ベッカーのアート・ワールドの概念に基づいて、この手法は伝統的なAIと創造性評価の範囲を広げる。
1)「美術界との対話」と「美術史家・学芸家・考古学者との対話」と,(2)「機械との対話」の2つの対話は,構造化された芸術家と評論家による最先端のジェネレーティブAIツールによる実験を通じて促進される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:21:14 GMT)
Two Layer Walk: A Community-Aware Graph Embedding [3.8] Two Layer Walk (TLWalk) は階層的なコミュニティ構造を組み込んだグラフ埋め込みアルゴリズムである。
TLWalkはコミュニティ対応のランダムウォーク機構を通じて、コミュニティ内およびコミュニティ間関係のバランスをとる。
ベンチマークデータセットの実験では、TLWalkは最先端のメソッドよりも優れています。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:52:01 GMT)
A Concept-Centric Approach to Multi-Modality Learning [3.8] 我々は、より効率的なAIシステムを構築するために、新しいマルチモーダリティ学習フレームワークを導入する。
我々のフレームワークは、より効率的な学習曲線を示しながら、ベンチマークモデルと同等に達成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:40:21 GMT)
Let Curves Speak: A Continuous Glucose Monitor based Large Sensor Foundation Model for Diabetes Management [3.8] AIと継続的グルコースモニタリングを統合することは、近い将来のグルコース予測を約束する。
CGM-LSMは592人の糖尿病患者からの1596万のブドウ糖の記録に基づいて、近未来のグルコース予測のために事前訓練されている。
LSMは1型糖尿病患者29.81mg/dL、23.49mg/dLである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:07:48 GMT)
Analyzing Toxicity in Open Source Software Communications Using Psycholinguistics and Moral Foundations Theory [3.8] 本稿では,オープンソースソフトウェア(OSS)における有害通信の自動検出のための機械学習によるアプローチについて検討する。
我々は精神言語学のレキシコンとモラル・ファンデーションズ・理論を利用して、OSSコミュニケーションチャネルの2種類の毒性を分析し、コメントとコードレビューを発行する。
道徳的価値を特徴として使うことは言語的手がかりよりも効果的であり、コードレビューデータ中の有害なインスタンスを67.50%、問題コメントを64.83%特定するF1尺度となる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:47:49 GMT)
Adapting Multilingual LLMs to Low-Resource Languages with Knowledge Graphs via Adapters [3.7] 本稿では,言語から多言語大モデル(LLM)へのグラフ知識の統合について検討する。
我々は、感情分析(SA)および名前付きエンティティ認識(NER)における低リソース言語(LRL)の性能向上のために、言語固有のアダプタを使用している。
構造化グラフ知識が,SA および NER における LRL の多言語 LLM の性能に与える影響を評価する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:09:31 GMT)
Safeguarding Virtual Healthcare: A Novel Attacker-Centric Model for Data Security and Privacy [3.5] 遠隔医療提供は、保護された健康情報(PHI)に重大なセキュリティとプライバシのリスクをもたらした
本研究では,このようなセキュリティ事件の根本原因を調査し,攻撃者中心アプローチ(ACA)を導入する。
ACAは、全体的な攻撃に焦点を当てた視点を採用することで、既存の脅威モデルと規制フレームワークの制限に対処する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:21:53 GMT)
Gauss-Newton Dynamics for Neural Networks: A Riemannian Optimization Perspective [3.5] 我々は,スムーズな活性化関数を持つニューラルネットワークを学習するためのガウスニュートン力学の収束性を分析する。
適切に選択された減衰係数を持つレバンス・マルカルト力学は、不条件カーネルに対してロバスト性をもたらすことを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:51:47 GMT)
Combining Priors with Experience: Confidence Calibration Based on Binomial Process Modeling [3.5] 既存の信頼性校正法は主に統計手法を用いてデータから校正曲線を推定する。
推定キャリブレーション曲線を利用して真のキャリブレーション誤差(TCE)を推定する新しいキャリブレーション計量(TCE_bpm$)を設計する。
実世界およびシミュレーションデータにおいて,キャリブレーション手法と測定値の有効性を検証した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:20:05 GMT)
Lifting Scheme-Based Implicit Disentanglement of Emotion-Related Facial Dynamics in the Wild [3.4] In-the-the-wild dynamic expression Recognition (DFER)は、感情に関連する表情を認識する上で重要な課題に遭遇する。
IFDD(Implicit Facial Dynamics Disentanglement framework)を提案する。
IFDDは感情に無関係な世界的文脈から感情に関連する動的情報を暗黙的に切り離す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:47:15 GMT)
SHAP scores fail pervasively even when Lipschitz succeeds [3.4] 最近の研究は、計算されたSHAPスコアが完全に満足できない機械学習(ML)分類器の例を考案した。
SHAPスコアでどの程度問題が特定されたかは明らかでない。
本稿では,ブール分類器に対して,SHAPスコアを満足できないものとみなさなければならない事例が任意に多数存在することを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:02:15 GMT)
MBInception: A new Multi-Block Inception Model for Enhancing Image Processing Efficiency [3.4] 本稿では,畳み込みニューラルネットワークフレームワーク内で連続する3つの開始ブロックを用いた,革新的な画像分類モデルを提案する。
モデルとVisual Geometry Group、Residual Network、MobileNetといった確立したアーキテクチャを比較した。
その結果、私たちの新しいモデルは、さまざまなデータセットで一貫してそのモデルよりも優れています。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:46:04 GMT)
Multi-Exposure Image Fusion via Distilled 3D LUT Grid with Editable Mode [3.4] 既存のマルチ露光画像融合アルゴリズムは、リアルタイムに超高解像度の高ダイナミックレンジ画像を生成するのに苦労している。
資源制約のあるデバイス上で,超高精細(UHD)解像度で画像をリアルタイムに高精細化できる3D LUT技術を導入する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:33:16 GMT)
On Enhancing Root Cause Analysis with SQL Summaries for Failures in Database Workload Replays at SAP HANA [3.3] リプレイ時に発生する障害の根本原因分析を自動化するために,機械学習ベースのフレームワークを採用している。
トレーニングデータに見つからない新しい問題を扱うことは、機械学習アプローチの一般的な課題である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:07:54 GMT)
Real-Time Position-Aware View Synthesis from Single-View Input [3.3] 本稿では,1つの入力画像とターゲットポーズからリアルタイムなビュー合成を実現する軽量な位置認識ネットワークを提案する。
この作業は、ライブおよびインタラクティブなアプリケーションのために、単一の画像からリアルタイムのビュー合成を可能にするための一歩となる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:20:21 GMT)
Understanding and Analyzing Model Robustness and Knowledge-Transfer in Multilingual Neural Machine Translation using TX-Ray [3.3] 本研究では,言語間の知識伝達が,極低リソース環境におけるニューラルマシン翻訳(MNMT)をいかに向上させるかを検討する。
我々は、最小限の並列データを利用して、英語・ドイツ語・英語・フランス語・英語・スペイン語の翻訳を行い、言語間マッピングを確立する。
逐次移動学習は40kパラレル文コーパスのベースラインよりも優れており,その有効性を示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:21:58 GMT)
Personalized Generative Low-light Image Denoising and Enhancement [3.2] 本稿では,異なるユーザ向けにカスタマイズされた拡散モデルを構築することにより,個人化生成デノベーション(PGD)を提案する。
私たちの中心となるイノベーションは、ギャラリーから人物の物理的属性を抽出するアイデンティティ一貫性のある物理バッファです。
幅広い低照度テストシナリオにおいて、PGDは優れた画像復調性能と高精細化性能を実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:43:38 GMT)
Tree-of-Code: A Hybrid Approach for Robust Complex Task Planning and Execution [3.2] 本稿では,toC(Tree-of-Code)と呼ばれる新しい手法を提案する。
本フレームワークでは,各最終的なコード実行結果を決定ツリーのノードとして扱う。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:47:17 GMT)
Multi-OphthaLingua: A Multilingual Benchmark for Assessing and Debiasing LLM Ophthalmological QA in LMICs [3.2] 大型言語モデル(LLM)は、様々な眼科手術を自動化するための有望なソリューションを提供する。
LLMは、自然言語の問合せタスクにおいて、様々な言語で顕著に異なる性能を示してきた。
本研究は,複数言語にまたがる質問を手作業でキュレートした,最初の多言語眼科的質問答えベンチマークを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:18:03 GMT)
Are Vision xLSTM Embedded UNet More Reliable in Medical 3D Image Segmentation? [3.2] 本稿では,CNNとVision-xLSTM(Vision-xLSTM)の統合について検討する。
ビジョン-xLSTMブロックは、CNNの機能マップから抽出されたパッチ内の時間的およびグローバルな関係をキャプチャする。
我々の主な目的は、Vision-xLSTMが医用画像セグメンテーションの適切なバックボーンを形成し、計算コストを削減して優れた性能を提供することである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:26:10 GMT)
Modeling Short-Range Microwave Networks to Scale Superconducting Quantum Computation [3.2] チップレットとして知られる小さな量子ビットアレイをまたいだ分散量子コンピューティングは、これらの課題をスケーラブルな方法で解決することができる。
短期ハードウェア上でのモノリシック性能を超える可能性のあるマイクロ波リンク上のチップレットアーキテクチャを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:40:29 GMT)
Singular transport in non-equilibrium strongly internal-coupled 1D tilted field spin-1/2 chain [3.2] 本研究は、傾斜磁場に浸漬された一次元非平衡イジング鎖を研究する。
すべてのスピンは、散逸系の環境相互作用でボソン貯水池に接触する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:00:58 GMT)
Protect Measurement-Induced Phase Transition from Noise [3.1] 本研究では, 環境騒音から測定誘起相転移(MIPT)を効果的に保護できることを示す。
また,(2+1)次元量子回路の雑音下でのMIPTの数値実験を行った。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:14:58 GMT)
Coherent Information Phase Transition in a Noisy Quantum Circuit [3.1] ノイズの多い監視量子回路に量子強調演算を導入する。
この遷移は、ノイズと量子化演算の相対周波数によって変調される。
この位相遷移を特徴付けるための資源効率の高いプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:54:51 GMT)
Seeking Consistent Flat Minima for Better Domain Generalization via Refining Loss Landscapes [3.1] ドメインの一般化は、複数のトレーニングドメインからモデルを学び、それを見えないテストドメインに一般化することを目的としています。
最近の理論では、損失ランドスケープの平坦なミニマムにパラメータを持つ深層モデルを求めることは、領域外一般化誤差を著しく減少させることが示されている。
既存の手法は、異なる領域における損失ランドスケープの整合性を無視することが多く、結果として、全ての領域において最適な平坦なミニマに同時に存在しないモデルが生じる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:45:30 GMT)
Hansel: Output Length Controlling Framework for Large Language Models [3.1] Hanselは大規模言語モデルにおける長さ制御のための効率的なフレームワークである。
このフレームワークは、モデルの微調整段階において、事前訓練されたLLMに適用することができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:52:38 GMT)
Sequence Matters: Harnessing Video Models in 3D Super-Resolution [3.0] 3次元超解像は、低解像度(LR)マルチビュー画像から高忠実度3Dモデルを再構成することを目的としている。
ビデオ超解像モデル(VSR)を利用した3次元超解像の包括的研究を行う。
以上の結果から,VSRモデルでは正確な空間アライメントが欠如している配列でも極めて良好に動作できることが判明した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:00:13 GMT)
Methods to Assess the UK Government's Current Role as a Data Provider for AI [3.0] 本稿では, 設計, 力学, 限界を詳細に解説し, 技術的報告として機能する。
ODIのWebサイトには、実験と重要な発見を要約し、それらを解釈し、英国政府がAIポリシーの設計を進めるための実用的なレコメンデーションのセットを構築するという、補完的な非技術レポートが添付されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:55:28 GMT)
Context Matters: Leveraging Contextual Features for Time Series Forecasting [3.0] 既存の予測モデルにマルチモーダルなコンテキスト情報を外科的に統合する新しいプラグイン・アンド・プレイ手法であるContextFormerを導入する。
ContextFormerは、カテゴリ、連続、時間変化、さらにはテキスト情報を含む、リッチなマルチモーダルコンテキストから予測固有の情報を効果的に蒸留する。
エネルギー、交通、環境、金融ドメインにまたがるさまざまな実世界のデータセットにおいて、SOTA予測モデルを最大30%上回ります。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:01:18 GMT)
From Prejudice to Parity: A New Approach to Debiasing Large Language Model Word Embeddings [2.9] DeepSoftDebiasは、ニューラルネットワークを使って'ソフトデバイアス'を実行するアルゴリズム
我々は、このアルゴリズムを様々なSOTAデータセット、精度メトリクス、難解なNLPタスクで徹底的に評価する。
DeepSoftDebiasは、性別、人種、宗教の偏見を減らし、最先端の手法よりも優れています。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:28:54 GMT)
In-Group Love, Out-Group Hate: A Framework to Measure Affective Polarization via Contentious Online Discussions [2.9] 我々は、感情的に偏極化されたソーシャルネットワーク内での意思決定をキャプチャする個別選択モデルを導入する。
本稿では,ソーシャルメディアデータから,グループ内愛とグループ外憎悪のキーパラメータを推定する統計的推測手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:58:13 GMT)
Semantic Role Labeling of NomBank Partitives [2.9] いくつかのシステムは、従来のトランスフォーマーベースの機械学習とアンサンブルを使って記述されている。
我々の最高スコアシステムは、ペン・ツリーバンクの「ゴールド」パースを用いて91.74%、バークレー・ニューラルを用いた場合の91.12%のF1を達成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:56:11 GMT)
Pipeline Analysis for Developing Instruct LLMs in Low-Resource Languages: A Case Study on Basque [2.9] 大規模言語モデル(LLM)は一般的に英語のような資源に富む言語に最適化され、高リソース言語と低表現言語の間のギャップを悪化させる。
本研究は,低リソース言語,特にバスク語で指示に従うことができるモデルを開発するための戦略を,事前学習,指導指導,人間の嗜好との整合という3つの重要な段階に焦点をあてて詳細に分析する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:05:59 GMT)
Benchmarking Pretrained Attention-based Models for Real-Time Recognition in Robot-Assisted Esophagectomy [2.8] 食道癌は世界中で最も多いがんの1つである。
近年,ロボットによる最小侵襲食道切除術が有望な代替手段として浮上している。
コンピュータ支援解剖学の認識は、手術ナビゲーションを改善することを約束する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:47:57 GMT)
Benchmarking the Communication Competence of Code Generation for LLMs and LLM Agent [2.8] 大規模言語モデル(LLM)は、コード生成の分野でタスクを実行する能力を大幅に改善した。
LLMが有能なプログラマであることと、最上位のソフトウェアエンジニアであることの間にはまだギャップがある。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:59:31 GMT)
Versatile Ordering Network: An Attention-based Neural Network for Ordering Across Scales and Quality Metrics [2.8] 本稿では,品質基準を付与する戦略を自動的に学習するVersatile Ordering Network (VON)を提案する。
VONは、そのソリューションを評価するために品質測定値を使用し、強化学習をエレデートなロールアウトベースラインで活用して、自分自身を改善する。
この結果から, VONは特殊解法に匹敵する結果が得られることが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:34:58 GMT)
TopView: Vectorising road users in a bird's eye view from uncalibrated street-level imagery with deep learning [2.7] 本研究では、カメラの内在的・外在的パラメータを事前に把握せずに、画像から鳥の視線を推定するための簡単なアプローチを提案する。
このフレームワークは、カメラフィードからライブマップを生成し、都市規模での社会的距離違反を分析するために、いくつかのアプリケーションに適用されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:55:58 GMT)
BanglishRev: A Large-Scale Bangla-English and Code-mixed Dataset of Product Reviews in E-Commerce [2.6] 本研究は、英語のベンガル語で書かれたレビューと、英語のアルファベットで書かれたバングリッシュ・ベンガル語を混ぜたレビューのために、これまでで最大のeコマース製品レビューデータセットを提示する。
このデータセットは、ベンガル人を対象にしたオンライン電子商取引プラットフォームで販売されている128万の製品から収集された320万のレーティング情報から144万件のレビューが作成されている。
レビューには、レビュー者からのレーティング、レビューが投稿された日、購入日、いいね!の件数、嫌悪感、売り手からの反応、レビューに関連する画像などを含む、レビューごとに関連するメタデータの広範囲が含まれている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:51:58 GMT)
Resilience of Networks to Spreading Computer Viruses: Optimal Anti-Virus Deployment (Extended Version) [2.6] アンチウイルスソフトウェアは、コンピュータネットワーク上でのコンピュータウイルスやワームの伝播を防ぎ、制御するための一般的な戦略である。
ウイルスの拡散を阻止するネットワークの能力に抗ウイルス展開戦略が及ぼす影響について検討した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:52:41 GMT)
Long-time accuracy of ensemble Kalman filters for chaotic and machine-learned dynamical systems [2.5] 本稿では,アンサンブルカルマンフィルタの長時間精度を確立する。
我々の理論は、部分的に観察されたカオス力学系の幅広いクラスをカバーしている。
シュロゲート力学を用いたアンサンブルカルマンフィルタの長時間精度を検証した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:35:21 GMT)
Towards Efficient and Explainable Hate Speech Detection via Model Distillation [2.4] 大規模言語モデル(LLM)は、ヘイトスピーチの検出と解釈可能性向上に有効であることが証明されている。
ヘイトスピーチ分類タスクを支援する説明文を,Chain-of-Thoughtを用いて抽出する。
蒸留モデルでは, 大規模モデルと同等の品質を説明できる一方で, 分類性能も上回っていることを実証した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:42:53 GMT)
Clustering by Mining Density Distributions and Splitting Manifold Structure [2.4] 近年,スペクトルクラスタリングの効率向上のためのトップダウン手法が提案されている。
本稿では,局所構造からマイクロクラスターを得る方法を提案する。
その後、最終的なスペクトルクラスタリングのために、マイクロクラスタ間の新しい類似度尺度が提案される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:44:25 GMT)
HeartBERT: A Self-Supervised ECG Embedding Model for Efficient and Effective Medical Signal Analysis [2.4] HeartBertは自然言語処理におけるBERT(Bidirectional Representations from Transformers)にインスパイアされ、自己教師型学習アプローチで強化されている。
提案モデルの汎用性,一般化性,効率性を示すために,睡眠ステージ検出と心拍分類という2つの重要な下流課題が選択された。
HeartBERTの優位性と進歩を示すための一連の実験が実施されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:54:33 GMT)
A Generic Method for Integrating Lindblad Master Equations [2.3] 我々はリンドブラッドマスター方程式を統合する一般的な方法を提案する。
この方法では、級数は切り詰められ、有限個の項を保持し、密度行列上のリンドブラディアンの反復作用は対応するマスター方程式に従う。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:38:55 GMT)
An XAI Social Media Platform for Teaching K-12 Students AI-Driven Profiling, Clustering, and Engagement-Based Recommending [2.3] 本稿では,K-12教室,特に4~9年生を対象とした説明可能なAI(XAI)教育ツールを提案する。
このツールは、4つのAIとデータ駆動のコアコンセプトに焦点を当てた、ソーシャルメディアプラットフォームの背後にある基本的なプロセスの介入のために設計された。
Instagramのようなインターフェースと、データ駆動プロセスを説明するためのモニタリングツールによって、これらの複雑なアイデアはアクセス可能になり、若い学習者にとって魅力的なものになる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:10:45 GMT)
Mitigating Adversarial Attacks in LLMs through Defensive Suffix Generation [2.3] 大規模言語モデル (LLM) は自然言語処理タスクにおいて優れた性能を示した。
わずかな入力摂動が有害または誤解を招く可能性のある敵攻撃。
勾配に基づく防御接尾辞生成アルゴリズムはLLMの堅牢性を高めるために設計されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:49:41 GMT)
Randomization Tests for Conditional Group Symmetry [2.3] この研究は、特定の局所コンパクト群の作用の下で条件分布の対称性に対する非パラメトリックランダム化テストの研究を開始する。
我々は,有限サンプル型I誤差制御を用いたランダム化テストのための一般的なフレームワークをカーネル手法を用いて開発し,有限サンプルパワーの低い境界を持つテストを実装した。
合成例におけるそれらの性質と高エネルギー粒子物理学の2つの問題における対称性試験への応用について検討する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:51:23 GMT)
Do Language Models Understand Time? [2.3] 大規模言語モデル(LLM)は、アクション認識、異常検出、要約を含む、ビデオベースのコンピュータビジョンアプリケーションに革命をもたらした。
本研究は,ビデオ処理におけるLLMの役割を,時間的推論能力に着目して批判的に考察する。
LLMの時間的理解を制限するため、バイアス、時間的アノテーションの欠如、ドメイン固有の制限など、既存のビデオデータセットによる課題を分析します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:38:06 GMT)
Signal Reconstruction from Samples at Unknown Locations with Application to 2D Unknown View Tomography [2.3] 提案手法は, サンプル位置順序の特定において, ある程度の誤差に耐性があることを実証する。
これは2次元UVTの解析を行い、サンプリング理論の進歩と明確に関連付ける最初の作品である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:53:04 GMT)
Multi-View Pedestrian Occupancy Prediction with a Novel Synthetic Dataset [2.2] 私たちはMVP-Occと呼ばれる新しい合成データセットを作成しました。
我々のデータセットは、豊かなセマンティックシーン理解ラベルを伴って、ボクセル構造を用いた歩行者の詳細な表現を提供する。
オムニオック(OmniOcc)と呼ばれる頑健なベースラインモデルを提案し,マルチビュー画像からボクセル占有状態とパノプティカルラベルの両方を予測する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:35:42 GMT)
Zero-Shot Low Light Image Enhancement with Diffusion Prior [2.1] 暗視画像変換タスクのための拡散モデルの生成挙動を制御・改善するための新しいゼロショット手法を提案する。
提案手法は,低照度画像強調作業における既存の最先端手法よりも優れた性能を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:31:18 GMT)
High-throughput digital twin framework for predicting neurite deterioration using MetaFormer attention [2.1] 神経発達障害(NDD)は、自閉症スペクトラム障害、注意欠陥・高活動障害、てんかんなど、様々な症状をカバーしている。
それらの高いコンコビディティと複雑なエチオロジーは、正確な診断と効果的な治療に重大な課題を呈している。
本稿では,NDDに関連する神経突起劣化に対する高スループットディジタルツインフレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:48:50 GMT)
Training neural networks without backpropagation using particles [2.1] ニューラルネットワークは、人間の脳内の生物学的ニューロンを模倣するために、複数の層にまとめられたニューロンのグループである。
勾配降下戦略は、ニューラルネットワークのバックプロパゲーションアルゴリズムを改善するために使用されている。
粒子群最適化 (PSO) は損失関数の探索空間の中で最適な局所最小値を選択するために提案された。
提案手法では、個々のニューロンを個別に訓練することで、勾配降下とPSOアルゴリズムの限界を克服する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:57:22 GMT)
HaSPeR: An Image Repository for Hand Shadow Puppet Recognition [2.0] シャドウグラフィー(Shadowgraphy)またはボンボマニー(ombromanie)は、演劇芸術とストーリーテリングの一形態である。
プロとアマチュアの両方の手影人形クリップから抽出した15のクラスに15,000枚の手影人形画像からなる新しいデータセットを提案する。
本研究は,注目型トランスアーキテクチャよりも,スキップ接続型畳み込みモデルの大幅な性能上の優位性を示すものである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:02:07 GMT)
Are LLMs Good Literature Review Writers? Evaluating the Literature Review Writing Ability of Large Language Models [2.0] 本稿では,大規模言語モデルの文献レビュー作成能力を自動評価するフレームワークを提案する。
我々は,3つのタスク(参照の生成,要約の執筆,文献レビューの執筆)でLLMの性能を評価する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:42:25 GMT)
Stable Learning Using Spiking Neural Networks Equipped With Affine Encoders and Decoders [2.0] スパイクニューラルネットワークに関連する学習問題について検討する。
我々は、正のシナプス重みしか持たない単純なスパイキングニューロンからなるスパイキングニューラルネットワークに焦点を当てた。
特に、アフィンスパイクニューラルネットワークが浅いReLUニューラルネットワークを近似できるという理論とシミュレーションを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:17:16 GMT)
Self-control: A Better Conditional Mechanism for Masked Autoregressive Model [2.0] 本稿では,連続マスク型自己回帰モデルのための条件付き導入ネットワークを提案する。
提案した自己制御ネットワークは、ベクトル量子化の負の影響が生成画像の品質に与える影響を軽減するのに役立つ。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:09:39 GMT)
Enhancing Knowledge Distillation for LLMs with Response-Priming Prompting [1.9] そこで本研究では,学生モデルの性能向上のための新しい応答プライシング手法を提案する。
Llama 3.1 405B 教師モデルから知識を抽出し,より小さな Llama 3.1 8B 教師モデルを微調整する。
その結果, 蒸留したLlama 3.1 8BインストラクトのGSM8Kは55%向上した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:41:44 GMT)
Navigating the Noise: Bringing Clarity to ML Parameterization Design with O(100) Ensembles [1.9] サブグリッドプロセスの機械学習(ML)パラメータ化は、いつか従来のパラメータ化を置き換えるかもしれない。
オフラインとオンラインのパフォーマンスの関係の不確実性は、彼らの開発を妨げる。
オフラインエラーの体系的削減がオンラインエラーやオンライン安定性の変化にどのように影響するかを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:27:15 GMT)
Multi-zone trapped-ion qubit control in an integrated photonics QCCD device [1.8] 大規模アーキテクチャにおいて、多重化操作と多重トラップサイトに対する拡張コヒーレント制御は、トラップイオンプロセッサの基本要件である。
多数のゾーンにスケーラブルなフォトニック部品を集積した表面電極トラップを用いて,これらのビルディングブロックを実演する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:36:57 GMT)
Unifying Attribution-Based Explanations Using Functional Decomposition [1.8] 本稿では,属性に基づく説明手法の統一化フレームワークを提案する。
類似点と説明の相違点の厳密な研究に向けての一歩となる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:04:07 GMT)
Threshold UCT: Cost-Constrained Monte Carlo Tree Search with Pareto Curves [1.8] 制約付きマルコフ決定プロセス(CMDP)は、不確実性の下で安全なシーケンシャルな意思決定のための主要なフレームワークである。
CMDP計画のためのオンラインMCTSベースのアルゴリズムであるThreshold UCTを紹介する。
実験の結果,本手法は文献の最先端手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:41:47 GMT)
Magic State Injection on IBM Quantum Processors Above the Distillation Threshold [1.7] この研究は、IBM量子プロセッサに量子ビット効率の回転重六角形曲面符号を用いる。
論理ビットと位相フリップの誤差の閾値はそれぞれ$approx0.37%$と$approx0.31%$である。
我々の研究は、IBM量子デバイス上で高忠実な論理マジック状態を生成することによって、非クリフォード論理ゲートの実現の可能性を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:27:54 GMT)
Exploring Transformer-Augmented LSTM for Temporal and Spatial Feature Learning in Trajectory Prediction [1.7] 本研究では,TransformerベースのモデルとLong Short-Term Memory (LSTM)ベースの技術の統合について検討する。
提案手法は, STA-LSTM, SA-LSTM, CS-LSTM, NaiveLSTM など, 従来の LSTM ベースの手法に対してベンチマークを行う。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:31:08 GMT)
AdvIRL: Reinforcement Learning-Based Adversarial Attacks on 3D NeRF Models [1.7] textitAdvIRLは、多様な3D変換の下で頑健な対向ノイズを生成する。
私たちのアプローチは、小さなオブジェクト(バナナなど)から大きな環境(灯台など)まで、幅広い場面で検証されています。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:01:30 GMT)
FlexCache: Flexible Approximate Cache System for Video Diffusion [1.6] 2つの主要な設計における課題に対処するフレキシブルな近似キャッシュシステムであるFlexCacheを紹介します。
FlexCacheは、最先端の拡散近似キャッシュシステムと比較して、スループットが1.26倍、コストが25%低いことが分かりました。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:35:16 GMT)
Gendered Words and Grant Rates: A Textual Analysis of Disparate Outcomes in the Patent System [1.5] この記事では、機械学習と自然言語処理を使用して、特許出願から隠れた情報を抽出する。
発明者の性別は、発明者の名前を知ることなく、しばしばテキストの属性から識別できる。
また,特許出願の客観的特徴が付与されるかどうかを予測できるかどうかについても検討した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:24:00 GMT)
Adaptive Calibration: A Unified Conversion Framework of Spiking Neural Network [1.5] スパイキングニューラルネットワーク(SNN)は、従来のニューラルネットワーク(ANN)の代替としてエネルギー効率が高いと見なされる
変換されたSNNの性能と効率を大幅に向上させる一貫した学習自由変換フレームワークを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:38:54 GMT)
Dispersive Qubit Readout of Temperature [1.5] スクイーズ光は、分散量子ビット読み出しの信号対雑音比(SNR)を指数関数的に増加させることができる。
また, 温度測定精度を指数関数的に向上させるために, 注入外スクイーズ (IES) とキャビティ内スクイーズ (ICS) が有効か検討した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:08:45 GMT)
Formal Verification of Permission Voucher [1.5] Permission Voucher Protocolは、分散環境におけるセキュアで認証されたアクセス制御のために設計されたシステムである。
この分析では、重要なセキュリティ特性を評価するために、象徴的検証のための最先端のツールであるTamarin Proverを使用している。
結果は、メッセージの改ざん、偽装、リプレイなどの一般的な攻撃に対するプロトコルの堅牢性を確認する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:11:50 GMT)
Joint Perception and Prediction for Autonomous Driving: A Survey [1.5] 知覚と予測モジュールは自律運転システムの重要な構成要素である。
伝統的に、これらのタスクは独立して開発され、最適化される。
本稿では,入力表現,シーンコンテキストモデリング,出力表現に基づいてアプローチを分類する分類法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:34:52 GMT)
Fake News Detection: Comparative Evaluation of BERT-like Models and Large Language Models with Generative AI-Annotated Data [1.4] フェイクニュースは、現代の社会における世論と社会の安定に重大な脅威をもたらす。
本研究では,偽ニュース検出のためのBERT-like encoder-onlyモデルと自己回帰型decoder-only large language model(LLMs)の比較評価を行った。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:15:17 GMT)
RadField3D: A Data Generator and Data Format for Deep Learning in Radiation-Protection Dosimetry for Medical Applications [1.4] ドシメトリのための3次元放射場データセットを生成するために,オープンソースのGeant4ベースのモンテカルロシミュレーションアプリケーションRadField3Dを提案する。
伴って、RadFiled3Dと呼ばれるニューラルネットワーク研究への統合を容易にするために、Python APIを使った高速で機械解釈可能なデータフォーマットを導入しました。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:47:37 GMT)
Nemesis: Noise-randomized Encryption with Modular Efficiency and Secure Integration in Machine Learning Systems [1.4] Nemesisは、正確さやセキュリティを損なうことなく、FHEベースの機械学習システムを高速化するフレームワークである。
我々は、標準的な暗号的仮定の下で、Nemesisのセキュリティを証明する。
その結果、NemesisはFHEベースのMLシステムの計算オーバーヘッドを大幅に削減することがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:52:12 GMT)
The random coupled-plaquette gauge model and the surface code under circuit-level noise [1.4] ノイズのある設定で, 表面コード中の真のYエラーを最適に説明する。
我々は回路レベルのノイズシナリオに取り組み,非対称な非偏極化とシンドロームノイズ率の効果的な検出に還元手法を用いる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:20:14 GMT)
Language verY Rare for All [1.3] 本稿では,LLMファインチューニングと検索拡張生成(RAG)を組み合わせた新しい手法であるLYRA(Language verY Rare for All)を紹介する。
本研究は,既存の翻訳ツールでサポートされていないフランス語とMon'egasqueの双方向翻訳に焦点を当てた。
この結果から,レア言語翻訳におけるLYRAの有効性や,最先端のエンコーダ・デコーダモデルによく適合することを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:07:23 GMT)
TRIM: Token Reduction and Inference Modeling for Cost-Effective Language Generation [1.3] 本稿では,より少ない推論コストのモデルを用いて,大規模言語モデルからの短い蒸留出力をフルナラティブに再構成する,計算コストの削減のためのパイプラインを提案する。
実験の結果、特に20.58%のトークンを平均で保存し、評価基準を小さくする一般知識領域において有望な結果が得られた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:39:47 GMT)
Functional connectomes of neural networks [1.3] 本稿では,脳にインスパイアされた技術を活用し,ニューラルネットワークと人間の脳機能を橋渡しする新しい手法を提案する。
我々のアプローチは、安定した統計的および機械学習技術を用いて、大規模ニューラルネットワークのトポロジを特徴付けるスケーラブルな方法を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:46:30 GMT)
Two-qubit gate protocols with microwave-dressed Rydberg ions in a linear Paul trap [1.3] 制御相ゲート動作につながる3つのプロトコルの性能について理論的に検討する。
本研究では, 高速レーザー駆動による非断熱遷移が, システムの特性時間スケールに対して, ゲート忠実度にどのように影響するかを示す。
全体として、この場所は、高速な高精度量子コンピューティングと最終的に量子エラー補正が可能である体制に、リドバーグイオンを閉じ込めた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:43:54 GMT)
Real Classification by Description: Extending CLIP's Limits of Part Attributes Recognition [1.2] 本稿では,視覚言語モデル(VLM)がオブジェクトのクラス名を除いた記述的属性のみに基づいてオブジェクトを分類する能力を評価する新しいタスクである記述によるゼロショットの「リアル」分類に取り組む。
我々は、オブジェクト名を省略し、真にゼロショット学習を促進する6つの人気のあるきめ細かいベンチマークに関する記述データをリリースする。
修正されたCLIPアーキテクチャを導入し、複数の解像度を活用し、きめ細かい部分属性の検出を改善する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:28:08 GMT)
Rare Event Detection in Imbalanced Multi-Class Datasets Using an Optimal MIP-Based Ensemble Weighting Approach [1.2] マルチクラスデータセットは、重要なサイバー物理システムにおけるまれな事象検出に使用される。
最適,効率的,適応可能な混合整数プログラミング(MIP)アンサンブル重み付け方式を提案する。
MIPに基づく手法と6つの確立された重み付け手法を比較検討した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:20:51 GMT)
Neural Controlled Differential Equations with Quantum Hidden Evolutions [1.2] 量子力学にインスパイアされた神経制御微分方程式のクラスを導入する。
NQDEはシュリンガー方程式の類似により力学をモデル化する。
我々は,おもちゃのスパイラル分類問題に対して,NQDEの4つの変種を実装・比較した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:42:10 GMT)
Explainable Risk Classification in Financial Reports [1.2] 米国内の上場企業はすべて、同社の豊富な情報を含む年間10Kの財務報告を提出する必要がある。
本研究では,FinBERT-XRCと呼ばれる,10-Kのレポートを入力として記述可能なディープラーニングモデルを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:28:53 GMT)
Biological and Radiological Dictionary of Radiomics Features: Addressing Understandable AI Issues in Personalized Prostate Cancer; Dictionary Version PM1.0 [1.2] PI-RADSと関連するリスクファクターのための生物・放射線学的RFの標準化辞書を作成しました。
そして、この辞書を使って、最良の予測モデルを解釈した。
このアプローチは0.78の平均精度を達成し、単一シーケンス法を著しく上回った。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:26:46 GMT)
Intelligent Environmental Empathy (IEE): A new power and platform to fostering green obligation for climate peace and justice [1.2] 我々は、国際機関を通じて、権威主義的なトップダウン政府間協力は、これまで環境問題や危機を克服できなかったことを示す。
気候の平和と正義のための知的環境共感(IEE)モデルを運用レベルで提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:08:33 GMT)
Open-Vocabulary High-Resolution 3D (OVHR3D) Data Segmentation and Annotation Framework [1.1] 本研究の目的は,3次元セグメンテーションタスクのための包括的で効率的なフレームワークの設計と開発である。
このフレームワークはGrounding DINOとSegment Any Modelを統合し、3Dメッシュによる2D画像レンダリングの強化によって強化される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:08:01 GMT)
Enhancing Quantum Synchronization in a driven qubit system coupled to a structured environment [1.1] 変調過程の振幅-周波数比をゼロ階ベッセル関数の零点に調整すると位相ロックが生じることを示した。
結果は、量子環境における位相ダイナミクスを効率的に理解するための新しい洞察を与える。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:00:35 GMT)
On the Robustness of Distributed Machine Learning against Transfer Attacks [1.1] 学習プロセスと推論プロセスの両方を分散させることによる堅牢性の組み合わせについて、事前の研究は行われていない。
本研究では,MLインスタンスの適切な分散化により,最先端の転送ベース攻撃に対する精度損耗トレードオフの改善が達成されることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:27:17 GMT)
On symmetry-resolved generalized entropies [1.0] 我々は,励起状態対称性を解いた絡み合いの研究に適した計算フレームワークを開発する。
XX連鎖の格子計算を用いて結果をベンチマークする。
副産物として、我々のフレームワークは、サブシステムに含まれる対称性電荷の確率分布へのアクセスを提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:59:28 GMT)
Markovian Transformers for Informative Language Modeling [1.0] CoT(Chain-of-Thought)推論は言語モデルのアウトプットを説明する上で大きな可能性を秘めている。
我々はCoTを2つの重要なコンポーネントを通じて予測に因果的に必要としており、中間のCoTテキストを通して次のトークンを予測することと、他のコンテキストとは独立して将来のトークンを予測するためにCoTを訓練する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:26:15 GMT)
GLIDER: Grading LLM Interactions and Decisions using Explainable Ranking [1.0] 我々は,任意のユーザ定義基準に基づいて任意のテキスト入力および関連するコンテキストをスコアできる,強力な3B評価用LLMであるGLIDERを紹介する。
GLIDERは、FLASK上のGPT-4oよりもピアソンの相関が高く、事前評価モデルよりも大幅に優れていた。
きめ細かいスコア付け、多言語推論、強調表示をサポートし、685のドメインと183の基準でトレーニングされた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:41:12 GMT)
Deep Reinforcement Learning for Multi-Truck Vehicle Routing Problems with Multi-Leg Demand Routes [0.9] 既存のエンコーダ・デコーダのアテンションモデルに新たな拡張を加えて,複数のトラックとマルチレグルーティング要求を処理できるようにした。
私たちのモデルには、少数のトラックやノードに対してトレーニングを行い、大きなサプライチェーンに組み込んで、多数のトラックやノードに対するソリューションを提供するという利点があります。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:08:51 GMT)
DODGE: Ontology-Aware Risk Assessment via Object-Oriented Disruption Graphs [0.9] 共通オントロジー・オブ・バリュー・アンド・リスク(COVER)は、透明で完全かつ説明可能なリスク評価を実行する上で、オブジェクトとそれらの関係がいかに重要であるかを強調している。
我々は、リスクアセスメントのための新しい枠組みであるDODGEを提示することで、COVERが提案する概念のいくつかを運用する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:44:04 GMT)
The VOROS: Lifting ROC curves to 3D [0.9] 本稿では,新しいROC曲面と,このROC曲面上の体積であるVOOSを,ROC曲線を3Dに上げることで,これらのコストを捉える自然な方法として紹介する。
ROC曲線を一般化する以前の試みと比較して、我々の定式化は、正確な値ではなく範囲がクラス不均衡と誤分類コストで知られている場合にのみシナリオをモデル化するための単純で直感的な方法を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:35:09 GMT)
Differentially Private Substring and Document Counting [0.9] 我々は、この問題をすべてのパターンに対して同時に解くために、$epsilon$-differentially privateデータ構造を与えます。
本研究では,独立した関心を持つ木上での数え上げ関数の一般クラスを微分的にプライベートに計算する新しい手法を開発した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:00:09 GMT)
Design choices made by LLM-based test generators prevent them from finding bugs [0.9] 本稿は,最近のLCMベースのテスト生成ツールであるCodium CoverAgentやCoverUpが,効果的にバグを見つけたり,意図せずに欠陥コードを検証することができるかどうかを,批判的に検証する。
実際の人手によるバグ検出コードを入力として使用すると、これらのツールを評価し、LCM生成テストがバグの検出に失敗する可能性を示し、さらに警告として、生成されたテストスイートのバグを検証することで、その設計が状況を悪化させる可能性があることを示します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:33:26 GMT)
Discovering maximally consistent distribution of causal tournaments with Large Language Models [0.8] 因果発見は複雑なシステムを理解するのに不可欠である。
伝統的な手法は、しばしば強い、証明不可能な仮定に依存する。
本稿では,非循環トーナメントの分布を導出する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:37:51 GMT)
Probabilistic channel simulation using coherence [0.8] 我々は,自由操作のコヒーレンスを用いた確率的チャネルシミュレーションの枠組みを開発する。
対象チャネルがリソース非活性化チャネルでなければ、決定論的および確率論的の両方を正確にシミュレートすることはできない。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:13:13 GMT)
Rapid optimal work extraction from a quantum-dot information engine [0.8] 我々は量子ドットSzilardエンジンを用いて、20年以上の駆動速度で最大効率で熱ゆらぎから作業を取り出す。
我々は、遅いものから高速なものまで、最適化されたプロトコル群を設計し、実装する。
その結果,効率を最適化する場合,Szilardエンジンの出力が必然的に増加すると電力変動が増大することがわかった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:32:26 GMT)
Symbolic-AI-Fusion Deep Learning (SAIF-DL): Encoding Knowledge into Training with Answer Set Programming Loss Penalties by a Novel Loss Function Approach [0.7] ドメイン固有の制約、ルール、論理的推論を直接モデルの学習プロセスにエンコードします。
提案手法はフレキシブルであり、回帰タスクと分類タスクの両方に適用可能である。
この設計により、ASPルールを単に更新することで、損失関数の自動化が可能になる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:55:06 GMT)
Building Trustworthy AI: Transparent AI Systems via Large Language Models, Ontologies, and Logical Reasoning (TranspNet) [0.7] AIにおける透明性の欠如、特に医療や金融といった高度な分野での懸念が高まっているため、説明可能な信頼性の高いシステムの必要性が高まっている。
そこで本研究では,シンボルAIと大規模言語モデルを統合したTranspNetパイプラインを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:45:15 GMT)
jinns: a JAX Library for Physics-Informed Neural Networks [0.7] jinnsは物理インフォームドニューラルネットワークのためのオープンソースのPythonライブラリである。
JAXエコシステムに根ざしたこのフレームワークは、リアルプロブレムを効率的にプロトタイピングするための多用途フレームワークを提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:21:41 GMT)
Spatio-Temporal SIR Model of Pandemic Spread During Warfare with Optimal Dual-use Healthcare System Administration using Deep Reinforcement Learning [0.7] 本稿では、疫学的SIR(susceptible-infected-recovered)モデルと戦争力学ランチェスターモデルを統合する新しい数学的モデルを提案する。
エージェントによるシミュレーションを用いてシリコデータを生成することにより,医療行政政策のための深層強化学習モデルを訓練した。
以上の結果から、戦争中のパンデミックは、医療システムが戦争で負傷した兵士や、パンデミックに感染した民間人を優先すべきというカオス的ダイナミクスを誘導することを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:54:27 GMT)
Future Research Avenues for Artificial Intelligence in Digital Gaming: An Exploratory Report [0.7] ビデオゲームは、人工知能(AI)システムのための自然でシナジスティックなアプリケーションドメインである。
本稿では,最先端のAI手法,特にディープラーニングをデジタルゲームに適用するための5つの研究経路について概説する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:32:27 GMT)
Efficient Fine-Tuning of Single-Cell Foundation Models Enables Zero-Shot Molecular Perturbation Prediction [0.7] 本研究では,数千万の単細胞上で事前学習した単一細胞基盤モデル(FM)を利用する。
本稿では,基礎モデルの1%未満のトレーニングにより,効率的な微調整を可能にする薬物調和アダプタを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:42:20 GMT)
USEFUSE: Utile Stride for Enhanced Performance in Fused Layer Architecture of Deep Neural Networks [0.6] 本研究では,低レイテンシ左から右へのビットシリアル演算を用いた畳み込みのためのSum-of-Products (SOP)ユニットを提案する。
有効メカニズムは、ReLU層の後、非効率な畳み込みを検出し、スキップし、消費電力を最小化する。
ひとつはミッションクリティカルなアプリケーションの応答時間を最小限にすること、もうひとつはリソースに制約のあるデバイスに同じレイテンシでフォーカスすることである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:04:58 GMT)
Enhancing Rhetorical Figure Annotation: An Ontology-Based Web Application with RAG Integration [0.6] ファイド・ユー・フィギュア (Find your Figure) というウェブアプリケーションを開発した。
ドイツの修辞的人物の識別と注釈を容易にする。
さらに、検索生成(RAG)によるユーザエクスペリエンスの向上も行います。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:45:55 GMT)
A Clinical Trial Design Approach to Auditing Language Models in Healthcare Setting [0.6] 医療現場に展開する言語モデルの監査機構を提案する。
提案手法を用いることで,本手法はサンプルサイズと電力計算の原理に従うことができることを示す。
本研究では,大規模公衆衛生ネットワークにおける実運用環境における監査の実例を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:48:15 GMT)
What Human-Horse Interactions may Teach us About Effective Human-AI Interactions [0.6] 馬のようにAIは人間の能力を補うのではなく、補完すべきである、と私たちは主張する。
我々は、信頼、コミュニケーション、相互適応性といった、人間と馬の関係の重要な要素を分析する。
私たちは、信頼でき、適応可能で、共生的な人間とAIのパートナーシップを育むことができるAIシステムを設計するためのビジョンを提供します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:39:16 GMT)
Scaling Deep Learning Training with MPMD Pipeline Parallelism [0.6] JaxPPは、柔軟なパイプライン並列性を備えた大規模ディープラーニングモデルのトレーニングを効率的にスケールアップするシステムである。
我々は,勾配蓄積のためのユーザ定義パイプラインスケジュールの実装を可能にする,シームレスなプログラミングモデルを導入する。
JaxPPは、パイプラインステージに対応するタスクをノードのクラスタ上に分散し、それら間の通信を自動的に推論する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:15:11 GMT)
Dynamic semantic VSLAM with known and unknown objects [0.6] 本稿では,未知の物体と未知の物体の両方の存在下での動的特徴を検出できる特徴量に基づくセマンティックVSLAMを提案する。
我々は、教師なしセグメンテーションネットワークを使用し、次に、オブジェクタ検出器を使用して、それらの中の既知のクラスを識別する。
次に、これを計算された高次光フロー情報と組み合わせて、未知のオブジェクトクラスと未知のオブジェクトクラスの両方の静的および動的セグメンテーションを識別する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:55:25 GMT)
The Data-Driven Censored Newsvendor Problem [0.6] 我々は,データ駆動型ニューズベンダー問題の検閲版について検討する。そこでは,意思決定者は,期待される過給と低給のコストを最小限に抑える順序付け量を選択する必要がある。
我々のゴールは、歴史的需要の検閲の程度が、この問題に対する学習アルゴリズムのパフォーマンスにどのように影響するかを理解することである。
我々は、歴史的需要検閲のレベルに適応する、自然なロバストなアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:34:36 GMT)
TAACKIT: Track Annotation and Analytics with Continuous Knowledge Integration Tool [0.5] 地理空間トラックの領域では、データの注釈付けと検証のためのツールが欠如しているため、迅速でアクセスしやすい機械学習アプリケーション開発が阻害される。
本稿では,地理空間軌跡データのアノテートとMLモデルの検証において重要な機能を実現するために,TAACKIT(Track and Analytics with Continuous Knowledge Integration Tool)を提案する。
航空交通分野におけるMLアプリケーション利用事例を実演し、そのデータアノテーションとモデル評価能力を説明し、アノテーションの労力削減を定量化する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:51:51 GMT)
Implementing TD3 to train a Neural Network to fly a Quadcopter through an FPV Gate [0.5] クワッドコプターの速度制御を行うためにニューラルネットワークをトレーニングする。
実験室環境のクワッドコプターに配置することで、訓練された方針を現実世界に伝達する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:04:29 GMT)
Federated Learning and RAG Integration: A Scalable Approach for Medical Large Language Models [0.5] 本研究では,医学分野におけるLarge Language Models(LLM)の性能を,連合学習フレームワークにRAG(Retrieval-Augmented Generation)システムを統合することによって解析する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:00:58 GMT)
Evaluation of LLM Vulnerabilities to Being Misused for Personalized Disinformation Generation [0.5] 大型言語モデル(LLM)は、偽ニュース記事を生成するために効果的に誤用することができる。
本研究は,近年のオープンおよびクローズドLCMの脆弱性評価により,このギャップを埋めるものである。
以上の結果から,より強力な安全フィルターとディファイラの必要性が示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:48:53 GMT)
Temporal Numeric Planning with Patterns [0.5] PDDL2.1レベル3で表される時間数値計画問題$Pi$を考える。
モデルが$Pi$の有効なプランに対応する$(i)$と$(ii)$は、最近提案された数値から時間ケースへのパターンアプローチによるプランニングの拡張を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:31:58 GMT)
Discerning and Characterising Types of Competency Questions for Ontologies [0.5] コンピテンシー質問(CQ)は、スコーピングや検証の段階を導くことで、オントロジー開発に広く使われている。
CQの定式化や良質なCQの評価には極めて限定的なガイダンスがあり、曖昧さや使用不能な定式化といった問題に繋がる。
本論は, 課題の多様さ, 利用状況, 開発課題の多様さを分析し, 理論的基礎に寄与する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:26:29 GMT)
A Systematic Analysis of Input Modalities for Fracture Classification of the Paediatric Wrist [0.5] ドイツでは毎年約80万人が治療を受けており、子供や青年の骨折は最も多い。
AO/OTAシステムは、治療決定の基礎となる構造化骨折型分類を提供する。
現在のディープラーニングモデルは、経験豊富な放射線学者に匹敵する性能を示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:52:20 GMT)
Topology optimization of high-performance optomechanical resonator [0.5] 我々は高次固有モードでの動作に最適化された新しいコンパクト共振器のクラスを示す。
減衰希釈係数を最大化するために位相最適化を用いることで、これらの共振器は最小限のエッジ曲げ損失を達成する。
それらの高(Qf)性能とコンパクトなフォームファクタは、これらの共振器を量子情報技術の応用の有望な候補として位置づけている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:49:56 GMT)
Advances in Kidney Biopsy Lesion Assessment through Dense Instance Segmentation [0.4] 腎病理学者による病変スコアは半定量的であり、サーバ間の変動が高い。
DiffRegFormerは計算に優しいフレームワークで、3つの解剖学的クラスにわたる500以上のオブジェクトを効率的に認識できる。
我々の手法は従来の手法よりも優れており、平均精度は52.1%(検出)と46.8%(分離)である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:38:38 GMT)
Benchmarking Quantum Models for Time-series Forecasting [0.4] 時系列予測における古典モデルと量子モデルを比較した。
ほとんどの量子モデルは、同等の結果を得ることができた。
結果は、予測の分野と量子機械学習の分野での有用な比較ポイントとして役立ちます。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:17:17 GMT)
CiTrus: Squeezing Extra Performance out of Low-data Bio-signal Transfer Learning [0.4] 近年, 生体信号の伝達学習は, 小さな生体信号データセットを用いて下流タスクの予測性能を向上させる重要な手法となっている。
低データの生体信号伝達学習のためのマスク付き自動符号化を用いた畳み込み変換型ハイブリッドモデルアーキテクチャを提案する。
我々のハイブリッドモデルにおける畳み込みのみの部分は、いくつかの低データダウンストリームタスクにおいて最先端のパフォーマンスを達成できることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:40:34 GMT)
Zero-Shot Prompting and Few-Shot Fine-Tuning: Revisiting Document Image Classification Using Large Language Models [0.3] スキャンされた文書の分類は、画像、レイアウト、文書理解のためのテキスト分析を含む難しい問題である。
特定のベンチマークデータセット、特にRVL-CDIPでは、最先端のパフォーマンスに近づきつつある。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:53:16 GMT)
Braiding for the win: Harnessing braiding statistics in topological states to win quantum games [0.2] 非局所量子ゲームは、量子資源が特定のタスクで有利に働くという原理の証明を提供する。
本研究では, リソース状態の小さな変形に対して頑健な, ある非局所的なゲームに対して, トーリックなコードリソース状態が有利であることを示す。
パラダイムトポロジカルおよびフラクトン秩序相から他のいくつかの状態が、適切に定義された非局所ゲームのためのリソースとして機能することを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:30:30 GMT)
Automated Inference of Graph Transformation Rules [0.2] 本稿では,生成的視点と動的視点を組み合わせたグラフ変換モデル構築法を提案する。
得られたモデルは最小限であることを保証するため、モデル圧縮としてアプローチをフレーミングする。
グラフ変換の観点で表されるコルモゴロフ複雑性に、我々の結果がどのように関係しているかを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:47:17 GMT)
Domain-adaptative Continual Learning for Low-resource Tasks: Evaluation on Nepali [0.2] ドメイン適応型事前トレーニング(DAPT)は、トレーニング済みの言語モデルを継続的にトレーニングして、元々トレーニングされていないドメインに適応させることに重点を置いている。
合成データを用いてLlama 3 8Bを4ビットQLoRA設定でネパール語に適応させる訓練を継続する。
適応モデルの性能, 忘れ, 知識獲得について評価する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:53:59 GMT)
AI Perceptions Across Cultures: Similarities and Differences in Expectations, Risks, Benefits, Tradeoffs, and Value in Germany and China [0.2] 本研究は,AIの将来的影響に関する71の声明に対する反応を評価するために,マイクロシナリオを用いたAIの公開精神モデルについて検討する。
ドイツの参加者はより慎重な評価に傾向を示し、中国の参加者はAIの社会的利益に関してより楽観的であった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:34:44 GMT)
Tuning Music Education: AI-Powered Personalization in Learning Music [0.2] 本稿では,音楽教育の課題に対処するために,このような音楽技術の進歩を利用した2つのケーススタディを提案する。
最初のケーススタディでは、音声トラックからパーソナライズされたエクササイズを生成するために、自動コード認識を使用するアプリケーションを紹介した。
第2のケーススタディでは,アダプティブピアノ方式の本を試作し,オートマチック・ミュージック・トランストラクレーションを用いて,異なるスキルレベルでのエクササイズを生成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:25:42 GMT)
Universality of the Weyl-Heisenberg symmetry and its covariant quantisations [0.1] 基本レベルでは、この対称性は変位作用素と標準フーリエ解析によってどのように現れるかを記述する。
平面上のマヨラナ星座へのフォーマリズムの応用例を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:35:10 GMT)
A purely geometrical Aharonov-Bohm effect [0.1] 共変アフィン積分量子化を2次元句読面の運動の研究に応用する。
句読点付近では、量子ゆらぎに影響を及ぼす位相がアフィンベクトルポテンシャルをもたらすことが観察される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:58:22 GMT)
Open Universal Arabic ASR Leaderboard [0.1] オープンユニバーサル アラビア ASR Leaderboard をオープンソース アラビア ASR モデルのための連続ベンチマークプロジェクトとして紹介する。
また,モデルのロバスト性,話者適応性,推論効率,メモリ消費を包括的に分析する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:31:31 GMT)
Three-dimensional real space renormalization group with well-controlled approximations [0.1] 我々は、カダノフのブロックアイデアを信頼性のある3次元実空間再正規化群(RG)法に変換する。
提案したRGは3次元の体系的に改善可能な実空間RG法として期待されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:53:05 GMT)
Zero energy modes with gaussian, exponential, or polynomial decay: Exact solutions in hermitian and nonhermitian regimes [0.0] トポロジカル絶縁体や超伝導体のトップゼロモードは、トポロジカルに自明な位相と非自明な位相の間の相転移で指数関数的に局在する。
我々は、これらのモードを解として認める修正ジャッキー・レビ方程式(およびシュル・オーディンガー方程式)の明示的で解析的な形式を導出する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:00:04 GMT)
Wonderful Matrices: Combining for a More Efficient and Effective Foundation Model Architecture [0.0] 状態空間双対性アルゴリズムに回転位置を埋め込むことが可能であることを示し、これは2次因果自己アテンションと状態空間双対性の組み合わせの複雑さを4%以上減少させる。
次に,より難易度の高いマルチクエリ・アソシエイト・リコールタスクにおいて,100%の精度を維持するダイナミックマスクアテンションを提案する。
第3に、専門家のクロスドメイン混在を設計し、専門家の混在の8倍から10倍の速さで1024人以上の専門家による専門家検索の計算速度を向上する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:53:26 GMT)
Why Is Anything Conscious? [0.0] 生物系が階層的に階層的に知覚情報を解釈するためにどのように自己組織化するかを記述するフォーマリズムを提供する。
我々の提案は、ゾンビフィクションよりも人間の事実に近い、意識の正式な科学の基礎を築いた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:25:52 GMT)
Weak ergodicity breaking with isolated integrable sectors [0.0] 我々は、弱いエルゴディディディティの破れを示す局所ハミルトニアンのスピン鎖モデルを考える。
このような弱破壊は、選択された可積分モデルを、そうでなければカオスなモデルのより大きなヒルベルト空間に埋め込むことによって達成される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:31:44 GMT)
Verified invertible lexer using regular expressions and DFAs [0.0] 本稿では,シリアライズおよびレキシングフレームワークに適用する可逆性の概念について検討する。
シリアライゼーションはデータ構造をビット配列に書き込むプロセスであり、レキシングは文字のストリームを読み取ってトークンに分割するプロセスである。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:03:17 GMT)
Variance-based loss function for improved regularization [0.0] ディープラーニングでは、選択された誤差メトリックの平均が損失関数として一般的に使用される。
このアプローチは、しばしば局所化された外れ値に対処できず、急勾配や不連続な領域で重大な不正確な結果をもたらす。
本稿では,選択した誤差量の平均偏差と標準偏差を組み合わせた新しい損失関数を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:11:45 GMT)
Unified Understanding of Environment, Task, and Human for Human-Robot Interaction in Real-World Environments [0.0] サービスロボットは、人間と効果的にコミュニケーションしながら、動的な環境に適応し、必要なタスクを理解する必要がある。
本稿では,新しい屋内動的マップ,タスク理解システム,応答生成システムを提案する。
シミュレーションされたレストラン環境で行った実験では、提案したHRIシステムは顧客とのコミュニケーションに成功し、90%の精度で注文食品を提供した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:05:56 GMT)
Understanding and Evaluating Trust in Generative AI and Large Language Models for Spreadsheets [0.0] Generative AI and Large Language Models (LLMs)は、スプレッドシートの公式作成を自動化することを約束している。
しかし, 幻覚, バイアス, 可変ユーザスキルにより, 生成AIから得られる出力は正確で信頼性が高いとは考えられない。
公式の透明性と信頼性を評価した信頼性フレームワークが提案されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:08:18 GMT)
Two-photon interference at a telecom wavelength for quantum networking [0.0] 我々は、光子対光源とオフザシェルフ光学を含む光ファイバー結合デバイスを活用し、香港・ウーマンデル干渉を実証する。
2光子の一致を記録し、91.9(5)%の最先端の可視性を示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:41:12 GMT)
Turning qubit noise into a blessing: Automatic state preparation and long-time dynamics for impurity models on quantum computers [0.0] 強相関系に対する力学平均場理論のアプローチでは、雑音を有利に活用できることが示される。
本研究では, 振幅減衰を抽出し, ノイズのない量子ビットと雑音のない量子ビットを混合して, このモデルの力学を再現する回路を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:52:33 GMT)
Transversal PACS Browser API: Addressing Interoperability Challenges in Medical Imaging Systems [0.0] Transversal PACS Browser APIは、DICOMイメージの検索と検索のプロセスを強化するように設計されている。
さまざまなフィルターオプションを通じて高度なフィルタリング機能と、カスタムフィールド検索を提供する。
このアプリケーションは、複数のPACSステーションからのクエリと検索のための統一インターフェースを提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:52:10 GMT)
Training LLMs for Generating IEC 61131-3 Structured Text with Online Feedback [0.0] 本稿では,IEC 61131-3 構造化テキスト (ST) コード生成のための微調整 LLM へのアプローチを提案する。
このフレームワークは産業自動化アプリケーションに非常に適しており、最先端のモデルより優れている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:09:46 GMT)
Towards an optimised evaluation of teachers' discourse: The case of engaging messages [0.0] 本研究では,教師の言論評価を最適化するための新しい手法を提案する。
最初の研究は、2年間にわたる音声録音による実例に基づく2つの大きな言語モデルを訓練することであった。
第2の研究では、これらのモデルを第3学年の音声録音授業の書き起こしに適用し、メッセージタイプの頻度と分布について検討した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:29:45 GMT)
Towards an identity management solution on Arweave [0.0] 本稿では、Arweaveネットワークを用いてID管理ソリューションを開発する可能性について検討する。
Arweaveの永続ストレージを活用することで、当社のソリューションは、ユーザにSSI(Self-Sovereign Identity)フレームワークを提供します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:01:31 GMT)
Towards Responsible Governing AI Proliferation [0.0] 論文では、小規模で分散化されたオープンソースのAIモデルの台頭を期待するProliferation'パラダイムを紹介している。
これらの発展は、可能性があり、利益と新たなリスクの両方をもたらす可能性が高いことを示唆している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:10:35 GMT)
Toward an Insider Threat Education Platform: A Theoretical Literature Review [0.0] 組織内のインサイダー脅威(Insider threats, InTs)は少ないが、システム、情報、インフラにダメージを与える不均等な能力を持つ。
既存のInT研究は、心理的、技術的、教育的な観点から問題を研究している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:34:33 GMT)
Time-dependent spectra of quantum beats [0.0] 単一マルチレベルエミッタの自然発光と共鳴蛍光の時間分解スペクトルを得る。
強磁場共鳴蛍光では、ビートシグネチャはダブルト側バンドの形成である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:54:16 GMT)
Time-Reversible Bridges of Data with Machine Learning [0.0] この論文は、初期条件と最終条件に制約された時間可逆的な決定論と力学を学ぶための新しいアプローチを提示している。
ダイナミクスは、観測されたデータから機械学習アルゴリズムによって推測される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:47:19 GMT)
Theory of robust quantum many-body scars in long-range interacting systems [0.0] 量子多体散乱(Quantum many-body scars, QMBS)は、量子多体系の異常エネルギー固有状態である。
長距離相互作用量子スピン系は、一般にロバストQMBSをホストすることを示す。
この理論は、任意のシステムサイズに対するQMBSの安定性のメカニズムを明らかにする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:18:44 GMT)
Theory of Complex Particle without Extra Dimensions [0.0] ミンコフスキー時空における複素粒子の臨界次元は、$D = 4$であり、$D = 2, 4$ または 6$ はユークリッド時空において許される。
次元に対する制限の起源は、正準理論の量子化における第三次制約の存在である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:41:05 GMT)
Theory and Experimental Demonstration of Wigner Tomography of Unknown Unitary Quantum Gates [0.0] 有限次元ウィグナー型表現の枠組みにおける未知のユニタリ量子過程のトモグラフィーについて検討する。
これらの形状は、走査型位相空間トモグラフィー法を用いて実験的にトモグラフィすることができる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:02:57 GMT)
The Multiplex Classification Framework: optimizing multi-label classifiers through problem transformation, ontology engineering, and model ensembling [0.0] 本稿では,多重化分類フレームワークについて紹介する。
このフレームワークには,任意のクラスへの適応性や論理的制約など,いくつかのメリットがある。
従来の分類モデルとMultiformxアプローチを比較した2つの実験を行った。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:07:27 GMT)
The Certainty Ratio $C_ρ$: a novel metric for assessing the reliability of classifier predictions [0.0] 本稿では,任意の分類性能指標に対する信頼性(確実性)と不確実性(不確実性)の寄与を定量化する新しい尺度であるCertainty Ratio(C_rho$)を紹介する。
21のデータセットと複数の分類器(Decision Trees、Naive-Bayes、 3-Nearest Neighbors、Random Forestsなど)にまたがる実験の結果、$C_rho$rhoは従来のメトリクスがしばしば見落としているという重要な洞察を明らかにしている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:46:01 GMT)
Tensor-network decoders for process tensor descriptions of non-Markovian noise [0.0] フォールトトレラント計算には量子エラー補正(QEC)が不可欠である。
本稿では,2つのパラダイムQEC符号の性能について検討する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:17:09 GMT)
TAUDiff: Improving statistical downscaling for extreme weather events using generative diffusion models [0.0] 迅速なターンアラウンド、動的整合性、正確な時間的回復を達成することが不可欠である。
本稿では,決定論的モデルとより小さな生成的拡散モデルを組み合わせることで,より微細な特徴を再現する効率的な拡散モデルTiffAUDを提案する。
提案手法は, 極端事象のより高速なシミュレーションを実現するだけでなく, 低推算時間による炭素フットプリントの削減も可能である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:05:19 GMT)
Suppression of Quantum Correlations in a Clean-Disordered Atom-Nanophotonic Interface [0.0] 原子-ナノフォトニクス系の高次量子相関に対するクリーンシステムサイズの影響について検討した。
その結果、導波路を介する長距離相互作用によって実現される異なる量子相関が明らかとなった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:51:34 GMT)
Superfluorescent upconversion nanoparticles as an emerging second generation quantum technology material [0.0] アップコンバージョンナノ粒子(UCNP)の超蛍光は室温量子現象であり、ネオジム(Nd3+)ドープUCNPによって放出される光子の速度と総量を大幅に増加させることができる。
この視点では、SF-UCNPを第2世代の量子技術応用のための光学ナノマテリアルのクラスとして利用する方法を文脈化している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:00:02 GMT)
Speech-based Multimodel Pipeline for Vietnamese Services Quality Assessment [0.0] 本研究は,ベトナムのサービスセクターに着目した,サービス品質評価のための新たなディープラーニングアプローチを提案する。
従来の評価手法を超越したマルチモーダルパイプラインを活用することで、従来の評価の限界に対処する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 06:31:10 GMT)
Sinkhorn Algorithm for Sequentially Composed Optimal Transports [0.0] Sinkhornアルゴリズムは最適な輸送のためのデファクト標準近似アルゴリズムである。
本稿では,効率的な近似アルゴリズム,すなわち,逐次的に合成された最適輸送のためのシンクホーンアルゴリズムを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:34:23 GMT)
Simulating Bell inequalities with Qibo [0.0] 本稿では,ベルの不等式に関する教育資料を量子コンピューティングの文脈で提示する。
我々は,その違反をシミュレートするソフトウェアツールと,教室での議論のガイドを提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:43:13 GMT)
Sharp finite statistics for quantum key distribution [0.0] 量子鍵分布(QKD)におけるランダムサンプリング問題に対する単純な指数境界を考案する。
副生成物として、非正則ベルヌーイパラメータの平均に対する信頼区間も従う。
超幾何分布の累積質量関数が正確に計算可能であるので, 広いパラメータ構造では, テール境界の使用は強制されない。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:40:29 GMT)
Self-attentive Transformer for Fast and Accurate Postprocessing of Temperature and Wind Speed Forecasts [0.0] 現在のポストプロセッシング技術は、リードタイムごとに別々のモデルを必要とし、アンサンブル間の関係を無視することが多い。
本研究では,各アンサンブルメンバーを個別に後処理する革新的で高速かつ高精度なトランスフォーマを用いて,これらの欠点に対処する。
本手法は, CRPSで測定したように, 風速2mで17.5%, 風速10mで5%近く, 風速100mで5.3%と, 当初の予測を大幅に改善する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:37:09 GMT)
Scalar field with a time-independent classical source, not trivial after all: from vacuum decay to scattering [0.0] 散乱振幅を正確に解き、不安定真空からの粒子の生成が鍵となる。
過去に見いだされた自明な散乱は、相互作用の断熱スイッチングの副産物であることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:37:38 GMT)
Robustness of chaotic-light correlation plenoptic imaging against turbulence [0.0] 相関画像と一階強調画像の両方を同時に行うことができる顕微鏡に着想を得た撮像方式を考える。
強い乱流の存在下での直接画像と相関画像の比較により,後者の利点が明らかとなった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:04:56 GMT)
Representative Social Choice: From Learning Theory to AI Alignment [0.0] 代表的な社会的選択において、人口は、どの社会的選択決定が下されるかに基づいて、個々の課題のペアの有限のサンプルによって代表される。
代表的社会的選択における最も深い質問の多くは、統計的学習問題として自然に定式化できることを示す。
我々はさらに、社会選択の代表を定式化し、Arrowのような公理を一般化分析の新しいツールで証明する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:41:48 GMT)
Reliability analysis for non-deterministic limit-states using stochastic emulators [0.0] 本稿では、モデルに対する信頼性解析を導入し、その典型的な計算コストを下げるために適切な代理モデルを用いて対処する。
具体的には、最近導入された一般化モデルとカオス拡張に焦点を当てる。
まず、閉形式解を持つ解析関数を用いて、エミュレータが正しい解に収束することを実証する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:08:56 GMT)
Reduced density matrix and entanglement Hamiltonian for a free real scalar field on an interval [0.0] 有限区間における1+1$自由実スカラー場に対する還元密度行列の正確な結果を示す。
質量のない場合、出現する核のウィリアムソン分解が明示的に実行され、従属(モジュラー)ハミルトニアンに対する既知の結果を再現することができる。
反対の$Mtoinfty$の場合、$O(M-1/2)$ まで、絡み合いハミルトニアンは局所であり、密度は三角形の形状関数によって空間的に変調されるハミルトン密度である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:13:38 GMT)
Race Discrimination in Internet Advertising: Evidence From a Field Experiment [0.0] ブラジルと米国におけるMetaの広告プラットフォームに人種的偏見を示す実験の結果を報告する。
広告主は1000ドル(約1万1000円)ごとに、暗い肌のコンプレッションモデルの写真を使って同じエンゲージメントを達成するために159ドル(約1万5000円)を支払わなければならない。
光と暗いコンプレックスのモデルの写真が共有予算に割り当てられると、Metaは予算の約64%を、より軽い肌のコンプレックスを特徴とする写真に向ける。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:19:57 GMT)
Quantum-selected configuration interaction with time-evolved state [0.0] 量子選択構成相互作用(QSCI)は、量子デバイス上の入力量子状態を使用して重要な基底を選択する。
対象のハミルトン状態(初期状態)をQSCIの入力として用いることを提案する。
小分子の電子状態を記述する量子化学ハミルトニアン法により得られたエネルギーの精度を数値的に検討する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:33:16 GMT)
Quantum entropy and QCD factorization for low-$Q^2$ $ν$DIS [0.0] 我々はQCDにおける連続分布に付随する量子エントロピーに基づく新しいアプローチを導入し、ニュートリノdisの記述に関連する分解定理の限界を特徴づける。
この研究は、量子エントロピーを通じて分解分解を破る力学を分離するための追加の道が示唆され、関連する系の量子シミュレーションでも役割を果たす可能性がある。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:00:05 GMT)
Quantum Simulation of the Dicke-Ising Model via Digital-Analog Algorithms [0.0] そこで我々はDicke-Isingモデルのためのディジタルアナログ量子シミュレータを提案する。
本研究では,フィールド理論を用いて,システムの自由エネルギー景観を解析する。
我々は、量子ビットと光子自由度をアンタングルするデジタルアナログ量子アルゴリズムを開発した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:28:52 GMT)
Quantum Optimization for Energy Management: A Coherent Variational Approach [0.0] 本稿では、最適潮流(OPF)を解くための量子化解を提案する。
内部点法(IPM)とコヒーレント変分量子線形解法(CVQLS)を統合する。
CVQLSはIPMのHessianのような不条件行列との安定性のためにOPFに最も適している。
将来性はあるものの、CVQLSの適用は現在、既存の量子ハードウェアの制限によって制限されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:43:51 GMT)
Quantum Observables of Quantized Fluxes [0.0] ヤン・ミルズ理論におけるフラックス可観測物の正準量子化の体系的解析について述べる。
結果として生じる位相量子可観測物は、フラックス量子化されたゲージ場のモジュライ空間のループ空間のホモロジーポントラジャーギン代数を形成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:06:23 GMT)
Quantum Fisher Information Reveals UV-IR Mixing in the Strange Metal [0.0] マルチパーティ・エンタングルメントの証人である量子フィッシャー情報(QFI)を計算した。
この定数は紫外と赤外の両方の性質に依存するため、奇妙な金属中の多粒子の絡み合いがUV-IR混合を示すことを示している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:46:22 GMT)
Quantum Calculus of Fibonacci Divisors and Fermion-Boson Entanglement for Infinite Hierarchy of N = 2 Supersymmetric Golden Oscillators [0.0] 金と銀の比の力の2つの基底を持つ量子計算は、フィボナッチ因子微分とフィボナッチ因子演算子のビネット公式を関連付ける。
我々は、フェルミオンボソンの絡み合いを測定する基準状態と対応するフォン・ノイマンエントロピーが、金比のパワーによって完全に特徴づけられることを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:23:43 GMT)
Python Agent in Ludii [0.0] LudiiはJavaの汎用ゲームシステムであり、新しいエージェントを開発するためのAPIと新しいゲームを作成するためのゲーム記述言語を備えている。
我々はエージェントプログラミングにPythonを提供する。これにより、一般的なゲームプレイエージェントを実装するためにPythonモジュールを使用することができる。
Ludiiエージェントを作成するためにPythonを有効にする手段として、インターフェースはjpyとPy4Jという異なるJavaライブラリを使って実装されている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:12:52 GMT)
Projective purification of correlated reduced density matrices [0.0] 以下に示す全てのタスクを、最も侵襲的な方法で実行することができるアルゴリズムを提案する。
本稿では,Fermi-Hubbardモデルを用いて,従来の浄化アルゴリズムよりも,現在の浄化アルゴリズムの方が優れていることを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:33:51 GMT)
Probing supersolidity through excitations in a spin-orbit-coupled Bose-Einstein condensate [0.0] スピン軌道結合したボース=アインシュタイン凝縮体は、合成量子多体系を設計するための柔軟な実験プラットフォームである。
In situ画像と直接観察を用いて,超固体の物質状態の例であるストライプ相について検討した。
この結果から, スピン軌道結合型スーパーソリッドがスーパーソリデーティとそのリッチダイナミクスを研究するためのプラットフォームとして確立された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:54:59 GMT)
Oscillators with imaginary coupling: spectral functions in quantum mechanics and quantum field theory [0.0] カルPT$対称性を持つ非エルミート的ハミルトニアンは、実スペクトルとユニタリ時間の両方を持つことができる。
2点相関関数とその関連K"アルレン・レーマン表現を解析する。
我々は、この理論のいくつかのスペクトル関数に対する肯定的違反は、複素エネルギー固有値の存在の一般的な兆候であるかもしれないと推測する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:09:30 GMT)
Optimally Solving Simultaneous-Move Dec-POMDPs: The Sequential Central Planning Approach [0.0] 本稿では、分散実行のためのシーケンシャルモブ集中型トレーニングという、新しい、よりスケーラブルな代替手段を提案する。
さらに、ベルマンの最適性原理の適用性を高め、3つの新しい性質を提起する。
2-および多-エージェント領域の実験は、我々の新しいアプローチの優位性を確認した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:46:10 GMT)
Operator dynamics in Floquet many-body systems [0.0] 我々は,多体量子系の演算子ダイナミクスについて研究し,エルゴード的,空間的拡張,保存密度の欠如といったシステムの汎用的特徴に着目した。
我々は、Floquet量子回路に焦点をあて、それらの挙動を、時間的にランダムな回路で以前に見つかったものと比較する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:23:46 GMT)
Open-Source Protein Language Models for Function Prediction and Protein Design [0.0] タンパク質言語モデル(PLM)は、タンパク質配列の理解を改善することを約束しており、機能予測やタンパク質工学などの分野の発展に寄与している。
我々はPLMを、計算生物学と化学のためのオープンソースのフレームワークであるDeepChemに統合し、タンパク質関連のタスクのためのよりアクセスしやすいプラットフォームを提供する。
各種タンパク質予測タスクにおける統合モデルの性能評価を行い,ベンチマーク間で妥当な結果が得られることを示した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:41:15 GMT)
On Compton ionization of a hydrogen atom by twisted photons [0.0] 平面波の代わりに円筒波を用いることは, 反応生成物の新しい角分布に繋がらないことを示す。
平面波の代わりに円筒波を用いることは, 反応生成物の新しい角分布に繋がらないことを示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:14:55 GMT)
Observation of extrinsic topological phases in Floquet photonic lattices [0.0] 離散ステップ歩行に特有の位相位相の観察を報告する。
我々の研究は、量子ウォークの対象となる粒子のトポロジカルモードの工学の新しい視点を開く。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:37:53 GMT)
Novel AI Camera Camouflage: Face Cloaking Without Full Disguise [0.0] 本研究は,標的となる化粧品の摂動とα透明層操作を組み合わせた顔迷彩の新しいアプローチを示す。
キーポイント領域への微妙な修正によって効果的な難読化を実現する。
結果は、スケーラブルで視力の低い顔難読化戦略を作成する可能性を強調している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:03:18 GMT)
Neonpool: Reimagining cryptocurrency transaction pools for lightweight clients and IoT devices [0.0] textitNeonpoolは、ブルームフィルタの変種を使った革新的なトランザクションプール最適化であり、トランザクションプールのメモリフットプリントを一部に削減する。
textitNeonpoolは、軽量暗号クライアントや、ブラウザ、システムオンチップ、モバイル、IoTデバイスなどのリソース制限されたデバイスに理想的だ。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:19:19 GMT)
Negative Wigner function by decaying interaction from equilibrium [0.0] 負のウィグナー関数重畳状態を得るための概念的に異なる、より自律的な方法を提案する。
検出可能な負のウィグナー関数と量子コヒーレンスと、より多くの量子ビットを用いた定性的拡張を同時に示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:13:05 GMT)
Multi-user QKD using quotient graph states derived from continuous-variable dual-rail cluster states [0.0] マルチパーティの絡み合った状態は、マルチユーザ量子暗号タスクの基本的なリソースである。
本稿では,CVデュアルレールクラスタ状態を用いて3つのユーザ会議鍵を生成する新しいプロトコルを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 20:35:12 GMT)
Momentum space magic for the transverse field quantum Ising model [0.0] 一次元横場量子イジングモデルにおけるパウリ弦の運動量空間構造と安定化エントロピーについて検討する。
すべての強磁性状態は熱力学的限界において同じ程度の魔法を持っているが、安定度エントロピーは臨界点において非解析的であり、横磁場の増加とともに消滅する。
量子魔法に対する運動量空間のアプローチは、その実空間を補完するだけでなく、非安定化器性や古典的シミュラビリティを解析する上での利点も提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 07:21:27 GMT)
Model-Agnostic Cosmological Inference with SDSS-IV eBOSS: Simultaneous Probing for Background and Perturbed Universe [0.0] Sloan Digital Sky Survey IV (SDSS-IV)拡張バリオン振動分光サーベイ (eBOSS) から得られたデータにインプリントされた微妙な特徴を、背景と摂動宇宙の複合プローブとして探索する。
SDSSのみを用いてバリオン音響振動(BAO)と赤方偏移(RSD)を赤方偏移の関数として再構成する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:50:50 GMT)
Mobilizing Waldo: Evaluating Multimodal AI for Public Mobilization [0.0] 我々は,「Where's Waldo」を用いて,複雑で混み合った集まりのプロキシとしてのイメージを創出する。
我々は,鍵となる個人を特定し,モビライゼーション戦略を定式化する際のモデルの性能を分析する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 00:10:11 GMT)
Measurement-device-independent entanglement witness with imprecise input states [0.0] 測定デバイスに依存しない絡み合い目撃者(MDI-EWs)は、特徴のある測定に頼らずに絡み合いの検出を可能にする。
MDI-EWは入力状態において非ゼロの精度で絡み合いの基準が成立しない敏感なMDI-EWである。
そこで本研究では,MDI-EWの基準を変更するための体系的なアプローチを提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:08:44 GMT)
Maximally Nonlinear and Nonconservative Quantum Circuits [0.0] 本稿では, 大規模非線形回路の保守的エネルギーと非保守的電力を求めるアルゴリズムを提案する。
我々は、Maxwell-Kirchhoffの現在の規則またはMaxwell-Kirchhoffの電圧規則によって提供されるほとんどホロノミック制約を持つ2ポート線形回路を考える。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:32:54 GMT)
Massive graviton dark matter searches with long-baseline atom interferometers [0.0] 本研究では, 原子干渉計のスピン-2 ULDMに対する感度について, 質量重力に対するいくつかの枠組みを考慮し検討した。
スピン-2 ULDMフィールドのコヒーレント振動は3つの異なるチャネルを通して測定可能な位相シフトを誘導する。
原子干渉計はこれらすべての効果を独自に探査し、レーザー干渉計とは異なる質量範囲に感度を与える。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:21:51 GMT)
Manifolds of exceptional points and effective Zeno limit of an open two-qubit system [0.0] 2つの相互作用量子ビットの開量子系を記述したリウヴィリア超作用素の例外点と、その1つの量子ビットに適用された散逸性偏光浴について解析的に研究する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:59:19 GMT)
Machine learning in wastewater treatment: insights from modelling a pilot denitrification reactor [0.0] ノルウェーのヴェアス処理施設にあるパイロット・リアクターのデータを用いて、生物学的硝酸塩の最適化に機械学習をどのように利用できるかを探る。
予測精度にのみ焦点をあてるのではなく、本手法は効果的なデータ駆動モデリングのための基礎的要件を理解することを優先する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:49:23 GMT)
Low loss hybrid Nb/Au superconducting resonators for quantum circuit applications [0.0] 100nmNiO(Nb)回路と10nm金(Au)キャッピング層を組み合わせた超伝導デバイスについて検討した。
以上の結果から,Au層の追加は2レベルのシステム欠陥の密度を低下させることが明らかとなった。
この結果から,Nb/Au積層素子共振器が超伝導量子技術の進歩に有効である可能性が示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:30:32 GMT)
Lindblad dynamics of open multi-mode bosonic systems: Algebra of bilinear superoperators, spectral problem, exceptional points and speed of evolution [0.0] 行列に付随する左超作用素と右超作用素の二次結合のリー代数に基づく手法を開発する。
本手法は, スーパープロパゲータの低温近似を導出し, フォトニック偏光モードを表す2モード系の特別な場合について検討する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:30:04 GMT)
Lightweight Safety Classification Using Pruned Language Models [0.0] 本稿では,大規模言語モデルに対するコンテンツ安全性と迅速なインジェクション分類のための新しい手法を提案する。
提案手法は,GPT-4oを超える優れた性能と,タスク毎に微調整された特別目的モデルを実現する。
以上の結果から,コンテンツ安全性の分類やインジェクションの早期検出,出力トークンの同時生成に,単一汎用LLMが使用可能であることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:13:13 GMT)
LeStrat-Net: Lebesgue style stratification for Monte Carlo simulations powered by machine learning [0.0] モンテカルロサンプリングにおける階層化を回避する機械学習アルゴリズムを開発した。
我々は、ルベーグ積分でなされるような、サンプリングされる関数の高さに基づいて、積分の領域空間を分割する別の方法を使用する。
ニューラルネットワークの能力を利用して複雑な関数を学習し、これらの複雑な分割を予測し、ドメイン空間の大規模なサンプルを事前分類する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:03:37 GMT)
Landscape of AI safety concerns -- A methodology to support safety assurance for AI-based autonomous systems [0.0] AIは重要な技術として登場し、さまざまなアプリケーションにまたがる進歩を加速している。
AIコンポーネントを組み込んだシステムの安全性を確保するという課題は、極めて重要である。
本稿では,AIシステムにおける安全保証事例作成を支援する新しい手法を提案する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:38:16 GMT)
LLM-SEM: A Sentiment-Based Student Engagement Metric Using LLMS for E-Learning Platforms [0.0] LLM-SEM (Language Model-Based Students Engagement Metric) は,ビデオメタデータと学生コメントの感情分析を利用してエンゲージメントを測定する手法である。
包括的メタデータと感情極性スコアを組み合わせることで、コースと授業レベルのエンゲージメントを測定する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:01:53 GMT)
Integrated GIS- and network-based framework for assessing urban critical infrastructure accessibility and resilience: the case of Hurricane Michael [0.0] 本研究は, ハリケーン等の極端なイベントにおける都市インフラの弾力性を評価するための枠組みを提案する。
この手法はGISとネットワーク分析を、余波のオープンなリモートセンシングデータ、インフラ上のベクトルデータ、被災地域の人口の社会デコグラフィー特性と組み合わせる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:07:27 GMT)
Improving Generalization Performance of YOLOv8 for Camera Trap Object Detection [0.0] この論文では、一般化の問題に対処するため、YOLOv8オブジェクト検出アルゴリズムの強化について検討する。
提案された拡張は、カメラトラップデータセットに固有の課題に対処するだけでなく、現実の保存シナリオにおける広範な適用性への道を開く。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 02:00:53 GMT)
Generative AI Toolkit -- a framework for increasing the quality of LLM-based applications over their whole life cycle [0.0] 本稿では,LLMベースのアプリケーションのライフサイクル全体を自動化したGenerative AI Toolkitを紹介する。
このツールキットはエージェントのような生成AIアプリケーションの設定、テスト、監視、最適化に役立ち、リリースサイクルを短縮しながら品質を大幅に改善する。
ジェネレーティブAIツールキットが他のチームに役立つと確信しているので、オープンソースにして、他の人が利用し、前進し、適応し、改善することを望んでいます。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:40:00 GMT)
Generation of the Complete Bell Basis via Hong-Ou-Mandel Interference [0.0] 量子光学におけるHong-Ou-Mandel(HOM)干渉現象は、古典的な状態を超えて応用を拡張する可能性がある。
HOMの干渉を利用した4つのベル状態の同時生成を実演する。
結果は、高次元量子情報処理、特に高次元量子通信、量子センシング、および光の調整された量子状態に依存する高度なフォトニック技術のための有望な道を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:09:26 GMT)
From approximation error to optimality gap -- Explaining the performance impact of opportunity cost approximation in integrated demand management and vehicle routing [0.0] 本稿では,近似誤差の大きさ,即時の影響,および状態空間の特定の領域におけるそれらの関連性を定量化し,可視化する説明可能性手法を提案する。
本手法を一般のi-DMVRPに適用することにより,アルゴリズム性能の説明に寄与し,アルゴリズムの選択と開発プロセスのガイダンスを提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:46:46 GMT)
Fool's gold: ligand-receptor interactions and the origins of life [0.0] 生命の起源は、科学の分野を巡って科学者を誘惑し続けている問題である。
1つの理論、すなわち鉄-硫黄理論は、生体材料の合成に必須な反応が、鉄パイライトのような鉱物表面から「スパーク」パイライトを得たことを示唆している。
したがって、リガンド受容体の結合は生命の起源の基本である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:26:12 GMT)
Flow Exporter Impact on Intelligent Intrusion Detection Systems [0.0] 高品質なデータセットは、機械学習モデルのトレーニングに不可欠である。
特徴発生の不整合は、脅威検出の精度と信頼性を妨げる。
本稿では,侵入検知のための機械学習モデルの性能と信頼性に及ぼす流量輸出機の影響について検討する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:38:20 GMT)
Exploring User Acceptance of Blockchain-Based Student Certificate Sharing System: A Study on Non Fungible Token (NFT) Utilization [0.0] 本稿では, 使いやすさ, 使いやすさ, システムに対する態度が, 利用意図に与える影響を精査する技術受容モデルTAMを構築した。
その結果,個々の構成物がシステムの使用意図に特に影響を与え,その集団的影響は統計的に有意であることが示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:47:17 GMT)
Exchange-Symmetrized Qudit Bell Bases and Bell-State Distinguishability [0.0] 単一粒子ヒルベルト空間次元$d$のキューディ対の絡み合いは、量子情報処理にとって重要なポテンシャルを持つ。
2つの粒子間の状態の交換の下で、定対称性を持つ一般化ベル基底を導入する。
我々は、線形進化と局所測定に制限されたデバイスによって明確に区別できるキュディットベル状態の数を定量化する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:49:09 GMT)
Exceptional stationary state in a dephasing many-body open quantum system [0.0] 我々は、無限温度状態と別の静止状態とを同時にホストする多体オープン量子システムについて研究する。
本稿では,2つの状態間の相互作用の運命に着目したモデルの定常性へのアプローチについて論じる。
オープンシステムフレームワークにおける量子多体傷として、これらの例外定常状態を考える理由を指摘する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:09:40 GMT)
Evaluating the Propensity of Generative AI for Producing Harmful Disinformation During an Election Cycle [0.0] 本研究は, 選挙期間中に有害な偽情報を生成するための, 現在の生成AIモデルの妥当性について検討する。
コピロとジェミニは、予想される最低限の損害に気付き、全体的な安全性能に結びついていることが判明した。
敵対的役割の特徴が発見され 全てのモデルに より大きな害をもたらすことが判明しました
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:44:02 GMT)
Essential implications of similarities in non-Hermitian systems [0.0] 3つの異なる一般化された類似性がすべてのユニタリ対称性と反ユニタリ対称性を包含していることが示される。
一般化された類似性条件は、ユニタリ対称性あるいは反ユニタリ対称性によって定義される任意のクラスよりもより大きな系のクラスをもたらすことを証明している。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:02:34 GMT)
Enhancing Fingerprint Recognition Systems: Comparative Analysis of Biometric Authentication Algorithms and Techniques for Improved Accuracy and Reliability [0.0] 本研究では,指紋認識精度と堅牢性を向上させるために,畳み込みニューラルネットワーク(CNN)とGaborフィルタを統合することを検討した。
以上の結果から,CNNによるアプローチの優位性が示唆され,全体の精度は94%であった。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 23:23:50 GMT)
Enhanced Detection Rate and High Photon-Number Efficiencies with a Scalable Parallel SNSPD [0.0] 専用の並列構造を持つ28画素の超伝導ナノワイヤ単光子検出器について報告する。
このデバイスは最大1光子の効率が88%で、効率は50%以上維持できる。
この検出器は、2光子効率75%、3光子効率62%の最先端の光子数分解性能も提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:30:55 GMT)
Efficient construction of witnesses of stellar rank of nonclassical states of light [0.0] 星級の一般証人を構築するための効率的な方法を提案する。
本稿では,Fock状態確率のペアと,コヒーレント状態の重ね合わせによる忠実度の組み合わせに基づいて,星級証人を構成する手順を説明する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:43:52 GMT)
Dynamical Screening of Local Spin Moments at Metal-Molecule Interfaces [0.0] 軌道依存型ハイブリダイゼーションと電子相関が共に強い電荷とスピンの揺らぎをもたらすことを示す。
本結果は, 金属接触分子デバイスにおける量子揺らぎの重要性を強調した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:23:38 GMT)
Distilled Pooling Transformer Encoder for Efficient Realistic Image Dehazing [0.0] 本稿では,DPTE-Net と呼ばれる蒸留ポリオ変圧器を用いて,リアルなイメージデハージング用に設計された軽量ニューラルネットワークを提案する。
種々のベンチマークデータセットによる実験結果から,提案するDPTE-Netは,最先端の手法と比較して,競合的なデハージング性能が得られることが示された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:16:23 GMT)
Dissipative Phase Transition in the Two-Photon Dicke Model [0.0] 2光子ディックモデルの散逸相転移について検討する。
2光子損失の包含により安定性が回復し、超ラジカル状態が出現する。
また、モデルに固有のZ4対称性の破れについても光を当てた。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:06:22 GMT)
Discretization of Structured Bosonic Environments at Finite Temperature by Interpolative Decomposition: Theory and Application [0.0] 本研究では, ボゾン熱浴のスペクトル密度を識別する新しい手法を提案する。
スペクトル密度-自己相関関数関係に符号化された時間、周波数、温度依存性を捉えることにより、オープン量子系力学に必要な自由度を著しく低減する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 12:38:10 GMT)
Discrete Quantum Walks with Marked Vertices and Their Average Vertex Mixing Matrices [0.0] 我々は、$AMM$のエントリのバウンダリを見つけ、これらのバウンダリがタイトであるかどうかを調べる。
この境界に達する量子ウォークに対して、$AMMS,S]$が対称、正の半定値、あるいは均一であるかどうかを決定する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:54:59 GMT)
Digital twin in advanced training of engineering specialists [0.0] 企業のデジタルツインには、すべての主要なプレプロダクション、プロダクション、プロダクションサポートプロセスが含まれています。
エンジニアリングスペシャリストが受ける能力が選択されている。
エンジニアリングスペシャリストの新たな能力を考慮して、プロセスの運用モードを測定した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:46:13 GMT)
Digestion Algorithm in Hierarchical Symbolic Forests: A Fast Text Normalization Algorithm and Semantic Parsing Framework for Specific Scenarios and Lightweight Deployment [0.0] テキスト正規化とセマンティックパーシングは、自然言語プログラミング、パラフレージング、データ拡張、エキスパートシステムの構築、テキストマッチングなど、自然言語処理に多くの応用がある。
大規模言語モデル(LLM)におけるディープラーニング(Deep Learning)の顕著な成果にもかかわらず、ニューラルネットワークアーキテクチャの解釈性はまだ貧弱であり、信頼性に影響を与え、結果としてリスクに敏感なシナリオの展開を制限する。
データが少ない特定のシナリオ固有のドメインでは、大量の教師付き学習ラベルを素早く取得することは困難であり、手動でラベル付けするデータのワークロードは膨大である。
DAHSFはテキストを組み合わせてこれらの問題に対処するために提案されている
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:05:49 GMT)
Diffusion map particle systems for generative modeling [0.0] 拡散写像とラプラシアン調整ワッサーシュタイン勾配勾配(LAWGD)に基づく新しい拡散写像粒子システム(DMPS)を提案する。
拡散写像は、サンプルから対応するランゲヴィン拡散過程の生成元を近似し、基礎となるデータ生成多様体を学習するために用いられる。LAWGDは、核の適切な選択を条件として、対象分布からの効率的なサンプリングを可能にする。
本手法では、オフライントレーニングや最小限のチューニングは必要とせず、適度な次元のデータセットにおいて、他の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:51:43 GMT)
Diffusion Model from Scratch [0.0] 拡散生成モデルは、現在最も人気のある生成モデルである。
本稿では,VAEからDDPMへの進化をトレースすることで,生成モデルの基本的理解を支援することを目的とする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:25:55 GMT)
Diagnosising Helicobacter pylori using AutoEncoders and Limited Annotations through Anomalous Staining Patterns in IHC Whole Slide Images [0.0] 本研究は,化学染色による組織像中のHelicobacter pylori(H. pylori)の検出に対処する。
本稿では,自己エンコーダを用いて健康パッチの潜伏パターンを学習し,HSV空間における画像の再構成誤差の具体的な指標を定式化することを提案する。
ROC分析は、この測定の最適しきい値と、H. pyloriの存在を決定するサンプル中の正のパッチの割合を設定するために用いられる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 13:52:42 GMT)
Determining the $^3$P$_0$ excited-state tune-out wavelength of $^{174}$Yb in a triple-magic lattice [0.0] アルカリ-アース(-様)原子におけるクロック状態対のチューニング波長は、最大状態選択トラップ条件を提供する。
我々はメタスタブルな3$P$_0$クロック状態の波長を519.920(9)$THzで174$Ybで測定した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:56:30 GMT)
Detecting Wildfires on UAVs with Real-time Segmentation Trained by Larger Teacher Models [0.0] 森林火災の早期発見は、大規模な火災が大規模な環境、構造、社会的な被害をもたらすのを防ぐために不可欠である。
遠隔地では、高帯域幅の移動ネットワークが欠如しているため、検出方法はオンボード計算に限られている。
本研究では,境界ボックスラベルのみを用いて,小さなセグメンテーションモデルを訓練する方法を示す。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:54:03 GMT)
Deep hybrid models: infer and plan in a dynamic world [0.0] 複雑な制御タスクに対する能動推論に基づく解を提案する。
提案したアーキテクチャは、ハイブリッド(離散および連続)処理を利用する。
モデルが異なる条件下で提示された課題に対処できることが示される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 17:05:38 GMT)
Deep encoder-decoder hierarchical convolutional neural networks for conjugate heat transfer surrogate modeling [0.0] 共役熱伝達(CHT)解析は多くのエネルギー系の設計に不可欠である。
高忠実CHT数値シミュレーションは計算集約的である。
我々は,CHT解析のためのモジュール型ディープエンコーダ・デコーダ階層型畳み込みニューラルネットワーク(DeepEDH)を開発した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 03:28:16 GMT)
Correlations, Spectra and Entaglement Transitions in Ensembles of Matrix Product States [0.0] 量子回路の進化によって生じる行列積状態のアンサンブルと,固定結合次元$chi$のMPSへの投射について検討する。
具体的には, (i) ランダム逐次ユニタリ回路, (ii) ランダムユニタリ回路, (iii) ユニタリと射影の測定の両方を含むアンサンブルについて考察する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 19:00:33 GMT)
Constructing sensible baselines for Integrated Gradients [0.0] 我々は、異なるベースラインを設計することで、機械学習モデルを理解するために統合的勾配(IG)を適用する方法を示す。
ゼロベクターベースラインは良い特徴属性を提供しておらず、バックグラウンドイベントからサンプリングされた平均ベースラインは、一貫してより合理的な属性を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:01:15 GMT)
Comparative Analysis of YOLOv9, YOLOv10 and RT-DETR for Real-Time Weed Detection [0.0] 本稿では,スマートスパレイティングアプリケーションにおける雑草検出のためのオブジェクト検出モデルであるYOLOv9,YOLOv10,RT-DETRの総合評価について述べる。
これらのモデルの性能は、GPUデバイスの平均平均精度(mAP)スコアと推論時間に基づいて比較される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 04:15:32 GMT)
Clinical Trials Ontology Engineering with Large Language Models [0.0] 本稿では,臨床試験データを簡易かつ効果的な方法で抽出・統合する手法を提案する。
大規模な言語モデル(LLM)は、コストと時間の観点から、このプロセスを自動化するための実行可能な選択肢であることを示している。
本研究は,臨床実験からのリアルタイムデータ統合が標準となる医療研究における重要な意味を指摘する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 22:40:52 GMT)
Climate-Driven Doubling of U.S. Maize Loss Probability: Interactive Simulation with Neural Network Monte Carlo [0.0] 我々は、米国連邦作物保険プログラム(Federal Crop Insurance Program)の1つの重要な機関に対する、米国コーンベルト内の将来のリスクについて検討する。
温暖化による農作物の減少の影響を,政策順応的な「リスクユニット」スケールで予測する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:25:39 GMT)
Characterizing quantum state-space with a single quantum measurement [0.0] QBismは、量子論は隠れ変数のない世界でのエージェントのギャンブルの規範的ガイダンスであると主張する。
正しく解釈された単一の3つの設計「参照装置」との整合性は、全ての量子理論との整合性を意味する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 05:00:45 GMT)
Characterization of errors in a CNOT between surface code patches [0.0] 格子サージェリーを用いた2つのコードパッチ間のCNOT動作について検討する。
格子サージェリーベースのCNOTの2ビット論理的誤りチャネルを完全特徴付ける。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:17:38 GMT)
CNNtention: Can CNNs do better with Attention? [0.0] 本研究の目的は,従来のCNNと注意増進CNNを画像分類タスクで比較することである。
彼らの性能、精度、計算効率を評価し、比較することで、プロジェクトは従来のCNNの局所的特徴抽出の利点とトレードオフを強調します。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:56:51 GMT)
Beyond Monte Carlo: Harnessing Diffusion Models to Simulate Financial Market Dynamics [0.0] 本稿では,合成金融市場データを生成するための,効率的かつ正確な手法を提案する。
合成データは、いくつかの重要な側面において観測された市場データと密接に一致している。
モデルトレーニングではモンテカルロシミュレーションではなく数値積分に基づく効率的かつ高速なアルゴリズムを開発する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 16:11:15 GMT)
Bell's shadows from satellites [0.0] 我々は、絡み合った光子対の交換によって量子リンクが生成される衛星と地上ステーションのネットワークを構想する。
我々は、衛星星座の力学と、星座と地上ステーションの間の一連のベル試験をシミュレートする。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 01:24:06 GMT)
Bayesian Critique-Tune-Based Reinforcement Learning with Attention-Based Adaptive Pressure for Multi-Intersection Traffic Signal Control [0.0] 本稿では,多区間信号制御のためのBCT-APRL(Bayesian Critique-Tune-based Reinforcement Learning)を提案する。
BCT-APRLは、7つの実世界のデータセットにおける最先端の手法よりも優れている。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:33:25 GMT)
Attention-driven Next-best-view Planning for Efficient Reconstruction of Plants and Targeted Plant Parts [0.0] 本稿では,注意駆動型NBV計画手法を用いて,目標知覚を改善する上での注意の役割について検討する。
その結果,作業関連部品に注意を向けることによって,3次元再構築のスピードと精度が著しく向上することが示唆された。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 08:50:58 GMT)
Applications and resource estimates for open system simulation on a quantum computer [0.0] オープンシステム量子シミュレーションが量子コンピュータにおいて望ましいアプローチである2つの応用について述べる。
産業利用のために,先進技術の経済価値を継続的に推定する手法を開発した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:07:15 GMT)
Advanced Reasoning and Transformation Engine for Multi-Step Insight Synthesis in Data Analytics with Large Language Models [0.0] ARTEMIS-DAは、複雑で多段階のデータ分析タスクを解決するために、大規模言語モデルを拡張するために設計されたフレームワークである。
ARTEMIS-DAはPlanner、Coder、Grapherという3つのコアコンポーネントを統合している。
このフレームワークはWikiTableQuestionsやTabFactといったベンチマーク上でのSOTA(State-of-the-art)のパフォーマンスを実現する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:44:08 GMT)
Accurate and precise optical phase sensor based on a non-linear quantum Sagnac interferometer [0.0] そこで我々は,サニャック構成に基づく量子非線形干渉計を試作し,高精度,高精度,自己安定化,再生可能な光位相測定を可能にした。
このシステムのポテンシャルは、電気通信波長における商業分散シフトファイバの2次分散、すなわち色分散の測定によって示される。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 11:22:24 GMT)
A spinless spin qubit [0.0] 量子ビットの全電気的ベースバンド制御は、クロストークや熱発生の問題を取り除くことで量子プロセッサのスケールアップを容易にする。
半導体量子ドットにおいて、これは交換のみの量子ビットのようなマルチスピン量子ビット符号化によって実現される。
我々の設計は半導体スピン量子ビット技術のための堅牢でスケーラブルな経路を提供する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 09:38:35 GMT)
A simple yet accurate stochastic approach to the quantum phase noise of nanolasers [0.0] レーザー量子ノイズの簡単なモデルを提案する。
線幅は、閾値以下の光子によって支配されるものから、閾値上の波のような性質に変化する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 21:30:18 GMT)
A hybrid learning agent for episodic learning tasks with unknown target distance [0.0] 本稿では,必要なエピソードの長さに関する知識の必要性を軽減するために,選択戦略を備えたハイブリッドエージェントを提案する。
このハイブリッドエージェントは, ターゲット距離が不明で, エピソードの長さが一定でない特定のシナリオにおいて, 対応する古典的エージェントよりも高速に学習できることが判明した。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 10:23:46 GMT)
A Staged Deep Learning Approach to Spatial Refinement in 3D Temporal Atmospheric Transport [0.0] 本稿では,2段テンポラル3次元超解像(DST3D-UNet-SR)モデルを提案する。
このモジュールは、低分解能時間データから複雑な地形における羽根の過渡的な進化を予測する時間モジュール(TM)と、その空間分解モジュール(SRM)の2つの逐次モジュールから構成され、その結果、予測の空間分解能が向上する。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 18:46:15 GMT)
A Review of the Duality of Adversarial Learning in Network Intrusion: Attacks and Countermeasures [0.0] 敵対的攻撃、特にディープラーニングモデルの脆弱性を狙った攻撃は、サイバーセキュリティに対するニュアンスで重大な脅威となる。
本研究は,データポジショニング,テストタイムエベイション,リバースエンジニアリングなど,敵対的な学習の脅威について論じる。
我々の研究は、敵の攻撃によって引き起こされるネットワークセキュリティとプライバシの潜在的な侵害に対処するための防御メカニズムを強化するための基盤となる。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 14:21:46 GMT)
A Low-Temperature Tunable Microcavity featuring High Passive Stability and Microwave Integration [0.0] この研究は、特に低受動的振動レベルのために設計された閉サイクル極低温ファイバベースのマイクロキャビティ構成を提示する。
10ケルビン以下の温度では、25ピクタ程度の安定性が異なる設定で再現可能である。
論文参考訳(メタデータ) (Wed, 18 Dec 2024 15:31:58 GMT)