Think More, Hallucinate Less: Mitigating Hallucinations via Dual Process of Fast and Slow Thinking [124.7] HaluSearchは、ツリー検索ベースのアルゴリズムを組み込んだ新しいフレームワークである。
テキスト生成をステップバイステップの推論プロセスとしてフレーム化する。
認知科学における二重プロセス理論に着想を得た階層的思考システムスイッチ機構を導入する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:36:50 GMT)
Text2Data: Low-Resource Data Generation with Textual Control [100.6] Text2Dataは、ラベルのないデータを使って基盤となるデータ配布を理解する新しいアプローチである。
制御性を確保し、破滅的な忘れを効果的に防止する、制約最適化に基づく新たな学習目標を通じて微調整を行う。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:47:09 GMT)
Explainable Brain Age Gap Prediction in Neurodegenerative Conditions using coVariance Neural Networks [94.1] 脳年齢差予測に対するブラックボックス機械学習アプローチは実用性に制限がある。
各種神経変性疾患に対する皮質厚み特徴を用いた脳年齢差の研究に,VNNに基づくアプローチを適用した。
以上の結果より,アルツハイマー病,前頭側頭型認知症,非定型パーキンソン病の脳年齢差の解剖学的特徴が明らかとなった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:37:09 GMT)
Edicho: Consistent Image Editing in the Wild [90.4] エディコは拡散モデルに基づく訓練なしの解を踏む。
これは、明示的な画像対応を使って直接編集する基本的な設計原理を特徴としている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:00:16 GMT)
HunyuanVideo: A Systematic Framework For Large Video Generative Models [87.9] HunyuanVideoは、革新的なオープンソースのビデオファンデーションモデルだ。
データキュレーション、高度なアーキテクチャ設計、プログレッシブモデルスケーリング、トレーニングが組み込まれている。
その結果,13億以上のパラメータを持つビデオ生成モデルの訓練に成功した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:13:42 GMT)
SVFR: A Unified Framework for Generalized Video Face Restoration [86.2] 顔復元(FR)は画像およびビデオ処理において重要な領域であり、劣化した入力から高品質な肖像画を再構成することに焦点を当てている。
本稿では,映像BFR,インペイント,カラー化タスクを統合した汎用映像顔復元タスクを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:51:20 GMT)
Disambiguation of Chinese Polyphones in an End-to-End Framework with Semantic Features Extracted by Pre-trained BERT [82.0] ポリフォニック文字の発音を予測するためのエンドツーエンドフレームワークを提案する。
提案手法は,Transformers(BERT)モデルとニューラルネットワーク(NN)に基づく分類器から,事前訓練された双方向エンコーダ表現からなる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:51:52 GMT)
Nested Attention: Semantic-aware Attention Values for Concept Personalization [78.9] 我々はNested Attentionを紹介した。これはモデル内の既存のクロスアテンション層にリッチで表現豊かなイメージ表現を注入する新しいメカニズムである。
私たちのキーとなるアイデアは、ネストした注意層から得られたクエリ依存の主観値を生成し、生成した画像の各領域について関連する主観的特徴を選択することである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:52:11 GMT)
Free-Form Motion Control: A Synthetic Video Generation Dataset with Controllable Camera and Object Motions [78.7] 自由形運動制御のための合成データセット(SynFMC)を提案する。
提案したSynFMCデータセットは、さまざまなオブジェクトと環境を含み、特定のルールに従ってさまざまな動きパターンをカバーしている。
さらに,物体とカメラの動きの独立的あるいは同時制御を可能にするFMC(Free-Form Motion Control)を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:59:45 GMT)
Ultrasound Lung Aeration Map via Physics-Aware Neural Operators [78.6] 肺超音波は、急性肺疾患や慢性肺疾患を診断するクリニックにおいて増加するモダリティである。
超音波による空気透過性の低下に起因する胸膜界面からの複雑な逆流によって複雑になる。
RFデータから肺エアレーションマップを直接再構成するAIモデルLUNAを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:24:34 GMT)
SeedVR: Seeding Infinity in Diffusion Transformer Towards Generic Video Restoration [76.8] SeedVRは、任意の長さと解像度で現実世界のビデオ再生を処理するために設計された拡散トランスフォーマーである。
合成ベンチマークと実世界のベンチマーク、AI生成ビデオで高い競争力を発揮する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:19:48 GMT)
Object-level Visual Prompts for Compositional Image Generation [75.6] テキストから画像への拡散モデルにおいて,オブジェクトレベルの視覚的プロンプトを構成する手法を提案する。
このタスクにおける重要な課題は、入力された視覚的プロンプトで表現されたオブジェクトのアイデンティティを保持することである。
我々は、キーと値が異なる視覚的表現から学習される新しいKV混合のクロスアテンション機構を導入する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:59:44 GMT)
AIM: Additional Image Guided Generation of Transferable Adversarial Attacks [72.2] トランスファー可能な敵の例は、さまざまな現実世界のアプリケーションにまたがる知覚できない摂動に対するディープニューラルネットワーク(DNN)の脆弱性を強調している。
本研究は,ターゲットの移動可能な攻撃に対する生成的アプローチに焦点を当てる。
本稿では,汎用ジェネレータアーキテクチャに新しいプラグイン・アンド・プレイモジュールを導入し,対向トランスファビリティを向上する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:06:49 GMT)
RESTOR: Knowledge Recovery through Machine Unlearning [71.8] Webスケールコーパスでトレーニングされた大規模な言語モデルは、望ましくないデータポイントを記憶することができる。
これらのデータポイントを消去する目的で、多くの機械学習アルゴリズムが提案されている。
本稿では,機械学習アルゴリズムが対象データ消去を行う能力を評価する,機械学習のためのRESTORフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 20:36:44 GMT)
Aligning Large Language Models for Faithful Integrity Against Opposing Argument [71.3] 大規模言語モデル(LLM)は複雑な推論タスクにおいて印象的な機能を示している。
原文が正しい場合でも、会話中に不誠実な議論によって容易に誤解される。
本稿では,信頼度と信頼度を両立させる新しい枠組みを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:38:21 GMT)
CodeElo: Benchmarking Competition-level Code Generation of LLMs with Human-comparable Elo Ratings [71.0] LiveCodeBenchやUSACOといった既存のベンチマークは、プライベートテストケースの可用性の欠如、特別な審査員のサポートの欠如、不整合実行環境のために不足している。
CodeEloは標準化された競合レベルのコード生成ベンチマークで、これらすべての課題に初めて効果的に対処する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:49:00 GMT)
Modeling Multi-Task Model Merging as Adaptive Projective Gradient Descent [70.7] 複数のエキスパートモデルをマージすることは、元のデータにアクセスせずにマルチタスク学習を実行するための有望なアプローチを提供する。
既存の手法は必然的にタスク固有の情報を破棄し、競合の原因となっているが、パフォーマンスには不可欠である。
我々の手法は従来の手法より一貫して優れており、視覚領域とNLP領域の両方において様々なアーキテクチャやタスクにまたがって最先端の結果が得られます。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:45:21 GMT)
Multi-Task Semantic Communication With Graph Attention-Based Feature Correlation Extraction [69.2] 本稿では,マルチタスク・セマンティック・コミュニケーション・システムのエンコーダ/トランスミッタに新たなグラフアテンション・インターブロック(GAI)モジュールを提案する。
エンコーダの中間特徴抽出ブロックの出力をグラフのノードとして解釈し,その中間特徴の相関関係を捉える。
実験により、提案されたモデルは、CityScapes 2Taskデータセットにおいて、最も競争力があり、公開可能なモデルよりも11.4%多いことが示されている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:38:01 GMT)
R-SCoRe: Revisiting Scene Coordinate Regression for Robust Large-Scale Visual Localization [66.9] 可視性グラフに基づくグローバルエンコーディング学習とデータ拡張戦略を導入する。
ネットワークアーキテクチャとローカル特徴抽出モジュールを再考する。
本手法は,ネットワークアンサンブルや3D監視に頼ることなく,大規模データセットに挑戦する最先端の手法を実現する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:59:08 GMT)
VideoAnydoor: High-fidelity Video Object Insertion with Precise Motion Control [66.7] VideoAnydoorは、高忠実度ディテール保存と正確なモーションコントロールを備えたゼロショットビデオオブジェクト挿入フレームワークである。
詳細な外観を保ちながら、微粒な動き制御をサポートするため、我々は画素ワーパーを設計する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:59:54 GMT)
HarmonyIQA: Pioneering Benchmark and Model for Image Harmonization Quality Assessment [66.2] 画像調和評価のための画像品質評価データベース(HarmonyIQAD)について紹介する。
本研究では,ハーモニー画像品質評価(Harmony Image Quality Assessment, HarmonyIQA)を提案する。
実験により、ハーモニーIQAは、調和した画像に対する人間の視覚的嗜好評価において最先端のパフォーマンスを達成することが示された。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:30:17 GMT)
Unleashing Correlation and Continuity for Hyperspectral Reconstruction from RGB Images [64.8] RGB画像からのHSI再構成のための相関連続性ネットワーク(CCNet)を提案する。
局所スペクトルの相関について,GrSCM(Group-wise Spectral correlation Modeling)モジュールを紹介する。
グローバルスペクトルの連続性のために、我々はNeSCMモジュールを設計する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:14:40 GMT)
CultureVLM: Characterizing and Improving Cultural Understanding of Vision-Language Models for over 100 Countries [63.0] 視覚言語モデル(VLM)は高度な人間とAIの相互作用を持つが、文化的な理解に苦慮している。
CultureVerseは大規模なマルチモーダルベンチマークで、682の文化的概念、188の国/地域、15の文化的概念、3の質問タイプをカバーしている。
本稿では,文化理解の大幅な向上を実現するために,我々のデータセットを微調整したVLMのシリーズであるCultureVLMを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:42:37 GMT)
learning discriminative features from spectrograms using center loss for speech emotion recognition [62.1] 本稿では,感情認識のための可変長スペクトログラムから識別特徴を学習するための新しい手法を提案する。
ソフトマックスのクロスエントロピー損失は、異なる感情カテゴリの特徴を分離可能とし、センターロスは、同じ感情カテゴリに属する特徴をその中心に効率的に引き出す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:52:28 GMT)
Predicting the Performance of Black-box LLMs through Self-Queries [60.9] 大規模言語モデル(LLM)は、AIシステムにおいてますます頼りになってきている。
本稿では、フォローアッププロンプトを使用し、異なる応答の確率を表現として捉え、ブラックボックス方式でLCMの特徴を抽出する。
これらの低次元表現上で線形モデルをトレーニングすると、インスタンスレベルでのモデル性能の信頼性を予測できることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 22:26:54 GMT)
VLM2Vec: Training Vision-Language Models for Massive Multimodal Embedding Tasks [60.5] 幅広い下流タスクを扱える普遍的な埋め込みを構築する可能性について検討する。
We build a series of VLM2Vec model on SoTA VLMs like Phi-3.5-V, LLaVA-1.6 and evaluate them on MMEB's evaluation split。
以上の結果から,VLM2Vecは既存のマルチモーダル埋め込みモデルよりも10%から20%の絶対的な平均的改善を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:26:47 GMT)
Learning 3D Garment Animation from Trajectories of A Piece of Cloth [60.1] ガーメントアニメーションは、仮想現実、ゲーム、映画制作など、様々な用途で広く使われている。
観察された衣服の変形を模倣するために、データ駆動法は大規模な衣服データを必要とする。
本稿では,衣服に関する教師あり学習の代わりに,観察された衣服をアニメーションする方法を学ぶために,ゆがみのあるスキームを採用する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:09:42 GMT)
Asymmetric Reinforcing against Multi-modal Representation Bias [59.7] マルチモーダル表現バイアス(ARM)に対する非対称強化法を提案する。
我々のARMは、条件付き相互情報を通じて支配的なモダリティを表現する能力を維持しながら、弱いモダリティを動的に強化する。
我々はマルチモーダル学習の性能を著しく改善し、不均衡なマルチモーダル学習の軽減に顕著な進展をもたらした。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:00:06 GMT)
Next Patch Prediction for Autoregressive Visual Generation [58.7] 自動回帰画像生成のためのNPP(Next Patch Prediction)パラダイムを提案する。
私たちのキーとなるアイデアは、画像トークンを高情報密度のパッチトークンにまとめて集約することです。
パッチトークンを短い入力シーケンスとして、自己回帰モデルを訓練して次のパッチを予測することにより、計算コストを大幅に削減する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:14:43 GMT)
Training Medical Large Vision-Language Models with Abnormal-Aware Feedback [58.0] 本報告では,Unveiling Medicalnomaitiesを用いたUMed-LVLMを提案する。
本稿では,GPT-4Vを用いた診断手法を提案する。
実験の結果, UMed-LVLMは既存のMed-LVLMを上回り, 医学的異常を同定し, 理解していることがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:37:20 GMT)
Fine-grained Image-to-LiDAR Contrastive Distillation with Visual Foundation Models [56.0] Visual Foundation Models (VFM) は、弱い教師付きピクセル対ポイントのコントラスト蒸留のためのセマンティックラベルを生成するために使用される。
我々は,空間分布とカテゴリー周波数の不均衡に対応するために,点のサンプリング確率を適応させる。
我々の手法は、下流タスクにおける既存の画像からLiDARへのコントラスト蒸留法を一貫して超越している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:30:54 GMT)
Mamba-SEUNet: Mamba UNet for Monaural Speech Enhancement [54.4] Mambaは、新しいステートスペースモデル(SSM)として、自然言語処理やコンピュータビジョンに広く応用されている。
本稿では,MambaとU-Net for SEタスクを統合する革新的なアーキテクチャであるMamba-SEUNetを紹介する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:56:07 GMT)
Rethinking Relation Extraction: Beyond Shortcuts to Generalization with a Debiased Benchmark [53.9] ベンチマークは、機械学習アルゴリズムのパフォーマンスの評価、比較の促進、優れたソリューションの特定に不可欠である。
本稿では,関係抽出タスクにおけるエンティティバイアスの問題に対処する。
本稿では,エンティティの代替によって,エンティティ参照と関係型との擬似相関を破る不偏関係抽出ベンチマークDREBを提案する。
DREBの新たなベースラインを確立するために,データレベルとモデルトレーニングレベルを組み合わせたデバイアス手法であるMixDebiasを導入する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:01:06 GMT)
A Closer Look at Deep Learning Methods on Tabular Datasets [52.5] タブラルデータは、機械学習のさまざまな領域で広く使われている。
Deep Neural Network(DNN)ベースの手法は最近、有望なパフォーマンスを実証した。
我々は,32種類の最先端の深部・木質の手法を比較し,その平均性能を複数の基準で評価した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:59:01 GMT)
Ethical-Lens: Curbing Malicious Usages of Open-Source Text-to-Image Models [51.7] 我々はEthical-Lensというフレームワークを紹介した。
Ethical-Lensは、毒性とバイアス次元をまたいだテキストと画像のモデルにおける価値アライメントを保証する。
実験の結果、Ethical-Lensは商業モデルに匹敵するレベルまでアライメント能力を向上することがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:04:34 GMT)
An Efficient Outlier Detection Algorithm for Data Streaming [51.6] Local Outlier Factor (LOF)アルゴリズムのような従来の異常検出手法は、リアルタイムデータと競合する。
本稿では,オンライン異常検出におけるLOFアルゴリズムの効率向上のための新しい手法を提案し,EILOFアルゴリズムを提案する。
EILOFアルゴリズムは計算コストを大幅に削減するだけでなく、加算点数が増加すると検出精度を体系的に改善する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:12:43 GMT)
Automated Self-Refinement and Self-Correction for LLM-based Product Attribute Value Extraction [51.5] 本稿では,製品属性値抽出タスクに対して,エラーベースのプロンプト書き換えと自己補正という2つの自己補正手法を適用した。
実験の結果、どちらの自己補充技術も、異なるシナリオでモデルの性能に限界的な影響しか与えず、処理コストは大幅に増加することがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:55:27 GMT)
Prometheus: 3D-Aware Latent Diffusion Models for Feed-Forward Text-to-3D Scene Generation [51.4] Prometheusはオブジェクトレベルとシーンレベルの両方を秒単位でテキストから3D生成するための3D対応潜時拡散モデルである。
遅延拡散パラダイムにおいて、3Dシーン生成を多視点, フィードフォワード, ピクセルアラインな3Dガウス生成として定式化する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:31:44 GMT)
Accurate RNA 3D structure prediction using a language model-based deep learning approach [50.2] RhoFold+はRNA言語モデルに基づくディープラーニング手法で、配列から単一鎖RNAの3次元構造を正確に予測する。
RhoFold+はRNA 3D構造予測のための完全に自動化されたエンドツーエンドパイプラインを提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:03:15 GMT)
Negativity in Self-Admitted Technical Debt: How Sentiment Influences Prioritization [50.1] SATD(Self-Admitted Technical Debt)は、ソフトウェアシステムに存在する技術的負債の自己申告書である。
ソフトウェアシステムにおけるSATDの記述の約4分の1は、何らかの否定的感情や否定的な感情を表現している。
我々の研究は、開発者がSATDにおいて、特定のTDのインスタンスがどの程度緊急に対処されるべきかを決定するために、どのように積極的にネガティビティを利用するかを示している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:33:43 GMT)
A Quantum Genetic Algorithm Framework for the MaxCut Problem [49.6] 提案手法では,Groverをベースとした進化的枠組みと分割・分散原理を用いた量子遺伝的アルゴリズム(QGA)を提案する。
完全グラフ上では、提案手法は真に最適なMaxCut値を一貫して達成し、セミデフィニティプログラミング(SDP)アプローチより優れている。
ErdHos-R'enyiランダムグラフでは、QGAは競合性能を示し、SDP結果の92-96%で中央値の解が得られる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:06:16 GMT)
Image-based Multimodal Models as Intruders: Transferable Multimodal Attacks on Video-based MLLMs [48.8] ビデオベースの大規模言語モデル(V-MLLM)は、ビデオテキストマルチモーダルタスクにおける逆例の脆弱性を示す。
本稿では,V-MLLM間の対向映像の転送可能性について検討する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:52:22 GMT)
AutoSAM: Towards Automatic Sampling of User Behaviors for Sequential Recommender Systems [48.5] 本稿では,歴史的挙動を一様に扱わない汎用的な自動サンプリングフレームワークであるAutoSAMを提案する。
具体的には、AutoSAMは、サンプル層を追加して標準のシーケンシャルレコメンデーションアーキテクチャを拡張し、生入力のスキュー分布を適応的に学習する。
理論的には、Future PredictionやSequence Perplexityなどの多目的サンプリング報酬を設計し、フレームワーク全体をエンドツーエンドで最適化する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:19:53 GMT)
A Multi-Year Grey Literature Review on AI-assisted Test Automation [47.0] テスト自動化(TA)技術は、ソフトウェアエンジニアリングの品質保証には不可欠だが、制限に直面している。
業界でAIが広く使われていることを考えると、真実の情報源はグレー文学だけでなく、専門家の心にも当てはまる。
この研究は、グレーの文献を調査し、AIがTAでどのように採用されているかを調査し、解決する問題、そのソリューション、利用可能なツールに焦点を当てる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:11:13 GMT)
Enhancing Uncertainty Modeling with Semantic Graph for Hallucination Detection [46.9] 大規模言語モデル(LLM)は、非事実的あるいは不誠実な文で幻覚を起こす傾向がある。
本稿では,幻覚検出のための意味グラフを用いた不確実性モデリング手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:45:05 GMT)
OmniChat: Enhancing Spoken Dialogue Systems with Scalable Synthetic Data for Diverse Scenarios [45.8] 本稿では,多種多様なシナリオの対話モデルを強化するために合成データを活用することを提案する。
ShareChatXは、多様なシナリオにまたがる音声対話のための、最初の包括的な大規模データセットである。
また、合成データを用いた対話システムの訓練における重要な側面についても検討する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:58:23 GMT)
Synergistic Multi-Agent Framework with Trajectory Learning for Knowledge-Intensive Tasks [44.4] 大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて大きなブレークスルーをもたらした。
知識集約的なシナリオにおいて、現実的に一貫した応答を生成することは、依然として課題である。
本稿では,LSM生成応答の解釈可能性と現実的一貫性を高めるために,外部知識を活用する新しいマルチエージェントフレームワークSMARTを紹介する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:43:57 GMT)
Realistic Noise Synthesis with Diffusion Models [44.4] ディープラーニングモデルには、大規模な実世界のトレーニングデータが必要です。
本稿では,これらの課題に対処するために拡散モデルを用いた新しい実音合成拡散器(RNSD)法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:13:59 GMT)
A3: Android Agent Arena for Mobile GUI Agents [44.4] モバイルGUIエージェントは、モバイルデバイス上で自律的にタスクを実行するように設計されている。
Android Agent Arena (A3)は、現実の、開発中のタスクのパフォーマンスを評価するための、新しい評価プラットフォームである。
A3には、広く使われている21の一般サードパーティアプリと、一般的なユーザシナリオを表す201のタスクが含まれている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:03:56 GMT)
RiTTA: Modeling Event Relations in Text-to-Audio Generation [41.4] テキスト・ツー・オーディオ生成モデルにおける音声イベント関係モデリングを体系的に研究する。
本稿では,既存のTTAモデルの音声イベント関係をモデル化する機能を強化するための微調整フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:38:10 GMT)
Parallel assembly of neutral atom arrays with an SLM using linear phase interpolation [39.6] 超高速空間光変調器で表示されたホログラムを更新することにより、光ツイーザ中の単一原子を任意のジオメトリに高速に並列に再配置する。
我々は、同じ原子サンプルを、撮像および再配置サイクル当たり99パーセント以上の成功確率で複数のジオメトリーに分類した。
これにより、この手法は量子計算と量子シミュレーションのために大きな原子配列を再構成するための有用なツールとなる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:06:31 GMT)
The Unmet Promise of Synthetic Training Images: Using Retrieved Real Images Performs Better [39.6] すべての合成画像は、最終的にジェネレータを訓練するために使用される上流データに由来する。
我々は, LAION-2Bから直接取得した目標実画像に対して, 安定拡散によって生成されたタスク関連ターゲット合成データを微調整と比較した。
解析の結果,このアンダーパフォーマンスは生成物と,合成画像中のタスク関連視覚的詳細が不正確なためであることが示唆された。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 00:01:03 GMT)
GPT4Scene: Understand 3D Scenes from Videos with Vision-Language Models [39.5] 2次元視覚言語モデル(VLM)は、画像テキスト理解タスクにおいて大きな進歩を遂げている。
近年の進歩は、3Dポイントクラウドとマルチビューイメージを入力として活用し、有望な結果をもたらしている。
人間の知覚にインスパイアされた、純粋に視覚に基づくソリューションを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:59:59 GMT)
DiagrammaticLearning: A Graphical Language for Compositional Training Regimes [39.3] 学習図は、コンポーネントモデルがトレーニングされたユニークな損失関数にコンパイルされる。
一般的な学習環境を学習ダイアグラムとして表現できることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:44:36 GMT)
World knowledge-enhanced Reasoning Using Instruction-guided Interactor in Autonomous Driving [39.2] 本研究では,認識条件下での自律走行性能向上を目的としたフレームワークを提案する。
具体的には,モダリティギャップを埋めるプラグアンドプレイ方式の対話モジュールを提案する。
運転関連タスクと世界の知識をよりよく統合するために、我々は大規模なマルチモーダルデータセットを収集し、洗練しました。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:14:58 GMT)
Unifying Specialized Visual Encoders for Video Language Models [38.9] Video Large Language Models (VideoLLMs) は、視覚処理の全てを単一の視覚エンコーダに頼っている。
提案手法であるMERV(Multi-Encoder Representation of Videos)では,複数の凍結した映像エンコーダを用いて映像の統一表現を作成する。
MERVは、標準のスイートビデオ理解ベンチマークにおいて、Video-LLaVAよりも3.7%精度が良い。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:59:45 GMT)
PatchRefiner V2: Fast and Lightweight Real-Domain High-Resolution Metric Depth Estimation [38.7] PRV2はUnrealStereo4Kの精度と速度の両方で最先端の深さ推定手法より優れている。
また、CityScape、ScanNet++、KITTIといった現実世界のデータセットでは、奥行き境界線が改善されている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:41:27 GMT)
Advancing Singlish Understanding: Bridging the Gap with Datasets and Multimodal Models [38.6] 我々は、MNSC(Multitask National Speech Corpus)を導入し、最大のSinglishコーパスを標準化し、注釈する。
これらのデータセットは、自動音声認識(ASR)、音声質問回答(SQA)、音声対話要約(SDS)、パラ言語質問回答(PQA)など様々なタスクをサポートする。
本稿ではマルチタスクマルチモーダルモデルであるSingAudioLLMを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:28:52 GMT)
Data Augmentation Techniques for Chinese Disease Name Normalization [37.7] 病名正規化は医療分野において重要な課題である。
既存の疾患名正規化システムに対する最も大きな障害は、トレーニングデータの不足である。
本稿では,一連のデータ拡張手法といくつかのサポートモジュールを含む新しいデータ拡張手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:12:03 GMT)
Digital Guardians: Can GPT-4, Perspective API, and Moderation API reliably detect hate speech in reader comments of German online newspapers? [36.6] GPT-4oはGoogleのパースペクティブAPIとOpenAIのモデレーションAPIと比較される。
GPT-4oでは、ゼロショット(Zero-Shot)、ワンショット(One-Shot)、フューショット(Few-Shot)の3つの異なるプロンプトが使用される。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:48:56 GMT)
A Unified Hyperparameter Optimization Pipeline for Transformer-Based Time Series Forecasting Models [36.3] 時系列予測(TSF)のためのトランスフォーマーベースのモデルは、その有効性と汎用性から近年大きな注目を集めている。
このようなパイプラインを1つ提示し、いくつかの最先端変換器(SOTA)モデルに対する広範な実験を行う。
私たちのパイプラインはトランスフォーマーベースのアーキテクチャを超えて一般化可能であり、MambaやTimeMixerといった他のSOTAモデルにも適用可能です。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:12:42 GMT)
Physics-informed Gaussian Processes for Safe Envelope Expansion [35.9] 物理インフォームド平均関数を持つガウス過程(GP)を用いた飛行テスト解析の新しい手法を提案する。
本研究では,事前定義された飛行試験点や繰り返し飛行試験点を必要とせずにピッチングモーメント係数を推定し,提案手法を実証する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 01:37:15 GMT)
Multi-task Domain Adaptation for Computation Offloading in Edge-intelligence Networks [34.9] 本稿では,MTDA(Multi-Task Domain Adaptation)と呼ばれる新しいアプローチを提案する。
提案したMTDAモデルには,推論時にソースドメインデータへのアクセスを必要とせずに継続的適応が可能な教師学生アーキテクチャが組み込まれている。
提案するMTDAモデルは様々なシナリオで高い性能を維持しており,新興MECアプリケーションへの実用的な展開の可能性を示している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:20:29 GMT)
EasySplat: View-Adaptive Learning makes 3D Gaussian Splatting Easy [34.3] 高品質な3DGSモデリングを実現するための新しいフレームワークEasySplatを提案する。
本稿では、ビュー類似性に基づく効率的なグループ化戦略を提案し、高品質な点雲を得るためにロバストな点マップを前もって利用する。
信頼性の高いシーン構造を得た後、近隣のガウス楕円体の平均形状に基づいてガウス原始体を適応的に分割する新しいデンシフィケーション手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 01:56:58 GMT)
Reconstruction vs. Generation: Taming Optimization Dilemma in Latent Diffusion Models [34.2] 本稿では,視覚トークン化器のトレーニングにおいて,潜在空間と事前学習された視覚基盤モデルとの整合性を提案する。
提案するVA-VAEは遅延拡散モデルの再構成世代フロンティアを著しく拡張する。
私たちは、LightningDiTと呼ばれるトレーニング戦略とアーキテクチャ設計を改善した拡張DiTベースラインを構築します。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:59:40 GMT)
3D-LLaVA: Towards Generalist 3D LMMs with Omni Superpoint Transformer [33.4] 3D-LLaVAは,3D世界の理解,推論,対話において,インテリジェントなアシスタントとして機能するように設計された,シンプルかつ強力な3D LMMである。
3D-LLaVAのコアには、3つの機能を統合する新しいOmni Superpoint Transformer (OST)がある。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:33:13 GMT)
EraseAnything: Enabling Concept Erasure in Rectified Flow Transformers [33.2] EraseAnythingは、最新のフローベースのT2Iフレームワークにおける概念消去に対処するために特別に開発された最初の方法である。
概念消去を二段階最適化問題として定式化し,LoRAに基づくパラメータチューニングとアテンションマップ正規化器を用いた。
本研究では,意図しない概念の除去が意図せず,無関係な概念のパフォーマンスを損なうことのない自己矛盾型学習戦略を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:26:55 GMT)
Generalized Task-Driven Medical Image Quality Enhancement with Gradient Promotion [33.0] 既存のタスク駆動IQEモデルでは、さまざまなレベルの視覚タスクが、画像特徴の要求に相反することがあるという、根本的な事実を見落としてしまう傾向があります。
本稿では,医療画像のタスク駆動IQEのための一般化勾配促進(GradProm)トレーニング戦略を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:21:28 GMT)
SpecDETR: A Transformer-based Hyperspectral Point Object Detection Network [32.7] ハイパースペクトル目標検出(HTD)は、ハイパースペクトル画像のスペクトル情報に基づいて特定の物質を識別することを目的としている。
既存のHTDメソッドは、インスタンスレベルのオブジェクトの特徴表現能力を制限するピクセル単位のバイナリ分類に基づいて開発されている。
ハイパースペクトル多クラス点オブジェクト検出のための最初の専用ネットワーク SpecDETR を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:20:40 GMT)
ProgCo: Program Helps Self-Correction of Large Language Models [32.7] Self-Correctionは、大規模な言語モデル(LLM)が、外部からのフィードバックなしに初期応答を自己検証し、自己定義できるようにすることを目的としている。
ProgCoは効果的な自己補正を実現し、実際のプログラムツールと組み合わせることでパフォーマンスをさらに向上させることができる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:59:20 GMT)
Improving Equivariant Model Training via Constraint Relaxation [31.5] そこで本研究では,トレーニング中の厳密な均衡制約を緩和することにより,そのようなモデルの最適化を改善する新しい枠組みを提案する。
本研究では,様々な最先端ネットワークアーキテクチャの実験結果を提供し,このトレーニングフレームワークが一般化性能を向上した同変モデルを実現する方法を示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 22:07:11 GMT)
Filtering Discomforting Recommendations with Large Language Models [31.4] DiscomfortFilterは不快なレコメンデーションをフィルタリングするツールだ。
DiscomfortFilterは、LLM(Large Language Model)ベースのツールであるDiscomfortFilterをベースにしている。
参加者24名による1週間のユーザスタディでは、DiscomfortFilterの有効性が示された。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:56:16 GMT)
General Information Metrics for Improving AI Model Training Efficiency [31.4] 本稿では,AIモデルのトレーニングデータの増大に対処する汎用情報量評価(GIME)手法を提案する。
司法AIプログラムにGIMEを適用することで、合計モデルのトレーニング費用が39.56%削減された。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 01:28:00 GMT)
Boosting Adversarial Transferability with Spatial Adversarial Alignment [30.3] ディープニューラルネットワークは、様々なモデルにまたがる転送可能性を示す敵の例に対して脆弱である。
本稿では,アライメント損失を利用してサロゲートモデルを微調整する手法を提案する。
ImageNet上の様々なアーキテクチャの実験では、SAAに基づくアライメントされたサロゲートモデルにより、より高い転送可能な逆の例が得られることが示されている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:35:47 GMT)
Deep Learning in Palmprint Recognition-A Comprehensive Survey [30.0] パームプリント認識は、様々なシナリオに広く応用される、顕著な生体認証技術として登場した。
ディープラーニング(DL)はこの制限に対処するために導入され、様々な領域でその顕著な成功を活用している。
本論文は, DLを用いたヤシ文字認識の最近の進歩を徹底的にレビューすることによって, そのギャップを埋めるものである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:38:44 GMT)
Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards for Hallucination Mitigation [29.7] 自己校正型報酬(TPO)を用いた新しいToken Preference Optimizationモデルを提案する。
具体的には,生画像に条件付された生成トークンのロジスティック分布と劣化したトークンの対数分布の差として,トークンレベルのアンカレート・アンカレート・アンフレワードを導入する。
より正確なトークンレベルの最適化を実現するために,視覚認識型学習目標を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:39:20 GMT)
FaceSpeak: Expressive and High-Quality Speech Synthesis from Human Portraits of Different Styles [29.2] 視覚駆動型テキスト音声(TTS)学者は、実際の顔について調査を行った。
そこで我々は,多様なイメージスタイルから有能なアイデンティティ特性と感情表現を抽出する,新しいFaceSpeakアプローチを提案する。
余分な情報を緩和し、結果として文字のペルソナと密接に一致した音声が合成される。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:00:15 GMT)
Large Language Model-Enhanced Symbolic Reasoning for Knowledge Base Completion [28.7] 大きな言語モデル(LLM)とルールベースの推論は、知識ベース補完の柔軟性と信頼性を向上させる強力なソリューションを提供する。
本稿では, サブグラフエクストラクタ, LLMプロポーラ, ルール共振器からなる新しいフレームワークを提案する。
提案したルールの豊かさと多様性を高めるためのLCMの利用,信頼性を向上させるためのルールベースの推論との統合などである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:14:28 GMT)
InDeed: Interpretable image deep decomposition with guaranteed generalizability [28.6] 画像分解は、イメージを基本成分に分解することを目的としている。
深層学習はそのようなタスクには強力だが、解釈可能性と一般化性に焦点を合わせることはめったにない。
本稿では,階層型ベイズモデルとディープラーニングを組み合わせた,解釈可能な深層画像分解のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:58:26 GMT)
AdaptVC: High Quality Voice Conversion with Adaptive Learning [28.3] 鍵となる課題は、ソースと音声スタイルから絡み合った言語コンテンツを抽出することである。
本稿では,アダプタを用いた自己教師型音声特徴の調整により,コンテンツと話者の特徴のアンタングル化を成功させる。
アダプタは、リッチな自己教師付き特徴からニュアンス特徴を動的に符号化するように訓練され、デコーダはそれらを融合して参照に正確に類似した音声を生成する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:54:08 GMT)
CryptoMamba: Leveraging State Space Models for Accurate Bitcoin Price Prediction [28.2] 本稿では,マンバをベースとした新しいステートスペースモデル(SSM)アーキテクチャであるCryptoMambaを提案する。
我々の実験は、CryptoMambaがより正確な予測を提供するだけでなく、異なる市場条件における一般化性も向上していることを示している。
我々の調査結果は、株式や暗号通貨の価格予測タスクにおいて、SSMにとって大きな優位性を示している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:16:56 GMT)
DynamicLip: Shape-Independent Continuous Authentication via Lip Articulator Dynamics [27.4] 脂質認証は有望な生体認証法として登場した。
既存の口唇認証法は口閉じ時の静的唇形状に大きく依存する。
そこで本研究では,唇音節力学を用いた形状非依存連続認証システムを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:26:29 GMT)
Dynamic Scaling of Unit Tests for Code Reward Modeling [27.3] 現在の大規模言語モデル(LLM)は、コード生成のような複雑な推論タスクの最初の試みにおいて、正確な応答を生成するのに苦労することが多い。
高速かつ高品質な単体テストスケーリングを実現する軽量で効率的な単体テストジェネレータであるCodeRM-8Bを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:33:31 GMT)
Dynamic Attention-Guided Context Decoding for Mitigating Context Faithfulness Hallucinations in Large Language Models [26.5] 大きな言語モデル(LLM)は、しばしば文脈忠実な幻覚に悩まされる。
動的注意誘導コンテキストデコーディング(DAGCD)を提案する。
DAGCDは、単一パス復号プロセスにおいて注意分布と不確実性信号を統合する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:07:06 GMT)
Real World Federated Learning with a Knowledge Distilled Transformer for Cardiac CT Imaging [26.0] 今回,8つの病院にまたがる実環境において,これまでで最大の心電図解析を行った。
我々の2段階の半教師戦略は、タスク固有のCNNからの知識をトランスフォーマーに抽出する。
これにより予測精度が向上し、フェデレーション全体にわたる全ての部分ラベルの同時学習が可能になる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:22:55 GMT)
Enhancing Preference-based Linear Bandits via Human Response Time [25.9] 対話的嗜好学習システムは、クエリを選択肢のペアとして提示し、バイナリ選択を収集することによって、人間の嗜好を推測する。
本研究では,選択時間と応答時間を組み合わせて人間のユーティリティ関数を推定する手法を提案する。
固定予算ベストアーム識別のための選好ベース線形バンドレットにこの推定器を組み込む。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:00:28 GMT)
Source-free Semantic Regularization Learning for Semi-supervised Domain Adaptation [25.5] 半教師付きドメイン適応(SSDA)は、モデルの分類性能と一般化能力を改善する能力により、広範囲に研究されている。
意味正規化学習(SERL)と呼ばれる新しいSSDA学習フレームワークを提案する。
SERLは、正規化学習の複数の視点からターゲット意味情報をキャプチャし、ターゲットドメイン上のソース事前学習モデルの適応的な微調整を実現する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:53:02 GMT)
TabTreeFormer: Tree Augmented Tabular Data Generation using Transformers [25.4] TabTreeFormerは、ツリーベースのモデルを組み込んだハイブリッドトランスフォーマーアーキテクチャである。
マルチモーダル連続分布を捉えるための二重量子化トークン化器を提案する。
実験の結果,TabTreeFormerは優れた忠実度,実用性,プライバシ,効率性を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:57:08 GMT)
Cross-model Transferability among Large Language Models on the Platonic Representations of Concepts [25.0] この研究は、異なる大言語モデル(LLM)における概念表現間の複雑な関係を探求する。
我々はこれらの表現をブリッジする線形変換法を導入し、プラトンの洞窟のアレゴリーに平行な興味をそそる。
より小さなLSMから抽出されたSVは、より大きなLSMの挙動を効果的に制御できる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:56:59 GMT)
The Reality of AI and Biorisk [24.9] AIモデルやシステムがバイオリスクを増大させるための健全な理論的脅威モデルと、その脅威モデルをテストする堅牢な方法の両方を持つことが必要である。
本稿では,2つのAIおよびバイオリスク脅威モデルに関する既存の研究について分析する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:04:46 GMT)
Leverage Cross-Attention for End-to-End Open-Vocabulary Panoptic Reconstruction [24.8] PanopticRecon++は、新しい横断的視点を通じて、パノプティクスの再構築を定式化するエンドツーエンドのメソッドである。
このパースペクティブは、(クエリとして)3Dインスタンスとシーンの(キーとして)3D埋め込みフィールドの関係を、アテンションマップを通じてモデル化する。
PanopticRecon++は、シミュレーションと実世界のデータセットの両方で、3Dと2Dのセグメンテーションと再構成のパフォーマンスで競合するパフォーマンスを示している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:37:09 GMT)
BoxingGym: Benchmarking Progress in Automated Experimental Design and Model Discovery [24.6] 実験的な設計とモデル発見を評価するための10環境のベンチマークであるBoxingGymを紹介する。
予測情報ゲイン(EIG)は,実験が生成モデルのパラメータの不確実性をどの程度低減するかを測定する情報理論量である。
GPT-4oのような現在のLLMは、実験的な設計とモデル発見の両方に苦戦している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:15:57 GMT)
HoneypotNet: Backdoor Attacks Against Model Extraction [24.6] モデル抽出攻撃は、プロダクションモデルとMLプラットフォームに深刻なセキュリティ脅威をもたらす。
我々は、モデル出力を有害なものに修正する、アタック・アズ・ディフェンスと呼ばれる新しい防衛パラダイムを導入する。
HoneypotNetは、高い成功率でバックドアを代替モデルに注入することができる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:23:51 GMT)
Three-dimensional quantum anomalous Hall effect in Weyl semimetals [24.5] 量子異常ホール効果(quantum anomalous Hall effect, QAHE)は、2次元の系が磁場がないときに量子化されたホール抵抗を$h/e2$で示す量子現象である。
本研究では,この新たな位相を3次元に拡張し,よりリッチで多目的な輸送挙動を示す3次元QAHEを提案する。
この3次元QAHEはホールエフェクトファミリーのギャップを埋めるだけでなく、インメモリコンピューティングのようなデバイスアプリケーションにも大きな可能性を秘めている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:23:37 GMT)
Knowledge-Guided Biomarker Identification for Label-Free Single-Cell RNA-Seq Data: A Reinforcement Learning Perspective [24.2] 本稿では、既存の遺伝子選択アルゴリズムからのアンサンブル知識を利用して、予備的境界や事前知識を確立する反復的な遺伝子パネル選択戦略を提案する。
我々は、専門家の行動によって形成される報酬関数を通じて強化学習を取り入れ、動的洗練と遺伝子パネルの標的選択を可能にした。
本研究は, 単細胞ゲノムデータ解析における本手法の可能性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:57:41 GMT)
Is It Still Fair? Investigating Gender Fairness in Cross-Corpus Speech Emotion Recognition [24.2] クロスコーパス音声感情認識(SER)モデルは、パフォーマンスを一般化する能力によって、ますます認識されつつある。
既存のフェアネス研究は、しばしばコーパス固有のフェアネスにのみ焦点をあて、クロスコーパスシナリオにおける一般化可能性を無視している。
本研究は, クロスコーパスSERシナリオにおけるジェンダーフェアネスの一般化性について検討した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 01:21:34 GMT)
Fourier Position Embedding: Enhancing Attention's Periodic Extension for Length Generalization [23.9] 回転位置埋め込み(RoPE)は非均一離散フーリエ変換を暗黙的に達成することで周期的に注意を向けることができることを示す。
この周期性は,1) 線形層と注意領域外の活性化機能,2) 時間領域切断による周波数成分の不足によるスペクトル損傷によって損なわれている。
本稿では,FoPE (Fourier Position Embedding) を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:58:38 GMT)
Privacy Bills of Materials: A Transparent Privacy Information Inventory for Collaborative Privacy Notice Generation in Mobile App Development [23.6] モバイルアプリのプライバシ情報をキャプチャしてコーディネートするための,システマティックなソフトウェアエンジニアリングアプローチであるPriBOMを紹介します。
PriBOMは、透明性中心のプライバシドキュメントと特定のプライバシ通知の作成を促進し、プライバシプラクティスのトレーサビリティと追跡性を可能にする。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:14:52 GMT)
AutoPrep: Natural Language Question-Aware Data Preparation with a Multi-Agent Framework [22.7] Tabular Question Answering (TQA)では、構造化データから意味のある洞察を迅速かつ効率的に抽出することができる。
多くのテーブルはWebソースや実世界のシナリオから派生しており、正確な応答を保証するには精巧なデータ準備(あるいはデータ準備)が必要である。
この質問対応データ準備には、特定の質問に適したカラム拡張やフィルタリングといった特定のタスクが含まれる。
本稿では,マルチエージェントの強みを利用した大規模言語モデル(LLM)に基づくマルチエージェントフレームワークであるAutoPrepを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 01:11:46 GMT)
MEDEC: A Benchmark for Medical Error Detection and Correction in Clinical Notes [22.4] MEDECは医学的誤りの検出と修正のための最初の公開ベンチマークである。
MEDECは3,848の臨床的テキストで構成されており、3つの病院システムから488の臨床ノートが含まれている。
医学的知識と推論能力の両方を必要とする医療ミスの検出・修正タスクについて,最近のLCMを評価した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:46:05 GMT)
ZeroFlow: Overcoming Catastrophic Forgetting is Easier than You Think [22.3] 我々はZeroFlowの最初のベンチマークを導入し、勾配のない最適化アルゴリズムを評価し、忘れを克服する。
このベンチマークでは、複数のメソッドをまたいだフォワードパスメソッドのスイートを調べ、シナリオやデータセットを忘れる。
フォワードパスだけでは、忘れを乗り越えるには十分です。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:10:17 GMT)
Amortized Bayesian Experimental Design for Decision-Making [22.3] 本稿では、下流決定ユーティリティの最大化を優先する、償却決定対応のBEDフレームワークを提案する。
本稿では,新しいアーキテクチャであるTransformer Neural Decision Process (TNDP)を導入する。
提案手法は複数のタスクにまたがって性能を実証し,情報的設計を実現し,正確な意思決定を容易にすることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:34:23 GMT)
Graph2text or Graph2token: A Perspective of Large Language Models for Graph Learning [21.8] 本稿では,LLM4graph と呼ばれるグラフに大規模言語モデルを適用する手法について概説する。
LLM4graphの中核は、グラフをLLMが理解し分析するためのテキストに変換することである。
既存のメソッドは、Graph2textとGraph2tokenの2つのパラダイムに分けられる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:45:34 GMT)
Face-Human-Bench: A Comprehensive Benchmark of Face and Human Understanding for Multi-modal Assistants [21.8] 本稿では,3段階の能力を含む階層型能力分類法を提案する。
新しいベンチマークの問題を発生させるために、セミオートマチックなデータパイプラインを構築します。
メインストリームのマルチモーダル大言語モデル(MLLM)について,Face-Human-Benchを用いて評価を行った。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:05:47 GMT)
A Survey on Large Language Model Acceleration based on KV Cache Management [21.5] 大規模言語モデル(LLM)は、自然言語処理、コンピュータビジョン、マルチモーダルタスクなど、幅広い領域に革命をもたらした。
LLMの計算とメモリ要求は、それらを現実世界、長期コンテキスト、リアルタイムアプリケーションにスケールする際に大きな課題を生じさせる。
このサーベイは、LLMアクセラレーションのためのKVキャッシュ管理戦略を包括的に概観し、トークンレベル、モデルレベル、システムレベルの最適化に分類する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:40:15 GMT)
KaLM-Embedding: Superior Training Data Brings A Stronger Embedding Model [21.4] KaLM-Embeddingは、よりクリーンで、より多様な、ドメイン固有のトレーニングデータを活用する一般的な多言語埋め込みモデルである。
我々のモデルは、性能を向上させることが証明された重要な技術で訓練されている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:17:51 GMT)
An Inclusive Theoretical Framework of Robust Supervised Contrastive Loss against Label Noise [20.7] 両立する対照的なパラダイムの下で、ロバストな損失に対する統一的な理論的枠組みを提案する。
ラベルノイズに対する教師付きコントラスト損失の理論的ロバスト性を検証するための基準となる任意のコントラスト損失に対する一般的なロバスト条件を導出する。
我々の理論は、従来の堅牢な手法の説明を提供する包括的枠組みであることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:12:23 GMT)
Understanding Difficult-to-learn Examples in Contrastive Learning: A Theoretical Framework for Spectral Contrastive Learning [20.5] 教師なしのコントラスト学習は近年、様々なタスクにおいて教師付き学習に近づいたり、競合したりするなど、大幅なパフォーマンス向上を見せている。
従来の研究では、教師なし学習に欠かせない学習例は、教師なしの環境において最小限に寄与することが示されている。
本稿では,サンプルサイズを小さくするが,難解なサンプルの直接除去により,コントラスト学習の下流分類性能が向上することを見出した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:17:44 GMT)
Federated Unsupervised Domain Generalization using Global and Local Alignment of Gradients [20.4] まず、教師なし学習における領域シフトと勾配のアライメントの関係を理論的に確立する。
我々はFedGaLAという新しい手法を提案し、クライアントレベルで勾配アライメントを行い、クライアントがドメイン不変の機能を学ぶことを奨励する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 23:28:10 GMT)
Integrated Sensing and Communications for Low-Altitude Economy: A Deep Reinforcement Learning Approach [20.4] 低高度経済(LAE)のための統合センシング・通信(ISAC)システムについて検討する。
所定の飛行期間における通信総和レートは、GBSとUAVの軌道でのビームフォーミングを共同最適化することにより最大化する。
本稿では, 深部強化学習(DRL)技術を活用して, 深部LAE-ISAC(Deep LAE-ISAC)と呼ばれる新しいLEE指向ISAC方式を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:09:11 GMT)
The Initial Screening Order Problem [20.1] 候補検定における初期検定順序(ISO)の役割について検討する。
ISOは、$k$の候補を選択する際に、スクリーニング者が候補プールを検索する順序を指す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:02:36 GMT)
Large Vision-Language Model Alignment and Misalignment: A Survey Through the Lens of Explainability [19.8] LVLM(Large Vision-Language Models)は、視覚情報とテキスト情報の両方を処理する際、顕著な能力を示す。
本調査では,LVLMのアライメントとアライメントについて,説明性レンズを用いて総合的に検討した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:53:50 GMT)
MuQ: Self-Supervised Music Representation Learning with Mel Residual Vector Quantization [19.8] 音楽理解のための自己教師付き音楽表現学習モデルを提案する。
MuQはMel Residual Vector Quantization(Mel-RVQ)によって生成されるトークンを予測するために訓練される
様々なダウンストリームタスクの実験では、MuQが以前の自己教師付き音楽表現モデルより優れていたことが示されている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:08:29 GMT)
LEO-Split: A Semi-Supervised Split Learning Framework over LEO Satellite Networks [19.6] 衛星ネットワークに適した半教師付き(SS)SL設計であるLEO-Splitを提案する。
我々のフレームワークは最先端のベンチマークよりも優れた性能を実現している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:19:16 GMT)
Task Singular Vectors: Reducing Task Interference in Model Merging [19.5] Task Arithmeticは、追加のトレーニングなしでモデルをマージするためのシンプルで効果的な方法として登場した。
本研究では,タスク層行列とその特異値分解に着目し,タスクベクトルを層レベルで研究する。
TSV-Merge (TSV-M) は,圧縮と干渉低減を組み合わせた新しいモデルマージ手法である。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:33:12 GMT)
Photoacoustic Iterative Optimization Algorithm with Shape Prior Regularization [19.0] 光音響イメージング(PAI)は、再構成された結果の品質を低下させる固有の限界に悩まされる。
本稿では,2次元と3次元のPAI再構成結果に対する新たな最適化手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:43:15 GMT)
Learning Spectral Methods by Transformers [18.9] 多層トランスフォーマーは、十分な数の事前学習インスタンスを与えられた場合、アルゴリズム自体を学習可能であることを示す。
この学習パラダイムは、コンテキスト内学習設定とは異なるものであり、人間の脳の学習手順と似ている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:53:25 GMT)
Perception-guided Jailbreak against Text-to-Image Models [18.8] PGJと呼ばれるLPM駆動型知覚誘導ジェイルブレイク法を提案する。
これは、特定のT2Iモデル(モデルフリー)を必要としないブラックボックスジェイルブレイク方式であり、非常に自然な攻撃プロンプトを生成する。
6つのオープンソースモデルと何千ものプロンプトによる商用オンラインサービスによる実験により,PGJの有効性が検証された。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:17:28 GMT)
Regularized Proportional Fairness Mechanism for Resource Allocation Without Money [18.6] 我々は資源配分問題に合わせた革新的なニューラルネットワークアーキテクチャを設計し、それを正規化比例公正ネットワーク(RPF-Net)と呼ぶ。
RPF-Netは、最も悪用可能なアロケーションの学習関数近似器により、比例フェアネス(PF)機構の出力を正規化する。
有限分布および外分布サンプル下での学習時の機構性能を保証する一般化境界を導出する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:17:23 GMT)
SegKAN: High-Resolution Medical Image Segmentation with Long-Distance Dependencies [18.4] 本稿では,SegKanという革新的なモデルを提案する。
我々は,画像埋め込みのための新しい畳み込みネットワーク構造を採用することにより,従来の埋め込みモジュールを改善した。
我々は,従来の視覚変換器モデルにおいて,パッチブロック間の空間的関係を時間的関係に変換することで,パッチブロック間の関係を捕捉する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:25:02 GMT)
Optimizing Noise Schedules of Generative Models in High Dimensionss [18.2] 分散(VP)と分散爆発(VE)の保存に特有なノイズスケジュールは,高次特徴と低次特徴の両方の回復を可能にすることを示す。
また、これらのスケジュールは、確率フローODEを識別可能なGMとCurie-Weiss(CW)モデルの生成モデルが得られることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 00:39:00 GMT)
Approximation Rate of the Transformer Architecture for Sequence Modeling [18.2] 非線型関係のクラスを考察し、トランスフォーマーのジャクソン型近似率推定を明示するために、複雑性尺度の新たな概念を同定する。
この速度はトランスフォーマーの構造特性を明らかにし、それが近似に最も適しているシーケンシャルな関係のタイプを示唆する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:02:48 GMT)
Multi-Head Explainer: A General Framework to Improve Explainability in CNNs and Transformers [17.9] MHEX(Multi-Head Explainer)は、CNNとTransformerベースのモデルの説明可能性と精度を高める汎用的でモジュール化されたフレームワークである。
MHEXは3つのコアコンポーネントで構成されている。タスク関連機能を動的に強調するアテンションゲート、ターゲットクラスに関連するきめ細かい詳細をキャプチャするために初期レイヤをガイドするDeep Supervision、洗練されたローカル表現とグローバル表現を統一して包括的なサリエンシマップを生成する等価マトリックスである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:47:56 GMT)
Exploring Information Processing in Large Language Models: Insights from Information Bottleneck Theory [17.4] 大規模言語モデル(LLM)は、幅広いタスクで顕著なパフォーマンスを示している。
本稿では,情報ボトルネック理論の観点から,情報処理におけるLLMの動作機構について考察する。
情報圧縮に基づくコンテキスト学習(IC-ICL)とタスク空間誘導ファインタニング(TS-FT)の2つの新しいアプローチを紹介する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 01:33:58 GMT)
Blind Men and the Elephant: Diverse Perspectives on Gender Stereotypes in Benchmark Datasets [17.1] 本稿では,言語モデルの固有バイアス緩和と測定戦略に焦点を当てる。
我々は、本質的な測定を深く掘り下げ、矛盾を識別し、これらのベンチマークがジェンダーステレオタイプの違いを反映している可能性を示唆している。
本研究は, 言語モデルにおけるジェンダーステレオタイピングの複雑さと, 偏見の検出・低減のための, より洗練された手法を開発するための新たな方向性を指摘するものである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:40:31 GMT)
The Prompt Alchemist: Automated LLM-Tailored Prompt Optimization for Test Case Generation [17.1] 大きな言語モデル(LLM)は、与えられたソースコードに対して有用なテストケースを生成することができる。
現存する作品は、主に人書きの平易なプロンプトに依存している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:30:05 GMT)
TOPIC: A Parallel Association Paradigm for Multi-Object Tracking under Complex Motions and Diverse Scenes [16.9] BEE24と呼ばれる新しいデータセットを導入し、複雑な動きを強調します。
並列パラダイムを提案し,それを実装するために2つのrOund Parallel MatchIng meChanism(TOPIC)を提案する。
提案手法は,4つの公開データセットとBEE24上での最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:36:25 GMT)
ChemDFM-X: Towards Large Multimodal Model for Chemistry [16.8] 化学用クロスモーダル対話基盤モデル(ChemDFM-X)について紹介する。
近似計算とタスク固有モデル予測により、初期モダリティから、多様なマルチモーダルデータを生成する。
ChemDFM-Xは、様々なデータモダリティを持つ様々な化学タスクの広範な実験で評価される。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:27:41 GMT)
Change Detection-Based Procedures for Piecewise Stationary MABs: A Modular Approach [16.6] Multi-Armed Bandit (MAB) アルゴリズムは、アームに関連する報酬分布が時間とともに変化しない静止環境向けに設計されている。
しかし、多くのアプリケーションでは、環境は非定常であるとより正確にモデル化されている。
本研究では,腕のサブセットに付随する報酬分布が変化する部分的定常MAB(PS-MAB)環境について検討した。
私たちのゴールは、CDベースのBandit(CDB)プロシージャの設計と分析をモジュール化することです。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:18:18 GMT)
Stealthy Backdoor Attack to Real-world Models in Android Apps [15.8] モバイルアプリから抽出した現実世界のディープラーニングモデルに対する、より効果的でステルス的なバックドア攻撃について検討する。
まず,4つの最先端DNNモデルに対するステガノグラフィーによるバックドアアタックの有効性を確認した。
当社のアプローチでは,DeepPayloadよりも平均12.50%高い攻撃成功率を実現しています。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:58:05 GMT)
Reasoning based on symbolic and parametric knowledge bases: a survey [15.6] 推論(Reasoning)とは、既存の知識に基づいて新たな結論を導くこと。
本稿ではまず,知識ベースを記号とパラメトリックに分類する。
次に,記号的知識ベース,パラメトリック知識ベース,およびそれらの両方を用いた推論手法の概要について概説する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:21:32 GMT)
A 2-step Framework for Automated Literary Translation Evaluation: Its Promises and Pitfalls [15.5] 文芸機械翻訳を評価するための2段階パイプラインの実現可能性を提案し,評価する。
私たちのフレームワークは、文学翻訳に適した細粒度で解釈可能なメトリクスを提供します。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:29:31 GMT)
FairGP: A Scalable and Fair Graph Transformer Using Graph Partitioning [15.4] 近年の研究では、グラフトランスフォーマー(GT)モデルにおいて、重要な公平性の問題が浮き彫りになっている。
GTは計算集約的でメモリオンデマンドであり、大規模グラフに制限される。
本稿では,高次ノードの負の影響を最小限に抑えるためにグラフを分割するグラフ分割(FairGP)を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:53:15 GMT)
L3D-Pose: Lifting Pose for 3D Avatars from a Single Camera in the Wild [15.2] 3Dポーズ推定は、奥行きを取り入れたより包括的なソリューションを提供するが、動物のための3Dポーズデータセットを作成することは、自然の環境での動的で予測不可能な振る舞いのために難しい。
本研究では,2次元から3次元へのポーズを持ち上げるために,体系的に合成されたデータセットを用いたフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:04:12 GMT)
Aligning the Objective of LLM-based Program Repair [14.9] 本稿では,大規模言語モデル (LLM) をプログラム修復に適用するための新しいアプローチについて検討する。
我々の中核的な洞察は、LLMのAPR能力は、単にトレーニング目標に出力を合わせるだけで大幅に改善できるということです。
この知見に基づいて、我々はAPRの直接的なプロンプトフレームワークであるD4Cを設計した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:14:11 GMT)
Vulnerability-Aware Spatio-Temporal Learning for Generalizable and Interpretable Deepfake Video Detection [14.6] ディープフェイクビデオは、鍛造シーケンスの複雑な時間的および空間的なアーティファクトのため、検出が極めて困難である。
最近のアプローチは、実データと偽データの両方で訓練されたバイナリ分類器に依存している。
モデルが微妙なアーティファクトに集中できるように,空間的および時間的分岐を付加したマルチタスク学習フレームワークを導入する。
第2に,疑似フェイク映像を微妙なアーティファクトで生成するビデオレベルデータアルゴリズムを提案し,そのモデルに高品質なサンプルと地上真実データを提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:21:34 GMT)
MSWA: Refining Local Attention with Multi-ScaleWindow Attention [14.5] スライディングウィンドウアテンション(SWA)は、固定サイズのローカルコンテキストウインドウにアテンション範囲を制限することでこの問題を解決する。
トランスフォーマーの頭と層に多様なウィンドウサイズを適用したマルチスケールウィンドウアテンション(MSWA)を提案する。
同じ層内のヘッド間で異なるウィンドウサイズを可能にするだけでなく、浅い層から深い層へのウィンドウサイズ割り当てを徐々に増加させ、モデルが異なる長さと距離でコンテキスト情報をキャプチャできるようにする。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:41:32 GMT)
LayeringDiff: Layered Image Synthesis via Generation, then Disassembly with Generative Knowledge [14.5] LayeringDiffは、階層化されたイメージを合成するための新しいパイプラインである。
合成イメージからレイヤを抽出することで、スクラッチから生成するのではなく、大規模なトレーニングの必要性を回避できる。
実効的な層分解のために,前景層と背景層を推定する前に,大規模事前学習型生成法を適用する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:18:25 GMT)
ProjectedEx: Enhancing Generation in Explainable AI for Prostate Cancer [14.4] 我々は,解釈可能な多属性説明を提供する生成フレームワークであるProjectedExを提案する。
第二に,機能ピラミッドを組み込むことでエンコーダモジュールを強化し,マルチスケールフィードバックにより潜伏空間を改良する。
第3に,ジェネレータと分類器の両方について総合的な実験を行い,ProjectedExの臨床的意義と有効性を示した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:07:36 GMT)
Hyperparameter Importance Analysis for Multi-Objective AutoML [14.3] 本稿では,多目的最適化タスクにおけるハイパーパラメータの重要性を評価するための最初の手法を提案する。
具体的には、目的のa-prioriスキャラライゼーションを計算し、異なる目的のトレードオフに対するハイパーパラメータの重要性を決定する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:46:53 GMT)
EHCTNet: Enhanced Hybrid of CNN and Transformer Network for Remote Sensing Image Change Detection [14.3] 既存のフレームワークは、偽陽性のコストを削減するために精度基準を改善するのに苦労しているが、それでも関心の変化に焦点を合わせるのに制限がある。
本研究は,特徴学習能力の向上と特徴情報の周波数成分の統合により,これらの課題に対処する。
本稿では,CNN と Transformer Network (EHCTNet) のハイブリッドを改良し,関心の変化情報を効果的にマイニングする手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:55:36 GMT)
CLIP-UP: CLIP-Based Unanswerable Problem Detection for Visual Question Answering [14.1] 提案するCLIP-UP: CLIP-based Unanswerable Problem Detection。
探索不可能な質問に対する回答を抑える能力を備えたビジョン・ランゲージ・モデル(Vision-Language Models)を装備するための,新しい軽量な手法である。
MM-UPDベンチマークを用いて,複数選択の視覚質問応答における解答不可能性の評価を行う。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:30:53 GMT)
Decoding Knowledge in Large Language Models: A Framework for Categorization and Comprehension [14.0] 大規模言語モデル(LLM)は知識を取得し、保持し、適用する。
本稿では,LLMの知識を2次元に分類する新しいフレームワークK-(CSA)2を紹介する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:34:10 GMT)
Pruning-based Data Selection and Network Fusion for Efficient Deep Learning [13.9] PruneFuseは、プルーニングとネットワーク融合を組み合わせてデータ選択を強化し、トレーニングを加速する新しい方法である。
PruneFuseでは、元の高密度ネットワークをプルーニングして、データセットから最も情報性の高いサンプルを効率的に選択する、より小さなサロゲートモデルを生成する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:35:53 GMT)
Dynamic Negative Guidance of Diffusion Models [13.9] 負のプロンプティング(NP)は、一定の指導尺度の仮定によって制限されていることを示す。
我々は、ほぼ最適時間とガイダンスの状態依存変調に依存する、Dynamic Negative Guidanceと呼ばれる原則的手法を導出する。
以上の結果から,DNGを安定拡散法を用いてNPよりも正確で侵襲的なガイダンスを得ることが可能であることが示唆された。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:06:54 GMT)
Satori: Towards Proactive AR Assistant with Belief-Desire-Intention User Modeling [13.6] 本稿では,ユーザ状態と環境状況の両方をモデル化し,積極的なガイダンスを提供する新しいAR支援システムである佐取を提案する。
本稿では,Breief-Desire-Intention(BDI)モデルと最先端のマルチモーダル言語モデル(LLM)を組み合わせて,文脈的に適切なガイダンスを推測する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:02:13 GMT)
Deep Discrete Encoders: Identifiable Deep Generative Models for Rich Data with Discrete Latent Layers [13.5] 本稿では,離散遅延層を持つリッチデータ型に対する解釈可能な深層生成モデリングフレームワークを提案する。
DDEを階層的なトピックモデリング、画像表現学習、教育試験における応答時間モデリングの3つの多様な実データに適用し、解釈可能な結果を得る。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:56:23 GMT)
Degeneracy is OK: Logarithmic Regret for Network Revenue Management with Indiscrete Distributions [13.3] 我々は、従来のネットワーク収益管理(NRM)問題について、意思決定を受理/退避し、IIDの到着を$T$で検討する。
本モデルでは,O(log2 T)$ regret を実現するオンラインアルゴリズムを開発した。
2階成長の仮定を追加して、$O(log T)$ regretを達成する2番目の結果を得る。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:07:08 GMT)
On Unifying Video Generation and Camera Pose Estimation [13.0] 画像生成装置の創発的な3D機能にインスパイアされ、映像生成装置も同様に3D認識を示すかどうかを探索する。
まず、DUSt3RのようなSfM予測モジュールに生の中間出力をルーティングすることで、ビデオ生成機能におけるネイティブな3D認識について検討する。
その結果,映像生成機能には固有の3D認識が限定されているのに対し,タスク固有の監視はカメラポーズ推定の精度を著しく向上させることがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:55:04 GMT)
MM-Path: Multi-modal, Multi-granularity Path Representation Learning -- Extended Version [12.9] マルチモーダル・マルチグラニュラリティパス表現学習フレームワーク(MM-Path)を提案する。
MM-Pathは道路経路と画像経路の両方からモダリティを統合することで、一般的な経路表現を学習することができる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:52:02 GMT)
λ: A Benchmark for Data-Efficiency in Long-Horizon Indoor Mobile Manipulation Robotics [12.3] 学習ベースモデルや,基礎モデルとタスクと動作計画を組み合わせたニューロシンボリックなモジュラーアプローチなど,いくつかのモデルをベンチマークする。
発見は、よりデータ効率のよい学習ベースのMoMaアプローチの必要性を強調している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:16:49 GMT)
ARNet: Self-Supervised FG-SBIR with Unified Sample Feature Alignment and Multi-Scale Token Recycling [11.1] FG-SBIRは、埋め込み空間におけるスケッチと対応する画像の距離を最小化することを目的としている。
両領域間のギャップを狭める効果的なアプローチを提案する。
主に、イントラサンプルとインターサンプルの両方を共有する統一的な相互情報共有を促進する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:51:35 GMT)
Do Developers Adopt Green Architectural Tactics for ML-Enabled Systems? A Mining Software Repository Study [11.0] グリーンAIは、精度を維持しながら計算要求を減らすことを提唱している。
本稿は、GitHub上の168のオープンソースMLプロジェクトを研究することで、このギャップに対処する。
新たな大規模言語モデル(LLM)ベースのマイニング機構を使用して、グリーン戦略を特定し分析する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:27:01 GMT)
Lost-in-Distance: Impact of Contextual Proximity on LLM Performance in Graph Tasks [10.9] 大規模言語モデルでは,意味のある文脈データを効率的に取得・処理する能力に障害のある盲点が示される。
本研究では, 損失-in-distance現象の定式化を提案し, 損失-in-distance現象と損失-in-the middle現象が独立に発生することを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:15:37 GMT)
Summarizing Bayesian Nonparametric Mixture Posterior -- Sliced Optimal Transport Metrics for Gaussian Mixtures [10.7] 混合モデルの後方推論を要約する既存の方法は、クラスタリングのための暗黙のランダムパーティションの点推定を同定することに焦点を当てている。
本研究では,非パラメトリックベイズ混合モデルにおける後部推論を要約し,混合度(または混合度)の密度推定を推論対象として優先順位付けする手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:00:24 GMT)
Transfer Learning Analysis of Variational Quantum Circuits [10.6] 本研究は変分量子回路(VQC)の伝達学習を解析する
損失境界の解析において,VQCの適応性と能力を検討するために形式主義を確立した。
解析的微調整法は、類似ドメインの適応に最適な遷移を実現するために導かれる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:26:25 GMT)
Transformers in Uniform TC$^0$ [10.5] AHAT と SMAT によって認識される言語は、回路複雑性クラス TC$0$ に含まれることを示す。
近似のないAHAT,O(poly(n))ビットの浮動小数点精度を持つSMAT,および少なくとも2-O(poly(n))$の絶対誤差を持つSMATは、すべてDLOGTIME-uniform TC$0$であることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:19:20 GMT)
In-Trajectory Inverse Reinforcement Learning: Learn Incrementally Before An Ongoing Trajectory Terminates [10.4] 逆強化学習(IRL)は報酬関数とそれに対応するポリシーを学習することを目的としている。
現在のIRLの作業は、学習するために少なくとも1つの完全な軌跡を集めるのを待つ必要があるため、進行中の軌跡から漸進的に学習することはできない。
本稿では,現在進行中の軌跡の初期状態対を観察しながら,報酬関数と対応する政策を学習する問題について考察する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:29:43 GMT)
OCTAMamba: A State-Space Model Approach for Precision OCTA Vasculature Segmentation [10.4] そこで我々は,OCTAMambaを提案する。OCTAMambaはOCTAMambaアーキテクチャをベースとした新しいU字型ネットワークで,OCTA内の血管を正確に分割する。
OCTAMambaは、局所的な特徴抽出のためのQuad Stream Efficient Mining Embedding Module、マルチスケールDilated Asymmetric Convolution ModuleをキャプチャするMulti-Scale Dilated Convolution Module、ノイズをフィルタリングしターゲット領域をハイライトするFocused Feature Recalibration Moduleを統合している。
本手法は,線形複雑度を維持しつつ,効率的なグローバルモデリングと局所特徴抽出を実現し,低計算医療応用に適している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:04:49 GMT)
A Game Between the Defender and the Attacker for Trigger-based Black-box Model Watermarking [10.4] 本稿では,トリガベースブラックボックスモデル透かしにおけるモデルアタッカーとモデルディフェンダーのゲームを紹介する。
2人のプレイヤーそれぞれに対して、ペイオフ関数を構築し、最適応答を決定する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:07:38 GMT)
NET-SA: An Efficient Secure Aggregation Architecture Based on In-Network Computing [10.2] NET-SAは機械学習のための効率的なセキュアアグリゲーションアーキテクチャである。
シードアグリーメントとシークレット共有のコミュニケーション集約フェーズを排除し、通信オーバーヘッドを低減する。
実行時の最大77倍と12倍の強化を実現し、最先端のメソッドと比較してクライアント間の通信コストを2倍削減する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:27:06 GMT)
Fast data inversion for high-dimensional dynamical systems from noisy measurements [10.1] 我々は高次元力学系に対するフレキシブル潜在因子モデルのためのスケーラブルなアプローチを開発する。
カスカディア地域の測地学的な観測に本手法を適用することにより, 地震の地震観測データと独立に一致したスリップの推定値が得られた。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:25:57 GMT)
Navigating the Maze of Explainable AI: A Systematic Approach to Evaluating Methods and Metrics [10.0] LATECは、20の異なる指標を用いて17の顕著なXAI手法を批判的に評価する大規模なベンチマークである。
信頼性の低いランキングに繋がるメトリクスの衝突リスクを実証し、その結果、より堅牢な評価手法を提案する。
LATECは将来のXAI研究における役割を強化し、326kのサリエンシマップと378kのメトリクススコアを(メタ評価)データセットとして公開している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:54:29 GMT)
Deep Reinforcement Learning for Job Scheduling and Resource Management in Cloud Computing: An Algorithm-Level Review [10.0] 深層強化学習(Dep Reinforcement Learning, DRL)は、これらの課題に対する有望な解決策として登場した。
DRLにより、システムは環境の継続的な観察に基づいてポリシーを学習し、適応することができる。
この調査は、クラウドコンピューティングにおけるジョブスケジューリングとリソース管理のためのDRLベースのアルゴリズムの包括的なレビューを提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:08:00 GMT)
Polynomial Time Quantum Gibbs Sampling for Fermi-Hubbard Model at any Temperature [9.6] 我々は、相互作用するフェルミオンに対応する摂動型リンドブレディアンの一定のギャップを最大結合強度まで証明する。
これは格子フェルミオンのギャップの安定性に関する定理を用いて達成される。
このギャップは混合時間に上限を与え、従って量子アルゴリズムの全体的な複雑さに上限を与える。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:56:02 GMT)
MSC-Bench: Benchmarking and Analyzing Multi-Sensor Corruption for Driving Perception [9.6] マルチセンサー融合モデルは、特に3Dオブジェクト検出やHDマップ構築といったタスクにおいて、自律運転知覚において重要な役割を果たす。
これらのモデルは、自律運転システムに必須かつ包括的な静的環境情報を提供する。
カメラ-LiDAR融合法は有望な結果を示しているが、それらはしばしば完全なセンサー入力に依存する。
この依存は、センサーが破損したり行方不明になったりした場合のロバスト性や潜在的な故障を招き、重大な安全性上の懸念を引き起こす可能性がある。
この課題に対処するために,多センサ自律運転知覚モデルの各種センサ破損に対する堅牢性評価を目的とした,初の総合的なベンチマークであるMulti-Sensor Corruption Benchmark(MSC-Bench)を導入する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:38:46 GMT)
Conformalized Interval Arithmetic with Symmetric Calibration [9.6] 我々は,複数の目標の和に対する予測区間に対して,単一目標に対する共形予測区間を開発する。
提案手法は, 既存のコンフォメーション手法や非コンフォメーション手法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:00:03 GMT)
FlashInfer: Efficient and Customizable Attention Engine for LLM Inference Serving [9.4] FlashInferは、大きな言語モデル(LLM)のためのカスタマイズ可能で効率的なアテンションエンジンである
ブロックスパースフォーマットと構成可能なフォーマットを使用して、KV-cacheストレージの不均一性に取り組むことで、メモリアクセスの最適化と冗長性の低減を実現している。
また、Just-In-TimeJITコンパイルによるさまざまな設定への適応を可能にする、カスタマイズ可能なアテンションテンプレートも提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:02:20 GMT)
Safeguarding Large Language Models in Real-time with Tunable Safety-Performance Trade-offs [9.3] 大規模言語モデル(LLM)は、ジェイルブレイク攻撃の影響を受けやすいことが示されている。
ジェイルブレイクはサイバー犯罪者やブラックハット俳優によって悪用され、重大な被害を受けている。
制御されたテキスト生成と「ナッジ」を組み合わせた新しいセーフガード「SafeNudge」を導入する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:15:38 GMT)
ViGiL3D: A Linguistically Diverse Dataset for 3D Visual Grounding [9.3] 3Dビジュアルグラウンドティングは、自然言語テキストによって参照される3Dシーンでエンティティをローカライズする。
多様な言語パターンに対して視覚的接地手法を評価するための診断データセットである3D (ViGiL3D) の視覚的接地について紹介する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:20:41 GMT)
SAFER: Sharpness Aware layer-selective Finetuning for Enhanced Robustness in vision transformers [9.1] ビジョントランス (ViT) は、先進的なコンピュータビジョンアプリケーションやマルチモーダル基盤モデルにおいて重要なバックボーンとなっている。
その強みにもかかわらず、ViTsは、畳み込みニューラルネットワーク(CNN)の脆弱性に匹敵する、あるいは超える敵の摂動に弱いままである。
本稿では,新しい層選択型微調整手法であるSAFERを用いて,ViTの対向オーバーフィッティングを緩和する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 20:37:14 GMT)
The Search for Stability: Learning Dynamics of Strategic Publishers with Initial Documents [9.1] 本稿では,戦略出版社が検索エンジンで最初にランク付けされる確率を最大化するゲーム理論情報検索モデルについて検討する。
一般に使用されている確率ランク付け原理(PRP)ランキングスキームは,ゲームが純粋なナッシュ均衡に達するのにしばしば失敗する不安定な環境をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:29:40 GMT)
SAP: Corrective Machine Unlearning with Scaled Activation Projection for Label Noise Robustness [9.1] 本稿では,SVDに基づく新しい非学習アルゴリズムであるScaled Activation Projection (SAP)を紹介する。
SAPは、クロスエントロピー損失を用いて信頼されたサンプルの小さなサブセットを特定することでラベルノイズを緩和する。
自然劣化したクロチング1Mで訓練したビジョントランスモデルの2.31%の一般化改善を観察する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:08:12 GMT)
A Shape-Based Functional Index for Objective Assessment of Pediatric Motor Function [9.0] DMD19例, SMA9例, 年齢対応コントロール13例において, 日常活動時の運動機能の客観的評価にウェアラブルセンサを用いた新しい手法を提案する。
本手法では,運動軌跡の整列と運動速度や非対称性の変動を含む運動パターンの識別に形状に基づく主成分分析を用いる。
SMA患者では運動非対称性パターンの活性化が認められた。
このデータ駆動方式は、家庭環境に展開することができ、神経筋疾患の小児に対する治療効果の経時的追跡を改善できる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:42:04 GMT)
DeepFilter: An Instrumental Baseline for Accurate and Efficient Process Monitoring [8.8] プロセス監視のためのTransformerスタイルのフレームワークであるDeepFilterを提案する。
コアとなるイノベーションは、複雑さを減らして長期および周期的なパターンをキャプチャする効率的なフィルタリング層である。
実世界のプロセス監視データセットのテストは、正確性と効率の点でDeepFilterの優位性を検証する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:47:55 GMT)
FALCON: Feedback-driven Adaptive Long/short-term memory reinforced Coding Optimization system [8.8] 大規模言語モデル(LLM)は、コードの自動生成において大きな進歩を遂げた。
教師付き微調整(SFT)と人間からのフィードバック(RLHF)からの強化学習の課題は、正確で人間中心のコードを生成する失敗につながった。
フィードバック駆動型適応長/短周期メモリ強化符号化最適化(FALCON)を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:16:32 GMT)
Securing Wi-Fi 6 Connection Establishment Against Relay and Spoofing Threats [8.8] 現在のWi-Fiセキュリティプロトコルは、中途半端、プリアンブルスプーフ、リレーなどの攻撃を完全に緩和することができない。
我々は,物理層(PHY)のプリアンブルに,時間制約のあるデジタル署名を織り込み,後方互換性のあるスキームを設計する。
我々は,リレー攻撃検出が96-100%正の正の確率を達成することを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:49:24 GMT)
Runtime Stealthy Perception Attacks against DNN-based Adaptive Cruise Control Systems [8.6] 本稿では,実行時認識攻撃下での深層ニューラルネットワークを用いたACCシステムのセキュリティ評価を行う。
攻撃を誘発する最も重要な時間を選択するための文脈認識戦略を提案する。
提案攻撃の有効性を,実車,公用運転データセット,現実的なシミュレーションプラットフォームを用いて評価した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:14:18 GMT)
ScarNet: A Novel Foundation Model for Automated Myocardial Scar Quantification from LGE in Cardiac MRI [8.5] ScarNetは、Medical Segment Anything Model(MedSAM)のトランスフォーマーベースのエンコーダと、畳み込みベースのU-Netデコーダを組み合わせたハイブリッドモデルである。
ScarNetは184人の検査患者において、Diceスコアが0.912(IQR: 0.863--0.944)であった。
モデルは多様な画像品質と傷跡パターンにまたがって堅牢な性能を示した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:30:55 GMT)
Operator Learning for Reconstructing Flow Fields from Sparse Measurements: an Energy Transformer Approach [8.2] 本稿では,エネルギー変換器を用いて再構成問題を解決するための新しい演算子学習フレームワークを提案する。
不完全な観測データから完全に再構成されたフィールドへのマッピングとして再構成を定式化する。
その結果、ETは複雑な流れ場を高度に不完全なデータから正確に再構築できることを示した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:24:19 GMT)
Language Models for Code Optimization: Survey, Challenges and Future Directions [7.9] ディープニューラルネットワーク(DNN)上に構築された言語モデル(LM)は、先日、ソフトウェアエンジニアリングタスクにおいて、画期的な効果を実証した。
本稿では,50以上の初等研究の体系的な文献レビューを行い,新たな傾向を特定し,11の専門的な疑問に対処する。
結果は、モデルの複雑さと実用的なユーザビリティのバランス、一般化性の向上、AIによるソリューションへの信頼の構築など、5つの重要なオープン課題を明らかにしている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:20:36 GMT)
HybridTrack: A Hybrid Approach for Robust Multi-Object Tracking [7.9] HybridTrackは、車両のための新しい3Dマルチオブジェクトトラッキングアプローチである。
データ駆動型カルマンフィルタ(KF)をトラッキング・バイ・検出パラダイムに統合する。
82.08%のHOTA精度を実現し、最先端の手法を大きく上回っている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:17:19 GMT)
Bridging Simplicity and Sophistication using GLinear: A Novel Architecture for Enhanced Time Series Prediction [7.9] Time Series Forecasting (TSF)は多くの分野において重要なアプリケーションです。
最近の研究では、より単純な線形モデルは、TSFタスクの複雑なTransformerベースのモデルに比べて、性能が優れているか、少なくとも競合する可能性があることが示唆されている。
本稿では,多変量TSFのための新しいデータ効率アーキテクチャGLinearを提案する。
また、他の最先端の線形予測器と比較して、少量の履歴データを使用することで予測精度も向上する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:19:53 GMT)
GeoDiffuser: Geometry-Based Image Editing with Diffusion Models [7.8] ゼロショット最適化に基づく2次元および3次元画像に基づくオブジェクト編集機能を1つの手法に統合するGeoDiffuserを提案する。
これらの変換は拡散モデルの注意層に直接組み込むことができ、暗黙的に編集操作を行うことができる。
GeoDiffuserは、オブジェクト翻訳、3Dローテーション、削除などの一般的な2Dおよび3D編集を実行することができる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:59:09 GMT)
Enhancing Code LLMs with Reinforcement Learning in Code Generation: A Survey [7.8] コード生成と最適化のための重要なテクニックとして強化学習(RL)が登場した。
本稿では,コード最適化と生成におけるRLの適用について,系統的な調査を行った。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:43:43 GMT)
MMVA: Multimodal Matching Based on Valence and Arousal across Images, Music, and Musical Captions [7.7] 妥当性と覚醒度に基づくマルチモーダルマッチング(MMVA)を提案する。
MMVA(MMVA)は、画像、音楽、音楽のキャプションにまたがる感情的コンテンツをキャプチャするために設計された、トリモーダルなエンコーダフレームワークである。
本研究では, 連続値(感情肯定)と覚醒値(感情強度)に基づいて, マルチモーダルマッチングスコアを用いる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:36:09 GMT)
EliGen: Entity-Level Controlled Image Generation with Regional Attention [7.7] Entity-Level制御画像生成のための新しいフレームワークであるEliGenを紹介する。
本稿では,追加パラメータを必要としない拡散変圧器の局所的注意,エンティティプロンプトと任意の形状の空間マスクをシームレスに統合する機構を紹介する。
我々はEliGenに、位置制御精度と画質の両方において既存の手法を超越して、堅牢で正確なエンティティレベルの操作を実現するよう訓練する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:46:13 GMT)
Federated Heavy Hitter Analytics with Local Differential Privacy [7.6] フェデレートされたヘビーヒットター分析により、サービスプロバイダは、最も頻繁なアイテムを分析して、サードパーティユーザの好みをよりよく理解することができる。
プライバシー保護データ収集のデファクトスタンダードであるローカルディファレンシャルプライバシ(LDP)は、各ユーザがデータをローカルに摂動させ、衛生バージョンを報告することによって、プライバシの課題を解決する。
本稿では,フェデレートヘビーヒッタ解析のための,$epsilon$-LDPを満たす新規なターゲットアライニングプレフィックスツリー機構を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:24:40 GMT)
EC-IoU: Orienting Safety for Object Detectors via Ego-Centric Intersection-over-Union [7.4] Ego-Centric Intersection-over-Union (EC-IoU) は、標準IoU尺度の制限に対処する。
我々は,IoUを改良する重み付け機構を提案する。これにより,エゴエージェントの観点からの接地トラス物体の近点をカバーする予測値に高いスコアを割り当てることができる。
提案したEC-IoU測度は、典型的な評価プロセスにおいて、下流タスクの安全関連性能を向上した対象検出器の選択に利用できる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:28:39 GMT)
Generative Modelling with High-Order Langevin Dynamics [6.9] スコアマッチングによる微分方程式(SDE)に基づく拡散生成モデル(DGM)は、データ生成において前例のない結果を得た。
スコアマッチングを用いた高次ランゲヴィンダイナミクス(HOLD)に基づく高速な高品質生成モデリング手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:06:57 GMT)
COMET:Combined Matrix for Elucidating Targets [6.8] マルチテクノロジカルなモジュラーターゲット予測ツールであるCOMETを紹介する。
厳密にキュレートされたデータでは、COMETデータベースは990,944個のドラッグとターゲットの相互作用ペアと45,035個の結合ポケットを含んでいる。
比較テストでは、COMETは他の5つのよく知られたアルゴリズムより優れており、少なくとも1つの真のターゲットを正確に特定する確率は80%近くである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:09:40 GMT)
Advancements in Visual Language Models for Remote Sensing: Datasets, Capabilities, and Enhancement Techniques [6.8] 本稿では、視覚言語モデル(VLM)に関する基礎理論と、リモートセンシングで構築されたデータセットについて概観する。
本稿では,VLMのコアコンポーネントに基づいて,改善手法を3つの主要部品に分類し,それらの方法の詳細な紹介と比較を行う。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:13:40 GMT)
IVIM-Morph: Motion-compensated quantitative Intra-voxel Incoherent Motion (IVIM) analysis for functional fetal lung maturity assessment from diffusion-weighted MRI data [6.8] 動き補正によるDWIデータの定量的解析のための自己教師型ディープニューラルネットワークモデルIVIM-morphを提案する。
IVIM-morphは2つのサブネットワーク、登録サブネットワーク、IVIMモデル適合サブネットワークを組み合わせ、IVIMモデルパラメータと動きの同時推定を可能にする。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:39:16 GMT)
Citations and Trust in LLM Generated Responses [6.7] 信頼は引用の存在と相関し、逆に引用をチェックすることに関係していると予測される。
我々は、この仮説を、商用AIを用いて生成されたテキスト応答を示すライブ質問応答実験で検証した。
その結果,引用が無作為であった場合でも,信頼度は著しく上昇した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:32:50 GMT)
Grand Challenges in Immersive Technologies for Cultural Heritage [6.7] 没入型技術の統合は、文化遺産の提示方法を変えてきた。
これらのテクノロジの採用は、さまざまな課題や潜在的なリスクをもたらします。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:00:45 GMT)
Bayesian Active Learning By Distribution Disagreement [6.6] 本稿では,BALDアルゴリズムの適応であるBALSAを提案する。
4つの異なるデータセットと2つの異なるアーキテクチャにわたるBALSAのSOTA結果について報告する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:21:47 GMT)
Embedding-based Approaches to Hyperpartisan News Detection [6.5] 過党派ニュース(Hyperpartisan news)は、国民に政治的分裂を起こそうとする極端に分極的な政治的立場をとるニュースである。
両方向LSTMを用いた事前学習ELMoを用いた最適システムは,10倍のクロスバリデーションで83%の精度を実現した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:29:53 GMT)
Drift2Matrix: Kernel-Induced Self Representation for Concept Drift Adaptation in Co-evolving Time Series [6.4] 概念ドリフトは従来の時系列解析モデルの信頼性と精度に影響を与える。
Dread2Matrixはカーネルベースの学習機構を使用して表現行列を生成する。
広く普及しているパターンを効果的に識別し、新興トレンドに対する洞察を提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:09:00 GMT)
Multi-Agent Quantum Reinforcement Learning using Evolutionary Optimization [6.3] 我々は、勾配のない量子強化学習のための既存のアプローチを構築し、マルチエージェント強化学習のための変分量子回路を用いた3つの遺伝的バリエーションを提案する。
我々は、トレーニング可能なパラメータの量に類似したニューラルネットワークと比較して、変動量子回路のアプローチが大幅に優れていることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:09:53 GMT)
From Models to Systems: A Comprehensive Fairness Framework for Compositional Recommender Systems [6.3] 現実のレコメンデーションシステムは、複数のモデルや複数のステージ上に構築されている。
本稿では,システムレベルの公平性をモデル化するための総合的な枠組みを提案する。
提案手法が合成データセットおよび実データセットに与える影響を実証的に実証した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:21:22 GMT)
Semialgebraic Neural Networks: From roots to representations [6.3] 本稿では,任意の有界半代数関数を表現可能なニューラルネットワークアーキテクチャであるSemialgebraic Networks(SANN)を紹介する。
構築により,SANNアーキテクチャがこの継続法を実行可能であることを示し,学習された半代数関数を評価する。
これらのネットワークの例を示し、従来のディープラーニング技術でトレーニングできることを示します。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 22:52:07 GMT)
Experimental emulator of pulse dynamics in fractional nonlinear Schrödinger equation [6.1] 一般化された分数非線形シュリンガー方程式(FNLSE)により制御されるパルス伝搬を支援する非線形光学プラットフォームを提案する。
提案手法は, キャビティ内とキャビティ外とを区別し, 有効分数群速度分散(FGVD)とKerr非線形性の間の相互作用を探索する。
これらの知見は、分数非線形系におけるスペクトル時間力学の実験的な研究のための新しい道を開く。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:17:51 GMT)
NeutraSum: A Language Model can help a Balanced Media Diet by Neutralizing News Summaries [6.1] ニュース記事のメディア偏見は、メディアの政治的偏見から生じる。
NeutraSumは、2つの中立性損失を統合し、生成された要約の意味空間を調整する。
メディアバイアスを大幅に減らし、中立的なニュース要約に有望なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:48:07 GMT)
Contrastive Learning from Exploratory Actions: Leveraging Natural Interactions for Preference Elicitation [6.0] 探索行動(CLEA)からの対照的な学習を提案する。
CLEAは、完全性、単純性、最小性、説明可能性という4つの指標よりもユーザの好みを引き出す際に、より優れた自己管理機能を備えている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:26:01 GMT)
Text Clustering as Classification with LLMs [6.0] 本研究では,大規模言語モデル(LLM)の文脈内学習能力を効果的に活用する,テキストクラスタリングのための新しいフレームワークを提案する。
そこで本研究では,テキストクラスタリングをLLMによる分類タスクに変換することを提案する。
我々のフレームワークは、最先端のクラスタリング手法に匹敵する、あるいは優れた性能を達成できることが実験的に証明されている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:53:50 GMT)
ST-HCSS: Deep Spatio-Temporal Hypergraph Convolutional Neural Network for Soft Sensing [5.8] ソフトセンシングのための深部時間畳み込みニューラルネットワーク(ST-HCSS)を提案する。
我々のフレームワークは、センサーノード間の複雑なマルチインタラクションをモデル化するために、高階グラフ(ハイパーグラフ)を構築し、活用することができる。
以上の結果より,ST-HCSSは既存のソフトセンサに比べて優れていた。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:06:43 GMT)
Leveraging Full Dependency Parsing Graph Information For Biomedical Event Extraction [5.8] 本稿では,依存グラフの完全隣接行列を用いて個々のトークンを埋め込む。
また, 依存グラフが全体の性能に与える影響を示すために, アブレーション実験を行った。
提案したモデルは,BEEの最先端モデルを,異なるデータセットに対してわずかに上回っている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:25:24 GMT)
Anti-counterfeiting tags with camouflaged QR codes on nanocavities, using polymer-dispersed-liquid-crystals [5.7] 3つの反反偽造タグが作製され、それぞれが独自のネマティック-等方性遷移温度を持つ別個のLCを用いて作製された。
ネマティック液晶と光学ナノキャビティのユニークな光学特性の組み合わせにより、2つの異なるエンコーディングレベルを示す新しいタイプのタグが作られる。
実現された2つのセキュリティレベルのアンチカウンセリングタグは、コスト効率が高く、製造が容易であり、柔軟性のおかげで、パッケージングや製品に簡単に統合できる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:54:44 GMT)
Exploiting Latent Properties to Optimize Neural Codecs [5.7] 本稿では,ベクトル量子化とエントロピー勾配の利点を利用して,市販コーデックの性能を向上させることを提案する。
これらの手法は、様々な事前訓練された手法で同じ品質の1~3%のコストを節約できることが示される。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:45:31 GMT)
KANS: Knowledge Discovery Graph Attention Network for Soft Sensing in Multivariate Industrial Processes [5.7] 本稿では,効果的なソフトセンシングのための知識探索グラフ注意ネットワークというフレームワークを提案する。
既存のディープラーニングソフトセンサーモデルとは異なり、kanSは多変量産業プロセス間の本質的な相関と不規則な関係を発見することができる。
実験結果から,KANSAはソフトセンシング性能において,すべてのベースラインと最先端手法を著しく上回っていることがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:02:36 GMT)
Many of Your DPOs are Secretly One: Attempting Unification Through Mutual Information [5.7] 大規模言語モデル(LLM)のポストアライメントは、実用性、安全性、人間の意図との整合性を改善する上で重要である。
直接選好最適化(DPO)は、このアライメントを実現するために最も広く使われているアルゴリズムの1つである。
本稿では,相互情報にインスパイアされた統一的な枠組みを導入し,フレキシブルな先行する新たな損失関数を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:31:38 GMT)
The Sigma-max System Induced from Randomness & Fuzziness and its Application in Time Series Prediction [5.6] 可能性尺度に「最大性」のキー公理が採用された理由に焦点をあてる。
我々の研究はファジネスの測定可能性の公理的定義のための物理的基盤を提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:24:58 GMT)
A Survey of Controllable Learning: Methods and Applications in Information Retrieval [5.6] 我々は、制御可能な学習(CL)の形式的定義を提供し、情報検索(IR)におけるその応用について議論する。
学習、評価、タスク設定、オンライン環境への展開など、CLが直面している課題を特定します。
理論解析、効率的な計算、大規模言語モデル、アプリケーションシナリオ、評価フレームワークにおけるCLの有望な方向性について概説する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:14:16 GMT)
The Role of Handling Attributive Nouns in Improving Chinese-To-English Machine Translation [5.6] 特に、中国語の帰属名詞による翻訳課題を対象とし、英語翻訳における曖昧さをしばしば引き起こす。
省略粒子X('DE')を手動で挿入することで、この臨界関数ワードの処理方法を改善する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:27:41 GMT)
Empirical Analysis of Nature-Inspired Algorithms for Autism Spectrum Disorder Detection Using 3D Video Dataset [5.6] 自閉症スペクトラム障害(Autism Spectrum disorder、ASD)は、反復行動や社会的・コミュニケーションスキルの欠如を含む慢性神経発達障害の症状である。
本稿では,3次元歩行映像データセットからASDを検出する手法について検討した。
分類アルゴリズムと自然に着想を得たアルゴリズムの組み合わせを多種に分けて展開し,その分類精度を100%の精度で評価した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:24:06 GMT)
An unsupervised method for MRI recovery: Deep image prior with structured sparsity [5.4] 教師なしMRI再構成法は完全なk-spaceデータを必要としない。
深部画像前処理法(DISCUS)は,深部画像前処理法(DIP)を拡張した。
円盤は4つの研究で検証されました
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:13:35 GMT)
Large Language Models for Mental Health Diagnostic Assessments: Exploring The Potential of Large Language Models for Assisting with Mental Health Diagnostic Assessments -- The Depression and Anxiety Case [5.2] 大規模言語モデル(LLM)は、医療専門家の注目を集めている。
本稿では,大うつ病 (MDD) に対する患者健康アンケート (PHQ-9) および一般不安障害 (GAD-7) における一般不安障害 (GAD) に関するアンケート調査について検討する。
微調整にはメンタラマモデルとラマモデルを使用し、プロンプトには GPT-3.5 や GPT-4o などのプロプライエタリモデルと llama-3.1-8b や mixtral-8x7b といったオープンソースモデルを試した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:34:02 GMT)
Hear the Scene: Audio-Enhanced Text Spotting [5.1] テキストスポッティングモデルのトレーニングに転写アノテーションのみを活用する革新的なアプローチを導入する。
提案手法では,暗黙的な位置特徴の学習を容易にする問合せに基づくパラダイムを用いている。
より正確なテキストインスタンスのローカライズを行うために、粗大から細粒のクロスアテンションローカライズ機構を導入する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:41:18 GMT)
Enhancing Dynamic Range of Sub-Quantum-Limit Measurements via Quantum Deamplification [5.1] 動的範囲を最小限の感度で拡張する新しい量子デアンプリフィケーション機構を導入する。
我々のプロトコルは、最先端の原子分子-光学プラットフォームの範囲内にあります。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:54:17 GMT)
Missing Data as Augmentation in the Earth Observation Domain: A Multi-View Learning Approach [5.1] マルチビュー学習(MVL)は、複数のソースやデータのビューを活用して、機械学習モデルの性能と堅牢性を向上させる。
本研究では,地球観測のための新しい手法について紹介する。
提案手法は,異なるトレーニングサンプルとして,欠落したビューのすべての組み合わせをシミュレートするために,セットの組み合わせを統合する。
これによりMVLモデルは、欠落したビューを完全に無視し、予測的堅牢性を高めることができる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:17:27 GMT)
Derivatives and residual distribution of regularized M-estimators with application to adaptive tuning [5.1] 凸ペナルティを基準とした勾配リプシッツ損失関数を持つM推定器について検討した。
実例は、ハマー損失と弾性ネットペナルティで構築されたロバストなM推定器である。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:19:28 GMT)
On Computational Complexity of 3D Ising Spin Glass: Lessons from D-Wave Annealer [5.0] D-Wave 3DアニールをNleq 5627$で広範囲に実験した結果を報告する。
その結果, 3次元スピングラスの高効率化には, $betaapprox 103$が有効であることがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:08:13 GMT)
PIMAEX: Multi-Agent Exploration through Peer Incentivization [4.9] 本研究は、内在的好奇心と影響に基づく報酬に関する過去の研究から着想を得たピアインセンティブ型報酬関数を提案する。
textitPIMAEXの報酬は、エージェントが互いに影響力を持つように促すことで、マルチエージェント環境での探索を改善することを目的としている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:06:52 GMT)
Characterizing the MrDeepFakes Sexual Deepfake Marketplace [4.8] 性的なディープフェイク素材の流行は、ここ数年で爆発した。
この成長の一端として、性的なディープフェイク素材の売買を支援するために、いくつかの市場が出現している。
我々は、市場経済、創造されたメディアのターゲット、そしてディープフェイクの作り方に関するユーザーディスカッションを分析します。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 22:58:22 GMT)
Adaptive Domain Inference Attack with Concept Hierarchy [4.8] 最もよく知られているモデルターゲットアタックは、アタッカーがアプリケーションドメインを学んだり、データの分散を訓練したと仮定する。
モデルAPIからドメイン情報を取り除くことは、これらの攻撃からモデルを保護することができるか?
提案した適応的ドメイン推論攻撃(ADI)は、トレーニングデータの関連するサブセットを評価できることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:27:15 GMT)
Speech Retrieval-Augmented Generation without Automatic Speech Recognition [4.7] SpeechRAGは、音声データに対するオープンクエスト応答のために設計された新しいフレームワークである。
提案手法は,事前学習した音声エンコーダを,凍結した大言語モデルに入力した音声アダプタに微調整する。
テキストと音声の埋め込み空間を整列させることで、音声検索者はテキストベースのクエリから音声を直接検索する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:29:01 GMT)
Sparsified Simultaneous Confidence Intervals for High-Dimensional Linear Models [4.7] 本稿では,間隔化同時信頼区間という,同時信頼区間の概念を提案する。
我々の区間は、区間の上と下の境界の一部が 0 に切り替わるという意味でスパースである。
提案手法は様々な選択手順と組み合わせることができるため,不確実性を比較するのに最適である。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:21:26 GMT)
Risks of Cultural Erasure in Large Language Models [4.6] 我々は,歴史的権力不平等を疑問視し,考慮する言語技術の量化可能な評価の必要性を論じる。
我々は、言語モデルがこれらの文脈を記述するよう依頼されたとき、世界中の様々な場所で生成する表現を探索する。
言語モデルアプリケーションを用いて,旅行レコメンデーションに表される文化を分析した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:57:50 GMT)
Detecting subtle cyberattacks on adaptive cruise control vehicles: A machine learning approach [4.6] 運転行動がわずかに変化しただけで、より汚い攻撃は、ネットワーク全体の混雑、燃料消費、さらにはクラッシュリスクさえも、容易に検出されずに増加させる可能性がある。
本稿では,車両制御コマンドの不正な操作,センサ計測に対する偽データ注入攻撃,DoS攻撃の3種類のサイバー攻撃に対するトラフィックモデルフレームワークを提案する。
車両軌跡データを用いた攻撃をリアルタイムに識別するために,GANに基づく新しい生成逆数ネットワーク(generative adversarial network, GAN)を用いた異常検出モデルを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:21:42 GMT)
Maximally Extendable Product Codes are Good Coboundary Expanders [4.6] 製品拡張と呼ばれる製品コードのコバウンダリ拡張特性について検討する。
本稿では,十分に大きなフィールド上の乱数符号の収集は,良好な積展開を達成できることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:56:01 GMT)
Past, Present, and Future of Sensor-Based Human Activity Recognition Using Wearables: A Surveying Tutorial on a Still Challenging Task [4.6] センサをベースとしたヒューマンアクティビティ認識(Human Activity Recognition)の在庫を取得し,その将来を図示する。
我々は,活動認識問題の解決を目的とした手法の初心者や専門家のためのコンペディションを提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 20:13:50 GMT)
Multi-Scenario Reasoning: Unlocking Cognitive Autonomy in Humanoid Robots for Multimodal Understanding [4.6] 本研究では,この分野でのマルチモーダル理解の技術的欠点を解決するために,多シナリオ推論アーキテクチャを提案する。
この結果は、マルチモーダルデータにおけるこのアーキテクチャの実現可能性を示している。
それは、シナリオを変える際に、ヒューマノイドロボットの自己学習と自律行動の将来の発展を物語っている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:52:28 GMT)
In Search of a Lost Metric: Human Empowerment as a Pillar of Socially Conscious Navigation [4.6] 人間のエンパワーメント(Human empowerment)は、人間の将来の状態に影響を与える能力を測定する情報理論の概念である。
本稿では,ナビゲーションタスクにおける社会的パフォーマンスの評価に,人間のエンパワーメントを統合する枠組みを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:13:46 GMT)
FED: Fast and Efficient Dataset Deduplication Framework with GPU Acceleration [4.5] NVIDIAはGPUベースのMinHash LSH復号法を導入したが、依然として準最適である。
sysは、SlimPajamaに含まれるCPUベースの復号化ツールを最大58.3倍の性能を発揮する。
1.2兆のトークンの重複は、4ノード16GPU環境でわずか5.1時間で完了する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:11:23 GMT)
Analysis of Security in OS-Level Virtualization [4.4] 仮想化の基本概念を確立します。
コンテナの脅威モデルの形成を支援する,コンテナ生成ライフサイクルについて論じる。
最後に、コンテナが提供する分離をさらに検討するケーススタディについて論じる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:36:41 GMT)
Iris Recognition for Infants [4.3] 新生児の非侵襲的、効率的、物理的トークンレス、正確で安定した識別方法は、出生時の赤ちゃんの交換を予防し、赤ちゃんの誘拐を制限し、出生後の健康モニタリングを改善することができる。
乳児4~6歳児の生体認証における虹彩認識の有用性について検討した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:34:44 GMT)
Embedding Similarity Guided License Plate Super Resolution [4.3] 本研究では,ピクセルベース損失と埋め込み類似性学習を組み合わせた新しいフレームワークを提案し,ライセンスプレート超解像(LPSR)の課題に対処する。
導入されたピクセルと埋め込み整合性損失(PECL)は、シームズネットワークを統合し、コントラスト損失を適用して埋め込み類似性を強制し、知覚的および構造的忠実性を改善する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:42:07 GMT)
Evaluation Metric for Quality Control and Generative Models in Histopathology Images [4.3] ResNet-L2(RL2)は、病理組織学における生成モデルと画像品質を評価するための新しい指標である。
RL2の劣化に対する単調反応は、画質を評価するモデルに適している。
従来のメトリクスに比べて大幅に軽量で高速で、安定したメトリック値を与えるには画像が少ない。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:07:16 GMT)
A Multi-task Supervised Compression Model for Split Computing [4.2] 分散コンピューティングは、リソース制約のあるエッジコンピューティングシステムのためのディープラーニングモデルに対する有望なアプローチである。
マルチタスクスプリットコンピューティングのための最初のマルチタスク型教師付き圧縮モデルであるLadonを提案する。
我々のモデルはマルチタスクスプリットコンピューティングシナリオにおいて、エンドツーエンドのレイテンシ(最大95.4%)とモバイルデバイスのエネルギー消費(最大88.2%)を削減した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:59:05 GMT)
BhashaVerse : Translation Ecosystem for Indian Subcontinent Languages [4.1] 本稿では,36言語を対象とした翻訳モデルとその関連アプリケーションの開発に焦点をあてる。
スクリプトのバリエーション、音声の違い、構文の多様性といった課題に対処する。
既存の資源を活用し、並列データセットを開発し、ドメイン固有のコーパスを生成し、合成データ技術を利用するコーパス作成戦略を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:33:40 GMT)
Rethinking Performance Analysis for Configurable Software Systems: A Case Study from a Fitness Landscape Perspective [3.8] 私たちはパフォーマンス分析を再考する新しい視点を提唱します -- 構成空間を構造化された風景としてモデル化します。
当社のフレームワークは,実システムの32ドル(約3,800円)のワークロードから,ベンチマークによる構成を86ドル(約8,800円)にします。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:55:38 GMT)
SwitchLoRA: Switched Low-Rank Adaptation Can Learn Full-Rank Information [3.7] ReLoRAやGaLoreのような手法は、低ランクのサブスペースを更新することでこの問題に対処しようとしている。
本稿では,LoRAのトレーニング可能なパラメータを代替パラメータに頻繁にスムーズに置き換える,パラメータ効率のトレーニング手法であるSwitchLoRAを紹介する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:02:35 GMT)
A Survey of Deep Learning Methods in Protein Bioinformatics and its Impact on Protein Design [3.6] ディープラーニングはコンピュータビジョンや自然言語処理などの分野において顕著な性能を示している。
近年、タンパク質配列のデータ豊富な領域に応用され、大きな成功を収めている。
ディープラーニングによって達成された性能改善は、タンパク質バイオインフォマティクスの分野での新たな可能性を開く。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:21:34 GMT)
Transfer Neyman-Pearson Algorithm for Outlier Detection [3.1] 異常データが稀な外乱検出における移動学習の問題点を考察する。
本稿では, 理論上, 異常分布の様々な変化に対して強い保証が得られるような一般メタアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 20:28:53 GMT)
PoVF: Empowering Decentralized Blockchain Systems with Verifiable Function Consensus [3.0] 本稿では,PoVF(Proof of Verifiable Function)と呼ばれる公正なコンセンサス機構を提案する。
PoVFは十分な公正なメカニズムを提供し、ブロックチェーンネットワークのすべてのノードがコンセンサスに参加する機会を平等に確保する。
われわれのセキュリティ分析によると、PoVFは確実に安全であり、潜在的な敵に抵抗する能力を持っている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:59:24 GMT)
Are LLMs effective psychological assessors? Leveraging adaptive RAG for interpretable mental health screening through psychometric practice [3.0] 本稿では,ソーシャルメディアの投稿を分析し,心理的アンケートを補完する適応型検索・拡張生成(RAG)手法を提案する。
本手法は,心理調査において各質問に対する最も関連性の高いユーザ投稿を検索し,ゼロショット環境でのアンケート結果の予測にLarge Language Models (LLMs) を用いる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 00:01:54 GMT)
Real-time Cross-modal Cybersickness Prediction in Virtual Reality [2.9] サイバーシックネスは、没入型バーチャルリアリティ(VR)体験の普及にとって重要な障壁であり続けている。
本稿では,生体信号の特徴を処理する軽量モデルと,映像特徴抽出のためのPP-TSNネットワークを提案する。
本モデルは,眼・頭部追跡データ,生理的データ,VR映像を含む公開データセットを用いて,サイバーシックネス予測の最先端性能を実証した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:41:43 GMT)
Perspective Chapter: MOOCs in India: Evolution, Innovation, Impact, and Roadmap [2.8] インドは1980年代にオープン・デジタル教育に焦点を合わせ始め、2009年にはインド政府のNMEICTプログラムを通じてその取り組みがエスカレートされた。
この章では、インドのMOOCの進化、そのイノベーション、その現状と影響、そして、その課題と成長に対処するための次の10年のロードマップを深く調べています。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:44:28 GMT)
Predictive Model Development to Identify Failed Healing in Patients after Non-Union Fracture Surgery [2.8] 骨偽関節は外傷手術に最も重篤な合併症の一つである。
機械学習の最近の進歩は、非統一的治癒を予測するモデルを開発することを約束している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:24:40 GMT)
Des-q: a quantum algorithm to provably speedup retraining of decision trees [2.7] Des-qは、回帰および二分分類タスクのための決定木を構築し、再訓練するための新しい量子アルゴリズムである。
我々は,複数のデータセット上での最先端の古典的手法に対して,Des-qのシミュレーションバージョンをベンチマークする。
提案アルゴリズムは,最新の決定木に類似した性能を示しながら,周期木再学習を著しく高速化する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:40:02 GMT)
Solving Hierarchical Information-Sharing Dec-POMDPs: An Extensive-Form Game Approach [2.7] 本稿では,階層的な情報共有の下での最適性を維持しつつ,決定変数をアンタングルにする方法を示す。
我々のアプローチでは、広義のゲームは常に単一ステージのサブゲームに対する解決策として存在し、時間的複雑さを著しく減少させる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:10:43 GMT)
Multi-Scale Denoising in the Feature Space for Low-Light Instance Segmentation [2.6] 低照度画像のインスタンスセグメンテーションはほとんど探索されていない。
提案手法は特徴抽出器に重み付けされた非局所ブロック(wNLB)を実装する。
実世界の騒音特性に対するネットワークの適応性を高めるため,各層に学習可能な重みを導入する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 23:06:37 GMT)
Efficient Connectivity-Preserving Instance Segmentation with Supervoxel-Based Loss Function [2.5] 計算オーバーヘッドを最小限に抑えたトポロジ対応ニューラルネットワークセグメンテーション法を提案する。
マウス脳の3次元光顕微鏡画像の公開データセット上で,その効果を実証する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:49:13 GMT)
Athanor: Local Search over Abstract Constraint Specifications [2.3] 本稿では,制約モデルとして受け入れる汎用ローカルサーチソルバに着目した。
ここで説明するAthanorソルバは、抽象制約仕様言語Essenceにおける問題の仕様から始まります。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:41:10 GMT)
Enhancing Precision of Automated Teller Machines Network Quality Assessment: Machine Learning and Multi Classifier Fusion Approaches [2.3] 本研究では、ATMの信頼性を高めるためにマルチクラス化融合技術を利用するデータ融合手法を提案する。
提案したフレームワークは、スタックに多様な分類モデルを統合することで、誤報の劇的な減少を3.56パーセントからわずか0.71パーセントに達成している。
このマルチクラス化融合法は個々のモデルの強度を合成し、大幅なコスト削減と運用上の意思決定の改善をもたらす。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:33:01 GMT)
Improving Graph Neural Network Training Efficiency By Using Top Non-Robust Samples In The Training Set [2.2] グラフニューラルネットワーク(GNN)は、グラフ構造化データを処理するための、非常に効果的なニューラルネットワークアーキテクチャである。
本稿では,与えられたモデルに対して特にノイズに敏感なトレーニングサンプルを同定し,トレーニングセットを構築するための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:10:23 GMT)
SeFAR: Semi-supervised Fine-grained Action Recognition with Temporal Perturbation and Learning Stabilization [2.2] きめ細かいアクション認識(FAR)は、短い時間内に詳細なセマンティックラベルに焦点を当てる。
ラベルのアノテートコストと微調整 LLM に必要なデータ量を考えると,半教師付き学習(SSL)の導入を提案する。
当社のフレームワークであるSeFARには,これらの課題に対処するための革新的な設計がいくつか含まれています。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:12:12 GMT)
Enhancing Reasoning through Process Supervision with Monte Carlo Tree Search [2.2] 大規模言語モデル(LLM)は、様々なタスクにまたがる顕著な能力を示している。
LLMの推論能力を改善するために、プロセスの監督は結果の監督よりも優れていることが証明されている。
本研究では,モンテカルロ木探索(MCTS)を用いてLLM自体を用いてプロセス監視データを生成する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:09:17 GMT)
Disentangling quantum neural networks for unified estimation of quantum entropies and distance measures [2.1] 本稿では,量子情報の様々な物理量を効率的に推定する分散量子ニューラルネットワーク(DEQNN)について紹介する。
提案するDECNNは,多様な物理量の値を保存するとともに,ヒルベルト空間のサイズを大幅に削減できる統一次元削減手法を提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:39:38 GMT)
Multi-Modal Video Feature Extraction for Popularity Prediction [2.1] 本研究は,ビデオ自体とその関連機能を用いて,ショートビデオの人気を予測することを目的としている。
人気度は、ビューカウント、例えば、コメントカウント、シェアカウントの4つの主要なエンゲージメント指標によって測定される。
本研究では,異なるアーキテクチャの映像分類モデルとトレーニング手法をバックボーンネットワークとして利用し,映像モダリティの特徴を抽出する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:59:36 GMT)
Noise-Resilient Symbolic Regression with Dynamic Gating Reinforcement Learning [2.1] シンボリック回帰は、データ内の本質的な情報を明らかにするための重要な手法として登場した。
現在の最先端(ソータ)SR法は,高雑音データからシンボル表現の正確な復元に苦慮している。
本稿では,高雑音データから表現を復元できる新しい雑音耐性SR法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:05:59 GMT)
MalCL: Leveraging GAN-Based Generative Replay to Combat Catastrophic Forgetting in Malware Classification [2.0] マルウェア分類のための継続的学習(CL)は、急速に進化するマルウェアの脅威に対処する。
本稿では,GAN(Generative Adversarial Networks)を利用したGRベースのCLシステムを提案する。
本システムでは,Windows のマルウェアサンプルに対して平均 55% の精度を達成し,GR ベースのモデルよりも28% 向上した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:15:31 GMT)
Click-Calib: A Robust Extrinsic Calibration Method for Surround-View Systems [2.0] Click-Calibは、オフラインSVS外部キャリブレーションのためのパターンなしのアプローチである。
他のオフラインキャリブレーションアプローチとは異なり、Click-Calib最適化カメラは広範囲にわたってポーズする。
社内データセットとパブリックなWoodScapeデータセットの評価は、その優れた精度と堅牢性を示している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 22:24:13 GMT)
Domain-invariant feature learning in brain MR imaging for content-based image retrieval [2.0] 脳MR画像のコンテントベース画像検索(CBIR)を実現するために,スタイルエンコーダ逆数領域適応(SE-ADA)と呼ばれる新しい低次元表現(LDR)取得手法を提案する。
SE-ADAは、LDRからドメイン固有情報を分離し、対向学習を用いてドメイン差を最小限にすることで、病的特徴を保ちながらドメイン差を低減する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:27:19 GMT)
TeLU Activation Function for Fast and Stable Deep Learning [1.9] 双曲型Tangent Exponential Linear Unit(TeLU)は、TeLU(x)=xtanh(exp(x))として定義されるニューラルネットワーク隠れ活性化関数である。
TeLUの設計はキーアクティベーション関数の中核原理に基づいており、強い収束を達成する。
我々の結果は、TeLUが活性化関数の新しい標準を設定する可能性を強調し、ディープニューラルネットワークにおけるより効率的で安定した学習を促進する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:32:43 GMT)
Detecting high-dimensional entanglement by local randomized projections [1.9] 本稿では,一階のモーメントを持つ局所的ランダム化射影に基づいて,シュミットの高次元状態の2部数の推定基準を導入する。
提案手法は,シュミット数より正確な推定値を得るだけでなく,既知の手法と比較して投射数を削減する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:20:05 GMT)
Specification Overfitting in Artificial Intelligence [1.8] 機械学習(ML)と人工知能(AI)のアプローチは、その固有のバイアスと、制御の欠如、説明責任、透明性のためにしばしば批判される。
公平性や堅牢性といった高レベルの要件は、具体的な仕様メトリクスに形式化する必要があります。
本稿では,高レベルの要求とタスク性能の低下に対して,特定の指標に過度に注目するシナリオである仕様オーバーフィッティングを定義する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:45:02 GMT)
Boosting Memory Efficiency in Transfer Learning for High-Resolution Medical Image Classification [1.6] FPT+(Fun-fine Prompt Tuning plus)は、高解像度の医用画像分類のために設計されたPETL法である。
FPT+は、軽量なサイドネットワークをトレーニングし、大規模な事前学習モデルから事前学習された知識にアクセスすることによって、転送学習を行う。
FPT+は, サイズ, モダリティ, 複雑さの異なる8つの医用画像データセットで評価した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:25:43 GMT)
nnY-Net: Swin-NeXt with Cross-Attention for 3D Medical Images Segmentation [1.5] 本稿では, nnY-Net と呼ばれる新しい3次元医用画像分割モデル構造を提案する。
我々は、最新の2つのSOTAモデルであるMedNeXtとSwinUNETRの利点を統合し、エンコーダとしてSwin Transformerを使用し、デコーダとしてConvNeXtを使用する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:46:41 GMT)
Best Transition Matrix Esitimation or Best Label Noise Robustness Classifier? Two Possible Methods to Enhance the Performance of T-revision [1.5] ラベルノイズ(英: Label noise)とは、人間のエラーやコレクションの欠陥に起因するデータセットの不正なラベルを指す。
本稿では,雑音遷移行列を推定し,ラベル雑音に対して頑健なディープラーニング分類器を構築する方法について検討する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:27:30 GMT)
iCNN-LSTM: A batch-based incremental ransomware detection system using Sysmon [1.5] 本研究では,畳み込みニューラルネットワーク(CNN)とLong Short-Term Memory(LSTM)ネットワークを統合した新しい検出システムを提案する。
Sysmonログを活用することで、システムはWindowsベースのエンドポイント上でリアルタイムの分析を可能にする。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:57:41 GMT)
A Sysmon Incremental Learning System for Ransomware Analysis and Detection [1.5] サイバー脅威、特にランサムウェア攻撃の増加に直面しているため、高度な検知と分析システムの必要性が高まっている。
これらの提案のほとんどは、新しいランサムウェアを検出するために、基礎となるモデルをスクラッチから更新する必要がある、非インクリメンタルな学習アプローチを活用している。
新たなランサムウェア株がモデルが更新されるまで検出されない可能性があるため、再トレーニング中に攻撃に対して脆弱なデータを残すため、このアプローチは問題となる。
本稿では,Sysmon Incremental Learning System for Analysis and Detection (SILRAD)を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:22:58 GMT)
Probing Light Bosonic Dark Matter with Transmon Qubits [1.5] 擬似粒子の測定から, ダーク光子, 光スカラーダークマター, アクシオン様粒子のパラメータ空間の制約を示す。
本研究は,地下実験室における暗黒物質の直接検出を目的とした量子量子ビット実験の開発に関する知見を提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 00:35:00 GMT)
Algebraic classification of Hietarinta's solutions of Yang-Baxter equations~:~invertible $4\times 4$ operators [1.4] ヒエタリンタは2次元局所ヒルベルト空間に対して定数ヤン・バクスター解を初めて分類した。
我々は4つの異なる代数的構造を用いており、この構造はキュービット表現に依存して、11のヒエタリンタ族のうち10を複製する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:24:59 GMT)
Information Subtraction: Learning Representations for Conditional Entropy [1.4] 本稿では,望ましくない情報を排除しつつ,所望の情報を保存するためのフレームワークであるInformation Subtractionを紹介する。
我々は、情報項を最大化し、他の表現を最小化することにより、これらの表現を出力する生成的アーキテクチャを実装した。
本結果は,条件付きエントロピーのセマンティックな特徴を提供する表現の能力を強調した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:10:31 GMT)
Weakly Supervised Learning on Large Graphs [1.4] 本研究は,2つの部分グラフ抽出技術を活用した弱教師付きグラフ分類フレームワークを提案する。
サブグラフはグラフ注意ネットワーク(GAT)を使用して処理される。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:12:13 GMT)
MDSF: Context-Aware Multi-Dimensional Data Storytelling Framework based on Large language Model [1.3] 本稿では,大規模言語モデルに基づく多次元データストーリーテリングフレームワーク(MDSF)について紹介する。
このフレームワークには、高度な前処理技術、拡張分析アルゴリズム、行動可能な洞察を特定し優先順位付けするためのユニークなスコアリングメカニズムが含まれている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:35:38 GMT)
BeliN: A Novel Corpus for Bengali Religious News Headline Generation using Contextual Feature Fusion [1.2] 見出し生成への既存のアプローチは、感情、カテゴリ、アスペクトといった重要な文脈的特徴を見越して、記事の内容のみに依存するのが一般的である。
本研究は,新しいコーパスであるベリN(ベンガル宗教ニュース)を導入することで,この限界に対処する。
バングラデシュの著名なオンライン新聞の宗教ニュース記事と、マルチジェネレーション(MultiGen) - コンテキスト的マルチインプット機能融合の見出し生成アプローチ。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:34:21 GMT)
Robust COVID-19 Detection from Cough Sounds using Deep Neural Decision Tree and Forest: A Comprehensive Cross-Datasets Evaluation [1.2] 本研究は、最先端の機械学習技術を用いて、新型コロナウイルス音の分類に頑健なアプローチを示す。
本手法は,様々な音質データセットに対して一貫した性能を示す。
本研究は、新型コロナウイルス関連音の人口的および地理的な差異を明らかにする総合的なデータセット分析を含む。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:35:06 GMT)
Upper Bounds for Learning in Reproducing Kernel Hilbert Spaces for Non IID Samples [1.2] 一般ヒルベルト空間におけるマルコフ連鎖に基づく勾配アルゴリズムについて検討し、二次損失関数の最適解を近似することを目的とした。
我々はこれらの結果を、カーネルヒルベルト空間を再現するオンライン正規化学習アルゴリズムに拡張する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:47:34 GMT)
ValuesRAG: Enhancing Cultural Alignment Through Retrieval-Augmented Contextual Learning [1.1] ValuesRAGは、テキスト生成中に文化的および人口統計学的知識を動的に統合するフレームワークである。
主実験およびアブレーション研究において、ベースライン法を一貫して上回る。
文化的に整合したAIシステムを育み、AI駆動型アプリケーションの傾きを高めることができる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:26:13 GMT)
Function Basis Encoding of Numerical Features in Factorization Machines [1.1] FM変種に数値的特徴を組み込む体系的・理論的に最適化された方法を提案する。
提案手法は,選択した関数の集合にまたがる数値特徴の分数化関数を学習するモデルであることを示す。
本手法は,高速な学習と推論を保存し,FMモデルの計算グラフのわずかな修正しか必要としない。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:49:12 GMT)
Toward Inclusive Educational AI: Auditing Frontier LLMs through a Multiplexity Lens [1.1] 本稿では,大規模言語モデル(LLM)における文化的バイアスの評価と緩和のための枠組みを提案する。
分析の結果,LLMには文化的偏極が頻繁に見られ,バイアスは過度にも微妙にも現れることがわかった。
システムプロンプトに直接多重化原理を組み込む textitContextual-Implemented Multiplex LLM と、複数の LLM エージェントがそれぞれ異なる文化的視点を表現し、バランスよく合成された応答を協調的に生成する textitMulti-Agent System (MAS)-Implemented Multiplex LLM という2つの戦略を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:27:08 GMT)
Harnessing Multi-Agent LLMs for Complex Engineering Problem-Solving: A Framework for Senior Design Projects [1.0] マルチエージェント大規模言語モデル(LLM)は、集合的知性を活用する能力において大きな注目を集めている。
本稿では,工学系学生が実施する上級設計プロジェクトを支援するために,マルチエージェント LLM の利用について検討する。
本稿では,問題定式化エージェント,システム複雑化エージェント,社会的・倫理的エージェント,プロジェクトマネージャなど,異なる専門家の視点でLLMエージェントが表現されるフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:25:45 GMT)
Multi-view Bayesian optimisation in reduced dimension for engineering design [1.0] 目的あるいは制約関数を表す入力設計変数と出力データの両方を考慮した多視点学習戦略を導入する。
確率的最小二乗(PPLS)を用いて,設計変数から潜伏変数への直交写像を学習する。
提案した確率論的最小二乗ベイズ最適化(PPLS-BO)戦略を,その決定論的手法,部分最小二乗ベイズ最適化(PLS-BO)および古典的ベイズ最適化と比較した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 22:03:00 GMT)
Towards Adversarially Robust Deep Metric Learning [0.9] ディープニューラルネットワークは敵の攻撃を受けやすいため、敵の例によって簡単に騙される可能性がある。
既存の作業は、DMLモデルの堅牢性を徹底的に検査することができない。
我々は,アンサンブル学習と対人訓練を利用する新しい防衛法である「アンサンブル・アディバーショナル・トレーニング(EAT)」を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:15:25 GMT)
Trajectory Representation Learning on Road Networks and Grids with Spatio-Temporal Dynamics [0.9] 軌道表現学習は、スマートシティや都市計画など分野の応用における基本的な課題である。
本稿では,時間的ダイナミクスを取り入れつつ,グリッドと道路ネットワークのモダリティを統合する新しいモデルであるTIGRを提案する。
実世界の2つのデータセット上でTIGRを評価し,両モードの組み合わせの有効性を実証した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:59:50 GMT)
Multi-View Majority Vote Learning Algorithms: Direct Minimization of PAC-Bayesian Bounds [0.8] 我々は PAC-Bayesian 理論を多視点学習に拡張し、R'enyi divergence に基づいた新しい一般化境界を導入する。
これらの境界は、R'enyi の発散の柔軟性を生かして、伝統的な Kullback-Leibler の発散に基づく代替となる。
また,第1次および第2次オラクルPAC-Bayesian境界を提案し,Cバウンドをマルチビュー設定に拡張する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 23:44:44 GMT)
Prediction of Geoeffective CMEs Using SOHO Images and Deep Learning [0.8] 深層学習フレームワークは、地球に到達したCMEイベントが地磁気嵐を引き起こすかどうかを予測、決定、あるいは確率的に予測するように設計されている。
GeoCMEは、ソーラー・アンド・ヘリオスフェア天文台(Solar and Heliospheric Observatory)に搭載されているLASCO C2、EIT、MDIなどの観測機器で訓練されている。
アンサンブルと移動学習技術を用いて、GeoCMEはSOHO観測で隠された特徴を抽出することができる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:24:37 GMT)
Kramers-protected hardware-efficient error correction with Andreev spin qubits [0.7] 線形インダクタの結合ネットワークはビットフリップ符号の安定化器からなる静的ハミルトニアンとなることを示す。
回路を介するスピンカップリングは、誤り訂正演算と論理量子ゲートの完全なセットを可能にする。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:10:40 GMT)
TreeLUT: An Efficient Alternative to Deep Neural Networks for Inference Acceleration Using Gradient Boosted Decision Trees [0.7] FPGA上での勾配向上決定木(GBDT)実装のためのオープンソースツールであるTreeLUTを提案する。
本稿では,複数のデータセットを分類し,超低域と遅延性の評価によく用いられるTreeLUTの有効性を示す。
以上の結果から,TreeLUTはハードウェア利用率,レイテンシ,スループットを,従来の作業に比べて競争精度で大幅に向上することがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:38:07 GMT)
TED: Turn Emphasis with Dialogue Feature Attention for Emotion Recognition in Conversation [0.7] 本稿では,各曲がり角を明示的に識別する優先度に基づくアテンション手法を提案する。
対話機能としてターン位置と話者情報に基づいて各ターンを優先する。
マルチターン入力のためのターンベースベクトル間のマルチヘッド自己アテンションと、対話機能によるアテンションスコアの調整を行う。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:44:48 GMT)
AI-Enabled Operations at Fermi Complex: Multivariate Time Series Prediction for Outage Prediction and Diagnosis [0.6] フェルミラボ・アクセラレーター・コンプレックスのメイン・コントロール・ルームは、ビームを監視する何千ものセンサーから時系列データを継続的に収集する。
旅行や電圧変動などの未計画の出来事は、しばしばビームの停止を引き起こし、運用上のダウンタイムを引き起こす。
このダウンタイムは、問題を診断し対処するオペレーターの労力を消費するだけでなく、ビーム復元を待つアイドルマシンによる不要なエネルギー消費につながる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:31:48 GMT)
Machine Learning-Based Differential Diagnosis of Parkinson's Disease Using Kinematic Feature Extraction and Selection [0.6] パーキンソン病(英: Parkinson's disease、PD)は、神経変性疾患の2番目に多い疾患である。
PDは進行性核上性麻痺(PSP)や多系統萎縮(MSA)などの他の神経変性疾患と症状を共有している
本稿では,PD,PSP,MSA,健康管理の鑑別診断を行う機械学習システムを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:43:39 GMT)
Multicollinearity Resolution Based on Machine Learning: A Case Study of Carbon Emissions [0.6] 本研究では,DBSCANクラスタリングとペナル化回帰モデルを用いた一般的な分析フレームワークを提案する。
この枠組みを適用して2000年から2019年までの46の産業のエネルギー消費データを分析した結果、中国では16のカテゴリーが特定された。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:59:08 GMT)
Does a Large Language Model Really Speak in Human-Like Language? [0.6] 大規模言語モデル(LLM)が最近登場し、非常に自然で人間らしいテキストを生成する能力によって、かなりの注目を集めている。
本研究では,LLM生成テキストと人文テキストの潜在コミュニティ構造を比較した。
以上の結果から,GPT生成テキストは人為的なテキストとは相変わらず異なることが示唆された。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:13:44 GMT)
TexAVi: Generating Stereoscopic VR Video Clips from Text Descriptions [0.6] 本稿では,既存の生成システムを融合してテキストから立体視のバーチャルリアリティービデオを作成する手法を提案する。
私たちの研究は、バーチャルリアリティーシミュレーションのような分野において自然言語駆動グラフィックスを使うことのエキサイティングな可能性を強調します。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:21:03 GMT)
Multi-Objective Optimization-Based Anonymization of Structured Data for Machine Learning [0.5] 本研究は,プライバシ保護のための既存最適化モデルにおける重要な制約を明らかにする。
本稿では,情報損失を同時に最小化し,攻撃に対する防御を最大化する新しい多目的最適化モデルを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 01:52:36 GMT)
BlockDialect: Block-wise Fine-grained Mixed Format for Energy-Efficient LLM Inference [0.5] 大規模言語モデル(LLM)は目覚ましい成功を収めているが、メモリ使用量や計算コストの増大は大きな課題となっている。
ブロック単位の最適な数値形式をフォーマットブックから割り当ててデータ表現を改善する,ブロック単位できめ細かな混合形式であるBlockDialectを提案する。
また、さまざまなデータ分布に対応するFP4変種(方言と同様)のフォーマットブックであるDialectFP4を導入する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:57:00 GMT)
Rephotography in the Digital Era: Mass Rephotography and re.photos, the Web Portal for Rephotography [0.5] 我々は、既存のデジタル手法で再撮影を行い、今後のデジタル・マス・リフォトグラフィーのアプローチと要件について論じる。
本稿では、リフォトグラフィーのための既存のWebポータルであるre.photosを紹介し、協調的なリフォトグラフィー、インタラクティブな画像登録、検索、組織化、再フォトグラフィーの共有を行う方法を紹介する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:13:24 GMT)
Quantum theory of molecular orientations: topological classification, complete entanglement, and fault-tolerant encodings [0.5] 分子回転状態と核スピン状態の量子位相空間を定式化する。
我々は分子を非対称、回転対称、回転対称の3つのタイプに分類する。
位置状態が内部の擬似スピンまたは「繊維」自由度を持つ分子種を同定する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:11:52 GMT)
Detecting Financial Bots on the Ethereum Blockchain [0.5] DLT(Distributed Ledger Technologies)のボットは、効率性と自動化を促進する。
それらの利用は捕食的取引や市場の操作にも関係しており、システムの完全性に脅威をもたらす可能性がある。
現在の検知システムは、主にルールベースであり、柔軟性がない。
プラットフォーム上での金融ボットの検出に機械学習を利用する新しいアプローチを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:54:17 GMT)
HPC Application Parameter Autotuning on Edge Devices: A Bandit Learning Approach [0.5] エッジデバイスにおけるパラメータ検索空間の問題に対処するために設計された新しい戦略であるLASPを紹介する。
当社の戦略は、オンライン探索とエクスプロイトに焦点を当てたマルチアーム・バンディット(MAB)技術を用いている。
私たちはLulesh、Kripke、Clomp、Hypreの4つのHPCアプリケーションでLASPをテストしました。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:59:32 GMT)
Accelerating Hardware Verification with Graph Models [0.4] ゲートレベルのネットリスト検証のためのグラフベースのハードウェアファザであるGraphFuzzを紹介する。
このアプローチでは、ハードウェア設計はグラフノードとしてモデル化され、ゲートの振る舞いは特徴として符号化される。
グラフ学習アルゴリズムを活用することで、GraphFuzzはノードパターンを分析して、ハードウェアの脆弱性を効率的に検出する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:12:28 GMT)
Relativistic VQE calculations of molecular electric dipole moments on trapped ion quantum hardware [0.4] 本研究では,従来のコンピュータ上でのBeH分子とRaH分子の永久電気双極子モーメント(PDM)を計算するために,高精度な18量子相対論的VQEシミュレーションを提案する。
本稿では,ZX-Calculusルーチンを保存するための強化学習や因果フロー,エラー軽減,選択後のテクニックなど,さまざまなリソース削減手法を適用する。
我々の12量子回路の2量子ゲート数を99.71%削減し、古典的な評価では2.35%の精度でPDMのトレードオフを行う。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:12:36 GMT)
The Use of Generative Artificial Intelligence for Upper Secondary Mathematics Education Through the Lens of Technology Acceptance [0.4] 本研究では,生成人工知能(GenAI)を用いた数学教育における学生の認識について検討した。
その結果,GenAIの使用意図に対する知覚的有用性の影響が強く示された。
互換性の付与により、モデルの説明力、特に知覚された有用性を予測する能力が改善された。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:50:30 GMT)
Test Schedule Generation for Acceptance Testing of Mission-Critical Satellite Systems [0.4] ほぼ最適な軌道内テストスケジュールを生成するための多目的手法を提案する。
SES Techcomによる産業ケーススタディでは、大きな改善が見られた。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:15:38 GMT)
ORACLE: A Real-Time, Hierarchical, Deep-Learning Photometric Classifier for the LSST [0.3] ORACLEは、時間的・変動的な天体物理学現象のリアルタイム・文脈的分類のための最初の階層的深層学習モデルである。
ORACLEは Gated Recurrent Units (GRU) を備えたリカレントニューラルネットワークである
LSST Astronomical Time-Series Classification Challenge から$sim$0.5M のイベントをトレーニングし、1日の測光観測のみを用いて、最上位(過渡対可変)のマクロ平均精度 0.96 を達成した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:00:05 GMT)
Benchmarking Constraint-Based Bayesian Structure Learning Algorithms: Role of Network Topology [0.3] 本研究では,ノード,エッジ,サンプルサイズを同一に制約しながら,異なるネットワークトポロジ間の感度の変化について検討する。
この結果は、制約ベースのBSLベンチマーク演習におけるネットワークトポロジの調整の重要性を解明するものである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:47:20 GMT)
Unsupervised learning for anticipating critical transitions [0.2] この課題に対処するために,変分オートエンコーダ(VAE)と貯水池コンピューティングを組み合わせたフレームワークを述べる。
特に、この駆動因子は、教師なし学習方式でVAEを用いて時系列から検出される。
倉本-シヴァシンスキー系を含む力学系を用いた原型的教師なし学習方式のパワーを実証する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 23:57:23 GMT)
Empirical learning of dynamical decoupling on quantum processors [0.2] 動的デカップリング(Dynamical Decoupling, DD)は、量子エラー抑制のための低オーバーヘッド法である。
学習アルゴリズムは,任意の量子回路やデバイスに対して,DD戦略を実証的に調整する方法を示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 20:47:48 GMT)
SwinVFTR: A Novel Volumetric Feature-learning Transformer for 3D OCT Fluid Segmentation [0.2] 3D OCT画像の精密な流体分割のためのトランスフォーマアーキテクチャであるSwinVFTRを提案する。
SwinVFTRは、チャネルワイドボリュームサンプリングとシフトウィンドウトランスフォーマーブロックを用いて、流体の局在を改善する。
Spectralis、Cirrus、Topcon OCTデータセットの既存モデルを上回っている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 22:11:57 GMT)
Representing arbitrary ground states of toric code by a restricted Boltzmann machine [0.2] 隠れたニューロンと可視ニューロンの局所的接続のみを有する制限ボルツマンマシンによるトーリック符号基底状態の表現可能性の解析を行った。
我々は制限ボルツマン機械を改良し、効率的な非局所接続を導入することで任意の基底状態に適応する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:07:31 GMT)
Developing a practical model for noise in entangled photon detection [0.2] 本研究では, 交叉光子対のパラメトリックソースによって生成される有効2光子密度行列の包括的モデルを構築した。
我々は,ポアソン分布光子対,非ユニット検出効率,暗数と仮定して,単一の偶然を得る確率を導出した。
我々の研究は、現実的な非理想性の下での2光子実験の定量的設計のための貴重なツールを提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 22:06:12 GMT)
Automating Work Orders and Tracking Winter Snow Plows and Patrol Vehicles with Telematics Data [0.2] 冬季道路の整備はインディアナ州交通省にとって重要な優先事項である。
現在のSnowplowワークロードのマニュアルトラッキングは非効率であり、エラーを起こしやすい。
我々は,テレマティクスシステムを用いた大規模GPSデータセットを用いて作業順序の作成と検証を自動化するブラウザ内Webアプリケーションを開発した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:02:45 GMT)
Phase-aware Training Schedule Simplifies Learning in Flow-Based Generative Models [0.2] 本研究では,フローベース生成モデルのパラメータ化に用いる2層オートエンコーダのトレーニングを分析する。
速度場を表すオートエンコーダは,各位相に関係するパラメータのみを推定することにより,簡易化を図る。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 00:11:26 GMT)
On the Robustness of Cover Version Identification Models: A Study Using Cover Versions from YouTube [0.0] オンラインビデオプラットフォーム上で、モデルがカバー曲でどれだけうまく機能するかは不明だが、予想外の変更が見られる可能性がある。
本稿では,マルチモーダルな不確実性サンプリング手法によってサンプリングされたYouTubeの楽曲のサブセットに注釈を付け,最先端のモデルの評価を行う。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:35:58 GMT)
Variational autoencoders with latent high-dimensional steady geometric flows for dynamics [0.0] 我々はPDE型環境データに対する変分オートエンコーダ(VAE)の手法を開発し,幾何学的潜在力学を規則化する。
エンコーダとデコーダによって開発された中間ラテント空間において,幾何学的流れを考慮した多様体幾何学が学習されるようなVAEフレームワークを再開発する。
興味のあるデータセットで、我々の手法は、少なくとも従来のVAEと同様にパフォーマンスが良く、しばしばより良くなることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:02:16 GMT)
Tracking behavioural differences across chronotypes: A case study in Finland using Oura rings [0.0] フィットネストラッカー、スマートウォッチ、リングなどの非侵襲的なモバイルウェアラブルは、日常の人間の行動を研究するための簡単で安価なアプローチを可能にする。
ここでは,19名の健常者から1年間にわたる詳細なデータを得るために,Oura環を用いた。
参加者の3つのクロノタイプ群の縦型睡眠と活動パターンについて検討した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:02:28 GMT)
ToolComp: A Multi-Tool Reasoning & Process Supervision Benchmark [0.0] マルチステップのツール使用推論を評価するためのベンチマークであるToolCompを紹介する。
ToolCompはモデルと人間のアノテータのコラボレーションによって開発されている。
我々は、結果教師付き報酬モデルとプロセス教師付き報酬モデルのパフォーマンスを比較するために、合成トレーニングデータを生成する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:10:52 GMT)
Test-time Controllable Image Generation by Explicit Spatial Constraint Enforcement [0.0] 本研究では,自然文のプロンプトと複雑な条件を考慮したテスト時間制御可能な生成手法を提案する。
具体的には,空間的条件を意味的条件と幾何学的条件に分離し,画像生成過程においてその一貫性を個別に強制する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:26:25 GMT)
Tensor-Based Foundations of Ordinary Least Squares and Neural Network Regression Models [0.0] 本稿では,通常の最小二乗モデルとニューラルネットワーク回帰モデルの数学的発展に対する新しいアプローチを紹介する。
解析と基本的な行列計算を活用することにより、両方のモデルの理論的基礎は慎重に詳細化され、完全なアルゴリズム形式に拡張される。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:03:05 GMT)
Tensor network method for solving the Ising model with a magnetic field [0.0] テンソルネットワーク法を用いて2次元正方格子Ising強磁性体と反強磁性体を磁場で研究する。
我々はIsing強磁性体と反強磁性体を並べて、磁化と絡み合いエントロピーの数値結果を示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:46:29 GMT)
Task-Driven Fixation Network: An Efficient Architecture with Fixation Selection [0.0] 本稿では,自動固定点選択機能を備えたニューラルネットワークアーキテクチャを提案する。
提案モデルは,入力画像から低解像度のグローバル特徴をキャプチャする低解像度チャネルと,局所的な高解像度特徴を逐次抽出する高解像度チャネルから構成される。
ハイブリッド符号化モジュールの定義特性は、固定点生成器を内蔵し、動的に固定点を生成することである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:38:10 GMT)
TART: Token-based Architecture Transformer for Neural Network Performance Prediction [0.0] トークンベースのアーキテクチャトランスフォーマー(TART)は、候補ネットワークをトレーニングすることなく、ニューラルネットワークのパフォーマンスを予測する。
TARTはエッジ情報のないパフォーマンス予測タスクのために、DeepNets-1Mデータセット上で最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:22:17 GMT)
State-of-the-art AI-based Learning Approaches for Deepfake Generation and Detection, Analyzing Opportunities, Threading through Pros, Cons, and Future Prospects [0.0] ディープフェイク技術は、信じられないほど生き生きとした顔画像やビデオコンテンツを作るように設計されている。
本報告では,400種前後の出版物を含む,近年のディープフェイク発生・検出の進展を精査する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:19:21 GMT)
Sparsely Multimodal Data Fusion [0.0] 本稿では,3つのマルチモーダル埋め込み技術,modal Channel Attention (MCA), Zorro, and Everything at Once (EAO)の比較検討を行った。
MCAは、入力モダリティのすべての組み合わせに融合埋め込みを導入し、注意マスキングを使用して異なる注意チャネルを作成する。
MCAは単相および核融合埋め込みにおける頑健な均一性を維持することにより優れた性能を発揮する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:31:25 GMT)
Simultaneous Latent State Estimation and Latent Linear Dynamics Discovery from Image Observations [0.0] 状態推定の問題は、ノイズの観測から解析的導出や後続のフィルタリング分布の近似を可能にする多くの成功したアルゴリズムで長い歴史を持っている。
本報告では, 画像ベース観測による潜時状態推定の課題を解決し, 新たな解決法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:44:03 GMT)
Sequential Large Language Model-Based Hyper-parameter Optimization [0.0] 本研究では,大規模言語モデル(LLM)をハイパーパラメータ最適化(HPO)に活用する革新的なフレームワークSLLMBOを紹介する。
動的探索空間適応性、拡張パラメータ空間利用、新しいLLM木構造パーゼン推定器(LLM-TPE)が組み込まれている。
この総合ベンチマークは、GPT-3.5-Turbo、GPT-4o、Claude-Sonnet-3.5、Gemini-1.5-Flashを含む複数のLCMを評価する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 23:08:47 GMT)
Sequencing Silicates in the IRS Debris Disk Catalog I: Methodology for Unsupervised Clustering [0.0] デブリディスクは、親体の鉱物学的組成にユニークな窓を提供する。
$textttCLUES$は、新しい、非パラメトリックで完全に解釈可能な機械学習スペクトル分析ツールである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:00:00 GMT)
SFFT-Based Homogenization: Using Tensor Trains to Enhance FFT-Based Homogenization [0.0] 均一化(homogenization)は、マイクロスケールの不均一性を持つ材料のマクロ特性を近似する鍵となる技術である。
FFTに基づくホモジェナイゼーション法は、複雑なミクロ構造を扱う際の計算効率と精度のために広く利用されている。
本稿では,量子変換の量子化列車変種を利用した,SFFTに基づく新しい均質化アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 20:35:15 GMT)
RingFormer: A Neural Vocoder with Ring Attention and Convolution-Augmented Transformer [0.0] RingFormerは、リングアテンション機構を軽量変圧器、畳み込み強化変圧器(コンフォーマー)に組み込むニューラルボコーダである。
RingFormerは2つの差別者による敵の訓練で訓練されている。
実験の結果、RingFormerは既存のモデルに匹敵する、あるいは優れたパフォーマンスを実現していることがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:18:57 GMT)
Reinforcement Learning for Control of Evolutionary and Ecological Processes [0.0] 本稿では,エコロジーと生理学の両方を計算としてモデル化し,進化ゲームの定式化を導入する。
我々は,進化する細胞の個体群を制御するためのアルゴリズム的問題に対して,その先駆的な結果を開発した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:38:12 GMT)
RealDiffFusionNet: Neural Controlled Differential Equation Informed Multi-Head Attention Fusion Networks for Disease Progression Modeling Using Real-World Data [0.0] 本稿では,RealDiffFusionNetという新しい深層学習手法を提案する。
ニューラル制御された微分方程式(Neural Controlled Differential Equations, ニューラルCDE)と、関連するマルチモーダルコンテキストを整合させるマルチヘッドアテンションを備えている。
CDEとマルチモーダルデータを利用して、病気の進行を正確に予測することは約束されている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 22:50:57 GMT)
Quantum Information Measures in Quartic and Symmetric Potentials using perturbative approach [0.0] 我々は、クォートおよび対称ポテンシャル井戸を受けるシステムに対するシャノンとフィッシャーの情報測度を解析する。
両方のポテンシャルに対して、シャノンエントロピーは位置空間を減少させ、幅が増加するにつれて運動量空間を増大させる。
対称井戸ポテンシャルに対して、フィッシャー情報は位置空間の減少と運動量空間の増大が、位置空間の局所化が増加するにつれて起こる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:16:15 GMT)
Quantum Error Correction with Goppa Codes from Maximal Curves: Design, Simulation, and Performance [0.0] この論文は、$yn = xm + x$ という形の方程式で定義される有限体上のある極大曲線のゴッパ符号を特徴づける。
本稿では,これらの最大曲線に付随する代数幾何学および量子安定化符号について検討し,それらのパラメータを改善するための修正を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:43:59 GMT)
Quantum Computing for Partition Function Estimation of a Markov Random Field in a Radar Anomaly Detection Problem [0.0] 確率論において、分割関数は、任意の確率関数を1の確率で密度関数に還元するために用いられる因子である。
本稿では,1つのクリーンキュービットモデルにおける分割関数推定のための量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:14:14 GMT)
Preliminaries to artificial consciousness: a multidimensional heuristic approach [0.0] 人工意識の追求は、理論的および経験的課題をナビゲートするために概念的明瞭さを必要とする。
本稿では,この分野の研究を導く枠組みとして,複合的,多段階的,多次元的な意識モデルを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:09:12 GMT)
Physically Constrained Generative Adversarial Networks for Improving Precipitation Fields from Earth System Models [0.0] 既存のポストプロセッシング手法はESMシミュレーションを局所的に改善できるが、モデル化された空間パターンの誤りを訂正することはできない。
本研究では,局所分布と空間構造を同時に改善するための,物理的に制約された生成逆ネットワーク(GAN)に基づくフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:31:29 GMT)
Overcoming Intensity Limits for Long-Distance Quantum Key Distribution [0.0] 量子鍵分配(QKD)は、量子力学によって確保された暗号鍵の共有を可能にする。
BB84プロトコルは単一光子源を仮定するが、実用システムは光子数分割攻撃に弱いコヒーレントパルスに依存する。
観測データから直接鍵パラメータを推定するためにベイズ推定を適用することにより、高い強度が確実に許されることを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 07:26:59 GMT)
Out-of-time-ordered correlators of mean-field bosons via Bogoliubov theory [0.0] 非線形分散PDEにおける新しい問題として,量子多体カオスについて述べる。
我々の発見は、量子多体カオスに影響を及ぼす非線形分散PDEにおける新しい問題に着目する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:27:49 GMT)
Optimized Relay Lens Design For High-Resolution Image Transmission In Military Target Detection Systems [0.0] ZEMAXソフトウェアを用いて設計・最適化したリレーレンズシステムの光学特性について詳細に検討した。
その結果、このレンズは高解像度で低収差の目標検出と追跡のための軍事的応用に有意な可能性を示唆した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:55:21 GMT)
Optical Gottesman-Kitaev-Preskill qubit generation via approximate squeezed coherent state superposition breeding [0.0] 例外的な誤り訂正能力で知られるGKP量子ビットは、量子コンピューティングにおいて非常に解明されている。
未検出モードにおける所望の状態を隠蔽する光子数分解検出器を用いて、絡み合った真空モードの一部が測定される計測ベースの手法が、最小限のリソース要件のために光GKP量子ビット生成の候補として浮上している。
一般化された光子サブトラクションによって生成される近似的圧縮コヒーレント状態重畳を育む手法は, 単一の高い確率ホモダイン測定で2つの光子数分解測定を補足することでこの問題を克服する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:56:55 GMT)
Need of AI in Modern Education: in the Eyes of Explainable AI (xAI) [0.0] この章は、AIの操作方法、特にバイアスに関する複雑な方法を明かそうとしている。
これらは、より信頼性があり、説明責任があり、すべての関係者にとって有益な方法でAIを使用することを含む、より良い教育政策に向けた基本的なステップである。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:59:22 GMT)
Modulational Instability and Dynamical Growth Blockade in the Nonlinear Hatano-Nelson Model [0.0] ハタノ・ネルソンモデル(Hatano-Nelson model)は、非エルミート物理学の基礎であり、一次元格子上の非対称ホッピング力学を記述する。
古典系と量子系の両方で広く研究され、凝縮物質物理学、フォトニクス、低温原子ガスに応用されている。
波多野・ネルソンモデルの最近の非線形拡張は、非線形性と非エルミート効果の間の相互作用を探索する新たな道を開いた。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:20:28 GMT)
Model Checking in Medical Imaging for Tumor Detection and Segmentation [0.0] 近年のモデル検査の進歩は、様々な応用において大きな可能性を秘めている。
医用画像は、モデル検査を効果的に適用できる重要な領域として際立っている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 20:47:04 GMT)
Measurable Improvement in Multi-Qubit Readout Using a Kinetic Inductance Traveling Wave Parametric Amplifier [0.0] KI-TWPAと多重量子ビットデバイスの統合を実証する。
その結果、大きな量子ビット系における量子制限されたリードアウトチェーンの実現に期待できる道のりが示された。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:22:18 GMT)
Marketing Mix Modeling in Lemonade [0.0] 本稿では,オンライン保険会社レモネードにおけるベイズMMMモデルの構築プロセスについて述べる。
私たちはまず、オンライン広告、ソーシャルメディア、ブランドマーケティングなど、レモネードのマーケティング活動に関するデータとパフォーマンスデータを収集しました。
A/Bテストとスライディングウィンドウのホールドアウトデータから得られた実際の性能データと比較した。
その結果、各マーケティングチャネルの予測貢献度は、A/Bテスト性能と一致し、動作可能であることがわかった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 14:17:31 GMT)
Magnetic moments in the Poynting theorem, Maxwell equations, Dirac equation, and QED [0.0] 電気力学のどちらのバージョンにも磁気モーメント効果がどのように含まれているかを示す。
いずれの場合も、ベクトルポテンシャルを使わずに、電磁場のみの観点から相互作用を表現する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:32:45 GMT)
Machine Learning-Based Prediction of ICU Readmissions in Intracerebral Hemorrhage Patients: Insights from the MIMIC Databases [0.0] 脳内出血(英:cerebral hemorrhage、ICH)は、脳内出血を特徴とする生命リスクの病態である。
本研究は,集中治療のための医療情報マート(MIMIC-IIIおよびMIMIC-IV)データベースを用いて,ICU受信リスク予測モデルを開発した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:19:27 GMT)
Machine Learning for Modeling Wireless Radio Metrics with Crowdsourced Data and Local Environment Features [0.0] 本稿では,4G環境におけるRSRP,RSRQ,RSSI無線無線メトリクスをモデル化するための機械学習モデルであるCRC-ML-Radio Metricsについて述べる。
RMSEのパフォーマンスは、RSRPが9.76から11.69dB、RSRQが2.90から3.23dB、RSSIが9.50から10.36dB、トロント、モントリオール、バンクーバーの30,000以上のデータポイントで評価されている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:52:08 GMT)
Improving Robustness Estimates in Natural Language Explainable AI though Synonymity Weighted Similarity Measures [0.0] 敵の例は、XAIの有効性を取り巻く文献で顕著である。
自然言語による説明については,情報検索の領域で見られる尺度をランク付けされたリストで用いるのが自然である。
これらの尺度の標準実装は、敵のXAIにおける説明の比較にはあまり適していないことを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 19:49:04 GMT)
High-Order Tensor Regression in Sparse Convolutional Neural Networks [0.0] 本稿では、現在の機械学習文献における従来の方法論とは大きく異なる、畳み込みに対する一般的なアプローチを示す。
その数学的側面において、このアプローチは単純で有利であることが証明され、特に高次テンソルが関与する場合に顕著である。
スパース畳み込みニューラルネットワークの一般的な見方の枠組みとして、ニューラルネットワークにおける回帰の合理的理論が開発されている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:59:10 GMT)
Heitler effect and resonance fluorescence in quantum magnonics [0.0] 量子ビットの結合系と、量子ビットが弱駆動されるマグノンモードを考える。
クビットとマグノンの両方のスペクトル定常応答は、結合によって分割された2つのサイドバンドに加えて、ほぼ直線幅の駆動周波数でのピークも示している。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:44:35 GMT)
Generalized Recurrence Criteria for Classes of Open Quantum Walks [0.0] それぞれ異なる種類の硬貨に適合する3つの異なる再発基準を提示する。
最初の基準は任意の有限次元のレイジー OQW のクラスのために開発された。
後者は次元 2 のラジー OQW に制限され、この下次元の繰り返しの完全な特徴づけを与える。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:22:41 GMT)
Generalising multipartite concentratable entanglement for practical applications: mixed, qudit, and optical states [0.0] 我々は,c-SWAP試験とCE測定を,絡みを特徴付ける実験に適用するのに適するようにした。
我々は、CEを高次元の絡み合いの尺度として検証するために、キュディ状態や絡み合った光状態のようないくつかの重要な高次元状態のCEを示す。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:05:43 GMT)
Four-Qubit Variational Algorithms in Silicon Photonics with Integrated Entangled Photon Sources [0.0] 室内温度でシリコンフォトニック集積回路上で2つの変分量子アルゴリズムを実行する。
これは光子対の源を持つフォトニック量子シミュレータ上での変分量子アルゴリズムの最初の実証である。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:29:47 GMT)
Fast, Scale-Adaptive, and Uncertainty-Aware Downscaling of Earth System Model Fields with Generative Machine Learning [0.0] 高分解能地球モデル(ESM)シミュレーションは、人為的気候変動の生態学的および社会経済的影響を評価するために不可欠である。
最近の機械学習アプローチは、ESMシミュレーションのダウンスケールにおいて有望な結果を示し、最先端の統計手法よりも優れている。
ゼロショット方式で再トレーニングすることなく、任意のESMシミュレーションを効率的に正確にダウンスケールする一貫性モデル(CM)を学習することで、これらの欠点に対処する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:30:30 GMT)
FAPL-DM-BC: A Secure and Scalable FL Framework with Adaptive Privacy and Dynamic Masking, Blockchain, and XAI for the IoVs [0.0] FAPL-DM-BCソリューションは、新しいFLベースのIoT(Internet of Vehicles, IoV)のためのプライバシ、セキュリティ、スケーラビリティソリューションである。
Adaptive Privacy-Aware Learning(FAPL)とDynamic Masking(DM)を活用して、プライバシポリシを学習し、適応的に変更する。
FAPL-DM-BCは、セキュアでスケーラブルで解釈可能なフェデレーション学習を保証する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 05:21:52 GMT)
Exceptional point in a trimer chain of oscillators with a quadratic driving [0.0] 従来の単一ピークではなく、光学スペクトルは2つのピークに分割されている。
これらのピークの位置は、テクスチャクローズドシステムにおけるトリマーの自然な周波数に対応する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:28:08 GMT)
Detection and classification of DDoS flooding attacks by machine learning method [0.0] 本研究では,ニューラルネットワークを用いた分散型サービス拒否攻撃(DDoS)の検出と分類に焦点をあてる。
通常のトラフィックとさまざまなDDoS攻撃を含むデータセットを使用して、24-106-5アーキテクチャでニューラルネットワークモデルをトレーニングした。
このモデルは高い精度(99.35%)、精度(99.32%)、リコール(99.54%)、Fスコア(0.99)を達成した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:34:09 GMT)
Design of mechanisms for ensuring the execution of tasks in project planning [0.0] 本報告では,プロジェクト計画の段階的側面の分析について報告する。
費用とプロジェクトの実施期間の制限を考慮している。
プロジェクト計画の段階で行われるタスクやタスクの階層を構築するタスクのモデルを構築した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:47:20 GMT)
Design of Qubit Readout Circuit for Purcell Rate Suppressing and Nonclassicality Enhancing [0.0] パーセル効果は、量子ビット共振器系において、忠実さと非古典性の両方の損失をもたらす一般的な問題である。
この研究は、全ハミルトニアンを導いた完全な量子力学理論を用いてシステムを広範囲に解析する。
その結果、スケーラブルな量子アーキテクチャにおいて、高忠実度読み出しと量子相関保存のギャップを埋めるシステムの可能性を示した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:26:26 GMT)
Data-Driven Machine Learning Approaches for Predicting In-Hospital Sepsis Mortality [0.0] セプシスはアメリカ合衆国と世界中で多くの死者を負う重篤な状態である。
機械学習を用いたこれまでの研究では、特徴選択とモデル解釈可能性に制限があった。
本研究は,院内敗血症死亡率を予測するための,解釈可能かつ正確な機械学習モデルを開発することを目的とした。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:06:56 GMT)
CySecBench: Generative AI-based CyberSecurity-focused Prompt Dataset for Benchmarking Large Language Models [0.0] CySecBenchは、サイバーセキュリティドメインのジェイルブレイク技術を評価するために特別に設計された12のプロンプトを含む包括的なデータセットである。
データセットは10の異なるアタックタイプカテゴリに分類され、ジェイルブレイクの試みをより一貫性のある正確な評価を可能にする、厳密なプロンプトが特徴である。
実験の結果,商業用ブラックボックスLLMから有害成分を抽出し,ChatGPTで65%,Geminiで88%の成功率を達成できた。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:37:04 GMT)
Constructive impact of Wannier-Stark field on environment-boosted quantum batteries [0.0] 我々は、Wannaier-Stark(WS)フィールドをオンサイト相互作用に加えて充電するために使用することにより、バッテリの最大電力を増大させることができることを示した。
フェルミオン電池は、格子サイズが大きくなるときやワニエ・スターク場が存在するとき、過渡的な状態においてそのような環境効果を示すことができる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 15:45:15 GMT)
Constructing and explaining machine learning models for chemistry: example of the exploration and design of boron-based Lewis acids [0.0] 我々は、説明可能なAI技術を活用して、ホウ素系ルイス酸の設計を探索する。
化学空間を適切に定義された分子足場に限定することにより,高精度な予測が可能となった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 23:47:54 GMT)
Conditional Consistency Guided Image Translation and Enhancement [0.0] マルチドメイン画像変換のための条件整合モデル(CCM)を提案する。
タスク固有の条件入力を導入し,これらの修正を施す。
CCMを10種類のデータセットで評価し,高品質な翻訳画像の作成の有効性を実証した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:13:31 GMT)
Comparative Analysis of Topic Modeling Techniques on ATSB Text Narratives Using Natural Language Processing [0.0] 本稿では、確率的潜在意味分析(pLSA)、潜在意味分析(LSA)、潜在ディリクレ割当(LDA)、非負行列分解(NMF)の4つの顕著なトピックモデリング手法の適用について検討する。
この研究は、各技術がデータ内に潜伏するテーマ構造を明らかにする能力を調べ、安全専門家に行動可能な洞察を得るための体系的なアプローチを提供する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:21:07 GMT)
Commutator Estimates and Quantitative Local Weyl's Law for Schödinger Operators with Non-Smooth Potentials [0.0] 我々は、クラス C1,1/2$ のポテンシャルを持つシュリンガー作用素を解析し、シャッテンノルムにおける関連する射影作用素の可換推定を確立する。
非相互作用粒子系と相互作用粒子系の両方を研究する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 17:52:06 GMT)
Commutative Evolution Laws in Holographic Cellular Automata: AdS/CFT, Near-Extremal D3-Branes, and a Deep Learning Approach [0.0] ホログラフィックセルオートマトンにおけるポアンカーの対称性の復元には、通勤する2つの異なる進化法則が必要であることを示す。
計算モデルでは、超平面をトーラスにコンパクト化し、自由度を有限数に下げる。
本稿では,時間発展法則と可換性から対応する空間進化法則を導出する深層学習アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 16:40:41 GMT)
Classification of Operational Records in Aviation Using Deep Learning Approaches [0.0] 本研究では,商業・軍事・民間の分類課題におけるDP(深層学習)の4つのモデルの性能評価を行った。
モデルのうち、BLSTMは72%の最高精度を達成し、安定性とバランスの取れた分類において優れた性能を示した。
CNNとsRNNは67%と69%の低い精度を示し、プライベートクラスでは大きな誤分類があった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 12:12:02 GMT)
Causal Deep Learning [0.0] 逆因果質問は、マルチ線形投影アルゴリズムを実装するニューラルネットワークで対処される。
計算にスケーラブルな解に対しては、ブロック代数を利用してディープニューラルネットワークの集合を導出する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 03:29:11 GMT)
Casimir Effect in Stochastic Semi-Classical Gravity [0.0] 半古典重力理論に一階補正を導入する。
このような補正によるカシミール力の変化を分析した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 18:56:25 GMT)
Calculating Customer Lifetime Value and Churn using Beta Geometric Negative Binomial and Gamma-Gamma Distribution in a NFT based setting [0.0] 顧客ライフサイクルバリュー(CLV)は、顧客が生涯にわたってビジネスにもたらす合計価値を測定する。
ベータ幾何負二項分布(BGNBD)とガンマガンマ分布(Gamma Gamma Distribution)はCLVを計算するために使用できる2つのモデルである。
この記事では、BGNBDとGamma Gammaディストリビューションモデルを説明し、ブロックチェーン環境でNFT(Non-Fungible Token)トランザクションデータのCLVを計算する方法について説明する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:55:54 GMT)
CT-AGRG: Automated Abnormality-Guided Report Generation from 3D Chest CT Volumes [0.0] 既存の方法では、観察された異常に明示的に焦点をあてることなく、3D CT画像から直接レポートを生成するのが一般的である。
本稿では,まず異常を予測し,それぞれが対象とする記述を生成する,新たな異常誘導型レポート生成モデルを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 20:10:51 GMT)
Bridging the Early Science Gap with Artificial Intelligence: Evaluating Large Language Models as Tools for Early Childhood Science Education [0.0] 幼少期の科学教育は科学リテラシーの発展に不可欠である。
複雑な科学概念を年齢に合った内容に翻訳することは、教育者にとって依然として困難である。
本研究は,4つの主要なLarge Language Model (LLM) について,就学前に適した科学的説明を生成する能力について評価した。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 10:55:41 GMT)
Bichromatic Rabi Control of Semiconductor Qubits [0.0] 電気的に駆動されるスピン共鳴は、半導体スピン量子ビットを制御するための強力な技術である。
しかし、大規模システムでは、量子アドレス可能性やオフ共鳴駆動の課題に直面している。
量子ドット孔スピン量子ビットのコヒーレント二色ラビ制御を実証し、大きな量子ビットアレイに対して空間選択的アプローチを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:11:40 GMT)
BiasJailbreak:Analyzing Ethical Biases and Jailbreak Vulnerabilities in Large Language Models [0.0] 本稿では,大規模言語モデル (LLM) における安全性に起因したバイアスが引き起こす固有のリスクを明らかにする,BiasJailbreakの概念を紹介する。
生成前に防御プロンプトを注入することにより、脱獄未遂を防止する効率的な防御方法であるBiasDefenseを提案する。
本研究は, LLMの倫理的バイアスが, 実際に安全でない出力を発生させる可能性を強調し, LLMをより安全でバイアスのないものにする方法を提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 04:06:46 GMT)
An Efficient Attention Mechanism for Sequential Recommendation Tasks: HydraRec [0.0] 本稿では,より長いシーケンスとより大きなデータセットに対する計算注意の理論的複雑さを大幅に改善する,効率的なトランスフォーマーベースのシーケンスRS(HydraRec)を提案する。
HydraRecは、次のアイテム予測タスクのシーケンシャルレコメンデーションに因果マスキングを使用する場合、他の線形アテンションベースモデルやドット製品ベースのアテンションモデルよりも優れています。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 13:03:06 GMT)
An Ad-hoc graph node vector embedding algorithm for general knowledge graphs using Kinetica-Graph [0.0] 本稿では,知識グラフ表現から一般的なグラフノードの埋め込みを生成する方法について論じる。
埋め込み空間は、局所親和性とリモート構造関連性の両方を模倣するいくつかのサブ機能から構成される。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 20:52:09 GMT)
Adaptive posterior distributions for uncertainty analysis of covariance matrices in Bayesian inversion problems for multioutput signals [0.0] 非線形多出力モデルのパラメータに対してベイズ推定を行う際の問題に対処する。
興味のある変数は2つのブロックに分割され、推論は既知の解析最適化公式を利用する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 09:01:09 GMT)
Adaptive Hardness-driven Augmentation and Alignment Strategies for Multi-Source Domain Adaptations [0.0] マルチソースドメイン適応(MDA)は、複数のラベル付きソースドメインからラベルなしのターゲットドメインに知識を転送することを目的としている。
従来の手法は主にサンプルレベルの制約を通じてドメイン間のアライメントを達成することに重点を置いています。
我々は,「A3MDA」という,MDAタスクのための新しい硬度駆動型戦略を導入する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:54:01 GMT)
A survey of Monte Carlo methods for noisy and costly densities with application to reinforcement learning and ABC [0.0] この種の問題は、最適化や強化学習など、多くの現実世界のシナリオで見ることができる。
異なる手法を3つの主要なクラスに分類し、統一された表記法でアルゴリズムの特定のインスタンスを記述する。
可能性のない設定と強化学習に特に注意を払って、様々な応用シナリオについて論じる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 08:43:24 GMT)
A redescription mining framework for post-hoc explaining and relating deep learning models [0.0] ディープラーニングモデル(DLM)は、構造化データと非構造化データの両方で、ますます高いパフォーマンスを達成する。
これらの成果にもかかわらず、DLMは巨大であるため説明が難しい。
本稿では,DLMの書き直しによる説明・関連のための新しいフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 11:38:10 GMT)
A Metasemantic-Metapragmatic Framework for Taxonomizing Multimodal Communicative Alignment [0.0] 本稿では,人間のようなマルチモーダル・コミュニケーションアライメントの基盤と概念化のためのメタマンティック・メタプラティックな分類法を提案する。
索引的文脈化の概念を導入し、「文脈化指向性」の原則を提案する。
この枠組みは, 意図, アイデンティティ, 影響, 倫理に関するより広範な意味合いを, モーダル内およびモーダル間における人間・機械のアライメントにおいて論じている。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 21:00:19 GMT)
A Comprehensive Review of Quantum Circuit Optimization: Current Trends and Future Directions [0.0] 分析アルゴリズム、戦略、機械学習ベースのメソッド、ハイブリッド量子古典フレームワークなど、最先端のアプローチをレビューする。
本稿では,各手法の長所と短所と,それらがもたらす課題について述べる。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 02:22:19 GMT)
A Competition Winning Deep Reinforcement Learning Agent in microRTS [0.0] RAISocketAIは、IEEE microRTSコンペティションで優勝した最初のDeep Reinforcement Learning (DRL)エージェントである。
パフォーマンス制約のないベンチマークでは、RAISocketAIは2つの以前の競争勝者を定期的に破った。
根本方針を反復的に微調整し、特定の地図に学習を移すことは、RAISocketAIの勝利に不可欠であった。
論文参考訳(メタデータ) (Thu, 02 Jan 2025 06:50:23 GMT)