EMOVA: Empowering Language Models to See, Hear and Speak with Vivid Emotions [150.9] GPT-4oは、多様な感情や声調を持つ声の会話を可能にするオムニモーダルモデルである。
本研究では,エンド・ツー・エンドの音声機能を備えた大規模言語モデルを実現するためのEMOVAを提案する。
EMOVAは、視覚言語と音声のベンチマークの両方で最先端のパフォーマンスを初めて達成した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:44:02 GMT)
Efficient Video Object Segmentation via Modulated Cross-Attention Memory [123.1] 頻繁なメモリ拡張を必要とせず、時間的滑らかさをモデル化するトランスフォーマーベースの手法MAVOSを提案する。
我々のMAVOSは、単一のV100 GPU上で37フレーム/秒(FPS)で動作しながら、J&Fスコア63.3%を達成する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:23:49 GMT)
MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models [91.4] この研究は、大規模言語モデルにおける半構造化(あるいはN:M'')のスパーシティを確立する学習可能なプルーニング手法であるMaskLLMを紹介した。
MaskLLMはGumbel Softmaxサンプリングを通じて学習可能な分布としてN:Mパターンを明示的にモデル化する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:37:41 GMT)
How Feature Learning Can Improve Neural Scaling Laws [87.0] 我々は,カーネル限界を超えたニューラルスケーリング法則の解法モデルを開発する。
モデルのサイズ、トレーニング時間、利用可能なデータの総量によるパフォーマンスのスケールアップ方法を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:05:32 GMT)
Empowering Agrifood System with Artificial Intelligence: A Survey of the Progress, Challenges and Opportunities [86.9] 我々は、AI技術がアグリフードシステムをどう変え、現代のアグリフード産業に貢献するかをレビューする。
本稿では,農業,畜産,漁業において,アグリフードシステムにおけるAI手法の進歩について概説する。
我々は、AIで現代のアグリフードシステムを変革するための潜在的な課題と有望な研究機会を強調します。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:34:35 GMT)
EAGLE: Towards Efficient Arbitrary Referring Visual Prompts Comprehension for Multimodal Large Language Models [80.0] 本稿では,既存のアプローチよりもトレーニングの少ない任意の参照視覚的プロンプトの理解を促進するための,MLLM(Multimodal Large Language Models)を提案する。
本手法は,視覚的プロンプトを,MLLMに理解可能な特定の空間領域を伝達する空間概念として応用する。
我々はまた、MLLMの領域レベルの理解を視覚的プロンプトを参照する特定の形式にさらに引き離すための幾何非依存学習パラダイム(GAL)を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:28:48 GMT)
Abstraction-of-Thought Makes Language Models Better Reasoners [79.7] AoT(Abstraction-of-Thought)と呼ばれる新しい構造化推論形式を導入する。
AoTのユニークな点は、推論プロセス内での抽象化のさまざまなレベルに対する明示的な要件にある。
提案するAoTコレクションは,AoT推論プロセスを用いた348kの高品質サンプルからなる汎用微調整データセットである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:15:14 GMT)
MIO: A Foundation Model on Multimodal Tokens [76.2] マルチモーダルトークン上に構築された新しい基礎モデルMIOを紹介する。
MIOは、エンドツーエンドの自己回帰的な方法で、音声、テキスト、画像、ビデオを理解し、生成することができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:57:16 GMT)
On the Design and Analysis of LLM-Based Algorithms [74.7] 大規模言語モデル(LLM)はアルゴリズムのサブルーチンとして使用される。
LLMは素晴らしい経験的成功を収めた。
提案フレームワークは,LLMアルゴリズムの進歩を約束する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:21:33 GMT)
Hypergame Theory for Decentralized Resource Allocation in Multi-user
Semantic Communications [71.6] マルチユーザSCシステムにおける分散コンピューティングと通信資源割り当てのための新しいフレームワークを提案する。
通信資源と計算資源を効率的に割り当てることの課題は、Stackelbergハイパーゲーム理論の適用によって解決される。
シミュレーションの結果,提案したStackelbergハイパーゲームは通信資源と計算資源を効率的に利用することができることがわかった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:55:59 GMT)
FlowTurbo: Towards Real-time Flow-Based Image Generation with Velocity Refiner [70.9] フローベースモデルはサンプリングプロセス中により直線的なサンプリング軌道を生成する傾向にある。
擬似修正器やサンプル認識コンパイルなどいくつかの手法を導入し,推論時間をさらに短縮する。
FlowTurboはImageNet上で100(ms/img)で2.12FID、38(ms/img)で3.93FIDに達する
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:59:51 GMT)
Serving Deep Learning Model in Relational Databases [70.5] リレーショナルデータ上での深層学習(DL)モデルの実現は、様々な商業分野や科学分野において重要な要件となっている。
最先端のDL中心アーキテクチャは、DL計算を専用のDLフレームワークにオフロードします。
UDF中心アーキテクチャの可能性は、リレーショナルデータベース管理システム(RDBMS)内の1つ以上のテンソル計算をユーザ定義関数(UDF)にカプセル化する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:33:35 GMT)
CHIQ: Contextual History Enhancement for Improving Query Rewriting in Conversational Search [67.6] 我々は,オープンソースの大規模言語モデル(LLM)の機能を活用して,クエリ書き換え前の会話履歴の曖昧さを解消する2段階の手法であるCHIQを紹介する。
我々は、CHIQがほとんどの設定で最先端の結果をもたらす、よく確立された5つのベンチマークを実証する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:19:34 GMT)
Reblurring-Guided Single Image Defocus Deblurring: A Learning Framework with Misaligned Training Pairs [65.3] 本稿では,単一画像デフォーカス・デブロアリングのためのリブロアリング誘導学習フレームワークを提案する。
我々のリブラーリングモジュールは、デブラーレッド画像とリブラーレッド画像と入力ぼかし画像との空間的整合性を保証する。
我々は,典型的な誤認識を伴わない単一画像デフォーカスのための新しいデータセットを収集した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:37:50 GMT)
The Hard Positive Truth about Vision-Language Compositionality [64.8] 視覚言語モデルがハードポジティクスに不変であるかどうかを考察する。
強陰性字幕と強陰性字幕を併用した1,775,259枚の画像テキスト・トレーニングセットを作成した。
本研究は,CLIPの「肯定的」概念間の意味的関係の理解を徹底的に検証し,改善するための今後の研究の必要性を示唆するものである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:36:10 GMT)
Message-Passing Monte Carlo: Generating low-discrepancy point sets via Graph Neural Networks [64.4] 本稿では,Message-Passing Monte Carlo という低差点集合を生成する機械学習手法を提案する。
MPMC点は、低次元と少数の点との差に関して、最適かほぼ最適であることが実証的に示されている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:53:10 GMT)
Just say what you want: only-prompting self-rewarding online preference optimization [64.3] 現在の自己回帰アプローチは、差別者の判断能力に大きく依存している。
本稿では,判断能力に頼らずに嗜好データセットを生成する,新たな自己回帰型オンラインアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:41:08 GMT)
Improving Fast Adversarial Training Paradigm: An Example Taxonomy Perspective [61.4] 高速対人訓練 (FAT) は, 効率的な訓練を行うために提案され, 熱い研究課題となっている。
FATは破滅的なオーバーフィッティングに悩まされ、多段階の逆行訓練と比較してパフォーマンスが低下する。
本稿では, FATにおける内的最適化と外的最適化のバランスが不均衡であることから, 破滅的なオーバーフィッティングが原因であることが確認された FAT の分類例を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:47:50 GMT)
Mitigating Covariate Shift in Imitation Learning for Autonomous Vehicles Using Latent Space Generative World Models [60.9] World Model(ワールドモデル)は、エージェントの次の状態を予測できるニューラルネットワークである。
エンド・ツー・エンドのトレーニングでは、人間のデモで観察された状態と整合してエラーから回復する方法を学ぶ。
クローズドループ試験における先行技術に有意な改善がみられた定性的,定量的な結果を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:57:52 GMT)
Improving the Shortest Plank: Vulnerability-Aware Adversarial Training for Robust Recommender System [60.7] VAT(Vulnerability-aware Adversarial Training)は、レコメンデーションシステムにおける中毒攻撃に対する防御を目的とした訓練である。
VATは、システムの適合度に基づいて、ユーザの脆弱性を推定するために、新たな脆弱性認識機能を採用している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:24:03 GMT)
ID$^3$: Identity-Preserving-yet-Diversified Diffusion Models for Synthetic Face Recognition [60.2] 合成顔認識(SFR)は、実際の顔データの分布を模倣するデータセットを生成することを目的としている。
拡散燃料SFRモデルであるtextID3$を紹介します。
textID3$はID保存損失を利用して、多様だがアイデンティティに一貫性のある顔の外観を生成する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:46:40 GMT)
LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field [58.9] ニューラル光場(NeLF)に基づく最初の頭部アバターモデルであるLightAvatarを紹介する。
LightAvatarは3DMMパラメータから画像をレンダリングし、メッシュやボリュームレンダリングを使わずに、単一のネットワークフォワードパスを介してカメラがポーズする。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:00:02 GMT)
EvMAPPER: High Altitude Orthomapping with Event Cameras [58.9] この研究は、イベントカメラを用いた最初のオルソモザイク的アプローチを導入している。
CMOSカメラにのみ依存する既存の手法とは対照的に,本手法は難易度の高い光条件においてもマップ生成を可能にする。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:57:15 GMT)
Synthesizing Environment-Specific People in Photographs [58.0] ESPはコンテキスト対応フルボディ生成のための新しい手法である。
ESPは、シーンの写真から抽出された2Dポーズとコンテキストキューに条件付けされる。
本研究では,ESPがコンテキストフルボディ生成のタスクにおいて,最先端技術よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:25:33 GMT)
Trust-Region Sequential Quadratic Programming for Stochastic Optimization with Random Models [57.5] 本稿では,1次と2次の両方の定常点を見つけるための信頼逐次準計画法を提案する。
本手法は, 1次定常点に収束するため, 対象対象の近似を最小化して定義された各イテレーションの勾配ステップを計算する。
2階定常点に収束するため,本手法は負曲率を減少するヘッセン行列を探索する固有ステップも計算する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:37:48 GMT)
The Lou Dataset -- Exploring the Impact of Gender-Fair Language in German Text Classification [57.1] ジェンダーフェア言語は、すべての性別に対処したり、中立形を使用することによって包摂性を促進する。
ジェンダーフェア言語はラベルを反転させ、確実性を減らし、注意パターンを変化させることで予測に大きな影響を及ぼす。
ドイツ語のテキスト分類への影響について最初の知見を提供する一方で、他の言語にもその知見が当てはまる可能性が高い。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:08:17 GMT)
Implementing a Nordic-Baltic Federated Health Data Network: a case
report [57.0] 我々は5か国6機関からなるフェデレーション型健康データネットワークを開発するための学際コンソーシアムを結成した。
本報告の目的は,このネットワークの開発経験に関する早期知見を提供することである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:15:54 GMT)
Deblur e-NeRF: NeRF from Motion-Blurred Events under High-speed or Low-light Conditions [56.8] 動き赤外イベントからぼやけた最小のNeRFを再構成する新しい手法であるDeblur e-NeRFを提案する。
また,大きなテクスチャレスパッチの正規化を改善するために,新しいしきい値正規化全変動損失を導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:57:20 GMT)
Toward Efficient Deep Blind RAW Image Restoration [56.4] 我々は、深部ブラインドRAW復元モデルをトレーニングするための、新しい現実的な劣化パイプラインを設計する。
私たちのパイプラインでは、リアルなセンサーノイズ、動きのぼかし、カメラの揺れ、その他の一般的な劣化について検討しています。
パイプラインと複数のセンサーのデータで訓練されたモデルは、ノイズとぼやけをうまく低減し、異なるカメラから撮影されたRAW画像の細部を復元する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:34:37 GMT)
Criticality and Safety Margins for Reinforcement Learning [53.1] 我々は,定量化基盤真理とユーザにとっての明確な意義の両面から,批判的枠組みを定めようとしている。
エージェントがn連続的ランダム動作に対するポリシーから逸脱した場合の報酬の減少として真臨界を導入する。
我々はまた、真の臨界と統計的に単調な関係を持つ低オーバーヘッド計量であるプロキシ臨界の概念も導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:00:45 GMT)
SlimSAM: 0.1% Data Makes Segment Anything Slim [53.0] 本稿では,新しいデータ効率のSAM圧縮手法であるSlimSAMを紹介する。
SlimSAMは、非常に少ないトレーニングデータで優れたパフォーマンスを達成する。
コードはhttp://github.com/czg1225/SlimSAMで入手できる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 05:41:56 GMT)
Are Transformers in Pre-trained LM A Good ASR Encoder? An Empirical Study [52.9] 自動音声認識(ASR)のためのエンコーダとして再利用された事前訓練言語モデル(PLM)内のトランスフォーマー
本研究は,事前学習したLMのトランスフォーマーを組み込んだASRタスクにおいて,文字誤り率 (CER) とワード誤り率 (WER) の顕著な改善が認められた。
このことは、事前訓練されたトランスフォーマーに埋め込まれたセマンティックな技術を活用して、ASRシステムの能力を向上させる可能性を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:31:18 GMT)
Subjective and Objective Quality-of-Experience Evaluation Study for Live Video Streaming [51.7] ライブビデオストリーミングにおける主観的および客観的QoE評価の総合的研究を行う。
主観的なQoE研究のために、最初のライブビデオストリーミングQoEデータセットであるTaoLive QoEを紹介する。
TaoLive QoEデータセットの主観的QoEスコアを導出するために人間による研究を行った。
マルチスケールな意味的特徴と光フローに基づく動作特徴を統合したエンドツーエンドQoE評価モデルTao-QoEを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:22:38 GMT)
Elephant in the Room: Unveiling the Impact of Reward Model Quality in Alignment [50.2] 重要な役割の報酬モデルが整列するにもかかわらず、以前の作品は一貫してパフォーマンスを見落としている。
本研究は、まず、広く使われている嗜好データセットHH-RLHFの品質を調査し、クリーンバージョンCHH-RLHFをキュレートする。
本稿では,CHH-RLHFに基づいて,従来のアライメント作業で使用する幅広い報酬モデルの精度をベンチマークし,最適化と評価の両方に使用するという信頼性の欠如を明らかにした。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:28:35 GMT)
Method for Evaluating the Number of Signal Sources and Application to Non-invasive Brain-computer Interface [49.2] 本稿では,時系列展開法の背後にある数学的理論を簡潔に紹介する。
提示されたアルゴリズムは、脳とコンピュータのインターフェイスから収集されたデータを解析するための貴重な数学的および分析ツールとして機能する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:03:42 GMT)
Unraveling Anomalies in Time: Unsupervised Discovery and Isolation of Anomalous Behavior in Bio-regenerative Life Support System Telemetry [43.9] 南極のEDEN ISS宇宙温室から得られたテレメトリデータから得られた異常を解析した。
我々は,異常検出結果に時系列クラスタリングを適用し,様々な種類の異常を分類する。
本稿では, MDI と DAMP の異常検出手法が相補的な結果をもたらすことを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:21:31 GMT)
Graph Edit Distance with General Costs Using Neural Set Divergence [43.8] グラフ編集距離(GED)は、2つのグラフ間の(dis-)類似性を測定する。
本稿では,編集作業に要する一般的なコストで動作可能なニューラルGED推定器である GraphEDX を提案する。
さまざまな編集コスト設定の下で、いくつかのデータセットの実験では、 GraphEDXが最先端の計算とメソッドを一貫して上回っていることが示されている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:51:29 GMT)
AI Delegates with a Dual Focus: Ensuring Privacy and Strategic Self-Disclosure [43.0] 我々は、さまざまな社会的関係やタスクシナリオにまたがるAIデリゲートのユーザの嗜好を調査するために、パイロットスタディを実施している。
次に、プライバシーに配慮した自己開示を可能にする新しいAIデリゲートシステムを提案する。
我々のユーザー調査は、提案されたAIデリゲートがプライバシーを戦略的に保護し、多様なダイナミックなソーシャルインタラクションにおけるその利用の先駆者であることを実証している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:45:15 GMT)
SLIDE: A machine-learning based method for forced dynamic response estimation of multibody systems [42.9] SLiding-Window初期停止型動的応答推定器(SLIDE)
メカニカル・マルチボディシステムの出力シーケンスを推定する深層学習法
その結果、シミュレーションから数百万までの大幅な高速化が示され、リアルタイム性能を大きく上回った。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 20:34:07 GMT)
Pure state entanglement and von Neumann algebras [41.9] 我々は、フォン・ノイマン代数の交換で表される二部量子系に対する局所演算の理論と古典的通信(LOCC)を開発する。
我々の定理は、ハグ双対性における可換因子によってモデル化された双対系において、すべての状態が無限に一発の絡み合いを持つことを暗示する。
付録では、半有限フォン・ノイマン代数と$sigma$-finite測度空間上の偏化の自己完備な処理を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:13:47 GMT)
Disentangled Clothed Avatar Generation from Text Descriptions [41.0] 本稿では,人体と衣服を別々に生成する新しいテキスト・トゥ・アバター生成手法を提案する。
提案手法は,テクスチャやテクスチャの質の向上,テキストプロンプトとのセマンティックアライメントの向上を実現する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:11:37 GMT)
EAGLES: Efficient Accelerated 3D Gaussians with Lightweight EncodingS [40.9] 3Dガウシアンスプラッティング(3D-GS)は、ノベルビューシーンの合成で人気がある。
レイディアンス・ニューラル・フィールド(NeRF)に関連する長いトレーニング時間と遅いレンダリング速度の課題に対処する。
本稿では,メモリ単位の記憶容量を大幅に削減するために,量子化埋め込みを利用する手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:33:24 GMT)
Demonstration of entanglement distribution over 155 km metropolitan fiber using a silicon nanophotonic chip [39.8] 我々は、オフチップの光子対の明るさが8,000対から460,000対/秒のSOIプラットフォームを報告した。
これは前回の報告を3桁の明るさで上回っている。
1つの光子を局所的に測定し、もう1つの光子を93kmの光ファイバーで送信すると、毎秒132対のカウントレートが得られる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:11:05 GMT)
Dark Miner: Defend against unsafe generation for text-to-image diffusion models [39.8] テキストと画像の拡散モデルは、フィルタされていない大規模なトレーニングデータにより、安全でない生成で実証されている。
我々は、採掘、検証、回避を含む3段階のプロセスであるダークマイナーを提案する。
本手法は,特に4件の最先端攻撃において,消去効果と防御効果が向上する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:48:24 GMT)
Open-World Evaluation for Retrieving Diverse Perspectives [39.2] 主観的質問に対する検索多様性のベンチマーク(BERDS)を作成する。
それぞれの例は質問と、質問に関連するさまざまな視点で構成されている。
検索した文書に視点があるかどうかを判断する言語モデルに基づく自動評価器を構築する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:52:57 GMT)
Can AI writing be salvaged? Mitigating Idiosyncrasies and Improving Human-AI Alignment in the Writing Process through Edits [39.0] 私たちはプロの作家を雇い、いくつかの創造的なドメインで段落を編集しました。
LAMPコーパス 1,057 LLM- generated paragraphs by professional writer based by our taxonomy。
LAMPの分析から,本研究で用いたLLMはいずれも,書字品質の面では優れていないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:15:53 GMT)
Can AI writing be salvaged? Mitigating Idiosyncrasies and Improving Human-AI Alignment in the Writing Process through Edits [39.0] 私たちはプロの作家を雇い、いくつかの創造的なドメインで段落を編集しました。
LAMPコーパス 1,057 LLM- generated paragraphs by professional writer based by our taxonomy。
LAMPの分析から,本研究で用いたLLMはいずれも,書字品質の面では優れていないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:15:53 GMT)
Can AI writing be salvaged? Mitigating Idiosyncrasies and Improving Human-AI Alignment in the Writing Process through Edits [39.0] 私たちはプロの作家を雇い、いくつかの創造的なドメインで段落を編集しました。
LAMPコーパス 1,057 LLM- generated paragraphs by professional writer based by our taxonomy。
LAMPの分析から,本研究で用いたLLMはいずれも,書字品質の面では優れていないことが明らかとなった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:15:53 GMT)
P4Q: Learning to Prompt for Quantization in Visual-language Models [38.9] 量子化のためのPrompt(P4Q)という,微調整と量子化のバランスをとる手法を提案する。
提案手法は,低ビット量子化による画像特徴とテキスト特徴とのギャップを効果的に低減することができる。
私たちの8ビットP4Qは理論上CLIP-ViT/B-32を4$times$で圧縮でき、Top-1の精度は66.94%である。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:31:27 GMT)
Analysis of Spatial augmentation in Self-supervised models in the purview of training and test distributions [38.8] 本稿では,自己指導型表現学習における空間拡張手法の実証的研究について述べる。
a) ランダムトリミングを2つの別々の拡張に分解し、オーバーラップとパッチを行い、重複領域とパッチサイズがダウンストリームタスクの精度に与える影響を詳細に分析する。
以前の文献で報告されたように、なぜカットアウト強化が良い表現を学ばないのかについての洞察を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 19:18:36 GMT)
Assumption violations in causal discovery and the robustness of score matching [38.6] 本稿では、最近の因果発見手法の観測データに対する実証的性能を広範囲にベンチマークする。
スコアマッチングに基づく手法は、推定されたグラフの偽陽性と偽陰性率において驚くべき性能を示すことを示す。
本論文は,因果発見手法の評価のための新しい基準を策定することを願っている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:55:48 GMT)
Computation Pre-Offloading for MEC-Enabled Vehicular Networks via Trajectory Prediction [38.5] 本稿では,車両の過去の軌跡を解析するためのトラジェクトリ予測に基づく事前負荷決定アルゴリズムを提案する。
本稿では,Double Deep Q-Network (DDQN) を用いて,エッジサーバがタスク処理遅延を最小限に抑える動的リソース割り当てアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:46:43 GMT)
An Empirical Study on Cross-lingual Vocabulary Adaptation for Efficient Language Model Inference [38.2] State-of-the-the-art Generative Large Language Model (LLM) は、英語中心のトークン化器、語彙、事前学習データに依存している。
近年の研究では、英語以外の言語でテキストを生成する際に、推論効率が低下することが示されている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:15:14 GMT)
Nob-MIAs: Non-biased Membership Inference Attacks Assessment on Large Language Models with Ex-Post Dataset Construction [37.7] メンバーシップ推論攻撃 (MIA) は、特定の文書が与えられたLarge Language Models (LLM) プリトレーニングで使用されたかどうかを検出することを目的としている。
本稿では,LLMにおけるMIAの評価について述べる。
我々は、より公平なMIA評価のために、非バイアス'と非分類'のデータセットを作成するアルゴリズムを提案し、検証する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:38:02 GMT)
Dirichlet-Based Coarse-to-Fine Example Selection For Open-Set Annotation [37.3] 本稿では,ディリクレに基づく大まかな実例選択(DCFS)戦略を提案する。
本手法では, 翻訳の不変性を損なうために, 単純なx-based obviousial Deep Learning (EDL)を導入している。
様々なオープンネス比データセットの実験は、DCFSが最先端のパフォーマンスを達成することを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:47:50 GMT)
WaSt-3D: Wasserstein-2 Distance for Scene-to-Scene Stylization on 3D Gaussians [37.1] We developed a new style transfer method for 3D scene called WaSt-3D。
トレーニングを必要とせずに、スタイルシーンからコンテンツシーンに詳細を忠実に転送する。
WaSt-3Dは、トレーニングを必要とせずに、さまざまなコンテンツやスタイルシーンに一貫して結果を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:02:50 GMT)
Learning to Drive via Asymmetric Self-Play [34.6] 課題,解決可能,現実的な合成シナリオを用いて,実際のデータを超えてスケールする非対称なセルフプレイを提案する。
私たちのアプローチは、解決可能なシナリオを生成することを学ぶ教師と、それを解くことを学ぶ学生のペアです。
当社の方針は、エンド・ツー・エンドの自律性のためのトレーニングデータを生成するためのゼロショット転送をさらに促進し、最先端の敵のアプローチを著しく上回っている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:55:38 GMT)
Benign or Not-Benign Overfitting in Token Selection of Attention Mechanism [34.3] 注目アーキテクチャのトークン選択機構における良性過剰適合の解析を行う。
私たちの知る限りでは、注意機構に対する良心過剰適合を特徴づける最初の研究である。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:20:05 GMT)
Revisiting Deep Ensemble Uncertainty for Enhanced Medical Anomaly Detection [34.1] 医用異常検出のためのDual-space Uncertainty Estimationフレームワークを提案する。
異常検出のための一致と不一致のバランスをとるために,冗長性認識反発(RAR)を提案する。
また,入出力空間におけるアンサンブルの不確実性を利用したDual-Space Uncertainty(DSU)を開発した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:47:41 GMT)
Retrospective Comparative Analysis of Prostate Cancer In-Basket Messages: Responses from Closed-Domain LLM vs. Clinical Teams [33.9] 我々は,GPT-4をベースとしたLarge Language Model (LLM) であるRadOnc-GPTを紹介する。
RandOnc-GPT は以前記録された158個のバスケット内メッセージインタラクションに対して評価された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:00:51 GMT)
Deep Self-Cleansing for Medical Image Segmentation with Noisy Labels [33.7] 医用画像のセグメンテーションは、疾患の診断と手術計画を支援する医療画像の分野で重要である。
確立されたセグメンテーション手法の多くは、監督された深層学習に依存しており、クリーンで正確なラベルが監督に不可欠である。
トレーニング段階でノイズを除去しながら、クリーンなラベルを保存できるディープ・セルフ・クリーン・セグメンテーション・フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:55:49 GMT)
Learning 3D-Aware GANs from Unposed Images with Template Feature Field [33.3] この研究は、未提示の画像から3D対応のGANを学習することを目的としている。
学習テンプレート特徴場(TeFF)を用いたトレーニング画像のオンザフライポーズ推定を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:58:11 GMT)
Report on the Workshop on Simulations for Information Access (Sim4IA 2024) at SIGIR 2024 [33.2] 本報告はSIGIR 2024における情報アクセスシミュレーションワークショップ(Sim4IA)の報告である。
主な内容は、学習と産業におけるユーザシミュレーションの重要性、オンラインおよびオフライン評価のブリッジングの可能性、情報アクセスのためのユーザシミュレーションに関する共同作業の編成に関する問題であった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:32:10 GMT)
LEMMA-RCA: A Large Multi-modal Multi-domain Dataset for Root Cause Analysis [32.8] ルート原因分析(RCA)は複雑なシステムの信頼性と性能を高めるために重要である。
LEMMA-RCAは複数のドメインとモダリティにまたがる多様なRCAタスク用に設計された大規模なデータセットである。
本研究では, LEMMA-RCAの性能評価を行い, 8つのベースライン法の性能評価を行った。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 22:42:49 GMT)
MoGenTS: Motion Generation based on Spatial-Temporal Joint Modeling [32.8] 本研究では,2次元関節型VQVAE,時間空間型2次元マスキング技術,時空間型2次元アテンションを提案する2次元運動量子化フレームワークを構築した。
提案手法は,HumanML3DでFIDが26.6%低下し,KIT-MLで29.9%低下した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:51:11 GMT)
Data Proportion Detection for Optimized Data Management for Large Language Models [32.6] 我々は,事前学習データの割合の自動推定を可能にする新しいトピック,textitdata proportion Detectionを導入する。
データ比例検出のための厳密な理論的証明、実用的なアルゴリズム、予備実験結果を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:30:32 GMT)
Neural Light Spheres for Implicit Image Stitching and View Synthesis [32.4] 暗黙的パノラマ画像縫合と再レンダリングのための球状神経電場モデル
従来の画像縫合法や放射場法に比べて再現性は向上した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:05:29 GMT)
Shape-intensity knowledge distillation for robust medical image segmentation [32.2] セグメント化ネットワークに結合形状インテンシティ事前情報を組み込む新しい手法を提案する。
5つの医用画像セグメンテーションタスクの実験により,提案した形状-強度知識蒸留(Shape-Intensity Knowledge Distillation)が一貫していくつかのベースラインモデルを改善することが示された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:21:21 GMT)
KAG: Boosting LLMs in Professional Domains via Knowledge Augmented Generation [32.0] 我々は、Knowledge Augmented Generation(KAG)と呼ばれる専門的なドメイン知識サービスフレームワークを紹介します。
KAGは、知識グラフ(KG)とベクトル検索の利点をフル活用する動機によって、これらの課題に対処するために設計されている。
我々は,E-Government Q&AやE-Health Q&Aを含む,Ant Groupの2つの専門知識Q&AタスクにKAGを適用し,RAG手法と比較して,プロ主義の大幅な改善を実現した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:34:35 GMT)
KAG: Boosting LLMs in Professional Domains via Knowledge Augmented Generation [32.0] 我々は、Knowledge Augmented Generation(KAG)と呼ばれる専門的なドメイン知識サービスフレームワークを紹介します。
KAGは、知識グラフ(KG)とベクトル検索の利点をフル活用する動機によって、これらの課題に対処するために設計されている。
我々は,E-Government Q&AやE-Health Q&Aを含む,Ant Groupの2つの専門知識Q&AタスクにKAGを適用し,RAG手法と比較して,プロ主義の大幅な改善を実現した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:34:35 GMT)
Recent advances in interpretable machine learning using structure-based protein representations [30.9] 機械学習(ML)の最近の進歩は、構造生物学の分野を変えつつある。
タンパク質3D構造を低分解能から高分解能に表現する様々な方法を提案する。
本稿では,タンパク質構造,タンパク質機能,タンパク質-タンパク質相互作用の予測などのタスクを解釈可能なML手法がどのようにサポートするかを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:56:27 GMT)
Explanation Regularisation through the Lens of Attributions [30.7] 説明正則化(ER)は、テキスト分類器に予測を導出する方法として導入された。
これは、入力属性手法の出力が人間の注釈付き論理とどの程度うまく一致しているかを測定する補助的な説明損失を導入することで達成される。
従来の研究は、特にモデルを導くのに使われたものと異なる属性技術を用いて、信頼度を測定する場合、その依存度に対するガイダンスの影響を過小評価していた。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:27:30 GMT)
RED QUEEN: Safeguarding Large Language Models against Concealed
Multi-Turn Jailbreaking [30.7] 我々は,害の防止という目的の下に悪意のある意図を隠蔽し,マルチターンシナリオを構築する新しいジェイルブレイク手法RED QUEEN ATTACKを提案する。
我々の実験によると、全てのLLMはRED QUEEN ATTACKに対して脆弱であり、GPT-4oで87.62%、Llama3-70Bで75.4%に達する。
安全を優先するために, RED QUEEN GUARDと呼ばれる簡単な緩和戦略を導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:24:17 GMT)
Self-supervised Monocular Depth Estimation with Large Kernel Attention [30.4] より詳細な情報を得るために,自己教師付き単眼深度推定ネットワークを提案する。
具体的には,長距離依存性をモデル化可能なカーネルアテンションに基づくデコーダを提案する。
提案手法は,KITTIデータセット上での競合結果を実現する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:44:41 GMT)
Improving Fast Adversarial Training via Self-Knowledge Guidance [30.3] 高速対人訓練(FAT)における不均衡問題を包括的に研究する。
我々は、そのパフォーマンスに関する明らかな階級格差を観察する。
この格差は、クリーンとロバストな精度の整合性の観点から具現化することができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:12:04 GMT)
Exploring Text-Guided Single Image Editing for Remote Sensing Images [30.2] 本稿では,テキスト誘導型RSI編集手法を提案する。
大規模なベンチマークデータセットのトレーニングを必要とせずに、一貫性を維持するために、マルチスケールのトレーニングアプローチを採用している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 05:10:23 GMT)
Preserving phase coherence and linearity in cat qubits with exponential bit-flip suppression [29.6] 猫量子ビットは平均光子数の増加を伴うビットフリップ誤差に対して指数的なノイズバイアスを示すことができる。
バッファモードの損失環境を多極フィルタで色づけすることで,この課題を克服する方法を示す。
我々は,光子数の増加に伴い,キャットキュービットのビットフリップ速度のほぼ理想的向上を実現した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 05:57:51 GMT)
Optimal Parallelization Strategies for Active Flow Control in Deep Reinforcement Learning-Based Computational Fluid Dynamics [29.5] Deep Reinforcement Learning (DRL) は、高ダイナミックかつ非線形なアクティブフロー制御(AFC)問題を扱うための有望なアプローチとして登場した。
本研究では、DRLに基づくアルゴリズムを並列設定で最適化することに焦点を当てる。
並列効率を約49%から約78%に向上させる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:37:57 GMT)
High-throughput 3D shape completion of potato tubers on a harvester [24.5] 我々は,RGB-D画像から3次元形状を完結できるCoRe++と呼ばれる3次元形状補完ネットワークを開発した。
CoRe++は高速で正確であり、高いスループットのジャガイモ収量推定のために運用用収穫機に実装できる。
本手法は,他の塊茎,果実,野菜にも適用可能であり,多目的,高精度,リアルタイムの収量モニタリングが可能となる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:31:28 GMT)
CadVLM: Bridging Language and Vision in the Generation of Parametric CAD Sketches [24.2] CAD(Parametric Computer-Aided Design)は、現代の機械設計の中心である。
CAD生成のためのエンド・ツー・エンドの視覚言語モデルであるCadVLMを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:22:29 GMT)
Infer Human's Intentions Before Following Natural Language Instructions [24.2] 本研究では,協調作業における自然言語学習の改善を目的とした,ソーシャル・エンボダイド推論によるフォローインストラクション(FISER)を提案する。
我々のフレームワークは、中間的推論ステップとして、人間の目標と意図を明確に推論する。
行動計画を立てる前に、社会的推論を用いて人間の意図を明示的に推測することが、純粋にエンドツーエンドのアプローチを超えることを実証的に実証する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:19:49 GMT)
Unsupervised Cross-Domain Image Retrieval via Prototypical Optimal Transport [24.1] 教師なしクロスドメイン画像検索は、ラベル付きデータに頼ることなく、さまざまな領域で同じカテゴリを共有する画像を検索することを目的としている。
従来のアプローチでは、UCIRの問題をドメイン内表現学習とドメイン間特徴アライメントという2つの異なるタスクに分解していた。
本稿では,UCIR に最適化された新規な Optimal Transport の定式化である ProtoOT を紹介する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:00:00 GMT)
PGN: The RNN's New Successor is Effective for Long-Range Time Series Forecasting [23.4] 本稿では,RNN の新たな後継者として Parallel Gated Network (PGN) という新しいパラダイムを提案する。
PGNは、デザインされた履歴情報抽出層を通じて、以前のタイムステップから情報を直接キャプチャする。
本稿では,時系列予測タスクにおけるPGNの性能向上を図るため,TPGN(Temporal PGN)と呼ばれる新しい時間モデリングフレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:20:25 GMT)
Trustworthy Text-to-Image Diffusion Models: A Timely and Focused Survey [22.9] テキスト・ツー・イメージ(T2I)拡散モデル(DM)は、画像生成における顕著な進歩に対して広く注目を集めている。
彼らの人気が高まったことで、信頼性の重要な非機能的特性に関する倫理的・社会的懸念が高まった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:46:47 GMT)
Prototype based Masked Audio Model for Self-Supervised Learning of Sound Event Detection [22.9] 半教師付きアルゴリズムはラベルのないデータから学ぶためにラベル付きデータに依存する。
SEDにおける自己教師型表現学習のためのプロトタイプベースMasked Audio Model(PMAM)アルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:07:20 GMT)
Neural Implicit Representation for Highly Dynamic LiDAR Mapping and Odometry [22.7] NeRF-LOAMは、NeRFベースのSLAMアプリケーションで顕著な性能を示している。
本稿では,高ダイナミックな屋外シーンの再現性を向上するための新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:58:31 GMT)
Unleashing the Power of Emojis in Texts via Self-supervised Graph Pre-Training [22.5] ソーシャルメディアデータマイニングにおける絵文字のパワーを解放します。
テキストと絵文字の共モデリングのためのグラフ事前学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:02:13 GMT)
Unleashing the Power of Emojis in Texts via Self-supervised Graph Pre-Training [22.5] ソーシャルメディアデータマイニングにおける絵文字のパワーを解放します。
テキストと絵文字の共モデリングのためのグラフ事前学習フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:02:13 GMT)
LLaVA-3D: A Simple yet Effective Pathway to Empowering LMMs with 3D-awareness [22.4] 3次元シーン理解のための3次元認識型LMMの開発は、大規模3次元視覚言語データセットと強力な3次元エンコーダの欠如によって妨げられている。
LLaVA-3Dというシンプルなフレームワークを導入し,LLaVAを3次元シーン理解に効果的に適用する。
LLaVA-3Dは、3Dビジョン言語データセットでトレーニングされた場合、既存の3D LMMよりも3.5倍高速に収束する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:59:11 GMT)
Bridging OOD Detection and Generalization: A Graph-Theoretic View [21.8] OODの一般化と検出の両問題に対処するためのグラフ理論フレームワークを提案する。
グラフ定式化を利用すると、グラフの隣接行列の分解によってデータ表現が得られる。
経験的結果は既存の手法と比較して競争性能を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:35:51 GMT)
Can Large Language Models Faithfully Express Their Intrinsic Uncertainty in Words? [21.8] 大規模言語モデル(LLM)は,自然言語における本質的な不確実性を表現できることが示唆された。
我々は、モデル固有のアサーションに対する信頼のギャップと、それらが伝達される決定性に基づいて、忠実な応答の不確実性を定式化する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:53:01 GMT)
Towards sub-millisecond latency real-time speech enhancement models on hearables [21.5] 低レイテンシモデルは、補聴器や補聴器などのリアルタイム音声強調アプリケーションに不可欠である。
計算効率のよい最小位相FIRフィルタを用いて音声強調を行い、サンプル・バイ・サンプル処理により平均アルゴリズム遅延0.32msから1.25msを実現した。
我々は,388MIPSの低消費電力DSPと3.35msのエンドツーエンドのレイテンシで動作可能であることをベンチマークした。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 19:31:05 GMT)
Pioneering Reliable Assessment in Text-to-Image Knowledge Editing: Leveraging a Fine-Grained Dataset and an Innovative Criterion [21.4] テキスト・トゥ・イメージ(T2I)拡散モデルは、事実知識をパラメータにエンコードする。
知識編集技術は、対象とする方法でモデル知識を更新することを目的としている。
我々は3つのフェーズに網羅してT2I知識編集フレームワークを設計する。
T2I知識編集のためのシンプルだが効果的なアプローチである textbfMPE を導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:07:30 GMT)
Inference-Time Language Model Alignment via Integrated Value Guidance [21.3] 私たちは$textitIntegrated Value Guidance$ (IVG)を導入します。
IVGは暗黙的かつ明示的な値関数を使用して、トークンとチャンクレベルで言語モデルのデコーディングをガイドする。
様々なタスクにまたがるIVGの汎用性を実証する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:15:18 GMT)
Navigating the Shortcut Maze: A Comprehensive Analysis of Shortcut
Learning in Text Classification by Language Models [20.7] この研究は、過度に単純化されたショートカットを超えてモデルの信頼性を損なう微妙で複雑なショートカットの影響を克服する。
ショートカットを発生、スタイル、概念に分類する包括的なベンチマークを導入する。
本研究は,洗練されたショートカットに対するモデルの弾力性と感受性を系統的に検討する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:17:42 GMT)
PhoCoLens: Photorealistic and Consistent Reconstruction in Lensless
Imaging [20.7] レンズレスカメラは、従来のレンズベースのシステムと比較して、サイズ、重量、コストにおいて大きな利点がある。
現在のアルゴリズムは、不正確な前方画像モデルと、高品質な画像の再構成に不十分な事前処理に苦慮している。
我々は、一貫したフォトリアリスティックなレンズレス画像再構成のための新しい2段階のアプローチを導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:07:24 GMT)
A Survey of Spatio-Temporal EEG data Analysis: from Models to Applications [20.5] 本調査は,脳活動の理解と解釈を変革するための新しい手法と技術に焦点を当てる。
我々は、脳信号の堅牢な表現を可能にする自己教師あり学習手法を探求する。
また,グラフニューラルネットワーク(GNN)や基礎モデル,大規模言語モデル(LLM)に基づくアプローチなど,新たな差別的手法についても検討する。
この調査は、これらの最先端技術、その応用、そして彼らが将来の研究および臨床実践に持つ深い影響について、広範囲にわたる概要を提供している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:09:15 GMT)
The Sandbox Environment for Generalizable Agent Research (SEGAR) [19.5] 汎用エージェントリサーチ(SEGAR)のためのサンドボックス環境の構築
SEGARは対話型環境における一般化研究の容易性と説明責任を向上させる。
本稿では、SEGARの概要と、SEGARがこれらの目標にどのように貢献するか、および、SEGARが答えられるいくつかの研究課題を実証する実験を紹介する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:19:46 GMT)
Few-shot Pairwise Rank Prompting: An Effective Non-Parametric Retrieval
Model [19.4] 本稿では,複雑な訓練パイプラインを必要とせず,教師付きモデルに近い性能を達成できる一対数ショットローダを提案する。
また,複雑なトレーニングパイプラインを必要とせず,教師付きモデルに近い性能を実現する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:19:09 GMT)
Enhancing elusive clues in knowledge learning by contrasting attention of language models [19.4] 本稿では,言語モデル事前学習における知識学習の促進手法を提案する。
より大きな言語モデルは、より小さな言語モデルによって見落とされがちな、目立たないが重要な手がかりにより多くの注意を払っていることがわかった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:30:54 GMT)
CNCA: Toward Customizable and Natural Generation of Adversarial Camouflage for Vehicle Detectors [19.3] 既訓練拡散モデルを利用したCNCA(Customizable and Natural Camouflage Attack)を提案する。
本手法は,攻撃性能を維持しつつ,自然かつカスタマイズ可能な対向カモフラージュを生成することができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:41:18 GMT)
Uni-Med: A Unified Medical Generalist Foundation Model For Multi-Task
Learning Via Connector-MoE [19.2] MLLM(Multi-modal large language model)は、様々な視覚的・言語的タスクのための汎用インタフェースとして、印象的な機能を示している。
Uni-Medは、普遍的な視覚的特徴抽出モジュール、CMoE(consor Mixed-of-experts)モジュール、LLMで構成される新しい医療一般モデルである。
私たちの知る限りでは、Uni-Medはコネクタにおけるマルチタスク干渉に対処する最初の取り組みです。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:33:26 GMT)
FlowBench: A Large Scale Benchmark for Flow Simulation over Complex
Geometries [19.2] FlowBenchは10K以上のサンプルを持つニューラルシミュレータ用のデータセットである。
FlowBenchは、複雑な幾何学、結合フロー現象、およびニューラルPDEソルバの性能に関するデータ十分性の間の相互作用を評価することができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:38:48 GMT)
Dataset Distillation-based Hybrid Federated Learning on Non-IID Data [19.0] 本稿では,データセット蒸留を統合して,独立および等分散(IID)データを生成するハイブリッド・フェデレーション学習フレームワークHFLDDを提案する。
クライアントを異種クラスタに分割し、クラスタ内の異なるクライアント間でのデータラベルがバランスが取れないようにします。
このトレーニングプロセスは、従来のIDデータに対するフェデレーション学習に似ているため、モデルトレーニングにおける非IIDデータの影響を効果的に軽減する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:52:41 GMT)
Deep CLAS: Deep Contextual Listen, Attend and Spell [18.7] CLAS(Contextual-LAS)は,まれな単語の自動音声認識の改善に有効であることが示されている。
本研究では,文脈情報をよりよく利用するための深層CLASを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:40:03 GMT)
AnyLogo: Symbiotic Subject-Driven Diffusion System with Gemini Status [18.5] 特筆すべき詳細整合性を備えたゼロショット領域カスタマイズツールである textbfAnyLogo を提示する。
我々は厳密な署名抽出と創造的なコンテンツ生成が有望な互換性があることに気付く。
外部構成の代わりに、デノナイジングモデルのgemini状態は、強化された被写体伝達効率を促進する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:15:15 GMT)
CMamba: Channel Correlation Enhanced State Space Models for Multivariate Time Series Forecasting [18.5] ステートスペースモデルであるMambaは、堅牢なシーケンスと機能ミキシング機能を備えている。
チャネル間の依存関係のキャプチャは、時系列予測のパフォーマンス向上に不可欠である。
時系列予測に適した改良されたマンバ変種を導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:54:15 GMT)
AER-LLM: Ambiguity-aware Emotion Recognition Leveraging Large Language Models [18.5] この研究は、あいまいな感情を認識する上でのLarge Language Models(LLM)の可能性を探究する最初のものである。
我々はゼロショットと少数ショットのプロンプトを設計し、過去の対話を曖昧な感情認識のための文脈情報として組み込んだ。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 23:25:21 GMT)
Arena: A Patch-of-Interest ViT Inference Acceleration System for Edge-Assisted Video Analytics [18.0] 視覚変換器(ViT)を用いたエッジ・ツー・エンドビデオ推論高速化システムを提案する。
その結果、Arenaは平均で1.58(時間)と1.82(時間)の推論速度を向上でき、それぞれ帯域幅の47%と31%しか消費していないことがわかった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:25:22 GMT)
Effective Decision Boundary Learning for Class Incremental Learning [17.7] クラスインクリメンタルラーニング(CIL)におけるリハーサルアプローチは、新しいクラスに過度に適合する決定境界に悩まされる。
これら2つの要因に対処するための,単純かつ効果的なアプローチを提案する。
実験の結果,提案したLはいくつかのCILベンチマークにおいて,最先端の性能を実現していることがわかった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:16:07 GMT)
Fast ODE-based Sampling for Diffusion Models in Around 5 Steps [17.5] 本稿では, 高速サンプリングのための平均方向を直接学習することにより, トランケーション誤差を解消する近似平均方向解法(AMED-r)を提案する。
本手法は,既存の ODE ベースのサンプルを改良するためのプラグインとして容易に利用できる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 23:14:27 GMT)
TabGraphs: A Benchmark and Strong Baselines for Learning on Graphs with Tabular Node Features [17.3] タブラル機械学習はグラフ機械学習の手法の恩恵を受けるかもしれない。
グラフニューラルネットワーク(GNN)は、予測性能が向上することが多い。
単純な機能前処理により、GNNと競合し、さらに性能も向上する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:26:43 GMT)
TabGraphs: A Benchmark and Strong Baselines for Learning on Graphs with Tabular Features [17.3] タブラル機械学習はグラフ機械学習の手法の恩恵を受けるかもしれない。
グラフニューラルネットワーク(GNN)は、予測性能が向上することが多い。
単純な機能前処理により、GNNと競合し、さらに性能も向上する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:26:43 GMT)
Improving Agent Behaviors with RL Fine-tuning for Autonomous Driving [17.3] 我々は,強化学習を用いた行動モデルのクローズドループ微調整によりエージェント動作の信頼性を向上させる。
本手法は,衝突速度などの目標値の改善とともに,全体的な性能の向上を示す。
シミュレーションエージェントが自律走行車プランナーの質を計測する能力を直接評価するための新しいポリシー評価ベンチマークを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 23:40:33 GMT)
Humans or LLMs as the Judge? A Study on Judgement Biases [17.1] 本稿では, LLM および人間審査員に対する誤情報監視バイアス, ジェンダーバイアス, オーソリティバイアス, 美容バイアスを調査するための基礎的アノテーションの参照が不要な新しい枠組みを提案する。
その結果、人間とLLMの裁判官は様々な程度に摂動に弱いこと、そして最先端の裁判官でさえかなりの偏見を持っていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:16:52 GMT)
Is It Good Data for Multilingual Instruction Tuning or Just Bad Multilingual Evaluation for Large Language Models? [17.0] 命令データの性質がモデル出力に影響を及ぼすかどうかは不明である。
翻訳されたテストセットがそのようなニュアンスをキャプチャできるかどうかは疑わしい。
ネイティブまたはジェネレーションベンチマークでは、ネイティブとトランスポートされたインストラクションデータの間に顕著な違いがあることが示されている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:39:44 GMT)
FaithScore: Fine-grained Evaluations of Hallucinations in Large Vision-Language Models [16.9] 本稿では,大規模な視覚言語モデル(LVLM)から生成した自由形式の回答の忠実度を測定するための基準フリーできめ細かな評価指標であるFaithScoreを紹介する。
FaithScoreの評価は、まず検証が必要な記述文を含むサブ文を特定し、次にこれらのサブ文から包括的な原子事実のリストを抽出し、最後に粒度の細かい原子事実と入力画像との整合性検証を行う。
その結果、現在のシステムは、画像に不満足な幻覚コンテンツを生成する傾向にあり、将来の改善の余地が残されていることが明らかとなった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 19:44:31 GMT)
CompGS: Smaller and Faster Gaussian Splatting with Vector Quantization [16.8] 3D Gaussian Splatting (3DGS) は3次元放射場をモデリング・レンダリングするための新しい手法である。
本稿では,3DGSのストレージコストを40倍から50倍に削減し,レンダリング時間を2倍から3倍に削減し,レンダリング画像の品質を低下させる方法を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:45:20 GMT)
A Simple but Strong Baseline for Sounding Video Generation: Effective
Adaptation of Audio and Video Diffusion Models for Joint Generation [16.7] オーディオとビデオのベース拡散モデルを考えると,これらを1つのモデルに追加モジュールに統合し,モデルが共同でオーディオとビデオを生成するように訓練する。
音声とビデオのペア間のアライメントを高めるために,本モデルでは2つの新しいメカニズムを導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 05:39:52 GMT)
From News to Forecast: Integrating Event Analysis in LLM-Based Time Series Forecasting with Reflection [16.5] 本稿では,Large Language Models(LLM)とGenerative Agentsを用いた時系列予測の新たな手法を提案する。
言語をメディアとすることで,様々な社会的事象を予測モデルに適応的に統合し,ニュースコンテンツと時系列のゆらぎを協調させ,豊かな洞察を得る。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:50:22 GMT)
A Comprehensive Framework for Evaluating API-oriented Code Generation in
Large Language Models [15.5] GitHub CopilotやChatGPTのような大規模言語モデル(LLM)は、コード生成の強力なツールとして登場した。
API指向コード生成におけるLLMの機能を評価するために設計されたフレームワークであるAutoAPIEvalを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:57:52 GMT)
AssistantX: An LLM-Powered Proactive Assistant in Collaborative Human-Populated Environment [15.5] AssistantXは、物理的なオフィス環境で自律的に動作するように設計されたプロアクティブアシスタントである。
従来のサービスロボットとは異なり、AssistantXは、高度な推論機能を提供する新しいマルチエージェントアーキテクチャPPDR4Xを利用している。
評価では、アーキテクチャの有効性を強調し、AssistantXが明確な指示に応答し、メモリから積極的に補足情報を検索し、積極的にチームメンバの協力を求め、タスクの完了を確実にすることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:06:56 GMT)
Quantum memory assisted entangled state verification with local measurements [15.4] 本稿では,量子メモリを用いた量子状態検証タスクについて考察する。
検証者は2つのコピーを格納する2つのコピー状態検証を最適化するための正確な解析式を確立する。
本稿では,GHZライクな状態を効率的に検証する手法として,効率的な検証戦略を設計する次元展開手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:21:06 GMT)
OmniColor: A Global Camera Pose Optimization Approach of LiDAR-360Camera Fusion for Colorizing Point Clouds [15.1] 単純で効率的な3D表現としてのカラーポイントクラウドは、様々な分野において多くの利点がある。
本稿では,独立系360度カメラを用いて点雲をカラー化するための,新規で効率的なアルゴリズムであるOmniColorを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:53:33 GMT)
Weak-To-Strong Backdoor Attacks for LLMs with Contrastive Knowledge Distillation [15.1] 対照的な知識蒸留(W2SAttack)に基づく新しいバックドア攻撃アルゴリズムを提案する。
W2SAttackが4つの言語モデルにまたがる分類タスクにおいて優れた性能を示す。
実験の結果,PEFTを標的としたバックドア攻撃では100%に近い成功率を示した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:20:37 GMT)
Optimizing the Induced Correlation in Omnibus Joint Graph Embeddings [15.0] 相関-OMNI問題と平坦相関問題について検討する。
相関-OMNI問題において、埋め込み空間における最適相関を誘導する一般化オムニバス重みの行列を推定するアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 05:22:16 GMT)
An Adversarial Perspective on Machine Unlearning for AI Safety [14.9] この作業は、アンラーニングと従来のトレーニング後の安全性の根本的な違いに挑戦する。
既存のjailbreakメソッドは、これまで未学習に対して効果がないと報告されていたが、慎重に適用した場合に成功できることを実証する。
例えば、アクティベーション空間における10の無関係な例を微調整したり、特定の方向を除去することで、RMUで編集されたモデルに対して最も危険な能力を回復できることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:32:19 GMT)
DRL-STNet: Unsupervised Domain Adaptation for Cross-modality Medical Image Segmentation via Disentangled Representation Learning [14.8] 非教師なし領域適応(UDA)は、医用画像のセグメンテーション、特にクロスモダリティデータシナリオにおいて不可欠である。
本稿では, DRL-STNetについて述べる。
提案フレームワークは,FLAREチャレンジデータセットの腹部臓器セグメント化において,優れた性能を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 23:30:40 GMT)
Towards More Relevant Product Search Ranking Via Large Language Models: An Empirical Study [14.8] 大規模言語モデル(LLM)は、モデルトレーニングにおいてラベルと特徴生成の両方に使用される。
LLM出力に異なるシグモイド変換を導入し,ラベリングにおけるレバレンススコアを分極する。
我々の研究は、LEMをeコマース製品検索ランキングモデルトレーニングに統合するための高度な戦略に光を当てている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:38:05 GMT)
A Comprehensive Framework for Evaluating API-oriented Code Generation in Large Language Models [14.7] GitHub CopilotやChatGPTのような大規模言語モデル(LLM)は、コード生成の強力なツールとして登場した。
API指向コード生成におけるLLMの機能を評価するために設計されたフレームワークであるAutoAPIEvalを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:57:52 GMT)
Contrastive Learning for Knowledge-Based Question Generation in Large Language Models [14.7] 本稿では,知識に基づく質問生成技術について述べる。
コンピュータが、特定のテキストや知識ベースを理解することによって、人間の質問プロセスをシミュレートできるようにすることを目的としている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 22:24:13 GMT)
Contrastive Learning for Knowledge-Based Question Generation in Large Language Models [14.7] 本稿では,知識に基づく質問生成技術について述べる。
コンピュータが、特定のテキストや知識ベースを理解することによって、人間の質問プロセスをシミュレートできるようにすることを目的としている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 22:24:13 GMT)
LingoQA: Video Question Answering for Autonomous Driving [14.6] 本稿では,自律運転における視覚的質問応答のための新しいデータセットとベンチマークであるLingoQAを紹介する。
データセットには28Kのユニークなショートビデオシナリオと419Kアノテーションが含まれている。
私たちのベンチマークでは、視覚言語モデルは、質問の59.6%に対して、人間の96.6%に対して真に反応する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:30:00 GMT)
Unveiling the Role of Pretraining in Direct Speech Translation [14.6] 我々は,事前学習エンコーダを用いたシステムのトレーニング力学,従来のアプローチ,スクラッチからトレーニングしたシステムを比較した。
学習を通して、ランダムモデルがその予測のために音声入力からの情報を組み込むのに苦労していることを観察する。
本稿では,デコーダのクロスアテンションを微妙に変化させ,トレーニングの初期の段階からソース情報を統合することを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:46:46 GMT)
Minimizing Live Experiments in Recommender Systems: User Simulation to Evaluate Preference Elicitation Policies [14.3] 本稿では,ライブ実験の利用を拡大(および削減)するために用いられるシミュレーション手法について述べる。
そこで本研究では,YouTube Musicプラットフォームの新規ユーザを対象とした選好評価アルゴリズムの展開について述べる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 00:08:46 GMT)
Dealing with Controversy: An Emotion and Coping Strategy Corpus Based on Role Playing [14.3] 多くの感情の基本は、自然言語処理において未発見のままである。
私たちは感情を健全な状況に対処するための戦略として扱う。
本稿では,ロールプレイングによって構築されたコーパスとともに,識別に対処するタスクを紹介する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:49:54 GMT)
Efficient Bias Mitigation Without Privileged Information [14.2] 経験的リスク最小化を通じてトレーニングされたディープニューラルネットワークは、グループ間での大きなパフォーマンス格差を示すことが多い。
この問題に対処しようとする既存のバイアス軽減手法は、トレーニングや検証のためにグループラベルに依存していることが多い。
本稿では,支援者モデルのトレーニング履歴全体を活用するフレームワークであるTAB(Targeted Augmentations for Bias Mitigation)を提案する。
また,TABはグループ情報やモデル選択を使わずにグループ性能を向上し,全体の精度を維持しながら既存手法よりも優れていたことを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:56:13 GMT)
Description-based Controllable Text-to-Speech with Cross-Lingual Voice
Control [14.1] 本稿では,言語間制御機能を備えた新しい制御可能なテキスト音声合成手法を提案する。
我々は、ターゲット言語で訓練されたTSモデルと、他の言語で訓練された記述制御モデルを組み合わせて、入力されたテキスト記述をTSモデルの条件付き特徴にマッピングする。
英語と日本語のTTS実験により,本手法が両言語に対して高い自然性と制御性を実現することを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:08:09 GMT)
Revisiting Acoustic Similarity in Emotional Speech and Music via Self-Supervised Representations [14.1] 音声や音楽からの感情認識は、その音響的重なり合いから類似性を共有しており、これらの領域間での知識の伝達に関心が持たれている。
本稿では,感情音声と音楽の音響的類似性を再考し,自己監督学習(SSL)モデルの階層的振る舞いの分析から始める。
最後に、Frechet音声距離を用いた感情音声と音楽の音響的類似性について検討し、音声と音楽のSSLモデルにおける感情バイアスの問題を明らかにする。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:49:09 GMT)
Threats, Attacks, and Defenses in Machine Unlearning: A Survey [14.0] マシン・アンラーニング(MU)は、Safe AIを達成する可能性から、最近かなりの注目を集めている。
この調査は、機械学習における脅威、攻撃、防衛に関する広範な研究のギャップを埋めることを目的としている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:48:26 GMT)
Long or Short or Both? An Exploration on Lookback Time Windows of Behavioral Features in Product Search Ranking [14.0] 顧客の買い物行動機能は、eコマースにおける商品検索ランキングモデルの中核をなす。
長時間・短時間の窓を用いた場合の長所と短所を調べた結果,異なる窓の歴史的挙動を統合化するための新しい手法が提案された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:18:29 GMT)
Multi-Designated Detector Watermarking for Language Models [13.9] 大型言語モデル(LLM)のためのEmphmulti-Designated Detector Watermarking (MDDW)を導入する。
この技術により、モデルプロバイダは、2つの重要な特性を持つLCMから透かし出力を生成することができる: (i) 特定の、おそらく複数の指定された検出器だけが透かしを識別でき、 (ii) 一般ユーザにとって出力品質の劣化は認識できない。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:01:15 GMT)
High-Fidelity 3D Lung CT Synthesis in ARDS Swine Models Using Score-Based 3D Residual Diffusion Models [13.8] 急性呼吸不全症候群(ARDS)は、肺炎症と呼吸不全を特徴とする重症疾患であり、死亡率は約40%である。
胸部X線のような従来の画像撮影法は、肺病理の完全な評価において、その効果を制限し、2次元のビューのみを提供する。
本研究では, スコアベース3D残差拡散モデルを用いて2次元X線画像から高忠実度3D肺CTを合成する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:22:34 GMT)
DMC-VB: A Benchmark for Representation Learning for Control with Visual Distractors [13.7] 行動クローニングやオフライン強化学習(RL)を通じて収集されたデータから学習することは、ジェネラリストエージェントをスケールするための強力なレシピである。
オフラインRLエージェントの堅牢性を評価するため,DeepMind Control Visual Benchmark (DMC-VB) をDeepMind Control Suiteで収集した。
そこで,本研究では,事前学習のための表現学習手法を評価するための3つのベンチマークを提案し,最近提案したいくつかの手法の実験を行った。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 23:07:01 GMT)
Granularity is crucial when applying differential privacy to text: An investigation for neural machine translation [13.7] 差分プライバシー(DP)は、NLPでますます人気が高まっている。
DPが適用される粒度の選択はしばしば無視される。
以上の結果から, 文書レベルのNMTシステムは, メンバーシップ推論攻撃に対する耐性が高いことが示唆された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:48:42 GMT)
Role-RL: Online Long-Context Processing with Role Reinforcement Learning for Distinct LLMs in Their Optimal Roles [13.6] 長いコンテキスト処理を持つ大規模言語モデル(LLM)は、実装の複雑さ、訓練効率、データの分散性のために、依然として難しい。
オンラインLong-Context Processing(OLP)は、無制限のドキュメントを処理する際に提案されるもので、通常は、自動ニュースレポーティング、ライブeコマース、バイラルショートビデオなどの多様なストリーミングメディアの情報受信と組織化に発生する。
また,OLPパイプライン内の各ロールに,実際の性能に応じて異なるLLMを自動デプロイする役割強化学習(Role-RL)を開発した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:22:59 GMT)
AlterMOMA: Fusion Redundancy Pruning for Camera-LiDAR Fusion Models with Alternative Modality Masking [13.3] カメラ-LiDAR融合モデルは自律走行における認識性能を著しく向上させる。
単一モードの事前訓練カメラとLiDARのバックボーンをカメラ-LiDAR融合モデルに直接ロードすることは、モダリティにまたがる同様の機能冗長性をもたらすと我々は主張する。
本稿では,各モードに代替マスキングを適用し,冗長パラメータを識別する,新規なモダリティ・マスキング・プルーニング・フレームワーク(AlterMOMA)を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:57:02 GMT)
Good Data Is All Imitation Learning Needs [13.3] 本稿では,エンド・ツー・エンド自動運転システムのための新しいデータ拡張手法として,CFE(Counterfactual Explanations)を導入する。
CFEは、意思決定境界付近でトレーニングサンプルを生成することによって、専門家のドライバ戦略をより包括的な表現に導く。
CARLAシミュレータによる実験により,CF-Driverは現在の最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:43:12 GMT)
AnoVox: A Benchmark for Multimodal Anomaly Detection in Autonomous Driving [13.0] AnoVoxは、コンテンツと時間的異常の両方を含む最初のベンチマークである。
正規性の形式的定義を提案し,従順なトレーニングデータセットを提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:18:49 GMT)
ReThink: Reveal the Threat of Electromagnetic Interference on Power Inverters [13.0] 電力インバータは、直流(DC)電力を再生可能エネルギー源(RES)からグリッド上の交流(AC)電力に変換する重要な電子装置である。
本稿では、内部センサの観点から太陽光発電インバータの安全性を解析する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:19:38 GMT)
Enhancement of 3D Gaussian Splatting using Raw Mesh for Photorealistic Recreation of Architectures [13.0] 本研究では,3次元ガウスモデルを用いて建物の基本形状を抽出する手法を提案する。
この調査は,建築設計分野における3次元再構築技術の有効性を向上する新たな可能性を開くものである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:07:39 GMT)
IDP-PGFE: An Interpretable Disruption Predictor based on Physics-Guided Feature Extraction [12.6] 本稿では物理誘導特徴抽出(IDP-PGFE)に基づく解釈破壊予測器を設計する。
物理誘導された特徴を抽出することにより、モデルの予測性能を効果的に向上する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:40:31 GMT)
GLinSAT: The General Linear Satisfiability Neural Network Layer By Accelerated Gradient Descent [12.4] ニューラルネットワーク出力のバッチを、有界および一般線形制約を満たすものにする。
これは、すべての操作が微分可能で行列分解自由な、最初の一般線形満足層である。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:12:53 GMT)
On the Impact of Feature Heterophily on Link Prediction with Graph Neural Networks [12.3] ネットワーク内の接続ノードが異なるクラスラベルや異種特徴を持つ傾向は、多くのグラフニューラルネットワーク(GNN)モデルでは難しいと認識されている。
本稿では,リンク予測タスクに着目し,ノード特徴がGNN性能に与える影響を系統的に解析する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:19:48 GMT)
Robotic-CLIP: Fine-tuning CLIP on Action Data for Robotic Applications [12.0] Contrastive Language-Image Pretraining (CLIP) は、視覚と自然言語の理解の両方を必要とするロボット作業で広く使われている。
ロボット認識能力を高めるために,ロボットCLIPを導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:56:35 GMT)
Human Mobility Modeling with Limited Information via Large Language Models [11.9] 本稿では,人間の移動性モデリングフレームワークであるLLM(Large Language Model)を提案する。
提案手法は,詳細な移動統計データへの依存を著しく低減する。
NHTSとSCAG-ABMのデータセットを用いて評価を行った。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:07:32 GMT)
Global-Local Medical SAM Adaptor Based on Full Adaption [11.7] 本報告では,世界規模でSAMを適応可能な完全適応型グローバル医療SAMアダプタ(GMed-SA)を提案する。
グローバル・ローカル・メディカルSAM適応器(GLMed-SA)を提案する。
その結果, GLMed-SAは様々な評価指標において, 最先端のセマンティックセマンティックセグメンテーション法よりも優れていた。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:48:15 GMT)
Fast Sampling Through The Reuse Of Attention Maps In Diffusion Models [11.3] テキストと画像の拡散モデルは、フレキシブルでリアルな画像合成のための前例のない能力を示している。
これらのモデルは、時間を要するサンプリング手順に依存しており、レイテンシの削減を動機付けている。
我々のアプローチは、再訓練、微調整、知識蒸留なしに、直接遅延を減らそうとしている。
我々は,これらの再利用戦略と同等のレイテンシの少数のサンプリング手順を経験的に比較し,再利用が元の高遅延拡散モデルにより生成された画像に近い画像を生成することを発見した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:35:22 GMT)
Quality Matters: Evaluating Synthetic Data for Tool-Using LLMs [11.2] 外部ツール使用のための大規模言語モデル(LLM)のトレーニングは、急速に拡大する分野である。
体系的なデータ品質チェックの欠如は、モデルを適切にトレーニングし、テストするための複雑さを引き起こす。
外部ツールを用いたLCMのトレーニングにおいて,データの信頼性を評価するための2つの手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:54:10 GMT)
Enhancing Lossy Compression Through Cross-Field Information for Scientific Applications [11.0] ロスシー圧縮は、複数のデータフィールドを含む科学データのサイズを減らす最も効果的な方法の1つである。
従来のアプローチでは、ターゲットデータポイントを予測する際に、単一のターゲットフィールドからのローカル情報を使用し、より高い圧縮比を達成する可能性を制限する。
本稿では,CNNを用いた新たなハイブリッド予測モデルを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:06:53 GMT)
Gaussian Deja-vu: Creating Controllable 3D Gaussian Head-Avatars with Enhanced Generalization and Personalization Abilities [10.8] 本稿では,まず頭部アバターの一般化モデルを取得し,その結果をパーソナライズするガウス的D'eja-vuフレームワークを紹介する。
最先端の3Dガウシアンヘッドアバターをフォトリアリスティックな品質で上回り、既存の方法の少なくとも4分の1のトレーニング時間を短縮する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:31:35 GMT)
A Multimodal Single-Branch Embedding Network for Recommendation in
Cold-Start and Missing Modality Scenarios [10.6] 勧告のためのマルチモーダルシングルブランチ埋め込みネットワーク(SiBraR)を利用した,マルチモーダルレコメンデーションのための新しい手法を提案する。
SiBraRは、異なるモダリティ上の同一の単一ブランチ埋め込みネットワークを使用して、インタラクションデータとマルチモーダル側情報をエンコードする。
我々は,SiBraRの勧告がモダリティの欠如のシナリオにおいて正確であることを示し,モデルが異なるモダリティを共有埋め込み空間の同じ領域にマッピング可能であることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:12:23 GMT)
Jumping through Local Minima: Quantization in the Loss Landscape of Vision Transformers [10.4] Evol-Q は完全量子化された ViT-Base のトップ-1 の精度を 10.30%$,$0.78%$,$0.15%$ で$3$-bit,$4$-bit,$8$-bit で改善している。
私たちのコードはhttps://github.com/enyac-group/evol-q.comで公開されています。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:37:58 GMT)
Towards determining the presence of barren plateaus in some chemically inspired variational quantum algorithms [10.4] 量子化学において、変分量子固有解法(VQE)は、短期量子コンピュータにおける分子シミュレーションのための有望なアルゴリズムである。
しかし、ハードウェア効率のよい回路を用いたVQEは、不毛高原問題によるスケーリングの課題に直面している。
これにより、一元結合クラスタ(UCC)法から化学的にインスパイアされた回路がこの問題を回避することができるのかという疑問が提起される。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:02:53 GMT)
Logic-of-Thought: Injecting Logic into Contexts for Full Reasoning in Large Language Models [10.1] 本稿では,入力コンテキストから拡張論理情報を生成するために,命題論理を利用するロジック・オブ・ソート(LoT)プロンプトを提案する。
LoTは5つの論理的推論タスクで顕著なマージンで、様々なプロンプトメソッドのパフォーマンスを向上する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:59:45 GMT)
T3: A Novel Zero-shot Transfer Learning Framework Iteratively Training on an Assistant Task for a Target Task [10.0] 長文要約は大規模言語モデル(LLM)の課題である
本稿では,目標タスクのアシスタントタスクに対して,ベースラインLDMを反復的にトレーニングする,新しいゼロショット転送学習フレームワークT3を提案する。
実際には、T3は、質問応答をアシスタントタスクとして活用して、長文要約タスクにアプローチし、BBCの要約、NarraSum、FairytaleQA、NLQuADデータセットでその効果を検証している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:44:38 GMT)
GSON: A Group-based Social Navigation Framework with Large Multimodal Model [9.9] 移動ロボットが周囲の社会集団を知覚し利用できるようにするためのグループベースのソーシャルナビゲーションフレームワークGSONを提案する。
認識のために、歩行者間の社会的関係をゼロショットで抽出する視覚的プロンプト技術を適用した。
計画には,グローバルパス計画とローカルモーションプランニングの橋渡しとして,社会構造に基づく中間プランナを採用する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:27:15 GMT)
Generating Is Believing: Membership Inference Attacks against Retrieval-Augmented Generation [9.7] Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚や知識の安定化といった問題を緩和する手法である。
既存の研究では、RAGのLCMに関連する潜在的なプライバシーリスクが示されている。
S$2$MIA, underlineMembership underlineInference underlineAttack, which uses the underlineSemantic underlineSimilarity between a given sample and the content generated by the RAG system。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:22:18 GMT)
InterNet: Unsupervised Cross-modal Homography Estimation Based on Interleaved Modality Transfer and Self-supervised Homography Prediction [9.7] InterNetはモダリティ転送と自己教師付きホモグラフィー推定を統合している。
InterNetは、教師なしメソッド間のSOTA(State-of-the-art)のパフォーマンスを達成する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:04:31 GMT)
SPEER: Sentence-Level Planning of Long Clinical Summaries via Embedded Entity Retrieval [9.7] 臨床医は、患者が退院するたびに、長い要約を書かなければならない。
要約が臨床的に有用であるためには、健全な実体を同定し、カバーすることが不可欠である。
我々は、そのタスクでオープンソースLLMを微調整し、不完全で不誠実な要約を生成することを発見した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 19:07:30 GMT)
MMCode: Benchmarking Multimodal Large Language Models for Code Generation with Visually Rich Programming Problems [9.6] MMCodeは、視覚的にリッチなコンテキストでアルゴリズムによる問題解決スキルを評価するための、最初のマルチモーダルコーディングデータセットである。
MMCodeには3,548の質問と6,620の画像が含まれている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:31:48 GMT)
LLM4Brain: Training a Large Language Model for Brain Video Understanding [9.3] 映像刺激によって引き起こされるfMRI信号から視覚的意味情報を再構成するためのLCMに基づく手法を提案する。
我々は、適応器を備えたfMRIエンコーダに微調整技術を用いて、脳の反応を映像刺激に合わせた潜在表現に変換する。
特に,視覚的セマンティック情報と脳反応のアライメントを高めるために,自己教師付きドメイン適応手法を統合する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:57:08 GMT)
A Time Series is Worth Five Experts: Heterogeneous Mixture of Experts for Traffic Flow Prediction [9.3] 本稿では,交通流予測のためのヘテロジニアス・ミックス・オブ・エキスパート(TITAN)モデルを提案する。
2つのパブリックトラフィックネットワークデータセットであるMETR-LAとP-BAYの実験では、TITANが変数中心の依存関係を効果的にキャプチャすることを示した。
従来のSOTAモデルと比較して、約4.37%から11.53%までのすべての評価指標の改善を実現している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 00:26:47 GMT)
Value Identification in Multistakeholder Recommender Systems for Humanities and Historical Research: The Case of the Digital Archive Monasterium.net [9.2] 本稿では、Monasterium.netのレコメンデーションによって影響を受ける可能性のある、複数の利害関係者の初歩的な価値識別を提供する。
筆者らは,編集者,アグリゲータ,プラットフォーム所有者,研究者,出版社,資金調達機関など,利害関係者のさまざまな価値と目的について論じる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:07:46 GMT)
Sample compression unleashed : New generalization bounds for real valued losses [9.2] 実数値損失を抑える新しいサンプル圧縮境界を導出するための一般的な枠組みを提案する。
異なるタイプのモデルで評価することで、境界の厳密さとそれらの汎用性を実証的に実証する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:08:52 GMT)
Information transmission under Markovian noise [9.1] マルコフ力学に基づく開量子系を考える。
ワンショット$epsilon$-error情報送信容量が$Phin$を有限時間持つ場合、上と下の境界が見つかる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:17:42 GMT)
SeCoKD: Aligning Large Language Models for In-Context Learning with Fewer Shots [9.0] 本稿では,学生モデルと非常に刺激的なバリエーションを調和させる自己学習蒸留(KD)トレーニングフレームワークであるSeCoKDを紹介する。
我々は3つの大規模言語モデル(LLM)と6つのベンチマークでSeCoKDを実験した。
その結果,提案手法はベースモデルとSupervised Fine-tuning(SFT)よりも優れていた。
SeCoKDは、新しいタスクで評価する際の否定的な成果物はほとんど提供しないが、Supervised Fine-tuningよりも堅牢である。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:12:59 GMT)
Loop Algorithm for Quantum Transverse Ising Model in a Longitudinal Field [9.0] 本稿では,新しいマージアンマージプロセスを用いたループアルゴリズムを提案する。
これは、Rydberg atom chain と Kagome qubit ice をシミュレートするために実装する際の最先端アルゴリズムに対する大きな利点を示す。
この高度なアルゴリズムは、Rydberg原子配列、閉じ込められたイオン、量子材料、量子アニールなどの多くのシステムに適合する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:36:56 GMT)
Scaling Law for Time Series Forecasting [9.0] 大規模データセット、複雑なモデル、強化されたデータの粒度に報いるスケーリング法則は、ディープラーニングの様々な分野において観察されている。
しかし、時系列予測の研究は、時系列予測のためのディープラーニング手法のスケーリング行動に疑問を投げかけている。
本稿では,このような異常な振る舞いを説明できる時系列予測法則のスケーリング理論を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:11:44 GMT)
Self-Supervised Learning of Deviation in Latent Representation for Co-speech Gesture Video Generation [8.8] 協調音声におけるジェスチャーの表現について,自己教師付き表現と画素レベルの動き偏差に着目して検討する。
提案手法は,手ジェスチャー生成を容易にするために,遅延表現における自己教師付き偏差を利用する。
最初の実験の結果,本手法が生成ビデオの品質を向上させることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:33:20 GMT)
Does Worst-Performing Agent Lead the Pack? Analyzing Agent Dynamics in
Unified Distributed SGD [8.4] 分散学習は、異種エージェント間の機械学習アルゴリズムのトレーニングに不可欠である。
我々は統一分散SGD(UD-SGD)の分析を行う。
我々は、UD-SGDの収束速度に、サンプリング、シャッフル、マルコフサンプリングなどの異なるサンプリング戦略がどう影響するかを評価する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:12:20 GMT)
Functional Classification of Spiking Signal Data Using Artificial
Intelligence Techniques: A Review [8.3] 本稿では、スパイク分類におけるAIの重要性と利用について論じ、ニューラルアクティビティノイズの認識に焦点を当てる。
第一の目的は、将来の研究のためのスパイク分類の視点を提供し、関連する方法論と問題に関する包括的な理解を提供することである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:50:55 GMT)
Causality-based Subject and Task Fingerprints using fMRI Time-series Data [8.3] 本稿では,「因果指紋」の概念を開拓し,定量化する。
実験結果と非因果性に基づく手法との比較により,提案手法の有効性が示された。
我々の研究は、健康管理と神経変性疾患の両方に適用可能な因果指紋のさらなる研究の道を開く。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:10:50 GMT)
TestBench: Evaluating Class-Level Test Case Generation Capability of Large Language Models [8.2] クラスレベルのLLMベースのテストケース生成のためのベンチマークであるTestBenchを紹介する。
GitHub上の9つの実世界の大規模プロジェクトから108のJavaプログラムのデータセットを構築します。
本稿では,構文的正当性,コンパイル的正当性,テスト的正当性,コードカバレッジ率,欠陥検出率という,テストケースの5つの側面を考慮した詳細な評価フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:18:06 GMT)
VITaL Pretraining: Visuo-Tactile Pretraining for Tactile and Non-Tactile Manipulation Policies [8.2] 触覚情報を模倣学習プラットフォームに組み込んで操作タスクのパフォーマンスを向上させる方法について述べる。
触覚前訓練を取り入れることで,触覚エージェントだけでなく,模倣学習性能が向上することを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:47:04 GMT)
Boundless: Generating Photorealistic Synthetic Data for Object Detection in Urban Streetscapes [7.9] 本研究では,高密度都市景観におけるオブジェクト検出のための写真リアルな合成データ生成システムであるBoundlessを紹介する。
Boundlessは、大規模な実世界のデータ収集と手動のグラウンドトルースオブジェクトアノテーション(ラベル付け)を置き換えることができる
本研究では、Boundlessが生成したデータセットに基づいて学習したオブジェクト検出モデルの性能を評価する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:15:26 GMT)
Progressive Quantum Algorithm for Maximum Independent Set with Quantum Alternating Operator Ansatz [7.7] 本稿では,最大独立集合(MIS)問題を解く上で必要となるキュービットを削減するために,プログレッシブ量子アルゴリズム(PQA)を提案する。
シミュレーションの結果、最適近似比0.95を達成するためには、キュービットの5.5565%$(15.4%$)とランタイムの10.695%$(7.23%$)しか必要としないことがわかった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:13:45 GMT)
Human Eyes Inspired Recurrent Neural Networks are More Robust Against Adversarial Noises [7.7] 我々は人間の脳にインスパイアされたデュアルストリーム視覚モデルを設計した。
このモデルは網膜のような入力層を特徴とし、次の焦点(固定点)を決定する2つのストリームと、固定点を取り巻く視覚を解釈する2つのストリームを含む。
このモデルを,物体認識,視線行動,対向強靭性の観点から評価した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:59:44 GMT)
Integrating Hierarchical Semantic into Iterative Generation Model for Entailment Tree Explanation [7.5] 本稿では,HiSCG (Controller-Generator) の枠組みに基づいて文の階層的意味論を統合するアーキテクチャを提案する。
提案手法はEntailmentBankデータセットの3つの設定で同等のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:46:58 GMT)
Optimal Protocols for Continual Learning via Statistical Physics and
Control Theory [7.5] ニューラルネットワークは、複数のタスクを逐次学習する際に、破滅的な忘れに苦しむことが多い。
近年の理論的研究は、学習プロトコル下での合成フレームワークにおける学習曲線の分析によってこの問題に対処している。
このギャップを、統計的物理手法を用いて導出したトレーニング力学の正確な方程式と最適制御法を組み合わせることで埋める。
我々の理論的分析は、破滅的な忘れを緩和するための非自明で解釈可能な戦略を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:01:41 GMT)
VARADE: a Variational-based AutoRegressive model for Anomaly Detection on the Edge [7.5] 本研究は,エッジ上でのリアルタイム実行に最適な変分推論に基づく軽量自己回帰フレームワークを実装した新しいソリューションを提案する。
提案手法は、パイロット生産ラインの一部であるロボットアームで検証され、最先端のアルゴリズムと比較された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:11:28 GMT)
VARADE: a Variational-based AutoRegressive model for Anomaly Detection on the Edge [7.5] 本研究は,エッジ上でのリアルタイム実行に最適な変分推論に基づく軽量自己回帰フレームワークを実装した新しいソリューションを提案する。
提案手法は、パイロット生産ラインの一部であるロボットアームで検証され、最先端のアルゴリズムと比較された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:11:28 GMT)
DREAMS: A python framework to train deep learning models with model card reporting for medical and health applications [7.3] 本稿では,脳波データ処理,モデルトレーニング,レポート生成に適した総合的なディープラーニングフレームワークを提案する。
AI開発者によってさらに適応され、開発されるように構築されているが、モデルカードを通じて、開発者と臨床医の両方が使用する結果と具体的な情報を報告することができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:12:13 GMT)
MathDSL: A Domain-Specific Language for Concise Mathematical Solutions Via Program Synthesis [7.1] 本稿では,数式解析のためのドメイン特化言語であるMathを紹介する。
Mathは、プログラムモデルにデプロイされた場合、最先端の強化学習方法より優れている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:54:19 GMT)
Latent Watermark: Inject and Detect Watermarks in Latent Diffusion Space [7.1] 既存の手法は、画質と透かしの堅牢性のジレンマに直面している。
画像品質の優れた透かしは通常、ぼやけやJPEG圧縮のような攻撃に対して弱い堅牢性を持つ。
本稿では,潜伏拡散空間内の透かしを注入し,検出する潜伏透かしを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:27:58 GMT)
AI-driven View Guidance System in Intra-cardiac Echocardiography Imaging [7.1] 心内心エコー法(ICE)は、電気生理学(EP)と構造心疾患(SHD)の介入において重要な画像モダリティである。
本稿では,人間によるループ内フィードバックを用いたAI駆動クローズドループビュー誘導システムを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:38:14 GMT)
Compositional Hardness of Code in Large Language Models -- A Probabilistic Perspective [6.9] 大規模言語モデル(LLM)における一般的なプラクティスは、モデルのコンテキストウィンドウ内のタスク全体に対するソリューションをサンプリングすることである。
これまでの研究では、モデルのコンテキスト内でのサブタスク分解がそのようなタスクの解決に有用であることが示されている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:34:35 GMT)
On the Implicit Relation Between Low-Rank Adaptation and Differential
Privacy [6.3] 言語モデルの低ランクタスク適応(LoRAやFLoRAなど)が提案されている。
我々は、低ランク適応が微調整データのプライバシーを暗黙的に提供することを示した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:56:49 GMT)
A New Dataset for Monocular Depth Estimation Under Viewpoint Shifts [6.3] 本稿では,異なるカメラ位置と方向が単眼深度推定性能に与える影響を定量化するための新しいデータセットと評価手法を提案する。
ホログラフィー推定と物体検出に基づく地中真理戦略を提案し,高価なライダーセンサの必要性を排除した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:57:05 GMT)
Distributional Latent Variable Models with an Application in Active Cognitive Testing [6.2] 認知モデリングは一般的に、注意力や作業記憶、その他の潜伏変数を推定するために、様々なテストのバッテリーを完了するよう参加者に求めることに依存する。
ほぼユビキタスなアプローチは、各テストに対して個別に多くの観察を繰り返すことであり、結果として各被験者に与えられた各テストの結果にまたがる分布をもたらす。
我々はLVMを、各被験者の観測データが再構成される単純なベクトルではなく、多くの異なる分布からの一連の観測であるような設定に拡張する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:04:03 GMT)
Towards the Mitigation of Confirmation Bias in Semi-supervised Learning: a Debiased Training Perspective [6.2] 半教師付き学習(SSL)は、モデルが特定のクラスを不均等に好むという、一般的に確認バイアスを示す。
SSLのデバイアスドトレーニングのための統合フレームワークであるTaMatchを紹介します。
TaMatchは,様々な課題の画像分類タスクにおいて,既存の最先端手法よりも大幅に優れていることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:50:30 GMT)
The application of GPT-4 in grading design university students' assignment and providing feedback: An exploratory study [5.9] 本研究は、カスタムGPTの開発において反復的な研究アプローチを採用する。
GPTとヒトのラッカー間の信頼関係は、一般に教育者によって受け入れられる水準に達した。
適切な指導により、カスタム GPT は、学生の学習の前提条件である一貫した結果を与える。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:09:10 GMT)
NeuroPath: A Neural Pathway Transformer for Joining the Dots of Human
Connectomes [5.8] 本稿では, FCのユビキタスインスタンスが, SCによって物理的に配線された神経経路(デトゥール)によってどのようにサポートされているかを明らかにするために, トポロジカルデトゥールの概念を導入する。
機械学習のclich'eでは、SC-FCカップリングの基礎となるマルチホップデトゥール経路により、新しいマルチヘッド自己保持機構を考案することができる。
バイオインスパイアされたニューロパス(NeuroPath)と呼ばれる深層モデルを提案し,これまでにない量のニューロイメージから有意な結合性特徴表現を求める。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:40:12 GMT)
Learning Variable Compliance Control From a Few Demonstrations for Bimanual Robot with Haptic Feedback Teleoperation System [5.5] 厳格なロボットを使った、きめ細やかな、接触に富んだ操作は、ロボット工学において重要な課題である。
外部センサを介して力を制御することでこれらの問題を緩和するために、コンプライアンス制御スキームが導入されている。
Demonstrationsからの学習は直感的な代替手段であり、ロボットは観察された動作を通じて操作を学習できる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 05:51:20 GMT)
LGFN: Lightweight Light Field Image Super-Resolution using Local Convolution Modulation and Global Attention Feature Extraction [5.5] 本稿では,LGFN という軽量なモデルを提案する。このモデルでは,異なるビューの局所的特徴とグローバル的特徴と,LF 画像 SR のための異なるチャネルの特徴を統合している。
我々のモデルは0.45Mのパラメータと19.33GのFLOPを持つ。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:53:25 GMT)
Comparing Unidirectional, Bidirectional, and Word2vec Models for
Discovering Vulnerabilities in Compiled Lifted Code [5.4] 本研究は,一方向変圧器を用いた埋め込み,特にGPT-2の適用について検討する。
本研究は,GPT-2モデルからの埋め込みがBERTとRoBERTaの双方向モデルよりも有意に優れていることを明らかにする。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:48:47 GMT)
Scenario of Use Scheme: Threat Model Specification for Speaker Privacy Protection in the Medical Domain [5.4] 本稿では,話者のプライバシを守らなければならない相手を特徴付けるアタッカーモデルと,その防衛を規定するプロテクタモデルとを組み込んだユースケースシナリオ・オブ・ユース・スキームを提案する。
本稿では,特定のシナリオ・オブ・ユース(Senario of Use)の具体例と,パーキンソン検出の実用性を維持しつつ,ジェンダー推論攻撃から話者データを保護するための一連の実験について述べる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:05:36 GMT)
FruitNeRF: A Unified Neural Radiance Field based Fruit Counting Framework [5.4] FruitNeRFは,新鮮果実のカウンティングフレームワークである。
我々は3Dで直接果物の種類を数えるために最先端のビュー合成法を用いる。
実世界のデータセットと合成データセットの両方を用いて,本手法の評価を行った。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:56:50 GMT)
Tenplex: Dynamic Parallelism for Deep Learning using Parallelizable Tensor Collections [5.4] ディープラーニングジョブは、トレーニングやハードウェアメンテナンス中のGPUアロケーションの変更を経験することができる。
現在のDLフレームワークはジョブをGPUのセットに結びつけるため、これらのシナリオのサポートが欠如している。
Scalaiは、実行時にGPU割り当てが更新された後、ジョブが動的に並列性を変更することができるDLシステムのための状態管理ライブラリである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:52:13 GMT)
Flat'n'Fold: A Diverse Multi-Modal Dataset for Garment Perception and Manipulation [5.1] 衣服操作のための新しい大規模データセットであるFlat'n'Foldを紹介する。
1,212人の人間と887人のロボットが、8つのカテゴリーにまたがる44のユニークな衣服を平らにし、折りたたみするデモを行った。
私たちのデータセットは、折り畳まれた状態から折り畳まれた状態まで、操作プロセス全体を一意にキャプチャします。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:10:17 GMT)
Data-Prep-Kit: getting your data ready for LLM application development [5.1] 本稿では,Data Prep Kit (DPK) と呼ばれる,使いやすく,フレキシブルで,スケールフレキシブルなオープンソースデータ作成ツールキットを提案する。
DPKは、ユーザが自分のニーズに合わせてデータ準備をスケールできるように設計され設計されている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:30:28 GMT)
Cross-lingual Human-Preference Alignment for Neural Machine Translation with Direct Quality Optimization [5.0] ニューラルネットワーク翻訳(NMT)へのタスクアライメントの適用は,NMTにおける既存のタスクデータミスマッチに対処することを示す。
人選好のプロキシとして,事前学習された翻訳品質推定モデルを活用するDPOの変種であるダイレクト品質最適化(DQO)を導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:32:12 GMT)
A multi-source data power load forecasting method using attention mechanism-based parallel cnn-gru [5.0] 本稿では,動的データと静的データの両方から重要な情報を抽出する並列構造ネットワークを提案する。
CNNモジュールは静的データから空間特性をキャプチャし、GRUモジュールは動的時系列データの長期的な依存関係をキャプチャする。
マルチソース情報の抽出・統合における並列構造モデルの利点を実証するため, 一連の実験を行った。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:38:54 GMT)
CASPFormer: Trajectory Prediction from BEV Images with Deformable
Attention [4.9] 本研究では,空間化されたBird-Eye-View(BEV)画像からマルチモーダルな動作予測を行うことができるコンテキスト認識シーン予測変換器(CASPFormer)を提案する。
我々のシステムは、BEV画像を生成することができる上流認識モジュールと統合することができる。
我々は、nuScenesデータセット上でモデルを評価し、複数のメトリクスにまたがって最先端に到達していることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:37:22 GMT)
AC4: Algebraic Computation Checker for Circuit Constraints in ZKPs [4.8] 過度に制約された回路や過度に制約された回路はバグを引き起こす可能性がある。
提案手法の実装を表すためにAC4というツールが提案されている。
解決可能な範囲内では、チェック時間も顕著に改善されている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:18:21 GMT)
Advancing Object Detection in Transportation with Multimodal Large Language Models (MLLMs): A Comprehensive Review and Empirical Testing [4.8] 本研究の目的は,多モード大言語モデル (MLLM) と大規模視覚モデル (VLM) の交通システムにおけるオブジェクト検出への応用を総合的に検証し,実証的に評価することである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 20:58:11 GMT)
Study of Subjective and Objective Quality in Super-Resolution Enhanced Broadcast Images on a Novel SR-IQA Dataset [4.8] 超解像技術(SR)は、高解像度のスクリーンに高画質の放送コンテンツをフルスクリーンで表示するために不可欠である。
SR強調放送コンテンツなどの低品質ソースから生成されたSR画像の品質を評価することは困難である。
SR放送画像のための新しいIQAデータセットを2Kと4Kの解像度で導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:07:15 GMT)
Enhancing Structured-Data Retrieval with GraphRAG: Soccer Data Case Study [4.7] Structured-GraphRAGは自然言語クエリにおける構造化データセット間の情報検索を強化するために設計された汎用フレームワークである。
その結果,Structured-GraphRAGはクエリ処理効率を大幅に改善し,応答時間を短縮することがわかった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:53:29 GMT)
Protocols and Trade-Offs of Quantum State Purification [4.7] 本稿では,特定の確率で高い忠実度を達成するために設計された汎用的な状態浄化フレームワークを提案する。
脱分極雑音下での量子状態の場合、我々のフレームワークはバレンコとアルによって提案された浄化プロトコルを複製することができる。
任意の次元を持つ雑音状態の2つのコピーに対するプロトコルの最適性を証明し、より高いコピー数と次元に対してその最適性を確認する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:33:21 GMT)
Drone Stereo Vision for Radiata Pine Branch Detection and Distance Measurement: Integrating SGBM and Segmentation Models [4.7] 本研究では,専用プルーニングツールとステレオビジョンカメラを備えたドローン式プルーニングシステムの開発を提案する。
YOLOやMask R-CNNを含むディープラーニングアルゴリズムは、正確な分岐検出を保証するために使用される。
これらの技術間の相乗効果により、分岐位置の正確な同定が容易になり、効率的で標的とした刈り取りが可能となる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:27:44 GMT)
Privacy-Preserving Redaction of Diagnosis Data through Source Code Analysis [4.7] 我々は、ログのリアクションのためのソースコード解析アプローチについて論じる。
本手法では,機密情報を含むログメッセージを識別するために,対応するログ文をソースコード内に配置する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:41:55 GMT)
Confidence intervals uncovered: Are we ready for real-world medical
imaging AI? [4.6] パフォーマンスレポートは、どの方法が臨床に翻訳されるべきかを決定するための鍵である。
本稿では,この一般的なプラクティスは,性能の変動を無視するので,しばしば誤解を招く単純化である,と論じる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:58:41 GMT)
Safe Time-Varying Optimization based on Gaussian Processes with Spatio-Temporal Kernel [4.6] TVSafeOptは、未知の報酬と安全機能を持つ時間変化最適化問題のアルゴリズムである。
TVSafeOptは、明示的な変更検出を必要とせずに、時間変化のある安全な領域を安全に追跡することができる。
その結果,TVSafeOptは,安全と最適性の両方に関して,合成データ上でSafeOptと良好に比較できることがわかった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:09:19 GMT)
Artificial Data Point Generation in Clustered Latent Space for Small
Medical Datasets [4.5] 本稿では,クラスタ化潜在空間(AGCL)における人工データポイント生成手法を提案する。
AGCLは、合成データ生成により、小さな医療データセットの分類性能を向上させるように設計されている。
顔の表情データを利用してパーキンソン病検診に応用した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:51:08 GMT)
Defining a universal sign to strictly probe a phase transition [4.5] 最近の研究は、サインが位相遷移を探索するのに使えることを指摘して、サイン問題において顕著なブレークスルーをもたらした。
我々は、位相遷移を厳密に探索できる参照系の影響を排除した修正符号を定義する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:12:12 GMT)
Multi-View and Multi-Scale Alignment for Contrastive Language-Image
Pre-training in Mammography [4.5] 対照的な言語-画像事前学習は、医療画像解析において有望であるが、かなりのデータと計算資源を必要とする。
本稿では,マンモグラフィに完全CLIPモデルを適用することを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:56:59 GMT)
Enhancing Post-Hoc Attributions in Long Document Comprehension via Coarse Grained Answer Decomposition [4.4] ポストホック属性システムは、回答テキストをソース文書にマッピングするように設計されているが、このマッピングの粒度は未解決である。
そこで本研究では,テンプレートを用いたテキスト内学習を用いて,帰属に対する回答の事実分解に関する新しい手法を提案し,検討する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 20:40:15 GMT)
Conjugate Bayesian Two-step Change Point Detection for Hawkes Process [4.3] 本稿では,ホークス過程に対する共役ベイズ変換点検出法を提案する。
合成データと実データの両方で実験を行い,本手法の有効性と効率性を示した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:16:38 GMT)
Reducing and Exploiting Data Augmentation Noise through Meta Reweighting
Contrastive Learning for Text Classification [4.0] 本稿では,テキスト分類タスクにおける拡張データ/サンプルを用いたディープラーニングモデルの性能向上のための新しいフレームワークを提案する。
本稿では,拡張サンプルの重み/品質情報を効果的に活用するための,新しい重み依存型列列とデキューアルゴリズムを提案する。
本フレームワークでは,テキストCNNエンコーダの平均1.6%,テキストCNNエンコーダの平均4.3%,RoBERTaベースエンコーダの平均1.4%,絶対改善の4.4%を実現している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:19:13 GMT)
Efficient Arbitrary Precision Acceleration for Large Language Models on
GPU Tensor Cores [4.0] 大規模言語モデル(LLM)は広く応用されているが、効率的な推論では課題に直面している。
本稿では、並列計算を容易にし、対称量子化をサポートする新しいバイポーラ-INTデータフォーマットを提案する。
ビットレベルで分解・復元する任意の精度行列乗算方式を実装し,フレキシブルな精度を実現する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:17:58 GMT)
Digital simulation of zero-temperature spontaneous symmetry breaking in a superconducting lattice processor [4.0] 超伝導格子における反強磁性(AFM)と強磁性(FM)相の生成に関する実験シミュレーションを報告する。
SSB誘起相転移のシグネチャの出現を相関関数で観測する。
我々の結果は、凝縮物質物理学の新しい進歩への展望を開いている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:15:18 GMT)
Atom graph, partial Boolean algebra and quantum contextuality [3.9] 量子系は原子グラフによって一意に決定されることを示す。
また、グラフに基づいたKochen-Specker定理の一般かつパラメトリックな記述も提示する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:57:04 GMT)
Enhancing Productivity with AI During the Development of an ISMS: Case Kempower [3.9] 本稿では、フィンランドの企業であるKempowerが、ISMSの作成と実装に生成AIを効果的に利用した方法について論じる。
本研究は、生成AIの使用が、IMSの作成プロセスを強化する方法について研究する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 20:37:31 GMT)
Geospatial Road Cycling Race Results Data Set [3.8] サイクリング分析の分野は、オープンなデータソースへのアクセスが限られているため、最近発展し始めたばかりである。
我々は,2017-2023年のプロレース結果数千点と,コースに関する詳細な地理情報とを関連づけたデータセットの公開を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:35:14 GMT)
Equivariant Machine Learning Decoder for 3D Toric Codes [3.8] 量子コンピューティングでは、エラーが高速で無効な結果を伝播し、従来のシステムに比べて理論的な指数的な速度が時間的に増加する。
量子システムにおける誤りを訂正するために、誤り訂正符号が用いられる。現在、トポロジ的符号である符号のサブグループが多くの研究論文の焦点となっている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:54:53 GMT)
EM-Net: Efficient Channel and Frequency Learning with Mamba for 3D Medical Image Segmentation [3.7] 我々は,EM-Netと呼ばれる新しい3次元医用画像セグメンテーションモデルを紹介し,その成功に触発されて,新しいマンバベースの3次元医用画像セグメンテーションモデルであるEM-Netを紹介した。
提案手法は,SOTAモデルのパラメータサイズをほぼ半分にし,訓練速度を2倍に向上させながら,より高精度なセグメンテーション精度を示すことを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:34:33 GMT)
Leveraging Annotator Disagreement for Text Classification [3.7] テキスト分類では、データセットが複数のアノテータによってアノテートされた場合でも、モデルトレーニングに1つのマジョリティラベルのみを使用するのが一般的である。
本稿では,アノテータの不一致を利用してテキスト分類を行う3つの手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:46:53 GMT)
Visualization of Age Distributions as Elements of Medical Data-Stories [3.6] 本研究では, 疾患の年齢分布を示す最も効果的な方法について, 物語的可視化による検討を行った。
我々は、理解、美学、エンゲージメント、記憶可能性に焦点をあてた設計選択を特定した。
伝統的なバーチャートはエンゲージメントに好まれ、他の変種は記憶に残るものとなった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:00:00 GMT)
Evaluation of Large Language Models for Summarization Tasks in the Medical Domain: A Narrative Review [3.6] 大規模言語モデルは、高度な臨床自然言語生成を持ち、医療用テキストの量を管理する機会を生み出している。
臨床要約タスクの現在の評価状況を評価し,専門家による評価の資源制約に対処するための今後の方向性を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:58:26 GMT)
Direct Learning of Mesh and Appearance via 3D Gaussian Splatting [3.5] 本稿では、3DGSを明示的な幾何学的表現、すなわちメッシュに組み込んだ学習可能なシーンモデルを提案する。
我々のモデルはメッシュと外観をエンドツーエンドで学習し、メッシュ面に3Dガウスアンを結合し、3DGSの微分レンダリングを行い、測光監督を得る。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:21:27 GMT)
dlordinal: a Python package for deep ordinal classification [3.4] dlordinalは、最近の多くのディープ順序分類方法論を統合する新しいPythonライブラリである。
日常的な分類問題に対して、最先端のディープラーニング技術を実装している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:07:06 GMT)
Role of coherence in many-body Quantum Reservoir Computing [3.4] 量子コヒーレンスや相関などの異なる量子効果が時間的タスクの性能向上にどのように寄与するかを示す。
我々は, 有限計測資源と騒音が, 異なる状態における貯水池の力学に与える影響を批判的に評価する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:06:08 GMT)
Deep-ER: Deep Learning ECCENTRIC Reconstruction for fast high-resolution neurometabolic imaging [3.4] 変化した神経代謝は、多くの神経疾患や脳がんにおいて重要な病理機構である。
ディープラーニングECCENTRIC再構成は、従来の方法よりも600倍高速な再構築を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:20:51 GMT)
Deep Generative Model for Mechanical System Configuration Design [3.2] 本稿では,設計問題に対するコンポーネントとインターフェースの最適な組み合わせを予測するための,深い生成モデルを提案する。
次に、GearFormerというデータセットを使ってTransformerをトレーニングします。
GearFormerは、特定の設計要件を満たすという点で、独自の検索方法よりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 00:44:54 GMT)
Estimating The Carbon Footprint Of Digital Agriculture Deployment: A Parametric Bottom-Up Modelling Approach [3.1] 本稿では,デジタル農業シナリオの炭素フットプリントを推定するためのボトムアップ手法を提案する。
本研究は,農業におけるデジタル技術の1次効果のさらなる探求の必要性を明らかにするものである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:09:36 GMT)
MALPOLON: A Framework for Deep Species Distribution Modeling [3.1] MALPOLONは深部種分布モデル(deep-SDM)の訓練と推測を容易にすることを目的としている
Pythonで書かれ、PyTorchライブラリ上に構築されている。
このフレームワークはGitHubとPyPiでオープンソース化されている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:45:10 GMT)
AMARO: All Heavy-Atom Transferable Neural Network Potentials of Protein
Thermodynamics [3.1] 全原子分子シミュレーションはマクロ分子現象に関する詳細な知見を提供するが、その計算コストは複雑な生物学的過程の探索を妨げる。
我々は,O(3)等価なメッセージパッシングネットワークアーキテクチャと,水素原子を排除した粗粒度マップを組み合わせた,新しいニューラルネットワークポテンシャル(NNP)であるAMARO(Advanced Machine-learning Atomic Omni-force Representation-field)を紹介する。
AMAROは、エネルギー用語を使わずに、拡張性と一般化機能を備えた安定なタンパク質力学を実行するための訓練粗大化NNPの実現可能性を実証している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:58:06 GMT)
HER2 and FISH Status Prediction in Breast Biopsy H&E-Stained Images Using Deep Learning [3.1] ヘマトキシリンとエオシン(H&E)の腫瘍染色はより広く利用可能である。
H&EによるHER2状態の正確な予測は、コスト削減と治療選択の迅速化を可能にする。
H&Eのためのディープラーニングアルゴリズムは、様々ながんの特徴と臨床結果を予測するのに有効である。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:07:16 GMT)
Local Patterns Generalize Better for Novel Anomalies [3.1] ビデオ異常検出(VAD)は、トレーニング中に目に見えない新しい行動や出来事を特定することを目的としている。
既存のVAD技術はイベントのグローバルなパターンに重点を置いており、新しいサンプルに適切に一般化することはできない。
本稿では,新しいサンプルを一般化する空間的局所パターンを同定し,局所パターンのダイナミクスをモデル化する枠組みを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:38:52 GMT)
On Translating Technical Terminology: A Translation Workflow for
Machine-Translated Acronyms [3.1] 技術的な用語、特に頭字語を翻訳する、重要なステップが見逃されていることが分かりました。
Google Translateのような最先端の機械翻訳システムは、頭字語を扱う際に誤用されることがある。
SL-TL (FR-EN) 翻訳ワークフローに追加のステップを提案し、まず、公共消費のための新しい頭字語コーパスを提供し、次に検索ベースのしきい値付けアルゴリズムを実験する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:18:34 GMT)
UNICORN: A Deep Learning Model for Integrating Multi-Stain Data in Histopathology [2.9] UNICORNは動脈硬化の重症度予測のための多段階組織学を処理できるマルチモーダルトランスフォーマーである。
このアーキテクチャは、2段階のエンドツーエンドのトレーニング可能なモデルと、トランスフォーマーの自己保持ブロックを利用する特殊なモジュールから構成される。
UNICORNは0.67の分類精度を達成し、他の最先端モデルを上回った。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:13:52 GMT)
Infering Alt-text For UI Icons With Large Language Models During App Development [2.9] そこで我々は,Large Language Models (LLMs) を用いて,部分的なUIデータを持つモバイルUIアイコンに対する情報的アルトテキストを自律的に生成する手法を提案する。
経験的評価とユーザスタディでは、IconDescは関連するalt-textの生成において大幅な改善を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:01:33 GMT)
Heterogeneous Hyper-Graph Neural Networks for Context-aware Human Activity Recognition [2.8] 我々は,実世界の現実的なデータにおけるコンテキスト認識活動の訪問パターンを,汎用的なグラフ表現学習タスクとみなすことができると論じている。
本稿では,コンテキスト認識型ヒューマンアクティビティ認識のための新しいヘテロジニアスハイパーグラフニューラルネットワークアーキテクチャを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:44:37 GMT)
Self-supervised Pretraining for Cardiovascular Magnetic Resonance Cine
Segmentation [2.7] 自己教師付き事前トレーニング(SSP)は、大規模なラベルなしデータセットから学習する上で有望な結果を示している。
SSPはラベル付きトレーニングデータが不足している場合にCMRシネセグメンテーションに有用であるが、十分なラベル付きデータが利用可能である場合には最先端のディープラーニング手法を助長しない。
本研究では,ラベル付きトレーニングデータが少ない場合,SSPはCMRシネセグメンテーションに有用であるが,十分なラベル付きデータが存在する場合,最先端のディープラーニング手法には役に立たないことを示した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:44:29 GMT)
Scene Understanding in Pick-and-Place Tasks: Analyzing Transformations Between Initial and Final Scenes [2.6] この研究は、シーンからの初期画像と最終画像が与えられたタスクを検知し、配置するためのシーン理解に焦点を当てている。
オブジェクト検出のためのデータセットが収集され、タスク検出が選択および配置される。
その後、YOLOv5ネットワークがトレーニングされ、最初のシーンと最後のシーンのオブジェクトを検出する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:43:09 GMT)
AI-Powered Augmented Reality for Satellite Assembly, Integration and Test [2.5] 本稿では,欧州宇宙機関のESAプロジェクト「AI for AR in Satellite AIT」の技術的記述について述べる。
このプロジェクトは、リアルタイムコンピュータビジョンとARシステムを組み合わせて、衛星組み立て中の技術者を支援する。
すべてのAIモデルは70%以上の精度を示し、検出モデルは95%を超える精度で、高いレベルのパフォーマンスと信頼性を示している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:44:52 GMT)
Modeling and Analyzing the Influence of Non-Item Pages on Sequential Next-Item Prediction [2.5] シーケンシャルレコメンデーションモデルに非イテムページを組み込む方法を示す。
我々は、一般的なシーケンシャルレコメンデータモデルを適用して、非itemページを統合する。
その結果,非イテムページは貴重な情報源であることがわかった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:22:34 GMT)
Predicting Anchored Text from Translation Memories for Machine
Translation Using Deep Learning Methods [2.4] 本稿では、CBOW(Continuous bag-of-words)パラダイムに従うアンカードワードに対して、Word2Vec、BERT、GPT-4を使用できることを示す。
一部のケースでは、フランス語から英語へのアンカー付き単語の翻訳において、ニューラルマシン翻訳よりも良い結果が得られる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:12:59 GMT)
TypeFly: Flying Drones with Large Language Model [2.3] 移動ロボットを含むリアルタイムおよびインタラクティブなアプリケーションでは、シーケンシャルトークン生成プロセスにはかなりのレイテンシが伴う。
本稿では,MiniSpecという新しいプログラミング言語と,その実行環境を組み合わせたChatFlyを提案する。
すなわち、LLMに人気のあるPythonでプログラム(ロボティックプラン)を書く代わりに、ChatFlyはトークン効率とストリーム解釈のために特別に設計されたMiniSpecでプログラムを実行できる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:45:13 GMT)
MoJE: Mixture of Jailbreak Experts, Naive Tabular Classifiers as Guard
for Prompt Attacks [2.3] 本稿では,大規模言語モデル(LLM)における脱獄予防の重要性を論じる。
我々は,既存の最先端ガードレールの限界を超えるよう設計された,新しいガードレールアーキテクチャであるMoJEを紹介する。
MoJEは、モデル推論中に最小限の計算オーバーヘッドを維持しながら、ジェイルブレイク攻撃の検出に優れる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:12:19 GMT)
LuSNAR:A Lunar Segmentation, Navigation and Reconstruction Dataset based on Muti-sensor for Autonomous Exploration [2.3] 環境認識とナビゲーションアルゴリズムが月探査の基盤となっている。
既存の月のデータセットのほとんどは、単一のタスクをターゲットにしています。
本稿では,マルチタスク,マルチシーン,マルチラベルのベンチマークデータセットLuSNARを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:11:38 GMT)
Control Industrial Automation System with Large Language Models [2.2] 本稿では,大規模言語モデルと産業自動化システムを統合するためのフレームワークを提案する。
フレームワークの中核には、産業タスク用に設計されたエージェントシステム、構造化プロンプト方法、イベント駆動情報モデリング機構がある。
コントリビューションには、フォーマルなシステム設計、概念実証実装、タスク固有のデータセットを生成する方法が含まれる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:19:37 GMT)
Trainability and Expressivity of Hamming-Weight Preserving Quantum Circuits for Machine Learning [2.2] 可変量子回路(VQC)のトレーニング性と制御性の解析
まず、新しいデータローダの実現可能性を示し、$binomnk$-dimensionalベクトルの量子振幅符号化を行う。
最後に、ハミング重み保存回路のトレーニング可能性を分析し、サブ空間の$binomnk$の分散がサブ空間の$binomnk$に応じて有界であることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:14:42 GMT)
Harnessing and modulating chaos to sample from neural generative models [2.0] 我々は、脳が生成モデルから学習し、サンプルすることを可能にする上で、神経カオスがどのように機能的な役割を果たすかを示す。
我々は、古典的なニューラルカオスモデルと標準生成モデリングアーキテクチャ、あるいはニューラルメモリのエネルギーベースモデルを組み合わせたアーキテクチャを構築する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 22:52:26 GMT)
An angle rounding parameter initialization technique for ma-QAOA [2.0] マルチ角量子近似最適化アルゴリズム(ma-QAOA)は、量子近似最適化アルゴリズム(QAOA)と少なくとも同じ近似比を与えるアルゴリズムである。
ma-QAOAの欠点の1つは、QAOAよりもかなり古典的なパラメータを使用するため、古典的な最適化成分はより複雑である。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 23:02:29 GMT)
A Framework for Standardizing Similarity Measures in a Rapidly Evolving Field [2.0] 類似度測定は、人工システムと生物学的システムのアライメントを定量化する基本的なツールである。
類似度尺度の多様性と命名・実施規則の多様性は、研究全体を比較するのを困難にしている。
本稿では,類似度対策を独自かつ効率的に特定することを目的とした命名規則の開発,検証,精錬のための枠組みを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 23:14:01 GMT)
Jump Diffusion-Informed Neural Networks with Transfer Learning for Accurate American Option Pricing under Data Scarcity [2.0] 本研究は,6つの相互関連モジュールからなる米国オプション価格の包括的枠組みを提案する。
このフレームワークは非線形最適化アルゴリズム、解析モデルと数値モデル、ニューラルネットワークを組み合わせて価格性能を向上させる。
提案したモデルでは、より深い収益源オプションの価格設定において優れた性能を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:50:12 GMT)
Decision Support System to triage of liver trauma [2.0] 肝の出血・裂傷をCTで検出する新しい方法を提案する。
本手法の有効性はDiceスコアで定量化され,肝出血97%,肝裂傷検出93%の精度が得られた。
この研究は、GAN Pix2Pixのような高度な画像翻訳モデルが、クリティカルケアシナリオにおける医療診断の精度とスピードを改善する可能性を強調している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 22:28:17 GMT)
Extracting Affect Aggregates from Longitudinal Social Media Data with Temporal Adapters for Large Language Models [1.9] 本稿では,ソーシャルメディアデータの経時的分析ツールとして,時整列大言語モデル(LLM)を提案する。
我々は、Llama 3 8BのテンポラルアダプタをイギリスのTwitterユーザーのパネルから全タイムラインで微調整し、確立したアンケートで感情と態度の縦断的な集計を抽出する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:02:00 GMT)
Quantum entanglement in phase space [1.9] We study entanglement detection from Measurement of the Wigner function。
我々は、様々な実験的なガウス状態と非ガウス状態に対して厳密であることを示す補完的基準を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:40:36 GMT)
DualAD: Dual-Layer Planning for Reasoning in Autonomous Driving [1.8] 運転中の人間の推論を模倣する新しい自動運転フレームワークであるDualADを提案する。
DualADは、ルールベースのモーションプランナとルールベースのテキストエンコーダを備えた上位レイヤの2つのレイヤで構成されている。
上層は潜在的な危険が検出されたときに下層の決定に介入し、臨界時の人間の推論を模倣する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:58:04 GMT)
CBIDR: A novel method for information retrieval combining image and data by means of TOPSIS applied to medical diagnosis [1.8] そこで我々は,患者の医療画像と臨床データの両方を活用するCBIDRという新しい手法を提案し,それらをランキングアルゴリズムToPSISを用いて組み合わせた。
精度の面での実験結果は、Top-1で97.44%、Top-5で100%達成し、提案手法の有効性を示した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:04:36 GMT)
A Survey on Offensive AI Within Cybersecurity [1.8] 攻撃的AIに関する調査論文は、AIシステムに対する攻撃および使用に関する様々な側面を包括的にカバーする。
消費者、企業、公共のデジタルインフラストラクチャなど、さまざまな分野における攻撃的なAIプラクティスの影響を掘り下げる。
この論文では、敵対的な機械学習、AIモデルに対する攻撃、インフラストラクチャ、インターフェース、および情報収集、ソーシャルエンジニアリング、兵器化されたAIといった攻撃的テクニックについて検討する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:36:22 GMT)
Intervention strategies for misinformation sharing on social media: A bibliometric analysis [1.8] 不正確な共有情報は混乱を引き起こし、精神的健康に悪影響を及ぼし、誤報による意思決定につながる。
本研究では,ソーシャルメディア上での誤情報共有に対処するための介入戦略の類型について検討する。
認識ベース、自動化ベース、情報ベース、ハイブリッドベースの4つの重要なクラスタを特定します。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:38:15 GMT)
Showing Many Labels in Multi-label Classification Models: An Empirical Study of Adversarial Examples [1.8] 我々は、"Showing Many Labels"と呼ばれる新しいタイプの攻撃を導入する。
Showing Many Labels" では、反復攻撃はワンステップ攻撃よりもはるかに優れている。
データセット内のすべてのラベルを表示することができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:31:31 GMT)
What happens to diffusion model likelihood when your model is conditional? [1.6] 拡散モデル(DM)は、ランダムサンプルを反復的に識別して高品質なデータを生成する。
DMは非条件DMのランク付けやドメイン外の分類に使われてきた。
条件付きタスクにDMを適用すると、不整合が明らかになり、DMの特性が不明であるという主張が強まる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:33:46 GMT)
Federated Learning under Attack: Improving Gradient Inversion for Batch of Images [1.6] フェデレートラーニング(FL)は、ユーザのデータのプライバシを保存する機械学習アプローチとして登場した。
フィードバックブレンディング(DLG-FB)を用いたグラディエンスからのディープリークは、逆勾配攻撃を改善することができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:02:36 GMT)
Developing a Dual-Stage Vision Transformer Model for Lung Disease Classification [1.5] 肺疾患は全米で流行し、3400万人以上の人に影響を与えている。
さまざまな種類の肺疾患の正確な診断とタイムリーな診断が重要であり、人工知能(AI)の手法はこれらのプロセスを高速化する可能性がある。
この研究を通じて、視覚変換器(ViT)とスイニング変換器(Swin Transformer)を統合して、X線スキャンで14種類の肺疾患を分類する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 19:59:36 GMT)
Model-Free versus Model-Based Reinforcement Learning for Fixed-Wing UAV
Attitude Control Under Varying Wind Conditions [1.5] 本稿では、PIDを基準点として、固定翼無人航空機の姿勢制御のためのモデルフリーおよびモデルベース強化学習の性能を評価し、比較する。
その結果, 時間差モデル予測制御は, PIDコントローラと他のモデルレス強化学習法の両方で, 精度と頑健さの点で優れていた。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:47:14 GMT)
Open Digital Rights Enforcement Framework (ODRE): from descriptive to enforceable policies [1.4] 本稿では,ODRLに執行能力を提供することを目標とする,オープンデジタル著作権執行(ODRE)フレームワークを紹介する。
このフレームワークには,ODRLポリシの実施アルゴリズムと,PythonとJavaの2つのオープンソース実装が含まれている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:36:49 GMT)
EfficientCrackNet: A Lightweight Model for Crack Segmentation [1.4] き裂検出は、建物、舗装、橋の構造的整合性を維持するために不可欠である。
既存の軽量な手法は、計算の非効率性、複雑な亀裂パターン、難易度などの課題に直面していることが多い。
本稿では,CNN(Convolutional Neural Networks)とトランスフォーマーを組み合わせた軽量ハイブリッドモデルであるEfficientCrackNetを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:44:20 GMT)
Multilingual Evaluation of Long Context Retrieval and Reasoning [1.3] 大きな言語モデル(LLM)は、長いコンテキストを扱うのに素晴らしい能力を示している。
5言語にわたる検索と推論のタスクに対して,長いコンテキストのLLMを評価した。
最高のパフォーマンスモデルは英語で約96%の精度を達成し、ソマリでは約36%の精度を目標文で達成している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:15:14 GMT)
Toward Interactive Optimization of Source Code Differences: An Empirical Study of Its Performance [1.3] ソースコードの違い(差分)を最適化するためのインタラクティブなアプローチを提案する。
ユーザは、マッチすべきではなく、マッチすべきでない部分や、マッチすべきでない部分に対するフィードバックを提供することができる。
GitHubの23のプロジェクトの結果は、最適でない差分のうち92%が、理想的なケースでは4つ未満のフィードバックアクションで対処可能であることを確認している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:13:53 GMT)
Toward Interactive Optimization of Source Code Differences: An Empirical Study of Its Performance [1.3] ソースコードの違い(差分)を最適化するためのインタラクティブなアプローチを提案する。
ユーザは、マッチすべきではなく、マッチすべきでない部分や、マッチすべきでない部分に対するフィードバックを提供することができる。
GitHubの23のプロジェクトの結果は、最適でない差分のうち92%が、理想的なケースでは4つ未満のフィードバックアクションで対処可能であることを確認している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:13:53 GMT)
Investigating OCR-Sensitive Neurons to Improve Entity Recognition in Historical Documents [1.3] OCR感受性ニューロンは、歴史的文書におけるエンティティ認識に影響を及ぼす。
クリーンでノイズの多いテキスト入力に応答してニューロンの活性化パターンを解析することにより、OCR感受性ニューロンを同定し、中和し、モデル性能を向上させる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:22:37 GMT)
Masks and Boxes: Combining the Best of Both Worlds for Multi-Object Tracking [1.2] マルチオブジェクト追跡(MOT)は、ビデオシーケンスをまたいだオブジェクトの特定と一貫した追跡を含む。
従来のトラッキング・バイ・検出手法は、広範囲なチューニングと一般化性の欠如を必要とする。
我々は,時間的に伝播するセグメンテーションマスクを強相関キューとして組み込んだ新しいアプローチ,McByteを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:13:43 GMT)
Masks and Boxes: Combining the Best of Both Worlds for Multi-Object Tracking [1.2] マルチオブジェクト追跡(MOT)は、ビデオシーケンスをまたいだオブジェクトの特定と一貫した追跡を含む。
従来のトラッキング・バイ・検出手法は、広範囲なチューニングと一般化性の欠如を必要とする。
我々は,時間的に伝播するセグメンテーションマスクを強相関キューとして組み込んだ新しいアプローチ,McByteを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:13:43 GMT)
HVT: A Comprehensive Vision Framework for Learning in Non-Euclidean Space [1.2] 本稿では、双曲幾何学を統合した視覚変換器(ViT)の新たな拡張である、双曲型視覚変換器(HVT)を紹介する。
従来のViTはユークリッド空間で作用するが、この手法は双曲的距離とM"オビウス変換を活用することにより自己認識機構を強化する。
厳密な数学的定式化を行い、双曲幾何学を注意層、フィードフォワードネットワーク、最適化に組み込む方法を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:39:02 GMT)
Can the quantum switch be deterministically simulated? [1.2] 入力チャネルに1つの余分な呼び出ししかできない場合、量子スイッチは任意の量子回路でシミュレートできないことを示す。
この結果は、量子スイッチがユニタリチャネルにのみ作用すると、その作用をシミュレートできるという既知の事実とは対照的である。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:34:14 GMT)
Transferring disentangled representations: bridging the gap between synthetic and real images [1.1] 実データに適用可能な汎用的不整合表現を学習するために,合成データを活用する可能性を検討する。
本稿では,表現中の因子の質を測定するために,新しい解釈可能な介入基準を提案する。
以上の結果から, 合成データから実データへの表現の変換が可能であること, 有効であることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:25:48 GMT)
Let the Quantum Creep In: Designing Quantum Neural Network Models by
Gradually Swapping Out Classical Components [1.0] 現代のAIシステムはニューラルネットワーク上に構築されることが多い。
古典的ニューラルネットワーク層を量子層に置き換える枠組みを提案する。
画像分類データセットの数値実験を行い、量子部品の体系的導入による性能変化を実証する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:01:29 GMT)
Human participants in AI research: Ethics and transparency in practice [1.0] 人工知能(AI)と機械学習(ML)の進歩には、人間の参加者を巻き込んだ研究が欠かせない。
しかし、AIと参加型研究者は、AIとMLの人間の参加者による倫理研究のガイドラインを欠いている。
本稿は,これらの課題に対処し,技術研究者を実践的な知識で位置づけることを目的とする。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:38:48 GMT)
When A Man Says He Is Pregnant: ERP Evidence for A Rational Account of Speaker-contextualized Language Comprehension [1.0] 事象関連電位(ERP)研究は、そのような話者ミスマッチした発話に対する神経生理学的反応について混合の結果を示した。
これらの異なるERP効果は、話者とメッセージのミスマッチを解決するために使用される認知過程を反映していることを示す。
本研究は,文献における経験的不整合の解明に役立ち,話者文脈言語理解の合理的な説明を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:24:52 GMT)
Development of an Edge Resilient ML Ensemble to Tolerate ICS Adversarial Attacks [0.9] 敵の攻撃に耐えられるように設計された、レジリエントなエッジ機械学習アーキテクチャを構築します。
reMLはResilient DDDASパラダイム、移動目標防衛(MTD)理論、TinyMLに基づいている。
提案手法は電力効率とプライバシ保護であり,ISCのセキュリティを高めるため,電力制約のあるデバイスにデプロイすることができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 19:37:37 GMT)
Using dynamic loss weighting to boost improvements in forecast stability [0.9] ローリング起点予測不安定性(ローリング起点予測不安定性)とは、予測の更新によって生じる特定の期間の予測における変動をいう。
本稿では, 動的損失重み付けアルゴリズムを適用して, 精度を損なうことなく, さらなる安定性向上が達成できるかどうかを実験的に検討する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 20:21:46 GMT)
Navigation in a simplified Urban Flow through Deep Reinforcement Learning [0.9] 都市環境における無人航空機(UAV)は、環境への影響を最小限に抑える戦略を必要とする。
我々の目標は、都市環境下での無人航法を可能にするDRLアルゴリズムを開発することである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:05:15 GMT)
Supervised Learning Model for Key Frame Identification from Cow Teat Videos [0.9] 本稿では, ウシの乳房炎リスク評価の精度をニューラルネットワークとビデオ解析を用いて改善する手法を提案する。
伝統的に、獣医は乳牛の乳房の健康を評価する。
本論文は、牛のうどんが無傷に見えるビデオのキーフレームをニューラルネットワークで同定する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:50:43 GMT)
A Systematisation of Knowledge: Connecting European Digital Identities with Web3 [0.9] 自己主権アイデンティティ(Self-Sovereign Identity, SSI)と分散アイデンティティ(decentralized identity)という用語は、しばしば相互に使用される。
本稿は、欧州デジタルアイデンティティフレームワーク(eIDAS 2.0)の制定に関する改正規制に関して、この2つの概念を明確に区別することを目的としている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 22:35:25 GMT)
Digital Twin Ecosystem for Oncology Clinical Operations [0.8] 本稿では,腫瘍学における臨床手術の高度化をめざした,新たなデジタルツインフレームワークを提案する。
我々は,医療ニーズ双生児,ケアナビゲータ双生児,臨床履歴双生児など,複数の専門的デジタル双生児の統合を提案する。
複数のデータソースを合成し、NCCN(National Comprehensive Cancer Network)ガイドラインと整合させることで、ダイナミックながんケアパスを作成する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:56:54 GMT)
BeanCounter: A low-toxicity, large-scale, and open dataset of business-oriented text [0.8] BeanCounterは、企業の開示から抽出された159B以上のトークンからなるパブリックデータセットである。
データの出所を考えると、BeanCounterはWebベースのデータセットよりも比較的現実的で毒性が低いという仮説を立てています。
有害な生成が18~33%減少し、継続的に事前訓練されたモデルに対するファイナンス領域内での性能が向上した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:26:46 GMT)
Language agents achieve superhuman synthesis of scientific knowledge [0.8] PaperQA2は、ファクトリティの改善、マッチング、あるいは課題の専門家のパフォーマンスを上回るように最適化されたフロンティア言語モデルエージェントである。
PaperQA2は、Wikipediaのような科学的トピックの要約を引用している。
本稿では,人間にとって重要な科学的課題である科学文献の矛盾を明らかにするためにPaperQA2を適用した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:27:08 GMT)
Regional quality estimation for echocardiography using deep learning [0.7] 心エコー画像の画質の推定は、オペレーターを誘導し、臨床測定の精度を確保するのに有用である。
過去の研究はしばしば、心エコー図の視線精度と画質の区別に失敗する。
本研究では,画像品質を推定する3つの手法を開発し,比較した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:34:23 GMT)
Regional quality estimation for echocardiography using deep learning [0.7] 心エコー画像の画質の推定は、オペレーターを誘導し、臨床測定の精度を確保するのに有用である。
過去の研究はしばしば、心エコー図の視線精度と画質の区別に失敗する。
本研究では,画像品質を推定する3つの手法を開発し,比較した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:34:23 GMT)
Visual Concept Networks: A Graph-Based Approach to Detecting Anomalous Data in Deep Neural Networks [0.7] ディープニューラルネットワーク(DNN)は異常やアウト・オブ・ディストリビューション(OOD)データに対する堅牢性に苦しむ。
本稿では, グラフ構造とトポロジ的特徴を利用して, 遠距離OODデータと近距離OODデータの両方を効果的に検出する手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 19:27:08 GMT)
An exploratory analysis of Community-based Question-Answering Platforms and GPT-3-driven Generative AI: Is it the end of online community-based learning? [0.7] ChatGPTは、Stack Overflowのようなコミュニティの質問に答えるプラットフォームに対して、ソフトウェアエンジニアにインタラクティブな代替手段を提供する。
私たちは、2022年1月から2022年12月までのStack Overflowで投稿された2564 PythonとJavaScriptの質問に対して、ChatGPTのパフォーマンスを分析した。
分析の結果,ChatGPTの回答は66%短く,質問に対して35%の回答が得られた。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:17:30 GMT)
Enhancing Tourism Recommender Systems for Sustainable City Trips Using Retrieval-Augmented Generation [0.7] 本稿では,大規模言語モデルと改良型検索拡張パイプラインを用いて,持続可能な都市旅行を実現するための新しいアプローチを提案する。
我々は,都市の人気度と季節的需要に基づいて,サステナビリティ指標を組み込むことで,従来のRAGシステムを強化した。
Sustainability Augmented Re rank (SAR)と呼ばれるこの修正は、システムの推奨事項と持続可能性の目標との整合性を保証する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:12:33 GMT)
LowREm: A Repository of Word Embeddings for 87 Low-Resource Languages Enhanced with Multilingual Graph Knowledge [0.6] 87の低リソース言語に対する静的な埋め込みのリポジトリであるLowREmを紹介します。
また,多言語グラフ知識を統合することで,GloVeベースの埋め込みを強化する新しい手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:10:26 GMT)
QUBO Formulations for Variation of Domination Problem [0.6] 支配問題 (DP) は, 消防署問題, ソーシャルネットワーク理論など, 現実の多くの実践的問題に関係している。
本稿では,従来のDPのQUBOモデリング手法とその変種について検討する。
従来の研究と比較して、従来のDPのモデリング手法であるQUBOでは、量子コンピュータ上でのDP解決の障壁を低くすることができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:36:55 GMT)
Low Photon Number Non-Invasive Imaging Through Time-Varying Diffusers [0.6] ダイナミックディフューザの裏側に隠された蛍光体の非侵襲イメージングを実証する。
我々の再構成では、異なるディフューザ実現のために記録された画像のスタックを使用し、個々のカメラフレームが小さな光子数を含む場合でも機能する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:19:13 GMT)
QBI: Quantile-Based Bias Initialization for Efficient Private Data Reconstruction in Federated Learning [0.5] フェデレーション学習は、ユーザのプライバシを損なうことなく、分散データ上で機械学習モデルのトレーニングを可能にする。
近年の研究では、中央のエンティティが共有モデル更新からプライベートデータを完全に再構築できることが示されている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:36:32 GMT)
Time and State Dependent Neural Delay Differential Equations [0.5] 遅れた用語は、物理学や工学から医学、経済学まで、幅広い種類の問題の統治方程式で遭遇する。
複数および状態依存の遅延と時間依存の遅延をモデル化できるフレームワークであるNeural State-Dependent DDEを導入する。
提案手法は競争力があり,様々な遅延力学系における他の連続クラスモデルよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:29:00 GMT)
HydraViT: Stacking Heads for a Scalable ViT [0.5] 本稿では,拡張性のあるViTを実現するために,注目ヘッドを積み重ねることで制限に対処する新しいアプローチであるHydraViTを紹介する。
実験の結果,HydraViTは最大10ワークスで拡張性のあるViTを実現し,幅広いリソース制約をカバーできることがわかった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:52:36 GMT)
Recombination vs Stochasticity: A Comparative Study on the Maximum Clique Problem [0.4] 最大傾き問題(英: maximum clique problem、MCP)は、グラフ理論と計算複雑性の基本的な問題である。
様々なメタヒューリスティックがMPPを近似するために使われており、遺伝的アルゴリズムやメメティックアルゴリズム、アリコロニーアルゴリズム、欲求アルゴリズム、タブアルゴリズム、シミュレートされたアニーリングなどがある。
以上の結果から,モンテカルロのアルゴリズムはランダム検索を用いてグラフを生成するが,速度と能力の両面で遺伝的アルゴリズムを上回っていることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:50:00 GMT)
Zero- and Few-shot Named Entity Recognition and Text Expansion in Medication Prescriptions using ChatGPT [0.4] 大規模言語モデル(LLM)は、入力プロンプトに応答してテキストを生成する有望な能力を示している。
われわれはChatGPT 3.5を用いて、排出サマリーにおける医薬品のステートメントを自動構築し、拡張する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:49:27 GMT)
Magic state cultivation: growing T states as cheap as CNOT gates [0.4] 1つの状態のサイズと信頼性が徐々に増大するので、我々は建設を「魔法の国家栽培」と呼んでいる。
物理的騒音の改善に対する栽培効率と強い反応は、実際にはそれ以上のマジックステート蒸留は必要ないことを示唆している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:21:58 GMT)
Entanglement Microscopy: Tomography and Entanglement Measures via Quantum Monte Carlo [0.3] 我々は、エンタングルメント顕微鏡と呼ばれるプロトコルを用いて、マイクロサブリージョンの完全な還元密度行列に符号化されたマルチパーティントエンタングルメントを明らかにする。
その結果,Ising QCPは空間,温度ともにLNの急死が有限である短距離絡み合っていることがわかった。
2dのIsing QCP付近の大きなパラメータウィンドウでは,2人の目撃者との3方向の絡み合いは検出できない。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:35:06 GMT)
Probabilistic unifying relations for modelling epistemic and aleatoric uncertainty: semantics and automated reasoning with theorem proving [0.3] 確率的プログラミングは、一般的なコンピュータプログラミング、統計的推論、形式的意味論を組み合わせたものである。
ProbURelは、Hehnerの予測確率的プログラミングに基づいているが、彼の作品が広く採用されるにはいくつかの障害がある。
コントリビューションには、Unified Theories of Programming(UTP)を使用した関係の形式化や、ブラケット外の確率などが含まれています。
ロボットのローカライゼーションの問題,機械学習の分類,確率ループの終了など,6つの事例で研究成果を実演する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 23:10:41 GMT)
Byzantine-Robust Aggregation for Securing Decentralized Federated
Learning [0.3] Federated Learning(FL)は、デバイス上でAIモデルをローカルにトレーニングすることで、プライバシの問題に対処する分散機械学習アプローチとして登場した。
分散フェデレートラーニング(DFL)は、中央サーバを排除し、単一障害点の回避を通じてスケーラビリティと堅牢性を向上させることで、FLパラダイムを拡張します。
We present a novel byzantine-robust aggregate algorithm to enhance the security of DFL environment, coin, WFAgg。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:36:08 GMT)
Optimal trace-distance bounds for free-fermionic states: Testing and improved tomography [0.3] 相関行列の推定における誤差が状態のトレース距離誤差にどのように影響するかを示す。
我々は,自由フェルミオン状態の物性試験とトモグラフィーの大幅な進歩を導出した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:29:52 GMT)
VVTEAM: A Compact Behavioral Model for Volatile Memristors [0.2] 本稿では,V-VTEAM(V-VTEAM)を提案する。
モデルの有効性を, イオンドリフト/拡散ベースAg/SiOx/C/W揮発性メムリスタに適合させ, 相対根平均誤差が4.5%に達することを実証した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:52:04 GMT)
Input-Dependent Power Usage in GPUs [0.2] 入力データをGEMMに変換し,行列形状やサイズを維持しながら,これらのカーネルの消費電力を著しく変化させることができることを示す。
以上の結果から,GEMMにおけるGPUの消費電力は,ほぼ40%変化することが示唆された。
本稿では,この特性をコンパイラとスケジューラの最適化によって利用し,電力管理と省エネルギー化を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 22:31:09 GMT)
Symmetric-Cyclic Bidirectional Quantum Teleportation of Bell-like State via Entanglement-Swapping [0.2] 量子テレポーテーション(quantum teleportation)は、量子ネットワークにおいて量子情報を交換するためのプリミティブプロトコルである。
本稿では,ベル様状態が周期列で同時に交換される方式を提案する。
通信と運用の複雑さに基づいて、我々のプロトコルを他の等価プロトコルと比較し、本プロトコルの本質的な効率が33.33%のペギングであることを示した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:21:50 GMT)
SF-MMCN: Low-Power Sever Flow Multi-Mode Diffusion Model Accelerator [0.2] 畳み込みニューラルネットワーク(CNN)アクセラレータは,特に高速推論のために設計・開発が急速に進んでいる。
サーバフローマルチモードCNNユニット(SF-MMCN)が提案され,処理要素数(PE)が削減され,操作効率が向上した。
提案したSF-MMCNは、電力消費を92%削減し、シリコン領域を70%削減し、運転効率を約81倍改善する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:38:48 GMT)
Convolutional Signal Propagation: A Simple Scalable Algorithm for Hypergraphs [0.1] 本稿では,両部グラフ(ハイパーグラフ)で動作する非パラメトリック単純かつスケーラブルな方法である畳み込み信号伝搬(CSP)を提案する。
計算複雑性を低く保ちながら,CSPが競争性能を提供することを示す。
ハイパーグラフの操作にもかかわらず、CSPは自然言語処理のようなハイパーグラフに関連のないタスクで良い結果を得る。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:22:09 GMT)
A Policy Report Evaluating the National Assessment Program for Literacy and Numeracy (Naplan) Reform in Australia: The Impacts of High Stakes Assessment on Students [0.1] オーストラリアで2008年に開始されたNAPLAN(National Assessment Program for Literacy and Numeracy)改革(National Assessment Program for Literacy and Numeracy)は、オーストラリアで最も重要かつ論争の多い改革である。
本報告はNAPLAN改革の成果と障害を評価するものである。
オンラインテストへの移行、コンテンツとプラットフォームの向上、公共アセスメントのリテラシーの向上、LBOTE教育へのさらなる投資などのレコメンデーションを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:36:14 GMT)
End-to-end guarantees for indirect data-driven control of bilinear systems with finite stochastic data [0.0] 本稿では,安定性が保証された双線形システムの間接的データ駆動制御のためのエンドツーエンドアルゴリズムを提案する。
広範にわたる数値的な研究により、制御器設計と導出された識別誤差境界との相互作用を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:19:49 GMT)
Why Companies "Democratise" Artificial Intelligence: The Case of Open Source Software Donations [0.0] 企業は、AIのオープンソースソフトウェア(OSS)を非営利団体に寄付したり、AIモデルをリリースする際に、人工知能(AI)を「民主化する」と主張している。
本研究は、Linux Foundationへの43のAI OSS寄付に対する商業的インセンティブを調査するために、混合メソッドのアプローチを採用する。
それはAI民主化のための個人的および組織的社会的、経済的、技術的インセンティブの両方の分類に寄与している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:23:44 GMT)
What is the social benefit of hate speech detection research? A Systematic Review [0.0] 我々は、倫理的枠組みの欠如が、現在の実践とベストプラクティスの亀裂に寄与したと主張している。
適切な倫理的枠組みを採用することで、NLP研究者はヘイトスピーチ研究の社会的影響の可能性を有効にすることができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:57:27 GMT)
Unused information in token probability distribution of generative LLM: improving LLM reading comprehension through calculation of expected values [0.0] トークン確率の操作により復号法を改良できることを示す2つの実験を行った。
まず,SummEvalの要約スコアリングデータセットを用いて,読解理解度を測定する。
スコアのエントロピーを高めるために,ロジットを高温でスケールする。
7BMistralでは6-8%から13-28%,Mixtralでは20%-46%から37%-56%に改善した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:57:27 GMT)
Unsupervisedly Learned Representations: Should the Quest be Over? [0.0] 強化学習が動物と同じ精度の表現を学習できることを実証する。
これらの観察の要旨は、シミュレーション環境で訓練される可能性のある教師なし学習の競争パラダイムのさらなる探索が無駄になる可能性があるということである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:42:25 GMT)
Unsupervisedly Learned Representations: Should the Quest be Over? [0.0] 強化学習が動物と同じ精度の表現を学習できることを実証する。
これらの観察の要旨は、シミュレーション環境で訓練される可能性のある教師なし学習の競争パラダイムのさらなる探索が無駄になる可能性があるということである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:42:25 GMT)
Unsupervisedly Learned Representations: Should the Quest be Over? [0.0] 強化学習が動物と同じ精度の表現を学習できることを実証する。
これらの観察の要旨は、シミュレーション環境で訓練される可能性のある教師なし学習の競争パラダイムのさらなる探索が無駄になる可能性があるということである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:42:25 GMT)
Ultradecoherence model of the measurement process [0.0] この研究は、量子力学における測定過程の興味深い物理を垣間見る。
測定装置は、他のどの関連する時間スケールよりも高速なオープンデコヒーレンスダイナミクスを持つようにモデル化することができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:42:39 GMT)
Two-dopant origin of competing stripe and pair formation in Hubbard and $t$-$J$ models [0.0] 本研究では, 密度行列再正規化群アルゴリズムを用いて, 円筒系における単対のドーパントについて検討した。
秩序と一様ペアリングの相互作用は、有限ドーピングにおけるモデルの位相の中心であり、その起源は単対レベルである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:59:57 GMT)
Tuning transport in solid-state Bose-Fermi mixtures by Feshbach resonances [0.0] 狭い固体フェシュバッハ共鳴に近いボース・フェルミ混合物の輸送特性を予測した。
これらの固体ボース-フェルミ混合系において, 従来の散乱機構よりも相互作用効果が支配的であることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:00:01 GMT)
Trustworthy AI: Securing Sensitive Data in Large Language Models [0.0] 大規模言語モデル(LLM)は、堅牢なテキスト生成と理解を可能にすることで自然言語処理(NLP)を変革した。
本稿では, 機密情報の開示を動的に制御するために, 信頼機構をLCMに組み込むための包括的枠組みを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 19:02:33 GMT)
Time and its arrow from quantum geometrodynamics? [0.0] 古典的時空の出現とそれとともに、古典的時空とその矢印が普遍的な量子状態から出現することを説明する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:01:36 GMT)
The Top Manifold Connectedness of Quantum Control Landscapes [0.0] 本稿では,地形の上部多様体を形成する大域最適制御解の経路接続性について数値的に検討する。
状態-状態遷移確率を含む異なる量子制御目標に対して、観測可能な期待値とユニタリ変換は、そのような連続経路を容易に見つけることができる。
後者の予想の意義は、原目的の完全な最適性を維持しつつも、補助目的を最適化できるトップ多様体内の位置を求めることである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 00:58:52 GMT)
The QES sextic and Morse potentials: exact WKB condition and supersymmetry [0.0] 一次元準特殊可解(QES)性ポテンシャル $Vrm(qes)(x) を考える。
WKB補正$gamma=gamma(N,n)$は、第1の最低50状態に対して計算される。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:42:32 GMT)
The Nexus of AR/VR, Large Language Models, UI/UX, and Robotics Technologies in Enhancing Learning and Social Interaction for Children: A Systematic Review [0.0] 子どもに対する治療における言語モデル(LLM),拡張現実(AR),ユーザインターフェース/ユーザエクスペリエンス(UI/UX)設計について検討した。
150の出版物がPubMed、ACM、IEEE Xplore、Elsevier、Google Scholarで詳細な文献検索によって発見された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:19:25 GMT)
Text Image Generation for Low-Resource Languages with Dual Translation Learning [0.0] 本研究では,高リソース言語からの実際のテキスト画像のスタイルをエミュレートすることで,低リソース言語でテキスト画像を生成する手法を提案する。
このモデルのトレーニングには、2つの翻訳タスクが含まれており、平易なテキストイメージを合成または実際のテキストイメージに変換する。
生成したテキスト画像の精度と多様性を高めるために,2つのガイダンス手法を導入する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:23:59 GMT)
Symmetry constrained neural networks for detection and localization of damage in metal plates [0.0] 我々はニューラルネットワークをトレーニングし、薄いアルミニウム板の材料応答の時系列データを解析する。
各タスクに対して、最も性能の良いモデルは、トランスデューサがほぼ均一なプレート上の正方形パターンに類似し配置されているという帰納バイアスに基づいて設計された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:05:17 GMT)
Surface Scattering Expansion for the Casimir-Polder Interaction of a Dielectric Wedge [0.0] 偏光性粒子と誘電体ウェッジとのカシミール・ポルダー相互作用は計算が難しい。
この幾何学は、ゆらぎによって引き起こされる相互作用に対するエッジの効果のプロトタイプである。
顕著な発見は、円滑な縁を持つくさびのCP電位が、完全な導体で作られた鋭いくさびの電位と密接に関連していることである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:25:37 GMT)
Spectroscopy, Crystal-Field, and Transition Intensity Analyses of the C$_{\rm 3v}$(O$^{2-}$) Centre in Er$^{3+}$ Doped CaF$_{2}$ Crystals [0.0] 本稿では,CaF$:Er$3+$におけるC$_rm 3v$(O$2-$)中心の詳細な吸収とレーザーサイト選択分光について述べる。
この遷移は、167$Er同位体から観測可能な超微細構造を持つ1GHzの低温不均一線を有する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:31:12 GMT)
Spectroscopy and Crystal-Field Analysis of Low -Symmetry Er$^{3+}$ Centres in K$_2$YF$_5$ Microparticles [0.0] ランタノイドイオンをドープしたK$YF$_5$結晶は、様々な光学的応用がある。
電子-常磁性共鳴研究により、ランタニドイオンがC$_rm s$局所的な曖昧さでイットリウムの代わりになることが示された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:33:51 GMT)
Spatial embedding promotes a specific form of modularity with low entropy and heterogeneous spectral dynamics [0.0] 空間的に埋め込まれたリカレントニューラルネットワークは、学習よりもネットワークの構造と機能を組み合わせた組織をどのように形成するかを研究するための有望な道を提供する。
我々は,これらの制約を,速度とスパイクニューラルネットワークの両面にわたって,ニューラルウェイトと固有スペクトルのエントロピー測定によって研究することが可能であることを示す。
この作業は、ニューラルネットワークにおける制約付き学習の理解を深め、コーディングスキームやタスクを越えて、同時に構造的および機能的目的に対するソリューションをタンデムで達成する必要がある。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:00:05 GMT)
Sentiment Analysis of ML Projects: Bridging Emotional Intelligence and Code Quality [0.0] 本研究では、機械学習(ML)プロジェクトにおける感情分析(SA)とコード品質の関係について検討する。
一般的なMLリポジトリの包括的なデータセットを統合することで、この分析はルールベース、機械学習、ハイブリッド感情分析の方法論をブレンドする。
開発者の肯定的な感情は、バグの減少とコードの臭いの発生率の低下によって表される優れたコード品質と強く結びついている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:34:01 GMT)
SR-CurvANN: Advancing 3D Surface Reconstruction through Curvature-Aware Neural Networks [0.0] SR-CurvANNは、ニューラルネットワークベースの2Dインペイントを組み込んで、3D表面を効果的に再構築する新しい手法である。
SR-CurvANNは形状完成過程において優れており、穴を目覚ましいリアリズムと精度で埋める。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:33:53 GMT)
Revolutionizing Payload Inspection: A Self-Supervised Journey to Precision with Few Shots [0.0] 従来のセキュリティ対策は、現代のサイバー攻撃の高度化に対して不十分である。
Deep Packet Inspection (DPI)は、ネットワークセキュリティの強化において重要な役割を担っている。
先進的なディープラーニング技術とDPIの統合は、マルウェア検出に現代的な手法を導入している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:55:52 GMT)
Removal of clouds from satellite images using time compositing techniques [0.0] 時間合成の2つの異なるアプローチがテストされた。
すべての構成画像上の永続的な雲は、両方の方法で保持された。
クラウドを255に再コードし、'min'関数を実行するハイブリッド技術が開発された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 05:00:04 GMT)
Relaxation Fluctuations of Correlation Functions: Spin and Random Matrix Models [0.0] 本稿では,量子カオスの診断尺度として,ある相関関数の変動平均と分散について検討する。
モデルの3つの異なる位相(エルゴード相、フラクタル相、局所化相)を同定する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:11:37 GMT)
Quantum Kernel Methods under Scrutiny: A Benchmarking Study [0.0] 基礎となるグラム行列を計算するための2つの一般的なアプローチ: 忠実性量子カーネル(FQK)と投影量子カーネル(PQK)である。
本稿では,FQKとPQKに基づくQKMを設計選択の多様体にわたって総合的に検討する。
我々のゴールは、特定のタスクの最高のパフォーマンスモデルを特定するのではなく、効果的なQKMにつながるメカニズムを明らかにすることです。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:38:26 GMT)
QuForge: A Library for Qudits Simulation [0.0] QuForgeは、量子回路を量子ビットでシミュレートするように設計されたPythonベースのライブラリである。
GPUやTPUなどの加速デバイス上での実行をサポートし、シミュレーションを著しく高速化する。
スパース操作もサポートしており、他のライブラリと比較してメモリ消費が減少する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:38:35 GMT)
Pulsed magnetic field gradient on a tip for nanoscale imaging of spins [0.0] 本研究では,ナノスケールで高勾配の局所的かつ制御可能な磁場を提供するために,先端にスイッチング可能な磁場勾配を示す。
我々は、勾配場をナノスケール磁気共鳴センサ、ダイヤモンド中の窒素空孔(NV)中心に組み込み、高分解能磁気共鳴画像を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:56:02 GMT)
Privacy for Quantum Annealing. Attack on Spin Reversal Transformations in the case of cryptanalysis [0.0] SRTを用いて得られたIsing問題から元の問題を回復する方法を示す。
その結果,本手法は大規模問題においても効率的であることがわかった。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:17:47 GMT)
Preserving logical and functional dependencies in synthetic tabular data [0.0] 本稿では,属性間の論理的依存関係の概念を紹介する。
また、表データの属性間の論理的依存関係を定量化する尺度も提供します。
現在利用可能な合成データ生成アルゴリズムは、合成データセットを生成する際に、機能的依存関係を完全に保存していないことを実証する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:51:07 GMT)
Population Dynamics of Schrödinger Cats [0.0] 我々は、$d$次元格子上で、原型的なシュラーオドニガー・キャットの個体群モデルについて検討する。
古典的な個体群動態と通常の量子相転移の両方で観察されるものとは異なっている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 04:20:08 GMT)
Performance of a radio-frequency two-photon atomic magnetometer in different magnetic induction measurement geometries [0.0] ここで報告された発展は、2光子過程の基本的および応用的な側面を磁気誘導測定に組み入れている。
高コントラスト測定は、センサーの一次磁場に対する感度の低下により得られる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:11:07 GMT)
Participatory design: A systematic review and insights for future practice [0.0] 利害関係者の密接な関与を利用する反復的で柔軟なデザインプロセスである、参加型デザインは、デザインの分野にわたって利用されつつある。
参加型デザイン(PD)に移行する実践者の増加に伴い、厳格に定義されなくなった。
この体系的なレビューは、今日の実践者が過去の参加型デザインプロセスから学習を合成し、PDの今後の利用を知らせ、改善するものである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:29:34 GMT)
Monitoring Human Dependence On AI Systems With Reliance Drills [0.0] 人間は、AIが生み出すアドバイスを信頼すれば、AIシステムに過信される可能性がある。
本稿では,AIによるアドバイスにおいて,人間が誤りを認識できるかどうかを判定する演習を提案する。
私たちは、AIによる意思決定に人間が適切に関与し続けるための重要なツールとして、頼りのドリルが用いられるかもしれないと論じています。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:54:20 GMT)
Monitoring Human Dependence On AI Systems With Reliance Drills [0.0] 人間は、AIが生み出すアドバイスを信頼すれば、AIシステムに過信される可能性がある。
本稿では,AIによるアドバイスにおいて,人間が誤りを認識できるかどうかを判定する演習を提案する。
私たちは、AIによる意思決定に人間が適切に関与し続けるための重要なツールとして、頼りのドリルが用いられるかもしれないと論じています。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:54:20 GMT)
Model-Free Stochastic Process Modeling and Optimization using Normalizing Flows [0.0] 本研究は, 化学プロセスの力学を学習するために, 離散時間モデルとして条件正規化フローを用いることを提案する。
正規化フローは長期水平線上での安定なシミュレーションと、開ループ制御のための確率的およびMPC定式化による高品質な結果をもたらす。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:28:14 GMT)
Macroscopic QED and noise currents in time-varying media [0.0] 標準 MQED 内での epsilon(t,omega) に対する $epsilon(omega) の置換が非物理的分極電流をもたらすことが予想される。
この特異な挙動は貯水池の力学を変化させることで取り除くことができることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:07:30 GMT)
Machine Learning-based vs Deep Learning-based Anomaly Detection in
Multivariate Time Series for Spacecraft Attitude Sensors [0.0] 本研究の目的は、宇宙船の姿勢センサから得られる多変量時系列におけるスタンプ値検出問題に対する2つの異なるアプローチを特徴付けることである。
この分析は2つのアプローチのパフォーマンスの違いを明らかにし、解釈可能性と異なるシナリオへの一般化についてコメントする。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:45:36 GMT)
Machine Learning for Two-Sample Testing under Right-Censored Data: A Simulation Study [0.0] 本研究は,2サンプル検定における機械学習(ML)手法の有効性を評価することを目的とする。
この研究は、計18の2サンプル検定法を右集束観察でカバーしている。
直感的な観察で2サンプル問題をテストするには、提案された2サンプルメソッド(スクリプト、データセット、モデル)をGitHubとHugging Faceで使用することができる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:56:57 GMT)
Loop-Diffusion: an equivariant diffusion model for designing and scoring protein loops [0.0] ループ拡散(Loop-Diffusion)は、関数予測タスクに一般化するエネルギー関数を学ぶエネルギーベースの拡散モデルである。
我々は,TCR-pMHCインタフェースの評価におけるLoop-Diffusionの性能を評価し,結合強調突然変異の認識における最先端の結果を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:34:06 GMT)
Learning to Love Edge Cases in Formative Math Assessment: Using the AMMORE Dataset and Chain-of-Thought Prompting to Improve Grading Accuracy [0.0] 本稿では,Rori による 53,000 個の質問応答対の新たなデータセットである AMMORE を紹介する。
2つの実験により,大規模言語モデル(LLM)を用いて,難解な学生の回答を段階的に評価する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:51:40 GMT)
Laser Site-Selective Spectroscopy and Magnetic Hyperfine Splittings of Ho$^{3+}$ doped Y$_{2}$SiO$_{5}$ [0.0] 高分解能吸収測定は、選択規則に従って近似する複雑な超微細パターンを明らかにする。
3つの光学軸に沿って磁場を印加すると、0.5テスラ以下で回避された交差の存在が明らかになる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:38:01 GMT)
Joint Localization and Planning using Diffusion [0.0] 拡散モデルは、操作や車道計画といったロボティクスの問題にうまく適用されてきた。
本稿では,自己中心型LIDARスキャン,任意の地図,所望の目標位置が与えられたグローバル参照フレームにおいて,衝突のない経路を生成する拡散モデルを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:07:20 GMT)
Intelligent Energy Management: Remaining Useful Life Prediction and
Charging Automation System Comprised of Deep Learning and the Internet of
Things [0.0] 電池の持続寿命 (Remaining Useful Life, RUL) は、電池の余寿命と充電の必要性を知るための重要なパラメータである。
この研究プロジェクトの目標は、バッテリーRULデータセットのための機械学習ベースのモデルを開発することである。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 15:08:38 GMT)
Incomplete quantum oblivious transfer with perfect one-sided security [0.0] 我々は、送信者が受信機に2ビットの情報を送信する2つの不愉快な転送のうち1つを考える。
私たちは最低限の不正確率を見つけることを目指している。
非対話型量子プロトコルは非対話型古典的プロトコルよりも優れていることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:35:36 GMT)
Improvements to SDXL in NovelAI Diffusion V3 [0.0] 本技術報告では,ノベルAI拡散V3の訓練過程におけるSDXLの変更について報告する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:56:01 GMT)
High fidelity macroscopic superposition states via shortcut to adiabaticity [0.0] 巨視的空間重畳状態の大規模物体を調製するために, 断熱方式のショートカットを提案する。
この実装のために超伝導回路のハイブリッド電気機械構成を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 03:42:04 GMT)
HARMONIC: Cognitive and Control Collaboration in Human-Robotic Teams [0.0] メタ認知,自然言語コミュニケーション,説明可能性を備えたロボットチームにおいて,ロボットの認知戦略を実証する。
このシステムは、認知と制御機能を柔軟に統合するHARMONICアーキテクチャを使って実現されている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:48:21 GMT)
HARMONIC: A Framework for Explanatory Cognitive Robots [0.0] 本稿では,認知ロボットを実現するためのフレームワークであるHARMONICを紹介する。
このフレームワークは、高レベルの意思決定のための戦略的(認知的)層と低レベルの制御と実行のための戦術的(ロボット)層との相互運用性をサポートする。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:42:13 GMT)
Guaranteed Global Minimum of Electronic Hamiltonian 1-Norm via Linear Programming in the Block Invariant Symmetry Shift (BLISS) Method [0.0] ブロック不変対称性シフト(BLISS)技術は、望ましくない電子数部分空間のみにハミルトン作用を変更することで1ノルムを減少させる。
本稿では,この最適化の最適化を線形プログラミング問題として導入し,最適性を保証し,計算コストを大幅に削減する。
BLISS演算子を得る線形プログラミング手法により、より効率的なハミルトニアンシミュレーションが可能となり、ハミルトニアンスペクトル範囲を小さくすることで、LCUグルーピングを改善する機会を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 20:39:20 GMT)
Greenberger-Horne-Zeilinger state is the best probe for multiparameter estimation of independent local fields [0.0] 局所ハミルトニアンの独立な多重体強度の推定には、真の多党交絡状態の有用性が必要であることを示す。
混合状態にあるプローブを用いることで、GHZよりも精度が低いことを示す。
検討した重み行列の重要性を強調するために、同一の恒等演算子を選択すると、最高の精度が得られる製品プローブが得られることを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:02:12 GMT)
Fast multicomponent cat-state generation under resonant or strong-dressing Rydberg-Kerr interaction [0.0] 猫の状態は、気象学とフォールトトレラント量子計算の応用で最大に絡み合った状態である。
実験により、Rydberg集団の雪崩脱コヒーレンス(英語版)が、Rydberg原子による猫の創出のボトルネックとなることが明らかになった。
本論文は, 非線形性の複雑な順序が存在するにもかかわらず, キャット状態の出現を明らかにするために, 強いライドバーグドレッシング体制におけるキャット状態の形成を考察した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 08:09:27 GMT)
Faithfulness and the Notion of Adversarial Sensitivity in NLP Explanations [0.0] 本稿では, 信頼度評価の新しいアプローチとして, 適応感について紹介する。
本手法は, 逆入力変化に対する感度を捉えることによって, 説明者の忠実さを考慮に入れている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:11:28 GMT)
Evaluation of Cluster Id Assignment Schemes with ABCDE [0.0] クラスタID割り当てスキームは、クラスタリングの各クラスタを別個のIDでラベル付けする。
セマンティックIDの安定性により、クラスタリングのユーザは、クラスタリング/時間にわたって安定したIDを持つコンセプトのクラスタを参照することができる。
本稿では,ID代入方式の相対的メリットを評価することの課題について論じる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 19:56:56 GMT)
Estimating the Number of States via the Rodeo Algorithm for Quantum Computation [0.0] 我々は、最近開発されたロデオアルゴリズムを用いて、すべてのエネルギーレベルに関連する状態の数を決定する方法を示す。
1次元逆場イジングモデルの状態を計算し、その結果、その比熱を計算する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:25:29 GMT)
Essential implications of similarities in non-Hermitian systems [0.0] 3つの異なる一般化された類似性がすべてのユニタリ対称性と反ユニタリ対称性を包含していることが示される。
一般化された類似性条件は、ユニタリ対称性あるいは反ユニタリ対称性によって定義される任意のクラスよりもより大きな系のクラスをもたらすことを証明している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:58:06 GMT)
Entanglement witnesses with local partial ordering [0.0] 本稿では,各目撃者が2つの製品観測値の差分として定式化される,絡み合いの目撃者の類型について検討する。
これらの絡み合いの証人を構築するためのフレームワークを、いくつかの例とともに提供します。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:55:21 GMT)
Entanglement source and quantum memory analysis for zero added-loss multiplexing [0.0] ZALMは、ゼロ・ロス多重化によるエンタングルメント・ディストリビューション率を劇的に向上させる手段を提案した。
本稿では、ZALMのSPDC、部分BSM、アリスとボブの量子メモリのロードについて深く研究する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 20:11:08 GMT)
Enriched Functional Tree-Based Classifiers: A Novel Approach Leveraging
Derivatives and Geometric Features [0.0] 本研究では,高次元時系列の分類手法として,関数型データ分析(FDA)と木に基づくアンサンブル技術を統合した教師付き分類手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 12:57:47 GMT)
Enhanced Unsupervised Image-to-Image Translation Using Contrastive Learning and Histogram of Oriented Gradients [0.0] 本稿では,Contrastive Unpaired Translation (CUT)モデルに基づく,教師なし画像から画像への変換手法を提案する。
この新しいアプローチは、セマンティックラベルなしでも画像のセマンティック構造を確実に保存する。
本手法は,GTA5データセットから都市景観データセットのリアルな都市シーンへの合成ゲーム環境の変換について検討した。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:18:24 GMT)
E-scooter effects on public transport demand: a case study in Santiago, Chile [0.0] 電動スクーター(eスクーター)は公共交通機関の課題と機会を提供する。
本研究では,チリ・サンティアゴの公共交通需要に対するeスクータの効果について検討した。
その結果,e-scooterは公共交通機関の利用率を低下させるが,アクセスしにくい地域での利用率を高めることが示唆された。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:11:47 GMT)
Drawing the boundaries between Blockchain and Blockchain-like systems: A Comprehensive Survey on Distributed Ledger Technologies [0.0] Bitcoinのグローバルな成功はブロックチェーンの台頭につながったが、"ブロックチェーン"と呼ばれる多くのシステムは、その中核的な原則から逸脱している。
この調査は、ブロックチェーンとブロックチェーンのようなシステムの違いを明らかにするために、包括的なレビューと分類の必要性に対処する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:17:13 GMT)
Does End-to-End Autonomous Driving Really Need Perception Tasks? [0.0] SSRは16個のナビゲーション誘導トークンのみをスパースシーン表現として利用する新しいフレームワークである。
本手法では,教師付きサブタスクの必要性を排除し,ナビゲーションインテントに係わる重要な要素に計算資源を集中させることができる。
SSRは、nuScenesデータセットの最先端の計画性能を達成し、L2エラーが27.2%減少し、主要なE2EAD法であるUniADとの衝突速度が51.6%低下したことを示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 23:30:48 GMT)
Code Generation and Algorithmic Problem Solving Using Llama 3.1 405B [0.0] Llama駆動のコード生成は、自然言語プロンプトを複数のプログラミング言語で実行可能なコードに変換することができる。
Llamaは、あらゆるスキルレベルの開発者にとって汎用的なツールとして機能し、ソフトウェア開発の生産性と効率を改善します。
教育、産業、そしてコーディングプラクティスの将来への潜在的影響についても論じる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:29:20 GMT)
Cluster state as a non-invertible symmetry protected topological phase [0.0] 標準的な 1+1d $mathbbZ tensortimes mathbbZ$ cluster model が非可逆大域対称性を持つことを示す。
これらの非可逆SPT相間の界面におけるエッジモードと局所射影代数を同定する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 02:56:16 GMT)
Characterizing stable regions in the residual stream of LLMs [0.0] モデル出力が小さいアクティベーション変化に敏感なままであるトランスフォーマーの残ストリーム内の「安定領域」を同定する。
これらの領域はトレーニング中に現れ、トレーニングの進行やモデルサイズの増加に伴ってより定義される。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:30:51 GMT)
Characterization of Nuclear Magnetism at Ultralow and Zero Field using SQUIDs [0.0] 磁気共鳴イメージング(MRI)における医学などの領域の核磁気学
我々は[1-$13$C]ピルビン酸を過分極化する過分極反応器を設計し、シールド内での可逆交換による信号増幅によりヘテロ核へのアライメント移動を可能にする(SABRE-SHEATH)。
シミュレーションの結果から, 過分極設定が13ドルC分極0.4%となり, 地上での予測熱平衡信号(50ドルmu$T)に対して10万000の信号強調が得られた。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 11:04:59 GMT)
Bridging the Protection Gap: Innovative Approaches to Shield Older Adults from AI-Enhanced Scams [0.0] 多くの兆候は、詐欺師が既に成功した詐欺を強化するためにAIを使用していることを示唆している。
本稿では、現在の脆弱性を特定し、最新の防衛対策を推奨することで、高齢者に影響を及ぼす詐欺におけるAIの将来について検討する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 19:46:50 GMT)
Automated Detection and Analysis of Power Words in Persuasive Text Using Natural Language Processing [0.0] 本研究では,文中のパワーワードの自動検出と解析手法を提案する。
与えられたテキスト中のパワーワードの存在と頻度を識別することにより、感情や読者エンゲージメントに対するパワーワードの影響を分類し分析することを目指している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:38:56 GMT)
Augmented neural forms with parametric boundary-matching operators for solving ordinary differential equations [0.0] 本稿では,最適化可能な境界マッチングを持つ適切なニューラルフォームを体系的に構築するフォーマリズムを提案する。
ニューマン条件やロビン条件の問題をパラメトリックディリクレ条件の等価問題に変換する新しい手法を記述する。
提案手法は,一階および二階の常微分方程式と一階のシステムを含む多種多様な問題に対して実験を行った。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:34:40 GMT)
Asymmetric Bidirectional Quantum Teleportation: Arbitrary bi-modal Information State [0.0] 本稿では,送信側から受信側へ4成分のバイモーダル絡み合ったコヒーレント状態の任意の重ね合わせを送信する戦略を提案する。
ほぼ忠実な部分非対称な双方向量子テレポーテーションとそれに伴う成功の確率を解析する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 16:59:58 GMT)
An Autotuning-based Optimization Framework for Mixed-kernel SVM Classifications in Smart Pixel Datasets and Heterojunction Transistors [0.0] Support Vector Machine (SVM) は、科学や工学で広く使われている最先端の分類手法である。
そこで本稿では,SVMにおけるハイパーパラメータの範囲を定量化して最適選択を識別する,自動チューニングに基づく最適化フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:50:11 GMT)
All-to-all reconfigurability with sparse and higher-order Ising machines [0.0] オール・ツー・オールのネットワーク機能をエミュレートする多重アーキテクチャを導入する。
適応並列テンパリングアルゴリズムの実行は、競合するアルゴリズムと事前ファクターの利点を示す。
pビットIMのスケールされた磁気バージョンは、汎用最適化のための最先端技術よりも桁違いに改善される可能性がある。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:27:01 GMT)
A single space-time is too small for all of Wigner's friends [0.0] 量子論の解釈に関する最近のNo-go定理は、予期せぬほど強い相関関係を持つことが示されている。
AOEを拒絶することはできず、同時に、観測されたイベント'はすべての観測者が共通する単一の背景空間時間内に埋め込むことができると仮定する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 17:53:32 GMT)
A novel application of Shapley values for large multidimensional time-series data: Applying explainable AI to a DNA profile classification neural network [0.0] 本研究は,シェープリー値にスーパーピクセルの考え方を適応させる,時系列ライクなデータに対する効率的な解法を提案する。
法医学的なDNA分類の例により、この方法は、畳み込みニューラルネットワーク(CNN)によって分類された時系列のようなデータに適用される。
本研究は,この大規模タスクに対するShapley値の現実的で正確かつ高速な計算を実証する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 07:34:17 GMT)
A method for identifying causality in the response of nonlinear dynamical systems [0.0] データ駆動モデルを構築するには、システムの入力と出力を実験的に測定する必要がある。
モデル内の不正確さがエラーやノイズのモデル化に起因するかどうかを判断することは困難である。
本稿では,入力出力データの因果成分を,出力雑音の存在下でのシステム計測から同定する手法を提案する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 14:19:07 GMT)
A Scalable Data-Driven Framework for Systematic Analysis of SEC 10-K Filings Using Large Language Models [0.0] SEC10-Kの申請に基づいて企業の業績を分析し,評価する,新たなデータ駆動型アプローチを提案する。
提案手法は、データパイプラインを実行して視覚化を作成するためのノーコードソリューションとして、対話型GUI上に実装される。
このアプリケーションは評価結果を示し、企業業績の年次比較を提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 06:57:22 GMT)
A Novel Spinor-Based Embedding Model for Transformers [0.0] 幾何代数学からのスピノルを利用したトランスフォーマーモデルにおける単語埋め込みの新しい手法を提案する。
スピノルは高次元空間における複雑な関係や変換を捉えることができるリッチな数学的枠組みを提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 01:18:45 GMT)
A Generalized LLM-Augmented BIM Framework: Application to a Speech-to-BIM system [0.0] 提案するフレームワークは6つのステップで構成されている。
本稿では,BIM アプリケーション NADIA-S の実装により,提案手法の適用性を示す。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 23:46:15 GMT)
A Gaussian Process Framework for Solving Forward and Inverse Problems Involving Nonlinear Partial Differential Equations [0.0] 非線形PDEシステムを解くためにカーネル法とディープNNの長所を統合するためにカーネル重み付き補正残差(CoRes)を導入する。
CoResは幅広いベンチマーク問題の解決において競合する手法を一貫して上回っている。
我々はPDEの解決にカーネル手法を活用することに新たな関心を喚起する可能性があると考えている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 18:12:09 GMT)
A Distributed Privacy Preserving Model for the Detection of Alzheimer's Disease [0.0] 本稿では,分散データからトレーニングできるHIPAA準拠のフレームワークを提案する。
次に,アルツハイマー病(AD)検出のための多モード垂直フェデレーションモデルを提案する。
ここで提案されたVFLアーキテクチャは、多様な医療データソースをまたいだ協調学習を可能にする、新しい分散アーキテクチャを提供する。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 21:24:00 GMT)
A Concept-Value Network as a Brain Model [0.0] 本稿では,脳様モデルの物理的実体と概念的実体の関係を記述するための統計的枠組みを提案する。
この論文は、化学接続も可能であるが、電気配線が特徴である可能性を示唆している。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 10:53:16 GMT)
A Comprehensive Review of TLSNotary Protocol [0.0] 本稿では,TLSセッションからデータに対する証明をクライアントが得ることを目的としたTLSNotaryプロトコルについて検討する。
このような証明をサーバ側の調整や許可なしに実現するには、セキュアなマルチパーティ計算(MPC)と知識証明のゼロが用いられる。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 09:28:51 GMT)
2D and 3D Deep Learning Models for MRI-based Parkinson's Disease Classification: A Comparative Analysis of Convolutional Kolmogorov-Arnold Networks, Convolutional Neural Networks, and Graph Convolutional Networks [0.0] 本研究はパーキンソン病の診断にConvolutional Kolmogorov-Arnold Networks(ConvKANs)を適用した。
ConvKANは、構造MRIを用いたPD分類のために、学習可能なアクティベーション機能を畳み込み層に統合する。
医用画像用ConvKANの最初の3D実装について紹介し、その性能を畳み込みニューラルネットワーク(CNN)とグラフ畳み込みニューラルネットワーク(GCN)と比較した。
これらの知見は, PD検出に対するConvKANsの可能性を強調し, 脳の微妙な変化を捉える上での3D解析の重要性を強調し, データセット間の一般化の課題を浮き彫りにしている。
論文参考訳(メタデータ) (Thu, 26 Sep 2024 13:37:04 GMT)