Fugu-MT: arxivの論文翻訳(概要)

MMEvol: Empowering Multimodal Large Language Models with Evol-Instruct [148.4]
我々は,新しいマルチモーダル命令データ進化フレームワークであるMMEvolを提案する。 MMEvolは、きめ細かい知覚、認知的推論、相互作用の進化の洗練された組み合わせによって、データ品質を反復的に改善する。提案手法は,9つのタスクにおいて,最先端モデルに比べて有意に少ない精度でSOTA(State-of-the-art)性能を実現する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:17:38 GMT)
MMSearch: Benchmarking the Potential of Large Models as Multi-modal Search Engines [91.1]
大規模マルチモーダルモデル(LMM)は、AI検索エンジンにおいて目覚ましい進歩を遂げた。しかし、AI検索エンジンとして機能するかどうかはまだ未定だ。まず,マルチモーダル検索機能を備えた任意のLMMに対して,センシティブなパイプラインMMSearch-Engineを設計する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:59:45 GMT)
3DTopia-XL: Scaling High-quality 3D Asset Generation via Primitive Diffusion [86.3]
3DTopia-XLは,既存の手法の限界を克服するために設計された,スケーラブルなネイティブな3D生成モデルである。 3DTopia-XLは、新しいプリミティブベースの3D表現であるPrimXを利用して、詳細な形状、アルベド、マテリアルフィールドをコンパクトなテンソル形式にエンコードする。その上で, 1) 原始的パッチ圧縮, 2) および潜在的原始的拡散を含む拡散変換器(DiT)に基づく生成フレームワークを提案する。我々は,3DTopia-XLが既存の手法よりも高い性能を示すことを示すために,広範囲な定性的,定量的な実験を行った。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:59:06 GMT)
Manifold Sampling for Differentiable Uncertainty in Radiance Fields [82.2]
本稿では,ガウス放射場を明示的かつきめ細かい不確実性推定で学習するための多元的アプローチを提案する。次回のベクター・ビュー・プランニング・タスクにおける最先端のパフォーマンスを実演する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:22:20 GMT)
Preference Alignment Improves Language Model-Based TTS [76.7]
選好アライメントアルゴリズムは、報酬モデルの嗜好に合わせてLMを調整し、生成されたコンテンツの望ましさを高める。 1.15B のパラメータ LM に基づく TTS モデルを用いて、嗜好の整合性は常に知性、話者類似性、代用主観的評価スコアを向上することを示した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:58:19 GMT)
Zero-to-Strong Generalization: Eliciting Strong Capabilities of Large Language Models Iteratively without Gold Labels [75.8]
大規模言語モデル(LLM)は,ゴールドラベルを用いた教師付き微調整やテキスト内学習を通じて,顕著な性能を示した。本研究では,ラベルのないデータのみを利用することで,強力なモデル機能を実現することができるかどうかを考察する。ゼロ・ツー・ストロング一般化と呼ばれる新しいパラダイムを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:59:44 GMT)
CLAIR-A: Leveraging Large Language Models to Judge Audio Captions [73.5]
機械生成オーディオキャプションの評価は、様々な要因を検討する必要がある複雑なタスクである。本稿では,大規模言語モデルのゼロショット機能を活用するシンプルで柔軟なCLAIR-Aを提案する。我々の評価では、CLAIR-Aは従来のメトリクスと比較して品質の人的判断を良く予測する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:59:52 GMT)
Disentangling Speakers in Multi-Talker Speech Recognition with Speaker-Aware CTC [73.2]
マルチトーカー音声認識は、重複する音声を遠ざけ、書き起こす際、独特な課題に直面している。本稿では,MTASRにSOT(Serialized Output Training)を取り入れた場合の話者の絡み合いにおける接続性時間分類(CTC)の役割について検討する。本研究では,ベイズリスクCTCフレームワークに基づく話者認識型CTC(SACTC)学習目標を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:26:33 GMT)
PropaInsight: Toward Deeper Understanding of Propaganda in Terms of Techniques, Appeals, and Intent [71.2]
プロパガンダは世論の形成と偽情報の拡散に重要な役割を果たしている。 Propainsightはプロパガンダを体系的に、技術、覚醒的魅力、そして根底にある意図に分解する。 Propagazeは、人間の注釈付きデータと高品質な合成データを組み合わせる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 06:28:18 GMT)
End-to-end Open-vocabulary Video Visual Relationship Detection using Multi-modal Prompting [68.4]
Open-vocabulary video visual relationship detectionは、ビデオの視覚的関係の検出をカテゴリを超えて拡張することを目的としている。既存の方法は、通常、閉じたデータセットで訓練された軌跡検出器を使用して物体の軌跡を検出する。我々はCLIPの豊富な意味的知識を活用して新しい関係を発見するオープン語彙関係を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 06:25:01 GMT)
Robust Audiovisual Speech Recognition Models with Mixture-of-Experts [67.8]
EVAを導入し、オーディオVisual ASRのミックス・オブ・エクササイズを利用して、Wildのビデオに対してロバストな音声認識を行う。まず、視覚情報を視覚トークンシーケンスにエンコードし、それらを軽量な投影により音声空間にマッピングする。実験により,本モデルが3つのベンチマークで最先端の結果が得られることが示された。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 00:08:28 GMT)
Efficient Performance Tracking: Leveraging Large Language Models for Automated Construction of Scientific Leaderboards [67.7]
科学的リーダーボードは、競争方法の評価と比較を容易にする標準化されたランキングシステムである。出版物の増加により、これらのリーダーボードを手動で構築し維持することは不可能になった。手作業の削減の解決策としてリーダーボードの自動構築が登場しました
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:12:27 GMT)
3DGS-LM: Faster Gaussian-Splatting Optimization with Levenberg-Marquardt [65.3]
3DGS-LM, 3D Gaussian Splatting(3DGS)の再構築を高速化する新しい手法を提案する。提案手法は元の3DGSよりも30%高速で, 再現品質の最適化が可能である。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:31:44 GMT)
PVContext: Hybrid Context Model for Point Cloud Compression [61.2]
我々は,効率的なオクツリーベースのポイントクラウド圧縮のためのハイブリッドコンテキストモデルPVContextを提案する。 PVContextは、ボクセルを用いて局所幾何学情報を正確に表現するVoxel Contextと、ポイントクラウドからグローバルな形状情報を効率的に保存するPoint Contextの2つのコンポーネントから構成される。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:47:35 GMT)
InfiMM-WebMath-40B: Advancing Multimodal Pre-Training for Enhanced Mathematical Reasoning [58.8]
InfiMM-WebMath-40Bは、インターリーブされた画像テキスト文書の高品質なデータセットである。ウェブページは2400万、画像URLは8500万、テキストトークンは400億だ。テキストのみのベンチマークでは,400億トークンしか利用していないにもかかわらず,データセットは1.3Bモデルの性能を大幅に向上させることが示された。私たちのモデルは、MathVerseやWe-Mathといったマルチモーダルな数学ベンチマーク上で、オープンソースモデルの中で新しい最先端のモデルを設定しました。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:41:21 GMT)
From Linguistic Giants to Sensory Maestros: A Survey on Cross-Modal Reasoning with Large Language Models [56.9]
クロスモーダル推論(CMR)は、より高度な人工知能システムへの進化における重要な能力として、ますます認識されている。 CMRタスクに取り組むためにLLM(Large Language Models)をデプロイする最近のトレンドは、その有効性を高めるためのアプローチの新たな主流となっている。本調査では,LLMを用いてCMRで適用された現在の方法論を,詳細な3階層分類に分類する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:51:54 GMT)
LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba [54.9]
局所的意図的マンバブロックは、大域的コンテキストと局所的詳細の両方を線形複雑性でキャプチャする。このモデルは, 256x256の解像度で, ImageNet上の様々なモデルスケールでDiTの性能を上回り, 優れたスケーラビリティを示す。 ImageNet 256x256 と 512x512 の最先端拡散モデルと比較すると,最大 62% GFLOP の削減など,我々の最大のモデルには顕著な利点がある。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:07:14 GMT)
Unrolled denoising networks provably learn optimal Bayesian inference [54.8]
我々は、近似メッセージパッシング(AMP)のアンロールに基づくニューラルネットワークの最初の厳密な学習保証を証明した。圧縮センシングでは、製品から引き出されたデータに基づいてトレーニングを行うと、ネットワークの層がベイズAMPで使用されるのと同じデノイザーに収束することを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:56:16 GMT)
MURI: High-Quality Instruction Tuning Datasets for Low-Resource Languages via Reverse Instructions [54.1]
MURI(Multilingual Reverse Instructions)は低リソース言語のための高品質な命令チューニングデータセットを生成する。 MURIは、低リソース言語における既存の人文テキストから命令出力ペアを生成する。私たちのデータセットであるMURI-ITには200言語にまたがる200万以上の命令出力ペアが含まれています。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:59:20 GMT)
Enhancing Logical Reasoning in Large Language Models through Graph-based Synthetic Data [53.4]
本研究では,大規模言語モデルの推論能力を高めるための学習信号としてグラフベースの合成推論データを使用することの可能性と限界について検討する。 2つの確立された自然言語推論タスクにおいて,合成グラフに基づく推論データによる教師付き微調整が,他の標準評価ベンチマークでの有効性を損なうことなく,LLMの推論性能を効果的に向上することを示した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:39:09 GMT)
KLDD: Kalman Filter based Linear Deformable Diffusion Model in Retinal Image Segmentation [51.0]
本稿では,網膜血管分割のためのKLDDモデルを提案する。我々のモデルは、変形可能な畳み込みの柔軟な受容場を利用して、分割を反復的に洗練する拡散過程を用いる。実験は網膜基底画像データセット(DRIVE,CHASE_DB1)とOCTA-500データセットの3mm,6mmで評価された。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:21:38 GMT)
SPARQ: Efficient Entanglement Distribution and Routing in Space-Air-Ground Quantum Networks [50.9]
宇宙空間量子(SPARQ)ネットワークは、シームレスなオンデマンドの絡み合い分布を提供する手段として開発された。 SPARQの複数のグラフ上でディープQネットワーク(DQN)を用いて深層強化学習フレームワークを提案し,訓練した。通信相手間の絡み合いを確立するために,サードパーティの絡み合い分散政策を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:31:37 GMT)
Towards Low-latency Event-based Visual Recognition with Hybrid Step-wise Distillation Spiking Neural Networks [50.3]
スパイキングニューラルネットワーク(SNN)は、低消費電力と高い生物性のために大きな注目を集めている。現在のSNNは、ニューロモルフィックデータセットの正確性とレイテンシのバランスをとるのに苦労している。ニューロモルフィックデータセットに適したステップワイド蒸留法(HSD)を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 06:52:34 GMT)
Bundle Fragments into a Whole: Mining More Complete Clusters via Submodular Selection of Interesting webpages for Web Topic Detection [49.8]
最先端のソリューションは、まず、Webページを多数の粒度トピック候補にまとめることである。ホットトピックは、その面白さを推定することによってさらに特定される。本稿では,フラグメントからより完全なホットトピックを抽出するためのバンドル・リフィニング手法を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 00:46:31 GMT)
Prompting Segment Anything Model with Domain-Adaptive Prototype for Generalizable Medical Image Segmentation [49.6]
医用画像のセグメンテーションにおけるセグメンテーションモデル(DAPSAM)の微調整のための新しいドメイン適応型プロンプトフレームワークを提案する。 DAPSAMは,2つの医療画像分割タスクにおいて,異なるモダリティで最先端のパフォーマンスを実現する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:28:33 GMT)
Textualized Agent-Style Reasoning for Complex Tasks by Multiple Round LLM Generation [49.3]
我々は、llmベースの自律エージェントフレームワークであるAgentCOTを紹介する。それぞれのステップで、AgentCOTはアクションを選択し、それを実行して、証拠を裏付ける中間結果を得る。エージェントCOTの性能を高めるための2つの新しい戦略を導入する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:20:06 GMT)
Opponent Shaping for Antibody Development [49.3]
抗ウイルス療法は通常、ウイルスの現在の株に向けて設計または進化される。学習用語では、これは筋性最良の反応(すなわち、相手の適応的な動きを考慮しない)に対応する。これは、一般的には、ミオピック・ベスト・レスポンスではなく、共プレイヤの適応を考慮に入れている相手のシェーピングにインスパイアされている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:05:59 GMT)
Enhancing Perception of Key Changes in Remote Sensing Image Change Captioning [49.2]
KCFI(Key Change Features and Instruction-tuned)によるリモートセンシング画像変換キャプションのための新しいフレームワークを提案する。 KCFIは、バイテンポラルリモートセンシング画像特徴を抽出するViTsエンコーダと、重要な変化領域を識別するキー特徴知覚器と、画素レベルの変化検出デコーダとを含む。提案手法の有効性を検証するため,LEVIR-CCデータセット上のいくつかの最新の変更キャプション手法との比較を行った。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:33:33 GMT)
Impact of ML Optimization Tactics on Greener Pre-Trained ML Models [46.8]
本研究の目的は,画像分類データセットと事前学習モデルの解析,最適化モデルと非最適化モデルを比較して推論効率を向上させること,最適化の経済的影響を評価することである。画像分類におけるPyTorch最適化手法(動的量子化、トーチ・コンパイル、局所プルーニング、グローバルプルーニング)と42のHugging Faceモデルの影響を評価するための制御実験を行った。動的量子化は推論時間とエネルギー消費の大幅な削減を示し、大規模システムに非常に適している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:23:03 GMT)
A Deep Dive into Fairness, Bias, Threats, and Privacy in Recommender Systems: Insights and Future Research [45.9]
本研究では,推薦システムにおける公正性,バイアス,脅威,プライバシについて検討する。アルゴリズムによる決定が、意図せずバイアスを強化したり、特定のユーザやアイテムグループを疎外したりする方法について検討する。この研究は、推薦システムの堅牢性、公正性、プライバシーを改善するための今後の研究の方向性を示唆している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:00:35 GMT)
Ultra-high strained diamond spin register with coherent optical link [45.4]
ダイヤモンドの色中心のような固体スピン欠陥は、スケーラブルで統合された量子技術にとって最も有望な候補である。ナノダイヤモンド内部の超高ひずみシリコン空洞を利用すれば、液体ヘリウム温度でフォノンによる脱落を緩和しながら、電子スピンのコヒーレントかつ効率的に制御できることを示す。我々の研究は、将来量子ネットワークレジスタを従来の、確立されたフォトニクスとハイブリッド量子通信システムに統合するための道を開く。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 10:46:24 GMT)
Exploring the Lands Between: A Method for Finding Differences between AI-Decisions and Human Ratings through Generated Samples [45.2]
生成モデルの潜在空間におけるサンプルを見つける手法を提案する。これらのサンプルを意思決定モデルと人間のレーダの両方に提示することにより、その決定が人間の直感と一致する領域を特定することができる。本手法を顔認識モデルに適用し,100人の被験者から11,200人の評価データを収集する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:14:08 GMT)
DrivingForward: Feed-forward 3D Gaussian Splatting for Driving Scene Reconstruction from Flexible Surround-view Input [45.0]
フレキシブル・サラウンド・ビュー・インプットから運転シーンを再構成するフィードフォワードガウス・スプレイティング・モデルを提案する。我々は、ポーズネットワーク、ディープネットワーク、およびガウスネットワークを共同でトレーニングし、運転シーンを表すプリミティブを予測する。提案モデルでは,既存のフィードフォワードやシーン最適化の手法よりも再現性が高い。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:16:04 GMT)
Fundus image enhancement through direct diffusion bridges [44.3]
直接拡散ブリッジに基づく基礎画像強調手法であるFD3を提案する。まず, 眼科医による人体フィードバックループによる合成前方モデルを提案する。我々は,スタンドアローン手法として非常に有効である,堅牢で柔軟な拡散に基づく画像強調ネットワークを訓練する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 00:26:14 GMT)
ConvexECG: Lightweight and Explainable Neural Networks for Personalized, Continuous Cardiac Monitoring [43.2]
ConvexECGは、単誘導データから6誘導心電図を再構成するための説明可能かつ資源効率のよい方法である。我々は、ConvexECGがより大きなニューラルネットワークに匹敵する精度を実現し、計算オーバーヘッドを大幅に削減することを示した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 06:14:30 GMT)
A Margin-Maximizing Fine-Grained Ensemble Method [42.4]
マルジン最大化ファイングラインドアンサンブル法(Margin-Maximizing Fine-Grained Ensemble Method)を提案する。少数の学習者を巧みに最適化し、一般化能力を向上させることで、大規模アンサンブルを超えるパフォーマンスを実現する。本手法は,基礎学習者の10分の1と,他の最先端のアンサンブル手法を用いて,従来のランダム林よりも優れていた。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:48:12 GMT)
LLM-Powered Text Simulation Attack Against ID-Free Recommender Systems [42.1]
本研究は,提案したテキストシミュレーション攻撃(TextSimu)に対して,IDフリーのレコメンデータシステムが脆弱であることを明らかにする。新しいタイプのテキスト中毒攻撃として、TextSimuは、人気のあるアイテムの特徴をシミュレートすることで、ターゲットアイテムのテキスト情報を変更するために、大きな言語モデル(LLM)を利用する。 TextSimuライクな攻撃に耐えるために,LLM生成したプロモーションテキストを識別するための検出手法を検討する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:28:21 GMT)
Toolbox for nonreciprocal dispersive models in circuit QED [41.9]
汎用的な非相反線形系で結合された弱非調和超伝導回路を記述するために、効果的分散型リンドブラッドマスター方程式を構築する体系的な方法を提案する。結果は、量子情報の非自明なルーティングを持つ複雑な超伝導量子プロセッサの設計や、凝縮物質系の量子シミュレータの設計に利用できる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:20:01 GMT)
Hardware-efficient quantum error correction using concatenated bosonic qubits [41.6]
量子コンピュータは、論理量子ビットが多くのノイズの多い物理量子ビットで冗長に符号化される量子エラー補正を組み込む必要がある。ここでは、マイクロファブリケート超伝導量子回路を用いて、符号化されたボソニックキャット量子ビットの連結から形成される論理量子ビットメモリを実現する。論理量子ビットメモリの性能とスケーリングについて検討し,位相フリップ補正繰り返し符号がしきい値以下で動作していることを見出した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:00:53 GMT)
Look Through Masks: Towards Masked Face Recognition with De-Occlusion Distillation [39.2]
本稿では, マスク面認識の課題に対するアモーダル完了のメカニズムを, エンド・ツー・エンド・エンド・デオクルージョン蒸留フレームワークを用いて移行することを提案する。合成対向ネットワークを適用して顔補完を行い、マスクの下にある内容を回復し、外観の曖昧さを解消する。テキスト蒸留モジュールは、訓練済みの一般顔認識モデルを教師として受け取り、その知識を、完成した顔の学習者に伝達する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:00:36 GMT)
Learning to Coordinate without Communication under Incomplete Information [39.1]
自律的なエージェントが、パートナーの行動を解釈することで、どのように協力するかを示す。 Gnomes at Nightというテストベッドの実験結果から、学習したコミュニケーションの協調戦略が成功率を著しく向上させることが示された。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:41:41 GMT)
Denoising Reuse: Exploiting Inter-frame Motion Consistency for Efficient Video Latent Generation [36.1]
本研究では,遅延ビデオ生成を高速化する拡散再利用モードネットワークを提案する。初期のデノナイジングステップの粗いきめのノイズは、連続するビデオフレーム間で高い動きの一貫性を示す。 Mo博士は、慎重に設計された軽量なフレーム間の動きを取り入れることで、これらの粗いノイズを次のフレームに伝播させる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:50:34 GMT)
Bilingual Evaluation of Language Models on General Knowledge in University Entrance Exams with Minimal Contamination [35.9]
このデータセットは、スペイン語と英語の大学入学レベルの試験に関する1003の質問からなる。現在のオープンソースモデルとプロプライエタリモデルの選択は、一様ゼロショット実験環境で評価される。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:13:07 GMT)
Privacy-Preserving Student Learning with Differentially Private Data-Free Distillation [35.4]
プライバシーを保護したディープラーニングモデルを学習するための効果的な教師学生学習手法を提案する。データプライバシを公開することなく、モデルトレーニングのために大量の合成データを生成することができる。学生は、プライベートレーベルの監督の下で、合成データに基づいて訓練される。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:00:18 GMT)
Frequency-Guided Spatial Adaptation for Camouflaged Object Detection [34.1]
我々は,CODタスクのための新しい周波数誘導空間適応法を提案する。スペクトログラム内の非重なり円内に位置する周波数成分をグループ化して相互作用することにより、異なる周波数成分を動的に強化または弱める。同時に、被写体と背景を区別するための特徴を強調し、被写体の位置と形状を間接的に示唆する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:53:48 GMT)
EdgeGaussians -- 3D Edge Mapping via Gaussian Splatting [33.4]
最先端の画像ベースの手法は、3Dエッジポイントクラウドを学習し、3Dエッジを適合させる。提案手法は,3次元エッジ点とそのエッジ方向を明示的に学習することにより,点サンプリングの必要性を回避できる。以上の結果から,提案手法は最先端技術と同程度の精度と完成度を実現し,精度は桁違いに向上した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:28:45 GMT)
Familiarity-aware Evidence Compression for Retrieval Augmented Generation [33.1]
対象モデルに慣れ親しんだ証拠を抽出する訓練不要な証拠圧縮手法であるFaviCompを提案する。 FaviCompは、対象モデルに関する圧縮された証拠の難易度を積極的に下げる。 FaviCompは、複数のオープンドメインQAにおいて、既存のベースラインを一貫して上回ることを示す実験結果が得られた。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 05:14:55 GMT)
Oscillatory dissipative tunneling in an asymmetric double-well potential [32.7]
化学研究は、トンネリング速度の正確な測定能力を備えた完全に制御可能で非対称な二重井戸の恩恵を受けるだろう。我々の研究は、量子超伝導回路に基づくアナログ分子シミュレーターの道を開いた。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 22:43:07 GMT)
A Roadmap for Simulating Chemical Dynamics on a Parametrically Driven Bosonic Quantum Device [32.7]
ボソニック超伝導Kerr-catデバイスを用いた反応力学シミュレーションの実現可能性について検討した。このアプローチは、二重井戸自由エネルギープロファイルを定義するパラメータを制御し、温度や反応座標と非反応性自由度の熱浴との間の結合強度などの外部要因を制御できる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 22:43:08 GMT)
Robust estimation of the intrinsic dimension of data sets with quantum cognition machine learning [31.3]
本稿では,量子認知機械学習に基づく新しいデータ表現法を提案し,それを多様体学習に適用する。我々は各点を量子状態として表現し、点の局所的性質とデータ全体との関係を符号化する。量子幾何学のアイデアに触発され、量子状態から量子計量を備えた点雲を構築する。提案手法は,このスペクトルギャップの検出に基づく。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:24:35 GMT)
MambaRecon: MRI Reconstruction with Structured State Space Models [30.5]
ディープラーニングの出現は、MRIスキャンの迅速な再構築のための最先端の手法の開発を触媒している。本稿では,長期的文脈感度と再構成の有効性の両立を目的とした,構造化状態空間モデルをコアに採用した革新的なMRI再構成フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:50:10 GMT)
I2I-Galip: Unsupervised Medical Image Translation Using Generative Adversarial CLIP [30.5]
ペアの例が存在しないため、画像から画像への翻訳は難しい作業である。我々はイメージ・ツー・イメージ・ジェネレーティブ・アドバイザリアル・CLIP (I2I-Galip) という新しい画像・画像変換フレームワークを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:44:50 GMT)
Human-like Affective Cognition in Foundation Models [28.6]
基礎モデルにおける感情認知テストのための評価フレームワークを提案する。評価,感情,表現,結果の関係を探求する1,280の多様なシナリオを生成する。以上の結果から,基礎モデルは人間の直感と一致しがちであることが明らかとなった。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:33:54 GMT)
Enhancing Performance and Scalability of Large-Scale Recommendation Systems with Jagged Flash Attention [27.7]
Jagged Feature Interaction Kernelsは、長いカテゴリの特徴からきめ細かい洞察を抽出する新しい手法である。我々の小説『Jagged Flash Attention』は、注目度と比較して最大9倍のスピードアップと22倍のメモリ削減を実現している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:20:54 GMT)
Defending against Reverse Preference Attacks is Difficult [26.9]
大きな言語モデル(LLM)は、有害なデータセットに対する教師付き微調整(SFT)のようなトレーニング時の攻撃に対して脆弱である。本研究では,LLMが人間からのフィードバックから強化学習を行う際に,相手の報酬を用いて有害な行動を学習できるようにするために,Reverse Preference Attacks (RPA)を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:10:34 GMT)
How the (Tensor-) Brain uses Embeddings and Embodiment to Encode Senses and Decode Symbols [26.5]
近年の発展を含むテンソル脳モデルの概要について概説する。表象層は、意識研究からの象徴的なグローバルワークスペースのモデルである。インデックス層には、概念、時間インスタンス、述語のためのシンボルが含まれている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:45:38 GMT)
The Midas Touch: Triggering the Capability of LLMs for RM-API Misuse Detection [26.3]
ChatDetectorは、RM-API誤用検出のためのドキュメント理解を完全に自動化する。 ChatDetectorは、最先端のAPI検出器と比較して、98.21%の精度で165組のRM-APIを識別する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:05:13 GMT)
Generating API Parameter Security Rules with LLM for API Misuse Detection [26.3]
LLMを用いたAPIソースコード解析により,APSRの自動生成のためのGPTAidという新しいフレームワークを提案する。セキュリティクリティカルなAPIの誤用がAPSR違反によってしばしば引き起こされるという観察に基づく,実行時のフィードバックチェック手法を提案する。 GPTAidは92.3%の精度を達成し、最先端検出器の6倍のAPSRを生成する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 04:15:40 GMT)
Scaling FP8 training to trillion-token LLMs [26.2]
最大2兆トークンのデータセット上でFP8精度を使用して、大規模な言語モデルをトレーニングします。我々は,FP8トレーニングにおいて,より短い期間で観察できない重大な障害を発見した。 Smooth-SwiGLUは機能変更なしに安定したFP8トレーニングを実現する新しい修正である。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:15:58 GMT)
Revisiting Semi-supervised Adversarial Robustness via Noise-aware Online Robust Distillation [26.2]
SNORDは、現代の半教師あり学習技術を対人訓練の領域に導入するフレームワークである。 SNORDは、さまざまなデータセットとラベルの予算にまたがって、印象的で最先端のパフォーマンスを誇示している。完全な敵監督と比較すると、SNORDはエプシロン=8/255オートアタックの下で90%の相対的な堅牢な精度を達成している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:55:32 GMT)
Exploring Large Language Models for Product Attribute Value Identification [25.9]
製品属性値識別(PAVI)は、製品情報から属性とその値を自動的に識別する。既存の手法は、BARTやT5のような微調整済みの言語モデルに依存している。本稿では, LLaMA や Mistral などの大規模言語モデル (LLM) をデータ効率・ロバストなPAVI 代替品として検討する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:09:33 GMT)
The Impact of Element Ordering on LM Agent Performance [25.7]
ウェブおよびデスクトップ環境における各種要素順序付け手法の影響について検討する。我々は, 画素のみの環境において, 次元の減少が実効的な順序付けをもたらすことを見出した。本手法は,従来の最先端技術と比較して平均2倍以上のタスクを完了させる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 05:44:21 GMT)
Mutual Information-based Representations Disentanglement for Unaligned Multimodal Language Sequences [25.7]
不整合多モーダル言語列の鍵となる課題は、様々なモーダルからの情報を統合して洗練された多モーダル関節表現を得ることである。非整合多モーダル言語系列に対する相互情報に基づく表現不整合(MIRD)手法を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:12:26 GMT)
AutoVerus: Automated Proof Generation for Rust Code [25.6]
AutoVerusは大規模な言語モデル(LLM)を使用して、Rustコードの正確性証明を自動的に生成する。評価の結果,AutoVerusは90%以上の正解を自動生成できることがわかった。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 20:40:52 GMT)
MEXMA: Token-level objectives improve sentence representations [25.1]
MEXMAは、文レベルとトークンレベルの両方の目的を統合する新しいアプローチである。ある言語の文表現は、他の言語のマスキングトークンを予測するために使用され、文表現と全てのトークンがエンコーダを直接更新する。トークンレベルの目的を付加することで,複数のタスク間の文表現品質が大幅に向上することを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:00:29 GMT)
NN-Copula-CD: A Copula-Guided Interpretable Neural Network for Change Detection in Heterogeneous Remote Sensing Images [24.5]
不均一なリモートセンシング画像の変化検出は、災害監視や土地利用管理に広く利用されている。 NN-Copula-CD というコプラ誘導型ニューラルネットワークを用いた知識データ駆動型ヘテロジニアスCD法を提案する。 NN-Copula-CDでは、コプラの数学的特徴を損失関数として用い、ニューラルネットワークを監督し、両時間的ヘテロジニアススーパーピクセル対間の依存性を学習する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:32:45 GMT)
LLMR: Knowledge Distillation with a Large Language Model-Induced Reward [24.5]
大規模言語モデルは、様々な自然言語処理(NLP)タスクで顕著なパフォーマンスを示すようになった。しかし、これらのモデルは一般的に計算コストが高く、資源制約のある環境では展開が困難である。大規模言語モデルから誘導される報酬関数に基づく新しい知識蒸留(KD)法であるLLMRを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 06:27:58 GMT)
LogicPro: Improving Complex Logical Reasoning via Program-Guided Learning [24.0]
本稿では,プログラム例を通して大規模言語モデル (LLM) の論理的推論を強化するための新しいアプローチであるLogicProを提案する。私たちは、広く利用可能なアルゴリズム問題とそのコードソリューションを単純に活用することで、これを効果的に実現します。提案手法はBBH$27$, GSM8K, HellSwag, Logicqa, Reclor, RTEデータセットの複数のモデルの大幅な改善を実現する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:30:45 GMT)
Channel-Aware Domain-Adaptive Generative Adversarial Network for Robust Speech Recognition [24.0]
本稿では,頑健な音声認識訓練のためのチャネル認識データシミュレーション手法を提案する。提案手法は,チャネル抽出技術とGANの相乗効果を利用する。台湾におけるハッカ・アクロス・台湾 (HAT) と台湾・アクロス・台湾 (TAT) のコーパスについて, 相対的文字誤り率 (CER) を 20.02% と 9.64% の減少率で評価した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:02:31 GMT)
How to predict on-road air pollution based on street view images and machine learning: a quantitative analysis of the optimal strategy [23.4]
オンロード大気汚染は、放出源、希釈、物理化学的プロセスによる短距離でのかなりの変動を示す。モバイル監視データをストリートビューイメージに統合することは、局所的な大気汚染を予測することを約束する。このギャップを埋めるため,NO,NO2,PM2.5,PM10を314台のタクシーで動的に監視し,対応するSVIをサンプリングした。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:21:23 GMT)
DNI: Dilutional Noise Initialization for Diffusion Video Editing [22.3]
本稿では,非剛性編集を含む精密かつダイナミックな修正が可能なDNI(Dilutional Noise Initialization)フレームワークを提案する。 DNIは「ノイズ希釈」の概念を導入し、入力ビデオによって課される構造的剛性を和らげるために編集される領域の潜時雑音にさらなるノイズを加える。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:17:57 GMT)
Rethinking the Influence of Source Code on Test Case Generation [22.2]
大規模言語モデル(LLM)は、コンテキストとして提供されるテスト対象のソースコードでテスト生成を支援するために広く応用されている。テスト中のソースコードが間違っていれば、LLMはテストの生成時に誤用されるだろうか? 評価結果から, 誤りコードは, 正しい, 高いカバレッジ, バグ修正テストを生成する際に, LLMを著しく誤解させる可能性が示唆された。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:03:27 GMT)
Personalized Speech Recognition for Children with Test-Time Adaptation [21.9]
主に成人データに基づいて事前訓練されたオフザシェルフ自動音声認識(ASR)モデルは、子供の発話に悪影響を及ぼす傾向にある。子どもの音声認識に教師なしテスト時間適応(TTA)手法を適用する新しいASRパイプラインを考案した。以上の結果から,TTA法に適応したASRモデルは,個々の子話者の平均および統計的に,未適応のASRベースラインよりも有意に優れていた。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 21:40:07 GMT)
Should RAG Chatbots Forget Unimportant Conversations? Exploring Importance and Forgetting with Psychological Insights [21.7]
本稿では、感情的に記憶を刺激し、会話の10%未満を維持できるLUFYを提案する。その結果,会話の大部分を忘れたままの記憶の優先順位付けがユーザエクスペリエンスを著しく向上させることが示された。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:39:22 GMT)
HLLM: Enhancing Sequential Recommendations via Hierarchical Large Language Models for Item and User Modeling [21.5]
大規模言語モデル(LLM)は様々な分野で顕著な成功を収めており、いくつかの研究がレコメンデーションシステムにおいてその可能性を探求している。逐次レコメンデーションシステムを強化するために,新しい階層型大規模言語モデル (HLLM) アーキテクチャを提案する。 HLLMは,項目特徴抽出とユーザ関心モデリングの両方に 7B パラメータを利用する構成で,優れたスケーラビリティを実現している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:03:07 GMT)
ITPatch: An Invisible and Triggered Physical Adversarial Patch against Traffic Sign Recognition [21.2]
我々は,新しい攻撃ベクトル,すなわち蛍光インキを用いた,目に見えない,引き起こされる物理的敵パッチ(ITPatch)を導入し,最先端の技術を推し進める。標的の標識に慎重に設計された蛍光摂動を適用し、攻撃者は後に目に見えない紫外線を使って蛍光効果を誘発し、TSRシステムは標識を誤って分類し、交通事故を引き起こす可能性がある。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:36:54 GMT)
DiffEditor: Enhancing Speech Editing with Semantic Enrichment and Acoustic Consistency [20.3]
我々は,OODテキストシナリオの性能向上を目的とした新しい音声編集モデルであるDiffEditorを紹介する。事前学習した言語モデルから抽出した単語埋め込みを統合することで,音素埋め込みの意味情報を豊かにする。本稿では、編集境界におけるスムーズな遷移を促進し、編集された音声の全体的な流速を高めるための1次損失関数を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:11:54 GMT)
A Novel Perspective for Multi-modal Multi-label Skin Lesion Classification [20.1]
本稿ではマルチモーダルマルチラベルトランスフォーマーモデル(SkinM2Former)を用いた皮膚病変について述べる。 SkinM2Formerは、平均平均精度77.27%、平均診断精度77.85%を公開Derm7ptデータセットで達成し、最先端(SOTA)法より優れている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:31:38 GMT)
FoME: A Foundation Model for EEG using Adaptive Temporal-Lateral Attention Scaling [19.9]
FoME (Foundation Model for EEG) は適応的側方アテンションスケーリングを用いた新しいアプローチである。 FoMEは1.7TBの頭皮と頭蓋内脳波記録のデータセットで事前訓練されており、1,096kのステップで745Mのパラメータが訓練されている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 04:22:40 GMT)
What does guidance do? A fine-grained analysis in a simple setting [19.5]
誘導の力学を2つのケースで詳細に解析する。非ゼロレベルのスコア推定誤差に対して、十分な大きなガイダンスがサポートからのサンプリングにつながることを証明します。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 20:16:33 GMT)
A Lightweight and Real-Time Binaural Speech Enhancement Model with Spatial Cues Preservation [19.4]
バイノーラル音声強調は、聴覚装置から受信される雑音信号の音質と可聴性を改善することを目的としている。既存の手法は、ノイズ低減(NR)と空間的手がかり(SCP)の精度と保存の妥協に悩まされることが多い。本稿では、低周波帯域をフィルタし、残りを保ち、NRに優れた学習ベース軽量複合畳み込みネットワーク(LBCCN)を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:52:50 GMT)
SurgPLAN++: Universal Surgical Phase Localization Network for Online and Offline Inference [18.8]
本稿では,時間的検出の原理を用いて,SurgPLAN++という汎用的な外科的位相ローカライゼーションネットワークを提案する。オンライン分析のために、SurgPLAN++は、ストリーミングビデオをミラーリング、センター複製、ダウンサンプリングを通じて擬似完全ビデオに拡張するデータ拡張戦略を採用している。我々のSurgPLAN++は、オンラインモードとオフラインモードの両方で顕著なパフォーマンスを実現しています。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 05:08:33 GMT)
VCAT: Vulnerability-aware and Curiosity-driven Adversarial Training for Enhancing Autonomous Vehicle Robustness [18.3]
Vulnerability-aware and Curiosity-driven Adversarial Training (VCAT)は、悪意のある攻撃に対して自動運転車(AV)を訓練するフレームワークである。 VCATは、サロゲートネットワークを使用して、AV被害者の価値関数に適合し、被害者の固有の脆弱性に関する密集した情報を提供する。被害者防衛訓練フェーズでは、AVは、訓練済みの攻撃者が被害者の周りに配置され、攻撃行動を生成する重要なシナリオで訓練される。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:53:02 GMT)
Towards Physically-Realizable Adversarial Attacks in Embodied Vision Navigation [18.2]
本稿では,学習可能なテクスチャと不透明度を持つ対向パッチをオブジェクトにアタッチすることで,ナビゲーションを具体化するための実用的な攻撃手法を提案する。実験の結果,我々の敵パッチは航法成功率を約40%削減し,実用性,有効性,自然性において従来の手法よりも優れていた。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 04:55:24 GMT)
LLM-Measure: Generating Valid, Consistent, and Reproducible Text-Based Measures for Social Science Research [18.1]
本稿では,大規模言語モデル(LLM)の内部隠れ状態を利用して概念尺度を生成する手法を提案する。 3つの複製研究は、高い妥当性、一貫性、再現可能なテキストベースの尺度を生成する方法の有効性を示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:44:00 GMT)
LVCD: Reference-based Lineart Video Colorization with Diffusion Models [18.1]
参照型リニアトビデオのカラー化のための第1のビデオ拡散フレームワークを提案する。我々は、大規模な事前学習ビデオ拡散モデルを利用して、カラー化されたアニメーションビデオを生成する。提案手法は高品質で長時間の時間一貫性のあるアニメーションビデオを生成することができる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:59:48 GMT)
Adversarial Attack for Explanation Robustness of Rationalization Models [17.8]
合理化モデルは、人間が予測を理解し、信頼するために、入力テキストのサブセットを選択する。本論文は, 合理化モデルの説明可能性について, 予測を変更せずに損なうことを目的としている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:24:02 GMT)
Is it Still Fair? A Comparative Evaluation of Fairness Algorithms through the Lens of Covariate Drift [17.5]
データ分散ドリフトとその公正度アルゴリズムとメトリクスへの影響について検討する。場合によっては、データ分布のドリフトは、いわゆるフェアモデルにおいて、フェアネスの深刻な劣化を引き起こすことがある。本研究の成果から,データ分散ドリフトが公正性アルゴリズムにもたらすいくつかの政策的含意を合成する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:18:12 GMT)
Leveraging Retrieval Augment Approach for Multimodal Emotion Recognition Under Missing Modalities [16.8]
我々は,Multimodal Emotion Recognition(RAMER)の欠如に対する検索機能強化の新たな枠組みを提案する。我々のフレームワークは、欠落したモダリティMERタスクにおける最先端のアプローチよりも優れている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:31:12 GMT)
LLM Surgery: Efficient Knowledge Unlearning and Editing in Large Language Models [16.7]
大規模言語モデル(LLM)は、様々なドメインに革命をもたらしたが、そのユーティリティには、事前トレーニング中に埋め込まれた時代遅れまたは問題のある知識に関する課題が伴っている。本稿では, ゼロから再学習することなく, 新たな知識を効率的に統合しながら, 問題や時代遅れの情報を解き放つため, LLMを変更するという課題に対処する。 Llama2-7B を用いて,LLM 手術は未学習のセットを忘れて,更新セットの精度が20%向上し,保持セットの性能が維持できることを実証した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 19:07:01 GMT)
Learning Multi-Manifold Embedding for Out-Of-Distribution Detection [16.3]
オフ・オブ・ディストリビューション(OOD)サンプルは、現実世界のアプリケーションにおいて信頼できるAIにとって不可欠である。本稿では,OOD検出の強化を目的としたMMEL(Multi-Manifold Embedding Learning)フレームワークを提案する。 MMELは代表埋め込みを生成し、OODサンプルの識別にプロトタイプ認識スコアリング機能を利用する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 05:43:00 GMT)
HeadCT-ONE: Enabling Granular and Controllable Automated Evaluation of Head CT Radiology Report Generation [16.1]
HeadCT-ONEは、関係正規化エンティティ抽出による頭部CTレポート生成を評価するメトリクスである。 HeadCT-ONEは正規化されたエンティティとリレーションを比較し、異なるエンティティタイプや特定のエンティティのコントロール可能な重み付けを可能にする。以上の結果から,ヘッドCT-ONEはより柔軟で,制御可能で,粒度の高い頭部CTレポートの自動評価を可能にした。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:20:11 GMT)
Unsupervised Hyperspectral and Multispectral Image Blind Fusion Based on Deep Tucker Decomposition Network with Spatial-Spectral Manifold Learning [15.9]
タッカー分解と空間スペクトル多様体学習(DTDNML)に基づくハイパースペクトル・マルチスペクトル画像の教師なしブラインド融合法を提案する。本手法は,様々なリモートセンシングデータセット上でのハイパースペクトルとマルチスペクトル融合の精度と効率を向上させる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 04:31:01 GMT)
Linguistic Minimal Pairs Elicit Linguistic Similarity in Large Language Models [15.9]
我々はLarge Language Models(LLMs)が捉えた言語知識の定量化と洞察を得る。 3つの言語で100以上のLLMと150k以上の最小ペアにまたがる大規模な実験では、4つの重要な側面から言語的類似性の特性を明らかにした。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:29:40 GMT)
TEAM: Temporal Adversarial Examples Attack Model against Network Intrusion Detection System Applied to RNN [14.5]
我々は,textbfTemporal adversarial textbfExamples textbfAttack textbfModel textbf(TEAM)と呼ばれる特徴再構成に基づく新しいRNN敵攻撃モデルを提案する。ほとんどの攻撃カテゴリーでは、TEAMはブラックボックスとホワイトボックスの両方でのNIDSの誤判定率を改善し、96.68%以上に達する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 05:26:04 GMT)
Assessing the Zero-Shot Capabilities of LLMs for Action Evaluation in RL [14.1]
信用割当問題は強化学習(RL)における中心的な課題であるクレジット・アサインメント・ウィズ・ランゲージ・モデル(CALM)は、報酬形成とオプション発見を通じてクレジット・アサインメントを自動化する新しいアプローチである。予備的な結果は、大規模言語モデルの知識が、RLにおける信用代入の有望な先行であることを示している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:08:09 GMT)
Adaptive Selection of Sampling-Reconstruction in Fourier Compressed Sensing [13.8]
圧縮センシング(CS)は、ナイキストサンプリングの非効率性を克服するために出現している。ディープラーニングベースの再構築は、最適化ベースの再構築に代わる有望な代替手段である。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:54:58 GMT)
An Empirical Study on the Distance Metric in Guiding Directed Grey-box Fuzzing [13.4]
Directed gray-box fuzzing (DGF)は、特定のコード領域の脆弱性を効率的に発見することを目的としている。距離の異なるメトリクスがファジィングプロセスをどのようにガイドし、ファジィングの結果に影響を及ぼすかについては、いまだ不透明である。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:15:54 GMT)
Multi-Scale Feature Prediction with Auxiliary-Info for Neural Image Compression [13.1]
本稿では,ニューラルビデオ圧縮にインスパイアされた補助粗いネットワークと主ネットワークからなる新しい予測構造を導入する。我々のモデルは、他のニューラル画像圧縮モデルより優れており、Tecnickデータセット上のVVCよりも19.49%高い速度歪み性能を実現している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:41:53 GMT)
Improved Image Classification with Manifold Neural Networks [13.0]
グラフニューラルネットワーク(GNN)は、さまざまな学習タスクで人気を集めている。本稿では,一般データ表現におけるGNNの可能性,特に画像領域における検討を行う。分類タスクにおいて、画像ラベルに対応するノードラベルを予測するためにGNNを訓練し、GNNの収束を利用してGNNの一般化を分析する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 19:55:33 GMT)
Prompts Are Programs Too! Understanding How Developers Build Software Containing Prompts [13.0]
いくつかの形態のプロンプトはプログラムであり、プロンプトの開発はプログラミングにおいて異なる現象であると主張する。私たちの観察では、迅速なプログラミングは従来のソフトウェア開発と大きく異なることが示されています。我々の発見は、ソフトウェア工学の実践者、教育者、研究者に影響を及ぼす。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:55:49 GMT)
Deep generative models as an adversarial attack strategy for tabular machine learning [13.0]
我々は4つの人気のDeep Generative Model(DGM)を逆DGM(AdvDGM)に適用する。ドメイン制約に適合した現実的な逆例を生成する上での有効性を評価する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 10:41:23 GMT)
SpecEval: Evaluating Code Comprehension in Large Language Models via Program Specifications [12.7]
プログラム仕様を用いて,大規模言語モデルにおけるコード理解を評価するためのSpecEvalを提案する。プログラムのセマンティクスを表現し、徹底的な評価を行うために、正式な仕様を採用する。特に、4つの仕様関連タスクは、基本的なレベルから高度なレベルまでLLMの能力を評価するように設計されている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:08:39 GMT)
PersonaFlow: Boosting Research Ideation with LLM-Simulated Expert Personas [12.6]
研究アイデアを支援するためにペルソナシミュレーションを用いたLLMシステムであるペルソナフローを紹介する。以上の結果から,複数のペルソナをアイデア作成中に使用すると,ユーザ認識の質が著しく向上することが示唆された。ユーザのペルソナカスタマイズインタラクションは、生成したアイデアのコントロールとリコールの感覚を大幅に改善した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:54:29 GMT)
UL-VIO: Ultra-lightweight Visual-Inertial Odometry with Noise Robust Test-time Adaptation [12.5]
視覚-慣性整合性に基づくテスト時間適応(TTA)が可能な超軽量 (1M) 視覚慣性オドメトリー (VIO) ネットワークを提案する。 KITTIデータセットで1分間のエラー増加 – 1% – で、最先端のネットワークサイズよりも36倍小さなネットワークサイズを実現している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 22:24:14 GMT)
Representing Positional Information in Generative World Models for Object Manipulation [12.3]
本稿では,世界モデルに基づくエージェントがオブジェクト配置タスクを解くための汎用的アプローチを提案する。特にLCPでは、目標仕様のためのオブジェクトの位置情報を明示的にキャプチャするオブジェクト中心の潜在表現を採用している。提案手法は複数の操作環境にまたがって厳密に評価され,現行のモデルベース制御手法と比較して良好な性能を示した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:38:06 GMT)
Communication-Efficient Federated Low-Rank Update Algorithm and its Connection to Implicit Regularization [12.0]
フェデレートラーニング(FL)は、コミュニケーション効率と不均一性に関連する重要な課題に直面している。我々はフェデレート学習のための一般的な低ランク更新フレームワークであるFedLoRUを提案する。我々のフレームワークは、低ランククライアント側の更新を強制し、これらの更新を蓄積して高ランクモデルを作成します。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 00:11:58 GMT)
Don't be Fooled: The Misinformation Effect of Explanations in Human-AI Collaboration [11.8]
我々は,人間がXAIに支えられたAIによる意思決定について研究している。その結果,誤った説明が正しいAIアドバイスに付随する場合に誤報が生じることがわかった。この効果は、人間が欠陥のある推論戦略を推測し、タスクの実行を妨げ、手続き的知識の障害を示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:34:20 GMT)
Interpretable Action Recognition on Hard to Classify Actions [11.6]
人間は、明確に認識された物体と部分の間の批判的時間的関係を認識することによって、ビデオにおける複雑な活動を認識する。これを模倣するために、物体と手の位置と動きを利用したモデルを構築し、その活動が起こっていることを認識します。このモデルを改善するために、最も混乱した3つのクラス(このモデル)に注目し、3D情報の欠如が大きな問題であることを確認した。オブジェクトの形状情報を既存のオブジェクトの特徴に統合するために,“Container”と“NotContainer”の違いを決定するために,最先端のオブジェクト検出モデルを微調整した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 21:23:44 GMT)
Connecting Ideas in 'Lower-Resource' Scenarios: NLP for National Varieties, Creoles and Other Low-resource Scenarios [11.5]
少数の言語のベンチマークによる優れた結果にもかかわらず、大規模な言語モデルは、低リソースのシナリオにある言語からテキストを処理するのに苦労している。このチュートリアルでは、自然言語処理(NLP)研究における共通の課題、アプローチ、テーマを特定し、データ・ポーア・コンテキストに固有の障害に直面し克服する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:48:42 GMT)
Counterfactual Explanations for Clustering Models [11.4]
クラスタリングアルゴリズムは、理解が難しい複雑な最適化プロセスに依存している。本稿では,クラスタリングアルゴリズムを非現実的文で説明するための,モデルに依存しない新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 10:05:58 GMT)
LMT-Net: Lane Model Transformer Network for Automated HD Mapping from Sparse Vehicle Observations [11.4]
Lane Model Transformer Network (LMT-Net) は、エンコーダとデコーダのニューラルネットワークアーキテクチャであり、ポリリン符号化を実行し、レーンペアとその接続性を予測する。我々は、複数の車両観測と、地上真実(GT)としての人間のアノテーションからなる内部データセット上でのLMT-Netの性能を評価する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:14:35 GMT)
Cross-Chirality Palmprint Verification: Left is Right for the Right Palmprint [11.4]
本稿では,従来のパームプリント検証システムにおける従来の知恵に挑戦する,新しいCCPVフレームワークを提案する。通常、左右両方のヤシプリントを保存する必要がある既存の方法とは異なり、本手法では、ヤシプリントテンプレートを1つだけ保存しながら、ヤシプリントを使用することが可能である。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 19:10:21 GMT)
Gender Representation and Bias in Indian Civil Service Mock Interviews [11.3]
男女の偏見は、男女の候補者に質問する質問の幅広い性質に見受けられる。大きな言語モデルを用いた実験は、説明に性別バイアスが強く存在することを示している。本稿では,今後の社会科学研究に有用な51,278質問のデータセットを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:56:26 GMT)
Text2Traj2Text: Learning-by-Synthesis Framework for Contextual Captioning of Human Movement Trajectories [11.3]
本稿では,小売店舗における買い物客の軌跡データの背後にあるコンテキストをキャプションする新しい学習・キャプションフレームワークであるText2Traj2Textを提案する。私たちの仕事は、ターゲット広告や在庫管理など、より良い顧客理解を必要とするさまざまな小売アプリケーションに影響を与えます。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:30:09 GMT)
Pay Attention to What Matters [10.9]
命令トークンの注意点を機械的に増加させる,GUIDE と呼ばれるシンプルで効果的な手法を提案する。この操作を支援するために,ユーザの指示がトランス層を通してどのように伝播するかを強調する新しい指標であるEmpfectを提案する。以上の結果から,GUIDEは命令の精度を29.4%から60.4%に向上し,自然刺激の代替品や100万トークンのスーパービジョンファインチューニングよりも優れていた。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:26:50 GMT)
Enhancing Synthetic Training Data for Speech Commands: From ASR-Based Filtering to Domain Adaptation in SSL Latent Space [10.9]
我々は、音声コマンド分類の特定のタスクに対して、合成音声データを用いてゼロショット学習に関する一連の実験を行う。 Google Speech Commands データセットの結果から,単純な ASR ベースのフィルタリング手法が生成したデータの品質に大きな影響を及ぼす可能性が示唆された。生成した音声データの品質は高いが,自己教師付き(WavLM)機能を用いることで,合成音声と実音声の区別が容易に可能であることを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:07:55 GMT)
Disentangling Recognition and Decision Regrets in Image-Based Reinforcement Learning [10.7]
画像に基づく強化学習では、性能と急激な相関や意思決定に無関係な特徴が一般化性能の低下につながる可能性がある。我々は,2つの誤りの原因を解き明かすために,認識の後悔と決定の後悔という概念を導入する。本稿では,迷路環境とアタリゲームポンの両面において,過度に特有の表現と過小な表現の両方による観測過適合の例を示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 22:26:36 GMT)
StoryMaker: Towards Holistic Consistent Characters in Text-to-image Generation [10.7]
StoryMakerは、顔の整合性だけでなく、衣服、髪型、身体の整合性も保持するパーソナライズソリューションである。 StoryMakerは多くのアプリケーションをサポートし、他のソーシャルプラグインと互換性がある。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:53:06 GMT)
KnowFormer: Revisiting Transformers for Knowledge Graph Reasoning [10.4]
メッセージパッシングの観点から知識グラフの推論を行うために KnowFormer.KnowFormer を提案する。構造情報を自己認識機構に組み込むため,クエリ,キー,値を計算する構造認識モジュールを導入する。実験結果から, トランスダクティブベンチマークとインダクティブベンチマークの両方において, 顕著なベースライン手法と比較して, KnowFormer の優れた性能を示した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:08:10 GMT)
Using Large Language Models to Generate Clinical Trial Tables and Figures [10.3]
テーブル、フィギュア、リスト(TFL)は臨床試験データを要約するための重要なツールである。本研究では,TFLの自動生成における大規模言語モデル (LLM) の利用について,素早い工学的手法と数発の転写学習を用いて検討した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:48:43 GMT)
Trust-informed Decision-Making Through An Uncertainty-Aware Stacked Neural Networks Framework: Case Study in COVID-19 Classification [10.3]
本研究は、放射線画像から新型コロナウイルスの信頼できる分類のための、不確実性を考慮した重畳ニューラルネットワークモデルを提案する。このモデルは、確実な正確な予測を正確に識別することに焦点を当て、不確実性を考慮したモデリングにおける重要なギャップに対処する。このアーキテクチャはモンテカルロのドロップアウトやアンサンブル技術を含む不確実な定量化手法を統合し、予測信頼性を高める。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 04:20:12 GMT)
Enhancing Knowledge Distillation of Large Language Models through Efficient Multi-Modal Distribution Alignment [10.1]
本稿では,教師モデルと学生モデルとのピーク予測の整合性を促進するために,ランキング損失に基づく知識蒸留(RLKD)を提案する。提案手法は,教師モデルのマルチモーダル分布をよりよく学習し,様々な下流タスクにおいて顕著な性能向上をもたらす。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:06:42 GMT)
Data Poisoning and Leakage Analysis in Federated Learning [10.1]
データ中毒と漏洩のリスクは、現実世界におけるフェデレートされた学習の大規模展開を妨げる。この章では、データプライバシー侵害のエミュレーションとデータ中毒のエミュレーションという2つの支配的脅威を理解するための真実と落とし穴を明らかにします。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:50:29 GMT)
Hierarchical Gradient-Based Genetic Sampling for Accurate Prediction of Biological Oscillations [9.9]
生体振動に対するニューラルネットワーク予測の精度を向上させる階層的勾配に基づく遺伝的サンプリング(HGGS)フレームワークを提案する。実験の結果,HGGSは4つの生体系において7つの比較サンプリング法より優れていた。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:41:54 GMT)
A dynamic vision sensor object recognition model based on trainable event-driven convolution and spiking attention mechanism [9.7]
Spiking Neural Networks(SNN)は、ダイナミックビジュアルセンサー(DVS)からのイベントストリームを処理するのに適している DVSオブジェクトから特徴を抽出するために、SNNは通常、固定されたカーネルパラメータでイベント駆動の畳み込みを使用する。トレーニング可能なイベント駆動型畳み込みとスパイク注意機構を利用するDVSオブジェクト認識モデルを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:01:05 GMT)
Online Proximal ADMM for Graph Learning from Streaming Smooth Signals [9.3]
我々は,潜伏グラフ上でスムーズな観測ストリームを用いたオンライングラフ学習のための新しいアルゴリズムを開発した。我々のモダス・オペランは、グラフ信号を逐次処理し、メモリと計算コストを抑えることです。提案手法は,現在最先端のオンライングラフ学習ベースラインと比較して,(準最適性の観点から)追跡性能が向上することを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:12:03 GMT)
Optimal or Greedy Decision Trees? Revisiting their Objectives, Tuning, and Performance [9.3]
近年,精度を直接最適化する最適決定木 (ODT) 手法への関心が高まっている。我々は,ODTの比較的探索されていない2つの側面を同定する。最適手法の値は、文献が矛盾する結果をもたらすため、まだ十分に理解されていない。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:55:29 GMT)
Nigerian Software Engineer or American Data Scientist? GitHub Profile Recruitment Bias in Large Language Models [9.0]
私たちはOpenAIのChatGPTを使って、4つのリージョンからGitHub User Profileを使って6人のソフトウェア開発チームを募集しています。結果から,ChatGPTは2つのプロファイルの位置情報文字列をスワップしても,他のリージョンよりも好みを示すことがわかった。 ChatGPTは特定の国のユーザに特定の開発者ロールを割り当てる傾向があり、暗黙の偏見が浮かび上がっていた。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:04:30 GMT)
Cloudy with a Chance of Anomalies: Dynamic Graph Neural Network for Early Detection of Cloud Services' User Anomalies [9.0]
本稿では,クラウドサービスグラフに基づく異常検出 (CS-GAD) のための,先駆的な時間ベースの埋め込み手法を提案する。本手法では動的三部グラフ表現を用いて,クラウドサービス,ユーザ,それらの活動間の相互作用を時間とともにカプセル化する。その結果,有望な方法に比べて偽陽性率(2-9%)が顕著に低下し,真陽性率(100%)が低下した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:50:31 GMT)
Retrieval-Augmented Test Generation: How Far Are We? [8.8]
Retrieval Augmented Generation (RAG)は、ソフトウェアエンジニアリングタスクの顕著な進歩を示している。このギャップを埋めるために,テスト生成におけるRAGベースのLCMの有効性を検討する。具体的には,1) APIドキュメント,2) GitHubイシュー,3) StackOverflow Q&Aの3種類のドメイン知識に基づいて構築されたRAGについて検討する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:48:29 GMT)
CF-GO-Net: A Universal Distribution Learner via Characteristic Function Networks with Graph Optimizers [8.8]
本稿では,分布に直接対応する確率的記述子である特徴関数(CF)を用いる手法を提案する。確率密度関数 (pdf) とは異なり、特徴関数は常に存在するだけでなく、さらなる自由度を与える。提案手法では,訓練済みのオートエンコーダなどの事前学習モデルを使用することで,特徴空間で直接学習することができる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:33:12 GMT)
MGSO: Monocular Real-time Photometric SLAM with Efficient 3D Gaussian Splatting [8.6]
本稿では,光メトリックSLAMと3DGSを統合した新しいリアルタイムSLAMシステムであるMonocular GSOを提案する。本システムでは, 品質, メモリ効率, 速度のバランスを保ち, 再現性を向上する。現代のシステムを超えているだけでなく、ラップトップのハードウェアの性能も維持していることを示す実験も行っています。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 19:07:05 GMT)
Efficient Identification of Direct Causal Parents via Invariance and Minimum Error Testing [8.4]
ICPの識別可能性問題に対処するために,誤り不等式を用いたMMSE-ICPと高速ICPを提案する。不等式は、因果親を用いた予測器の最小誤差が全ての予測器の中で最小であることを示す。 MMSE-ICP と fastICP は、多くのシミュレーションにおいて競合するベースラインを上回るだけでなく、大規模な実データベンチマークで最先端の結果が得られる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:07:31 GMT)
BGDB: Bernoulli-Gaussian Decision Block with Improved Denoising Diffusion Probabilistic Models [8.3]
生成モデルは、複雑な特徴空間を構築することによって識別的分類器を強化することができる。本稿では,Bernolli-Gaussian Decision Block (BGDB)を提案する。具体的には,改良拡散確率モデル(IDDPM)を用いてベルヌーイ裁判の確率をモデル化する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 22:52:55 GMT)
COCO-Occ: A Benchmark for Occluded Panoptic Segmentation and Image Understanding [8.3]
本稿では,COCO画像を3つの認知閉塞レベルに手動でラベル付けすることで,COCOデータセットから派生した大規模データセットCOCO-Occを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:26:28 GMT)
Shape-informed surrogate models based on signed distance function domain encoding [8.1]
パラメータ化偏微分方程式(PDE)の解を近似する代理モデルを構築するための非侵入的手法を提案する。我々のアプローチは2つのニューラルネットワーク(NN)の組み合わせに基づいている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:47:04 GMT)
RAD-Bench: Evaluating Large Language Models Capabilities in Retrieval Augmented Dialogues [8.0]
RAD-Benchは、検索後のマルチターン対話における大規模言語モデルの能力を評価するために設計されたベンチマークである。また, LLM の評価結果から, モデルの性能が劣化し, 追加の条件や制約が適用されることが判明した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:26:45 GMT)
Program Slicing in the Era of Large Language Models [8.0]
プログラムスライシングはソフトウェア工学において重要なテクニックであり、開発者は関連するコードの部分を分離することができる。本研究では,大規模言語モデル(LLM)の静的スライシングおよび動的プログラムスライシングへの応用について検討する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 00:07:56 GMT)
Arena 4.0: A Comprehensive ROS2 Development and Benchmarking Platform for Human-centric Navigation Using Generative-Model-based Environment Generation [7.9]
本稿では、Arena 3.0、Arena-Bench、Arena 1.0、Arena 2.0の大幅な進歩であるArena 4.0を紹介する。 Arena 4.0は、(1)生成モデルに基づく世界とシナリオ生成アプローチ、(2)包括的な3Dモデルデータベース、(3)ROS 2.0への完全移行の3つの重要な貢献を提供する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 05:20:13 GMT)
Towards Testing and Evaluating Vision-Language-Action Models for Robotic Manipulation: An Empirical Study [7.9]
視覚言語アクション(VLA)モデルは、ロボット操作を前進させる可能性について多くの注目を集めている。 VLAモデルによって提供されるエンドツーエンドの知覚制御ループにもかかわらず、そのようなモデルの能力を包括的に理解する能力は欠如している。 VLAモデルの性能を評価するために,多様なロボット操作シーンを自動的に生成するテストフレームワークであるVLATestを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:33:00 GMT)
A sound description: Exploring prompt templates and class descriptions to enhance zero-shot audio classification [7.6]
ゼロショット音声分類のための代替プロンプトテンプレートについて検討し、高い性能のオプションの存在を実証する。本研究は, クラス記述の促進により, 周囲の音声データセット間でのゼロショット音声分類の結果が得られたことを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:27:50 GMT)
Optimizing food taste sensory evaluation through neural network-based taste electroencephalogram channel selection [7.6]
味覚刺激によって誘発される味覚脳波(EEG)は、異なる脳パターンを反映し、食品の感覚評価などの用途に使用できる。本稿では,注意を伴うクラスアクティベーションマッピング (CAM-Attention) と呼ばれるチャネル選択手法を提案する。優れた認識性能を有し、味覚評価に有効な技術サポートを提供する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:36:22 GMT)
On the Regret of Coded Caching with Adversarial Requests [7.2]
オンライン学習フレームワークにおいて、よく知られた符号化キャッシュ問題について検討し、リクエストが順次到着する。本稿では、Follow-The-Perturbed-Leader原則に基づくキャッシュポリシーを導入し、任意の時間水平線Tにおいて、算術的O(sqrt(T))に対するサブ線形後悔を実現することを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:13:03 GMT)
PoTATO: A Dataset for Analyzing Polarimetric Traces of Afloat Trash Objects [7.1]
水生環境のプラスチック廃棄物は海洋生物や人間の健康に深刻なリスクをもたらす。ディープラーニングはこのタスクの強力なツールとして広く利用されているが、その性能は屋外の光条件と水面反射によって著しく制限されている。 12,380個のラベル付きプラスチックボトルとリッチ偏光情報を含むデータセットPoTATOを紹介する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:21:24 GMT)
Trustworthy Intrusion Detection: Confidence Estimation Using Latent Space [7.1]
侵入検知システム(IDS)における異常検出の信頼性向上のための新しい手法を提案する。遅延空間表現に基づく信頼度尺度の開発により,サイバー攻撃に対するIDS予測の信頼性向上を目指す。 NSL-KDDデータセットの適用により,通常のネットワークアクティビティと悪意のあるネットワークアクティビティを効果的に区別するバイナリ分類タスクに焦点をあてる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:09:44 GMT)
The Robustness of Spiking Neural Networks in Communication and its Application towards Network Efficiency in Federated Learning [7.0]
スパイキングニューラルネットワーク(SNN)は最近、組み込みデバイスでのオンチップ学習に多大な関心を集めている。本稿では,フェデレートラーニングにおける雑音の多いコミュニケーション下でのSNNの本質的ロバスト性について検討する。 FLトレーニングにおける帯域幅の削減を目的とした,TopKスパシフィケーションを用いた新しいフェデレートラーニングアルゴリズムを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:37:18 GMT)
jina-embeddings-v3: Multilingual Embeddings With Task LoRA [6.9]
jina-embeddings-v3は5億7000万のパラメータを持つ新しいテキスト埋め込みモデルである。多言語データと長文検索タスクで最先端のパフォーマンスを実現する。最大8192トークンのコンテキスト長をサポートする。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:21:24 GMT)
Generation and Editing of Mandrill Faces: Application to Sex Editing and Assessment [6.8]
本稿では,男性や女性のマンドリルの顔画像を生成する手法を提案する。提案手法の主な特徴は、特定のGANの潜伏空間における性軸を特定することによって、性別を編集する能力である。さらに,実画像の分布から抽出した統計的特徴に基づく性別レベルの評価も行った。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:30:50 GMT)
The Gaussian Discriminant Variational Autoencoder (GdVAE): A Self-Explainable Model with Counterfactual Explanations [6.7]
視覚的対物的説明(CF)法は、画像の概念を変更し、予測を事前に定義された結果に変更する。本稿では,条件付き変分オートエンコーダ(CVAE)とCF説明の統合に基づく自己説明可能なモデルであるGdVAEを紹介する。 CFsの整合性は、説明関数で潜在空間を正規化することによって改善される。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:58:15 GMT)
ARTAI: An Evaluation Platform to Assess Societal Risk of Recommender Algorithms [6.7]
ARTAIは,推薦アルゴリズムの大規模評価を可能にする評価環境である。本稿では,コンテンツ配信における有害なパターンを大規模に評価できる評価環境ARTAIを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:39:51 GMT)
MambaClinix: Hierarchical Gated Convolution and Mamba-Based U-Net for Enhanced 3D Medical Image Segmentation [6.7]
医用画像分割のための新しいU字型アーキテクチャであるMambaClinixを提案する。 MambaClinixは、階層的なゲート畳み込みネットワークとMambaを適応的なステージワイドフレームワークに統合する。以上の結果から,MambaClinixは低モデルの複雑さを維持しつつ高いセグメンテーション精度を達成できることが示唆された。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:51:14 GMT)
Fear and Loathing on the Frontline: Decoding the Language of Othering by Russia-Ukraine War Bloggers [6.6]
その他に、外集団を内集団と根本的に異なるものとして描写する行為は、しばしばそれらを現実的な脅威とみなすようにエスカレートする。ドイツやルワンダの少数民族に対するジェノサイドの極端な歴史的例から、米国やヨーロッパの移民を標的とした暴力や修辞学まで、これらのダイナミクスは驚くほど広範囲に及んでいる。我々のフレームワークは、他者のダイナミクスに関する深い洞察を提供するように設計されており、迅速な適応プロセスと組み合わせて、他者の社会的結束に対する悪影響を緩和するための重要なツールを提供する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 19:56:03 GMT)
AutoMode-ASR: Learning to Select ASR Systems for Better Quality and Cost [6.5]
AutoMode-ASRは複数のASRシステムを統合し、コストを最適化しながら全体の転写品質を向上させる。 2つのシステム間の選好を決定するバイナリ分類器を組み込むことでこれを実現できる。その結果、WERの相対的な削減は16.2%、コスト削減は65%、スピード改善は75%であった。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 05:34:52 GMT)
Towards Unbiased Evaluation of Time-series Anomaly Detector [6.5]
時系列異常検出(TSAD)は、その重要な応用に動機付けられた研究の進化する領域である。本研究では,平衡点調整(BA)と呼ばれる代替調整プロトコルを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 19:02:45 GMT)
DenoMamba: A fused state-space model for low-dose CT denoising [6.5]
低線量CT(LDCT)は放射線曝露に伴う潜在的なリスクを低くする。 LDCT denoisingは、基礎となる組織信号からの線量減少によって引き起こされるノイズを分離するために、データ駆動画像の事前学習を行うニューラルネットワークモデルに基づいている。 DenoMambaは、状態空間モデリング(SSM)に基づく、医療画像の短距離および長距離コンテキストを効率的にキャプチャする新しいデノナイジング手法である。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 21:32:07 GMT)
Improving Cone-Beam CT Image Quality with Knowledge Distillation-Enhanced Diffusion Model in Imbalanced Data Settings [6.2]
毎日のコーンビームCT(CBCT)画像は、治療調整の要点であり、組織密度の精度が低い。治療中のCBCTデータを最大化し, 疎対ファンビームCTで補完した。本手法はRTにおけるCBCTスキャンから高画質CT画像を生成する上で有望であることを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:56:06 GMT)
A quest through interconnected datasets: lessons from highly-cited ICASSP papers [6.0]
我々は,ICASSP(International Conference on Acoustics, Speech, and Signal Processing)において,トップ5の引用論文に関連するデータセットの利用状況について検討する。この方法では、使用済みデータセットの起源を徹底的に分析し、しばしば公式論文で報告された以上の検索を行なわなければならない。特に、より大きく、おそらく生成可能なAIモデルへの現在のプルでは、データ証明に対する説明責任の必要性に対する認識が高まっている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:25:57 GMT)
Vision Language Models Can Parse Floor Plan Maps [5.9]
視覚言語モデル(VLM)は、多くのタスクに取り組むために画像とテキストを同時に推論することができる。本稿では,VLMコンテキスト内で探索されていない新しいタスクであるmap parsingに焦点を当てる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:36:28 GMT)
Evolution and challenges of computer vision and deep learning technologies for analysing mixed construction and demolition waste [5.7]
本稿では,高度自動混合C&DW管理システム開発における課題と機会について考察する。我々は,DLに基づく視覚的手法が最適解であるとして,様々なC&DW分析手法を概説する。また、C&DWデータセット、そのキュレーション、作成のための革新的な方法についても論じる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 22:38:26 GMT)
pyrtklib: An open-source package for tightly coupled deep learning and GNSS integration for positioning in urban canyons [5.6]
本稿では,広く利用されているオープンソースツールRTKLIBのPythonバインディングであるpyrtklibを紹介する。我々は,新しいディープラーニングフレームワークであるpyrtklibの下で,ディープラーニングサブシステムを提案する。 pyrtklibを使用することで、開発者はディープラーニング支援アルゴリズムを簡単かつ迅速に実装できる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:47:47 GMT)
PMR-Net: Parallel Multi-Resolution Encoder-Decoder Network Framework for Medical Image Segmentation [5.6]
並列マルチ解像度エンコーダデコーダネットワーク,すなわちPMR-Netを提案する。提案したPMR-Netは,5つの公開データセットの最先端手法よりも,より正確なセグメンテーション結果が得られる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:45:08 GMT)
Experimental sample-efficient quantum state tomography via parallel measurements [5.4]
我々は、量子重畳トモグラフィ(PQST)にインスパイアされた効率的な量子状態トモグラフィー法を開発した。 PQSTは測定回数を大幅に削減し、ショットノイズに対してより多くの効果を提供する。その結果,PQSTは測定コストを低減し,75および99の観測可能な6kbitおよび9kbitのW状態から98.68%,95.07%の忠実度を得た。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:34:50 GMT)
Multi-View Adaptive Contrastive Learning for Information Retrieval Based Fault Localization [5.2]
MACL-IRFL(Multi-View Adaptive Contrastive Learning for Information Retrieval Fault Localization)という新しい手法を提案する。まず、レポート・コード・インタラクション・ビュー、レポート・レポートの類似性ビュー、コード・コードの共引用ビューを別々に生成し、グラフニューラルネットワークを用いて、埋め込みプロセスの3つのビューからバグレポートやソースコードファイルの情報を集約する。コントラスト学習タスクの設計では,バグレポートの表現は,レポートレポートやレポートコードビューで共有される情報をエンコードし,ソースコードファイルの表現はコードコードとレポートコードビューで共有する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:20:10 GMT)
TACE: Tumor-Aware Counterfactual Explanations [5.1]
tumor Aware Counterfactual Explanations (TACE) は、医用画像の信頼性の高い偽物説明を生成するために設計されたフレームワークである。提案手法は, 従来の最先端技術よりも, 品質, 忠実度, 生成速度をはるかに上回っていることがわかった。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:38:08 GMT)
METDrive: Multi-modal End-to-end Autonomous Driving with Temporal Guidance [5.1]
我々は,ego状態の組込み時系列特徴から時間的ガイダンスを利用する,エンド・ツー・エンドのMETDriveを紹介する。 CARLAリーダボードのLongest6ベンチマークでMETDriveを評価し,運転スコア70%,経路完了スコア94%,屈折スコア0.78を達成した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:27:40 GMT)
Profiling Patient Transcript Using Large Language Model Reasoning Augmentation for Alzheimer's Disease Detection [5.0]
アルツハイマー病(AD)は認知症の主要な原因であり、徐々に音声や言語能力の低下が特徴である。近年の深層学習は自発音声によるAD自動検出を容易にする。各発話中のテキストパターンを,患者の言語的特徴をグローバルに把握せずに直接モデル化する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:58:07 GMT)
Federated Learning with Quantum Computing and Fully Homomorphic Encryption: A Novel Computing Paradigm Shift in Privacy-Preserving ML [4.9]
フェデレートラーニング(Federated Learning)は、複数の学習クライアントがプライベートデータを公開せずにモデル知識を共有できるようにする、従来の方法に代わるプライバシ保護手法である。この研究は、古典層と量子層の両方を統合するフェデレート学習ニューラルネットワークアーキテクチャに完全同型暗号化スキームを適用した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:05:48 GMT)
Quantum synchronization in one-dimensional topological systems [4.7]
量子系におけるシンクロナイゼーションは、中心サイトへの散逸を適用して誘導することができる。トポロジカルエッジ状態に由来する2種類の同期は、境界点間の対角線外あるいは対角線の相関によって特徴づけられる。注目すべきは、同期振動は熱力学的限界において安定した振幅と周波数を維持することである。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:03:09 GMT)
CraftRTL: High-quality Synthetic Data Generation for Verilog Code Models with Correct-by-Construction Non-Textual Representations and Targeted Code Repair [4.6]
本稿では,従来手法の合成データを用いて,Verilog 符号化における微調整 LLM の解析を行った。我々は、非テクスト表現の扱いの困難さと、ランダムに「マイナー」ミスを犯すモデルによるトレーニング中の大きな変動の2つを識別する。我々の微調整されたStarcoder2-15Bは、VerilogEval-Machine, VerilogEval-Human, RTLLMで3.8%、10.9%、pass@1で6.6%、最先端の結果よりも優れています。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:15:55 GMT)
Enhancing Agricultural Environment Perception via Active Vision and Zero-Shot Learning [4.5]
この作業では、アクティブビジョン(AV)技術とゼロショット学習(ZSL)を活用して、ロボットが農業環境を知覚し、相互作用する能力を向上させる。 ROS 2で実装されたAVパイプラインは、3D環境再構築のためのNext-Best View(NBV)プランニングを統合している。 YOLO World + EfficientViT SAMなどのZSLセグメンテーションモデルは高速性能と正確なセグメンテーションを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:26:23 GMT)
FedAT: Federated Adversarial Training for Distributed Insider Threat Detection [4.4]
本稿では,非独立分散(非IID)データ分散を考慮したFL対応マルチクラスITDパラダイムを提案する。具体的には,非IIDデータ分布から生じる極度のデータ歪を緩和するために,生成モデルを用いたFedATアプローチを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 20:44:33 GMT)
What Would You Ask When You First Saw $a^2+b^2=c^2$? Evaluating LLM on Curiosity-Driven Questioning [4.4]
大規模言語モデル(LLM)は膨大な量の知識を格納できるが、新しい知識を取得する可能性はまだ不明である。本稿では,この能力を評価する新しい評価フレームワークを提案する。 GPT-4 や Mistral 8x7b のような大規模モデルはコヒーレントで関連する質問を生成するには適しているが、より小さな Phi-2 モデルは等しく、より効果的である。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 22:12:16 GMT)
Multichannel-to-Multichannel Target Sound Extraction Using Direction and Timestamp Clues [4.3]
連続した時間的手がかりに基づいてマルチチャンネル音声信号を抽出するM2Mフレームワークを提案する。異なる室内環境における多様なクラスの音声信号から合成されたマルチチャネル信号に対して,我々のトランスフォーマーベースアーキテクチャがM2M-TSEを実現することを実証した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:30:49 GMT)
PromSec: Prompt Optimization for Secure Generation of Functional Source Code with Large Language Models (LLMs) [4.3]
LLM(Large Language Model)は、高品質なソースコードを生成するために使われる。 LLMは、安全でないオープンソースデータのトレーニングのために、セキュリティ上の脆弱性をしばしば導入する。本稿では,セキュアかつ機能的なコード生成のためのプロム最適化アルゴリズムであるPromSecを紹介する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:14:10 GMT)
SeqRisk: Transformer-augmented latent variable model for improved survival prediction with longitudinal data [4.1]
本研究では,変分オートエンコーダ (VAE) と長手VAE (LVAE) をトランスフォーマーエンコーダとコックス比例ハザードモジュールに結合してリスク予測を行う手法であるSeqRiskを提案する。 SeqRiskは、シミュレーションと実世界の両方のデータセットにおける既存のアプローチと比較して、競合的に機能することを示した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:35:25 GMT)
Are Large Language Models Good Essay Graders? [4.1]
我々は,エッセイの質を評価する上で,Large Language Models (LLMs) を評価する。我々は,LLMが提供した数値を,ASAPデータセットを用いた人間レーダ提供スコアと比較した。チャットGPTは、Llamaよりも厳格で、人間による評価と不一致の傾向にある。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 23:20:49 GMT)
On the second-order zero differential properties of several classes of power functions over finite fields [4.1]
Feistel Boomerang Connectivity Table (FBCT) は、差動攻撃やブーメラン攻撃などの攻撃に対するFeistelネットワークベースの暗号の抵抗を分析するための重要な暗号解析手法である。本稿では、有限体上の特定の方程式の解数を計算することにより、パワー関数の2階ゼロ微分スペクトルをx2m+3$およびx2m+5$で明示的に決定する。これらのエントリと各テーブルの濃度の計算は、Sボックスの微分およびブーメラン暗号解析を容易にすることを目的としている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:19:19 GMT)
Accelerating AI and Computer Vision for Satellite Pose Estimation on the Intel Myriad X Embedded SoC [3.8]
本稿では,インテルのMovidius Myriad Xを用いたハイブリッドAI/CVシステムを構築し,衛星の宇宙ミッションにおける姿勢を初期化・追跡する。提案したシングルチップ,ロバスト推定,リアルタイムソリューションは,2Wの限られたパワーエンベロープ内で,1メガピクセルのRGB画像に対して最大5FPSのスループットを提供する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:50:50 GMT)
A Multi-agent Market Model Can Explain the Impact of AI Traders in Financial Markets -- A New Microfoundations of GARCH model [3.7]
本稿では,ノイズトレーダー,基本トレーダー,AIトレーダーの3種類のエージェントを組み込んだマルチエージェント市場モデルを提案する。我々は,このモデルをマルチエージェントシミュレーションにより検証し,金融市場のスタイル化された事実を再現する能力を確認した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:14:13 GMT)
Hidden in Plain Sound: Environmental Backdoor Poisoning Attacks on Whisper, and Mitigations [3.6]
本研究では,異なる環境トリガー音を異なる長さのフレーズにマッピングする新しい中毒手法を提案する。我々は、最も人気のあるトランスフォーマーベースのSRモデルであるWhisperで、我々の攻撃に対して非常に脆弱であることを示す。本稿では,この攻撃を抑えるため,防衛機構として,最先端音声活動検出(VAD)モデルであるSilero VAD(Silero VAD)について検討する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:21:52 GMT)
The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives [3.5]
本稿では,ジェネレーティブ・人工知能(GenAI)を利用した子ども向けのストーリーテリングを支援する教育ツールのコンセプトを紹介する。このシステムは、GenAIによる物語の共創、テキストから音声への変換、およびテキストからビデオへの生成を組み合わせることで、学習者にとって魅力的な体験を生み出す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:50:58 GMT)
EFA-YOLO: An Efficient Feature Attention Model for Fire and Flame Detection [3.3]
EAConv(Efficient Attention Downsampling)とEADown(Efficient Attention Downsampling)の2つの重要なモジュールを提案する。これら2つのモジュールに基づいて,効率的な軽量火炎検出モデル EFA-YOLO (Efficient Feature Attention YOLO) を設計する。 EFA-YOLOは検出精度(mAP)と推論速度を著しく向上させ、モデルパラメータの量を94.6削減し、推論速度を88倍改善した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 10:20:07 GMT)
Guided Profile Generation Improves Personalization with LLMs [3.3]
勧告、ランク付け、Eコマースプラットフォームを含む現代の商業システムでは、パーソナライズコンテキストを大型言語モデル(LLM)への入力として取り入れる傾向にある。本稿では,自然言語で個人プロファイルを生成するための汎用手法であるGPGを提案する。実験の結果,GAGはLLMのパーソナライズ能力を向上させることが示され,例えば,LLMを生の個人的コンテキストで直接供給するよりも,個人の嗜好を予測する上で37%の精度が向上することがわかった。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 21:29:56 GMT)
Lyapunov Controlled Counterdiabatic Quantum Optimization [3.1]
本稿では,量子リアプノフ制御(QLC)と逆ダイアバティック(CD)プロトコルを統合し,最適化問題に対処する量子アルゴリズムを提案する。このアプローチは汎用性を提供し、デジタルアナログまたは純粋にデジタルアルゴリズムとしての実装を可能にする。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:39:34 GMT)
FaFeSort: A Fast and Few-shot End-to-end Neural Network for Multi-channel Spike Sorting [3.1]
FaFeSortは、数ショットの学習と並列化可能な後処理を備えた、エンドツーエンドのニューラルネットワークベースのスパイクソータである。我々のフレームワークは、スクラッチからのトレーニングに比べて、トレーニングに必要な注釈付きスパイクの数を44%削減し、最大25.68%の精度を達成する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 20:01:07 GMT)
When SparseMoE Meets Noisy Interactions: An Ensemble View on Denoising Recommendation [3.1]
本稿では,適応アンサンブル学習(Adaptive Ensemble Learning, AEL)を提案する。 AELはスパースゲーティングネットワークを脳として採用し、適切な認知能力の合成に適した専門家を選択する。モデル複雑性のアンサンブル学習の欠点を解決するために,コンポーネントを積み重ねてサブレコメンダを作成する新しい手法を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:55:34 GMT)
Optimal sensing of photon addition and subtraction on nonclassical light [3.0]
ワッサーシュタイン距離$W_1$は、古典的でない状態への光子付加または減算によって生じる変化を忠実に捉えていることを示す。圧縮真空やコヒーレント状態の場合にはこれを説明し、トモグラム内の特定の領域の強度の変化に光子付加(または減算)が反映されていることを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:26:41 GMT)
ViolinDiff: Enhancing Expressive Violin Synthesis with Pitch Bend Conditioning [2.9]
本稿では,2段階拡散に基づく合成フレームワークであるViolinDiffを紹介する。提案モデルでは, 明示的なピッチ曲げモデリングを伴わないモデルよりも, より現実的なヴァイオリン音を生成する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 05:39:19 GMT)
Hybrid spin-phonon architecture for scalable solid-state quantum nodes [2.8]
固体スピン系は量子情報処理に大きな可能性を秘めている。固体中のスピンの不均一性は、固体量子系のスケーリングに重大な課題をもたらす。スピン埋め込みSiC光学結晶(OMC)キャビティに基づくハイブリッドスピンフォノンアーキテクチャを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:49:21 GMT)
TEAM PILOT -- Learned Feasible Extendable Set of Dynamic MRI Acquisition Trajectories [2.8]
本稿では,3次元ウィンドウアテンションとフレキシブルで時間的に拡張可能な獲得軌跡を用いた新しい深部圧縮型センシング手法を提案する。本手法は既存の手法と比較してトレーニング時間と推論時間を著しく短縮する。実データによるテストは、我々のアプローチが現在の最先端技術よりも優れていることを示している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:45:13 GMT)
Experimental decoherence mitigation using a weak measurement-based scheme and the duality quantum algorithm [2.7]
NMR量子プロセッサ上での弱い測定と逆数に基づく手法を実験的に実証した。双対量子アルゴリズムは、要求される非単位量子演算を効率的に実装するために用いられる。実験の結果,弱い測定に基づくデコヒーレンス緩和法が成功していることが明らかとなった。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:15:28 GMT)
Machine-learning-based multipoint optimization of fluidic injection parameters for improving nozzle performance [2.6]
本稿では,計算流体力学(CFD)シミュレーションの代替として,事前学習ニューラルネットワークモデルを用いる。ノズル流れ場の物理的特性を考慮すると, モデルの伝達性を高めるために, 先行予測手法が採用された。推力係数1.14%の改善を実現し、従来の最適化手法と比較して時間コストを大幅に削減する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:32:54 GMT)
Re-Introducing LayerNorm: Geometric Meaning, Irreversibility and a Comparative Study with RMSNorm [2.6]
表現空間における隠れベクトルのノルムと配向にLayerNormがどのように影響するかを示す。 i) 一様ベクトルに沿ったベクトルの成分を除去し、 (ii) 残りのベクトルを正規化し、 (iii) 結果ベクトルを$sqrtd$でスケールする。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:58:07 GMT)
Improving Prototypical Parts Abstraction for Case-Based Reasoning Explanations Designed for the Kidney Stone Type Recognition [2.6]
尿管鏡による腎結石の同定は、尿学の大きな医学的進歩となる。近年,尿管鏡画像を用いて腎臓結石のタイプを自動的に認識する深層学習(DL)モデルが提案されている。このコントリビューションは, 原型部品(PP)を使用し, 局所的および大域的記述子を生成するケースベース推論DLモデルを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:27:32 GMT)
Small Language Models are Equation Reasoners [2.4]
CoT(Chain-of-Thought)推論により、算術的問題解決を含む様々なNLPタスクにおいて、LLM(Large Language Model)が顕著な性能を達成できるようになった。しかし、この成功はT5のような小さな言語モデル(sLM)に一般化しない。知識蒸留によるsLMの高度化に向けた最近の研究は、いくつかの改善をもたらしたが、依然として重大な限界に直面している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:34:43 GMT)
Enhanced Krylov Methods for Molecular Hamiltonians: Reduced Memory Cost and Complexity Scaling via Tensor Hypercontraction [2.4]
本稿では, Ab 分子ハミルトニアンに対するテンソルハイパーコントラクション (THC) 形式に基づく行列積演算子 (MPO) の構成について述べる。これらは局所的なミニマを回避し、高い精度で量子時間進化をシミュレートしながら、低い高度の固有状態を見つけることができる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:34:06 GMT)
Bayesian-Optimized One-Step Diffusion Model with Knowledge Distillation for Real-Time 3D Human Motion Prediction [2.4]
本稿では,知識蒸留とベイズ最適化を用いた1段階多層パーセプトロン(MLP)拡散モデルによる動き予測のトレーニングを提案する。提案モデルでは,予測速度を大幅に向上し,性能の劣化を伴わないリアルタイム予測を実現している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 04:36:40 GMT)
Investigating the Impact of Randomness on Reproducibility in Computer Vision: A Study on Applications in Civil Engineering and Medicine [2.4]
視覚によるランダム性は、パフォーマンススコアの最大4.77%の違いを説明できる。実行時におけるこの変数の管理には,パフォーマンスの向上や低下が伴う可能性があるが,前回の調査で報告されたようなデメリットはそれほど大きくない。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:06:06 GMT)
Hypersphere Secure Sketch Revisited: Probabilistic Linear Regression Attack on IronMask in Multiple Usage [2.3]
我々は、更新可能性というセキュリティ概念に基づいて、IronMaskに対する攻撃を考案する。この攻撃は、複数の保護されたテンプレートを取得する際に元のテンプレートを回復する最初のアルゴリズムである。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:28:30 GMT)
LARE: Latent Augmentation using Regional Embedding with Vision-Language Model [2.1]
視覚言語モデルは、イメージを単一の点として統合された埋め込み空間に埋め込む。地域埋め込み(LARE)は、VLMによって学習された統合埋め込み空間の領域としてイメージを埋め込む。 LAREは、ファインチューンVLMへの拡張画像埋め込みを用いて、領域内および外部の堅牢な画像分類を実現する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:21:42 GMT)
On the Effectiveness of LLMs for Manual Test Verifications [1.9]
本研究の目的は,手動テストの検証にLarge Language Models (LLMs) を用いることである。オープンソースモデル Mistral-7B と Phi-3-mini-4k は、クローズドソースモデルと同等の有効性と一貫性を示した。 AI幻覚にも懸念があり、検証は期待から著しく逸脱した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:03:04 GMT)
Across-Game Engagement Modelling via Few-Shot Learning [1.8]
ドメインの一般化には、さまざまなドメインにわたるハイパフォーマンスを維持するAIモデルを学ぶことが含まれる。ビデオゲームは、ユーザー体験の分析にユニークな課題と機会を提供する。本稿では,ユーザエクスペリエンスの汎用ドメインに依存しないモデリングをいくつかのドメイン固有タスクとゲーム依存タスクに分解するフレームワークを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:21:21 GMT)
CMINNs: Compartment Model Informed Neural Networks -- Unlocking Drug Dynamics [1.8]
本稿では,PKとPK-PDモデリングを統合した革新的な手法を提案する。提案手法は物理インフォームドニューラルネットワーク(PINN)と分数物理インフォームドニューラルネットワーク(fPINN)を用いる。その結果、この手法は、薬物吸収率と分散遅延応答のモデル描写を著しく強化する堅牢なフレームワークを提供することを示した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:01:33 GMT)
A Case Study of Web App Coding with OpenAI Reasoning Models [1.7]
我々は,OpenAIの最新推論モデルであるo1-previewとo1-miniによるコーディングタスクのケーススタディを,他のフロンティアモデルと比較した。 o1モデルは、シングルタスクのベンチマークであるWebApp1Kに対して、SOTA結果を提供する。この結果、WebApp1K-Duoは、多くのタスクとテストケースを倍にする、より難しいベンチマークである。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 06:58:02 GMT)
Towards adaptive trajectories for mixed autonomous and human-operated ships [1.7]
私たちは自動運転車の台頭を目の当たりにしています。本研究は、自律船と人体船の軌道予測と適応の課題について詳述する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:38:19 GMT)
Prediction of Brent crude oil price based on LSTM model under the background of low-carbon transition [1.7]
本稿では,3層のLSTMユニットを用いた深層学習モデルを用いて,数日後の原油価格の予測を行う。その結果、LSTMモデルは、急激な価格変動の時期に多少のずれがあるにもかかわらず、全体的な価格トレンドを捉えるのによく機能することが示された。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 00:25:22 GMT)
LLMs Can Check Their Own Results to Mitigate Hallucinations in Traffic Understanding Tasks [1.7]
本稿では,3つの最先端大規模言語モデル(LLM)による幻覚を見つけるためのSelfCheckGPTの採用について検討する。以上の結果より, GPT-4oはLLaVAよりも忠実な画像キャプションを生成するのが得意である。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:02:20 GMT)
Selecting a classification performance measure: matching the measure to the problem [1.6]
研究や応用の目的に合致するパフォーマンスの尺度を選択することは不可欠である。本論文は,異なるパフォーマンス尺度の相対的メリットに関する文献の増大に寄与するものである。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:32:02 GMT)
LOLA -- An Open-Source Massively Multilingual Large Language Model [1.6]
LOLAは160以上の言語で訓練された多言語大言語モデルである。私たちのアーキテクチャと実装の選択は、言語多様性を活用するという課題に対処します。学習したエキスパート・ルーティング機構は、暗黙の系統パターンを利用して、多言語性の呪いを和らげる可能性があることを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:50:01 GMT)
Domain Generalization for Endoscopic Image Segmentation by Disentangling Style-Content Information and SuperPixel Consistency [1.5]
本稿では,インスタンス正規化とインスタンス選択白化(ISW)を用いて,ドメインの一般化を改善する手法を提案する。本研究では,EndoUDA BarrettのEsophagusとEndoUDA polypsの2つのデータセットに対するアプローチを評価し,その性能を3つの最先端(SOTA)手法と比較した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 04:10:04 GMT)
Machine-learning based high-bandwidth magnetic sensing [1.4]
ダイヤモンド中の窒素空孔(NV)色中心は、多用途、高感度、高解像度磁気センシングを提供する。スピン共鳴磁気センシング(NV量子センシング)の現在のスキームは、感度、ダイナミックレンジ、帯域幅に関連するトレードオフに悩まされている。我々は,大規模なダイナミックレンジシナリオにおける感度/帯域トレードオフの観点から,NV磁気センサを強化するための機械学習ツールを実装した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:50:12 GMT)
AutoPET III Challenge: Tumor Lesion Segmentation using ResEnc-Model Ensemble [1.3]
我々は,新しいU-Netフレームワーク内で3次元残留エンコーダU-Netを訓練し,自動病変分割の性能を一般化した。腫瘍病変のセグメンテーションを増強するために,テストタイム増強や他の後処理技術を利用した。現在、私たちのチームはAuto-PET IIIチャレンジでトップの地位にあり、Diceスコア0.9627の予備テストセットでチャレンジベースラインモデルを上回っています。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 20:18:39 GMT)
Lexicon-Based Sentiment Analysis on Text Polarities with Evaluation of Classification Models [1.3]
本研究は,レキシコン法を用いて感情分析を行い,テキストデータを用いた分類モデルの評価を行った。語彙に基づく手法は、単語レベルでの感情と主観性の強さを識別する。この研究は、テキストが正、負、中立とラベル付けされているというマルチクラスの問題に基づいている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:31:12 GMT)
Skill matching at scale: freelancer-project alignment for efficient multilingual candidate retrieval [1.3]
本手法は,事前学習した多言語言語モデルを利用して,プロジェクト記述とフリーランサープロファイルを符号化する。いくつかの実験により,本手法はスキルマッチングの類似性を効果的に把握し,効率の良いマッチングを容易にすることが示されている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:10:38 GMT)
AutoPETIII: The Tracer Frontier. What Frontier? [1.2]
今年のエディションは、PET/CTスキャンで病変のセグメンテーションを実行できる完全自動アルゴリズムを開発することを目的としている。我々は,nnUNetv2フレームワークを用いて,完全自動PET/CT病変分割を行うために,モデルの6倍アンサンブルの2セットをトレーニングした。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:26:31 GMT)
Qubit coupled with an effective negative-absolute-temperature bath in off-resonant collision model [1.2]
量子力学では、非共鳴相互作用はしばしばエキサイティングな欠陥をもたらす。負の絶対温度の浴は、熱装置の開発に役立てられると期待されている。我々は、量子衝突モデルと量子ビットを結合した有効負絶対温度浴を遠方共振系で確立する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:02:40 GMT)
Model calibration using a parallel differential evolution algorithm in computational neuroscience: simulation of stretch induced nerve deficit [1.1]
実験結果に対して校正する必要がある自由パラメータを複数有する複合機械電気生理学的モデルを用いる。キャリブレーションは進化的アルゴリズム(差分進化, DE)を用いて実施され、6つの異なる損傷事例におけるパラメータのそれぞれの構成を評価する必要がある。我々は,利用可能な計算能力をすべて活用して,マルチプロセッサ上で動作するOpenMPに基づく並列実装を開発した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:40:32 GMT)
Recognition of Harmful Phytoplankton from Microscopic Images using Deep Learning [1.0]
プランクトン分布のモニタリングは、水生生態系の保全、地球環境の規制、環境保護の確保に不可欠である。従来の監視方法は、しばしば時間を要する、コストがかかり、エラーが発生し、大規模アプリケーションには適さない。 ResNet, ResNeXt, DenseNet, EfficientNetなどの最新のCNNモデルを3つの伝達学習手法を用いて評価し, 顕微鏡画像から有害植物プランクトン11種の分類を行った。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:42:53 GMT)
Test-Time Augmentation Meets Variational Bayes [1.0]
TTA(Test-Time Augmentation)は、テストフェーズでデータ拡張を活用して堅牢な予測を実現するテクニックである。本研究では,TTAの重み付け版について,各データ拡張の貢献に基づいて検討する。また,限界対数類似度を最大化するための重み付けを最適化することで,テストフェーズにおける不要なデータ増大の候補を抑えることを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:11:01 GMT)
Personalized 2D Binary Patient Codes of Tissue Images and Immunogenomic Data Through Multimodal Self-Supervised Fusion [0.9]
MarbliXは、病理組織像と免疫ゲノムシークエンシングデータを統合し、それらを簡潔なバイナリー患者コードにカプセル化する革新的なフレームワークである。実験の結果は、医療専門家に深い洞察を与えるMarbliXの可能性を示している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 22:49:27 GMT)
Enhancing 3D Robotic Vision Robustness by Minimizing Adversarial Mutual Information through a Curriculum Training Approach [0.9]
敵攻撃は、小さな、慎重に構築された摂動を通じて、モデルの決定境界における脆弱性を悪用する。 3Dビジョンでは、高次元とデータ空間が攻撃面を大きく拡大し、3Dビジョンは特に安全クリティカルなロボティクスに対して脆弱になる。本稿では,対向的摂動下での予測損失と相互情報(MI)を同時に最小化する学習目標を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 00:44:45 GMT)
Semi-overcomplete convolutional auto-encoder embedding as shape priors for deep vessel segmentation [0.9]
本稿では,半完全畳み込み型自動エンコーダの組込みから,より深いセグメンテーション形状を取り入れた新しい手法を提案する。標準的な畳み込みオートエンコーダ(CAE)と比較すると、小さな構造をより正確に特徴付けるために、高次元にデータを投影するオーバーコンプリートブランチを利用する。 DRIVEおよび3D-IRCADbデータセットを用いて網膜および肝血管抽出実験を行ったところ,従来のCAEの形状を考慮せずにトレーニングしたU-Netと比較して,本法の有効性が示された。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:59:23 GMT)
Fuzzy Rule based Intelligent Cardiovascular Disease Prediction using Complex Event Processing [0.9]
心血管疾患 (CVD) は、不健康な食事、身体活動の欠如、その他の要因により、急速に世界的な懸念が高まっている。最近の研究は、リスクと死亡率を減らすための正確でタイムリーな病気予測に焦点を当てている。本稿では,リアルタイム意思決定支援のためのファジィルールに基づく臨床データ監視システムを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:36:24 GMT)
Deep Probability Segmentation: Are segmentation models probability estimators? [0.8]
モデルのキャリブレーションへの影響を評価するために,セグメンテーションタスクにキャリブレーション確率推定を適用した。その結果, キャリブレーションはキャリブレーションが向上するが, 分類タスクに比べ, キャリブレーションの効果は低かった。また, キャリブレーションの有効性に及ぼすデータセットサイズとビン最適化の影響についても検討した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 07:52:19 GMT)
Incremental and Data-Efficient Concept Formation to Support Masked Word Prediction [0.7]
本稿では、マスク付き単語予測をサポートする効率的な言語モデル学習のための新しいアプローチであるCobweb4Lを紹介する。我々は、Cobweb4Lが急速に学習し、Word2Vecに匹敵する性能を達成していることを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:48:31 GMT)
Instigating Cooperation among LLM Agents Using Adaptive Information Modulation [0.7]
本稿では,人間戦略行動と強化学習のためのプロキシとしてLLMエージェントを併用した新しいフレームワークを提案する。ネットワーク内のエージェント間での情報アクセスを調節し、社会的福祉を最適化し、社会的行動を促進する。このフレームワークは、実世界のチーム設定におけるAIの展開に寄与する、AIを介するソーシャルダイナミクスに関する重要な洞察を提供する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:32:58 GMT)
Deep Learning-Based Detection of Referable Diabetic Retinopathy and Macular Edema Using Ultra-Widefield Fundus Imaging [0.7]
糖尿病網膜症や糖尿病黄斑浮腫は、視力喪失につながる糖尿病の重大な合併症である。超広視野眼底画像による早期発見は、患者の成果を高めるが、画質と分析スケールの課題を提示する。本稿では,MICCAI 2024 UWF4DRチャレンジの枠組みの中で,自動UWF画像解析のためのディープラーニングソリューションを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:51:48 GMT)
Reference Dataset and Benchmark for Reconstructing Laser Parameters from On-axis Video in Powder Bed Fusion of Bulk Stainless Steel [0.6]
RAISE-LPBFは粉末層融合におけるレーザーパワーとレーザードット速度の影響に関する大規模なデータセットである。このデータは、LPBFの統計的性質の導出や、異常検出器の構築に利用できる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 05:30:24 GMT)
Fast End-to-End Generation of Belief Space Paths for Minimum Sensing Navigation [0.6]
本稿では,問題記述から直接最適な経路候補を予測するために,ディープラーニングモデルを活用するアプローチを提案する。我々は、U-Netアーキテクチャを活用して、入力と出力データの依存関係を学習する。提案手法はサンプリングベースベースラインアルゴリズムと比較して時間を大幅に短縮する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:49:36 GMT)
An Exploration of Agile Methods in the Automotive Industry: Benefits, Challenges and Opportunities [0.6]
本稿では,自動車産業におけるアジャイル手法導入のメリットと課題について考察する。私たちの調査結果は、コラボレーションの改善や市場投入までの時間短縮など、アジャイルアプローチの潜在的なメリットを浮き彫りにしています。本稿では,既存の研究と実践的な洞察を合成することによって,自動車ソフトウェア開発の将来を形作る上でのアジャイル手法の役割を理解することを目的とする。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:43:38 GMT)
Multi-Source and Multi-Sequence Myocardial Pathology Segmentation Using a Cascading Refinement CNN [0.5]
心筋組織の生存性を評価するために, セマンティックセグメンテーションを生成するMulti-Sequence Cascading Refinement CNN(MS-CaRe-CNN)を提案する。 MS-CaRe-CNNは、心筋組織の生存可能性を評価するためにセマンティックセグメンテーションを生成するのに適している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:01:15 GMT)
AutoPET III Challenge: PET/CT Semantic Segmentation [0.5]
PET/CT画像におけるセグメント病変に対する2段階の深層学習手法を,AutoPET IIIチャレンジのために実装した。最初の段階では、DynUNetモデルを使用して、広い関心領域を識別する粗いセグメンテーションを行った。第2ステージでは、SwinUNETR、SegResNet、UNetモデルのアンサンブルを使用して、このセグメンテーションを改良した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:45:17 GMT)
Theoretical Analysis of Heteroscedastic Gaussian Processes with Posterior Distributions [0.5]
本研究ではヘテロセダスティックガウス過程(HGP)を解析するための新しい理論的枠組みを紹介する。後部分布の正確な方法、分散、累積分布を導出する。得られた理論的知見は、確率制約付きトラッキングコントローラに適用される。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:51:46 GMT)
Quantum resources of quantum and classical variational methods [0.5]
量子情報と変分技法の間の橋渡しを、非安定化性(マジック)の概念がいかに実現できるかを示す。エネルギーの正確性は必要だが、非安定化装置の正確性には必ずしも十分ではないことを示す。本研究は,古典的変分法と量子的変分法の両方の普遍的表現性評価の基礎となる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:00:00 GMT)
Introducing the Large Medical Model: State of the art healthcare cost and risk prediction with transformers trained on patient event sequences [0.5]
大規模医療モデル(Large Medical Model, LMM)は、患者医療と医療管理の幅広い側面をガイドし、予測するために設計された、GPT(Generative Pre-trained Transformer)である。このモデルは、医療用語システムから構築された特別な語彙を用いて、1億4000万件以上の患者の主張記録から医療イベントシーケンスに基づいて訓練されている。 LMMは、最高の商用モデルよりも14.1%のコスト予測と、幅広い条件を予測する研究において最高のトランスフォーマーモデルよりも1.9%の慢性的な条件予測の両方を改善できる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:38:21 GMT)
Check-probe spectroscopy of lifetime-limited emitters in bulk-grown silicon carbide [0.5]
レーザー誘起スペクトル拡散と電離速度を測定するために,高帯域幅チェックプローブ方式を導入する。市販のバルクグレード4H-ケイ素炭化物において, 単一のV2中心にこれらの方法を示す。これらの結果は半導体材料における量子エミッタのスペクトル拡散の理解を前進させ、他のプラットフォームにおける電荷ダイナミクスの研究に応用できるかもしれない。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:00:03 GMT)
USBIPS Framework: Protecting Hosts from Malicious USB Peripherals [0.5]
本稿は、悪質なUSB周辺機器を防御するために、OS内にUSBIPSと呼ばれるセキュリティフレームワークを構築することに焦点を当てる。まず,USB周辺機器に組み込まれた攻撃に着目した行動に基づく検知機構を提案する。次に、USBアクセス制御のための許容値に基づく新しい方法を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:48:52 GMT)
Controlled LLM-based Reasoning for Clinical Trial Retrieval [0.4]
そこで我々は,LSMの能力を拡張するスケーラブルな手法を提案し,医療適性基準のセットに対する推論を体系化する。提案法はTREC 2022 臨床試験で評価され,最新技術である NDCG@10 の 0.693 と Precision@10 の 0.73 に勝る結果を得た。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:42:33 GMT)
Efficient Knowledge Distillation: Empowering Small Language Models with Teacher Model Insights [0.4]
そこで本研究では,小言語モデルの性能向上を目的とした,単純かつ効果的な知識蒸留手法を提案する。提案手法では,約30億のパラメータを持つ教師モデルを用いて,意思決定プロセスにおいて最も影響力のあるトークンを同定する。この方法は、4つの多様なデータセットでテストすることによって実証されたように、効果的であることが証明されている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:09:53 GMT)
Geometric phase assisted detection of Lorentz-invariance violation from modified dispersion at high energies [0.4]
量子重力の多くの理論は、$omega_|mathbfk|=|mathbfk|f(|mathbfk|/M_star)$という形のローレンツに反する分散関係を提唱している。ローレンツ場理論の場合、GPは検出器の速度に依存する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:10:57 GMT)
Enhancing SLM via ChatGPT and Dataset Augmentation [0.4]
我々は,大言語モデル (LLMs) と小言語モデル (SLMs) のパフォーマンスギャップを埋めるために,知識蒸留技術と合成データセット拡張を用いている。提案手法は,情報抽出と情報推論という2種類の理性生成を伴い,ANLIデータセットを充実させる。その結果, 合成合理化によって自然言語の理解能力が向上し, ANLIデータセット上での分類精度が1.3%, 2.3%向上することが判明した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:24:36 GMT)
Sustainable Visions: Unsupervised Machine Learning Insights on Global Development Goals [0.4]
国連2030アジェンダ・フォー・サステナブル・ディベロップメントは、世界的課題に取り組むための17の目標を概説している。 SDGの進歩は、地理的、文化的、社会経済的要因に大きく影響されている。 2030年までにすべての目標を達成する国はない。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 03:10:49 GMT)
Hybrid Ensemble Deep Graph Temporal Clustering for Spatiotemporal Data [0.4]
多変量時間データ解析のためのハイブリッドアンサンブルグラフクラスタリング(HEDGTC)法を提案する。 HEDGTCは、従来のクラスタリングからノイズや誤分類に対処するためのデュアルコンセンサスアプローチを採用している。 3つの実世界のデータセットで評価すると、HEDGTCは最先端のアンサンブルクラスタリングモデルより優れている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:14:10 GMT)
Deep Transfer Hashing for Adaptive Learning on Federated Streaming Data [0.4]
フェデレーション学習は、複数のクライアントがデータのプライバシを維持しながら、共同で共有モデルをトレーニングすることを可能にする。提案フレームワークは、転送学習、中央サーバ上のディープニューラルネットワークの事前学習、モデル精度と適応性を高めるためのクライアントの微調整を利用する。 Car2Xイベント予測では、共有モデルでトラフィックパターンを認識し、トラフィック密度評価や事故検出などのタスクを支援する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:52:49 GMT)
Task and Domain Adaptive Reinforcement Learning for Robot Control [0.3]
課題や環境条件に応じて動的にポリシーを適応する新しい適応エージェントを提案する。このエージェントはIsaacGym上に作られたカスタムで高度に並列化されたシミュレータを使って訓練されている。実世界において、さまざまな課題を解くために、飛行飛行のためにゼロショット転送を行う。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:36:53 GMT)
Comprehensive Overview of Artificial Intelligence Applications in Modern Industries [0.3]
本稿では、医療、金融、製造業、小売の4つの主要な分野にわたるAIの適用について検討する。我々は、倫理的考察、AI開発の将来的な軌跡、そして経済成長を促進する可能性など、AI統合がもたらす意味について論じる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 19:22:52 GMT)
Explainable AI for Autism Diagnosis: Identifying Critical Brain Regions Using fMRI Data [0.3]
自閉症スペクトラム障害(ASD)の早期診断と介入は、自閉症者の生活の質を著しく向上させることが示されている。 ASDの客観的バイオマーカーは診断精度の向上に役立つ。深層学習(DL)は,医療画像データから疾患や病態を診断する上で,優れた成果を上げている。本研究の目的は, ASD の精度と解釈性を向上させることであり, ASD を正確に分類できるだけでなく,その動作に関する説明可能な洞察を提供する DL モデルを作成することである。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 23:08:09 GMT)
Curricula for Learning Robust Policies with Factored State Representations in Changing Environments [0.2]
因子状態表現を用いたエージェントのカリキュラムが学習方針の堅牢性にどのように影響するかを示す。本報告では, ポリシーの堅牢性を著しく向上させる, エピソード間での最大後悔の変数のみを変動させるような, 3つの簡単なカリキュラムを実験的に実証する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:03:24 GMT)
Enhancing E-commerce Product Title Translation with Retrieval-Augmented Generation and Large Language Models [0.2]
本研究では,電子商取引における既存のバイリンガル製品情報を活用する検索強化世代(RAG)アプローチを提案する。実験の結果,提案手法は製品タイトルの翻訳品質を最大15.3%向上させることができた。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:23:42 GMT)
Exploring Engagement and Perceived Learning Outcomes in an Immersive Flipped Learning Context [0.2]
本研究の目的は,学生のオンラインエンゲージメントと学習成果に対する没入型フリップ学習アプローチのメリットと課題を検討することである。この研究は、高レベルの学生エンゲージメントと学習結果の認知を明らかにしたが、改善が必要な領域も明らかにした。この研究の成果は、有意義で効果的な遠隔学習体験をデザインしようとする教育者にとって貴重な情報源となる可能性がある。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:38:48 GMT)
Graph Convolutional Neural Networks as Surrogate Models for Climate Simulation [0.2]
我々は,完全接続型ニューラルネットワーク(FCNN)とグラフ畳み込み型ニューラルネットワーク(GCNN)を活用し,高速なシミュレーションと不確実性定量化を実現する。我々のサロゲートは、1つのA100 GPUで約310秒で80年シミュレーションしましたが、ESMモデルでは数週間でした。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:41:15 GMT)
Super Resolution On Global Weather Forecasts [0.2]
グループは,グローバル気象予測の空間分解能を高めることにより,既存の深層学習に基づく予測手法の改善を目指している。具体的には、大域的精度を1度から0.5度に高めることにより、グラフCast温度予測における超解像(SR)の実行に関心がある。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:56:28 GMT)
Scalable and Robust Mobile Activity Fingerprinting via Over-the-Air Control Channel in 5G Networks [0.2]
物理的ダウンリンク制御チャネル(PDCCH)メッセージの10%未満は、スニファーを用いて復号化可能であることを示す。このプライバシー攻撃は、アクティブな通信チャネルの数を明らかにし、モバイルアプリケーションとその使用時間を明らかにする。本稿では,手動による特徴抽出を不要とした,効率的なディープラーニングに基づくモバイルトラフィック分類手法を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:49:40 GMT)
Entanglemons: Cross-platform protected qubits from entanglement [0.1]
スケーラブルなフォールトトレラント量子コンピューティングの重要な要素は、誤り率の低い論理量子ビットの構築と固有のノイズ保護である。そこで本研究では, 局所雑音による誤りを除去(緩和)し, 劣化を抑えるハードウェアレベルのノイズ保護のためのクロスプラットフォーム構築法を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:00:04 GMT)
Universal semiclassical dynamics in disordered two-dimensional systems [0.0]
乱れた1D格子と2D格子上に伝播するスピンレスフェルミオンの相互作用のダイナミクスを解析する。両空間次元において、不均衡は再スケール時間$t/xi_W$に普遍的依存を示し、2Dでは時間スケール$xi_W$は障害強度への伸張指数依存に従う。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:59:00 GMT)
Universal approximation theorem for neural networks with inputs from a topological vector space [0.0]
位相ベクトル空間(TVS-FNN)からの入力を用いたフィードフォワードニューラルネットワークの研究従来のフィードフォワードニューラルネットワークとは異なり、TVS-FNNはシーケンス、行列、関数などを含む幅広い入力を処理することができる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:10:14 GMT)
Towards AI-enabled Cyber Threat Assessment in the Health Sector [0.0]
このプロジェクトの目的は、医療機関の外部からセキュリティ関連情報を収集するAI対応プラットフォームを導入することである。このプラットフォームはリスクスコアを提供し、医療機関の意思決定者をサポートし、セキュリティ対策のための投資選択を最適化する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:34:34 GMT)
TREBLE: Fast Software Updates by Creating an Equilibrium in an Active Software Ecosystem of Globally Distributed Stakeholders [0.0]
TREBLEはAndroidでモジュールベースを構築するための2年間のイニシアチブです。私たちのTREBLEアーキテクチャは、Javaで書かれたハードウェアに依存しないコアフレームワークと、ハードウェア依存のベンダー実装を分離します。我々は,年次リリースモデルを用いて,TREBLEアーキテクチャの変更をシリコンベンダやデバイスメーカに提供した経験について論じる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 20:34:54 GMT)
Swine Diet Design using Multi-objective Regionalized Bayesian Optimization [0.0]
動物栄養の文脈における食餌の設計は、最小限の栄養量のバランスを保ちながら、コスト効率の良い製剤を開発することを目的とした複雑な問題である。原料中の代謝反応と消化可能エネルギーの濃度の理論モデルに基づく従来のアプローチは、動物のパフォーマンスに影響を与える動物工学的変数を組み込むことの制限に直面し、持続可能な開発方針に沿った複数の目的を含む。近年、多目的ベイズ最適化は、複数の情報源、多目的、多目的の組み合わせに対処できる有望な代替手段として提案されている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:18:00 GMT)
Strategic Collusion of LLM Agents: Market Division in Multi-Commodity Competitions [0.0]
機械学習技術は、現実世界の市場シナリオへの展開が増えている。マルチコモディティ市場において,大規模言語モデル(LLM)が自律エージェントとして展開する際の戦略行動について検討する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 20:10:40 GMT)
Solving Combinatorial Optimization Problems on a Photonic Quantum Computer [0.0]
組合せ最適化問題は、ロジスティクスから暗号まで、様々な分野において重要な計算問題を引き起こす。従来の計算手法は指数関数的な複雑性に苦しむことが多く、量子コンピューティングのような代替パラダイムへの探索を動機付けている。フォトニック量子コンピュータが解空間を効率的に探索し、様々な問題に対する最適解を同定する方法を実証する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 20:57:24 GMT)
Smirk: An Atomically Complete Tokenizer for Molecular Foundation Models [0.0]
SMILES言語を対象とする13種のケミカル特異的トークン化剤を系統的に評価した。 I>smirk/i>と<i>smirk-gpe/i>の2つの新しいトークンを導入し,OpenSMILES仕様の全体を表す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:36:04 GMT)
Shadows and subsystems of generalized probabilistic theories: when tomographic incompleteness is not a loophole for contextuality proofs [0.0]
非コンテクスト性の失敗の証明は、トモグラフィー完全性の失敗の非常に幅広いクラスに対して堅牢であることを示す。また、GPTフラグメントの影の概念を導入し、その状態や効果が無意識に互いにトモグラフィーされていないときに失われた情報をキャプチャする。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:00:42 GMT)
Progress towards efficient 4-level photon echo memories [0.0]
Er:YSO におけるスピン記憶量子メモリの効率(最大80%)を示す。書き込み時間は150時間,ストレージ時間は25時間である。そのようなデバイスは量子ネットワークや測定ベースの量子コンピューティングに応用される。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 06:49:24 GMT)
ProcessTBench: An LLM Plan Generation Dataset for Process Mining [0.0]
大規模言語モデル(LLM)は、計画生成において大きな可能性を示しています。既存のデータセットは、高度なツール使用シナリオに必要な複雑さを欠いていることが多い。本稿では,TaskBench データセットの拡張である ProcessTBench 合成データセットを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:46:17 GMT)
Predicting soccer matches with complex networks and machine learning [0.0]
本研究の目的は,サッカーの試合結果を予測するための代替ツールとして,複雑なネットワークを利用することである。通過ネットワークに基づくモデルは、一般的なマッチング統計を用いた従来のモデルと同じくらい効果的であった。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 21:45:25 GMT)
Practical Investigation on the Distinguishability of Longa's Atomic Patterns [0.0]
NIST楕円曲線P-256に対するLongaの原子パターンを用いた二進楕円曲線スカラー乗算kPアルゴリズムを実装した。マイクロコントローラ上での1kP実行の電磁的痕跡を測定し,解析した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:08:38 GMT)
Physics aware machine learning for micromagnetic energy minimization: recent algorithmic developments [0.0]
ブラウンの静電自己エネルギーに対する境界の上に構築し、伝達問題の変分定式化の文脈でそれらの応用を再検討する。有限領域上のこれらの境界を再構成し、数値シミュレーションの手法をより効率的かつスケーラブルにする。その結果,メッシュフリーな物理インフォームドニューラルネットワーク(PINN)とELM(Extreme Learning Machines)が,厳しい制約と統合される可能性を強調した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 16:22:40 GMT)
Performance analysis for high-dimensional Bell-state quantum illumination [0.0]
量子照明(QI)は、未解決ターゲットのライダー/レーダー検出を改善するための絡み合いベースのプロトコルである。本稿では,Pannu et al.のQIの有限次元性能について述べる。どちらのシステムも、低明度(1光子/モード)ノイズにおいて有意な量子優位性は持たない。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:28:56 GMT)
Kochen-Specker non-contextuality through the lens of quantization [0.0]
Kochen-Speckerの定理は、量子力学における全ての動的変数にシャープな値を割り当てることは不可能であることを示している。古典理論の量子化によって得られる量子論について、この条件は最初から証明できないことを示す。観察の結果,全ての動的変数に鋭い値を割り当てられるかどうかという問題に対するコチェン=スペクターの定理の関連性は,比較的限定的であることが示唆された。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 20:10:37 GMT)
Instantaneous tunneling time within the theory of time-of-arrival operators [0.0]
量子トンネルは古典的TOAのワイル量子化によって構築された時変演算子を用いて瞬時に行われる。しかし、古典的なTOAの量子画像は無限に存在するため、他のものよりも一意に好まれているかどうかは不明だ。ここでは、位置と運動量観測値の間の順序規則によらず、古典的到着時間の可能な全ての量子画像についてトンネル時間が消滅することを実証する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 01:26:40 GMT)
Informational non-equilibrium concentration [0.0]
熱力学への情報的貢献は別々に研究することができる。非平衡であることは、情報内容のみから抽出可能な仕事のような熱力学的資源を提供する。 2量子ビットでは不可能であることが示され、高次元でこれを達成できる状態を見つけることは常に可能である。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:25:30 GMT)
Improving generalisability of 3D binding affinity models in low data regimes [0.0]
PDBBindデータセットの新たな分割を導入し、列車とテストセット間の類似性リークを最小限にする。一般に、3次元グローバルモデルが低データ構造におけるタンパク質特異的局所モデルよりも優れていることを実証する。この研究は、結合親和性モデリングのためのGNNアーキテクチャの可能性を解き放つための、有望な新しいアプローチをもたらすと信じている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:54:38 GMT)
Image inpainting for corrupted images by using the semi-super resolution GAN [0.0]
欠落した画素を学習・複製するためのGAN(Generative Adversarial Network)を提案する。提案したモデルの堅牢性と正確性を評価するために,3つの多様なデータセットを利用した。我々のトレーニングプロセスは、最適な精度を達成し、高品質な画像を生成するために、様々なレベルの画素破壊を伴います。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 10:21:16 GMT)
Exponential speed-up of quantum annealing via n-local catalysts [0.0]
我々は,n-$ローカライズされた触媒が,アニーアル過程中にギャップを再開したり,閉じたりすることを防止できることを示した。我々の分析は、複数の量子ビットを絡む非局所量子ゆらぎが、望まれる量子優位性を達成するための鍵であることを示唆している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:01:53 GMT)
Exploring the topics, sentiments and hate speech in the Spanish information environment [0.0]
本研究は,スペインのメディア5社のニュースに対して,337,807件の回答メッセージ(サイトコメントとツイート)の話題,感情,憎悪の頻度について検討した。コンテンツは主に陰性(62.7%)で中性(28.57%)で、低い陽性(8.73%)である。低レベルのヘイトスピーチ(3.98%)にもかかわらず、この研究は社会や政治の話題に対するオンライン反応の毒性が高いことを確認している。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:19:44 GMT)
Exploring bat song syllable representations in self-supervised audio encoders [0.0]
いくつかの自己教師型オーディオエンコーダにおけるコウモリの音節の符号化について分析する。人間の発話に事前学習されたモデルは、異なる音節型の最も独特な表現を生成する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 10:09:31 GMT)
Evolving a Multi-Population Evolutionary-QAOA on Distributed QPUs [0.0]
我々は,進化的QAOA(E-QAOA)ペアリングがCOBYLAベースのQAOAよりも同等以上の性能を示すことを示した。また,2つのQPU上に分布する多集団EAを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:50:03 GMT)
Enhancing TinyBERT for Financial Sentiment Analysis Using GPT-Augmented FinBERT Distillation [0.0]
本研究では,大規模言語モデル(LLM)の生成能力を生かして,ドメイン固有の学習データを生成することを提案する。この研究は、金融感情分析用に微調整されたBERTモデルであるFinBERTを強化し、コンパクトトランスモデルであるTinyFinBERTを開発することを目的としている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 10:22:23 GMT)
Enhancing Construction Site Safety: A Lightweight Convolutional Network for Effective Helmet Detection [0.0]
本稿では,建設現場におけるヘルメットの存在を正確に分類するために設計された畳み込みニューラルネットワーク(CNN)の開発と評価について述べる。 CNNは、建設現場でヘルメットなどの個人用防護具を識別するために開発された。改良があったにも拘わらず、精度は準最適のままであり、さらなるアーキテクチャと運用の強化の段階が整った。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:29:18 GMT)
Engineering Quantum Error Correction Codes Using Evolutionary Algorithms [0.0]
量子誤り訂正と量子誤り訂正符号の使用は、実用的な量子コンピューティングの実現に不可欠である可能性が高い。与えられたエラーモデルに対して最適な安定化器符号を求める新しい進化的アルゴリズムを提案する。この研究の一環として、量子誤り訂正符号の距離を求める進化的アルゴリズムQDistEvolを導入する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 18:00:02 GMT)
Emergence of coupling induced transparency by tuning purely dissipative couplings [0.0]
結合誘起透明性(CIT)と結合誘起吸収(CIA)の制御された遷移は、基本的重要性と様々なデバイスにおける潜在的な応用の両方の影響である。可変モード(TM)と複数の静的モード(SM)を考慮した多モード結合型ハイブリッド量子系におけるこれらの特異な現象を探索した。我々は純粋に散逸結合のみを用いてCITを実現することができるが、CITがコヒーレントカップリングと共に現れることはよく知られている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 08:53:41 GMT)
Embedding Geometries of Contrastive Language-Image Pre-Training [0.0]
直感的なユークリッド幾何を持つ変種であるユークリッドCLIP (EuCLIP) がCLIPの性能に適合するか, 上回っていることを示す。また,Euclidean CLIP (EuCLIP) は少なくとも階層的関係と,より複雑な双曲的選択肢をサポートすることを示した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 20:34:22 GMT)
Efficient computation of topological order [0.0]
量子多体系におけるトポロジカル秩序の検出の計算的側面を解析する。前者のシステムサイズと後者のスケーリングで指数的スケーリングが見られます。我々の戦略は、平衡から高次元やシステムに容易に一般化できる。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 12:30:27 GMT)
Dynamics of "Classical" Bosons, Fermions, and beyond [0.0]
量子統計学の記憶を保持する粒子の古典力学と力学を研究する。我々の研究は、そのような粒子の統計力学と熱力学に関する以前の研究に基づいている。それらの交換統計が多様体のシンプレクティック形式にどのように反映されるかを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 15:55:46 GMT)
Dunkl-Schrodinger Equation in Higher Dimension [0.0]
本稿では,高次元シュリンガー方程式の固有値と固有関数の解析解を提案する。 2つの基本的な量子力学的問題は、それらの正確な形式で検証される。エネルギー固有値関数の挙動は、確率密度の減少とともに図式的に説明される。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:03:25 GMT)
Dunkl-Klein-Gordon Equation in Higher Dimensions [0.0]
クライン=ゴルドン方程式の標準偏微分をダンクル微分に置き換える。我々はDunkl-Klein-Gordon方程式の高次元における固有値と固有関数の正確な解析解を得る。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:10:12 GMT)
Domain-stratified Training for Cross-organ and Cross-scanner Adenocarcinoma Segmentation in the COSAS 2024 Challenge [0.0]
COSAS 2024(Cross-Organ and Cross-Scanner Adenocarcinoma)チャレンジのために開発された画像分割アルゴリズムを提案する。臓器層化・スキャナ層化手法を用いて,複数の Upernet ベースセグメンテーションモデルを訓練し,結果をアンサンブルした。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 02:36:34 GMT)
Dissipative dynamics of an open quantum battery in the BTZ spacetime [0.0]
量子電池の充電性能は、量子場の真空揺らぎの存在によってどのように影響されるかを考える。量子場の異なる境界条件は、異なる充電性能をもたらす可能性がある。本研究は,曲面時空における緩和効果を解明するための一般的な枠組みを提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:06:47 GMT)
Dephasing in the central spin problem with long-range Ising spin-bath coupling [0.0]
中心スピンモデルにおけるqubit dephasingの中心極限定理について検討する。この近似をイジング・スピン・システムで描かれた浴槽の近似式として証明する。ある種の場合、すなわち、短距離(指数的に崩壊する)カップリングに対して、この近似が破れることを示す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 13:14:31 GMT)
Decoherence and wavefunction deformation of $D_4$ non-Abelian topological order [0.0]
非アベリアのTOは、かなりリッチであるにもかかわらず、同様の程度に分析・理解できることが示される。対応する局所統計力学的スピンまたはローターモデルを$D_4$対称性で同定することにより、非アベリア異性体の増加に対する顕著な安定性を見出す。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 17:56:21 GMT)
Cross-Organ and Cross-Scanner Adenocarcinoma Segmentation using Rein to Fine-tune Vision Foundation Models [0.0]
我々はReinを用いて、MICCAI 2024とCross-OrganおよびCross-Scanner Adenocarcinomaの様々な視覚基盤モデル(VFM)を微調整する。 COSAS2024 Challengeのデータ環境において、ラインは良好な結果を得るためにVFMを微調整した。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 09:39:49 GMT)
Bone: Block Affine Transformation as Parameter Efficient Fine-tuning Methods for Large Language Models [0.0]
Low-Rank Adaptation (LoRA)は、オリジナルの重量を凍結し、低ランクの行列のみを訓練することで、優れたトレーニング結果を得た。 LoRA+, PISSA, Olora, LoRA-GA など,一連の LoRA 変種が出現している。本稿では,メモリオーバーヘッドを低減するだけでなく,重み間の内部接続も強調する,Bone(Block Affine)と呼ばれる革新的な手法を提案する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 10:26:42 GMT)
Automated Linear Disturbance Mapping via Semantic Segmentation of Sentinel-2 Imagery [0.0]
道路、地震探査線、パイプラインは、森林地帯のカリブーの人口に重大な脅威をもたらす。本研究では、低解像度(10m)のSentinel-2衛星画像のセマンティックセグメンテーションのためのVGGNet16アーキテクチャに基づく深部畳み込みニューラルネットワークモデルを用いる。このモデルは、無料のAlberta Institute of Biodiversity Monitoring Human Footprintデータセットから得られた、地平線ラベルマップを使って訓練されている。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 14:42:12 GMT)
Any Quantum Many-Body State under Local Dissipation will be Disentangled in Finite Time [0.0]
遺伝的局所散逸の下での量子多スピン状態は、システムサイズに依存しない有限時間後に完全に分離可能であることを証明した。この結果は、ランダムな測定と量子チャネルの収束バウンドに基づく状態再構成IDを組み合わせることによって、厳密に導出される。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 10:32:52 GMT)
(Un)certainty of (Un)fairness: Preference-Based Selection of Certainly Fair Decision-Makers [0.0]
公正度指標は、さまざまな領域にわたる意思決定プロセスにおける差別と偏見を評価するために使用される。我々は差別評価を強化するために格差の不確実性を定量化する。我々は、意思決定者よりも好みを定義し、最適な意思決定者を選択するためにブルートフォースを利用する。
論文参考訳（メタデータ） (Thu, 19 Sep 2024 11:44:03 GMT)