From Linguistic Giants to Sensory Maestros: A Survey on Cross-Modal Reasoning with Large Language Models [56.9] クロスモーダル推論(CMR)は、より高度な人工知能システムへの進化における重要な能力として、ますます認識されている。
CMRタスクに取り組むためにLLM(Large Language Models)をデプロイする最近のトレンドは、その有効性を高めるためのアプローチの新たな主流となっている。
本調査では,LLMを用いてCMRで適用された現在の方法論を,詳細な3階層分類に分類する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:51:54 GMT)
LaMamba-Diff: Linear-Time High-Fidelity Diffusion Models Based on Local Attention and Mamba [54.9] 局所的意図的マンバブロックは、大域的コンテキストと局所的詳細の両方を線形複雑性でキャプチャする。
このモデルは, 256x256の解像度で, ImageNet上の様々なモデルスケールでDiTの性能を上回り, 優れたスケーラビリティを示す。
ImageNet 256x256 と 512x512 の最先端拡散モデルと比較すると,最大 62% GFLOP の削減など,我々の最大のモデルには顕著な利点がある。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:07:14 GMT)
MURI: High-Quality Instruction Tuning Datasets for Low-Resource Languages via Reverse Instructions [54.1] MURI(Multilingual Reverse Instructions)は低リソース言語のための高品質な命令チューニングデータセットを生成する。
MURIは、低リソース言語における既存の人文テキストから命令出力ペアを生成する。
私たちのデータセットであるMURI-ITには200言語にまたがる200万以上の命令出力ペアが含まれています。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 17:59:20 GMT)
Enhancing Logical Reasoning in Large Language Models through Graph-based Synthetic Data [53.4] 本研究では,大規模言語モデルの推論能力を高めるための学習信号としてグラフベースの合成推論データを使用することの可能性と限界について検討する。
2つの確立された自然言語推論タスクにおいて,合成グラフに基づく推論データによる教師付き微調整が,他の標準評価ベンチマークでの有効性を損なうことなく,LLMの推論性能を効果的に向上することを示した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 03:39:09 GMT)
KLDD: Kalman Filter based Linear Deformable Diffusion Model in Retinal Image Segmentation [51.0] 本稿では,網膜血管分割のためのKLDDモデルを提案する。
我々のモデルは、変形可能な畳み込みの柔軟な受容場を利用して、分割を反復的に洗練する拡散過程を用いる。
実験は網膜基底画像データセット(DRIVE,CHASE_DB1)とOCTA-500データセットの3mm,6mmで評価された。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:21:38 GMT)
SPARQ: Efficient Entanglement Distribution and Routing in Space-Air-Ground Quantum Networks [50.9] 宇宙空間量子(SPARQ)ネットワークは、シームレスなオンデマンドの絡み合い分布を提供する手段として開発された。
SPARQの複数のグラフ上でディープQネットワーク(DQN)を用いて深層強化学習フレームワークを提案し,訓練した。
通信相手間の絡み合いを確立するために,サードパーティの絡み合い分散政策を提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:31:37 GMT)
Bundle Fragments into a Whole: Mining More Complete Clusters via Submodular Selection of Interesting webpages for Web Topic Detection [49.8] 最先端のソリューションは、まず、Webページを多数の粒度トピック候補にまとめることである。
ホットトピックは、その面白さを推定することによってさらに特定される。
本稿では,フラグメントからより完全なホットトピックを抽出するためのバンドル・リフィニング手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 00:46:31 GMT)
Prompting Segment Anything Model with Domain-Adaptive Prototype for Generalizable Medical Image Segmentation [49.6] 医用画像のセグメンテーションにおけるセグメンテーションモデル(DAPSAM)の微調整のための新しいドメイン適応型プロンプトフレームワークを提案する。
DAPSAMは,2つの医療画像分割タスクにおいて,異なるモダリティで最先端のパフォーマンスを実現する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:28:33 GMT)
Opponent Shaping for Antibody Development [49.3] 抗ウイルス療法は通常、ウイルスの現在の株に向けて設計または進化される。
学習用語では、これは筋性最良の反応(すなわち、相手の適応的な動きを考慮しない)に対応する。
これは、一般的には、ミオピック・ベスト・レスポンスではなく、共プレイヤの適応を考慮に入れている相手のシェーピングにインスパイアされている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:05:59 GMT)
Enhancing Perception of Key Changes in Remote Sensing Image Change Captioning [49.2] KCFI(Key Change Features and Instruction-tuned)によるリモートセンシング画像変換キャプションのための新しいフレームワークを提案する。
KCFIは、バイテンポラルリモートセンシング画像特徴を抽出するViTsエンコーダと、重要な変化領域を識別するキー特徴知覚器と、画素レベルの変化検出デコーダとを含む。
提案手法の有効性を検証するため,LEVIR-CCデータセット上のいくつかの最新の変更キャプション手法との比較を行った。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:33:33 GMT)
Impact of ML Optimization Tactics on Greener Pre-Trained ML Models [46.8] 本研究の目的は,画像分類データセットと事前学習モデルの解析,最適化モデルと非最適化モデルを比較して推論効率を向上させること,最適化の経済的影響を評価することである。
画像分類におけるPyTorch最適化手法(動的量子化、トーチ・コンパイル、局所プルーニング、グローバルプルーニング)と42のHugging Faceモデルの影響を評価するための制御実験を行った。
動的量子化は推論時間とエネルギー消費の大幅な削減を示し、大規模システムに非常に適している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:23:03 GMT)
A Deep Dive into Fairness, Bias, Threats, and Privacy in Recommender Systems: Insights and Future Research [45.9] 本研究では,推薦システムにおける公正性,バイアス,脅威,プライバシについて検討する。
アルゴリズムによる決定が、意図せずバイアスを強化したり、特定のユーザやアイテムグループを疎外したりする方法について検討する。
この研究は、推薦システムの堅牢性、公正性、プライバシーを改善するための今後の研究の方向性を示唆している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:00:35 GMT)
Ultra-high strained diamond spin register with coherent optical link [45.4] ダイヤモンドの色中心のような固体スピン欠陥は、スケーラブルで統合された量子技術にとって最も有望な候補である。
ナノダイヤモンド内部の超高ひずみシリコン空洞を利用すれば、液体ヘリウム温度でフォノンによる脱落を緩和しながら、電子スピンのコヒーレントかつ効率的に制御できることを示す。
我々の研究は、将来量子ネットワークレジスタを従来の、確立されたフォトニクスとハイブリッド量子通信システムに統合するための道を開く。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 10:46:24 GMT)
Exploring the Lands Between: A Method for Finding Differences between AI-Decisions and Human Ratings through Generated Samples [45.2] 生成モデルの潜在空間におけるサンプルを見つける手法を提案する。
これらのサンプルを意思決定モデルと人間のレーダの両方に提示することにより、その決定が人間の直感と一致する領域を特定することができる。
本手法を顔認識モデルに適用し,100人の被験者から11,200人の評価データを収集する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:14:08 GMT)
DrivingForward: Feed-forward 3D Gaussian Splatting for Driving Scene Reconstruction from Flexible Surround-view Input [45.0] フレキシブル・サラウンド・ビュー・インプットから運転シーンを再構成するフィードフォワードガウス・スプレイティング・モデルを提案する。
我々は、ポーズネットワーク、ディープネットワーク、およびガウスネットワークを共同でトレーニングし、運転シーンを表すプリミティブを予測する。
提案モデルでは,既存のフィードフォワードやシーン最適化の手法よりも再現性が高い。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:16:04 GMT)
Fundus image enhancement through direct diffusion bridges [44.3] 直接拡散ブリッジに基づく基礎画像強調手法であるFD3を提案する。
まず, 眼科医による人体フィードバックループによる合成前方モデルを提案する。
我々は,スタンドアローン手法として非常に有効である,堅牢で柔軟な拡散に基づく画像強調ネットワークを訓練する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 00:26:14 GMT)
Look Through Masks: Towards Masked Face Recognition with De-Occlusion Distillation [39.2] 本稿では, マスク面認識の課題に対するアモーダル完了のメカニズムを, エンド・ツー・エンド・エンド・デオクルージョン蒸留フレームワークを用いて移行することを提案する。
合成対向ネットワークを適用して顔補完を行い、マスクの下にある内容を回復し、外観の曖昧さを解消する。
テキスト蒸留モジュールは、訓練済みの一般顔認識モデルを教師として受け取り、その知識を、完成した顔の学習者に伝達する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:00:36 GMT)
Learning to Coordinate without Communication under Incomplete Information [39.1] 自律的なエージェントが、パートナーの行動を解釈することで、どのように協力するかを示す。
Gnomes at Nightというテストベッドの実験結果から、学習したコミュニケーションの協調戦略が成功率を著しく向上させることが示された。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:41:41 GMT)
Bilingual Evaluation of Language Models on General Knowledge in University Entrance Exams with Minimal Contamination [35.9] このデータセットは、スペイン語と英語の大学入学レベルの試験に関する1003の質問からなる。
現在のオープンソースモデルとプロプライエタリモデルの選択は、一様ゼロショット実験環境で評価される。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:13:07 GMT)
Oscillatory dissipative tunneling in an asymmetric double-well potential [32.7] 化学研究は、トンネリング速度の正確な測定能力を備えた完全に制御可能で非対称な二重井戸の恩恵を受けるだろう。
我々の研究は、量子超伝導回路に基づくアナログ分子シミュレーターの道を開いた。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 22:43:07 GMT)
A Roadmap for Simulating Chemical Dynamics on a Parametrically Driven Bosonic Quantum Device [32.7] ボソニック超伝導Kerr-catデバイスを用いた反応力学シミュレーションの実現可能性について検討した。
このアプローチは、二重井戸自由エネルギープロファイルを定義するパラメータを制御し、温度や反応座標と非反応性自由度の熱浴との間の結合強度などの外部要因を制御できる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 22:43:08 GMT)
Robust estimation of the intrinsic dimension of data sets with quantum cognition machine learning [31.3] 本稿では,量子認知機械学習に基づく新しいデータ表現法を提案し,それを多様体学習に適用する。
我々は各点を量子状態として表現し、点の局所的性質とデータ全体との関係を符号化する。
量子幾何学のアイデアに触発され、量子状態から量子計量を備えた点雲を構築する。
提案手法は,このスペクトルギャップの検出に基づく。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:24:35 GMT)
MambaRecon: MRI Reconstruction with Structured State Space Models [30.5] ディープラーニングの出現は、MRIスキャンの迅速な再構築のための最先端の手法の開発を触媒している。
本稿では,長期的文脈感度と再構成の有効性の両立を目的とした,構造化状態空間モデルをコアに採用した革新的なMRI再構成フレームワークを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:50:10 GMT)
Human-like Affective Cognition in Foundation Models [28.6] 基礎モデルにおける感情認知テストのための評価フレームワークを提案する。
評価,感情,表現,結果の関係を探求する1,280の多様なシナリオを生成する。
以上の結果から,基礎モデルは人間の直感と一致しがちであることが明らかとなった。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:33:54 GMT)
Enhancing Performance and Scalability of Large-Scale Recommendation Systems with Jagged Flash Attention [27.7] Jagged Feature Interaction Kernelsは、長いカテゴリの特徴からきめ細かい洞察を抽出する新しい手法である。
我々の小説『Jagged Flash Attention』は、注目度と比較して最大9倍のスピードアップと22倍のメモリ削減を実現している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 18:20:54 GMT)
Defending against Reverse Preference Attacks is Difficult [26.9] 大きな言語モデル(LLM)は、有害なデータセットに対する教師付き微調整(SFT)のようなトレーニング時の攻撃に対して脆弱である。
本研究では,LLMが人間からのフィードバックから強化学習を行う際に,相手の報酬を用いて有害な行動を学習できるようにするために,Reverse Preference Attacks (RPA)を提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 17:10:34 GMT)
How the (Tensor-) Brain uses Embeddings and Embodiment to Encode Senses and Decode Symbols [26.5] 近年の発展を含むテンソル脳モデルの概要について概説する。
表象層は、意識研究からの象徴的なグローバルワークスペースのモデルである。
インデックス層には、概念、時間インスタンス、述語のためのシンボルが含まれている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 15:45:38 GMT)
The Midas Touch: Triggering the Capability of LLMs for RM-API Misuse Detection [26.3] ChatDetectorは、RM-API誤用検出のためのドキュメント理解を完全に自動化する。
ChatDetectorは、最先端のAPI検出器と比較して、98.21%の精度で165組のRM-APIを識別する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:05:13 GMT)
Generating API Parameter Security Rules with LLM for API Misuse Detection [26.3] LLMを用いたAPIソースコード解析により,APSRの自動生成のためのGPTAidという新しいフレームワークを提案する。
セキュリティクリティカルなAPIの誤用がAPSR違反によってしばしば引き起こされるという観察に基づく,実行時のフィードバックチェック手法を提案する。
GPTAidは92.3%の精度を達成し、最先端検出器の6倍のAPSRを生成する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 04:15:40 GMT)
Scaling FP8 training to trillion-token LLMs [26.2] 最大2兆トークンのデータセット上でFP8精度を使用して、大規模な言語モデルをトレーニングします。
我々は,FP8トレーニングにおいて,より短い期間で観察できない重大な障害を発見した。
Smooth-SwiGLUは機能変更なしに安定したFP8トレーニングを実現する新しい修正である。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:15:58 GMT)
NN-Copula-CD: A Copula-Guided Interpretable Neural Network for Change Detection in Heterogeneous Remote Sensing Images [24.5] 不均一なリモートセンシング画像の変化検出は、災害監視や土地利用管理に広く利用されている。
NN-Copula-CD というコプラ誘導型ニューラルネットワークを用いた知識データ駆動型ヘテロジニアスCD法を提案する。
NN-Copula-CDでは、コプラの数学的特徴を損失関数として用い、ニューラルネットワークを監督し、両時間的ヘテロジニアススーパーピクセル対間の依存性を学習する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:32:45 GMT)
LLMR: Knowledge Distillation with a Large Language Model-Induced Reward [24.5] 大規模言語モデルは、様々な自然言語処理(NLP)タスクで顕著なパフォーマンスを示すようになった。
しかし、これらのモデルは一般的に計算コストが高く、資源制約のある環境では展開が困難である。
大規模言語モデルから誘導される報酬関数に基づく新しい知識蒸留(KD)法であるLLMRを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 06:27:58 GMT)
How to predict on-road air pollution based on street view images and machine learning: a quantitative analysis of the optimal strategy [23.4] オンロード大気汚染は、放出源、希釈、物理化学的プロセスによる短距離でのかなりの変動を示す。
モバイル監視データをストリートビューイメージに統合することは、局所的な大気汚染を予測することを約束する。
このギャップを埋めるため,NO,NO2,PM2.5,PM10を314台のタクシーで動的に監視し,対応するSVIをサンプリングした。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:21:23 GMT)
DNI: Dilutional Noise Initialization for Diffusion Video Editing [22.3] 本稿では,非剛性編集を含む精密かつダイナミックな修正が可能なDNI(Dilutional Noise Initialization)フレームワークを提案する。
DNIは「ノイズ希釈」の概念を導入し、入力ビデオによって課される構造的剛性を和らげるために編集される領域の潜時雑音にさらなるノイズを加える。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 18:17:57 GMT)
Rethinking the Influence of Source Code on Test Case Generation [22.2] 大規模言語モデル(LLM)は、コンテキストとして提供されるテスト対象のソースコードでテスト生成を支援するために広く応用されている。
テスト中のソースコードが間違っていれば、LLMはテストの生成時に誤用されるだろうか?
評価結果から, 誤りコードは, 正しい, 高いカバレッジ, バグ修正テストを生成する際に, LLMを著しく誤解させる可能性が示唆された。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:03:27 GMT)
Personalized Speech Recognition for Children with Test-Time Adaptation [21.9] 主に成人データに基づいて事前訓練されたオフザシェルフ自動音声認識(ASR)モデルは、子供の発話に悪影響を及ぼす傾向にある。
子どもの音声認識に教師なしテスト時間適応(TTA)手法を適用する新しいASRパイプラインを考案した。
以上の結果から,TTA法に適応したASRモデルは,個々の子話者の平均および統計的に,未適応のASRベースラインよりも有意に優れていた。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 21:40:07 GMT)
Should RAG Chatbots Forget Unimportant Conversations? Exploring Importance and Forgetting with Psychological Insights [21.7] 本稿では、感情的に記憶を刺激し、会話の10%未満を維持できるLUFYを提案する。
その結果,会話の大部分を忘れたままの記憶の優先順位付けがユーザエクスペリエンスを著しく向上させることが示された。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:39:22 GMT)
HLLM: Enhancing Sequential Recommendations via Hierarchical Large Language Models for Item and User Modeling [21.5] 大規模言語モデル(LLM)は様々な分野で顕著な成功を収めており、いくつかの研究がレコメンデーションシステムにおいてその可能性を探求している。
逐次レコメンデーションシステムを強化するために,新しい階層型大規模言語モデル (HLLM) アーキテクチャを提案する。
HLLMは,項目特徴抽出とユーザ関心モデリングの両方に 7B パラメータを利用する構成で,優れたスケーラビリティを実現している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:03:07 GMT)
ITPatch: An Invisible and Triggered Physical Adversarial Patch against Traffic Sign Recognition [21.2] 我々は,新しい攻撃ベクトル,すなわち蛍光インキを用いた,目に見えない,引き起こされる物理的敵パッチ(ITPatch)を導入し,最先端の技術を推し進める。
標的の標識に慎重に設計された蛍光摂動を適用し、攻撃者は後に目に見えない紫外線を使って蛍光効果を誘発し、TSRシステムは標識を誤って分類し、交通事故を引き起こす可能性がある。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:36:54 GMT)
A Novel Perspective for Multi-modal Multi-label Skin Lesion Classification [20.1] 本稿ではマルチモーダルマルチラベルトランスフォーマーモデル(SkinM2Former)を用いた皮膚病変について述べる。
SkinM2Formerは、平均平均精度77.27%、平均診断精度77.85%を公開Derm7ptデータセットで達成し、最先端(SOTA)法より優れている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:31:38 GMT)
FoME: A Foundation Model for EEG using Adaptive Temporal-Lateral Attention Scaling [19.9] FoME (Foundation Model for EEG) は適応的側方アテンションスケーリングを用いた新しいアプローチである。
FoMEは1.7TBの頭皮と頭蓋内脳波記録のデータセットで事前訓練されており、1,096kのステップで745Mのパラメータが訓練されている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 04:22:40 GMT)
What does guidance do? A fine-grained analysis in a simple setting [19.5] 誘導の力学を2つのケースで詳細に解析する。
非ゼロレベルのスコア推定誤差に対して、十分な大きなガイダンスがサポートからのサンプリングにつながることを証明します。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 20:16:33 GMT)
A Lightweight and Real-Time Binaural Speech Enhancement Model with Spatial Cues Preservation [19.4] バイノーラル音声強調は、聴覚装置から受信される雑音信号の音質と可聴性を改善することを目的としている。
既存の手法は、ノイズ低減(NR)と空間的手がかり(SCP)の精度と保存の妥協に悩まされることが多い。
本稿では、低周波帯域をフィルタし、残りを保ち、NRに優れた学習ベース軽量複合畳み込みネットワーク(LBCCN)を提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 03:52:50 GMT)
VCAT: Vulnerability-aware and Curiosity-driven Adversarial Training for Enhancing Autonomous Vehicle Robustness [18.3] Vulnerability-aware and Curiosity-driven Adversarial Training (VCAT)は、悪意のある攻撃に対して自動運転車(AV)を訓練するフレームワークである。
VCATは、サロゲートネットワークを使用して、AV被害者の価値関数に適合し、被害者の固有の脆弱性に関する密集した情報を提供する。
被害者防衛訓練フェーズでは、AVは、訓練済みの攻撃者が被害者の周りに配置され、攻撃行動を生成する重要なシナリオで訓練される。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:53:02 GMT)
Towards Physically-Realizable Adversarial Attacks in Embodied Vision Navigation [18.2] 本稿では,学習可能なテクスチャと不透明度を持つ対向パッチをオブジェクトにアタッチすることで,ナビゲーションを具体化するための実用的な攻撃手法を提案する。
実験の結果,我々の敵パッチは航法成功率を約40%削減し,実用性,有効性,自然性において従来の手法よりも優れていた。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 04:55:24 GMT)
LLM-Measure: Generating Valid, Consistent, and Reproducible Text-Based Measures for Social Science Research [18.1] 本稿では,大規模言語モデル(LLM)の内部隠れ状態を利用して概念尺度を生成する手法を提案する。
3つの複製研究は、高い妥当性、一貫性、再現可能なテキストベースの尺度を生成する方法の有効性を示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:44:00 GMT)
LVCD: Reference-based Lineart Video Colorization with Diffusion Models [18.1] 参照型リニアトビデオのカラー化のための第1のビデオ拡散フレームワークを提案する。
我々は、大規模な事前学習ビデオ拡散モデルを利用して、カラー化されたアニメーションビデオを生成する。
提案手法は高品質で長時間の時間一貫性のあるアニメーションビデオを生成することができる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 17:59:48 GMT)
Adversarial Attack for Explanation Robustness of Rationalization Models [17.8] 合理化モデルは、人間が予測を理解し、信頼するために、入力テキストのサブセットを選択する。
本論文は, 合理化モデルの説明可能性について, 予測を変更せずに損なうことを目的としている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:24:02 GMT)
Is it Still Fair? A Comparative Evaluation of Fairness Algorithms through the Lens of Covariate Drift [17.5] データ分散ドリフトとその公正度アルゴリズムとメトリクスへの影響について検討する。
場合によっては、データ分布のドリフトは、いわゆるフェアモデルにおいて、フェアネスの深刻な劣化を引き起こすことがある。
本研究の成果から,データ分散ドリフトが公正性アルゴリズムにもたらすいくつかの政策的含意を合成する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 03:18:12 GMT)
HeadCT-ONE: Enabling Granular and Controllable Automated Evaluation of Head CT Radiology Report Generation [16.1] HeadCT-ONEは、関係正規化エンティティ抽出による頭部CTレポート生成を評価するメトリクスである。
HeadCT-ONEは正規化されたエンティティとリレーションを比較し、異なるエンティティタイプや特定のエンティティのコントロール可能な重み付けを可能にする。
以上の結果から,ヘッドCT-ONEはより柔軟で,制御可能で,粒度の高い頭部CTレポートの自動評価を可能にした。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 18:20:11 GMT)
Unsupervised Hyperspectral and Multispectral Image Blind Fusion Based on Deep Tucker Decomposition Network with Spatial-Spectral Manifold Learning [15.9] タッカー分解と空間スペクトル多様体学習(DTDNML)に基づくハイパースペクトル・マルチスペクトル画像の教師なしブラインド融合法を提案する。
本手法は,様々なリモートセンシングデータセット上でのハイパースペクトルとマルチスペクトル融合の精度と効率を向上させる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 04:31:01 GMT)
Linguistic Minimal Pairs Elicit Linguistic Similarity in Large Language Models [15.9] 我々はLarge Language Models(LLMs)が捉えた言語知識の定量化と洞察を得る。
3つの言語で100以上のLLMと150k以上の最小ペアにまたがる大規模な実験では、4つの重要な側面から言語的類似性の特性を明らかにした。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 03:29:40 GMT)
TEAM: Temporal Adversarial Examples Attack Model against Network Intrusion Detection System Applied to RNN [14.5] 我々は,textbfTemporal adversarial textbfExamples textbfAttack textbfModel textbf(TEAM)と呼ばれる特徴再構成に基づく新しいRNN敵攻撃モデルを提案する。
ほとんどの攻撃カテゴリーでは、TEAMはブラックボックスとホワイトボックスの両方でのNIDSの誤判定率を改善し、96.68%以上に達する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 05:26:04 GMT)
Assessing the Zero-Shot Capabilities of LLMs for Action Evaluation in RL [14.1] 信用割当問題は強化学習(RL)における中心的な課題である
クレジット・アサインメント・ウィズ・ランゲージ・モデル(CALM)は、報酬形成とオプション発見を通じてクレジット・アサインメントを自動化する新しいアプローチである。
予備的な結果は、大規模言語モデルの知識が、RLにおける信用代入の有望な先行であることを示している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:08:09 GMT)
Adaptive Selection of Sampling-Reconstruction in Fourier Compressed Sensing [13.8] 圧縮センシング(CS)は、ナイキストサンプリングの非効率性を克服するために出現している。
ディープラーニングベースの再構築は、最適化ベースの再構築に代わる有望な代替手段である。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 03:54:58 GMT)
An Empirical Study on the Distance Metric in Guiding Directed Grey-box Fuzzing [13.4] Directed gray-box fuzzing (DGF)は、特定のコード領域の脆弱性を効率的に発見することを目的としている。
距離の異なるメトリクスがファジィングプロセスをどのようにガイドし、ファジィングの結果に影響を及ぼすかについては、いまだ不透明である。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:15:54 GMT)
Multi-Scale Feature Prediction with Auxiliary-Info for Neural Image Compression [13.1] 本稿では,ニューラルビデオ圧縮にインスパイアされた補助粗いネットワークと主ネットワークからなる新しい予測構造を導入する。
我々のモデルは、他のニューラル画像圧縮モデルより優れており、Tecnickデータセット上のVVCよりも19.49%高い速度歪み性能を実現している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:41:53 GMT)
Deep generative models as an adversarial attack strategy for tabular machine learning [13.0] 我々は4つの人気のDeep Generative Model(DGM)を逆DGM(AdvDGM)に適用する。
ドメイン制約に適合した現実的な逆例を生成する上での有効性を評価する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 10:41:23 GMT)
SpecEval: Evaluating Code Comprehension in Large Language Models via Program Specifications [12.7] プログラム仕様を用いて,大規模言語モデルにおけるコード理解を評価するためのSpecEvalを提案する。
プログラムのセマンティクスを表現し、徹底的な評価を行うために、正式な仕様を採用する。
特に、4つの仕様関連タスクは、基本的なレベルから高度なレベルまでLLMの能力を評価するように設計されている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:08:39 GMT)
PersonaFlow: Boosting Research Ideation with LLM-Simulated Expert Personas [12.6] 研究アイデアを支援するためにペルソナシミュレーションを用いたLLMシステムであるペルソナフローを紹介する。
以上の結果から,複数のペルソナをアイデア作成中に使用すると,ユーザ認識の質が著しく向上することが示唆された。
ユーザのペルソナカスタマイズインタラクションは、生成したアイデアのコントロールとリコールの感覚を大幅に改善した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:54:29 GMT)
Representing Positional Information in Generative World Models for Object Manipulation [12.3] 本稿では,世界モデルに基づくエージェントがオブジェクト配置タスクを解くための汎用的アプローチを提案する。
特にLCPでは、目標仕様のためのオブジェクトの位置情報を明示的にキャプチャするオブジェクト中心の潜在表現を採用している。
提案手法は複数の操作環境にまたがって厳密に評価され,現行のモデルベース制御手法と比較して良好な性能を示した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:38:06 GMT)
Communication-Efficient Federated Low-Rank Update Algorithm and its Connection to Implicit Regularization [12.0] フェデレートラーニング(FL)は、コミュニケーション効率と不均一性に関連する重要な課題に直面している。
我々はフェデレート学習のための一般的な低ランク更新フレームワークであるFedLoRUを提案する。
我々のフレームワークは、低ランククライアント側の更新を強制し、これらの更新を蓄積して高ランクモデルを作成します。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 00:11:58 GMT)
Don't be Fooled: The Misinformation Effect of Explanations in Human-AI Collaboration [11.8] 我々は,人間がXAIに支えられたAIによる意思決定について研究している。
その結果,誤った説明が正しいAIアドバイスに付随する場合に誤報が生じることがわかった。
この効果は、人間が欠陥のある推論戦略を推測し、タスクの実行を妨げ、手続き的知識の障害を示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:34:20 GMT)
Interpretable Action Recognition on Hard to Classify Actions [11.6] 人間は、明確に認識された物体と部分の間の批判的時間的関係を認識することによって、ビデオにおける複雑な活動を認識する。
これを模倣するために、物体と手の位置と動きを利用したモデルを構築し、その活動が起こっていることを認識します。
このモデルを改善するために、最も混乱した3つのクラス(このモデル)に注目し、3D情報の欠如が大きな問題であることを確認した。
オブジェクトの形状情報を既存のオブジェクトの特徴に統合するために,“Container”と“NotContainer”の違いを決定するために,最先端のオブジェクト検出モデルを微調整した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 21:23:44 GMT)
Connecting Ideas in 'Lower-Resource' Scenarios: NLP for National Varieties, Creoles and Other Low-resource Scenarios [11.5] 少数の言語のベンチマークによる優れた結果にもかかわらず、大規模な言語モデルは、低リソースのシナリオにある言語からテキストを処理するのに苦労している。
このチュートリアルでは、自然言語処理(NLP)研究における共通の課題、アプローチ、テーマを特定し、データ・ポーア・コンテキストに固有の障害に直面し克服する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:48:42 GMT)
LMT-Net: Lane Model Transformer Network for Automated HD Mapping from Sparse Vehicle Observations [11.4] Lane Model Transformer Network (LMT-Net) は、エンコーダとデコーダのニューラルネットワークアーキテクチャであり、ポリリン符号化を実行し、レーンペアとその接続性を予測する。
我々は、複数の車両観測と、地上真実(GT)としての人間のアノテーションからなる内部データセット上でのLMT-Netの性能を評価する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:14:35 GMT)
Cross-Chirality Palmprint Verification: Left is Right for the Right Palmprint [11.4] 本稿では,従来のパームプリント検証システムにおける従来の知恵に挑戦する,新しいCCPVフレームワークを提案する。
通常、左右両方のヤシプリントを保存する必要がある既存の方法とは異なり、本手法では、ヤシプリントテンプレートを1つだけ保存しながら、ヤシプリントを使用することが可能である。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 19:10:21 GMT)
Gender Representation and Bias in Indian Civil Service Mock Interviews [11.3] 男女の偏見は、男女の候補者に質問する質問の幅広い性質に見受けられる。
大きな言語モデルを用いた実験は、説明に性別バイアスが強く存在することを示している。
本稿では,今後の社会科学研究に有用な51,278質問のデータセットを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:56:26 GMT)
Text2Traj2Text: Learning-by-Synthesis Framework for Contextual Captioning of Human Movement Trajectories [11.3] 本稿では,小売店舗における買い物客の軌跡データの背後にあるコンテキストをキャプションする新しい学習・キャプションフレームワークであるText2Traj2Textを提案する。
私たちの仕事は、ターゲット広告や在庫管理など、より良い顧客理解を必要とするさまざまな小売アプリケーションに影響を与えます。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:30:09 GMT)
Pay Attention to What Matters [10.9] 命令トークンの注意点を機械的に増加させる,GUIDE と呼ばれるシンプルで効果的な手法を提案する。
この操作を支援するために,ユーザの指示がトランス層を通してどのように伝播するかを強調する新しい指標であるEmpfectを提案する。
以上の結果から,GUIDEは命令の精度を29.4%から60.4%に向上し,自然刺激の代替品や100万トークンのスーパービジョンファインチューニングよりも優れていた。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 15:26:50 GMT)
Enhancing Synthetic Training Data for Speech Commands: From ASR-Based Filtering to Domain Adaptation in SSL Latent Space [10.9] 我々は、音声コマンド分類の特定のタスクに対して、合成音声データを用いてゼロショット学習に関する一連の実験を行う。
Google Speech Commands データセットの結果から,単純な ASR ベースのフィルタリング手法が生成したデータの品質に大きな影響を及ぼす可能性が示唆された。
生成した音声データの品質は高いが,自己教師付き(WavLM)機能を用いることで,合成音声と実音声の区別が容易に可能であることを示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:07:55 GMT)
Disentangling Recognition and Decision Regrets in Image-Based Reinforcement Learning [10.7] 画像に基づく強化学習では、性能と急激な相関や意思決定に無関係な特徴が一般化性能の低下につながる可能性がある。
我々は,2つの誤りの原因を解き明かすために,認識の後悔と決定の後悔という概念を導入する。
本稿では,迷路環境とアタリゲームポンの両面において,過度に特有の表現と過小な表現の両方による観測過適合の例を示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 22:26:36 GMT)
StoryMaker: Towards Holistic Consistent Characters in Text-to-image Generation [10.7] StoryMakerは、顔の整合性だけでなく、衣服、髪型、身体の整合性も保持するパーソナライズソリューションである。
StoryMakerは多くのアプリケーションをサポートし、他のソーシャルプラグインと互換性がある。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 08:53:06 GMT)
Using Large Language Models to Generate Clinical Trial Tables and Figures [10.3] テーブル、フィギュア、リスト(TFL)は臨床試験データを要約するための重要なツールである。
本研究では,TFLの自動生成における大規模言語モデル (LLM) の利用について,素早い工学的手法と数発の転写学習を用いて検討した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:48:43 GMT)
Trust-informed Decision-Making Through An Uncertainty-Aware Stacked Neural Networks Framework: Case Study in COVID-19 Classification [10.3] 本研究は、放射線画像から新型コロナウイルスの信頼できる分類のための、不確実性を考慮した重畳ニューラルネットワークモデルを提案する。
このモデルは、確実な正確な予測を正確に識別することに焦点を当て、不確実性を考慮したモデリングにおける重要なギャップに対処する。
このアーキテクチャはモンテカルロのドロップアウトやアンサンブル技術を含む不確実な定量化手法を統合し、予測信頼性を高める。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 04:20:12 GMT)
Enhancing Knowledge Distillation of Large Language Models through Efficient Multi-Modal Distribution Alignment [10.1] 本稿では,教師モデルと学生モデルとのピーク予測の整合性を促進するために,ランキング損失に基づく知識蒸留(RLKD)を提案する。
提案手法は,教師モデルのマルチモーダル分布をよりよく学習し,様々な下流タスクにおいて顕著な性能向上をもたらす。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 08:06:42 GMT)
Data Poisoning and Leakage Analysis in Federated Learning [10.1] データ中毒と漏洩のリスクは、現実世界におけるフェデレートされた学習の大規模展開を妨げる。
この章では、データプライバシー侵害のエミュレーションとデータ中毒のエミュレーションという2つの支配的脅威を理解するための真実と落とし穴を明らかにします。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:50:29 GMT)
Hierarchical Gradient-Based Genetic Sampling for Accurate Prediction of Biological Oscillations [9.9] 生体振動に対するニューラルネットワーク予測の精度を向上させる階層的勾配に基づく遺伝的サンプリング(HGGS)フレームワークを提案する。
実験の結果,HGGSは4つの生体系において7つの比較サンプリング法より優れていた。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:41:54 GMT)
A dynamic vision sensor object recognition model based on trainable event-driven convolution and spiking attention mechanism [9.7] Spiking Neural Networks(SNN)は、ダイナミックビジュアルセンサー(DVS)からのイベントストリームを処理するのに適している
DVSオブジェクトから特徴を抽出するために、SNNは通常、固定されたカーネルパラメータでイベント駆動の畳み込みを使用する。
トレーニング可能なイベント駆動型畳み込みとスパイク注意機構を利用するDVSオブジェクト認識モデルを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:01:05 GMT)
Optimal or Greedy Decision Trees? Revisiting their Objectives, Tuning, and Performance [9.3] 近年,精度を直接最適化する最適決定木 (ODT) 手法への関心が高まっている。
我々は,ODTの比較的探索されていない2つの側面を同定する。
最適手法の値は、文献が矛盾する結果をもたらすため、まだ十分に理解されていない。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:55:29 GMT)
Nigerian Software Engineer or American Data Scientist? GitHub Profile Recruitment Bias in Large Language Models [9.0] 私たちはOpenAIのChatGPTを使って、4つのリージョンからGitHub User Profileを使って6人のソフトウェア開発チームを募集しています。
結果から,ChatGPTは2つのプロファイルの位置情報文字列をスワップしても,他のリージョンよりも好みを示すことがわかった。
ChatGPTは特定の国のユーザに特定の開発者ロールを割り当てる傾向があり、暗黙の偏見が浮かび上がっていた。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 08:04:30 GMT)
Cloudy with a Chance of Anomalies: Dynamic Graph Neural Network for Early Detection of Cloud Services' User Anomalies [9.0] 本稿では,クラウドサービスグラフに基づく異常検出 (CS-GAD) のための,先駆的な時間ベースの埋め込み手法を提案する。
本手法では動的三部グラフ表現を用いて,クラウドサービス,ユーザ,それらの活動間の相互作用を時間とともにカプセル化する。
その結果,有望な方法に比べて偽陽性率(2-9%)が顕著に低下し,真陽性率(100%)が低下した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:50:31 GMT)
Retrieval-Augmented Test Generation: How Far Are We? [8.8] Retrieval Augmented Generation (RAG)は、ソフトウェアエンジニアリングタスクの顕著な進歩を示している。
このギャップを埋めるために,テスト生成におけるRAGベースのLCMの有効性を検討する。
具体的には,1) APIドキュメント,2) GitHubイシュー,3) StackOverflow Q&Aの3種類のドメイン知識に基づいて構築されたRAGについて検討する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:48:29 GMT)
CF-GO-Net: A Universal Distribution Learner via Characteristic Function Networks with Graph Optimizers [8.8] 本稿では,分布に直接対応する確率的記述子である特徴関数(CF)を用いる手法を提案する。
確率密度関数 (pdf) とは異なり、特徴関数は常に存在するだけでなく、さらなる自由度を与える。
提案手法では,訓練済みのオートエンコーダなどの事前学習モデルを使用することで,特徴空間で直接学習することができる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:33:12 GMT)
MGSO: Monocular Real-time Photometric SLAM with Efficient 3D Gaussian Splatting [8.6] 本稿では,光メトリックSLAMと3DGSを統合した新しいリアルタイムSLAMシステムであるMonocular GSOを提案する。
本システムでは, 品質, メモリ効率, 速度のバランスを保ち, 再現性を向上する。
現代のシステムを超えているだけでなく、ラップトップのハードウェアの性能も維持していることを示す実験も行っています。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 19:07:05 GMT)
Efficient Identification of Direct Causal Parents via Invariance and Minimum Error Testing [8.4] ICPの識別可能性問題に対処するために,誤り不等式を用いたMMSE-ICPと高速ICPを提案する。
不等式は、因果親を用いた予測器の最小誤差が全ての予測器の中で最小であることを示す。
MMSE-ICP と fastICP は、多くのシミュレーションにおいて競合するベースラインを上回るだけでなく、大規模な実データベンチマークで最先端の結果が得られる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:07:31 GMT)
COCO-Occ: A Benchmark for Occluded Panoptic Segmentation and Image Understanding [8.3] 本稿では,COCO画像を3つの認知閉塞レベルに手動でラベル付けすることで,COCOデータセットから派生した大規模データセットCOCO-Occを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:26:28 GMT)
Shape-informed surrogate models based on signed distance function domain encoding [8.1] パラメータ化偏微分方程式(PDE)の解を近似する代理モデルを構築するための非侵入的手法を提案する。
我々のアプローチは2つのニューラルネットワーク(NN)の組み合わせに基づいている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:47:04 GMT)
RAD-Bench: Evaluating Large Language Models Capabilities in Retrieval Augmented Dialogues [8.0] RAD-Benchは、検索後のマルチターン対話における大規模言語モデルの能力を評価するために設計されたベンチマークである。
また, LLM の評価結果から, モデルの性能が劣化し, 追加の条件や制約が適用されることが判明した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 08:26:45 GMT)
Program Slicing in the Era of Large Language Models [8.0] プログラムスライシングはソフトウェア工学において重要なテクニックであり、開発者は関連するコードの部分を分離することができる。
本研究では,大規模言語モデル(LLM)の静的スライシングおよび動的プログラムスライシングへの応用について検討する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 00:07:56 GMT)
Arena 4.0: A Comprehensive ROS2 Development and Benchmarking Platform for Human-centric Navigation Using Generative-Model-based Environment Generation [7.9] 本稿では、Arena 3.0、Arena-Bench、Arena 1.0、Arena 2.0の大幅な進歩であるArena 4.0を紹介する。
Arena 4.0は、(1)生成モデルに基づく世界とシナリオ生成アプローチ、(2)包括的な3Dモデルデータベース、(3)ROS 2.0への完全移行の3つの重要な貢献を提供する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 05:20:13 GMT)
Towards Testing and Evaluating Vision-Language-Action Models for Robotic Manipulation: An Empirical Study [7.9] 視覚言語アクション(VLA)モデルは、ロボット操作を前進させる可能性について多くの注目を集めている。
VLAモデルによって提供されるエンドツーエンドの知覚制御ループにもかかわらず、そのようなモデルの能力を包括的に理解する能力は欠如している。
VLAモデルの性能を評価するために,多様なロボット操作シーンを自動的に生成するテストフレームワークであるVLATestを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:33:00 GMT)
A sound description: Exploring prompt templates and class descriptions to enhance zero-shot audio classification [7.6] ゼロショット音声分類のための代替プロンプトテンプレートについて検討し、高い性能のオプションの存在を実証する。
本研究は, クラス記述の促進により, 周囲の音声データセット間でのゼロショット音声分類の結果が得られたことを示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:27:50 GMT)
On the Regret of Coded Caching with Adversarial Requests [7.2] オンライン学習フレームワークにおいて、よく知られた符号化キャッシュ問題について検討し、リクエストが順次到着する。
本稿では、Follow-The-Perturbed-Leader原則に基づくキャッシュポリシーを導入し、任意の時間水平線Tにおいて、算術的O(sqrt(T))に対するサブ線形後悔を実現することを示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:13:03 GMT)
PoTATO: A Dataset for Analyzing Polarimetric Traces of Afloat Trash Objects [7.1] 水生環境のプラスチック廃棄物は海洋生物や人間の健康に深刻なリスクをもたらす。
ディープラーニングはこのタスクの強力なツールとして広く利用されているが、その性能は屋外の光条件と水面反射によって著しく制限されている。
12,380個のラベル付きプラスチックボトルとリッチ偏光情報を含むデータセットPoTATOを紹介する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:21:24 GMT)
Trustworthy Intrusion Detection: Confidence Estimation Using Latent Space [7.1] 侵入検知システム(IDS)における異常検出の信頼性向上のための新しい手法を提案する。
遅延空間表現に基づく信頼度尺度の開発により,サイバー攻撃に対するIDS予測の信頼性向上を目指す。
NSL-KDDデータセットの適用により,通常のネットワークアクティビティと悪意のあるネットワークアクティビティを効果的に区別するバイナリ分類タスクに焦点をあてる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 08:09:44 GMT)
The Robustness of Spiking Neural Networks in Communication and its Application towards Network Efficiency in Federated Learning [7.0] スパイキングニューラルネットワーク(SNN)は最近、組み込みデバイスでのオンチップ学習に多大な関心を集めている。
本稿では,フェデレートラーニングにおける雑音の多いコミュニケーション下でのSNNの本質的ロバスト性について検討する。
FLトレーニングにおける帯域幅の削減を目的とした,TopKスパシフィケーションを用いた新しいフェデレートラーニングアルゴリズムを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:37:18 GMT)
Generation and Editing of Mandrill Faces: Application to Sex Editing and Assessment [6.8] 本稿では,男性や女性のマンドリルの顔画像を生成する手法を提案する。
提案手法の主な特徴は、特定のGANの潜伏空間における性軸を特定することによって、性別を編集する能力である。
さらに,実画像の分布から抽出した統計的特徴に基づく性別レベルの評価も行った。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:30:50 GMT)
The Gaussian Discriminant Variational Autoencoder (GdVAE): A Self-Explainable Model with Counterfactual Explanations [6.7] 視覚的対物的説明(CF)法は、画像の概念を変更し、予測を事前に定義された結果に変更する。
本稿では,条件付き変分オートエンコーダ(CVAE)とCF説明の統合に基づく自己説明可能なモデルであるGdVAEを紹介する。
CFsの整合性は、説明関数で潜在空間を正規化することによって改善される。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 17:58:15 GMT)
ARTAI: An Evaluation Platform to Assess Societal Risk of Recommender Algorithms [6.7] ARTAIは,推薦アルゴリズムの大規模評価を可能にする評価環境である。
本稿では,コンテンツ配信における有害なパターンを大規模に評価できる評価環境ARTAIを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:39:51 GMT)
MambaClinix: Hierarchical Gated Convolution and Mamba-Based U-Net for Enhanced 3D Medical Image Segmentation [6.7] 医用画像分割のための新しいU字型アーキテクチャであるMambaClinixを提案する。
MambaClinixは、階層的なゲート畳み込みネットワークとMambaを適応的なステージワイドフレームワークに統合する。
以上の結果から,MambaClinixは低モデルの複雑さを維持しつつ高いセグメンテーション精度を達成できることが示唆された。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:51:14 GMT)
Fear and Loathing on the Frontline: Decoding the Language of Othering by Russia-Ukraine War Bloggers [6.6] その他に、外集団を内集団と根本的に異なるものとして描写する行為は、しばしばそれらを現実的な脅威とみなすようにエスカレートする。
ドイツやルワンダの少数民族に対するジェノサイドの極端な歴史的例から、米国やヨーロッパの移民を標的とした暴力や修辞学まで、これらのダイナミクスは驚くほど広範囲に及んでいる。
我々のフレームワークは、他者のダイナミクスに関する深い洞察を提供するように設計されており、迅速な適応プロセスと組み合わせて、他者の社会的結束に対する悪影響を緩和するための重要なツールを提供する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 19:56:03 GMT)
AutoMode-ASR: Learning to Select ASR Systems for Better Quality and Cost [6.5] AutoMode-ASRは複数のASRシステムを統合し、コストを最適化しながら全体の転写品質を向上させる。
2つのシステム間の選好を決定するバイナリ分類器を組み込むことでこれを実現できる。
その結果、WERの相対的な削減は16.2%、コスト削減は65%、スピード改善は75%であった。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 05:34:52 GMT)
Towards Unbiased Evaluation of Time-series Anomaly Detector [6.5] 時系列異常検出(TSAD)は、その重要な応用に動機付けられた研究の進化する領域である。
本研究では,平衡点調整(BA)と呼ばれる代替調整プロトコルを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 19:02:45 GMT)
DenoMamba: A fused state-space model for low-dose CT denoising [6.5] 低線量CT(LDCT)は放射線曝露に伴う潜在的なリスクを低くする。
LDCT denoisingは、基礎となる組織信号からの線量減少によって引き起こされるノイズを分離するために、データ駆動画像の事前学習を行うニューラルネットワークモデルに基づいている。
DenoMambaは、状態空間モデリング(SSM)に基づく、医療画像の短距離および長距離コンテキストを効率的にキャプチャする新しいデノナイジング手法である。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 21:32:07 GMT)
Improving Cone-Beam CT Image Quality with Knowledge Distillation-Enhanced Diffusion Model in Imbalanced Data Settings [6.2] 毎日のコーンビームCT(CBCT)画像は、治療調整の要点であり、組織密度の精度が低い。
治療中のCBCTデータを最大化し, 疎対ファンビームCTで補完した。
本手法はRTにおけるCBCTスキャンから高画質CT画像を生成する上で有望であることを示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:56:06 GMT)
A quest through interconnected datasets: lessons from highly-cited ICASSP papers [6.0] 我々は,ICASSP(International Conference on Acoustics, Speech, and Signal Processing)において,トップ5の引用論文に関連するデータセットの利用状況について検討する。
この方法では、使用済みデータセットの起源を徹底的に分析し、しばしば公式論文で報告された以上の検索を行なわなければならない。
特に、より大きく、おそらく生成可能なAIモデルへの現在のプルでは、データ証明に対する説明責任の必要性に対する認識が高まっている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:25:57 GMT)
Vision Language Models Can Parse Floor Plan Maps [5.9] 視覚言語モデル(VLM)は、多くのタスクに取り組むために画像とテキストを同時に推論することができる。
本稿では,VLMコンテキスト内で探索されていない新しいタスクであるmap parsingに焦点を当てる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 15:36:28 GMT)
Evolution and challenges of computer vision and deep learning technologies for analysing mixed construction and demolition waste [5.7] 本稿では,高度自動混合C&DW管理システム開発における課題と機会について考察する。
我々は,DLに基づく視覚的手法が最適解であるとして,様々なC&DW分析手法を概説する。
また、C&DWデータセット、そのキュレーション、作成のための革新的な方法についても論じる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 22:38:26 GMT)
pyrtklib: An open-source package for tightly coupled deep learning and GNSS integration for positioning in urban canyons [5.6] 本稿では,広く利用されているオープンソースツールRTKLIBのPythonバインディングであるpyrtklibを紹介する。
我々は,新しいディープラーニングフレームワークであるpyrtklibの下で,ディープラーニングサブシステムを提案する。
pyrtklibを使用することで、開発者はディープラーニング支援アルゴリズムを簡単かつ迅速に実装できる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:47:47 GMT)
PMR-Net: Parallel Multi-Resolution Encoder-Decoder Network Framework for Medical Image Segmentation [5.6] 並列マルチ解像度エンコーダデコーダネットワーク,すなわちPMR-Netを提案する。
提案したPMR-Netは,5つの公開データセットの最先端手法よりも,より正確なセグメンテーション結果が得られる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:45:08 GMT)
Experimental sample-efficient quantum state tomography via parallel measurements [5.4] 我々は、量子重畳トモグラフィ(PQST)にインスパイアされた効率的な量子状態トモグラフィー法を開発した。
PQSTは測定回数を大幅に削減し、ショットノイズに対してより多くの効果を提供する。
その結果,PQSTは測定コストを低減し,75および99の観測可能な6kbitおよび9kbitのW状態から98.68%,95.07%の忠実度を得た。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:34:50 GMT)
Multi-View Adaptive Contrastive Learning for Information Retrieval Based Fault Localization [5.2] MACL-IRFL(Multi-View Adaptive Contrastive Learning for Information Retrieval Fault Localization)という新しい手法を提案する。
まず、レポート・コード・インタラクション・ビュー、レポート・レポートの類似性ビュー、コード・コードの共引用ビューを別々に生成し、グラフニューラルネットワークを用いて、埋め込みプロセスの3つのビューからバグレポートやソースコードファイルの情報を集約する。
コントラスト学習タスクの設計では,バグレポートの表現は,レポートレポートやレポートコードビューで共有される情報をエンコードし,ソースコードファイルの表現はコードコードとレポートコードビューで共有する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:20:10 GMT)
Profiling Patient Transcript Using Large Language Model Reasoning Augmentation for Alzheimer's Disease Detection [5.0] アルツハイマー病(AD)は認知症の主要な原因であり、徐々に音声や言語能力の低下が特徴である。
近年の深層学習は自発音声によるAD自動検出を容易にする。
各発話中のテキストパターンを,患者の言語的特徴をグローバルに把握せずに直接モデル化する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:58:07 GMT)
Federated Learning with Quantum Computing and Fully Homomorphic Encryption: A Novel Computing Paradigm Shift in Privacy-Preserving ML [4.9] フェデレートラーニング(Federated Learning)は、複数の学習クライアントがプライベートデータを公開せずにモデル知識を共有できるようにする、従来の方法に代わるプライバシ保護手法である。
この研究は、古典層と量子層の両方を統合するフェデレート学習ニューラルネットワークアーキテクチャに完全同型暗号化スキームを適用した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 03:05:48 GMT)
Quantum synchronization in one-dimensional topological systems [4.7] 量子系におけるシンクロナイゼーションは、中心サイトへの散逸を適用して誘導することができる。
トポロジカルエッジ状態に由来する2種類の同期は、境界点間の対角線外あるいは対角線の相関によって特徴づけられる。
注目すべきは、同期振動は熱力学的限界において安定した振幅と周波数を維持することである。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:03:09 GMT)
CraftRTL: High-quality Synthetic Data Generation for Verilog Code Models with Correct-by-Construction Non-Textual Representations and Targeted Code Repair [4.6] 本稿では,従来手法の合成データを用いて,Verilog 符号化における微調整 LLM の解析を行った。
我々は、非テクスト表現の扱いの困難さと、ランダムに「マイナー」ミスを犯すモデルによるトレーニング中の大きな変動の2つを識別する。
我々の微調整されたStarcoder2-15Bは、VerilogEval-Machine, VerilogEval-Human, RTLLMで3.8%、10.9%、pass@1で6.6%、最先端の結果よりも優れています。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:15:55 GMT)
Enhancing Agricultural Environment Perception via Active Vision and Zero-Shot Learning [4.5] この作業では、アクティブビジョン(AV)技術とゼロショット学習(ZSL)を活用して、ロボットが農業環境を知覚し、相互作用する能力を向上させる。
ROS 2で実装されたAVパイプラインは、3D環境再構築のためのNext-Best View(NBV)プランニングを統合している。
YOLO World + EfficientViT SAMなどのZSLセグメンテーションモデルは高速性能と正確なセグメンテーションを示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:26:23 GMT)
FedAT: Federated Adversarial Training for Distributed Insider Threat Detection [4.4] 本稿では,非独立分散(非IID)データ分散を考慮したFL対応マルチクラスITDパラダイムを提案する。
具体的には,非IIDデータ分布から生じる極度のデータ歪を緩和するために,生成モデルを用いたFedATアプローチを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 20:44:33 GMT)
What Would You Ask When You First Saw $a^2+b^2=c^2$? Evaluating LLM on
Curiosity-Driven Questioning [4.4] 大規模言語モデル(LLM)は膨大な量の知識を格納できるが、新しい知識を取得する可能性はまだ不明である。
本稿では,この能力を評価する新しい評価フレームワークを提案する。
GPT-4 や Mistral 8x7b のような大規模モデルはコヒーレントで関連する質問を生成するには適しているが、より小さな Phi-2 モデルは等しく、より効果的である。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 22:12:16 GMT)
Multichannel-to-Multichannel Target Sound Extraction Using Direction and Timestamp Clues [4.3] 連続した時間的手がかりに基づいてマルチチャンネル音声信号を抽出するM2Mフレームワークを提案する。
異なる室内環境における多様なクラスの音声信号から合成されたマルチチャネル信号に対して,我々のトランスフォーマーベースアーキテクチャがM2M-TSEを実現することを実証した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:30:49 GMT)
PromSec: Prompt Optimization for Secure Generation of Functional Source Code with Large Language Models (LLMs) [4.3] LLM(Large Language Model)は、高品質なソースコードを生成するために使われる。
LLMは、安全でないオープンソースデータのトレーニングのために、セキュリティ上の脆弱性をしばしば導入する。
本稿では,セキュアかつ機能的なコード生成のためのプロム最適化アルゴリズムであるPromSecを紹介する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:14:10 GMT)
SeqRisk: Transformer-augmented latent variable model for improved survival prediction with longitudinal data [4.1] 本研究では,変分オートエンコーダ (VAE) と長手VAE (LVAE) をトランスフォーマーエンコーダとコックス比例ハザードモジュールに結合してリスク予測を行う手法であるSeqRiskを提案する。
SeqRiskは、シミュレーションと実世界の両方のデータセットにおける既存のアプローチと比較して、競合的に機能することを示した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:35:25 GMT)
Are Large Language Models Good Essay Graders? [4.1] 我々は,エッセイの質を評価する上で,Large Language Models (LLMs) を評価する。
我々は,LLMが提供した数値を,ASAPデータセットを用いた人間レーダ提供スコアと比較した。
チャットGPTは、Llamaよりも厳格で、人間による評価と不一致の傾向にある。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 23:20:49 GMT)
On the second-order zero differential properties of several classes of power functions over finite fields [4.1] Feistel Boomerang Connectivity Table (FBCT) は、差動攻撃やブーメラン攻撃などの攻撃に対するFeistelネットワークベースの暗号の抵抗を分析するための重要な暗号解析手法である。
本稿では、有限体上の特定の方程式の解数を計算することにより、パワー関数の2階ゼロ微分スペクトルをx2m+3$およびx2m+5$で明示的に決定する。
これらのエントリと各テーブルの濃度の計算は、Sボックスの微分およびブーメラン暗号解析を容易にすることを目的としている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 03:19:19 GMT)
Accelerating AI and Computer Vision for Satellite Pose Estimation on the Intel Myriad X Embedded SoC [3.8] 本稿では,インテルのMovidius Myriad Xを用いたハイブリッドAI/CVシステムを構築し,衛星の宇宙ミッションにおける姿勢を初期化・追跡する。
提案したシングルチップ,ロバスト推定,リアルタイムソリューションは,2Wの限られたパワーエンベロープ内で,1メガピクセルのRGB画像に対して最大5FPSのスループットを提供する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 17:50:50 GMT)
A Multi-agent Market Model Can Explain the Impact of AI Traders in Financial Markets -- A New Microfoundations of GARCH model [3.7] 本稿では,ノイズトレーダー,基本トレーダー,AIトレーダーの3種類のエージェントを組み込んだマルチエージェント市場モデルを提案する。
我々は,このモデルをマルチエージェントシミュレーションにより検証し,金融市場のスタイル化された事実を再現する能力を確認した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:14:13 GMT)
Hidden in Plain Sound: Environmental Backdoor Poisoning Attacks on Whisper, and Mitigations [3.6] 本研究では,異なる環境トリガー音を異なる長さのフレーズにマッピングする新しい中毒手法を提案する。
我々は、最も人気のあるトランスフォーマーベースのSRモデルであるWhisperで、我々の攻撃に対して非常に脆弱であることを示す。
本稿では,この攻撃を抑えるため,防衛機構として,最先端音声活動検出(VAD)モデルであるSilero VAD(Silero VAD)について検討する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 08:21:52 GMT)
The Art of Storytelling: Multi-Agent Generative AI for Dynamic Multimodal Narratives [3.5] 本稿では,ジェネレーティブ・人工知能(GenAI)を利用した子ども向けのストーリーテリングを支援する教育ツールのコンセプトを紹介する。
このシステムは、GenAIによる物語の共創、テキストから音声への変換、およびテキストからビデオへの生成を組み合わせることで、学習者にとって魅力的な体験を生み出す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:50:58 GMT)
EFA-YOLO: An Efficient Feature Attention Model for Fire and Flame Detection [3.3] EAConv(Efficient Attention Downsampling)とEADown(Efficient Attention Downsampling)の2つの重要なモジュールを提案する。
これら2つのモジュールに基づいて,効率的な軽量火炎検出モデル EFA-YOLO (Efficient Feature Attention YOLO) を設計する。
EFA-YOLOは検出精度(mAP)と推論速度を著しく向上させ、モデルパラメータの量を94.6削減し、推論速度を88倍改善した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 10:20:07 GMT)
Re-Introducing LayerNorm: Geometric Meaning, Irreversibility and a Comparative Study with RMSNorm [2.6] 表現空間における隠れベクトルのノルムと配向にLayerNormがどのように影響するかを示す。
i) 一様ベクトルに沿ったベクトルの成分を除去し、 (ii) 残りのベクトルを正規化し、 (iii) 結果ベクトルを$sqrtd$でスケールする。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 17:58:07 GMT)
Improving Prototypical Parts Abstraction for Case-Based Reasoning Explanations Designed for the Kidney Stone Type Recognition [2.6] 尿管鏡による腎結石の同定は、尿学の大きな医学的進歩となる。
近年,尿管鏡画像を用いて腎臓結石のタイプを自動的に認識する深層学習(DL)モデルが提案されている。
このコントリビューションは, 原型部品(PP)を使用し, 局所的および大域的記述子を生成するケースベース推論DLモデルを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:27:32 GMT)
Small Language Models are Equation Reasoners [2.4] CoT(Chain-of-Thought)推論により、算術的問題解決を含む様々なNLPタスクにおいて、LLM(Large Language Model)が顕著な性能を達成できるようになった。
しかし、この成功はT5のような小さな言語モデル(sLM)に一般化しない。
知識蒸留によるsLMの高度化に向けた最近の研究は、いくつかの改善をもたらしたが、依然として重大な限界に直面している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:34:43 GMT)
Enhanced Krylov Methods for Molecular Hamiltonians: Reduced Memory Cost and Complexity Scaling via Tensor Hypercontraction [2.4] 本稿では, Ab 分子ハミルトニアンに対するテンソルハイパーコントラクション (THC) 形式に基づく行列積演算子 (MPO) の構成について述べる。
これらは局所的なミニマを回避し、高い精度で量子時間進化をシミュレートしながら、低い高度の固有状態を見つけることができる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:34:06 GMT)
Bayesian-Optimized One-Step Diffusion Model with Knowledge Distillation for Real-Time 3D Human Motion Prediction [2.4] 本稿では,知識蒸留とベイズ最適化を用いた1段階多層パーセプトロン(MLP)拡散モデルによる動き予測のトレーニングを提案する。
提案モデルでは,予測速度を大幅に向上し,性能の劣化を伴わないリアルタイム予測を実現している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 04:36:40 GMT)
Investigating the Impact of Randomness on Reproducibility in Computer Vision: A Study on Applications in Civil Engineering and Medicine [2.4] 視覚によるランダム性は、パフォーマンススコアの最大4.77%の違いを説明できる。
実行時におけるこの変数の管理には,パフォーマンスの向上や低下が伴う可能性があるが,前回の調査で報告されたようなデメリットはそれほど大きくない。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:06:06 GMT)
Hypersphere Secure Sketch Revisited: Probabilistic Linear Regression Attack on IronMask in Multiple Usage [2.3] 我々は、更新可能性というセキュリティ概念に基づいて、IronMaskに対する攻撃を考案する。
この攻撃は、複数の保護されたテンプレートを取得する際に元のテンプレートを回復する最初のアルゴリズムである。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:28:30 GMT)
LARE: Latent Augmentation using Regional Embedding with Vision-Language Model [2.1] 視覚言語モデルは、イメージを単一の点として統合された埋め込み空間に埋め込む。
地域埋め込み(LARE)は、VLMによって学習された統合埋め込み空間の領域としてイメージを埋め込む。
LAREは、ファインチューンVLMへの拡張画像埋め込みを用いて、領域内および外部の堅牢な画像分類を実現する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:21:42 GMT)
On the Effectiveness of LLMs for Manual Test Verifications [1.9] 本研究の目的は,手動テストの検証にLarge Language Models (LLMs) を用いることである。
オープンソースモデル Mistral-7B と Phi-3-mini-4k は、クローズドソースモデルと同等の有効性と一貫性を示した。
AI幻覚にも懸念があり、検証は期待から著しく逸脱した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:03:04 GMT)
A Case Study of Web App Coding with OpenAI Reasoning Models [1.7] 我々は,OpenAIの最新推論モデルであるo1-previewとo1-miniによるコーディングタスクのケーススタディを,他のフロンティアモデルと比較した。
o1モデルは、シングルタスクのベンチマークであるWebApp1Kに対して、SOTA結果を提供する。この結果、WebApp1K-Duoは、多くのタスクとテストケースを倍にする、より難しいベンチマークである。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 06:58:02 GMT)
Towards adaptive trajectories for mixed autonomous and human-operated ships [1.7] 私たちは自動運転車の台頭を目の当たりにしています。
本研究は、自律船と人体船の軌道予測と適応の課題について詳述する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 12:38:19 GMT)
Prediction of Brent crude oil price based on LSTM model under the background of low-carbon transition [1.7] 本稿では,3層のLSTMユニットを用いた深層学習モデルを用いて,数日後の原油価格の予測を行う。
その結果、LSTMモデルは、急激な価格変動の時期に多少のずれがあるにもかかわらず、全体的な価格トレンドを捉えるのによく機能することが示された。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 00:25:22 GMT)
LLMs Can Check Their Own Results to Mitigate Hallucinations in Traffic Understanding Tasks [1.7] 本稿では,3つの最先端大規模言語モデル(LLM)による幻覚を見つけるためのSelfCheckGPTの採用について検討する。
以上の結果より, GPT-4oはLLaVAよりも忠実な画像キャプションを生成するのが得意である。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:02:20 GMT)
Selecting a classification performance measure: matching the measure to the problem [1.6] 研究や応用の目的に合致するパフォーマンスの尺度を選択することは不可欠である。
本論文は,異なるパフォーマンス尺度の相対的メリットに関する文献の増大に寄与するものである。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:32:02 GMT)
LOLA -- An Open-Source Massively Multilingual Large Language Model [1.6] LOLAは160以上の言語で訓練された多言語大言語モデルである。
私たちのアーキテクチャと実装の選択は、言語多様性を活用するという課題に対処します。
学習したエキスパート・ルーティング機構は、暗黙の系統パターンを利用して、多言語性の呪いを和らげる可能性があることを示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 15:50:01 GMT)
Domain Generalization for Endoscopic Image Segmentation by Disentangling Style-Content Information and SuperPixel Consistency [1.5] 本稿では,インスタンス正規化とインスタンス選択白化(ISW)を用いて,ドメインの一般化を改善する手法を提案する。
本研究では,EndoUDA BarrettのEsophagusとEndoUDA polypsの2つのデータセットに対するアプローチを評価し,その性能を3つの最先端(SOTA)手法と比較した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 04:10:04 GMT)
Machine-learning based high-bandwidth magnetic sensing [1.4] ダイヤモンド中の窒素空孔(NV)色中心は、多用途、高感度、高解像度磁気センシングを提供する。
スピン共鳴磁気センシング(NV量子センシング)の現在のスキームは、感度、ダイナミックレンジ、帯域幅に関連するトレードオフに悩まされている。
我々は,大規模なダイナミックレンジシナリオにおける感度/帯域トレードオフの観点から,NV磁気センサを強化するための機械学習ツールを実装した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:50:12 GMT)
Personalized 2D Binary Patient Codes of Tissue Images and Immunogenomic Data Through Multimodal Self-Supervised Fusion [0.9] MarbliXは、病理組織像と免疫ゲノムシークエンシングデータを統合し、それらを簡潔なバイナリー患者コードにカプセル化する革新的なフレームワークである。
実験の結果は、医療専門家に深い洞察を与えるMarbliXの可能性を示している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 22:49:27 GMT)
Enhancing 3D Robotic Vision Robustness by Minimizing Adversarial Mutual Information through a Curriculum Training Approach [0.9] 敵攻撃は、小さな、慎重に構築された摂動を通じて、モデルの決定境界における脆弱性を悪用する。
3Dビジョンでは、高次元とデータ空間が攻撃面を大きく拡大し、3Dビジョンは特に安全クリティカルなロボティクスに対して脆弱になる。
本稿では,対向的摂動下での予測損失と相互情報(MI)を同時に最小化する学習目標を提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 00:44:45 GMT)
Semi-overcomplete convolutional auto-encoder embedding as shape priors for deep vessel segmentation [0.9] 本稿では,半完全畳み込み型自動エンコーダの組込みから,より深いセグメンテーション形状を取り入れた新しい手法を提案する。
標準的な畳み込みオートエンコーダ(CAE)と比較すると、小さな構造をより正確に特徴付けるために、高次元にデータを投影するオーバーコンプリートブランチを利用する。
DRIVEおよび3D-IRCADbデータセットを用いて網膜および肝血管抽出実験を行ったところ,従来のCAEの形状を考慮せずにトレーニングしたU-Netと比較して,本法の有効性が示された。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 15:59:23 GMT)
Deep Probability Segmentation: Are segmentation models probability estimators? [0.8] モデルのキャリブレーションへの影響を評価するために,セグメンテーションタスクにキャリブレーション確率推定を適用した。
その結果, キャリブレーションはキャリブレーションが向上するが, 分類タスクに比べ, キャリブレーションの効果は低かった。
また, キャリブレーションの有効性に及ぼすデータセットサイズとビン最適化の影響についても検討した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 07:52:19 GMT)
Incremental and Data-Efficient Concept Formation to Support Masked Word Prediction [0.7] 本稿では、マスク付き単語予測をサポートする効率的な言語モデル学習のための新しいアプローチであるCobweb4Lを紹介する。
我々は、Cobweb4Lが急速に学習し、Word2Vecに匹敵する性能を達成していることを示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 03:48:31 GMT)
Instigating Cooperation among LLM Agents Using Adaptive Information Modulation [0.7] 本稿では,人間戦略行動と強化学習のためのプロキシとしてLLMエージェントを併用した新しいフレームワークを提案する。
ネットワーク内のエージェント間での情報アクセスを調節し、社会的福祉を最適化し、社会的行動を促進する。
このフレームワークは、実世界のチーム設定におけるAIの展開に寄与する、AIを介するソーシャルダイナミクスに関する重要な洞察を提供する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:32:58 GMT)
Deep Learning-Based Detection of Referable Diabetic Retinopathy and Macular Edema Using Ultra-Widefield Fundus Imaging [0.7] 糖尿病網膜症や糖尿病黄斑浮腫は、視力喪失につながる糖尿病の重大な合併症である。
超広視野眼底画像による早期発見は、患者の成果を高めるが、画質と分析スケールの課題を提示する。
本稿では,MICCAI 2024 UWF4DRチャレンジの枠組みの中で,自動UWF画像解析のためのディープラーニングソリューションを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 15:51:48 GMT)
Reference Dataset and Benchmark for Reconstructing Laser Parameters from On-axis Video in Powder Bed Fusion of Bulk Stainless Steel [0.6] RAISE-LPBFは粉末層融合におけるレーザーパワーとレーザードット速度の影響に関する大規模なデータセットである。
このデータは、LPBFの統計的性質の導出や、異常検出器の構築に利用できる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 05:30:24 GMT)
Fast End-to-End Generation of Belief Space Paths for Minimum Sensing Navigation [0.6] 本稿では,問題記述から直接最適な経路候補を予測するために,ディープラーニングモデルを活用するアプローチを提案する。
我々は、U-Netアーキテクチャを活用して、入力と出力データの依存関係を学習する。
提案手法はサンプリングベースベースラインアルゴリズムと比較して時間を大幅に短縮する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:49:36 GMT)
An Exploration of Agile Methods in the Automotive Industry: Benefits, Challenges and Opportunities [0.6] 本稿では,自動車産業におけるアジャイル手法導入のメリットと課題について考察する。
私たちの調査結果は、コラボレーションの改善や市場投入までの時間短縮など、アジャイルアプローチの潜在的なメリットを浮き彫りにしています。
本稿では,既存の研究と実践的な洞察を合成することによって,自動車ソフトウェア開発の将来を形作る上でのアジャイル手法の役割を理解することを目的とする。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:43:38 GMT)
Multi-Source and Multi-Sequence Myocardial Pathology Segmentation Using a Cascading Refinement CNN [0.5] 心筋組織の生存性を評価するために, セマンティックセグメンテーションを生成するMulti-Sequence Cascading Refinement CNN(MS-CaRe-CNN)を提案する。
MS-CaRe-CNNは、心筋組織の生存可能性を評価するためにセマンティックセグメンテーションを生成するのに適している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:01:15 GMT)
Theoretical Analysis of Heteroscedastic Gaussian Processes with Posterior Distributions [0.5] 本研究ではヘテロセダスティックガウス過程(HGP)を解析するための新しい理論的枠組みを紹介する。
後部分布の正確な方法、分散、累積分布を導出する。
得られた理論的知見は、確率制約付きトラッキングコントローラに適用される。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:51:46 GMT)
Quantum resources of quantum and classical variational methods [0.5] 量子情報と変分技法の間の橋渡しを、非安定化性(マジック)の概念がいかに実現できるかを示す。
エネルギーの正確性は必要だが、非安定化装置の正確性には必ずしも十分ではないことを示す。
本研究は,古典的変分法と量子的変分法の両方の普遍的表現性評価の基礎となる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 18:00:00 GMT)
Introducing the Large Medical Model: State of the art healthcare cost and risk prediction with transformers trained on patient event sequences [0.5] 大規模医療モデル(Large Medical Model, LMM)は、患者医療と医療管理の幅広い側面をガイドし、予測するために設計された、GPT(Generative Pre-trained Transformer)である。
このモデルは、医療用語システムから構築された特別な語彙を用いて、1億4000万件以上の患者の主張記録から医療イベントシーケンスに基づいて訓練されている。
LMMは、最高の商用モデルよりも14.1%のコスト予測と、幅広い条件を予測する研究において最高のトランスフォーマーモデルよりも1.9%の慢性的な条件予測の両方を改善できる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 15:38:21 GMT)
Sustainable Visions: Unsupervised Machine Learning Insights on Global Development Goals [0.4] 国連2030アジェンダ・フォー・サステナブル・ディベロップメントは、世界的課題に取り組むための17の目標を概説している。
SDGの進歩は、地理的、文化的、社会経済的要因に大きく影響されている。
2030年までにすべての目標を達成する国はない。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 03:10:49 GMT)
Hybrid Ensemble Deep Graph Temporal Clustering for Spatiotemporal Data [0.4] 多変量時間データ解析のためのハイブリッドアンサンブルグラフクラスタリング(HEDGTC)法を提案する。
HEDGTCは、従来のクラスタリングからノイズや誤分類に対処するためのデュアルコンセンサスアプローチを採用している。
3つの実世界のデータセットで評価すると、HEDGTCは最先端のアンサンブルクラスタリングモデルより優れている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:14:10 GMT)
Deep Transfer Hashing for Adaptive Learning on Federated Streaming Data [0.4] フェデレーション学習は、複数のクライアントがデータのプライバシを維持しながら、共同で共有モデルをトレーニングすることを可能にする。
提案フレームワークは、転送学習、中央サーバ上のディープニューラルネットワークの事前学習、モデル精度と適応性を高めるためのクライアントの微調整を利用する。
Car2Xイベント予測では、共有モデルでトラフィックパターンを認識し、トラフィック密度評価や事故検出などのタスクを支援する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 08:52:49 GMT)
Task and Domain Adaptive Reinforcement Learning for Robot Control [0.3] 課題や環境条件に応じて動的にポリシーを適応する新しい適応エージェントを提案する。
このエージェントはIsaacGym上に作られたカスタムで高度に並列化されたシミュレータを使って訓練されている。
実世界において、さまざまな課題を解くために、飛行飛行のためにゼロショット転送を行う。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:36:53 GMT)
Comprehensive Overview of Artificial Intelligence Applications in Modern Industries [0.3] 本稿では、医療、金融、製造業、小売の4つの主要な分野にわたるAIの適用について検討する。
我々は、倫理的考察、AI開発の将来的な軌跡、そして経済成長を促進する可能性など、AI統合がもたらす意味について論じる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 19:22:52 GMT)
Explainable AI for Autism Diagnosis: Identifying Critical Brain Regions Using fMRI Data [0.3] 自閉症スペクトラム障害(ASD)の早期診断と介入は、自閉症者の生活の質を著しく向上させることが示されている。
ASDの客観的バイオマーカーは診断精度の向上に役立つ。
深層学習(DL)は,医療画像データから疾患や病態を診断する上で,優れた成果を上げている。
本研究の目的は, ASD の精度と解釈性を向上させることであり, ASD を正確に分類できるだけでなく,その動作に関する説明可能な洞察を提供する DL モデルを作成することである。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 23:08:09 GMT)
Curricula for Learning Robust Policies with Factored State Representations in Changing Environments [0.2] 因子状態表現を用いたエージェントのカリキュラムが学習方針の堅牢性にどのように影響するかを示す。
本報告では, ポリシーの堅牢性を著しく向上させる, エピソード間での最大後悔の変数のみを変動させるような, 3つの簡単なカリキュラムを実験的に実証する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:03:24 GMT)
Enhancing E-commerce Product Title Translation with Retrieval-Augmented Generation and Large Language Models [0.2] 本研究では,電子商取引における既存のバイリンガル製品情報を活用する検索強化世代(RAG)アプローチを提案する。
実験の結果,提案手法は製品タイトルの翻訳品質を最大15.3%向上させることができた。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 16:23:42 GMT)
Exploring Engagement and Perceived Learning Outcomes in an Immersive Flipped Learning Context [0.2] 本研究の目的は,学生のオンラインエンゲージメントと学習成果に対する没入型フリップ学習アプローチのメリットと課題を検討することである。
この研究は、高レベルの学生エンゲージメントと学習結果の認知を明らかにしたが、改善が必要な領域も明らかにした。
この研究の成果は、有意義で効果的な遠隔学習体験をデザインしようとする教育者にとって貴重な情報源となる可能性がある。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:38:48 GMT)
Super Resolution On Global Weather Forecasts [0.2] グループは,グローバル気象予測の空間分解能を高めることにより,既存の深層学習に基づく予測手法の改善を目指している。
具体的には、大域的精度を1度から0.5度に高めることにより、グラフCast温度予測における超解像(SR)の実行に関心がある。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:56:28 GMT)
Scalable and Robust Mobile Activity Fingerprinting via Over-the-Air Control Channel in 5G Networks [0.2] 物理的ダウンリンク制御チャネル(PDCCH)メッセージの10%未満は、スニファーを用いて復号化可能であることを示す。
このプライバシー攻撃は、アクティブな通信チャネルの数を明らかにし、モバイルアプリケーションとその使用時間を明らかにする。
本稿では,手動による特徴抽出を不要とした,効率的なディープラーニングに基づくモバイルトラフィック分類手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 08:49:40 GMT)
Universal semiclassical dynamics in disordered two-dimensional systems [0.0] 乱れた1D格子と2D格子上に伝播するスピンレスフェルミオンの相互作用のダイナミクスを解析する。
両空間次元において、不均衡は再スケール時間$t/xi_W$に普遍的依存を示し、2Dでは時間スケール$xi_W$は障害強度への伸張指数依存に従う。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 17:59:00 GMT)
Universal approximation theorem for neural networks with inputs from a topological vector space [0.0] 位相ベクトル空間(TVS-FNN)からの入力を用いたフィードフォワードニューラルネットワークの研究
従来のフィードフォワードニューラルネットワークとは異なり、TVS-FNNはシーケンス、行列、関数などを含む幅広い入力を処理することができる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 17:10:14 GMT)
Towards AI-enabled Cyber Threat Assessment in the Health Sector [0.0] このプロジェクトの目的は、医療機関の外部からセキュリティ関連情報を収集するAI対応プラットフォームを導入することである。
このプラットフォームはリスクスコアを提供し、医療機関の意思決定者をサポートし、セキュリティ対策のための投資選択を最適化する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:34:34 GMT)
TREBLE: Fast Software Updates by Creating an Equilibrium in an Active Software Ecosystem of Globally Distributed Stakeholders [0.0] TREBLEはAndroidでモジュールベースを構築するための2年間のイニシアチブです。
私たちのTREBLEアーキテクチャは、Javaで書かれたハードウェアに依存しないコアフレームワークと、ハードウェア依存のベンダー実装を分離します。
我々は,年次リリースモデルを用いて,TREBLEアーキテクチャの変更をシリコンベンダやデバイスメーカに提供した経験について論じる。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 20:34:54 GMT)
Strategic Collusion of LLM Agents: Market Division in Multi-Commodity Competitions [0.0] 機械学習技術は、現実世界の市場シナリオへの展開が増えている。
マルチコモディティ市場において,大規模言語モデル(LLM)が自律エージェントとして展開する際の戦略行動について検討する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 20:10:40 GMT)
Solving Combinatorial Optimization Problems on a Photonic Quantum Computer [0.0] 組合せ最適化問題は、ロジスティクスから暗号まで、様々な分野において重要な計算問題を引き起こす。
従来の計算手法は指数関数的な複雑性に苦しむことが多く、量子コンピューティングのような代替パラダイムへの探索を動機付けている。
フォトニック量子コンピュータが解空間を効率的に探索し、様々な問題に対する最適解を同定する方法を実証する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 20:57:24 GMT)
Smirk: An Atomically Complete Tokenizer for Molecular Foundation Models [0.0] SMILES言語を対象とする13種のケミカル特異的トークン化剤を系統的に評価した。
I>smirk/i>と<i>smirk-gpe/i>の2つの新しいトークンを導入し,OpenSMILES仕様の全体を表す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:36:04 GMT)
Shadows and subsystems of generalized probabilistic theories: when tomographic incompleteness is not a loophole for contextuality proofs [0.0] 非コンテクスト性の失敗の証明は、トモグラフィー完全性の失敗の非常に幅広いクラスに対して堅牢であることを示す。
また、GPTフラグメントの影の概念を導入し、その状態や効果が無意識に互いにトモグラフィーされていないときに失われた情報をキャプチャする。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 18:00:42 GMT)
Performance analysis for high-dimensional Bell-state quantum illumination [0.0] 量子照明(QI)は、未解決ターゲットのライダー/レーダー検出を改善するための絡み合いベースのプロトコルである。
本稿では,Pannu et al.のQIの有限次元性能について述べる。
どちらのシステムも、低明度(1光子/モード)ノイズにおいて有意な量子優位性は持たない。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 17:28:56 GMT)
Kochen-Specker non-contextuality through the lens of quantization [0.0] Kochen-Speckerの定理は、量子力学における全ての動的変数にシャープな値を割り当てることは不可能であることを示している。
古典理論の量子化によって得られる量子論について、この条件は最初から証明できないことを示す。
観察の結果,全ての動的変数に鋭い値を割り当てられるかどうかという問題に対するコチェン=スペクターの定理の関連性は,比較的限定的であることが示唆された。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 20:10:37 GMT)
Instantaneous tunneling time within the theory of time-of-arrival operators [0.0] 量子トンネルは古典的TOAのワイル量子化によって構築された時変演算子を用いて瞬時に行われる。
しかし、古典的なTOAの量子画像は無限に存在するため、他のものよりも一意に好まれているかどうかは不明だ。
ここでは、位置と運動量観測値の間の順序規則によらず、古典的到着時間の可能な全ての量子画像についてトンネル時間が消滅することを実証する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 01:26:40 GMT)
Improving generalisability of 3D binding affinity models in low data regimes [0.0] PDBBindデータセットの新たな分割を導入し、列車とテストセット間の類似性リークを最小限にする。
一般に、3次元グローバルモデルが低データ構造におけるタンパク質特異的局所モデルよりも優れていることを実証する。
この研究は、結合親和性モデリングのためのGNNアーキテクチャの可能性を解き放つための、有望な新しいアプローチをもたらすと信じている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:54:38 GMT)
Image inpainting for corrupted images by using the semi-super resolution GAN [0.0] 欠落した画素を学習・複製するためのGAN(Generative Adversarial Network)を提案する。
提案したモデルの堅牢性と正確性を評価するために,3つの多様なデータセットを利用した。
我々のトレーニングプロセスは、最適な精度を達成し、高品質な画像を生成するために、様々なレベルの画素破壊を伴います。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 10:21:16 GMT)
Exponential speed-up of quantum annealing via n-local catalysts [0.0] 我々は,n-$ローカライズされた触媒が,アニーアル過程中にギャップを再開したり,閉じたりすることを防止できることを示した。
我々の分析は、複数の量子ビットを絡む非局所量子ゆらぎが、望まれる量子優位性を達成するための鍵であることを示唆している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 18:01:53 GMT)
Exploring the topics, sentiments and hate speech in the Spanish information environment [0.0] 本研究は,スペインのメディア5社のニュースに対して,337,807件の回答メッセージ(サイトコメントとツイート)の話題,感情,憎悪の頻度について検討した。
コンテンツは主に陰性(62.7%)で中性(28.57%)で、低い陽性(8.73%)である。
低レベルのヘイトスピーチ(3.98%)にもかかわらず、この研究は社会や政治の話題に対するオンライン反応の毒性が高いことを確認している。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:19:44 GMT)
Exploring bat song syllable representations in self-supervised audio encoders [0.0] いくつかの自己教師型オーディオエンコーダにおけるコウモリの音節の符号化について分析する。
人間の発話に事前学習されたモデルは、異なる音節型の最も独特な表現を生成する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 10:09:31 GMT)
Evolving a Multi-Population Evolutionary-QAOA on Distributed QPUs [0.0] 我々は,進化的QAOA(E-QAOA)ペアリングがCOBYLAベースのQAOAよりも同等以上の性能を示すことを示した。
また,2つのQPU上に分布する多集団EAを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:50:03 GMT)
Enhancing TinyBERT for Financial Sentiment Analysis Using GPT-Augmented FinBERT Distillation [0.0] 本研究では,大規模言語モデル(LLM)の生成能力を生かして,ドメイン固有の学習データを生成することを提案する。
この研究は、金融感情分析用に微調整されたBERTモデルであるFinBERTを強化し、コンパクトトランスモデルであるTinyFinBERTを開発することを目的としている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 10:22:23 GMT)
Enhancing Construction Site Safety: A Lightweight Convolutional Network for Effective Helmet Detection [0.0] 本稿では,建設現場におけるヘルメットの存在を正確に分類するために設計された畳み込みニューラルネットワーク(CNN)の開発と評価について述べる。
CNNは、建設現場でヘルメットなどの個人用防護具を識別するために開発された。
改良があったにも拘わらず、精度は準最適のままであり、さらなるアーキテクチャと運用の強化の段階が整った。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:29:18 GMT)
Domain-stratified Training for Cross-organ and Cross-scanner Adenocarcinoma Segmentation in the COSAS 2024 Challenge [0.0] COSAS 2024(Cross-Organ and Cross-Scanner Adenocarcinoma)チャレンジのために開発された画像分割アルゴリズムを提案する。
臓器層化・スキャナ層化手法を用いて,複数の Upernet ベースセグメンテーションモデルを訓練し,結果をアンサンブルした。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 02:36:34 GMT)
Dissipative dynamics of an open quantum battery in the BTZ spacetime [0.0] 量子電池の充電性能は、量子場の真空揺らぎの存在によってどのように影響されるかを考える。
量子場の異なる境界条件は、異なる充電性能をもたらす可能性がある。
本研究は,曲面時空における緩和効果を解明するための一般的な枠組みを提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:06:47 GMT)
Dephasing in the central spin problem with long-range Ising spin-bath coupling [0.0] 中心スピンモデルにおけるqubit dephasingの中心極限定理について検討する。
この近似をイジング・スピン・システムで描かれた浴槽の近似式として証明する。
ある種の場合、すなわち、短距離(指数的に崩壊する)カップリングに対して、この近似が破れることを示す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 13:14:31 GMT)
Decoherence and wavefunction deformation of $D_4$ non-Abelian topological order [0.0] 非アベリアのTOは、かなりリッチであるにもかかわらず、同様の程度に分析・理解できることが示される。
対応する局所統計力学的スピンまたはローターモデルを$D_4$対称性で同定することにより、非アベリア異性体の増加に対する顕著な安定性を見出す。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 17:56:21 GMT)
Cross-Organ and Cross-Scanner Adenocarcinoma Segmentation using Rein to Fine-tune Vision Foundation Models [0.0] 我々はReinを用いて、MICCAI 2024とCross-OrganおよびCross-Scanner Adenocarcinomaの様々な視覚基盤モデル(VFM)を微調整する。
COSAS2024 Challengeのデータ環境において、ラインは良好な結果を得るためにVFMを微調整した。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 09:39:49 GMT)
Bone: Block Affine Transformation as Parameter Efficient Fine-tuning Methods for Large Language Models [0.0] Low-Rank Adaptation (LoRA)は、オリジナルの重量を凍結し、低ランクの行列のみを訓練することで、優れたトレーニング結果を得た。
LoRA+, PISSA, Olora, LoRA-GA など,一連の LoRA 変種が出現している。
本稿では,メモリオーバーヘッドを低減するだけでなく,重み間の内部接続も強調する,Bone(Block Affine)と呼ばれる革新的な手法を提案する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 10:26:42 GMT)
Automated Linear Disturbance Mapping via Semantic Segmentation of Sentinel-2 Imagery [0.0] 道路、地震探査線、パイプラインは、森林地帯のカリブーの人口に重大な脅威をもたらす。
本研究では、低解像度(10m)のSentinel-2衛星画像のセマンティックセグメンテーションのためのVGGNet16アーキテクチャに基づく深部畳み込みニューラルネットワークモデルを用いる。
このモデルは、無料のAlberta Institute of Biodiversity Monitoring Human Footprintデータセットから得られた、地平線ラベルマップを使って訓練されている。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 14:42:12 GMT)
Any Quantum Many-Body State under Local Dissipation will be Disentangled in Finite Time [0.0] 遺伝的局所散逸の下での量子多スピン状態は、システムサイズに依存しない有限時間後に完全に分離可能であることを証明した。
この結果は、ランダムな測定と量子チャネルの収束バウンドに基づく状態再構成IDを組み合わせることによって、厳密に導出される。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 10:32:52 GMT)
(Un)certainty of (Un)fairness: Preference-Based Selection of Certainly Fair Decision-Makers [0.0] 公正度指標は、さまざまな領域にわたる意思決定プロセスにおける差別と偏見を評価するために使用される。
我々は差別評価を強化するために格差の不確実性を定量化する。
我々は、意思決定者よりも好みを定義し、最適な意思決定者を選択するためにブルートフォースを利用する。
論文参考訳(メタデータ) (Thu, 19 Sep 2024 11:44:03 GMT)