Geometric Deep Learning for Structure-Based Drug Design: A Survey [83.9] 構造に基づく薬物設計(SBDD)は、タンパク質の3次元幾何学を利用して、潜在的な薬物候補を特定する。
近年の幾何学的深層学習の進歩は、3次元幾何学的データを効果的に統合・処理し、この分野を前進させてきた。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:51:56 GMT)
It Takes Two: Accurate Gait Recognition in the Wild via Cross-granularity Alignment [72.8] 本稿では,XGait という新しい粒度アライメント歩行認識手法を提案する。
この目的を達成するために、XGaitはまず2つのバックボーンエンコーダの分岐を含み、シルエットシーケンスとパーシングシーケンスを2つの潜在空間にマッピングする。
2つの大規模な歩行データセットの総合的な実験では、ランク1の精度が80.5%、CCPGが88.3%である。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:54:27 GMT)
SQL Injection Jailbreak: a structural disaster of large language models [71.6] LLMによる入力プロンプトの構築を利用して、ユーザプロンプトにジェイルブレイク情報を注入する新しいジェイルブレイク手法を提案する。
提案手法は,AdvBench の文脈でよく知られた5つのオープンソース LLM に対する攻撃成功率を約100% 達成する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:05:40 GMT)
PreAlign: Boosting Cross-Lingual Transfer by Early Establishment of Multilingual Alignment [68.2] 大規模な言語モデルは、英語中心の事前訓練にもかかわらず、合理的な多言語能力を示す。
これらのモデルにおける自発的な多言語アライメントは弱く、不満足な言語間移動と知識共有をもたらす。
言語モデル事前学習に先立って多言語アライメントを確立するフレームワークであるPreAlignを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:44:50 GMT)
FlipSketch: Flipping Static Drawings to Text-Guided Sketch Animations [65.6] スケッチアニメーションは、単純なフリップブックの落書きからプロのスタジオプロダクションまで、ビジュアルなストーリーテリングのための強力な媒体を提供する。
FlipSketchは、フリップブックアニメーションの魔法を復活させるシステムです。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:53:03 GMT)
LoRA-IR: Taming Low-Rank Experts for Efficient All-in-One Image Restoration [62.4] 高速なオールインワン画像復元を実現するために,コンパクトな低ランクの専門家を動的に活用する,フレキシブルなフレームワークであるLoRA-IRを提案する。
LoRA-IRは、劣化誘導前訓練とパラメータ効率の良い微調整の2つの訓練段階で構成されている。
実験により、LoRA-IRは計算効率を維持しつつ、14のIRタスクと29のベンチマークでSOTA性能を達成することが示された。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 09:02:05 GMT)
Partitioning Message Passing for Graph Fraud Detection [57.9] グラフフラッド検出(GFD)タスクにグラフニューラルネットワーク(GNN)を適用する場合、ラベルの不均衡とホモフィリー・ヘテロフィリー混合が直面する根本的な問題である。
既存のGNNベースのGFDモデルは、GNNのホモフィリーへの帰納バイアスに対応するためにグラフ構造を拡張するように設計されている。
我々の研究では、GFDにGNNを適用する鍵は除外するのではなく、異なるラベルを持つ隣人を区別することにあると論じている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:30:53 GMT)
Unveiling Hidden Details: A RAW Data-Enhanced Paradigm for Real-World Super-Resolution [57.0] リアル・ワールド・イメージ・スーパーレゾリューション(Real SR)は、低解像度(LR)画像から高忠実でディテールに富んだ高解像度(HR)画像を生成することを目的としている。
既存のReal SRメソッドは主にLR RGBドメインから詳細を生成することに重点を置いており、しばしば細部における豊かさや忠実さの欠如につながっている。
RAWデータに隠された詳細を用いて既存のRGBのみの手法を補完し、優れた出力を得る。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 13:29:50 GMT)
Learning-to-Cache: Accelerating Diffusion Transformer via Layer Caching [56.3] 拡散変圧器内の多数の層をキャッシュ機構で計算することで、モデルパラメータを更新しなくても容易に除去できる。
本稿では,拡散変圧器の動的手法でキャッシングを学習するL2C(Learningto-Cache)を提案する。
実験の結果,L2C は DDIM や DPM-r など,キャッシュベースの従来の手法と同等の推論速度で性能を向上することがわかった。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:43:28 GMT)
Unveiling User Preferences: A Knowledge Graph and LLM-Driven Approach for Conversational Recommendation [55.6] 本稿では,Large Language Models (LLMs) とKGs (KGs) を相乗化するプラグイン・アンド・プレイフレームワークを提案する。
これにより、LLMはKGエンティティを簡潔な自然言語記述に変換することができ、ドメイン固有の知識を理解できるようになる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:47:21 GMT)
Conformation Generation using Transformer Flows [55.2] 本稿では,トランスネットワークに基づくコンフォーメーション生成のためのフローベースモデルConfFlowを提案する。
ConfFlowは、明示的な物理的制約を課すことなく、座標空間で直接サンプリングする。
ConfFlowは、最先端の学習ベースの方法と比較して、最大40%の精度向上を実現している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:42:05 GMT)
Efficient Encoder-Decoder Transformer Decoding for Decomposable Tasks [53.6] エンコーダ・デコーダモデルのための新しい構成を導入し、構造化された出力と分解可能なタスクの効率を改善する。
提案手法は,インプットを一度エンコードして並列にデコードすることで,トレーニングと推論の効率を向上する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:39:46 GMT)
Understanding Before Recommendation: Semantic Aspect-Aware Review Exploitation via Large Language Models [53.3] レコメンデーションシステムは、クリックやレビューのようなユーザとイテムのインタラクションを利用して表現を学習する。
従来の研究では、様々な側面や意図にまたがるユーザの嗜好をモデル化することで、推奨精度と解釈可能性を改善する。
そこで本研究では,意味的側面と認識的相互作用を明らかにするためのチェーンベースのプロンプト手法を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:45:32 GMT)
AllRestorer: All-in-One Transformer for Image Restoration under Composite Degradations [52.1] 本稿では,新しいトランスフォーマーベースの復元フレームワークAllRestorerを提案する。
AllRestorerは、すべてのイメージ障害を適応的に考慮し、シーンディスクリプタのミスダイレクトによるエラーを避ける。
CDD-11データセットのベースラインと比較して,AllRestorerはPSNRの5.00dB増加を実現している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 05:30:55 GMT)
Underwater Image Enhancement with Cascaded Contrastive Learning [51.9] 水中画像強調(UIE)は、水中環境の複雑さと水中画像劣化の多様性のために非常に困難な課題である。
既存のディープラーニングベースのUIEメソッドの多くは、多様な劣化に同時に対処できないシングルステージネットワークに従っている。
本稿では,2段階の深層学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:16:44 GMT)
DiHuR: Diffusion-Guided Generalizable Human Reconstruction [51.3] 一般化可能なヒト3次元再構成のための拡散誘導モデルであるDiHuRを導入し,スパース・ミニマル・オーバーラップ画像からのビュー合成について述べる。
提案手法は, 一般化可能なフィードフォワードモデルと2次元拡散モデルとの2つのキー前処理をコヒーレントな方法で統合する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:52:23 GMT)
Atlas3D: Physically Constrained Self-Supporting Text-to-3D for Simulation and Fabrication [50.5] 我々は,テキストから3Dへの自動的実装であるAtlas3Dを紹介する。
提案手法は,新しい微分可能シミュレーションに基づく損失関数と,物理的にインスパイアされた正規化を組み合わせたものである。
我々は、Atlas3Dの有効性を広範囲な生成タスクを通して検証し、シミュレーションと実環境の両方で結果の3Dモデルを検証する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:54:28 GMT)
One-Layer Transformer Provably Learns One-Nearest Neighbor In Context [48.5] 本研究では、1層変圧器が1層近傍の規則を学習する能力について検討する。
単一のソフトマックスアテンション層は、ワンアレスト隣人のように振る舞うことをうまく学ぶことができる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:12:42 GMT)
Physics in Next-token Prediction [47.0] 我々はNext-token Prediction(NTP)における情報保存の法則を特定した。
我々は,自己回帰モデルにおけるインテリジェンスの発生の本質が情報伝達の過程であることを示す,情報容量第一法則(IC-1)を提案した。
我々はまた、自動回帰モデルトレーニングとエネルギー消費の関係を確立する第2情報容量法(IC-2)を定式化したランダウアーの原則をNTPに導入した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:17:37 GMT)
Towards Next-Generation Medical Agent: How o1 is Reshaping Decision-Making in Medical Scenarios [46.7] 本稿では,医療用AIエージェントのバックボーンLSMの選択について検討する。
我々の研究結果は、o1の診断精度と一貫性を高める能力を示し、よりスマートでより応答性の高いAIツールへの道を開いた。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 18:19:53 GMT)
The Learning Stabilizers with Noise problem [46.6] 雑音のある学習パリティ(Learning Parity with Noise, LPN)問題は、雑音の存在下でランダムな線形コードを復号するタスクとみなすことができる。
LSNは特殊なケースとして含まれており、これは古典的なケースと同程度に難しいことを示唆している。
我々は、量子ビットスキームの構築から量子データからの学習の計算限界まで、LSN仮定のいくつかの応用を同定する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:09:27 GMT)
$\text{S}^{3}$Mamba: Arbitrary-Scale Super-Resolution via Scaleable State Space Model [45.7] ASSRは、1つのモデルを用いて、任意のスケールで低解像度画像を高解像度画像に超解き放つことを目的としている。
拡張性のある連続表現空間を構築するために,$textS3$Mambaと呼ばれる新しい任意のスケール超解法を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:13:02 GMT)
Multi-Stage Vision Token Dropping: Towards Efficient Multimodal Large Language Model [45.0] ライフサイクル全体から各トークンの重要性を測定するため,マルチステージトークンドロップ(MustDrop)を提案する。
MustDropはLLaVAで約88.5%のFLOPを削減し、圧縮比は92.2%である。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 13:45:33 GMT)
Bayesian inverse Navier-Stokes problems: joint flow field reconstruction and parameter learning [44.6] ベイズ逆ナヴィエ・ストークス(N-S)問題を定式化して解く。
境界位置を含む未知のN-Sパラメータを学習する。
次に,この手法を用いて3次元定常層流の磁気共鳴速度測定データを再構成する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:57:04 GMT)
Invar-RAG: Invariant LLM-aligned Retrieval for Better Generation [43.6] Invar-RAGと呼ばれる2段階ファインチューニングアーキテクチャを提案する。
検索段階では、LORAに基づく表現学習を統合してLLMベースの検索器を構築する。
生成段階では、抽出した情報に基づいて回答を生成する際のLCM精度を向上させるための精細調整法が用いられる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:46:49 GMT)
MetaLA: Unified Optimal Linear Approximation to Softmax Attention Map [42.4] リニアトランス(LinFormer)、ステートスペースモデル(SSM)、リニアRNN(LinRNN)は、トランスフォーマー構造における従来のソフトマックスアテンションを置き換えるために提案されている。
現在の線形モデルはいずれも3つの条件をすべて満たさず、結果として準最適性能が得られる。
我々は,Multi-Query Associative Recall(MQAR)タスク,言語モデリング,画像分類,Long-Range Arenaベンチマークを用いて,MetaLAが既存の線形モデルよりも有効であることを実証した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:47:32 GMT)
Deep Learning-Based Image Compression for Wireless Communications: Impacts on Reliability,Throughput, and Latency [41.8] 無線通信では、効率的な画像伝送は信頼性、スループット、レイテンシのバランスをとる必要がある。
ハイパープライアモデルとVQGAN(Vector Quantized Generative Adversarial Network)の2つの最先端学習モデルについて検討する。
両モデルのプログレッシブバージョンを提案し、不完全なチャネル条件下で部分的な画像伝送と復号を可能にする。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 01:14:55 GMT)
Patient-Specific Models of Treatment Effects Explain Heterogeneity in Tuberculosis [41.0] 結核(英: tuberculosis、TB)は、HIV、糖尿病、貧血などの共同病原体が合併した世界的な健康問題である。
TBの伝統的なモデルは、広範に定義された患者グループに焦点を当てることで、この異種性を見落としていることが多い。
マルチタスク学習手法である文脈的モデリングを用いて、粗い部分群解析を超えて移動することを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:55:24 GMT)
ARM: Appearance Reconstruction Model for Relightable 3D Generation [38.7] ARMは、スパースビューの画像から高品質な3Dメッシュとリアルな外観を再構築する。
ARMのコアは外見から幾何学を分離することにある。
ARMは既存の手法を量的にも質的にも上回っている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 15:35:15 GMT)
Building Interpretable Climate Emulators for Economics [38.2] 本稿では,効率よく解釈可能な炭素サイクルエミュレータ(CCE)を開発するための枠組みを提案する。
政策分析のための透明で柔軟なツールを提供することで、経済学者は気候政策の経済的影響をより正確に評価することができる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 10:22:23 GMT)
HIST-AID: Leveraging Historical Patient Reports for Enhanced Multi-Modal Automatic Diagnosis [38.1] HIST-AIDは,過去の報告から自動診断精度を高めるフレームワークである。
AUROCは6.56%増加し、AUPRCは9.51%向上した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:20:53 GMT)
Deep Feature Response Discriminative Calibration [37.8] ResNetやSENetのような最適化技術は、モデルの精度を改善するために提案されている。
異なる特徴に対する差別的なキャリブレーションが欠如しているため、モデル出力に制限が生じる。
特徴応答を識別的に分類する手法を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 10:48:32 GMT)
Learning Video Representations without Natural Videos [36.0] 本研究では, 自然映像を訓練に取り入れることなく, 合成ビデオや自然画像から有用な映像表現を学習できることを示す。
人工ビデオに事前学習したビデオMAEモデルでは、UCF101アクション分類におけるパフォーマンスギャップの97.2%を、スクラッチからのトレーニングと自然ビデオからの自己教師付き事前訓練の間に閉じている。
UCF101-Pの14のアウト・オブ・ディストリビューションデータセットのうち11で、UCF101事前トレーニングと同様のパフォーマンスを示し、UCF101事前トレーニングモデルを上回っている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 23:30:37 GMT)
BlueLM-V-3B: Algorithm and System Co-Design for Multimodal Large Language Models on Mobile Devices [35.4] 本稿では,MLLMのモバイルプラットフォームへの効率的なデプロイに適した,アルゴリズムとシステムの共同設計手法であるBlueLM-V-3Bを提案する。
小型サイズ: BlueLM-V-3Bは2.7Bパラメータを持つ言語モデルと400Mパラメータを持つエンコーダビジョンを備えている。
高速: BlueLM-V-3Bは、MediaTek Dimensity 9300プロセッサの24.4トークン/秒で4ビットLLMの量子化を実現している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:14:51 GMT)
SPDFusion: An Infrared and Visible Image Fusion Network Based on a Non-Euclidean Representation of Riemannian Manifolds [35.0] マルチモーダル画像融合のための新しいSPD(対称正定値)多様体学習フレームワークを提案する。
我々のフレームワークは現在の最先端手法と比較して優れた性能を示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:09:49 GMT)
I'm Spartacus, No, I'm Spartacus: Measuring and Understanding LLM Identity Confusion [33.8] 大規模言語モデル(LLM)は、テキスト生成、データ分析、ソフトウェア開発といった様々なタスクに優れています。
しかし、LSMの急速な普及は、その独創性と信頼性に関する懸念を引き起こしている。
本研究は,3つの研究課題を通じて,アイデンティティの混乱を系統的に検討する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:20:39 GMT)
Language Model Evolutionary Algorithms for Recommender Systems: Benchmarks and Algorithm Comparisons [33.7] 大規模言語モデル(LLM)は進化的アルゴリズム(EA)の機能を大幅に強化した
我々は,LSMベースのEAの性能を評価するために,RSBenchというベンチマーク問題セットを導入し,プロンプト最適化を提案する。
確立されたEAフレームワークに基づく3つのLCMベースのEAを開発し、RSBenchを用いてその性能を実験的に評価する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:35:17 GMT)
When is an Embedding Model More Promising than Another? [33.5] 埋め込みは機械学習において中心的な役割を担い、あらゆるオブジェクトを数値表現に投影し、様々な下流タスクを実行するために利用することができる。
埋め込みモデルの評価は一般にドメイン固有の経験的アプローチに依存する。
本稿では, 組込み器の評価を統一的に行い, 充足性と情報性の概念を考察する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:01:02 GMT)
UniTraj: Learning a Universal Trajectory Foundation Model from Billion-Scale Worldwide Traces [33.5] UniTrajはタスク適応型、領域非依存、高度に一般化可能な人間の軌道基礎モデルである。
WorldTraceは、オープンなWebプラットフォームからソースされた、最初の大規模で高品質でグローバルに分散されたデータセットである。
UniTrajは、スケーラビリティと適応性という点で、既存のアプローチを一貫して上回ります。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:53:43 GMT)
Conservative and Risk-Aware Offline Multi-Agent Reinforcement Learning [33.5] 強化学習(Reinforcement Learning, RL)は、次世代無線ネットワークのような複雑なエンジニアリングシステムの制御と最適化に広く採用されている。
RLを採用する上で重要な課題は、物理的環境への直接アクセスの必要性である。
本稿では、分散RLと保守的Q-ラーニングを統合したオフラインMARL方式を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 10:08:06 GMT)
Conservative Generator, Progressive Discriminator: Coordination of Adversaries in Few-shot Incremental Image Synthesis [33.4] 生成段階的な数ショット学習の課題について検討する。
本稿では,GANの2プレーヤの性質を活用するConProという新しいフレームワークを提案する。
本研究は,ConProの有効性を検証する実験である。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:10:46 GMT)
BPO: Towards Balanced Preference Optimization between Knowledge Breadth and Depth in Alignment [32.1] 本稿では,知識源の包括性と深さを測定する知識幅と知識深度の概念を紹介する。
本稿では,各サンプルの知識深度を動的に増大させるため,バランス優先最適化(BPO)を提案する。
BPOは、知識の有用性がサンプルによって異なるという観察によって動機付けられ、知識深度をカスタマイズした学習を必要とする。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 23:53:27 GMT)
Verified Safe Reinforcement Learning for Neural Network Dynamic Models [31.2] 本稿では,非線形神経力学系における安全な制御ポリシーを学習するための新しいアプローチを提案する。
提案手法は,有限水平到達性という意味での安全性の実現を目的としている。
5つの安全な制御問題に関する実験は、我々の訓練されたコントローラーが、最先端のベースラインよりも桁違いに長い水平線上で検証された安全性を達成できることを実証している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:21:50 GMT)
GeoGround: A Unified Large Vision-Language Model. for Remote Sensing Visual Grounding [31.0] GeoGroundは、HBB、OBB、マスクRSビジュアルグラウンドタスクのサポートを統合する新しいフレームワークである。
モデルトレーニングを支援するために,161kの画像テキストペアを含む大規模RS視覚指示追従データセットrefGeoを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 05:12:11 GMT)
String-Breaking Dynamics in Quantum Adiabatic and Diabatic Processes [30.4] 閉じ込めは、例えばクォークのような自然界における色電荷の分離を、弦の破れと呼ばれるプロセスによって禁止する。
時間とともにひも張力の漸増によって引き起こされる動的ひも割れの現象について検討した。
この研究は、量子シミュレーション実験における弦の破れの研究に直ちに関係している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 01:18:27 GMT)
Conformal Prediction for Class-wise Coverage via Augmented Label Rank Calibration [30.0] 本稿では,クラス条件カバレッジを実現するための予測セットサイズを削減するために,ランク校正型クラス条件CP(RC3P)アルゴリズムを提案する。
複数の実世界のデータセットの実験により、RC3Pは平均的な予測セットサイズを26.25%削減した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:04:07 GMT)
NOLO: Navigate Only Look Once [29.2] 本稿では、オフラインでビデオからコンテキスト内ナビゲーションポリシーを純粋に学習する必要があるビデオナビゲーション設定に焦点を当てる。
In-context 能力を有するナビゲーションポリシーの学習方法である Navigate Only Look Once (NOLO) を提案する。
提案アルゴリズムは,学習ポリシーの文脈内学習能力を実証し,ベースラインを大きなマージンで上回ることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 15:47:07 GMT)
Exploring Scene Affinity for Semi-Supervised LiDAR Semantic Segmentation [28.5] 本稿では,運転シーンにおける半教師付きLiDARセマンティックセマンティックセグメンテーションのためのシーン親和性,すなわちシーン内一貫性とシーン間相関について検討する。
AISceneは教師学生のトレーニングを採用し、教師ネットワークを用いて、ラベルなしデータから擬似ラベル付きシーンを生成する。
バックプロパゲーションのための擬似ラベル付シーンのすべてのポイントを含むほとんどの方法とは異なり、AISceneは擬似ラベルなしのポイントを除去する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 13:39:49 GMT)
Can Generic LLMs Help Analyze Child-adult Interactions Involving Children with Autism in Clinical Observation? [27.7] 大規模言語モデル(LLM)は、人間のコミュニケーションと相互作用を理解する上で大きな可能性を示している。
本研究は,ALDの小児における乳児・乳児・乳児・乳児・乳児・乳児・乳児の相互作用を,臨床的に関連性のある文脈で解析する汎用LSMの能力を評価した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 09:36:56 GMT)
LLaSA: Large Language and Structured Data Assistant [27.5] グラフニュートラルネットワーク (GNN) は、Large Language Models (LLM) の入力に付加的なモダリティとして導入された。
構造化データの処理能力を高めるために, textbfLarge textbfLanguage と textbfStructured Data textbfAssistant (LLaSA) を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 12:27:14 GMT)
LightStereo: Channel Boost Is All Your Need for Efficient 2D Cost Aggregation [27.0] LightStereoは、マッチングプロセスを加速するために作られた最先端のステレオマッチングネットワークである。
私たちのブレークスルーは、3Dコストボリュームのチャネル次元に特化してパフォーマンスを向上させることです。
LightStereoは、SceneFlowデータセットで競合するEPEメトリックを達成し、最低でも22GFLOPと17msのランタイムを必要とする。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:11:30 GMT)
An End-to-End Real-World Camera Imaging Pipeline [26.6] 本稿では,リアルタイムカメラ撮像性能を向上させるために,エンドツーエンドカメラ撮像パイプライン(RealCamNet)を提案する。
RealCamNetはRAWからRGBへの高品質な変換とコンパクトな画像圧縮のために設計されている。
実験の結果,RealCamNetは推論遅延を低く抑え,最高の速度歪み性能が得られることがわかった。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:19:03 GMT)
OpenStereo: A Comprehensive Benchmark for Stereo Matching and Strong Baseline [25.5] 我々はOpenStereoと呼ばれるフレキシブルで効率的なステレオマッチングを開発する。
OpenStereoには10以上のネットワークモデルのトレーニングと推論コードが含まれている。
我々は, 立体マッチングにおける最近の展開の総合的分析とデコンストラクションを, 包括的アブレーション実験を通じて実施する。
私たちのStereoBaseは、SceneFlow、KITTI 2015、2012(Reflective)で第1位であり、すべてのメトリクスで最高のパフォーマンスを実現しています。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:44:39 GMT)
TDSM:Triplet Diffusion for Skeleton-Text Matching in Zero-Shot Action Recognition [25.3] ゼロショットスケルトンに基づくアクション認識では、見えないアクションを正確に予測するためには、スケルトン特徴とアクションラベルのテキスト特徴との整合が不可欠である。
本フレームワークは,スケルトン・テキストマッチング(TDSM)方式のトリプルト拡散として設計されており,スケルトンの特徴を逆拡散によるテキストプロンプトと整合させる。
識別力を高めるために,TDSMが不正確な3重項拡散(TD)損失を生じさせ,不正確な3重項拡散(TD)を推し進める。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:55:18 GMT)
AnimateAnything: Consistent and Controllable Animation for Video Generation [24.6] 本稿では,AnimateAnythingという統合制御可能なビデオ生成手法を提案する。
様々な条件にまたがる正確で一貫したビデオ操作を容易にする。
実験により,本手法は最先端手法よりも優れていることが示された。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:36:49 GMT)
MiCEval: Unveiling Multimodal Chain of Thought's Quality via Image Description and Reasoning Steps [24.4] 本稿では,各推論ステップと記述の質を評価することによって,推論チェーンの正しさを評価するためのフレームワークを提案する。
MiCEvalは詳細なデータセット上に構築されており、各ステップを正確性、妥当性、情報性に応じて評価するアノテーションを備えている。
実験の結果、MiCEvalを用いた段階的評価は、既存の方法に比べて人間の判断とより密接に一致していることがわかった。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 18:47:18 GMT)
SAMPart3D: Segment Any Part in 3D Objects [24.0] 3D部分のセグメンテーションは、3D知覚において重要な課題であり、ロボット工学、3D生成、および3D編集などのアプリケーションにおいて重要な役割を果たす。
最近の手法では、2次元から3次元の知識蒸留に強力なビジョン言語モデル(VLM)を用いており、ゼロショットの3次元部分分割を実現している。
本研究では,任意の3Dオブジェクトを複数の粒度のセマンティックな部分に分割する,スケーラブルなゼロショット3D部分分割フレームワークであるSAMPart3Dを紹介する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:04:42 GMT)
On the Faithfulness of Vision Transformer Explanations [24.0] ポストホックの説明では、サリエンススコアを入力ピクセルに割り当て、人間の理解可能なヒートマップを提供する。
サリエンス誘導忠実度係数(SaCo)は,サリエンス分布の本質的情報を利用した新しい評価指標である。
我々のSaCoは、勾配と多層アグリゲーションを用いることで、注意に基づく説明の忠実さを著しく向上させることができることを示した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:37:39 GMT)
Transformers Learn to Achieve Second-Order Convergence Rates for In-Context Linear Regression [23.9] 変換器は、文脈内線形回帰の2次最適化法を近似することを学習する。
文脈内線形回帰では、トランスフォーマーは反復ニュートン法と同様の収束率を共有し、どちらもGDよりも指数関数的に高速である。
また、Transformerは、Gradient Descentが苦戦するがIterative Newtonが成功するような環境で、不調なデータを使ってコンテキストで学習できることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:20:24 GMT)
C-DiffSET: Leveraging Latent Diffusion for SAR-to-EO Image Translation with Confidence-Guided Reliable Object Generation [23.6] C-DiffSETは、訓練済みの遅延拡散モデル(LDM)を自然画像で広く訓練したフレームワークである。
顕著なことに、事前訓練されたVAEエンコーダは、SAR入力のノイズレベルが異なる場合でも、同じ潜時空間でSARとEOの画像を整列する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 12:28:40 GMT)
Closed-Loop Long-Horizon Robotic Planning via Equilibrium Sequence Modeling [23.6] 我々は、均衡に達するまで計画案を反復的に洗練する自己精製スキームを提唱する。
効率的なクローズドループ計画のためのネスト型平衡系列モデリング手法を考案した。
提案手法はVirtualHome-Envベンチマークで評価され,性能が向上し,推論精度が向上した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 13:58:45 GMT)
SPICA: Retrieving Scenarios for Pluralistic In-Context Alignment [23.6] 本研究では,文脈内サンプル検索におけるグループレベルの差を考慮した多元的アライメントのためのフレームワークSPICAを提案する。
SPICAはシナリオバンク、グループインフォームドメトリクス、コンテキスト内アライメントプロンプトの3つの設計を導入している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 23:29:32 GMT)
Structured Dialogue System for Mental Health: An LLM Chatbot Leveraging the PM+ Guidelines [23.2] SuDoSysは、心理学的カウンセリングを提供するために設計された、ステージ対応マルチターン対話システムである。
このシステムはカウンセリングプロセスを通じて重要な情報を格納し、コヒーレントで指示された会話を確実にする。
客観的評価と主観評価の両方を用いて評価すると、SuDoSysは論理的に一貫性のある応答を生成する効果を示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:12:17 GMT)
Toward Automated Algorithm Design: A Survey and Practical Guide to Meta-Black-Box-Optimization [22.9] 進化計算(EC)コミュニティの新たな道としてメタブラックボックス最適化(MetaBBO)を導入する。
MetaBBOの成功にもかかわらず、現在の文献は主要な側面の要約が不十分であり、実装に関する実践的なガイダンスが欠如している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:23:09 GMT)
Beyond Feature Mapping GAP: Integrating Real HDRTV Priors for Superior SDRTV-to-HDRTV Conversion [22.8] HDR-WCGディスプレイデバイスの普及は、SDRTVをHDRTVに変換する必要性を強調している。
既存の手法は主に、SDRTVからHDRTVへの単一スタイルマッピングを学ぶニューラルネットワークの設計に焦点を当てている。
本稿では,実際のHDRTVプリエントによって誘導されるHDRTV変換に対するSDRTVの新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:20:29 GMT)
Towards a Comprehensive Benchmark for Pathological Lymph Node Metastasis in Breast Cancer Sections [21.8] 我々は1,399枚のスライド画像(WSI)と、Camelyon-16とCamelyon-17データセットのラベルを再処理した。
再発腫瘍領域の大きさから,2重複癌検診を4段階に改善した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 09:19:24 GMT)
Information Anxiety in Large Language Models [21.6] 大規模言語モデル(LLM)は知識リポジトリとして高いパフォーマンスを示している。
本研究は, LLMの内部推論と検索機構を包括的に分析することにより, さらなる調査を行う。
我々の研究は、エンティティの人気の影響、クエリの定式化における語彙変化に対するモデルの感度、隠された状態表現の進行という3つの重要な側面に焦点を当てている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:28:33 GMT)
Decentralizing Test-time Adaptation under Heterogeneous Data Streams [21.4] テスト時間適応(TTA)は、トレーニングとテストデータの分散シフトに対処する上で、有望であることを示している。
以前の試みは、絶えず変化する環境を扱うために、時間とともにモデル微調整を安定化するだけであった。
本稿では、異種データストリーム下でのTTAについて、現在のモデル中心の制限を超えて検討する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 12:29:59 GMT)
A Novel Approach to Eliminating Hallucinations in Large Language Model-Assisted Causal Discovery [21.2] 因果発見に大型言語モデル(LLM)を用いる場合,幻覚の存在が示唆された。
本稿では,品質データが利用可能な場合の幻覚を低減するために,検索拡張生成(RAG)を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:06:39 GMT)
Awaker2.5-VL: Stably Scaling MLLMs with Parameter-Efficient Mixture of Experts [21.1] MLLM(Multimodal Large Language Models)に適したMixture of Experts(MoE)アーキテクチャであるAwaker2.5-VLを提案する。
Awaker2.5-VLのトレーニングと推論を高速化するために、我々のモデルの各専門家はローランク適応(LoRA)構造として考案される。
複数の最新のベンチマークの実験では、Awaker2.5-VLの有効性が示されている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:10:14 GMT)
Bag of Design Choices for Inference of High-Resolution Masked Generative Transformer [20.1] Masked Generative Transformer (MGT) は、DMと自己回帰モデル(ARM)の間の有望な仲介役である
我々は、MGTのための一連のDMベースの推論手法を修正・再設計し、さらにMGTの性能を解明する。
我々はHPS v2のバニラサンプリングと最近のSOTA MGT Meissonicと比較して約70%の勝利率を達成した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:51:33 GMT)
SAM Decoding: Speculative Decoding via Suffix Automaton [18.7] 大規模言語モデル(LLM)は、タスクをテキスト生成に統一することで自然言語処理に革命をもたらしたが、その大きなパラメータサイズと自己回帰的自然制限推論速度は変化している。
SAM-Decodingは、サフィックスオートマトンを用いて効率よく正確なドラフト生成を行う新しい検索ベースの投機的復号法を導入することで、この問題に対処する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:02:49 GMT)
Playing Language Game with LLMs Leads to Jailbreaking [18.6] ミスマッチした言語ゲームとカスタム言語ゲームに基づく2つの新しいジェイルブレイク手法を導入する。
GPT-4oでは93%, GPT-4o-miniでは89%, Claude-3.5-Sonnetでは83%であった。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 13:07:13 GMT)
Gazing at Rewards: Eye Movements as a Lens into Human and AI Decision-Making in Hybrid Visual Foraging [18.6] 我々は、強化学習により訓練されたトランスフォーマーベースのビジュアルフォアガー(VF)モデルを開発する。
我々のモデルは、一連のターゲットとその対応する値を取り、望ましくない視覚を用いて画像を処理します。
眼球運動を連続させ、各固定アイテムを収集するかどうかを判断する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:00:19 GMT)
Towards Physically-Realizable Adversarial Attacks in Embodied Vision Navigation [18.2] 本稿では,学習可能なテクスチャと不透明度を持つ対向パッチをオブジェクトにアタッチすることで,ナビゲーションを具体化するための実用的な攻撃手法を提案する。
実験の結果,我々の敵パッチは航法成功率を約40%削減し,実用性,有効性,自然性において従来の手法よりも優れていた。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 15:10:15 GMT)
HELENE: Hessian Layer-wise Clipping and Gradient Annealing for Accelerating Fine-tuning LLM with Zeroth-order Optimization [18.0] 微調整された大きな言語モデル(LLM)は、大きなメモリ問題を引き起こす。
最近の研究であるMeZOは、ゼロ階最適化法(ZO)を用いてこの問題に対処している。
HELENEは、スケーラブルでメモリ効率の良い新しいプレコンディショナーである。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:27:22 GMT)
Human-in-the-loop Learning for Dynamic Congestion Games [18.0] 本研究では, 利用者が交通条件を学習し, 交通条件を変更する方法について検討する。
提案手法は,経路の過度な探索に繋がることを示す。
本研究では,選択したユーザグループからすべての情報を隠蔽するための複合的な隠蔽・確率的レコメンデーション(CHAR)機構を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 01:45:44 GMT)
QT-TDM: Planning With Transformer Dynamics Model and Autoregressive Q-Learning [17.9] 強化学習(RL)におけるトランスフォーマーの利用について検討する。
分割Q-Transformerモデルを用いて自己回帰離散Q-関数を学習し、短期水平計画以上の長期的なリターンを推定する。
提案手法であるQT-TDMは,動的モデルとしてのトランスフォーマーの頑健な予測機能とモデルフリーQ-トランスフォーマーの有効性を統合し,リアルタイム計画に伴う計算負担を軽減する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 13:32:45 GMT)
GeomCLIP: Contrastive Geometry-Text Pre-training for Molecules [17.0] 我々は,200万対の基底状態の幾何学的構造とバイオメディカルテキストのためのデータ収集作業を構築した。
分子構造とバイオメディカルテキストからのマルチモーダル表現学習のためのGeomCLIPフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 15:15:24 GMT)
DEAL: Decoupled Classifier with Adaptive Linear Modulation for Group Robust Early Diagnosis of MCI to AD Conversion [16.7] 深層学習に基づくアルツハイマー病の診断は、最近大きな進歩を遂げた。
診断のグループロバスト性についての研究には、依然として重大なギャップが残っている。
MRI画像を用いてMCIからADへの変換の早期診断におけるグループロバスト性の最初の包括的調査を行った。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:30:46 GMT)
MATES: Model-Aware Data Selection for Efficient Pretraining with Data Influence Models [16.7] 手作りのルールやより大きな参照モデルに依存する現在のデータ選択方法は、静的に行われ、事前訓練中に進化するデータ優先をキャプチャしない。
データ影響モデル(MATES)を用いたモデル認識データ選択を導入し、データ影響モデルが事前学習モデルの進化するデータ嗜好に継続的に適応し、現在の事前学習の進行に最も有効なデータを選択する。
C4データセット上で410Mと1Bモデルを事前訓練した実験により、MATESは広範囲な下流タスクにおいてランダムなデータ選択を著しく上回ることを示した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:59:22 GMT)
Task Offloading for Vehicular Edge Computing Based on Improved Hotstuff under Parking Assistance [16.2] 駐車支援車両エッジコンピューティング(PVEC)は、駐車車両の通信とコンピューティング資源を完全に活用する。
これらの懸念に対処するため、PVEC内のオフロードとトランザクションのためのセキュアで信頼性の高い環境を提供するために、ブロックチェーンが導入されている。
我々は、タスクオフロードとトランザクションのセキュリティと信頼性を高めるために、ブロックチェーンベースのPVECオフロードフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 10:28:36 GMT)
ProverbEval: Exploring LLM Evaluation Challenges for Low-resource Language Understanding [15.9] ProverbEvalは,証明に基づく低リソース言語の評価ベンチマークである。
様々なLCMをベンチマークし、ベンチマークプロセスにおける変数を生成する要因を探索する。
我々は、選択の順序、プロンプト言語の選択、タスクの可変性、生成タスクに特別な注意を払わなければならないと論じている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 18:58:35 GMT)
Two-layer consensus based on master-slave consortium chain data sharing for Internet of Vehicles [15.3] 本稿では,マスタ-スレーブコンソーシアム連鎖に基づく2層コンセンサスアルゴリズムを提案する。
WRBFTは重み付きラフトとビザンティンフォールトトレランス(WRBFT)を採用した。
多くの実験結果から,提案したWRBFTアルゴリズムは遅延を低減し,スループットとシステムのセキュリティを向上することが示された。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:10:04 GMT)
Test-time Conditional Text-to-Image Synthesis Using Diffusion Models [15.2] TINTIN: Diffusion Modelsを用いたテスト時条件テキスト画像合成は、新しいトレーニング不要なテスト時のみのアルゴリズムである。
質的にも定量的にも、現在の最先端技術よりも大幅に改善されていることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 13:32:18 GMT)
On Reductions and Representations of Learning Problems in Euclidean Spaces [15.1] 多くの実用的な予測アルゴリズムはユークリッド空間における入力を表現し、離散的な0/1分類損失を真の自明な代理損失に置き換える。
我々は古典的トポロジカルアプローチと凸性を考慮したボルスク・ウラム理論の一般化を開発する。
また、ランダム性を利用して、より小さな次元で表現できる自然な分類タスクも提示する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 12:09:37 GMT)
A Survey on Vision Autoregressive Model [15.0] 自然言語処理(NLP)における自己回帰モデルの性能を実証した
NLP分野での顕著な成功にインスパイアされた自己回帰モデルは、近年コンピュータビジョンにおいて集中的に研究されている。
本稿では,既存の手法の分類学の発展を含む,視覚自己回帰モデルに関する体系的なレビューを行う。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:17:49 GMT)
Unsupervised Domain Adaptation for RF-based Gesture Recognition [14.5] RFに基づくジェスチャー認識のための教師なしドメイン適応フレームワークを提案する。
まず、モデルトレーニングに未ラベルデータを利用するために、擬似ラベルと整合正則化を提案する。
次に、RF信号の特性に基づいて、2つの対応するデータ拡張手法を設計し、一貫性の正則化の性能を高める。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 12:31:20 GMT)
AutoIoT: Automated IoT Platform Using Large Language Models [14.5] AutoIoTは、Large Language Models(LLM)とフォーマルな検証技術に基づく、IoT自動化プラットフォームである。
我々は、AutoIoTが、ユーザーがコンフリクトのない自動化ルールを生成し、コンフリクト検出のためのコードを生成するのにどのように役立つかを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:02:01 GMT)
Reinforcement Learning for Sequence Design Leveraging Protein Language Models [14.5] 本稿では,タンパク質言語モデル(PLM)を報酬関数として利用し,新たな配列を生成することを提案する。
我々はRLベースのアプローチをベンチマークするために、様々なシーケンス長に関する広範な実験を行う。
生物学的妥当性とタンパク質の多様性に関する総合的な評価を行った。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:48:19 GMT)
Targeting Negative Flips in Active Learning using Validation Sets [14.1] 本稿では,予測精度と負のフリップによる能動学習アルゴリズムの性能向上について論じる。
最初の観察では、負のフリップと全体的なエラー率が切り離されている。
第2の観察は、未ラベルプールのサブセットで目標とするアクティブラーニングを実行することが、アクティブラーニングアルゴリズムの動作に大きな影響を与えることである。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 21:50:04 GMT)
MTA: Multimodal Task Alignment for BEV Perception and Captioning [13.8] Bird's Eye View (BEV)ベースの3D知覚は、自律運転アプリケーションにおいて重要な役割を果たす。
既存のアプローチでは、認識とキャプションを別々のタスクとして扱い、タスクの1つだけのパフォーマンスに焦点を当てている。
我々は,BEVの知覚とキャプションの双方を促進する,新しいマルチモーダルタスクアライメントフレームワークであるMTAを紹介する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:14:13 GMT)
MaskMedPaint: Masked Medical Image Inpainting with Diffusion Models for Mitigation of Spurious Correlations [13.6] Masked Medical Image Inpainting (MaskMedPaint)
本研究では,テキスト・ツー・イメージ拡散モデルを用いて,対象領域にマッチする領域をキー分類領域外の領域に塗布することでトレーニング画像を強化するMasked Medical Image Inpainting (MaskMedPaint)を提案する。
我々はMaskMedPaintが、制限された未ラベルのターゲット画像から、自然(Waterbirds, iWildCam)と医学(ISIC 2018, Chest X-ray)のデータセットの両方を対象とするドメインの一般化を促進することを実証した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:23:06 GMT)
Game-Theoretic Neyman-Pearson Detection to Combat Strategic Evasion [13.5] この研究は、このような回避攻撃に対抗するための全体論的理論を開発することを目的としている。
本稿では,戦略的回避攻撃と回避対応NP検出器の競合関係を捉えるためのゲーム理論フレームワークを提案する。
回避認識型NP検出器は、攻撃者の行動に対して戦略的に行動することができるように、受動型NP検出器よりも優れていることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 21:40:31 GMT)
ViBe: A Text-to-Video Benchmark for Evaluating Hallucination in Large Multimodal Models [13.0] 本稿では,T2Vモデルによる幻覚映像の大規模テキスト・ビデオベンチマークであるViBeを紹介する。
10個のオープンソースT2Vモデルを用いて,幻覚映像の大規模データセットを開発した。
このベンチマークは、入力プロンプトとより正確に一致したビデオを生成する堅牢なT2Vモデルの開発を促進することを目的としている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:23:12 GMT)
A Survey of Graph Unlearning [12.9] グラフアンラーニングは、トレーニングされたモデルから機密データトレースを削除し、忘れられる権利を保持する手段を提供する。
本稿では,多種多様な方法論を包含したグラフアンラーニング手法の体系的レビューを行う。
我々は、ソーシャルネットワークやレコメンダシステム、モノのインターネットのようなリソース制約のある環境など、さまざまな分野にわたるグラフアンラーニングの汎用性について検討する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:51:30 GMT)
Distributed Collaborative Inference System in Next-Generation Networks and Communication [12.4] 生成人工知能(GAI)の高度な計算要求は、限られたリソースを持つデバイスに対する課題を提示する。
次世代ネットワークと通信のための多段階協調推論システムを提案する。
本システムでは,推測精度を犠牲にすることなく,最大17%の推論時間を短縮できる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 10:48:12 GMT)
SAGED: A Holistic Bias-Benchmarking Pipeline for Language Models with Customisable Fairness Calibration [12.1] SAGED(-Bias)はこれらの問題に対処する最初の総合的なベンチマークパイプラインである。
私たちは、Gemma2、Llama3.1、Mistral、Qwen2など、人気のある8bレベルのモデルでG20諸国でSAGEDを使用しています。
感情分析により、MistralとQwen2はGemma2やLlama3.1よりも最大差とバイアス濃度が低いが、すべてのモデルがロシアや(Qwen2を除く)中国に偏っていることが判明した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:28:03 GMT)
Neighboring Slice Noise2Noise: Self-Supervised Medical Image Denoising from Single Noisy Image Volume [12.1] 近距離スライスノイズ2ノイズ(NS-N2N)の自己監督型医用画像復号法を提案する。
NS-N2Nは、画像ボリューム自体の高品質な denoising を実現するために、1つの医療画像から得られるノイズの多い画像ボリュームのみを必要とする。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:24:28 GMT)
Neuc-MDS: Non-Euclidean Multidimensional Scaling Through Bilinear Forms [11.9] 非ユークリッドMDS(Neuc-MDS)は古典的多次元スケーリング(MDS)の拡張である
Neuc-MDSは、異種グラム行列の(正および負の両方の)固有値の選択を効率よく最適化し、STRESSを減少させる。
先行研究により得られた古典的MDSの限界に対処するNeuc-MDSの能力を実証し,様々な合成および実世界のデータセットで検証する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 21:09:38 GMT)
FlexFL: Flexible and Effective Fault Localization with Open-Source Large Language Models [11.9] 我々は,FlexFL という新しい LLM ベースのFL フレームワークを提案し,様々な種類のバグ関連情報を柔軟に活用する。
軽量なオープンソースのLLM Llama3-8Bを持つFlexFLは、2つの最先端のLLMベースのFLアプローチであるAutoFLとAgentFLよりも42と63のバグを発見できることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:08:14 GMT)
From Prototypes to General Distributions: An Efficient Curriculum for Masked Image Modeling [11.6] Masked Image Modelingは視覚表現学習のための強力な自己教師型学習パラダイムとして登場した。
本稿では,原典例からデータセットのより複雑なバリエーションまで,学習プロセスの進行を構造化する,プロトタイプ駆動型カリキュラム学習フレームワークを提案する。
本研究は, 自己指導型視覚学習において, トレーニング事例の順序を慎重に制御することが重要な役割を担っていることを示唆している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:21:06 GMT)
Pluralistic Alignment Over Time [11.6] 我々は、利害関係者の満足度の変化と、潜在的に時間的に拡張された嗜好を含む時間的側面の考察を提唱する。
時間的公正性を評価するための最近のアプローチは、時間的多元性アライメント(時間的多元性)という新しい形式にどのように適用できるかを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 01:23:25 GMT)
ML$^2$Tuner: Efficient Code Tuning via Multi-Level Machine Learning Models [11.5] 自動チューニング効率を向上させるマルチレベル機械学習チューニング技術であるML$2$Tunerを紹介する。
ML$2$Tunerは、必要なサンプルの12.3%しか使用せず、同等のパフォーマンス向上を実現していることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 10:10:12 GMT)
FIAS: Feature Imbalance-Aware Medical Image Segmentation with Dynamic Fusion and Mixing Attention [11.4] 畳み込みニューラルネットワーク(CNN)とトランスフォーマーを組み合わせたハイブリッドアーキテクチャは、医療画像セグメンテーションにおける競争力を示している。
本稿では、デュアルパスエンコーダとMixAtt(MixAtt)デコーダを組み込んだフェール・インバランス・アウェア(FIAS)ネットワークを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:30:44 GMT)
Deep Loss Convexification for Learning Iterative Models [11.4] 点雲登録のための反復的最近点(ICP)のような反復的手法は、しばしば悪い局所最適性に悩まされる。
我々は,各地真実の周囲に凸景観を形成する学習を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 01:13:04 GMT)
Chess Rating Estimation from Moves and Clock Times Using a CNN-LSTM [11.3] 本稿では,ゲームの動きや時計時間から直接プレイヤーの格付けを推定する手法を提案する。
我々のモデルアーキテクチャは、位置特徴を学習するためのCNNで構成されており、時計時間データと統合された双方向LSTMである。
このモデルは、手作りの機能を使わずにチェスのレーティングを推定し、各移動後にレーティング予測を出力した最初のモデルである。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:39:44 GMT)
OpenLS-DGF: An Adaptive Open-Source Dataset Generation Framework for Machine Learning Tasks in Logic Synthesis [11.1] OpenLS-DGFは適応論理合成データセット生成フレームワークである。
論理合成の3つの基本的なステップをカプセル化することにより、さまざまな機械学習タスクをサポートする。
生成されたOpenLS-D-v1データセットは、確立されたベンチマークから46の組合せ設計で構成されている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:48:26 GMT)
GraphVL: Graph-Enhanced Semantic Modeling via Vision-Language Models for Generalized Class Discovery [11.0] 一般化カテゴリー発見(GCD)における視覚言語モデリングの新しいアプローチであるGraphVLを紹介する。
グラフ畳み込みネットワーク(GCN)とCLIPのテキストエンコーダを統合し,クラス近傍構造を保存する。
ベンチマークデータセットの7つの実験は、CLIPバックボーンと統合した場合のGraphVLの優位性を一貫して示している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 09:05:56 GMT)
LightCode: Light Analytical and Neural Codes for Channels with Feedback [10.6] 我々は,通信システムに適した低複雑さの符号化方式を設計することに注力する。
まず、Schalkwijk-Kailath (SK) と Gallager-Nakibouglu (GN) にインスパイアされた解析的符号化スキームであるPowerBlast が、SK と GN のスキームに対して顕著な信頼性向上を実現していることを示す。
次に、低SNR領域の信頼性を高めるために、既存のディープラーニングベースのコードと比較して、わずかなメモリと計算を使いながら、最先端の信頼性を実現する軽量ニューラルネットワークであるLightCodeを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:55:18 GMT)
Developer Perspectives on Licensing and Copyright Issues Arising from Generative AI for Coding [10.5] ジェネレーティブAI(GenAI)ツールは、すでにソフトウェア開発プラクティスを変革し始めている。
これらのツールの使用は、重要な法的問題と潜在的なリスクを引き起こす。
この調査では、開発活動にGenAIツールを使用するGitHub開発者574を調査した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:06:21 GMT)
Witnessing Quantum Incompatibility Structures in High-Dimensional Multimeasurement Systems [10.3] 量子不整合性(quantum incompatibility)は、いくつかの量子測定を同時に行うことができない現象である。
本稿では、複雑な整合構造をペアに分解する量子状態識別プロトコルを提案する。
実験の結果を実証し、量子ステアリング、量子シミュラビリティ、および量子通信と接続する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:17:01 GMT)
Vocabulary Transfer for Biomedical Texts: Add Tokens if You Can Not Add Data [10.2] 我々は,対象語彙を拡張して,ドメイン固有のバイオメディカル用語を組み込む手法である語彙拡張に焦点を当てた。
以上の結果から,語彙拡張は,下流モデルの性能と推論時間の両方において,測定可能な改善をもたらすことが示唆された。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:49:57 GMT)
Wireless Resource Allocation with Collaborative Distributed and Centralized DRL under Control Channel Attacks [10.0] 制御チャネルがDoS攻撃を受けるサイバー物理システム(CPS)における無線リソース割り当て問題について考察する。
本稿では,これらの攻撃の影響を効果的に軽減するために,CDCの資源配分を協調的に行うという新しい概念を提案する。
既存の DRL フレームワークは集中的あるいは分散的な意思決定問題のみを定式化するのに対して,我々は CDC-deep reinforcement learning (DRL) アルゴリズムを開発した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:56:23 GMT)
Efficient, Low-Regret, Online Reinforcement Learning for Linear MDPs [9.9] LSVI-UCBは,学習時間と学習時間の交互に変化し,空間と時間の短縮を図る。
合成データと実世界のベンチマークを用いて、我々のアルゴリズムは空間使用量や実行時間が低く、後悔のあまり犠牲にならないことを実験的に示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 22:51:52 GMT)
MetricGold: Leveraging Text-To-Image Latent Diffusion Models for Metric Depth Estimation [9.6] MetricGoldは、生成拡散モデルの豊富な先行値を利用して、メートル法深さ推定を改善する新しいアプローチである。
我々の実験は、多様なデータセットをまたいだ堅牢な一般化を実証し、よりシャープで高品質なメートル法深さ推定を導出する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:59:01 GMT)
The Implicit Bias of Heterogeneity towards Invariance: A Study of Multi-Environment Matrix Sensing [9.6] 不均一なデータに対するグラディエント・Descent (SGD) の暗黙バイアスについて検討した。
暗黙のバイアスがモデル学習を不変解へと導くことを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:49:06 GMT)
Infrared-Assisted Single-Stage Framework for Joint Restoration and Fusion of Visible and Infrared Images under Hazy Conditions [9.4] 本稿では,赤外線画像を用いた統合学習フレームワークを提案する。
本手法は, ヘイズを除去しながらIR-VIS画像を効果的に融合させ, 鮮明で無害な融合結果をもたらす。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:57:12 GMT)
On the Verification of Control Flow Attestation Evidence [9.3] 我々は、Vrfが受信した証拠を効果的に分析できれば、実行時の検証と監査は本当に役に立つと論じる。
Vrfによる実行時のエビデンスを実際に活用するためのケーススタディとして,SABRE: A Security Analysis and Binary repair Engineを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 18:24:11 GMT)
IntentGPT: Few-shot Intent Discovery with Large Language Models [9.2] 我々は、新たな意図が現れると識別できるモデルを開発する。
IntentGPTは、Large Language Models (LLM) を効果的に促し、最小限のラベル付きデータで新しいインテントを発見する、トレーニング不要の手法である。
実験の結果,IntentGPTはドメイン固有データと微調整を必要とする従来の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:16:59 GMT)
Diagnostic Text-guided Representation Learning in Hierarchical Classification for Pathological Whole Slide Image [9.2] 階層的病理画像分類の概念を導入し、PathTreeと呼ばれる表現学習を提案する。
PathTreeは、病気の多重分類を二分木構造とみなしている。
提案したPathTreeは,最先端の手法と比較して一貫して競合する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 05:35:39 GMT)
Diffusion-Based Semantic Segmentation of Lumbar Spine MRI Scans of Lower Back Pain Patients [9.2] 腰痛 (LBP) 患者における脊椎椎間板 (IVDs) と脊椎椎間板 (intravertebral discs) の堅牢かつ正確なセグメンションのための拡散型枠組みについて検討した。
その結果, SpineSegDiffは, 劣化IVDの同定において, 拡散非拡散モデルよりも優れていた。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 09:22:46 GMT)
Watermarking Generative Categorical Data [9.1] 本手法は,データ分布を2つの成分に分割し,一方の分布を他方との決定論的関係に基づいて修正することにより秘密信号を埋め込む。
透かしを検証するために挿入逆アルゴリズムを導入し、逆復号データと元の分布との間の全変動距離を計測してその存在を検出する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 21:57:45 GMT)
PipeInfer: Accelerating LLM Inference using Asynchronous Pipelined Speculation [9.1] PipeInferは、パイプライン化された投機的アクセラレーション技術で、トークン間のレイテンシを低減し、単一要求シナリオにおけるシステム利用を改善する。
PipeInferは、標準的な投機的推論よりも生成速度が2.15$times$改善されている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 23:19:51 GMT)
Multi Scale Graph Neural Network for Alzheimer's Disease [9.0] アルツハイマー病(英語: Alzheimer's disease、AD)は、細胞外アベタプラーク、神経線維性タウ・タングル、グリア活性化、神経変性を特徴とする複雑で進行的な神経変性疾患である。
そこで我々は,老化からADスペクトル全体にわたるドナーの脳ミクスデータを用いて,マルチスケールグラフニューラルネットワーク(GNN)モデルALZ PINNACLEを開発した。
ALZ PINNACLE は PINNACLE GNN フレームワークをベースとしている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:48:14 GMT)
Transformer-Based Classification Outcome Prediction for Multimodal Stroke Treatment [8.7] 本研究では,Transformerアーキテクチャと自己保持機構に基づくマルチモーダル融合フレームワークであるMultitransを提案する。
このアーキテクチャは、非コントラストCT(non-contrast Computed tomography)画像の研究と、脳卒中治療中の患者の退院診断報告を組み合わせたものである。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:36:32 GMT)
Towards Operationalizing Right to Data Protection [8.6] RegTextは、認識不能な相関関係を自然言語データセットに注入するフレームワークで、コンテンツに影響を与えることなく、効果的に学習不能にすることができる。
小型・大規模LMの厳密な実証分析によりRegTextの有用性を実証する。
RegTextは、生成したデータからGPT-4oやLlamaといった新しいモデルを学ぶことができます。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 09:36:36 GMT)
Comparison of Multilingual and Bilingual Models for Satirical News Detection of Arabic and English [8.2] 風刺的なニュースは、文化的、社会的背景の異なる個人によって誤解されることが多い。
本研究は、英語とアラビア語の多言語風刺検出手法を活用することによって、真実のニュースと風刺を区別することの課題に対処する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:49:15 GMT)
CODECLEANER: Elevating Standards with A Robust Data Contamination Mitigation Toolkit [7.9] データ汚染は、コード言語モデルを活用するソフトウェアエンジニアリング技術の普及を妨げている。
本稿では, 産業用コード演算子の複数スケールにおける有効性を検討するための最初の体系的な研究について述べる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:06:21 GMT)
Why Rectified Power Unit Networks Fail and How to Improve It: An Effective Theory Perspective [7.4] Rectified Power Unit (RePU) のアクティベーション機能は、ニューラルネットワークを構築する際に微分可能な関数であるという利点がある。
本稿では,RePUのアドバンテージを維持しつつ,その欠点を克服する新たなアクティベーション機能を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 15:15:15 GMT)
Take Caution in Using LLMs as Human Surrogates: Scylla Ex Machina [7.2] 研究は、大規模言語モデル(LLM)が、経済実験、調査、政治談話において、人間の行動と整合した人間的な推論を示す可能性があることを示唆している。
このことから、LLMは社会科学研究において人間の代理やシミュレーションとして使用できると多くの人が提案している。
11~20のマネーリクエストゲームを用いてLCMの推論深度を評価する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:26:24 GMT)
Empowering Meta-Analysis: Leveraging Large Language Models for Scientific Synthesis [7.1] 本研究では,大規模言語モデル(LLM)を用いた科学文献におけるメタアナリシスの自動化について検討する。
ビッグデータ処理と構造化データ抽出の課題に対処するため,LLMを広範囲の科学的データセットに微調整する新たなアプローチを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:18:57 GMT)
BanglaDialecto: An End-to-End AI-Powered Regional Speech Standardization [7.1] 本研究は、方言のNoakhali音声を標準のBangla音声に変換するためのエンドツーエンドパイプラインを提案する。
約55の異なる方言が1億6000万人が話しており、バングラ方言に対処することは包括的コミュニケーションツールの開発に不可欠である。
実験の結果,Whisper ASRモデルが0.8%,WERが1.5%,BanglaT5モデルが41.6%,BLEUが41.6%であった。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:20:15 GMT)
Constructing accurate machine-learned potentials and performing highly efficient atomistic simulations to predict structural and thermal properties [6.9] Ab initio molecular dynamics (AIMD) シミュレーションから生成されたデータセットに基づいて学習した神経進化電位(NEP)を導入する。
両方の機械学習ポテンシャルを用いて、状態(DOS)と放射分布関数(RDF)のフォノン密度を計算する。
MTP電位はわずかに精度が良いが、NEPは計算速度が41倍に向上する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 23:16:59 GMT)
Hybrid Attention Model Using Feature Decomposition and Knowledge Distillation for Glucose Forecasting [6.5] GlucoNetは、行動と生理の健康を継続的に監視するAI駆動のセンサーシステムである。
本稿では,患者の行動・生理的データを組み込んだ分解型トランスフォーマーモデルを提案する。
GGlucoNetは、T1-Diabetesの12人を含むデータを用いて、RMSEの60%の改善とパラメータ数の21%削減を実現している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 05:09:20 GMT)
FPPL: An Efficient and Non-IID Robust Federated Continual Learning Framework [6.4] フェデレーション型連続学習(FCL)は、分散化されたフェデレーション型学習環境において、シーケンシャルなデータストリームから学習することを目的としている。
既存のFCLメソッドは通常、典型的なリハーサル機構を使用しており、これはプライバシー侵害や追加の面倒なストレージや計算負荷をもたらす可能性がある。
本研究では,FPPL(Federated Prototype-Augmented Prompt Learning)と呼ばれる,効率的で非IIDな連立型連続学習フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 12:05:45 GMT)
On-device Anomaly Detection in Conveyor Belt Operations [6.4] 本研究では,マイニングコンベヤベルトの動作サイクルにおけるリアルタイム異常検出のための2つのパターン認識手法を提案する。
第1のアプローチは、通常サイクルと異常サイクルそれぞれ97.3%と80.2%で、第1のデータセットで最高パフォーマンスに達する。
この手法は、推論中にエネルギー消費量が13.3および20.6ドルの効率的なリアルタイム運転を実証した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:46:28 GMT)
An Oversampling-enhanced Multi-class Imbalanced Classification Framework for Patient Health Status Prediction Using Patient-reported Outcomes [6.1] 放射線治療を受けたがん患者から直接収集された患者報告結果(PROs)は、臨床医が潜在的毒性について助言する患者を支援する上で重要な役割を担っている。
本稿では,がん光子・プロトン療法センターのproBoostを用いて,健康状態に関連する患者の予後を予測するためのさまざまな機械学習手法について検討する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:54:18 GMT)
Increasing Rosacea Awareness Among Population Using Deep Learning and Statistical Approaches [5.7] 本稿では,深層学習と説明可能な統計的アプローチを用いたロザス検出法について述べる。
提案手法は,ロザセアに苦しむ患者と,この疾患を清潔にしている患者とを自動的に区別することができる。
そして最後に、提案手法は、ロザセアが早期に治療可能であることから、この疾患に苦しむ患者に早期治療の可能性を思い出させるのに役立つ。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 22:27:41 GMT)
Investigating Annotator Bias in Large Language Models for Hate Speech Detection [5.6] 本稿では,ヘイトスピーチデータに注釈をつける際に,Large Language Models (LLMs) に存在するバイアスについて考察する。
具体的には、これらのカテゴリ内の非常に脆弱なグループを対象として、アノテータバイアスを分析します。
我々は,この研究を行うために,独自のヘイトスピーチ検出データセットであるHateBiasNetを紹介した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 18:56:32 GMT)
I Know What You Sync: Covert and Side Channel Attacks on File Systems via syncfs [5.6] 論理的分離を断ち切るファイルシステムを通して、新しいタイプのサイドチャネルを示す。
ファイルシステムはオペレーティングシステムにおいて重要な役割を担い、アプリケーション層と物理ストレージデバイスの間のすべてのI/Oアクティビティを管理する。
我々はLinuxとAndroidの両方をターゲットとする3つのサイドチャネル攻撃を構築した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:40:08 GMT)
Large Language Models (LLMs) as Traffic Control Systems at Urban Intersections: A New Paradigm [5.2] 本研究では,Large Language Models (LLM) をトラヒックコントローラとして利用することで,トラヒック制御システムに新たなアプローチを提案する。
この研究は、論理的推論、シーン理解、意思決定能力を利用してスループットを最適化し、リアルタイムで交通状況に基づいたフィードバックを提供する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:23:52 GMT)
MpoxVLM: A Vision-Language Model for Diagnosing Skin Lesions from Mpox Virus Infection [5.2] ムポックス(サルポックスウイルスによる)は、しばしば診断されない動物感染症の顕著な例である。
MpoxVLMは, 皮膚病変画像と患者臨床情報の両方を分析し, mpoxの検出を目的とした視覚言語モデル(VLM)を提案する。
本研究は, mpox検出における90.38%の精度を達成し, mpox対策における早期診断精度を向上させるための有望な経路を提供する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 21:09:04 GMT)
ChannelDropBack: Forward-Consistent Stochastic Regularization for Deep Networks [5.0] 既存のテクニックでは、しばしば特別なレイヤを追加することによってネットワークのアーキテクチャを変更する必要がある。
本稿では,逆情報フローにのみランダム性を導入する単純な正規化手法であるChannelDropBackを提案する。
アーキテクチャを変更することなく、任意のモデルやレイヤのトレーニングプロセスにシームレスに統合することができます。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 21:24:44 GMT)
Commutation Relations in Adiabatic Elimination [5.0] 真空ノイズの高周波を遮断して断熱除去を行うことから, 誤計算関係が生じることを示す。
断熱除去法は、物理信頼性を維持しつつ計算の複雑さを低減することができる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 01:58:58 GMT)
Stereotype Detection in LLMs: A Multiclass, Explainable, and Benchmark-Driven Approach [4.9] 本稿では, 性別, 人種, 職業, 宗教, その他のステレオタイプにまたがる51,867の事例からなるMulti-Grain Stereotype (MGS)データセットを提案する。
我々は、さまざまな機械学習アプローチを評価し、異なるアーキテクチャと大きさのベースラインと微調整言語モデルを確立する。
我々は、モデルが学習したパターンがステレオタイプに関する人間の直観と一致するかどうかを評価するために、SHAP、LIME、BertVizを含む説明可能なAI(XAI)ツールを採用する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:54:09 GMT)
Feature Alignment: Rethinking Efficient Active Learning via Proxy in the Context of Pre-trained Models [4.7] トレーニング済みモデルをアクティブな学習で微調整することは、アノテーションコストの削減を約束する。
近年,プロキシに基づく能動学習が提案されている。
このアプローチは、しばしばアクティブな学習性能に大きな損失をもたらし、時には計算コストの削減を上回ります。
本研究では,選択の相違による能動的学習能力の低下を緩和する適切な学習方法を示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:45:43 GMT)
How (un)ethical are instruction-centric responses of LLMs? Unveiling the vulnerabilities of safety guardrails to harmful queries [4.7] 大型言語モデル(LLM)の安全性と倫理的利用に関する懸念が高まっている。
当社の作業は,特定の問題に対してゼロになっている – 命令中心の応答を生成するように要求することで,LLMをどの程度の頻度で誘導することが可能か,という点です。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:21:32 GMT)
Masking Gaussian Elimination at Arbitrary Order, with Application to Multivariate- and Code-Based PQC [4.7] 我々は,ガウス的排除(GE)のためのマスキングスキームを提供する。
線形方程式の系を行-エケロン形式に変換するためのマスク付きアルゴリズムを提案する。
提案手法のオーバーヘッドを,数件のポストクォータ候補と,それらの異なるセキュリティレベルで評価した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:59:36 GMT)
NeuroNURBS: Learning Efficient Surface Representations for 3D Solids [4.6] 境界表現(B-Rep)はコンピュータ支援設計(CAD)における3次元固体のデファクト表現である
現在の研究はしばしばUV格子近似、すなわち表面のサンプル点を均一に利用している。
本稿では,NURBS表面のパラメータを直接符号化する表現学習手法であるNeuroNURBSを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:44:43 GMT)
Bias in Large Language Models: Origin, Evaluation, and Mitigation [4.6] 大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、バイアスへの感受性は大きな課題となっている。
本総説では, LLMの発端から現在の緩和戦略まで, バイアスの背景を概観する。
偏りのあるLLMの倫理的および法的含意について論じ、医療や刑事司法のような現実の応用における潜在的な害を強調した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 23:54:53 GMT)
A Multimodal Fusion Network For Student Emotion Recognition Based on Transformer and Tensor Product [4.5] 本稿ではトランスフォーマーアーキテクチャとテンソル製品融合戦略に基づく新しいマルチモーダルモデルを提案する。
BERTのテキストベクトルとViTのイメージベクトルを組み合わせて、生徒の心理的条件を93.65%の精度で分類する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:38:47 GMT)
Cooperative non-reciprocal emission and quantum sensing of symmetry breaking [4.4] エネルギーと情報の非相互伝播は、幅広い量子技術応用に不可欠である。
反対称的(対称的)コヒーレントと対称的(対称的)散逸的相互作用の相互作用が非相互結合をもたらすことを示す。
我々は、時間変調外付けドライブや複雑なエンジニアリングを必要とせず、クビットアンサンブルにおける協調的非相互輸送を実現するための道を開いた。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 01:58:03 GMT)
New advances in universal approximation with neural networks of minimal width [4.4] リークReLUアクティベーションを持つオートエンコーダは$Lp$関数の普遍近似器であることを示す。
我々は,滑らかな可逆ニューラルネットワークが$Lp(mathbbRd,mathbbRd)$をコンパクト化できることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 12:51:03 GMT)
LTCXNet: Advancing Chest X-Ray Analysis with Solutions for Long-Tailed Multi-Label Classification and Fairness Challenges [4.4] Pruned MIMIC-CXR-LTデータセットは、長い尾と多ラベルのデータシナリオを表現するように設計されている。
本稿では,ConvNeXtモデル,ML-Decoder,戦略的データ拡張を統合した新しいフレームワークであるLCCXNetを紹介する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:59:20 GMT)
A Wearable Gait Monitoring System for 17 Gait Parameters Based on Computer Vision [4.3] このシステムは、片方の靴に取り付けられたステレオカメラを使って、反対側の靴のマーカーを追跡する。
靴のヒールに付着したFSR(Force Sensitive Resistor)と、カスタム設計のアルゴリズムを組み合わせることで、時間的歩行パラメータを測定する。
このシステムは費用対効果が高く、ユーザフレンドリで、実生活の計測に適している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:25:22 GMT)
Exploring Feature-based Knowledge Distillation For Recommender System: A Frequency Perspective [4.2] 周波数の観点から特徴量に基づく知識蒸留を推奨するために分析する。
我々は,知識重みを再分配することによって重要な知識を強調することを提案する。
広範囲にわたる実験により、FreqDはレコメンダシステムに対する最先端の知識蒸留法よりも一貫して、著しく優れていることが示された。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:41:12 GMT)
Bullion: A Column Store for Machine Learning [4.1] 本稿では,機械学習処理に適した列記憶システムであるBullionについて述べる。
Bundyはデータコンプライアンスの複雑さに対処し、長いシーケンススパース機能のエンコーディングを最適化し、拡張可能なプロジェクションを効率的に管理し、ストレージに機能量子化を導入し、包括的なカスケードエンコーディングフレームワークを提供する。
予備的な実験結果と理論的分析は、機械学習ワークロードのユニークな要求に直面して、Bullionが強力なパフォーマンスを提供する能力が改善されたことを示している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:17:20 GMT)
Generative Priors for MRI Reconstruction Trained from Magnitude-Only Images Using Phase Augmentation [4.1] 本稿では,大域のみの画像から汎用的でロバストな生成画像を生成するワークフローを提案する。
次に、前者は画像品質を改善するために再構成の正規化に使用することができる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:39:15 GMT)
Beyond Full Labels: Energy-Double-Guided Single-Point Prompt for Infrared Small Target Label Generation [3.8] 我々は、赤外線小ターゲットラベル生成(IRSTLG)のための学習に基づくシングルポイントプロンプトパラダイムを開拓した。
本稿では、粗いIRSTDネットワークを洗練されたラベル生成手法に変換することを目的とした、エレガントで効果的なエネルギー二重ガイド型シングルポイントプロンプト(EDGSP)フレームワークを提案する。
本フレームワークは,SIRST,NUDT-SIRST,IRSTD-1kデータセット上で100%オブジェクトレベル検出確率 (Pd) と0%偽アラームレート (Fa) を達成し,IoU (Pixel-level intersection over union) を13.28%改善した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:21:56 GMT)
ReLU's Revival: On the Entropic Overload in Normalization-Free Large Language Models [3.8] LayerNormは、トレーニングの安定化とスムーズな最適化を保証するため、現代の大規模言語モデル(LLM)において重要なコンポーネントである。
本研究は、正規化自由デコーダのみのLLMにおける望ましいアクティベーション関数について検討する。
ReLUは、LayerNormフリーモデルでGELUを著しく上回り、bf 8.2%のパープレキシティ改善をもたらした。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:59:35 GMT)
MRI Parameter Mapping via Gaussian Mixture VAE: Breaking the Assumption of Independent Pixels [3.7] 我々はMRIにおける定量的パラメータマッピングの新しいパラダイムを導入し、実証する。
独立画素の仮定を破る自己教師型深部変分法を提案する。
そこで本手法は,dMRIやqMRIなどのパラメータマッピング手法の臨床応用を支援することができる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:11:36 GMT)
Deep BI-RADS Network for Improved Cancer Detection from Mammograms [3.7] テキスト型BI-RADS病変記述子と視覚マンモグラムを併用した新しいマルチモーダル手法を提案する。
提案手法は,これらの異なるモダリティを効果的に融合させるために,反復的な注意層を用いる。
CBIS-DDSMデータセットの実験では、すべてのメトリクスで大幅に改善されている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 21:32:51 GMT)
Exascale Workflow Applications and Middleware: An ExaWorks Retrospective [3.4] 多様な大規模プラットフォーム上で異種ソフトウェアコンポーネントをコーディネートし、デプロイするという課題に対処するExaWorksプロジェクトを紹介します。
我々はジョブ管理抽象化APIであるSoftware Development Toolkit(SDK)と、ジョブの提出と監視のための最小限のインターフェースであるPSI/Jを開発した。
当社のプロジェクトでは,ワークフローコミュニティや大規模コンピューティング施設,HPCプラットフォームベンダと連携して,エクサスケールでの要件を持続的に解決する方法について論じる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:10:53 GMT)
Towards ultrastrong-coupling quantum thermodynamics using a superconducting flux qubit [3.4] クビットのハイブリッド化状態とそれに結合したキャビティを観察することにより,強い結合を示す実験的な証拠を示す。
また, 量子ビットに小さな磁束を印加することにより, 熱電流のオンオフ比の約100%のスイッチングを実証した。
我々は、真の量子熱エンジンと冷凍機を高効率で実現することを目的とした、量子熱力学の新しいツールを提供する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:20:05 GMT)
Anatomy-Guided Radiology Report Generation with Pathology-Aware Regional Prompts [3.1] 生成AIを報告する放射線学は、臨床ワークロードを緩和し、医療を合理化するための大きな可能性を秘めている。
既存のシステムは、固定サイズ、パッチレベルの画像特徴、病理情報の組み入れが不十分なため、しばしば不足する。
本稿では,病的・病態的情報を多種多様な尺度で明確に統合するために,病理学的に認識された地域的プロンプトを活用する革新的なアプローチを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 12:36:20 GMT)
Practitioner Paper: Decoding Intellectual Property: Acoustic and Magnetic Side-channel Attack on a 3D Printer [3.1] 本研究は,3Dプリンタ上でサイドチャネル攻撃を行うことにより,G符号の再構築の実現可能性を示す。
グラディエントブースト決定木を用いたモデルの訓練により, 軸運動, ステッパ, ノズル, ロータ速度の予測精度が向上した。
実世界の試験において本モデルを効果的に展開し, 平均テンディエンシエラー(MTE)を4.47%, 平易なGコード設計で達成する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 21:05:25 GMT)
SAFES: Sequential Privacy and Fairness Enhancing Data Synthesis for Responsible AI [3.0] SAFES(Sequential PrivAcy and Fairness Enhancing data synthesis procedure)を紹介する。
適切なプライバシ損失を得るために、SAFESの生成した合成データは、比較的実用性損失の少ないフェアネス指標を著しく改善した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:13:23 GMT)
Steam Turbine Anomaly Detection: An Unsupervised Learning Approach Using Enhanced Long Short-Term Memory Variational Autoencoder [3.0] ラベルなしデータセットの精度の高い教師なし異常検出のためのELSTMVAE-DAF-GMM(ELSTMVAE-DAF-GMM)を提案する。
VAEとLSTMを統合したELSTMVAEは,低次元位相空間に高次元時系列データを投影するために用いられた。
新たなDAF(Deep Advanced Feature)は、LSTMVAEモデルから遅延埋め込みと再構成の相違をハイブリダイズし、より包括的なデータ表現を提供する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 10:11:36 GMT)
EVT: Efficient View Transformation for Multi-Modal 3D Object Detection [3.0] 効率的なビュー変換(EVT)による新しい3次元物体検出法を提案する。
EVTは、アダプティブサンプリングとアダプティブプロジェクション(ASAP)を使用して、3Dサンプリングポイントとアダプティブカーネルを生成する。
トランスデコーダ内で得られたマルチモーダルBEV機能を効果的に活用するように設計されている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:11:10 GMT)
Gaussian Copula Models for Nonignorable Missing Data Using Auxiliary Marginal Quantiles [2.9] 本稿では,非無視的欠落データのモデル化と計算手法を提案する。
我々は,ノースカロライナの170,000人の学生を対象に,鉛暴露とエンドツーエンドテストスコアの関係を解析するためにモデルを適用した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:11:29 GMT)
Towards Robust Text Classification: Mitigating Spurious Correlations with Causal Learning [2.8] 本稿では,因果関係へのモデル依存を軽減するために,因果相関ロバスト (CCR) を提案する。
CCRは、逆確率重み付け(IPW)損失関数とともに、反ファクト推論に基づく因果的特徴選択法を統合する。
グループラベルを持たないメソッド間でのCCRの最先端性能を示し、場合によってはグループラベルを利用するモデルと競合する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 05:22:52 GMT)
Developer Challenges on Large Language Models: A Study of Stack Overflow and OpenAI Developer Forum Posts [2.7] 大規模言語モデル(LLM)は、様々なドメインにまたがる例外的な機能のために広く普及している。
本研究は,Stack OverflowとOpenAI Developer Forum上でのコミュニティインタラクションを分析することによって,開発者の課題を調査する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:38:27 GMT)
An Empirical Investigation on the Challenges in Scientific Workflow Systems Development [2.7] この記事では、Stack Overflow(SO)とGitHubにおける開発者と研究者のインタラクションについて検討する。
問題を分析することで、13のトピック(例えば、エラーとバグ修正、ドキュメント、依存性)を特定し、データ構造と操作が最も難しいことを発見した。
また、データ構造や操作、タスク管理、ワークフロースケジューリングといった、SOとGitHubの共通するトピックも見つけました。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 21:14:11 GMT)
Gender Bias Mitigation for Bangla Classification Tasks [2.6] バングラ語事前学習言語モデルにおける性別バイアスについて検討する。
名前と性別固有の用語を変更することで、これらのデータセットが性別バイアスを検出し緩和するのに適していることを確認した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:04:45 GMT)
A Model-Agnostic Graph Neural Network for Integrating Local and Global Information [2.6] グラフニューラルネットワーク(GNN)は、さまざまなグラフにフォーカスしたタスクにおいて、有望なパフォーマンスを実現している。
既存のGNNには、ブラックボックスの性質による結果の解釈可能性の欠如と、さまざまな順序の表現を学べないという2つの大きな制限がある。
本稿では,様々な順序の情報を効果的に統合し,高次隣人から知識を抽出し,影響力のあるコンパクトグラフ構造を同定して有意義かつ解釈可能な結果を提供する,モデル非依存型グラフニューラルネットワーク(MaGNet)フレームワークを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:25:08 GMT)
Chain-of-Programming (CoP) : Empowering Large Language Models for Geospatial Code Generation [2.6] 本稿では,コード生成プロセスを5段階に分解するプログラミングフレームワークを提案する。
このフレームワークには、共有情報プール、知識ベース検索、ユーザフィードバック機構が含まれている。
生成されたコードの論理的明確性、構文的正確性、実行可能性を大幅に改善する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 09:20:35 GMT)
Classical optimization with imaginary time block encoding on quantum computers: The MaxCut problem [2.5] 対角ハミルトニアンの基底状態解を見つけることは、金融、物理学、計算機科学など多くの分野に関心を持つ理論的および実践的な問題の両方に関係している。
ここでは、新しいブロック符号化方式を用いて、これらの問題の基底状態を取得し、この手法をMaxCutに例証として応用する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:17:36 GMT)
How to Defend Against Large-scale Model Poisoning Attacks in Federated Learning: A Vertical Solution [2.5] フェデレートラーニング(FL)は、その分散した性質のため、毒殺攻撃のモデルとして脆弱である。
本稿では,グローバル通信ラウンドを垂直軸とするVERTを提案する。
VERTは効率的でスケーラブルであり、FLシナリオの異なる大規模(=80%)モデルによる防御効果を示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:25:05 GMT)
Web Archives Metadata Generation with GPT-4o: Challenges and Insights [2.5] 本稿では,Web Singapore Archiveにおけるメタデータ生成におけるgpt-4oの利用について検討する。
データ削減技術を用いて112のWeb ARChive(WARC)ファイルを処理し、メタデータ生成コストを99.9%削減した。
この研究は、コンテンツ不正確性、幻覚、翻訳問題を含む主要な課題を特定し、人間カタログの置き換えではなく、Large Language Models(LLM)が補体として機能すべきであることを示唆している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:27:09 GMT)
A Data-Efficient Sequential Learning Framework for Melt Pool Defect Classification in Laser Powder Bed Fusion [2.4] 本研究では, 融解プール欠陥分類のためのシークエンシャルラーニングフレームワークであるSL-RF+(Sequentially Learned Random Forest with Enhanced Sampling)を提案する。
その結果,SL-RF+は,精度,精度,リコール,F1スコアなど,従来の機械学習モデルよりも優れていた。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 15:18:56 GMT)
Event-based Sensor Fusion and Application on Odometry: A Survey [2.4] イベントカメラは、高速モーション、低照度、広ダイナミックレンジを特徴とする環境において利点がある。
これらの特性は、特にロボット工学とコンピュータビジョンにおけるセンサー融合に有効なイベントカメラをレンダリングする。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:04:23 GMT)
VayuBuddy: an LLM-Powered Chatbot to Democratize Air Quality Insights [2.3] VayuBuddyは、Large Language Model (LLM)を利用した、空気質センサーデータ分析のためのチャットボットである。
VyuBuddyは自然言語で質問を受け取り、構造化された知覚データをLLM生成のPythonコードで分析し、自然言語で回答を提供する。
VyuBuddyはまた、センサーデータから行プロット、マッププロット、バーチャートなどの視覚的分析を生成することもできる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:02:35 GMT)
An adaptively inexact first-order method for bilevel optimization with application to hyperparameter learning [2.2] 提案アルゴリズムは,実行前に手動で選択するよりも,必要な精度を動的に決定する。
我々の実験は、画像とデータサイエンスにおける様々な問題に対して、我々のアプローチの効率性と実現可能性を示すものである。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:11:18 GMT)
Improvement in Facial Emotion Recognition using Synthetic Data Generated by Diffusion Model [2.2] 顔の感情認識(FER)は、コンピュータビジョンにおいて重要な役割を担い、人間とコンピュータの相互作用、感情コンピューティング、メンタルヘルスモニタリングやパーソナライズされた学習環境などの分野に重要な応用がある。
FERタスクにおける大きな課題は、利用可能なデータセットで一般的に見られるクラス不均衡であり、モデルパフォーマンスと一般化の両方を妨げる可能性がある。
我々は、合成データ拡張とResEmoteNetモデルを活用して、顔の感情認識タスクにおける全体的なパフォーマンスを向上させることで、データ不均衡の問題に取り組む。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:01:50 GMT)
Simulating and investigating various dynamic aspects of $\rm{H}_2\rm{O}$-related hydrogen bond model [2.1] Jaynes-Cummingsモデルから修正した単純な$rmHrmO$関連水素結合モデルを提案する。
水素結合の形成と破断過程は、媒体の熱フォノンの生成と消滅を伴う。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:03:46 GMT)
Is Value Functions Estimation with Classification Plug-and-play for Offline Reinforcement Learning? [1.9] 深層強化学習(RL)では、値関数はディープニューラルネットワークを用いて近似され、平均2乗誤差回帰目標を用いて訓練される。
近年の研究では、クロスエントロピー分類の目的を活かした代替手法が提案されている。
我々の研究は、オフラインのRLセットアップにおけるそのような置換の影響を実証的に調査することを目指している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:03:22 GMT)
RadFlag: A Black-Box Hallucination Detection Method for Medical Vision Language Models [1.8] 我々はラジオロジーレポート生成の精度を高めるブラックボックス手法であるRadFlagを紹介した。
本手法では, 除去すべき幻覚世代を見つけるために, サンプリングベースのフラグング手法を用いる。
本手法は,個々の幻覚文と幻覚を含む報告を識別する際に高い精度を達成する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:37:48 GMT)
Segmentation of Ink and Parchment in Dead Sea Scroll Fragments [1.8] 本稿では,デッドシースクロール断片のマルチスペクトル画像におけるインク領域とパーチメント領域の分画計算手法を提案する。
新たに開発された20個の断片からなるQumranデータセットを用いて,その特異なスペクトルシグネチャに基づいて,インク領域とパーチメント領域を分離するためにマルチスペクトルしきい値を適用した。
セグメンテーションの精度を向上するために,インクの輪郭を利用したエネルギー最小化手法を導入する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:06:41 GMT)
EEG-Driven 3D Object Reconstruction with Style Consistency and Diffusion Prior [1.7] 本稿では,脳波を用いた3次元オブジェクト再構成手法を提案する。
実験により,この手法は脳波データを効果的に利用して3次元オブジェクトをスタイル整合性で再構築できることが実証された。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:08:36 GMT)
AI-Empowered Human Research Integrating Brain Science and Social Sciences Insights [1.7] 我々は、研究者が人間-AI共同研究に移行する時期は高いと論じている。
我々は、AIを研究ツール(ART)、AIを研究アシスタント(ARA)、AIを研究参加者(ARP)という3つの人間とAIのコラボレーションモデルを紹介する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:13:23 GMT)
SwiftBrush: One-Step Text-to-Image Diffusion Model with Variational Score Distillation [1.6] テキストと画像の拡散モデルは、しばしば遅い反復的なサンプリングプロセスに悩まされる。
我々は$textbfSwiftBrush$という新しいイメージフリー蒸留方式を提案する。
SwiftBrushは、COCO-30Kベンチマークで、$textbf16.67$のFIDスコアと$textbf0.29$のCLIPスコアを達成している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:48:41 GMT)
Error-mitigated initialization of surface codes with non-Pauli stabilizers [1.6] 非パウリ安定化器を組み込むことにより,従来の曲面符号の性能を向上させる。
格子手術法を用いて,非パウリ基底とパウリ基底の論理量子ビットを絡み合わせる能力を示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:23:00 GMT)
Insights and Current Gaps in Open-Source LLM Vulnerability Scanners: A Comparative Analysis [1.5] 本稿では,対話型大規模言語モデル(LLM)のためのオープンソースの脆弱性スキャナの比較分析を行う。
我々の研究は、脆弱性を公開するために赤いチームのプラクティスを適用する著名なスキャナー、Garak、Giskard、PyRIT、CyberSecEvalを評価した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:48:19 GMT)
State-Constrained Optimal Control for Coherence Preservation in Multi-Level Open Quantum Systems [1.5] 本稿では,Lindbladマスター方程式をモデルとしたマルチレベルシステムにおける量子コヒーレンスの最適制御について述べる。
状態間のコヒーレンスを保ちながら、クォート(3レベル)量子系の進化を制御するためのエネルギー最小化フレームワークを開発する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:53:56 GMT)
Deep models for stroke segmentation: do complex architectures always perform better? [1.5] ストロークセグメンテーションは脳卒中患者の診断と治療において重要な役割を担っている。
一般的な医用画像分割のためのディープモデルが導入された。
本研究では,最近提案された4種類の深部モデルを選択し,脳卒中セグメンテーションの性能評価を行った。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:01:08 GMT)
Large Language Models are Null-Shot Learners [1.4] Null-shot promptingは大規模言語モデル(LLM)における幻覚を悪用する
通常のゼロショットプロンプトと比較して,幻覚を利用してタスクの実行性能を向上させることができることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:23:20 GMT)
NSTRI Global Collaborative Research Data Platform [1.2] このプラットフォームはセキュアな研究ポッドアーキテクチャ内でコンテナ化された環境を実装している。
プラットフォームは現在、SNUHから10の異なる医療データセットへのアクセスを提供している。
このインフラは、厳格なデータ保護標準を維持しながら、グローバルな共同医療研究を可能にする。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:13:54 GMT)
KyrgyzNLP: Challenges, Progress, and Future [1.2] 大規模言語モデル(LLM)は多くのベンチマークで優れており、言語的タスクと非言語的タスクの両方においてAIアプリケーションを進歩させている。
これは主に、リソースの少ない言語(LRL)を不利な状態にしておくことで、十分なリソースを持つ言語に利益をもたらしている。
本稿では,特定のLRL:Kyrgyz tiliにおけるNLPフィールドの現状について述べる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:53:07 GMT)
HJ-Ky-0.1: an Evaluation Dataset for Kyrgyz Word Embeddings [1.2] 本研究はキルギス語で単語ベクトル表現を構築するための最初の「銀標準」データセットを紹介する。
対応するモデルをトレーニングし、品質評価指標を通じてデータセットの適合性を検証します。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:14:32 GMT)
Poster: Reliable 3D Reconstruction for Ad-hoc Edge Implementations [1.2] マルチビュー3D再構成のようなリアルタイム複雑なビデオ処理アプリケーションをサポートするアドホックなデプロイメントは、エッジシステムの破壊に悩まされることが多い。
本稿では,ポートフォリオ理論にインスパイアされた資源管理戦略を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 05:17:27 GMT)
Unified monogamy relations for the generalized $W$-class states beyond qubits [1.1] 我々は、統一-($q,s$)絡み合い(UE)に基づいて、一般化された$W$クラス(GW)状態の分割に関するモノガミー関係を研究する。
我々は、キューディットGW状態の還元密度行列に対して、平方UEに基づくモノガミー関係と、UEの$alpha$th(alphageq2$)パワーに基づくより厳密なモノガミー関係を提供する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:44:50 GMT)
Nonlinear optical pumping to a diamond NV center dark state [1.0] 我々は、NVの読み出しを劣化させる発光のクエンチングが、一般に完全には理解されていない暗黒状態であることを示す。
ナノスケールキャビティを用いて、NVが非非線形に放出する強い赤外線場を磁場強度とともに生成し、暗黒状態が中性荷電NVの4A$四重項状態に2光子励起によってアクセスされることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 00:11:26 GMT)
Collective field theory of gauged multi-matrix models: Integrating out off-diagonal strings [1.0] 得られた(2+1)次元の集合体作用が非局所性に関して新しい特徴を持つことを示す。
1 つの行列量子力学的集合体は、適切な極限でハミルトニアンを回復する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:25:03 GMT)
Fine Tuning Swimming Locomotion Learned from Mosquito Larvae [0.9] 本研究では, 蚊幼虫の後方泳動を解析し, パラメータ化し, 計算流体力学(CFD)モデルで再現した。
本稿では,スイマーのモデルに対して,このコピーソリューションをさらに最適化する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:54:43 GMT)
Enhancing PTSD Outcome Prediction with Ensemble Models in Disaster Contexts [0.9] 外傷後ストレス障害(PTSD)は、外傷性事象に曝される個人に影響を与える重要な精神疾患である。
PTSDの早期発見と効果的な介入は、治療を受けなければ長期の心理的苦痛につながる可能性があるため、極めて重要である。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 01:44:43 GMT)
Symmetry-protected Landau-Zener-Stückelberg-Majorana interference and non-adiabatic topological transport of edge states [0.9] 本研究では,Landau-Zener-St"uckelberg-Majorana(LZSM)干渉をカイラルミラー様対称性下で研究する。
我々の研究は、非断熱的トポロジカルトランスポートによる量子制御、量子状態移動、および量子通信を研究する別の方法を明らかにする。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 09:14:00 GMT)
Memetic Differential Evolution Methods for Semi-Supervised Clustering [0.9] MDEClustの半教師付き最小二乗クラスタリング(MSSC)問題に対する拡張を提案する。
我々の新しいフレームワークであるS-MDEClustは、最適な実現可能なソリューションを生成するために設計された最初のメメカティックな方法論である。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 09:03:05 GMT)
Efficient generative adversarial networks using linear additive-attention Transformers [0.8] 本稿では,Ladaformer という線形アテンショントランスフォーマーブロックに基づく新しい GAN アーキテクチャを提案する。
LadaGANは、さまざまな解像度のベンチマークデータセットにおいて、既存の畳み込みGANとTransformer GANを一貫して上回る。
LadaGANは、最先端のマルチステップ生成モデルと比較して、競争性能を示している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:16:42 GMT)
Transforming Teacher Education in Developing Countries: The Role of Generative AI in Bridging Theory and Practice [0.7] この研究はガーナに焦点を当てており、限られた教育モデル、パフォーマンスベースアセスメント、実践者と実践者のギャップといった課題が進歩を妨げる。
GenAIは、コンテンツ知識獲得の支援により、これらの課題に対処する能力を持っている。
この研究は、これらの役割をさらに探求するための実証的研究を推奨し、教員教育システムにGenAIを統合するための実践的なステップを効果的に発展させることで結論付けられた。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:46:09 GMT)
Education in the Era of Neurosymbolic AI [0.6] 我々は,ハイブリッドNAIアーキテクチャの重要な構成要素として,教育エージェントの独特な余裕を生かしたシステムを提案する。
我々は,NAI時代の教育によって,学習がよりアクセスしやすく,公平で,現実世界のスキルに適合するものになると結論づける。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:18:39 GMT)
Improving training time and GPU utilization in geo-distributed language model training [0.6] ATLASとBUBBLETEAはトレーニング時間を最大17倍改善し、GPU使用率を最大94%向上させる。
我々は、ワイド・エリア・ネットワーク(WAN)を介して接続された複数のDCでそのようなモデルをトレーニングすることに注力する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 10:15:01 GMT)
Attention-based U-Net Method for Autonomous Lane Detection [0.5] 本研究では,ディープラーニングに基づく2つのレーン認識手法を提案する。
最初の方法はFPN(Feature Pyramid Network)モデルを用いており、道路車線検出の精度は87.59%である。
注意層をU-Netモデルに組み込んだ第2の手法はセマンティックセグメンテーションタスクの性能を大幅に向上させる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 22:20:11 GMT)
Precision or Peril: Evaluating Code Quality from Quantized Large Language Models [0.5] 量子化は、大規模言語モデルのメモリオーバーヘッドを軽減する手段として登場した。
本研究の目的は、様々なメトリクスを用いて、より小さなLCMのコード生成能力を評価することである。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 01:31:29 GMT)
Automatic Discovery and Assessment of Interpretable Systematic Errors in Semantic Segmentation [0.5] 本稿では,セグメンテーションモデルにおける体系的誤りを発見するための新しい手法を提案する。
マルチモーダル・ファンデーション・モデルを用いてエラーを検索し、誤った性質とともに概念的リンクを用いてこれらのエラーの体系的性質を研究する。
我々の研究は、これまでセマンティックセグメンテーションで過小評価されてきたモデル分析と介入への道を開く。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:31:37 GMT)
SugarcaneNet: An Optimized Ensemble of LASSO-Regularized Pre-trained Models for Accurate Disease Classification [0.5] サトウキビNet2024は、サトウキビ病を自動的にかつ迅速に検出する従来の方法よりも優れたユニークなモデルである。
提案モデルは、7つのカスタマイズおよびLASSO正規化事前学習モデルの最適化された平均アンサンブルを集約する。
この最適化されたサトウキビNet2024モデルは、精度、精度、リコール、F1スコアの99.67%、100%、100%、100%を達成し、サトウキビ病の診断に最適であった。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:36:01 GMT)
Self-Attention Limits Working Memory Capacity of Transformer-Based Models [0.5] Transformerベースの大規模言語モデル(LLMs)に関する最近の研究は、ワーキングメモリ容量の大幅な制限を明らかにしている。
具体的には、これらのモデルの性能は N が増加するにつれて N-back タスクに著しく低下する。
行動科学からエグゼクティブ・アテンション理論に触発された我々は、自己認識メカニズムが作業記憶能力の限界に寄与するかもしれないと仮説を立てた。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:50:11 GMT)
Exact Quantum Trace Formula from Complex Periodic Orbits [0.5] トレース式の全量子バージョンをLefschetz thimble法を用いて探索する。
我々の重要な革新はサイクル周期の同時複雑化であり、結果として完全に量子トレース公式が導かれる。
この定式化は、量子スペクトルをすべての複雑な時間方向への寄与に結び付け、関連するすべてのホモロジークラスを包含する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:58:24 GMT)
Efficient symmetric and asymmetric Bell-state transfers in a dissipative Jaynes-Cummings model [0.4] 我々は,Jaynes-Cummingsモデル内のシステムパラメータを変調することにより,効率的な対称および非対称なベル状態遷移を示す。
例外点(EP)が存在しない場合でも、完全不斉ベル状態移動がさらに達成される。
本研究は, NH系における散逸工学を通して, 対称特性と非対称特性の両立状態の効果的かつ確実な操作方法を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:23:00 GMT)
Vision-Language Modeling with Regularized Spatial Transformer Networks for All Weather Crosswind Landing of Aircraft [0.4] 気象によって引き起こされる視覚劣化をクリアするために訓練された視覚ベースのシステムは、様々な気候条件下で堅牢な着陸データセットを必要とする。
本稿では,迅速な気候拡散ネットワークを訓練し,厳しい気象画像の合成を提案する。
また、新しい拡散蒸留損失を用いた気象蒸留モデルの最適化を行い、これらの視覚的劣化を解明する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:49:53 GMT)
The Intersectionality Problem for Algorithmic Fairness [0.4] 断続性(Intersectionality)は、複数の群の交叉における公平性を達成する問題である。
本稿では,問題の根底にある課題を明らかにするためにデシラタを開発し,潜在的な解の探索を指導する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 01:11:26 GMT)
X-arability of mixed quantum states [0.4] 我々は, X-arability と呼ばれる分離性の概念を統一的に研究する。
純粋な状態 X の部分集合について、混合量子状態が X の凸包にある場合、X-アーブルであると述べる。
我々は、統一ツールを開発し、X-arabilityの保証を保証します。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 18:04:49 GMT)
Empathic Coupling of Homeostatic States for Intrinsic Prosociality [0.3] ホメオスタティック・セルフレギュレーションによる自律エージェントの社会的行動の出現について検討した。
本研究は, 社会的行動に資する人工エージェントにおける共感のタイプと役割を明らかにした。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 13:30:01 GMT)
Two-stroke thermal machine using spin squeezing operation [0.0] そこで本研究では,スピンスクイズ効果が本態的にスイッチオンされる2ストロークサイクルについて検討した。
スピンスクイーズ効果が大きいほど、エネルギーベースでのコヒーレンス量が大きくなることを示す。
この結果から, サイクル中のエントロピー生成量に直接関連している常オンスピンスクイーズを仮定しても, より優れた効率のセットを見つけることが可能であることが示唆された。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:45:27 GMT)
Towards a Generic Software Architecture for IoT Systems [0.0] 従来のソフトウェアアーキテクチャは、IoTシステムの要件に対処できない。
本稿では,IoTシステム開発のための品質特性駆動型ソフトウェアアーキテクチャの基礎を概説する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:39:53 GMT)
Towards Exploring Fairness in Visual Transformer based Natural and GAN Image Detection Systems [0.0] 本研究では、自然画像とGAN画像を分類する視覚変換器に基づく画像法科学アルゴリズムのバイアスについて検討する。
提案研究は, 性別, 人種, 感情, 交叉領域の偏見を解析するために, 偏見評価コーパスを取得する。
また、画像圧縮がモデルバイアスに与える影響を分析する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:40:06 GMT)
SupplyGraph: A Benchmark Dataset for Supply Chain Planning using Graph Neural Networks [0.0] グラフニューラルネットワーク(GNN)は、輸送、バイオインフォマティクス、言語処理、コンピュータビジョンなど、さまざまな領域で注目を集めている。
サプライチェーンネットワークは本質的にグラフのような構造であり、GNN方法論を適用するための主要な候補となる。
このアプローチの大きな欠点は、GNNを用いたサプライチェーン問題の研究と解決を容易にするために、実世界のベンチマークデータセットが存在しないことである。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:54:05 GMT)
Series Expansion of Probability of Correct Selection for Improved Finite Budget Allocation in Ranking and Selection [0.0] 限られたシミュレーション予算の下でのPCS近似は、有限サンプル設定において精度を欠く可能性がある。
本稿では, 最適条件を逐次推定し, サンプリング比のバランスをとる, 新たな有限予算割当政策を提案する。
拡張として、低信頼シナリオの文献に記述されている非単調なPCS挙動は、PCS近似における同時的不正確なバイナリ比較の無視に起因する可能性があることに留意する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:26:19 GMT)
See-Saw Generative Mechanism for Scalable Recursive Code Generation with Generative AI [0.0] 本稿では,動的かつ反復的なコード生成手法であるSee-Saw生成機構を紹介する。
提案されたアプローチは、アライメントと機能を保証するために、メインコード更新と依存性生成を交互に行う。
このメカニズムにより、すべてのコードコンポーネントが同期化され、機能し、スケーラブルで効率的なプロジェクト生成を可能にする。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 18:54:56 GMT)
SFA-UNet: More Attention to Multi-Scale Contrast and Contextual Information in Infrared Small Object Segmentation [0.0] 赤外線小オブジェクト(ISOS)は、いくつかの課題のために、依然として大きな焦点をあてています。
Scharr Convolution (SC) と Fast Fourier Convolution (FFC) を組み合わせることで,垂直および水平のアテンションゲート (AG) を UNet に組み込むことにより,SFA-UNet という改良されたU-Netアーキテクチャを提案する。
SCは、背景から背景までのコントラスト情報を学ぶのに役立ち、FFCは、小さなオブジェクトが消える問題を緩和しながら、マルチスケールのコンテキスト情報を提供する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:10:33 GMT)
Room-temperature amplified transduction of infrared to visible photons [0.0] 本研究では,3レベルのLambda$系のバリウム原子を用いて,1500nmの光子から53nmの光子の室温での変換実験を行った。
自由空間で行った実験では、可視光子を増幅することができ、内部効率は1.49で、ユニティを上回った。
この研究は、異なるエネルギーレベルでの量子デバイスの統合と、効率的な赤外線光子検出器の開発に向けた一歩である。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 02:53:21 GMT)
Robust Learning for Optimal Dynamic Treatment Regimes with Observational Data [0.0] 本研究では,各段階における各個人に対する最適な治療課題を,個人の進化史に基づいて導くための最適動的治療体制(DTR)の統計的学習について検討する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:41:53 GMT)
Qurts: Automatic Quantum Uncomputation by Affine Types with Lifetime [0.0] Uncomputationは、プログラマが量子情報を失うことなく値を捨てることができる量子プログラミングの機能である。
Rustの型システムを拡張して、Qurtsと呼ばれる自動非計算のための統一的なフレームワークを提供します。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:34:08 GMT)
Quasicrystal Scattering and the Riemann Zeta Function [0.0] 原子の有限長1次元点状配列である$chi(x)$に対して、原子密度をほぼ一定にするシフト演算により、素数の分布に関連する数値散乱計算を行う。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:41:43 GMT)
Quantum sensing in Kerr parametric oscillators [0.0] 本稿では,Kerrパラメトリック発振器の古典的極限の位相空間構造の解析を用いて制御パラメータを決定する方法を示す。
また、従来の量子相転移が存在しない場合でも、励起状態の量子相転移による量子センシングのメリットについても検討する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:49:28 GMT)
Quantum chaos and macroscopic realism as no-signaling in time [0.0] 本稿では, マクロ的リアリズムの違反に対する正規力学とカオス力学の影響を考察する。
我々は,3点の時間外相関器と測定条件の確率との密接な関係を観察し,マクロリアリズムの違反に対するカオスの無意味なインプリントを見いだした。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:57:26 GMT)
Quantum Engines and Refrigerators [0.0] エンジンは、ある形態のエネルギーを別の形態に変換するシステムや装置であり、通常、作業を行うことができるより有用な形式へと変換する。
しかし、量子状態においては、量子現象が作用するため、エネルギー変換の原理は曖昧になる。
我々の研究は、量子エンジンと冷蔵庫のこの活発な分野を概観し、最新の理論的提案と実験的実現をレビューしている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 15:07:30 GMT)
Quantum Buffer Design Using Petri Nets [0.0] これはプリミティブストレージ要素、すなわち量子CNOTとSWAPゲートを用いた量子S-Rフリップフロップ設計を提供する。
上記の量子バッファは、単純化されたQPNモデルと量子レジスタを用いて得られる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:41:38 GMT)
QUTE: Quantifying Uncertainty in TinyML with Early-exit-assisted ensembles for model-monitoring [0.0] 不確実性定量化(UQ)は、真のラベルにアクセスせずにデプロイされた小さなMLモデルのオンデバイス監視のためのリソース効率の高いソリューションを提供する。
QUTEは,資源効率の優れた早期終了支援型アンサンブルアーキテクチャであり,最適化された小型MLモデルのためのアーキテクチャである。
QUTEは、より小さなモデルに対して優れた不確実性を提供し、最も近い作業よりも59%小さいモデルサイズで、より大きなモデルで同等のパフォーマンスを実現する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:34:58 GMT)
Pilot-wave theory and the search for new physics [0.0] 我々は、パイロット波理論が量子力学以外の新しい物理学をどう指しているのかを示す。
我々は、ボルン規則から外れた一般化された宇宙の初期条件が、観測可能な異常を引き起こすことを示す。
深い量子重力状態におけるボルン則の崩壊は、半古典的に不安定なボルン則を生じる重力補正によって、蒸発するブラックホールからホーキング放射の異常を引き起こす。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:55:41 GMT)
Monolithic Hybrid Recommender System for Suggesting Relevant Movies [0.0] 本稿では,視聴映像のシーケンスと関連映画の視聴率を考慮した協調フィルタリングの2つの手法について考察する。
用途に応じて様々な重みが設定される。
この問題を解決するための文献と方法論のアプローチについて論じられた。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 20:41:17 GMT)
Local Operations in Multiparty Quantum Systems [0.0] マルチパーティシステムでは、一方の当事者によって局所的な操作が行われ、その結果が他方の当事者に伝達される。
任意の操作が任意のパーティによってシミュレート可能であることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 05:52:31 GMT)
LoRA Unlearns More and Retains More (Student Abstract) [0.0] PruneLoRAは、モデルに低ランクの更新を適用することで、大規模なパラメータ更新の必要性を減らす。
そこで我々はLoRAを利用してプルーンドモデルのパラメータのサブセットを選択的に修正し、計算コスト、メモリ要件を低減し、残りのクラスの性能を維持するモデルの能力を向上させる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:47:57 GMT)
Large Vision-Language Models for Remote Sensing Visual Question Answering [0.0] リモートセンシング視覚質問回答(RSVQA)は、複雑な衛星画像の自然言語質問への答えを解釈する難しいタスクである。
伝統的なアプローチは、しばしば別々の視覚特徴抽出器と言語処理モデルに依存しており、計算集約的で、オープンエンドの質問を扱う能力に制限がある。
RSVQAプロセスの合理化にLVLM(Large Vision-Language Model)を用いた新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 18:32:38 GMT)
LLM4DS: Evaluating Large Language Models for Data Science Code Generation [0.0] 本稿では、Microsoft Copilot(GPT-4 Turbo)、ChatGPT(o1-preview)、Claude(3.5 Sonnet)、Perplexity Labs(Llama-3.1-70b-instruct)の4つの主要なAIアシスタントの性能を実証的に評価する。
すべてのモデルが50%の成功率を超え、ランダムなチャンスを超えた能力が確認された。
ChatGPTは様々な難易度で一貫した性能を示し、クロードの成功率はタスクの複雑さによって変動した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 18:43:26 GMT)
Integrated Machine Learning and Survival Analysis Modeling for Enhanced Chronic Kidney Disease Risk Stratification [0.0] 慢性腎疾患(CKD)は公衆衛生上の重要な課題であり、早期に発見・管理されていない場合、しばしばエンドステージ腎疾患(ESRD)へと進行する。
本稿では,機械学習技術と古典統計モデルを組み合わせて,CKDの進行をモデル化する手法を提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 09:22:06 GMT)
Influence of Solution Efficiency and Valence of Instruction on Additive and Subtractive Solution Strategies in Humans and GPT-4 [0.0] 本研究では,空間的タスクと言語的タスクの双方において,人間とGPT-4の問題解決を比較した。
588人の米国からの参加者と680人のGPT-4の反復による4つの実験では、GPT-4の付加的な変換は人間よりも強い傾向を示した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:09:11 GMT)
Hidden nonlinear optical susceptibilities in linear polaritonic spectra [0.0] マイクロキャビティ光子モードに結合した$N$分子によって形成される分子偏光子の線形スペクトルは通常、古典的な線形光学によってよく説明される。
真空を媒介とする分子ラマン過程により、これまで見過ごされていた有限サイズの量子補正を明らかにする偏光性線形スペクトルの一般式を導出する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 08:30:07 GMT)
FlowScope: Enhancing Decision Making by Time Series Forecasting based on Prediction Optimization using HybridFlow Forecast Framework [0.0] 時系列予測は気象学、小売、医療、金融などいくつかの分野において重要である。
本稿では,時系列データを予測するための汎用的で堅牢なプラットフォームであるFlowScopeを提案する。
これにより、企業に対して、インフォームドな意思決定と、パフォーマンスの最大化のための長期的な戦略を最適化することが可能になる。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 06:25:30 GMT)
Exploring the Strongly-Interacting Regime of Effective Multi-Body Interactions in a Trapped Ultracold Atom System [0.0] 深部光学格子に密閉された超低温ボソンからなる数体システムについて検討した。
強相互作用状態における少数原子系の挙動を実験的に明らかにする。
この研究は、強く相互作用するメソスコピック・ボース・ポーラロン問題と重要な関係を深く理解するための重要な第一歩である。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:57:39 GMT)
Evolution of IVR building techniques: from code writing to AI-powered automation [0.0] 本稿では,建築技術の進化を探求し,産業の革命とシステムの未来を立案する。
著者らは、歴史的状況、現在のトレンド、そして将来の開発展望を掘り下げ、AIが創造プロセスの簡素化と顧客エクスペリエンスの向上に与える影響を解明した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 21:47:10 GMT)
Eventually entanglement breaking divisible quantum dynamics [0.0] 本稿では, 最終的に絡み合う破壊的力学(eEB-divisible dynamics)の新たな概念を提案する。
eEBの可分性は非常に一般的であり、量子進化の大規模なクラスを保っていることが判明した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 10:44:25 GMT)
Enhancing Predictive Maintenance in Mining Mobile Machinery through a TinyML-enabled Hierarchical Inference Network [0.0] 本稿では,予測保守のためのエッジセンサネットワーク(ESN-PdM)を紹介する。
ESN-PdMはエッジデバイス、ゲートウェイ、クラウドサービスにまたがる階層的推論フレームワークで、リアルタイムな状態監視を行う。
システムは、正確性、レイテンシ、バッテリー寿命のトレードオフに基づいて、デバイス、オンゲートウェイ、あるいはクラウド上の推論位置を動的に調整する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:41:25 GMT)
Enhanced FIWARE-Based Architecture for Cyberphysical Systems With Tiny Machine Learning and Machine Learning Operations: A Case Study on Urban Mobility Systems [0.0] モビリティコンピューティングは、リアルタイム要求、分散化、および無線ネットワークを介した接続性のために、特定の障壁を提示する。
エッジコンピューティングと小さな機械学習(tinyML)に関する新しい研究は、これらの問題に対処するために、低パフォーマンスデバイス上でAIモデルの実行を調査している。
本稿では、FIWAREソフトウェアコンポーネントに基づく以前のアーキテクチャを拡張し、機械学習操作フローを実装する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 13:14:29 GMT)
Decoherence control of a single-photon optomechanical system in phase-sensitive reservoirs [0.0] 本研究は, 強い結合状態下でのキャビティフォトンフォック状態の脱コヒーレンスに及ぼす真空・熱貯留層の影響について検討した。
発見は、量子デコヒーレンスを正確に制御するための貯水池工学における重要な洞察を与える。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 12:51:36 GMT)
Decision Machines: Congruent Decision Trees [0.0] 本稿では,ブール試験を二進ベクトル空間に埋め込み,木構造を行列として表現する決定機械を提案する。
我々は,決定木と注意機構の一致を探求し,決定木を最適化し,予測力を増強するための新たな道を開く。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 05:22:37 GMT)
Data Science for Geographic Information Systems [0.0] データサイエンスを地理情報システムに統合することで、これらのツールの完全な空間分析プラットフォームへの進化が促進された。
機械学習とビッグデータ技術の採用により、これらのプラットフォームはますます複雑なデータを扱う能力を備えてきた。
この研究は、研究分野としてのデータサイエンスとGISの歴史的・技術的進化を辿り、ドメイン間の収束の要点を浮き彫りにしている。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 15:16:18 GMT)
DEBUG-HD: Debugging TinyML models on-device using Hyper-Dimensional computing [0.0] TinyMLモデルは、クラウド接続なしでリモートで動的環境で動作するため、障害が発生しやすい。
超次元コンピューティング(HDC)を利用したKBサイズの小型MLデバイス向けに最適化された,リソース効率の高い新しいオンデバイスデバッグ手法である-HDを提案する。
提案手法では,従来のニューラルネットワークを応用した新しいHDC符号化手法を導入し,様々な画像および音声データセットの入力汚損検出において,HDC法を平均で27%上回る性能を実現した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 04:03:22 GMT)
Compatibility of Quantum Measurements and the Emergence of Classical Objectivity [0.0] 汎用マルチパーティイトシステムの解離成分に関する任意の測定値の集合を記述するKDQ分布について考察する。
系力学はこれらの分布が古典的であることを保証し、ハミルトニアンが量子ダーウィン主義を支持する場合に限ることを示す。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:01:30 GMT)
Combining Squeezing and Transition Sensitivity Resources for Quantum Metrology by Asymmetric Non-Linear Rabi model [0.0] このような組み合わせは、実現可能な非対称量子ラビモデル(QRM)による光-物質相互作用において実現可能であることを示す。
この研究は、異なる感度資源を組み合わせてQMを操作し、MPを最大化するパラダイム的なケースを確立する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:55:50 GMT)
Characterizing Noise of Driven Controlled Field Using the Central Spin Model [0.0] 我々は、時間依存ノイズ磁場を持つスピン鎖に結合した中心スピンのコヒーレンスダイナミクスを解析する。
その結果, 環境の非平衡臨界ダイナミクスによるデコヒーレンシは, 非相関ノイズと相関ノイズの存在下で増幅されることがわかった。
本研究は,外部信号のノイズスペクトロスコピーに応用できる可能性が示唆された。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 11:49:09 GMT)
Browser Extension for Fake URL Detection [0.0] 本稿では、機械学習モデルを用いてオンラインセキュリティを強化するBrowser Extensionを提案する。
提案手法はPhishing Webサイトの分類にLGBM分類器を用いる。
スパムメール検出のためのModel for Spamは、5500以上のメッセージを持つデータセットでトレーニングされたマルチノードNBアルゴリズムを使用している。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 07:22:59 GMT)
Bridging Classical and Quantum: Group-Theoretic Approach to Quantum Circuit Simulation [0.0] 量子回路を量子コンピュータ上で効率的にシミュレーションすることは、量子コンピューティングの根本的な課題である。
本稿では,既存のシミュレータ上での指数的高速化(ポリノミカルランタイム)を実現する新しい理論手法を提案する。
この発見は、量子アルゴリズムの設計、誤り訂正、より効率的な量子シミュレータの開発に影響を及ぼす可能性がある。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 14:47:25 GMT)
Bilingual Text-dependent Speaker Verification with Pre-trained Models for TdSV Challenge 2024 [0.0] 本稿は、TdSV(Text-dependent Speaker Verification Challenge)2024のイラン分科会に提出する。
TdSVは、特定のフレーズがターゲット話者によって話されたかどうかを決定することを目的としている。
フレーズ検証では、不正確なフレーズを拒否するフレーズと、話者検証では、ドメイン適応型話者埋め込みを抽出した事前訓練されたResNet293が使用される。
Whisper-PMFAは、話者検証に適応した事前訓練されたASRモデルであり、事前訓練されたResNetの性能に劣る。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 15:53:03 GMT)
Bayesian Quantile Regression with Subset Selection: A Decision Analysis Perspective [0.0] 量子回帰は、共変量が応答分布の特定のパーセンタイルにどのように影響するかを推測する強力なツールである。
既存の方法では、興味のある各量に対して個別に条件量子を推定するか、半パラメトリックモデルまたは非パラメトリックモデルを用いて条件分布全体を推定する。
本研究では,線形定量推定,不確実性定量化,およびベイズ決定解析の観点からのサブセット選択の基本的問題を提起する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 19:01:43 GMT)
Asymptotically optimal synthesis of reversible circuits [0.0] 任意の$n$wire回路を$ (2n n/log n)$小ゲートで実装するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 03:56:47 GMT)
Adaptive Learning of Design Strategies over Non-Hierarchical Multi-Fidelity Models via Policy Alignment [0.0] 多要素強化学習フレームワークは、精度と計算コストの異なる分析モデルを活用することにより、エンジニアリング設計の効率を高める。
ALPHAは、高忠実度モデルとともに、任意の非階層的で不均一な低忠実度モデルの集合を適応的に活用することにより、高忠実度ポリシーを効率的に学習する新しい多忠実度RLフレームワークである。
ALPHAの有効性は、高忠実度モデルと2つの低忠実度モデルを用いて、分析的テスト最適化とオクトコプター設計問題において実証される。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 16:54:33 GMT)
A hierarchy of eigencomputations for polynomial optimization on the sphere [0.0] 単位球面上の実形式の最小値に下界の収束階層を導入する。
実和-二乗階層に対する我々の階層の主な実用的利点は、各レベルの下限が最小の固有値によって得られることである。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 18:01:30 GMT)
A SysML-based language for evaluating digital twin software reusability in cyber-physical system structure [0.0] 本稿では,SysMLに基づくシミュレート・物理システムモデリング言語(SPSysML)を紹介する。
サイバー物理システムにおけるコンポーネント再利用性を評価するためのドメイン仕様言語である。
提案した因子は設計を定量的に評価する。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:01:49 GMT)
A Robust Image Forensic Framework Utilizing Multi-Colorspace Enriched Vision Transformer for Distinguishing Natural and Computer-Generated Images [0.0] 本稿では、リッチな視覚変換器を利用して、自然画像と生成画像の区別を行う頑健な法科学分類手法を提案する。
提案手法は,各クラスの評価において,94.25%の検定精度と有意な性能向上を示す。
この研究は、自然な画像と生成された画像を区別する汎用的でレジリエントなソリューションを提供することにより、画像鑑定の最先端を推し進める。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:13:38 GMT)
A Regularized LSTM Method for Detecting Fake News Articles [0.0] 本稿では,偽ニュース記事を検出するための高度な機械学習ソリューションを開発する。
我々は、23,502の偽ニュース記事と21,417の正確なニュース記事を含む、包括的なニュース記事のデータセットを活用している。
私たちの研究は、そのようなモデルを現実世界のアプリケーションにデプロイする可能性を強調しています。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 05:54:36 GMT)
A Novel Adaptive Hybrid Focal-Entropy Loss for Enhancing Diabetic Retinopathy Detection Using Convolutional Neural Networks [0.0] 糖尿病網膜症に対するAHFE(Adaptive Hybrid Focal-Entropy Loss)を提案する。
AHFEは、焦点損失とエントロピー損失のアイデアと適応重み付けを組み合わせて、少数派に焦点を合わせる。
AHFEによる糖尿病網膜症検出に応用した最先端の術式では,良好な成績を示した。
論文参考訳(メタデータ) (Sat, 16 Nov 2024 17:07:53 GMT)