Learning to Generalize Unseen Domains via Multi-Source Meta Learning for Text Classification [71.1] テキスト分類の多元的領域一般化について検討する。
本稿では、複数の参照ドメインを使用して、未知のドメインで高い精度を達成可能なモデルをトレーニングするフレームワークを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 07:46:21 GMT)
Unlocking Memorization in Large Language Models with Dynamic Soft Prompting [66.5] 大規模言語モデル(LLM)は、要約、質問応答、翻訳などの自然言語処理(NLP)タスクに革命をもたらした。
LLMはトレーニングデータを記憶する傾向があるため、重大なセキュリティリスクを生じ、プライバシー侵害や著作権侵害につながる可能性がある。
動的,プレフィックスに依存したソフトプロンプトを用いたLLM記憶推定手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 18:56:32 GMT)
Generating Visual Stories with Grounded and Coreferent Characters [63.1] 本稿では,一貫した接地的・中核的な特徴を持つ視覚的ストーリーを予測できる最初のモデルを提案する。
我々のモデルは、広く使われているVISTベンチマークの上に構築された新しいデータセットに基づいて微調整されています。
また、物語における文字の豊かさとコア参照を測定するための新しい評価指標を提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:56:33 GMT)
Exploring and Enhancing the Transfer of Distribution in Knowledge Distillation for Autoregressive Language Models [62.6] 知識蒸留(KD)は、より小さな学生モデルを模倣するように訓練することで、大きな教師モデルを圧縮する技術である。
本稿では、教師ネットワークが小さなオンラインモジュールを統合し、学生モデルと同時学習するオンライン知識蒸留(OKD)について紹介する。
OKDは、様々なモデルアーキテクチャやサイズにおけるリードメソッドのパフォーマンスを達成または超え、トレーニング時間を最大4倍に短縮する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:35:45 GMT)
TG-LLaVA: Text Guided LLaVA via Learnable Latent Embeddings [61.9] 視覚言語モデル(VLM)を最適化するためのテキストガイド付きLLaVA(TG-LLaVA)を提案する。
学習可能な潜伏埋め込みをブリッジとして使用し、テキスト命令を分析し、視覚エンコーダに解析結果をガイダンスとして付加する。
テキストのガイダンスによって、視覚エンコーダは、人間が質問を考えるとき、画像の最も関連性の高い部分に集中する方法と同様に、テキスト関連の特徴を抽出することができる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:51:18 GMT)
ID-Guard: A Universal Framework for Combating Facial Manipulation via Breaking Identification [60.7] 深層学習に基づく顔操作の誤用は、公民権に対する潜在的な脅威となる。
この不正行為を防ぐため、プロアクティブな防御技術が提案され、操作プロセスを妨害した。
我々は,ID-Guardと呼ばれる,顔操作と戦うための新しい普遍的枠組みを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:30:08 GMT)
FullAnno: A Data Engine for Enhancing Image Comprehension of MLLMs [59.0] FullAnnoは、大規模で高品質できめ細かい画像アノテーションを生成するデータエンジンである。
我々はFullAnnoシステムを用いてCOCOデータセットとVisual Genomeデータセットを再注釈した。
実験により、再生したアノテーションは、複数のベンチマークでLLaVA-v1.5の能力を著しく向上できることが示された。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:33:17 GMT)
UniTabNet: Bridging Vision and Language Models for Enhanced Table Structure Recognition [55.2] 我々は、画像からテキストへのモデルに基づくテーブル構造解析のための新しいフレームワークUniTabNetを紹介する。
UniTabNetは、画像とテキストのモデルを使ってテーブルセルを分離し、物理デコーダと論理デコーダを統合して完全なテーブル構造を再構築する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 01:26:32 GMT)
Michelangelo: Long Context Evaluations Beyond Haystacks via Latent Structure Queries [54.3] ミケランジェロ(Michelangelo)は、大規模言語モデルに対する最小限の、合成的で、未学習の長文推論評価である。
この評価は、任意に長いコンテキストに対する評価のための、新しく統一された枠組みによって導出される。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 00:47:33 GMT)
A Systematic Evaluation of Large Code Models in API Suggestion: When, Which, and How [53.7] API提案は、現代のソフトウェア開発において重要なタスクである。
大規模コードモデル(LCM)の最近の進歩は、API提案タスクにおいて有望であることを示している。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 03:12:35 GMT)
ExtractGPT: Exploring the Potential of Large Language Models for Product Attribute Value Extraction [51.9] 電子商取引プラットフォームは、属性と値のペアという形で構造化された製品データを必要とする。
BERTベースの抽出法では,タスク固有の大量のトレーニングデータを必要とする。
本稿では,大規模言語モデル (LLM) を,より訓練的かつ堅牢な代替手段として活用することを検討する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:49:37 GMT)
RRM: Robust Reward Model Training Mitigates Reward Hacking [51.1] リワードモデル(RM)は、大きな言語モデルと人間の嗜好の整合において重要な役割を果たす。
これらのアーティファクトとは無関係に好みを学習する因果的枠組みを導入する。
実験の結果,提案手法は望ましくないアーティファクトをフィルタし,より堅牢な報酬モデルを実現することができた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 01:46:07 GMT)
G-Fuzz: A Directed Fuzzing Framework for gVisor [48.9] G-FuzzはgVisor用のファジィフレームワークである。
G-Fuzzは業界に展開され、深刻な脆弱性を複数発見している。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 01:00:22 GMT)
A Novel Adaptive Fine-Tuning Algorithm for Multimodal Models: Self-Optimizing Classification and Selection of High-Quality Datasets in Remote Sensing [46.6] マルチモーダル大モデルに対する適応的な微調整アルゴリズムを提案する。
我々は、GeoChatマルチモーダルリモートセンシングデータセットの3分の1を使用して、2台の3090 GPU上でモデルをトレーニングする。
このモデルはUCMercedおよびAID評価データセットで89.86と77.19のスコアを得た。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:19:46 GMT)
Leveraging Text Localization for Scene Text Removal via Text-aware Masked Image Modeling [44.7] 既存のシーンテキスト削除(STR)タスクは、高価なピクセルレベルのラベリングのため、トレーニングデータ不足に悩まされる。
我々は,低コストなテキスト検出ラベルを用いたSTRモデルの事前学習が可能なテキスト対応マスク付き画像モデリングアルゴリズム(TMIM)を提案する。
我々の方法は、他のプリトレイン法より優れ、最先端のパフォーマンス(SCUT-EnsTextの37.35 PSNR)を達成する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:52:57 GMT)
Sketching With Your Voice: "Non-Phonorealistic" Rendering of Sounds via Vocal Imitation [44.5] 人間の声の模倣を再現する手法を提案する。
まず、モデルの制御パラメータを調整して、音声の模倣を生成する。
人間の話者が聴取者に対して戦略的に判断する方法について,コミュニケーションの認知理論を適用した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:48:48 GMT)
Learning to Compare Hardware Designs for High-Level Synthesis [44.4] 高レベル合成(HLS)は、高レベルコードをハードウェア設計に変換する自動設計プロセスである。
HLSは、ソースコードに挿入されたディレクティブであるプラグマに依存して合成プロセスを導く。
ハードウェア設計を比較して効率的なHLS最適化を行う新しい手法であるComparXploreを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 00:47:29 GMT)
A Spacetime Perspective on Dynamical Computation in Neural Information Processing Systems [43.0] ニューラル計算における新しい「時空」の視点を導入する。
時間的ダイナミクスは、自然のニューラルネットワークが近似的な視覚量をエンコードする、ということが示される。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:25:37 GMT)
EmotionQueen: A Benchmark for Evaluating Empathy of Large Language Models [41.7] 本稿では,大規模言語モデル(LLM)の感情的インテリジェンスを評価するためのEmotionQueenというフレームワークを提案する。
このフレームワークには、キーイベント認識、混合イベント認識、インプリシット感情認識、意図認識の4つの固有のタスクが含まれている。
実験により、LLMの能力と感情知能の限界について重要な結論が得られた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:44:51 GMT)
A Unified Causal Framework for Auditing Recommender Systems for Ethical Concerns [40.8] 我々は、因果レンズからのレコメンデータシステム監査を見て、監査基準を定義するための一般的なレシピを提供する。
この一般的な因果監査フレームワークでは、既存の監査指標を分類し、それらのギャップを識別する。
本稿では,ユーザ自身やユーザの推奨に影響を及ぼす能力を計測する,未来と過去の評価可能性と安定性の2つのクラスを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:37:36 GMT)
Aligning Language Models Using Follow-up Likelihood as Reward Signal [40.4] そこで本稿では,好ましくない応答を区別するための報奨として,フォローアップ発話の可能性を提案する。
提案した報奨機構であるFollow-up Likelihood as Reward (FLR) は,大規模人やGPT-4アノテートデータに基づいてトレーニングされた強力な報奨モデルの性能と一致する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 23:47:25 GMT)
Recent Advancement of Emotion Cognition in Large Language Models [40.2] 大規模言語モデル(LLM)における感情認知は、様々なアプリケーションのパフォーマンス向上に不可欠である。
我々は、感情分類、感情的に豊かな反応生成、心の理論などを中心に、現在の研究の展望を探求する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:34:58 GMT)
CoMamba: Real-time Cooperative Perception Unlocked with State Space Models [39.9] CoMambaは、リアルタイム車載認識にステートスペースモデルを活用するために設計された、新しい3D検出フレームワークである。
CoMambaは、リアルタイム処理能力を維持しながら、既存の方法よりも優れたパフォーマンスを実現している。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 23:09:56 GMT)
Transfer Learning for Passive Sonar Classification using Pre-trained Audio and ImageNet Models [39.9] 本研究では,事前学習型Audio Neural Networks(PANNs)とImageNet事前学習型モデルを比較した。
また, 受動的ソナー分類において, ImageNet事前学習モデルの方が若干優れていた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 20:13:45 GMT)
Constrained Reasoning Chains for Enhancing Theory-of-Mind in Large Language Models [39.8] LLM(Large Language Models)が持つ理論-of-Mind(ToM)能力は制限されている。
本稿ではドメイン知識とToM次元間の因果関係を利用して制約に対処するConstrained Chain-of-ToM(CCoToM)を提案する。
CCoToMは、使用したすべてのデータセットにまたがる大きなマージンで、従来の最先端メソッドを一貫して上回ります。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:27:11 GMT)
Portrait Video Editing Empowered by Multimodal Generative Priors [39.7] マルチモーダルプロンプトを用いた一貫した表現型スタイリングを実現する強力なポートレートビデオ編集手法であるPortraitGenを紹介する。
提案手法は,大規模2次元生成モデルから抽出した知識によるマルチモーダル入力を取り入れたものである。
また,表情類似性指導と顔認識画像編集モジュールを内蔵し,反復的データセット更新に伴う劣化問題を効果的に軽減する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:45:13 GMT)
Enhancing Large Language Models with Domain-specific Retrieval Augment Generation: A Case Study on Long-form Consumer Health Question Answering in Ophthalmology [34.8] 医学における大規模言語モデル(LLM)は、幻覚的証拠に基づく証拠を欠いた応答を生成する可能性がある。
我々は,7万件の眼科用文書を用いたRAGパイプラインを開発し,推測時間にLCMを増大させるために関連文書を検索した。
医療従事者10名を対象に,RAGの有無を問う質問100件において, LLMの500件以上の基準を含む回答を評価した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 21:06:00 GMT)
Blockchain-Enabled Variational Information Bottleneck for Data
Extraction Based on Mutual Information in Internet of Vehicles [34.6] Internet of Vehicles (IoV) ネットワークは、限られた計算資源と個々の車両のデータ処理能力の問題に対処することができる。
ブロックチェーン技術を適用することで、IoV内のセキュアなデータリンクを確立することが可能になる。
本稿では、ブロックチェーンをBVIBと呼ぶVIBと統合する革新的なアプローチを紹介し、計算処理の軽量化とネットワークのセキュリティ強化を目的としている。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:30:19 GMT)
Target word activity detector: An approach to obtain ASR word boundaries without lexicon [33.0] 語彙に依存することなく単語境界を推定する手法を提案する。
本手法は,サブワードトークン単位と事前学習されたASRモデルからの単語埋め込みを利用する。
提案手法は,余分なコストを伴わずに,任意の言語にスケールアップすることができる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 21:40:18 GMT)
CFSP: An Efficient Structured Pruning Framework for LLMs with Coarse-to-Fine Activation Information [33.0] CFSPと呼ばれる効率的な構造化プルーニングフレームワークを提案する。
まず、その重要度に基づいて各ブロックに分散予算を割り当て、その後、各ブロックに重要な重みを保持する。
その結果,CFSP は様々な予算にまたがる様々なモデルにおいて,既存の手法よりも優れていることがわかった。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:03:27 GMT)
Mufu: Multilingual Fused Learning for Low-Resource Translation with LLM [33.0] 自動生成された多言語候補の選択と、プロンプト内の不正確な翻訳を補正する命令を含む。
Mufuは、翻訳タスクをポストされたタスクに変換する。
Flores-200データセット上でのEn-XX翻訳実験により,Museスタイルのプロンプトに対して微調整されたLLMは,高品質な補助翻訳候補に対して堅牢であることが示された。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 23:48:47 GMT)
Large Language Model Should Understand Pinyin for Chinese ASR Error Correction [31.1] 我々は,中国のASR誤り訂正を改善するため,Pinyin-enhanced GECを提案する。
提案手法は, 合成誤差をトレーニングに用い, 推論時に最良仮説を用いる。
Aishell-1とCommon Voiceデータセットの実験は、我々のアプローチがテキストのみの入力でGECを一貫して上回っていることを示している。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:50:56 GMT)
Neural-Symbolic Collaborative Distillation: Advancing Small Language Models for Complex Reasoning Tasks [30.6] 大規模言語モデル(LLM)の複雑な推論能力を学習するための新しい知識蒸留法を提案する。
NesyCDはLLMの一般的な能力と専門知識を異なる方法で蒸留する。
実験の結果,NesyCDは領域内(BBH, GSM8K)および領域外(AGIEval, ARC)データセット上でのSLMの複雑な推論性能を大幅に向上させることがわかった。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:17:13 GMT)
Autoregressive + Chain of Thought = Recurrent: Recurrence's Role in Language Models' Computability and a Revisit of Recurrent Transformer [30.0] ニューラルモデルにおけるリカレント構造が推論能力と計算可能性に与える影響について検討する。
我々は、CoTアプローチが繰り返し計算を模倣し、自己回帰と再発の間のブリッジとして機能する方法について光を当てた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 21:12:25 GMT)
JMedBench: A Benchmark for Evaluating Japanese Biomedical Large Language Models [29.9] 本稿では,日本の生物医学大言語モデル(LLM)を評価するための新しいベンチマークを提案する。
実験の結果,以下のことが示唆された。
日本人の生物医学的知識をより深く理解したLLMは、日本の生物医学的タスクにおいて、より良いパフォーマンスを実現する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:25:16 GMT)
Demystifying and Extracting Fault-indicating Information from Logs for Failure Diagnosis [29.8] エンジニアは、診断のためにログ情報の2つのカテゴリを優先順位付けする。
そこで本研究では,LoFIと呼ばれる故障診断のためのログから誤検出情報を自動抽出する手法を提案する。
LoFIは全てのベースライン法を大幅な差で上回り、最高のベースライン法であるChatGPTよりもF1の25.837.9を絶対的に改善した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:00:47 GMT)
SSE: Multimodal Semantic Data Selection and Enrichment for Industrial-scale Data Assimilation [29.5] 近年、人工知能のために収集されたデータは、管理不能な量に成長している。
セマンティックに多様で重要なデータセット部分を選択するためのフレームワークを提案する。
巨大なラベルのないデータプールから意味のある新しいデータを発見することで、さらにセマンティックに強化します。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 19:17:52 GMT)
PLOT: Text-based Person Search with Part Slot Attention for Corresponding Part Discovery [29.3] 本稿では、スロットアテンションに基づく部分発見モジュールを活用して、特徴部分を自律的に識別し、モダリティ間で整合させる新しいフレームワークを提案する。
提案手法は3つの公開ベンチマークで評価され,既存手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:05:55 GMT)
Brain-Cognition Fingerprinting via Graph-GCCA with Contrastive Learning [28.7] 縦断的神経画像研究は、脳機能と認知の間の動的相互作用を研究することによって、脳の老化と疾患の理解を改善することを目的としている。
本稿では,グラフ注意ネットワークと一般化相関解析を用いた教師なし学習モデルを提案する。
個々の人の独特の神経・認知表現型を反映した脳認知指紋を作成するために、モデルは個別化およびマルチモーダル・コントラスト学習にも依存する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 20:36:20 GMT)
State space models, emergence, and ergodicity: How many parameters are needed for stable predictions? [28.7] かなりの長距離相関を示すタスクには,一定のパラメータが要求されることを示す。
また,学習者のパラメトリゼーションの役割についても検討し,隠れ状態を持つ線形力学系の簡単なバージョンを考える。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:39:37 GMT)
Towards Child-Inclusive Clinical Video Understanding for Autism Spectrum Disorder [27.8] 本研究では,3つのモダリティ(音声,ビデオ,テキスト)にまたがる基礎モデルを用いて,子どものインタラクション・セッションの分析を行う。
本研究は,行動認識と異常行動検出という,情報粒度の異なる2つのタスクにおいて,その性能を評価する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:06:46 GMT)
$\textit{SKIntern}$: Internalizing Symbolic Knowledge for Distilling Better CoT Capabilities into Small Language Models [27.1] 小言語モデル(SLM)は、高い計算要求とプライバシー上の懸念から注目を集めている。
シンボリック知識を内部化するためのSLMを実現する革新的なアプローチである$textitSKIntern$を紹介した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 03:23:20 GMT)
One Model is All You Need: ByT5-Sanskrit, a Unified Model for Sanskrit NLP Tasks [26.8] ByT5-Sanskritは、形態的にリッチなサンスクリット言語を含むNLPアプリケーション向けに設計された。
外部の言語資源によってカバーされていないデータへのデプロイが容易で、より堅牢である。
提案手法は,他の形態学的にリッチな言語に対する補題化と依存関係解析のための新たなベストスコアが得られることを示す。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 22:02:26 GMT)
OneBEV: Using One Panoramic Image for Bird's-Eye-View Semantic Mapping [25.8] OneBEVは、単一のパノラマ画像を入力として使用する、新しいBEVセマンティックマッピングアプローチである。
Mamba View Transformation (MVT)と呼ばれる歪み対応モジュールは、パノラマの空間歪みを処理するために特別に設計されている。
この作業は、自律運転におけるBEVセマンティックマッピングを前進させ、より高度で信頼性の高い自律システムへの道を開く。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 21:33:53 GMT)
Balancing Label Imbalance in Federated Environments Using Only Mixup and Artificially-Labeled Noise [25.8] 擬似画像を用いて、特定のラベルクラスの未表現サンプルを埋め込む方法を示す。
既存のアルゴリズムは擬似イメージのみをトレーニングしていますが、拡張されたクライアントデータセットは実画像と擬似イメージの両方で構成されています。
ラベル付きCIFAR-10およびMNIST訓練において,混合と自然雑音による少量の増強が顕著に改善することが実証された。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 05:44:43 GMT)
Eliciting Instruction-tuned Code Language Models' Capabilities to Utilize Auxiliary Function for Code Generation [25.4] 本研究では,事前学習言語モデル上に構築された命令学習モデルのコード生成挙動について検討する。
我々は、クエリに追加したり、応答プレフィックスを提供したりすることで、モデルに補助機能を提供する方法をいくつか設計する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 22:28:20 GMT)
Autonomous Goal Detection and Cessation in Reinforcement Learning: A Case Study on Source Term Estimation [25.0] 強化学習は動的環境における意思決定プロセスに革命をもたらした。
正確な環境情報がないため、明確なフィードバック信号の提供は困難である。
本研究では,タスク完了時の自律目標検出と停止のための自己フィードバック機構を開発する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:28:06 GMT)
Scaling Smart: Accelerating Large Language Model Pre-training with Small Model Initialization [22.9] 本稿では,事前学習した言語モデルのパラメータを,隠れ次元が増大する大規模モデルのパラメータに拡張する手法であるHyperCloningを紹介する。
結果として、より大きなモデルは、トレーニングを開始する前に、より小さなモデルの予測能力と精度をすでに継承している。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:22:37 GMT)
RPAF: A Reinforcement Prediction-Allocation Framework for Cache Allocation in Large-Scale Recommender Systems [22.9] 本稿では,キャッシュアロケーションにおける2つの重要な課題,すなわち,バリューストラテジー依存とストリーミングアロケーションを示す。
これらの問題に対処するための強化予測割当フレームワーク(RPAF)を提案する。
RPAFは、予測とアロケーション段階を含む強化学習ベースの2段階フレームワークである。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 03:02:42 GMT)
Interpret the Predictions of Deep Networks via Re-Label Distillation [22.2] 本研究では,入力から予測への直接写像を自己超越的に学習するための再ラベル蒸留手法を提案する。
合成画像は、ラベルがシフトするかどうかを識別することにより、2つのクラスのうちの1つに注釈を付けることができる。
このようにして、これらの再ラベルされた合成画像は、ディープネットワークの局所的な分類機構をうまく記述することができる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 00:46:22 GMT)
Gender Representation and Bias in Indian Civil Service Mock Interviews [21.3] 男女の偏見は、男女の候補者に質問する質問の幅広い性質に見受けられる。
大きな言語モデルを用いた実験は、説明に性別バイアスが強く存在することを示している。
本稿では,今後の社会科学研究に有用な51,278質問のデータセットを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:38:21 GMT)
YesBut: A High-Quality Annotated Multimodal Dataset for evaluating Satire Comprehension capability of Vision-Language Models [21.3] サテライト画像検出(画像が風刺的かどうかを検出する)、理解(画像の背後にある理由を生成する)、完成(画像の片方に画像の残りの半分を風刺的であるような2つのオプションから選択する)を提案する。
我々は、さらなる研究のために、119枚のリアルな風刺写真データセットを公開します。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:45:29 GMT)
LLM for Everyone: Representing the Underrepresented in Large Language Models [21.1] この論文は、表現不足言語に焦点をあてて、NLPの研究と開発におけるギャップを埋めることを目的としている。
大規模言語モデル(LLM)の包括的評価を行い,それらの能力を評価する。
提案手法は、言語間連続的命令チューニング、検索に基づく言語間インコンテキスト学習、コンテキスト内クエリアライメントを網羅する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 20:53:22 GMT)
An adapted large language model facilitates multiple medical tasks in diabetes care [20.1] 大規模言語モデル(LLM)は、様々な医療シナリオにおいて有望であるが、様々な糖尿病タスクにおけるその効果は証明されていない。
本研究は糖尿病特異的LSMを訓練し、検証するための枠組みを導入した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 03:47:54 GMT)
Instruction-guided Multi-Granularity Segmentation and Captioning with Large Multimodal Model [19.9] MGLMM(Multi-Granularity Large Multimodal Model)を導入する。
MGLMMはユーザ指示に従ってキャプション(SegCap)の粒度をシームレスに調整することができる。
8つ以上の下流タスクに対処し、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:13:31 GMT)
$\textit{"I Don't Use AI for Everything"}$: Exploring Utility, Attitude, and Responsibility of AI-empowered Tools in Software Development [19.9] 本研究では、ソフトウェア開発プロセスにおけるAIを活用したツールの採用、影響、およびセキュリティに関する考察を行う。
ソフトウェア開発のさまざまな段階において,AIツールが広く採用されていることが判明した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:17:10 GMT)
Concept-Based Explanations in Computer Vision: Where Are We and Where Could We Go? [17.4] ニューラルビジョンモデルを説明するための概念ベースのXAIアプローチは、有望な研究分野である。
本稿では,C-XAI手法を用いて,興味深く,未探索な領域を同定し,今後の研究方向性を提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 12:43:21 GMT)
Deep Learning and Machine Learning, Advancing Big Data Analytics and Management: Tensorflow Pretrained Models [17.4] この本では、ResNet、MobileNet、EfficientNetといったモダンアーキテクチャの実践的な実装を取り上げている。
線形探索とモデル微調整を比較し、PCA、t-SNE、UMAPといった技術を用いた可視化を提供する。
この本は、理論的な洞察と実践を融合することで、読者に様々な深層学習課題に自信を持って取り組む知識を与える。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:07:14 GMT)
LLMs Still Can't Plan; Can LRMs? A Preliminary Evaluation of OpenAI's o1 on PlanBench [17.3] PlanBenchは、大規模言語モデル(LLM)の計画能力を評価するためのベンチマークである。
本稿では,現在の LLM と新しい LRM の PlanBench に対する効果を概観する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:20:46 GMT)
Towards Long-Context Time Series Foundation Models [17.2] 時系列基礎モデルは、ゼロショットの設定であっても、幅広い領域にわたる様々なタスクにおいて印象的なパフォーマンスを示している。
本研究は,言語領域と時系列領域の両方から,様々な文脈展開手法を体系的に比較することによって,ギャップを埋めるものである。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:19:59 GMT)
Temporally Aligned Audio for Video with Autoregression [17.0] V-AURAはビデオ・オーディオ生成において時間的アライメントと関連性を達成する最初の自己回帰モデルである。
VisualSoundは、高いオーディオと視覚の関連性を持つベンチマークデータセットである。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:59:01 GMT)
ChemDFM-X: Towards Large Multimodal Model for Chemistry [16.8] 化学用クロスモーダル対話基盤モデル(ChemDFM-X)について紹介する。
近似計算とタスク固有モデル予測により、初期モダリティから、多様なマルチモーダルデータを生成する。
ChemDFM-Xは、様々なデータモダリティを持つ様々な化学タスクの広範な実験で評価される。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 03:55:34 GMT)
Morphology and Behavior Co-Optimization of Modular Satellites for Attitude Control [16.7] 我々は、モジュラー衛星のモルフォロジーと制御を同時に最適化するための、新しい勾配に基づくアプローチを導入する。
我々のモンテカルロシミュレーションは、この共最適化アプローチによって、より優れたミッション性能を持つモジュラー衛星が生まれることを示した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 02:43:53 GMT)
DiffFluid: Plain Diffusion Models are Effective Predictors of Flow Dynamics [16.7] 各種作業条件下での流体力学の効果的な予測因子としてトランスフォーマーを用いた平ら拡散モデルを示す。
本手法は,画像翻訳問題としてフローダイナミクスの予測を定式化し,平らな拡散モデルを用いてこの問題に対処する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:19:03 GMT)
A Multimodal Dense Retrieval Approach for Speech-Based Open-Domain Question Answering [16.6] 音声ベースのオープンドメインQAでは,パス検索が重要な課題である。
本稿では,音声質問を直接処理可能な,エンドツーエンドのマルチモーダル高密度検索手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:15:53 GMT)
Unsupervised Attention-Based Multi-Source Domain Adaptation Framework for Drift Compensation in Electronic Nose Systems [16.3] 本稿では,E-noseシステムにおけるドリフト補償を伴うガス識別のための新しい枠組みを提案する。
AMDS-PFFAモデルは、複数のソースドメインからのラベル付きデータを効果的に活用する。
コンバージェンスの高い平均ガス認識精度を達成する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 02:47:05 GMT)
SLaVA-CXR: Small Language and Vision Assistant for Chest X-ray Report Automation [15.4] 我々はChest X-Rayレポートの自動化に使用できるオープンソースのSmall Language and Vision Assistant (SLaVA-CXR)を提案する。
そこで我々はまず,放射線科医の認知発達をシミュレートしたRe$3$Training法を提案する。
そこで,プライバシー規制に準拠した高品質で多様な学習コーパスを生成できるデータ合成手法RADEXを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:28:46 GMT)
Simple Unsupervised Knowledge Distillation With Space Similarity [15.3] 自己教師付き学習(SSL)は、より小さなアーキテクチャに容易に拡張できない。
正規化により失われた情報を捉えるための単純な目的を提案する。
提案する損失成分である「textbfspace similarity」は,生徒の特徴空間の各次元を,教師の対応する次元に類似させる動機付けを行う。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 22:54:39 GMT)
Conversational Query Reformulation with the Guidance of Retrieved Documents [14.4] 本稿では,最初に検索したドキュメントからキー情報を活用することでクエリを洗練するフレームワークである GuideCQR を紹介する。
提案手法は,複数のデータセットにまたがる最先端性能を実現し,従来のCQR手法よりも優れていた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 01:59:52 GMT)
Measuring Copyright Risks of Large Language Model via Partial Information Probing [14.1] LLM(Large Language Models)のトレーニングに使用されるデータソースについて検討する。
著作権のあるテキストの一部をLSMに入力し、それを完了するように促し、生成したコンテンツとオリジナルの著作権のある資料の重複を分析します。
これらの部分的な入力に基づいて著作権素材と重なり合うコンテンツをLLMが生成できることが本研究で実証された。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 18:16:05 GMT)
DAP-LED: Learning Degradation-Aware Priors with CLIP for Joint Low-light Enhancement and Deblurring [14.0] DAP-LEDと呼ばれる新しい変圧器を用いた共同学習フレームワークを提案する。
低照度向上と劣化を共同で達成することができ、深度推定、セグメンテーション、暗黒での検知といった下流タスクの恩恵を受けることができる。
重要な洞察は、CLIPを活用して、夜間に画像から劣化レベルを適応的に学習することだ。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:37:53 GMT)
Using High-Level Patterns to Estimate How Humans Predict a Robot will Behave [13.8] ロボットと対話する人間は、ロボットが次に何をするかを予測する。
我々は、ロボットが人間の行動を予測する方法を推定できる2階のマインド・アプローチを開発した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:23:05 GMT)
Skill-Adpative Imitation Learning for UI Test Reuse [13.5] UIテストマイグレーションの有効性を高めるために,スキル適応型模倣学習フレームワークを提案する。
その結果、SAILはUIテストマイグレーションの有効性を大幅に改善し、149%の成功率が最先端のアプローチよりも高いことがわかった。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:13:04 GMT)
FIHA: Autonomous Hallucination Evaluation in Vision-Language Models with Davidson Scene Graphs [12.5] FIHA (Autonomous Fine-grained Hallucination evAluation Evaluation in LVLMs) について紹介する。
FIHAは、LLMフリーでアノテーションフリーな方法で幻覚LVLMにアクセスし、異なる種類の幻覚間の依存性をモデル化することができた。
FIHA-v1 というベンチマークを導入し,MSCOCO と Foggy の様々な画像に対する多様な質問からなる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:19:53 GMT)
RingMo-Aerial: An Aerial Remote Sensing Foundation Model With A Affine Transformation Contrastive Learning [12.4] 本稿では,ARSビジョンの分野における基礎モデル研究のギャップを埋めることを目的としたRingMo-Aerialモデルを提案する。
小型目標に対するモデルの検出能力を向上し、ARSの特徴となる傾いた視角に最適化する。
実験により、RingMo-Aerialは複数の下流タスクにおいてSOTA性能を達成することを示した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:03:14 GMT)
Investigation on domain adaptation of additive manufacturing monitoring systems to enhance digital twin reusability [12.4] 機械学習(ML)ベースのモデリングを使用したデジタルツイン(DT)は、AMプロセスの監視と制御のためにデプロイできる。
メルトプールは、プロセス監視において最もよく見られる物理現象の1つである。
本稿では,AM DTの再利用性を高めるため,異なるAM設定間の知識伝達パイプラインを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:29:23 GMT)
V-Hands: Touchscreen-based Hand Tracking for Remote Whiteboard Interaction [11.8] ホワイトボードベースの遠隔通信では、描画コンテンツと手画面インタラクションのシームレスな統合が不可欠である。
これまでの方法では、手の動きを捉えるために、かさばる装置のセットアップが必要だったり、静電容量画像から手の動きを正確に追跡できなかったりしていた。
容量ビデオフレームから両手の3Dポーズを正確に追跡するためのリアルタイムな手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:26:53 GMT)
Towards Zero-shot Point Cloud Anomaly Detection: A Multi-View Projection Framework [11.6] 我々は、事前訓練されたビジョンランゲージモデル(VLM)を利用して異常を検出する、Multi-View Projection(MVP)フレームワークを紹介する。
MVPは、クラウドデータをマルチビューの深度イメージに投影することで、ポイントクラウド異常検出をイメージ異常検出に変換する。
本稿では、これらのVLMを微調整するための学習可能な視覚的および適応的テキストプロンプトの統合を提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 02:30:33 GMT)
A Test of Empty Wave via Quantum Memory in a Weak Measurement Scheme [11.5] 量子力学では、1つの光子が1つのスリットのみを通過し、その波動関数は空の「波」と完全な「波」に分裂する。
ここでは、量子メモリと弱い測定を組み合わせた新しい実験構成を提案し、空波の性質について検討する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:33:58 GMT)
JoyHallo: Digital human model for Mandarin [11.4] 本研究はJD Health International Inc.の従業員から29時間のマンダリン音声ビデオを収集した。
このデータセットには、さまざまな年齢と話し方が含まれており、会話と専門の医療トピックの両方を含んでいる。
マンダリンのJoyHalloモデルに適応するために、我々は中国語wav2vec2モデルをオーディオ機能埋め込みに使用した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:57:42 GMT)
A Simple HMM with Self-Supervised Representations for Phone Segmentation [10.3] 我々は,メルスペクトルのピーク検出が,多くの自己監督的アプローチよりも強いベースラインであることを示す。
本稿では,電話セグメンテーションの境界における自己教師付き表現と特徴を用いた単純な隠れマルコフモデルを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:49:10 GMT)
Region Prompt Tuning: Fine-grained Scene Text Detection Utilizing Region Text Prompt [10.2] リージョンプロンプトチューニング手法は、領域テキストプロンプトを個々の文字に分解し、視覚特徴マップを領域視覚トークンに分割する。
これにより、文字はトークンの局所的な特徴と一致し、詳細な特徴やきめ細かいテキストが省略されるのを避けることができる。
提案手法は,画像テキストプロセスから得られた一般的なスコアマップと,文字とトークンのマッチングから得られた領域スコアマップを組み合わせる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:24:26 GMT)
Data Augmentation for Sequential Recommendation: A Survey [9.9] シーケンシャルレコメンデーション(SR)は、現実の状況との整合性から多くの注目を集めている。
SRのためのデータ拡張(DA)手法の総合的なレビューを行う。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:39:42 GMT)
A Value Based Parallel Update MCTS Method for Multi-Agent Cooperative Decision Making of Connected and Automated Vehicles [9.8] 本稿では,マルチエージェント・マルコフゲームに対する並列更新によるモンテカルロ木探索(MCTS)手法を提案する。
部分定常交通流における多車両共同動作空間の並列動作を解析することにより、並列更新法は潜在的危険な動作を迅速に排除することができる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 03:13:01 GMT)
Inductive Spatial Temporal Prediction Under Data Drift with Informative Graph Neural Network [9.7] Informative Graph Neural Network (INF-GNN) を設計し、多様化した不変パターンを抽出し、データドリフト時の予測精度を向上させる。
まず、一意に設計された指標であるRelation Importance (RI)を用いて、安定した実体と異なる空間関係を効果的に選択できる情報サブグラフを構築する。
次に,時間間隔内の影響関数を用いて抽出した貴重なタイムスタンプを強調するための情報的時間記憶バッファを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:21:53 GMT)
Simulating the Schwinger Model with a Regularized Variational Quantum Imaginary Time Evolution [9.6] シュウィンガーモデルは、量子色力学において非摂動アルゴリズムをテストするためのベンチマークとして機能する。
古典的アルゴリズムは「符号問題」のようなシュウィンガーモデルをシミュレートする際に問題に遭遇する
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:51:48 GMT)
Beyond Accuracy Optimization: Computer Vision Losses for Large Language Model Fine-Tuning [9.5] 大きな言語モデル(LLM)は、様々なタスクで素晴らしいパフォーマンスを示しています。
現在のトレーニングアプローチでは、標準的なクロスエントロピー損失と、広範なデータ、人間のフィードバック、あるいはパフォーマンス向上のためのアドホックメソッドを組み合わせる。
本研究では,自然言語生成におけるセマンティックセグメンテーションの損失関数を用いた,汎用的で実用的でスケーラブルなソリューションの構築について検討する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:46:17 GMT)
Audio Codec Augmentation for Robust Collaborative Watermarking of Speech Synthesis [9.5] 本稿では,従来の音声コーデックとニューラルオーディオコーデックを併用するために,チャネル拡張を拡張した。
リスニングテストでは、8kbpsの高コーデックやDACで、協調的な透かしが知覚上の劣化を無視できることを示した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:33:17 GMT)
ReMEmbR: Building and Reasoning Over Long-Horizon Spatio-Temporal Memory for Robot Navigation [9.5] ロボットと対話する人々は、それがいつ起きたのか、どれくらい昔に起きたのかといった質問をしたいかもしれない。
本稿では,ロボットナビゲーションのための長時間ビデオ質問応答システムであるReMEmbRを紹介する。
我々の実験により、ReMEmbRはLLMとVLMのベースラインよりも優れており、低レイテンシで効率的な長距離推論を実現することができることが示された。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:50:07 GMT)
Multiscale Encoder and Omni-Dimensional Dynamic Convolution Enrichment in nnU-Net for Brain Tumor Segmentation [9.4] 本研究では nnU-Net アーキテクチャを改良した新しいセグメンテーションアルゴリズムを提案する。
我々は、全次元動的畳み込み層を組み込むことにより従来の畳み込み層を強化し、特徴表現を改善した。
モデルの有効性はBraTS-2023チャレンジの多様なデータセットで実証される。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 05:25:46 GMT)
Multi-omics data integration for early diagnosis of hepatocellular carcinoma (HCC) using machine learning [8.7] 異なるモードのマルチクラスデータの遅延統合が可能なアンサンブル機械学習アルゴリズムの性能を比較した。
PB-MVBoostとAdaboostとソフト投票という2つの強化された方法が、全体的な最高のパフォーマンスモデルであった。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:38:02 GMT)
ALPEC: A Comprehensive Evaluation Framework and Dataset for Machine Learning-Based Arousal Detection in Clinical Practice [8.5] 本稿では,覚醒剤の局所化と正確な事象数(ALPEC)を重視した新しい後処理・評価フレームワークを提案する。
本論文と並行してデータセットを公開し,マルチモーダルデータを利用した覚醒的オンセット検出の利点を実証する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:03:37 GMT)
Visualising Personal Data Flows: Insights from a Case Study of Booking.com [8.5] 本稿では、プライバシポリシから抽出した個人データフローを可視化するケーススタディとして、Booking.comを取り上げている。
消費者の個人情報の共有方法を示すことによって、私たちは質問を提起し、プライバシポリシを使用してオンラインユーザに対して、個人データフローの真の規模と状況について通知する際の課題と制限に関する議論を拡大します。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:06:34 GMT)
Prompt Obfuscation for Large Language Models [8.4] 本研究では,従来のシステムプロンプトの代替案を提案する。
システムプロンプトの抽出を防止するために,プロンプト難読化を導入する。
提案手法は,知的財産権の保護に有効な手法でありながら,本来のシステムプロンプトと同じ実用性を維持しつつも有効であることを示す。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:39:50 GMT)
Kalahi: A handcrafted, grassroots cultural LLM evaluation suite for Filipino [8.3] フィリピン生まれの話者が共同で作成した,文化的LLM評価スイートであるKalahiを紹介する。
カラヒにおける強力なLLMパフォーマンスは、ある状況下で平均的なフィリピン人が言うのと同じような反応をモデルが生成する能力を示している。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:01:21 GMT)
Enhancing Fault Localization Through Ordered Code Analysis with LLM Agents and Self-Reflection [8.2] 大規模言語モデル(LLM)は、コード理解と推論を強化することによって、フォールトローカライゼーションの有望な改善を提供する。
LLM4FL は,SBFL ランキングと配当戦略を統合した新しい LLM4FL の故障局所化手法である。
以上の結果から,LLM4FLはTop-1の精度でAutoFLを19.27%上回り,DeepFLやGraceといった最先端の監視技術を上回っていることがわかった。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:47:34 GMT)
Ultra spectral sensitivity and non-local bi-impurity bound states from quasi-long-range non-hermitian skin modes [8.1] 熱力学極限における非エルミート系ではスペクトル安定性の原理が失敗することを示す。
ハミルトニアンは完全に局所的であるが、そのエネルギースペクトルは2つの無限に弱い不純物の存在を検出することができる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:33:43 GMT)
A Personalised 3D+t Mesh Generative Model for Unveiling Normal Heart Dynamics [6.6] 心臓の形状と運動パターンの分布を学習するために,条件付き生成モデルであるMeshHeartを開発した。
MeshHeartは、年齢、性別、体重、高さなどの臨床的要因を考慮して、3D+t心筋メッシュ配列を生成することができる。
本稿では,個人化規範パターンから実際の心臓の偏差を定量化する,新しい距離測定式潜時デルタを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 18:08:37 GMT)
T2M-X: Learning Expressive Text-to-Motion Generation from Partially Annotated Data [6.6] 既存の方法は、表情や手の動きを除いて、身体の動きデータのみを生成する。
このようなデータセットを作成しようとする最近の試みは、異なる身体部位間での運動の不整合をもたらす。
部分注釈付きデータから表現力のあるテキスト・ツー・モーション生成を学習する2段階の方法であるT2M-Xを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:20:00 GMT)
PyGRF: An improved Python Geographical Random Forest model and case studies in public health and natural disasters [6.6] 地理ランダムフォレスト(GRF)は、最近開発された、空間的に明示的な機械学習モデルである。
現在のGRFモデルは、局所モデル重みと帯域幅ハイパーパラメータの決定に制限がある。
また、Rパッケージとして実装されているGRFは、現在、機械学習実践者の間で採用を制限するPythonバージョンを持っていない。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 23:46:17 GMT)
Wormhole: Concept-Aware Deep Representation Learning for Co-Evolving Sequences [6.4] 本稿では,概念を意識した新しい深層表現学習フレームワークであるWormholeを紹介する。
概念遷移は、潜伏空間の急激な変化を特定し、新しい行動への移行を示すことによって検出される。
この新しいメカニズムは、共進化配列の概念を正確に識別し、これらのワームホールの正確な位置を特定できる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 19:11:39 GMT)
Data Pruning via Separability, Integrity, and Model Uncertainty-Aware Importance Sampling [6.4] 本稿では,重要サンプリングに基づく新しいプルーニング指標とプルーニング手順を導入することにより,画像分類のための既存のデータプルーニング手法を改善する。
提案したプルーニング指標は、データ分離性、データの完全性、モデルの不確実性を明確に説明している。
サンプリング手順はプルーニング比に適応し、クラス内分離とクラス間分離の両方を考慮してプルーニングの有効性をさらに高める。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 21:45:02 GMT)
STOP! Benchmarking Large Language Models with Sensitivity Testing on Offensive Progressions [6.2] 大規模言語モデル(LLM)における明示的バイアスと暗黙的バイアスの緩和は、自然言語処理の分野において重要な焦点となっている。
我々は,2700のユニークな文を含む450の攻撃的進行を含む,攻撃的進行に関する感性テストデータセットを紹介した。
以上の結果から,最も優れたモデルでさえバイアスを不整合に検出し,成功率は19.3%から69.8%であった。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 18:34:38 GMT)
Do language models practice what they preach? Examining language ideologies about gendered language reform encoded in LLMs [6.1] 我々は、英語のジェンダー化言語改革を事例として、LLMが作成したテキストにおける言語イデオロギーについて研究する。
LLMは「正しい」あるいは「自然な」言語を使うよう求められた時、保守的な(進歩的な)価値観に合わせるよう求められた時と、最もよく似た言語を使用する。
このことは、LLMが生成したテキストで表現される言語イデオロギーがいかに異なるかを示しており、これはユーザにとって予期せぬことである。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 18:55:48 GMT)
PureDiffusion: Using Backdoor to Counter Backdoor in Generative Diffusion Models [6.0] 拡散モデル(DM)は、幅広い生成タスクにおいて最先端の能力を達成した高度なディープラーニングモデルである。
近年の研究では、バックドア攻撃に関する脆弱性が示されており、バックドアDMは、バックドアターゲットと呼ばれる指定結果を一貫して生成している。
DMに埋め込まれたバックドアトリガを反転させることで、バックドア攻撃を効率的に検出できる新しいバックドア防御フレームワークであるPureDiffusionを導入する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 23:19:26 GMT)
A Law of One's Own: The Inefficacy of the DMCA for Non-Consensual Intimate Media [5.9] NCIM(Non-consensual Intimate Media)は、表現されている個人に対して、インターネット規模の害を与えるメディアである。
本稿では,NCIM削除に対するDMCA(Digital Millennium Copyright Act)の有効性について検討する。
その結果、60日以内にWebサイトホストから削除されたURLは50%以下であることが判明した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:22:17 GMT)
Applying Pre-trained Multilingual BERT in Embeddings for Improved Malicious Prompt Injection Attacks Detection [5.8] 大きな言語モデル(LLM)は、その優れた能力と広範囲のアプリケーションに適用できることで有名である。
この研究は、実際のLLMアプリケーションに最も危険な脆弱性の1つである悪意のあるプロンプトインジェクション攻撃の影響に焦点を当てている。
正規のプロンプトから悪意のあるプロンプトを分類するために、多言語BERTやDistilBertのような様々なBERT(Bidirectional Representations from Transformers)を適用する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:48:51 GMT)
3D-GSW: 3D Gaussian Splatting Watermark for Protecting Copyrights in Radiance Fields [5.5] 本稿では3次元ガウススプラッティングのための新しい透かし法を提案する。
提案手法は,事前学習した3次元ガウススプラッティングモデルを微調整することにより,バイナリメッセージを3次元ガウスに埋め込む。
実験の結果,本手法は3次元ガウシアンに透かしを埋め込むことができ,攻撃に対するキャパシティとロバスト性を高めることができることがわかった。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 05:16:06 GMT)
Selective Exploration and Information Gathering in Search and Rescue Using Hierarchical Learning Guided by Natural Language Input [5.5] 本稿では,大規模言語モデル(LLM)と階層的強化学習(HRL)フレームワークを連携させるシステムを提案する。
提案システムは,人間の利害関係者からの言語入力を実用的なRLインサイトへ翻訳し,検索戦略を調整するように設計されている。
LLMによる人為的情報の利用とHRLによるタスク実行の構造化により、長い地平線とスパース報酬を特徴とする環境におけるエージェントの学習効率と意思決定プロセスを大幅に改善する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 12:27:47 GMT)
OATS: Outlier-Aware Pruning Through Sparse and Low Rank Decomposition [4.8] 入力埋め込みにおける第2モーメント情報を利用してモデル重みをスパース行列とローランク行列の和に分解する,OATSという大形変圧器の圧縮手法を提案する。
OATSは、Llama-3やPhi-3のような大型言語モデルやViTやDINOv2のようなビジョントランスフォーマーで最大60%の価格でモデルを圧縮する際に、最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:02:00 GMT)
Transfer Learning with Clinical Concept Embeddings from Large Language Models [4.8] 大言語モデル (LLMs) は, 臨床的概念の意味を捉える重要な可能性を示している。
本研究では,2つの大規模医療システムからの電子健康記録を分析し,セマンティック埋め込みが局所的,共有的,移動的学習モデルに与える影響を評価する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 20:50:55 GMT)
Empowering Visual Artists with Tokenized Digital Assets with NFTs [4.7] 非Fungible Tokens(NFT)は、アートプラクティスの強化とブロックチェーンテクノロジの活用の間のネクサスを調べることによって、視覚芸術産業に変革的な影響を与える。
その構造、コンセンサスアルゴリズム、スマートコントラクト、デジタルウォレットなど、ブロックチェーンエコシステムの重要な基盤を導入し、定義します。
特に、さまざまな市場でNFTを鋳造・取引するための重要なプロセスを概説し、関連する市場動態と価格について論じる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:01:39 GMT)
Deep Learning based Optical Image Super-Resolution via Generative Diffusion Models for Layerwise in-situ LPBF Monitoring [4.7] 我々は,ビルドプレートの低解像度画像とビルドプレートの詳細な高解像度光学画像とを関連付けるために,生成的深層学習モデルを実装した。
低解像度Webカメラ画像からビルドプレートの現実的な高解像度画像を生成するために,条件付き潜在確率拡散モデルを訓練した。
また, 印刷部の3次元形状を再現し, 復元した試料の表面粗さを解析する枠組みを設計した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 02:59:25 GMT)
Feature-Centered First Order Structure Tensor Scale-Space in 2D and 3D [4.5] 微分フィルタの幅を画像特徴量に結びつけることで構造テンソル法を単純化する。
抽出された構造的測度を用いて,スケールマップの既知の不正確さを補正する方法について述べる。
我々のソリューションははるかに正確であり、最小限のユーザ入力で幅広い構造パラメータを抽出するアウト・オブ・ボックス法として機能する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:43:10 GMT)
Enhancing Fruit and Vegetable Detection in Unconstrained Environment with a Novel Dataset [4.5] 本稿では,実環境における果実や野菜の検出とローカライズのためのエンドツーエンドパイプラインを提案する。
我々はFRUVEG67というデータセットをキュレートした。このデータセットには、制約のないシナリオでキャプチャされた67種類の果物や野菜の画像が含まれている。
Fruit and Vegetable Detection Network (FVDNet) は3つの異なるグリッド構成を持つYOLOv7のアンサンブルバージョンである。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:46:03 GMT)
Causal Reinforcement Learning for Optimisation of Robot Dynamics in Unknown Environments [4.5] 本研究は,ロボット操作の高度化に向けた新しい因果強化学習手法を導入する。
提案する機械学習アーキテクチャにより,ロボットは物体の視覚的特徴間の因果関係を学習することができる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:40:51 GMT)
On the Feasibility of Fully AI-automated Vishing Attacks [4.3] ヴァイシング攻撃は社会工学の一形態であり、攻撃者は個人を騙して機密情報を開示するために電話をかける。
我々は、AIの出現とともに、ヴァイシング攻撃がエスカレートする可能性について研究する。
我々は、公開AI技術を用いて開発されたAIを利用したバイシングシステムであるViKingを紹介する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:47:09 GMT)
"I Never Said That": A dataset, taxonomy and baselines on response clarity classification [4.2] 本稿では,応答の明瞭さを検出し分類するタスクを編み出した新しい分類法を提案する。
提案する2段階分類法は,質問に対する回答の明瞭度を,質問に対する情報提供の観点から明らかにする。
ChatGPTと人間のアノテーションを組み合わせて、政治インタビューから個別のQAペアを収集、検証、注釈付けします。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 20:15:06 GMT)
Exploring Scaling Laws for Local SGD in Large Language Model Training [4.1] モデルパラメータ,データセット,計算資源が与えられた従来の手法と比較して,局所的なSGDは競争力のある結果が得られることを示す。
これは、単一の大規模クラスタトレーニングの代替として、その生存性を示すものだ。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:02:48 GMT)
A Bottom-Up Approach to Class-Agnostic Image Segmentation [4.1] 本稿では,クラスに依存しないセグメンテーション問題に対処するためのボトムアップの新たな定式化を提案する。
我々は、その特徴空間の射影球に直接ネットワークを監督する。
ボトムアップの定式化は、クラスベースのセグメンテーション用に設計されたデータセットで訓練された場合でも、例外的な一般化能力を示す。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:56:02 GMT)
First Place Solution to the Multiple-choice Video QA Track of The Second Perception Test Challenge [4.1] The Second Perception Test Challenge(第2回知覚テストチャレンジ)のマルチチョイスビデオ質問回答トラックへの第1位ソリューションを提示する。
このコンペティションは複雑なビデオ理解の課題を提起し、ビデオコンテンツに関する質問を正確に理解し答えるモデルを必要とした。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:31:13 GMT)
Credit Card Fraud Detection: A Deep Learning Approach [4.0] 不正なクレジットカード取引により、多くの機関や個人によって実質的な金額が失われている。
本稿では,偽陽性率が非常に低い不正カバレッジを得るために,Deep Learningアルゴリズムを理解し,実装することを目的とする。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:13:16 GMT)
'Since Lawyers are Males..': Examining Implicit Gender Bias in Hindi Language Generation by LLMs [4.0] 本研究はヒンディー語のテキスト生成における性差の暗黙的偏見を調査し,それを英語のそれと比較する。
以上の結果から, ヒンディー語では87.8%, 英語では33.4%であった。
この研究は、言語間での性別バイアスの変化を強調し、生成的AIシステムにおいてこれらのバイアスをナビゲートするための考察を提供する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:16:58 GMT)
Transforming disaster risk reduction with AI and big data: Legal and interdisciplinary perspectives [4.0] AIが法的枠組みや環境管理にどのように影響するかを論じる。
法的および環境的な考慮事項が、社会経済領域内でAIをいかに限定するかを検査する。
AI統合に基づいた適応的な法体系を構築するために、学際的なコラボレーションのための青写真を提供する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:08:34 GMT)
Convergence of Distributed Adaptive Optimization with Local Updates [3.9] 局所的な更新(間欠的通信)による分散適応アルゴリズムの研究
局所SGD em with momentum (em Local em SGDM) and em Local em Adam can beperform their minibatch equivalents in convex and weakly convex settings。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 01:45:10 GMT)
LM-assisted keyword biasing with Aho-Corasick algorithm for Transducer-based ASR [3.8] そこで本研究では,音声認識性能向上のためのライトオンザフライ方式を提案する。
我々は、名前付きエンティティのバイアスリストと単語レベルのn-gram言語モデルと、Aho-Corasick文字列マッチングアルゴリズムに基づく浅い融合アプローチを組み合わせる。
逆実時間係数の実用的差のない一般単語誤り率の21.6%の相対的な改善を実現した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:53:37 GMT)
A generalizable framework for unlocking missing reactions in genome-scale metabolic networks using deep learning [3.8] CLOSEgapsは、代謝ネットワークをハイパーグラフとしてマッピングし、そのハイパートポロジー機能を学び、欠落した反応とギャップを識別するディープラーニングツールである。
その結果, CLOSEgaps は人工的に導入した GEM の 96% 以上のギャップを正確に埋めることができた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:47:44 GMT)
MRSO: Balancing Exploration and Exploitation through Modified Rat Swarm Optimization for Global Optimization [3.8] 本研究では,探索と搾取のバランスを高めるため,MRSO(Modified Rat Swarm)を導入する。
MRSOは探索効率と耐久性を改善するために独自の改良を加えており、溶接ビーム、圧力容器、ギヤトレインの設計といった挑戦的な工学的問題に適合している。
CEC 2019ベンチマークでは、MRSOは10機能中6機能で標準RSOよりも優れており、優れたグローバル検索能力を示している。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:52:25 GMT)
Deep Generative Adversarial Network for Occlusion Removal from a Single Image [3.6] 本稿では,完全自動2段階畳み込みニューラルネットワークを提案する。
我々は、GANを利用して、構造とテクスチャの両方を含む現実的なコンテンツを、インペイントのための単一ショットで合成する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:00:45 GMT)
A User Study on Contrastive Explanations for Multi-Effector Temporal Planning with Non-Stationary Costs [3.5] 我々は、スマートホームの時間的計画にエンドユーザーアプリケーションでコンストラッシブな説明を採用する。
ユーザは、アプライアンスタスクの実行に関する要件、動的エネルギー関税によるエネルギーの支払い、高容量のバッテリーストレージへのアクセス、グリッドへのエネルギー販売を行うことができる。
以上の結果から,質問や説明を対照的に提供したユーザは,満足度が高く,理解度が向上する傾向があり,AIの推奨スケジュールにより有用度が向上することが示唆された。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:48:25 GMT)
Engagement, Content Quality and Ideology over Time on the Facebook URL Dataset [3.4] 本研究は,2017年1月から2020年12月までの米国におけるニュースURLに関するユーザエンゲージメント指標について検討した。
ニュースソースのイデオロギー的アライメントと質を,ユーザの政治的嗜好と合わせて取り入れることで,リベラル,保守的,中道的な読者を対象に,イデオロギーとニュース消費の質の重み付け平均を構築した。
両指標のトレンドには,ユーザエンゲージメントの変化に伴う2つの大きな変化がある。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 12:50:17 GMT)
Classification of Buried Objects from Ground Penetrating Radar Images by using Second Order Deep Learning Models [3.3] 埋蔵物を分類するために,共分散行列に基づく新しい分類モデルを構築した。
提案手法はGPRデータ用に設計された浅層ネットワークよりも優れていることを示す。
また、異なる気象モードや考慮事項から、トレーニングデータとテストセットが得られた場合のモデルの関心についても説明する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:42:30 GMT)
Validity of Feature Importance in Low-Performing Machine Learning for Tabular Biomedical Data [3.3] 性能の低いモデルも特徴として有用であることを示す。
完全なデータセットから得られた特徴のランクを、サンプルサイズ(データカット)を減らしたもの(機能カット)または少ないもの(機能カット)と比較する。
データサイズが十分であれば,性能の低いレベルでも,機能の重要性の妥当性を維持することができると結論付けた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:11:24 GMT)
Transfer Learning for E-commerce Query Product Type Prediction [3.1] グローバルマルチローカライズeコマース市場におけるQ2PT予測に焦点を当てる。
ローカルごとのQ2PTモデルと統合されたQ2PTモデルをベンチマークし、世界中の店舗でトレーニングデータとモデル構造を共有する。
我々は、世界20カ国にわたる大規模なeコマースデータセット上で、Q2PTモデルの定量的および定性的分析を行う。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:30:04 GMT)
Prithvi WxC: Foundation Model for Weather and Climate [2.9] Prithvi WxCは、Modern-Era Retrospective Analysis for Research and Applications, Version 2 (MERRA-2)から160変数を用いて開発された23億のパラメータ基盤モデルである。
このモデルは、異なる位相の気象現象を微細な解像度でモデル化するために、大きなトークン数に対応できるように設計されている。
本稿では, 自動回帰ロールアウト予測, ダウンスケーリング, 重力波フラックスパラメータ化, エクストリームイベント推定など, 課題のある下流タスクのセットでモデルを検証する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:53:17 GMT)
MCICSAM: Monte Carlo-guided Interpolation Consistency Segment Anything Model for Semi-Supervised Prostate Zone Segmentation [2.8] 半教師付き学習に基づく前立腺領域セグメンテーションに適用するためのモンテカルロ誘導補間一貫性セグメンテーションモデル(MCICSAM)を提案する。
Dice と Hausdorff Distance at 95th percentile (HD95) を用いてモデル性能を評価する。MCICSAM は Dice を 79.38% と 89.95% で、HD95 の値 3.12 と 2.27 をトランジションゾーンとトランジションゾーンで改善する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:13:34 GMT)
ChainBuddy: An AI Agent System for Generating LLM Pipelines [2.8] ChainBuddyは、ChainForgeプラットフォームに組み込まれた評価パイプラインを生成するためのAIアシスタントである。
本稿では,ChainBuddyをベースラインインタフェースと比較した内的ユーザスタディを報告する。
AIアシスタントを使用する場合、参加者は要求の少ない作業負荷を報告した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:42:33 GMT)
Irreversible Diagonalization of Mechanical Quantities and the EPR Paradox [2.7] 量子力学的射影作用素の閉包関係は完全に真ではなく、フォック状態のユニタリ変換の下で厳密にファルシファイドすることができる。
角運動量 $J_x$, $J_y$, $J_z$ は、フォック状態における連続回転変換の正則集合 $|phi_nrangle$ の下で同時に対角化される。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:26:12 GMT)
Causal Feature Selection Method for Contextual Multi-Armed Bandits in Recommender System [2.7] 機械学習モデルの特徴選択手法は、文脈的マルチアームバンディット(MAB)のユースケースでは不十分である。
本稿では,連続MAB問題を対象としたモデルフリー特徴選択手法を提案する。
その結果、この特徴選択法は、文脈的MAB報酬の増大につながる重要な特徴を効果的に選択することを示した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 20:39:23 GMT)
Sine Wave Normalization for Deep Learning-Based Tumor Segmentation in CT/PET Imaging [2.5] 本報告では, オートPETIIIチャレンジのために開発されたCT/PETスキャンにおける腫瘍自動分節の正規化ブロックについて述べる。
SineNormalはPETデータに周期的な正弦変換を適用して病変検出を強化する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:20:11 GMT)
Security analysis of the Australian Capital Territory's eVACS 2020/2024 paperless direct recording electronic voting system [2.4] 本報告では,Ada Web Services Libraryにおける2つの暗号エラーがeVACSに与える影響について述べる。
これらのエラーは、2024年3月に公開された2024 eVACSコードの検査とテストの過程で確認した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:16:35 GMT)
A Survey on Moral Foundation Theory and Pre-Trained Language Models: Current Advances and Challenges [2.4] 道徳的価値は初期の文明に深く根ざし、社会秩序と共通の善を規制する規範や法則の中で成文化された。
モラル・ファンデーション理論(MFT)は、異なる文化が個人や社会生活を形作る方法の基礎となる道徳的基盤を識別する確立した枠組みである。
自然言語処理,特にプレトレーニング言語モデル(PLM)の最近の進歩は,テキストデータから道徳的次元の抽出と分析を可能にしている。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:03:06 GMT)
Exploring Actions, Interactions and Challenges in Software Modelling Tasks: An Empirical Investigation with Students [2.4] 学生のモデリング知識とモデリング行動を探究することを目的としている。
また、特定のモデリングツールのモデリングタスクを解決しつつ、学生の課題についても検討したい。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:03:54 GMT)
Towards Nudging in BPM: A Human-Centric Approach for Sustainable Business Processes [2.3] ナッジ(英: Nudging)は、心理学と行動経済学のアプローチであり、人々の行動を導く。
我々は、BPMライフサイクルの異なるフェーズにヌージングがどのように統合されるかを示します。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 07:43:53 GMT)
Information Reconciliation for Continuous-Variable Quantum Key Distribution Beyond the Devetak-Winter Bound Using Short Blocklength Error Correction Codes [2.2] この2段階の復号法を用いることで,デベタック・Winter境界を超える秘密鍵レートを達成可能であることを示す。
短ブロック長の低密度パリティチェックコードを用いてプロトコルをシミュレートし,最大1.5。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:21:57 GMT)
Lightweight and Resilient Signatures for Cloud-Assisted Embedded IoT Systems [2.2] ハードウェアアシスト付き軽量・レジリエントシグナチャ(LRSHA)とその前方防犯バージョン(FLRSHA)
We create two novel digital signatures called Lightweight and Resilient Signatures with Hardware Assistance (LRSHA) and its Forwardsecure version (FLRSHA)。
彼らは、小さなキーと署名サイズで、ほぼ最適に署名する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 22:43:47 GMT)
Learning to Play Video Games with Intuitive Physics Priors [2.2] 我々は、多数のビデオゲームでよく一般化されたオブジェクトベースの入力表現を設計する。
これらの表現を用いて,幼児に類似したゲームを学ぶエージェントの能力を評価する。
以上の結果から,人間のようなオブジェクトインタラクションのセットアップが,複数のビデオゲームを遊べるように学習できることが示唆された。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 20:30:27 GMT)
Benchmarking Reliability of Deep Learning Models for Pathological Gait Classification [2.2] 最近研究者たちは、機械学習アルゴリズムの進歩を活用して、歩行変化の症状を検出することを試みた。
本稿では,翻訳を阻害するギャップを同定するための既存手法について分析する。
我々は,複数の病的歩行のカテゴリを確実に区別できるAMS-GCN (Asynchronous Multi-Stream Graph Convolutional Network) という強力なベースラインを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:47:45 GMT)
Fine Tuning Large Language Models for Medicine: The Role and Importance of Direct Preference Optimization [2.1] ファインチューニングの最も一般的な2つの方法は、スーパーバイザード・ファインチューニング(SFT)と直接選好最適化(DPO)である。
医学における5つの共通自然言語タスクにおけるSFTとDPOの性能を比較した。
SFTだけではテキストデータの分類に十分であるのに対し、DPOは、より複雑な臨床推論、要約、臨床トリアージのタスクのパフォーマンスを向上させる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 19:30:42 GMT)
Alternate Preference Optimization for Unlearning Factual Knowledge in Large Language Models [2.1] 機械学習は、特定のトレーニングデータの影響をモデルから効率的に排除することを目的としている。
既存の未学習手法は, 無視集合に関連する応答を抑制するために, 負のフィードバックのみに頼っている。
本稿では,AltPO(Alternate Preference Optimization)と呼ばれる新しい手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:05:07 GMT)
Longitudinal Segmentation of MS Lesions via Temporal Difference Weighting [2.0] 本稿では,ベースラインとフォローアップスキャンの時間的差を,差分重みブロックと呼ばれるユニークなアーキテクチャ的帰納バイアスによって明示的に取り込む新しい手法を提案する。
本研究は,2つのデータセットにまたがる最先端の縦・単点モデルと比較して,病変のセグメンテーションおよび病変検出において優れたスコアを得る。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:30:54 GMT)
Overcoming Data Limitations in Internet Traffic Forecasting: LSTM Models with Transfer Learning and Wavelet Augmentation [2.0] 小型ISPネットワークにおけるインターネットトラフィックの効果的な予測は、データ可用性の制限によって困難である。
本稿では2つのLSTMモデル(LSTMSeq2SeqとLSTMSeq2SeqAtn)を用いた転送学習とデータ拡張技術を用いてこの問題を考察する。
データセットは実際のインターネットトラフィックテレメトリを表し、さまざまなネットワークドメインにわたる多様なトラフィックパターンに関する洞察を提供する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 03:18:20 GMT)
An Adaptive End-to-End IoT Security Framework Using Explainable AI and LLMs [2.0] 本稿では,機械学習(ML),説明可能なAI(XAI),大規模言語モデル(LLM)を活用した,リアルタイムIoT攻撃検出および応答のための革新的なフレームワークを提案する。
私たちのエンドツーエンドフレームワークは、モデル開発からデプロイメントへのシームレスな移行を促進するだけでなく、既存の研究でしばしば欠落している現実世界のアプリケーション機能も表しています。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 03:09:23 GMT)
Unveiling Population Heterogeneity in Health Risks Posed by Environmental Hazards Using Regression-Guided Neural Network [1.9] 環境の危険は、特定の個人を不均等に高いリスクに陥らせる。
回帰誘導ニューラルネットワーク(RegNN)というハイブリッド手法を導入する。
ReGNNは、人工知能ニューラルネットワーク(ANN)を使用して予測器を非線形に結合し、焦点予測器と相互作用する潜在表現を生成する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:28:14 GMT)
From Cognition to Precognition: A Future-Aware Framework for Social Navigation [1.9] 本稿では,社会的に認識されたナビゲーションに取り組むための強化学習アーキテクチャであるFalconを提案する。
我々はSocial-HM3DとSocial-MP3Dという2つの新しいデータセットを含むSocialNavベンチマークを導入する。
我々は、最先端の学習法と古典的なルールベースの経路計画アルゴリズムを用いて、詳細な実験分析を行う。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:08:24 GMT)
Efficient and Discriminative Image Feature Extraction for Universal Image Retrieval [1.9] 様々な領域にまたがる強力な意味的イメージ表現を提供する普遍的特徴抽出装置のためのフレームワークを開発する。
Google Universal Image Embedding Challengeでは、mMP@5の0.721で、最先端の成果をほぼ達成しています。
類似の計算条件を持つ手法と比較して,従来の手法よりも3.3ポイント優れていた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:53:13 GMT)
Machine Learning for Analyzing Atomic Force Microscopy (AFM) Images Generated from Polymer Blends [1.8] 高分子膜から得られた原子間力顕微鏡画像内の領域を特定するために,教師なし学習技術を用いた新しい機械学習ワークフローを提案する。
このワークフローの目的は、2種類のポリマードメインの空間的位置を手動の介入をほとんど行わずに同定することである。
上記の課題に適用可能なコンピュータビジョンや信号処理など,他の分野で使用されている既存手法について概観する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:31:46 GMT)
Recent Advances in Non-convex Smoothness Conditions and Applicability to Deep Linear Neural Networks [1.5] 本稿では,二項分類のためのネットワーク内で発生する滑らかさ条件について論じる。
我々は、それらが保持されているかどうかを判断し、二項分類のためのディープネットワークへの適用性を評価する条件を提供する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:26:47 GMT)
Slice it up: Unmasking User Identities in Smartwatch Health Data [1.5] 本稿では、時系列健康データに対する類似性に基づく動的時間ワープ(DTW)再識別攻撃のための新しいフレームワークを提案する。
私たちの攻撃はトレーニングデータとは独立しており、1つのCPUコア上で1万の被験者に対して約2分で類似性ランキングを計算します。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:58:11 GMT)
Time Distributed Deep Learning models for Purely Exogenous Forecasting. Application to Water Table Depth Prediction using Weather Image Time Series [1.4] グラナ・マイラ(IT)における水テーブル深度を予測するための2つの異なるディープラーニングモデルを提案する。
画像時系列を扱うために、どちらのモデルも最初のTime Distributed Convolutional Neural Network (TDC) で構成され、各ステップで利用可能な画像をベクトル表現にエンコードする。
TDC-LSTMはバイアスの低減に重点を置いており、TDC-UnPWaveNetは時間的ダイナミクスの最大化とKGEに重点を置いている。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 07:25:54 GMT)
MAGICS: Adversarial RL with Minimax Actors Guided by Implicit Critic Stackelberg for Convergent Neural Synthesis of Robot Safety [1.3] Inlicit Critic Stackelberg (MAGICS)により導かれるMinimaxアクターは、最小値平衡解への局所収束を保証する新しい逆強化学習(RL)アルゴリズムである。
我々は、MAGICSが最先端のニューラルセーフティ合成法よりも優れたロバスト制御ポリシーを実現できることを示す。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 19:45:48 GMT)
A Deep Learning Approach for Pixel-level Material Classification via Hyperspectral Imaging [1.3] ハイパースペクトル(HS)イメージングは、X線蛍光やラマン分光のような従来の技術よりも有利である。
本研究では,HSイメージングと深層学習を併用した材料評価の可能性について検討した。
このモデルは99.94%の分類精度を達成し、色、サイズ、形状のばらつきの堅牢さを示し、材料重なりを効果的に扱った。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:38:48 GMT)
Morphological Detection and Classification of Microplastics and Nanoplastics Emerged from Consumer Products by Deep Learning [1.2] プラスチック汚染は世界的な問題となり、健康や環境システムに影響を及ぼす。
これらの汚染物質を研究する伝統的な方法は、労働集約的で時間を要する。
本稿では,マイクロ・ナノプラスチックの自動検出と分類を目的とした,新しいオープンソースデータセットであるMiNaとマイクロ・ナノプラスチックについて紹介する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:56:25 GMT)
Dermatologist-like explainable AI enhances melanoma diagnosis accuracy: eye-tracking study [1.2] 人工知能(AI)システムは皮膚科医のメラノーマの診断精度を大幅に改善した。
これらの進歩にもかかわらず、皮膚科医がAIとXAIの両方のツールとどのように関わるかの客観的評価には、依然として重要な必要性がある。
そこで本研究では,76名の皮膚科医を対象に,XAIシステムを用いてメラノーマとネビの16例の皮膚内視鏡像の診断を行った。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:08:33 GMT)
GAProtoNet: A Multi-head Graph Attention-based Prototypical Network for Interpretable Text Classification [1.2] GAProtoNetは、新しいホワイトボックスマルチヘッドグラフアテンションベースのプロトタイプネットワークである。
提案手法は,元のブラックボックスLMの精度を犠牲にすることなく,優れた結果が得られる。
プロトタイプクラスタのケーススタディと可視化は,LMを用いて構築したブラックボックスモデルの決定を効率的に説明できることを示す。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:15:17 GMT)
A Plug-and-Play Method for Guided Multi-contrast MRI Reconstruction based on Content/Style Modeling [1.2] 誘導再建のためのモジュラー2段階手法を提案する。
放射線学的な課題として、MUNITは診断品質における臨床再建よりも33.3%の加速を可能にした。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:08:51 GMT)
ShizishanGPT: An Agricultural Large Language Model Integrating Tools and Resources [1.1] シジシャンGPTはRetrieval Augmented Generationフレームワークとエージェントアーキテクチャに基づく農業のためのインテリジェントな質問応答システムである。
ShizishanGPTは5つの主要なモジュールから構成される: 一般的な質問に答えるための汎用的なGPT-4ベースのモジュール; 大きな言語モデルの知識をタイムリーに更新できない問題に補償する検索エンジンモジュール。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:30:45 GMT)
Measuring Error Alignment for Decision-Making Systems [1.1] 本稿では,2つの行動アライメント指標の誤分類契約を提案する。
私たちのメトリクスはRAメトリクスとよく相関しており、補完的な情報を他のBAメトリクスに提供しています。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 21:59:13 GMT)
Continual Learning for Multimodal Data Fusion of a Soft Gripper [1.1] あるデータモダリティに基づいてトレーニングされたモデルは、異なるモダリティでテストした場合、しばしば失敗する。
異なるデータモダリティを漸進的に学習できる連続学習アルゴリズムを提案する。
我々は、アルゴリズムの有効性を、挑戦的なカスタムマルチモーダルデータセット上で評価する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:53:27 GMT)
Tackling fluffy clouds: field boundaries detection using time series of S2 and/or S1 imagery [1.0] 本研究では,Sentinel-2 (S2) とSentinel-1 (S1) 画像からの時系列データを利用して,多様な雲条件下での性能向上を行う手法を提案する。
2つのモデルが提案されている: PTAViT3DはS2またはS1データを独立に処理し、PTAViT3D-CAは両方のデータセットを融合して精度を高める。
以上の結果から,S1モデルでは,部分的(S2やS2,S1データ融合)や密集クラウドカバー(S1)においても,S2画像に匹敵する性能を提供する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:10:04 GMT)
The Relevance of Item-Co-Exposure For Exposure Bias Mitigation [1.0] 暗黙のフィードバックレコメンダシステムでは、ログ化されたインタラクションに影響を与え、最終的には彼ら自身のレコメンデーションに影響を与えます。
この効果は露光バイアスと呼ばれ、フィルターバブルやエコーチャンバーなどの問題を引き起こす可能性がある。
従来の研究では、合成データの露出バイアスを低減するために、露出情報を持つマルチノミアルロジットモデル(MNL)が用いられていた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 07:36:54 GMT)
High-Resolution Flood Probability Mapping Using Generative Machine Learning with Large-Scale Synthetic Precipitation and Inundation Data [1.0] Flood-Precipitation Generative Adversarial Network (Flood-Precipitation Generative Adversarial Network)は、生成機械学習を利用して大規模な人工浸水データをシミュレートする新しい手法である。
Flood-Precip GANは、高解像度の洪水確率マップを作成するのに必要な合成洪水深度データを生成するスケーラブルなソリューションを提供する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 22:43:31 GMT)
Evaluating the plausibility of synthetic images for improving automated endoscopic stone recognition [0.9] 現在、Morpho-Constitutional Analysis (MCA) は腎臓結石の組織学的診断における事実上のアプローチである。
近年では、内視鏡的石盤認識(ESR)と呼ばれる、そのようなタスクを術中実行することに焦点を当てている。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:19:08 GMT)
A Multiple-Fill-in-the-Blank Exam Approach for Enhancing Zero-Resource Hallucination Detection in Large Language Models [0.9] 大型言語モデル (LLM) はしばしば幻覚テキストを作成する。
本稿では,マルチフィル・イン・ザ・ブランク試験を取り入れた幻覚検出手法を提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:34:30 GMT)
Deterministic versus stochastic dynamical classifiers: opposing random adversarial attacks with noise [0.9] CVFRモデル(Continuous-Variable Firing Rate、CVFR)は、興奮性生物学的ニューロンの相互交叉ダイナミクスを記述するために用いられる。
このモデルには、ノード間結合行列に自己整合的に埋め込まれた植込み誘引器のセットが供給される。
CVFRモデルの変種も研究され、不可逆的ランダム攻撃に対して堅牢であることが判明し、分類対象の項目が破損した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 12:59:16 GMT)
Utility of Multimodal Large Language Models in Analyzing Chest X-ray with Incomplete Contextual Information [0.9] 大規模言語モデル (LLM) は, 臨床現場での利用が進んでいるが, 不完全な放射線学報告に悩まされることがある。
胸部X線撮影では,マルチモーダルLSM(テキストと画像を用いた)が精度と理解を向上できるかどうかを検討した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 01:42:53 GMT)
Prompting Large Language Models for Supporting the Differential Diagnosis of Anemia [0.9] 実際には、臨床医は、検査、観察、イメージングなどの一連の手順に従って診断を行う。
診断決定に到達するための経路は、専門家組織が作成したガイドラインによって文書化され、これらの手順を通じて臨床医が正しい診断に到達するよう指導する。
本研究の目的は,臨床ガイドラインで得られるものと同様の経路を発達させることであった。
我々は3つのLarge Language Model (LLMs) -Generative Pretrained Transformer 4 (GPT-4)、Large Language Model Meta AI (LLaMA)、Mistral - を、貧血とそのサブタイプを識別するための合成的で現実的なデータセットでテストした。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:47:36 GMT)
Learning Ordering in Crystalline Materials with Symmetry-Aware Graph Neural Networks [0.8] グラフィカルニューラルネットワーク(GCNN)は、結晶材料の化学空間をスクリーニングする機械学習のワークホースとなっている。
我々は、多成分材料の秩序依存エネルギーを捉えるために、様々なニューラルネットワークアーキテクチャーをベンチマークする。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 18:53:48 GMT)
pAE: An Efficient Autoencoder Architecture for Modeling the Lateral Geniculate Nucleus by Integrating Feedforward and Feedback Streams in Human Visual System [0.7] 本稿では,人間の視覚情報処理を近似した深部畳み込みモデルを提案する。
本研究の目的は、訓練された浅部畳み込みモデルを用いて、外側原核(LGN)領域の機能を近似することである。
pAEモデルは最終99.26%の予測性能を達成し、時間モードでの人間の結果よりも約28%向上したことを示す。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:33:01 GMT)
The Impact of Feature Embedding Placement in the Ansatz of a Quantum Kernel in QSVMs [0.5] 量子埋め込みカーネル(QEK)における様々なアーキテクチャパターンの研究と分類を行う。
既存の建築様式は文献が想定しているように振る舞わないことを示す。
我々は、古いものに基づいた新しい代替アーキテクチャを作成し、古いものよりも少ないゲートを含む一方で、同等に機能することを示す。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 01:25:13 GMT)
Pennsieve: A Collaborative Platform for Translational Neuroscience and Beyond [0.5] Pennsieveはオープンソースでクラウドベースの科学データ管理プラットフォームである。
複雑なマルチモーダルデータセットをサポートし、データの視覚化と分析のためのツールを提供する。
Pennsieveは125TB以上の科学的データを格納し、350以上のハイインパクトデータセットで35TB以上のデータを公開している。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 19:02:51 GMT)
Economic Policy Challenges for the Age of AI [0.3] 本稿では、AIの人工知能(AGI)への転換的進歩が、経済学者や経済政策立案者にもたらす大きな課題について考察する。
私は、AIの時代が、労働の役割を減らし、前例のない生産性向上をもたらすことによって、経済の基本的な構造にどのように革命をもたらすかを検討するが、失業、所得分配、教育と人的資本の価値に対する懸念を提起する。
次に,AI時代の経済政策の課題として,(1)不平等・所得分配,(2)教育・技術開発,(3)社会的・政治的安定,(4)マクロ経済政策,(5)反トラスト・市場規制,(6)知的財産,(7)
論文参考訳(メタデータ) (Fri, 20 Sep 2024 02:49:37 GMT)
Towards the Discovery of Down Syndrome Brain Biomarkers Using Generative Models [0.0] 我々は変分オートエンコーダと拡散モデルに基づく最先端の脳異常検出モデルの評価を行った。
以上の結果から、ダウン症候群の脳解剖を特徴付ける一次変化を効果的に検出するモデルが存在することが示唆された。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 12:01:15 GMT)
Time Awareness in Large Language Models: Benchmarking Fact Recall Across Time [0.0] 我々は、時間に敏感な事実を扱う大規模言語モデルの能力を厳格にテストするために設計された新しいデータセットを導入する。
我々のベンチマークは、LLMが自身の知識を正しい時間文脈とどのように一致させるかを測定するための体系的な方法を提供する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:57:20 GMT)
Stimulus-to-Stimulus Learning in RNNs with Cortical Inductive Biases [0.0] 大脳皮質に広まる2種類の誘導バイアスを用いた刺激置換の繰り返しニューラルネットワークモデルを提案する。
本研究では,モデルが幅広い条件づけ現象を発生させ,学習量と多数の関連性を学習可能であることを示す。
我々の枠組みは、大脳皮質におけるマルチコンパートメントニューロン処理の重要性を強調し、大脳皮質動物を進化の端とみなす方法を示している。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:01:29 GMT)
Spectrum Broadcast Structures from von Neumann type interaction Hamiltonians with continuous variables [0.0] 我々は最近確立されたスペクトル放送構造理論(SBS)に貢献する。
我々は、フォン・ノイマン型測定相互作用を介してN環境と相互作用する中心系の場合、SBSとSBSへの収束について検討する。
系が無限次元ヒルベルト空間によってモデル化され、ハミルトニアンの系に付随する作用素が純粋に連続スペクトルを持つ場合に焦点を当てる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:55:03 GMT)
Relationship between Uncertainty in DNNs and Adversarial Attacks [0.0] ディープニューラルネットワーク(DNN)は、アート結果の状態を達成し、多くの課題において人間の精度よりも優れています。
DNNは結果の不確実性を伴い、あるレベルの信頼の域外にある結果を予測する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 05:38:38 GMT)
Quantum evolutionary algorithm for TSP combinatorial optimisation problem [0.0] 本稿では、量子遺伝的アルゴリズム(QGA)を用いて、旅行セールスマン問題(TSP)と呼ばれる新しい問題を解決する方法を実装する。
我々は、この新しいアプローチがいかにうまく機能するかを、古典的遺伝的アルゴリズム(CGA)として知られる従来の手法と比較した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:27:42 GMT)
Quantum Speed limit on the production of quantumness of observables [0.0] 量子システムの古典的でない特徴は、環境や雑音にさらされると劣化することがある。
我々は、2つの与えられた可観測体の可観測子のノルムとして観測可能の量子性に速度制限を証明した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:02:39 GMT)
Quantum Monte Carlo for Economics: Stress Testing and Macroeconomic Deep Learning [0.0] 我々は、Quantum Monte Carlo(QMC)アルゴリズムが経済応用のランタイムを改善することができるかどうかを初めて研究する。
量子コンピューティング、特にQMCアルゴリズムの詳細を紹介する。
本稿では、QMCと古典計算システムの計算能力の潜在的な向上について論じ、QMCにおけるいくつかの革新について述べる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 21:27:09 GMT)
Quantum Computing for Energy Correlators [0.0] ハミルトニアン格子法を用いてエネルギー相関器を計算するための最初の数値戦略を導入する。
また、量子場理論におけるエネルギー相関子を計算するための量子アルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 18:14:53 GMT)
Protecting Africa's Future: Cybersecurity Strategies for Child Safety, Learning, and Skill Acquisition in Tanzania [0.0] アフリカ中の子供たちはインターネットからリスクが増している。
本稿では,第3世界のアフリカ諸国が子どものオンライン安全を確保する上で直面する課題について概説する。
これは、子供たちをオンラインの脅威から守るために他国が採用した効果的な慣行と政策を強調している。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 02:10:54 GMT)
Procedure Model for Building Knowledge Graphs for Industry Applications [0.0] グラフベースの未接続情報とドメイン知識の統合は、新たな洞察を提供する。
本稿では,RDF知識グラフ構築のための実践的なステップバイステッププロシージャモデルを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:46:37 GMT)
Probing Celestial Energy and Charge Correlations through Real-Time Quantum Simulations: Insights from the Schwinger Model [0.0] 実時間量子シミュレーションを用いて光線演算子(LRO)の相関関数を研究するための新しい手法を提案する。
量子シミュレータは、低次元の量子場理論における性質 LRO を探索する理想的な実験室を提供すると主張する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 18:00:07 GMT)
Predicting DNA fragmentation: A non-destructive analogue to chemical assays using machine learning [0.0] 世界の不妊率は増加しており、全出生の2.5%は2022年に体外受精(IVF)によって支えられている。
精子DNAの評価は伝統的に、IVFに対して精子細胞を不適格にする化学測定によって行われる。
最先端の機械学習の出現と、多くの分野における例外的なパフォーマンスにより、この研究はこれらの成功に基づいている。
精子の完全性を維持し、IVFのための精子の最適な選択を可能にする予測モデルをレンダリングする。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:04:12 GMT)
Pauli weight requirement of the matrix elements in time-evolved local operators: dependence beyond the equilibration temperature [0.0] 均一な積状態から始まるクエンチに「軽い」パウリ弦が適用できるかどうかを考察する。
場合によっては、光のパウリ弦は力学を記述するのに十分であり、現在のアルゴリズムによる効率的なシミュレーションを可能にしている。
演算子重みエントロピー(Operator Weight Entropy)を用いて,この振る舞いを分析する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:02:19 GMT)
More Clustering Quality Metrics for ABCDE [0.0] ABCDEは、非常に多数のアイテムのクラスタリングを評価する技術である。
本稿では,クラスタリング差分が品質向上に寄与する程度を特徴付けるため,IQと呼ばれる新しい指標を提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:24:39 GMT)
Leveraging Knowledge Graphs and LLMs to Support and Monitor Legislative Systems [0.0] 本研究は、立法プロセスの相乗効果と支援について、立法知識グラフとLLMを用いて検討する。
この目的のために、我々は、立法分析を行う可能性を高めるイタリアの法律に焦点を当てたインタラクティブなプラットフォームであるLegis AI Platformを開発する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:21:03 GMT)
Lecture notes on high-dimensional data [0.0] 改訂版が教科書(Mathematical Introduction to Data Science, Springer, Berlin, Heidelberg, 2024, https://link.springer.com/book007/978-3-662-69426-8)の一部として出版された。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:52:11 GMT)
Improved Unet brain tumor image segmentation based on GSConv module and ECA attention mechanism [0.0] U-Netアーキテクチャに基づく深層学習アルゴリズムである脳腫瘍に対する医用画像分割法の改良モデルについて述べる。
従来のU-Netに基づいて,医療画像分割作業におけるモデルの性能向上を目的としたGSConvモジュールとECAアテンション機構を導入する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 16:35:19 GMT)
Improve Machine Learning carbon footprint using Parquet dataset format and Mixed Precision training for regression models -- Part II [0.0] この論文では、回帰MLモデルをトレーニングしながら、Comma-Separated-Values(CSV)とデータセットフォーマットを使用した消費電力を、デフォルトの浮動小数点(32bit)とNvidiaの混合精度(16bitと32bit)と比較した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:54:44 GMT)
Hydrogen under Pressure as a Benchmark for Machine-Learning Interatomic Potentials [0.0] 機械学習原子間ポテンシャル(MLPs)は、原子系のポテンシャルエネルギー表面の高速でデータ駆動の代理モデルである。
圧力下での水素中の液体-液体相転移の性能を自動的に定量するベンチマークを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 10:44:40 GMT)
Hybrid-Order Topological Phase And Transition in 1H Transition Metal Compounds [0.0] 我々は1H遷移金属化合物中のハイブリッドオーダートポロジカル絶縁体(HOTI)を予測した。
我々の発見は、2次元電子材料における新しいハイブリッド秩序トポロジカル位相を明らかにし、スピントロニクスの応用を強調した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 06:45:00 GMT)
Hidden Activations Are Not Enough: A General Approach to Neural Network Predictions [0.0] 本稿では,クイバー表現理論のツールを用いたニューラルネットワーク解析のための新しい数学的枠組みを提案する。
データサンプルの帰納的クイバー表現を活用することで、従来の隠蔽層出力よりも多くの情報をキャプチャする。
結果はアーキテクチャ非依存でタスク非依存であり、広く適用できます。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 02:35:13 GMT)
Gravity as a mesoscopic system [0.0] 熱相関関数の時間変動とブラウン運動の間に概念的および定量的な類似性を引き出すため,確率的メソスコピック記述を用いる。
この定式化をAdS$_3$の半古典重力の場合に適用し、ワームホールの寄与をプロセスのモーメントとして自然に特定できることを示す。
この研究の結果、AdSの半古典重力は自然に量子重力のメソスコピックな記述として解釈でき、メソスコピックなホログラフィック双対性はモーメントvs-確率分布双対性として表されることが示された。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 18:00:00 GMT)
Graph-theoretical approach to the eigenvalue spectrum of perturbed higher-order exceptional points [0.0] 我々は、高次例外点の固有値スペクトルに対する摂動効果の理解に寄与するグラフ理論的視点を提唱する。
半無限導波路と端ミラーを結合したマイクロリングのシステムについて,実例を考察する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 11:56:15 GMT)
Global Outlier Detection in a Federated Learning Setting with Isolation Forest [0.0] 本稿では,特にクロスサイロシナリオをターゲットとした,フェデレーション学習環境におけるグローバルなアウトレイラの検出手法を提案する。
当社のアプローチでは、2つのサーバの使用と、クライアントから1つのサーバにマスキングされたローカルデータの送信を伴います。
データのマスキングは、外れ値の識別を引き続き許可しながら、機密情報の開示を防止する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 12:55:29 GMT)
Geometric contribution to adiabatic amplification in non-Hermitian systems [0.0] 断熱過程におけるベリー相の非エルミートアナログを実験的に測定した。
非エルミート系では、ベリー相は虚部を持ち、全波の強度の増幅や減衰に寄与する。
我々は、この経路独立が適切な対称性によって保証される非エルミートハミルトニアンのクラスを列挙する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:49:47 GMT)
Generative AI Carries Non-Democratic Biases and Stereotypes: Representation of Women, Black Individuals, Age Groups, and People with Disability in AI-Generated Images across Occupations [0.0] このエッセイは、生成的AIがアウトプットにエクイティ保存グループを含んでいるか、あるいは除外しているかを強調することを目的としている。
この結果から、生成的AIは性別、人種、年齢、可視性障害について公平に包括的ではないことが明らかとなった。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 19:47:31 GMT)
Generation of strong mechanical squeezing through the joint effect of two-tone driving and parametric pumping [0.0] 本研究では,2音駆動とパラメトリックポンピングの相乗的機構を利用して,強力なメカニカルスクイーズを効率的に作成する革新的な手法を提案する。
我々のプロジェクトは、幅広い条件で強力な機械的スクイーズを生成するために、多用途で効率的なアプローチを提供する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:31:50 GMT)
Generating Topologically and Geometrically Diverse Manifold Data in Dimensions Four and Below [0.0] 近年の研究では、合成4D画像型データが、4D畳み込みニューラルネットワークモデルのトレーニングに有用であることが示されている。
これらのモデルは、永続的ホモロジーのような既存のトポロジ的データ分析技術では不可能な画像前処理技術の使用を許容しているように見える。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:37:09 GMT)
Fusion and flow: formal protocols to reliably build photonic graph states [0.0] 最近提案されたフュージョンベースのアーキテクチャは、普遍性とフォールトトレランスを達成することを目的としている。
本稿では,線形光学,ZX計算,データフロープログラミングを融合して,フォトニック量子コンピューティングのためのフレームワークを開発する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:33:54 GMT)
Formal Power Series on Algebraic Cryptanalysis [0.0] 正則度と第一降下次数の上限は、しばしば暗号解析で用いられる。
十分に大きなフィールド上での計算システムの第一降下次数に関する理論的仮定を提供する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 01:09:22 GMT)
Flotta: a Secure and Flexible Spark-inspired Federated Learning Framework [0.0] Flottaは、バイオメディカルフィールドのような高度なセキュリティを必要とするコンテキストで研究を行う多党コンソーシアムに分散されたセンシティブなデータに基づいて、機械学習モデルをトレーニングするために設計されたフェデレートラーニングフレームワークである。
FlottaはApache Sparkのいくつかの側面にインスパイアされたPythonパッケージで、柔軟性とセキュリティの両方を提供し、コンソーシアム内部のマシンのみを使用して研究を行うことができる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:04:42 GMT)
Fast Analysis of the OpenAI O1-Preview Model in Solving Random K-SAT Problem: Does the LLM Solve the Problem Itself or Call an External SAT Solver? [0.0] 私は、モデルが直接解決するのではなく、外部SATソルバを呼び出しインスタンスを解決できることを示します。
我々は,OpenAI O1-previewモデルがインテリジェンスの火花を示すかどうかを定量化する分析法を提案し,提示する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 07:53:16 GMT)
Failures in Perspective-taking of Multimodal AI Systems [0.0] 本研究は,マルチモーダルAIシステムにおける空間表現に関するこれまでの研究を拡張した。
認知・発達科学の手法を応用し, GPT-4oの視点的能力を評価する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 22:31:46 GMT)
FAIR GPT: A virtual consultant for research data management in ChatGPT [0.0] FAIR GPTは、研究者や組織がFAIR原則に準拠したデータやメタデータを作成するのを支援するために設計されたChatGPTの最初の仮想コンサルタントである。
メタデータの改善、データセットの編成、リポジトリの選択に関するガイダンスを提供する。
本稿では,その特徴,応用,限界について述べる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 12:28:48 GMT)
Exploring the ability of the Deep Ritz Method to model strain localization as a sharp discontinuity [0.0] 弾塑性固体の変種設定において, 規則化された強不連続キネマティクスを用いる。
ニューラルネットワーク(ANN)を用いて,対応する数学的モデルを識別する
概念実証として、1次元および2次元の数値例を通して、弾塑性固体のひずみ局在の計算モデルが実現可能であることを示す。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 05:57:50 GMT)
Exploring Information Retrieval Landscapes: An Investigation of a Novel Evaluation Techniques and Comparative Document Splitting Methods [0.0] 本研究では, 教科書の構造的性質, 記事の簡潔さ, 小説の物語的複雑さについて, 明確な検索戦略が必要であることを示した。
オープンソースのモデルを用いて,質問対と回答対の包括的データセットを生成する新しい評価手法を提案する。
評価には、SequenceMatcher、BLEU、METEOR、BERT Scoreなどの重み付けされたスコアを使用して、システムの正確性と妥当性を評価する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:52:16 GMT)
Development and bilingual evaluation of Japanese medical large language model within reasonably low computational resources [0.0] 本稿では,近年の7Bモデルに基づく医療適応について述べる。
日本語医学データセットに基づく英語中心ベースモデルの微調整により,両言語のスコアが向上することが判明した。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:13:33 GMT)
Deep learning for fast segmentation and critical dimension metrology & characterization enabling AR/VR design and fabrication [0.0] 我々は,電子顕微鏡画像の多種多様なデータセットを用いて,事前訓練されたセグメンテーションモデル(SAM)の微調整について報告する。
低ランク適応(LoRA)のような手法を用いて、トレーニング時間を短縮し、ROI抽出の精度を高める。
モデルが見えない画像に一般化する能力はゼロショット学習を促進し、CD抽出モデルをサポートする。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 23:54:58 GMT)
Data Distribution Shifts in (Industrial) Federated Learning as a Privacy Issue [0.0] 我々は、少数の強力で潜在的に競合する工業者間のコラボレーションである産業連合学習を考察する。
この設定は、デバイス間設定などでは発生しないプライバシーリスクを隠蔽する、と我々は主張する。
攻撃者は、他のクライアントに対して微妙な分布シフトを検知できることを示す。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 20:09:19 GMT)
Data Compression using Rank-1 Lattices for Parameter Estimation in Machine Learning [0.0] 平均二乗誤差と正規化バージョンは、教師付き機械学習における標準的な損失関数である。
広範データセットをランク1格子を用いてより小さなサイズに縮小するアルゴリズムを提案する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 12:35:24 GMT)
ConvLSTMTransNet: A Hybrid Deep Learning Approach for Internet Traffic Telemetry [0.0] 本稿では,時系列予測のためのハイブリッドディープラーニングモデルConvLSTMTransNetを提案する。
以上の結果から,ConvLSTMTransNetは予測精度において,ベースラインモデルよりも約10%優れていた。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 03:12:57 GMT)
Contextualized AI for Cyber Defense: An Automated Survey using LLMs [0.0] 本稿では,サイバー防御能力向上におけるコンテキストAIの可能性について検討する。
私たちは、組織的信頼とガバナンスフレームワークのギャップを指摘しながら、堅牢性、信頼性、統合方法に重点を置いています。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 14:05:40 GMT)
Contextual Breach: Assessing the Robustness of Transformer-based QA Models [0.0] 文脈問合せモデルは、入力コンテキストに対する逆の摂動に影響を受けやすい。
異なる7種類の対立雑音を文脈に組み込んだユニークなデータセットを導入する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 13:34:44 GMT)
Colorful Diffuse Intrinsic Image Decomposition in the Wild [0.0] 固有の画像分解は、1枚の写真から反射率と効果を分離することを目的としている。
本研究では,入力画像から拡散アルベド,カラフルな拡散シェーディング,特異残留成分を分離する。
拡張された内在モデルにより、写真の照度を意識した分析が可能となり、画像編集に利用することができる。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 17:59:40 GMT)
Coherent dynamics of a nuclear-spin-isomer superposition [0.0] 本稿では、2つの非結合核-スピン-異性体状態間の強い結合を生み出すために、スペクトルの回避された交差を利用するスキームを提案する。
我々は,4レベルハミルトニアンを用いて体系をモデル化し,システムの異なる状態とパラメータのコヒーレントなダイナミクスを探索する。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 08:30:53 GMT)
BoilerTAI: A Platform for Enhancing Instruction Using Generative AI in Educational Forums [0.0] 本稿では,Generative AI(GenAI)とオンライン教育フォーラムをシームレスに統合する,実用的でスケーラブルなプラットフォームについて述べる。
このプラットフォームは、学生ポストとLarge Language Model(LLM)との対話を円滑に進めることによって、指導スタッフが反応を効率的に管理し、洗練し、承認することを可能にする。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 04:00:30 GMT)
Autonomous Visual Fish Pen Inspections for Estimating the State of Biofouling Buildup Using ROV -- Extended Abstract [0.0] 魚のケージ検査は、小規模でも工業でも、どんな魚農場でも必要なメンテナンス作業である。
定期的な検査を行う訓練されたダイバーを 自律的な海洋車両に置き換えれば 人力のコストを下げる 水中検査を行う人間に関連するリスクを取り除く
本研究の目的は、ROVのための自律制御アルゴリズムの開発から、魚介類の画像の自動分割、バイオファウリング状態の正確な推定に至るまで、これらの検査プロセスを自動化するための完全なソリューションを提案することである。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 09:01:22 GMT)
Augmenting the Interpretability of GraphCodeBERT for Code Similarity Tasks [0.0] 本稿では,GraphCodeBERTを用いた類似性評価の透明性向上を目的としたアプローチを提案する。
このアプローチは、類似のコードフラグメントを特定し、その識別の背後にある理由を明らかにし、開発者が結果をよりよく理解し、信頼するのに役立つ。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 12:09:49 GMT)
Analyzing the Effect of $k$-Space Features in MRI Classification Models [0.0] 医用イメージングに適した説明可能なAI手法を開発した。
我々は、画像領域と周波数領域の両方にわたるMRIスキャンを分析する畳み込みニューラルネットワーク(CNN)を採用している。
このアプローチは、初期のトレーニング効率を高めるだけでなく、追加機能がモデル予測にどのように影響するかの理解を深めます。
論文参考訳(メタデータ) (Fri, 20 Sep 2024 15:43:26 GMT)