GIVE: Structured Reasoning of Large Language Models with Knowledge Graph Inspired Veracity Extrapolation [108.2] Graph Inspired Veracity Extrapolation (GIVE)は、パラメトリックメモリと非パラメトリックメモリを融合して、最小の外部入力で正確な推論を改善する新しい推論手法である。
GIVE は LLM エージェントをガイドして,最も関連する専門家データ (observe) を選択し,クエリ固有の発散思考 (reflect) に従事し,その情報を合成して最終的な出力 (speak) を生成する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 22:44:31 GMT)
Case2Code: Scalable Synthetic Data for Code Generation [105.9] 大規模言語モデル(LLM)は、コード生成において顕著なブレークスルーを示している。
最近の研究は、いくつかの強力なLLMによって生成された合成データをトレーニングすることで、コードLLMを改善している。
プログラムの表現性と正確性を利用したtextbfCase2Code タスクを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:27:57 GMT)
Enhancing Visual-Language Modality Alignment in Large Vision Language Models via Self-Improvement [102.2] 大規模視覚言語モデル(LVLM)は、視覚的質問応答および推論タスクにおいて印象的な結果を得た。
既存の手法は、しばしば外部モデルやデータに依存し、制御不能で不安定なアライメント結果をもたらす。
本稿では,外部依存を伴わない視覚的・言語的モダリティアライメントを向上させる自己改善フレームワークSIMAを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:50:41 GMT)
Transformers to SSMs: Distilling Quadratic Knowledge to Subquadratic Models [92.4] 本稿では,事前学習したトランスフォーマーアーキテクチャを,状態空間モデル(SSM)などの代替アーキテクチャに蒸留する手法を提案する。
提案手法はMOHAWKと呼ばれ、3Bトークンと5Bトークンを用いたハイブリッドバージョン(Hybrid Phi-Mamba)を用いてPhi-1.5アーキテクチャに基づくMamba-2変異体を蒸留することができる。
Phi-Mambaは、スクラッチからモデルのトレーニングに使用されるトレーニングデータの1%未満を使用してはいるが、過去のオープンソース非トランスフォーマーモデルと比較して、大幅にパフォーマンスが向上している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:53:16 GMT)
Towards Trustworthy Retrieval Augmented Generation for Large Language Models: A Survey [92.4] Retrieval-Augmented Generation (RAG)は、AIGC(AIGC)の課題に対処するために設計された高度な技術である。
RAGは信頼性と最新の外部知識を提供し、幻覚を減らし、幅広いタスクで関連するコンテキストを保証する。
RAGの成功と可能性にもかかわらず、最近の研究により、RAGパラダイムはプライバシーの懸念、敵対的攻撃、説明責任の問題など、新たなリスクももたらしていることが示されている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:50:47 GMT)
Interactive Task Planning with Language Models [89.6] 対話型ロボットフレームワークは、長期のタスクプランニングを達成し、実行中であっても、新しい目標や異なるタスクに容易に一般化することができる。
最近の大規模言語モデルに基づくアプローチは、よりオープンな計画を可能にするが、しばしば、重いプロンプトエンジニアリングまたはドメイン固有の事前訓練されたモデルを必要とする。
言語モデルを用いた対話型タスクプランニングを実現するための,高レベルプランニングと低レベルスキル実行を併用したシンプルなフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:22:08 GMT)
Revisiting 360 Depth Estimation with PanoGabor: A New Fusion Perspective [89.5] 本稿では,これらの課題に対処するため,指向性歪みを考慮したGabor Fusionフレームワーク(PGFuse)を提案する。
再帰的歪みに対処するために、線形緯度対応の歪み表現法を設計し、カスタマイズされた歪み対応ガボルフィルタを生成する。
ガボル変換の配向感度を考慮すると、この感度を安定させるために球面勾配制約を導入する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:13:26 GMT)
Position: LLMs Can be Good Tutors in Foreign Language Education [87.9] 我々は、外国語教育(FLE)において、大きな言語モデル(LLM)が効果的な家庭教師として機能する可能性を主張する。
具体的には、(1)データエンハンサーとして、(2)学習教材の作成や学生シミュレーションとして、(2)タスク予測器として、学習者の評価や学習経路の最適化に、(3)エージェントとして、そして、パーソナライズされた包括的教育を可能にする3つの重要な役割を果たせる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:48:49 GMT)
InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.1] 3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:36:40 GMT)
Learning from models beyond fine-tuning [78.2] Learn From Model (LFM) は、モデルインターフェースに基づいた基礎モデル(FM)の研究、修正、設計に焦点を当てている。
LFM技術の研究は、モデルチューニング、モデル蒸留、モデル再利用、メタラーニング、モデル編集の5つの分野に大別できる。
本稿では, LFM の観点から, FM に基づく現在の手法を概観する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:18:16 GMT)
Ranking-aware adapter for text-driven image ordering with CLIP [76.8] 本稿では,CLIPモデルを学習からランクへのタスクに再構成する,効率的かつ効率的な手法を提案する。
我々のアプローチは、ランキングの目的のために新しい指示に適応するための学習可能なプロンプトを取り入れている。
私たちのランキングアウェアアダプタは、様々なタスクにおいて微調整されたCLIPよりも一貫して優れています。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:25:39 GMT)
WorldCuisines: A Massive-Scale Benchmark for Multilingual and Multicultural Visual Question Answering on Global Cuisines [74.3] 視覚言語モデル(VLM)は、特に英語以外の言語において、文化特有の知識に苦しむことが多い。
我々は多言語および多文化の視覚的理解のための大規模ベンチマークであるWorld Cuisinesを紹介した。
このベンチマークには、30の言語と方言にまたがるテキストイメージペアを備えた、視覚的質問応答(VQA)データセットが含まれている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:48:22 GMT)
Learning Task Representations from In-Context Learning [73.7] 大規模言語モデル(LLM)は、文脈内学習において顕著な習熟性を示している。
ICLプロンプトにおけるタスク情報をアテンションヘッドの関数として符号化するための自動定式化を導入する。
提案手法の有効性は,最後の隠れ状態の分布と最適に実行されたテキスト内学習モデルとの整合性に起因していることを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:16:44 GMT)
Rethinking Link Prediction for Directed Graphs [73.4] 有向グラフのリンク予測は、様々な現実世界のアプリケーションにとって重要な課題である。
埋め込み手法とグラフニューラルネットワーク(GNN)の最近の進歩は、有望な改善を示している。
本稿では,既存手法の表現性を評価するための統一的なフレームワークを提案し,二重埋め込みとデコーダ設計が性能に与える影響を強調した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 23:51:05 GMT)
A Probabilistic Framework for LLM Hallucination Detection via Belief Tree Propagation [72.9] 本稿では,幻覚検出のための確率的フレームワークであるBelief Tree Propagation (BTProp)を提案する。
BTPropは、親ステートメントを子ステートメントに分解することで、論理的に関連するステートメントの信念ツリーを導入する。
複数の幻覚検出ベンチマークにおいて,AUROCとAUC-PRにより評価された基準線を3%-9%改善する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:06:12 GMT)
BlinkVision: A Benchmark for Optical Flow, Scene Flow and Point Tracking Estimation using RGB Frames and Events [72.3] 我々はBlinkVisionを提案する。BlinkVisionは大規模かつ多彩なベンチマークで、複数のモダリティと高密度対応アノテーションを持つ。
BlinkVisionは、フォトリアリスティックなデータを提供し、カメラの揺らぎや変形など、さまざまな自然主義的な要素をカバーしている。
画像ベースとイベントベースの両方の3種類の対応タスク(光学フロー、点追跡、シーンフロー推定)の広範なベンチマークを可能にする。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:26:40 GMT)
AdaFlow: Efficient Long Video Editing via Adaptive Attention Slimming And Keyframe Selection [70.6] 我々は,AdaFlowと呼ばれる,効率的かつ効果的な長編ビデオ編集のための,新規かつトレーニング不要なアプローチを提案する。
AdaFlowは、1つの推論、すなわち1つのA800 GPU上の1$k$フレームで高品質なビデオ編集時間を達成している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:46:28 GMT)
ReNeg: Learning Negative Embedding with Reward Guidance [69.8] テキスト・ツー・イメージ(T2I)生成アプリケーションでは、負の埋め込みは生成品質を向上させるための単純で効果的なアプローチであることが証明されている。
Rewardモデルにより導かれる改良された負の埋め込みを学習するために設計されたエンドツーエンドの手法であるReNegを紹介する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:36:19 GMT)
On Memory Construction and Retrieval for Personalized Conversational Agents [69.5] 本稿では,対話モデルを導入し,圧縮メモリ単位に基づいたメモリ検索を行い,話題セグメントを持つメモリバンクを構築するSeComを提案する。
実験結果から, LOCOMOやLong-MT-Bench+のような長期会話ベンチマークにおいて, ターンレベル, セッションレベル, および要約に基づくいくつかの手法よりも優れた結果が得られた。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:28:36 GMT)
AnyEdit: Edit Any Knowledge Encoded in Language Models [69.3] 大規模言語モデル(LLM)のための新しい自動回帰編集パラダイムであるAnyEditを提案する。
長い形式の知識を逐次チャンクに分解し、各チャンク内のキートークンを反復的に編集し、一貫性と正確な出力を保証する。
UnKEBench、AKEW、そして我々の長文の多様な知識のための新しいEditEverythingデータセットを含むベンチマークでは、強いベースラインを21.5%上回っている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:18:37 GMT)
From Loops to Oops: Fallback Behaviors of Language Models Under Uncertainty [67.8] 大型言語モデル(LLM)は幻覚やシーケンスの繰り返しのような望ましくない振る舞いを示すことが多い。
転倒行動(シークエンス反復、退化テキスト、幻覚)を分類し、それらを広範囲に分析する。
我々の実験では、これらのすべての軸にまたがる、明確な、一貫したフォールバック動作の順序が明らかになりました。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:48:33 GMT)
FlowTS: Time Series Generation via Rectified Flow [67.4] FlowTSは、確率空間における直線輸送を伴う整流フローを利用するODEベースのモデルである。
非条件設定では、FlowTSは最先端のパフォーマンスを達成し、コンテキストFIDスコアはStockとETThデータセットで0.019と0.011である。
条件設定では、太陽予測において優れた性能を達成している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:19:45 GMT)
LC-Protonets: Multi-Label Few-Shot Learning for World Music Audio Tagging [65.7] ラベル結合型プロトタイプネットワーク(LC-Protonets)を導入し,複数ラベルの複数ショット分類の問題に対処する。
LC-Protonetsは、限られたトレーニング項目に存在するラベルのパワーセットから、ラベルの組み合わせごとに1つのプロトタイプを生成する。
本手法は,様々な文化をカバーし,現代音楽と伝統音楽の両方を含む,多様な音楽データセットにまたがる自動音声タグ付けに適用する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:11:34 GMT)
XAMPLER: Learning to Retrieve Cross-Lingual In-Context Examples [64.8] XAMPLER: 言語横断学習の課題に対処するための手法であるクロス言語実例検索法を紹介する。
XAMPLERはまず、多言語小言語モデルであるGlot500に基づいてレトリバーを訓練する。
ターゲット言語の文脈内学習の例として、英語の例を直接検索することができる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:44:14 GMT)
A Recipe of Parallel Corpora Exploitation for Multilingual Large Language Models [64.8] 最近の研究は、多言語大言語モデルを強化するために並列コーパスを利用する可能性を強調している。
並列コーパスで強化された多言語大言語モデルの性能に及ぼす並列コーパスの品質と量,訓練目標,モデルサイズの影響について検討した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:46:52 GMT)
EmbodiedSAM: Online Segment Any 3D Thing in Real Time [61.2] 身体的なタスクは、エージェントが探索と同時に3Dシーンを完全に理解する必要がある。
オンライン、リアルタイム、微粒化、高度に一般化された3D知覚モデルは、必死に必要である。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:57:42 GMT)
Disentangling CLIP Features for Enhanced Localized Understanding [58.7] 提案するUnmix-CLIPは,相互特徴情報(MFI)の低減と特徴の絡み合いの改善を目的とした新しいフレームワークである。
COCO-14データセットでは、Unmix-CLIPは機能の類似性を24.9%削減している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 22:39:35 GMT)
Unbiased Sliced Wasserstein Kernels for High-Quality Audio Captioning [55.4] 非バイアススライスされたWasserstein RBFカーネルを導入し、時間相似性スコアを開発する。
また、未バイアススライスされたWassersteinカーネルに基づくオーディオキャプションフレームワークも導入する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:47:06 GMT)
Gender Bias in Instruction-Guided Speech Synthesis Models [55.2] 本研究では、モデルが職業関連プロンプトをどのように解釈するかにおける潜在的な性別バイアスについて検討する。
このようなプロンプトを解釈する際に、これらのモデルがジェンダーステレオタイプを増幅する傾向を示すかどうかを検討する。
実験の結果, ある職業において, 性別偏見を示す傾向が示された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:38:24 GMT)
Identifiable Exchangeable Mechanisms for Causal Structure and Representation Learning [54.7] IEM(Identible Exchangeable Mechanisms)と呼ばれる,表現と構造学習のための統合フレームワークを提供する。
IEMは、交換可能な非i.d.データにおける因果構造同定に必要な条件を緩和する新しい洞察を提供する。
また、認識可能な表現学習における双対性条件の存在を実証し、新たな識別可能性結果をもたらす。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:19:37 GMT)
A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.1] 一般的な類似性に基づく機能アップサンプリングパイプラインが提案されている。
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
我々は,モーザイクアーティファクトを緩和する上ではシンプルだが有効であるHR特徴に対して,きめ細かな近傍選択戦略を開発する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:30:27 GMT)
Efficient Rectification of Neuro-Symbolic Reasoning Inconsistencies by Abductive Reflection [53.8] Neuro-Symbolic (NeSy) AIは、人間の二重プロセス認識の類似と見なすことができる。
本稿では,ABLフレームワークに基づくAbductive Reflection (ABL-Refl)を導入することにより,NeSyシステムを改善することを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:31:44 GMT)
HAMSTER: Hierarchical Action Models For Open-World Robot Manipulation [53.2] 階層型視覚-言語-アクションモデルは、標準的なモノリシックVLAモデルよりも、ドメイン外のデータを利用するのに効果的であることを示す。
階層設計により、高レベルなVLMは、オフドメイン微調整データと実ロボットテストシナリオの間の重要なドメインギャップをまたいで転送可能であることを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:50:22 GMT)
GraphHash: Graph Clustering Enables Parameter Efficiency in Recommender Systems [51.6] 本稿では,モジュール性に基づく二部グラフクラスタリングを利用したグラフベースの最初のアプローチであるGraphHashを紹介する。
高速クラスタリングアルゴリズムを使用することで、GraphHashはプリプロセス中のメッセージパッシングの計算効率のよいプロキシとして機能する。
実験では、GraphHashは検索およびクリックスルーレート予測タスクの両方において、多様なハッシュベースラインを大幅に上回る。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:54:48 GMT)
Dynamic Noise Preference Optimization for LLM Self-Improvement via Synthetic Data [51.6] 我々は、イテレーション間で一貫した改善を保証するために、動的ノイズ優先最適化(DNPO)を導入します。
Zephyr-7Bでの実験では、DNPOは既存の手法を一貫して上回り、平均性能は2.6%向上した。
DNPOは、GPT-4評価のベースラインに比べて29.4%のウィンロス率差で、モデル生成データの品質が大幅に向上したことを示している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:20:09 GMT)
A Top-down Graph-based Tool for Modeling Classical Semantic Maps: A Crosslinguistic Case Study of Supplementary Adverbs [51.0] セマンティックマップモデル(SMM)は、言語横断的なインスタンスや形式からネットワークのような概念空間を構築する。
ほとんどのSMMは、ボトムアップ手順を使用して、人間の専門家によって手動で構築される。
本稿では,概念空間とSMMをトップダウンで自動生成するグラフベースの新しいアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:10:57 GMT)
TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [50.9] TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己注意機構はDRLエージェントの探索とこれらの戦略を融合させ、政策の収束を加速し、様々な運転条件をまたいだ堅牢性を高める。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:45:15 GMT)
Temporal Representation Alignment: Successor Features Enable Emergent Compositionality in Robot Instruction Following Temporal Representation Alignment [50.4] 本研究では,現在および将来の状態の表現と時間的損失を関連付ける学習により,構成一般化が向上することを示す。
我々は,多様なロボット操作タスクおよびシミュレーションにおけるアプローチを評価し,言語やゴールイメージで指定されたタスクに対して,大幅な改善を示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:26:29 GMT)
Related Knowledge Perturbation Matters: Rethinking Multiple Pieces of Knowledge Editing in Same-Subject [49.6] 現在最先端の編集手法は、複数の関連知識を同じ主題に編集する作業で苦労している。
本稿では,textS2textRKE$(Same-Subject Related Knowledge Editing)ベンチマークを紹介する。
実験の結果,ROMやMEMITのような主流の位置情報編集手法だけが「関連する知識の摂動」を示すことがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:47:17 GMT)
TD(0) Learning converges for Polynomial mixing and non-linear functions [49.2] そこで本研究では,より適切な仮定の下でのTD学習に関する理論的知見について述べる。
これは、普遍的および非独立なステップサイズの下でマルコフデータ上でのTD(0)収束の最初の証明である。
我々の結果は、一般化勾配の下での線型モデルと非線形モデルの境界と、H"より古い連続性を含む。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 22:01:02 GMT)
Gen-DFL: Decision-Focused Generative Learning for Robust Decision Making [48.6] 意思決定型生成学習(Gen-DFL)は、生成モデルを利用して不確実性を適応的にモデル化し、意思決定品質を向上させる新しいフレームワークである。
本論文は,Gen-DFLが従来のDFLと比較して,最悪の性能バウンダリを改善できることを理論的に示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:52:11 GMT)
StyleDistance: Stronger Content-Independent Style Embeddings with Synthetic Parallel Examples [48.4] スタイル表現は、内容に関係なく、類似した書体スタイルのテキストを密に埋め込み、異なる書体スタイルのテキストを遠くに埋め込むことを目的としている。
より強力なコンテンツに依存しないスタイル埋め込みをトレーニングするための新しいアプローチであるStyleDistanceを紹介する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:45:04 GMT)
A Physical Coherence Benchmark for Evaluating Video Generation Models via Optical Flow-guided Frame Prediction [46.7] 本稿では,生成されたビデオの物理コヒーレンスを評価するためのベンチマークPhyCoBenchを紹介する。
われわれのベンチマークでは、120のプロンプトが7つのカテゴリの物理原理をカバーし、ビデオコンテンツで観察できる重要な物理法則を捉えている。
また,光学フローと映像フレームをカスケード的に生成する拡散モデルであるPhyCoPredictorを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:31:26 GMT)
FedRLHF: A Convergence-Guaranteed Federated Framework for Privacy-Preserving and Personalized RLHF [46.6] Federated Reinforcement Learning with Human Feedback (FedRLHF)は、ヒューマンフィードバックプロセスによる強化学習を分散化する新しいフレームワークである。
FedRLHFは、生データや人的フィードバックの共有を必要とせずに、複数のクライアント間で協調的なポリシー学習を可能にする。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:34:08 GMT)
ASAP: Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills [46.2] ASAPは、動的ミスマッチに対処し、アジャイルなヒューマノイド全体のスキルを実現するために設計された2段階のフレームワークである。
第1段階では、リターゲットされた人間の動きデータを用いたシミュレーションにおいて、運動追跡ポリシーを事前訓練する。
第2段階では、現実の世界でポリシーをデプロイし、現実のデータを収集し、デルタ(残留)アクションモデルをトレーニングします。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:12:16 GMT)
UniForm: A Unified Diffusion Transformer for Audio-Video Generation [46.1] UniFormは、クロスモーダル整合性を高めるために設計された統合拡散変換器である。
聴覚情報と視覚情報を結合することにより、UniFormは音声と映像を同時に生成することを学ぶ。
実験では, 共同音声合成, オーディオ誘導映像生成, 映像誘導音声生成タスクにおいて, 提案手法の優れた性能を示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:37:13 GMT)
Sample-Efficient Reinforcement Learning from Human Feedback via Information-Directed Sampling [46.0] 本研究では,大規模言語モデルの学習において重要な課題である,人間からのフィードバック(RLHF)による強化学習の課題について検討する。
我々の主な貢献は、情報指向サンプリング(IDS)に基づく新しいサンプル効率RLHFアルゴリズムの設計である。
本研究は、強化学習と大規模言語モデルの訓練における情報理論の価値を示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:47:00 GMT)
Training-Free Constrained Generation With Stable Diffusion Models [45.1] 本稿では,安定拡散モデルと制約付き最適化フレームワークを統合する新しい手法を提案する。
本研究では, 物質科学実験を通じて, 精密な形態計測特性の付着を必要とする手法の有効性を実証する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:11:17 GMT)
Lower Bounds for Time-Varying Kernelized Bandits [43.6] ノイズの多い観測によるブラックボックス関数の最適化は、広く応用される基本的な問題である。
特定のアプリケーションに不可欠な非定常シナリオについて検討するが、現時点では十分に理解されていない。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:33:00 GMT)
Distribution Aligned Semantics Adaption for Lifelong Person Re-Identification [43.3] ライフロングパーソン・リID(Lifelong person Re-IDentification)は、リID(Re-ID)システムの一種である。
LReIDは、古いドメインからの例証の再生と、古いモデルでロジットに知識蒸留を適用することに依存している。
多様な歩行者画像に基づいて大規模に訓練されたRe-IDモデルは、堅牢で一般的な人間の意味知識を得ることができると論じる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:22:17 GMT)
Influencing Humans to Conform to Preference Models for RLHF [41.9] 選好モデルでは、人間の報酬関数の近似が貧弱なことを学習するリスクがある。
我々は,人間の嗜好表現に影響を及ぼすかどうかを3つの人間の研究により評価し,好む嗜好モデルにより密接に適合させる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:44:45 GMT)
Dynamic Strategy Planning for Efficient Question Answering with Large Language Models [41.3] 大規模言語モデル(LLM)における動的戦略選択プロセスを誘導する新しい手法DyPlanを提案する。
DyPlanは、入力質問に条件付けられた最も適切な戦略を選択し、それに従ってLLMの応答生成を誘導する最初の決定ステップを組み込む。
実験では、DyPlanがモデルパフォーマンスを7-13%改善し、最高のベースラインモデルと比較してコストを11-32%削減できることが示された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:48:39 GMT)
A Linear Quantum Coupler for Clean Bosonic Control [40.4] 理想的な量子非線形性は、高い強度で所望のコヒーレント過程を選択的に活性化する。
ジョゼフソンの非線形性の広い帯域幅は、望ましくない駆動誘起遷移とデコヒーレンス制限によるキュービット読み出し、ゲート、カプラ、増幅器によってこれを困難にしている。
両強度を組み合わせ、アイドル時に(カーフリーだけでなく)本質的に線形にし、高強度で駆動してもクリーンなパラメトリックプロセスを活性化するエンジニアリングされた選択規則を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:15:58 GMT)
Benchmarking Language Model Creativity: A Case Study on Code Generation [39.5] 本研究では,LLMの創造性を定量化するフレームワークを提案する。
生成した創造的応答における収束的思考と発散的思考の両方を定量化する計量であるNEOGAUGEを定義する。
我々はCodeforcesの問題に関する提案されたフレームワークをテストする。これは、タスクをコーディングするための自然なデータセットと、先行する人間のソリューションのコレクションの両方に役立ちます。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:32:51 GMT)
Evaluating Self-Generated Documents for Enhancing Retrieval-Augmented Generation with Large Language Models [39.2] 本稿では,自己文書の総合的有効性について検討し,RAGパフォーマンスへの貢献を形作る重要な要因を同定する。
これらの知見に基づいて,体系的機能言語学に基づく分類学を開発し,様々なセルフドキュメンテーションカテゴリーの影響を比較する。
その結果,どのタイプのセルフドキュメンテーションが最も有用かを明らかにし,それを活用するための実践的ガイドラインを提供した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:35:14 GMT)
ViTime: A Visual Intelligence-Based Foundation Model for Time Series Forecasting [38.9] 時系列予測(TSF)は、電力やエネルギー、輸送など、様々な分野で大きな実践的価値を持っている。
本稿では, TSFファウンデーションモデルの開発において先駆的な研究を行い, 視覚情報を利用したフレームワークであるViTimeを初めて提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:05:56 GMT)
Evaluating Differential Privacy on Correlated Datasets Using Pointwise Maximal Leakage [38.5] データ駆動の進歩はプライバシーに重大なリスクをもたらす。
差分プライバシーは プライバシー保護の 基盤になっている
私たちの研究は、微妙なプライバシーリスクの理解を深め、より効果的なプライバシー保護メカニズムの開発の必要性を強調することを目的としています。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:30:45 GMT)
Multi-Agent Simulator Drives Language Models for Legal Intensive Interaction [37.9] 本稿では,対話型法シナリオをシミュレートして合成データを生成するマルチエージェント法定シミュレーションドライバ(MASER)を提案する。
MASERは参加者間の法的属性の整合性を確保し、参加者の性格や行動を調整するための監督機構を導入する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:05:24 GMT)
Conformal Risk Minimization with Variance Reduction [37.7] コンフォーマル予測(CP)は、ブラックボックスモデルにおける確率的保証を達成するための分布自由フレームワークである。
最近の研究は、トレーニング中のCP効率の最適化に重点を置いている。
我々は、この概念を共形リスク最小化の問題として定式化する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:00:36 GMT)
End-to-End Crystal Structure Prediction from Powder X-Ray Diffraction [37.6] 本研究では,PXRDを用いた結晶構造予測モデルであるXtalNetを紹介する。
XtalNetはPXRDを付加条件として利用し、曖昧さを排除し、単位細胞に最大400個の原子を持つ複雑な有機構造を生成する。
XtalNetは、条件付き結晶構造予測タスクにおいて、hMOF-100とhMOF-400において、90.2%と79%のトップ10マッチングレートを達成する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:24:36 GMT)
Efficiently Learning at Test-Time: Active Fine-Tuning of LLMs [37.0] 本稿では,モデル応答の不確実性を低減するために設計されたデータ選択アルゴリズムSIFTを紹介する。
SIFTは計算オーバーヘッドを最小限に抑えながら、常に最近傍の検索より優れていることを示す。
我々は、Nearest Neighbor検索のドロップイン代替として使用できる$textttactiveft$ライブラリを提供する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:39:09 GMT)
Event Stream-based Visual Object Tracking: HDETrack V2 and A High-Definition Benchmark [37.0] 本稿では,学生トランスフォーマーネットワークの学習を支援するために,新しい階層的知識蒸留戦略を導入する。
新たに提案したテストタイムチューニング戦略により,テスト対象オブジェクトに対してネットワークモデルを適用する。
大規模なイベントベースのトラッキングデータセットであるEventVOTを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:59:52 GMT)
Democratizing Large Language Models via Personalized Parameter-Efficient Fine-tuning [36.9] 大規模言語モデル(LLM)のパーソナライゼーションはますます重要になっている。
1つのPEFT Per User (OPPU) は、パーソナライズされたパラメータ効率の微調整(PEFT)モジュールを使用して、ユーザ固有の行動パターンと好みを保存する。
OPPUは、LaMPベンチマークの7つのタスクで既存のプロンプトベースのメソッドよりも大幅に優れています。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:01:56 GMT)
OntoTune: Ontology-Driven Self-training for Aligning Large Language Models [36.7] 大規模コーパスの訓練はしばしば、大規模言語モデルのドメイン知識を効果的に組織化するのに失敗する。
そこで我々は,オントトゥン(OntoTune)というオントロジー駆動の自己学習フレームワークを提案する。
本研究は,オントトゥンの有効性を評価するために,医学領域で実施する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:38:45 GMT)
Progressive Binarization with Semi-Structured Pruning for LLMs [36.3] 大規模言語モデル(LLM)は自然言語処理タスクにおいて顕著な成功を収めた。
彼らの高い計算量とメモリ要求は、リソース制約のあるデバイスへのデプロイに困難をもたらす。
LLM圧縮のための半構造化プルーニング(PBS$2$P)法によるプログレッシブバイナリ化を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:23:05 GMT)
Mix Data or Merge Models? Balancing the Helpfulness, Honesty, and Harmlessness of Large Language Model via Model Merging [35.5] 本稿では,大規模言語モデル(LLM)におけるモデルマージのための,最初の包括的なベンチマークを確立する。
分析の結果, これまで見過ごされた3H次元間のコラボレーティブ/コンフリクト関係, (ii) 整合性トレードオフのバランスをとる上でのデータ混在アプローチに対するモデルマージの一貫性上の優位性, (iii) 冗長なコンポーネントプルーニングとアウトリー緩和によるパラメータレベルのコンフリクト解決の重要な役割, の3点が明らかになった。
重み付きパラメータの重み付けと、重み付きパラメータに適応したスペーサ適応ランク選択戦略を組み込んだ、重み付け強化タスク特異ベクトルマージ手法であるR-TSVMを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:56:58 GMT)
Transductive Active Learning: Theory and Applications [35.5] 本研究では,古典的能動学習の現実的環境への一般化を,具体的な予測対象を用いて検討する。
我々は,予測対象の不確実性を最小限に抑えるために,適応的にサンプルをサンプリングする一連の決定ルールを解析する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:30:33 GMT)
You Are What You Eat -- AI Alignment Requires Understanding How Data Shapes Structure and Generalisation [35.4] 我々は、トレーニングされたモデルにおけるデータ分布の構造と構造の関係を理解することがAIアライメントの中心であると主張する。
標準試験と評価は、広く展開された一般的なインテリジェントシステムに対する安全性の保証を得るには不十分である。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:24:04 GMT)
Insights into Alignment: Evaluating DPO and its Variants Across Multiple Tasks [35.4] 本研究では,多言語モデル(LLM)と人間の嗜好を整合させるためのDPOとその変種について検討する。
評価対象は、対話、推論、数学的問題解決、質問応答、真理性、MT-Bench、Big Bench、Open LLM Leaderboardを含む13のベンチマークである。
トレーニングデータのサブセットが小さい場合でも,アライメント手法がほぼ最適に近い性能を達成できることが判明した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:29:14 GMT)
From Mystery to Mastery: Failure Diagnosis for Improving Manipulation Policies [35.2] 本稿では,臨界故障モード(FM)を自動的に識別するシステムであるロボットマニピュレーション診断(RoboMD)を提案する。
事前訓練された操作ポリシーにおける潜在的なFMの膨大な空間を考慮すると、深層強化学習(deep reinforcement learning, ディープRL)を活用してこれらのFMを探索し、発見する。
非構造環境における未知障害の診断におけるRoboMDの有効性を実証する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:54:30 GMT)
ARIES: Stimulating Self-Refinement of Large Language Models by Iterative Preference Optimization [34.8] 真にインテリジェントなLarge Language Model (LLM) は、外部インタラクションを通じて応答のエラーを修正する能力を持つべきである。
ARIES: Adaptive Refinement and Iterative Enhancement Structure。
ARIESは、反復的に好みのトレーニングと自己修正に基づくデータ収集を行う。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:21:55 GMT)
Investigating the Shortcomings of LLMs in Step-by-Step Legal Reasoning [34.4] 推論誤りを特定し,LLMの性能を評価するための自動評価フレームワークを開発した。
我々の研究は、論理集約的な複雑なタスクに対する推論チェーンの詳細なエラー解析に使用できる評価フレームワークとしても機能する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:49:32 GMT)
Can Unconfident LLM Annotations Be Used for Confident Conclusions? [34.2] 大規模言語モデル (LLMs) は、様々なタスクにおいて、人間と高い合意を示してきた。
信頼性駆動推論(Confidence-Driven Inference)は、LCMの信頼度インジケータを組み合わせて、どのアノテーションを収集すべきかを戦略的に選択する手法である。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:15:35 GMT)
Rethinking Word Similarity: Semantic Similarity through Classification Confusion [31.1] 本稿では,特徴に基づく分類の混乱という観点から意味的類似性を再編成する,類似性の新たな尺度,Word Confusionを提案する。
提案手法は,複数のデータセットにまたがる人間の類似性判定におけるコサイン類似性に匹敵するものである。
フランスの「革命」という言葉の18世紀における変化に関する仮説を検証するために、我々のモデルが動的特徴を活用できることを実証する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:55:38 GMT)
Deep Positive-Unlabeled Anomaly Detection for Contaminated Unlabeled Data [31.0] 本稿では, 深い正のラベルのない異常検出フレームワークを提案する。
肯定的未ラベル学習と深い異常検出モデルを統合する。
提案手法は既存の手法よりも優れた検出性能を実現する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:03:37 GMT)
Rigid Body Adversarial Attacks [30.9] 剛体シミュレータはしばしば、興味のある物体が非常に硬いと考えられるアプリケーションで使用される。
材料には無限の剛性がないため、硬い物体の非ゼロなコンプライアンスが、剛体のシミュレートや変形可能なシミュレーターにおいて、その軌道間に大きな違いをもたらす可能性がある。
本稿では,剛体シミュレータに対する敵攻撃を提案する。
対象物に対する衝突形状と質量のモーメントが同じである知覚的に剛性のある対向物体を、剛体シミュレーションでは同一に振る舞うが、より正確な変形可能なシミュレーションでは極大に異なるように、最適化問題を解く。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:12:27 GMT)
Managing Geological Uncertainty in Critical Mineral Supply Chains: A POMDP Approach with Application to U.S. Lithium Resources [30.2] 世界は、再生可能エネルギー技術と電気自動車による、前例のない重要なミネラル需要の時代に突入している。
この遷移は、特に地質学的不確実性のため、鉱物資源開発に固有の課題をもたらす。
本稿では、重要な鉱物の抽出決定を最適化する部分観測可能なマルコフ決定プロセス(POMDP)の新たな応用を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:44:44 GMT)
SAMGPT: Text-free Graph Foundation Model for Multi-domain Pre-training and Cross-domain Adaptation [29.9] テキストのないマルチドメイングラフ事前学習とクロスドメイン適応のための新しい構造アライメントフレームワークを提案する。
複数のソースドメインを起源とするグラフから、マルチドメインの知識を学ぶように設計されている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:24:25 GMT)
Hypothesis Generation for Materials Discovery and Design Using Goal-Driven and Constraint-Guided LLM Agents [29.6] LLM(Large Language Models)は、一度検証された場合、材料発見を早める仮説を生成するために用いられる。
現実のアプリケーションを設計するための、現実の目標、制約、方法を含むデータセットをキュレートしました。
このデータセットを用いて、特定の制約の下で与えられた目標を達成するための仮説を生成するLCMベースのエージェントをテストする。
本稿では,材料科学者が仮説を批判的に評価する過程をエミュレートする,新しいスケーラブルな評価指標を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:56:08 GMT)
DOMBA: Double Model Balancing for Access-Controlled Language Models via Minimum-Bounded Aggregation [28.5] データセット上での大規模言語モデル(LLM)のトレーニングは、無許可のユーザに機密情報を暴露する可能性がある。
DOMBA - 二重モデルバランシング - LLMのトレーニングとデプロイのためのシンプルなアプローチを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:19:54 GMT)
Graph-based Molecular In-context Learning Grounded on Morgan Fingerprints [28.3] In-context Learning (ICL) では、プロパティ予測や分子キャプションなどの分子タスクのための大規模言語モデル(LLM)を、慎重に選択された実演例を入力プロンプトに埋め込む。
しかし、現在の分子タスクのプロンプト検索法は、モーガン指紋のような分子の特徴的類似性に依存しており、これはグローバル分子と原子結合の関係を適切に捉えていない。
本稿では,グローバル分子構造をグラフニューラルネットワーク(GNN)とテキストキャプション(記述)に整合させ,モーガン指紋による局所的特徴類似性を活用する自己教師付き学習手法GAMICを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:46:33 GMT)
Iterative Deepening Sampling for Large Language Models [27.8] 効果的な自己補正と自己補正を実現するためのトレーニングモデルは、依然として重要な課題である。
自己補正の強化と高品質なサンプル生成を目的とした,新しい反復サンプリングアルゴリズムフレームワークを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:39:51 GMT)
MIM: Multi-modal Content Interest Modeling Paradigm for User Behavior Modeling [27.3] マルチモーダルコンテンツ興味モデリングパラダイム(MIM)を提案する。
MIMは3つの主要なステージで構成されている。
CTRでは+14.14%、RPMでは+4.12%の大幅な増加を達成した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:39:43 GMT)
Towards Quantum-Native Communication Systems: State-of-the-Art, Trends, and Challenges [27.3] 調査では、量子ドメイン(QD)マルチインプット、QD非直交多重アクセス、量子セキュアダイレクト通信、QDリソース割り当て、QDルーティング、QD人工知能などの技術を調査した。
量子センシング、量子レーダ、量子タイミングの現在の状況は、将来の応用をサポートするために簡単にレビューされる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:44:44 GMT)
Quantum Approximate Optimization Algorithms for Maximum Cut on Low-Girth Graphs [26.9] 量子コンピューティングにおいて、Farhi、Gutmann、GoldstoneはMaxCutの問題を解決するためにQuantum Approximate Optimization Algorithm (QAOA)を提案した。
加法積グラフとして知られるMohantyとO'Donnellによって提案された拡張グラフの集合上で、MaxCutにQAOAを適用する。
我々は、よく知られた古典的局所アルゴリズムとQAOAを一定の深さで比較するために数値実験を行う。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:40:10 GMT)
Surprise Potential as a Measure of Interactivity in Driving Scenarios [26.6] 本稿では,他者に対するAVのサプライズポテンシャルを測定することで,対話的なシナリオを識別する新しい指標を提案する。
人間の嗜好から学習した報酬モデルを用いて、サプライズポテンシャル測定が対話的なシナリオを正しく識別するかどうかを判断する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:57:16 GMT)
On the Convergence and Stability of Upside-Down Reinforcement Learning, Goal-Conditioned Supervised Learning, and Online Decision Transformers [25.9] 本稿は,表意的なアップサイドダウン強化学習,ゴール・コンディションド・スーパービジョン学習,オンライン決定変換器の収束と安定性を厳密に分析する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:26:22 GMT)
Robustifying Fourier Features Embeddings for Implicit Neural Representations [25.7] Inlicit Neural Representation (INR) は、目標関数の対応する値に座標をマッピングすることで、連続関数を表現するためにニューラルネットワークを使用する。
INRは、様々な周波数を含むシーンを扱う際に、スペクトルバイアスとして知られる課題に直面している。
本稿では,多層パーセプトロン (MLP) を添加剤なしで使用することを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:43:37 GMT)
Design Considerations in Offline Preference-based RL [25.7] DPOやIPO,SLiCなど,さまざまな方法による設計選択が,学習方針の質に与える影響について検討する。
我々の治療は、損失関数の選択、ログライクな状態の正規化に使用されるポリシー、およびデータサンプリングポリシーの役割に関する洞察を得る。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:01:37 GMT)
AutoVerus: Automated Proof Generation for Rust Code [25.6] AutoVerusは大規模な言語モデル(LLM)を使用して、Rustコードの正確性証明を自動的に生成する。
評価の結果,AutoVerusは90%以上の正解を自動生成できることがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:06:56 GMT)
DeepThink: Aligning Language Models with Domain-Specific User Intents [25.5] 本研究では、高品質な命令を生成するためのDeepThinkと呼ばれる新しいフレームワークを提案する。
DeepThinkはまず、いくつかのシード質問を生成して、実際のユーザ質問を模倣し、会話をシミュレートして、隠されたユーザニーズを明らかにし、会話のコンテキストによって回答を洗練する。
実験により、DeepThinkは広告ドメイン内の実際のユーザテストセット上でのGPT-4-turbo+RAGベースのアシスタントと比較して平均パフォーマンスが7.92%向上していることが示された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:04:16 GMT)
Deep Generative Models with Hard Linear Equality Constraints [24.9] 本稿では,DGMにハード制約を強制し,制約に準拠したデータを生成する確率論的健全なアプローチを提案する。
5つの画像データセットと3つの科学的応用に関する様々なDGMモデルアーキテクチャを用いて実験を行った。
ジェネレーションにおける制約の満足度を保証するだけでなく、各ベンチマークの他のメソッドよりも優れた生成性能をアーカイブしています。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:53:32 GMT)
Poincaré Inequality for Local Log-Polyak-Lojasiewicz Measures : Non-asymptotic Analysis in Low-temperature Regime [24.8] 深層学習のような関連する応用におけるポテンシャル関数は、非溶解性ミニマを許容する経験的に観察される。
我々はPL のクラスが $mu_epsilon propto exp(-V/epsilon) を測り、その局所ミニマの集合は証明可能 mph 接続であることを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:43:57 GMT)
Boosting Multimodal Reasoning with MCTS-Automated Structured Thinking [24.4] MLLM(Multimodal large language model)は印象的な能力を示すが、複雑な視覚的推論の課題に直面している。
我々はモンテカルロ木探索(MCTS)によるマルチモーダル推論のための自動構造化思考パラダイムであるAStarを提案する。
AStarはMCTSを使った階層構造を用いて、限られたデータから高レベルの認知的推論パターンを自動的に導き出す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:12:10 GMT)
Communication-efficient Vertical Federated Learning via Compressed Error Feedback [24.3] ロスシー圧縮は、トレーニング中にサーバとクライアントの間で通信される情報に一般的に使用される。
水平FLでは、訓練サブセットの各サブセットは、その情報のサブセットを保持する。
本稿では,各クライアントが情報サブセットのサブセットを保持する垂直FLのトレーニング手法を提案する。
目的関数がpolyak-Lojasiewiczの不等式を満たすとき、この方法は線型収束する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:17:54 GMT)
"Yes, My LoRD." Guiding Language Model Extraction with Locality Reinforced Distillation [23.8] 大規模言語モデル(LLM)に特化して設計された新しいモデル抽出アルゴリズムであるLoRD(Locality Reinforced Distillation)を提案する。
LoRDは、被害者モデルの応答を信号として利用し、ローカルモデルの好みの作り方をガイドする、新たに定義されたポリシー段階的なトレーニングタスクを採用している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:14:26 GMT)
Language Models Largely Exhibit Human-like Constituent Ordering Preferences [23.7] 我々は,大規模言語モデルと多様な特性を比較し,構成運動の性能を評価する。
粒子移動に関する予期せぬ行動にもかかわらず、LLMは概して構成順序に関する人間の嗜好と一致している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:13:40 GMT)
Learning to Steer Markovian Agents under Model Uncertainty [23.6] 我々は,希望する政策に向けて,マルチエージェントシステムに付加的な報酬を課す方法について検討する。
既存の作業の制限によって動機づけられた我々は、emphMarkovian agentと呼ばれる学習力学の新しいカテゴリーを考える。
我々は、エージェントの学習力学に関する本質的なモデルの不確実性を扱うために、歴史に依存した運営戦略を学習する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:23:27 GMT)
Towards Rationality in Language and Multimodal Agents: A Survey [23.5] 確実で一貫したソリューションを確保することによって、信頼性の高い問題解決において重要な役割を果たす。
近年,マルチモーダルシステムやマルチエージェントシステムへの取り組みが進んでいる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:48:13 GMT)
TrackDiffuser: Nearly Model-Free Bayesian Filtering with Diffusion Model [23.4] 本稿では,条件拡散モデルとしてベイズフィルタを再構成することにより,両方の課題に対処する生成フレームワークであるTrackDiffuserを提案する。
提案手法は,不正確なSSMの影響を軽減するために,データからシステムダイナミクスを暗黙的に学習する。
TrackDiffuserはSSMの不正確性に顕著な堅牢性を示し、実世界の状態推定問題に対する実用的な解決策を提供する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:21:18 GMT)
Scalable Autoregressive Image Generation with Mamba [23.0] 本稿では,マンバアーキテクチャに基づく自己回帰(AR)画像生成モデルであるAiMを紹介する。
Mamba(マンバ)は、線形時間による長周期モデリングに特有な性能を特徴とする、新しい状態空間モデルである。
パラメータ数は128Mから1.3Bまで様々である。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:45:31 GMT)
The Geometry of Numerical Reasoning: Language Models Compare Numeric Properties in Linear Subspaces [22.3] 本稿では,大規模言語モデル (LLM) が数値比較を含む疑問に答える際に,埋め込み空間の低次元部分空間に符号化された数値属性を利用するかどうかを検討する。
まず, 部分最小二乗回帰を用いて, これらの部分空間を同定し, 比較プロンプトの要素に関連付けられた数値特性を効果的に符号化した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:31:33 GMT)
Stark Shift from Quantum Defects in Hexagonal Boron Nitride [22.2] 六方晶窒化ホウ素の発色中心は、量子情報応用の有望な候補として浮上している。
スタークシフトのような外界と欠陥の間の相互作用は、その局所的な幾何学的構成に関する貴重な洞察を与える。
欠陥の局所対称性は、線形あるいは二次的なスタークシフトの性質を決定する上で重要な役割を果たす。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:12:48 GMT)
Imitation Learning from a Single Temporally Misaligned Video [21.6] 既存の手法では、模倣を分布マッチング問題として扱い、エージェントとデモの間に個々のフレームを整列させる。
このようなフレームレベルのマッチングは、時間的順序付けや一貫した進捗の確保に失敗することを示す。
本稿では,実演フレームをカバーするエージェントの確率を正しい順序で測定する,高密度な時間ステップごとの報酬関数ORCAを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:03:43 GMT)
APE: Faster and Longer Context-Augmented Generation via Adaptive Parallel Encoding [21.4] 並列符号化がコンテキスト拡張生成問題の解決にどのように役立つかを示す。
APEは98%と93%のシーケンシャルエンコーディング性能を同じ入力で保持できる。
また、多数のCAGにスケールし、事実上数百のコンテキストを並列に符号化する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:41:16 GMT)
Large Multimodal Models for Low-Resource Languages: A Survey [21.1] 我々は,LMM(Large Multimodal Model)を低リソース(LR)言語に適応させる手法を体系的に分析する。
我々は、限られたデータと計算資源の課題に研究者がどう取り組むかにおいて、重要なパターンを特定する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:29:44 GMT)
Demystifying Chains, Trees, and Graphs of Thoughts [21.0] 利用構造の基本クラスを特定することに集中し、これらの構造表現を分析する。
本研究は,提案した分類法を用いて既存のプロンプト方式と比較し,特定の設計選択が性能とコストの異なるパターンにどのように寄与するかを論じる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:02:41 GMT)
Filter-then-Generate: Large Language Models with Structure-Text Adapter for Knowledge Graph Completion [21.0] 大規模言語モデル(LLM)は、膨大な固有の知識と優れた意味理解能力を示す。
実証的な証拠は、LLMは従来の知識グラフ補完手法よりも一貫して性能が悪いことを示唆している。
そこで本研究では,これらの課題に対処するために,FtGという命令チューニングに基づく新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:40:23 GMT)
Explainable LLM-driven Multi-dimensional Distillation for E-Commerce Relevance Learning [20.6] 電子商取引関連学習のための説明可能なLCM駆動多次元蒸留フレームワークを提案する。
提案手法は,eコマース関連学習性能とユーザエクスペリエンスを大幅に向上させる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:56:02 GMT)
Pareto-Optimality, Smoothness, and Stochasticity in Learning-Augmented One-Max-Search [20.5] ワンマックス検索はオンライン意思決定における古典的な問題である。
学習強化環境における1マックス探索の解析に得られる滑らかさの活用法を示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 23:25:52 GMT)
Federated Domain Generalization with Label Smoothing and Balanced Decentralized Training [20.4] ラベルの平滑化とバランスの取れた分散トレーニング(FedSB)による新しいドメイン一般化手法を提案する。
FedSBは、クライアントレベルでのラベルの平滑化を利用して、ドメイン固有の機能への過度な適合を防ぎ、様々なドメインにわたる一般化機能を強化する。
FedSBには、クライアント間のトレーニングのバランスをとる分散予算機構が組み込まれており、これは集約されたグローバルモデルの性能を改善することが示されている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:41:08 GMT)
Stochastic Forward-Backward Deconvolution: Training Diffusion Models with Finite Noisy Datasets [20.1] 近年の拡散型生成モデルは大量のデータセットのトレーニングによって顕著な結果を得るが、このプラクティスは記憶と著作権侵害に関する懸念を提起する。
提案されている治療法は、著作権問題のあるノイズの多いデータのみを訓練し、モデルが元のコンテンツを決して観察しないことを保証することである。
ノイズの多いサンプルからデータ分布を学習することは理論的には不可能であるが,十分なサンプルを集めるという実践的な課題は,学習をほぼ達成不可能にしている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:37:39 GMT)
Large Memory Network for Recommendation [20.0] Large Memory Network (LMN) は、ユーザ履歴の振る舞い情報を大規模メモリブロックに圧縮保存する新しいアイデアである。
LMNはDouyin E-Commerce Search (ECS)に完全にデプロイされており、毎日数百万のユーザにサービスを提供している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:08:11 GMT)
TACLR: A Scalable and Efficient Retrieval-based Method for Industrial Product Attribute Value Identification [19.9] 製品属性値識別(PAVI)の最初の検索手法であるTACLRを紹介する。
製品プロファイルと候補値を埋め込みに符号化し、アイテム埋め込みと類似性に基づいて値を取得することにより、情報検索タスクとしてPAVIを定式化する。
1)正規化された出力を生成しながら暗黙的およびOOD値を効果的に処理し、(2)数千のカテゴリ、数万の属性、および数百万の値にスケールし、(3)高負荷の産業シナリオに対する効率的な推論をサポートする。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:13:23 GMT)
Cascading Large Language Models for Salient Event Graph Generation [19.7] CALLMSAEは、SAlient Event Graph生成のためのCAscading Large Language Modelフレームワークである。
まず、LSMにサマリを生成するよう促すことで、サレントイベントを識別する。
次に、イベント関係グラフを生成するための反復的コード改善促進戦略を開発する。
CALLMSAEにより、大規模な自動注釈付きイベントグラフデータセットである textitNYT-SEG を提示する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:23:18 GMT)
FRAMES: Boosting LLMs with A Four-Quadrant Multi-Stage Pretraining Strategy [19.2] 大規模言語モデル(LLM)は、人間の言語理解と生成を著しく進歩させる。
既存の方法はデータ分割の量的基準を欠くことが多く、直観に頼っている。
本稿では,FRAMES(Four-quadrant Multi-stage pretraining Strategy)を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:46:33 GMT)
Bridging Traffic State and Trajectory for Dynamic Road Network and Trajectory Representation Learning [19.2] TRACKは、動的道路網と軌道表現学習のためのトラジェクトリデータとトラジェクトリデータをブリッジする新しいフレームワークである。
トラジェクトリデータからの遷移確率をGAT注意重みに組み込むことで、TRACKは道路セグメントの動的空間的特徴を捉える。
実生活都市交通データセットの実験は、最先端のベースラインよりもTRACKの方が優れていることを示した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:36:54 GMT)
Fg-T2M++: LLMs-Augmented Fine-Grained Text Driven Human Motion Generation [19.1] テキスト駆動型人体動作生成のための新しいフレームワークを提案する。
Fg-T2M++ は,(1) 身体部分の記述と意味をテキストから抽出する LLM 意味解析モジュール,(2) テキスト単位間の関係情報をエンコードする双曲的テキスト表現モジュール,(3) テキストと運動の特徴を階層的に融合するマルチモーダル融合モジュールからなる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:38:12 GMT)
Towards Sustainable NLP: Insights from Benchmarking Inference Energy in Large Language Models [19.0] 大きな言語モデル(LLM)は、その例外的な生成能力と汎用性によって、ますます認識されている。
本研究では,幅広いNLPタスクを対象としたLLM推論エネルギーの総合的なベンチマークを行う。
量子化と最適なバッチサイズは、目的のプロンプトフレーズとともに、エネルギー使用量を大幅に削減できることがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:34:52 GMT)
CryptoX : Compositional Reasoning Evaluation of Large Language Models [18.9] 既存のベンチマークと暗号を組み合わせた評価フレームワークであるCryptoXを紹介する。
我々はCryptoBenchを用いて、広く使われているオープンソースおよびクローズドソース LLM に関する詳細な実験を行う。
コンポジション推論を独立に研究することの価値を強調し,LLMのコンポジション推論能力を高める必要性を強調した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:19:43 GMT)
A Survey on Explainable Deep Reinforcement Learning [18.9] Deep Reinforcement Learning (DRL)は、さまざまな領域にわたるシーケンシャルな意思決定タスクにおいて、顕著な成功を収めた。
ブラックボックスのニューラルアーキテクチャに依存しているため、高信頼のアプリケーションにおける解釈可能性、信頼性、デプロイメントが妨げられる。
説明可能なDeep Reinforcement Learning(XRL)は、機能レベル、状態レベル、データセットレベル、モデルレベルの説明技術を通じて透明性を高めることで、これらの課題に対処する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:30:31 GMT)
XiHeFusion: Harnessing Large Language Models for Science Communication in Nuclear Fusion [18.7] 本稿では,核融合分野における最初の大規模モデルであるXiHeFusionを提案する。
我々は、このモデルの訓練を支援するために、核融合タスクに関する多元的知識を収集し、共有クロール、eBooks、arXiv、論文等を収集した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:47:48 GMT)
MDE: Modality Discrimination Enhancement for Multi-modal Recommendation [17.9] マルチモーダルレコメンデーションシステムのためのMDEフレームワークを提案する。
MDEは、共有機能を維持しながらレコメンデーション精度を向上させるために、モダリティ固有の情報抽出を優先する。
提案手法は、他の最先端手法よりも優れており、モダリティ共有とモダリティ特化の特徴を共同で検討することの有効性を実証している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:36:14 GMT)
FTSmartAudit: A Knowledge Distillation-Enhanced Framework for Automated Smart Contract Auditing Using Fine-Tuned LLMs [17.8] 本稿では,スマートコントラクト監査において,より小型で微調整されたモデルを用いて,同等あるいは優れた結果が得られる可能性について検討する。
本稿では,スマートコントラクト監査のための費用対効果の高い特化モデルの開発を目的としたFTSmartAuditフレームワークを紹介する。
コントリビューションには,(1)データ準備,トレーニング,評価,継続的な学習を効率化するシングルタスク学習フレームワーク,(2)ドメイン固有知識蒸留を利用した堅牢なデータセット生成手法,(3)モデルの正確性と堅牢性を維持するための適応型学習戦略などが含まれている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:57:42 GMT)
Perception Compressor: A Training-Free Prompt Compression Framework in Long Context Scenarios [17.7] Perceptionは、大規模な言語モデルのためのトレーニングフリーのプロンプト圧縮フレームワークである。
これには、指導的質問と指示を利用して、最も関連するデモンストレーションを検索する知覚検索機能が含まれる。
長いコンテキスト、ベンチマーク、iSie、LongBench、MuSiQueに関する広範な実験を行います。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:01:41 GMT)
Adaptive Domain Scaling for Personalized Sequential Modeling in Recommenders [17.7] 本稿では、ターゲット・アウェア・シーケンス・モデリングにおけるパーソナライズ機能を包括的に強化するAdaptive Domain Scaling(ADS)モデルを提案する。
ADSは、パーソナライズされた配列表現生成(PSRG)とパーソナライズされた候補表現生成(PCRG)の2つの主要モジュールから構成される。
パブリックデータセットと20億規模の産業データセットの両方で実験を行い、大規模な結果により、ADSの高効率性と互換性が検証された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:05:22 GMT)
UniAP: Unifying Inter- and Intra-Layer Automatic Parallelism by Mixed Integer Quadratic Programming [17.6] UniAPは、並列戦略の2つのカテゴリを共同で最適化し、最適解を見つけるための最初の並列手法である。
実験の結果、UniAPは最先端の手法よりもスループットが最大3.80$times$で、ストラテジー最適化の時間を最大107$times$で5つのTransformerベースのモデルで削減できることがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:48:38 GMT)
Refining Positive and Toxic Samples for Dual Safety Self-Alignment of LLMs with Minimal Human Interventions [17.5] 近年のAIエージェントは、大規模言語モデル(LLM)の出力を人間の意図で調整するために、命令チューニングと強化学習に依存している。
PT-ALIGN(PT-ALIGN)は,ヒトの健康管理を最小化するための安全自己調整手法である。
PT-ALIGNの安全性向上に有効であると同時に,有用性と有用性の両面を両立させながら,9つのオープンソース LLM 実験を行った。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:54:47 GMT)
Can Transformers Reason Logically? A Study in SAT Solving [17.2] 本研究では,デコーダのみのトランスフォーマーの論理的推論能力について,SAT問題の観点から検討する。
我々は,デコーダのみのトランスフォーマーが,Chain-of-Thought (CoT) によるバックトラックとデダクションを用いて,一様でない計算モデルで 3-SAT を決定できることを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:12:58 GMT)
Online Bidding Algorithms with Strict Return on Spend (ROS) Constraint [17.0] 厳密な返却制約(ROSC)の下での自動入札問題について考察する。
タイムスロット全体で明らかな値が一定である場合でも、問題は自明ではない。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:58:49 GMT)
Generating Diverse Hypotheses for Inductive Reasoning [17.0] そこで我々は,Mixture of Concepts (MoC) と呼ばれる,人間の帰納的推論にインスパイアされた新しいアプローチを提案する。
MoCは、標準IIDサンプリングや他のアプローチと比較して、大幅な性能向上を示した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 23:39:32 GMT)
Efficient Multi-Agent Collaboration with Tool Use for Online Planning in Complex Table Question Answering [16.8] 複雑なテーブル質問応答(TQA)は、複数のステップや複数カテゴリの推論のような複雑な推論を必要とする質問に答えることを目的としている。
以前のアプローチでは、クローズドソースの大規模言語モデル(LLM)か、微調整のオープンウェイトLLMを利用することで、顕著な性能を示した。
クローズドソースモデルや微調整を必要としないフレームワークであるMulti-Agent Collaboration with Tool Use (MACT)を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:16:02 GMT)
VLind-Bench: Measuring Language Priors in Large Vision-Language Models [16.7] LVLM(Large Vision-Language Models)は、様々なマルチモーダルタスクにおいて優れた性能を示す。
それらは、画像情報を無視しながら、テキストパターンのみに基づいて応答が生成される、言語事前(Language prior)と呼ばれる問題に悩まされる。
我々は,LVLMの言語先行性を測定するために設計された最初のベンチマークであるVLind-Benchという新しいベンチマークを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 23:14:12 GMT)
Characterizing Dependence of Samples along the Langevin Dynamics and Algorithms via Contraction of $Φ$-Mutual Information [16.5] 連続空間サンプリングにおいて,サンプルがマルコフ連鎖に沿ってほぼ独立になる速度について検討する。
我々の証明手法は,マルコフ連鎖に沿ったSDPI(Strong Data Processing Inequality)を示すものである。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:00:36 GMT)
Canine EEG Helps Human: Cross-Species and Cross-Modality Epileptic Seizure Detection via Multi-Space Alignment [16.4] てんかんは世界の健康に大きく影響し、世界中の約6500万人と様々な動物種に影響を与えている。
そこで本研究では,多空間アライメント手法を多種間および多次元脳波(EEG)データに基づいて提案し,てんかん発作の検出能力と理解を向上する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:43:05 GMT)
Mechanistic Interpretability of Emotion Inference in Large Language Models [16.4] 感情表現は大規模言語モデルにおいて特定の領域に機能的に局所化されていることを示す。
我々は,環境刺激の評価から感情が出現することを示すための認知的評価理論を導いた。
この研究は、因果的に介入し、感情的なテキスト生成を正確に形作る新しい方法を強調している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:11:37 GMT)
Generating Physically Realistic and Directable Human Motions from Multi-Modal Inputs [16.4] この研究は、望まれる動きを部分的にしか特定できないマルチモーダル入力から現実的で物理的に人間の行動を生成することに焦点を当てている。
入力は、腕の動きと身体の速度、部分的なキーポイントアニメーション、ビデオに適用されたコンピュータビジョン、さらにはより高いレベルの運動目標を提供するVRコントローラから得られる。
Masked Humanoid Controller (MHC) は,多目的模倣学習を多目的マスク型動作実証に適用する新しい手法である。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:02:11 GMT)
LMS-Net: A Learned Mumford-Shah Network For Few-Shot Medical Image Segmentation [16.4] 我々はLearned Mumford-Shah Network(LMS-Net)と呼ばれる新しい深層展開ネットワークを提案する。
我々は,学習したMumford-Shahモデル(LMSモデル)を数学的基礎として活用し,洞察を統一されたフレームワークに統合する。
3つの医用セグメンテーションデータセットの総合的な実験により,本手法の有効性が検証された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:15:44 GMT)
Estimating the Spectral Moments of the Kernel Integral Operator from Finite Sample Matrices [16.3] 本稿では,カーネル積分作用素のスペクトルモーメントを無限入力と特徴の極限で非バイアスで推定するアルゴリズムを提案する。
動的プログラミングに基づく本手法は,演算子スペクトルのモーメントを推定できる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:11:35 GMT)
CLIP Behaves like a Bag-of-Words Model Cross-modally but not Uni-modally [16.1] 近年の研究では、CLIPの合成概念を効果的に表現する能力に疑問が呈されている。
線形属性結合CLIP(LABCLIP)を提案し,CLIPの構成的理解を改善する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:04:11 GMT)
TabICL: A Tabular Foundation Model for In-Context Learning on Large Data [15.1] 最大60Kのサンプルを持つ合成データセットで事前訓練された分類のための基礎モデルであるTabICLを紹介する。
TabPFNv2と同等で、体系的に(最大10倍)高速であり、他のすべてのアプローチよりも大幅に優れています。
10K以上のサンプルを持つ56のデータセットで、TabICLはTabPFNv2とCatBoostを上回り、大規模データに対するICLの可能性を示している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:25:04 GMT)
Mitigating Hallucinations in Large Vision-Language Models via Summary-Guided Decoding [14.7] LVLM(Large Vision-Language Models)は、視覚入力から詳細でコヒーレントな応答を生成する。
言語に対する依存度が高すぎるため、幻覚を起こす傾向にある。
そこで我々は,SumGD (Slide-Guided Decoding) という新しい手法を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:34:52 GMT)
A Model-Consistent Data-Driven Computational Strategy for PDE Joint Inversion Problems [14.5] このような連立反転問題に対する統合的データ駆動・モデルベース反復再構成フレームワークを提案する。
提案手法は補足データとPDEモデルとを結合し,データ駆動モデリングプロセスとモデルベース再構築手順との整合性を実現する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:14:07 GMT)
ATLAS: Autoformalizing Theorems through Lifting, Augmentation, and Synthesis of Data [14.4] ATLASは大規模で高品質な並列定理文を生成するために設計された反復データ生成フレームワークである。
我々は300kの定理文からなる学部レベルのデータセットを構築し,ATLASトランスレータを開発し,ProofNet上で80.59%(pass@8)および92.99%(pass@128)の精度を達成した。
ATLASトランスレータは、高学年のminiF2Fデータセットと、この研究で導入された大学院レベルのMathQualデータセットの両方で最先端のパフォーマンスを達成する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:28:51 GMT)
Incongruence Identification in Eyewitness Testimony [14.2] 目撃談話における一致検出は証言の信頼性を理解する上で重要である。
目撃証言における不一致検出の新たな課題について紹介する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:51:57 GMT)
Parameter Tracking in Federated Learning with Adaptive Optimization [14.1] フェデレートラーニング(FL)では、モデルトレーニングのパフォーマンスはクライアント間のデータ不均一性に強く影響されます。
GT(Gradient Tracking)は、最近、局所モデル更新に修正項を導入することでこの問題を軽減するソリューションとして登場した。
現在まで、GTはグラディエント(SGD)ベースのDescentトレーニングしか考慮されていないが、現代のFLフレームワークは収束を改善するために適応性を採用する傾向にある。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:01:17 GMT)
IllusionCAPTCHA: A CAPTCHA based on Visual Illusion [14.0] 我々は、"Human-Easy but AI-Hard"パラダイムを用いた新しいセキュリティメカニズムであるIllusionCAPTCHAを提案する。
その結果,初回試験では86.95%の参加者がCAPTCHAに合格し,他のCAPTCHAシステムよりも優れていた。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:03:03 GMT)
Mixing Time of the Proximal Sampler in Relative Fisher Information via Strong Data Processing Inequality [14.0] 近距離サンプリングアルゴリズムを用いて,相対的なフィッシャー情報のサンプリングに要する混合時間保証について検討する。
ターゲットの確率分布が強く対数となると、相対的なフィッシャー情報は近距離サープラーに沿って指数関数的に高速に収束する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:07:12 GMT)
DEGAS: Detailed Expressions on Full-Body Gaussian Avatars [13.7] 顔表情の豊かなフルボディアバターに対する3次元ガウススティング(3DGS)に基づくモデリング手法であるDEGASを提案する。
本稿では,2次元の顔と3次元のアバターのギャップを埋めて,2次元の肖像画にのみ訓練された潜在空間を採用することを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:49:49 GMT)
Generative Psycho-Lexical Approach for Constructing Value Systems in Large Language Models [13.5] 大規模言語モデル(LLM)は、その本質的な価値に関する懸念を提起している。
本研究は、生成心理学的アプローチ(GPLA)の導入によるギャップに対処する。
LLMに適した心理学的基礎を持つ5要素値システムを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:13:29 GMT)
Leveraging Constraint Violation Signals For Action-Constrained Reinforcement Learning [13.3] ACRL(Action-Constrained Reinforcement Learning)は、ポリシーネットワークの後にプロジェクション層を用いて行動を修正する。
近年,潜在変数と実行可能行動の異なるマッピングを学習するために,生成モデルを訓練する手法が提案されている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:58:26 GMT)
Differentially Private Synthetic Data via APIs 3: Using Simulators Instead of Foundation Model [13.3] 差分プライベート(DP)合成データは、プライバシーを損なうことなく、プライベートデータの価値を解放するための重要なツールとなっている。
プライベート・エボリューション(PE)はDP合成データを生成するための有望な方法として登場した。
計算機グラフィックスベースの画像合成ツールであるシミュレーターが、PEフレームワーク内で効果的なAPIとして機能することを示します。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:50:30 GMT)
LRA-GNN: Latent Relation-Aware Graph Neural Network with Initial and Dynamic Residual for Facial Age Estimation [13.2] 本稿では,LRA-GNN(Relatnt Relation-Aware Graph Neural Network)を提案する。
提案するフレームワークは,いくつかの年齢推定ベンチマークにおける最先端のベースラインを超え,その強度と有効性を示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:17:00 GMT)
Embedding Self-Correction as an Inherent Ability in Large Language Models for Enhanced Mathematical Reasoning [13.1] 自己補正の連鎖は、大規模言語モデルに固有の能力として自己補正を組み込む。
CoSCは一連の自己補正段階を通して機能する。
実験により、CoSCは標準的な数学的データセットの性能を大幅に向上させることが示された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:45:10 GMT)
LLM-Powered Decentralized Generative Agents with Adaptive Hierarchical Knowledge Graph for Cooperative Planning [13.0] 動的オープンワールドシナリオにおける長期協力のためのインテリジェントエージェントの開発は、マルチエージェントシステムにおける大きな課題である。
本稿では,分散適応型知識グラフメモリと構造化通信システム(DAMCS)を,新しいマルチエージェントクラフト環境において提案する。
我々の生成エージェントはLLM(Large Language Models)を利用しており、長期計画と推論のために外部知識と言語を活用することで従来のMARLエージェントよりもスケーラブルである。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:26:02 GMT)
Knowledge is Power: Harnessing Large Language Models for Enhanced Cognitive Diagnosis [12.9] 認知診断モデル(CDMs)は、学生の認知状態を評価するために、一連のエクササイズを通してそのパフォーマンスを分析する。
既存のCDMは、豊富な事前知識が不足しているため、希少な学生や運動の診断に苦慮することが多い。
大型言語モデル(LLM)の進歩に伴い、認知診断への統合は有望な機会となる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:02:45 GMT)
FreeBlend: Advancing Concept Blending with Staged Feedback-Driven Interpolation Diffusion [12.7] 概念ブレンディングは、生成モデルにおいて、有望だが未発見の領域である。
FreeBlendは、これらの課題に対処するために設計された、効果的な、トレーニング不要のフレームワークです。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:25:03 GMT)
YOLO-RD: Introducing Relevant and Compact Explicit Knowledge to YOLO by Retriever-Dictionary [12.4] この問題に対処するために,革新的なRetriever-Dictionary (RD) モジュールを導入する。
このアーキテクチャにより、YOLOベースのモデルは、データセットの洞察を含むDictionaryから機能を効率的に取得できる。
実験の結果,RDを用いることでモデル性能が有意に向上し,平均平均精度が3%以上向上することがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:50:55 GMT)
Show-o Turbo: Towards Accelerated Unified Multimodal Understanding and Generation [12.3] Show-oは、テキスト・ツー・イメージと画像・ツー・テキスト生成のためのマルチモーダル理解モデルである。
本稿では,Show-oと他のアプローチのギャップを埋めるため,Show-o Turboを提案する。
Show-o Turboは1.5倍のスピードアップで性能が大幅に低下する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:52:25 GMT)
Efficient Reinforcement Learning Through Adaptively Pretrained Visual Encoder [12.3] APE:適応事前学習による効率的な強化学習を提案する。
APEは、事前学習期間中に適応的な拡張戦略を使用し、政策学習期間中にタスク環境内でほんのわずかの相互作用しか持たない一般化可能な特徴を抽出する。
その結果、DreamerV3やDrQ-v2といった主流のRL法は、APEを装着すると最先端の性能が得られることがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:57:02 GMT)
Beyond and Free from Diffusion: Invertible Guided Consistency Training [12.3] iGCTは、DMの訓練と蒸留を必要とせず、高速でガイドされた画像生成と編集に寄与する。
CIFAR-10 と ImageNet64 を用いた実験により,iGCT はCFG と比較して FID と精度が有意に向上することが示された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:23:40 GMT)
Semantic-Aware Adaptive Video Streaming Using Latent Diffusion Models for Wireless Networks [12.2] 本稿では,遅延拡散モデル(LDM)をFF手法に組み込むことにより,リアルタイム適応ビットレート動画ストリーミングのための新しいフレームワークを提案する。
従来のコンスタントストリーミング(CBS)とアダプティブストリーミング(ABS)に関連する、高帯域幅の使用、ストレージ非効率、およびクオリティ・オブ・エクスペリエンス(QoE)の課題に対処する。
この作業は、リアルタイムビデオストリーミングのための新しいスケーラブルなソリューションを5Gおよび将来のポスト5Gネットワークで開放する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:14:28 GMT)
Graph-Based Vector Search: An Experimental Evaluation of the State-of-the-Art [12.1] 我々は,7つの実データ収集に対して,最大10億個のベクトルで12種類の最先端手法を実験的に評価する。
これらの手法の強みと限界に関する重要な洞察を共有します。
我々は、より洗練されたデータ適応型種選択と多様化戦略を考案することの重要性など、オープンな研究の方向性について論じる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:03:43 GMT)
Mol-MoE: Training Preference-Guided Routers for Molecule Generation [12.0] Mol-MoEは、再トレーニングなしに分子生成の効率的なテストタイムステアリングを可能にする、試験用混合アーキテクチャである。
当社のアプローチの中心にあるのは、好みに基づくルータトレーニングの目標です。
最先端手法と比較して,Moll-MoEはより優れた試料品質と操舵性が得られることを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:28:33 GMT)
Causal Learning for Heterogeneous Subgroups Based on Nonlinear Causal Kernel Clustering [12.0] 非線形因果クラスタリング法は異種因果学習に有用である。
実験結果から,本手法は異種サブグループを同定し,因果学習の促進に有効であることが示唆された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:20:05 GMT)
WirelessGPT: A Generative Pre-trained Multi-task Learning Framework for Wireless Communication [12.0] 本稿では,無線通信およびセンシングにおけるマルチタスク学習のための先駆的基礎モデルである WirelessGPT を紹介する。
初期パラメータサイズは約8000万で、従来のメソッドやより小さなAIモデルよりも大幅に改善されている。
WirelessGPTは、さまざまなドメインにわたる多様なタスクをサポートする最初の基礎モデルとして、新しいベンチマークを確立している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:38:56 GMT)
Toward Copyright Integrity and Verifiability via Multi-Bit Watermarking for Intelligent Transportation Systems [11.8] インテリジェントトランスポートシステム(ITS)は、人工知能などの高度な技術を使用して、トラフィックフロー管理の効率を大幅に改善する。
本稿では,ITS のニーズに応じて著作権の完全性を検証するための透かしを提案する。
実験の結果,Tracemarkはデータ品質,抽出精度,非偽造性において,ベースラインのパフォーマンスを上回っていることがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:26:17 GMT)
Independent RL for Cooperative-Competitive Agents: A Mean-Field Perspective [11.6] 強化学習(RL:Reinforcement Learning)とは、各チーム内で協力するが、異なるチーム間での一般競争があるように、チームにグループ化されるエージェントのひとつです。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:59:43 GMT)
Group Reasoning Emission Estimation Networks [11.5] 企業レベルの排出量推定を標準化する,AI駆動型炭素会計フレームワークを導入する。
大規模言語モデル(LLM)を用いた新しい推論手法を用いる。
1,114のAICSカテゴリの実験により、最先端の性能が得られる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:02:43 GMT)
Pareto Merging: Multi-Objective Optimization for Preference-Aware Model Merging [11.2] 本稿では,各ベースモデルのタスク上でのマージモデルの性能を目的として扱う,嗜好意識のモデルマージ問題を提案する。
提案したモデルマージにより,多様なトレードオフモデルが生成され,最先端のマージベースラインと比較して高いテスト精度が得られることを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:03:20 GMT)
Lossless Acceleration of Large Language Models with Hierarchical Drafting based on Temporal Locality in Speculative Decoding [11.2] LLM(Large Language Models)における推論の高速化は、リアルタイムインタラクションにおいて重要である。
投機的復号化は、トークンの起草と検証によって推論速度の向上に注目され、1つのフォワードパスで複数のトークンが生成される。
本稿では,時間的局所性に基づく階層型フレームワークを用いて,さまざまなトークンソースを複数のデータベースにまとめる,新しい無損失ドラフト手法である階層ドラフト(HD)を提案する。
7B と 13B のパラメータを持つ LLM を用いた Spec-Bench 実験では,HD が既存のデータベースドラフト手法より優れており,モデルサイズ,タスク,温度に対する堅牢な推論スピードアップが達成されている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:32:53 GMT)
Semantic Data Augmentation Enhanced Invariant Risk Minimization for Medical Image Domain Generalization [10.7] そこで本研究では,VIRMにおけるランダム拡張戦略を代替する,新しいドメイン指向方向セレクタを提案する。
本手法は,領域の差異を効果的に低減し,一般化性能を向上させる。
マルチセンター糖尿病網膜症データセットの実験は、我々の手法が最先端のアプローチより優れていることを示した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:40:05 GMT)
The Odyssey of the Fittest: Can Agents Survive and Still Be Good? [10.6] 本稿では,生物ドライブを3つの異なるエージェントに実装することの倫理的意義について検討する。
NEATに最適化されたベイズエージェント、変分推論に最適化されたベイズエージェント、GPT 4oエージェントが模擬冒険を行う。
分析によれば、危険が増加すると、エージェントは倫理的考慮を無視し、非倫理的行動を選択する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:17:28 GMT)
ConRFT: A Reinforced Fine-tuning Method for VLA Models via Consistency Policy [10.6] VLA(Vision-Language-Action)モデルは、現実世界のロボット操作において大きな可能性を示している。
これらのモデルを教師付き学習で微調整することで、制限された一貫性のないデモのために堅牢なパフォーマンスを達成することができる。
我々は,オフラインとオンラインのファインチューニングで構成されるConRFTという,VLAモデルのための強化されたファインチューニング手法を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:01:17 GMT)
SSH: Sparse Spectrum Adaptation via Discrete Hartley Transformation [10.3] 低ランク適応(LoRA)は,大規模基礎モデル(LLM)の微調整において,トレーニング可能なパラメータ数を削減できることが実証されている。
本稿では,SSH(Sparse Spectrum Adaptation via Discrete Hartley Transformation)を提案する。
SSHは、計算コストとメモリ要求を大幅に削減しながら、既存のパラメータ効率の微調整法(PEFT)よりも優れている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:06:58 GMT)
Meta-Reasoning Improves Tool Use in Large Language Models [10.2] 本稿では,タスクを最初に理由付け,候補ツールを出力する2段階システムであるTECTON(Meta-reasONing)によるツール選択を提案する。
TECTONは、様々な数学推論データセットにおいて、分布内と分布外の両方において、実質的なゲインをもたらす。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:26:05 GMT)
Dual Defense: Enhancing Privacy and Mitigating Poisoning Attacks in Federated Learning [10.1] フェデレート・ラーニング(FL)は、本質的にプライバシー侵害や毒殺攻撃の影響を受けやすい。
本稿では,DDF(Dual Defense Federated Learning)フレームワークを紹介する。
DDFedは、新たな参加者の役割を導入したり、既存のFLトポロジを破壊したりすることなく、プライバシー保護を強化し、毒殺攻撃を緩和する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:28:20 GMT)
ELMI: Interactive and Intelligent Sign Language Translation of Lyrics for Song Signing [10.0] ELMIは、リアルタイムでシンクされた歌詞とミュージックビデオのスニペットで、ユーザーがグルースを1行ずつ編集することを可能にする。
ユーザーは大きな言語モデル駆動AIとチャットして、意味、光沢、動機付け、タイミングについて議論することもできる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:00:32 GMT)
Flow-based Conformal Prediction for Multi-dimensional Time Series [9.9] 本稿では,トランスフォーマーと正規化フローを統合することで,2つの課題に対処する新しい共形予測手法を提案する。
トランスフォーマーは時系列の歴史的文脈を符号化し、正規化フローは、ベース分布から符号化された歴史的文脈に基づいて条件付けられた非整合性のスコアの分布への変換を学習する。
提案手法は,シミュレーションおよび実世界の時系列データセットを用いた包括的実験により,所望のカバレッジを満足しながら,ベースラインと比較して予測領域が小さいことを実証する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 22:04:05 GMT)
Implementing an information-theoretically secure Byzantine agreement with quantum signed message solution [9.6] Byzantine Agreement (BA) は、分散ネットワーク内のすべての正直なノードが合意に達することを可能にする。
本稿では、量子署名メッセージ(QSM)方式に基づく量子署名ビザンチン合意(QSBA)プロトコルを提案する。
本プロトコルは,ネットワークノード間のQKD共有鍵リソースのみを用いて,情報理論のセキュリティを実現する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:30:37 GMT)
The Evolution of Dataset Distillation: Toward Scalable and Generalizable Solutions [9.6] この調査は、データセット蒸留の最近の進歩を包括的にレビューする。
我々は、ImageNet-1KやImageNet-21Kのような大規模データセットへのスケーリングに注力する。
効率的かつ効果的な凝縮のためのSRe2Lフレームワークを含む、画期的なイノベーションを強調します。
また、ビデオおよびオーディオ処理、マルチモーダル学習、医用画像、科学計算における新しい応用についても検討する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:37:33 GMT)
Enhancing Hallucination Detection through Noise Injection [9.6] 大型言語モデル(LLM)は、幻覚として知られる、もっとも不正確な応答を生成する傾向にある。
ベイズ感覚のモデル不確実性を考慮し,検出精度を著しく向上できることを示す。
サンプリング中にモデルパラメータの適切なサブセット、あるいは等価に隠されたユニットアクティベーションを摂動する、非常に単純で効率的なアプローチを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:29:40 GMT)
Knowledge Graph Guided Evaluation of Abstention Techniques [9.5] 6つのオープンソースモデルとクローズドソースモデルに対して異なる禁忌テクニックをベンチマークする。
調査の結果,モデルが80%以上の棄権率で棄権されることが判明した。
しかし、これらの手法は、禁忌率が19%の目標概念の子孫にとって効果がない。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:36:28 GMT)
Infrared-Assisted Single-Stage Framework for Joint Restoration and Fusion of Visible and Infrared Images under Hazy Conditions [9.4] 本稿では,赤外線画像を用いた統合学習フレームワークを提案する。
本手法は, ヘイズを除去しながらIR-VIS画像を効果的に融合させ, 鮮明で無害な融合結果をもたらす。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:36:58 GMT)
Bridging the Gap between Expert and Language Models: Concept-guided Chess Commentary Generation and Evaluation [9.3] 我々は,言語による複雑な意思決定プロセスを説明する代表的タスクとして,チェスの解説に焦点をあてる。
概念誘導型Chess注釈生成法(CCC)を導入し,GPTに基づくChess注釈評価法(GCC-Eval)を用いて評価を行った。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:28:23 GMT)
Physics-Conditioned Diffusion Models for Lattice Gauge Theory [9.0] 我々は格子ゲージ理論をシミュレートするための拡散モデルを開発し、量子化をサンプリングの物理条件として明示的に組み込む。
2つの時空次元におけるU(1)ゲージ理論の適用性を示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:50:27 GMT)
Linear Alignment of Vision-language Models for Image Captioning [8.9] 本稿では,ReCapと呼ばれる軽量キャプション手法を提案する。
また,CLIPスコアに基づく2つの新しい学習ベース画像キャプチャーメトリクスと,提案したアライメントを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:54:35 GMT)
Advancing Fine-Grained Classification by Structure and Subject Preserving Augmentation [8.8] 本報告では,SaSPA: Structure and Subject Preserving Augmentationについて述べる。
本手法では, 実画像をガイダンスとして使用せず, 生成の柔軟性を高め, 多様性を高める。
従来のデータ拡張手法と最近のデータ拡張手法の両方に対して、広範な実験を行い、SaSPAをベンチマークする。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:48:51 GMT)
Deep Ritz method with Fourier feature mapping: A deep learning approach for solving variational models of microstructure [8.6] 本稿では,Deep Ritz Method(DRM)とFourier特徴マッピングを組み合わせて最小化問題の解法を提案する。
これらの問題は、最小のグローバルエネルギーポテンシャルが欠如しているため、計算上の課題を示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:37:03 GMT)
Feature Explosion: a generic optimization strategy for outlier detection algorithms [8.2] 外乱検出タスクは潜在的な問題や機会を発見することを目的としている。
何千もの異常検出アルゴリズムが提案されている。
この冗長性の根本原因は、現在の高度にカスタマイズされた(非汎用的な)最適化戦略にある。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:58:12 GMT)
Improving Environment Novelty Quantification for Effective Unsupervised Environment Design [8.0] 無監督環境設計(UED)は,教師エージェントと学生エージェントの対話的学習を通じて,自己カリキュラムの問題を定式化する。
既存のUEDメソッドは主に後悔に依存しており、エージェントの最適なパフォーマンスと実際のパフォーマンスの違いを測定する指標である。
本稿では,CENIE(Coverage-based Evaluation of Novelty In Environment)フレームワークについて紹介する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 23:59:41 GMT)
Bridging the Gap for Test-Time Multimodal Sentiment Analysis [7.9] マルチモーダル感情分析(マルチモーダル感情分析、Multimodal sentiment analysis、MSA)は、複数のモーダルを通して人間の感情や感情を理解し、認識することを目的とした、新たな研究トピックである。
本稿では,コントラスト適応(Contrastive Adaptation)と安定擬似ラベル生成(Stable Pseudo-label generation, CASP)の2つの手法を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:41:36 GMT)
CompAct: Compressed Activations for Memory-Efficient LLM Training [7.8] CompActはGPU上でのピークメモリ利用を事前トレーニングで25~30%削減し、LLMの微調整で50%削減する技術である。
低ランクで圧縮されたアクティベーションを後方パスに格納することで、必要なメモリを大幅に削減する。
CompActの貯蓄は、より大きなモデルに対してさらに高いスケールを期待しています。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:27:02 GMT)
Unifying AI Tutor Evaluation: An Evaluation Taxonomy for Pedagogical Ability Assessment of LLM-Powered AI Tutors [7.8] 我々は,現在最先端の大規模言語モデル (LLM) がAI家庭教師として有効かどうかを検討する。
本研究では,キーラーニング科学の原則に基づく8つの教育次元を持つ統一的な評価分類法を提案する。
MRBench - 192の会話と1,596の回答を含む新しい評価ベンチマーク。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:51:57 GMT)
Riemannian Manifold Learning for Stackelberg Games with Neural Flow Representations [7.8] Stackelbergの汎用ゲームにおいて,オンライン学習のための新しいフレームワークを提案する。
このアプローチの中核は、共同作用空間を滑らかなリーマン多様体に写す学習微分同相である。
この写像は、ニューラル正規化フローによって促進され、トラクタブルなイソプラナー部分空間の形成を保証する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:10:44 GMT)
Reed-Muller Codes on CQ Channels via a New Correlation Bound for Quantum Observables [7.4] 我々は、Reed-Muller符号の対称性とネスト構造を用いて復号関数を解析する。
以上の結果から,コードレートがHolevoの容量より小さい場合,2o(sqrtlog N)$ビットの任意のセットを高い確率で復号化可能であることが示された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 23:20:57 GMT)
Learning Spatiotemporal Dynamical Systems from Point Process Observations [7.4] 現在のニューラルネットワークベースのモデルアプローチは、時間と空間でランダムに収集されるデータに直面したときに不足する。
そこで我々は,このようなプロセス観察から効果的に学習できる新しい手法を開発した。
我々のモデルは、ニューラルディファレンシャル方程式、ニューラルポイントプロセス、暗黙のニューラル表現、そしてアモータライズされた変分推論の技法を統合している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:48:45 GMT)
Diffusion Model for Interest Refinement in Multi-Interest Recommendation [7.3] Diffusion Multi-Interest Model (DMI) は、ディメンションレベルでのユーザ関心表現を洗練するための新しいフレームワークである。
DMIは現実世界のレコメンデーションシステムにうまくデプロイし、毎日数億人のアクティブユーザの大きなトラフィックを提供する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:20:13 GMT)
Democratic Training Against Universal Adversarial Perturbations [7.1] 本研究では, 普遍的対向摂動が通常, 隠蔽層に異常なエントロピースペクトルをもたらすことを観察する。
我々は,emphDemocratic TrainingというUAPを効果的かつ効果的に防御する方法を提案する。
その結果, 攻撃成功率を効果的に低減し, モデル堅牢性を向上し, クリーンサンプルのモデル精度を維持できることがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:15:32 GMT)
Probabilistic Foundations for Metacognition via Hybrid-AI [7.0] 本稿では「エラー検出・修正規則」として知られるハイブリッドAIアプローチについてレビューする。
従来の実証研究に厳密さを加える確率的枠組みを導入する。
我々はこの枠組みを用いてメタ認知改善に必要な十分な条件について結果を証明している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:10:56 GMT)
Beyond Vision: How Large Language Models Interpret Facial Expressions from Valence-Arousal Values [7.0] 大規模言語モデルは、主にテキストベースの入力と出力によって操作されるが、人間の感情は、表情を含む言語的および非言語的な手がかりによって伝達される。
本研究では,LLMが生の視覚的入力を使わずに,表情の次元から感情的意味を推定できるかどうかを検討する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:54:03 GMT)
IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System [6.7] 本稿では,主にXTTSとTortoiseモデルに基づくIndexTTSシステムを紹介する。
具体的には、中国語のシナリオでは、文字とピンインを組み合わせたハイブリッドなモデリング手法を採用する。
XTTSと比較すると、自然性、コンテンツ一貫性、ゼロショット音声クローンの大幅な改善が達成されている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:23:20 GMT)
Quantifying the Cross-sectoral Intersecting Discrepancies within Multiple Groups Using Latent Class Analysis Towards Fairness [6.7] のイニシアチブは、サービスやリソース、機会へのアクセスにおいて、多種多様な不平等に対処するよう促します。
健康、エネルギー、住宅など、さまざまな分野の意思決定プロセスにAIツールが適用されている。
本研究は,クロスセクタ間差分を定量化するための革新的アプローチを導入する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:28:05 GMT)
4DR P2T: 4D Radar Tensor Synthesis with Point Clouds [6.6] 本稿では,深層学習に適したテンソルデータを生成する4D Radar Point-to-Tensor(4DR P2T)モデルを提案する。
K-Radarデータセットの実験結果は、4DR P2Tモデルの有効性を検証し、平均PSNRは30.39dB、SSIMは0.96である。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:42:23 GMT)
Are LLMs Correctly Integrated into Software Systems? [6.6] 大規模言語モデル(LLM)は、検索拡張生成(RAG)のサポートにより、様々なアプリケーションシナリオにおいて効果的なソリューションを提供する。
LLMをRAGサポートに組み込んだ100のオープンソースアプリケーションを総合的に調査し、18の欠陥パターンを特定した。
私たちの調査によると、これらのアプリケーションの77%は、ソフトウェア機能、効率、セキュリティを低下させる3つのタイプの統合欠陥を含んでいる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:57:00 GMT)
Multimodal Cognitive Reframing Therapy via Multi-hop Psychotherapeutic Reasoning [6.5] 我々はM2CoSC(Multi Modal-Cognitive Support Conversation)と呼ばれる新しいデータセットを提案する。
GPT-4生成ダイアログと仮想クライアントの表情を反映した画像とをペアリングする。
表情が暗黙的な感情的エビデンスを解釈する実際の心理療法をより良く反映するために,我々はマルチホップ・サイコセラピー的推論アプローチを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:32:48 GMT)
Operator convexity along lines, self-concordance, and sandwiched Rényi entropies [6.3] 凸関数が任意の一次元制限に沿った作用素凸であれば、そのエピグラフの自然対数障壁は自己調和的であることを示す。
本論文で考慮した凸円錐の実装は,我々のオープンソースインテリア・ポイント・ソルバQICSで利用可能である。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:17:57 GMT)
CrossVideoMAE: Self-Supervised Image-Video Representation Learning with Masked Autoencoders [6.2] CrossVideoMAEはビデオレベルとフレームレベルのリッチテンポラル表現とセマンティック属性の両方を学ぶ。
提案手法は,ビデオからの時間的情報とサンプルフレームからの空間的情報を統合する。
これは、ビデオおよびフレーム画像のモダリティから、リッチでラベルなしなガイド信号の自己教師型取得に不可欠である。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:15:39 GMT)
Language-based Valence and Arousal Expressions between the United States and China: a Cross-Cultural Examination [6.1] 本稿は,Twitter/X(米国)とSina Weibo(中国本土)を比較し,感情表現の文化的差異を考察する。
NRC-VADレキシコンを用いて、両プラットフォームにまたがる感情表現の異なるパターンを同定した。
われわれは、米国ユーザーが中国ユーザーよりも感情的な強さを示すなど、異文化間の大きな差異を明らかにした。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 22:12:35 GMT)
Comprehensive Monitoring of Air Pollution Hotspots Using Sparse Sensor Networks [6.0] 2018年5月1日から2020年11月1日までの30ヶ月にわたって、New Delhiの既存のセンサネットワークを28の低コストセンサーで拡張し、PM2.5データを収集しました。
このデータに定式化されたホットスポットの定義を適用すると、公共ネットワークによって検出された660個のホットスポットの確認とは別に、189個の隠れホットスポットが存在することが判明した。
この結果から,データ駆動予測モデルと物理に基づく力学モデルを統合することの重要性が示唆された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:27:54 GMT)
SMaCk: Efficient Instruction Cache Attacks via Self-Modifying Code Conflicts [5.9] 自己修正コード(SMC)は、プログラムが自身の命令を変更することを可能にする。
SMCは、悪質な目的のために悪用できるユニークな微構造的挙動を導入している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:35:55 GMT)
4D VQ-GAN: Synthesising Medical Scans at Any Time Point for Personalised Disease Progression Modelling of Idiopathic Pulmonary Fibrosis [5.9] 我々は,IPF患者をリアルなCTボリュームで生成できるモデルである4D-VQ-GAN(4D Vector Quantated Generative Adversarial Networks)を提案する。
縦断的CT画像を生成するためのモデルの異なる構成を評価し, 結果と地中真理データを比較した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 22:25:53 GMT)
On the Effectiveness of Large Language Models in Automating Categorization of Scientific Texts [5.8] 我々は,学術論文を階層型分類システムに分類する能力において,Large Language Models (LLMs) を評価する。
FORCデータセットを基底真理データとして使用することにより、最近のLCMでは、従来のBERTモデルよりも最大0.08の精度で、最大0.82の精度を達成できることがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:37:21 GMT)
BF-GAN: Development of an AI-driven Bubbly Flow Image Generation Model Using Generative Adversarial Networks [5.8] 気泡流生成対向ネットワーク(BF-GAN)と呼ばれる生成AIアーキテクチャを開発した。
物理的条件付き入力、jg、jfにより、現実的で高品質な気泡流画像を生成するように設計されている。
BF-GANは、2相フロー研究のための生成AIソリューションを提供し、高品質なデータを得るのに必要な時間とコストを大幅に削減する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:01:58 GMT)
SC-Bench: A Large-Scale Dataset for Smart Contract Auditing [5.8] 自動スマートコントラクト監査研究のための最初のデータセットであるSC-Benchを紹介する。
SC-Benchは5,377の現実世界のスマートコントラクトと15,975の標準に違反している。
GPT-4 を用いて SC-Bench の評価を行った。
以上の結果から,GPT-4は0.9%の違反しか検出できず,22.9%の違反を検出できた。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:58:02 GMT)
GWRF: A Generalizable Wireless Radiance Field for Wireless Signal Propagation Modeling [5.7] Generalizable Wireless Radiance Fields (GWRF) は、任意の3D送信機と受信機の位置で無線信号の伝搬をモデル化するためのフレームワークである。
まず、ジオメトリ対応トランスフォーマーエンコーダを用いた無線シーン表現モジュールは、地理的に近接する送信機からの情報を組み込んで、一般化可能な無線放射場を学習する。
第2に、このフィールド上でニューラル駆動のレイトレーシングアルゴリズムが動作し、受信機での信号受信を自動的に計算する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 22:03:08 GMT)
Multi-scale Masked Autoencoder for Electrocardiogram Anomaly Detection [5.6] MMAE-ECGはECG信号を非重複セグメントに分割し、各セグメントは学習可能な位置埋め込みを割り当てる。
新しいマルチスケールマスキング戦略とマルチスケールアテンション機構は、異なる位置埋め込みとともに、軽量なトランスフォーマーエンコーダを実現する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:18:38 GMT)
Sequential Stochastic Combinatorial Optimization Using Hierarchal Reinforcement Learning [5.6] 本稿では,上位層への適応的な予算配分と下位層へのノード選択を同時に決定する2層オプションベースフレームワークを提案する。
実験の結果,WS-option は従来の方法と比較して,有効性と一般化性が著しく向上していることがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:00:30 GMT)
Symmetry Breaking Dynamics in Quantum Many-Body Systems [5.4] エンタングルメント非対称性は、量子多体系における対称性の破れを特徴づける強力なツールとして登場した。
このレターでは、2つの異なるシナリオにおいて、対称性が絡み合う非対称性のレンズを通して動的に破壊されるかを考察する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:39:27 GMT)
KMI: A Dataset of Korean Motivational Interviewing Dialogues for Psychotherapy [5.3] モチベーション・インタヴュー(MI)は,これらのチャットボットの開発における専門知識向上の理論的基盤として注目されている。
本稿では,専門的セラピストの専門知識に富んだMIセッションをシミュレートする新しいフレームワークを提案する。
提案するKMIは、理論上はMIに基礎を置いている最初の合成データセットであり、高品質な韓国のモチベーション・インタビュー対話を1000種類含んでいる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:53:41 GMT)
On Exact Space-Depth Trade-Offs in Multi-Controlled Toffoli Decomposition [5.3] Clifford $+$ T ゲートセットを用いた Multi Toffoli (MCT) の最適化実装について検討する。
古典的2制御トフォリを用いたトフォリ深度と深度とのトレードオフの定量化を行う。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:00:35 GMT)
Data Augmentation Policy Search for Long-Term Forecasting [4.9] TSAAという時系列自動拡張手法を導入する。
TSAAは2段階のプロセスを通じて関連する二段階最適化問題に取り組む。
安定していくつかの堅牢なベースラインを上回ります。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:33:25 GMT)
Learning Memory and Material Dependent Constitutive Laws [4.8] 本稿では,共同学習の問題に焦点をあて,それに対応する新しいニューラルネットワークフレームワークを提案する。
このケルビン・ヴォイグト設定における細胞問題の理論的性質は、提案された一般神経オペレーターフレームワークの動機付けに使用される。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:08:45 GMT)
Diverse Image Generation with Diffusion Models and Cross Class Label Learning for Polyp Classification [4.7] そこで我々は,多種多様な特徴を持つテキスト制御合成画像を生成する新しいモデルPathoPolyp-Diffを開発した。
モデルが他のクラスから特徴を学習できるように、クラス間ラベル学習を導入し、データアノテーションの面倒な作業を減らす。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:26:20 GMT)
Engineered Chirality of One-Dimensional Nanowires [4.7] DNA、タンパク質、その他の生命の構成要素におけるキラリティの起源と機能は、生物学の中心的な問題である。
我々は、LaAlO$_3$/SrTiO$_3$インターフェースにおける導電性に対する再構成可能なナノスケール制御を用いて、鏡対称性を明示的に欠くキラル電子ポテンシャルを生成する。
我々は共鳴を、カイラル領域内の工学的な軸方向のスピン軌道相互作用から生じるものと解釈する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:14:00 GMT)
Transfer Learning of Surrogate Models via Domain Affine Transformation Across Synthetic and Real-World Benchmarks [4.5] 代理モデルはしばしば、現実世界のプロセスのコストのかかる実行のための効率的な代用として使われる。
本研究は、原関数から対象関数への非微分可能な代理モデルを転送することに焦点を当てる。
これらのドメインは未知のアフィン変換によって関連づけられていると仮定し、ターゲット上で評価された限られた量の転送データポイントのみを使用する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:02:02 GMT)
Reflexive Guidance: Improving OoDD in Vision-Language Models via Self-Guided Image-Adaptive Concept Generation [4.5] 各種プロプライエタリおよびオープンソースLVLMのOoDD機能の評価と解析を行った。
本稿では,LVLMのOoDD機能向上を目的とした自己誘導型プロンプト手法であるReflexive Guidance(ReGuide)を提案する。
実験結果から,我々のReGuideは画像分類とOoDDタスクの両方において,現在のLVLMの性能を向上させることが示された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:38:33 GMT)
ProMoE: Fast MoE-based LLM Serving using Proactive Caching [4.4] 本稿では,プロアクティブキャッシュシステムProMoEについて紹介する。
ProMoEはプリフィルおよびデコード段階で平均2.20倍(最大3.21倍)と2.07倍(最大5.02倍)のスピードアップを達成する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:11:25 GMT)
LLMs as Meta-Reviewers' Assistants: A Case Study [4.3] 大言語モデル(LLM)は、専門家の意見の制御された多視点要約(MPS)を生成するために使用することができる。
本稿では,GPT-3.5,LLaMA2,PaLM2の3種類のLPMを用いて,メタリビューアによる専門家の理解を深めるためのケーススタディを行う。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:23:21 GMT)
SSDD-GAN: Single-Step Denoising Diffusion GAN for Cochlear Implant Surgical Scene Completion [4.3] 本研究は, 人工乳頭切除データセットの外科的シーンを完了するための効率的な方法を提案する。
我々のアプローチは、実際の外科的データセットにおける自己教師付き学習を活用して、単一ステップのDNOD-GAN(SSDD-GAN)を訓練する。
トレーニングされたモデルは、ゼロショットアプローチを用いて、合成後乳頭切除データセットに直接適用される。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 22:04:22 GMT)
Learning Conformal Abstention Policies for Adaptive Risk Management in Large Language and Vision-Language Models [4.0] 大きな言語と視覚言語モデル(LLMs/VLMs)は、安全クリティカルなアプリケーションでますます使われている。
不確かさの定量化は、予測の信頼性を評価するのに役立ち、不確実性が高い場合の回避を可能にする。
本稿では,学習可能な禁忌法を提案し,強化学習(RL)と整形予測(CP)を統合して禁忌閾値を最適化する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:30:41 GMT)
False Discovery Rate Control via Frequentist-assisted Horseshoe [3.9] ホースシュー先行は、ベイズ推論や機械学習に先立つ、例外的にデフォルトのグローバルローカル縮小である。
定常的に有限サンプルFDR制御が可能であることを示す。
より複雑なモデルとグローバル局所縮小前ファミリの両方に対して、FDR制御を実現するための潜在的な一般化を指摘する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:56:18 GMT)
AMNS: Attention-Weighted Selective Mask and Noise Label Suppression for Text-to-Image Person Retrieval [3.6] ノイズ対応(NC)問題は画像品質の低下とラベルの誤りによる。
ランダムマスキングの強化は、必然的に重要なセマンティックコンテンツを捨てる可能性がある。
双方向類似分布マッチング(BSDM)損失は、正のペアから効果的に学習することを可能にする。
重み調整焦点(WAF)の損失により、モデルのハードサンプル処理能力が向上する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:45:33 GMT)
Coarse-to-Fine Structure-Aware Artistic Style Transfer [3.5] アーティスティック・スタイル・トランスファーは、スタイル・イメージとコンテンツ・イメージを使用して、スタイル・イメージと同じ芸術的表現を保持するターゲット・イメージを合成することを目的としている。
最近提案された多くのスタイル転送手法には共通の問題がある。つまり、スタイル画像のテクスチャと色をコンテンツ画像のグローバルな構造に単純に転送する。
本稿では,ローカルなスタイル構造をローカルなコンテンツ構造に融合させながら,スタイルパターンの転送に有効な方法を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:04:12 GMT)
Proving the Coding Interview: A Benchmark for Formally Verified Code Generation [3.5] FVAPPS (Formally Verified Automated Programming Progress Standards, FVAPPS) は,プログラムの記述と正確性を証明するための4715サンプルのベンチマークである。
我々は,機械学習とプログラム合成コミュニティに対して,汎用プログラミング問題とその関連した正当性仕様の解決に挑戦する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 22:54:58 GMT)
The Role of Prosody in Spoken Question Answering [3.5] 音声質問応答における韻律の役割について検討する。
語彙情報が手に入ると、モデルは主としてそれに依存する傾向にある。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:11:55 GMT)
WildGraph: Realistic Graph-based Trajectory Generation for Wildlife [3.5] 軌道生成は運動研究において重要な課題である。
ターゲットの人口から実際の軌跡を収集するプライバシー、倫理、技術的課題を回避している。
本稿では,野生生物の移動に類似した長距離軌道生成の問題点を,少数の実検体に基づいて考察する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:20:40 GMT)
Semantic Captioning: Benchmark Dataset and Graph-Aware Few-Shot In-Context Learning for SQL2Text [3.5] 大規模言語モデル (LLM) は様々なNLPタスクにおいて顕著な性能を示した。
逆のプロセスは、コードを自然言語に翻訳し、セマンティックキャプションと呼ばれるが、あまり注目されていない。
本稿では,クエリの理解と説明に関する重要なニーズに対処するため,2Textのキャプションに着目した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:58:14 GMT)
CODESIM: Multi-Agent Code Generation and Problem Solving through Simulation-Driven Planning and Debugging [3.4] 我々は,新しいマルチエージェントコード生成フレームワークであるCodeSimを紹介する。
人間が視覚シミュレーションを通じてアルゴリズムの理解を検証すると、CodeSimは一意に計画検証の手法を特徴付ける。
我々のフレームワークは、新しい最先端の結果を達成する(HumanEval 95.1%、MBPP 90.7%、APPS 22%、CodeContests 29.1%)。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:43:59 GMT)
Progressive Feedback-Enhanced Transformer for Image Forgery Localization [3.3] 本稿では,プログレッシブフィードbACkエンハンストランスフォーマー(ProFact)ネットワークを提案する。
実世界の法医学的シナリオに近い大規模な画像サンプルを自動的に生成する効果的な手法を提案する。
提案するローカライザは,画像フォージェリーのローカライゼーション能力とロバスト性において,最先端のローカライザを大きく上回っている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:30:01 GMT)
Do I Know This Entity? Knowledge Awareness and Hallucinations in Language Models [3.2] 大規模言語モデルにおける幻覚は広範な問題であるが、モデルが幻覚化するかどうかのメカニズムは理解されていない。
スパースオートエンコーダを解釈可能性ツールとして使用することにより,これらのメカニズムの重要な部分はエンティティ認識であることがわかった。
疎いオートエンコーダがベースモデルで訓練されているにもかかわらず、これらの方向がチャットモデルの拒否行動に因果的影響があることを実証する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:50:42 GMT)
Machine Unlearning via Information Theoretic Regularization [3.1] 本稿では,情報理論の正規化に基づく数学的枠組みを導入し,特徴とデータポイントのアンラーニングに対処する。
学習対象の柔軟性と正規化設計の単純さを組み合わせることで、我々のアプローチは、幅広い機械学習やAIアプリケーションに対して、高度に適応可能で実践的です。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:33:06 GMT)
ELMTEX: Fine-Tuning Large Language Models for Structured Clinical Information Extraction. A Case Study on Clinical Reports [3.0] 本稿では,Large Language Models (LLMs) を用いて,構造化されていない臨床報告から構造化情報を抽出することを目的としたプロジェクトの結果について述べる。
我々は,ユーザインタフェースを用いたワークフローを開発し,戦略と微調整により,様々なサイズのLCMを評価した。
以上の結果から,微調整された小型モデルでは性能が向上し,資源制限設定の効率化が期待できることがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:44:56 GMT)
An inpainting approach to manipulate asymmetry in pre-operative breast images [3.0] 乳房画像における乳頭形状と乳頭位置を再現する塗装法を提案する。
2つの乳房データセットの実験では、提案されたモデルが患者の乳房を現実的に変化させる能力を示している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:54:11 GMT)
ChainBuddy: An AI Agent System for Generating LLM Pipelines [2.8] ChainBuddyは、ChainForgeプラットフォームに組み込まれたAIワークフロー生成アシスタントである。
単一のプロンプトまたはチャットから、ChainBuddyは、ユーザの要求に応じてChainForgeでスターター評価パイプラインを生成する。
AIアシストを使用すると、参加者は要求の少ない作業負荷を報告し、より自信を持ち、LCMの振る舞いを評価する高品質なパイプラインを作成しました。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:59:10 GMT)
Inversion of Magnetic Data using Learned Dictionaries and Scale Space [2.8] 磁気データインバージョンは地球物理学において重要なツールであり、表面磁場測定から地表面の磁化率分布を推定するために用いられる。
従来の反転アプローチは、解を安定化させるために事前に定義された正則化技術に依存している。
本稿では,これらの課題に対処するために,可変辞書学習とスケールスペース手法を統合するアプローチを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:04:51 GMT)
MoFM: A Large-Scale Human Motion Foundation Model [2.6] MoFMは、時間と空間の両方において複雑な人間の動きを意味的に理解するために設計されている。
MoFMはモーションデータの大規模なコーパスに基づいて訓練されており、ワンショット、教師なし、教師なしタスクなどのパラダイムをサポートする。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:42:52 GMT)
Audio-visual cross-modality knowledge transfer for machine learning-based in-situ monitoring in laser additive manufacturing [2.6] 本稿では, LAM in-situ モニタリングのための相互モダリティ知識伝達手法について紹介する。
3つのCMKT法が提案され、セマンティックアライメント、完全教師付きマッピング、半教師付きマッピングである。
LAMインサイト欠陥検出のケーススタディでは,CMKT法とマルチモーダル・オーディオ・ビジュアル・フュージョンを比較した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:28:57 GMT)
Approximating the total variation distance between spin systems [2.5] 本研究では,差分距離$d_TV(mu,nu)$を$epsilon$-relativeエラーで近似する問題について検討する。
そこで本研究では,テレビ距離の近似問題と,サンプリングと近似カウントとを関連付ける新しい削減法を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:58:55 GMT)
Toward a Common Understanding of Cryptographic Agility -- A Systematic Review [2.5] 暗号のアジリティという用語はあいまいに定義されており、その正確な意味について明確なコンセンサスはない。
この明確さの欠如は、新たな暗号脆弱性と高度なコンピューティング脅威が出現するにつれて、アジリティの必要性がより緊急になるため、課題となる。
3つの研究コントリビューションを提供することで、暗号のアジリティの概念を体系化します。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:55:58 GMT)
Postselection-Free Cavity-Enhanced Narrow-Band Orbital Angular Momentum Entangled Photon Source [2.4] 提案手法は,光子対を狭帯域に束ねた最初のポストセレクションフリーのキャビタエンハンスド光子対を実現する。
我々はOAMエンタングルメントをほぼ損失のない偏光子に決定論的に転送し、0.948(2)の忠実度を持つ偏光エンタングルド2光子を得る。
提案手法は,メモリを用いた長距離量子通信とネットワークのための狭帯域光子源の創出に有効である。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:51:12 GMT)
People will agree what I think: Investigating LLM's False Consensus Effect [2.4] 大規模言語モデル(LLM)は、通信を必要とする対話型システムで最近採用されている。
モデルに対する誤った信念は、そのようなシステムのユーザビリティを損なう可能性があるため、LLMは人間が持っている認知バイアスを持ってはならない。
FCE(False Consensus Effect)は、個人が他人が信念や行動を共有する程度を過大評価する認知バイアスである。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:21:17 GMT)
Approaching the double-Heisenberg scaling sensitivity in the Tavis-Cummings model [2.4] Tavis-Cummingsモデルのような原型空洞量子力学系が二重HS精度を実現することを証明した。
このような二重感性は、量子スクイーズにより光子または原子価の揺らぎを導入することで実験的に実現できる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:19:50 GMT)
Explicit decoders using fixed-point amplitude amplification based on QSVT [2.3] 量子回路を明示する2つの復号器を提供し、最適な速度、すなわち量子容量を達成する。
我々の構成には計算コストの面でも利点があり、回路の複雑さを大幅に減らしている。
復号化問題の調査を通じて、QSVTベースのFPAAの独特な利点を強調した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:50:11 GMT)
The late-stage training dynamics of (stochastic) subgradient descent on homogeneous neural networks [2.1] 均質ニューラルネットワークによる分類の設定について考察する。
正規化SGD反復は、後期訓練において、正規化マージンの臨界点の集合に収束することを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:09:16 GMT)
AI-Driven Electronic Health Records System for Enhancing Patient Data Management and Diagnostic Support in Egypt [2.1] このプロジェクトは、エジプトのユニバーサルヘルス保険と医療エコシステムのためのEHRシステムを導入している。
マイクロサービスアーキテクチャとリアルタイムアクセスとプロバイダ通信のためのポリグロット永続性によって、医療履歴を集中化することで、データ管理を単純化する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:14:12 GMT)
From Cognition to Precognition: A Future-Aware Framework for Social Navigation [1.9] 本稿では,社会的に認識されたナビゲーションに取り組むための強化学習アーキテクチャであるFalconを提案する。
我々はSocial-HM3DとSocial-MP3Dという2つの新しいデータセットを含むSocialNavベンチマークを導入する。
我々は、最先端の学習法と古典的なルールベースの経路計画アルゴリズムを用いて、詳細な実験分析を行う。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:07:56 GMT)
Amorphous Fortress Online: Collaboratively Designing Open-Ended Multi-Agent AI and Game Environments [1.9] Amorphous Fortress OnlineはWebベースのプラットフォームで、ペトリディッシュのような環境や、マルチエージェントAIキャラクタで構成されるゲームを設計できる。
ユーザーは、顕微鏡的だが透明な有限状態マシンエージェントで構成される人工生命とゲーム環境をプレイ、作成、共有することができる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:25:52 GMT)
HumorReject: Decoupling LLM Safety from Refusal Prefix via A Little Humor [1.8] 大きな言語モデル(LLM)は、安全のために明示的な拒絶プレフィックスに依存している。
我々は,LLMの安全性を間接的拒絶戦略としてユーモアによる拒絶接頭辞から切り離すことによって,新たなデータ駆動型アプローチであるHumorRejectを紹介した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:15:20 GMT)
Evaluating Vision-Language Models for Emotion Recognition [1.7] 本稿では、画像から誘発された感情を認識するために、VLM(Large Vision-Language Models)を初めて包括的に評価する。
いくつかの実験を通して、感情認識性能が依存する重要な要因を明らかにし、その過程でVLMが犯した様々な誤りを特徴付ける。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:25:31 GMT)
Backflash Attack on Coherent One-Way Quantum Key Distribution [1.7] 単光子アバランシェ検出器(SPAD)によって発生した破壊フラッシュを利用して、盗聴者(Eve's)の情報取得を実験的に実証した。
この研究は、キー蒸留エンジン(KDE)を含むQKDシステムを用いてイヴの学習を定量化する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:24:59 GMT)
Graphical quantum Clifford-encoder compilers from the ZX calculus [1.6] 本稿では、クリフォードエンコーダをZX計算におけるユニークなグラフィカル表現にマッピングする量子コンパイルアルゴリズムを提案する。
具体的には、ZX計算の正準形式を開発し、任意のクリフォードエンコーダを正準形式に効率よく再現可能であることを証明する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:17:58 GMT)
Zero-Shot End-to-End Relation Extraction in Chinese: A Comparative Study of Gemini, LLaMA and ChatGPT [1.6] 本研究では,中国語のエンドツーエンド関係抽出(RE)における様々な大規模言語モデル(LLM)の性能について検討する。
以前の研究のほとんどは英語に焦点をあてるか、事前に注釈付けされたエンティティを仮定し、中国語のREでの有効性は未解明のままである。
精度,効率,適応性に基づいてChatGPT,Gemini,LLaMAを評価した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:12:04 GMT)
Integrating Causality with Neurochaos Learning: Proposed Approach and Research Agenda [1.5] 我々は、より優れた結果を得るために、因果学習とニューロカオス学習のアプローチを統合する方法について検討する。
本稿では,この統合による分類・予測・強化学習の促進に向けたアプローチを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:06:44 GMT)
MC3: Memory Contention based Covert Channel Communication on Shared DRAM System-on-Chips [1.4] 我々は,新しいメモリ保持型秘密通信攻撃MC3を導入する。
システムへのLLCや高機能アクセスを必要とせずに、CPUとGPU上で動作するアプリケーション間の高いスループット通信を実現する。
NVIDIA Orin AGX, Orin NX, Orin Nano における MC3 の有用性を 1% 以下の6.4 kbps の伝送速度で実証した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:44:24 GMT)
LLM4DistReconfig: A Fine-tuned Large Language Model for Power Distribution Network Reconfiguration [1.3] DERの統合と顧客参加の増加により、配電ネットワークは進化している。
最適動作を維持し、損失を最小限に抑え、様々な負荷要求を満たすためには、頻繁なネットワーク再構成が必要である。
データ駆動の再構成は、不完全なネットワークデータに対する正確性、速度、堅牢性のために勢いを増している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:13:16 GMT)
Fake detection in imbalance dataset by Semi-supervised learning with GAN [1.3] 本研究は,100個のラベル付きサンプルを用いた偽アカウントの検出において,81%の精度を達成し,この分野に寄与する。
これは、マイノリティクラスを扱い、偽アカウント検出におけるビッグデータの問題に対処するための強力なツールとしてのSGANの可能性を示している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:30:26 GMT)
Vision-Ultrasound Robotic System based on Deep Learning for Gas and Arc Hazard Detection in Manufacturing [1.2] ガス漏れとアーク放電は産業環境に重大なリスクをもたらす。
本研究では,ガス漏れやアーク放電を自律的に検出・分類する深層学習型ロボットシステムを提案する。
このシステムは、ロボット上ですべての実験的なタスクを実行するように設計されている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:17:19 GMT)
Segmentation-free integration of nuclei morphology and spatial transcriptomics for retinal images [1.2] SEFI(Segmentation-Free Integration)は、細胞核の形態的特徴と空間転写学データを統合する新しい方法である。
マルチプレックス単一分子Fluorescence In Situ Hybridization (smFISH)を用いて得られた発達期網膜の空間分解遺伝子発現プロファイルについてSEFIを実証する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:03:02 GMT)
On the use of adversarial validation for quantifying dissimilarity in geospatial machine learning prediction [1.1] 本稿では,データ特徴空間の観点から,0~100%間隔における相似性を定量化する手法を提案する。
提案手法は逆検証(DAV)により異種性(dissimilarity)と呼ばれる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:54:04 GMT)
Federated Learning with Reservoir State Analysis for Time Series Anomaly Detection [1.1] フェデレートラーニングでは、複数のクライアントによるローカルモデルトレーニングとサーバによるモデル統合は、モデルパラメータ共有によってのみ繰り返される。
本研究では,計算効率とデータプライバシ保護を同時に求めるために,貯水池状態解析を用いたフェデレーション学習手法を提案する。
時系列異常検出のためのベンチマークデータセットを用いて,InFed MD-RSの性能評価を行った。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:00:23 GMT)
Achievable rates in non-asymptotic bosonic quantum communication [1.0] ガウス流路の非漸近容量の計算容易な下界を求める。
我々は2つのガウス状態間のトレース距離を固定精度で計算できる最初のアルゴリズムを設計する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:12:26 GMT)
The Complexity of Learning Sparse Superposed Features with Feedback [1.0] モデルの基本となる学習特徴がエージェントからのフィードバックによって効率的に検索できるかどうかを検討する。
スパース設定で特徴行列を学習する際のフィードバックの複雑さを解析する。
この結果は,エージェントがアクティベーションを構築し,スパースシナリオにおいて強い上限を示すことを許された場合に,厳密な境界を確立する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:54:23 GMT)
Nonlinearity mediated miscibility dynamics of mass-imbalanced binary Bose Einstein condensate for circular atomtronics [0.8] 準2次元質量不均衡Bose-Einstein凝縮体の非線形および分数的復元による不整合ダイナミクスについて検討する。
時間進化の過程では、空間密度分布と自己相関関数で見られるように、2種の凝縮体は一般的には不明瞭なままである。
この研究は、凝縮体が自己相関関数の明確なシグネチャと空間的に区別できる条件も明らかにした。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:52:47 GMT)
How Culturally Aware are Vision-Language Models? [0.8] 神話、民俗舞踊、文化記号、シンボルなどの民俗ジャンルからのイメージは、あらゆる文化にとって不可欠である。
本研究は、これらの画像中の文化的特定情報を特定するために、4つの一般的な視覚言語モデルの性能を比較した。
画像キャプションにおける文化意識の度合いを計測する新しい評価指標であるCAS(Culture Awareness Score)を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:49:00 GMT)
dynoGP: Deep Gaussian Processes for dynamic system identification [0.8] ガウスディープ・プロセスの特定のクラス(ディープGP)に基づく力学系に対するシステム同定の新しい手法を提案する。
提案手法は,ニューラルネットワークアーキテクチャに基づくようなデータ駆動手法の強みと,確率分布を出力する能力を組み合わせる。
シミュレーションデータと実世界のデータの両方を用いて,提案手法の有効性を実証する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:57:59 GMT)
CSP-AIT-Net: A contrastive learning-enhanced spatiotemporal graph attention framework for short-term metro OD flow prediction with asynchronous inflow tracking [0.7] 現在のモデルでは、オリジン・デスティネーション(OD)の乗客フローデータの非同期離脱特性を捉えることができないことが多い。
本稿では,非同期なインフロートラッキングと高度なセマンティクスを組み込むことで,ODフローの予測を改善する新しいフレームワークを提案する。
この作業は、メトロの運用効率の向上、スケジューリングの精度の向上、システム全体の安全性の向上に寄与する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:51:41 GMT)
MMHMER:Multi-viewer and Multi-task for Handwritten Mathematical Expression Recognition [0.7] 本稿では,CNNとTransformerの強みを効果的に統合できるマルチビューマルチタスクフレームワークを提案する。
我々のモデルは手書きの数学的表現の複雑さをうまく扱える。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:03:52 GMT)
Topological derivative approach for deep neural network architecture adaptation [0.6] この研究は、深度に沿ってニューラルネットワークアーキテクチャを段階的に適応させる新しいアルゴリズムを提案する。
本稿では, 形状関数の最適条件が, 深部神経アーキテクチャ適応の固有値問題につながることを示す。
提案手法は,新しい層を挿入する必要がある深さに最も敏感な位置を決定する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 23:01:07 GMT)
Efficient learning and optimizing non-Gaussian correlated noise in digitally controlled qubit systems [0.6] 雑音最適化回路設計における高次スペクトル推定法について述べる。
注目すべきは、デジタル駆動された量子ビットダイナミクスは、適用された制御の複雑さによってのみ決定できることである。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:09:40 GMT)
Explainable and Class-Revealing Signal Feature Extraction via Scattering Transform and Constrained Zeroth-Order Optimization [0.6] 機械学習モデルから識別可能かつ説明可能な特徴を抽出する新しい手法を提案する。
興味のあるクラスのクラス確率を最大化する入力パターンを探索するために、ゼロ階最適化アルゴリズムを採用する。
本稿では,合成時系列分類問題を用いて提案手法の有効性を実証する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 23:35:37 GMT)
CluStRE: Streaming Graph Clustering with Multi-Stage Refinement [0.5] 計算効率と高品質クラスタリングのバランスをとる新しいストリーミンググラフクラスタリングアルゴリズムであるCluStREを提案する。
我々は、CluStREがソリューションの品質を89.8%改善し、2.6倍高速に動作し、最先端のストリーミングクラスタリングアルゴリズムで要求されるメモリの3分の2未満を使用することを示した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:18:13 GMT)
Weakly-Supervised PET Anomaly Detection using Implicitly-Guided Attention-Conditional Counterfactual Diffusion Modeling: a Multi-Center, Multi-Cancer, and Multi-Tracer Study [0.4] PET画像(IgCONDA-PET)における異常検出のための弱教師付きIgCONDA拡散モデルを提案する。
トレーニングは、アテンションモジュールを介してイメージクラスラベル(健康対不健康)に条件付けされる。
我々は、不健康な入力画像の合成的で健全なバージョンを生成することにより、「不健康な」ドメイン翻訳を容易にする対物生成を行う。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:56:44 GMT)
Block Graph Neural Networks for tumor heterogeneity prediction [0.4] 正確な腫瘍分類は有効な治療法の選択に不可欠である。
標準腫瘍グレーディングは、細胞分化に基づく腫瘍を分類するが、スタンドアロンの処置としては推奨されない。
腫瘍の進化をシミュレートし,腫瘍分類のための人工データセットを生成する数学的モデルを構築することを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:48:09 GMT)
ETHEREAL: Energy-efficient and High-throughput Inference using Compressed Tsetlin Machine [0.3] Tsetlin Machine(TM)はディープニューラルネットワーク(DNN)に代わる新しい選択肢である
本稿では,排除されたオートマトン状態を用いて,肯定句と否定句の両方でTM論理パターンをスパース化するトレーニング手法を提案する。
標準のTMと比較して、ETHEREAL TMモデルはモデルサイズを最大87.54%削減できる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:58:43 GMT)
Dynamical complexity of non-Gaussian many-body systems with dissipation [0.3] 本研究では, ガウス間結合, オンサイト非ガウス間相互作用, 局所散逸を伴うボソニックおよびフェルミオン多体モデルの状態を特徴付ける。
フェルミオン系では、デフォーカスノイズが非ガウス相互作用よりも大きい場合、系状態は常にガウス状態の凸結合である。
ボソニック系とは異なり、フェルミオン系は、サイト間結合よりもはるかに大きいノイズ率でも絡み合いを発生させることができる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:23:31 GMT)
From "I have nothing to hide" to "It looks like stalking": Measuring Americans' Level of Comfort with Individual Mobility Features Extracted from Location Data [0.2] 位置情報収集は、スマートフォンがユビキタスになるにつれて広まりつつある。
データアグリゲータとデータブローカは、個々の位置情報データへのアクセスを提供する。
FTCはまた、位置情報の消費者プライバシを活発に規制し始めた。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:34:18 GMT)
Vision-in-the-loop Simulation for Deep Monocular Pose Estimation of UAV in Ocean Environment [0.2] 本論文では,海洋環境下でのUAVの深部単分子ポーズ推定のためのビジョン・イン・ザ・ループシミュレーション環境を提案する。
ガウススプラッティングの最近の進歩を生かしたフォトリアリスティックな3次元仮想環境を提案する。
結果として得られたシミュレーションにより、飛行ソフトウェア、ハードウェア、深層単眼のポーズ推定スキームのすべての側面を検証しながら、飛行操作の屋内テストが可能になる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:19:42 GMT)
CISCA and CytoDArk0: a Cell Instance Segmentation and Classification method for histo(patho)logical image Analyses and a new, open, Nissl-stained dataset for brain cytoarchitecture studies [0.2] 組織学的スライスにおけるセルインスタンスの自動セグメンテーションと分類のための新しいディープラーニングフレームワークCISCAを提案する。
CISCAの中核は、軽量なU-Netとデコーダに3つの頭を持つネットワークアーキテクチャである。
我々はCISCAを他の最先端手法と比較し、その汎用性、堅牢性、およびセグメンテーションと分類における精度を実証した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:38:23 GMT)
Global Ease of Living Index: a machine learning framework for longitudinal analysis of major economies [0.2] 世界経済の急激な変化、地政学的状況、新型コロナウイルス(COVID-19)のパンデミックなどの破壊は、生活費や生活の質に影響を与えている。
本稿では, 生活の質を, 社会経済的・インフラ的要因を1つの複合スコアに組み合わせたGlobal Ease of Living Indexを通じて定量化する手法を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:37:17 GMT)
Mobile Application Threats and Security [0.2] この原稿は、モバイルコンピューティング業界のセキュリティ上の脆弱性、特にタブレットとスマートフォンに焦点を当てている。
本研究の目的は、現在のセキュリティリスクと脅威を分析し、そのような脅威から保護するためにデプロイされる可能性のあるソリューションを提供することである。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:33:57 GMT)
Commissioning An All-Sky Infrared Camera Array for Detection Of Airborne Objects [0.1] ガリレオ計画では、空を継続的に監視する多モード地上観測所を設計、建設、委託している。
鍵となる機器の1つは、8つの冷却されていない長波長のFLIRボソン640カメラを使用した全天型赤外線カメラアレイである。
各種気象条件に対する受入率(観測可能な航空機等)と検出効率(検出に成功している航空機等)を報告する。
おもちゃのアウトリーチは2次元再構成トラジェクトリーフラッグの大きな不純物に焦点を絞ったもので、トラジェクトリーの約16%をアウトリーチとして用いた。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:37:06 GMT)
Opportunities and Challenges of Generative-AI in Finance [0.1] 本稿では,金融分野におけるGen-AI技術の応用について概観する。
本稿では,Gen-AI技術の育成に使用可能な各種手法と,金融エコシステムにおけるGen-AI技術の応用分野について述べる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:43:32 GMT)
ViTHSD: Exploiting Hatred by Targets for Hate Speech Detection on Vietnamese Social Media Texts [0.0] まず、ベトナムのソーシャルメディアテキストを対象としたヘイトスピーチ検出データセットViTHSDを紹介する。
データセットには10Kコメントが含まれており、各コメントには、クリーン、攻撃、ヘイトという3つのレベルがある特定のターゲットにラベルが付けられている。
データセットから得られたアノテーション間の合意は、コーエンのカッパ指数によって0.45であり、中程度のレベルとして示される。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:31:38 GMT)
Using agent-based models and EXplainable Artificial Intelligence (XAI) to simulate social behaviors and policy intervention scenarios: A case study of private well users in Ireland [0.0] アイルランドの田園部の人口の約50%は、農業流出や未処理排水に弱い非規制の私的井戸に依存している。
志賀毒素産生性大腸菌(STEC)およびその他の水性疾患の高国率と水被曝との関連が指摘されている。
本研究では,エージェント・ベース・モデリング(ABM)を用いて,全国調査データに基づく政策介入をシミュレートする。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 23:21:50 GMT)
User Identification Procedures with Human Mutations: Formal Analysis and Pilot Study (Extended Version) [0.0] ユーザ識別手順をセキュリティ儀式としてモデル化して分析し、そのような儀式を自動的に分析するための実証された手法を適用した。
このアプローチは、識別プロセス中に期待される相互作用から逸脱する潜在的な人間のエラーをモデル化するための突然変異規則に依存している。
概念実証として、来訪者認証のためのAI駆動のバーチャルレセプタリストキオスクを含む実生活のパイロット研究を検討する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:29:53 GMT)
Unpaired Image Dehazing via Kolmogorov-Arnold Transformation of Latent Features [0.0] 本稿では,Kolmogorov-Arnold Transformation, UID-KATによる教師なし画像復調のための革新的なフレームワークを提案する。
提案するUID-KATフレームワークは,実世界のデータの豊富さを活かし,ペア/クリーンな画像を作成するという課題に対処するために,教師なし環境で訓練されている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:24:49 GMT)
Uncertainty, von Neumann entropy and squeezing in bipartite state of two-level atoms [0.0] 我々はフォン・ノイマンのエントロピーの不確実性に対処し、2つの準位原子の絡み合ったバイパルタイト純状態でスクイーズする。
両部状態が絡み合っているとき、合成状態のフォン・ノイマンエントロピーは部分系のものよりも小さいことを観察する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:22:28 GMT)
Traversable AdS Wormhole via Non-local Double Trace or Janus Deformation [0.0] トラバース可能なAdSワームホールのCFT双対を構築するための2つの方法について検討した。
まず,2つのポアンカーAdS測地とBTZブラックホールを凝集させることにより,トラベル可能なワームホールの単純なモデルを構築した。
本稿では,2つの分離されたCFT間の二重トレース変形が,AdSワームホールの2点関数を再現可能であることを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:48:17 GMT)
Towards Learning Scalable Agile Dynamic Motion Planning for Robosoccer Teams with Policy Optimization [0.0] 障害物の存在下でのマルチエージェントシステムの動的運動計画は普遍的で未解決な問題である。
本稿では,学習に基づく動的ナビゲーションモデルを提案し,シンプルなRobosoccer Gameの概念を用いて,シンプルな環境で動作するモデルを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:13:07 GMT)
Targeted synthetic data generation for tabular data via hardness characterization [0.0] 本稿では,高価値な学習点のみを生成する簡単な拡張パイプラインを提案する。
提案手法はサンプル外予測の品質を向上し,非対象手法と比較して計算効率が向上する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:33:51 GMT)
TOKON: TOKenization-Optimized Normalization for time series analysis with a large language model [0.0] 本稿ではトークン化の本質的性質を考慮した新しい正規化手法を提案する。
提案したTokenization-d Normalization(TOKON)は,各要素を単一トークンで表現することで時系列データを単純化する。
また, 時系列予測のための新しいプロンプト, Time Series Forecasting with Care (TFSC) を導入し, 予測性能をさらに向上させる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:42:14 GMT)
Smart Sampling Strategies for Wireless Industrial Data Acquisition [0.0] 本研究では,データ取得戦略の最適化がエイリアス効果や系統的誤りを低減させる方法について検討する。
サンプリング周波数の80%低減は測定品質を劣化させることなく達成された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:22:29 GMT)
Scalable Framework for Classifying AI-Generated Content Across Modalities [0.0] 本稿では,知覚ハッシュ,類似度測定,擬似ラベル処理を統合したスケーラブルなフレームワークを提案する。
Defactify4データセットの総合評価は、テキストおよび画像分類タスクにおける競合性能を示す。
これらの結果は、生成AIが進化を続けるにつれて、現実世界のアプリケーションに対するフレームワークの可能性を強調している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:07:02 GMT)
Relaxation Fluctuations of Correlation Functions: Spin and Random Matrix Models [0.0] 本稿では,量子カオスの診断尺度として,ある相関関数の変動平均と分散について検討する。
モデルの3つの異なる位相(エルゴード相、フラクタル相、局所化相)を同定する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:42:34 GMT)
Real Time Control of Tandem-Wing Experimental Platform Using Concerto Reinforcement Learning [0.0] 本稿では,DDTWEP(Direct-Drive Tandem-Wing Experimental Platform)のリアルタイム制御性能向上を目的とした改良強化学習法であるCRL2RTアルゴリズムを提案する。
その結果,CRL2RTは標準CPUで2500Hzを超える制御周波数を実現することがわかった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 03:46:40 GMT)
QuantumDNA: A Python Package for Analyzing Quantum Charge Dynamics in DNA and Exploring Its Biological Relevance [0.0] DNA電荷動力学の研究は、物理学、化学、生物学、医学を橋渡しする非常に学際的な分野である。
我々は,DNA電荷移動(CT)と励起状態を量子物理法を用いてシミュレーションする,オープンソースのPythonパッケージQuantumDNAを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:48:16 GMT)
Predictive Modeling of Classical and Quantum Mechanics Using Machine Learning: A Case Study with TensorFlow [0.0] 本稿では,古典系と量子系の両方の挙動を予測するための機械学習手法を提案する。
古典的領域では、標準人工ニューラルネットワーク(ANN)と物理インフォームドニューラルネットワーク(PINN)の両方を用いて、複数の力の振り子をモデル化する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:02:03 GMT)
Physics Informed Neural Network Estimated Circuit Parameter Adaptive Modulation of DAB [0.0] 提案手法は,物理インフォームドニューラルネットワークを用いて推定した回路パラメータに基づいて制御パラメータを調整する。
本稿では、デュアルアクティブブリッジDC-DCコンバータにおける損失最適化および回路パラメータ感受性TPS変調方式の開発、実装、検証について述べる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:20:28 GMT)
Paradox No More: How Stimulated Emission of Radiation Preserves Information Absorbed by Black Holes [0.0] ブラックホールは2つのパラドックスに関係しており、これは明らかに非単位動力学を含む。
このパラドックスは、ホーキングの元々の導出の誤りによるものであることを示す。
励起放出の寄与を復活させることで、ブラックホールの(正の)古典的な情報伝達能力を計算することができる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:06:36 GMT)
PT-Symmetry Breaking Transitions in Polymeric Systems [0.0] 古典的なDNAの解離遷移は、一般化パリティ (bf P) 時間逆転 (bf T) 対称性の遷移によって支えられていることを示す。
また,有限サイズ格子上の単一不純物とランダム乱れの存在下では,Hatano-Nelsonモデルの1次元離散化バージョンも検討する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:05:24 GMT)
Optimal conversion of Kochen-Specker sets into bipartite perfect quantum strategies [0.0] バイパート完全量子戦略 (BPQS) は、2人のプレイヤーが互いに孤立し、非ローカルゲームの全てのトライアルに勝つことを可能にする。
BPQSは近年の量子情報と量子計算において重要な役割を担っている。
与えられたKochen-Specker (KS) セットの最小設定数でBPQSを識別するアルゴリズムを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:27:38 GMT)
Open Challenges in Time Series Anomaly Detection: An Industry Perspective [0.0] 実践的な関連性のあるいくつかの分野をリストアップし、現在の議論からまだ検討されていないか、あるいは完全に欠落していると信じている。
クラウド環境にデプロイされるシステムの調査に基づいて,ストリーミングアルゴリズム,ヒューマン・イン・ザ・ループシナリオ,ポイントプロセス,条件付き異常,時系列の人口分析の分野を動機づける。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:38:07 GMT)
On A Scale From 1 to 5: Quantifying Hallucination in Faithfulness Evaluation [0.0] 幻覚は自然言語生成(NLG)においてポピュラーな話題となっている。
本稿では,ガイド付きNLGにおける信頼度の自動評価について検討する。
GPT-4はソースと世代が実際に一貫性があるかどうかの正確な判断と説明を提供する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:35:35 GMT)
Nonequilibrium Quantum Batteries: Amplified Work Extraction Through Thermal Bath Modulation [0.0] 複数の熱貯水池と相互作用する2セルと3セルの量子電池における作業抽出の定常状態特性について検討した。
本分析は, 貯水池における温度勾配の影響とセル間結合強度が電池性能に及ぼす影響に着目した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:02:06 GMT)
Naeural AI OS -- Decentralized ubiquitous computing MLOps execution engine [0.0] エンド・ツー・エンドのAI協調型アプリケーションパイプラインのローコード開発と展開に革新的なアプローチを提案する。
我々は、トークン化経済に基づいて、完全に分散したグローバルな協力コミュニティにおけるインフラ割り当て、コスト、および安全な雇用分配について論じる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:03:35 GMT)
NBM: an Open Dataset for the Acoustic Monitoring of Nocturnal Migratory Birds in Europe [0.0] この研究は、西太平洋の117種から13,359種の注釈付き発声を収集した夜行性鳥類移動データセットを提示する。
このデータセットには正確な時間と頻度のアノテーションが含まれており、フランス全土の何十人もの鳥愛好家によって集められている。
データセットの45の主種に対する認識モデルの精度は、はるかに大きなデータセットでトレーニングされた最先端のシステムと競合することを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:40:33 GMT)
Modeling of Core Loss Based on Machine Learning and Deep Learning [0.0] 本稿では,CNN-FCNNに基づくMNN(Mix Neural Network)を提案する。
1つのモデルで温度、周波数、波形の異なる少なくとも4つの異なる材料を予測できることがわかった。
MNNとXGBoostを組み合わせたハイブリッドモデルが提案され、重み付けによって予測され、精度が向上し続けることが判明した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 08:07:58 GMT)
Machine learning-guided construction of an analytic kinetic energy functional for orbital free density functional theory [0.0] 数百の材料の結晶セル平均運動エネルギー密度(タウ)の機械学習によって導かれる運動エネルギー密度表現(タウ)の解析式を構築した。
特徴量に対するタウの機能的依存のタイプを理解するために,ハイブリッドガウスプロセス回帰-ニューラルネットワーク(GPR-NN)法が用いられた。
コーンシャム DFT エネルギー体積曲線を十分な精度で再現できる解析モデルを構築した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 02:28:15 GMT)
ML DevOps Adoption in Practice: A Mixed-Method Study of Implementation Patterns and Organizational Benefits [0.0] 機械学習(ML) DevOps(MLOps)は、さまざまな産業でMLモデルを効率的に運用するための重要なフレームワークとして登場した。
本研究では,文献と実証分析を組み合わせることで,ML DevOpsの採用動向,実装の取り組み,メリットについて検討する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:37:24 GMT)
Leveraging Interpolation Models and Error Bounds for Verifiable Scientific Machine Learning [0.0] 我々は、検証可能な科学的機械学習へのベスト・オブ・ワールド・アプローチを提案する。
本稿では,複数の標準手法が効率よく計算あるいは推定できる情報的誤差境界を持つことを示す。
本稿では,エアフォイル画像からリフト・ドラッグ比を予測する手法を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:04:22 GMT)
Latent Structure Modulation in Large Language Models Through Stochastic Concept Embedding Transitions [0.0] 埋め込み遷移は、推論中にトークン表現を動的に調整する確率的メカニズムを導入する。
各トークンの埋め込みは確率的更新によって進化する移行フレームワークが提案された。
経験的評価では、語彙の多様性が向上し、生成コヒーレンスが向上し、低頻度語彙の保持が向上した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:53:52 GMT)
Latent Point Collapse on a Low Dimensional Embedding in Deep Neural Network Classifiers [0.0] 同一クラスに属する潜在表現の崩壊を単一点に誘導する手法を提案する。
提案されたアプローチは実装が簡単で、非ネイティブな機能埋め込みを大幅に改善する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:34:08 GMT)
Instrumental distortions in quantum optimal control [0.0] RAW-GRAPEは応答対応勾配上昇パルス工学フレームワークである。
GRAPEループ内の微分可能な歪みのカスケードを考慮に入れている。
ユーザが指定した歪みカスケードに耐性のある制御シーケンスを生成する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:29:48 GMT)
Information geometry of entangled states induced by noncommutative deformation of phase space [0.0] 非可換空間(NC)パラメータを通して位相空間の変形によって引き起こされる量子絡み合いの概念を再考する。
NC空間におけるガウス状態の状態空間の幾何学的構造は、情報幾何学的アプローチによって説明される。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:38:26 GMT)
Hierarchical Lexical Manifold Projection in Large Language Models: A Novel Mechanism for Multi-Scale Semantic Representation [0.0] 構造的階層的埋め込みをトランスフォーマーベースのアーキテクチャに統合することで、語彙表現に対する洗練されたアプローチが導入された。
トークンを構造化多様体にマッピングする射影機構は、改善された語彙アライメントを提供する。
埋め込みの洗練された階層構造は、語彙モデリングにおいてより大きな解釈可能性をもたらす。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:49:32 GMT)
Gravity from entropy [0.0] 重力はエントロピー作用結合物質場と幾何学から導かれる。
提案されたエントロピー作用は、時空の計量と物質場によって誘導される計量の間の量子相対エントロピーである。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:09:07 GMT)
Generalized Venn and Venn-Abers Calibration with Applications in Conformal Prediction [0.0] 本稿では,Venn and Conditional-Abersキャリブレーションのための統一フレームワークを提案する。
サブポピュレーションにおける有限サンプル校正の新しい手法であるVenn multicalibrationを提案する。
分布自由条件のキャリブレーションによるヒストグラム・バイニングとアイソトニック・キャリブレーションの保証を一般の損失に拡張する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 19:52:59 GMT)
GIS as a Job Growth Area for IT Professionals [0.0] 産業が成長するにつれて、地理空間産業を前進させるためには、このようなスキルが要求される候補者が必要である。
この業界は一般的に多くのITプロフェッショナルにとって成長の領域として知られておらず、誤解を招く求職のために、多くの候補者は彼らのスキルが要求されていることを知らないかもしれない。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 20:36:45 GMT)
Forbidden Science: Dual-Use AI Challenge Benchmark and Scientific Refusal Tests [0.0] 本稿では,主に制御された物質問合せの安全メカニズムを評価するための,オープンソースのデータセットとテストフレームワークを提案する。
系統的に異なるプロンプトに対する4つの主要モデルの反応を解析した。
Claude-3.5-sonnetは73%の拒絶と27%の許容率で最も保守的なアプローチを示し、Mistralは100%のクエリに答えようとした。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:27:33 GMT)
Flowing Through Layers: A Continuous Dynamical Systems Perspective on Transformers [0.0] 本稿では,変圧器の標準離散更新規則を連続力学系の前方オイラー離散化として自然に解釈できることを示す。
我々のTransformer Flow Approximation Theoremは、標準的なリプシッツ連続性仮定の下で、トークン表現が、層の数が増えるにつれてODEのユニークな解に一様収束することを示した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 18:11:40 GMT)
FlavorDiffusion: Predicting Food Pairings and Chemical Interactions Using Diffusion Models [0.0] 本稿では,フレーバー拡散モデルを用いた食品化学相互作用と成分ペアリングの予測手法を提案する。
グラフベースの埋め込み、拡散プロセス、化学特性の符号化を統合することで、FravorDiffusionはデータの不均衡に対処し、クラスタリングの品質を高める。
提案する枠組みは, 食品科学におけるスケーラブルで解釈可能な, 化学的に情報を得たソリューションを提供する, 計算ガストロノミーにおける重要な一歩である。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:47:27 GMT)
Exponential Separation Criteria for Quantum Iterative Power Algorithms [0.0] その結果,QIPAとvarQITEの指数的分離は実現不可能であることが判明した。
理論的な結果にもかかわらず、実際に関係のある拡張がまだ可能であることも示している。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 09:53:10 GMT)
Evaluation of Vision Transformers for Multimodal Image Classification: A Case Study on Brain, Lung, and Kidney Tumors [0.0] この研究は、いくつかのデータセットで、Swin TransformerやMaxViTを含むVision Transformersアーキテクチャのパフォーマンスを評価する。
脳、肺、腎臓の腫瘍で3つの画像のトレーニングセットを使用しました。
Swin Transformerは高い精度を提供し、腎臓腫瘍の分類で99.9%、組み合わせたデータセットで99.3%の精度を達成した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:35:51 GMT)
Enhanced Two-Way Teleportation of Entangled States with Six-Qubit Cluster State [0.0] 本研究は、AliceとBobの間の未知の2量子ビット量子状態の転送のための双方向のテレポーテーションプロトコルを提案する。
この双方向交換は、アリスとボブのキュービット対上でベル測定を行い、双方の量子状態のテレポーテーションを成功させることによって達成される。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 06:22:56 GMT)
Effective Hamiltonian approach to the exact dynamics of open system by complex discretization approximation for environment [0.0] 本稿では,複素ガウス二次数を用いた離散化近似法の複素平面への新たな一般化を提案する。
有効ハミルトニアンは非エルミート的であり、負の虚部を持つ複素エネルギーモードを証明できる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 11:03:22 GMT)
Do Spikes Protect Privacy? Investigating Black-Box Model Inversion Attacks in Spiking Neural Networks [0.0] この研究は、スパイキングニューラルネットワーク(SNN)に対するブラックボックスモデル反転(MI)攻撃の最初の研究である。
我々は、入力変換のためのレートベースの符号化と出力解釈のための復号機構を組み込むことにより、生成逆MIフレームワークをスパイク領域に適用する。
以上の結果から,SNNはANNよりもMI攻撃に対する抵抗性が有意に高いことが示唆された。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 10:02:27 GMT)
Detecting fake accounts through Generative Adversarial Network in online social media [0.0] 本稿では,ユーザ類似度尺度とGANアルゴリズムを用いて,Twitterデータセット内の偽ユーザアカウントを識別する手法を提案する。
問題の複雑さにもかかわらず、この方法は偽アカウントの分類と検出において80%のAUCレートを達成する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 12:23:55 GMT)
Deep Learning Meets Oversampling: A Learning Framework to Handle Imbalanced Classification [0.0] データ駆動型で合成データインスタンスを生成できる新しい学習フレームワークを提案する。
提案手法は, オーバーサンプリング過程を離散決定基準の構成として定式化する。
不均衡な分類タスクの実験は、最先端のアルゴリズムよりも我々のフレームワークの方が優れていることを示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 13:35:00 GMT)
DCENWCNet: A Deep CNN Ensemble Network for White Blood Cell Classification with LIME-Based Explainability [0.0] 白血球(WBC)は免疫系の重要な部分です。
従来の畳み込みニューラルネットワーク(CNN)は、血液細胞を物体の一部から分類し、物体認識を行う。
本稿では,3つのCNNアーキテクチャを統合した新しいアンサンブル手法を提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:53:20 GMT)
Convolutional Neural Network Segmentation for Satellite Imagery Data to Identify Landforms Using U-Net Architecture [0.0] この研究は、CNNセグメンテーション技術を用いて、効率的な特徴抽出にU-Netモデルを適用した。
このモデルはセマンティックセグメンテーションタスクに優れ、高解像度の出力、迅速な特徴抽出、幅広いアプリケーションに対する柔軟性を示す。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 07:27:12 GMT)
Convolutional Fourier Analysis Network (CFAN): A Unified Time-Frequency Approach for ECG Classification [0.0] 機械学習は心電図(ECG)などの生体医学的信号の分類に変化をもたらした
我々は,(1)不整脈分類,(2)識別,(3)無呼吸検出の3つのECG分類タスクを評価した。
我々は、FANとCNNを統合した畳み込みフーリエ解析ネットワーク(CFAN)を開発した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:23:52 GMT)
Convolutional Deep Colorization for Image Compression: A Color Grid Based Approach [0.0] 本研究は,画像カラー情報の完全自動保持に対するカラーグリッドに基づくアプローチの最適化に焦点をあてる。
私たちは、保存されている色情報の量を最小限に抑えつつ、忠実に画像を再カラー化できるようにしたいと思っています。
結果,画像圧縮比は有望であったが,画像再色化は高いCSIM値に到達した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:26:05 GMT)
Context information can be more important than reasoning for time series forecasting with a large language model [0.0] 時系列予測のための大規模言語モデル(LLM)の特性について検討する。
発見は、単一のプロンプト法が普遍的に適用できないことを示している。
LLMは、しばしばプロンプトによって記述された手順に従わない。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:39:07 GMT)
Content-based Video Retrieval in Traffic Videos using Latent Dirichlet Allocation Topic Model [0.0] 本研究では,遅延ディリクレ配置(LDA)トピックモデルを用いて,監視ビデオに教師なしで注釈を付ける。
4つの検索戦略が提案され,提案したクエリの定式化を用いて,ユーザがさまざまなアクティビティを定義し,検索することができる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:41:36 GMT)
Compatible Gradient Approximations for Actor-Critic Algorithms [0.0] 本稿では,アクション値勾配のゼロ次近似を用いることで,そのような精度の必要性を回避できるアクタ批判アルゴリズムを提案する。
実験結果から,我々のアルゴリズムは適合するだけでなく,現在の最先端手法の性能をかなり上回っていることが明らかとなった。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:06:29 GMT)
Closing the Responsibility Gap in AI-based Network Management: An Intelligent Audit System Approach [0.0] 既存のネットワークパラダイムは、AI(Artificial Intelligence)ベースのネットワーク管理ツールを使用することで、ダウンタイムの低減と、より高いQuality of Experience(QoE)を実現している。
これらのAI管理ツールは、ネットワーク条件の変更に対する自動応答を可能にし、オペレータの運用コストを低減し、全体的なパフォーマンスを改善する。
AIベースの管理ツールを採用することでネットワーク全体のパフォーマンスが向上する一方で、人間の監督、プライバシー侵害、アルゴリズムバイアス、モデル不正確性といった課題も導入されている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:30:25 GMT)
Classical post-processing approach for quantum amplitude estimation [0.0] 本稿では,量子リソースへの依存を最小限に抑えつつ計算効率を向上させるために,量子振幅推定(QAE)手法を提案する。
提案手法は,量子コンピュータを用いて信号列を生成し,量子振幅を古典的な後処理手法により推定する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 15:51:31 GMT)
Automatic Prompt Optimization Techniques: Exploring the Potential for Synthetic Data Generation [0.0] 医療などの専門分野において、データ取得はプライバシー規制、倫理的配慮、可用性の制限による重大な制約に直面している。
大規模プロンプトベースモデルの出現は、保護されたデータに直接アクセスすることなく、合成データ生成の新しい機会を示す。
PRISMAガイドラインに従って, 自動プロンプト最適化の最近の展開を概観する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 17:16:01 GMT)
Analyzing public sentiment to gauge key stock events and determine volatility in conjunction with time and options premiums [0.0] 本モデルでは,感情分析とデータ検索技術を統合し,ソーシャルメディアから重要な情報を抽出する。
このアプローチの目的は、主要なイベントに基づいて取引を実行するためのタイムリーなデータを提供することだ。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 01:48:10 GMT)
Agentic AI Systems Applied to tasks in Financial Services: Modeling and model risk management crews [0.0] 本稿では,金融サービス産業におけるエージェントシステムについて考察する。
複雑なモデリングやリスク管理タスクのモデル化に効果的に協力できるエージェントクルーを構築します。
本報告では, モデルおよびMRM乗組員の有効性とロバスト性について, 一連の数値例を提示する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 04:03:47 GMT)
Adversarial Machine Learning: Attacks, Defenses, and Open Challenges [0.0] Adversarial Machine Learning (AML)は、AIシステムの脆弱性に対処する。
本稿では,回避攻撃と毒殺攻撃を包括的に分析し,数学的厳密さで防御機構を定式化し,適応的脅威モデルに頑健なソリューションを実装する上での課題について論じる。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 16:43:17 GMT)
Addressing Out-of-Label Hazard Detection in Dashcam Videos: Insights from the COOOL Challenge [0.0] 本稿では,ダッシュカム映像におけるハザード解析の新しい手法を提案する。
危険物に対する運転者反応の検出、危険物の検出、説明的なキャプションの生成に対処する。
本手法は,自動運転におけるアウト・オブ・ラベルの課題において,最も高いスコアを得た。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:11:43 GMT)
Action Recognition Using Temporal Shift Module and Ensemble Learning [0.0] 本稿では,aclICPR 2024におけるマルチモーダル視覚パターン認識ワークショップの一環として,マルチモーダル行動認識チャレンジ(Multi-Modal Action Recognition Challenge)のファーストランクソリューションを提案する。
このコンペティションは、マルチモーダルソースから収集された20のアクションクラスの多様なデータセットを使用して、人間の行動を認識することを目的としている。
提案手法は,20クラスにまたがる人的行動の認識において,提案手法の有効性を実証した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:09:55 GMT)
A Novel Convolutional-Free Method for 3D Medical Imaging Segmentation [0.0] 畳み込みニューラルネットワーク(CNN)がこの分野を支配し、3次元の医用画像セグメンテーションで大きな成功を収めている。
TransUNetやnnFormerのような最近のトランスフォーマーベースのモデルは、これらの制限に対処することを約束している。
本稿では,トランスアーキテクチャと自己認識機構に基づく,新しい完全畳み込みフリーモデルを提案する。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 00:52:45 GMT)
A Hybrid Tabu Scatter Search Algorithm for Simulation-Based Optimization of Multi-Objective Runway Operations Scheduling [0.0] Dissertationは、滑走路運用スケジューリングのためのシミュレーションベースの最適化(SbO)アプローチを提案することで、航空交通フロー管理の課題に対処する。
目的は、遅延、燃料消費、環境への影響を最小限に抑えつつ、空港の容量利用を最適化することである。
提案するSbOフレームワークは,滑走路条件を扱う離散イベントシミュレーションモデルと,最適解を特定するためのハイブリッドタブ・散乱探索アルゴリズムを統合した。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:42:05 GMT)
A Framework for On the Fly Input Refinement for Deep Learning Models [0.0] ディープラーニングモデルは、最新のデータでトレーニングされた場合でも、現実世界のアプリケーションで顕著な誤予測を示す。
本研究では,入力検証と変換によるモデル性能向上を目的とした適応型オンザフライ入力改善フレームワークを提案する。
スケーラブルでリソース効率のよいソリューションとして、このフレームワークは、ソフトウェア工学、自然言語処理、コンピュータビジョンにおける高度なアプリケーションに対して、大きな可能性を秘めている。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 05:41:01 GMT)
A Cost-Benefit Analysis of Additive Manufacturing as a Service [0.0] 世界の製造業の状況は、資源集約的な大量生産から持続的、局所的な製造へと根本的に変化している。
本稿では,Cloud Crafting Platformを付加的な製造技術によってサービスとして製造できるプラットフォームとして分析する。
私たちは、プラットフォームのSOA(Service-Oriented Architecture)、Microsoft Azureクラウドへのデプロイメント、テストベッド環境での3つの異なる3Dプリンタモデルとの統合について紹介します。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 14:22:55 GMT)
A Conceptual Exploration of Generative AI-Induced Cognitive Dissonance and its Emergence in University-Level Academic Writing [0.0] 本研究は,認知不協和(CD)のトリガーおよび増幅器として,生成人工知能(GenAI)が果たす役割について考察する。
我々は、AI駆動の効率と、独創性、努力、知的所有権の原則との緊張を浮き彫りにして、GenAIによるCDの仮説的構成を導入する。
我々は、この不協和を緩和するための戦略について議論する。例えば、反射的教育、AIリテラシープログラム、GenAI使用の透明性、規律固有のタスク再設計などである。
論文参考訳(メタデータ) (Sat, 08 Feb 2025 21:31:04 GMT)