Discover latest generative AI models, prompt engineering papers, and MCP servers
Menu
Close
首页
data
training
models
inference
context
prompt
mcp
agents
关于
嗯,目前共计420篇文章
2025
5月 28, 2025
DeepSeek-R1-0528 - DeepSeek 大型语言模型
5月 26, 2025
理解偏好学习中的性能差距:RLHF与DPO的二分法分析
5月 26, 2025
理解偏好学习中的性能差距: 基于人类反馈的强化学习与直接偏好优化的二分法
5月 22, 2025
Claude 4 系列:Anthropic发布的世界级编码和推理模型
5月 22, 2025
Claude Opus 4 - Anthropic 大型语言模型
5月 22, 2025
Claude Sonnet 4 - Anthropic 大型语言模型
5月 22, 2025
Reasoning Beyond Language: A Comprehensive Survey on Latent Chain-of-Thought Reasoning
5月 18, 2025
ZenFlow: DeepSpeed的无停顿卸载训练引擎,5倍加速ZeRO-Offload
5月 16, 2025
SageAttention3: 基于微缩放 FP4 的 Attention 推理加速与 8-bit 训练探索
5月 13, 2025
FlashMLA-ETAP: 高效转置 Attention 流水线加速 H20 GPU 上的 MLA 推理