Discover latest generative AI models, prompt engineering papers, and MCP servers
Menu
Close
首页
data
training
models
inference
context
prompt
mcp
agents
关于
嗯,目前共计420篇文章
2025
10月 02, 2025
Ling-1T - inclusionAI 大型语言模型
10月 02, 2025
IBM Granite 4.0 H-Small - IBM 大型语言模型
10月 01, 2025
Liquid AI LFM2-Audio-1.5B - 端到端音频基础模型
9月 30, 2025
LoRAFusion: 大语言模型的高效LoRA微调系统
9月 30, 2025
Qwen3-VL 30B-A3B Thinking - 阿里巴巴 大型语言模型
9月 30, 2025
Qwen3-VL 30B-A3B Instruct - 阿里巴巴 大型语言模型
9月 29, 2025
Claude Sonnet 4.5 - Anthropic 大型语言模型
9月 29, 2025
DeepSeek-V3.2-Exp - DeepSeek 大型语言模型
9月 29, 2025
GLM-4.6 - 智谱AI 大型语言模型
9月 29, 2025
AI Agent的有效上下文工程
9月 27, 2025
长期运行低代码代理的记忆管理与上下文一致性
9月 26, 2025
动态专家搜索:在测试时增强 MoE LLM 的推理能力
9月 26, 2025
GraphSearch: 用于图检索增强生成的智能体深度搜索工作流
9月 25, 2025
InfiniPipe: 面向长上下文大语言模型训练的数据中心弹性流水线并行
9月 25, 2025
Google Gemini 2.5 Flash - Google 高性能多模态语言模型
9月 25, 2025
Tencent HunyuanImage 3.0 - 腾讯 大型语言模型
9月 25, 2025
以查询为中心的图检索增强生成
9月 22, 2025
Google Data Commons MCP服务器 - 公共数据的AI智能访问
9月 22, 2025
DeepSeek-V3.1-Terminus - DeepSeek 大型语言模型
9月 22, 2025
Qwen-Image-Edit-2509 - 阿里巴巴 大型语言模型
9月 20, 2025
Qwen3-Omni 30B-A3B Instruct - 阿里巴巴 大型语言模型
9月 19, 2025
xAI 发布 Grok 4 Fast: 性能比肩旗舰,成本降低 98%%
9月 17, 2025
三个近期问题的事故复盘
9月 12, 2025
Magistral Small 1.2 2509 - Mistral AI 大型语言模型
9月 11, 2025
突破记忆墙:长上下文代理 LLM 推理的优化路径
9月 08, 2025
测试时扩展在知识密集型任务中尚不有效
9月 07, 2025
消费级GPU上的LoRA/QLoRA微调效率实测: RTX 4060案例研究
9月 01, 2025
S1-Base-671B - ScienceOne AI 大型语言模型
8月 28, 2025
Microsoft MAI-1-Preview - 微软 大型语言模型
8月 28, 2025
Microsoft MAI-Voice-1 - 微软 大型语言模型
8月 27, 2025
Youtu-GraphRAG: 用于图检索增强复杂推理的垂直统一智能体
8月 27, 2025
Memory-R1: 通过强化学习增强大语言模型Agent的记忆管理能力
8月 21, 2025
增强代理长期记忆的多重记忆系统
8月 18, 2025
NVIDIA Nemotron Nano 9B v2 - 英伟达 大型语言模型
8月 15, 2025
Intern-S1 - InternLM (Shanghai AI Lab) 大型语言模型
8月 13, 2025
LLM的链式思维推理是海市蜃楼吗?从数据分布视角的分析
8月 13, 2025
大语言模型的链式思维推理是海市蜃楼吗?数据分布视角
8月 12, 2025
Victor WebSearch MCP - Enterprise-Grade Web Search Service / 高质量 Web 搜索服务
8月 08, 2025
LoRR: 用重置重放机制提升 LLM 偏好优化的样本效率
8月 08, 2025
无需预构建图的RAG:自适应推理结构的检索增强生成
8月 07, 2025
GPT-5:OpenAI发布的统一智能系统
8月 07, 2025
GPT-5 - OpenAI 大型语言模型
8月 05, 2025
GTPO: 用梯度冲突修正和熵控制稳定 GRPO 训练
8月 01, 2025
Claude Opus 4.1
8月 01, 2025
Gemini 2.5 深度思考
8月 01, 2025
Google 发布 Gemini 2.5 Deep Think: 并行思考推理模型,编程能力超越竞品
7月 31, 2025
失败是成功之母:利用负样本增强少样本上下文学习
7月 31, 2025
GraphRAG-R1: 图检索增强生成与过程约束强化学习
7月 29, 2025
Graph-R1: 基于端到端强化学习的智能体式图检索增强生成框架
7月 26, 2025
MegatronApp: 分布式大语言模型训练的高效全面管理工具链
7月 24, 2025
GSPO: Qwen团队用序列级优化重新定义GRPO,MoE训练终于稳了
7月 17, 2025
Promptomatix: 面向大型语言模型的自动提示优化框架
7月 17, 2025
Promptomatix: 全自动Prompt优化框架
7月 14, 2025
DPO全景图:从理论到实践的完整指南
7月 10, 2025
Grok 4
7月 10, 2025
xAI 发布 Grok 4: 首个在「人类最后考试」中突破 50%% 的 AI 模型
7月 09, 2025
Grok 4:xAI的突破性推理模型与高端订阅服务
7月 04, 2025
Towards Practical GraphRAG: 高效知识图谱构建与混合检索的大规模应用
7月 01, 2025
Voxtral Small 24B 2507 - Mistral AI 大型语言模型
6月 19, 2025
Mistral Small 3.2 24B Instruct 2506 - Mistral AI 大型语言模型
6月 18, 2025
为 AI Agent 编写高效工具
6月 15, 2025
Lingshu-7B - 阿里巴巴 大型语言模型
6月 10, 2025
Consilium MCP Server - 多AI专家共识决策平台
6月 06, 2025
何时在检索增强生成中使用图: 图检索增强生成的综合性分析
6月 05, 2025
Universal File Converter MCP Server - 专业级多格式文件转换服务
6月 05, 2025
我应该使用哪种提示技术?软件工程任务提示技术实证研究
6月 04, 2025
Web Scraper & Sitemap Generator - 网页抓取和站点地图生成
6月 03, 2025
Gemma 3n E4B IT - 谷歌 大型语言模型
5月 28, 2025
DeepSeek-R1-0528 - DeepSeek 大型语言模型
5月 26, 2025
理解偏好学习中的性能差距:RLHF与DPO的二分法分析
5月 26, 2025
理解偏好学习中的性能差距: 基于人类反馈的强化学习与直接偏好优化的二分法
5月 22, 2025
Claude 4 系列:Anthropic发布的世界级编码和推理模型
5月 22, 2025
Claude Opus 4 - Anthropic 大型语言模型
5月 22, 2025
Claude Sonnet 4 - Anthropic 大型语言模型
5月 22, 2025
Reasoning Beyond Language: A Comprehensive Survey on Latent Chain-of-Thought Reasoning
5月 18, 2025
ZenFlow: DeepSpeed的无停顿卸载训练引擎,5倍加速ZeRO-Offload
5月 16, 2025
SageAttention3: 基于微缩放 FP4 的 Attention 推理加速与 8-bit 训练探索
5月 13, 2025
FlashMLA-ETAP: 高效转置 Attention 流水线加速 H20 GPU 上的 MLA 推理
4月 30, 2025
DeepSeek-Prover-V2-671B - DeepSeek 大型语言模型
4月 29, 2025
DPO遇见PPO:RLHF的强化令牌优化
4月 28, 2025
Qwen3:阿里云通义千问混合推理大模型
4月 28, 2025
Mem0: Building Production-Ready AI Agents with Scalable Long-Term Memory
4月 28, 2025
迈向评估性思维: 基于演化奖励模型的元策略优化
4月 27, 2025
Qwen3-0.6B - 阿里巴巴 大型语言模型
4月 22, 2025
通过沙箱技术提升 Claude Code 安全性
4月 22, 2025
Claude 桌面扩展:一键安装 MCP 服务器
4月 22, 2025
面向 AI Agent 的有效上下文工程实践
4月 22, 2025
我们如何构建多 Agent 研究系统
4月 22, 2025
Pre-DPO: 使用引导参考模型改进直接偏好优化中的数据利用
4月 21, 2025
大语言模型时代的RAG评估:综合性调研
4月 16, 2025
Reinforcement Learning from Human Feedback: 全面的RLHF方法论指南
4月 05, 2025
OpenCodeInstruct: NVIDIA开源的500万规模代码指令数据集
4月 05, 2025
Llama 4 系列:Meta的开源多模态MoE模型
4月 05, 2025
Llama 4 Scout - Meta 大型语言模型
4月 04, 2025
GREATERPROMPT: 统一、可定制、高性能的开源提示优化工具包
3月 27, 2025
超图检索增强生成: 基于超图结构化知识表示的检索增强生成
3月 25, 2025
Gemini 2.5 系列:Google DeepMind的突破性思考模型
3月 19, 2025
设计抗 AI 作弊的技术评估方法
3月 16, 2025
基于大型语言模型的智能体优化综述
3月 06, 2025
更宽还是更深?通过自适应分支树搜索扩展 LLM 推理时计算
上一页
1
2
3
下一页