Discover latest generative AI models, prompt engineering papers, and MCP servers
Menu
Close
首页
data
training
models
inference
context
prompt
mcp
agents
关于
嗯,目前共计290篇文章
2025
8月 28, 2025
Microsoft MAI-Voice-1 - 微软 大型语言模型
8月 27, 2025
Youtu-GraphRAG: 用于图检索增强复杂推理的垂直统一智能体
8月 27, 2025
Memory-R1: 通过强化学习增强大语言模型Agent的记忆管理能力
8月 21, 2025
增强代理长期记忆的多重记忆系统
8月 18, 2025
NVIDIA Nemotron Nano 9B v2 - 英伟达 大型语言模型
8月 15, 2025
Intern-S1 - InternLM (Shanghai AI Lab) 大型语言模型
8月 13, 2025
大语言模型的链式思维推理是海市蜃楼吗?数据分布视角
8月 13, 2025
LLM的链式思维推理是海市蜃楼吗?从数据分布视角的分析
8月 12, 2025
Victor WebSearch MCP - Enterprise-Grade Web Search Service / 高质量 Web 搜索服务
8月 08, 2025
无需预构建图的RAG:自适应推理结构的检索增强生成
8月 07, 2025
GPT-5 - OpenAI 大型语言模型
8月 01, 2025
Google 发布 Gemini 2.5 Deep Think: 并行思考推理模型,编程能力超越竞品
7月 31, 2025
失败是成功之母:利用负样本增强少样本上下文学习
7月 29, 2025
Graph-R1: 基于端到端强化学习的智能体式图检索增强生成框架
7月 26, 2025
MegatronApp: 分布式大语言模型训练的高效全面管理工具链
7月 17, 2025
Promptomatix: 面向大型语言模型的自动提示优化框架
7月 14, 2025
DPO全景图:从理论到实践的完整指南
7月 10, 2025
xAI 发布 Grok 4: 首个在「人类最后考试」中突破 50%% 的 AI 模型
7月 01, 2025
Voxtral Small 24B 2507 - Mistral AI 大型语言模型
6月 19, 2025
Mistral Small 3.2 24B Instruct 2506 - Mistral AI 大型语言模型
6月 15, 2025
Lingshu-7B - 阿里巴巴 大型语言模型
6月 10, 2025
Consilium MCP Server - 多AI专家共识决策平台
6月 06, 2025
何时在检索增强生成中使用图: 图检索增强生成的综合性分析
6月 05, 2025
Universal File Converter MCP Server - 专业级多格式文件转换服务
6月 05, 2025
我应该使用哪种提示技术?软件工程任务提示技术实证研究
6月 04, 2025
Web Scraper & Sitemap Generator - 网页抓取和站点地图生成
6月 03, 2025
Gemma 3n E4B IT - 谷歌 大型语言模型
5月 28, 2025
DeepSeek-R1-0528 - DeepSeek 大型语言模型
5月 26, 2025
理解偏好学习中的性能差距:RLHF与DPO的二分法分析
5月 26, 2025
理解偏好学习中的性能差距: 基于人类反馈的强化学习与直接偏好优化的二分法
5月 22, 2025
Claude Opus 4 - Anthropic 大型语言模型
5月 22, 2025
Claude Sonnet 4 - Anthropic 大型语言模型
4月 30, 2025
DeepSeek-Prover-V2-671B - DeepSeek 大型语言模型
4月 29, 2025
DPO遇见PPO:RLHF的强化令牌优化
4月 28, 2025
迈向评估性思维: 基于演化奖励模型的元策略优化
4月 27, 2025
Qwen3-0.6B - 阿里巴巴 大型语言模型
4月 22, 2025
Pre-DPO: 使用引导参考模型改进直接偏好优化中的数据利用
4月 21, 2025
大语言模型时代的RAG评估:综合性调研
4月 05, 2025
Llama 4 Scout - Meta 大型语言模型
4月 04, 2025
GREATERPROMPT: 统一、可定制、高性能的开源提示优化工具包
3月 27, 2025
超图检索增强生成: 基于超图结构化知识表示的检索增强生成
3月 16, 2025
基于大型语言模型的智能体优化综述
3月 06, 2025
更宽还是更深?通过自适应分支树搜索扩展LLM推理时计算
3月 03, 2025
直接偏好优化的主动学习
3月 01, 2025
Gemma 3 27B IT - 谷歌 大型语言模型
2月 18, 2025
Infinite Retrieval: 基于注意力增强的无限长上下文处理
2月 17, 2025
自动提示工程综述:优化视角
2月 17, 2025
xAI Grok 3 - xAI 推理语言模型
2月 07, 2025
自适应思维图:统一链式、树式和图式结构的测试时自适应推理
2月 07, 2025
QuEST: 使用1比特权重和激活值的大语言模型稳定训练
2月 07, 2025
自适应思维图: 统一链、树和图结构的测试时自适应推理
2月 07, 2025
自监督提示优化(SPO):无需外部参考的成本高效框架
2月 07, 2025
自监督提示优化
2月 07, 2025
基于潜在推理的测试时计算扩展:循环深度方法
2月 05, 2025
揭秘大语言模型中的长链思维推理
2月 01, 2025
ChunkKV:基于语义块的KV缓存压缩技术
2月 01, 2025
Phi-4-mini-instruct 3.8B - 微软 大型语言模型
1月 31, 2025
s1: 简单的测试时扩展
1月 28, 2025
Mistral Small 24B Instruct 2501 - Mistral AI 大型语言模型
1月 26, 2025
Janus-Pro-7B - DeepSeek 大型语言模型
1月 21, 2025
图检索增强生成综述:定制化大语言模型的图检索增强生成
1月 20, 2025
DeepSeek-R1 - DeepSeek 大型语言模型
1月 15, 2025
SmolLM3 3B - Hugging Face 大型语言模型
1月 13, 2025
数学推理中开发过程奖励模型的经验教训
1月 08, 2025
基于图的检索增强生成(GraphRAG)
1月 06, 2025
METAGENE-1 - Meta 大型语言模型
1月 02, 2025
FlashInfer:大语言模型推理服务的高效可定制注意力引擎
1月 02, 2025
FlashInfer:高效可定制的LLM推理Attention引擎
上一页
1
2