Qwen3-VL 30B-A3B Thinking - 阿里巴巴大型语言模型

Posted on 九月 30, 2025

Qwen3-VL 30B-A3B Thinking - 阿里巴巴大型语言模型模型概述Qwen3-VL 30B-A3B Thinking 是阿里巴巴公司于 2025 年 9月发布的大型语言模型，拥有 30B active (A3B MoE) 参数规模。该模型支持多种语言，能够处理包括中文、英文在内的多语言任务，具备强大的逻辑推理和数学推理能力。该模型采用 Apache 2.0 开源许可证，这是一个非常商业友好的许可协议，允许企业在各种场景下自由使用、修改和分发，无需担心版权限制。 Qwen3-VL 30B-A3B Thinking 在开源社区获得了广泛认可，Hugging Face 平台上的下载量已达到 7.9K，获得了 103 个点赞，显示出强大的社区影响力和用户认可度。核心特性 30B active (A3B MoE) 参数规模：采用大规模参数设计，在性能和效率之间取得...

阅读全文

Magistral Small 1.2 2509 - Mistral AI 大型语言模型

Posted on 九月 12, 2025

Magistral Small 1.2 2509 - Mistral AI 大型语言模型模型概述Magistral Small 1.2 2509 是 Mistral AI 公司于 2025 年 9月发布的大型语言模型，拥有 24B 参数规模。该模型支持多种语言，能够处理包括中文、英文在内的多语言任务，在代码生成和理解方面表现出色，具备强大的逻辑推理和数学推理能力。该模型采用 Apache 2.0 开源许可证，这是一个非常商业友好的许可协议，允许企业在各种场景下自由使用、修改和分发，无需担心版权限制。 Magistral Small 1.2 2509 在开源社区获得了广泛认可，Hugging Face 平台上的下载量已达到 24.7K，获得了 235 个点赞，显示出强大的社区影响力和用户认可度。核心特性 24B 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡 Smal...

阅读全文

Qwen3-0.6B - 阿里巴巴大型语言模型

Posted on 四月 27, 2025

Qwen3-0.6B - 阿里巴巴大型语言模型模型概述Qwen3-0.6B 是阿里巴巴公司于 2025 年 4月发布的大型语言模型，拥有 0.6B (751.6M total) 参数规模。该模型经过指令微调，专门针对对话和任务执行场景进行了优化。该模型支持多种语言，能够处理包括中文、英文在内的多语言任务，具备强大的逻辑推理和数学推理能力。该模型采用 Apache 2.0 开源许可证，这是一个非常商业友好的许可协议，允许企业在各种场景下自由使用、修改和分发，无需担心版权限制。 Qwen3-0.6B 在开源社区获得了广泛认可，Hugging Face 平台上的下载量已达到 19.5M，获得了 695 个点赞，显示出强大的社区影响力和用户认可度。核心特性 0.6B (751.6M total) 参数规模：采用大规模参数设计，在性能和效率之间取得最佳平衡 Unique think...

阅读全文

Gemini 2.5 系列：Google DeepMind的突破性思考模型

Posted on 三月 25, 2025

Gemini 2.5 系列：Google DeepMind的突破性思考模型概述2025年3月25日，Google DeepMind发布了Gemini 2.5系列，这是一个具有革命性意义的多模态推理AI模型家族。Gemini 2.5最大的突破在于其”思考能力”（Thinking Capability），能够在回应之前进行深度推理，这使其成为Google迄今为止最智能的AI模型。系列模型对比模型名称主要特点发布时间最佳用途 Gemini 2.5 Pro 旗舰推理模型，支持深度思考模式 2025-03-25 复杂推理、科学研究、高级编程 Gemini 2.5 Flash 快速推理，高效率 2025-09-25 生产环境、实时应用 Gemini 2.5 Flash Image 最先进的图像生成和编辑 2025-08-26 图像创作、视觉内容生成 Gemini ...

阅读全文