Lingshu-7B - 阿里巴巴 大型语言模型

Lingshu-7B - 阿里巴巴 大型语言模型模型概述Lingshu-7B 是 阿里巴巴 公司于 2025 年 6月发布的大型语言模型,拥有 7B (also 32B variant available) 参数规模。 采用 MIT 开源许可证,允许商业使用和二次开发,为企业提供了极大的灵活性。 Lingshu-7B 在开源社区获得了广泛认可,Hugging Face 平台上的下载量已达到 N/A,获得了 N/A 个点赞,显示出强大的社区影响力和用户认可度。 Lingshu-7B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 7B (also ...

阅读全文

Qwen2.5-7B-Instruct - 阿里巴巴 大型语言模型

Qwen2.5-7B-Instruct - 阿里巴巴 大型语言模型模型概述Qwen2.5-7B-Instruct 是 阿里巴巴 公司于 2024 年 9月发布的大型语言模型,拥有 7B 参数规模。该模型经过指令微调,专门针对对话和任务执行场景进行了优化。 该模型支持多种语言,能够处理包括中文、英文在内的多语言任务,具备强大的逻辑推理和数学推理能力。 该模型采用 Apache 2.0 开源许可证,这是一个非常商业友好的许可协议,允许企业在各种场景下自由使用、修改和分发,无需担心版权限制。 Qwen2.5-7B-Instruct 在开源社区获得了广泛认可,Hugging Face 平台上的下载量已达到 5.2M,获得了 816 个点赞,显示出强大的社区影响力和用户认可度。 在性能方面,支持 128K tokens 的超长上下文窗口。 核心特性 7B 参数规模:采用大规模参数设计,在性能和...

阅读全文

Qwen2-0.5B - Qwen2 0.5B ultra-lightweight model

Qwen2-0.5B - Qwen2 0.5B ultra-lightweight model模型概述Qwen2-0.5B 是 阿里巴巴 公司于 2024 年 6月发布的大型语言模型,拥有 0.5B 参数规模。 该模型采用 Apache 2.0 开源许可证,这是一个非常商业友好的许可协议,允许企业在各种场景下自由使用、修改和分发,无需担心版权限制。 Qwen2-0.5B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 0.5B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡 Apache 2.0 开源许可:完全商业友好,无使用限制,支持二次开发 完全开源...

阅读全文

Qwen2-72B - Qwen2 72B flagship model

Qwen2-72B - Qwen2 72B flagship model模型概述Qwen2-72B 是 阿里巴巴 公司于 2024 年 6月发布的大型语言模型,拥有 72B 参数规模。 Qwen2-72B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 72B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡 完全开源:模型权重和代码完全开放,便于研究和定制化开发 高效推理:采用优化的模型架构,支持快速推理和批量处理 易于集成:提供标准的API接口,支持主流深度学习框架 同系列模型Qwen2-72B 属于 Qwen 系列模型。该系列通常包含多个不同规模的...

阅读全文

Qwen2-1.5B - Qwen2 1.5B lightweight model

Qwen2-1.5B - Qwen2 1.5B lightweight model模型概述Qwen2-1.5B 是 阿里巴巴 公司于 2024 年 6月发布的大型语言模型,拥有 1.5B 参数规模。 该模型采用 Apache 2.0 开源许可证,这是一个非常商业友好的许可协议,允许企业在各种场景下自由使用、修改和分发,无需担心版权限制。 Qwen2-1.5B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 1.5B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡 Apache 2.0 开源许可:完全商业友好,无使用限制,支持二次开发 完全开源:模型权重和...

阅读全文

Qwen2-7B - Qwen2 7B with improved 多语言支持 capabilities

Qwen2-7B - Qwen2 7B with improved 多语言支持 capabilities模型概述Qwen2-7B 是 阿里巴巴 公司于 2024 年 6月发布的大型语言模型,拥有 7B 参数规模。 该模型采用 Apache 2.0 开源许可证,这是一个非常商业友好的许可协议,允许企业在各种场景下自由使用、修改和分发,无需担心版权限制。 Qwen2-7B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 7B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡 Apache 2.0 开源许可:完全商业友好,无使用限制,支持二次开发 完全开源:模型...

阅读全文

Qwen1.5-0.5B - Qwen1.5 0.5B ultra-lightweight model

Qwen1.5-0.5B - Qwen1.5 0.5B ultra-lightweight model模型概述Qwen1.5-0.5B 是 阿里巴巴 公司于 2024 年 2月发布的大型语言模型,拥有 0.5B 参数规模。 Qwen1.5-0.5B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 0.5B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡 完全开源:模型权重和代码完全开放,便于研究和定制化开发 高效推理:采用优化的模型架构,支持快速推理和批量处理 易于集成:提供标准的API接口,支持主流深度学习框架 同系列模型Qwen1.5-0.5B 属...

阅读全文

Qwen1.5-72B - Qwen1.5 72B flagship model

Qwen1.5-72B - Qwen1.5 72B flagship model模型概述Qwen1.5-72B 是 阿里巴巴 公司于 2024 年 2月发布的大型语言模型,拥有 72B 参数规模。 Qwen1.5-72B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 72B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡 完全开源:模型权重和代码完全开放,便于研究和定制化开发 高效推理:采用优化的模型架构,支持快速推理和批量处理 易于集成:提供标准的API接口,支持主流深度学习框架 同系列模型Qwen1.5-72B 属于 Qwen 系列模型。该系列通...

阅读全文

Qwen1.5-14B - Qwen1.5 14B model

Qwen1.5-14B - Qwen1.5 14B model模型概述Qwen1.5-14B 是 阿里巴巴 公司于 2024 年 2月发布的大型语言模型,拥有 14B 参数规模。 Qwen1.5-14B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 14B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡 完全开源:模型权重和代码完全开放,便于研究和定制化开发 高效推理:采用优化的模型架构,支持快速推理和批量处理 易于集成:提供标准的API接口,支持主流深度学习框架 同系列模型Qwen1.5-14B 属于 Qwen 系列模型。该系列通常包含多个不同规模...

阅读全文

Qwen1.5-1.8B - Qwen1.5 1.8B lightweight model

Qwen1.5-1.8B - Qwen1.5 1.8B lightweight model模型概述Qwen1.5-1.8B 是 阿里巴巴 公司于 2024 年 2月发布的大型语言模型,拥有 1.8B 参数规模。 Qwen1.5-1.8B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 1.8B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡 完全开源:模型权重和代码完全开放,便于研究和定制化开发 高效推理:采用优化的模型架构,支持快速推理和批量处理 易于集成:提供标准的API接口,支持主流深度学习框架 同系列模型Qwen1.5-1.8B 属于 Qwen...

阅读全文

Qwen1.5-7B - Qwen1.5 7B model with strong Chinese capabilities

Qwen1.5-7B - Qwen1.5 7B model with strong Chinese capabilities模型概述Qwen1.5-7B 是 阿里巴巴 公司于 2024 年 2月发布的大型语言模型,拥有 7B 参数规模。 Qwen1.5-7B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 7B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡 完全开源:模型权重和代码完全开放,便于研究和定制化开发 高效推理:采用优化的模型架构,支持快速推理和批量处理 易于集成:提供标准的API接口,支持主流深度学习框架 同系列模型Qwen1.5-7B ...

阅读全文

VideoLLaMA3 7B - 阿里巴巴 大型语言模型

VideoLLaMA3 7B - 阿里巴巴 大型语言模型模型概述VideoLLaMA3 7B 是 阿里巴巴 公司于 2024 年 1月发布的大型语言模型,拥有 8.04B 参数规模。 在代码生成和理解方面表现出色。 该模型采用 Apache 2.0 开源许可证,这是一个非常商业友好的许可协议,允许企业在各种场景下自由使用、修改和分发,无需担心版权限制。 VideoLLaMA3 7B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。 核心特性 8.04B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡 Vision:centric multimodal design ...

阅读全文

© 2025 Generative AI Discovery All Rights Reserved.
Theme by hiero