Llama 4 Scout - Meta 大型语言模型模型概述Llama 4 Scout 是 Meta 公司于 2025 年 4月发布的大型语言模型,拥有 17B active (16 experts, MoE) 参数规模。作为基座模型,它为下游任务提供了强大的基础能力。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 Llama 4 Scout 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
17B active (16 experts, MoE) 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
First open:wei...
Llama 3.3 70B Instruct - Meta 大型语言模型
Llama 3.3 70B Instruct - Meta 大型语言模型模型概述Llama 3.3 70B Instruct 是 Meta 公司于 2024 年 11月发布的大型语言模型,拥有 70B 参数规模。该模型经过指令微调,专门针对对话和任务执行场景进行了优化。 该模型支持多种语言,能够处理包括中文、英文在内的多语言任务。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 Llama 3.3 70B Instruct 在开源社区获得了广泛认可,Hugging Face 平台上的下载量已达到 588.9K,获得了 2,526 个点赞,显示出强大的社区影响力和用户认可度。 在性能方面,支持 128K tokens 的超长上下文窗口,Competitive with 405B models。
核心特性
70B 参数规模:采用大规模参数设计,在性能和效率之间...
Llama 3.1 405B Instruct - Meta 大型语言模型
Llama 3.1 405B Instruct - Meta 大型语言模型模型概述Llama 3.1 405B Instruct 是 Meta 公司于 2024 年 7月发布的大型语言模型,拥有 405B 参数规模。该模型经过指令微调,专门针对对话和任务执行场景进行了优化。 该模型支持多种语言,能够处理包括中文、英文在内的多语言任务,具备强大的逻辑推理和数学推理能力。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 Llama 3.1 405B Instruct 在开源社区获得了广泛认可,Hugging Face 平台上的下载量已达到 799.5K,获得了 580 个点赞,显示出强大的社区影响力和用户认可度。 在性能方面,支持 128K tokens 的超长上下文窗口,Competitive with GPT-4 class models。
核心特性
40...
CodeLlama-13B - Code Llama 13B 基座模型 for code synthesis
CodeLlama-13B - Code Llama 13B 基座模型 for code synthesis模型概述CodeLlama-13B 是 Meta 公司于 2023 年 8月发布的大型语言模型,拥有 13B 参数规模。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 CodeLlama-13B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
13B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
易于集成:提...
CodeLlama-34B - Code Llama 34B 基座模型 for code synthesis
CodeLlama-34B - Code Llama 34B 基座模型 for code synthesis模型概述CodeLlama-34B 是 Meta 公司于 2023 年 8月发布的大型语言模型,拥有 34B 参数规模。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 CodeLlama-34B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
34B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
易于集成:提...
CodeLlama-7B - Code Llama 7B 基座模型 for code synthesis
CodeLlama-7B - Code Llama 7B 基座模型 for code synthesis模型概述CodeLlama-7B 是 Meta 公司于 2023 年 8月发布的大型语言模型,拥有 7B 参数规模。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 CodeLlama-7B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
7B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
易于集成:提供标准的AP...
Llama-2-13B - Meta's Llama 2 13B 基座模型
Llama-2-13B - Meta’s Llama 2 13B 基座模型模型概述Llama-2-13B 是 Meta 公司于 2023 年 7月发布的大型语言模型,拥有 13B 参数规模。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 Llama-2-13B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
13B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
易于集成:提供标准的API接口,支持主流深度学习框架
...
Llama-2-70B-Chat - Llama 2 70B fine-tuned for dialogue
Llama-2-70B-Chat - Llama 2 70B fine-tuned for dialogue模型概述Llama-2-70B-Chat 是 Meta 公司于 2023 年 7月发布的大型语言模型,拥有 70B 参数规模。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 Llama-2-70B-Chat 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
70B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
...
Llama-2-13B-Chat - Llama 2 13B fine-tuned for dialogue
Llama-2-13B-Chat - Llama 2 13B fine-tuned for dialogue模型概述Llama-2-13B-Chat 是 Meta 公司于 2023 年 7月发布的大型语言模型,拥有 13B 参数规模。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 Llama-2-13B-Chat 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
13B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处理
...
Llama-2-70B - Meta's Llama 2 70B 基座模型 with Grouped-Query Attention
Llama-2-70B - Meta’s Llama 2 70B 基座模型 with Grouped-Query Attention模型概述Llama-2-70B 是 Meta 公司于 2023 年 7月发布的大型语言模型,拥有 70B 参数规模。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 Llama-2-70B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
70B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批量处...
Llama-2-7B-Chat - Llama 2 7B fine-tuned for dialogue with RLHF
Llama-2-7B-Chat - Llama 2 7B fine-tuned for dialogue with RLHF模型概述Llama-2-7B-Chat 是 Meta 公司于 2023 年 7月发布的大型语言模型,拥有 7B 参数规模。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 Llama-2-7B-Chat 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
7B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速推理和批...
Llama-2-7B - Meta's Llama 2 7B 基座模型, the first truly commercial-ready 开源 LLM
Llama-2-7B - Meta’s Llama 2 7B 基座模型, the first truly commercial-ready 开源 LLM模型概述Llama-2-7B 是 Meta 公司于 2023 年 7月发布的大型语言模型,拥有 7B 参数规模。 使用 LLaMA 系列许可证,支持商业使用,但需遵守一定的使用条款和限制。 Llama-2-7B 采用了先进的 Transformer 架构和优化的训练方法,在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性,特别是在需要高质量语言理解和生成的应用场景中,如智能客服、内容创作、代码辅助等领域,都展现出了巨大的应用潜力。
核心特性
7B 参数规模:采用大规模参数设计,在性能和效率之间取得最佳平衡
完全开源:模型权重和代码完全开放,便于研究和定制化开发
高效推理:采用优化的模型架构,支持快速...