Liquid AI LFM2-Audio-1.5B - 端到端音频基础模型

Posted on 十月 1, 2025

Liquid AI LFM2-Audio-1.5B - 端到端音频基础模型厂商: Liquid AI发布日期: 2025-10-01模型类型: 音频基础模型模态: 音频、文本参数规模: 1.5B许可证: Apache 2.0 (有商业使用条款)评分: 4.4/5.0 概述Liquid AI LFM2-Audio-1.5B 是 Liquid AI 于 2025 年 10 月 1 日发布的端到端音频基础模型,也是 LFM2 系列的首个音频模型。该模型专为低延迟设计,响应延迟低于 100 毫秒,仅使用 1.5B 参数就实现了出色的音频理解和生成能力。LFM2-Audio 特别适合部署在边缘设备上,包括智能手机、笔记本电脑、车载系统和可穿戴设备。 LFM2-Audio 的发布标志着 Liquid AI 在多模态模型领域的重要扩展,继 LFM2 (文本)、LFM2-VL (视觉-...

阅读全文

Microsoft MAI-Voice-1 - 微软大型语言模型

Posted on 八月 28, 2025

Microsoft MAI-Voice-1 - 微软大型语言模型模型概述Microsoft MAI-Voice-1 是微软公司于 2025 年 8月发布的大型语言模型。该模型支持商业使用，为企业部署提供了法律保障。 Microsoft MAI-Voice-1 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代码辅助等领域，都展现出了巨大的应用潜力。核心特性 Ultra-fast generation：1 minute of audio in <1 second on single GPU Highly expressive and natural speech synthesis：提供强大的AI能力支持...

阅读全文

Gemma 3n E4B IT - 谷歌大型语言模型

Posted on 六月 3, 2025

Gemma 3n E4B IT - 谷歌大型语言模型模型概述Gemma 3n E4B IT 是谷歌公司于 2025 年 6月发布的大型语言模型，拥有 E4B (4B effective, 8B raw with MatFormer) 参数规模。该模型支持多种语言，能够处理包括中文、英文在内的多语言任务。该模型支持商业使用，为企业部署提供了法律保障。 Gemma 3n E4B IT 在开源社区获得了广泛认可，Hugging Face 平台上的下载量已达到 699.2K，获得了 794 个点赞，显示出强大的社区影响力和用户认可度。 Gemma 3n E4B IT 采用了先进的 Transformer 架构和优化的训练方法，在自然语言理解、生成和推理等任务上表现出色。该模型的发布为人工智能领域带来了新的可能性，特别是在需要高质量语言理解和生成的应用场景中，如智能客服、内容创作、代...

阅读全文