谷歌发布开源大模型Gemma4,有E2B、E4B、26B MoE与31B四种规格。全系支持多模态输入,E2B和E4B还支持语音输入。其中,31B稠密版在Arena AI文本榜单中排全球开源模型第三,非量化权重能在单块80GB H100显卡运行,量化版兼容消费级显卡。
技术上,E2B和E4B采用PLE嵌入技术与128K长上下文支持,可在移动端低延迟处理逻辑。Gemma4通过Apache2.0协议开放,为开发者构建本地化、高隐私AI应用提供基础,有望推动开源AI生态发展。
近日,谷歌发布开源大模型Gemma4,有E2B、E4B、26B MoE与31B四种规格。全系支持多模态输入,E2B和E4B还支持语音输入。31B稠密版在Arena AI文本榜单排全球开源模型第三。E2B和E4B用PLE嵌入技术等可在移动端低延迟处理逻辑。通过Apache2.0协议开放,有望推动开源AI生态发展。
谷歌发布开源大模型Gemma4,有E2B、E4B、26B MoE与31B四种规格。全系支持多模态输入,E2B和E4B还支持语音输入。其中,31B稠密版在Arena AI文本榜单中排全球开源模型第三,非量化权重能在单块80GB H100显卡运行,量化版兼容消费级显卡。
技术上,E2B和E4B采用PLE嵌入技术与128K长上下文支持,可在移动端低延迟处理逻辑。Gemma4通过Apache2.0协议开放,为开发者构建本地化、高隐私AI应用提供基础,有望推动开源AI生态发展。
网友评论