Google的DeepMind AI研究团队今天发布了一个新的开源AI模型, Gemma 3 270M。
如其名字所示,这是一个 2.7亿参数的模型 — 比许多前沿LLM的700亿甚至更多的参数要小得多(参数是决定模型行为的内部设置的数量)。
虽然更多的参数通常意味着一个更大、更强大的模型,但谷歌对此的关注几乎相反:高效率,为开发者提供一个足够小的模型,可以直接在智能手机上运行和本地,无需互联网连接,如在Pixel 9 Pro SoC上的内部测试所示。
然而,该模型仍然能够处理复杂、特定领域的任务,并且可以在几分钟内快速微调以满足企业或独立开发人员的需求。
在社交网络X上,Google DeepMind员工AI开发者关系工程师Omar Sanseviero补充说,Gemma 3 270M也可以直接在用户的网页浏览器中运行,或者在Raspberry Pi上运行,甚至“在你的烤面包机上运行”,强调了其在非常轻量级的硬件上运行的能力
Gemma 3 270M 结合了 1.7 亿个嵌入参数和 1 亿个 transformer 块参数 —— 得益于一个庞大的 256k 词汇量,能够处理稀有和特定的标记。
根据谷歌,该架构在出厂时就能在指令遵循任务上表现出色,同时保持足够小,可以在具有有限资源的设备(包括移动硬件)上快速微调和部署。
Gemma 3 270M 继承了更大的 Gemma 3 模型的架构和预训练,确保在 Gemma 生态系统中的兼容性。通过文档、微调配方和部署指南,开发者可以快速使用像 Hugging Face、UnSloth 和 JAX 这样的工具从实验到部署。
其尺寸的基准测试高分,以及高效能
在 IFEval 基准测试中,该测试衡量模型遵循指令的能力,经过指令微调的 Gemma 3 270M 得分 51.2%。
该评分将其 远远高于类似的小型模型,如 SmolLM2 135M Instruct 和 Qwen 2.5 0.5B Instruct,根据 Google 的出版比较,更接近一些十亿参数模型的性能范围。
然而,研究人员和领导者在竞争的AI初创公司Liquid AI的回复中指出,谷歌忽略了Liquid自己的LFM2-350M模型,该模型在今年7月发布,得分高达65.12%,只是参数稍微多了一些(但却是类似大小的语言模型)。
该模型的一个重要优势是其能源效率。在使用INT4-量化模型于Pixel 9 Pro SoC的内部测试中,25次对话仅消耗了设备电池的0.75%。
这使得Gemma 3成为在设备上进行AI的实用选择,特别是在隐私和离线功能很重要的情况下。
发布包括一个预训练模型和一个指令微调模型,为开发人员提供立即可用的通用指令遵循任务功能。
Quantization-Aware Trained (QAT) 检查点也已提供,能够在资源受限的环境中以最小的性能损失实现 INT4 精度,并使模型在这些环境中具备生产就绪的能力。
一个小型、微调版的Gemma 3 270M可以执行许多大型LLM的功能
谷歌将Gemma 3 270M视为一种更广泛的哲学的一部分,即选择合适的工具来完成任务,而不是依赖于模型的原始大小。
对于情感分析、实体提取、查询路由、结构化文本生成、合规检查和创意写作等功能,该公司表示,微调后的较小模型可以比通用的大模型提供更快、更 cost-effective 的结果。
专业化的益处在过去的项目中显而易见,例如Adaptive ML与SK Telecom的合作。
通过微调一个Gemma 3 4B模型用于多语言内容审核,该团队的表现超越了更大规模的内部系统。
Gemma 3 270M 的设计目的是在更小的规模上实现类似的成功, 支持针对特定任务定制的专用模型舰队。
示范床时间故事生成器应用程序展示了Gemma 3 270M的潜力
除了企业使用之外,该模型还适用于创意场景。在 YouTube 上发布的一个演示视频中,谷歌展示了一个使用Gemma 3 270M和Transformers.js构建的睡前故事生成器应用程序,该应用程序完全在离线的网页浏览器中运行,展示了该模型在轻量级、可访问的应用程序中的多功能性。
视频展示了该模型通过允许选择主要角色(例如,“一只神奇的猫”)、场景(“在一座魔法森林中”)、情节转折(“发现一扇秘密门”)、主题(“冒险”)和期望长度(“短”)的能力来综合多个输入。
一旦参数设置好,Gemma 3 270M 模型就会生成一个连贯且富有想象力的故事。应用程序接着根据用户的选择编织一个简短而充满冒险的故事,展示了该模型在创作性和上下文感知文本生成方面的能力。
这个视频展示了如何使用轻便但强大的Gemma 3 270M来驱动快速、引人入胜和互动的应用程序,不依赖于云端,为设备上的AI体验开辟了新的可能性。
根据Gemma定制许可证开源
Gemma 3 270M 根据 Gemma 使用条款发布,允许在满足某些条件的情况下使用、复制、修改和分发该模型及其衍生作品。
这些包括将谷歌的禁止使用政策中列出的使用限制向前推进,向下游接收者提供使用条款,并清楚地表明所做的任何修改。分发可以是直接的,也可以通过诸如API或网络应用等托管服务进行。
对于企业团队和商业开发者来说,这意味着该模型可以嵌入到产品中,作为云服务的一部分部署,或者根据授权条款进行微调,以创建特定的衍生产品。只要遵守授权条款,模型生成的输出不归谷歌所有,企业对其创建的内容拥有全部权利。
然而,开发者有责任确保遵守适用的法律,并避免禁止的用途,例如生成有害内容或违反隐私规则。
该许可证在传统意义上不是开源的,但它确实允许广泛的商业使用而无需额外付费许可证。
对于构建商业AI应用的公司,主要的操作考虑是确保终端用户受同等限制的约束、记录模型修改,并实施与禁止使用政策相一致的安全措施。
随着Gemmaverse的下载量超过2亿,Gemma产品线涵盖了云、桌面和移动优化的版本,Google AI开发者将Gemma 3 270M定位为构建快速、成本效益高和隐私为重点的AI解决方案的基础,并且看起来已经有一个良好的开端。