谷歌的新Gemma 4 12B模型设计用于在任何拥有16GB RAM的笔记本电脑上运行

Gemma 4 12B几乎与拥有260亿参数的版本一样强大。来源：谷歌。Gemma 4 12B几乎与拥有260亿参数的版本一样强大。来源：谷歌。谷歌表示，新模型能够进行复杂的多步骤推理和代理流程，这在以前需要更大规模的Gemma变体。尽管参数数量较少，Gemma 4 12B配备了新设计的多令牌预测（MTP）草图，该草图利用未使用的处理周期来计算可能的未来令牌。结果是更快和更高效。谷歌已发布其他Gemma 4模型的可选MTP版本，但这是首个自带MTP的版本。Gemma 4 12B还因为一种新的多模态方法而更为高效。Gemma 4系列本质上是多模态的，可以接收文本、音频或图像作为输入。大多数生成AI模型——包括其他Gemma 4变体——采用专用编码器处理非文本输入，并将此数据传递给大型语言模型（LLM）。这种方法足够有效，但增加了延迟和内存使用。通过新的中等重量模型，谷歌为视觉实现了一个简化的嵌入模块，具有单矩阵乘法和位置嵌入，这使得数据能够以适当的空间感知传递到LLM。这消除了对笨重中间编码器的需求。对于音频，根本无需编码。开发人员想出了一个将原始音频信号投射到用于文本令牌的相同向量的方法。如果你想查看新的Gemma 4模型，可以通过LM Studio、谷歌AI边缘画廊等工具在不下载的情况下访问它。但Gemma 4 12B的全部想法是你可以在本地以自己的方式运行它。如果你有内存，模型权重现在可以在Kaggle和Hugging Face上立即下载。它的大小略低于18GB。