对,你没看错, 270M,不是270B。这是个多模态模型,能接受文本和图片输入,并且输出文本。输入图片会标准化为 896 x 896 分辨率。

官方并没有做过多的介绍。不过这种大小的模型通常可以放在移动端设备运行。

模型地址:http://huggingface.co/google/gemma-3-270m

Image