在AI领域,Stability AI公司于2024年推出了其首个新型人工智能模型:商业许可的(通过会员资格)Stable Code3B。该模型仅拥有30亿参数,专注于软件开发的代码完成能力,可在没有专用GPU的笔记本上本地运行,并在性能上具有竞争力,可与Meta的CodeLLaMA7B等更大的模型相媲美。
Stability AI在2023年底开始推动更小、更紧凑和更强大的模型发展,例如StabilityLM Zephyr3B用于文本生成。Stability AI在2023年8月首次预览了Stable Code,并随后不断改进技术。
相比初始版本,Stable Code3B在多个方面得到了改进。除了建议新的代码行外,新模型还能填充现有代码中的较大缺失部分,实现高级代码完成能力,即Fill in the Middle(FIM)。
模型的训练采用了一种名为Rotary Position Embeddings(RoPE)的技术,通过扩大上下文大小,可选择性地允许上下文长度达到100k令牌。RoPE技术是其他大型语言模型(LLM)也在使用的,包括Meta的Llama2Long。
Stable Code3B建立在Stability AI的Stable LM3B自然语言模型之上,通过进一步专注于软件工程数据的训练,模型在保持通用语言任务强项的同时,获得了代码完成技能。其训练数据涵盖了代码仓库、程序员论坛和其他技术来源,同时在18种不同的编程语言上进行了训练。Stability AI声称Stable Code3B在多语言基准测试中表现出色,涵盖了Python、Java、JavaScript、Go、Ruby和C++等热门语言,初步基准测试显示其在完成质量上与两倍大小的模型相匹敌甚至超越。
在竞争激烈的生成式AI代码生成工具市场上,Stable Code3B作为Stability AI会员订阅服务的一部分,商业用户可获得使用权。该订阅服务于去年12月首次宣布,会员可以获取Stable Code3B以及Stability AI投资组合中的其他AI工具,包括SDXLStability扩散图像生成工具、StableLM Zephyr3B文本内容生成工具、Stable Audio音频生成工具、Stable Video视频生成工具等。
Stable Code3B的发布标志着Stability AI在AI代码生成领域的不断创新和改进,为开发者提供了更加便捷、高效的代码编写体验。