大模型时代,数据库的变化走到了哪?
“搭积木”、“‘自动驾驶’”、“三层解耦”,这些形象的标签成了1月17日阿里云开发者生态大会当天最出圈的词汇。
会上,一名小学生受邀上台演示了数据库查询的场景。一种“全民编程”的气氛向现场观众席卷而来。而让个人开发者和企业用户都可以像“搭积木”一样开发和管理数据库,这也正是阿里云在2024年甚至更长时间里的新愿景。
而AI,正是其中的关键武器。
从IBM小型机,到Oracle“统治”时代,再到以AWS、GCP等云数据库巨头引领的新时代,全球数据库行业交错发展了40年之久。而在最近的十年时间里,国产数据库成为新的弄潮儿。
2023年底,一张亮眼的成绩单新鲜出炉。阿里云瑶池数据库入选Gartner云数据库魔力象限,并连续4年蝉联“领导者”地位。
而与之对应的一个事实是,在国内云计算行业增速放缓的背景下,入选企业只有阿里云一家。放眼国际,IBM、SAP等传统商业数据库厂商,均跌出“领导者”象限。
云数据库正是其中的主角。实际上,在不少数据库企业的眼中,云数据库都被视为一个国内数据库行业换道超车的机会。其中不仅包括公有云大势所趋的推动,更重要的是云数据库所涉及到的底层创新,如存算分离和软硬一体技术等等,也正在成为数据库行业的新潮流。
2023年,据墨天轮统计,云数据库占国内数据库总数的20%。而早在2021年,中国信通院就做出相关预测。“80%的企业都认为云数据库是未来数据库行业的发展方向。”
在大模型一路“狂飙”的今天,云数据库又来到了超车关口。
一、从传统数据库到云数据库的“新需求面”
在很长一段时间里,业务高峰期间的流量指数级增长都是企业最怕遇到的问题,比如双十一期间的淘宝和春运期间的12306等等。这已经成为一种行业共识。
而在流量爆表的另一面,业务也对数据库,尤其是传统数据库提出了极高的要求,包括存储、计算等一系列环节都成为不少企业难以解决的问题。
根据一组不完全数据统计,在过去几年里,有超过70%的新型企业都因海量数据的挑战而对业务产生了影响。
天猫双十一是最常见的例子。每年双十一大促的,入驻天猫的商家都深知一个“爆款规则”,即提前几周乃止一个月对企业自身数据库计算能力和存储量做临时升配。
但尽管如此,在双十一流量高峰期间,客户的数据库还是会出现了问题。具体来看,由于传统数据库需要进行定期运维,而这种运维升级所需要的时间是6-8个小时。在此期间,不仅企业需要支付高昂的运维成本,更严重的情况则是由于资源冲突导致的升配失败。
在零售之外,中国联通这类的大型企业也在面临同样的问题。
与互联网业务不同的是,互联网业务交易量大,但速度快。而联通业务的特点则是会遇到多种需求,业务链条极长。
比如看似十分简单的选手机号的业务,一整条链条需要涉及到手机号码选择、套餐选择、开网,以及实名校验和反电信诈骗各种校验。
这种业务复杂、链条冗长的场景,对联通内部的IT系统是一个极大的考验,其不论是运维还是维护,都需要保持业务无感知以及绝对的安全,否则一旦出现问题将影响每个用户的日常生活。在这些之外,更要注意成本。因此,同样地,留给其内部数据库管理的难度极大。
实际上,不论是电商企业,还是如中国联通这样的大型运营商,传统数据库高企的成本和业务对弹性的运维需求也恰在成为采用云数据库的最强推动力。因此,极低的运营成本和弹性存储、计算便成为了对数据库企业的刚性需求。
根据不完全统计,在面对业务高峰带来的峰值时,云数据库的最大优势便是可以为企业提供弹性扩缩容能力。在这种弹性场景下,云原生数据库PolarDB的成本仅为传统商业数据库的十分之一。
另外,在厂商的帮助下,云原生数据库可以做到开箱即用,服务商提供从安装、部署到运维的全流程服务,基于云端的运维和弹性存储计算等进一步降低企业的运营和使用成本。
根据中国信通院报告显示,2022年中国公有云数据库市场规模为219.15亿元,较2021年增速51.6%,而本地部署的增速为14.4%。
二、解耦、AI、积木:
从弹性运维到智能运维
而在这个确定性的趋势之下,阿里云又向前了一步。
1月17日,阿里云PolarDB开发者大会上发布了“三层分离”的新版本,基于智能决策实现查询性能10倍提升、节省50%数据库成本。
而这里的“三层解耦/三层分离”则是阿里云的特殊标签。
此前,在过去40多年的数据库行业发展中,一个极为普遍的情况是数据库的计算与内存都是绑定在一起的,也就是俗称的存算一体。其中部分数据库可以做到计算和存储资源进行解耦,不过没有数据库能做到计算和内存的解耦。
但对于数据库而言,计算、内存和存储资源全部绑定在一起,这种强耦合性会极大地限制数据库的弹性能力,很难进行跨机迁移。
而放在现实生活中,最常见的例子是在淘宝双十一流量高峰,如果计算和内存无法进行分离,最直接的影响一方面是企业的数据库部署和运营成本十分高昂,另一方面则是对企业的计算资源造成极大的浪费。
这也是阿里云“三层解耦”方案的价值之处。
这种强解耦不仅带来的是运维和成本上的弹性,更在产品体验层面被强化。“未来,个人开发者和企业用户可以像‘搭积木’一样开发和管理数据库。”阿里云数据库产品事业部负责人李飞飞表示。
实际上,所谓的“搭积木”,其核心逻辑在于,在统一源数据管理和保证多租户隔离的前提下,企业可以自主调用搭配阿里云数据库的产品组组件,包括计算单元、存储引擎、向量引擎能力等等,满足业务对数据库的精准需求,而对阿里云而言,则是真正从原子化的层面满足企业自身需求。
从具体效果来看,“搭积木”的体现,一方面是刚刚提到的极致弹性,另一个则是强Severless能力。
对Severless化的一个通俗解释是,其更像一种按需付费的交付方式,用户不需要担心数据库的存储、计算等资源问题,也无需进行配置和维护、更新,可以大幅节省在服务上花费的时间和资源。
对企业而言,其只需要将重心放到本身的业务逻辑即可。
早在2017年,Serverless就在国内落地,也正是在这一年阿里云推出Serverless平台。后来,随着Serverless平台逐渐深化,“像搭积木一样简易”这样的愿景也开始一点点落地。
而在其中,AI是非常重要的价值工具。“在大模型时代,谁能够让整个端到端的流程更简单、更易用,谁就会在市场上占据先发优势。”李飞飞表示。
更客观来看,不论是弹性运维,还是Serverless,其本身都是对数据库产品力和使用体验的进一层深化,而如今在大模型的加持下,数据库的产品力将更为强大。
除了已有的向量引擎等数据库底层进化之外,李飞飞告诉我们,在数据库的智能运维方面,阿里云通过AI大模型能力,可以对企业内部的业务数据进行智能监控,再加上AI的智能分析能力,在一定程度上减少数据库维护、更新等人工成本。
再比如在数据库产品的服务层面,基于大模型可以对工单进行更为高效的管理,如今,这项能力已经在阿里云数据库团队内部使用。
“数据库和大模型结合的想象力很丰富,包括原有的BI,商业数据分析过等过去企业内部基于数据的动作,未来仍然会存在,但是会基于大模型的场景进行,这个想象力也是无穷的。”
三、2024,走到数据库的关口
实际上,我们再来看这个命题:即大模型究竟能为数据库做些什么?
继2023年,大模型“狂飙”了一年后,关于这样的讨论在持续发酵。甚至几乎所有大厂都All in AI来做大模型。
但就目前而言,与大模型结合更多可落地的场景在于上层应用,如AI Agent,或者与SaaS工具层的结合。而对于底层的数据库而言,大模型对数据库行业造成的潜在影响则在于智能化。
从大模型与数据库的本质进行分析,大模型需要依托海量的数据来训练、学习,而数据库的作用则是进行存储、筛选和处理数据。
因此,两者碰撞在一起的想象力,则可以通过可视化工具,来进行配合,比如通过大模型进行数据的收集、标签管理、数据资产沉淀,再利用AI大模型能力进行数据智能分析,并以清晰可视化的方式,实现真正的数据和业务结合。
这也是目前企业里较为常见的需求,即将数据库与AI和BI相结合的方向。
而从这些视角来理解,其实不难看出对当下而言,数据库行业正在坚定地发生一些变化。
首先,站在更大的行业视角,在云数据库成为新趋势的背景下,云数据库成为了国产数据库企业换道超车的新机会。而在此基础上,像阿里云所推出的“三层解耦”和“搭积木”理念,再加上AI加持的智能运维能力,也更是加速了云数据库替代传统商业数据库的趋势。
在过去2023年,整个数据库市场已经站上了数字路口的开始。从去年Gartner发布的云数据库魔力象限就可以发现,IBM、SAP等传统商业数据库厂商,均跌出“领导者”象限。
而从过往的历史趋势来看,一直以来在数据库行业具有“统治者”地位的Oracle也在云计算时代由于战略判断失误而失去了其原本的霸主地位。
而另一组根据信通院的统计则是,目前国内数据库有接近300家公司,这里面包括OLTP、OLAP、NoSQL等类型,已经被大量应用在企业业务中。
李飞飞告诉我们,未来坚持传统软件思维模式的数据库企业会越来越艰难。“坚持云原生化、一体化、平台化和智能化,才是数据库的下一个方向和未来。”
云原生化意味着企业从购买资源向购买能力转变,加速数据业务上云。其中“三层解耦”和Serverless能力便是最好的体现。
平台化对应的是基于平台来提供一站式的能力和解决方案,比如通过提供标准的API接口体系来减少业务烟囱。
一体化则是聚焦客户的业务场景,通过多产品一体化的体验,来简化开发、管理和运维,避免数据搬迁。如处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化。
最后,智能化便是结合AI提升运维效率和查询效率等等。而放在未来的大模型时代,智能化的想象力和应用力也将会越来越丰富。
不难看出,2024年数据库行业在AI的推动下,既定的云端进化速度正在加速。而伴随着市场和企业对于云数据库需求的越发增加,中国数据库厂商正在成为一股不可忽视的力量。
“核心还是持续为客户创造更大的价值,这是阿里云数据库和PolarDB产品的根本使命。”李飞飞说道。