2023年主要集中在采用生成式人工智能和基础模型。然而,随着组织竞相将生成式人工智能置于工作流的前沿,它们意识到整理数据事务的重要性。
尽管企业始终理解高质量数据在业务成功中的作用,生成式人工智能的崛起强化了其价值,确保它成为所有人关注的焦点。现在,随着我们进入2024年,这一年将带来更大规模的生成式人工智能故事,领先的行业专家和供应商分享了他们对数据生态系统不同方面未来几个月发展的预测。
1. 关系型数据库将摆脱SQL的束缚
“无论是利用现代边缘、物联网还是生成式人工智能应用来拓展业务,企业在2024年有着许多大胆的计划。所有这些计划都依赖于对企业数据的安全访问。对于许多公司来说,支持这些应用的数据基础设施仍然停滞不前。许多组织仍然依赖于过时的操作性数据库,这些数据库是为处理几十年前的技术需求而构建的。
SQL是一种数据库语言,缺乏对过程逻辑的标准化方法,对于大多数应用程序而言,过程逻辑嵌入在连接到SQL数据库的应用服务器中,使用有状态、持久的会话。这种SQL的设计方法在50年前是有道理的,但对于现代的、无连接的云服务来说,它是一种痛苦的遗产。它通常要求应用代码和数据库共同驻留在同一数据中心区域,这严重阻碍了今天对企业至关重要的无服务器或地理分布的应用程序,如物联网和边缘应用...”
展望未来,我们将看到企业采用更灵活的数据库基础设施,支持现代应用程序在物联网、边缘和人工智能领域的分布、一致性、可伸缩性和灵活性。随着传统数据库的局限性对企业开发人员的影响越来越显著,它们将变得更加昂贵,也会成为业务创新速度的更大瓶颈。”
— Bob Muglia,Fauna执行主席,前Snowflake首席执行官
2. 向量数据库将成为最受追捧的技术
“在2024年,向量数据库将成为最受追捧的技术。在数据驱动的洞察推动创新的时代,由于向量数据库在处理高维数据和促进复杂相似性搜索方面的能力,它们迅速崭露头角。无论是用于推荐系统、图像识别、自然语言处理、财务预测还是其他人工智能驱动的项目,了解顶级向量数据库对各行业的软件开发都至关重要。”
“随着新应用从零开始采用人工智能...,向量数据库将在技术堆栈中发挥越来越重要的作用,就像应用数据库在过去一样。团队将需要可扩展、易于使用和在操作上简单的向量数据存储,因为他们努力创建具有新的LLM驱动功能的人工智能产品。”
— Ratnesh Singh Parihar,Talentica Software首席架构师,Timescale AI和向量总经理
3. 在企业数据湖中寻找LLM的黄金
“关于企业平均存储多少信息的统计数据丰富多彩,对于大公司而言,可以达到数百PB。然而,许多公司报告称,他们仅对其少于一半的信息(主要是结构化数据)进行挖掘以获取可操作的见解。在2024年,企业将开始使用生成式人工智能利用这些未经开发的数据,通过利用它来构建和定制LLM。通过使用AI驱动的超级计算,企业将开始挖掘其非结构化数据——包括聊天、视频和代码——以将其生成式人工智能开发扩展到训练多模态模型。这一跨越超越对表格和其他结构化数据进行挖掘的能力,使公司能够对问题提供更具体的答案并发现新的机会。这包括帮助检测健康扫描中的异常,揭示零售业中新兴趋势,以及使业务运营更安全。”
— Charlie Boyle,Nvidia DGX Systems副总裁
4. 没有足够先进自动化支持人工智能的公司将感到痛苦
“随着企业实施人工智能以保持竞争优势,许多将更加深刻地感受到其杂乱的数据基础设施的影响。当从简单地在仪表板上提供错误信息升级到基于该数据潜在地自动化错误决策和行为时,糟糕的数据(或不足够的数据)的影响将会加剧。只是时间问题,就会有没有强大的数据基础设施和治理的人将生成式人工智能投入至关重要的背景,并因准确性下降而遭受损失。”
— Sean Knapp,Ascend.io首席执行官
5. 云FinOps团队将优化其数据流程
“面对今年云计算开支失控的现实,在2024年,真正的跨组织合作将是识别不必要支出所必需的,财务和工程团队都将发挥关键作用。在Ascend的年度研究中,48%的受访者表示计划优化其数据流程以降低云计算成本,其中89%的受访者预计未来12个月流程数量将增长。明年利用能够准确定位数据流程中额外开支并迅速进行成本优化演示的平台将是必不可少的,以避免来自上级的误导性指令。”
— Sean Knapp,Ascend.io首席执行官
6. 意向数据将成为市场团队不可或缺的一部分
“在2024年,意向数据对于市场团队来说将不再是‘好有的’。随着公司努力协调销售和营销工作,通过对意向数据进行行为数据分析来预测客户需求的能力将变得越来越重要。随着人工智能每年变得更加复杂,我们预计会看到从被动到主动的客户参与的持续转变,提升转化率并促进长期客户忠诚。”
— Henry Schuck,ZoomInfo首席执行官
7. 数据和业务团队将在引入AI产品方面产生分歧
“尽管业务用户对ChatGPT等人工智能产品的需求已经起飞,数据团队仍将在允许访问企业数据之前强加巨大的检查清单。这种由尾部摆动狗尾巴的情况可能是迫使达到平衡的一种力量,采用可能比预期更早一些,因为人工智能证明其可靠且安全。
此外,企业将优先考虑清洁的数据集,以跟随人工智能驱动的分析热潮。清洁的数据集将作为成功实施人工智能的基础,使企业能够获得有价值的见解并保持竞争力。”
— Arina Curtis,DataGPT首席执行官兼联合创始人
8. 企业将在实时和人工智能方面受到双重冲击
“由人工智能驱动的实时数据分析将通过自动化为企业带来比以往更大的成本节约和竞争情报,并使软件工程师在组织内更快地移动。例如,保险公司在其数据库中存储了数千TB的数据。到2024年,有了人工智能,我们将能够实时处理这些文件,并且无需编写定制模型也能从这个数据集中获得良好的情报。
迄今为止,需要软件工程师编写代码来解析这些文件,然后编写更多的代码来提取关键字或值,然后将其放入数据库并查询以生成可操作的见解。由于有了实时人工智能,企业的成本节省将是巨大的,因为公司无需雇佣大量员工来从数据中获得竞争价值。”
– Dhruba Borthakur,Rockset首席技术官兼联合创始人
9. 知识图谱将帮助用户消除数据孤岛
“随着企业继续将更多数据转移到数据云中,它们在云中收集了数百、数千,有时甚至数万个数据孤岛。知识图谱将通过利用各种数据源之间的关系,轻松驱动语言模型导航所有存在的数据孤岛。因此,在新的一年里,我们将看到各种已建立和新颖的基于知识图谱的人工智能技术出现,支持智能应用的发展。”
– Molham Aref,RelationalAI首席执行官兼创始人
10. 人工智能将改变当前的数据管理方法
“企业正在意识到人工智能对其总体价值主张和竞争优势的潜力。为了实现这一点,人工智能需要接受培训并处理不同类型的数据。一些数据是公开的,但其中很多是与组织特定的个人消费者信息或知识产权有关的。公司将发现他们需要在保护被人工智能模型使用的数据的同时,仍然使用这些数据来支持有价值的决策。这些创新的数据管理解决方案将继续随着法规合规性和新兴法规的演变而发展。”
— Osmar Olivo,Inrupt产品管理副总裁
11. 首席数据官的角色将成为渴望担任首席信息官的先决条件
“在2024年,将为渴望成为首席信息官的人开辟一条新的、百试不爽的职业道路 - 成为并在首席数据官的职务上取得卓越成绩。在过去的几年里,首席数据官从一个低预算的咨询角色逐渐演变为一项对帮助企业充分利用其数据至关重要的资产。随着越来越多的组织投资于人工智能和云计算以民主化数据并激发创新,首席数据官处于驾驶座上 - 比以往更接近首席信息官以及企业的成功。寻找优秀首席信息官的组织将选择那些真正了解数据在组织中如何移动、流动并影响的人,这意味着首席数据官在追求这一职业道路上将具有自然优势,并将继续在企业中产生巨大的影响。”
– Heath Thompson,Quest Software总裁兼总经理