这是个内卷的时代。
内卷释义:原指社会文化模式发展过程中的停滞,现引申为非理性的内部竞争或“被自愿”竞争。
eg.某培训机构标语:您来,我们培养您孩子;您不来,我们培养您孩子的竞争对手。
内卷导致加班文化盛行,工作完不成?加班来解决。
然而美国国家税务局的数据科学家黛博拉·泰勒,却用实际经历告诉我们,加班这颗万灵药,也有失效的时候。
美国国税局的故事
泰勒接到一项任务,她需要从国税局的数据库中,归纳出识别身份盗窃及其他欺诈行为的规律。这个数据库相当庞大,里面躺的数据超过300 TB。
300TB什么概念?
如果将一部画质1080P、时长120分钟的电影,以1G大小计算,300TB等于307,200部电影。一个人不眠不休、正常速度观影的话,约70年能看完。
可怜的泰勒,让一堆CPU服务器连夜加班,都没能把这项艰巨的数据整理任务整利索。
焦头烂额之际,Cloudera的工程师来了,将自带GPU加速Apache Spark 3.0软件的Cloudera Data Platform(CDP)推荐给国税局团队。在没有修改代码的情况下,仅对软件进行快速测试后,泰勒的工作进度立马得到5倍提升。
针对几块滞后的地方,NVIDIA数据科学家团队出手将一些非常复杂的在CPU中处理的任务,迁移到其插入Spark的RAPIDS软件接口中,从而使这些任务的所有代码都在分布式Spark集群的GPU上顺利运行。
最终,Cloudera和NVIDIA的这项技术整合,为美国国税局的数据工程和数据科学工作流程,带来了10倍的速度提升和一半的成本节约。
【CPU与GPU的碎碎念】:我们都知道,CPU是个统筹全局的大计算家,可处理大量重复数据时它也捉襟见肘。这时就要请出擅长并行运算的GPU了,在ETL(数据的提取/转换/加载)和加速海量数据分析方面,GPU向来不辱使命。
强强联合
NVIDIA的专长在于通过GPU加速AI运算,而Cloudera数据平台作为业界首个企业数据云,提供了从边缘到人工智能的全方位分析能力。
NVIDIA GPU加速Apache Spark 3.0软件的Cloudera数据平台的推出,将打破大量数据和缓慢计算造成的瓶颈,大幅加速云中数据分析和AI工作负载。
如何看待二者的合作呢?就好比美队合作钢铁侠,杨戬拉拢孙悟空,马龙联手樊振东,一个字,强!
如今,这个强者之师又迎来了他们的第三位猛士——戴尔易安信。
戴尔科技宣布,NVIDIA GPU加速的Cloudera数据平台,可以在戴尔易安信的NVIDIA认证系统上使用了。
(部分戴尔易安信NVIDIA认证系统展示点击图片看大图)
这意味着,从研发到生产的HPC、AI和数据科学需求,将进一步自硬件层面汲取能量,并获得可观的基础设施花销节约。
至此,NVIDIA+Cloudera+戴尔易安信的强大队伍,已集结完毕,迎接他们的,将是广阔的HPC/AI舞台。
戴尔易安信的HPC/AI表现
曾经看起来无比高大上的HPC和AI正飞入寻常百姓家。
8月初,IDC公布了全球半年度人工智能市场追踪报告:
预计2021年,AI市场全球收入将同比增长15.2%达到3418亿美元,预计2024年有望达到5000亿美元;
在硬件、软件、服务这三个人工智能类别中,硬件将在未来几年保持最快的增速。
人工智能服务器市场,2020年戴尔易安信作为顶级玩家,营收超过5亿美元;
人工智能存储市场,2020年戴尔易安信依然位居前茅,营收超过1亿美元。
广阔的市场前景,反映了数据、技术驱动下的业务格局变化。
想当年HPC/AI初面世,超算昂贵,专家独揽,高科技神秘,可望不可即;如今,计算、网络、存储技术进步了,小型集群和工作站,亦可撑起HPC/AI一片天。
随之而来的,传统游戏规则被打破,门槛降低,更广泛的用户可以在业务中使用HPC/ AI。只要有需求,各个规模的企业都可以利用HPC/AI进行数据分析,以获得市场洞察、提高效率,并为数据驱动的投资追求更高的回报 (ROI)。
打个比方,基于数据获取洞察的工序,含数据的清洗、集成、转换、归约,这好比开火前的食材处理——摘菜、洗菜、分类、装碟,共同点是取其精华,去其糟粕,在尽可能少的时间内又快又好地整理好所有数据(食材),是二者一致的追求。
那么如何摆脱赤膊上阵的原始粗犷,向集群化、精细化、多元化迈进呢?
戴尔易安信可以提供这些工序的一站式解决方案。
作为业界少有的提供HPC打包方案的供应商,戴尔易安信拥有广泛的产品组合,涵盖就绪解决方案、工作站、服务器、网络、存储、服务,提供数据分析和人工智能所需的HPC性能及效率,并降低复杂性。
这些方案,已经得到全球多个行业客户的盖章认证:
作为全球最大银行卡发卡公司之一,万事达卡借助防欺诈引擎打击全球信用卡欺诈,该引擎通过基于戴尔易安信高性能计算系统的Apache?Hadoop? 集群来实现。
Medacist,药物转移分析领域的创新者,基于PowerEdge服务器和PowerScale H500存储所提供的数据分析和人工智能技术,将数据计算延迟从24小时降低至5分钟,从而获得运营洞察,确保患者和医院安全。
西蒙弗雷泽大学推出Cedar超级计算机,采用PowerEdge C4130和C6320服务器,为加拿大各地研究人员提供领先的超算性能。
所以,难题当道,你还陷在加班的内卷中无法自拔吗?
打破内耗,拒绝人才、资源低效应用,孜孜不倦探索科技,认认真真谋求价值创新,这才应该是内卷的正确打开方式。
另外,如果您所在企业有HPC/AI方面的“卷需”,欢迎访问戴尔易安信官网或拨打电话(戴尔官方企采网采购咨询专线:400-884-6610),与戴尔易安信携手,以数据驱动业务创新,用科技打造可持续的“护城河”。
七夕好礼相送
新品0元试用
码上领取专属情意吧