科技魔方

CNCC2023技术论坛:百模大战之算力、算法、落地场景

云计算

2023年10月24日

  百模大战如火如荼,各大科技、互联网企业纷纷选择最擅长的模型类型起跑,竞争变得更加激烈。据不完全统计,从去年至今,国内已经产生了超百起大模型行业的融资案例。预计2023年全球大模型市场规模将达到210亿美元。为搭建更深入、更聚焦的学术和产业交流碰撞的平台,并行科技特举办“百模大战之算力、算法、落地场景”技术论坛,为行业带来一场才智交融、前沿观点碰撞的技术盛宴。  

  论坛简介

  今年随着全球对ChatGPT的关注,行业内掀起了AI发展的热潮,预训练大模型成为现象级AI应用,国内类ChatGPT应用更值得期待。面对上百亿、万亿规模的训练参数,对算力、数据、算法均提出更高的要求,使得人工智能成为算力相关产业发展的内在动力。伴随着人工智能算力网络的出现,可以显著降低算力的使用门槛、以及人工智能应用门槛,通过不断引入新的AI方法及算力基础设施,推动算力向高质量、高性能、高性价比发展。本场论坛活动将邀请多位专家学者,以人工智能热点技术为出发点,共同探讨人工智能、算力网络等相关技术发展,对产业落地进行展望。

  论坛日程

  时间:10月27日13:30-17:30

  地点:沈阳新世界博览馆5层会议室508

  时间

  报告题目

  讲者

  13:30 - 14:00 《超算架构大模型训练算力,高质量、高性能、高性价比》  陈健

  14:00 - 14:30  《安全可信的生成式多模态大模型》  苏航

  14:30 - 15:00  《大语言模型与多语言机器翻译》  肖桐

  15:15 - 15:45  《展望AI大模型时代》  茹立云

  15:45 - 16:15  《Colossal-AI:AI大模型的挑战与系统优化》  贾桐

  16:15 - 16:45  《知周万物:迈向通用人工智能》  缪钧玮

  论坛主席

  赵鸿冰| AI云事业部总经理  并行科技

  个人简介:

  赵鸿冰,博士,北京并行科技股份有限公司(839493)AI云事业部总经理,长期从事超算云与AI云研发与推广,致力于推进大规模GPU和CPU算力基础设施融合调度创新与服务模式创新,参与E级计算机关键技术验证系统和国家高性能计算环境服务化机制与支撑体系研究等科技部重大专项及国防预研项目十余项。

  论坛嘉宾

  陈健| 董事长  并行科技

  报告题目:

  《超算架构大模型训练算力,高质量、高性能、高性价比》

  报告摘要:

  随着ChatGPT的火爆,人类第一次让每个人都接触到了超算算力,都体会到了超算算力加持下的人工智能对生活众多方面生产效率的大幅度提升,这也导致近期全国乃至全球高端超算算力极度紧缺,高质量、高性能、高性价比的超算架构算力成为赋能大模型的刚需。算力网络是解决当前算力问题的最优模式,只要还有可用超算算力,算力网络就可以保证支撑用户完成计算任务。并行科技在过去十七年以算力网络服务模式,聚集国内外优质超算和智算算力资源,实现算力资源、应用资源、数据资源的共享与交易,面向终端用户提供多样化的算力服务。根据沙利文2022年行业分析报告, 并行科技超算算力服务营业额排名位居中国第一。并行科技积极探索与实践“算力网络”服务模式,积极响应国家近年来的“东数西算”发展政策,为行业发展提供了一套行之有效的“破题方法”,将前沿科技拓展至丰富的商业应用中,这将点燃算力服务市场的星火,为新的发展照亮前程。

  个人简介:

  陈健,博士,北京并行科技股份有限公司(839493)董事长,CCF中国计算机学会常务理事,CCF高专委常委,CCF YOCSEF主席(2019-2020),清华航院校友会副理事长,TEEC清华企业家协会成员。1993-2002年于清华大学获流体力学学士和博士学位,期间在荷兰TUDelft访问学者一年;2016-2021年,清华五道口金融学院GFD全球金融博士班;2002-2005年,任联想集团高性能服务器事业部方案处经理、副主任工程师;2005-2010年,任英特尔中国高性能计算架构师、资深性能优化工程师;2010年起,任并行科技CTO、CEO、董事长;2011年作为创始合伙人,与中国科学院计算机网络信息中心、北京市怀柔区政府共同筹建北京超级云计算中心,2020年北京超级云计算中心A分区荣登中国超算Top100排行榜第三名,紧随先后登顶世界第一的太湖之光和天河二号之后,助力中国科研和科技发展。

  苏航| 副研究员  清华大学计算机系

  报告题目:

  《安全可信的生成式多模态大模型》

  报告摘要:

  在GPT等大型模型的快速发展推动下,人工智能系统正加速技术革命和产业进步,逐步融入人类日常生活。本报告将从预训练扩散模型方法展开,阐述基于扩散模型的文本、图像和3D生成技术,并对其未来的应用前景进行分析;在此基础上,本报告将分析当前预训练大模型的安全性和可信性问题,介绍预训练模型普遍存在的鲁棒性不足,容易受到欺骗和误导等问题,介绍如何利用新型的训练范式,提升模型的安全性和稳定性。

  个人简介:

  苏航,清华大学计算机系副研究员,入选国家“万人计划”青年拔尖人才,主要研究鲁棒安全的人工智能方法和技术,发表CCF推荐A类会议和期刊论文100余篇,谷歌学术论文引用8000余次,获得吴文俊人工智能自然科学一等奖,ICME铂金最佳论文、MICCAI青年学者奖和AVSS最佳论文等多个学术奖项。

  肖桐| 教授  东北大学

  报告题目:

  《大语言模型与多语言机器翻译》

  报告摘要:

  以ChatGPT为代表的大语言模型具有十分出色的语言理解和生成能力,同时表现出惊人的多语言处理和翻译能力。这也给机器翻译研究带来了新的思路和挑战。本报告首先对大语言模型的多语言能力进行分析。在此基础上,从技术上剖析大语言模型的翻译能力,以及这种能力所衍生出来的新的技术路径。最终,对大语言模型在机器翻译中所面临的问题与挑战进行讨论。

  个人简介:

  肖桐,博士,东北大学教授、博士生导师,东北大学计算机学院人工智能系系主任,东北大学自然语言处理实验室主任,小牛翻译(NiuTrans)联合创始人。于东北大学计算机专业获得博士学位。2006—2009年赴日本富士施乐、微软亚洲研究院访问学习,并于2013—2014年赴英国剑桥大学开展博士后研究。主要研究领域包括自然语言处理、机器翻译、语言模型等。在国内外相关领域高水平会议及期刊上发表学术论文100余篇,并撰写专著《机器翻译:基础与模型》。作为项目技术负责人,成功研发了NiuTrans、NiuTensor等开源系统,在WMT、CCMT/CWMT、NTCIR等国内外评测中30余次获得冠军。2016年获得中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖,2021年获得中国计算机学会CCF-NLP青年新锐奖。任ACL、EMNLP、AAAI等国际著名会议及期刊的领域主席、高级程序委员会委员,并多次获得ACL、NAACL等会议的Outstanding Reviewer、Outstanding Action Editor。

  茹立云| 联合创始人、联席总裁  百川智能

  报告题目:

  《展望AI大模型时代》

  报告摘要:

  大模型学会自然语言,点燃了“AGI的火花”。它不仅是 AI 领域的重大突破,更是几百年不遇的,类似电力革命一样的机遇。大模型的演进将在工具、使用者、用户体验等多个维度带来革新。

  个人简介:

  茹立云,百川智能联合创始人、联席总裁,清华大学计算机系本科、硕士和博士,长江商学院EMBA,清华大学天工智能研究院副院长。曾任搜狗公司COO,2018年创立人工智能教育公司葡萄智学,2023年4月与王小川联合创立百川智能,超过20年AI领域经验。北京市科学技术奖一等奖,中国计算机协会CCF杰出工程师奖。

  贾桐| AI项目负责人  潞晨科技

  报告题目:

  《Colossal-AI:AI大模型的挑战与系统优化》

  报告摘要:

  众所周知,如今生成式AI的“涌现”能力来自于底层大模型的成熟,但训练大模型需要的算力、网络、数据成本非寻常公司能承受。潞晨科技为促进AI大模型时代行业标准化进程,全面解决AI大模型在行业落地难、门槛高等问题,基于多年在学术上的卓越成就和工业界的深厚积累,攻克多维张量并行、序列并行、异构内存管理、大规模优化库、自适应任务调度等多项核心关键技术,研发面向AI大模型时代的高效深度学习系统Colossal-AI,实现高效快速部署AI大模型训练和推理,全面降低AI大模型落地应用成本。Colossal-AI 自开源以来,获得GitHub Star 超3万颗,位列全球开源项目TOP500,细分赛道排名世界第一。其在ChatGPT,Stable Diffusion等前沿大模型的高效分布式解决方案展现卓越优势,受到全球最具影响力的AI生态PyTorch的官方认可,并成功入选NeurIPS、SC、AAAI、PPoPP、CVPR、NVIDIA GTC等国际AI与HPC顶级会议的官方教程,吸引上百家来自全球各地的机构共建Colossal-AI开源生态,为AI大模型时代赋能。

  个人简介:

  贾桐,潞晨科技AI项目负责人、Colossal-AI大模型高级算法工程师,负责公司内大模型算法研发 & 对外项目研发落地。主导负责研发公司ColossalAI-LLaMA-2大模型的研发,对外问答大模型等方向落地。

  缪钧玮| 商业化副总裁  面壁智能

  报告题目:

  《知周万物:迈向通用人工智能》

  报告摘要:

  本汇报通过介绍AGI浪潮引发的技术革新,阐述通用人工智能乍现曙光的背后逻辑,并简单介绍大模型当前的能力及发展方向,从而深入介绍面壁智能在大模型领域的前沿研究和重点,通过经典案例展示,展望和探索未来大模型在千行百业的应用范式,为通用人工智能的出现,努力添砖加瓦,迈步向前。

  个人简介:

  缪钧玮,CFA,毕业于清华大学计算机系获硕士学位,面壁智能商业化副总裁,西贝尔学者,OpenBMB开源社区理事,连续创业者。多年产品和解决方案经验,曾负责C端产品一年用户数过亿;基于AI产品服务过多家银行、券商、资管等数十家专业金融机构。

+1

来源:科技魔方

延展资讯