人工智能成为科技行业最火的板块,有关人工智能的未来应用和潜在危险也引发了科技大腕的口水之争,许多人担心人工智能未来给人类社会造成巨大威胁和风险。据外媒最新消息,马斯克旗下的一家人工智能研发公司,已经研发出能够写新闻和小说的AI机器人,但是由于担心技术被滥用,他们暂时不敢公布研究成果。
据国外媒体报道,由埃隆·马斯克(Elon Musk)支持的非营利性人工智能研究公司OpenAI表示,其名为GPT2的新人工智能模型非常好,但是被恶意使用的风险如此之高,以至于它正在打破向公众公布全部研究成果的常规惯例,以便有更多时间讨论技术突破带来的各种后果。
GPT2的核心是一个文本生成器。人们向人工智能系统输入从几个单词到整个页面的任何文本,并要求根据对下一步将发生什么的预测来编写接下来的几个句子。该系统正在突破人们认为可能的极限范围(无论是在产出的文字质量方面,还是在广泛的潜在用途方面)。
当用来简单地生成新的文本时,GPT2能够写出与它的风格和主题相匹配的看似合理的段落。它很少显示出任何与以前的人工智能系统不同的奇怪之处,比如在段落中途忘记写些什么,或者破坏长句的语法。
如果向这一人工智能系统输入乔治·奥威尔(George Orwell)的《一九八四》小说的开场白——“四月份是一个明亮的寒冷的一天,时钟敲了十三下”,随后这套系统将会识别出模糊的未来主义基调和小说风格,并继续写出以下的句子:“在去西雅图找新工作的路上,我坐在车里。我加满油,把钥匙放进去,然后就让它跑路。我只是想象这一天会是什么样子。一百年后的2045年,我在中国农村贫困地区的一所学校当老师。我开始教中国历史和科学史课程。”
如果把英国“卫报”(Guardian)有关英国退欧的报道的前几段提供给它,它的产出就是可信的报纸新闻文字,比如新闻文章囊括了杰里米·科尔宾(Jeremy Corbyn)的“引述”,提到爱尔兰边境,以及英国首相发言人的回答。
其中一个完全是人工智能撰写的段落写道:“特里莎梅首相的一位发言人被要求澄清这些报道,他说:‘首相已经明确表示,她的意图是尽快离开欧盟,这将属于女王上周讲话中确认的她的谈判授权范围。’”
从研究的角度来看,GPT2在两个方面是富有开创性的。OpenAI的研究主管达里奥·阿莫迪(Dario Amodei)说,其中之一就是它的规模。
与以前最先进的人工智能模型相比,GPT2模型“大12倍,数据集大15倍,范围更广”。它是在一个包含大约1000万篇文章的数据集上进行训练的,这些文章是通过在社交新闻网站Reddit上投票超过3票的新闻链接而选出的。大量的文本数据多达40GB,足以存储大约35000份《白鲸》小说的全部文字。
GPT2训练的数据量直接影响到它的质量,它在理解书面文本方面有了更多的知识。这也导致了第二次突破。GPT2比以前的文本模型更通用。通过分析输入的文本,它可以执行翻译和摘要等任务,并通过简单的阅读理解测试,通常表现得与专门为这些任务构建的其他人工智能系统一样好或更好。
然而,这种质量也导致OpenAI改变了其推动人工智能向前发展的惯例,并考虑将GPT2技术关在门内,评估恶意用户可能会对它做些什么。
“我们需要进行实验,找出他们能做什么不能做什么,”该研究机构的政策负责人杰克·克拉克(Jack Clark)说。“如果你不能预见到一个人工智能模型的所有能力,你就必须督促它看看它能做些什么。有更多的人比我们更善于思考它可以恶意地做些什么。”
为了说明这意味着什么,OpenAI制作了GPT2的一个版本,只做了一些适度的调整,这些调整可以用来对文字产品产生无限的正面或负面评价。垃圾邮件和假新闻是另外两个明显的潜在缺点,这也是人工智能未经过滤的本质。由于它是在互联网上训练的,不难鼓励它产生偏执的文本、阴谋论等等。
据悉,OpenAI的目标是展示未来一两年内人工智能的主流技术发展。“我有一个术语来形容这件事。来自地狱的自动扶梯,”克拉克说,“它总是使新科技在成本上降低,在价格上降低。你可以用来控制技术的规则已经从根本上改变了。
克拉克说:“我们不是说我们知道在这里应该做什么,我们不是在说‘这就是方法’,…,我们正试图在这里发展更严格的思想。当我们穿越新环境时,我们正在努力修筑这条路。”