谷歌近日公开了一项名为“社会学习(Social Learning)”的 AI 框架,该框架允许 AI 语言模型能够通过自然语言互相学习,由于不需要直接交换敏感关键信息,因此训练出的 AI 模型更具隐私保护性。
据介绍,在这款“社会学习框架”中,“学生模型”会向多个已知特定任务解法的“教师模型”学习各种问题的解决方案,研究人员设计了“垃圾短信检测”、“解决小学数学问题”、“根据特定文字回答问题”等多项测试,来评估相关“社会学习”框架的成效。
研究人员表示,部分 AI 模型只经过短暂的“社会学习”框架训练,便能够能获得良好的任务解决能力。在研究人员的“垃圾短信检测任务”中,教师模型首先从用户所标记的数据学习,而在教师获得检测垃圾信息知识后,便可以教会学生模型区分垃圾和非垃圾信息。
IT之家注意到,相关教师模型可以依据实际数据集,合成出新的范例与学生模型共享,合成数据集与原始数据完全不同,因此能在保证起到相同教育作用的同时,降低原始数据中隐私内容泄露的可能性。
研究人员还尝试了合成指令的方式,让教师模型针对特定任务生成一系列指令,学生模型依据教师模型指令学习执行任务的方式,有点类似“人类遵循他人口头指令做事,并在执行任务中掌握如何做事”。
而实验证明,相关教师模型生成的指令能够提高学生模型执行任务的效率,相比于零样本学习,研究人员认为,这显示出 AI 模型在遵循指令方面的强大能力。