近日,B站UP主“差评君”发布了一条名为“我们用1300条B站热门视频,做了一个能读懂B站的取标题机器人”的视频。视频中,他通过训练生成了一个能自动生成标题的AI“赛博主编”,该AI能够根据过往的热门视频内容和观众口味生成符合B站观众口味的标题。
据了解,为了解决取标题的难题,“差评君”选择了使用B站过往的热门视频作为语料,经过人工数据处理和清洗后,将其投喂给千帆大模型平台进行训练。经过训练后的AI能够生成符合B站观众口味的标题。这一应用引起了广泛关注,截至目前,该视频播放量达72.4万,获赞2.1万。
类似这样的“专用AI”正成为不少玩家和开发者青睐的应用。然而,对于普通玩家来说,“如何获得训练AI的数据”是整个过程最大的难点。往往项目中需要的数据无法直接喂给AI,需要大量的预处理工作,会花费很多功夫。而“差评君”在视频中提到,1300条的样本量还是比较少,只是略微超过了标注数据的参考阈值。
但随着大模型预置的数据集越来越丰富,训练AI的门槛将会越来越低。相信未来,还有更多网友训练出不同玩法的AI应用。这种技术的出现将极大地方便了人们的生活和工作,同时也为AI技术的发展提供了新的可能性。