一项最新研究发现,ChatGPT在处理患有多种非传染性疾病(NCDs)的患者的营养咨询方面存在一定的局限性,无法替代医疗专业人员的咨询。这项研究由意大利都灵的研究人员进行,他们利用由OpenAI开发的Chat Generative Pretrained Transformer(ChatGPT)进行评估。
研究结果显示,ChatGPT在提供一般性的饮食建议方面表现良好,然而,在处理重叠的疾病时,出现了一些局限性,导致一些矛盾或不适当的建议。研究人员在《营养》杂志上指出:“尽管ChatGPT在为NCDs提供一般性饮食建议方面表现出合理的准确性,但在需要定制策略的复杂情况下,其效果降低。”
NCDs占全球死亡的74%,心血管疾病(CVD)是主要的贡献者,全球估计大约有4380万糖尿病(T2DM)病例,1850万高血压病例和12亿非酒精性脂肪肝病(NAFLD)病例。生活方式和饮食因素在NCDs中起着至关重要的作用,而在线健康信息搜索也在增加。
ChatGPT使用机器学习算法生成对基于文本的查询的回应,模仿人类对话,因此在提供个性化和即时的医疗建议方面越来越受欢迎。在患者教育和支持领域,人工智能的应用正在不断增加,医疗专业人员也越来越有兴趣探索这种工具,以提升患者护理、诊断和治疗。
然而,对ChatGPT在改善患有不同慢性NCDs的患者的营养知识方面的使用的文献仍然有限。最近的一项研究探讨了ChatGPT在提供营养信息方面的潜力,得出结论认为该工具无法替代注册营养师的专业知识,尤其是在处理复杂的医学状况时。与此不同的研究发现,这个聊天机器人在提供准确答案方面与人类营养师不相上下。
该研究的目标是比较ChatGPT(版本3.5)提供的关于不同需要饮食建议的NCDs的营养信息与国际指南的建议。在2023年11月,研究人员通过制定一系列关于各种NCDs的提示来评估ChatGPT提供的饮食建议的适当性。这些问题由专家小组(医生和注册营养师)设计,使用语言和句子结构模仿患者可能向医疗专业人员询问的方式。
ChatGPT的饮食建议与营养指南进行比较,然后通过引入涉及多种病症共存的更复杂的情景来调查聊天机器人处理复杂案例的能力。营养专家小组评估并将ChatGPT的回应标记为“适当”(如果内容符合指南),“不适当”(如果违反了指南),“不支持”(如果没有在指南中找到确认)以及“不完全匹配”(如果未完全满足指南的建议)。
研究结果显示,总体上,ChatGPT提供了明确的建议,适当性从55.5%(肌肉萎缩)到73.3%(NAFLD)不等。包括“适当”和“一般建议”两个类别,对于肌肉萎缩,营养建议的总体准确性达到了100%。
然而,有两个建议与指南相矛盾:一个是反对欧洲肥胖研究协会的饭点和零食指南的建议;另一个建议在NAFLD中服用维生素E、omega-3脂肪酸和抗氧化剂的补充剂,而欧洲临床营养和代谢学学会(ESPEN)坚持认为在进一步数据未经证实的情况下,这些补充剂不能被认可。对于T2DM,有一个建议被发现是“不支持”,而对于多种NCDs的许多建议被认为是“不完全匹配”指南,尽管没有直接违反它们。
此外,研究人员发现,当聊天机器人处理重叠的病症时,出现了局限性,导致一些矛盾或不适当的建议。研究人员总结道:“我们的发现表明,聊天机器人无法结合不同的建议,导致了矛盾或可能让用户困惑的不适当建议。”
研究人员还指出,在营养教育中使用ChatGPT可能受到患者数字素养的限制,尽管年轻人可能愿意接受技术,但老年患者可能不太愿意,并可能在理解该平台方面遇到困难。
这项研究的结论引起了关于ChatGPT在为患有多种非传染性疾病的患者提供准确和个性化的营养建议方面的有效性的讨论。