科技魔方

AI搜索引擎准确性堪忧:研究揭示高错误率

更多场景

2025年03月14日

  哥伦比亚大学数字新闻研究中心近期对八款AI搜索引擎进行了深入研究,包括ChatGPT Search、Perplexity及其付费版、Gemini、DeepSeek Search、Grok-2和Grok-3 Search以及Copilot。研究人员从20家新闻机构随机挑选了200篇报道,确保这些文章在谷歌搜索中排名靠前,随后用相同的查询方式测试各AI工具的准确性和引用情况。

  结果显示,除Perplexity及其付费版外,其他AI引擎的表现普遍不佳。整体来看,AI提供的答案有60%不准确,且它们往往以绝对肯定的语气陈述错误信息,加剧了问题的严重性。例如,ChatGPT Search虽然回答了所有200个查询,但其完全正确率仅为28%,完全错误率却高达57%。相比之下,X旗下的Grok-3 Search错误率更是达到了惊人的94%。

  微软的Copilot也表现欠佳,在200次查询中有104次拒绝作答,而剩下的96次中,仅16次完全正确,总体错误率接近70%。尽管这些问题存在,相关公司并未公开承认,仍继续向用户收取高额订阅费用。

+1

来源:DoNews

延展资讯