AI搜索引擎准确性堪忧：研究揭示高错误率_科技魔方-中文AI大模型门户网站

　　哥伦比亚大学数字新闻研究中心近期对八款AI搜索引擎进行了深入研究，包括ChatGPT Search、Perplexity及其付费版、Gemini、DeepSeek Search、Grok-2和Grok-3 Search以及Copilot。研究人员从20家新闻机构随机挑选了200篇报道，确保这些文章在谷歌搜索中排名靠前，随后用相同的查询方式测试各AI工具的准确性和引用情况。

　　结果显示，除Perplexity及其付费版外，其他AI引擎的表现普遍不佳。整体来看，AI提供的答案有60%不准确，且它们往往以绝对肯定的语气陈述错误信息，加剧了问题的严重性。例如，ChatGPT Search虽然回答了所有200个查询，但其完全正确率仅为28%，完全错误率却高达57%。相比之下，X旗下的Grok-3 Search错误率更是达到了惊人的94%。

　　微软的Copilot也表现欠佳，在200次查询中有104次拒绝作答，而剩下的96次中，仅16次完全正确，总体错误率接近70%。尽管这些问题存在，相关公司并未公开承认，仍继续向用户收取高额订阅费用。

AI搜索引擎准确性堪忧：研究揭示高错误率

延展资讯