谷歌“AI模式”在人工智能搜索工具精度评测中夺冠

围绕“谁是最精准的AI搜索工具”，一项涵盖多家人工智能搜索平台的对比评测结果近日公布。

美国时间27日，《华盛顿邮报》与美国各地公共及大学图书馆的馆员合作，对9款代表性AI搜索工具进行了详细性能测试。根据报道，谷歌的“AI模式”在此次评测中获得了最高准确分数。

此次测试对象包括谷歌AI模式与AI概要、OpenAI的ChatGPT（GPT-5、GPT-4 Turbo）、Anthropic的Claude、Meta AI、xAI的Grok、Perplexity以及微软Bing Copilot，所有工具都仅使用其7-8月期间的免费版本。

据悉，测试团队在包括问答、专业资料检索、最新事件、潜在偏见、图像识别等五大领域，对各工具共计提出30个高难度问题，总计收集并评分了900个答案。

最终结果显示，谷歌AI模式以60.2分（满分100分）高居第一，基于GPT-5的ChatGPT以55.1分排名第二，Perplexity以51.3分位居第三。

由埃隆·马斯克领导的Grok 3取得40.1分排第八，Meta AI则以33.7分垫底。Grok最新型号Grok 4由于缺少免费版本，未被纳入评测范围。

在细分领域对比中，各工具各有所长。谷歌AI模式在问答和时事领域表现突出；权威专业资料检索方面，微软Bing Copilot更胜一筹；图像识别环节则由Perplexity领先。GPT-4 Turbo则被认为在答案中展现出最少的偏见和较好的平衡性。

尽管GPT-5整体表现较前一代有提升，因此登上第二，但其在部分测试项目上反而低于GPT-4。

《华盛顿邮报》指出，本轮评测设计旨在揭示AI的弱点，结果显示即便如此，AI系统在许多日常提问场景中依然难以给出充分或正确的答案。尤其是对于信息的实时性判断与来源可靠性评估环节，部分AI会自信地提供错误信息。

该报强调：“若没有来源核查、时效性验证与批判性思维，用户只会获得杂音而非真正的知识。”

因此，专家建议用户不要轻易采信AI的答案。更安全的方法是结合链接、来源对比与时间点核查，多做交叉验证，主动提升“搜索思辨力”。

文章也评价道，虽然AI尚未能完全替代传统搜索，但若了解各AI工具的优势领域，灵活组合使用，有助于接近“更优解答”。

“本文由AI辅助从原始韩文版翻译，并由以母语为母语的记者进行后期编辑。”

照片=美联社新闻, 路透社

MHN스포츠 인기 기사 해당 언론사페이지로 이동합니다