谷歌“AI模式”在人工智能搜索工具精度评测中夺冠

[ MHN스포츠 ] / 기사승인 : 2025-08-29 11:36:08 기사원문
  • -
  • +
  • 인쇄






围绕“谁是最精准的AI搜索工具”,一项涵盖多家人工智能搜索平台的对比评测结果近日公布。



美国时间27日,《华盛顿邮报》与美国各地公共及大学图书馆的馆员合作,对9款代表性AI搜索工具进行了详细性能测试。根据报道,谷歌的“AI模式”在此次评测中获得了最高准确分数。



此次测试对象包括谷歌AI模式与AI概要、OpenAI的ChatGPT(GPT-5、GPT-4 Turbo)、Anthropic的Claude、Meta AI、xAI的Grok、Perplexity以及微软Bing Copilot,所有工具都仅使用其7-8月期间的免费版本。



据悉,测试团队在包括问答、专业资料检索、最新事件、潜在偏见、图像识别等五大领域,对各工具共计提出30个高难度问题,总计收集并评分了900个答案。



最终结果显示,谷歌AI模式以60.2分(满分100分)高居第一,基于GPT-5的ChatGPT以55.1分排名第二,Perplexity以51.3分位居第三。



由埃隆·马斯克领导的Grok 3取得40.1分排第八,Meta AI则以33.7分垫底。Grok最新型号Grok 4由于缺少免费版本,未被纳入评测范围。















在细分领域对比中,各工具各有所长。谷歌AI模式在问答和时事领域表现突出;权威专业资料检索方面,微软Bing Copilot更胜一筹;图像识别环节则由Perplexity领先。GPT-4 Turbo则被认为在答案中展现出最少的偏见和较好的平衡性。



尽管GPT-5整体表现较前一代有提升,因此登上第二,但其在部分测试项目上反而低于GPT-4。



《华盛顿邮报》指出,本轮评测设计旨在揭示AI的弱点,结果显示即便如此,AI系统在许多日常提问场景中依然难以给出充分或正确的答案。尤其是对于信息的实时性判断与来源可靠性评估环节,部分AI会自信地提供错误信息。



该报强调:“若没有来源核查、时效性验证与批判性思维,用户只会获得杂音而非真正的知识。”



因此,专家建议用户不要轻易采信AI的答案。更安全的方法是结合链接、来源对比与时间点核查,多做交叉验证,主动提升“搜索思辨力”。



文章也评价道,虽然AI尚未能完全替代传统搜索,但若了解各AI工具的优势领域,灵活组合使用,有助于接近“更优解答”。



“本文由AI辅助从原始韩文版翻译,并由以母语为母语的记者进行后期编辑。”



照片=美联社新闻, 路透社

  • 글자크기
  • +
  • -
  • 인쇄

포토 뉴스야

랭킹 뉴스
많이 본 뉴스