随着大语言模型(LLM)成为我们获取信息的核心工具,了解这些AI系统优先青睐的内容类型,对内容创作者和营销人员至关重要。Evertune研究机构近期深入该领域,分析了2026年3月至4月期间6款顶尖大语言模型引用的25000个独立URL,旨在揭示它们的引用行为规律。
清单体占据大语言模型引用主导地位
这项研究最引人注目的发现是什么?清单体占大语言模型引用的所有独立URL的50%,在6款模型总计近4亿次引用中,清单体贡献了63%的引用量。每款模型都表现出对清单体的强烈偏好,占比从40%(Copilot,最低)到65%(Gemini,最高)不等。
不过,并非所有清单体都受到同等青睐。以排名为核心的清单体占被引用清单体内容的71%至86%,其次是非排名类清单体。而机构排名类清单体仅占总量的1.4%至4.7%。
从来源来看,企业、媒体和联盟营销类域名占据主导地位。值得注意的是,福布斯是所有被分析模型的三大清单体来源之一,凸显了它对大语言模型的持续吸引力。
为什么清单体对AI系统如此有吸引力?其结构化格式具备三大核心优势:
- 主题聚焦:清单体围绕特定主题展开,便于大语言模型提取针对性信息。
- 结构清晰:其规整的布局简化了解析和内容检索流程。
- 直接对比:许多清单体提供产品或服务的横向对比,这是大语言模型生成高价值回复的重要素材。
不过,内容创作者需谨慎行事。谷歌已表示将打击推广类清单体,而自吹自擂的排名可能违反美国联邦贸易委员会(FTC)的相关规定。
跨模型URL重叠:谷歌大语言模型共享最多的共同引用
尽管理论上这6款模型可以引用36000个不同的URL,但研究发现实际只有25000个独立URL,这表明各模型在引用偏好上存在显著重叠。
不出所料,谷歌旗下的大语言模型系列——Gemini、Google AI模式和Google AI概览——重叠度最高。Google AI模式和Google AI概览共享超过50%的高引用URL,这表明它们的训练数据和检索机制保持一致。
其他模型与谷歌系统也存在不同程度的重叠:Perplexity与Google AI模式和概览共享超过20%的URL,ChatGPT的重叠率超过15%,而Copilot的重叠率在4%至6%之间波动。这些差异源于模型训练机制、网站爬取权限以及传统搜索引擎优化(SEO)表现等因素。
高引用URL的页面结构特征
除内容类型外,研究还发现了大语言模型频繁引用的URL的关键结构特征。大多数高引用页面的字数在1000至2000字之间,平均句子长度为18个单词。这些页面还包含大量链接和结构化标题(H2、H3)来组织内容。
不同模型也表现出特定偏好。Copilot偏爱简洁内容,引用的页面平均为964字、24个段落。相比之下,Gemini更倾向于详尽、篇幅较长的内容,引用的页面平均为1977字、53个段落。
生成引擎优化(GEO)最佳实践
基于这些洞察,内容创作者可通过以下可落地的GEO策略优化内容,提升在大语言模型中的曝光度:
- 创建或参与创作结构化、针对性强的清单体,避免可能招致处罚的低质量或自我推广类内容。
- 利用传统搜索引擎优化(SEO):在人类搜索结果中表现优异的页面,往往在大语言模型的引用中排名靠前,尤其是谷歌旗下的模型。
- 根据目标模型调整页面结构:针对Copilot保持内容简洁,针对Gemini则提供详尽内容。通用规则是,字数尽量控制在2000字以内,包含大量链接和结构化标题,并在相关位置添加图片或列表。
随着大语言模型持续塑造搜索的未来,调整内容以契合它们的引用偏好已不再是可选项,而是必备要求。通过聚焦结构化、高质量的清单体,优化传统SEO,并针对特定模型定制内容,创作者可以提升在AI驱动搜索结果中的曝光度,在不断演变的数字格局中保持领先。