--------------------------------------------------------------------------------
什么是生成式引擎(GEs),它们与传统搜索引擎有何不同? 生成式引擎(GEs)是一种结合了传统搜索引擎与大型语言模型(LLMs)的新型搜索范式。与传统搜索引擎提供相关网站列表不同,生成式引擎通过综合多个来源的信息,生成一个直接、全面的自然语言回答来满足用户查询。
为什么说生成式引擎给内容创作者带来了巨大挑战? 生成式引擎直接提供综合性答案,用户无需再点击进入各个网站,这可能导致网站的自然流量和可见度大幅下降。此外,生成式引擎的黑盒和专有特性使得内容创作者很难控制或理解他们的内容是如何被使用和呈现的,从而对创作者经济构成威胁。
什么是生成式引擎优化(GEO),其主要目标是什么? 生成式引擎优化(GEO)是一个旨在帮助内容创作者提升其内容在生成式引擎回答中可见性的框架。其主要目标是通过一系列黑盒优化策略,调整网站内容的呈现方式、文本风格和具体内容,从而最大化其在生成式引擎响应中的“印象”或可见性。
为什么像平均排名这样的传统SEO印象指标不适用于生成式引擎? 传统搜索引擎以线性列表形式展示网站,因此平均排名是衡量可见性的有效指标。然而,生成式引擎生成的是一个丰富的、结构化的回答,其中网站链接作为内联引用嵌入在文本中,其位置、长度和风格各不相同,使得简单的线性排名无法准确衡量其可见性。
请列举并简要描述研究中提出的两种为生成式引擎设计的印象指标。 研究提出了两种主要印象指标:
位置调整后字数(Position-Adjusted Word Count): 该指标结合了与某个引用相关的句子在回答中所占的字数,以及该引用出现的位置。它通过一个指数衰减函数为出现在回答前面的引用赋予更高权重。
主观印象(Subjective Impression): 这是一个主观指标,通过大型语言模型评估多个方面,包括引用内容与查询的相关性、引用的影响力、内容的独特性、用户点击引用的可能性等。
什么是GEO-bench,它的用途是什么? GEO-bench是一个专为生成式引擎设计的大规模基准测试集,包含来自多个领域的10000个多样化用户查询以及相关的网络来源。它的主要用途是为GEO方法的忠实和广泛评估提供一个标准的测试平台,促进对生成式引擎的系统性研究。
研究发现哪些GEO方法最有效?它们将可见性提升了多少? 研究发现最有效的方法是添加统计数据(Statistics Addition)、添加引文(Quotation Addition)引用来源(Cite Sources)。这些方法在“位置调整后字数”指标上实现了30-40%的相对提升,在“主观印象”指标上实现了15-30%的提升。
GEO方法的效果对于搜索排名高和排名低的网站有何不同? GEO方法对搜索排名较低的网站带来的益处远大于排名较高的网站。例如,“引用来源”方法使SERP排名第五的网站可见性提升了115.1%,而排名第一的网站可见性平均下降了30.3%。这表明GEO有潜力为小型创作者提供与大型企业竞争的机会。
结合不同的GEO策略是否能带来更好的效果?请从文中举一个例子。 是的,结合不同的GEO策略可以带来更好的效果。研究发现,将**流畅性优化(Fluency Optimization)和添加统计数据(Statistics Addition)**相结合,其性能比任何单一的GEO策略高出5.5%以上。
像“关键词堆砌”这样的传统SEO方法在生成式引擎环境中的表现如何? “关键词堆砌”这类在传统SEO中广泛使用的方法,在生成式引擎优化中几乎没有或完全没有效果。研究结果显示,该方法在自定义生成式引擎和商业引擎Perplexity.ai上的表现均不佳,甚至可能比不进行任何优化还要差。
--------------------------------------------------------------------------------
传统搜索引擎(SEs)在过去三十年里彻底改变了全球的信息获取和传播,但它们的主要限制是只为用户查询提供相关网站的列表。近年来,随着大型语言模型(LLMs)的成功应用,出现了将传统搜索与生成模型相结合的系统,例如BingChat、Google’s SGE和Perplexity.ai。研究将这些系统统一称为生成式引擎 (GEs)。
根本性转变:
生成式引擎不仅搜索信息,它们还会从多个来源检索相关文档,并利用大型神经模型(即LLMs)生成基于来源的响应,确保归因,并为用户提供核实信息的途径。这种转变显著提高了用户效用,因为用户可以更快、更准确地获取信息。
生成式引擎的关键技术组件:
生成式引擎的架构设计灵活,可以容纳各种模块化组件。GE的核心包含两个关键部分:
搜索引擎 ($SE$): 负责检索数据库(如互联网)中的相关文档,并返回一组排名的来源 ($S$)。
一套生成模型 ($G = {G_1, G_2, ..., G_n}$): 每个模型服务于特定目的。
查询重构模型 ($G_{qr}$): 生成一组更简单的查询 ($Q_1$),以便搜索引擎消耗。
摘要模型 ($G_{sum}$): 为检索到的每个来源生成摘要 ($Sum_j$)。
响应生成模型 ($G_{resp}$): 基于摘要集合生成最终的累积响应 ($r$)。
最终的响应 ($r$) 通常是带有**嵌入式引用(行内归因)**的结构化文本。引用至关重要,因为它可以解决LLMs可能产生的幻觉问题,并允许用户验证信息。
这一转变为用户、开发者和内容创作者带来的深远影响:
| 利益相关者 | 深远影响 | 来源 |
|---|---|---|
| 用户 | 能够更快、更准确地获取信息,提高了用户效用。 | |
| 开发者(GEs提供者) | 能够制作精确和个性化的响应,从而提高用户满意度和收入。 | |
| 内容创作者 | 处于劣势。GEs通过直接提供精确和全面的答案,消除了用户导航到网站的需求,这可能减少网站的自然流量并影响其可见性。此外,GEs的黑箱和专有性质使内容创作者难以控制和理解其内容如何被获取和展示。 |
传统SEO与新兴GEO范式中“印象”或“可见性”的概念差异:
传统SEO: 网站的“印象”(或可见性)主要由其在一系列查询中的平均排名来决定。传统搜索引擎以线性列表的形式展示网站,因此排名是衡量可见性的有效指标。
新兴GEO(生成式引擎优化): 可见性是一个更微妙和多层面的概念。生成式引擎提供丰富、结构化的响应,并将网站作为行内引用嵌入在响应中。这些引用在响应中的长度、位置和样式各不相同。因此,传统的排名指标不再适用。
论文提出的系列印象指标及其构成部分和设计原理:
GEO的印象指标是专门为生成式引擎设计的,并遵循三大设计原则:1) 必须对创作者具有相关性;2) 必须可解释;3) 必须易于被广泛的内容创作者理解。
| 印象指标 | 构成部分和设计原理 |
|---|---|
| 词频数 (Word Count, $Imp_{wc}$) | 构成部分: 与引用相关的句子词数占响应中所有句子总词数的归一化比例 ($frac{sum_{s in S_{ci}} |
| 位置调整词频数 (Position-Adjusted Word Count, $Imp_{pwc}$) | 构成部分: 结合词频数和引用在响应中的位置。通过一个指数衰减函数对位置进行加权。设计原理: 响应中较早出现的句子更有可能被用户阅读。指数项赋予这些引用更高的权重,其灵感来源于搜索结果的点击率会随排名位置呈幂律分布下降的研究。 |
| 主观印象 (Subjective Impression) | 构成部分: 这是一个主观指标,旨在捕获引用对用户注意力的影响。它通过G-Eval评估七个子指标:相关性、影响力(响应对引用的依赖程度)、独特性、主观位置、主观计数、点击可能性和多样性。设计原理: 旨在评估创作者可以针对性改进的各个方面。由于G-Eval评分校准较差,因此将其归一化,使其与“位置调整词频数”具有相同的平均值和方差,以进行公平比较。 |
研究评估了九种GEO方法,这些方法可以根据其目的进行分类:
GEO方法分类与有效性比较:
| GEO方法类别 | 代表方法 | 相对提升效果(Position-Adjusted Word Count) | 评估结果与分析 |
|---|---|---|---|
| 增强内容可信度和证据 (需要新增内容) | 引用来源 (Cite Sources) | 提升约 30-40% | 高效果。 提供事实的验证来源,显著增强了内容的可信度。 |
| 添加引文 (Quotation Addition) | 最高效果 (41% 提升) | 最高效果。 增加了内容的真实性和深度,特别在涉及历史或个人叙事(如‘People & Society’)的领域。 | |
| 添加统计数据 (Statistics Addition) | 提升约 30-40% | 高效果。 在“法律与政府”和“观点”等领域,数据驱动的证据可以显著增强可见性。 | |
| 改进内容呈现方式/风格 (无需额外内容) | 流畅性优化 (Fluency Optimization) | 提升约 15-30% | 中高效果。 表明生成式引擎不仅重视内容,也重视信息的表达方式和可读性。 |
| 传统SEO策略 | 关键词堆砌 (Keyword Stuffing) | 几乎无改善,甚至在Perplexity.ai上比基线差 10% | 无效/负面效果。 表明传统SEO方法不适用于GEO范式。 |
为什么某些方法(如添加统计数据、添加引文)的表现显著优于其他方法(如关键词堆砌):
表现优异的方法,如引用来源、添加引文和添加统计数据,其核心是增强了内容的可信度、丰富性和证据支持。这些方法通过提供可供GE模型核实的来源和数据,使其更愿意将这些信息纳入最终的生成响应中。
相比之下,关键词堆砌这种传统的SEO策略则被证明是无效的。这是因为生成式引擎在摄取源文档和生成响应时,使用的是大型语言模型,这些模型能够对文本和用户查询产生更细致入微的理解。因此,GEs不像传统搜索引擎那样局限于简单的关键词匹配,传统的SEO技巧不再适用。
论文提出GEO有潜力**“使数字空间民主化”。基于研究中评估的GEO方法对不同搜索排名网站影响的结果,这一论断是合理且有力的**。
评估依据:
低排名网站受益显著: 实验结果显示,排名靠后的网站从GEO中受益更多。例如,“引用来源”方法使在传统搜索结果页面(SERP)中排名第五的网站获得了高达 115.1% 的可见性提升。
高排名网站可见性下降: 相比之下,排名靠前的网站(如排名第一的网站)应用GEO后,其可见性平均下降了 30.3%。
竞争环境的转变: 传统搜索引擎依赖于反向链接和域名权威性等因素,这对小型创作者而言难以实现。但生成式引擎是基于网站内容(以内容为条件)运行的生成模型。这意味着,通过应用GEO方法(如提高内容可信度和流畅性),小型内容创作者或独立企业可以显著提高其在GE响应中的可见性。
因此,GEO方法提供了一个“拉平竞争环境”的机会,使这些传统上难以获得高可见度的小型实体能够更有效地与大型公司竞争,从而支持了“民主化数字空间”的论断。
基于在自定义生成式引擎和Perplexity.ai上的实验结果,我们为特定领域的内容创作者制定以下战略性建议:
核心原则: 专注于内容质量、可信度和呈现方式。避免传统的关键词堆砌,因为它表现不佳,甚至在Perplexity.ai上比基线差 10%。
| 领域 | 战略性建议 | 依据来源 |
|---|---|---|
| 法律与政府 | 首要策略:添加统计数据 (Statistics Addition) & 引用来源 (Cite Sources)。 确保所有关键陈述都附有量化数据和明确的来源引用。 辅助策略:流畅性优化 (Fluency Optimization)。 | 依据: “法律与政府”和“观点”领域的查询显著受益于数据驱动的证据。引用来源有助于为事实提供验证来源,增强内容可信度。流畅性优化(提升 15-30%)是普遍有效的辅助手段。 |
| 历史 | 首要策略:添加引文 (Quotation Addition) & 权威性 (Authoritative)。 纳入来自可信来源的直接引文,并在写作风格上采用有说服力和权威性的语气。 辅助策略:引用来源 (Cite Sources)。 | 依据: “历史”、“人物与社会”和“解释”领域最能从添加引文中受益,因为它能增加内容的真实性和深度。权威性风格对历史和辩论类问题有效。引文策略在Perplexity.ai上的位置调整词频数中表现最佳。 |
总之,在生成式引擎时代,内容创作者应将精力集中在提高内容的**证据基础(如引用和统计数据)以及优化其表达方式(如流畅性和易理解性)**上,这是获得可见性的关键。
比喻解释:
从传统搜索引擎到生成式引擎的转变,就像从阅读图书馆的目录卡片(传统SEO,只告诉你书在哪里,排名决定了卡片的位置)转变为阅读一位博学且善于归纳的私人导师的总结报告(生成式引擎)。在目录时代,你只需要确保你的书名(关键词)和卡片位置(排名)足够显眼。但在导师总结的时代(GEO),导师更看重你的论据是否扎实、数据是否可信、引用的来源是否权威。因此,与其在书名上堆砌关键词,不如确保书的内容有理有据、易于理解,才能被导师(GE)采纳并纳入其最终的报告中。
--------------------------------------------------------------------------------
术语 (中文) | 术语 (英文) | 定义 |
生成式引擎 | Generative Engines (GEs) | 一种集成了大型语言模型(LLMs)的新型搜索引擎,它通过综合多个来源的信息来生成自然语言回答以响应用户查询。 |
生成式引擎优化 | Generative Engine Optimization (GEO) | 一个旨在帮助内容创作者通过优化其网站内容,以提高在生成式引擎回答中可见性的框架和方法论。 |
GEO-bench | GEO-bench | 一个为评估GEO方法而创建的大规模基准测试集,包含10,000个跨领域的查询及相关网络来源。 |
印象/可见性 | Impression / Visibility | 在GEO中,指一个网站(或引用)在生成式引擎生成的回答中所获得的关注度或突出程度,由多个指标衡量。 |
字数(印象指标) | Word Count | 一种客观印象指标,定义为与某个引用相关的句子字数占整个回答总字数的归一化比例。 |
位置调整后字数 | Position-Adjusted Word Count | 一种结合了字数和引用位置的印象指标,通过指数衰减函数给予回答中较早出现的引用更高的权重。 |
主观印象 | Subjective Impression | 一种综合性主观指标,使用LLM评估引用的相关性、影响力、独特性、位置突出性等多个维度。 |
关键词堆砌 | Keyword Stuffing | 一种传统的SEO技术,即在内容中增加更多与查询相关的关键词。在GEO中被证明效果不佳。 |
引用来源 | Cite Sources | 一种GEO方法,通过在网站内容中添加对可靠来源的引用来提高内容的可信度和可见性。 |
添加引文 | Quotation Addition | 一种GEO方法,指在网站内容中加入来自可信来源的相关引文。 |
添加统计数据 | Statistics Addition | 一种GEO方法,指在内容中尽可能使用量化统计数据来替代定性描述,以增强内容的精确性和可信度。 |
黑盒优化 | Black-box Optimization | 一种优化方法,它在不了解系统内部具体算法设计的情况下,通过调整输入来提升输出结果。GEO就是一种黑盒优化框架。 |
搜索引擎优化 | Search Engine Optimization (SEO) | 旨在提高网站在传统搜索引擎结果页面中排名的过程和技术。 |
大型语言模型 | Large Language Models (LLMs) | 驱动生成式引擎进行信息综合和回答生成的先进人工智能模型,如GPT系列。 |
联系我们
客服:138-1808-3367
邮箱:info@expand.vip
地址:浙江省杭州市临平区迎宾路501号余之城南区4F优客工场
快捷链接
关于我们
客户案例
新闻中心
解决方案
数据仓储
教育培训
医疗行业
直播视频
产品服务
智能大数据
智能多媒体
智能物联网
区块链平台
AI人工智能