拓世网络

让AI理解你 · 选择你 · 推荐你

立即咨询

谷歌百科

Google 常用抓取工具列表

2025-05-29 googleseo

Google 常用抓取工具列表 bookmark_border Google 的常用抓取工具用于查找信息,以便构建 Google 搜索索引、执行其他产品特定抓取以及进行分析。在自动抓取时,它们始终会遵循 robots.txt 规则。Google 抓取工具的常规技术属性也适用于常用抓取工具。 常用抓取工具通常会从 googlebot.json 对象中发布的 IP 范围进行抓取,并且其主机名的反向 DNS 掩码与 crawl-***-***-***-***.googlebot.com 或 geo-crawl-***-***-***-***.geo.googlebot.com 匹配。 下表列出了常用抓取工具、它们在 HTTP 请求中显示的用户代理字符串、它们在 robots.txt 中 User-agent: 行的用户代理令牌,以及受抓取工具抓取偏好设置影响的产品。某些抓取工具有多个用户代理令牌;但您只需使用与相应抓取工具匹配的 1 个令牌,即可应用规则。此列表并非详尽无遗,仅涵盖更有可能出现在日志文件中且我们收到过相关问题的请求者。 注意:HTTP 用户代理字符串可能会遭到仿冒。了解如何验证访问者是否为 Google 抓取工具。 Googlebot HTTP 请求中的 User-Agent Googlebot(智能手机版) Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) Googlebot(桌面版) Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +http://www.google.com/bot.html) Chrome/W.X.Y.Z Safari/537.36 很少: Mozilla/5.0 […]

HTTP 状态代码以及网络连接错误和 DNS 错误对 Google 搜索有何影响

2025-05-29 googleseo

本文介绍了不同的 HTTP 状态代码、网络连接错误和 DNS 错误对 Google 搜索有何影响。我们在本文中介绍了 Googlebot 在网络上最常遇到的 20 个状态代码,以及最突出的网络连接错误和 DNS 错误,但未介绍一些较奇特的状态代码,例如 418 (I’m a teapot)。本文中提及的所有问题都会在 Search Console 的“网页索引编制”报告中生成相应的错误或警告。 除非另有说明,否则受支持协议(HTTP 和 FTP)的实验性功能默认不受支持。 HTTP 状态代码 HTTP 状态代码是由托管网站的服务器在对客户端(如浏览器或抓取工具)发出的请求作出响应时生成的。每个 HTTP 状态代码都有不同的含义,但请求结果往往相同。例如,有多个状态代码会发出重定向信号,但它们的结果是相同的。 Search Console 会为 4xx–5xx 范围内的状态代码和失败的重定向 (3xx) 生成错误消息。如果服务器返回 2xx 状态代码,则响应中接收到的内容可能会被考虑编入索引。 HTTP 2xx (success) 状态代码并不能保证一定会编入索引。 下表包含 Googlebot 最常遇到的 HTTP 状态代码,并解释了 Google 如何处理各个状态代码。 HTTP 状态代码 2xx (success) Google 会考虑将内容编入索引。如果内容表明有错误,例如空网页或错误消息,则 Search Console 会显示 soft 404 错误。 200 (success) Google 会将内容传递给索引编制流水线。索引编制系统可能会将内容编入索引,但不保证一定会。 201 (created) […]

面向大型网站所有者的抓取预算管理指南

本指南介绍了如何优化 Google 对频繁更新的超大型网站的抓取。 如果您的网站中没有大量经常更新的网页,或者您的网页一般在发布当日就被抓取,那么您无需阅读本指南;只需及时更新站点地图并定期检查索引涵盖范围即可。 如果您的内容已发布一段时间,但从未被编入索引,这便是另外一个问题了;请改用网址检查工具以查明网页未编入索引的原因。 本指南的适用对象 这是一个高级指南,适用于: 内容更改较为频繁(每周一次)的大型网站(非重复网页数量超过 100 万个) 内容每日更改飞快的中大型网站(非重复网页数量超过 10000 个) 网站的全部网址中有很大一部分被 Search Console 归类为已发现 – 尚未编入索引 上文提供的数字只是大致估算值,旨在帮助您对网站进行分类。这些数字并非精确阈值。 抓取的一般理论 网络是一个近乎无限的空间,Google 无法浏览每个可用网址并将其编入索引。因此,Googlebot 能花在抓取任意单个网站上的时间是有限的。Google 在抓取网站上投入的时间和资源通常称为网站的“抓取预算”。请注意,并非从您网站上抓取的所有内容都一定会编入索引;我们必须对每个网页进行评估和整合,以确定在抓取该网页后是否将其编入索引。 抓取预算由两个主要元素决定:抓取容量上限和抓取需求。 抓取容量上限 Googlebot 不希望在抓取您的网站时,导致您的服务器过载。为防止出现这种情况,Googlebot 会计算抓取容量上限,即 Googlebot 最多可以使用多少同时载入的并行连接来抓取网站,以及各次抓取之间的时间延迟。计算抓取容量上限是为了既能涵盖您的所有重要内容,又不会导致您的服务器负载过重。 抓取容量上限可能会升高或降低,具体取决于下面这几个因素: 抓取状况:如果网站在一段时间内的响应速度很快,则抓取容量上限会升高,即 Googlebot 可以使用更多的连接进行抓取。如果网站运行速度变慢或出现服务器错误,这一上限便会降低,Googlebot 能抓取的网页随之减少。 Google 的抓取上限:虽然 Google 的计算机数量很多,但不是无穷尽的。我们仍需根据已有的资源做出选择。 抓取需求 通常,Google 在抓取网站时会根据需要来分配抓取时间,具体取决于该网站的规模、更新频率、网页质量和相关性(与其他网站相比)。 下面这几个因素在确定抓取需求方面起着重要作用: Google 感知到的网址目录:如果没有您的引导,Googlebot 会尝试抓取在您网站上发现的所有或大多数网址。如果这些网址中有很多是重复的,或者您由于其他某种原因(网址已被移除、不重要等)不希望 Google 抓取这些网址,则它们会浪费大量 Google 抓取您网站的时间。这一因素是最能得到您的积极控制的。 热门程度:Googlebot 往往会更加频繁地抓取互联网上较为热门的网址,以便在我们的索引中及时更新这些网址的内容。 过时性:我们的系统希望尽可能频繁地重新抓取文档,以便将所有更改收入囊中。 […]

独立站管理对分面导航网址的抓取

2025-05-29 googleseo

分面导航是网站的常见功能,可让访问者更改内容(例如产品、文章或活动)在网页上的显示方式。这是一种常用且实用的功能,但其最常见的实现方式(基于网址参数)可能会生成无限的网址空间,并通过以下几种方式损害网站: 过度抓取:由于为分面导航创建的网址似乎是新创建的,并且抓取工具无法在先抓取网址之前确定这些网址是否有用,因此抓取工具通常会在确定这些网址实际上无用之前访问大量分面导航网址。 发现抓取速度变慢:基于前一点,如果抓取速度因抓取无用网址而变慢,抓取工具用于抓取有用新网址的时间就会减少。 典型的分面导航网址在查询字符串中可能包含与过滤的内容属性相关的各种参数。例如: https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny 更改网址参数 products、color 和 size 中的任意一个,都会在底层网页上显示一组不同的内容。这通常意味着过滤条件的可能组合数量非常庞大,从而导致潜在网址数量非常庞大。为了节省资源,我们建议您通过以下任一方式处理这些网址: 如果您不需要将分面导航网址编入索引,请禁止 Google 抓取这些网址。 如果您需要将分面导航网址编入索引,请确保这些网址遵循下一部分中概述的最佳实践。请注意,由于渲染这些网页需要大量网址和操作,因此抓取分面网址往往会消耗网站大量的计算资源。 防止 Google 抓取分面导航网址 如果您想节省服务器资源,并且不需要分面导航网址显示在 Google 搜索结果中,可以通过以下任一方式阻止 Google 抓取这些网址。 使用 robots.txt 禁止抓取分面导航网址。通常情况下,没必要允许抓取过滤后的内容,因为这会消耗服务器资源,而没有或几乎没有任何好处;相反,可以只允许抓取单个内容的网页以及一个专门的列表页面,其中显示未应用过滤条件的所有内容。 user-agent: Googlebot disallow: /*?*products= disallow: /*?*color= disallow: /*?*size= allow: /*?products=all$ 使用网址片段指定过滤条件。 Google 搜索在抓取和编制索引时通常不支持网址片段。 如果您的过滤机制基于网址片段,则不会对抓取产生任何影响(无论是正面还是负面)。例如,使用网址片段而非网址参数: https://example.com/items.shtm#products=fish&color=radioactive_green&size=tiny 表明希望(不)抓取哪些分面导航网址的其他方式包括使用 rel=”canonical” link 元素和 rel=”nofollow” 锚标记属性。不过,从长期来看,这些方法的效果通常不如前面提到的方法。 随着时间的推移,使用 rel=”canonical” 指定哪个网址是分面导航网址的规范版本可能会降低这些网址非规范版本的抓取量。例如,如果您有 3 种过滤网页类型,不妨将 rel=”canonical” 指向未过滤版本:https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny 指定 <link rel=”canonical” href=”https://example.com/items.shtm?products=fish” >。 在指向过滤结果页面的锚标记上使用 rel=”nofollow” 属性可能会有所帮助,但请注意,指向特定网址的每个锚标记都必须具有 rel=”nofollow” 属性,才能使其生效。 确保根据最佳实践创建分面导航网址 如果您需要系统抓取分面导航网址并编入索引,请确保您遵循以下最佳实践,以尽量减少抓取您网站上大量潜在网址所带来的负面影响: 请注意,抓取这些网址会增加服务器上的资源使用量,并且可能会降低网站上新网址的发现速度。 使用行业标准网址参数分隔符“&”。像英文逗号 (,)、分号 (;) 和方括号([ 和 ])这样的字符很难被抓取工具检测为参数分隔符(因为它们通常不是分隔符)。 如果您在网址路径中编码过滤条件,例如 /products/fish/green/tiny,请确保过滤条件的逻辑顺序始终保持不变,并且不存在重复的过滤条件。 当过滤条件组合未返回结果时,返回 HTTP 404 状态代码。 如果网站目录中没有绿色的鱼,用户和抓取工具应该会收到“找不到网页”错误,并显示相应的 HTTP 状态代码 (404)。如果网址包含重复的过滤条件或其他无意义的过滤条件组合,以及不存在的分页网址,也应该会出现这种情况。同样,如果过滤条件组合没有结果,请勿重定向到常见的“找不到网页”错误页面。相反,应该在遇到该网址时,提供“找不到网页”错误,并返回 404 HTTP 状态代码。

请求 Google 重新抓取您的网址

2025-05-29 googleseo

您是否使用了托管式内容管理平台(例如 Blogger 或 WordPress)?在大多数情况下,内容管理平台会自动将您的新内容提交给搜索引擎。请查看相应平台的支持文章。 如果您最近向网站添加了新网页或对网站中的现有网页进行了更改,则可以使用下列任一方法请求 Google 将该网页重新编入索引。您无法请求将不受您管理的网址编入索引。 抓取用时可能会从几天到几周不等。请耐心等待,并通过索引状态报告或网址检查工具监控进度。 请求抓取并不能保证系统会立即将网页收录到搜索结果中,甚至不能保证系统会收录该网页。我们的系统会优先快速收录优质、实用的内容。 使用网址检查工具(若网址数量不多) 如需请求抓取单个网址,请使用网址检查工具。您必须是 Search Console 资源的所有者或完整权限用户,才能在网址检查工具中请求将相应网址编入索引。 请注意,提交单个网址时有配额限制,多次请求重新抓取同一网址并不会缩短其抓取用时。 提交站点地图(一次提交多个网址) 如果您有大量网址,请提交站点地图。站点地图是让 Google 发现您网站上网址的重要渠道。如果您刚刚启动网站或最近执行了网站迁移,站点地图会很有帮助。站点地图也可包含与备用语言版本、视频、图片或新闻网页相关的其他元数据。了解如何创建和提交站点地图。

如何结合使用站点地图扩展

2025-05-29 googleseo

如何结合使用站点地图扩展 bookmark_border 站点地图扩展是将您在网站上使用的各类内容及其元数据告知 Google 的绝佳方式。您网页上的内容通常适合多种扩展;例如,您可能会发布嵌入图片和视频的新闻报道。此外,您的网页还可能会进行本地化,这可能意味着您可以为本地化网页添加 hreflang 注释。 命名空间 对于您要在站点地图中使用的每个站点地图扩展,您需要指定相应命名空间来声明扩展支持的标记。您可以借助 urlset 标记的 xmlns 属性来完成该步骤。Google 支持的站点地图扩展的命名空间包括: 扩展标记及其命名空间定义 image: http://www.google.com/schemas/sitemap-image/1.1 news: http://www.google.com/schemas/sitemap-news/0.9 video: http://www.google.com/schemas/sitemap-video/1.1 xhtml:(适用于 hreflang) http://www.w3.org/1999/xhtml 声明多个命名空间 如需声明多个命名空间,请按照对应扩展的文档中的说明,将相应的命名空间引用添加到您的站点地图中。以下示例演示了如何向站点地图添加新闻、视频和 xhtml(适用于 hreflang)扩展: <?xml version=”1.0″ encoding=”UTF-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9″ xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″ xmlns:xhtml=”http://www.w3.org/1999/xhtml”> <url> <!– rest of the sitemap –> 结合使用站点地图扩展 声明完命名空间后,请遵循您要使用的相应站点地图扩展的文档中的实现详情。 图片站点地图 Google 新闻站点地图 视频站点地图 hreflang 如需结合使用扩展,请按照各站点地图扩展的文档中的说明,将所使用的站点地图扩展中的标记逐一添加到相应的 <url> 标记中。 例如,要向站点地图添加新闻、视频和 xhtml (hreflang) 扩展,请按以下步骤操作: <?xml version=”1.0″ encoding=”UTF-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9″ xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″ xmlns:xhtml=”http://www.w3.org/1999/xhtml”> […]

视频站点地图和替代方案

视频站点地图是站点地图的一种,其中包含有关托管在网页上的视频的更多信息。创建视频站点地图有助于 Google 找到并了解您网站上的视频内容,尤其是最近添加的内容或 Google 通过常规抓取机制可能发现不了的内容。 Google 建议您使用视频站点地图,不过我们也支持 mRSS Feed。 视频站点地图最佳实践 由于视频站点地图基于常规站点地图,因此常规站点地图最佳实践也适用于视频站点地图。您可以仅为视频创建单独的站点地图或 mRSS Feed,也可以在现有的站点地图中添加视频站点地图标记,哪种方式更方便就选哪种。 此外,视频站点地图还需要满足以下要求: 请勿列出与托管网页的内容无关的视频。例如,视频是对网页的小补充或与主要文字内容无关。 视频站点地图中引用的所有文件都必须可供 Googlebot 访问。这意味着,视频站点地图中的所有网址: 不得被 robots.txt 规则禁止抓取, 必须能够在没有元文件且无需登录的情况下可供访问, 不得被防火墙或类似机制屏蔽, 并且必须可通过受支持的协议(HTTP 和 FTP)访问(不支持流式传输协议)。 如果您想阻止垃圾内容发布者访问在 <player_loc> 或 <content_loc> 网址上的视频内容,请验证访问您服务器的任何漫游器是否确实为 Googlebot。 如需了解关于 Google 搜索中的视频的更多提示,请参阅我们的视频最佳实践。 视频站点地图示例 以下示例显示的是具有视频扩展的常规站点地图。它包含嵌套在单个 <url> 标记中的两个视频条目。第一个 <video> 条目包含 Google 可以使用的所有标记,而第二个条目仅包含必需的标记。 <?xml version=”1.0″ encoding=”UTF-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″> <url> <loc>https://www.example.com/videos/some_video_landing_page.html</loc> <video:video> <video:thumbnail_loc>https://www.example.com/thumbs/123.jpg</video:thumbnail_loc> <video:title>Grilling steaks for summer</video:title> <video:description> Alkis shows you how to get perfectly done […]

Google 新闻站点地图

如果您是一家新闻发布商,可使用 Google 新闻站点地图将您的新闻报道和其他相关信息告知 Google。您既可以使用 Google 新闻专用标记扩展现有站点地图,也可以创建单独的 Google 新闻站点地图,专供您的新闻报道使用。这两种方案对 Google 来说都没有问题。不过,如果为您的新闻报道创建单独的站点地图,可通过 Search Console 更好地跟踪您在 Google 搜索中的内容。 Google 新闻站点地图最佳实践 由于 Google 新闻站点地图基于常规站点地图,因此常规站点地图最佳实践也适用于 Google 新闻站点地图。 发布新的报道时,请更新 Google 新闻站点地图。不要每次更新都创建新的 Google 新闻站点地图。Google 新闻抓取 Google 新闻站点地图的频率与抓取网站其他内容的频率相同。 仅添加过去两天内创建的文章的近期网址。报道发布超过两天后,请从 Google 新闻站点地图中移除这些网址,或从旧网址中移除站点地图中的 <news:news> 元数据。 如果您选择从 Google 新闻站点地图中移除旧网址,则可能意味着您的站点地图会在一段时间内(例如,您在过去几天内没有发布报道)为空。您可能会在 Search Console 中看到空站点地图警告,但这只是为了确保这是代表您有意为之。如果文件为空,不会导致 Google 搜索出现任何问题。 Google 新闻站点地图示例 以下示例显示的是具有新闻扩展的常规站点地图。其中包含一个 <url> 标记和一个 <news:news> 标记及其必需的子标记: <?xml version=”1.0″ encoding=”UTF-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:news=”http://www.google.com/schemas/sitemap-news/0.9″> <url> <loc>http://www.example.org/business/article55.html</loc> <news:news> <news:publication> <news:name>The […]

图片站点地图

图片站点地图可以告知 Google 您网站上的其他图片,尤其是 Google 可能无法通过其他方式找到的图片(例如,您的网站通过 JavaScript 代码获取的图片)。您可以创建单独的图片站点地图,也可以向现有站点地图添加图片站点地图标记;这两种方法对 Google 来说都没有问题。 图片站点地图以常规站点地图为基础,因此常规站点地图最佳实践也适用于图片站点地图。我们还建议您遵循发布图片的常规最佳实践。 图片站点地图示例 以下示例显示的是具有图片站点地图扩展的常规站点地图,其中包含两个 <url> 元素: https://example.com/sample1.html,其中包含两张图片 https://example.com/sample2.html,其中包含一张图片 <?xml version=”1.0″ encoding=”UTF-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″> <url> <loc>https://example.com/sample1.html</loc> <image:image> <image:loc>https://example.com/image.jpg</image:loc> </image:image> <image:image> <image:loc>https://example.com/photo.jpg</image:loc> </image:image> </url> <url> <loc>https://example.com/sample2.html</loc> <image:image> <image:loc>https://example.com/picture.jpg</image:loc> </image:image> </url> </urlset> 图片站点地图引用 image 标记在图片站点地图命名空间中定义:http://www.google.com/schemas/sitemap-image/1.1 为了确保 Google 能使用您的图片站点地图,您必须使用以下必需的标记: 必需的标记 <image:image> 包含单张图片的所有相关信息。每个 <url> 标记最多可包含 1,000 个 <image:image> 标记。 <image:loc> 图片的网址。 某些情况下,图片网址可能与您的主网站不在同一个网域中。即便如此也不必担心,只要您在 Search Console 中已验证这两个网域即可。例如,当您使用内容分发网络(如 Google 协作平台)托管图片时,请确保在 Search […]

使用站点地图索引文件管理站点地图

使用站点地图索引文件管理站点地图 bookmark_border 如果您的站点地图超过了大小上限,则需要将较大的站点地图拆分成多个站点地图,让每个新站点地图都小于大小上限。拆分站点地图后,您可以使用站点地图索引文件这种方式同时提交多个站点地图。 站点地图索引最佳实践 XML 格式的站点地图索引文件与 XML 格式的站点地图文件非常相似,前者由站点地图协议定义。 这意味着,所有站点地图要求同样适用于站点地图索引文件。 引用的站点地图必须与站点地图索引文件在同一个网站上托管。如果您设置了跨网站提交功能,则可免除此要求。 站点地图索引文件中引用的站点地图必须与站点地图索引文件位于同一目录中,或者位于网站层次结构中的更低一级目录中。例如,如果站点地图索引文件位于 https://example.com/public/sitemap_index.xml,它只能包含位于相同或更深目录中的站点地图,如 https://example.com/public/shared/…。 您最多可为 Search Console 账号中的每个网站提交 500 个站点地图索引文件。 站点地图索引示例 以下示例是一个 XML 格式的站点地图索引,其中列出了两个站点地图: <?xml version=”1.0″ encoding=”UTF-8″?> <sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″> <sitemap> <loc>https://www.example.com/sitemap1.xml.gz</loc> <lastmod>2024-08-15</lastmod> </sitemap> <sitemap> <loc>https://www.example.com/sitemap2.xml.gz</loc> <lastmod>2022-06-05</lastmod> </sitemap> </sitemapindex> 站点地图索引引用 站点地图索引标记由与通用站点地图相同的命名空间定义: http://www.sitemaps.org/schemas/sitemap/0.9 为确保 Google 能够使用您的站点地图索引,您必须使用以下必需的标记: 必需的标记 sitemapindex XML 树的根标记。它包含所有其他标记。 sitemap 文件中列出的每个站点地图的父标记。它是 sitemapindex 标记的唯一直接子级。 loc 站点地图的位置(网址)。它是 sitemap 标记的子级。一个站点地图索引文件最多可以包含 50,000 个 loc 标记。 此外,以下可选标记可能有助于 Google 安排何时抓取您的站点地图: 可选标记 lastmod […]

创建和提交站点地图

2025-05-29 googleseo

创建和提交站点地图 bookmark_border 本页面旨在介绍如何创建站点地图并将其提供给 Google。如果您刚开始接触站点地图,请先阅读我们的简介。 Google 支持由站点地图协议定义的站点地图格式。每种格式都有各自的优势和不足之处;请选择最适合您的网站和设置的站点地图格式(Google 没有偏好)。下表比较了不同的站点地图格式: 站点地图比较 XML 站点地图 XML 站点地图是用途最广的站点地图格式。该格式易于扩展,可用于提供关于图片、视频和新闻内容的其他数据,以及网页的本地化版本。 优点: 可扩展且用途广泛。 它可以提供有关网址的最详细信息。 大多数内容管理系统 (CMS) 会自动生成站点地图,或者 CMS 用户可以找到大量站点地图插件。 缺点: 处理起来可能会很麻烦。 在大型网站或网址经常改变的网站上维护映射可能会比较复杂。 RSS、mRSS 和 Atom 1.0 RSS、mRSS 和 Atom 1.0 站点地图在结构上与 XML 站点地图类似,但它们通常最容易提供,因为 CMS 会自动创建这些站点地图。 优点: 大多数 CMS 会自动生成 RSS 和 Atom Feed。 可用于向 Google 提供有关您视频的信息。 缺点: 除了 HTML 和其他可编入索引的文本内容之外,它只能提供视频相关信息,而不能提供图片或新闻相关信息。 处理起来可能会很麻烦。 文本站点地图 这是最简单的站点地图格式,只能列出指向 HTML […]

域名和关键词在搜索的特性统计

2025-05-28 googleseo

以下是关于 域名(Domain)和关键词(Keywords)在谷歌搜索中的特性统计及SEO影响 的数据和规律总结,基于近年行业研究和实战经验: 一、域名(Domain)特性统计 1. 域名长度与点击率(CTR) 最佳长度:8-12个字符的域名平均CTR比长域名高 23%(来源:Backlinko, 2023)。 例外:知名品牌(如 amazon.com)不受长度限制。 2. 关键词域名(EMD vs PMD) 精确匹配域名(EMD):如 buyiphones.com 优势:对低竞争长尾词排名短期有效(但谷歌2012年EMD算法更新后,过度优化会惩罚)。 现状:仅有 6.5% 的Google首页结果使用EMD(Ahrefs, 2024)。 部分匹配域名(PMD):如 apple.com/iphones(品牌+关键词)更安全且可持续。 3. 顶级域(TLD)分布 .com占比:全球TOP 100万网站中 48.7% 使用 .com(W3Techs, 2024)。 国家域(ccTLD):如 .de 网站在德国本地搜索中首页率比 .com 高 18%(Moz, 2023)。 4. HTTPS覆盖率 谷歌首页结果:98.2% 的页面启用HTTPS(Google Transparency Report, 2024)。 二、关键词(Keywords)特性统计 1. 关键词位置与排名 域名中的关键词:首页结果中 11.3% 的域名包含目标关键词(Ahrefs, 2024)。 URL路径中的关键词:如 example.com/blue-widgets,对长尾词排名提升显著(相关性得分提高 15-20%)。 2. 搜索意图匹配 商业型关键词:如 “buy wireless headphones”,域名含 buy 或 shop 的页面转化率高 32%(SEMrush, 2023)。 信息型关键词:如 “how to fix a sink”,子目录(如 wiki.com/how-to-fix-sink)比子域名更易排名。 3. 长尾关键词 vs 短尾关键词 流量分布:长尾词(3+单词)占搜索量的 70%,但竞争度低(Ahrefs)。 域名适配:长尾词更适合放在子目录(如 /best-running-shoes-for-women)而非域名。 三、关键结论与建议 域名选择 优先品牌化(如 patagonia.com),其次考虑PMD(如 allbirds.com/sneakers)。 避免EMD堆砌,除非品牌与关键词自然契合(如 booking.com)。 关键词策略 URL路径 > 域名:将关键词放在子目录中(如 /green-tea-benefits)更灵活且安全。 […]

谷歌seo网站域名机制

2025-05-28 googleseo

歌SEO中的域名机制(Domain Mechanism)核心可总结为以下几点,遵循这些原则能提升网站在谷歌搜索中的表现: 1. 简短易记 关键词优先:域名包含目标关键词(如 bestrunninggear.com),但避免堆砌(如 cheap-best-running-shoes.com)。 品牌化:优先选择独特品牌名(如 nike.com),而非泛泛的通用词。 2. 顶级域(TLD)选择 首选 .com:全球认可度高,用户默认信任。 国家域(ccTLD):如 .cn(中国)、.de(德国),针对本地搜索更有利。 新顶级域:如 .shop、.tech,需确保与品牌相关。 3. 子域名 vs 子目录 子目录(推荐):example.com/blog ——谷歌视为同一站点,权重集中。 子域名:blog.example.com ——谷歌可能视为独立站点,需单独优化(适合内容差异大的板块)。 4. HTTPS安全协议 必需项:谷歌将HTTPS作为排名信号,且浏览器标记非HTTPS站点为“不安全”。 5. 避免问题结构 连字符:最多1个(如 my-brand.com),避免垃圾感(如 buy-cheap-shoes-now.com)。 长度控制:不超过15个字符(不含后缀),便于记忆和分享。 6. 历史与惩罚 检查黑历史:避免购买曾被谷歌惩罚的域名(工具:Google Transparency Report)。 301重定向:更换域名时需完整重定向,传递权重。 7. 移动适配 响应式设计:确保域名下的页面适配移动端(影响移动搜索排名)。 一句话总结 “品牌相关、简短安全、结构清晰” 是谷歌友好域名的核心机制。 如需进一步细节(如子域名策略或HTTPS配置),可深入探讨具体环节。

Google 的链接最佳实践

2025-05-28 googleseo

在确定网页的相关性和查找可抓取的新网页时,Google 会使用链接作为信号。了解如何使您的链接可供抓取,以便 Google 能够通过您网页上的链接发现您网站上的其他网页;还可了解如何改进定位文字,以便用户和 Google 能够更轻松地理解您的内容。 确保链接可供抓取 一般来说,仅当链接是包含 href 属性的 <a> HTML 元素(也称为“锚标记元素”)时,Google 才能抓取该链接。Google 抓取工具不会解析和提取其他格式的大部分链接。Google 无法可靠地从没有 href 属性的 <a> 元素中提取网址,也无法从因脚本事件而作为链接发挥作用的其他标记中提取网址。以下是 Google 可以跟踪以及无法跟踪的链接示例: 推荐(Google 可以解析) <a href=”https://example.com”> <a href=”/products/category/shoes”> <a href=”./products/category/shoes”> <a href=”/products/category/shoes” onclick=”javascript:goTo(‘shoes’)”> <a href=”/products/category/shoes” class=”pretty”> 如果您使用 JavaScript 将链接动态地插入网页,只要链接使用了上述 HTML 标记,也可供抓取。 不推荐(但 Google 可能仍会尝试解析): <a routerLink=”products/category”> <span href=”https://example.com”> <a onclick=”goto(‘https://example.com’)”> 请确保 <a> 元素中的网址会解析为实际网址(也就是说,它类似于 URI),以便 Google 抓取工具向其发送请求,例如: 推荐(Google 可以解决): <a href=”https://example.com/stuff”> <a href=”/products”> <a href=”/products.php?id=123″> 不推荐(但 […]

Google 的网址结构最佳实践

2025-05-28 googleseo

Google 的网址结构最佳实践 bookmark_border Google 支持 RFC 3986 中定义的网址。所有被这项标准定义为预留的字符都必须采用百分比编码。非预留 ASCII 字符可以保留未编码形式。此外,非 ASCII 范围内的字符应采用 UTF-8 编码。 尽可能在网址中使用易读的字词,而非冗长的 ID 编号。 建议:在网址中使用简单、说明性字词: https://en.wikipedia.org/wiki/Aviation 建议:在网址中使用受众群体的语言(以及如适用的话,使用音译字词)。例如,如果您的受众群体使用德语搜索,请在网址中使用德语单词: https://example.com/lebensmittel/pfefferminz 建议:酌情使用 UTF-8 编码。例如,以下示例对网址中的阿拉伯语字符使用 UTF-8 编码: https://example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9 以下示例对网址中的中文字符使用 UTF-8 编码: https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7 以下示例对网址中的变音字符使用 UTF-8 编码: https://example.com/gem%C3%BCse 以下示例对网址中的表情符号使用 UTF-8 编码: https://example.com/%F0%9F%A6%99%E2%9C%A8 不建议:在网址中使用非 ASCII 字符: https://example.com/نعناع https://example.com/杂货/薄荷 https://example.com/gemüse https://example.com/🦙✨ 不建议:在网址中使用不易读的、冗长的 ID 编号: https://example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 请勿使用片段更改网页内容,因为 Google 通常不支持网址片段。如果您要使用 JavaScript 更改内容,请改为使用 History API。 […]

Google 的网址结构规则

Google 的网址结构最佳实践 bookmark_border Google 支持 RFC 3986 中定义的网址。所有被这项标准定义为预留的字符都必须采用百分比编码。非预留 ASCII 字符可以保留未编码形式。此外,非 ASCII 范围内的字符应采用 UTF-8 编码。 尽可能在网址中使用易读的字词,而非冗长的 ID 编号。 建议:在网址中使用简单、说明性字词: https://en.wikipedia.org/wiki/Aviation 建议:在网址中使用受众群体的语言(以及如适用的话,使用音译字词)。例如,如果您的受众群体使用德语搜索,请在网址中使用德语单词: https://example.com/lebensmittel/pfefferminz 建议:酌情使用 UTF-8 编码。例如,以下示例对网址中的阿拉伯语字符使用 UTF-8 编码: https://example.com/%D9%86%D8%B9%D9%86%D8%A7%D8%B9/%D8%A8%D9%82%D8%A7%D9%84%D8%A9 以下示例对网址中的中文字符使用 UTF-8 编码: https://example.com/%E6%9D%82%E8%B4%A7/%E8%96%84%E8%8D%B7 以下示例对网址中的变音字符使用 UTF-8 编码: https://example.com/gem%C3%BCse 以下示例对网址中的表情符号使用 UTF-8 编码: https://example.com/%F0%9F%A6%99%E2%9C%A8 不建议:在网址中使用非 ASCII 字符: https://example.com/نعناع https://example.com/杂货/薄荷 https://example.com/gemüse https://example.com/🦙✨ 不建议:在网址中使用不易读的、冗长的 ID 编号: https://example.com/index.php?id_sezione=360&sid=3a5ebc944f41daa6f849f730f1 请勿使用片段更改网页内容,因为 Google 通常不支持网址片段。如果您要使用 JavaScript 更改内容,请改为使用 History API。 […]

Google 编入索引的文件类型

Google 编入索引的文件类型 bookmark_border Google 可以将大多数文本文件和某些已编码文档格式的内容编入索引。最常编入索引的文件类型包括: Adobe 便携式文档格式 (.pdf) Adobe PostScript (.ps) 以逗号分隔的值 (.csv) 电子出版物 (.epub) Google 地球(.kml、.kmz) GPS 交换格式 (.gpx) Hancom Hanword (.hwp) HTML(.htm、.html、其他文件扩展名) Microsoft Excel(.xls、.xlsx) Microsoft PowerPoint(.ppt、.pptx) Microsoft Word(.doc、.docx) OpenOffice 演示文稿 (.odp) OpenOffice 电子表格 (.ods) OpenOffice 文本文件 (.odt) 富文本格式 (.rtf) 可缩放矢量图形 (.svg) TeX/LaTeX (.tex) 文本文件(.txt、.text、其他文件扩展名),包括采用常用编程语言的源代码,例如: Basic 源代码 (.bas) C/C++ 源代码(.c、.cc、.cpp、.cxx、.h、.hpp) C# 源代码 (.cs) Java […]

如何使您的网站页面显示在 Google 搜索结果中(谷歌编入索引)

使您的网站显示在 Google 搜索结果中 bookmark_border Google 会自动查找可添加到 Google 索引中的网站;通常您无需执行任何操作,只需将网站发布到网络上即可。但是,网站有时会被遗漏。检查您的网站是否已收录到 Google 中,并了解如何让您的内容在 Google 搜索中更易于被发现。 让网页出现在 Google 搜索结果中的基本核对清单  首先,您需要问自己以下几个有关网站的基本问题。您可在 SEO 入门指南中找到更多入门信息。 您的网站是否会显示在 Google 搜索结果中?  如需查看您的网页是否已经编入索引,请在 Google 搜索中按以下查询格式搜索您的网站。请将“example.com”换成您的网站地址。 site:example.com site: 运算符不一定会返回按照查询中指定的前缀编入索引的所有网址。详细了解 site: 运算符。 虽然 Google 可抓取数十亿个网页,但难免也会遗漏部分网站。造成抓取工具遗漏网站的常见原因如下: 您的网站没有链接到网络上的其他网站。看看能否让其他网站链接到您的网站(但请不要为了让其他网站链接到您的网站而向他们付费;这可能会被视为违反了 Google 的网络垃圾政策)。 您刚刚推出新的网站,Google 还没来得及抓取。Google 可能需要几周的时间才会注意到新网站或您对现有网站做出的任何更改。 网站设计致使 Google 很难有效抓取其内容。如果您的网站是基于其他一些专业技术(而非 HTML)构建的,Google 可能会无法正确抓取该网站。请务必在您的网站上使用文字(不要仅使用图片或视频)。 Google 尝试抓取您的网站时遇到了错误。最常见的原因是:您的网站设有登录页面,或者出于某种原因禁止 Google 访问。请确保您可在无痕式窗口中访问您的网站。 Google 漏掉了您的网站:虽然 Google 能抓取数十亿网页,但不可避免地会漏掉一些网站,特别是小网站。请稍作等待,并设法让其他网站链接到您的网站。如果您想尝试新鲜事物,可以在 Search Console 中添加您的网站,看看是否存在可能会导致 Google 无法理解您网站的错误。您也可以向我们发送最重要的网址,让我们知道应该抓取这些网址并可能将其编入索引。 遵循 Google 搜索要素,确保您满足了要显示在 Google […]