我们的站点究竟有多少页面被 Google 收录(装的技术性一点就叫:“索引”)呢?
这个提问所引发的问题时常出现在SEO世界中,并且,其曝光率大有蔓延飞涨之势。问题通常都是由于某个像下列这样的搜索行为所引起的:

Google的搜索结果生成根域名下有93800个页面被搜索引擎索引。这听起来美妙不堪,但是当我们在一周后使用同样的搜索请求时,索引的数字却变成了大约75000个,这时我在大概一分钟后对Google.co.uk使用同样的搜索请求,返回的极富戏剧性的数字结果更让人感到困惑:

我们在 Google.com 的搜索结果页中点击一下“刷新”怎么样:

哦看吧!谷歌刚刚删除掉了我搜索的站点在他们索引中的8500个页面。太不靠谱了对吧?但其带来的不便却远未及得上主管,营销总监和CEO…等等一切使用这些数字作为KPI的家伙们对于你工作产生的负面印象!我说明白了吧?一个小小的数字就让你一无所有了…不同的数据中心间约计300%的浮动可以改变人们的瞬时注意力,或给人一个可行的洞察行为契机作为一种商业度量指标?
额,不幸的是,的确如此。
但不幸中的万幸是,我们可以通过一种简单的方法来获得较之利用搜索引擎提供的通过“site:xxx.com”语法能搜到的更多,更翔实的数据。那么接下来,我们将向您一步步展示如何按部就班的获得真正的数据指标。
步骤一:到你的Web Analytics工具中查看流量来源吧

点击位于Google Analytics 或 Omniture中的 “Traffic Sources”(中文版中名曰“流量来源”)链接。(它在其他的分析工具中或许被称作“Referring Source”即-“引荐来源”)
步骤二:选择搜索引擎分组啊!

我们想要知道究竟有多少网页被搜索引擎收录(或说“索引”)了的话,很显然,下一步就是点击搜索引擎分组了。
步骤三:选择一个目的搜索引擎吧

选择你需要的要将真实的指标提取出的搜索引擎点击它。如果你对于这个搜索引擎同时具备付费放置与自然流量的话,在这一步中要显示的则只有自然流量一项。
步骤四:选择登录页过滤

在Keyword下拉菜单中的“Landing Page”(“目标网页”又或者叫“登陆页”)过滤器能够将每个你选择的单独页面从搜索引擎获得流量展示给你。这同时也产生了神奇的获得的“Total”(全部)流量数据,将在下一步骤中做进一步解释。
步骤五:记录位于底部的数据

这个数字告诉了你哪些网页是通过使用 Google 搜索行为引导最少来过一次的具有独立编号的网页(很拗口- -|| 就是至少有人用 Google 搜索到并查看过一次的网页…)。就是它!数据中的圣杯(意指:特别想做的事)— 一个你始终能够精确跟踪到得数字,而且它表现出了搜索引擎真的在渐渐收录(索引)你的站点!就其本身而言,它并非十分有用。但随着时间的推移(原文作者通常建议是每月记录一次,但对于部分站点来说,每2-3个月记录一次显得更有意义。)它无论在你将页面做的更好或是更糟的情况下,都将给出一个直观的流量增减曲线。
现在,从技术层面来讲,我厚颜无耻的准备在这放点臭气。这个数字并没有告诉你故事的全部 — 你网站被搜索引擎抓取或说收录(索引)的真实总数并非你所见到的那样,但他确实告诉了你至少被搜索到并浏览过一次的网页数量。以我的观点来看,这个数据距离精确与更加可靠差的还远。第一个形容词 – 精确 - 是很难争论出结果的(特指此文中可以看到的数据),但第二个形容词,则需要更进一步来解释。
为什么被访问过一次的页面总数就可靠呢?
首先,孤立的看待收录数量(索引数量)是毫无价值可言的。商业与网站使用这玩意来作为KPI是因为那些头头们想要弄清楚(或许他们也并没在意- -|||),随着时间的推移,是否能让自己的网页更多的跻身搜索引擎“指数”中。我必须要提出的是:你并不关心你的


