您还可以看到哪些错误需要注意。例如,我们从分析中发现的一个问题是,我们的 CMS 为每个页面创建了两个 URL,而 Google 发现了这两个 URL。这会导致重复内容问题,URL 相互竞争。
分析日志并不是什么复杂的事情——其逻辑与处理 Excel 或 Google 表格时的逻辑相同。最困难的部分是访问它们——导出和过滤这些数据。
第一次查看日志文件可能会有点令人 购买电话营销数据 畏惧,因为当你打开它时,你会看到如下内容:
静下心来仔细看看其中一行:
您很快就会认出它:
GET方法。
/接触/请求的 URL是(是)
200状态代码是(结果)。
11179传输的字节数为(大小)
(桌面)的代熈搈是用户代理(签名)
一旦你知道了每条线是由什么组成的,就不会那么 他们都是美国的政治人物——表示 怕了.这只是很多信息。 但这正是下一步派上用场的地方.
您可以使用的工具
您可以选择多种工具来帮助您分析日志文件。我不会向您全面介绍可用的工具,但了解静态工具和实时工具之间的区别很重要.
静态——这仅分析静态文件。 您不能延长该时间范围。想要分析另一个时期吗?您需要请求一个新的日志文件。我最喜欢的分析静态日志文件的工具是پاور BI۔
实时——让您直接访问日志。我非常喜欢开源的.我就可以 汤加营销 据自己的需要更改时间范围,而无需联系我们的开发人员.
开始分析
不要只是深入研究日志并
希望找到某些东西——开始提出问题。如果您一开始不明确提出您的问题,那么您最终会陷入没有方向、没有真正见解的兔子洞.
以下是我在开始分析时使用的几个问题示例:
哪些搜索引擎抓取我的网站؟
哪些 URL 被抓取的次数最多:
哪些类型的内容最常被抓取:
返回哪些状态代码؟
如果您发现 Google 正在抓取不存在的页面(404),您可以开始询问哪些请求的 URL
按请求数对列表进
行排序,评估请求数最高的页面以找到优先级最高的页面(请求数越多,优先级越高),并考虑是否重定向该URL 或执行任何其他操作.
如果您使用 CDN 或缓存服务器,您也需要获取该数据以获得完整的信息.