网站数据收集方法与技术

网站通常有两种常用的数据收集技术:页面标签技术与服务器日志技术。

页面标签技术

页面标签技术通过访客浏览器收集数据,并将这些数据发送到远程服务器,分析人员可以从远程服务器查看数据报告。这些信息通常通过放置在网站每个页面的javascript代码进行收集。有些服务商也会添加许多自定义标签来收集额外的数据。这些技术被称为客户端数据收集技术。Google analytics(谷歌分析)提供的就是页面标签技术。

服务器日志技术

服务器日志文件是指通过网站服务器而不依赖于访客的浏览器收集到的数据。服务器通常将访客的信息保留到同一个网段,甚至同一个服务器的本地文本文件上。分析者可以从本地服务器上看到报告。这些技术被称为服务器端数据收集技术,它会采集网站服务器收到的所有请求,包括页面,图像,PDF等。

注意:这两种技术并不能说哪种比哪种更好,各自都有自己的优缺点,主要取决于你的需求。将这两种技术进行结合,能获得取长补短的效果。

页面标签技术与日志文件技术的对比

页面标签技术优点

  • 不受代理和缓存服务器影响,提供更精准的会话追踪
  • 可以追踪客户端事件,如JavaScript、flash、web2.0等
  • 收集客户端电子商务信息
  • 实时收集和处理客户端数据
  • 自动升级
  • 数据存放在云端

页面标签技术缺点

  • 需要修改网页,在页面上加入追踪脚本
  • 错误设置会导致数据丢失,而且不能重新处理数据
  • 会受到防火墙的阻隔
  • 不能监测带宽和下载动作。当请求页面或文件时会运行追踪脚本,但下载时不会运行
  • 不能监测搜索引擎爬虫

日志文件技术优点

  • 自动收集,不需要修改页面代码
  • 可以处理历史数据
  • 不会防火墙阻隔
  • 可以监测带宽和下载动作,并且能够区分全部下载完成或部分下载完成
  • 可以监测搜索引擎爬虫
  • 可以监测手机用户

日志文件技术的缺点

  • 受代理和缓存的影响
  • 不能追踪客户端事件
  • 需要手动升级软件
  • 需要将数据存放在本地
  • 搜索引擎机器人会增加浏览数据

原创文章,作者:Johnny Chan,如若转载,请注明出处:https://www.myseosite.com/website-data-collect-methods/

发表评论

电子邮件地址不会被公开。 必填项已用*标注