诸如piwik / google Analytics / omniture之类的网络分析软件包如何确定一组网址中的唯一网页?
例如a)一个网站可能具有以下产品目录页面
http://acme.com/products/foohttp://acme.com/products/bar或b)使用查询字符串
http://acme.com/catalogue.xxx?product=foohttp://acme.com/catalogue.xxx?product=bar在这两种情况下,您都可以为附属链接或其他用途提供额外的查询字符串变量,那么如何确定其相同的页面呢?
例如,这两个都是针对上面列出的foo产品页面的。
http://acme.com/products/foo?aff=somebodyhttp://acme.com/catalogue.xxx?product=foo&aff=somebody如果您忽略所有查询字符串,那么catalogue.xxx中的所有产品都将整理到一个页面视图中。
如果您不忽略查询字符串,则任何额外的查询字符串参数看起来都像不同的页面。
如果您正在与第三方网站打交道,则不能假定它们使用了任何一种方法或依赖诸如canonicallinks之类的正确内容。
您该如何解决?