前面谈谈内容页本身的优化(meta,content)问题,最后解决内容页(viewthread)的网页复制问题 内容页伪静态URL不唯一 看看内容页的URL大家就知道了:thread-(tid)-(page)-(forumdisplay page).html,可以看出最后一节表示的是此帖在列表页的第几页。所以,当您的帖子越来越多,这个帖就会由第一页到第二页...,它的URL就会不断的变化。其实打开一个列表页就可以看出来,第2页的帖子链接的最后数字都是2,第3页的都是3,只是很少注意它。我是在SE的收录中发现复制网页越来越多,才对最后的数字注意的。 解决方法 修改 forumdisplay.php 文件:将 $extra = rawurlencode("page=$page$forumdisplayadd"); 语句替换为 $extra = rawurlencode("page=1$forumdisplayadd"); 语句中的page就是forumdisplay page,这样改后不管帖子在列表页的第几页,这个数都是1。 功能损失:当用户编辑帖子或版主管理帖子后,有个提示跳转页:选择转入列表页还是主题页,这时转入列表页的话,只能转到列表页第一页,而不管您原来停留在第几页。 redirect的301重定向 在discuz论坛中可以看到类似redirect.php?tid=xxx&goto=lastpost#lastpost这样的链接,它的功能是实现“最新发表、最后发表、上一主题、下一主题“功能,仅这一个功能就可以给同一个内容页造成四份复制网页,因此将这样的链接301永久重定向到帖子的静态地址。 解决方法 修改 redirect.php 文件: 将前两个 require_once DISCUZ_ROOT.'./viewthread.php'; 语句替换为 $bmt_url='Location:/thread-'.$tid.'-'.$page.'-1.html'; header('HTTP/1.1 301 Moved Permanently'); header( $bmt_url ); 将后两个 require_once DISCUZ_ROOT.'./viewthread.php'; 语句替换为 $bmt_url='Location:/thread-'.$tid.'-1-1.html'; header('HTTP/1.1 301 Moved Permanently'); header( $bmt_url ); dz5.5的引用处也有个跳转,也可以做301: 将 dheader("Location: viewthread.php?tid=$post[tid]&page=$page#pid$pid");替换为 $bmt_url='Location:/thread-'.$post[tid].'-'.$page.'-1.html#pid'.$pid; header('HTTP/1.1 301 Moved Permanently'); header( $bmt_url ); ***注意此处直接转到了静态地址,没有做判断是否开启伪静态功能,所以不开启会有问题 功能损失:转向到静态地址后,动态地址中类似#lastpost的锚点将无法起作用了,可能要手动滚屏了 ???好像没有影响锚点 提示信息页的网页复制 这个问题和内容页也有着很大的关系,呵呵。如管理员设置允许游客浏览列表,而禁止浏览内容时,这些内容页都将返回一没有权限的提示信息页,但它们的URL是不同的,这样就形成了严重的网页复制,此外还有其它形成的无权操作等。别一种提示信息如帖子不存在等,数量大了也会形成网页复制。这两种提示信息,都是通过showmessage函数分别调用nopermission.htm和showmessage.htm两个模板实现的。 解决方法 1.创建另一个头模板文件 templates/default/header_disbots.htm 内容同 header.htm 文件,但将其中的meta标签替换为 2.分别修改 templates/default/nopermission.htm 和 templates/default/showmessage.htm 文件 将它们第一行的 {template header} 替换为 {template header_disbots} 虽然对meta robots标签支持的不是很广泛,但这是比较省事的方法 因为是提示信息页,用301来实现的话,还要传给转到的页好多信息,修改起来比较麻烦 参考例子:http://bbs.admin5.com robots.txt使用 User-agent: * #禁止一个版面的收录 #如果有个水版,不想禁止游客权限,也不想SE收录,已免影响网站质量,可以用如下方法 Disallow: /forum-1- #数字即为要禁止版块的ID。 #注意数字最后的 - 不要省略,否则连ID为11,12等1开头的版都禁了 #再禁网页复制 Disallow: /viewthread.php #这个是内容页的动态形式,前面对伪静态做了优化并修改了很多的复制网页,因此这里动态形式如打印页等一定要禁止 Disallow: /forumdisplay.php #这个要慎重:列表页的动态形式,还包括精华、活动、投票等形式。我发现5.0的静态化不彻底,它的上一页下一页翻页仍是动态,这样如果禁止了,十页之后的内容就不能通这索引了。所以如果您站内的交差链接不丰富的话,不要在此禁止,以免影响收录。 hekaiyu说没有这个问题,去官方看了下5.5的确没问题(也许我的5.0本来没问题,也许官方在新版本中完善了正则表达式的替换规则),这样更好了,禁止它,又干净了好多 #禁止其它无用内容 Disallow: /profile #用户信息,不知为什么discuz也静态化了,一律禁止 Disallow: /relatethread Disallow: /post Disallow: /blog Disallow: /member Disallow: /misc Disallow: /faq Disallow: /my Disallow: /pm Disallow: /digest Disallow: /status # ... ... 等等 # ----- robots.txt end ------ [更新]dz5.5的robots.txt后部分给出的Disallow: post.php等是不合规范的,一定要在前面加上"/" 首页URL问题 后台基本设置->首页文件名如果不设置,会默认为index.php。所以站内到首页的链接为形式为http://domain/index.php。而我们一般引用论坛首页或交换链接的形式一般是http://domain/。实际是一样的,但SE可认为是两个URL,而且一个拥有很多的内部链接,一个拥有较多的外部链接,所以哪个被降级都不是好事情,最好统一起来。这里的修改目标是http://domain/的形式。 1.进入后台,基本设置->首面文件名 设置为: / 2.修改文件 member.php 将 header("Location: {$boardurl}".$indexname); 替换为 if( $indexname=='/'){ header("Location: {$boardurl}"); }else{ header("Location: {$boardurl}".$indexname); } 此修改处的功能是清除cookies后返回到首页,如不修改域名后就有两个/。暂时未发现使用/当首页文件名的其它问题 结 束 除了文件的修改,有些地方要配合后台设置,前面都提到了,这里总结一下。主要有:1.URL静态化,只启用普通页面静态化就可以了;2.不要启用Archiver功能;3.后台的keywords和description设置只是针对首页的(如果您没做列表页和内容页的meta修改则也应用到它们);4.后台首页文件名为/(当然您也可以设置自己特定的) Discuz的SEO到此就告一段落了。想想当初发现和解决这些问题还真花了不少力气呢,不过了解了discuz,了解了php,了解了seo,呵呵 欢迎各位提出意见和问题。 |
|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )
GMT+8, 2024-10-1 07:29 , Processed in 0.074355 second(s), 12 queries , Gzip On, MemCache On.
Powered by Discuz! X3.5
© 2001-2023 Discuz! Team.