找回密码
 注册
搜索
热搜: 回贴

超链分析已走入歧途

2009-12-13 01:44| 发布者: admin| 查看: 15| 评论: 0|原作者: 仙之剑缘


超链分析是最近几年搜索引擎技术的研究重点,取得了很大的成功,也是GOOGLE、百度等搜索引擎的技术基础,但是,从搜索引擎的基本功能来看,超链分析很可能是走入了一条错误的道路。
搜索引擎的基本功能是从浩如烟海的网页信息中找到用户所想要寻找的信息,目前所有实用的搜索引擎技术都是以“关键字匹配”为最基础的原理的。
随着互联网的迅猛发展,互联网上的网页数量呈几何级数快速增加,造成早期的简单的关键字匹配算法所得到的搜索结果出现数量大、结果不精确、有效结果少、结果排序无规律等问题,使得使用搜索引擎来查找信息的目的难以达到。为解决这些问题,搜索引擎技术在许多方面有了进一步的发展,超链分析就是其中用于解决搜索结果排序的一种技术思路。
超链分析的基本原理是:在某次搜索的所有结果中,被其他网页用超链指向得越多的网页,其价值就越高,就越应该在结果排序中排到前面。
超链分析是一种引用投票机制,对于静态网页或者网站主页,他具有一定的合理性,因为这样的网页容易根据其在互联网上受到的评价产生不同的超链指向量,超链分析的结果可以反映网页的重要程度,从而给用户提供出更重要、更有价值的搜索结果。
但是,超链分析本质上是针对一种公开的、通行的价值评估体系的。当用户搜索的目的是寻找关于某些关键字的站点资源或网站入口时,它是有效的;但当用户搜索的目的是寻找关于某些内容的有效信息本身时,超链分析的结果不仅没有参考价值,而且会破坏用户搜索结果的精确度。
用户搜索关于某些内容的有效信息时,最大的特点时各异性,就是说,没有绝对意义上的“好”网页或“坏”网页,只有“有用的”网页和“无用的”网页。有用的网页是包含了用户搜索目的,能够提供给用户足够信息的网页,而无用的网页是与用户搜索目的不相关或不能够直接提供用户所需信息的网页。从普遍意义、通用意义上的价值来评估的搜索结果,对用户查找具体的资料和信息没有什么用处。某个被普遍引用网页从绝对意义上来说,可能是更有价值的,但对用户来说是无用的(例如各种门户和入口网页);而某个很少被引用的关于某个具体问题的文章的网页,对于某个用户的搜索目的来说,可能是最佳的结果。
超链分析技术的应用结果,使得用户的搜索不是找到更符合自己需要的网页,而是找到那些最热门的网页。用户通过搜索寻找自己想要的信息的主动的过程,变成了接受一种根据某种标准排名次的网页的被动的过程。在超链分析的影响下,搜索引擎的发展从追求对用户寻找到最有用信息的技术研究,演变成为了各网站想尽办法追求网页排名的商业活动。从这个意义上来说,超链分析也许从商业上来说是有价值的,但从搜索引擎的基本用途来看,已经走入了歧途。
在某种程度,关键词检索是一种过时的技术,超链分析已走入歧途。


最新评论

QQ|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )

GMT+8, 2024-9-30 23:31 , Processed in 0.216702 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

返回顶部