|
Google搜索引擎的功能,特点
来源:
时间:2007-10-12 作者: RSS订阅
Google的功能与特点 Google搜索引擎是一个利用蜘蛛程序(Spider)以某种方法自动地在互联网中搜集和发现信息,并由索引器为搜集到的信息建立索引,从而为用户提供面向网页的全文检索服的 互联网信息查询系统。 它主要具有以下的特点和功能: 1) 采用了先进的网页级别(PageRankTM)技术。 这种技术是指依据网络自身结构,根据互联网本身的链接结构对相关网站用自动方法进行分类,清理混沌信息整合组织资源,使网络井然有序。这种独树一帜的技术打破了传统网络分类概念,它是基于网页的自然结构,即任何网页均可直接地连接到另一网页,而无须任何媒介。 2) 在同一个界面下,用户可以定制语言和到何种网站中进行搜索。 将多国语言的搜索引擎整合到同一个界面,供用户方便选择。目前,Google已可以对包括中文简体、中文繁体、捷克语、丹麦语、荷兰语、英语、爱沙尼亚语、芬兰语、法语、德语、希腊语、希伯来语、匈牙利语、冰岛语、意大利语、日语、朝鲜语、拉托维亚语、立陶宛语、挪威语、波兰语、葡萄牙语、罗马尼亚语、俄语、瑞典语、西班牙语等26个国家和地区的语言文字进行搜索。而一般情况下,Google会自动根据用户所使用的浏览器设置相应的语言界面。 3) 具有超链分析的功能。 即根据网页间彼此的连结关系,把一篇网页被连结数目的多寡视为相关性的一项指标,并根据相关性的高低排列出次序,以确定该网页的质量或重要度。因此,当用户输入关键字作Google搜索时,Google不仅会去搜索包含关键字的网页,同时还会搜索和这些网页具有高相关性的网页。 4) 遵从关键字的相对位置。 只提供包含所有关键字的网页,其正文或指向它的链接包含用户所输入的所有关键字。查询结果对网页关键字的接近度进行分析,按照关键字的接近度区分搜索结果的优先次序,筛选与关键字较为接近的结果。在显示的结果中,只摘录包含用户查询字串的内容作为网页简介,查询字串以高亮显示。 5) 提升了中文搜索引擎的相关性,而且更好地实现了检索字串与网页中文字的语义上的匹配,从而提高了检索效率。支持混合检索词查询。支持多种编码,使有些字虽然不在常用字符集中,但存在于Google所支持的其它字符集中,使问题迎刃而解。 查询方法 1) Google具有自己独特的语法结构,它不支持“AND”、“OR”和“*”等符号的使用,它自动带有“AND”的功能,当需要使用类似功能时,只需在两个关键词之间加空格即可,如“武汉广州”,由于不支持“OR”查找,用户如需获取两种不同的信息,则需分开检索。Google不支持“词干法”和“通配符”等,要求所输入的关键词完整,准确,一字不差,才能得到最准确的资料。要获得最实用的资料,并逐步缩小检索范围,则需要增加关键词的数量,或者在想删除的内容前加减号“-”(在减号前需留一空格)。 2) 高级搜索对于某些专用语的查询,可以点击“高级搜索”,例如为查找名言警句等专有名词时,要在键入的专用词语上加上双引号。此外,Google支持诸如“-”、“\”、“+”、“=”、“,”、“'”等标点符号作为短语连接符,并将之作为专用语的搜索处理。Google忽略“http”和“com”等字符,以及数字和单字,因为这类字词过于频繁出现于大部分网页,既无助于查询,还大大降低了搜索速度。因此需用“+”将这些字词强加于搜索项(“+”前必须留一空格)。如查“EpisodeI”或“OS/2”,需输入“Episode+I”及“OS/+2”。Google支持如冒号(:)等的某些特殊操作符,并具有相应的特殊功能,例如查询:“link:<网址>”,就可得到所有连接到该网址的网页(该方法不能与关键词查询联合使用)。 (鉴于时效性,以下仅作参考) Google的不足之处至目前为止,在满足用户的搜索需求上,Google依然存在一些令人遗憾的地方。 1) 其数据的更新速度无法进一步提高。由于数据量的庞大,使Google搜索引擎的数据更新无法早于30天,在一定程度上影响了用户对信息的时效需求,Google目前还无法突破这一瓶颈。 2) 无法搜索动态生成的网页。因为大多数负责搜索网页的蜘蛛软件都不敢去碰动态网页,怕被变化无穷的动态系统黑洞吸进去出不来,Google虽然在这方面的研究虽然取得一些突破,但离真正的实用还有一段路要走。
|
|