网站首页 外推专区 外推知识 正文
搜索引擎语法
搜索引擎语法作为互联网重要的一个推广、搜索、检测手段。必须要牢牢把握。
作用:
1.方便寻找客户
2.方便工作进行
3.提高经济效益
搜索引擎命令大全及用法:
blog:百度的blog命令,它可以查询你发表在百度空间的文章被百度收录的数量。但这条命令只对百度博客搜索起作用。用法:blog:hi.baidu.com/要查询空间名
Domain:用domain命令可以查找跟某一网站相关的信息。例提交“domain:url”就可以查询到在网站内容里面包含了url信息的网站。
Filetype:限制查找文件的格式类型。目前可以查找的文件类型有.pdf/.doc/.xls/.ppt/.rtf 用法:搜索关键字 filetype:ppt
inurl:限定查询匹配只搜索URL链接。用法:inurl:搜索关键字。注,在用inurl用法的时候,尽量使用英文,因为中文会被进行URL编码。
link:搜索与被查询网站做了链接的网站。用法:link:[url=http:// www.3suau.cn] 3suau.cn [/url],这样就可以看到谁跟[url=http:// www.3suau.cn] 3suau.cn [/url]做了交换链接
Site:限制查询在某一个特定站点内或网域内进行。用法:搜索关键字 site:3suau.cn 或是在网域内搜索如 搜索关键字 site:3suau.cn www可以省略
site:www.car8.net 酷熊
site:www.car8.net intitle:酷熊
site:www.car8.net intext:酷熊
找关于photoshop的使用技巧,可以这样查询:photoshop inurl:jiqiao
domain命令:
百度:查网页内容中包含某关键词的命令。如“domain:www.139.gov.cn”搜索结果是包含关键字词组(www.139.gov.cn )的所有网页。同理,domain:seo 指的是包含seo的所有网页,与直接搜索SEO相似。可以用来查找有多少个网页内容中包含你的网址,一般来说包含你网址的网页都属于站点的反向链接,所以这个命令一定程度上被误使用为查询网站的反向链接。
Google:domain 并不代表一个指令。只是一个普通的关键字。
Yahoo:与 site 一样,都是查找域名下的所有收录网页。
link命令:
百度:link 并不代表一个指令,只是一个普通的关键字。link:www.139.gov.cn 搜索结果是包含这样一个关键字(www.139.gov.cn)词组的所有网页,与其他普通关键词的搜索一样。并不是查找反向链接。
Google:查找的是反向链接,但只包含网站所有反向链接的少部分。Google网站管理员工具可以查网站的所有反向链接。
Yahoo:查找的是反向链接,但需要在域名前加 "http://",如:link:http://www.139.gov.cn 注意:域名加与不加"www"结果是不一样的。
每当我们用站长工具查询网站收录情况,尤其是反向链接的时候,都会发现百度是domain:yahoo用的是link:很多人都在讨论这个问题的时候,从来就没有想过为什么百度要用domain,而不用link。而且百度通过domain出来的数据仔细看一下,根本就不完全是返链,还包括其它好多的文字链接。比如我域名通过domain之后,
比如,google在webmaster central中宣称,通过link:命令查询的反链数量是不准确的,而在使用site:语句查询网站在百度的索引数量时,百度也提示:“找到的相关网页数是估算值,不代表真实结果数,仅供参考。”
我们还有必要继续使用link:命名吗?
外链可以用 google 的webmaster tools中看到的外链数量简直就不是同一个数量级别的。
平时我用google的时候喜欢用inurl这个功能来查找特定网站的内容,现在把这个小技巧贡献出来,和大家分享。例如:我想查一下某一个学校(北京大学)关于蛋白质的内容,键入“inurl:pku.edu.cn 蛋白质”,然后出来的检索结果就会限制在北京大学的网站之中,用这种方法查关于某一个人的情况非常实用,比如,你知道某一个人是某一单位的,但是进去网站去找非常费时,不如使用这个方法。如果大家有兴趣,不妨试一下。
INURL的用法和解释INURL有什么用
1)、inurl:xxx 作用是命令搜索引擎查找url中包含xxx的网页。 例子:inurl:news
2)、“inurl:xxx 关键词”或“关键词 inurl:xxx” 两者意义一样:要搜索引擎查找满足下面两个要求的网页 1. url中包括xxx 2.网页中含有“关键词” 例子:cnkikw inurl:viewthread.php ,网页正文包含“cnkikw”,url中有“viewthread.php” 可以直接加文件后缀
二、应用 任何网站的url都不是随意设置的,都经过一番过虑,有一定用意的。很多地方,url链接和网页的内容有着密切的相关。所以,可以利用这种相关性,来缩小范围,快速准确地找到所需信息。
1)查找专题资料:提供类似资源的网页url常有相同的字符。 在《Google搜索从入门到精通v4.0》这篇经典文章中,是这样解释的:“有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。”上网的时候,注意观察网页的url,总结出那些资源常用什么url,搜索时,用上inurl,能缩小搜索范围,迅速地找到结果。一般来说,
提供书籍下载的,url一般包括book、ebook、shu、shuji、 论坛的url中常含有bbs、forum 音乐方面 music、yinyue、mp3、midi 提供软件用 soft、software、ruanjian 新闻的用news、xinwen 体育的是sports、tiyu 下载photoshop cs ,加上inurl:soft,使用“photoshop cs 下载 inurl:soft”搜索,可以事结果更加准确。 想看看别人对三星E638 的评价,用“E638 inurl:bbs”搜索,就能看到论坛里的说法。 伊拉克大选怎么样了,用“伊拉克大选 inurl:news”,查找今天星六了,《南方周末》应该可以搜到了。用“inurl:20050407 zm ”查找。马上出来了。(zm是周末(ZhouMe)的缩写,20050407是日)
2)搜索具体信息:从英文名 拼音、缩写、首字母组合等着手 查找书籍:想下载神雕侠侣的电子书,inurl:shendiaoxialv , 结果233篇 ,很多无用的,就加上book, 用 inurl:shendiaoxialv book ,第一项是“《神雕侠侣》 金庸北极星书库e书下载” 听说阿来的《尘埃落定》不错,找来看看 inurl:chenailuoding 小灵通漫游未来,用inurl:xltmywl 即可。 找音乐 沧海一声笑 inurl:canghaiyishengxiao 10篇 可用 一剪梅 inurl:yijianmei 无用的结果多,加上music ,用 inurl:yijianmei music,三项结果,可用让我们荡起双桨,多么美妙的歌声。重温一下,inurl:rwmdqsj,找到相关网页148篇,可以。 找某人的相关资料: inurl:huipk huipk斑竹的个人家园都搜索出来了,很奇怪,没有搜到huipk在blogchina的blog。 inurl:wanganyi 王安忆的作品和个人资料很快就搜到了 inurl:zhangailing 找到很多信息,但多是关于其作品的,看看她的个人资料,用“出生 inurl:zhangailing ”搜索,立刻得到。
3)挑战site site的用处是把搜索范围限定在某一站点或指定网域中。所以,搜索结果的url就有一部分是相同的。 百度: 在线电影 site:sowang.com 331篇 在线电影 inurlsowang [...]
Site——把搜索范围限定在特定站点中
如果你知道这些网站中有你想要的信息,可以使用site语法缩小搜索范围,加快搜索速度。
在21cn找网络红人关键字实例: 网络红人 site:21cn.com
Inurl——把搜索范围限定在url链接中
网页url中的某些信息,常常有某种有价值的含义。于是,您如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。
在21cn找网络红人关键字实例: 网络红人 inurl:21cn.com
Domain——同时具备上述两个参数的作用
经常使用搜索引擎查找资料的用户也许会有一个疑问,在百度中Site和Inurl都可以实现上述的功能,为何如今一定要使用domain呢?用“site:网站”的搜索参数可以对指定网站内的内容进行查找(相当于网站的内部搜索);“inurl:网站”的搜索参数则要求全部结果中的网页地址中必须包括指定的网站;而“domain”这个参数就同时具备上述两个参数的作用,而且应用也更加广泛。
在21cn找网络红人关键字实例: 网络红人 domain:21cn.com
例如分别用site:21cn.com(搜索到3,730,000个结果)、inurl:21cn.com(搜索到808个结果)、 domain:21cn.com(搜索到3,580,000个结果)进行搜索,你会发现所得到的结果在数量上差异是比较明显的,因为前两个参数所定义的范围比较狭窄,而domain则由于允许所定义的范围可以出现在网页的任意位置,自然结果要多得多。根据这个特点,当我们无法从site或inurl参数中得到理想的结果时,使用domain参数往往能收到意想不到的效果。
使用domain查找网站密码:有时候出于一些特殊原因,我们需要查找某个网站的密码,输入“ OR password domain:XXXX”(XXXX为具体网址)进入搜索,说不定就会有意想不到的收获。
查网站密码关键字实例: password domain:www.0668.com
intitle,inurl,intext,site,双引号"",加减号,filetype的用法
""双引号 完全搜索
使用双引号("")进行词组检索 利用双引号查询完全符合关键字串的网站。例如:输入“中国女足”找出包含“中国女足”的网站,而不会找出包含“中国男足”的网站。
或:A|B
并:AB
否:AB
“seo” 工资|待遇|薪水|年薪 和 "seo" 工资 待遇 薪水 年薪 差不多
仅搜索网站的网址 "u:"
在关键字前加“u:”,搜索引擎仅会查询网址,例如在网页中的搜索框中输入“u:yahoo.com”,单击“搜索”按钮,则统一资源定位器中包含“yahoo.com”字符的网址全部显示出来。
仅搜索网站标题 "t:"
在关键字前加“t:”,搜索引擎仅查询网站的名称。例如在网站搜索框中输入“t:网络技术”,单击“搜索”按钮,符合搜索条件的网站标题显示出来。
用fitletype 在google 能搜索到很多资料
如: filetype:doc seo 翻译过来做软文
intext:to parent directoryintext.mdb
intitle:"index of" data
site:a2.xxxx.comintext:ftp://*:*
intitle:"george bush"
allintitle:"money supply" economics
排除某网站或者域名范围内的页面,只需用“网站/域名”。
seo发表于 20091120 00:50 | 只看该作者
intitle,inurl,filetype,site的作用及在google中的用法
这些就是Google的常用语法,也是Google Hack的必用语法。虽然这只是Google语法中很小的部分,但是合理使用这些语法将产生意想不到的效果。
语法在Google Hack中的作用
了解了Google的基本语法后,我们来看一下黑客是如何使用这些语法进行Google Hack的,这些语法在入侵的过程中又会起到怎样的作用呢?
intitle
intitle语法通常被用来搜索网站的后台、特殊页面和文件,通过在Google中搜索“intitle:登录”、“intitle:管理”就可以找到很多网站的后台登录页面。此外,intitle语法还可以被用在搜索文件上,例如搜索“intitle:"indexof"etc/shadow”就可以找到Linux中因为配置不合理而泄露出来的用户密码文件。
用google搜索以下内容:
intitle:"indexof"etc
intitle:"Indexof".sh_history
intitle:"Indexof".bash_history
intitle:"indexof"passwd
intitle:"indexof"people.lst
intitle:"indexof"pwd.db
intitle:"indexof"etc/shadow
intitle:"indexof"spwd
intitle:"indexof"master.passwd
intitle:"indexof"htpasswd
"#FrontPage"inurl:service.pwd
inurl
Google Hack中,inurl发挥的作用的最大,主要可以分为以下两个方面:寻找网站后台登录地址,搜索特殊URL。
寻找网站后台登录地址:和intitle不同的是,inurl可以指定URL中的关键字,我们都知道网站的后台URL都是类似login.asp、admin.asp为结尾的,那么我们只要以“inurl:login.asp”、“inurl:admin.asp”为关键字进行搜索,同样可以找到很多网站的后台。此外,我们还可以搜索一下网站的数据库地址,以“inurl:data”、“inurl:db”为关键字进行搜索即可。
1.寻找网站的后台登录页面
搜索特殊URL:通过inurl语法搜索特殊URL,我们可以找到很多网站程序的漏洞,例如最早IIS中的Uncode目录遍历漏洞,我们可以构造“inurl:/winnt/system32/cmd exe?/cdir”这样的关键字进行搜索,不过目前要搜索到存在这种古董漏洞的网站是比较困难的。再比如前段日子很火的上传漏洞,我们使用““inurl:upload.asp”或“inurl:upload_soft.asp”即可找到很多上传页面,此时再用工具进行木马上传就可以完成入侵。
intext
intext的作用是搜索网页中的指定字符,这貌似在Google Hack中没有什么作用,不过在以“intext:to parent directory”为关键字进行搜索后,我们会很惊奇的发现,无数网站的目录暴露在我们眼前。我们可以在其中随意切换目录,浏览文件,就像拥有了一个简单的Webshell。形成这种现象的原因是由于IIS的配置疏忽。同样,中文IIS配置疏忽也可能出现类似的漏洞,我们用“intext:转到父目录”就可以找到很多有漏洞的中文网站。
2.随意浏览网站中的文件
Filetype
Filetype的作用是搜索指定文件。假如我们要搜索网站的数据库文件,那么可以以“filetype:mdb”为关键字进行搜索,很快就可以下载到不少网站的数据库文件。当然,Filetype语法的作用不仅于此,在和其他语法配合使用的时候更能显示出其强大作用。
Site
黑客使用Site,通常都是做入侵前的信息刺探。Site语法可以显示所有和目标网站有联系的页面,从中或多或少存在一些关于目标网站的资料,这对于黑客而言就是入侵的突破口,是关于目标网站的一份详尽的报告。
语法组合,威力加倍
虽然上文中介绍的这几个语法能各自完成入侵中的一些步骤,但是只使用一个语法进行入侵,其效率是很低下的。Google Hack的威力在于能将多个语法组合起来,这样就可以快速地找到我们需要的东西。下面我们来模拟黑客是如何使用Google语法组合来入侵一个网站的。
信息刺探
黑客想入侵一个网站,通常第一步都是对目标网站进行信息刺探。这时可以使用“Site:目标网站”来获取相关网页,从中提取有用的资料。
3.搜索相关页面
下载网站的数据库
搜索“Site:目标网站 Filetype:mdb”就可以寻找目标网站的数据库,其中的Site语法限定搜索范围,Filetype决定搜索目标。用这种方法有一个缺点,就是下载到数据库的成功率较低。在这里我们还可以采用另一种语法组合,前提是目标网站存在IIS配置缺陷,即可以随意浏览站点文件夹,我们搜索“Site:目标网站 intext:to parent directory”来确定其是否存在此漏洞。在确定漏洞存在后,可以使用“Site:目标网站 intext:to parent directoryintext.mdb”进行数据库的搜索。
4.找到网站数据库
登录后台管理
下载到数据库后,我们就可以从中找到网站的管理员帐户和密码,并登录网站的后台。对于网站后台的查找,可以使用语法组合“Site:目标网站 intitle:管理”或者“Site:目标网站 inurl:login.asp”进行搜索,当然我们可以在这里进行联想,以不同的字符进行搜索,这样就有很大的概率可以找到网站的后台管理地址。接下去黑客就可以在后台上传Webshll,进一步提升权限,在此不再阐述。
利用其他漏洞
如果下载数据库不成功,我们还可以尝试其他的入侵方法。例如寻找上传漏洞,搜索“Site:目标网站 inurl:upload.asp”。此外,我们还可以根据一些程序漏洞的特征,定制出Google Hack的语句。
Google Hack可以灵活地组合法语,合理的语法组合将使入侵显得易如反掌,再加入自己的搜索字符,Google完全可以成为你独一无二的黑客工具。
合理设置,防范Google Hack
5. 合理设置网站
Google Hack貌似无孔不入,实则无非是利用了我们配置网站时的疏忽。例如上文中搜索“intext:to parent directory”即可找到很多可以浏览目录文件的网站,这都是由于没有设置好网站权限所造成的。在IIS中,设置用户访问网站权限时有一个选项,叫做“目录浏览”,如果你不小心选中了该项,那么其结果就如上文所述,可以让黑客肆意浏览你网站中的文件。
这种漏洞的防范方法十分简单,在设置用户权限时不要选中“目录浏览”选项即可。
6.不要选中该项
编写robots.txt文件
robot.txt是专门针对搜索引擎机器人robot编写的一个纯文本文件。我们可以在这个文件中说明网站中不想被robot访问的部分,这样,我们网站的部分或全部内容就可以不被搜索引擎收录了,或者让搜索引擎只收录指定的内容。因此我们可以利用robots.txt让Google的机器人访问不了我们网站上的重要文件,Google Hack的威胁也就不存在了。
编写的robots.txt文件内容如下:
Useragent: *
Disallow: /data/
Disallow: /db/
其中“Disallow”参数后面的是禁止robot收录部分的路径,例如我们要让robot禁止收录网站目录下的“data”文件夹,只需要在Disallow参数后面加上“/data/”即可。如果想增加其他目录,只需按此格式继续添加。文件编写完成后将其上传到网站的根目录,就可以让网站远离Google Hack了
http://johnny.ihackstuff.com
allinurl:bbs data 百度inurl和allinurl 不一样 谷歌一样
查找所有bbs中的含有data的URL
filetype:mdb inurl:database
查找含有database的URL,且查找后缀名为mdb的文件
filetype:inc conn
查找含有后缀名为inc conn的文件
inurl:data filetype:mdb
查找含有data的URL,且查找后缀名为mdb的文件
intitle:"index of" data
查找网页标题中含有"index of" data的网页
intitle:"Index of" .sh_history
查找网页标题中含有"Index of" .sh_history的网页
intitle:"Index of" .bash_history
查找网页标题中含有"Index of" .bash_history的网页
intitle:"index of" passwd
查找网页标题中含有"index of" passwd的网页
intitle:"index of" people.lst
查找网页标题中含有"index of" people.lst的网页
intitle:"index of" pwd.db
查找网页标题中含有"index of" pwd.db的网页
"# FrontPage" inurl:service.pwd
查找含有service.pwd 的URL且网页中含有"# FrontPage"
site:xxxx.com intext:管理
查找某个网站中网页正文含有"管理"的页面
site:xxxx.com inurl:login
查找某个网站中URL地址中含有login的页面
site:xxxx.com intitle:管理
查找某个网站中含有"管理"的标题的页面
intitle,inurl,filetype,site的用法
面我们先来看看Google的部分语法:
命令与domain命令
命令与domain命令的含义在于检索网站在搜索引擎中反面链接页面,例如想搜索有什么网页链接到3suau.cn的页面,就可以输入domain:sina.cn或者 3suau.cn
其它铺助搜索命令:
利用*代替所有的字母,模糊检索那关键词或者是不能确定的关键词。 例如:键入"氝*"后的会查询到包含氝字的相关内容。 但 王景* 和 王景 一样结果
利用()可以把多个关键词划分为一组,并进行优先查询。 例如:键入"(seo网络)"来搜索包含"seo"与"网络"的信息.
利用and 表示前后两个关键词是"与"的逻辑关系。 例如输入关键词:游戏 and 在线 会找出将包含游戏和在线有关的网站。
利用or(|)表示前后两个词是"或"的逻辑关系。 例如输入关键词:前门 or 下一站,会找出将包含前门 或者下一站 的网页。
百度查询页关于网址中代码的含义:
如搜索关键词“知识”第二页,网址如下:http://www.baidu.com/s?lm=0&si=&rn=10&ie=gb2312&ct=0&wd=%D6%AA%CA%B6&pn=10&ver=0&cl=3
http://www.baidu.com/s?wd=??&pn=10&usm=1 当天搜索的
其中:
wd代表搜索的关键词
cl=3代表网页搜索
ie(Input Encoding)默认值是“gb2312” 如ie=gb2312 代表查询输入关键词的编码是简体中文
tn代表搜索框所属网站。比如 tn=sitehao123,就是 http://www.hao123.com/ 左上那个搜索框
pn代表显示搜索结果的页数
rn代表页面显示搜索结果的数量
bs Before Search 上一次搜索输入的关键词.
sr 不建议使用该参数.结合bs使用。一般查询sr=0或者为空值,但sr=1时,查询将结合bs的值一起作为查询的关键字.默认值为0,除0,1外其它值无效。
ct 语言限制。0所有语言,1简体中文网页,2繁体中文网页;其它不确定或者无效或。默认值为0.
rn 每页包含的搜索结果数目。默认值为10
pn 搜索结果的页码,从零开始计数。即pn = ${结果页码1}*rn。
lm 搜索结果的时间限制。以天为单位,例如搜索最近一个月的网页,lm=30.默认值为0,表示没有时间限制。
q5 搜索内容位置限制.0所有内容;1网页标题(相当于使用'title:'查询前缀);2url(相当于使用'inurl:'查询前缀);其它值等效于0.默认值为0
q6 搜索内容网站限制.例如q6=sohu.com,表示只搜索sohu.com的网页;相当于使用了'site:前缀'.默认值为空
dq 不建议使用该参数.查询内容来原的地区限制. 具体值有百度确定.默认值为空.试了一下,使用这个参数的效果很差.
myselectvalue
submit=
tb=on 贴吧?
f 未知。 默认值为空
cl 未知。 默认值为空
rs2 未知。
sc 未知。
Google Hacker
Google hacker (Google黑客)是利用GOOGLE提供的搜索功能查找黑客们想找到的信息.一般是查找网站后台,网管的个人信息,也可以用来查找某人在网络上的活动.
Google hacker 一般是做为黑客在入侵时的一个手段.在入侵过程中有时需要查找后台的登陆口就需要用到GOOGLE HACKER.有时猜解密码的时候google也是提供查找管理员资料的有效平台.
Google hacker的入侵方法(来自网络):
http://blog.dianfu.org/blogview.asp?logID=44&cateID=2
route print 查看本机设置网络
intext:
这个就是把网页中的正文内容中的某个字符做为搜索条件.例如在google里输入:intext:动网.将返回所有在网页正文部分包含"动网"的网页.allintext:使用方法和intext类似.
intitle:
和上面那个intext差不多,搜索网页标题中是否有我们所要找的字符.例如搜索:intitle:安全天使.将返回所有网页标题中包含"安全天使"的网页.同理allintitle:也同intitle类似.
cache: 现在只要谷歌能用,现在用不了
搜索google里关于某些内容的缓存,有时候也许能找到一些好东西哦.
define:
搜索某个词语的定义,搜索:define:hacker,将返回关于hacker的定义. 谷歌能用
filetype:
.bak、.mdb或.inc也是可以的,获得的信息也许会更丰富
info:
查找指定站点的一些基本信息.
inurl:
搜索我们指定的字符是否存在于URL中.例如输入:inurl:admin,将返回N个类似于这样的连接:http://www.xxx.com/xxx/admin,用来找管理员登陆的URL不错.allinurl也同inurl类似,可指定多个字符.
? allinurl:WORDS = 只显示在URL地址里有搜索结果的页面.
? inurl:WORD = 跟allinurl类似,但是只在URL中搜索第一个词.
把google可能忽略的字列如查询范围
把某个字忽略
~同意词
.单一的通配符
*通配符,可代表多个字母
""精确查询
下面开始说说实际应用(我个人还是比较习惯用google.com,以下内容均在google上搜索),对于一个居心叵测的攻击者来说,可能他最感兴趣的就是密码文件了.而google正因为其强大的搜索能力往往会把一些敏感信息透露给他们.用google搜索以下内容:
intitle:"indexof"etc
intitle:"Indexof".sh_history
intitle:"Indexof".bash_history
intitle:"indexof"passwd
intitle:"indexof"people.lst
intitle:"indexof"pwd.db
intitle:"indexof"etc/shadow
intitle:"indexof"spwd
intitle:"indexof"master.passwd
intitle:"indexof"htpasswd
"#FrontPage"inurl:service.pwd
有时候因为各种各样的原因一些重要的密码文件被毫无保护的暴露在网络上,如果被别有用心的人获得,那么危害是很大的.下面是我找到的一个FreeBSD系统的passwd文件(我已做过处理):
同样可以用google来搜索一些具有漏洞的程序,例如ZeroBoard前段时间发现个文件代码泄露漏洞,我们可以用google来找网上使用这套程序的站点:
intext:ZeroBoardfiletype:php
或者使用:
inurlutlogin.php?_zb_path=site:.jp
来寻找我们所需要的页面.phpmyadmin是一套功能强大的数据库操作软件,一些站点由于配置失误,导致我们可以不使用密码直接对phpmyadmin进行操作.我们可以用google搜索存在这样漏洞的程序URL:
intitle:phpmyadminintext:Createnewdatabase
还记得http://www.xxx.com/_vti_bin/..%5C..%5C....m32/cmd.exe?dir吗?用google找找,你也许还可以找到很多古董级的机器。同样我们可以用这个找找有其他cgi漏洞的页面。
allinurl:winntsystem32
图三
前面我们已经简单的说过可以用google来搜索数据库文件,用上一些语法来精确查找能够获得更多东西(access的数据库,mssql、mysql的连接文件等等).举个例子示例一下:
allinurl:bbsdata
filetype:mdbinurl:database
filetype:incconn
inurl:datafiletype:mdb
intitle:"indexof"data//在一些配置不正确的apachewin32的服务器上经常出现这种情况
和上面的原理一样,我们还可以用google来找后台,方法就略了,举一反三即可,毕竟我写这篇文章的目的是让大家了解googlehacking,而不是让你用google去破坏.安全是把双刃剑,关键在于你如何去运用.
利用google完全是可以对一个站点进行信息收集和渗透的,下面我们用google对特定站点进行一次测试。www.xxxx.com是全国著名大学之一,一次偶然的机会我决定对其站点进行一次测试(文中所涉及该学校的信息均已经过处理,请勿对号入座.
首先用google先看这个站点的一些基本情况(一些细节部分就略去了):
site:xxxx.com
从返回的信息中,找到几个该校的几个系院的域名:
http://a1.xxxx.com
http://a2.xxxx.com
http://a3.xxxx.com
http://a4.xxxx.com
顺便ping了一下,应该是在不同的服务器.(想想我们学校就那一台可怜的web服务器,大学就是有钱,汗一个)。学校一般都会有不少好的资料,先看看有什么好东西没:
site:xxxx.comfiletype:doc
得到N个不错的doc。先找找网站的管理后台地址:
site:xxxx.comintext:管理
site:xxxx.cominurl:login
site:xxxx.comintitle:管理
超过获得2个管理后台地址:
http://a2.xxxx.com/sys/admin_login.asp
http://a3.xxxx.com:88/_admin/login_in.asp
还算不错,看看服务器上跑的是什么程序:
site:a2.xxxx.comfiletype:asp
site:a2.xxxx.comfiletype:php
site:a2.xxxx.comfiletype:aspx
site:a3.xxxx.comfiletype:asp
site:.......
......
a2服务器用的应该是IIS,上面用的是asp的整站程序,还有一个php的论坛
a3服务器也是IIS,aspxasp。web程序都应该是自己开发的。有论坛那就看看能不能遇见什么公共的FTP帐号什么的:
site:a2.xxxx.comintext:ftp://*:*
没找到什么有价值的东西。再看看有没有上传一类的漏洞:
site:a2.xxxx.cominurl:file
site:a3.xxxx.cominurl:load
在a2上发现一个上传文件的页面:
http://a2.xxxx.com/sys/uploadfile.asp
用IE看了一下,没权限访问。试试注射,
site:a2.xxxx.comfiletype:asp
得到N个asp页面的地址,体力活就让软件做吧,这套程序明显没有对注射做什么防范,dbowner权限,虽然不高但已足矣,backashell我不太喜欢,而且看起来数据库的个头就不小,直接把web管理员的密码暴出来再说,MD5加密过。一般学校的站点的密码都比较有规律,通常都是域名电话一类的变形,用google搞定吧。
site:xxxx.com//得到N个二级域名
site:xxxx.comintext:*@xxxx.com//得到N个邮件地址,还有邮箱的主人的名字什么的
site:xxxx.comintext:电话//N个电话
把什么的信息做个字典吧,挂上慢慢跑。过了一段时间就跑出4个帐号,2个是学生会的,1个管理员,还有一个可能是老师的帐号。登陆上去:
name:网站管理员
pass:a2xxxx7619//说了吧,就是域名4个数字
要再怎么提权那就不属于本文讨论访问了,呵呵,到此为止。
关于googlehacking的防范
以前我们站的晓风?残月写过一篇躲避google的文章,原理就是通过在站点根目录下建立一个robots.txt以避免网络机器人获得一些敏感的信息,具体大家看原文章:
http://www.4ngel.net/article/26.htm
不过这种方法我个人不推荐,有点此地无银三百两的味道。简单一点的方法就是上google把自己站点的一些信息删除掉,访问这个URL:
http://www.google.com/remove.html
前几天看见又有人讨论用程序来欺骗robot的方法,我觉得可以试试,代码如下:
if(strstr($_SERVER['HTTP_USER_AGENT'],"Googlebot"))
{
header("HTTP/1.1301");
header("Location:http://www.google.com");
}
?>
后记
这段时间在国外的一些googlehack的研究站点看了看,其实也都差不多是一些基本语法的灵活运用,或者配合某个脚本漏洞,主要还是靠个人的灵活思维。国外对于googlehack方面的防范也并不是很多,所以大家还是点到为止,不要去搞破坏拉,呵呵。对于一些在win上跑
apache的网管们应该多注意一下这方面,一个intitle:indexof就差不多都出来了:)
A1Pass 的 google黑客技术基础
黑客反病毒论坛 http://bbs.hackav.com
google黑客常用关键字:
[to parent directory]
lastmodified
index of/
description
[转到父目录]
<目录>
<dir>
********************************************************************
例子:查复旦大学网站数据库
intext:[to parent directory] intext:mdb site:fudan.edu.cn
上面为关键字
*********************************************************************
google黑客语法:
intext:
这个就是把网页中的正文内容中的某个字符做为搜索条件.例如在google里输入:intext:动网.将返回所有在网页正文部分包含"动网"的网页.allintext:使用方法和intext类似.
Google语法简介
目前, Internet 上有两种搜索引擎. 一种是The Searchable Subject Index,索引式搜索. 这种搜索引擎只搜索站点的Title和Meta描述信息. 而无法搜索个人主页,Yahoo就是一个索引式搜索引擎. 第二种是The FullText Search Engine 完全内容搜索引擎.通过Spider(蜘蛛?!) 技术搜索数百万个甚至数十亿个页面.而且可以搜索页面的Title和内容. 所以能够比索引式搜索做更全面的搜索.Google就是一个完全内容搜索引擎.
基本连接符
Google 默认的连接符是 AND; 意味着如果你不加其他修饰符号直接搜索的话, Google就会对所有的关键字同时进行搜索.
snowblower Honda "Green Bay"
如果要从几个关键字中指定任中一个, 可以使用OR 连接符.
snowblower OR snowmobile OR "Green Bay"
如果要明确的指出2个或多个关键字使用OR连接, 可以用括号连接
snowblower (snowmobile OR "Green Bay")
同时你也可以使用电脑编程里管道符号 "|" 来表示OR的功能. 如果要在搜索结果中不包括某个关键字, 使用 (减号/短横线)
snowblower snowmobile "Green Bay"
Google将搜索包括snowblower 和 snowmobile ,不包括Green Bay.
简单搜索和手气不错
手气不错是Google一个很有特色的功能.你可以迅速得到Google认为的最符合你搜索结果的页面(就是最常搜索的结果).
比如你搜索washington post 手气不错会把你带到 http://www.washingtonpost.com/. 而president 则是 http://www.whitehouse.gov/ .
大小写
很多的搜索引擎是大小写敏感的,比如你搜索GEORGE WASHINGTON, 就无法搜到"George Washington","george washington". Google是不区分大小写的,搜索Three, three, THREE都可以得到相同的结果.
intext: 只搜索网页<body>部分中包含的文字(也就是忽略了标题,URL等的文字).
allintext: 不推荐使用.
intext:"yahoo.com"
intext:html
inanchor: 搜索连接中包含锚点标记. 锚点标记就是指连接的标记, 比如<a href="http://www.oreilly.com>;O'Reilly and Associates</a> 中的O'Reilly and Associates就是锚点标记.
inanchor:"tom peters"
site: 可以限制你搜索范围的域名.
site:loc.gov
site:thomas.loc.gov
site:edu
site:nc.us
link: 可以得到一个所有包含了某个指定URL的页面列表. 例如link:www.google.com 就可以得到所有连接到Google的页面.不用担心http:// 部分,事实上即使你输入了Google也会将其忽略:p
cache: 搜索Google索引里页面的副本, 即使他原本的URL已经不存在或者完全发生了变化,这部分很适合页面经常变动的搜索. 如果Google搜索不到你输入的关键字, 那么很有可能你所看到的是Google缓存着的最新页面.
cache:www.yahoo.com
aterange: 限制搜索特定时间段里的检索内容. 注意是加入Google检索的时间, 而不是页面创建的时间.但是这个时间在Google整理检索的时候不会发生变化. 比如一个网页是February 2制作的,加入Google检索的时候是April 11 使用daterange:检索的时候就在April 11的检索里被搜索到. Google在August 13 重建了索引,但仍然在April 11里被搜索到.
daterange:的格式是Julian,而不是Gregorian格式.
"George Bush" daterange:24523892452389
neurosurgery daterange:24523892452389
filetype: 搜索文件的后缀或者扩展名,注意filetype:htm和filetype:html会得到不同的结果. 你也可以搜索各种不同的页面脚本语言,比如ASP, PHP, CGI等等. Google对部分Microsoft的文档也做了索引, 比如PowerPoint (PPT), Excel (XLS), and Word (DOC)等等.
homeschooling filetype:pdf
"leading economic indicators" filetype:ppt
related: 搜索和指定页面相关的页面,比如你搜索related:google.com , 会得到很多搜索引擎,比如HotBot, Yahoo!, Northern Light等等.
related:www.yahoo.com
related:www.cnn.com
info: 提供一个和指定URL更多信息的页面列表,包括URL缓存的连接,包括URL的连接,和URL相关的连接,包含URL的页面. 注意, 这里搜索的结果取决于Google是否对该URL进行了索引. 如果没有的话, 搜索结果将会少很多.
info:www.oreilly.com
info:www.nytimes.com/technology
phonebook: 用于查询电话号码.
phonebook:John Doe CA
phonebook510) 5551212
site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“网站/域名”。
示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。.
搜索:“金庸 site:edu.cn”.
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第110项 。搜索用时0.31秒。.
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,.
搜索:“金庸 古龙 site:sina.com.cn”.
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第110项。搜索用时0.34秒。.
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。.
.
搜索:“inurl:midi 沧海一声笑”.
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第110项。搜索用时0.01秒。.
示例:查找微软网站上关于windows2000的安全课题资料。.
搜索:“inurl:security windows2000 site:microsoft.com”.
结果:已在microsoft.com内搜索有关 inurl:security windows2000的网页。共约有198项查询结果,这是第110项。搜索用时0.37秒。.
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对“cgibin/phf”中的“/”当成空格处理。.
“allinurl”语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。.
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。.
做优化的经常用到的,但网络上似乎都列举不全,这里我整理一下,方便大家使用。
? inanchor:WORD=只在链接文字内搜索指定的内容
? allinanchor:WORD=限制搜索的词语是网页中链接内包含的关键词(可使用多个关键词)
? intext:WORD=只在网页的正文内搜索指定的内容(忽略链接文字、标题和url)
? allintitle:WORD = 搜索网页标题.
? intitle:WORD = 跟allintitle类似,但是只在标题里搜索第一个词.
intitle:谁动了我的奶酪 周杰伦 有搜索结果
allintitle:谁动了我的奶酪 周杰伦 没有搜索结果
? "WORD"=精确匹配关键字词组.
? cache:URL = 将显示关于URL的Google缓存(07年10月前中国不可用).
? info:URL = 将显示一个包含了这些元素的页面:类似结果的链接,反向链接,还有包括了这个URL的页面.在搜索框里直接输入URL会起到同样的效果.
? filetype:SOMEFILETYPE = 指定文件类型.
? filetype:SOMEFILETYPE = 剔除指定文件类型.
? site:www.somesite.net “www.somesite.net” = 显示该站点有多少网页被google收录
? allintext: = 搜索文本,但不包括网页标题和链接
? allinlinks: = 搜索链接, 不包括文本和标题
? WordA OR WordB = 搜索包含两关键词之一的页面
? “Word” OR “Phrase” = 精确的要求搜索单词或者句子
? WordA WordB = 包含单词A但是不包含单词B
? WordA WordB = 都包含
? ~WORD = 寻找此单词和它的同义词
? ~WORD WORD = 只搜索同义词,不要原词
~huge huge =
Welcome Giant
Grocery stores and pharmacies serving Maryland, Virginia, Washington DC, and Delaware.
Advanced Search Employment Promotions Shop Online
www.giantfood.com/ Cached Similar
google技巧、google教程、google方法、google功能介绍、google使用指南、google推广、google使用大全
Google(www.Google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎,98年至今,Google已经获得30多项业界大奖。
搜索入门
第一次进入Google,它会根据你的操作系统,确定语言界面。需要提醒的是,Google是通过cookie来存储页面设定的,所以,如果你的系统禁用cookie,就无法对Google界面进行个人设定了。
Google的首页很清爽,LOGO下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,假定你是个搜索新手,想要了解一下搜索引擎的来龙去脉和搜索技巧。在搜索框内输入一个关键字“搜索引擎”, 选中“搜索中文(简体)网页”选项,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
初阶搜索
上例中,单个关键字“搜索引擎”,搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢?我们需要进一步缩小搜索范围和结果。
1,搜索结果要求包含两个及两个以上关键字
一般搜索引擎需要在多个关键字之间加上“ ”,而Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此望搜得的网页上有“搜索引擎”和“历史”两个关键字。
示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页
搜索:“搜索引擎 历史”
结果:已搜索有关搜索引擎 历史的中文(简体)网页。 共约有78,600项查询结果,这是第110项 。 搜索用时0.36秒。
用了两个关键字,查询结果已经从70多万项减少到7万多项。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的“历史”,并不是我们所需要的“搜索引擎的历史”。 怎么办呢?删除与搜索引擎不相关的“历史”。我们发现,这部分无用的资讯,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、“历史书籍”等。
2,搜索结果要求不包含某些特定信息
2.1,Google用减号“”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。
示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页
搜索:“搜索引擎 历史 文化 中国历史 世界历史”
结果:已搜索有关搜索引擎 历史 文化 中国历史 世界历史的中文(简体)网页。
示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有5,440项查询结果,这是第110项。搜索用时0.13秒。
注意:这里的“”和“”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 吸星大法”,搜索引擎将视为逻辑“与”操作,中间的“”被忽略。
2.2,GOOGLE无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。
示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有726项查询结果,这是第110项。搜索用时0.13秒。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。
“”和“”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。
1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。
2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部 佛教 金庸”。
注意:这里的“ ”和“”号,是英文字符,而不是中文字符的“”和“”。此外,操作符与作用的关键字之间,不能有空格。比如“搜索引擎 文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“”被忽略。
3,搜索结果至少包含多个关键字中的任意一个。
3.1,Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。
示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。
搜索:“搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo 文化”
结果:已搜索有关搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo 文化的中文(简体)网页。 共约有8,400项查询结果,这是第110项 。 搜索用时0.16秒。
我们看到,搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧。
注意:“与”操作必须用大写的“OR”,而不是小写的“or”。
在上面的例子中,我介绍了搜索引擎最基本的语法“与”“非”和“或”,这三种搜索语法Google分别用“ ”(空格)、“”和“OR”表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“ ”连起来),目标信息不能含有的关键字(用“”去掉),目标信息可能含有的关键字(用“OR”连起来)。
3.2,关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。
例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
搜索:“酒 贵 贱 之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡之,故而贱之;醋味厚之,所以贵之。...”
以上的关键字选择技巧可以谓之“特定词法”。
例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。
搜索:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。
以上的关键字选择技巧可以谓之“近义词法”。
例三:刘德华同志的胸围是多少。
分析:首先声明,这是某个MM要我做的搜索,我把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。
搜索:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高 阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。
以上的关键字选择技巧可以谓之“相关词法”。
3.3,其他常用搜索个案
例一:找人
分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。
例二:找软件
分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0 下载的中文(简体)网页。共约有6,670项查询结果,这是第110项。搜索用时0.22秒。
分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurl:download”
结果:已搜索有关winzip 8.0 inurl:download的中文(简体)网页。共约有358项查询结果,这是第110项。搜索用时0.44秒。
在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。
共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第110项。搜索用时0.30秒。
例三:找图片
除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。
分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索:“"britney spears" inurl:photo”
结果:已向英特网搜索"britney spears" inurl:photo. 共约有2,720项查询结果,这是第110项。搜索用时0.23秒。
分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索:“intitle:"britney spears" picture”
结果:已向英特网搜索intitle:"britney spears" picture. 共约有317项查询结果,这是第110项。搜索用时0.40秒。
分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“"britney spears" site:geocities.com”
结果:已在geocities.com内搜索有关"britney spears"的网页。共约有5,020项查询结果,这是第110项。搜索用时0.47秒。
例四:找MP3
分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在用这个办法找找老歌“say you say me”。
搜索:“"say you say me" inurl:mp3”
结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第110项。搜索用时0.17秒。
分析二:也可以通过网页标题,找到这类提供MP3的网页。
搜索:“"say you say me" intitle:mp3”
结果:已向英特网搜索"say you say me" intitle:mp3. 共约有178项查询结果,这是第110项。搜索用时0.73秒。
当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。
例五:找书
分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的“www.shuku.net”。于是可以用SITE语法很简单的找到某本书(如果该网站上有的话)。比如,“旧唐书 site:shuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。
分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德 风车 桑乔”迅速找到该书。
4,杂项语法
4.1,通配符问题
很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用""引起来。比如,“"以*治国"”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。
4.2,关键字的字母大小写
Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
4.3,搜索整个短语或者句子
Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。
示例:搜索关于第一次世界大战的英文信息。
搜索:“"world war I"”
结果:已向英特网搜索"world war i". 共约有937,000项查询结果,这是第110项 。 搜索用时0.06秒。
4.4,搜索引擎忽略的字符以及强制搜索
Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
示例:搜索关于www起源的一些历史资料。
搜索:“www的历史 internet”
结果:以下的字词因为使用过于频繁,没有被列入搜索范围: www 的. 已搜索有关www的历史 internet的中文(简体)网页。 共约有75,100项查询结果,这是第110项 。 搜索用时0.22秒。
我们看到,搜索“www的历史 internet”,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索“www的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“”号。
搜索:“www 的历史 internet”
结果:已搜索有关www 的历史 internet的中文(简体)网页。 共约有25,000项查询结果,这是第110项 。 搜索用时0.05秒。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”world war I””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。
搜索:“"www的历史" internet”
结果:已搜索有关"www的历史" internet的中文(简体)网页。 共约有7项查询结果,这是第16项 。 搜索用时0.26秒。
我们看到,这做外推吧索事实上把“www的历史”作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
5,Google的高级搜索查询语法
上面已经探讨了Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。
[intitle:]
“intitle:”帮助Google将搜索结果限制在那些标题中含有检索单词的页面。例如,“intitle:login password”(不包括引号)将返回标题中有单词“login”,页面中任何地方有单词“password”的那些页面的链接。
类似的,如果想在网页的标题中检索多个单词,可以用“allintitle”来代替“intitle”得到标题中包含所有这些单词的网页列表。例如使用 “intitle:login intitle:password”跟使用“allintitle:login password”是一样的。
[inurl:]
“inurl:” 将搜索结果限制在那些URL中含有检索单词的页面。例如:“inurl:passwd”(不包括引号)将返回URL中有“passwd”的那些页面的链接。
类似的,如果想在URL中检索多个单词,可以用“allinurl”来代替“inurl”得到URL中包含所有检索单词的网页列表。例如 “allinurl:etc/passwd”会查找URL中包含“etc”和“passwd”的页面。单词之间的“/”会被Google忽略掉。
[site:]
“site:” 将限制Google只在特定的站点或域中检索关键词。例如:“exploits site:hackingspirits.com”(不包括引号)将在所有“hackingspirits.com”域的链接页面中查找关键词 “exploits”。“site:”和“hackingspirits.com”之间不应有空格。
[filetype:]
“filetype:” 将限制Google只在internet上搜索特定扩展名的文件(就是doc,pdf或者ppt等等)。例如:“filetype:doc site:gov confidential”(不包括引号)将在所有政府域相关的网站中查找页面中或“.doc”文件中包含关键词“confidential”的扩展名为 “.doc”的文件。也就是结果会包含到所有政府网站中有confidential关键词的文档的链接。
[link:]
“link:” 将显示有到指定网页的链接的网页。例如:“link:www.securityfocus.com”会列出有到SecurityFocus的链接的网页。注意“link:”和网页url之间不应有空格。
[related:]
“related:” 将显示跟指定网页类似的网页。例如:“related:www.securityfocus.com”会列出跟SecurityFocus主页类似的网页。注意“related:”和网页url之间不应有空格。
[cache:]
“cache:” 将显示在Google cache中的网页。例如:“cache:www.hackingspirits.com”会列出Google cache中hackingspirits的主页。注意“cache:”和网页url之间不应有空格。
如果查询串中包含其它词,Google会在cache的文档中高亮显示这些词。例如: “cache:www.hackingspirits.com guest”会显示在cache中的网页内容,并高亮显示“guest”。
[intext:]
“intext:” 会在特定的网站中搜索单词。它忽略links或URL和页面标题。例如:“intext:exploits”(不包括引号)将只返回页面中含有搜索关键词“exploits”的网页链接。
[phonebook:]
“phonebook:” 会搜索美国街道地址和电话号码信息。例如:“phonebookisaCA”会列出所有名字中有“Lisa”并且住在“加利福尼亚(CA)”的人的名字。这对那些想要挖掘个人信息的黑客来说是再好不过的工具了。
6,其他重要功能
目录服务
如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录 “http://directory.google.com/”,中文目录是 “http://directory.google.com/Top/World/Chinese_Simplified/”。不过由于GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。
工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。
新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,所以我点击“Advaced Groups Search”进入高级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。
搜索结果翻译
曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。
不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面, http://www.google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。
PDF文档搜索
我对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurl:pdf ecommerce”
结果:已向英特网搜索inurl:pdf ecommerce. 共约有19,200项查询结果,这是第110项。搜索用时0.11秒。
下面是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucingecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字档 类似网页
可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索
GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是“images.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚扰。
不过,非常遗憾的是,图像搜索功能还不支持中文。
7.Google黑客揭秘
上面所说的Google查询语法能真正帮助人们来精确他们的搜索结果,得到他们真正想要的。
现在Google如此智能,黑客们当然不会介意利用它从互联网上来挖掘更多本来不应该让他们知道的保密和隐私的信息。现在我将要详细讨论这些技术,展示黑客们是如何利用Google从网上挖掘信息的,以及如何利用这些信息来入侵远程服务器。
利用“index of”与发来查找开放目录浏览的站点
一个开放了目录浏览的WEB服务器意味着任何人都可以像浏览通常的本地目录一样浏览它上面的目录。这里我将讨论如何利用“index of”语法来得到开放目录浏览的WEB服务器列表。这对黑客来说是一种非常简单的信息搜集方法。试想如果得到了本不应该在internet上可见的密码文件或其它敏感文件,结果会怎样。下面给出了一些能轻松得到敏感信息的例子。
Index of /admin
Index of /passwd
Index of /password
Index of /mail
"Index of /" passwd
"Index of /" password.txt
"Index of /" .htaccess
"Index of /secret"
"Index of /confidential"
"Index of /root"
"Index of /cgibin"
"Index of /creditcard"
"Index of /logs"
"Index of /config"
利用“inurl”或“allinurl”寻找缺陷站点或服务器
a.利用“allinurl:winnt/system32/”(不包括引号)会列出所有通过web可以访问限制目录如“system32”的服务器的链接。如果你很幸运你就可以访问到“system32”目录中的cmd.exe。一旦你能够访问“cmd.exe”,就可以执行它,瞧!服务器归你所有了。
b.利用“allinurl:wwwboard/passwd.txt”(不包括引号)会列出所有存在“WWWBoard 密码缺陷”的服务器的链接。想了解更多关于这个缺陷的知识,你可以参看下面的链接:http://www.securiteam.com/exploits/2BUQ4S0SAW.html
c.利用“inurl:bash_history”(不包括引号)会列出所有通过web可以访问“.bash_history”文件的服务器的链接。这是一个历史命令文件。这个文件包含了管理员执行的命令列表,有时还包含敏感信息例如管理员输入的密码。如果这个文件被泄漏并且包含加密的unix密码,就可以用“John The Ripper”来破解它。
d.利用“inurl:config.txt”(不包括引号)会列出所有通过web可以访问 “config.txt”文件的服务器的链接。这个文件包含敏感信息,包括管理员密码的哈希值和数据库认证凭证。例如:Ingenium Learning Management System是一个由Click2learn,Inc开发的基于Web的Windows应用程序。Ingenium Learning Management System5.1和6.1版本以非安全的方式在config.txt文件中存储了敏感信息。更多相关内容请参看:http://www.securiteam.com/securitynews/6M00H2K5PG.html
其它类似的组合其它语法的“inurl:”或“allinurl:”用法:
inurl:admin filetype:txt
inurl:admin filetype:db
inurl:admin filetype:cfg
inurl:mysql filetype:cfg
inurl:passwd filetype:txt
inurl:iisadmin
inurl:auth_user_file.txt
inurlrders.txt
inurl:"wwwroot/*."
inurl:adpassword.txt
inurl:webeditor.php
inurl:file_upload.php
inurl:gov filetype:xls "restricted"
index of ftp .mdb allinurl:/cgibin/ mailto
利用“intitle”或“allintitle”寻找缺陷站点或服务器
a. 利用[allintitle:“index of /root”](不包括括号)会列出所有通过web可以访问限制目录如“root”的服务器的链接。这个目录有时包含可通过简单Web查询得到的敏感信息。
b. 利用[allintitle:“index of /admin”](不包括括号)会列出所有开放如“admin”目录浏览权限的WEB站点列表链接。大多数Web应用程序通常使用“admin”来存储管理凭证。这个目录有时包含可通过简单Web查询得到的敏感信息。
其它类似的组合其它语法的“intitle:”或“allintitle:”用法:
intitle:"Index of" .sh_history
intitle:"Index of" .bash_history
intitle:"index of" passwd
intitle:"index of" people.lst
intitle:"index of" pwd.db
intitle:"index of" etc/shadow
intitle:"index of" spwd
intitle:"index of" master.passwd
intitle:"index of" htpasswd
intitle:"index of" members OR accounts
intitle:"index of" user_carts OR user_cart
allintitle: sensitive filetype:doc
allintitle: restricted filetype :mail
allintitle: restricted filetype:doc site:gov
其它搜索串
? 查找有跨站脚本漏洞(XSS)的站点:
allinurl:/script_s/cart32.exe
allinurl:/CuteNews/show_archives.php
allinurl:/phpinfo.php
? 查找有SQL注入漏洞的站点:
allinurl:/privmsg.php
搜索技巧整理
■前言
自从Internet浪潮扑面迩来,影响人们最深的莫过于学习方式的变迁。
以前人们的学习,就是要把自己变成"才高八斗,学富五车",在肚子里装好足够多的知识,在运用的时候就把所需的部分提取出来。但是到了信息爆炸式膨胀的今天,预先无目的的吞下海量信息的学习方式就有些不合时宜了。如同我们到了大型的图书城,往往有一种不知所措的感觉。我们需要变更旧有的学习方式,目的明确的去学习,即先知道要学什么,然后有目的的去寻找答案,这种方式看上去更加有效率。而搜索引擎就是这样一个帮我们在海量信息库中提取信息的工具。公欲善其事,必先利其器,我们需要对我们的工具有充分的了解,掌握一些搜索技巧。
■基本语法
1、搜索结果要求包含两个及两个以上关键字
一般搜索引擎需要在多个关键字之间加上“ ”,Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。
注意:如果输入的查询词很长,可能会拆分查询,给查询词加上双引号,可以禁止拆分。
2、搜索结果要求不包含某些特定信息
减号“”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。
注意,前一个关键词,和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。
3、搜索结果至少包含多个关键字中的任意一个
Google用大写的“OR表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。百度用“A | B ”表示逻辑“或”关系。
注意:“与”操作必须用大写的“OR”,而不是小写的“or”。
4、逻辑关系优先级使用圆括号,例如查找包含java和(JVM或者虚拟机):Java (JVM或者虚拟机)。
5、要搜索词组需要使用引号括起来,例如搜索Java虚拟机可以使用:"Java虚拟机"。
6、书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。 书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说。比如,查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具——手机,而加上书名号后,《手机》结果就都是关于电影方面的了。
■杂项语法1、通配符问题
Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用““引起来。一般情况下是不能使用通配符的,通配符只能使用在词组中,例如:"使用*模式"。
2、关键字的字母大小写
Google是不区分大小写的,搜索Java和搜索JAVA或者java是完全一样的。
3、搜索整个短语或者句子
Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。
4、搜索引擎忽略的字符以及强制搜索
Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“”号。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
■进阶搜索上面是Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。
1、把搜索范围限定在特定站点中——site
有时候,你如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。
例如,爆点网就可以这样查询:msn site:podon.cn
注意,“site:”后面跟的站点域名,不要带“http://”和“/”符号;另外,site:和站点名之间,不要带空格。
2、把搜索范围限定在网页标题中——intitle
网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式,是把查询内容中,特别关键的部分,用“intitle:”领起来。
例如,找酒井法子的写真,就可以这样查询:写真 intitle:酒井法子
注意,intitle:和后面的关键词之间,不要有空格。
3、把搜索范围限定在url链接中——inurl
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。网页url中的某些信息,常常有某种有价值的含义。于是,你如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。
例如,找关于PS的技巧,可以这样查询:PS inurl:jiqiao
上面这个查询中的“PS”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。
(上面三条在百度中适用)
“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。
搜索:“allinurl:“cgibin“ phf com”
结果:已向英特网搜索allinurl:“cgibin“ phf com. 共约有51项查询结果,这是第110项 。 搜索用时0.11秒。
4、在某一类文件中查找信息——filetype
“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus123文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索几个资产负债表的Office文档。
搜索:“资产负债表 filetype:doc OR filetype:xls OR filetype:ppt”
结果:已搜索有关资产负债表 filetype:doc OR filetype:xls OR filetype:ppt的中文(简体)网页。 共约有481项查询结果,这是第110项 。 搜索用时0.04秒。
注意,下载的Office文件可能含有宏病毒,谨慎操作。
示例:搜索一些关于搜索引擎知识和技巧方面的PDF文档
搜索:““search engine“ tips OR tutorial filetype:pdf”
结果:已向英特网搜索“search engine“ tips OR tutorial filetype:pdf. 共约有12600项查询结果,这是第110项 。 搜索用时0.22秒。
我们来看其中的一个结果:
[PDF]Search Engines Tips
文档类型: PDF/Adobe Acrobat HTML 版
... http://www.google.com/press/zeitgeist.html See what people are searching on at Google.com
* Search Engine Watch http://searchenginewatch.com/ Some free tips ...
www.allvertical.com/PromoKits/SearchEngineTips.pdf 类似网页
可以看到,Google用[PDF]来标记这是一个PDF的文档检索,另外,它还给出了该PDF文档的HTML版本,该HTML版保留了文档的文字内容和结构,但没有图片。
5、搜索的关键字包含在网页的“锚”(anchor)链点内
所谓“锚”,就是在同一个网页中快速切换链接点。与URL和TITLE类似,Google提供了两种对anchor的检索,“inanchor”和“allincnchor”。对此不作详述。
■其他罕用语法1、搜索所有链接到某个URL地址的网页
如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语法就能让你迅速达到这个目的。
示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接到www.newhua.com的网页 。 共约有920项查询结果,这是第110项 。 搜索用时0.12秒。
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被Google忽略。另外还要说明的是,link只列出Google索引链接很小一部分,而非全部,所以如果你用Google没有搜到链到你的主页的链接,也不必灰心丧气。 除了上述功能,link语法还有其它妙用。一般说来,做友情链接的网站都有相似地方。这样,你可以通过这些友情链接,找到一大批具有相似内容的网站。比如说,你是个天文爱好者,你发现某网站非常不错,那么,可以用link语法查一下与之做链接的网站,也许可以找到更多符合你兴趣的内容。
说明一下:1.本文的“普通的搜索引擎”相对于专业搜索引擎而言,索引范围不局限在某一主题下。百度、Google就是“普通的搜索引擎”,他们的网络蜘蛛沿着超链接一直爬,不管你是任何主题的内容;Teein是专业搜索引擎,他仅仅索引论坛里的内容。2.我一般用百度和Google,这篇文章也是根据使用这两家搜索引擎的经验写的。
一、从URL着手
URl,全称 Uniform Resource Locator,中文为“统一资源定位器”。直观的说,就是地址栏里的内容。大多数论坛和社区的URL都至少包括下面三个单词之一:bbs、forum和club。所以,可以利用inurl语法。
格式如下: “你想要查的内容 inurl:bbs”
“你想要查的内容 inurl:forum”
“你想要查的内容 inurl:club”
深入下去,还可以发现论坛的各个帖子的URL都有相似的格式。
对于Dvbbs,网页的URL一般是这种格式:
http://***/dispbbs.asp?boardID=*&ID=*&page=*
discuz! http://***/viewthread.php?tid=*&fpage=*
PHPWind http://***/read.php?tid=*
BBSxp http://***/ShowPost.asp?id=*
所以,还能够搜索采用同样论坛系统的多个论坛里的内容,不过意义不大。使用
inurl:dispbbs、 inurl:boardID、inurl:viewthread、inurl:read.php、inurl:ShowPost、inurl:tid= ……
二、关键词
这里的关键词定位非常明确:要尽可能,最好仅仅出现在论坛里。
1.“powered by”
不管采用Dvbbs还是Discuz!或者其他的程序,网页下面都有类似的文字“Powered by Discuz! 2.2F ”、“Powered By :Dvbbs Version 7.0.0”、“Powered by BBSxp 5.10 SQL”。“powered by”总是不可少,特异性也可以。所以,在搜索时,加上“powered by”可以大致限定在论坛内查找。
2.“文本方式查看主题”
这主要针对DVbbs而言。用百度搜索 site:bbs.sowang.com 可以看到具体帖子在百度都被保存为文本页面形式。
实例:搜索cnki的密码 “文本方式查看主题 cnkikw”
补充:
一、从URL着手
inurl:printpage 和 inurl:print
printpage的特异性很高,搜索结果大多都是论坛里的内容,但和“文本方式查看主题”有重叠之初。
二、关键词
“作者 发布时间” 或者 “作者 时间”
用关键词““文本方式查看主题”“搜索的页面,都包含”作者“和”发布时间“。特异性不是太好,但查全率较高。
其他有效的关键词我还没发现,欢迎大家交流。
二、查询某一类文件(往往带有同一扩展名)
“filetype:”这是个尚在测试阶段的GOOGLE特色查询,不过功能已经非常强大,可以做很多意想不到的事情哦。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“ecommerce filetype:pdf”
结果:已向英特网搜索ecommerce filetype:pdf. 共约有25,500项查询结果,这是第91100项。搜索用时0.44秒。
三、搜索的关键字包含在URL链接中
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有16项查询结果,这是第110项。搜索用时0.16秒。
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。例如,GOOGLE会把“cgibin/phf”中的“/”当成空格处理。
四、搜索所有链接到某个URL地址的网页
如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语法就能让你迅速达到这个目的。
示例:搜索所有含指向“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接到www.newhua.com的网页。共约有856项查询结果,这是第110项。搜索用时0.17秒。
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。
黑客技巧:Google hacking实现以及应用
【编者按】
google hacking其实并算不上什么新东西,在早几年我在一些国外站点上就看见过相关的介绍,但是由于当时并没有重视这种技术,认为最多就只是用来找找未改名的mdb或者别人留下的webshell什么的,并无太大实际用途.但是前段时间仔细啃了些资料才猛然发觉google hacking其实并非如此简单...
________________________________________
前言
google hacking其实并算不上什么新东西,在早几年我在一些国外站点上就看见过相关的介绍,但是由于当时并没有重视这种技术,认为最多就只是用来找找未改名的mdb或者别人留下的webshell什么的,并无太大实际用途.但是前段时间仔细啃了些资料才猛然发觉google hacking其实并非如此简单...
google hacking的简单实现
记得以前看见过一篇文章写的就是简单的通过用www.google.com来搜索dvbbs6.mdb或conn.inc来获得一些站点的敏感信息.其实使用google中的一些语法可以提供给我们更多的信息(当然也提供给那些习惯攻击的人更多他们所想要的.),下面就来介绍一些常用的语法.
intext:
这个就是把网页中的正文内容中的某个字符做为搜索条件.例如在google里输入:intext:动网.将返回所有在网页正文部分包含"动网"的网页.allintext:使用方法和intext类似.
intitle:
和上面那个intext差不多,搜索网页标题中是否有我们所要找的字符.例如搜索:intitle:安全天使.将返回所有网页标题中包含"安全天使"的网页.同理allintitle:也同intitle类似.
cache:
搜索google里关于某些内容的缓存,有时候也许能找到一些好东西哦.
define:
搜索某个词语的定义,搜索:define:hacker,将返回关于hacker的定义.
filetype:
这个我要重点推荐一下,无论是撒网式攻击还是我们后面要说的对特定目标进行信息收集都需要用到这个.搜索指定类型的文件.例如输入:filetype:doc.将返回所有以doc结尾的文件URL.当然如果你找.bak、.mdb或.inc也是可以的,获得的信息也许会更丰富
info:
查找指定站点的一些基本信息.
inurl:
搜索我们指定的字符是否存在于URL中.例如输入:inurl:admin,将返回N个类似于这样的连接:http://www.xxx.com/xxx/admin,用来找管理员登陆的URL不错.allinurl也同inurl类似,可指定多个字符.
link:
例如搜索:inurl:www.4ngel.net可以返回所有和www.4ngel.net做了链接的URL.
site:
这个也很有用,例如:site:www.4ngel.net.将返回所有和4ngel.net这个站有关的URL.
对了还有一些操作符也是很有用的:
把google可能忽略的字列如查询范围
把某个字忽略
~ 同意词
. 单一的通配符
* 通配符,可代表多个字母
"" 精确查询
搜索引擎使用技巧
________________________________________
GOOGLE对英文字符大小写不敏感
GOOGLE对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。
INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。
用“”和“”减少冗余信息
搜索:“Britney OR Beatles Madonna”
//“”、“”和“OR”的混合查询
搜索:“winzip 8.0 inurl:download”
//很多网站设有专门的下载目录,而且就命名为“download”
搜索:“winzip 8.0 sn”
//结果:已向英特网搜索winzip 8.0 的序列号sn,number”、“sn”、“序列号”等关键字
搜索:“intitle:藤原纪香 写真”
//示例:查找日本明星藤原纪香的照片集。
搜索:“"say you say me" inurl:mp3”
//在网页的地址中包含关键字
搜索:“"say you say me" intitle:mp3”
//网页标题
搜索:“旧唐书 site:shuku.net"
//文艺类的“www.shuku.net”
搜索:“"britney spears" site:geocities.com”
// “site”表示搜索结果局限于某个具体网站或者网站频道
搜索:“intitle:"李连杰" picture”
//提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合
搜索:“BIG BANG filetype:jpg site:edu”
//示例:查找美国教育网上的宇宙大爆炸jpg图片
搜索:“info:www.sina.com.cn”
//info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能
related:www.sina.com.cn/
//寻找和www.sina.com.cn结构内容方面相似的网页
搜索:“link:www.newhua.com”
//搜索所有含指向华军软件园“www.newhua.com”链接的网页。
"www.sina.com.cn"
//寻找网页包含有"www.sina.com.cn
搜索:“cache:www.yahoo.com.cn”
//这是 G o o g l e 内 http://cn.yahoo.com/ ;的页库快照。“cache”用来搜索GOOGLE服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
搜索:“intitle:藤原纪香 写真”
//对网页的标题栏进行查询
搜索:“inurl:midi 沧海一声笑”
//“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。就可以用INURL语法找到这些相关资源链接,用第二个关键词确定是否有某项具体资料。
搜索:“allinurl:"cgibin" phf com”
//“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。
搜索:“inurl:security windows2000 site:microsoft.com”
//示例:查找[M$]网站上关于windows2000的安全课题资料。
搜索:“ecommerce filetype:pdf”
//“filetype:”查询某一类文件(往往带有同一扩展名)
搜索:“"who am i"”
//如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“”号。注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
搜索:“"long long ago"”
//搜索整个句子.GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。
搜索:“link:www.newhua.com”
//搜索所有链接到某个URL地址的网页
搜索:“BIG BANG filetype:jpg site:edu”
//查找美国教育网上的宇宙大爆炸jpg图片
目前支持的语法包括“”,“”,“OR”,“site”和“filetype”。其中“filetype:”的后缀只能是几种限定的图片类似,如JPG,GIF等。
如果只想看到不包含内链的结果,可输入如下指令:
LINK:yourdomain.com URL:yourdomain.com (googel中好像不能用,有谁知如何用吗)
如欲查看一特定页面的链接广泛度,可在Altavista中输入如下指令:
LINK:yourdomain.com/filename.htm (google中可用)
Inktomi及其隶属搜索引擎如HotBot, AOL, iWon和MSN
linkdomain:yourdomain.com
(MSN通过linkdomain:yourdomain.com,好像比在google中用link:www.yourdomain.com还好用.iWon采用google的搜索引擎;HotBot用linkdomain:yourdomain.com也很好,不过区分linkdomain大小写.用linkwww.|)yourdomain.com不能通过.AOL为美国在线,搜索不怎么好用,页面速度还慢)
结果为链至该主域的所有站点,包括内链。
LINKDOMAIN:yourdomain.com DOMAIN:Yourdomain.com
结果为链至该主域的所有外部站点。
Fast/Alltheweb
LINK.ALL:yourdomain.com或LINK:yourdomain.com
结果为链至该主域的所有网页,包括内链。
一旦DMOZ收录了你的网站,那你就等着被Netscape Search,AOL Search,Google,Lycos,HotBot,DirectHit等一些大型搜索引擎和门户网站收录吧
自称是“Google终极搜索界面”,对网页更新日做出限定“daterange:”。
http://www.faganfinder.com/google.html
想看看世界各国网民都用Google搜索什么信息么?
http://www.google.com/press/zeitgeist.html
搜索引擎使用技巧
搜索之前先思考
学会使用两个关键词搜索
学会使用减号“-”
点击搜索结果前先思考
善于改正错误
常见错误1:错别字
常见错误2:关键词太常见
常见错误3:多义词
常见错误4:不会输关键词,想要什么输什么
常见错误5:在错误的地方搜索
google搜索真经
二,GOOGLE特色
支持多达132种语言,包括简体中文和繁体中文;
网站只提供搜索引擎功能,没有花里胡哨的累赘;
速度极快,据说有8000多台服务器,200多条T3级宽带;
的专利网页级别技术PageRank能够提供高命中率的搜索结果;
的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;
智能化的“手气不错”功能,提供可能最符合要求的网站;
的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。
三,基本搜索:,,OR
GOOGLE无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。
示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有726项查询结果,这是第110项。搜索用时0.13秒。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
GOOGLE用减号“”表示逻辑“非”操作。
示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有5,440项查询结果,这是第110项。搜索用时0.13秒。
注意:这里的“”和“”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 吸星大法”,搜索引擎将视为逻辑“与”操作,中间的“”被忽略。
GOOGLE用大写的“OR”表示逻辑“或”操作。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。
示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。
搜索:“britney OR beatles”
结果:已搜索有关britney OR beatles的中文(简体)网页。共约有14,600项查询结果,这是第110项。搜索用时0.08秒。
搜索:“布兰妮 OR 披头士”
结果:找不到和您的查询布兰妮 OR 披头士相符的网页。
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。
“”和“”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。
1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。
2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部 佛教 金庸”。
四,辅助搜索:通配符、大小写、句子、忽略字符以及强制搜索
GOOGLE不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。
GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。
示例:搜索包含“long, long ago”字串的页面。
搜索:“"long, long ago"”
结果:已向英特网搜索"long, long ago". 共约有28,300项查询结果,这是第110项。搜索用时0.28秒。
注意:和搜索英文关键字串不同的是,GOOGLE对中文字串的处理并不十分完善。比如,搜索“"啊,我的太阳"”,我们希望结果中含有这个句子,事实并非如此。查询的很多结果,“啊”、“我的”、“太阳”等词语是完全分开的,但又不是“啊 我的 太阳”这样的与查询。显然,GOOGLE对中文的支持尚有欠缺之处。
GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“”。
示例:搜索包含“Who am I ?”的网页。如果用“"who am i ?"”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。
搜索:“"who am i"”
结果:已向英特网搜索"who am i". 共约有362,000项查询结果,这是第110项。搜索用时0.30秒。
注意:英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
五,高级搜索:site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“网站/域名”。
示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。
搜索:“金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第110项 。搜索用时0.31秒。
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索:“金庸 古龙 site:sina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第110项。搜索用时0.34秒。
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。
“link”语法返回所有链接到某个URL地址的网页。
示例:搜索所有含指向华军软件园www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接www.newhua.com的网页。共约有695项查询结果,这是第110项。搜索用时0.23秒。
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。
inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第110项。搜索用时0.01秒。
示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurl:security windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关 inurl:security windows2000的网页。共约有198项查询结果,这是第110项。搜索用时0.37秒。
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对“cgibin/phf”中的“/”当成空格处理。
allinurl语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。
语法:“allinurl:"cgibin" phf com”
搜索:已向英特网搜索allinurl:"cgibin" phf com. 共约有40项查询结果,这是第110项。搜索用时0.06秒。
allintitle和intitle的用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。
示例:查找日本明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第110项。搜索用时0.03秒。
GOOGLE的罕用高级搜索语法:related,cache,info
related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:www.sina.com.cn/index.shtml”。
cache用来搜索GOOGLE服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。
示例:查找和新浪首页相关的一些资讯。
搜索:“infwww.sina.com.cn”
结果:有www.sina.com.cn的网页信息。
新浪首页
北京站 上海站 广东站. ... 游戏世界, |, 影音娱乐, |, Club缘, |, 男
人女人, |, 论坛聊天, |, 时尚潮流, |, 文教育儿, |, 车行天下, |,
软件下载. ...
Google 提供这个网址的信息:
查看Google网页快照www.sina.com.cn的存档
寻找www.sina.com.cn类似的网页
寻找网页有链接www.sina.com.cn
寻找网页包含有‘www.sina.com.cn‘
六,其他重要功能
目录服务
如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录“http://directory.google.com/”,中文目录是“http://directory.google.com/Top/World/Chinese_Simplified/”。不过由于GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。
工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。
新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,所以我点击“Advaced Groups Search”进入高级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。
搜索结果翻译
曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。
不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面,http://www.google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。
PDF文档搜索
我对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurl:pdf ecommerce”
结果:已向英特网搜索inurl:pdf ecommerce. 共约有19,200项查询结果,这是第110项。搜索用时0.11秒。
下面是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucingecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字档 类似网页
可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索
GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是“images.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚扰。
不过,非常遗憾的是,图像搜索功能还不支持中文。
七,搜索技巧杂谈
关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。
例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
搜索:“酒 贵 贱 之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡之,故而贱之;醋味厚之,所以贵之。...”
以上的关键字选择技巧可以谓之“特定词法”。
例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。
搜索:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。
以上的关键字选择技巧可以谓之“近义词法”。
例三:刘德华同志的胸围是多少。
分析:首先声明,这是某个MM要我做的搜索,我把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。
搜索:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高 阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。
以上的关键字选择技巧可以谓之“相关词法”。
[此贴子已经被作者于20050110 00:12:48编辑过]
《中国网服》人力资源管理系统?网才招聘平台
详情访问:www.ITcn.cn 联系人:Server
WelCome To ITcn.CN 请点击这里咨询
20050107 21:16
举报帖子
复制贴子
加为精华
单贴屏蔽
帖子评价
使用道具
soft163bbs
头衔:★荣誉贵宾★
等级:版主
威望:86
文章:3748
积分:5411
门派:无门无派
注册:20030426 第 2 楼
其他常用搜索个案
例一:找人
分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。
例二:找软件
分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0 下载的中文(简体)网页。共约有6,670项查询结果,这是第110项。搜索用时0.22秒。
分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurl:download”
结果:已搜索有关winzip 8.0 inurl:download的中文(简体)网页。共约有358项查询结果,这是第110项。搜索用时0.44秒。
在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。
共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第110项。搜索用时0.30秒。
例三:找图片
除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。
分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索:“"britney spears" inurl:photo”
结果:已向英特网搜索"britney spears" inurl:photo. 共约有2,720项查询结果,这是第110项。搜索用时0.23秒。
分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索:“intitle:"britney spears" picture”
结果:已向英特网搜索intitle:"britney spears" picture. 共约有317项查询结果,这是第110项。搜索用时0.40秒。
分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“"britney spears" site:geocities.com”
结果:已在geocities.com内搜索有关"britney spears"的网页。共约有5,020项查询结果,这是第110项。搜索用时0.47秒。
例四:找MP3
分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在用这个办法找找老歌“say you say me”。
搜索:“"say you say me" inurl:mp3”
结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第110项。搜索用时0.17秒。
分析二:也可以通过网页标题,找到这类提供MP3的网页。
搜索:“"say you say me" intitle:mp3”
结果:已向英特网搜索"say you say me" intitle:mp3. 共约有178项查询结果,这是第110项。搜索用时0.73秒。
当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。
例五:找书
分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的www.shuku.net”。于是可以用SITE语法很简单的找到某本书(如果该网站上有的话)。比如,“旧唐书 site:shuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。
分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德 风车 桑乔”迅速找到该书。
九,GOOGLE搜索FAQ
Q:如何全面的了解google.com?
A:查看网站相关页面“http://www.google.com/about.html”。
Q:如何切换google.com的初始语言界面?
A:点击搜索栏右边的“使用偏好”(Preferences),选择“界面语言”(Interface Language)中你望的语言,点击最下面的“设定使用偏好”(Save Preferences)按钮。需要提醒的是,GOOGLE用cookie记录这个偏好,所以如果你把浏览器的cookie功能关掉,就无法进行设定。
Q:如何设定每页搜索结果显示数量?
A:同上,进入使用偏好,在该页的“查看结果”(Number of Results)选择显示结果数,数目越大,显示结果需要的时间越长,默认是10项。
Q:搜索到的链接无法打开怎么办?
A:链接无法打开的原因很多,比如网站当机,或者ISP过滤等,可以点击GOOGLE的“网页快照”查看在GOOGLE服务器上的网页缓存。
Q:打开搜索结果的链接,可是该页面太大,很难找到一下子找到目的资料怎么办?
A:直接打开“网页快照”,GOOGLE会把关键词用不同颜色标记出来,很容易找到。
“Google搜索技巧”相关的更多内容
随着科学研究所依赖的各种信息资源的大规模网络化数字化,搜索引擎逐渐成为网络时代的最快捷方便的个性化信息服务系统。Google成为目前最受欢迎的搜索引擎 ,本文全面详细总结了利用Google进行专题信息检索的方法和技巧。
关键词 个性化 信息服务 信息检索 专题检索 搜索 Google 方法 技巧
目前,科学研究依赖的各种信息资源,包括文摘索引、刊论文、预印本、技术报告、学位论文、会议论文、以及部分重要工具书和专著等在内的主流科研信息资源已经逐步数字化,开始形成一个逐步完善的数字化信息资源空间,科研人员可以通过网络跨时空的进行专题信息检索,获取相关科研文献资源[1]。
基于网页内容的全文检索技术是搜索引擎的核心,搜索引擎也是全自动的软件服务。从目前来看,搜索引擎,尤其是Google已成为网络时代最快捷方便的个性化信息服务系统和服务方式。[2]
1 Google成为目前最受欢迎的搜索引擎
Google(www.Google.com)是当今一个优秀的搜索引擎,其功能强大、特点突出、技术先进和服务优良,它在业界评测中获得多项大奖,各大引擎竞相模仿其功能和特色。Google非中国本土公司,但它支持中文搜索,其中文搜索引擎是收集亚洲网站最多的搜索引擎之一,国内使用其独立搜索引擎的人数急剧增长。
目前,全世界访问量最大的4个网站中,3家采用了Google的搜索技术,80%的互联网搜索是通过Google或使用Google技术的网站完成的。目前Google每个月接待来自世界各地的超过2800万独立访问者,全球网民通过Google可以使用86种语言,搜索30多亿个网页及其网页快照,以及4亿多张图片,每个月Google被用户使用的时间为1500万小时左右。
据搜索引擎观察者网络杂志统计结果显示,至2002年10月份,网民使用Google的时间量每月达到1610万小时;相比之下,雅虎只吸引了660万小时,微软 MSN仅有520万小时[3]。
2 利用Google进行专题信息检索的方法和技巧
关键词检索功能是网络信息检索工具的基本检索功能,也是Google最基本的检索功能。关键词属于自然语言,灵活、不受词表控制,但简单的关键词检索方法,命中过多,查准率很低,Google为改善关键词检索性能,提供了按相关度排列结果、布尔逻辑检索,短语或者句子检索、加权检索和限制检索等增强措施。
利用Google进行专题信息检索,为提高查准率,须认真分析课题,选择恰当的关键词,掌握和运用Google检索语法规则,准确设计表达需求的检索式,反复调整检索策略,才能获得高质量的检索结果。
2.1 简单专题信息检索,最直截了当就是在搜索框内输入一个关键词,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。
如果检索人员或用户对查询的领域熟悉,只想寻找某些专题网站,首先考虑用目录检索,Google根据其专业的“网页级别”(PageRank)技术对目录中登录的网站进行了排序,可以使检索具更高效率,按所需主题确定沿某类层层查找网站,目录分类明确,网站专题信息集中,剔除了大量不相关的信息,不过对查找中文信息,Google的中文目录太少,只有非常普通简单的类目,可能很难满足要求。
2.2 熟练掌握Google的基本搜索:,,OR ,学会使用两个关键字进行复杂专题信息检索
检索复杂专题依靠单个关键词查准率很低,要提高查全检准率,需进行详细的主题分析,选择多个关键词构造检索式。要分清主要概念和次要概念,去掉被隐含了的概念,确定需要排除的某些概念和不宜选用的泛指概念,以便在制定检索策略时有所侧重,保证检索提问的确切表达。
正确选择关键词,各种类型的检索课题对检索的查全率和查准率有着不同的要求,可以增加上位概念或下位概念的方法来扩检[4],若查准率要求较高,应使用专指性较强的概念或增加限制概念来缩小检索范围,还可通过对字段进行限定的方式来保证查找的准确性。对于那些对查全率和查准率无特殊要求的用户来说,也要针对不同的课题,制定相应的检索策略。
对文献量较大或属于成熟学科的课题,应优先考虑查准率,从众多的相关文献中选取针对性较强的文献。对文献较少或新兴学科的课题,可适当放宽检索范围来保证查全率,以免遗漏重要的参考文献。
选择正确的关键词后,就要运用Google检索语法规则构建检索式。
Google无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。
示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页
搜索式:“易筋经 吸星大法”(注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。)
Google用减号“”表示逻辑“非”操作。
示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
搜索式:“易筋经 吸星大法”(注意:这里的“”和“”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 吸星大法”,搜索引擎将视为逻辑“与”操作,中间的“”被忽略。)
Google用大写的“OR”表示逻辑“或”操作( 注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询)。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。
示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。
搜索式:“britney OR beatles”
结果:已搜索有关britney OR beatles的中文(简体)网页。共约有14,600项查询结果,这是第110项。搜索用时0.08秒。
搜索式:“布兰妮 OR 披头士”
结果:找不到和您的查询布兰妮 OR 披头士相符的网页。
“”和“”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的信息。可以用两个方法减少无关结果。
( 1)、如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,如“天龙八部 阿修罗”。搜索结果就只有995项,可以直接找到全部八部。
( 2)、如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,如“天龙八部 佛教 金庸”。查询结果为1,010项,可以迅速找到需要的资料。
2.3 熟悉Google的辅助搜索方法:通配符、大小写、句子、忽略字符以及强制搜索 [5]
Google不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。
Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
Google的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。
示例:搜索包含“long, long ago”字串的页面。
搜索式:““long, long ago“”
结果:已向英特网搜索“long, long ago“. 共约有28,300项查询结果,这是第110项。搜索用时0.28秒。
注意:和搜索英文关键字串不同的是,Google对中文字串的处理并不十分完善。比如,搜索““啊,我的太阳“”,我们希望结果中含有这个句子,事实并非如此。查询的很多结果,“啊”、“我的”、“太阳”等词语是完全分开的,但又不是“啊 我的 太阳”这样的与查询。
Google对一些网络上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“”。
示例:搜索包含“Who am I ?”的网页。如果用““who am i ?“”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。
搜索式:““who am i“”(注意:英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行 )
结果:已向英特网搜索“who am i“. 共约有362,000项查询结果,这是第110项。搜索用时0.30秒。
2.4 了解Google的高级搜索语法:site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“网站/域名”。
示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。
搜索式:“金庸 site:edu.cn”
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索式:“金庸 古龙 site:sina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第110项。搜索用时0.34秒。
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。
使用“link”语法,将搜索到所有链接到某个URL地址的网页。
示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索式:“link:www.newhua.com”
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被Google忽略。
使用inurl语法,返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索式:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第110项。搜索用时0.01秒。
示例:查找微软网站上关于windows2000的安全课题资料。
搜索式:“inurl:security windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关 inurl:security windows2000的网页。共约有198项查询结果,这是第110项。搜索用时0.37秒。
注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。Google对“cgibin/phf”中的“/”当成空格处理。
使用allinurl语法,返回的网页链接中包含所有查询关键字,这个查询的对象只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。
搜索式:“allinurl:“cgibin“ phf com”
结果:已向英特网搜索allinurl:“cgibin“ phf com. 共约有40项查询结果,这是第110项。搜索用时0.06秒。
allintitle和intitle的用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。
示例:查找日本明星藤原纪香的照片集。
搜索式:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第110项。搜索用时0.03秒。
2.5 Google的罕用高级搜索语法:related,cache,info
related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:www.sina.com.cn/index.shtml”。
cache用来搜索Google服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。
示例:查找和新浪首页相关的一些资讯。
搜索式:“info:www.sina.com.cn”
3 Google的其他重要功能介绍
目录服务 如果不想搜索网页,而是想寻找某些专题网站,可以访问Google的分类目录http://directory.Google.com/”,中文目录是http://directory.Google.com/Top/World/Chinese_Simplified/”。不过由于Google的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少[6]。
工具条 为了方便搜索者,Google提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank、设置拦截弹出广告等。最方便的一点在于用户可以快捷的在Google主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。目前Google主页已提示下载安装Google工具条。
新闻组(USENET)搜索 新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,Google将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,Google还支持新闻组的WEB方式浏览和张贴功能。输入http://groups.Google.com/”后,便进入Google新闻组界面。可惜现在还没有中文界面。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,更推荐使用图形搜索界面,方便而且直观。
搜索结果翻译 曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,Google支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文。只能在英文状态Google下实现这个功能。进入Google的设置页面http://www.Google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤 网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,Google新设立了成人内容过滤功能,见Google的设置页面http://www.Google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的Google尚没有这个功能。
PDF文档搜索 Google提供对PDF文档内文的检索。目前Google检索的PDF文档大约有2500万左右。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索式:“inurldf ecommerce”
下面是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucingecommerce.pdf Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product Marketing Professonial (PMP) Implementation Manager, Web Engineering ... 一般文字档 类似网页
可以看到,Google在PDF档前加上了[PDF]的标记,而且,Google把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索 Google提供了Internet上图像文件的搜索功能!!地址是“images.Google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“刘德华”。 Google给出的搜索结果具有一个直观的缩略图,以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“移除栏框”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。Google还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚扰。
4 Google特殊应用搜索实例介绍:
关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。
4.1 搜索之前先思考 搜索引擎本事再大,也搜索不到网上没有的内容,而且,有些内容虽然存在网上,却因为各种原因,而成为漏网之鱼。所以在你使用搜索引擎搜索之前,应该先花几秒种想一下,我要找的东西网上可能有吗?网页上会含有哪些关键字?
例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索,关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
搜索:“酒贵贱之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡之,故而贱之;醋味厚之,所以贵之。...” 以上的关键字选择技巧可以谓之“特定词法”。
例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。
搜索式:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。 以上的关键字选择技巧可以谓之“近义词法”。
例三:刘德华的胸围是多少。
分析:非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。
搜索式:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高 阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。
以上的关键字选择技巧可以谓之“相关词法”。
4.2 其他常用搜索个案
例一:找人 分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。
例二:找软件 分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
如, 搜索式:“winzip 8.0 下载”
分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索式:“winzip 8.0 inurl:download”
在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。
共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是人,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索式:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第110项。搜索用时0.30秒。
例三:找图片 除了Google提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。
分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索式:““britney spears“ inurlhoto”
结果:已向英特网搜索“britney spears“ inurlhoto. 共约有2,720项查询结果,这是第110项。搜索用时0.23秒。
分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索式:“intitle:“britney spears“ picture”
结果:已向英特网搜索intitle:“britney spears“ picture. 共约有317项查询结果,这是第110项。搜索用时0.40秒。
分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索式:““britney spears“ site:geocities.com”
结果:已在geocities.com内搜索有关“britney spears“的网页。共约有5,020项查询结果,这是第110项。搜索用时0.47秒。
保存在数据库中的记录数据,分结构化的字符,日,数值,等有有限长度或固定格式的数据;还有全文数据如简历,论文等不定长,非固定格式保存的字符型数据。现有数据库系统,都以结构化数据为检索的主要目标,实现相对简单。
搜索引擎的主要特色和功能有:
基本搜索
基本搜索的使用简洁方便,只要在搜索框中输入关键词,按回车键或点击 “搜索”按钮,即可得到所查寻的信息。
什么是关键词
关键词,就是您输入搜索框中的文字,也就是您寻找的东西。
您可以寻找任何内容,所以关键词的内容可以是:人名、网站、新闻
关键词,可以是任何中文、英文、数字,或中文英文数字的混合体。
什么是全文检索
全文检索技术是用来弥补传统数据库字段检索的不足,它采用特别的索引技术,将欲查询的文件资料及资料源,经过索引产生器的浏览而建立成所谓的索引数据库。当我们在进行查询时,系统透过使用者输入的关键词,迅速的从索引数据库中找到我们要的资料,并且条列式的显示出来让我们点选。除此之外,系统搭配许多方便使用者的特性,使我们可以更精确、更快的找到合适的资料。
本站在综合与新闻搜索里提供了全文检索,可以在本站所有静态与动态页面里检索到符合用户查询关键词的结果
网页的相关检索
当您输入关键词进行网页检索时,除得到相应的检索结果之外,本站搜索引擎还为您提供了“相关 检索”功能,它能避免您重复输入检索词的麻烦,大大提高搜索效率,减少您找到有效信息所花 费的时间。
“相关检索”的具体含义是:当您搜索一个关键词时,在结果页面的上方导航栏其它类别的搜索链接里会出现相应的关键字,点击这些链接,您就可以得到相应关键词的搜索结果,无须进入其它类别再输入一遍关键词。
例如,当您在首页搜索“纸业”时,在结果页面的上方导航栏处其它类别的按钮链接里会出现相应的关键字链接,点击某个链接,比如点击“新闻”,就会立即出现 “新闻”的搜索结果页。
对网站进行多个关键词查询:
表示“并且”的关系:当同时匹配多个关键词时,使用空格、“”或“,”。
例如:查询关于铜版纸的信息,则输入关键词“铜版纸”或“铜版纸”。
http://www.paper.com.cn/search/help.php
http://www.paper.com.cn/search/search.php检索页面代码参考:
在全文或其他检索字段中检索关键词或由关键词构成的检索表达式。
方式1、单一数据库的全文检索
单一数据库的全文检索是在选定数据库的所有字段中进行检索,检索的关键词(字)只有一个。检索步骤: ① 选择数据库:进入相应栏目资源总览区直接点击选取数据库,本例选取科技文献栏目的《中国学位论文》数据库;
② 确定检索方式:在数据库检索提问表单的字段选择列表框中按下拉箭头选择“全文”;
③ 输入检索关键词(字):在数据库检索提问表单的关键字输入框中输入关键词(字),比如“电机”;
④ 执行检索:点击“执行”。针对本例,检索系统将在《中国学位论文》数据库中将全文中含有“电机”的记录取出。
方式2、单一数据库的字段级检索
字段级检索是在您所选定的数据库字段中进行检索,检索的关键词(字)只有一个。检索步骤: ① 选择数据库:进入相应栏目资源总览区直接点击选取数据库,本例选取科技文献栏目的《中国学位论文》数据库;
② 确定检索方式:在数据库检索提问表单的字段选择列表框中按下拉箭头选择除“全文”之外的选项,本例选取“题目”;
③ 输入检索关键词(字):在查询关键字输入框中输入第一个检索关键词(字),比如“电机”;
④ 执行检索:点击“执行”。针对本例,检索系统将在《中国学位论文》数据库中将题目中含有“电机”的记录取出。
方式3、单一数据库的高级检索(逻辑检索)
高级检索是在您所选定的数据库用两个关键词进行的检索。检索步骤: ① 选择数据库:进入相应栏目资源总览区直接点击选取数据库,本例选取科技文献栏目的《中国学位论文》数据库;
② 确定第一个关键字的检索方式:在数据库检索提问表单的第一个字段选择列表框中按下拉箭头选择;比如选择“标题”;
③ 输入第一个检索关键词(字):在数据库检索提问表单的第一个查询关键字框中输入关键词(字),比如“电机”;
④ 确定词间关系:在逻辑运算选择列表框中选择“与”、“或”、“非”,比如选择“与”;
⑤ 确定第二个关键字的检索方式:在第二个检索字段列表框中做出选择,比如选择“全文”;
⑥ 输入第二个检索关键词(字):在数据库检索提问表单的第二个查询关键字框中输入关键词(字),比如“汽车”;
⑦ 执行检索:点击“执行”。针对本例,检索系统将在《中国学位论文》数据库中将标题含有“电机”并且全文中含有“汽车”的记录取出。
http://202.114.65.51:85/kjxx/help.html#method3万方数据科技信息子系统检索帮助
[{网络资源}]GOOGLE搜索秘籍全攻略 |周付安 发表于 2005324 10:29:00
[{网络资源}]GOOGLE搜索秘籍全攻略
蚊子 发表于 2005224 4:31:00
一,GOOGLE简介
Google(www.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得30多项业界大奖。
二,GOOGLE特色
GOOGLE支持多达132种语言,包括简体中文和繁体中文;
GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;
GOOGLE速度极快,据说有8000多台服务器,200多条T3级宽带;
GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;
GOOGLE的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;
GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;
GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。
三,基本搜索:,,OR
GOOGLE无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。
示例:搜索所有包含关键词“易筋经”和“吸星**”的中文网页
搜索:“易筋经 吸星**”
结果:已搜索有关易筋经 吸星**的中文(简体)网页。共约有726项查询结果,这是第110项。搜索用时0.13秒。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
GOOGLE用减号“”表示逻辑“非”操作。
示例:搜索所有包含“易筋经”而不含“吸星**”的中文网页
搜索:“易筋经 吸星**”
结果:已搜索有关易筋经 吸星**的中文(简体)网页。共约有5,440项查询结果,这是第110项。搜索用时0.13秒。
注意:这里的“”和“”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 吸星**”,搜索引擎将视为逻辑“与”操作,中间的“”被忽略。
GOOGLE用大写的“OR”表示逻辑“或”操作。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。
示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。
搜索:“britney OR beatles”
结果:已搜索有关britney OR beatles的中文(简体)网页。共约有14,600项查询结果,这是第110项。搜索用时0.08秒。
搜索:“布兰妮 OR 披头士”
结果:找不到和您的查询布兰妮 OR 披头士相符的网页。
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。
“”和“”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。
1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。
2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部 佛教 金庸”。
四,辅助搜索:通配符、大小写、句子、忽略字符以及强制搜索
GOOGLE不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。
GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。
示例:搜索包含“long, long ago”字串的页面。
搜索:“"long, long ago"”
结果:已向英特网搜索"long, long ago". 共约有28,300项查询结果,这是第110项。搜索用时0.28秒。
注意:和搜索英文关键字串不同的是,GOOGLE对中文字串的处理并不十分完善。比如,搜索“"啊,我的太阳"”,我们希望结果中含有这个句子,事实并非如此。查询的很多结果,“啊”、“我的”、“太阳”等词语是完全分开的,但又不是“啊 我的 太阳”这样的与查询。显然,GOOGLE对中文的支持尚有欠缺之处。
GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“”。
示例:搜索包含“Who am I ?”的网页。如果用“"who am i ?"”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。
搜索:“"who am i"”
结果:已向英特网搜索"who am i". 共约有362,000项查询结果,这是第110项。搜索用时0.30秒。
注意:英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
五,高级搜索:site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“网站/域名”。
示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。
搜索:“金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第110项 。搜索用时0.31秒。
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索:“金庸 古龙 siteina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第110项。搜索用时0.34秒。
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。
“link”语法返回所有链接到某个URL地址的网页。
示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接到www.newhua.com的网页。共约有695项查询结果,这是第110项。搜索用时0.23秒。
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。
inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第110项。搜索用时0.01秒。
示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurlecurity windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关 inurlecurity windows2000的网页。共约有198项查询结果,这是第110项。搜索用时0.37秒。
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对“cgibin/phf”中的“/”当成空格处理。
allinurl语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。
语法:“allinurl:"cgibin" phf com”
搜索:已向英特网搜索allinurl:"cgibin" phf com. 共约有40项查询结果,这是第110项。搜索用时0.06秒。
allintitle和intitle的用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。
示例:查找日本明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第110项。搜索用时0.03秒。
GOOGLE的罕用高级搜索语法:related,cache,info
related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:www.sina.com.cn/index.shtml”。
cache用来搜索GOOGLE服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。
示例:查找和新浪首页相关的一些资讯。
搜索:“infwww.sina.com.cn”
结果:有关www.sina.com.cn的网页信息。
新浪首页
北京站 上海站 广东站. ... 游戏世界, │, 影音娱乐, │, Club缘, │, 男
人女人, │, 论坛聊天, │, 时尚潮流, │, 文教育儿, │, 车行天下, │,
软件下载. ...
Google 提供这个网址的信息:
查看Google网页快照里www.sina.com.cn的存档
寻找和www.sina.com.cn类似的网页
寻找网页有链接到www.sina.com.cn
寻找网页包含有`www.sina.com.cn
六,其他重要功能
目录服务
如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录“http://directory.google.com/”,中文目录是“http://directory.google.com/Top/World/Chinese_Simplified/”。不过由于GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。
工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。
新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,所以我点击“Advaced Groups Search”进入高级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。
搜索结果翻译
曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。
不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面,http://www.google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。
PDF文档搜索
我对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurldf ecommerce”
结果:已向英特网搜索inurldf ecommerce. 共约有19,200项查询结果,这是第110项。搜索用时0.11秒。
黑客安全技术文章大全http://www.hackbase.com
下面是某项搜索结果:
[PDF]www.usi.net/pdf/outsoucingecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字档 类似网页
可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索
GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是“images.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚扰。
不过,非常遗憾的是,图像搜索功能还不支持中文。
七,搜索技巧杂谈
关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。
例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵*的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
搜索:“酒 贵 * 之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价*之,醋价贵之。因何*之?为甚贵之?真所分之,在其味之。酒昧淡之,故而*之;醋味厚之,所以贵之。...”
以上的关键字选择技巧可以谓之“特定词法”。
例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。
搜索:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。
以上的关键字选择技巧可以谓之“近义词法”。
例三:刘德华同志的胸围是多少。
分析:首先声明,这是某个MM要我做的搜索,我把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。
搜索:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高 阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。
以上的关键字选择技巧可以谓之“相关词法”。
其他常用搜索个案
例一:找人
分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。
例二:找软件
分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0 下载的中文(简体)网页。共约有6,670项查询结果,这是第110项。搜索用时0.22秒。
分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurlownload”
结果:已搜索有关winzip 8.0 inurlownload的中文(简体)网页。共约有358项查询结果,这是第110项。搜索用时0.44秒。
在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。
共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第110项。搜索用时0.30秒。
例三:找图片
除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。
分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索:“"britney spears" inurlhoto”
结果:已向英特网搜索"britney spears" inurlhoto. 共约有2,720项查询结果,这是第110项。搜索用时0.23秒。
分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索:“intitle:"britney spears" picture”
结果:已向英特网搜索intitle:"britney spears" picture. 共约有317项查询结果,这是第110项。搜索用时0.40秒。
分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“"britney spears" site:geocities.com”
结果:已在geocities.com内搜索有关"britney spears"的网页。共约有5,020项查询结果,这是第110项。搜索用时0.47秒。
例四:找MP3
分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在用这个办法找找老歌“say you say me”。
搜索:“"say you say me" inurl:mp3”
结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第110项。搜索用时0.17秒。
分析二:也可以通过网页标题,找到这类提供MP3的网页。
搜索:“"say you say me" intitle:mp3”
结果:已向英特网搜索"say you say me" intitle:mp3. 共约有178项查询结果,这是第110项。搜索用时0.73秒。
当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。
例五:找书
分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的“www.shuku.net”。于是可以用SITE语法很简单的找到某本书(如果该网站上有的话)。比如,“旧唐书 sitehuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。
分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德 风车 桑乔”迅速找到该书。
九,GOOGLE搜索FAQ
Q:如何全面的了解google.com?
A:查看网站相关页面“http://www.google.com/about.html”。
Q:如何切换google.com的初始语言界面?
A:点击搜索栏右边的“使用偏好”(Preferences),选择“界面语言”(Interface Language)中你望的语言,点击最下面的“设定使用偏好”(Save Preferences)按钮。需要提醒的是,GOOGLE用cookie记录这个偏好,所以如果你把浏览器的cookie功能关掉,就无法进行设定。
Q:如何设定每页搜索结果显示数量?
A:同上,进入使用偏好,在该页的“查看结果”(Number of Results)选择显示结果数,数目越大,显示结果需要的时间越长,默认是10项。
Q:搜索到的链接无法打开怎么办?
A:链接无法打开的原因很多,比如网站当机,或者ISP过滤等,可以点击GOOGLE的“网页快照”查看在GOOGLE服务器上的网页缓存。
Q:打开搜索结果的链接,可是该页面太大,很难找到一下子找到目的资料怎么办?
A:直接打开“网页快照”,GOOGLE会把关键词用不同颜色标记出来,很容易找到.
ROEBIN写这篇文章的目的就在于让一些盲目使用Google的朋友能够减少失误率,提高搜索成功率...
FAQ
1.问题:如果我想精确搜索范围,Google中有那些操作符可以利用,使用这些符号有什么作用?
实际上在使用Google搜索的时候,除了关键字之外,还有很多操作符我们可以利用,这些符号对于精确搜索范围起到相当重要的作用。
请注意:1、以下提到的操作符均应该使用英文、半角。2、因为“空格”也是其中一个操作符,因此操作符“”与关键字之间,不能有空格。3、对于操作符为英文字母的必须大写。
这四个操作符是:空格;OR;;双引号
前三个操作符就是我们常见的“与”“或”“非”。
如我们要搜索如下网页:要求必须含有“搜索引擎”和“历史”,但是没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Yahoo”。
搜索条件的写法:搜索引擎 历史 Archie OR 蜘蛛 OR yahoo文化
关于双引号:Google是基于单词搜索的,因此如果你想用一个短语做关键字,必须加双引号,否则其中的“空格”会被当作“与”操作符。
如我们要搜索关于第一次世界大战的英文信息。
搜索条件的写法:"World war I"
2.问题:Google中有通配符可以利用吗?
Google目前可利用的通配符只有“*”。比如,“以*治国”,表示搜索第一个为“以”,末两个为“治国”的短语,中间的“*”可以为任何字符甚至短语。
3.问题:为什么我输入:www的历史 internet 的搜索条件,在实际的结果中“www”和“的”两个关键字都被忽略了,我如何能让这两个关键字有效?
这里实际上涉及了Google分词。当我们搜索“www的历史”的时候,Google实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索。所以尽管我们输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。并且Google对一些网络上出现频率极高的英文单词,如“i”、“com”、“www”等会做忽略处理。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上英文的“”号。
如搜索条件更改为:www 的历史 internet
这样这两个关键字就起作用了。
4.问题:请问我是否可以从我指定的网站或者网站频道上搜索我想要的内容?
可以通过使用site语法来实现。
如我们要搜索:在著名IT门户网站ZDNET和CNET网站上搜索一下关于搜索引擎技巧方面的资讯。
搜索条件写法:"search engine" tips site:www.zdnet.com OR site:www.cnet.com
注意:site后的冒号为英文字符,而且冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字(这一点同样适合其他语法格式)。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。
5.问题:如果我只想搜索特定的二进制文档,可以实现吗?
可以通过使用filetype语法来实现。
目前Google支持的格式有:.xls;.ppt;.doc;.rtf;.pdf;.swf等
如我们要搜索:资产负债表的Office文档。
搜索条件写法:资产负债表 filetype:doc OR filetype:xls OR filetype: ppt
6.问题:我是否可以指定URL链接中的关键字进行搜索?
可以通过使用inurl;allinurl语法来实现。
inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。因为有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、 “GALLARY”等。于是我们就可以用inurl语法找到这些相关资源链接,然后用第二个关键词确定是否有某项具体资料,可以达到精确定位的作用。
如我们要:查找midi格式的“沧海一声笑”。
搜索条件写法为:inurl:midi “沧海一声笑”
allinurl语法返回的网页的链接中包含所有的关键字,这个查询的关键字只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序,表现在链接中就是“域名/cgibin/phf”。
搜索条件写法:allinurl:”cgibin” phf com
注意:inurl:后面不能有空格,Google也不对URL符号如“/”进行搜索。例如,Google会把“cgibin/phf”中的“/”当成空格处理。
7.问题:我是否可以指定网页标题中的关键字进行搜索?
可以通过使用intitle;allintitle语法来实现,用法类似于inurl和allinurl。只是后者是对URL进行查询,而前者是对网页的标题栏进行查询。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常可以找到相当准确的专题页面。
示例:查找刘翔的照片集。
搜索条件写法:“intitle:刘翔 "照片集"
8.问题:我搜索到了一篇德文的文章,我想了解一下,但是看不懂怎么办?
看看是否有“翻译此页的按钮”,再看结果,应该大致能看明白。目前Google只支持拉丁语、法语、西班牙语、德语和葡萄牙文的翻译。
9.问题:Google查询结果中的“网页快照”不能使用了,怎么办?
可以通过使用cache 语法来实现。 见此文
cache用来搜索Google服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
搜索引擎语法作为互联网重要的一个推广、搜索、检测手段。必须要牢牢把握。
作用:
1.方便寻找客户
2.方便工作进行
3.提高经济效益
搜索引擎命令大全及用法:
blog:百度的blog命令,它可以查询你发表在百度空间的文章被百度收录的数量。但这条命令只对百度博客搜索起作用。用法:blog:hi.baidu.com/要查询空间名
Domain:用domain命令可以查找跟某一网站相关的信息。例提交“domain:url”就可以查询到在网站内容里面包含了url信息的网站。
Filetype:限制查找文件的格式类型。目前可以查找的文件类型有.pdf/.doc/.xls/.ppt/.rtf 用法:搜索关键字 filetype:ppt
inurl:限定查询匹配只搜索URL链接。用法:inurl:搜索关键字。注,在用inurl用法的时候,尽量使用英文,因为中文会被进行URL编码。
link:搜索与被查询网站做了链接的网站。用法:link:[url=http:// www.3suau.cn] 3suau.cn [/url],这样就可以看到谁跟[url=http:// www.3suau.cn] 3suau.cn [/url]做了交换链接
Site:限制查询在某一个特定站点内或网域内进行。用法:搜索关键字 site:3suau.cn 或是在网域内搜索如 搜索关键字 site:3suau.cn www可以省略
site:www.car8.net 酷熊
site:www.car8.net intitle:酷熊
site:www.car8.net intext:酷熊
找关于photoshop的使用技巧,可以这样查询:photoshop inurl:jiqiao
domain命令:
百度:查网页内容中包含某关键词的命令。如“domain:www.139.gov.cn”搜索结果是包含关键字词组(www.139.gov.cn )的所有网页。同理,domain:seo 指的是包含seo的所有网页,与直接搜索SEO相似。可以用来查找有多少个网页内容中包含你的网址,一般来说包含你网址的网页都属于站点的反向链接,所以这个命令一定程度上被误使用为查询网站的反向链接。
Google:domain 并不代表一个指令。只是一个普通的关键字。
Yahoo:与 site 一样,都是查找域名下的所有收录网页。
link命令:
百度:link 并不代表一个指令,只是一个普通的关键字。link:www.139.gov.cn 搜索结果是包含这样一个关键字(www.139.gov.cn)词组的所有网页,与其他普通关键词的搜索一样。并不是查找反向链接。
Google:查找的是反向链接,但只包含网站所有反向链接的少部分。Google网站管理员工具可以查网站的所有反向链接。
Yahoo:查找的是反向链接,但需要在域名前加 "http://",如:link:http://www.139.gov.cn 注意:域名加与不加"www"结果是不一样的。
每当我们用站长工具查询网站收录情况,尤其是反向链接的时候,都会发现百度是domain:yahoo用的是link:很多人都在讨论这个问题的时候,从来就没有想过为什么百度要用domain,而不用link。而且百度通过domain出来的数据仔细看一下,根本就不完全是返链,还包括其它好多的文字链接。比如我域名通过domain之后,
比如,google在webmaster central中宣称,通过link:命令查询的反链数量是不准确的,而在使用site:语句查询网站在百度的索引数量时,百度也提示:“找到的相关网页数是估算值,不代表真实结果数,仅供参考。”
我们还有必要继续使用link:命名吗?
外链可以用 google 的webmaster tools中看到的外链数量简直就不是同一个数量级别的。
平时我用google的时候喜欢用inurl这个功能来查找特定网站的内容,现在把这个小技巧贡献出来,和大家分享。例如:我想查一下某一个学校(北京大学)关于蛋白质的内容,键入“inurl:pku.edu.cn 蛋白质”,然后出来的检索结果就会限制在北京大学的网站之中,用这种方法查关于某一个人的情况非常实用,比如,你知道某一个人是某一单位的,但是进去网站去找非常费时,不如使用这个方法。如果大家有兴趣,不妨试一下。
INURL的用法和解释INURL有什么用
1)、inurl:xxx 作用是命令搜索引擎查找url中包含xxx的网页。 例子:inurl:news
2)、“inurl:xxx 关键词”或“关键词 inurl:xxx” 两者意义一样:要搜索引擎查找满足下面两个要求的网页 1. url中包括xxx 2.网页中含有“关键词” 例子:cnkikw inurl:viewthread.php ,网页正文包含“cnkikw”,url中有“viewthread.php” 可以直接加文件后缀
二、应用 任何网站的url都不是随意设置的,都经过一番过虑,有一定用意的。很多地方,url链接和网页的内容有着密切的相关。所以,可以利用这种相关性,来缩小范围,快速准确地找到所需信息。
1)查找专题资料:提供类似资源的网页url常有相同的字符。 在《Google搜索从入门到精通v4.0》这篇经典文章中,是这样解释的:“有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。”上网的时候,注意观察网页的url,总结出那些资源常用什么url,搜索时,用上inurl,能缩小搜索范围,迅速地找到结果。一般来说,
提供书籍下载的,url一般包括book、ebook、shu、shuji、 论坛的url中常含有bbs、forum 音乐方面 music、yinyue、mp3、midi 提供软件用 soft、software、ruanjian 新闻的用news、xinwen 体育的是sports、tiyu 下载photoshop cs ,加上inurl:soft,使用“photoshop cs 下载 inurl:soft”搜索,可以事结果更加准确。 想看看别人对三星E638 的评价,用“E638 inurl:bbs”搜索,就能看到论坛里的说法。 伊拉克大选怎么样了,用“伊拉克大选 inurl:news”,查找今天星六了,《南方周末》应该可以搜到了。用“inurl:20050407 zm ”查找。马上出来了。(zm是周末(ZhouMe)的缩写,20050407是日)
2)搜索具体信息:从英文名 拼音、缩写、首字母组合等着手 查找书籍:想下载神雕侠侣的电子书,inurl:shendiaoxialv , 结果233篇 ,很多无用的,就加上book, 用 inurl:shendiaoxialv book ,第一项是“《神雕侠侣》 金庸北极星书库e书下载” 听说阿来的《尘埃落定》不错,找来看看 inurl:chenailuoding 小灵通漫游未来,用inurl:xltmywl 即可。 找音乐 沧海一声笑 inurl:canghaiyishengxiao 10篇 可用 一剪梅 inurl:yijianmei 无用的结果多,加上music ,用 inurl:yijianmei music,三项结果,可用让我们荡起双桨,多么美妙的歌声。重温一下,inurl:rwmdqsj,找到相关网页148篇,可以。 找某人的相关资料: inurl:huipk huipk斑竹的个人家园都搜索出来了,很奇怪,没有搜到huipk在blogchina的blog。 inurl:wanganyi 王安忆的作品和个人资料很快就搜到了 inurl:zhangailing 找到很多信息,但多是关于其作品的,看看她的个人资料,用“出生 inurl:zhangailing ”搜索,立刻得到。
3)挑战site site的用处是把搜索范围限定在某一站点或指定网域中。所以,搜索结果的url就有一部分是相同的。 百度: 在线电影 site:sowang.com 331篇 在线电影 inurlsowang [...]
Site——把搜索范围限定在特定站点中
如果你知道这些网站中有你想要的信息,可以使用site语法缩小搜索范围,加快搜索速度。
在21cn找网络红人关键字实例: 网络红人 site:21cn.com
Inurl——把搜索范围限定在url链接中
网页url中的某些信息,常常有某种有价值的含义。于是,您如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。
在21cn找网络红人关键字实例: 网络红人 inurl:21cn.com
Domain——同时具备上述两个参数的作用
经常使用搜索引擎查找资料的用户也许会有一个疑问,在百度中Site和Inurl都可以实现上述的功能,为何如今一定要使用domain呢?用“site:网站”的搜索参数可以对指定网站内的内容进行查找(相当于网站的内部搜索);“inurl:网站”的搜索参数则要求全部结果中的网页地址中必须包括指定的网站;而“domain”这个参数就同时具备上述两个参数的作用,而且应用也更加广泛。
在21cn找网络红人关键字实例: 网络红人 domain:21cn.com
例如分别用site:21cn.com(搜索到3,730,000个结果)、inurl:21cn.com(搜索到808个结果)、 domain:21cn.com(搜索到3,580,000个结果)进行搜索,你会发现所得到的结果在数量上差异是比较明显的,因为前两个参数所定义的范围比较狭窄,而domain则由于允许所定义的范围可以出现在网页的任意位置,自然结果要多得多。根据这个特点,当我们无法从site或inurl参数中得到理想的结果时,使用domain参数往往能收到意想不到的效果。
使用domain查找网站密码:有时候出于一些特殊原因,我们需要查找某个网站的密码,输入“ OR password domain:XXXX”(XXXX为具体网址)进入搜索,说不定就会有意想不到的收获。
查网站密码关键字实例: password domain:www.0668.com
intitle,inurl,intext,site,双引号"",加减号,filetype的用法
""双引号 完全搜索
使用双引号("")进行词组检索 利用双引号查询完全符合关键字串的网站。例如:输入“中国女足”找出包含“中国女足”的网站,而不会找出包含“中国男足”的网站。
或:A|B
并:AB
否:AB
“seo” 工资|待遇|薪水|年薪 和 "seo" 工资 待遇 薪水 年薪 差不多
仅搜索网站的网址 "u:"
在关键字前加“u:”,搜索引擎仅会查询网址,例如在网页中的搜索框中输入“u:yahoo.com”,单击“搜索”按钮,则统一资源定位器中包含“yahoo.com”字符的网址全部显示出来。
仅搜索网站标题 "t:"
在关键字前加“t:”,搜索引擎仅查询网站的名称。例如在网站搜索框中输入“t:网络技术”,单击“搜索”按钮,符合搜索条件的网站标题显示出来。
用fitletype 在google 能搜索到很多资料
如: filetype:doc seo 翻译过来做软文
intext:to parent directoryintext.mdb
intitle:"index of" data
site:a2.xxxx.comintext:ftp://*:*
intitle:"george bush"
allintitle:"money supply" economics
排除某网站或者域名范围内的页面,只需用“网站/域名”。
seo发表于 20091120 00:50 | 只看该作者
intitle,inurl,filetype,site的作用及在google中的用法
这些就是Google的常用语法,也是Google Hack的必用语法。虽然这只是Google语法中很小的部分,但是合理使用这些语法将产生意想不到的效果。
语法在Google Hack中的作用
了解了Google的基本语法后,我们来看一下黑客是如何使用这些语法进行Google Hack的,这些语法在入侵的过程中又会起到怎样的作用呢?
intitle
intitle语法通常被用来搜索网站的后台、特殊页面和文件,通过在Google中搜索“intitle:登录”、“intitle:管理”就可以找到很多网站的后台登录页面。此外,intitle语法还可以被用在搜索文件上,例如搜索“intitle:"indexof"etc/shadow”就可以找到Linux中因为配置不合理而泄露出来的用户密码文件。
用google搜索以下内容:
intitle:"indexof"etc
intitle:"Indexof".sh_history
intitle:"Indexof".bash_history
intitle:"indexof"passwd
intitle:"indexof"people.lst
intitle:"indexof"pwd.db
intitle:"indexof"etc/shadow
intitle:"indexof"spwd
intitle:"indexof"master.passwd
intitle:"indexof"htpasswd
"#FrontPage"inurl:service.pwd
inurl
Google Hack中,inurl发挥的作用的最大,主要可以分为以下两个方面:寻找网站后台登录地址,搜索特殊URL。
寻找网站后台登录地址:和intitle不同的是,inurl可以指定URL中的关键字,我们都知道网站的后台URL都是类似login.asp、admin.asp为结尾的,那么我们只要以“inurl:login.asp”、“inurl:admin.asp”为关键字进行搜索,同样可以找到很多网站的后台。此外,我们还可以搜索一下网站的数据库地址,以“inurl:data”、“inurl:db”为关键字进行搜索即可。
1.寻找网站的后台登录页面
搜索特殊URL:通过inurl语法搜索特殊URL,我们可以找到很多网站程序的漏洞,例如最早IIS中的Uncode目录遍历漏洞,我们可以构造“inurl:/winnt/system32/cmd exe?/cdir”这样的关键字进行搜索,不过目前要搜索到存在这种古董漏洞的网站是比较困难的。再比如前段日子很火的上传漏洞,我们使用““inurl:upload.asp”或“inurl:upload_soft.asp”即可找到很多上传页面,此时再用工具进行木马上传就可以完成入侵。
intext
intext的作用是搜索网页中的指定字符,这貌似在Google Hack中没有什么作用,不过在以“intext:to parent directory”为关键字进行搜索后,我们会很惊奇的发现,无数网站的目录暴露在我们眼前。我们可以在其中随意切换目录,浏览文件,就像拥有了一个简单的Webshell。形成这种现象的原因是由于IIS的配置疏忽。同样,中文IIS配置疏忽也可能出现类似的漏洞,我们用“intext:转到父目录”就可以找到很多有漏洞的中文网站。
2.随意浏览网站中的文件
Filetype
Filetype的作用是搜索指定文件。假如我们要搜索网站的数据库文件,那么可以以“filetype:mdb”为关键字进行搜索,很快就可以下载到不少网站的数据库文件。当然,Filetype语法的作用不仅于此,在和其他语法配合使用的时候更能显示出其强大作用。
Site
黑客使用Site,通常都是做入侵前的信息刺探。Site语法可以显示所有和目标网站有联系的页面,从中或多或少存在一些关于目标网站的资料,这对于黑客而言就是入侵的突破口,是关于目标网站的一份详尽的报告。
语法组合,威力加倍
虽然上文中介绍的这几个语法能各自完成入侵中的一些步骤,但是只使用一个语法进行入侵,其效率是很低下的。Google Hack的威力在于能将多个语法组合起来,这样就可以快速地找到我们需要的东西。下面我们来模拟黑客是如何使用Google语法组合来入侵一个网站的。
信息刺探
黑客想入侵一个网站,通常第一步都是对目标网站进行信息刺探。这时可以使用“Site:目标网站”来获取相关网页,从中提取有用的资料。
3.搜索相关页面
下载网站的数据库
搜索“Site:目标网站 Filetype:mdb”就可以寻找目标网站的数据库,其中的Site语法限定搜索范围,Filetype决定搜索目标。用这种方法有一个缺点,就是下载到数据库的成功率较低。在这里我们还可以采用另一种语法组合,前提是目标网站存在IIS配置缺陷,即可以随意浏览站点文件夹,我们搜索“Site:目标网站 intext:to parent directory”来确定其是否存在此漏洞。在确定漏洞存在后,可以使用“Site:目标网站 intext:to parent directoryintext.mdb”进行数据库的搜索。
4.找到网站数据库
登录后台管理
下载到数据库后,我们就可以从中找到网站的管理员帐户和密码,并登录网站的后台。对于网站后台的查找,可以使用语法组合“Site:目标网站 intitle:管理”或者“Site:目标网站 inurl:login.asp”进行搜索,当然我们可以在这里进行联想,以不同的字符进行搜索,这样就有很大的概率可以找到网站的后台管理地址。接下去黑客就可以在后台上传Webshll,进一步提升权限,在此不再阐述。
利用其他漏洞
如果下载数据库不成功,我们还可以尝试其他的入侵方法。例如寻找上传漏洞,搜索“Site:目标网站 inurl:upload.asp”。此外,我们还可以根据一些程序漏洞的特征,定制出Google Hack的语句。
Google Hack可以灵活地组合法语,合理的语法组合将使入侵显得易如反掌,再加入自己的搜索字符,Google完全可以成为你独一无二的黑客工具。
合理设置,防范Google Hack
5. 合理设置网站
Google Hack貌似无孔不入,实则无非是利用了我们配置网站时的疏忽。例如上文中搜索“intext:to parent directory”即可找到很多可以浏览目录文件的网站,这都是由于没有设置好网站权限所造成的。在IIS中,设置用户访问网站权限时有一个选项,叫做“目录浏览”,如果你不小心选中了该项,那么其结果就如上文所述,可以让黑客肆意浏览你网站中的文件。
这种漏洞的防范方法十分简单,在设置用户权限时不要选中“目录浏览”选项即可。
6.不要选中该项
编写robots.txt文件
robot.txt是专门针对搜索引擎机器人robot编写的一个纯文本文件。我们可以在这个文件中说明网站中不想被robot访问的部分,这样,我们网站的部分或全部内容就可以不被搜索引擎收录了,或者让搜索引擎只收录指定的内容。因此我们可以利用robots.txt让Google的机器人访问不了我们网站上的重要文件,Google Hack的威胁也就不存在了。
编写的robots.txt文件内容如下:
Useragent: *
Disallow: /data/
Disallow: /db/
其中“Disallow”参数后面的是禁止robot收录部分的路径,例如我们要让robot禁止收录网站目录下的“data”文件夹,只需要在Disallow参数后面加上“/data/”即可。如果想增加其他目录,只需按此格式继续添加。文件编写完成后将其上传到网站的根目录,就可以让网站远离Google Hack了
http://johnny.ihackstuff.com
allinurl:bbs data 百度inurl和allinurl 不一样 谷歌一样
查找所有bbs中的含有data的URL
filetype:mdb inurl:database
查找含有database的URL,且查找后缀名为mdb的文件
filetype:inc conn
查找含有后缀名为inc conn的文件
inurl:data filetype:mdb
查找含有data的URL,且查找后缀名为mdb的文件
intitle:"index of" data
查找网页标题中含有"index of" data的网页
intitle:"Index of" .sh_history
查找网页标题中含有"Index of" .sh_history的网页
intitle:"Index of" .bash_history
查找网页标题中含有"Index of" .bash_history的网页
intitle:"index of" passwd
查找网页标题中含有"index of" passwd的网页
intitle:"index of" people.lst
查找网页标题中含有"index of" people.lst的网页
intitle:"index of" pwd.db
查找网页标题中含有"index of" pwd.db的网页
"# FrontPage" inurl:service.pwd
查找含有service.pwd 的URL且网页中含有"# FrontPage"
site:xxxx.com intext:管理
查找某个网站中网页正文含有"管理"的页面
site:xxxx.com inurl:login
查找某个网站中URL地址中含有login的页面
site:xxxx.com intitle:管理
查找某个网站中含有"管理"的标题的页面
intitle,inurl,filetype,site的用法
面我们先来看看Google的部分语法:
命令与domain命令
命令与domain命令的含义在于检索网站在搜索引擎中反面链接页面,例如想搜索有什么网页链接到3suau.cn的页面,就可以输入domain:sina.cn或者 3suau.cn
其它铺助搜索命令:
利用*代替所有的字母,模糊检索那关键词或者是不能确定的关键词。 例如:键入"氝*"后的会查询到包含氝字的相关内容。 但 王景* 和 王景 一样结果
利用()可以把多个关键词划分为一组,并进行优先查询。 例如:键入"(seo网络)"来搜索包含"seo"与"网络"的信息.
利用and 表示前后两个关键词是"与"的逻辑关系。 例如输入关键词:游戏 and 在线 会找出将包含游戏和在线有关的网站。
利用or(|)表示前后两个词是"或"的逻辑关系。 例如输入关键词:前门 or 下一站,会找出将包含前门 或者下一站 的网页。
百度查询页关于网址中代码的含义:
如搜索关键词“知识”第二页,网址如下:http://www.baidu.com/s?lm=0&si=&rn=10&ie=gb2312&ct=0&wd=%D6%AA%CA%B6&pn=10&ver=0&cl=3
http://www.baidu.com/s?wd=??&pn=10&usm=1 当天搜索的
其中:
wd代表搜索的关键词
cl=3代表网页搜索
ie(Input Encoding)默认值是“gb2312” 如ie=gb2312 代表查询输入关键词的编码是简体中文
tn代表搜索框所属网站。比如 tn=sitehao123,就是 http://www.hao123.com/ 左上那个搜索框
pn代表显示搜索结果的页数
rn代表页面显示搜索结果的数量
bs Before Search 上一次搜索输入的关键词.
sr 不建议使用该参数.结合bs使用。一般查询sr=0或者为空值,但sr=1时,查询将结合bs的值一起作为查询的关键字.默认值为0,除0,1外其它值无效。
ct 语言限制。0所有语言,1简体中文网页,2繁体中文网页;其它不确定或者无效或。默认值为0.
rn 每页包含的搜索结果数目。默认值为10
pn 搜索结果的页码,从零开始计数。即pn = ${结果页码1}*rn。
lm 搜索结果的时间限制。以天为单位,例如搜索最近一个月的网页,lm=30.默认值为0,表示没有时间限制。
q5 搜索内容位置限制.0所有内容;1网页标题(相当于使用'title:'查询前缀);2url(相当于使用'inurl:'查询前缀);其它值等效于0.默认值为0
q6 搜索内容网站限制.例如q6=sohu.com,表示只搜索sohu.com的网页;相当于使用了'site:前缀'.默认值为空
dq 不建议使用该参数.查询内容来原的地区限制. 具体值有百度确定.默认值为空.试了一下,使用这个参数的效果很差.
myselectvalue
submit=
tb=on 贴吧?
f 未知。 默认值为空
cl 未知。 默认值为空
rs2 未知。
sc 未知。
Google Hacker
Google hacker (Google黑客)是利用GOOGLE提供的搜索功能查找黑客们想找到的信息.一般是查找网站后台,网管的个人信息,也可以用来查找某人在网络上的活动.
Google hacker 一般是做为黑客在入侵时的一个手段.在入侵过程中有时需要查找后台的登陆口就需要用到GOOGLE HACKER.有时猜解密码的时候google也是提供查找管理员资料的有效平台.
Google hacker的入侵方法(来自网络):
http://blog.dianfu.org/blogview.asp?logID=44&cateID=2
route print 查看本机设置网络
intext:
这个就是把网页中的正文内容中的某个字符做为搜索条件.例如在google里输入:intext:动网.将返回所有在网页正文部分包含"动网"的网页.allintext:使用方法和intext类似.
intitle:
和上面那个intext差不多,搜索网页标题中是否有我们所要找的字符.例如搜索:intitle:安全天使.将返回所有网页标题中包含"安全天使"的网页.同理allintitle:也同intitle类似.
cache: 现在只要谷歌能用,现在用不了
搜索google里关于某些内容的缓存,有时候也许能找到一些好东西哦.
define:
搜索某个词语的定义,搜索:define:hacker,将返回关于hacker的定义. 谷歌能用
filetype:
.bak、.mdb或.inc也是可以的,获得的信息也许会更丰富
info:
查找指定站点的一些基本信息.
inurl:
搜索我们指定的字符是否存在于URL中.例如输入:inurl:admin,将返回N个类似于这样的连接:http://www.xxx.com/xxx/admin,用来找管理员登陆的URL不错.allinurl也同inurl类似,可指定多个字符.
? allinurl:WORDS = 只显示在URL地址里有搜索结果的页面.
? inurl:WORD = 跟allinurl类似,但是只在URL中搜索第一个词.
把google可能忽略的字列如查询范围
把某个字忽略
~同意词
.单一的通配符
*通配符,可代表多个字母
""精确查询
下面开始说说实际应用(我个人还是比较习惯用google.com,以下内容均在google上搜索),对于一个居心叵测的攻击者来说,可能他最感兴趣的就是密码文件了.而google正因为其强大的搜索能力往往会把一些敏感信息透露给他们.用google搜索以下内容:
intitle:"indexof"etc
intitle:"Indexof".sh_history
intitle:"Indexof".bash_history
intitle:"indexof"passwd
intitle:"indexof"people.lst
intitle:"indexof"pwd.db
intitle:"indexof"etc/shadow
intitle:"indexof"spwd
intitle:"indexof"master.passwd
intitle:"indexof"htpasswd
"#FrontPage"inurl:service.pwd
有时候因为各种各样的原因一些重要的密码文件被毫无保护的暴露在网络上,如果被别有用心的人获得,那么危害是很大的.下面是我找到的一个FreeBSD系统的passwd文件(我已做过处理):
同样可以用google来搜索一些具有漏洞的程序,例如ZeroBoard前段时间发现个文件代码泄露漏洞,我们可以用google来找网上使用这套程序的站点:
intext:ZeroBoardfiletype:php
或者使用:
inurlutlogin.php?_zb_path=site:.jp
来寻找我们所需要的页面.phpmyadmin是一套功能强大的数据库操作软件,一些站点由于配置失误,导致我们可以不使用密码直接对phpmyadmin进行操作.我们可以用google搜索存在这样漏洞的程序URL:
intitle:phpmyadminintext:Createnewdatabase
还记得http://www.xxx.com/_vti_bin/..%5C..%5C....m32/cmd.exe?dir吗?用google找找,你也许还可以找到很多古董级的机器。同样我们可以用这个找找有其他cgi漏洞的页面。
allinurl:winntsystem32
图三
前面我们已经简单的说过可以用google来搜索数据库文件,用上一些语法来精确查找能够获得更多东西(access的数据库,mssql、mysql的连接文件等等).举个例子示例一下:
allinurl:bbsdata
filetype:mdbinurl:database
filetype:incconn
inurl:datafiletype:mdb
intitle:"indexof"data//在一些配置不正确的apachewin32的服务器上经常出现这种情况
和上面的原理一样,我们还可以用google来找后台,方法就略了,举一反三即可,毕竟我写这篇文章的目的是让大家了解googlehacking,而不是让你用google去破坏.安全是把双刃剑,关键在于你如何去运用.
利用google完全是可以对一个站点进行信息收集和渗透的,下面我们用google对特定站点进行一次测试。www.xxxx.com是全国著名大学之一,一次偶然的机会我决定对其站点进行一次测试(文中所涉及该学校的信息均已经过处理,请勿对号入座.
首先用google先看这个站点的一些基本情况(一些细节部分就略去了):
site:xxxx.com
从返回的信息中,找到几个该校的几个系院的域名:
http://a1.xxxx.com
http://a2.xxxx.com
http://a3.xxxx.com
http://a4.xxxx.com
顺便ping了一下,应该是在不同的服务器.(想想我们学校就那一台可怜的web服务器,大学就是有钱,汗一个)。学校一般都会有不少好的资料,先看看有什么好东西没:
site:xxxx.comfiletype:doc
得到N个不错的doc。先找找网站的管理后台地址:
site:xxxx.comintext:管理
site:xxxx.cominurl:login
site:xxxx.comintitle:管理
超过获得2个管理后台地址:
http://a2.xxxx.com/sys/admin_login.asp
http://a3.xxxx.com:88/_admin/login_in.asp
还算不错,看看服务器上跑的是什么程序:
site:a2.xxxx.comfiletype:asp
site:a2.xxxx.comfiletype:php
site:a2.xxxx.comfiletype:aspx
site:a3.xxxx.comfiletype:asp
site:.......
......
a2服务器用的应该是IIS,上面用的是asp的整站程序,还有一个php的论坛
a3服务器也是IIS,aspxasp。web程序都应该是自己开发的。有论坛那就看看能不能遇见什么公共的FTP帐号什么的:
site:a2.xxxx.comintext:ftp://*:*
没找到什么有价值的东西。再看看有没有上传一类的漏洞:
site:a2.xxxx.cominurl:file
site:a3.xxxx.cominurl:load
在a2上发现一个上传文件的页面:
http://a2.xxxx.com/sys/uploadfile.asp
用IE看了一下,没权限访问。试试注射,
site:a2.xxxx.comfiletype:asp
得到N个asp页面的地址,体力活就让软件做吧,这套程序明显没有对注射做什么防范,dbowner权限,虽然不高但已足矣,backashell我不太喜欢,而且看起来数据库的个头就不小,直接把web管理员的密码暴出来再说,MD5加密过。一般学校的站点的密码都比较有规律,通常都是域名电话一类的变形,用google搞定吧。
site:xxxx.com//得到N个二级域名
site:xxxx.comintext:*@xxxx.com//得到N个邮件地址,还有邮箱的主人的名字什么的
site:xxxx.comintext:电话//N个电话
把什么的信息做个字典吧,挂上慢慢跑。过了一段时间就跑出4个帐号,2个是学生会的,1个管理员,还有一个可能是老师的帐号。登陆上去:
name:网站管理员
pass:a2xxxx7619//说了吧,就是域名4个数字
要再怎么提权那就不属于本文讨论访问了,呵呵,到此为止。
关于googlehacking的防范
以前我们站的晓风?残月写过一篇躲避google的文章,原理就是通过在站点根目录下建立一个robots.txt以避免网络机器人获得一些敏感的信息,具体大家看原文章:
http://www.4ngel.net/article/26.htm
不过这种方法我个人不推荐,有点此地无银三百两的味道。简单一点的方法就是上google把自己站点的一些信息删除掉,访问这个URL:
http://www.google.com/remove.html
前几天看见又有人讨论用程序来欺骗robot的方法,我觉得可以试试,代码如下:
if(strstr($_SERVER['HTTP_USER_AGENT'],"Googlebot"))
{
header("HTTP/1.1301");
header("Location:http://www.google.com");
}
?>
后记
这段时间在国外的一些googlehack的研究站点看了看,其实也都差不多是一些基本语法的灵活运用,或者配合某个脚本漏洞,主要还是靠个人的灵活思维。国外对于googlehack方面的防范也并不是很多,所以大家还是点到为止,不要去搞破坏拉,呵呵。对于一些在win上跑
apache的网管们应该多注意一下这方面,一个intitle:indexof就差不多都出来了:)
A1Pass 的 google黑客技术基础
黑客反病毒论坛 http://bbs.hackav.com
google黑客常用关键字:
[to parent directory]
lastmodified
index of/
description
[转到父目录]
<目录>
<dir>
********************************************************************
例子:查复旦大学网站数据库
intext:[to parent directory] intext:mdb site:fudan.edu.cn
上面为关键字
*********************************************************************
google黑客语法:
intext:
这个就是把网页中的正文内容中的某个字符做为搜索条件.例如在google里输入:intext:动网.将返回所有在网页正文部分包含"动网"的网页.allintext:使用方法和intext类似.
Google语法简介
目前, Internet 上有两种搜索引擎. 一种是The Searchable Subject Index,索引式搜索. 这种搜索引擎只搜索站点的Title和Meta描述信息. 而无法搜索个人主页,Yahoo就是一个索引式搜索引擎. 第二种是The FullText Search Engine 完全内容搜索引擎.通过Spider(蜘蛛?!) 技术搜索数百万个甚至数十亿个页面.而且可以搜索页面的Title和内容. 所以能够比索引式搜索做更全面的搜索.Google就是一个完全内容搜索引擎.
基本连接符
Google 默认的连接符是 AND; 意味着如果你不加其他修饰符号直接搜索的话, Google就会对所有的关键字同时进行搜索.
snowblower Honda "Green Bay"
如果要从几个关键字中指定任中一个, 可以使用OR 连接符.
snowblower OR snowmobile OR "Green Bay"
如果要明确的指出2个或多个关键字使用OR连接, 可以用括号连接
snowblower (snowmobile OR "Green Bay")
同时你也可以使用电脑编程里管道符号 "|" 来表示OR的功能. 如果要在搜索结果中不包括某个关键字, 使用 (减号/短横线)
snowblower snowmobile "Green Bay"
Google将搜索包括snowblower 和 snowmobile ,不包括Green Bay.
简单搜索和手气不错
手气不错是Google一个很有特色的功能.你可以迅速得到Google认为的最符合你搜索结果的页面(就是最常搜索的结果).
比如你搜索washington post 手气不错会把你带到 http://www.washingtonpost.com/. 而president 则是 http://www.whitehouse.gov/ .
大小写
很多的搜索引擎是大小写敏感的,比如你搜索GEORGE WASHINGTON, 就无法搜到"George Washington","george washington". Google是不区分大小写的,搜索Three, three, THREE都可以得到相同的结果.
intext: 只搜索网页<body>部分中包含的文字(也就是忽略了标题,URL等的文字).
allintext: 不推荐使用.
intext:"yahoo.com"
intext:html
inanchor: 搜索连接中包含锚点标记. 锚点标记就是指连接的标记, 比如<a href="http://www.oreilly.com>;O'Reilly and Associates</a> 中的O'Reilly and Associates就是锚点标记.
inanchor:"tom peters"
site: 可以限制你搜索范围的域名.
site:loc.gov
site:thomas.loc.gov
site:edu
site:nc.us
link: 可以得到一个所有包含了某个指定URL的页面列表. 例如link:www.google.com 就可以得到所有连接到Google的页面.不用担心http:// 部分,事实上即使你输入了Google也会将其忽略:p
cache: 搜索Google索引里页面的副本, 即使他原本的URL已经不存在或者完全发生了变化,这部分很适合页面经常变动的搜索. 如果Google搜索不到你输入的关键字, 那么很有可能你所看到的是Google缓存着的最新页面.
cache:www.yahoo.com
aterange: 限制搜索特定时间段里的检索内容. 注意是加入Google检索的时间, 而不是页面创建的时间.但是这个时间在Google整理检索的时候不会发生变化. 比如一个网页是February 2制作的,加入Google检索的时候是April 11 使用daterange:检索的时候就在April 11的检索里被搜索到. Google在August 13 重建了索引,但仍然在April 11里被搜索到.
daterange:的格式是Julian,而不是Gregorian格式.
"George Bush" daterange:24523892452389
neurosurgery daterange:24523892452389
filetype: 搜索文件的后缀或者扩展名,注意filetype:htm和filetype:html会得到不同的结果. 你也可以搜索各种不同的页面脚本语言,比如ASP, PHP, CGI等等. Google对部分Microsoft的文档也做了索引, 比如PowerPoint (PPT), Excel (XLS), and Word (DOC)等等.
homeschooling filetype:pdf
"leading economic indicators" filetype:ppt
related: 搜索和指定页面相关的页面,比如你搜索related:google.com , 会得到很多搜索引擎,比如HotBot, Yahoo!, Northern Light等等.
related:www.yahoo.com
related:www.cnn.com
info: 提供一个和指定URL更多信息的页面列表,包括URL缓存的连接,包括URL的连接,和URL相关的连接,包含URL的页面. 注意, 这里搜索的结果取决于Google是否对该URL进行了索引. 如果没有的话, 搜索结果将会少很多.
info:www.oreilly.com
info:www.nytimes.com/technology
phonebook: 用于查询电话号码.
phonebook:John Doe CA
phonebook510) 5551212
site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“网站/域名”。
示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。.
搜索:“金庸 site:edu.cn”.
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第110项 。搜索用时0.31秒。.
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,.
搜索:“金庸 古龙 site:sina.com.cn”.
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第110项。搜索用时0.34秒。.
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。.
.
搜索:“inurl:midi 沧海一声笑”.
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第110项。搜索用时0.01秒。.
示例:查找微软网站上关于windows2000的安全课题资料。.
搜索:“inurl:security windows2000 site:microsoft.com”.
结果:已在microsoft.com内搜索有关 inurl:security windows2000的网页。共约有198项查询结果,这是第110项。搜索用时0.37秒。.
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对“cgibin/phf”中的“/”当成空格处理。.
“allinurl”语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。.
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。.
做优化的经常用到的,但网络上似乎都列举不全,这里我整理一下,方便大家使用。
? inanchor:WORD=只在链接文字内搜索指定的内容
? allinanchor:WORD=限制搜索的词语是网页中链接内包含的关键词(可使用多个关键词)
? intext:WORD=只在网页的正文内搜索指定的内容(忽略链接文字、标题和url)
? allintitle:WORD = 搜索网页标题.
? intitle:WORD = 跟allintitle类似,但是只在标题里搜索第一个词.
intitle:谁动了我的奶酪 周杰伦 有搜索结果
allintitle:谁动了我的奶酪 周杰伦 没有搜索结果
? "WORD"=精确匹配关键字词组.
? cache:URL = 将显示关于URL的Google缓存(07年10月前中国不可用).
? info:URL = 将显示一个包含了这些元素的页面:类似结果的链接,反向链接,还有包括了这个URL的页面.在搜索框里直接输入URL会起到同样的效果.
? filetype:SOMEFILETYPE = 指定文件类型.
? filetype:SOMEFILETYPE = 剔除指定文件类型.
? site:www.somesite.net “www.somesite.net” = 显示该站点有多少网页被google收录
? allintext: = 搜索文本,但不包括网页标题和链接
? allinlinks: = 搜索链接, 不包括文本和标题
? WordA OR WordB = 搜索包含两关键词之一的页面
? “Word” OR “Phrase” = 精确的要求搜索单词或者句子
? WordA WordB = 包含单词A但是不包含单词B
? WordA WordB = 都包含
? ~WORD = 寻找此单词和它的同义词
? ~WORD WORD = 只搜索同义词,不要原词
~huge huge =
Welcome Giant
Grocery stores and pharmacies serving Maryland, Virginia, Washington DC, and Delaware.
Advanced Search Employment Promotions Shop Online
www.giantfood.com/ Cached Similar
google技巧、google教程、google方法、google功能介绍、google使用指南、google推广、google使用大全
Google(www.Google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎,98年至今,Google已经获得30多项业界大奖。
搜索入门
第一次进入Google,它会根据你的操作系统,确定语言界面。需要提醒的是,Google是通过cookie来存储页面设定的,所以,如果你的系统禁用cookie,就无法对Google界面进行个人设定了。
Google的首页很清爽,LOGO下面,排列了四大功能模块:网站、图像、新闻组和目录服务。默认是网站搜索。现在进行第一次搜索实践,假定你是个搜索新手,想要了解一下搜索引擎的来龙去脉和搜索技巧。在搜索框内输入一个关键字“搜索引擎”, 选中“搜索中文(简体)网页”选项,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
初阶搜索
上例中,单个关键字“搜索引擎”,搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢?我们需要进一步缩小搜索范围和结果。
1,搜索结果要求包含两个及两个以上关键字
一般搜索引擎需要在多个关键字之间加上“ ”,而Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。现在,我们需要了解一下搜索引擎的历史,因此望搜得的网页上有“搜索引擎”和“历史”两个关键字。
示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页
搜索:“搜索引擎 历史”
结果:已搜索有关搜索引擎 历史的中文(简体)网页。 共约有78,600项查询结果,这是第110项 。 搜索用时0.36秒。
用了两个关键字,查询结果已经从70多万项减少到7万多项。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的“历史”,并不是我们所需要的“搜索引擎的历史”。 怎么办呢?删除与搜索引擎不相关的“历史”。我们发现,这部分无用的资讯,总是和“文化”这个词相关的,另外一些常见词是“中国历史”、“世界历史”、“历史书籍”等。
2,搜索结果要求不包含某些特定信息
2.1,Google用减号“”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。
示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页
搜索:“搜索引擎 历史 文化 中国历史 世界历史”
结果:已搜索有关搜索引擎 历史 文化 中国历史 世界历史的中文(简体)网页。
示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有5,440项查询结果,这是第110项。搜索用时0.13秒。
注意:这里的“”和“”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 吸星大法”,搜索引擎将视为逻辑“与”操作,中间的“”被忽略。
2.2,GOOGLE无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。
示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有726项查询结果,这是第110项。搜索用时0.13秒。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。
“”和“”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。
1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。
2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部 佛教 金庸”。
注意:这里的“ ”和“”号,是英文字符,而不是中文字符的“”和“”。此外,操作符与作用的关键字之间,不能有空格。比如“搜索引擎 文化”,搜索引擎将视为关键字为“搜索引擎”和“文化”的逻辑“与”操作,中间的“”被忽略。
3,搜索结果至少包含多个关键字中的任意一个。
3.1,Google用大写的“OR”表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。在上例中,我们希望搜索结果中最好含有“archie”、“lycos”、“蜘蛛”等关键字中的一个或者几个,这样可以进一步的精简搜索结果。
示例:搜索如下网页,要求必须含有“搜索引擎”和“历史”,没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Lycos”、“Yahoo”。
搜索:“搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo 文化”
结果:已搜索有关搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo 文化的中文(简体)网页。 共约有8,400项查询结果,这是第110项 。 搜索用时0.16秒。
我们看到,搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧。
注意:“与”操作必须用大写的“OR”,而不是小写的“or”。
在上面的例子中,我介绍了搜索引擎最基本的语法“与”“非”和“或”,这三种搜索语法Google分别用“ ”(空格)、“”和“OR”表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“ ”连起来),目标信息不能含有的关键字(用“”去掉),目标信息可能含有的关键字(用“OR”连起来)。
3.2,关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。
例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
搜索:“酒 贵 贱 之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡之,故而贱之;醋味厚之,所以贵之。...”
以上的关键字选择技巧可以谓之“特定词法”。
例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。
搜索:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。
以上的关键字选择技巧可以谓之“近义词法”。
例三:刘德华同志的胸围是多少。
分析:首先声明,这是某个MM要我做的搜索,我把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。
搜索:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高 阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。
以上的关键字选择技巧可以谓之“相关词法”。
3.3,其他常用搜索个案
例一:找人
分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。
例二:找软件
分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0 下载的中文(简体)网页。共约有6,670项查询结果,这是第110项。搜索用时0.22秒。
分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurl:download”
结果:已搜索有关winzip 8.0 inurl:download的中文(简体)网页。共约有358项查询结果,这是第110项。搜索用时0.44秒。
在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。
共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第110项。搜索用时0.30秒。
例三:找图片
除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。
分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索:“"britney spears" inurl:photo”
结果:已向英特网搜索"britney spears" inurl:photo. 共约有2,720项查询结果,这是第110项。搜索用时0.23秒。
分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索:“intitle:"britney spears" picture”
结果:已向英特网搜索intitle:"britney spears" picture. 共约有317项查询结果,这是第110项。搜索用时0.40秒。
分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“"britney spears" site:geocities.com”
结果:已在geocities.com内搜索有关"britney spears"的网页。共约有5,020项查询结果,这是第110项。搜索用时0.47秒。
例四:找MP3
分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在用这个办法找找老歌“say you say me”。
搜索:“"say you say me" inurl:mp3”
结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第110项。搜索用时0.17秒。
分析二:也可以通过网页标题,找到这类提供MP3的网页。
搜索:“"say you say me" intitle:mp3”
结果:已向英特网搜索"say you say me" intitle:mp3. 共约有178项查询结果,这是第110项。搜索用时0.73秒。
当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。
例五:找书
分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的“www.shuku.net”。于是可以用SITE语法很简单的找到某本书(如果该网站上有的话)。比如,“旧唐书 site:shuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。
分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德 风车 桑乔”迅速找到该书。
4,杂项语法
4.1,通配符问题
很多搜索引擎支持通配符号,如“*”代表一连串字符,“?”代表单个字符等。Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用""引起来。比如,“"以*治国"”,表示搜索第一个为“以”,末两个为“治国”的四字短语,中间的“*”可以为任何字符。
4.2,关键字的字母大小写
Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
4.3,搜索整个短语或者句子
Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。
示例:搜索关于第一次世界大战的英文信息。
搜索:“"world war I"”
结果:已向英特网搜索"world war i". 共约有937,000项查询结果,这是第110项 。 搜索用时0.06秒。
4.4,搜索引擎忽略的字符以及强制搜索
Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
示例:搜索关于www起源的一些历史资料。
搜索:“www的历史 internet”
结果:以下的字词因为使用过于频繁,没有被列入搜索范围: www 的. 已搜索有关www的历史 internet的中文(简体)网页。 共约有75,100项查询结果,这是第110项 。 搜索用时0.22秒。
我们看到,搜索“www的历史 internet”,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索“www的历史”的时候,搜索引擎实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“”号。
搜索:“www 的历史 internet”
结果:已搜索有关www 的历史 internet的中文(简体)网页。 共约有25,000项查询结果,这是第110项 。 搜索用时0.05秒。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例“”world war I””中,“I”其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。
搜索:“"www的历史" internet”
结果:已搜索有关"www的历史" internet的中文(简体)网页。 共约有7项查询结果,这是第16项 。 搜索用时0.26秒。
我们看到,这做外推吧索事实上把“www的历史”作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
5,Google的高级搜索查询语法
上面已经探讨了Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。
[intitle:]
“intitle:”帮助Google将搜索结果限制在那些标题中含有检索单词的页面。例如,“intitle:login password”(不包括引号)将返回标题中有单词“login”,页面中任何地方有单词“password”的那些页面的链接。
类似的,如果想在网页的标题中检索多个单词,可以用“allintitle”来代替“intitle”得到标题中包含所有这些单词的网页列表。例如使用 “intitle:login intitle:password”跟使用“allintitle:login password”是一样的。
[inurl:]
“inurl:” 将搜索结果限制在那些URL中含有检索单词的页面。例如:“inurl:passwd”(不包括引号)将返回URL中有“passwd”的那些页面的链接。
类似的,如果想在URL中检索多个单词,可以用“allinurl”来代替“inurl”得到URL中包含所有检索单词的网页列表。例如 “allinurl:etc/passwd”会查找URL中包含“etc”和“passwd”的页面。单词之间的“/”会被Google忽略掉。
[site:]
“site:” 将限制Google只在特定的站点或域中检索关键词。例如:“exploits site:hackingspirits.com”(不包括引号)将在所有“hackingspirits.com”域的链接页面中查找关键词 “exploits”。“site:”和“hackingspirits.com”之间不应有空格。
[filetype:]
“filetype:” 将限制Google只在internet上搜索特定扩展名的文件(就是doc,pdf或者ppt等等)。例如:“filetype:doc site:gov confidential”(不包括引号)将在所有政府域相关的网站中查找页面中或“.doc”文件中包含关键词“confidential”的扩展名为 “.doc”的文件。也就是结果会包含到所有政府网站中有confidential关键词的文档的链接。
[link:]
“link:” 将显示有到指定网页的链接的网页。例如:“link:www.securityfocus.com”会列出有到SecurityFocus的链接的网页。注意“link:”和网页url之间不应有空格。
[related:]
“related:” 将显示跟指定网页类似的网页。例如:“related:www.securityfocus.com”会列出跟SecurityFocus主页类似的网页。注意“related:”和网页url之间不应有空格。
[cache:]
“cache:” 将显示在Google cache中的网页。例如:“cache:www.hackingspirits.com”会列出Google cache中hackingspirits的主页。注意“cache:”和网页url之间不应有空格。
如果查询串中包含其它词,Google会在cache的文档中高亮显示这些词。例如: “cache:www.hackingspirits.com guest”会显示在cache中的网页内容,并高亮显示“guest”。
[intext:]
“intext:” 会在特定的网站中搜索单词。它忽略links或URL和页面标题。例如:“intext:exploits”(不包括引号)将只返回页面中含有搜索关键词“exploits”的网页链接。
[phonebook:]
“phonebook:” 会搜索美国街道地址和电话号码信息。例如:“phonebookisaCA”会列出所有名字中有“Lisa”并且住在“加利福尼亚(CA)”的人的名字。这对那些想要挖掘个人信息的黑客来说是再好不过的工具了。
6,其他重要功能
目录服务
如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录 “http://directory.google.com/”,中文目录是 “http://directory.google.com/Top/World/Chinese_Simplified/”。不过由于GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。
工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。
新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,所以我点击“Advaced Groups Search”进入高级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。
搜索结果翻译
曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。
不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面, http://www.google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。
PDF文档搜索
我对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurl:pdf ecommerce”
结果:已向英特网搜索inurl:pdf ecommerce. 共约有19,200项查询结果,这是第110项。搜索用时0.11秒。
下面是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucingecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字档 类似网页
可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索
GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是“images.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚扰。
不过,非常遗憾的是,图像搜索功能还不支持中文。
7.Google黑客揭秘
上面所说的Google查询语法能真正帮助人们来精确他们的搜索结果,得到他们真正想要的。
现在Google如此智能,黑客们当然不会介意利用它从互联网上来挖掘更多本来不应该让他们知道的保密和隐私的信息。现在我将要详细讨论这些技术,展示黑客们是如何利用Google从网上挖掘信息的,以及如何利用这些信息来入侵远程服务器。
利用“index of”与发来查找开放目录浏览的站点
一个开放了目录浏览的WEB服务器意味着任何人都可以像浏览通常的本地目录一样浏览它上面的目录。这里我将讨论如何利用“index of”语法来得到开放目录浏览的WEB服务器列表。这对黑客来说是一种非常简单的信息搜集方法。试想如果得到了本不应该在internet上可见的密码文件或其它敏感文件,结果会怎样。下面给出了一些能轻松得到敏感信息的例子。
Index of /admin
Index of /passwd
Index of /password
Index of /mail
"Index of /" passwd
"Index of /" password.txt
"Index of /" .htaccess
"Index of /secret"
"Index of /confidential"
"Index of /root"
"Index of /cgibin"
"Index of /creditcard"
"Index of /logs"
"Index of /config"
利用“inurl”或“allinurl”寻找缺陷站点或服务器
a.利用“allinurl:winnt/system32/”(不包括引号)会列出所有通过web可以访问限制目录如“system32”的服务器的链接。如果你很幸运你就可以访问到“system32”目录中的cmd.exe。一旦你能够访问“cmd.exe”,就可以执行它,瞧!服务器归你所有了。
b.利用“allinurl:wwwboard/passwd.txt”(不包括引号)会列出所有存在“WWWBoard 密码缺陷”的服务器的链接。想了解更多关于这个缺陷的知识,你可以参看下面的链接:http://www.securiteam.com/exploits/2BUQ4S0SAW.html
c.利用“inurl:bash_history”(不包括引号)会列出所有通过web可以访问“.bash_history”文件的服务器的链接。这是一个历史命令文件。这个文件包含了管理员执行的命令列表,有时还包含敏感信息例如管理员输入的密码。如果这个文件被泄漏并且包含加密的unix密码,就可以用“John The Ripper”来破解它。
d.利用“inurl:config.txt”(不包括引号)会列出所有通过web可以访问 “config.txt”文件的服务器的链接。这个文件包含敏感信息,包括管理员密码的哈希值和数据库认证凭证。例如:Ingenium Learning Management System是一个由Click2learn,Inc开发的基于Web的Windows应用程序。Ingenium Learning Management System5.1和6.1版本以非安全的方式在config.txt文件中存储了敏感信息。更多相关内容请参看:http://www.securiteam.com/securitynews/6M00H2K5PG.html
其它类似的组合其它语法的“inurl:”或“allinurl:”用法:
inurl:admin filetype:txt
inurl:admin filetype:db
inurl:admin filetype:cfg
inurl:mysql filetype:cfg
inurl:passwd filetype:txt
inurl:iisadmin
inurl:auth_user_file.txt
inurlrders.txt
inurl:"wwwroot/*."
inurl:adpassword.txt
inurl:webeditor.php
inurl:file_upload.php
inurl:gov filetype:xls "restricted"
index of ftp .mdb allinurl:/cgibin/ mailto
利用“intitle”或“allintitle”寻找缺陷站点或服务器
a. 利用[allintitle:“index of /root”](不包括括号)会列出所有通过web可以访问限制目录如“root”的服务器的链接。这个目录有时包含可通过简单Web查询得到的敏感信息。
b. 利用[allintitle:“index of /admin”](不包括括号)会列出所有开放如“admin”目录浏览权限的WEB站点列表链接。大多数Web应用程序通常使用“admin”来存储管理凭证。这个目录有时包含可通过简单Web查询得到的敏感信息。
其它类似的组合其它语法的“intitle:”或“allintitle:”用法:
intitle:"Index of" .sh_history
intitle:"Index of" .bash_history
intitle:"index of" passwd
intitle:"index of" people.lst
intitle:"index of" pwd.db
intitle:"index of" etc/shadow
intitle:"index of" spwd
intitle:"index of" master.passwd
intitle:"index of" htpasswd
intitle:"index of" members OR accounts
intitle:"index of" user_carts OR user_cart
allintitle: sensitive filetype:doc
allintitle: restricted filetype :mail
allintitle: restricted filetype:doc site:gov
其它搜索串
? 查找有跨站脚本漏洞(XSS)的站点:
allinurl:/script_s/cart32.exe
allinurl:/CuteNews/show_archives.php
allinurl:/phpinfo.php
? 查找有SQL注入漏洞的站点:
allinurl:/privmsg.php
搜索技巧整理
■前言
自从Internet浪潮扑面迩来,影响人们最深的莫过于学习方式的变迁。
以前人们的学习,就是要把自己变成"才高八斗,学富五车",在肚子里装好足够多的知识,在运用的时候就把所需的部分提取出来。但是到了信息爆炸式膨胀的今天,预先无目的的吞下海量信息的学习方式就有些不合时宜了。如同我们到了大型的图书城,往往有一种不知所措的感觉。我们需要变更旧有的学习方式,目的明确的去学习,即先知道要学什么,然后有目的的去寻找答案,这种方式看上去更加有效率。而搜索引擎就是这样一个帮我们在海量信息库中提取信息的工具。公欲善其事,必先利其器,我们需要对我们的工具有充分的了解,掌握一些搜索技巧。
■基本语法
1、搜索结果要求包含两个及两个以上关键字
一般搜索引擎需要在多个关键字之间加上“ ”,Google无需用明文的“ ”来表示逻辑“与”操作,只要空格就可以了。
注意:如果输入的查询词很长,可能会拆分查询,给查询词加上双引号,可以禁止拆分。
2、搜索结果要求不包含某些特定信息
减号“”表示逻辑“非”操作。“A –B”表示搜索包含A但没有B的网页。
注意,前一个关键词,和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。
3、搜索结果至少包含多个关键字中的任意一个
Google用大写的“OR表示逻辑“或”操作。搜索“A OR B”,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有A和B。百度用“A | B ”表示逻辑“或”关系。
注意:“与”操作必须用大写的“OR”,而不是小写的“or”。
4、逻辑关系优先级使用圆括号,例如查找包含java和(JVM或者虚拟机):Java (JVM或者虚拟机)。
5、要搜索词组需要使用引号括起来,例如搜索Java虚拟机可以使用:"Java虚拟机"。
6、书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。 书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说。比如,查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具——手机,而加上书名号后,《手机》结果就都是关于电影方面的了。
■杂项语法1、通配符问题
Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用““引起来。一般情况下是不能使用通配符的,通配符只能使用在词组中,例如:"使用*模式"。
2、关键字的字母大小写
Google是不区分大小写的,搜索Java和搜索JAVA或者java是完全一样的。
3、搜索整个短语或者句子
Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。
4、搜索引擎忽略的字符以及强制搜索
Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“”号。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。
注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
■进阶搜索上面是Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。
1、把搜索范围限定在特定站点中——site
有时候,你如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。
例如,爆点网就可以这样查询:msn site:podon.cn
注意,“site:”后面跟的站点域名,不要带“http://”和“/”符号;另外,site:和站点名之间,不要带空格。
2、把搜索范围限定在网页标题中——intitle
网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式,是把查询内容中,特别关键的部分,用“intitle:”领起来。
例如,找酒井法子的写真,就可以这样查询:写真 intitle:酒井法子
注意,intitle:和后面的关键词之间,不要有空格。
3、把搜索范围限定在url链接中——inurl
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。网页url中的某些信息,常常有某种有价值的含义。于是,你如果对搜索结果的url做某种限定,就可以获得良好的效果。实现的方式,是用“inurl:”,后跟需要在url中出现的关键词。
例如,找关于PS的技巧,可以这样查询:PS inurl:jiqiao
上面这个查询中的“PS”,是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。
(上面三条在百度中适用)
“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。
搜索:“allinurl:“cgibin“ phf com”
结果:已向英特网搜索allinurl:“cgibin“ phf com. 共约有51项查询结果,这是第110项 。 搜索用时0.11秒。
4、在某一类文件中查找信息——filetype
“filetype:”是Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档如.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus123文档,Adobe的.pdf文档,ShockWave的.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索几个资产负债表的Office文档。
搜索:“资产负债表 filetype:doc OR filetype:xls OR filetype:ppt”
结果:已搜索有关资产负债表 filetype:doc OR filetype:xls OR filetype:ppt的中文(简体)网页。 共约有481项查询结果,这是第110项 。 搜索用时0.04秒。
注意,下载的Office文件可能含有宏病毒,谨慎操作。
示例:搜索一些关于搜索引擎知识和技巧方面的PDF文档
搜索:““search engine“ tips OR tutorial filetype:pdf”
结果:已向英特网搜索“search engine“ tips OR tutorial filetype:pdf. 共约有12600项查询结果,这是第110项 。 搜索用时0.22秒。
我们来看其中的一个结果:
[PDF]Search Engines Tips
文档类型: PDF/Adobe Acrobat HTML 版
... http://www.google.com/press/zeitgeist.html See what people are searching on at Google.com
* Search Engine Watch http://searchenginewatch.com/ Some free tips ...
www.allvertical.com/PromoKits/SearchEngineTips.pdf 类似网页
可以看到,Google用[PDF]来标记这是一个PDF的文档检索,另外,它还给出了该PDF文档的HTML版本,该HTML版保留了文档的文字内容和结构,但没有图片。
5、搜索的关键字包含在网页的“锚”(anchor)链点内
所谓“锚”,就是在同一个网页中快速切换链接点。与URL和TITLE类似,Google提供了两种对anchor的检索,“inanchor”和“allincnchor”。对此不作详述。
■其他罕用语法1、搜索所有链接到某个URL地址的网页
如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语法就能让你迅速达到这个目的。
示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接到www.newhua.com的网页 。 共约有920项查询结果,这是第110项 。 搜索用时0.12秒。
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被Google忽略。另外还要说明的是,link只列出Google索引链接很小一部分,而非全部,所以如果你用Google没有搜到链到你的主页的链接,也不必灰心丧气。 除了上述功能,link语法还有其它妙用。一般说来,做友情链接的网站都有相似地方。这样,你可以通过这些友情链接,找到一大批具有相似内容的网站。比如说,你是个天文爱好者,你发现某网站非常不错,那么,可以用link语法查一下与之做链接的网站,也许可以找到更多符合你兴趣的内容。
说明一下:1.本文的“普通的搜索引擎”相对于专业搜索引擎而言,索引范围不局限在某一主题下。百度、Google就是“普通的搜索引擎”,他们的网络蜘蛛沿着超链接一直爬,不管你是任何主题的内容;Teein是专业搜索引擎,他仅仅索引论坛里的内容。2.我一般用百度和Google,这篇文章也是根据使用这两家搜索引擎的经验写的。
一、从URL着手
URl,全称 Uniform Resource Locator,中文为“统一资源定位器”。直观的说,就是地址栏里的内容。大多数论坛和社区的URL都至少包括下面三个单词之一:bbs、forum和club。所以,可以利用inurl语法。
格式如下: “你想要查的内容 inurl:bbs”
“你想要查的内容 inurl:forum”
“你想要查的内容 inurl:club”
深入下去,还可以发现论坛的各个帖子的URL都有相似的格式。
对于Dvbbs,网页的URL一般是这种格式:
http://***/dispbbs.asp?boardID=*&ID=*&page=*
discuz! http://***/viewthread.php?tid=*&fpage=*
PHPWind http://***/read.php?tid=*
BBSxp http://***/ShowPost.asp?id=*
所以,还能够搜索采用同样论坛系统的多个论坛里的内容,不过意义不大。使用
inurl:dispbbs、 inurl:boardID、inurl:viewthread、inurl:read.php、inurl:ShowPost、inurl:tid= ……
二、关键词
这里的关键词定位非常明确:要尽可能,最好仅仅出现在论坛里。
1.“powered by”
不管采用Dvbbs还是Discuz!或者其他的程序,网页下面都有类似的文字“Powered by Discuz! 2.2F ”、“Powered By :Dvbbs Version 7.0.0”、“Powered by BBSxp 5.10 SQL”。“powered by”总是不可少,特异性也可以。所以,在搜索时,加上“powered by”可以大致限定在论坛内查找。
2.“文本方式查看主题”
这主要针对DVbbs而言。用百度搜索 site:bbs.sowang.com 可以看到具体帖子在百度都被保存为文本页面形式。
实例:搜索cnki的密码 “文本方式查看主题 cnkikw”
补充:
一、从URL着手
inurl:printpage 和 inurl:print
printpage的特异性很高,搜索结果大多都是论坛里的内容,但和“文本方式查看主题”有重叠之初。
二、关键词
“作者 发布时间” 或者 “作者 时间”
用关键词““文本方式查看主题”“搜索的页面,都包含”作者“和”发布时间“。特异性不是太好,但查全率较高。
其他有效的关键词我还没发现,欢迎大家交流。
二、查询某一类文件(往往带有同一扩展名)
“filetype:”这是个尚在测试阶段的GOOGLE特色查询,不过功能已经非常强大,可以做很多意想不到的事情哦。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“ecommerce filetype:pdf”
结果:已向英特网搜索ecommerce filetype:pdf. 共约有25,500项查询结果,这是第91100项。搜索用时0.44秒。
三、搜索的关键字包含在URL链接中
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有16项查询结果,这是第110项。搜索用时0.16秒。
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。例如,GOOGLE会把“cgibin/phf”中的“/”当成空格处理。
四、搜索所有链接到某个URL地址的网页
如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而“link”语法就能让你迅速达到这个目的。
示例:搜索所有含指向“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接到www.newhua.com的网页。共约有856项查询结果,这是第110项。搜索用时0.17秒。
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。
黑客技巧:Google hacking实现以及应用
【编者按】
google hacking其实并算不上什么新东西,在早几年我在一些国外站点上就看见过相关的介绍,但是由于当时并没有重视这种技术,认为最多就只是用来找找未改名的mdb或者别人留下的webshell什么的,并无太大实际用途.但是前段时间仔细啃了些资料才猛然发觉google hacking其实并非如此简单...
________________________________________
前言
google hacking其实并算不上什么新东西,在早几年我在一些国外站点上就看见过相关的介绍,但是由于当时并没有重视这种技术,认为最多就只是用来找找未改名的mdb或者别人留下的webshell什么的,并无太大实际用途.但是前段时间仔细啃了些资料才猛然发觉google hacking其实并非如此简单...
google hacking的简单实现
记得以前看见过一篇文章写的就是简单的通过用www.google.com来搜索dvbbs6.mdb或conn.inc来获得一些站点的敏感信息.其实使用google中的一些语法可以提供给我们更多的信息(当然也提供给那些习惯攻击的人更多他们所想要的.),下面就来介绍一些常用的语法.
intext:
这个就是把网页中的正文内容中的某个字符做为搜索条件.例如在google里输入:intext:动网.将返回所有在网页正文部分包含"动网"的网页.allintext:使用方法和intext类似.
intitle:
和上面那个intext差不多,搜索网页标题中是否有我们所要找的字符.例如搜索:intitle:安全天使.将返回所有网页标题中包含"安全天使"的网页.同理allintitle:也同intitle类似.
cache:
搜索google里关于某些内容的缓存,有时候也许能找到一些好东西哦.
define:
搜索某个词语的定义,搜索:define:hacker,将返回关于hacker的定义.
filetype:
这个我要重点推荐一下,无论是撒网式攻击还是我们后面要说的对特定目标进行信息收集都需要用到这个.搜索指定类型的文件.例如输入:filetype:doc.将返回所有以doc结尾的文件URL.当然如果你找.bak、.mdb或.inc也是可以的,获得的信息也许会更丰富
info:
查找指定站点的一些基本信息.
inurl:
搜索我们指定的字符是否存在于URL中.例如输入:inurl:admin,将返回N个类似于这样的连接:http://www.xxx.com/xxx/admin,用来找管理员登陆的URL不错.allinurl也同inurl类似,可指定多个字符.
link:
例如搜索:inurl:www.4ngel.net可以返回所有和www.4ngel.net做了链接的URL.
site:
这个也很有用,例如:site:www.4ngel.net.将返回所有和4ngel.net这个站有关的URL.
对了还有一些操作符也是很有用的:
把google可能忽略的字列如查询范围
把某个字忽略
~ 同意词
. 单一的通配符
* 通配符,可代表多个字母
"" 精确查询
搜索引擎使用技巧
________________________________________
GOOGLE对英文字符大小写不敏感
GOOGLE对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。
“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。
INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。
用“”和“”减少冗余信息
搜索:“Britney OR Beatles Madonna”
//“”、“”和“OR”的混合查询
搜索:“winzip 8.0 inurl:download”
//很多网站设有专门的下载目录,而且就命名为“download”
搜索:“winzip 8.0 sn”
//结果:已向英特网搜索winzip 8.0 的序列号sn,number”、“sn”、“序列号”等关键字
搜索:“intitle:藤原纪香 写真”
//示例:查找日本明星藤原纪香的照片集。
搜索:“"say you say me" inurl:mp3”
//在网页的地址中包含关键字
搜索:“"say you say me" intitle:mp3”
//网页标题
搜索:“旧唐书 site:shuku.net"
//文艺类的“www.shuku.net”
搜索:“"britney spears" site:geocities.com”
// “site”表示搜索结果局限于某个具体网站或者网站频道
搜索:“intitle:"李连杰" picture”
//提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合
搜索:“BIG BANG filetype:jpg site:edu”
//示例:查找美国教育网上的宇宙大爆炸jpg图片
搜索:“info:www.sina.com.cn”
//info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能
related:www.sina.com.cn/
//寻找和www.sina.com.cn结构内容方面相似的网页
搜索:“link:www.newhua.com”
//搜索所有含指向华军软件园“www.newhua.com”链接的网页。
"www.sina.com.cn"
//寻找网页包含有"www.sina.com.cn
搜索:“cache:www.yahoo.com.cn”
//这是 G o o g l e 内 http://cn.yahoo.com/ ;的页库快照。“cache”用来搜索GOOGLE服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
搜索:“intitle:藤原纪香 写真”
//对网页的标题栏进行查询
搜索:“inurl:midi 沧海一声笑”
//“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。就可以用INURL语法找到这些相关资源链接,用第二个关键词确定是否有某项具体资料。
搜索:“allinurl:"cgibin" phf com”
//“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。
搜索:“inurl:security windows2000 site:microsoft.com”
//示例:查找[M$]网站上关于windows2000的安全课题资料。
搜索:“ecommerce filetype:pdf”
//“filetype:”查询某一类文件(往往带有同一扩展名)
搜索:“"who am i"”
//如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“”号。注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
搜索:“"long long ago"”
//搜索整个句子.GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。
搜索:“link:www.newhua.com”
//搜索所有链接到某个URL地址的网页
搜索:“BIG BANG filetype:jpg site:edu”
//查找美国教育网上的宇宙大爆炸jpg图片
目前支持的语法包括“”,“”,“OR”,“site”和“filetype”。其中“filetype:”的后缀只能是几种限定的图片类似,如JPG,GIF等。
如果只想看到不包含内链的结果,可输入如下指令:
LINK:yourdomain.com URL:yourdomain.com (googel中好像不能用,有谁知如何用吗)
如欲查看一特定页面的链接广泛度,可在Altavista中输入如下指令:
LINK:yourdomain.com/filename.htm (google中可用)
Inktomi及其隶属搜索引擎如HotBot, AOL, iWon和MSN
linkdomain:yourdomain.com
(MSN通过linkdomain:yourdomain.com,好像比在google中用link:www.yourdomain.com还好用.iWon采用google的搜索引擎;HotBot用linkdomain:yourdomain.com也很好,不过区分linkdomain大小写.用linkwww.|)yourdomain.com不能通过.AOL为美国在线,搜索不怎么好用,页面速度还慢)
结果为链至该主域的所有站点,包括内链。
LINKDOMAIN:yourdomain.com DOMAIN:Yourdomain.com
结果为链至该主域的所有外部站点。
Fast/Alltheweb
LINK.ALL:yourdomain.com或LINK:yourdomain.com
结果为链至该主域的所有网页,包括内链。
一旦DMOZ收录了你的网站,那你就等着被Netscape Search,AOL Search,Google,Lycos,HotBot,DirectHit等一些大型搜索引擎和门户网站收录吧
自称是“Google终极搜索界面”,对网页更新日做出限定“daterange:”。
http://www.faganfinder.com/google.html
想看看世界各国网民都用Google搜索什么信息么?
http://www.google.com/press/zeitgeist.html
搜索引擎使用技巧
搜索之前先思考
学会使用两个关键词搜索
学会使用减号“-”
点击搜索结果前先思考
善于改正错误
常见错误1:错别字
常见错误2:关键词太常见
常见错误3:多义词
常见错误4:不会输关键词,想要什么输什么
常见错误5:在错误的地方搜索
google搜索真经
二,GOOGLE特色
支持多达132种语言,包括简体中文和繁体中文;
网站只提供搜索引擎功能,没有花里胡哨的累赘;
速度极快,据说有8000多台服务器,200多条T3级宽带;
的专利网页级别技术PageRank能够提供高命中率的搜索结果;
的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;
智能化的“手气不错”功能,提供可能最符合要求的网站;
的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。
三,基本搜索:,,OR
GOOGLE无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。
示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有726项查询结果,这是第110项。搜索用时0.13秒。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
GOOGLE用减号“”表示逻辑“非”操作。
示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
搜索:“易筋经 吸星大法”
结果:已搜索有关易筋经 吸星大法的中文(简体)网页。共约有5,440项查询结果,这是第110项。搜索用时0.13秒。
注意:这里的“”和“”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 吸星大法”,搜索引擎将视为逻辑“与”操作,中间的“”被忽略。
GOOGLE用大写的“OR”表示逻辑“或”操作。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。
示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。
搜索:“britney OR beatles”
结果:已搜索有关britney OR beatles的中文(简体)网页。共约有14,600项查询结果,这是第110项。搜索用时0.08秒。
搜索:“布兰妮 OR 披头士”
结果:找不到和您的查询布兰妮 OR 披头士相符的网页。
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。
“”和“”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。
1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。
2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部 佛教 金庸”。
四,辅助搜索:通配符、大小写、句子、忽略字符以及强制搜索
GOOGLE不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。
GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。
示例:搜索包含“long, long ago”字串的页面。
搜索:“"long, long ago"”
结果:已向英特网搜索"long, long ago". 共约有28,300项查询结果,这是第110项。搜索用时0.28秒。
注意:和搜索英文关键字串不同的是,GOOGLE对中文字串的处理并不十分完善。比如,搜索“"啊,我的太阳"”,我们希望结果中含有这个句子,事实并非如此。查询的很多结果,“啊”、“我的”、“太阳”等词语是完全分开的,但又不是“啊 我的 太阳”这样的与查询。显然,GOOGLE对中文的支持尚有欠缺之处。
GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“”。
示例:搜索包含“Who am I ?”的网页。如果用“"who am i ?"”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。
搜索:“"who am i"”
结果:已向英特网搜索"who am i". 共约有362,000项查询结果,这是第110项。搜索用时0.30秒。
注意:英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
五,高级搜索:site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“网站/域名”。
示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。
搜索:“金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第110项 。搜索用时0.31秒。
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索:“金庸 古龙 site:sina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第110项。搜索用时0.34秒。
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。
“link”语法返回所有链接到某个URL地址的网页。
示例:搜索所有含指向华军软件园www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接www.newhua.com的网页。共约有695项查询结果,这是第110项。搜索用时0.23秒。
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。
inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第110项。搜索用时0.01秒。
示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurl:security windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关 inurl:security windows2000的网页。共约有198项查询结果,这是第110项。搜索用时0.37秒。
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对“cgibin/phf”中的“/”当成空格处理。
allinurl语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。
语法:“allinurl:"cgibin" phf com”
搜索:已向英特网搜索allinurl:"cgibin" phf com. 共约有40项查询结果,这是第110项。搜索用时0.06秒。
allintitle和intitle的用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。
示例:查找日本明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第110项。搜索用时0.03秒。
GOOGLE的罕用高级搜索语法:related,cache,info
related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:www.sina.com.cn/index.shtml”。
cache用来搜索GOOGLE服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。
示例:查找和新浪首页相关的一些资讯。
搜索:“infwww.sina.com.cn”
结果:有www.sina.com.cn的网页信息。
新浪首页
北京站 上海站 广东站. ... 游戏世界, |, 影音娱乐, |, Club缘, |, 男
人女人, |, 论坛聊天, |, 时尚潮流, |, 文教育儿, |, 车行天下, |,
软件下载. ...
Google 提供这个网址的信息:
查看Google网页快照www.sina.com.cn的存档
寻找www.sina.com.cn类似的网页
寻找网页有链接www.sina.com.cn
寻找网页包含有‘www.sina.com.cn‘
六,其他重要功能
目录服务
如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录“http://directory.google.com/”,中文目录是“http://directory.google.com/Top/World/Chinese_Simplified/”。不过由于GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。
工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。
新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,所以我点击“Advaced Groups Search”进入高级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。
搜索结果翻译
曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。
不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面,http://www.google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。
PDF文档搜索
我对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurl:pdf ecommerce”
结果:已向英特网搜索inurl:pdf ecommerce. 共约有19,200项查询结果,这是第110项。搜索用时0.11秒。
下面是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucingecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字档 类似网页
可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索
GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是“images.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚扰。
不过,非常遗憾的是,图像搜索功能还不支持中文。
七,搜索技巧杂谈
关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。
例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
搜索:“酒 贵 贱 之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡之,故而贱之;醋味厚之,所以贵之。...”
以上的关键字选择技巧可以谓之“特定词法”。
例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。
搜索:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。
以上的关键字选择技巧可以谓之“近义词法”。
例三:刘德华同志的胸围是多少。
分析:首先声明,这是某个MM要我做的搜索,我把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。
搜索:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高 阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。
以上的关键字选择技巧可以谓之“相关词法”。
[此贴子已经被作者于20050110 00:12:48编辑过]
《中国网服》人力资源管理系统?网才招聘平台
详情访问:www.ITcn.cn 联系人:Server
WelCome To ITcn.CN 请点击这里咨询
20050107 21:16
举报帖子
复制贴子
加为精华
单贴屏蔽
帖子评价
使用道具
soft163bbs
头衔:★荣誉贵宾★
等级:版主
威望:86
文章:3748
积分:5411
门派:无门无派
注册:20030426 第 2 楼
其他常用搜索个案
例一:找人
分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。
例二:找软件
分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0 下载的中文(简体)网页。共约有6,670项查询结果,这是第110项。搜索用时0.22秒。
分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurl:download”
结果:已搜索有关winzip 8.0 inurl:download的中文(简体)网页。共约有358项查询结果,这是第110项。搜索用时0.44秒。
在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。
共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第110项。搜索用时0.30秒。
例三:找图片
除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。
分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索:“"britney spears" inurl:photo”
结果:已向英特网搜索"britney spears" inurl:photo. 共约有2,720项查询结果,这是第110项。搜索用时0.23秒。
分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索:“intitle:"britney spears" picture”
结果:已向英特网搜索intitle:"britney spears" picture. 共约有317项查询结果,这是第110项。搜索用时0.40秒。
分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“"britney spears" site:geocities.com”
结果:已在geocities.com内搜索有关"britney spears"的网页。共约有5,020项查询结果,这是第110项。搜索用时0.47秒。
例四:找MP3
分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在用这个办法找找老歌“say you say me”。
搜索:“"say you say me" inurl:mp3”
结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第110项。搜索用时0.17秒。
分析二:也可以通过网页标题,找到这类提供MP3的网页。
搜索:“"say you say me" intitle:mp3”
结果:已向英特网搜索"say you say me" intitle:mp3. 共约有178项查询结果,这是第110项。搜索用时0.73秒。
当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。
例五:找书
分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的www.shuku.net”。于是可以用SITE语法很简单的找到某本书(如果该网站上有的话)。比如,“旧唐书 site:shuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。
分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德 风车 桑乔”迅速找到该书。
九,GOOGLE搜索FAQ
Q:如何全面的了解google.com?
A:查看网站相关页面“http://www.google.com/about.html”。
Q:如何切换google.com的初始语言界面?
A:点击搜索栏右边的“使用偏好”(Preferences),选择“界面语言”(Interface Language)中你望的语言,点击最下面的“设定使用偏好”(Save Preferences)按钮。需要提醒的是,GOOGLE用cookie记录这个偏好,所以如果你把浏览器的cookie功能关掉,就无法进行设定。
Q:如何设定每页搜索结果显示数量?
A:同上,进入使用偏好,在该页的“查看结果”(Number of Results)选择显示结果数,数目越大,显示结果需要的时间越长,默认是10项。
Q:搜索到的链接无法打开怎么办?
A:链接无法打开的原因很多,比如网站当机,或者ISP过滤等,可以点击GOOGLE的“网页快照”查看在GOOGLE服务器上的网页缓存。
Q:打开搜索结果的链接,可是该页面太大,很难找到一下子找到目的资料怎么办?
A:直接打开“网页快照”,GOOGLE会把关键词用不同颜色标记出来,很容易找到。
“Google搜索技巧”相关的更多内容
随着科学研究所依赖的各种信息资源的大规模网络化数字化,搜索引擎逐渐成为网络时代的最快捷方便的个性化信息服务系统。Google成为目前最受欢迎的搜索引擎 ,本文全面详细总结了利用Google进行专题信息检索的方法和技巧。
关键词 个性化 信息服务 信息检索 专题检索 搜索 Google 方法 技巧
目前,科学研究依赖的各种信息资源,包括文摘索引、刊论文、预印本、技术报告、学位论文、会议论文、以及部分重要工具书和专著等在内的主流科研信息资源已经逐步数字化,开始形成一个逐步完善的数字化信息资源空间,科研人员可以通过网络跨时空的进行专题信息检索,获取相关科研文献资源[1]。
基于网页内容的全文检索技术是搜索引擎的核心,搜索引擎也是全自动的软件服务。从目前来看,搜索引擎,尤其是Google已成为网络时代最快捷方便的个性化信息服务系统和服务方式。[2]
1 Google成为目前最受欢迎的搜索引擎
Google(www.Google.com)是当今一个优秀的搜索引擎,其功能强大、特点突出、技术先进和服务优良,它在业界评测中获得多项大奖,各大引擎竞相模仿其功能和特色。Google非中国本土公司,但它支持中文搜索,其中文搜索引擎是收集亚洲网站最多的搜索引擎之一,国内使用其独立搜索引擎的人数急剧增长。
目前,全世界访问量最大的4个网站中,3家采用了Google的搜索技术,80%的互联网搜索是通过Google或使用Google技术的网站完成的。目前Google每个月接待来自世界各地的超过2800万独立访问者,全球网民通过Google可以使用86种语言,搜索30多亿个网页及其网页快照,以及4亿多张图片,每个月Google被用户使用的时间为1500万小时左右。
据搜索引擎观察者网络杂志统计结果显示,至2002年10月份,网民使用Google的时间量每月达到1610万小时;相比之下,雅虎只吸引了660万小时,微软 MSN仅有520万小时[3]。
2 利用Google进行专题信息检索的方法和技巧
关键词检索功能是网络信息检索工具的基本检索功能,也是Google最基本的检索功能。关键词属于自然语言,灵活、不受词表控制,但简单的关键词检索方法,命中过多,查准率很低,Google为改善关键词检索性能,提供了按相关度排列结果、布尔逻辑检索,短语或者句子检索、加权检索和限制检索等增强措施。
利用Google进行专题信息检索,为提高查准率,须认真分析课题,选择恰当的关键词,掌握和运用Google检索语法规则,准确设计表达需求的检索式,反复调整检索策略,才能获得高质量的检索结果。
2.1 简单专题信息检索,最直截了当就是在搜索框内输入一个关键词,然后点击下面的“Google搜索”按钮(或者直接回车),结果就出来了。
如果检索人员或用户对查询的领域熟悉,只想寻找某些专题网站,首先考虑用目录检索,Google根据其专业的“网页级别”(PageRank)技术对目录中登录的网站进行了排序,可以使检索具更高效率,按所需主题确定沿某类层层查找网站,目录分类明确,网站专题信息集中,剔除了大量不相关的信息,不过对查找中文信息,Google的中文目录太少,只有非常普通简单的类目,可能很难满足要求。
2.2 熟练掌握Google的基本搜索:,,OR ,学会使用两个关键字进行复杂专题信息检索
检索复杂专题依靠单个关键词查准率很低,要提高查全检准率,需进行详细的主题分析,选择多个关键词构造检索式。要分清主要概念和次要概念,去掉被隐含了的概念,确定需要排除的某些概念和不宜选用的泛指概念,以便在制定检索策略时有所侧重,保证检索提问的确切表达。
正确选择关键词,各种类型的检索课题对检索的查全率和查准率有着不同的要求,可以增加上位概念或下位概念的方法来扩检[4],若查准率要求较高,应使用专指性较强的概念或增加限制概念来缩小检索范围,还可通过对字段进行限定的方式来保证查找的准确性。对于那些对查全率和查准率无特殊要求的用户来说,也要针对不同的课题,制定相应的检索策略。
对文献量较大或属于成熟学科的课题,应优先考虑查准率,从众多的相关文献中选取针对性较强的文献。对文献较少或新兴学科的课题,可适当放宽检索范围来保证查全率,以免遗漏重要的参考文献。
选择正确的关键词后,就要运用Google检索语法规则构建检索式。
Google无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。
示例:搜索所有包含关键词“易筋经”和“吸星大法”的中文网页
搜索式:“易筋经 吸星大法”(注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。)
Google用减号“”表示逻辑“非”操作。
示例:搜索所有包含“易筋经”而不含“吸星大法”的中文网页
搜索式:“易筋经 吸星大法”(注意:这里的“”和“”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 吸星大法”,搜索引擎将视为逻辑“与”操作,中间的“”被忽略。)
Google用大写的“OR”表示逻辑“或”操作( 注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询)。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。
示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。
搜索式:“britney OR beatles”
结果:已搜索有关britney OR beatles的中文(简体)网页。共约有14,600项查询结果,这是第110项。搜索用时0.08秒。
搜索式:“布兰妮 OR 披头士”
结果:找不到和您的查询布兰妮 OR 披头士相符的网页。
“”和“”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的信息。可以用两个方法减少无关结果。
( 1)、如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,如“天龙八部 阿修罗”。搜索结果就只有995项,可以直接找到全部八部。
( 2)、如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,如“天龙八部 佛教 金庸”。查询结果为1,010项,可以迅速找到需要的资料。
2.3 熟悉Google的辅助搜索方法:通配符、大小写、句子、忽略字符以及强制搜索 [5]
Google不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。
Google对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
Google的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。
示例:搜索包含“long, long ago”字串的页面。
搜索式:““long, long ago“”
结果:已向英特网搜索“long, long ago“. 共约有28,300项查询结果,这是第110项。搜索用时0.28秒。
注意:和搜索英文关键字串不同的是,Google对中文字串的处理并不十分完善。比如,搜索““啊,我的太阳“”,我们希望结果中含有这个句子,事实并非如此。查询的很多结果,“啊”、“我的”、“太阳”等词语是完全分开的,但又不是“啊 我的 太阳”这样的与查询。
Google对一些网络上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“”。
示例:搜索包含“Who am I ?”的网页。如果用““who am i ?“”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。
搜索式:““who am i“”(注意:英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行 )
结果:已向英特网搜索“who am i“. 共约有362,000项查询结果,这是第110项。搜索用时0.30秒。
2.4 了解Google的高级搜索语法:site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“网站/域名”。
示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。
搜索式:“金庸 site:edu.cn”
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索式:“金庸 古龙 site:sina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第110项。搜索用时0.34秒。
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。
使用“link”语法,将搜索到所有链接到某个URL地址的网页。
示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索式:“link:www.newhua.com”
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被Google忽略。
使用inurl语法,返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索式:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第110项。搜索用时0.01秒。
示例:查找微软网站上关于windows2000的安全课题资料。
搜索式:“inurl:security windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关 inurl:security windows2000的网页。共约有198项查询结果,这是第110项。搜索用时0.37秒。
注意:“inurl:”后面不能有空格,Google也不对URL符号如“/”进行搜索。Google对“cgibin/phf”中的“/”当成空格处理。
使用allinurl语法,返回的网页链接中包含所有查询关键字,这个查询的对象只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。
搜索式:“allinurl:“cgibin“ phf com”
结果:已向英特网搜索allinurl:“cgibin“ phf com. 共约有40项查询结果,这是第110项。搜索用时0.06秒。
allintitle和intitle的用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。
示例:查找日本明星藤原纪香的照片集。
搜索式:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第110项。搜索用时0.03秒。
2.5 Google的罕用高级搜索语法:related,cache,info
related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:www.sina.com.cn/index.shtml”。
cache用来搜索Google服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。
示例:查找和新浪首页相关的一些资讯。
搜索式:“info:www.sina.com.cn”
3 Google的其他重要功能介绍
目录服务 如果不想搜索网页,而是想寻找某些专题网站,可以访问Google的分类目录http://directory.Google.com/”,中文目录是http://directory.Google.com/Top/World/Chinese_Simplified/”。不过由于Google的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少[6]。
工具条 为了方便搜索者,Google提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank、设置拦截弹出广告等。最方便的一点在于用户可以快捷的在Google主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。目前Google主页已提示下载安装Google工具条。
新闻组(USENET)搜索 新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,Google将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,Google还支持新闻组的WEB方式浏览和张贴功能。输入http://groups.Google.com/”后,便进入Google新闻组界面。可惜现在还没有中文界面。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,更推荐使用图形搜索界面,方便而且直观。
搜索结果翻译 曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,Google支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文。只能在英文状态Google下实现这个功能。进入Google的设置页面http://www.Google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤 网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,Google新设立了成人内容过滤功能,见Google的设置页面http://www.Google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的Google尚没有这个功能。
PDF文档搜索 Google提供对PDF文档内文的检索。目前Google检索的PDF文档大约有2500万左右。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索式:“inurldf ecommerce”
下面是某项搜索结果:
[PDF] www.usi.net/pdf/outsoucingecommerce.pdf Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product Marketing Professonial (PMP) Implementation Manager, Web Engineering ... 一般文字档 类似网页
可以看到,Google在PDF档前加上了[PDF]的标记,而且,Google把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索 Google提供了Internet上图像文件的搜索功能!!地址是“images.Google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“刘德华”。 Google给出的搜索结果具有一个直观的缩略图,以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“移除栏框”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。Google还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚扰。
4 Google特殊应用搜索实例介绍:
关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。
4.1 搜索之前先思考 搜索引擎本事再大,也搜索不到网上没有的内容,而且,有些内容虽然存在网上,却因为各种原因,而成为漏网之鱼。所以在你使用搜索引擎搜索之前,应该先花几秒种想一下,我要找的东西网上可能有吗?网页上会含有哪些关键字?
例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索,关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
搜索:“酒贵贱之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡之,故而贱之;醋味厚之,所以贵之。...” 以上的关键字选择技巧可以谓之“特定词法”。
例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。
搜索式:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。 以上的关键字选择技巧可以谓之“近义词法”。
例三:刘德华的胸围是多少。
分析:非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。
搜索式:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高 阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。
以上的关键字选择技巧可以谓之“相关词法”。
4.2 其他常用搜索个案
例一:找人 分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。
例二:找软件 分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
如, 搜索式:“winzip 8.0 下载”
分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索式:“winzip 8.0 inurl:download”
在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。
共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是人,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索式:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第110项。搜索用时0.30秒。
例三:找图片 除了Google提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。
分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索式:““britney spears“ inurlhoto”
结果:已向英特网搜索“britney spears“ inurlhoto. 共约有2,720项查询结果,这是第110项。搜索用时0.23秒。
分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索式:“intitle:“britney spears“ picture”
结果:已向英特网搜索intitle:“britney spears“ picture. 共约有317项查询结果,这是第110项。搜索用时0.40秒。
分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索式:““britney spears“ site:geocities.com”
结果:已在geocities.com内搜索有关“britney spears“的网页。共约有5,020项查询结果,这是第110项。搜索用时0.47秒。
保存在数据库中的记录数据,分结构化的字符,日,数值,等有有限长度或固定格式的数据;还有全文数据如简历,论文等不定长,非固定格式保存的字符型数据。现有数据库系统,都以结构化数据为检索的主要目标,实现相对简单。
搜索引擎的主要特色和功能有:
基本搜索
基本搜索的使用简洁方便,只要在搜索框中输入关键词,按回车键或点击 “搜索”按钮,即可得到所查寻的信息。
什么是关键词
关键词,就是您输入搜索框中的文字,也就是您寻找的东西。
您可以寻找任何内容,所以关键词的内容可以是:人名、网站、新闻
关键词,可以是任何中文、英文、数字,或中文英文数字的混合体。
什么是全文检索
全文检索技术是用来弥补传统数据库字段检索的不足,它采用特别的索引技术,将欲查询的文件资料及资料源,经过索引产生器的浏览而建立成所谓的索引数据库。当我们在进行查询时,系统透过使用者输入的关键词,迅速的从索引数据库中找到我们要的资料,并且条列式的显示出来让我们点选。除此之外,系统搭配许多方便使用者的特性,使我们可以更精确、更快的找到合适的资料。
本站在综合与新闻搜索里提供了全文检索,可以在本站所有静态与动态页面里检索到符合用户查询关键词的结果
网页的相关检索
当您输入关键词进行网页检索时,除得到相应的检索结果之外,本站搜索引擎还为您提供了“相关 检索”功能,它能避免您重复输入检索词的麻烦,大大提高搜索效率,减少您找到有效信息所花 费的时间。
“相关检索”的具体含义是:当您搜索一个关键词时,在结果页面的上方导航栏其它类别的搜索链接里会出现相应的关键字,点击这些链接,您就可以得到相应关键词的搜索结果,无须进入其它类别再输入一遍关键词。
例如,当您在首页搜索“纸业”时,在结果页面的上方导航栏处其它类别的按钮链接里会出现相应的关键字链接,点击某个链接,比如点击“新闻”,就会立即出现 “新闻”的搜索结果页。
对网站进行多个关键词查询:
表示“并且”的关系:当同时匹配多个关键词时,使用空格、“”或“,”。
例如:查询关于铜版纸的信息,则输入关键词“铜版纸”或“铜版纸”。
http://www.paper.com.cn/search/help.php
http://www.paper.com.cn/search/search.php检索页面代码参考:
在全文或其他检索字段中检索关键词或由关键词构成的检索表达式。
方式1、单一数据库的全文检索
单一数据库的全文检索是在选定数据库的所有字段中进行检索,检索的关键词(字)只有一个。检索步骤: ① 选择数据库:进入相应栏目资源总览区直接点击选取数据库,本例选取科技文献栏目的《中国学位论文》数据库;
② 确定检索方式:在数据库检索提问表单的字段选择列表框中按下拉箭头选择“全文”;
③ 输入检索关键词(字):在数据库检索提问表单的关键字输入框中输入关键词(字),比如“电机”;
④ 执行检索:点击“执行”。针对本例,检索系统将在《中国学位论文》数据库中将全文中含有“电机”的记录取出。
方式2、单一数据库的字段级检索
字段级检索是在您所选定的数据库字段中进行检索,检索的关键词(字)只有一个。检索步骤: ① 选择数据库:进入相应栏目资源总览区直接点击选取数据库,本例选取科技文献栏目的《中国学位论文》数据库;
② 确定检索方式:在数据库检索提问表单的字段选择列表框中按下拉箭头选择除“全文”之外的选项,本例选取“题目”;
③ 输入检索关键词(字):在查询关键字输入框中输入第一个检索关键词(字),比如“电机”;
④ 执行检索:点击“执行”。针对本例,检索系统将在《中国学位论文》数据库中将题目中含有“电机”的记录取出。
方式3、单一数据库的高级检索(逻辑检索)
高级检索是在您所选定的数据库用两个关键词进行的检索。检索步骤: ① 选择数据库:进入相应栏目资源总览区直接点击选取数据库,本例选取科技文献栏目的《中国学位论文》数据库;
② 确定第一个关键字的检索方式:在数据库检索提问表单的第一个字段选择列表框中按下拉箭头选择;比如选择“标题”;
③ 输入第一个检索关键词(字):在数据库检索提问表单的第一个查询关键字框中输入关键词(字),比如“电机”;
④ 确定词间关系:在逻辑运算选择列表框中选择“与”、“或”、“非”,比如选择“与”;
⑤ 确定第二个关键字的检索方式:在第二个检索字段列表框中做出选择,比如选择“全文”;
⑥ 输入第二个检索关键词(字):在数据库检索提问表单的第二个查询关键字框中输入关键词(字),比如“汽车”;
⑦ 执行检索:点击“执行”。针对本例,检索系统将在《中国学位论文》数据库中将标题含有“电机”并且全文中含有“汽车”的记录取出。
http://202.114.65.51:85/kjxx/help.html#method3万方数据科技信息子系统检索帮助
[{网络资源}]GOOGLE搜索秘籍全攻略 |周付安 发表于 2005324 10:29:00
[{网络资源}]GOOGLE搜索秘籍全攻略
蚊子 发表于 2005224 4:31:00
一,GOOGLE简介
Google(www.google.com)是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得30多项业界大奖。
二,GOOGLE特色
GOOGLE支持多达132种语言,包括简体中文和繁体中文;
GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;
GOOGLE速度极快,据说有8000多台服务器,200多条T3级宽带;
GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;
GOOGLE的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;
GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;
GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。
三,基本搜索:,,OR
GOOGLE无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。
示例:搜索所有包含关键词“易筋经”和“吸星**”的中文网页
搜索:“易筋经 吸星**”
结果:已搜索有关易筋经 吸星**的中文(简体)网页。共约有726项查询结果,这是第110项。搜索用时0.13秒。
注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。
GOOGLE用减号“”表示逻辑“非”操作。
示例:搜索所有包含“易筋经”而不含“吸星**”的中文网页
搜索:“易筋经 吸星**”
结果:已搜索有关易筋经 吸星**的中文(简体)网页。共约有5,440项查询结果,这是第110项。搜索用时0.13秒。
注意:这里的“”和“”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 吸星**”,搜索引擎将视为逻辑“与”操作,中间的“”被忽略。
GOOGLE用大写的“OR”表示逻辑“或”操作。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。
示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。
搜索:“britney OR beatles”
结果:已搜索有关britney OR beatles的中文(简体)网页。共约有14,600项查询结果,这是第110项。搜索用时0.08秒。
搜索:“布兰妮 OR 披头士”
结果:找不到和您的查询布兰妮 OR 披头士相符的网页。
注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。
“”和“”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。
例:查阅天龙八部具体是哪八部。
分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。
1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。
2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部 佛教 金庸”。
四,辅助搜索:通配符、大小写、句子、忽略字符以及强制搜索
GOOGLE不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。
GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。
GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。
示例:搜索包含“long, long ago”字串的页面。
搜索:“"long, long ago"”
结果:已向英特网搜索"long, long ago". 共约有28,300项查询结果,这是第110项。搜索用时0.28秒。
注意:和搜索英文关键字串不同的是,GOOGLE对中文字串的处理并不十分完善。比如,搜索“"啊,我的太阳"”,我们希望结果中含有这个句子,事实并非如此。查询的很多结果,“啊”、“我的”、“太阳”等词语是完全分开的,但又不是“啊 我的 太阳”这样的与查询。显然,GOOGLE对中文的支持尚有欠缺之处。
GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“”。
示例:搜索包含“Who am I ?”的网页。如果用“"who am i ?"”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。
搜索:“"who am i"”
结果:已向英特网搜索"who am i". 共约有362,000项查询结果,这是第110项。搜索用时0.30秒。
注意:英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
五,高级搜索:site,link,inurl,allinurl,intitle,allintitle
“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“网站/域名”。
示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。
搜索:“金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第110项 。搜索用时0.31秒。
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索:“金庸 古龙 siteina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第110项。搜索用时0.34秒。
注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的。
“link”语法返回所有链接到某个URL地址的网页。
示例:搜索所有含指向华军软件园“www.newhua.com”链接的网页。
搜索:“link:www.newhua.com”
结果:搜索有链接到www.newhua.com的网页。共约有695项查询结果,这是第110项。搜索用时0.23秒。
注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。
inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。
示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第110项。搜索用时0.01秒。
示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurlecurity windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关 inurlecurity windows2000的网页。共约有198项查询结果,这是第110项。搜索用时0.37秒。
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对“cgibin/phf”中的“/”当成空格处理。
allinurl语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgibin/phf”。
语法:“allinurl:"cgibin" phf com”
搜索:已向英特网搜索allinurl:"cgibin" phf com. 共约有40项查询结果,这是第110项。搜索用时0.06秒。
allintitle和intitle的用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。
示例:查找日本明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第110项。搜索用时0.03秒。
GOOGLE的罕用高级搜索语法:related,cache,info
related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:www.sina.com.cn/index.shtml”。
cache用来搜索GOOGLE服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。
示例:查找和新浪首页相关的一些资讯。
搜索:“infwww.sina.com.cn”
结果:有关www.sina.com.cn的网页信息。
新浪首页
北京站 上海站 广东站. ... 游戏世界, │, 影音娱乐, │, Club缘, │, 男
人女人, │, 论坛聊天, │, 时尚潮流, │, 文教育儿, │, 车行天下, │,
软件下载. ...
Google 提供这个网址的信息:
查看Google网页快照里www.sina.com.cn的存档
寻找和www.sina.com.cn类似的网页
寻找网页有链接到www.sina.com.cn
寻找网页包含有`www.sina.com.cn
六,其他重要功能
目录服务
如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录“http://directory.google.com/”,中文目录是“http://directory.google.com/Top/World/Chinese_Simplified/”。不过由于GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。
工具条
为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,可以访问“http://toolbar.google.com/”,按页面提示可以自动下载并安装。
新闻组(USENET)搜索
新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。
输入“http://groups.google.com/”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,所以我点击“Advaced Groups Search”进入高级搜索界面http://groups.google.com/advanced_group_search。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。
搜索结果翻译
曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。
不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面,http://www.google.com/preferences,有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。
搜索结果过滤
网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,http://www.google.com/preferences,最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。
PDF文档搜索
我对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。
示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurldf ecommerce”
结果:已向英特网搜索inurldf ecommerce. 共约有19,200项查询结果,这是第110项。搜索用时0.11秒。
黑客安全技术文章大全http://www.hackbase.com
下面是某项搜索结果:
[PDF]www.usi.net/pdf/outsoucingecommerce.pdf
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字档 类似网页
可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。
图像文档搜索
GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是“images.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚扰。
不过,非常遗憾的是,图像搜索功能还不支持中文。
七,搜索技巧杂谈
关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。
例一:查找《镜花缘》一书中淑士国酒保的酸话原文。
分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵*的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。
搜索:“酒 贵 * 之”,OK,找到的第一条信息就是镜花缘的这一段落:“先生听者:今以酒醋论之,酒价*之,醋价贵之。因何*之?为甚贵之?真所分之,在其味之。酒昧淡之,故而*之;醋味厚之,所以贵之。...”
以上的关键字选择技巧可以谓之“特定词法”。
例二:“黄花闺女”一词中“黄花”是什么意思。
分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。
搜索:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。
以上的关键字选择技巧可以谓之“近义词法”。
例三:刘德华同志的胸围是多少。
分析:首先声明,这是某个MM要我做的搜索,我把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。
搜索:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高 阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。
以上的关键字选择技巧可以谓之“相关词法”。
其他常用搜索个案
例一:找人
分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。
例二:找软件
分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0 下载的中文(简体)网页。共约有6,670项查询结果,这是第110项。搜索用时0.22秒。
分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurlownload”
结果:已搜索有关winzip 8.0 inurlownload的中文(简体)网页。共约有358项查询结果,这是第110项。搜索用时0.44秒。
在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了木马,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。
共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第110项。搜索用时0.30秒。
例三:找图片
除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。
分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“image”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索:“"britney spears" inurlhoto”
结果:已向英特网搜索"britney spears" inurlhoto. 共约有2,720项查询结果,这是第110项。搜索用时0.23秒。
分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索:“intitle:"britney spears" picture”
结果:已向英特网搜索intitle:"britney spears" picture. 共约有317项查询结果,这是第110项。搜索用时0.40秒。
分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“"britney spears" site:geocities.com”
结果:已在geocities.com内搜索有关"britney spears"的网页。共约有5,020项查询结果,这是第110项。搜索用时0.47秒。
例四:找MP3
分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在用这个办法找找老歌“say you say me”。
搜索:“"say you say me" inurl:mp3”
结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第110项。搜索用时0.17秒。
分析二:也可以通过网页标题,找到这类提供MP3的网页。
搜索:“"say you say me" intitle:mp3”
结果:已向英特网搜索"say you say me" intitle:mp3. 共约有178项查询结果,这是第110项。搜索用时0.73秒。
当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。
例五:找书
分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的“www.shuku.net”。于是可以用SITE语法很简单的找到某本书(如果该网站上有的话)。比如,“旧唐书 sitehuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。
分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德 风车 桑乔”迅速找到该书。
九,GOOGLE搜索FAQ
Q:如何全面的了解google.com?
A:查看网站相关页面“http://www.google.com/about.html”。
Q:如何切换google.com的初始语言界面?
A:点击搜索栏右边的“使用偏好”(Preferences),选择“界面语言”(Interface Language)中你望的语言,点击最下面的“设定使用偏好”(Save Preferences)按钮。需要提醒的是,GOOGLE用cookie记录这个偏好,所以如果你把浏览器的cookie功能关掉,就无法进行设定。
Q:如何设定每页搜索结果显示数量?
A:同上,进入使用偏好,在该页的“查看结果”(Number of Results)选择显示结果数,数目越大,显示结果需要的时间越长,默认是10项。
Q:搜索到的链接无法打开怎么办?
A:链接无法打开的原因很多,比如网站当机,或者ISP过滤等,可以点击GOOGLE的“网页快照”查看在GOOGLE服务器上的网页缓存。
Q:打开搜索结果的链接,可是该页面太大,很难找到一下子找到目的资料怎么办?
A:直接打开“网页快照”,GOOGLE会把关键词用不同颜色标记出来,很容易找到.
ROEBIN写这篇文章的目的就在于让一些盲目使用Google的朋友能够减少失误率,提高搜索成功率...
FAQ
1.问题:如果我想精确搜索范围,Google中有那些操作符可以利用,使用这些符号有什么作用?
实际上在使用Google搜索的时候,除了关键字之外,还有很多操作符我们可以利用,这些符号对于精确搜索范围起到相当重要的作用。
请注意:1、以下提到的操作符均应该使用英文、半角。2、因为“空格”也是其中一个操作符,因此操作符“”与关键字之间,不能有空格。3、对于操作符为英文字母的必须大写。
这四个操作符是:空格;OR;;双引号
前三个操作符就是我们常见的“与”“或”“非”。
如我们要搜索如下网页:要求必须含有“搜索引擎”和“历史”,但是没有“文化”,可以含有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛”、“Yahoo”。
搜索条件的写法:搜索引擎 历史 Archie OR 蜘蛛 OR yahoo文化
关于双引号:Google是基于单词搜索的,因此如果你想用一个短语做关键字,必须加双引号,否则其中的“空格”会被当作“与”操作符。
如我们要搜索关于第一次世界大战的英文信息。
搜索条件的写法:"World war I"
2.问题:Google中有通配符可以利用吗?
Google目前可利用的通配符只有“*”。比如,“以*治国”,表示搜索第一个为“以”,末两个为“治国”的短语,中间的“*”可以为任何字符甚至短语。
3.问题:为什么我输入:www的历史 internet 的搜索条件,在实际的结果中“www”和“的”两个关键字都被忽略了,我如何能让这两个关键字有效?
这里实际上涉及了Google分词。当我们搜索“www的历史”的时候,Google实际上把这个短语分成三部分,“www”、“的”和“历史”分别来检索。所以尽管我们输入了连续的“www的历史”,但搜索引擎还是把这个短语当成三个关键字分别检索。并且Google对一些网络上出现频率极高的英文单词,如“i”、“com”、“www”等会做忽略处理。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上英文的“”号。
如搜索条件更改为:www 的历史 internet
这样这两个关键字就起作用了。
4.问题:请问我是否可以从我指定的网站或者网站频道上搜索我想要的内容?
可以通过使用site语法来实现。
如我们要搜索:在著名IT门户网站ZDNET和CNET网站上搜索一下关于搜索引擎技巧方面的资讯。
搜索条件写法:"search engine" tips site:www.zdnet.com OR site:www.cnet.com
注意:site后的冒号为英文字符,而且冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字(这一点同样适合其他语法格式)。此外,网站域名不能有“http://”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。
5.问题:如果我只想搜索特定的二进制文档,可以实现吗?
可以通过使用filetype语法来实现。
目前Google支持的格式有:.xls;.ppt;.doc;.rtf;.pdf;.swf等
如我们要搜索:资产负债表的Office文档。
搜索条件写法:资产负债表 filetype:doc OR filetype:xls OR filetype: ppt
6.问题:我是否可以指定URL链接中的关键字进行搜索?
可以通过使用inurl;allinurl语法来实现。
inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。因为有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、 “GALLARY”等。于是我们就可以用inurl语法找到这些相关资源链接,然后用第二个关键词确定是否有某项具体资料,可以达到精确定位的作用。
如我们要:查找midi格式的“沧海一声笑”。
搜索条件写法为:inurl:midi “沧海一声笑”
allinurl语法返回的网页的链接中包含所有的关键字,这个查询的关键字只集中于网页的链接字符串。
示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGIBIN目录中含有PHF脚本程序,表现在链接中就是“域名/cgibin/phf”。
搜索条件写法:allinurl:”cgibin” phf com
注意:inurl:后面不能有空格,Google也不对URL符号如“/”进行搜索。例如,Google会把“cgibin/phf”中的“/”当成空格处理。
7.问题:我是否可以指定网页标题中的关键字进行搜索?
可以通过使用intitle;allintitle语法来实现,用法类似于inurl和allinurl。只是后者是对URL进行查询,而前者是对网页的标题栏进行查询。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常可以找到相当准确的专题页面。
示例:查找刘翔的照片集。
搜索条件写法:“intitle:刘翔 "照片集"
8.问题:我搜索到了一篇德文的文章,我想了解一下,但是看不懂怎么办?
看看是否有“翻译此页的按钮”,再看结果,应该大致能看明白。目前Google只支持拉丁语、法语、西班牙语、德语和葡萄牙文的翻译。
9.问题:Google查询结果中的“网页快照”不能使用了,怎么办?
可以通过使用cache 语法来实现。 见此文
cache用来搜索Google服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。
- 上一篇: B2B推广信息数据报表建立的原则
- 下一篇: B2B平台开始从信息交易向在线交易方式转变
必看说明
- 本站中所有被研究的素材与信息全部来源于互联网,版权争议与本站无关。
- 本站文章或仅为文本内容原创,非程序原创。如有侵权、不妥之处,请联系站长第一时间删除。敬请谅解!
- 本站所有内容严格遵守国家法律的条例,所有研究的算法技术均来源于搜索引擎公开默认允许用户研究使用的接口。
- 阅读本文及获取资源前,请确保您已充分阅读并理解《访问曹操SEO网站需知:行为准则》。
- 本站分享的任何工具、程序仅供学习参考编写架构,仅可在本地的虚拟机内断网测试,严禁联网运行或上传搭建!
- 任何资源必须在下载后24个小时内,从电脑中彻底删除。不得传播或者用于其他任何用途!否则一切后果用户自负!
- 转载请注明 : 文章转载自 站群程序 搜索引擎语法
- 本文标题:《搜索引擎语法》
- 本文链接:http://www.zqcx.cn/356.html
猜你喜欢
- 2024-10-06 关于SEO的一些真诚思考
- 2023-05-07 相关关键词采集并合成标题工具
- 2022-03-09 本站所有站群程序演示站重建说明
- 2020-12-14 新浪微博头条发文软件绿色版
- 2020-12-14 知乎文章网页cookie版免账号登录
- 2020-11-03 新浪微博批量发帖工具绿色版
- 2020-10-18 外推引流的九个经验分享
- 2020-06-13 售价5000元的搜狗快速收录方法
- 2020-05-02 Linux服务器发动CC(ddos)攻击脚本
- 2020-05-01 CNZZ来源多线程引流工具
你 发表评论:
欢迎- 8094℃遵纪守法:一起举报违法网址
- 7229℃警惕“冒用身份”的电信网络诈骗
- 7215℃备案域名的买卖管控会越来越严,不要尝试!
- 5100℃6月1日是《中华人民共和国网络安全法》实施五周年
- 4527℃违规事件分类与违规信息类型说明
- 4454℃关于严格遵守网络安全法规的公告
- 6440℃百度正打击构造虚假标题等违规站点
- 8176℃「百日行动」“断卡”行动持续发力
- 16125℃懒人开源站群程序V2.4.2:影视模板V2
- 15750℃通过Nginx配置增强网站安全性
- 14665℃多线程批量查询百家号文章存活情况
- 14486℃搜狐号安全系统升级通知
- 12302℃多线程批量查询链接收录情况(免代理)
- 12105℃百家号批量发布软件V1.8.5
- 11290℃企业网站安全漏洞应对:从修复到增强全方位安全新举措
- 8350℃CCSEO原创蜘蛛统计v1.3
- 12-09百家号批量发布软件V2.4.4
- 10-06关于SEO的一些真诚思考
- 08-18罪恶克星:不良网站举报工具填表版
- 05-01多线程批量查询百家号文章存活情况
- 04-22通过Nginx配置增强网站安全性
- 04-22企业网站安全漏洞应对:从修复到增强全方位安全新举措
- 04-21搜狐号安全系统升级通知
- 04-18多线程批量查询链接收录情况(免代理)
- 近期评论
- 文章归档
-
- 2024年10月 (1)
- 2024年8月 (1)
- 2024年5月 (1)
- 2024年4月 (10)
- 2024年3月 (6)
- 2024年1月 (2)
- 2023年12月 (4)
- 2023年11月 (2)
- 2023年10月 (7)
- 2023年9月 (24)
- 2023年8月 (6)
- 2023年7月 (20)
- 2023年6月 (13)
- 2023年5月 (26)
- 2023年4月 (48)
- 2023年3月 (21)
- 2023年2月 (15)
- 2023年1月 (10)
- 2022年12月 (10)
- 2022年11月 (3)
- 2022年10月 (28)
- 2022年9月 (37)
- 2022年8月 (16)
- 2022年7月 (23)
- 2022年6月 (24)
- 2022年5月 (10)
- 2022年4月 (53)
- 2022年3月 (67)
- 2022年2月 (3)
- 2022年1月 (4)
- 2021年12月 (24)
- 2021年11月 (18)
- 2021年10月 (3)
- 2021年9月 (22)
- 2021年8月 (60)
- 2021年7月 (3)
- 2021年6月 (16)
- 2021年5月 (25)
- 2021年4月 (1)
- 2021年3月 (39)
- 2021年1月 (7)
- 2020年12月 (19)
- 2020年11月 (11)
- 2020年10月 (49)
- 2020年9月 (114)
- 2020年8月 (63)
- 2020年7月 (28)
- 2020年6月 (50)
- 2020年5月 (124)
- 2020年4月 (83)
- 2020年3月 (91)
- 2020年2月 (81)
- 2020年1月 (18)
- 2019年12月 (79)
- 2019年11月 (16)
- 2019年10月 (35)
- 2019年9月 (3)
- 2017年12月 (1)
- 2017年11月 (203)
- 2017年10月 (155)
- 标签列表
- 站点信息
-
- 文章总数:2025
- 页面总数:7
- 分类总数:46
- 标签总数:339
- 评论总数:9366
- 浏览总数:5898972
本文暂时没有评论,来添加一个吧(●'◡'●)