`
playfish
  • 浏览: 285518 次
  • 性别: Icon_minigender_1
  • 来自: 福州
社区版块
存档分类
最新评论

三大搜索引擎搜索代码所有参数详解

阅读更多


先说谷歌的,
q--查询的关键词(Query),百度对应的参数为wd
hl--Google搜索的界面语言(Interface Language)
hl=zh-CN简体中文语言界面,我们用的Google中文就是这个参数。
hl=zh-TW繁体中文语言界面,港台地区常使用
hl=en 英文语言界面

start--显示结果的页数,百度对应的参数为pn

lr--搜索内容的语言限定(Language Restrict),限定只搜索某种语言的网页。如果lr参数为空,则为搜索所有网页。
常用的有:
lr=lang_zh-CN只搜索简体中文网页
lr=lang_zh-TW只搜索繁体中文网页
lr=lang_zh-CN|lang_zh-TW搜索所有中文网页
lr=lang_en只搜索英文网页
ie--查询输入文字的编码(Input Encoding),Google缺省设置ie=utf-8,即请求Google搜索时参数q的值是一段utf-8编码的文字,如果要直接使用中文,可以设置ie=gb2312,即为简体中文编码
oe--搜索返回页面的编码(Output Encoding),Google缺省设置oe=utf-8

num--搜索结果显示条数(Number),取值范围在10--100条之间,缺省设置num=10,百度对应的参数为rn
newwindow--是否开启新窗口以显示查询结果。 缺省设置newwindow=1,在新窗口打开网页
safe--安全搜索选项(SafeSearch),设置该参数可以过滤成人内容, 缺省设置safe为空,即不过滤成人内容,设置为safe=vss,即过滤成人内容。这个参数真是让一些人欢喜,让一些人忧。
再说百度的
wd--查询的关键词(Keyword)
pn--显示结果的页数(Page Number)
cl--搜索类型(Class),cl=3为网页搜索

rn--搜索结果显示条数(Record Number),取值范围在10--100条之间,缺省设置rn=10
ie--查询输入文字的编码(Input Encoding),缺省设置ie=gb2312,即为简体中文
tn--提交搜索请求的来源站点
几个有用的tn
tn=baidulocal 表示百度站内搜索,返回的结果很干净,无广告干扰。比如,在百度站内搜索“快乐”,看看返回结果是不是很清爽。
tn=baiducnnic 想把百度放在框架中吗?试试这个参数就可以了,是百度为Cnnic定制的

vs--在限定的域名中搜索,比如想在本站内搜索可使用参数si=www.flymoonblog.cn,要使这个参数有效必须结合ct参数一起使用
ct--此参数的值一般是一串数字,估计应该是搜索请求的验证码
bs--上一次搜索的关键词(Before Search),估计与相关搜索有关
yahoo的代码相对要少得多
ei--查询输入文字的编码(Input Encoding),缺省设置ie=gb2312,即为简体中文
vs--在限定的域名中搜索,比如想在本站内搜索可使用参数si=www.flymoonblog.cn,在yahoo里面这个可以单独使用!
看懂了这些东西之后,你可以设计出更适合你网站的搜索代码,删掉无用代码,更加符合w3c的标准。让你的网站在各个浏览器下都能无BUG运行!
分享到:
评论

相关推荐

    codesearch:真正理解并遵循代码的源代码搜索引擎-Search source code

    一个代码搜索引擎,实际上可以分析并跟踪代码。 它根据查询查找代码行,然后通过添加代码的依赖项和依存关系来构建完整的代码片段,例如将变量声明和用法保持在一起。 搜索功能名称将显示几个用法示例。 这些代码...

    基于lucene的搜索引擎总结

    浅谈网络搜索引擎的实现 知识管理系统网络搜索模块开发实践交流 功能需求 可自定义要搜索的网站列表(以下简称目标列表) 可对目标列表网站的网页内容进行检索 可对目标列表网站的网页内容进行自动分类处理 可自定义...

    基于JAVA的搜索引擎 lucene-2.2.0

    这个构造函数具有三个参数: path :根据一个字符串描述的路径,为建立的索引文件指定存放目录。 a :一个分析器。 create:它是一个boolean型变量,如果为true,表示要重写指定的存放索引目录下的索引文件;如果...

    pdd (拼多多) 爬虫 js 解密 anti_content 参数解密及全站抓取代码思路实现.zip

    爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。 爬虫的工作流程包括以下几个关键步骤: URL收集: 爬虫从一个或多个初始URL开始,递归或迭代地发现新的URL,构建一个URL队列。这些URL...

    Android入门到精通源代码.

    第12章 Android的搜索引擎和Gtalk开发 12.1 搜索引擎在手机中的应用 12.1.1 本地搜索 12.1.2 Web搜索 12.2 Android搜索引擎API简介 12.3 应用实例详解:过滤式搜索 引擎程序 12.3.1 实例分析 12.3.2 实例实现 12.4 ...

    JAVA上百实例源码以及开源项目源代码

     Java二进制IO类与文件复制操作实例,好像是一本书的例子,源代码有的是独立运行的,与同目录下的其它代码文件互不联系,这些代码面向初级、中级Java程序员。 Java访问权限控制源代码 1个目标文件 摘要:Java源码,...

    机器学习算法及python代码详解.zip

    互联网领域----语音识别、搜索引擎、语言翻译、垃圾邮件过滤、自然语言处理等 生物领域----基因序列分析、DNA 序列预测、蛋白质结构预测等 自动化领域----人脸识别、无人驾驶技术、图像处理、信号处理等 金融领域...

    Script Inspector 3.0.23 - 专家级的代码编写插件 Unity3D

    Si3具有定制的高级C#解析和代码分析引擎!由于其新颖的代码分析方法(.Net的反射和增量语法和语义分析技术的混合),Si3可以轻松胜过任何其他IDE(是的,包括Visual Studio!)......文件立即打开!代码更改会立即...

    精易模块[源码] V5.15

    2、添加“文本_朗读”是否使用百度语音引擎参数,为空时默认使用微软语音引擎。 3、改善“文本_加密”与“文本_解密”去除原来算法,改用微软基础加解密API。 4、修复“网页_打印”,无效的BUG,感谢易友【@nameyypx...

    超实用的jQuery代码段

    8.7 打造自己的站内搜索引擎 8.8 异步加载并解析XML文件 8.9 动态加载HTML内容到标签页中 8.10 使用AJAX刷新异步提交表单 8.11 使用AJAX刷新上传图片 8.12 使用AJAX刷新验证PHP会话是否有效 8.13 在AJAX异步调用时...

    Machine_learning_in_action Sample codes 机器学习实战 详解代码.zip

    互联网领域----语音识别、搜索引擎、语言翻译、垃圾邮件过滤、自然语言处理等 生物领域----基因序列分析、DNA 序列预测、蛋白质结构预测等 自动化领域----人脸识别、无人驾驶技术、图像处理、信号处理等 金融领域...

    JAVA上百实例源码以及开源项目

     Java二进制IO类与文件复制操作实例,好像是一本书的例子,源代码有的是独立运行的,与同目录下的其它代码文件互不联系,这些代码面向初级、中级Java程序员。 Java访问权限控制源代码 1个目标文件 摘要:Java源码,...

    java源码包---java 源码 大量 实例

     Java二进制IO类与文件复制操作实例,好像是一本书的例子,源代码有的是独立运行的,与同目录下的其它代码文件互不联系,这些代码面向初级、中级Java程序员。 Java访问权限控制源代码 1个目标文件 摘要:Java源码,...

    imi-ai 一个基于 PHP+Swoole+Vue 的 ChatGPT 开源项目可以简单快速部署

    OpenAI 多文件(压缩)模型训练OpenAI 单文件模型训练聊天 AI 回答问题(可用于问题解答和客服等场景)搜索引擎,可定位文件支持解压文(zip、rar、7z、xz、gz、bz、tar.*)支持解析 txt 文件支持解析 md 文件支持...

    C++网络爬虫项目

    在此之后,搜索引擎会对网页进行解析,抽取网页主体内容,以及页面中包含 的指向其它页面的所谓超链接。 为了加快用户查询的响应速度,网页内容通过 “倒排索引”这种高效查询数据结构来保存,而网页之间的链接关系...

    高端大气的搬家公司企业网站源码

    程序虽然是asp+access开发的,但是不支持小型IIS本地调试,需要使用完整...3、网站程序集成了url自动提交到百度的脚本代码,网站新增加的内容在访客浏览时会自动提交给百度搜索引擎。 演示网站:http://www.1ff2.com/

    Nginx Rewrite使用场景及代码案例详解

    3.搜索引擎SEO优化依赖于URL路径,以便支持搜索引擎录入 4.可以调整用户浏览的URL,看起来更规范,合乎开发及产品人员的需求。 配置语法 rewrite regex replacement [flag]; 4种flag last 停止处理后续rewrite指令集,...

    任丘asp论坛社区 v3.1源代码

    将论坛代码压缩包解开包,保持文件的相对位置,将解压后得到的全部目录、文件包括所有空目录上传到你的服务器上,论坛基本上就可以使用了,您可以进入后台管理设置一些参数。 默认的管理员帐号:admin 前台密码:...

    java开源包8

    AutoTips基于搜索引擎Apache Lucene实现。AutoTips提供统一UI。 WAP浏览器 j2wap j2wap 是一个基于Java的WAP浏览器,目前处于BETA测试阶段。它支持WAP 1.2规范,除了WTLS 和WBMP。 Java注册表操作类 jared jared是...

Global site tag (gtag.js) - Google Analytics