Download the PHP package hanxiaoqingcheng/querylist without Composer
On this page you can find all versions of the php package hanxiaoqingcheng/querylist. It is possible to download/install these versions without Composer. Possible dependencies are resolved automatically.
Download hanxiaoqingcheng/querylist
More information about hanxiaoqingcheng/querylist
Files in hanxiaoqingcheng/querylist
Package querylist
Short Description QueryList是基于phpQuery的无比强大的PHP采集工具
License MIT
Homepage http://querylist.cc
Informations about the package querylist
QueryList简介
QueryList
是一个基于phpQuery
的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。
QueryList 安装
通过composer
安装:
更多安装方法:QueryList多种安装方式
QueryList 使用
下面演示QueryList
用一句代码采集百度搜索结果:
上面的代码实现的功能是采集百度搜索结果页面的所有搜索结果的标题
和链接
,然后分别以二维关联数组的格式输出。
采集结果:
Query() 静态方法
返回值:QueryList对象
Query方法为QueryList
唯一的主方法,用静态的方式调用。
原型:
QueryList::Query($page,array $rules, $range = '', $outputEncoding = null, $inputEncoding = null,$removeHead = false)
中文解释:
参数解释:
查看文档:http://doc.querylist.cc/site/index/doc/11
QueryList 扩展
Request 网络操作扩展
可以实现如携带cookie、伪造来路等任意复杂的网络请求,再也不用担心QueryList内置的抓取功能太弱了。
Login 模拟登陆扩展
可以实现模拟登陆然后采集。
Multi 多线程插件
多线程(多进程)采集扩展。
DImage图片下载扩展
可实现简单的图片下载需求。
扩展安装以及使用教程:QueryList扩展文档,获取更多扩展可以关注QueryList
社区和交流群。
其它说明
1.QueryList
内置的只是简单的源码抓取方法,遇到更复杂的抓取情况,如:需要登陆
身份验证 时,请配合其它的PHP的HTTP工具(推荐使用Guzzle)来使用,通过将辅助的HTTP类抓取到的网页源码传给QueryList
即可。
2.采集程序请在PHP命令行模式(PHP CLI)下运行。
3.QueryList
依赖phpQuery
,phpQuery
项目主页:phpQuery文档
寻求帮助?
- QueryList交流社区: http://querylist.cc/
- QueryList文档: http://doc.querylist.cc/
- Git@OSC:http://git.oschina.net/jae/QueryList
- GitHub:https://github.com/jae-jae/QueryList
Author
Jaeger [email protected]
Lisence
QueryList is licensed under the license of MIT. See the LICENSE for more details.