Download the PHP package xinrui5577/beanbun without Composer
On this page you can find all versions of the php package xinrui5577/beanbun. It is possible to download/install these versions without Composer. Possible dependencies are resolved automatically.
Table of contents
Download xinrui5577/beanbun
More information about xinrui5577/beanbun
Files in xinrui5577/beanbun
Download xinrui5577/beanbun
More information about xinrui5577/beanbun
Files in xinrui5577/beanbun
Vendor xinrui5577
Package beanbun
Short Description 老版本2018年4月份没有维护了.有bug,自己fork分支,自己维护,原来:Beanbun 是用 PHP 编写的多进程网络爬虫框架,具有良好的开放性、高可扩展性
License MIT
Package beanbun
Short Description 老版本2018年4月份没有维护了.有bug,自己fork分支,自己维护,原来:Beanbun 是用 PHP 编写的多进程网络爬虫框架,具有良好的开放性、高可扩展性
License MIT
Please rate this library. Is it a good library?
Informations about the package beanbun
说明
这是对Beanbun的运行中的更新.原始版本很久没更新.在linux 服务器运行有bug ,$count 属性不存在.php版本 7以下. 根据自己运行需求.把几个问题修改了下.PHP版本升级到php7+,依赖库也升级了下.把Parser集成都一个项目,反正都要解析. 后续如果有问题在更新
一下是原始信息:
简介
Beanbun 是一个简单可扩展的爬虫框架,支持分布式,支持守护进程模式与普通模式,守护进程模式基于 Workerman,下载器基于 Guzzle。
特点
- 支持守护进程与普通两种模式(守护进程模式只支持 Linux 服务器)
- 默认使用 guzzle 进行爬取
- 支持分布式
- 支持内存、Redis 等多种队列方式
- 支持自定义URI过滤
- 支持广度优先和深度优先两种爬取方式
- 遵循 PSR-4 标准
- 爬取网页分为多步,每步均支持自定义动作(如添加代理、修改 user-agent 等)
- 灵活的扩展机制,可方便的为框架制作插件:自定义队列、自定义爬取方式...
安装
Beanbun 可以通过 composer 进行安装。
快速开始
创建一个文件 start.php,包含以下内容
在命令行中执行
接下来就可以看到抓取的日志了。
插件
- beanbun-parser 数据抽取插件 https://github.com/kiddyuchina/beanbun-parser
更多详细内容,请查看 文档
All versions of beanbun with dependencies
PHP Build Version
Package Version
Requires
php Version
>=7.0
workerman/workerman Version ^3.5
guzzlehttp/guzzle Version ^6.3
jaeger/querylist Version ^4.1
workerman/workerman Version ^3.5
guzzlehttp/guzzle Version ^6.3
jaeger/querylist Version ^4.1
The package xinrui5577/beanbun contains the following files
Loading the files please wait ....