项目作者: PornBingo

项目描述 :
SpiderMan: A Powerful Spider System in Python.
高级语言: Python
项目地址: git://github.com/PornBingo/SpiderMan.git
创建时间: 2020-05-17T02:18:38Z
项目社区:https://github.com/PornBingo/SpiderMan

开源协议:MIT License

下载


SpiderMan

一个爬取相关视频的开源爬虫系统。

运行

  1. Python安装

  2. 安装依赖

  1. yum install python-devel mysql-devel gcc
  1. 安装和运行redis
  1. $ wget http://download.redis.io/releases/redis-2.8.3.tar.gz
  2. $ tar xzvf redis-2.8.3.tar.gz
  3. $ cd redis-2.8.3
  4. $ make
  5. $ make install
  6. $ redis-server
  1. 更新配置

配置爬虫的源地址等,如pornhub.com等。

  1. 创建和初始化数据库
  1. mysql> CREATE DATABASE `pornhub` CHARACTER SET utf8;
  1. 启动SpiderMan
  1. python bootstrap.py

TODO

License

Licensed under the MIT License.