太原PHP培训
达内太原php培训中心

0351-5608878

热门课程

2016Python爬虫+PHP网站+Xunsearch搜索引擎

  • 时间:2016-10-20
  • 发布:Linux视野
  • 来源:Linux视野

2016Python爬虫+PHP网站+Xunsearch搜索引擎

今天太原php培训机构就为大家带来一些知识福利,希望可以对大家有所帮助,使大家更上一层楼。

源码简介

适用范围:百度云网盘 搜索引擎 源码,百度 搜索引擎 源码,网盘搜索 爬虫 源码

运行环境:PHPMYSQL

其他说明:分享的是一款 搜索引擎 源码,百度云盘 爬虫 源码,Python百度云网盘搜索引擎 爬虫 +网站,搜索引擎采用Xunsearch高效搜索,源码很简单,附带安装教程,可二开,这里吾爱免费分享给大家,全自动更新百度云盘内容,全自动采集哦!

# 爱百应 - 百度云搜索引擎,安装部署教程

## 运行环境

开始之前你需要安装

* PHP 5.3.7 +

* MySQL

* Python 2.7 ~

* [xunsearch](http://xunsearch.com/) 搜索引擎

## 获取源码

```

git clone git@github.com:k1995/BaiduyunSpider.git

```

或手动下载

```

https://github.com/k1995/BaiduyunSpider/archive/master.zip

```

下载完毕后,___项目的目录结构___大致是这样的

```

--- indexer/ #索引

--- spider/ #爬虫

--- sql/

--- web/ #网站

--- application/

--- config/ # 配置相关

--- config.php

--- database.php # 数据库配置

...

...

--- static/ # 存放静态资源,css|js|font

--- system/

--- index.php

...

```

## 开始部署

### 创建数据库

创建名为`pan`的数据库,编码设为`utf-8`。然后导入`sql`,完成表的创建。

### 网站部署

支持`nginx``apache` 服务器。

__apache__ 需要开启 *mod_rewrite*

__nginx__ 配置如下

```

location /

{

index index.php;

try_files $uri $uri/ /index.php/$uri;

}

location ~ [^/]\.php(/|$)

{

fastcgi_pass 127.0.0.1:9000;

fastcgi_index index.php;

include fastcgi.conf;

include pathinfo.conf;

}

```

#### 配置文件修改

`config.php` 文件修改网站标题,描述等信息

`database.php` 修改数据库账号,密码等信息

> 网站是基于CodeIgniter 框架开发的,如安装,部署,或二次开发有问题,请参考[官网文档]( http://codeigniter.org.cn/user_guide/general/welcome.html)

### 启动爬虫

进入 `spider/`目录,修改`spider.py` 中数据库信息。

__如果你是第一次部署,需运行下面命令,完成做种__

```

python spider.py --seed-user

```

上面其实就是抓取百度云热门分享用户的相关信息,然后从他们开始入手爬取数据

然后运行

```

python spider.py

```

此时爬虫已经开始工作了

### 安装xunsearch

目前使用__xunsearch__作为搜索引擎,后面会更换为`elasticsearch`

安装过程请参考(不需要安装,PHP SDK,我已经整合到web里了)

http://xunsearch.com/doc/php/guide/start.installation

### 索引数据

上面我们完成了爬虫的数据抓取,网站的搭建,但还不能搜索,下面开始最后一步,索引的建立。

进入 `indexer/`目录,在`indexer.php`中将$prefix,替换为你web的根路径

```

require '$prefix/application/helpers/xs/lib/XS.php';

```

并修改数据库账号密码

然后运行

```

python ./index.php

```

到此为止程序已全部安装完毕

今天就给大家讲这么多吧,喜欢我的内容可以关注或者分享(微信公众平台:tytedu)选择太原达内培训,不再孤军奋战,轻轻松松做IT高薪白领。太原达内培训带领有明确目标的学子迈向成功之路!

上一篇:PHP 中使用 Redis
下一篇:Web版勒索软件JapanLocker,PHP源码已上传至GitHub

太原php培训资源站

太原PHP编程开发并发编程槽与坑

Php开发规划自己的路

太原php培训老生常谈php

选择城市和中心
贵州省

广西省

海南省

台湾