数据来源于http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2013/index.html
用到的开源库:phpQuery https://github.com/punkave/phpQuery
第一步:完整的down来源网址中的所有html页面
这个用的php写的小程序抓的,file_get_contents函数为主导,while循环检测down的可靠性。来源网址中的页面均为gb2312,需转码,同时将html中的相关编码me
第二步:读down完的本地页面,phpQuery读取生成数组,写成分省、市、县、镇、村的json文件
第三部:读json文件写入mysql
----
分享一个库是小事,用php(其实我是基于Tp写的代码)从html里抓数据的过程才是王道。
----
下载地址:http://blog.jjonline.cn/soft/J_Position/ajing.sql.gz
导入到mysql可能出现的问题解决方案:
http://blog.jjonline.cn/linux/116.html
详细介绍:http://blog.jjonline.cn/phptech/172.html
最佳答案
