爬虫用哪个好?
假如这里你同时有python与java的基础,而且还挺不错的(没错 是我)。
首推scrapy因为python用起来很舒服。
然后heritrix是比较适合整站直接爬取的框架。
WebCollector比较适合做有精准抽取抽取业务的爬虫,适合做二次开发。
写最后 ,就假如你是准备在爬虫上有所建树,建议先不用框架吧。这些框架太优秀了,你可能还没弄懂爬虫怎么运行的数据就抓下来了。你一定知道的 基础是很重要
Copyright © 广州京杭网络科技有限公司 2005-2025 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有