每天都是一大堆的数据导出采集?
从什么地方导出来,需要导出来的数据是什么格式的?说不清楚很难给你一个准确的方式的。不过从大多数的情况来看,使用python的话,通用性更高,可个性化的程度也非常高。
从网页导出数据到excel可以使用requests库直接下载数据,然后使用xlwings库保存到excel的工作簿中。当然如果数据源提供了接口就更为简单一点,不然就还要用BS4去进行解析数据才能保存。
从别的软件中导出数据先向软件商了解下,是否有公用的接口可以获取到数据,接口的文档也要拿来看一下,然后就照着文档的要求提出申请就行了。
如果没有接口,可以拦截一下封包,看看是不是明文的。如果是的话也可以通过拦截封包获取数据再生成表格。
如果是加密的话,就放弃吧。如果页面是比较干净的那种的话,还能考虑用ocr识别,不过出错的几率还是比较大的,万不得已不要用。
Copyright © 广州京杭网络科技有限公司 2005-2024 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有