Python小白怎么入门?这个问题不知道让我怎么回答,因为python可用于多种场景,比如:人工智能呢个、数据分析、数据挖掘、自动化运维、web开发等,都是发展路线。下面介绍一下数据分析的入门及发展学习路线。
0.Python使用工具
1. python基础
2. 数据基础
3. Numpy
4. Pandas
5. Matplotlib
6. 爬虫
7. 机器学习
1.数据分析工具选择
数据分析时,选择一款简单、喜欢的编程工具,将达到事半功倍的效果,这里介绍流行好用的工具
? Pycharm:
PyCharm 是一款功能强大的 Python 编辑器,具有跨平台性,下载地址:https://www.jetbrains.com/pycharm/download/#section=windows
professional 表示专业版,community 是社区版,推荐安装社区版,因为是免费使用的。
? Jupyter notebook、Jupyter Lab
Jupyter Notebook 是一个基于 Web 的交互式计算笔记本环境。(https://jupyter-notebook.readthedocs.io/en/stable/notebook.html)
The notebook extends the console-based approach to interactive computing in a qualitatively new direction, providing a web-based application suitable for capturing the whole computation process: developing, documenting, and executing code, as well as communicating the results. The Jupyter notebook combines two components:
A web application: a browser-based tool for interactive authoring of documents which combine explanatory text, mathematics, computations and their rich media output.
Notebook documents: a representation of all content visible in the web application, including inputs and outputs of the computations, explanatory text, mathematics, images, and rich media representations of objects.
? Vim
Vim是从 vi 发展出来的一个文本编辑器。代码补完、编译及错误跳转等方便编程的功能特别丰富,在程序员中被广泛使用。
? Spyter
Spyder是Python(x,y)的作者为它开发的一个简单的集成开发环境。和其他的Python开发环境相比,它最大的优点就是模仿MATLAB的“工作空间”的功能,可以很方便地观察和修改数组的值。
2.Python基础
学习顺序如下图所示:
一、基础:数据类型和变量、字符串和编码、 列表、元组、字典、条件判断
循环While循环、For循环、循环嵌套、break语句、continue语句、pass语句、日期和时间、正则表达式
二、函数:调用函数、定义函数、函数参数、递归函数
三、高级特性:切片、迭代、列表生成式、生成器、迭代器
四、面向对象:类和实例、继承和多态、获取对象信息、实例属性和类属性
五、错误、调试和测试、错误处理、调试、单元测试、文档测试
六、Python练习题:
Python100例:
菜鸟教程:https://www.runoob.com/python/python-100-examples.html
力扣 (LeetCode) 全球极客挚爱的技术成长平台:
https://leetcode-cn.com/problemset/all/
Python3中文官方文档网址如下:
http://doc.iplaypy.com/python3/
3.Panda(https://www.pypandas.cn/docs/)
Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。
利器之一:DataFrame
DataFrame是Pandas中的一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。
利器之一:Series
它是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。
学习视频:
【全30集】使用 pandas 进行数据分析:Data analysis in Python with pandas】
https://www.bilibili.com/video/av6785636?from=search&seid=15880205862713615709
【莫烦PythonàNumpy&Pandas数据处理教程】
https://www.bilibili.com/video/av16378934?from=search&seid=15880205862713615709
4.Numpy科学计算的基础软件包(https://www.numpy.org.cn/user/setting-up.html)
NumPy是使用Python进行科学计算的基础软件包。除其他外,它包括:
功能强大的N维数组对象。精密广播功能函数。集成 C/C+和Fortran 代码的工具。强大的线性代数、傅立叶变换和随机数功能利器之一:Ndarray
NumPy 最重要的一个特点是其 N 维数组对象 ndarray,它是一系列同类型数据的集合,以 0 下标为开始进行集合中元素的索引。ndarray 对象是用于存放同类型元素的多维数组。ndarray 中的每个元素在内存中都有相同存储大小的区域。
利器之一:切片和索引
ndarray对象的内容可以通过索引或切片来访问和修改,与 Python 中 list 的切片操作一样。ndarray 数组可以基于 0 - n 的下标进行索引,切片对象可以通过内置的 slice 函数,并设置 start, stop 及 step 参数进行,从原数组中切割出一个新数组。
5.Matplotlib
Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形。
为什么选择 Matplotlib?
如果某天你发现自己要学习 Matplotlib, 很可能是因为: 1、Matplotlib 是一个非常强大的 Python 画图工具;2、手中有很多数据, 可是不知道该怎么呈现这些数据。
Matplotlib 能帮你?
绘制线图、散点图、等高线图、条形图、柱状图、3D 图形、、甚至是图形动画等等。
6.爬虫
Beautiful Soup中文教程文档:http://doc.iplaypy.com/bs4/
Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间.
Requests
Requests中文文档 :(http://doc.iplaypy.com/requests/) 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。Requests 允许你发送纯天然,植物饲养的 HTTP/1.1 请求,无需手工劳动。你不需要手动为 URL 添加查询字串,也不需要对 POST 数据进行表单编码。
Scrapy
Scrapy官方中文手册,高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据。Scrapy用途广泛,可以用于数据挖掘、监测和自动化测试...7.数学基础
数据分析进阶版—机器学习
数学基础学习的为:微积分、线性代数、概率论
8.机器学习
机器学习的定义:
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、 逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现 人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构(利用数据 或经验等)使之不断改善自身的性能。
它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的 各个领域,包括网络搜索、垃圾邮件过滤、推荐系统、广告投放、信用评价、欺 诈检测、股票交易和医疗诊断等应用
Copyright © 广州京杭网络科技有限公司 2005-2024 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有