这里简单介绍2个中文分词包,一个是jieba,一个是snownlp,这2个中文分词包都可以完成中文分词、词性标注、关键词提取等功能,下面我简单介绍一下这2个包的安装和使用,实验环境win10+python3.6+pycharm5.0,主要内容如下:
jieba中文分词:这个大部分人都应该听过,应用比较广泛,可以完成常见的词性标注、关键词提取,使用起来非常方便,下面我简单介绍一下这个库:
1.安装jieba,这个直接在cmd窗口输入命令“pip install jieba”就行,如下:
2.安装完成后,就可以进行简单的测试了,测试代码如下,这里完成了分词、词性标注、提取关键词的功能:
程序运行截图如下,已经成功分词、标注词性及提取关键词:
snownlp中文分词:这也是一个中文分词包,所有算法都是作者自己实现,可以快速处理中文文本,包括分词、分句、词性标注、情感分析、关键词提取、tf、idf等,下面我简单介绍一下这个库:
1.安装snownlp,这个直接在cmd窗口输入命令“pip install snownlp”就行,如下,可能需要等待一会儿:
2.安装完成后,我们就可以进行简单的从测试了,主要代码如下,包括分词、词性标注等功能:
程序运行截图如下:
至此,我们就完成了jieba和snownlp这2个中分分词包的介绍和使用。总的来说,整个过程很简单,只要你有一定的python基础,熟悉一下相关示例和代码,很快就能掌握的,当然,你也可以使用其他中分分词包,像hulac,corenlp等,网上也有相关教程和资料,感兴趣的可以搜一下,希望以上分享的内容能对你有所帮助吧,也欢迎大家评论、留言。
首先,我们从Python的前世今生说起
Python是著名的吉多·范罗苏姆“龟叔”Guido van Rossum在1989年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言。(太无聊了,无聊到想敲代码了!!!!)
无聊起来敲代码,这可不是随便人都能干的。主要原因是,早些年龟叔就曾经编写过一种语言ABC(人家可是有底子的)。ABC是由龟叔参加设计的一种教学语言,就龟叔本人看来,ABC 这种语言非常优美和强大,是专门为非专业程序员设计的(后来证明,一切都是自我感觉良好)。
如你所猜,ABC语言并没有获得成功的机会,究其原因,龟叔也想明白了,非开放性是ABC最大的问题。
痛定思痛,无聊到和自己都过不去了,龟叔在荷兰阿姆斯特丹,为了打发圣诞节的无趣,决心开发一个新的脚本解释程序,作为ABC 语言的一种继承。于是,Python诞生了,龟叔决心在Python 中避免一些错误,同时,实现一些在ABC中闪现过的念头但未曾实现的东西(所谓亡羊补牢,为时不晚,圣诞节都不过了,也要弥补ABC的不足,与其说是无聊,不如说是想的太多。(圣诞节对于西方来说,重要程度类似我们的春节))。
那Python为什么和大蟒蛇有关系?其实,Python的英文意思就是:蟒蛇,巨蟒。至于为什么用这个名字命名新的语言,主要是龟叔太喜欢一个喜剧片了,名字就取自英国20世纪70年代首播的电视喜剧《蒙提·派森的飞行马戏团》(Monty Python's Flying Circus)。
就这样,Python在龟叔手中诞生了。
其次,我们再谈谈Python的设计理念Python的设计哲学是“优雅”、“明确”、“简单”。Python旨在“用一种方法,最好是只有一种方法来做一件事”。这与蟒蛇的特性有相似之处:蟒蛇捕食时常慢慢爬行接近猎物,迅速咬住后用身体缠绕致死,并压扁成长条形,然后分泌唾液,使食物润滑吞食。(动作优雅,目标明确,方法简单,效果杠杠的)
最后,我们谈谈编程语言现在,全世界差不多有600多种编程语言了吧,但流行的编程语言也就那么20来种。了解TIOBE的话,你可以知道所有编程语言的排名变化,那不妨看看近十几年的变化情况。至于Python为什么火,我们别的问题再来探讨。
Python本来就是外国人发明的,更何况中文不适合编程,要是真的英语很渣很渣记单词不行可以试试中文编程软件。
Python其实只是看起来复杂难懂(就比如你看到某程序猿电脑屏幕上全是你看不懂的乱码,你会觉得,哇好酷),但说白了,它就是一种编程语言,一种电脑的语言,你学明白了自然可以轻松的阅读代码,这是一种成就感,满足感。
它本身也不难,只需要记住一些重要的单词,初学者可以去b站上看看那些up主的视频,一行行的去看懂它,然后一行行抄写来,久而久之就记住了
对我来说,英语不是我最大的难关,反而是那些格式,细节什么的,比如什么时候要加个点,写完注释忘了切换输入法之类的。
无论学什么东西都要讲一份耕耘一份收货,学习没有捷径,学编程有很好的前景,加油(? ??_??)?
Python是一种面向对象的解释型计算机程序设计语言,由荷兰人Guido van Rossum于1989年发明,第一个公开发行版发行于1991年。
Python是纯粹的自由软件, 源代码和解释器CPython遵循 GPL(GNU General Public License)协议。
Python语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进。
Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)很轻松地联结在一起。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),然后对其有特别要求的部分,用更合适的语言改写,比如3D游戏中的图形渲染模块,性能要求特别高,就可以用C/C++重写,而后封装为Python可以调用的扩展类库。
需要注意的是在您使用扩展类库时可能需要考虑平台问题,某些可能不提供跨平台的实现。不过目前Python应用领域还是非常广的。
我也在提升这方面,零基础的话还是要从基础开始学习,我也看过不少的入门资料,还是比较推荐百战程序员的Python400集,特别适合初学者上手,而且讲的都是干货,这么多内容还都是免费的,可以说是非常实在了。你可以去看看,也可以对Python的性能有个更深入的了解。如果是兴趣,学完这些完全可以自己做些小项目了。
总结,以上就是关于python怎么读中文谐音以及python常见的中文分词包含哪些?应该怎么使用的经验分享,卡友有疑问可以加wx或扫码加群!Copyright © 广州京杭网络科技有限公司 2005-2025 版权所有 粤ICP备16019765号
广州京杭网络科技有限公司 版权所有