主要思路

Linux系统：

手机端：

1.微信撤回消息实现原理

我们先来了解一下微信撤回消息的原理：

其实微信撤回消息原理就是操作者在点击撤回的时候，客户端会自动发一条系统消息：“xxx撤回了一条消息”，然后对方app端收到消息后解析，替换原消息，改个显示的样式即可

猪哥给大家演示一下正常消息和撤回消息的内容到底有什么区别：
正常消息：Content='你好骚啊'，大家留意一下MsgId='8784390488772995470'

撤回消息：Content是一串xml格式的内容

我们在下面把它格式化看看

<sysmsg type="revokemsg">
  <revokemsg>
    <session>xxx</session>
    <oldmsgid>1090336364</oldmsgid>
    <msgid>8784390488772995470</msgid>
    <replacemsg><![CDATA["猪哥" 撤回了一条消息]]></replacemsg>
  </revokemsg></sysmsg>

分析上面撤回的Content字段我们发现<msgid>8784390488772995470</msgid>的id与我们之前发送消息的id是一致的，而<replacemsg>这个标签也验证了我们的猜想，确实是用新消息替换原消息。

2.找到被撤回消息

根据抓取正常消息和撤回消息的内容我们发现规则：撤回消息中会包含之前被撤回的那条消息的msgid，那我们只要找到之前那条消息就可以了，而wxpy模块默认为我们缓存了最近的200条消息，所以我们只要遍历这些历史消息然后比较msgid就可以找到被撤回的那条消息啦！
如果你微信消息太过频繁，2分钟之内消息数量超过200，则可以将max_history设置大些。

3.转发被撤回消息

原理也搞懂了，被撤回的消息也找到了，就差最后一步转发消息了，如果你之前玩过wxpy肯定会了吧，只要一行代码就可以将消息转发：

msg.forward(bot.file_helper)

4.代码

原理和过程讲完了，代码贴出来给大家看看，注释还是比较详细，有不懂得话可以在学习群中问我。

四、功能验证

五、总结

微信消息防撤回功能实现简单，但实用性很好，目前项目的唯一缺点就是易用性差，简单说就是我们还没有将项目部署服务器，每次使用都得打开电脑然后运行还得一直开着，猪哥考虑后面将项目部署在云服务器上或者打包成apk，这样就使用起来就非常方便了，而且还可以把apk发给朋友，让朋友也体验此功能！

学会这招，再也不用好奇对方到底撤回了啥消息，快下载项目试试吧！下载项目后可直接运行不需要修改代码！

Github项目地址：https://github.com/pig6/wxrobot
wxpy官方文档：https://wxpy.readthedocs.io/zh/latest

代码截止2018-06-25测试无误。

T_T这个脚本是完全合法无害的，只不过把自己收到的所有消息全部缓存下来，以防止别人撤回消息后自己看不到罢了。

不过应该也没人会无聊到把脚本放服务器上跑来监视自己的好友有没有撤回消息吧~~~

所以就纯当技(无)术(聊)交(取)流(乐)了？

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python爬取豆瓣读书的一些数据，并对这些数据做一定的分析。

标题可能改成类似“大数据时代如何科学有效地阅读”这样的题目更加引入瞩目吧，hhhhh。

——>

对过程不感兴趣的同学可以直接下拉到最后看结果~~~

主要思路

利用Python的requests模块和beautifulsoup模块来爬取豆瓣读书的数据，并对这些数据做一定的分析。

爬取的数据包括：

豆瓣图书各个分类中所有书籍的'书名', '作者/译者', '出版信息', '星级', '评分', '评价人数', '简介', '相应的豆瓣链接'。

例如：

同时，通过爬取的豆瓣链接对具体书籍的质量做一定的分析，分析包括：

制作热评词云、对热评进行简单的情感分析。

有需要者可自行修改源代码进行更多的数据分析。

说明

（1）因为豆瓣严格限制爬虫，且实际使用时也没有必要爬取所有分类的图书资料，给豆瓣服务器带来不必要的压力，因此我给出的源代码一次仅能爬取一个小类的图书资料，且为单进程。

（2）在相关文件中，本人已经提供了爬取到的上百个分类的几万本图书数据，供有需要者参考。

PS：

建筑、漫画、日本漫画、耽美这四个小类的数据写入excel时抛出异常，因此暂时无法提供数据。

开发工具

Python版本：3.5.4

相关模块：

requests模块、jieba模块、BeautifulSoup模块、openpyxl模块、matplotlib模块、wordcloud模块、snownlp模块以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

前期准备

以chrome浏览器为例。

使用演示1

演示内容：

爬取某个小类所有相关书籍基本信息。

截图如下：

按照提示进行输入，输入完成后按下回车键即可。

最后结果将保存在results文件夹中：

结果展示1

分析内容为：

挑选其中几类利用excel的统计功能对获得的数据进行简单的分析。

以名著类为例：

评分分布图：

评分Top10：

世界童话名著连环画

坂田荣男围棋全集（共12册）

世界文学名著连环画欧美部分（全十册）

三国演义

细说红楼梦 1-80回

世界文学名著连环画（亚非部分全五册）

算术探索

三国演义(绘画本1-5)

四大名著（套装全4册）

红楼梦

热度（评论人数）Top10：

围城

不能承受的生命之轻

红楼梦

百年孤独

简爱

傲慢与偏见

飘

月亮和六便士

边城

霍乱时期的爱情

更多内容请自行下载相关文件中提供的数据根据个人喜好进行分析选择。

使用演示2

演示内容为：

对具体书籍制作豆瓣热评词云并对豆瓣热评进行简单的情感分析。

截图如下：

链接地址都保存到了excel表中，复制粘贴即可。

如下图所示：

结果展示2

分析内容为：

爬取豆瓣读书中具体一本书的前20页短评，并制作成词云，同时对这些短评进行简单的情感分析。

以《统计学习方法》为例：

词云：

情感分析：

数值较大说明情感偏积极，否则情感偏消极。

本人不是专业做数据分析的~~~

所以分析的有些稚嫩~~~

欢迎专业人士指导补充~~~

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python为自己喜欢的音乐制作专属词云。至于词的来源嘛，当然是对应歌曲的所有评论或者热门评论啦！！！毕竟网易云音乐最得意的大概就是那些刷了我朋友圈n多遍的评论了吧~~~

主要思路

利用Python爬取网易云音乐中相应歌曲的所有评论，并利用这些评论制作歌曲的专属词云。

具体过程见相关文件中的源代码。

开发工具

Python版本：3.5.4

相关模块：

requests模块、jieba模块、scipy模块、wordcloud模块、pycrypto模块、selenium模块以及一些Python自带的模块。

chromedriver_win32版本：2.3.4

chrome版本：65.0.3298.4

环境搭建

（1）安装Python（添加到环境变量）并pip安装相关模块；

（2）安装chrome浏览器，并将相关文件中提供的chromedriver.exe文件放在python安装文件夹中的Scripts文件夹内。

PS：

（1）若chromedriver.exe文件放在其他文件夹，则需将对应文件夹路径添加到环境变量中！

（2）部分相关模块我在相关文件中提供了编译好的whl文件，使用pip+whl文件路径+whl文件名安装即可。

使用方式

在cmd窗口运行并根据提示输入就可以啦~~~

使用演示

利用歌曲热门评论制作词云：

利用歌曲所有评论制作词云：

（1）因为是单进程，所以当评论较多时生成图云的速度会比较慢，因此请慎重选择用所有评论制作词云（昨天晚上多线程跑到一半被封了T_T）；

（2）后续会有更多关于网易云音乐的内容，这算是初次试水吧，毕竟要从自己最喜欢的东西做起。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

翻了翻之前关于爬虫的文章。。。

似乎一直在欺负小网站，没什么挑战性。。。

那么，就来“试水”一波TX吧~~~

本着细水长流（偷懒）的原则T_T，这期文章我决定拆成两篇写。第一篇主要解决QQ空间的登录问题并尝试抓取一些信息，第二篇致力于抓取QQ空间的好友信息并做可视化分析。

让我们愉快地开始吧~~~

开发工具

Python版本：3.6.4

相关模块：

requests模块；

selenium模块；

lxml模块；

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块，并前往：

http://npm.taobao.org/mirrors/chromedriver/

下载与自己使用的Chrome浏览器版本对应的驱动文件，下载完毕后将chromedriver.exe所在文件夹添加到环境变量中即可。

原理简介

本文主要解决QQ空间的登录问题。

其主要思路为：

利用selenium模拟登录QQ空间从而获取登录QQ空间所需的cookie值，这样就可以利用requests模块来抓取QQ空间的数据了。

为什么这么绕？

selenium好久不用，写起来太慢了。而且它本身速度和资源占用等问题一直为大家所诟病。

And 省略无数条理由。

一些细节：

（1）第一次获取cookie之后将其保存下来，下次再登录之前先试试保存的cookie有没有用，有用直接使用就可以了，这样可以进一步节省时间。

（2）抓包分析过程中，可以发现抓取QQ空间数据所需请求的链接都包含g_tk这个参数，这个参数实际上是使用cookie中的skey参数计算获得的，懒得打公式了，直接贴一小段代码吧：

最后：

不抓点数据好像不能证明这篇文章真的有用？

好吧，那就把：

扒下来吧~~~

具体实现过程详见相关文件中的源代码。

使用演示

QQ号(username)和密码(password)：

在QQ_Spider.py文件中填写，位置如下图所示：

运行：

在cmd窗口运行QQ_Spider.py文件即可。

结果：

That's All.

下期预告

在本期基础上抓取好友的个人信息，并可视化分析抓取的结果。有兴趣的小伙伴可以提前试试~~~

事实上，微调本文所提供的代码，理论上是可以抓取QQ所有用户的信息的。当然，只是理论上，以及干很多有趣的事情。

T_T作为一个不搞事且不爱喝茶的boy，上述的理论我就不负责实现了。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

内容回顾：

Python爬取QQ空间信息（上）

按照（上）中的安排，本期内容为抓取QQ空间的好友信息并做可视化分析。

不过图省事，我只抓取了我关心和关心我的好友信息。

那就让我们愉快地开始吧~~~

开发工具

Python版本：3.6.4

相关模块：requests模块；selenium模块；lxml模块；pyecharts模块；以及一些Python自带的模块。

环境搭建

同Python爬取QQ空间信息（上）。

pyecharts模块安装参见：

Python简单分析微信好友。

原理简介

T_T

空间都登录了，剩下的就是分析数据包，找到需要的接口来获取需要的数据并分析呗。。。

PS：

公众号提供的脚本只能抓取你有权限访问的数据。换句话说，就是你能看到的合法数据。

所有脚本仅供学习交流。

其他你们想的很美的要求，想想就行了T_T

具体实现过程详见相关文件中的源代码。

使用方式

在cmd窗口运行QQ_Spider.py文件即可。

结果展示

借了一个玉树临风、面如冠玉、仪表不凡的小哥的QQ号做的分析QAQ。

qq好友男女比例：

qq好友年龄分布：

qq好友位置分布：

That's All.

代码截止2018-06-03测试无误。

事实上，本文提供的脚本可抓取的好友信息并不是仅有结果展示中的那些：

T_T我只是懒得一个个可视化了。。。

So，有兴趣的朋友可以自己去可视化好友的其他信息。嗯，就这样吧。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python简单爬取美团美食板块商家数据。。。

其实一开始我是想把美团的所有商家信息爬下来的，这样就可以美其名曰百万数据了。。。

然而相信很多爬过美团的朋友都发现了。。。

如果不进行一些小操作。。。

爬不了几页代码就GG了。。。

后来想想我要这么多数据也没什么用。。。

唯一对我有用的。。。

大概就是美食板块了。。。

以后用到其他板块的时候再另外爬就好了。。。

OK，Let's go!

主要思路

目的：

根据输入的城市名，爬取该城市美团美食板块所有商家的数据。数据包括：

店名、评分、评论数量、均价、地址，

并将这些数据存入Excel中。

最后尝试对爬取到的数据做一个简单的分析。

克服反爬虫：

爬取每页数据后，随机停止一段时间后再爬下一页；

每页使用不同的cookie值。

具体原理：

没用抓包软件。。。

Chrome打开后看了下xhr。。。

发现直接有接口可以用。。。

给个cookie就能返回所需的数据了。。。

后来随便点了几个其他板块的网页。。。

发现也差不多是这个套路。。。

详细的实现过程见源代码。

开发工具

Python版本：3.5.4

相关模块：requests模块；win_unicode_console模块；openpyxl模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

使用演示

在cmd窗口运行MT_Cate_Spider.py文件即可。

简单分析

其实在码字的时候我临时加的这个部分。。。

原因很简单。。。

我想强调爬虫和数据分析结合的重要性。。。

数据不多，懒得写代码分析了。。。

利用Excel的数据分析功能简单分析一波吧~~~

用的上海地区的数据。

首先当然是按照评分排个序，然后做成柱状图：

然后是评论数量排个序，做成柱状图：

然后再做点其他有趣的图案：

OK，That's all!

如果有需要，我会写一个爬取美团所有商家信息的脚本，因为就如之前所说。。。

貌似都有直接可以用的接口。。。

所以还算比较简单。。。

只要弄到足够多的cookie值就好了。。。

当然这个Flag应该是要到我实在没东西写或者懒得重新踩点的时候才会去实现了吧。。。

就这样吧~~~

有兴趣的朋友可以试着去抓其他板块的数据。。。

貌似挺easy的。。。

小心别被封了就好了。。。

代码截止2018-02-25测试无误。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

T_T 愚人节似乎不宜出门？

那就爬波猫眼电影看看有什么值得看的电影？

于是T_T

大概是没什么技术含量的~~~

Let's Go！！！

开发工具

Python版本：3.6.4

相关模块：openpyxl模块；requests模块；win_unicode_console模块；bs4模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

主要思路

目的：

爬取http://maoyan.com/films中的电影信息：

其中要爬取的内容为：

电影名、电影评分、电影介绍页链接以及电影简介。

思路：

先爬取电影名、电影评分和电影介绍页链接，再根据电影介绍页链接爬取电影简介。

这么算下来，一页30部电影，需要31个requests。

结果只是为了爬这么点数据，效率可想而知T_T

最后把爬到的数据存入Excel中。

具体实现方式详见相关文件中的源代码。

补充说明

（1）cookies.py文件中的cookie获取方式

按上图所示方式获得cookie值后填入cookies.py文件的相关位置中：

第一个Cookies列表是不含登录信息的cookie；

第二个login_Cookies列表是含登录信息的cookie。

含登录信息的cookie获取方式和不含登录信息的cookie获取方式相同，但是需要事先在网页上登录（登录选项在网页的右上角）。

（2）关于猫眼的反爬虫

猫眼电影的反爬虫机制十分到位。T_T

首先是对于非登录用户，你只能查看前100页的电影信息。其次，如果你的请求过于频繁，是会被封的：

经过测试，得到的结论如下：

设置随机的时间间隔并不有效防止ip被封；

更换cookie值无法防止ip被封；

爬取20页左右的电影数据后代码就GG了等等。

没有仔细研究猫眼电影是如何识别爬虫的。

但是可以感觉出其识别机制很智能。

比如我被封之后想尝试通过更换ip解决，但是我发现更换ip地址之后可以获取的数据量竟然比前一个ip少了很多。

因此，本人提供的正版源代码没有想过和猫眼的维护人员斗智斗勇，只是加了个随机的时间间隔。可以爬取的数据量在25页左右。选个电影而已，不想搞这么复杂。斗智斗勇的结果可能就是验证码输入越来越麻烦，给网站带来不必要的压力，影响正常用户的使用体验等等。弊大于利。

反爬虫解决方案

为了不让爬虫爱好者失望，还是稍微提一下吧~~~

网上关于反爬虫机制的解决方案很多，比如使用代理池之类的等等。

本人只是针对猫眼电影信息爬取过程中存在的反爬虫机制提出一项解决方案。

方案很简单，它不就是想让我们输入验证码来证明我们是人嘛~~~那就证明给它看咯。

简单测试后可以发现：

只要把识别之后的验证码和一些其他参数以post的方式请求：

http://maoyan.com/films?__oceanus_captcha=1

这个链接就可以解除ip封锁~~~

很简单。

我在相关文件中提供了一个测试版本（test.py）。

至于验证码获取的接口以及验证码如何自动识别，我就不一一介绍了，测试版本里也没有（源代码里获取验证码的接口只是临时接口，所以不是一个普适的版本）。。。

感兴趣的同学可以自己研究一下~~~

挺简单的，方案也很多T_T，但是为了避免别人滥用我就不公布最终的验证码破解版本了。

使用演示

在cmd窗口中运行MY_Spider.py文件即可。

如下图所示（爬取20页数据）：

其中9分以上的电影有：

摔跤吧！爸爸

战狼2

小萝莉的猴神大叔

厉害了，我的国

寻梦环游记

霸王别姬

速度与激情7

红海行动

神秘巨星

疯狂动物城

冰雪奇缘

泰坦尼克号

看不见的客人

泰坦尼克号3D

速度与激情8

奇迹男孩

缝纫机乐队

夏洛特烦恼

战狼

湄公河行动

蝙蝠侠：黑暗骑士

九品芝麻官

头号玩家

唐人街探案2

前任3：再见前任

帕丁顿熊2

公牛历险记

辛德勒的名单

一个人的课堂

智取威虎山

你的名字。

英雄本色

二十二

美国队长2

刀剑神域：序列之争

银河护卫队

变形金刚4：绝迹重生

我的少女时代

春光乍泄

闪光少女

熊出没·变形记

羞羞的铁拳

芳华

捉妖记

建军大业

侏罗纪世界

熊出没·奇幻空间

寻龙诀

末日崩塌

老炮儿

熊出没之熊心归来

比得兔

恋爱回旋

南极之恋

追龙

银河护卫队2

滚蛋吧！肿瘤君

美人鱼

唐人街探案

阿凡达

拆弹·专家

魔兽

钢铁侠3

蓝精灵：寻找神秘村

至爱梵高·星空之谜

爱在记忆消逝前

碟中谍5：神秘国度

傲娇与偏见

That'all~~~

看电影去了~~~

代码截止2018-04-01测试无误。

若日后猫眼电影有较大更新，源代码将仅供参考。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python“简单地”抓取并分析一下天气数据。

T_T翻了翻公众号之前文章。。。

很少有把重点放在数据可视化分析上。。。

所以算是填补一下之前的空白吧~~~

Let's Go!

开发工具

Python版本：3.6.4

相关模块：PIL模块；requests模块；pyecharts模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

额外说明：

pyecharts模块安装时请依次执行以下命令：

pip install echarts-countries-pypkg

pip install echarts-china-provinces-pypkg

pip install echarts-china-cities-pypkg

pip install pyecharts

若安装过程中出现：

'utf-8' codec can't decode byte 0xb6

或者类似的编码错误提示。

可尝试修改Python安装文件夹下如下图所示路径下的__init__.py文件的第75行代码：

修改为下图所示内容：

主要思路

利用国家气象局和百度天气查询API接口来获取当前天气数据，主要包括温度、湿度、气压等。

获取相关数据之后利用pyecharts模块和PIL模块对数据进行可视化分析。

具体实现过程详见源代码。

结果展示

使用：

在cmd窗口中运行analysis.py文件即可。

要画什么图把对应的函数调用注释去掉就好啦：

结果：

（打开相关文件中的html文件查看效果更佳，到处点一点有惊喜~~~）

（1）全国部分城市空气质量

（2）天气预报简图

（3）部分城市气温柱状图

（4）部分城市气温折线图

（5）部分城市相对气压饼图

（6）部分城市气温分布图

（7）北京城市湿度

（8）南京天气信息雷达图

有些是为了画图而画图了，所以看起来逻辑很怪T_T

代码截止2018-04-08测试无误。

Echarts作为百度开源的一个数据可视化 JS 库，功能还是十分强大的，有兴趣的朋友可以尝试去绘制一些其他有趣的图表。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

进入正题，利用Python爬取房价信息并进行简单的数据分析。好久没发爬虫相关的内容了，想想还是抽空过来发一篇吧~~~

Ok，让我们开始吧~~~

开发工具

Python版本：3.6.4

相关模块：openpyxl模块；requests模块；bs4模块；pyecharts模块；以及一些python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

pyecharts模块安装可参考：

Python简单分析微信好友

原理简介

需求：

根据输入的城市名获取该城市的房价信息；

对获得的数据进行简单的分析。

目标网站：

链家网（https://dl.lianjia.com/）

目标数据（图中圈出的）：

实现思路：

很基础的爬虫，不需要任何分析。直接请求需要的网页地址，然后利用bs4模块解析请求返回的数据并获取所需的信息即可。

然后再对这些信息进行简单的分析。

其中信息保存到Excel中，分析时读取即可。

具体实现细节详见相关文件中的源代码。

数据爬取演示

在cmd窗口运行Spider.py文件后根据提示输入相关的信息即可。

视频演示如下：

数据分析

以北京为例：

北京房价(元/平方）：

北京房价（万元/套起）：

emmmm，算了，不分析了吧。

更多扎心的画图分析可参考：

Python抓取并分析天气数据

代码截止2018-05-06测试无误。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

似乎好久没有更爬虫相关的内容了。。。

而好多童鞋对爬虫相关的内容比较感兴趣。。。

于是打算更一波。。。

最近事情比较多，实在没有时间重新踩点。。。

翻了下之前的文章，发现自己似乎说过以后还会继续爬网易云音乐相关的内容。。。

既然如此，那就顺水推舟更一波吧~~~

刚好不需要重新踩点T_T。。。

Let's go！

主要思路

目的：

制作简单的网易云音乐下载器。

至于这个下载器的是否可以“此处省略不可描述的内容”，你自己试试看咯~~~

功能：

根据提示输入歌曲名后下载该歌曲。

下载的歌曲数量不大于9首。

选取方式为类似上图所示的搜索结果的前9首歌曲。

若搜索结果不足9首则全部下载。

具体思路详见源代码。

开发工具

Python版本：3.5.4

相关模块：

requests模块、pycrypto模块以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

PS：

相关文件中提供了编译好的pycrypto模块whl文件。

使用演示

重要说明：

代码截止2018-02-24测试无误，若日后网易云音乐官网有较大更新，源代码将仅供参考。

如有其它疑问可后台私信我！

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

又是一年春运，很多地方的火车/高铁票依旧一票难求~~~于是，大家应该明白我推出这个小项目的缘由了吧~~~

项目内容

（1）利用python实现火车/高铁票查询功能；

（2）利用python实现抢火车/高铁票功能；

（3）对上述两项基本功能进行优化；

（4）最后将两项功能集成到一个Demo，供所有专业/非专业人士使用。

PS:

本项目不提供细致入微的教学（如有疑问可后台私信咨询），仅讲解主要思路、环境搭建、使用方式以及最终代码（含详细注释）。

本期内容

实现项目内容中的前两项。

开发工具

python版本：3.5.4

chromedriver_win32版本：2.3.4

chrome版本：65.0.3298.4

项目内容1

主要思路：

构建相关的URL请求，并对返回的JSON数据进行解析处理最后显示即可。

其中值得一提的有：

（1）需要对特殊的URL发送请求来获得输入车站的字母代号；

（2）车票余量查询的URL有两个，任意某时刻两个URL中仅有一个是有效的。

环境搭建：

安装python3.5.4（添加到环境变量）并pip安装相关第三方库即可。

使用方式：

使用演示：

最终代码：

见相关文件。

项目内容2

主要思路：

其实无非是利用splinter库，来实现模拟登陆、查询、订票等操作。换句话说只要找到相关的控件名称即可，具体流程可以参考相关文件中的源代码，我都做了详细的注释。

值得一提的有：

（1）出发地和目的地不是直接输入的页面值，需要在cookie中查出；

（2）验证码需要手动输入。

环境搭建：

安装python（添加到环境变量）并pip安装相关的第三方库，最后将相关文件中提供的chromedriver.exe文件放在python安装文件夹中的Scripts文件夹内。

使用方式：

在下图所示的代码段中填写相关信息：

确认无误后在cmd中运行即可。

其中cookie值查找方式如下图：

使用演示：

输入验证码后其余操作均将自动进行：

抢到票之后我们需要手动打开12306官网或者官方APP在未完成订单中进行支付后购票：

最终代码：

见相关文件。

下期预告

主要完成项目内容3。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

在“python抢火车票（上）”一文中我们完成了项目内容1和项目内容2，即利用python实现火车/高铁票查询功能以及利用python实现抢火车/高铁票功能，今天我将带大家完成项目内容3，即对项目内容1和项目内容2进行优化。

本期任务

完成项目内容3，即对项目内容1和项目内容2进行优化。

开发工具

python版本：3.5.4(64bit)

chromedriver_win32版本：2.3.4

chrome版本：65.0.3298.4

项目内容3

主要改进：

（1）出发地和目的地cookie值自动生成，无需再手工查找；

（2）将项目内容1和项目内容2功能进行合并；

（3）使用方式更加简便与人性化；

（4）增加了抢票成功后语音提示功能；

（5）避免了更多由于用户非法输入引起的程序异常；

（6）增加了抢票成功后邮件提示功能，但由于邮件发送容易失败所以我将该部分代码注释掉了，有需要者可自行修改（最后做成Demo时我会添加邮件提示功能的）。

具体原理请参考相关文件中的源代码，本人已进行了较为详细的注释。

环境搭建：

安装python（添加到环境变量）并pip安装相关的第三方库，最后将相关文件中提供的chromedriver.exe文件放在python安装文件夹中的Scripts文件夹内。

使用方式：

在cmd中运行后根据提示输入相关信息即可。

使用演示：

（1）查询功能：

（2）抢票功能：

抢到票之后我们需要手动打开12306官网或者官方APP在未完成订单中进行支付后购票：

最终代码：

见相关文件。

下期预告

完成项目内容4并进一步对代码进行优化。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

在之前的“教你如何用Python实现抢火车票功能（上）、（中）”两文中我们基本完成了项目要求的功能，今天我们来完成项目的最后一部分内容即将两项功能集成到一个Demo，供所有专业/非专业人士更加方便地使用。

本期任务

完成项目内容4。

开发工具

python版本：3.5.4

chromedriver_win32版本：2.3.4

chrome版本：65.0.3298.4

项目内容4

相关模块：

requests模块、splinter模块、PIL模块以及python自带的一些基本模块。（相关模块均使用pip安装即可）

相对之前版本的变动：

（1）可视化界面；

（2）车次不再使用纯数字，可直接输入需要抢票的车次名（如G163），使用更加方便；

（3）暂时废除了邮件提示功能（太不稳定了）。

具体原理请参考源代码！

环境搭建：

安装python（添加到环境变量）并pip安装相关的第三方库，最后将相关文件中提供的chromedriver.exe文件放在python安装文件夹中的Scripts文件夹内。

使用方式：

在cmd窗口运行即可。

界面展示：

最终代码：

见相关文件。

使用演示

（1）查询功能

（2）抢票功能

需手动输入验证码：

抢到票之后我们需要手动打开12306官网或者官方APP在未完成订单中进行支付后购票：

使用说明

（1）乘客名输入格式为：

xxx(学生)或者xxx，其中()使用英文输入法；

多名乘客时请输入xxx，xxx，xxx，其中，使用中文输入法。

xxx代表人名！！！

（2）日期输入格式为：

year-month-day，例如2018-01-20。

（3）类型输入格式为：

字母a代表全部；

字母g代表高铁；

字母d代表动车；

字母k代表快速；

字母t代表特快；

字母z代表直达。

注意字母均为小写。

（4）车次输入格式为：

数字0代表任意车次，其他按照正确的车次名输入即可，如G163等等。

若输入的车次不存在，则系统抢票时将抢任意车次。

（5）其他：

输入正确的用户名、密码和出发地与目的地即可。

（1）这只是V1.0版本，还有很多缺陷和不足之处，为调试和修改方便，且避免程序出现其他意外的错误，暂时不提供.exe版本；

（2）此版本至2018-01-12日为止是有效的，若日后12306官网有较大更新，则此代码将仅供参考；

（3）尽量每年抢票季对版本进行更新升级，供抢票回家的小伙伴使用；

（4）若发现代码有错误之处或者其他问题请后台联系我。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

T_T并不玩这些游戏。。。

单纯来蹭个热点。。。

大概是因为蹭热点需要的技术含量比较低？

就这样吧~~~

利用Python制作命令行版的王者荣耀出装小助手。

Let's Go！

开发工具

Python版本：3.6.4

相关模块：requests模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

主要思路

爬的是《英雄联盟盒子》这个APP。用Fiddler抓包找到需要的Get请求地址即可。。。

不过显示的Get请求很长，在浏览器里测试一下，把不需要的参数都去掉。

总之就是很简单的抓包。得到的三个URL：

爬虫主要的流程是：

（1）获得英雄ID；

（2）获得所有的装备信息；

（3）根据英雄ID和装备信息来获得英雄的详细信息，包括英雄简介和推荐出装。

顺手也把所有英雄的照片爬下来了，增加点代码量。

PS：

因为不想手机和电脑来回截图，麻烦而且估计也没什么人看T_T。

所以就文字叙述吧~~~

过几天有时间我会出个APP抓包教程在公众号菜单栏中进行分享T_T，想看就看~~~

具体实现过程详见源代码。

使用演示

抓取英雄照片：

在cmd窗口运行Get_Heros_Pic.py文件即可。

小助手：

在cmd窗口运行Helper.py文件即可。

视频演示：

代码截止2018-03-15测试无误。

若该盒子日后有较大更新，代码将仅供参考。

有兴趣的朋友可以去抓点其他数据~~~

总之这个APP还是很好抓的~~~

虽然感觉实用价值不高T_T。。。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

再次更新一下抖音视频批量下载脚本。

就不一一回复了~

参考文献

https://github.com/loadchange/amemv-crawler

开发工具

Python版本：3.6.4

相关模块：requests模块；ipaddress模块；click模块；以及一些Python自带的模块。

Nodejs版本：10.7.0-x64

环境搭建

Step1：

安装Python并添加到环境变量，pip安装需要的相关模块；

Step2：

安装nodejs(小白一路next就行，相关文件里提供了安装包，或者自己去官网下载)。

原理简介

第一个接口：

https://api.amemv.com/aweme/v1/discover/search/?cursor=0&keyword={}&count=10&type=1&device_id={}&aid=1128&app_name=aweme&version_code=162&version_name=1.6.2

keyword后的{}：输入的抖音号，

device_id后的{}：随机产生的设备id。

请求该接口可以获得以下信息：

uid、aweme_count、unique_id。

第二个接口：

https://www.amemv.com/share/user/{}

{}：请求第一个接口获得的uid。

请求该接口可以获得以下信息：

dytk。

第三个接口：

https://www.amemv.com/aweme/v1/aweme/post/?user_id={}&max_cursor=0&count={}&aid=1128&_signature={}&dytk={}

user_id后的{}：uid(由接口一得)；

count后的{}：aweme_count(由接口一得)；

_signature后的{}：根据uid算出来的，计算方式参考了参考文献；

dytk后的{}：dytk(由接口二得)。

请求该接口可以获得以下信息：

该抖音号的所有视频下载链接。

最后：

根据获得的视频下载链接下载抖音视频即可。

具体的代码实现请参考相关文件中的源代码，代码量不大，就100行左右，核心代码量更少。

使用方式

在cmd窗口运行douyin.py文件即可。

别忘了需要先安装Nodejs！！！

视频演示如下：

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

抖音貌似最近几个月都很火。。。

虽然我不玩T_T。。。

但是我还是决定来蹭个热点。。。

利用Python批量下载抖音视频。。。

但愿能蹭到热点吧。。。

Let's Go！

开发工具

Python版本：3.6.4

相关模块：requests模块；bs4模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

主要思路

根据输入的用户抖音号（T_T是叫抖音号吧？）获取该用户发布的所有视频并下载下来。

所有的数据都可以用现成的API接口链接获取。

所以代码思路基本没有什么好讲的。。。

代码量不到100行，相信大家都能看懂。。。

具体的实现过程详见源代码。

使用演示

在cmd窗口运行douyin_Spider.py文件即可。

视频演示如下：

点击链接查看视频

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

不久前，我们制作了网易云音乐下载器。。。

但是网易云音乐无版权的歌曲利用那个下载器也是无法下载的。。。

这时候就需要再搞一波事情。。。

譬如：

利用Python制作酷狗和QQ音乐下载器。。。

其他的T_T我就不多说了。。。

开发工具

Python版本：3.6.4

相关模块：requests模块，以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

原理简介

QQ音乐下载器：

分析网页数据之后可以找到下面三个接口：

第一个接口需要根据歌曲名构造完整链接来搜索需要下载的歌曲信息；

第二个接口需要根据第一个接口返回的信息来构造完整链接来获取歌曲下载地址的部分信息；

第三个接口即为歌曲下载地址，需要根据前两个接口获取的信息来构造完整链接。

具体的实现过程见相关文件中的源代码。

酷狗音乐下载器：

分析网页数据之后可以获得以下两个接口：

利用方式类似于QQ音乐下载器，但比QQ音乐下载器简单一些。第二个接口需要第一个接口返回的哈希值来构造完整链接，然后请求第二个接口就可以获取歌曲的下载链接。

具体的实现过程见相关文件中的源代码。

使用演示

QQ音乐下载器：

在cmd窗口运行QQ_Downloader.py文件即可。

演示如下图所示：

酷狗音乐下载器：

在cmd窗口运行KG_Downloader.py文件即可。

演示如下图所示：

代码截止2018-03-19测试无误。

若QQ音乐和酷狗音乐日后有较大更新，代码将仅供参考。（本人不予维护。）

请合理使用，代码仅供大家学习与交流参考用途。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python下载音悦台MV~~~

没别的，就是为了下载一首《末班车》翻唱BY林俊杰的MV~~~

当然这只是对我而言的~~~

你完全可以使用这个脚本下载音悦台其他MV~~~

Let's Go!

开发工具

Python版本：3.6.4

相关模块：click模块；requests模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

主要思路

MV的ID就是MV播放页链接后面的那串数字：

根据输入的播放页面链接获取MV的ID，根据这个ID请求一个接口链接即可获取MV的下载地址，然后下载就可以了。。。

很简单~~~

至于为啥要用脚本下T_T，当然是因为不能直接下载所以才出此下策呀！！！

具体思路详见相关文件中的源代码~~~

使用演示

在cmd窗口运行Yinyuetai.py文件，根据提示输入相关信息即可~~~

视频演示：

不小心把声音录进去了，点击观看时请注意场合！！！

代码截止2018-04-03测试无误。

若日后音悦台网站有较大更新，代码将仅供参考。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

之前好像有人问怎么用python下载B站的视频，于是今天稍微研究了一下，发现还是挺简单的，于是过来分享一波。

让我们愉快地开始吧~

开发工具

Python版本：3.6.4

相关模块：requests模块；contextlib模块；以及一些Python自带的模块。

其他工具：ffmpeg

环境搭建

Python：

安装Python并添加到环境变量，pip安装需要的相关模块；

Ffmpeg：

解压相关文件中提供的“ffmpeg.zip”文件，将解压后获得的文件夹内的bin文件夹路径添加到环境变量中，例如：

原理简介

FLV视频格式(科普一下)：

FLV(Flash Video)是Adobe公司设计开发的一种流行的流媒体格式，由于其视频文件体积轻巧、封装简单等特点，使其很适合在互联网上进行应用。此外，FLV可以使用Flash Player进行播放，而Flash Player插件已经安装在全世界绝大部分浏览器上，这使得通过网页播放FLV视频十分容易。FLV封装格式的文件后缀通常为“.flv”。

(摘自：https://blog.csdn.net/leixiaohua1020/article/details/17934487)

分析：

随便点开一个B站的视频，发现在网页元素里有一个

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python简单地预测一下NBA比赛结果。。。

这大概就叫蹭热度吧。。。

毕竟貌似今天朋友圈都在刷NBA相关的内容。。。

虽然我并不能看懂。。。

但这并不妨碍我瞎预测一波。。。

So,

以下内容纯属瞎玩，如有雷同，算我倒霉。。。

NBA忠实球迷请自动忽略不好结果。。。

主要思路

（1）数据选取

获取数据的链接为：

https://www.basketball-reference.com/

获取的数据内容为：

每支队伍平均每场比赛的表现统计；

每支队伍的对手平均每场比赛的表现统计；

综合统计数据；

2016-2017年NBA常规赛以及季后赛的每场比赛的比赛数据；

2017-2018年NBA的常规赛以及季后赛的比赛安排。

（2）建模思路

主要利用数据内容的前四项来评估球队的战斗力。

利用数据内容的第五项也就是比赛安排来预测每场比赛的获胜队伍。

利用方式为：

数据内容的前三项以及根据数据内容的第四项计算的Elo等级分作为每支队伍的特征向量。

Elo等级分介绍（相关文件中有）：

为方便起见，假设获胜方提高的Elo等级分与失败方降低的Elo等级分数值相等。

另外，为了体现主场优势，主场队伍的Elo等级分在原有基础上增加100。

（3）代码流程

数据初始化；

计算每支队伍的Elo等级分（初始值1600）；

基于数据内容前三项和Elo等级分建立2016-2017年常规赛和季后赛中每场比赛的数据集；

使用sklearn中的LogisticRegression函数建立回归模型；

利用训练好的模型对17-18年常规赛和季后赛的比赛结果进行预测；

将预测结果保存到17-18Result.CSV文件中。

开发工具

Python版本：3.5.4

相关模块：pandas模块、numpy模块、sklearn模块以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

使用演示

在cmd窗口运行Analysis_NBA_Data.py文件即可：

结果：

文章的初衷是为了让公众号推送的关于Python的小项目涉及的应用领域更加丰富多彩。从而激发部分Python初学者的学习热情，仅此而已。

这篇文章的技术含量并不高，模型简单，数据处理方式也比较随意。。。

可以优化的地方大概包括：

增加训练数据（如多利用几年数据）；

优化训练模型（如sklearn中其他机器学习方法或者利用深度学习框架搭建相应的网络进行模型训练）。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

T_T之前似乎发过类似的文章，那时候是用Keras实现的，现在用的PyTorch，而且那时候发的内容感觉有些水，于是我决定。。。

好吧我确实只是为了写点PyTorch练手然后顺便过来水一篇美文~~~

利用Python实现图像风格的迁移！！！

不喜欢过程同学的依旧可以直接下拉到最后看结果~

Let's Go!

参考资料

链接：

http://pytorch.org/tutorials/advanced/neural_style_tutorial.html#

是的，这又是来自于PyTorch官网的一个教程。

在相关文件中我依旧提供了我翻译好的版本~~~

以及涉及到的论文~~~

开发工具

Python版本：3.6.4

相关模块：torch模块；PIL模块；matplotlib模块；torchvision模块；以及一些Python自带的模块。

torch版本：0.3.0

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

补充说明：

PyTorch暂时不支持直接pip安装。

有两个选择：

（1）安装anaconda3后在anaconda3的环境下安装（直接pip安装即可）；

（2）使用编译好的whl文件安装，下载链接为：

https://pan.baidu.com/s/1dF6ayLr#list/path=%2Fpytorch

额外说明

T_T相关文件中提供了所需的预训练模型，若嫌弃官网的下载速度，可以下载我的。

下载之后放到类似下图路径的文件夹中：

原理简介

作为一个纯正的非艺术生，抱歉我真的没法解释什么叫图像的艺术风格。反正齐白石和梵高的画肯定不是一个style的就是了。

那么我来尝试解释一下风格迁移吧：

风格迁移的实质是保留原画内容的基础上，用另外一种style来呈现原画。

那么如何量化呢？

简单而言大概是这样的：

利用CNN逐层提取图像的特征（层越靠后提取出的特征越高级和稳定，即更能表现图片的高级语义信息），并且将某一层或某几层输出的Gram矩阵作为损失函数，来衡量两幅图像之间的内容/风格差异（T_T就是两幅图像分别经过相同的卷积神经网络，比较某一层或者某几层输出的Gram矩阵的差异）。

Gram矩阵是啥？？？

具体而言，其计算方式为：

我们都知道，一张图片在某个卷积层的输出特征为一个形如(batch_size, channels, width, height)的四阶张量，显然batch_size为1。

我们将类似下图的特征：

转换为(batch_size*channels, width*height)大小的矩阵，这个矩阵和它的转置相乘就可以得到一个大小为(batch_size*channels, batch_size*channels)的矩阵，这个矩阵即为Gram矩阵。

其实这就算是定义了图像风格和图像内容这两个概念了，接下来我们就可以实现风格迁移了。

其流程大概是这样的：

具体的实现细节详见源代码吧~~~

相关文件中也有官网教程的个人翻译版以及相关的论文供感兴趣者参考。

使用方式

修改下图所示处的图片路径为自己的图片路径：

在cmd窗口运行Neural_Transfer.py文件即可。

由于资源和时间有限，下面展示的结果我都只跑了几百轮左右，图像大小为256*256。

梵高笔下的皮卡丘

原图像：

生成的图像：

梵高笔下的老北京

原图像：

生成的图像：

毕加索笔下的爱因斯坦

原图像：

生成的图像：

齐白石笔下的西湖

原图像：

生成的图像：

利用其他库实现的图像风格迁移：

1.基于python深度学习库DeepPy的实现：

https://github.com/andersbll/neural_artistic_style

2.基于python深度学习库Caffe的实现：

https://github.com/fzliu/style-transfer

3.基于python深度学习库TensorFlow的实现：

https://github.com/log0/neural-style-painting

感兴趣的朋友自己去实现一下吧~~~

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

T_T没有科研梦想的人半夜过来水篇文章~~~

让Python学会写写歌，创创作~~~

纯属娱乐~~~

改编自PyTorch官网的一个教程，不过我用TF写的，然后生成英文变成了生成中文~~~

Let's Go~~~

开发工具

Python版本：3.6.4

相关模块：tensorflow-gpu模块；numpy模块；以及一些Python自带的模块。

其中TensorFlow-GPU版本为：

1.6.0

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

原理简介

关于RNN的介绍，请参考我之前的文章：

Python实现简单的机器翻译模型（点击蓝字进入）

这里我们使用Char RNN模型进行训练。

即Seq2Seq模型中的特殊情况输入与输出等长。

也就是类似下图的样子（图源网络）：

具体实现过程详见相关文件中的源代码。

使用演示

在cmd窗口运行Char_RNN.py文件并根据提示输入相关信息即可。

训练相关的参数请在config.py文件中调整：

训练所用的数据路径以及生成新文本所用的预热数据请在Char_RNN.py文件中调整：

训练演示视频：

因为时间太长了，我只录了训练的前面一部分。

最终训练结果如下图所示：

结果展示

因为时间和资源有限。

这里只展示周杰伦的所有歌词作为样本进行训练之后测试的结果。

当然你完全可以找其他文本作为训练语料来生成风格各异的“文章”，“歌词”等等~~~

结果如下：

（预热歌词为：是曾与你躲过雨的屋檐）

好吧我并不知道它在说啥T_T

一个失败的案例T_T

大概是模型太low了。而且训练数据是我从网上直接下载的，也没有预处理过T_T。中间竟然突然冒出一个括号我也是颓了T_T

随便玩玩的T_T~~~

有兴趣的同学可以试着换更复杂的模型~~~

然后训练的语料最好处理一下~~~

好久没写TF了，代码可能写的有点糟糕T_T

就这样吧~~~

MySQL Date 函数

定义和用法

DATE_ADD() 函数向日期添加指定的时间间隔。

语法

DATE_ADD(date,INTERVAL expr type)

date 参数是合法的日期表达式。expr 参数是您希望添加的时间间隔。

type 参数可以是下列值：

Type 值
MICROSECOND
SECOND
MINUTE
HOUR
DAY
WEEK
MONTH
QUARTER
YEAR
SECOND_MICROSECOND
MINUTE_MICROSECOND
MINUTE_SECOND
HOUR_MICROSECOND
HOUR_SECOND
HOUR_MINUTE
DAY_MICROSECOND
DAY_SECOND
DAY_MINUTE
DAY_HOUR
YEAR_MONTH

实例

假设我们有如下的 "Orders" 表：

OrderId	ProductName	OrderDate
1	Jarlsberg Cheese	2008-11-11 13:23:44.657

现在，我们想要向 "OrderDate" 添加 45 天，这样就可以找到付款日期。

我们使用下面的 SELECT 语句：

SELECT OrderId,DATE_ADD(OrderDate,INTERVAL 45 DAY) AS OrderPayDate
FROM Orders

结果：

OrderId	OrderPayDate
1	2008-12-26 13:23:44.657

MySQL Date 函数

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python简单品读/分析一下小说~~~

T_T纯属娱乐~~~

如有雷同，不甚荣幸~~~

Let's Go~~~

不想看过程的请直接下拉到最后看结果~~~

开发工具

Python版本：3.6.4

相关模块：gensim模块；jieba模块；scipy模块；snownlp模块；matplotlib模块；numpy模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

额外说明：

pip下载速度过慢：

临时/永久换源~~~（百度上就有很多教程T_T）

pip安装失败：

到类似https://www.lfd.uci.edu/~gohlke/pythonlibs/这样的网站下载whl文件安装。

主要思路

（1）小说主要人物分析

统计每个角色在小说中出现的次数，并假设出现的次数越多，人物在小说中的地位越高。

（2）小说人物关系分析

利用gensim生成一个词向量模型来分析人物关系。

T_T这个模型是Google在2013年开源出来的，具体实现细节还没来得及看，算不上深度学习，只是浅层的神经网络~~~

（3）小说情感分析

主要利用了snownlp库。

具体实现过程详见源代码。

补充说明

分析小说之前需要先到相关网站下载小说的文本文件并新建一个含有小说中所有人物名的文本文件。

修改源代码（analysis.py）中的：

if __name__ == '__main__':（98行）

下面的小说文件路径后在cmd窗口中运行即可。

Python品红楼

T_T首先让我们看看这本我看了20年也只看了前3页的中国古典四大名著之首！！！

主要人物（Top10）：

前面几个名字还是挺耳熟的？？？

人物关系图：

也不晓得靠谱不，聚类得到的图~~~

T_T随手还得出了这样的结论（逃）：

小说整体的情感基调（消极or积极？）：

以0.5为界，左边代表消极，右边代表积极~~~

这么极端的嘛T_T

Python品天龙八部

T_T只看过电视剧~~~

主要人物（Top10）：

可能有些地方是乔峰，有些地方是萧峰的原因吧，毕竟我觉得乔峰才是主角呀！

人物关系图：

以及随手得出的结论：

T_T毁三观啊~~~

小说整体的情感基调（消极or积极？）：

Excuse me???

不玩了T_T

以上内容纯属不专业不科学纯娱乐的分析~~~

有兴趣的可以去分析一下其他小说T_T

说不定可以得到令人震惊的结论~~~

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python对照片中人脸进行颜值预测！！！

至于结果的可靠性.......

本人概不负责！！！

对结果不满意或者因为结果分数过低而想不开者，请自行联系xxxPh.D.。也就是此颜值预测算法的提出者！！！本人只是部分复现了他的算法！！！

以上和以下内容纯属玩笑，如有雷同，不甚荣幸。

所需工具

Python版本：3.5.4(64bit)

相关模块：

opencv_python模块、sklearn模块、numpy模块、dlib模块以及一些Python自带的模块。

环境搭建

（1）安装相应版本的Python并添加到环境变量中；

（2）pip安装相关模块中提到的模块。

例如：

若pip安装报错，请自行到：

http://www.lfd.uci.edu/~gohlke/pythonlibs/

下载pip安装报错模块的whl文件，并使用：

pip install whl文件路径+whl文件名安装。

例如：

（本人已在相关文件中提供了编译好的用于dlib库安装的whl文件——>因为这个库最不好装）

参考文献链接

【1】xxxPh.D.的博客

http://www.learnopencv.com/computer-vision-for-predicting-facial-attractiveness/

【2】华南理工大学某实验室

http://www.hcii-lab.net/data/SCUT-FBP/EN/introduce.html

主要思路

（1）模型训练

用了PCA算法对特征进行了压缩降维；

然后用随机森林训练模型。

数据源于网络，据说数据“发源地”就是华南理工大学某实验室，因此我在参考文献上才加上了这个实验室的链接。

（2）提取人脸关键点

主要使用了dlib库。

使用官方提供的模型构建特征提取器。

（3）特征生成

完全参考了xxxPh.D.的博客。

（4）颜值预测

利用之前的数据和模型进行颜值预测。

使用方式

有特殊疾病者请慎重尝试预测自己的颜值，本人不对颜值预测的结果和带来的所有负面影响负责！！！

言归正传。

环境搭建完成后，解压相关文件中的Face_Value.rar文件，cmd窗口切换到解压后的*.py文件所在目录。

例如：

打开test_img文件夹，将需要预测颜值的照片放入并重命名为test.jpg。

例如：

若嫌麻烦或者有其他需求，请自行修改：

getLandmarks.py文件中第13行。

最后依次运行：

train_model.py(想直接用我模型的请忽略此步)

getLandmarks.py

getFeatures.py

Predict.py

使用演示

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用简单的机器学习算法实现垃圾邮件识别。

让我们愉快地开始吧~

开发工具

Python版本：3.6.4

相关模块：scikit-learn模块；jieba模块；numpy模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

逐步实现

（1）划分数据集

网上用于垃圾邮件识别的数据集大多是英文邮件，所以为了表示诚意，我花了点时间找了一份中文邮件的数据集。数据集划分如下：

训练数据集：

7063封正常邮件(data/normal文件夹下)；

7775封垃圾邮件(data/spam文件夹下)。

测试数据集：

共392封邮件(data/test文件夹下)。

（2）创建词典

数据集里的邮件内容一般是这样的：

首先，我们利用正则表达式过滤掉非中文字符，然后再用jieba分词库对语句进行分词，并清除一些停用词，最后再利用上述结果创建词典，词典格式为：

{"词1": 词1词频, "词2": 词2词频...}

这些内容的具体实现均在"utils.py"文件中体现，在主程序中(train.py)调用即可：

最终结果保存在"results.pkl"文件内。

大功告成了么？当然没有！！！

现在的词典里有52113个词，显然太多了，有些词只出现了一两次，后续特征提取的时候一直空占着一个维度显然是不明智的做法。因此，我们只保留词频最高的4000个词作为最终创建的词典：

最终结果保存在"wordsDict.pkl"文件内。

（3）特征提取

词典准备好之后，我们就可以把每封信的内容转换为词向量了，显然其维度为4000，每一维代表一个高频词在该封信中出现的频率，最后，我们将这些词向量合并为一个大的特征向量矩阵，其大小为：

(7063+7775)×4000

即前7063行为正常邮件的特征向量，其余为垃圾邮件的特征向量。

上述内容的具体实现仍然在"utils.py"文件中体现，在主程序中调用如下：

最终结果保存在"fvs_%d_%d.npy"文件内，其中第一个格式符代表正常邮件的数量，第二个格式符代表垃圾邮件的数量。

（4）训练分类器

我们使用scikit-learn机器学习库来训练分类器，模型选择朴素贝叶斯分类器和SVM(支持向量机)：

（5）性能测试

利用测试数据集对模型进行测试：

结果如下：

可以发现两个模型的性能是差不多的(SVM略胜于朴素贝叶斯)，但SVM更倾向于向垃圾邮件的判定。

That's all~

完整源代码请参见相关文件。

没有具体介绍模型原理，因为后续可能会出一个系列，比较完整详细地介绍一下机器学习里的常用算法。所以，就先这样吧~

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

花了点时间利用Python绘制了一些有意思的图案，也算是发掘了一下Python的可视化功能吧。。。

PS：

部分图案参考了一些博客的一部分源代码。

顺便证明一波我的审美T_T。。。

没错，是时候证明一波了~~~

Let's Go！

开发工具

Python版本：3.6.4

相关模块：numpy模块；matplotlib模块；numba模块；PIL模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

效果展示

原理没啥好说的，直接展示吧~~~

首先当然是一些逆天的数学分形图案啦~~~

（1）朱利亚分形

（2）二十面体对称的万花筒

（3）曼德勃罗集

（4）牛顿分形

其次，我也用Python的turtle模块画了一些有点意思的图案。

（1）漫天雪花

（2）玫瑰

方案一：

点此观看视频

方案二：

点此观看视频

（3）爱心（T_T好吧有些非主流）

点此观看视频

That's all...以后有机会再画其他的吧~~~

Python的可视化库还是非常丰富的，功能也十分强大，有需要的朋友可以自己去学习一下。

譬如：

Matplotlib；

Pandas；

Bokeh；

Pygal等等。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

早上起来随手写的脚本。

利用Python实时监控CPU使用率。

感觉应该还是有用武之地的，于是过来发一波文。

支持Linux和Windows系统。

Let's Go~~~

开发工具

测试系统：Win10和Ubuntu

Python版本：3.5+

相关模块：matplotlib模块；psutil模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

注意：

Ubuntu自带的Python不包含TK模块，需要使用：

sudo apt-get install python3-tk

命令自行安装。

参考文档

psutil文档：

https://psutil.readthedocs.io/en/latest/

matplotlib文档：

https://matplotlib.org/users/index.html

具体实现过程详见相关文件中的源代码。

最近都是比较简单的脚本，没什么原理思路T_T

使用演示

在cmd窗口运行monitor.py文件即可。

运行截图：

（1）Ubuntu

（2）Windows10

视频演示：

点击观看视频

代码截止2018-04-15测试无误。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

不像考卷，现实生活中，有些事永远没有答案。

简单且随意地分析一下高考的一些数据~~~

让我们愉快地开始吧~~~

开发工具

Python版本：3.6.4

相关模块：pyecharts模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

pyecharts模块的安装可参考：

安装Python并添加到环境变量，pip安装需要的相关模块即可。

额外说明：

pyecharts模块安装时请依次执行以下命令：

pip install echarts-countries-pypkg

pip install echarts-china-provinces-pypkg

pip install echarts-china-cities-pypkg

pip install pyecharts

若安装过程中出现：

'utf-8' codec can't decode byte 0xb6

或者类似的编码错误提示。

可尝试修改Python安装文件夹下如下图所示路径下的__init__.py文件的第75行代码：

修改为下图所示内容：

“一本正经的分析”

开始分析

首先让我们来看看从恢复高考(1977年)开始高考报名、最终录取的总人数走势吧：

T_T看来学生党确实是越来越多了。

不过这样似乎并不能很直观地看出每年的录取比例？Ok，让我们直观地看看吧：

看来上大学越来越“容易”之说不是空穴来风的，总录取比例高的可怕~~~

那么各省的情况呢？

由于各省高考最终录取人数的统计标准不一样，有些是只统计本科，有些是都统计的，为了避免统计标准不一而带来的不公平对比，我们只分析各省的高考报考人数。

从2010年开始到今年(2018年)各省份高考考生数量的分布图如下：

T_T河南的高考考生人数真是一枝独秀。

那么各省的大学数量又是如何分布的呢？以公办本科大学数量作为统计标准，其分布图大概是这样的：

Emmm。北京和江苏分别位居第一和第二名。想想也是必然T_T

那么985&211高校的分布又如何呢？

“那就这样吧，再爱都曲终人散了。”看到这个默默不说话了。

以省份为x轴，年份为y轴，该年该省报考的考生人数为z轴来更直观地看看各省每年的高考考生数量变化情况吧：

上图中省份的顺序是这样的：

北京、四川、陕西、江西、吉林、宁夏、广西、内蒙古、甘肃、西藏、福建、上海、广东、山东、浙江、河南、安徽、江苏、河北、黑龙江、湖南、湖北、山西、云南、贵州、海南、辽宁、重庆、天津、青海、新疆，台湾因为没有数据，所以没有加入。

T_T河南的高考考生数量真的恐怖。

Emmm，因为可用的数据不多，再分析下去大概就是花式的做图游戏了，想想还是算了吧。至于个人观点，还是不发表为好。毕竟，大家的“哈姆雷特”都不一样。

相关文件中包含了本文所涉及到的所有源代码、数据和结果，其中，数据来源网络，本人不保证其可靠性。

运行源代码前需将对应的注释去除。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

最近经常需要简单地远程控制一下电脑，比如远程查看一下电脑上模型训练的情况，模型训练完之后远程关闭电脑等等，于是就想着利用python来简单地实现一下这些功能，直接利用邮件远程控制自己电脑。

让我们愉快地开始吧~

开发工具

Python版本：3.6.4

相关模块：PIL模块；email模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

原理简介

一. 思路

电脑每隔一段时间查看指定邮箱中是否收到了新的邮件，若未收到，则不进行任何操作，若收到了，则判断发件人的身份，若发件人为合法的控制者，则解析发件人的邮件，执行解析结果，否则忽略该邮件。

二. 具体实现

（1）收发邮件

我们利用POP3协议来收取邮件，利用SMTP协议来发送邮件，python内置对着两个协议的支持，因此具体实现起来十分简单轻松。

注1：

此处推荐廖雪峰的Python教程，里面有关于收发邮件的详细介绍，我就不搬砖了。

注2：

电脑端邮箱本人使用了新浪邮箱，手机端邮箱本人使用了QQ邮箱。

（2）查看电脑状况

直接利用PIL模块的ImageGrab.grab()函数对电脑进行截屏，然后通过邮件把电脑截屏发送到手机上。

如果想查看模型运行的情况，走之前把模型训练界面显示在桌面上就可以啦~

（3）可扩展性

除了查看电脑状况外，目前仅支持利用cmd命令控制电脑，若需要添加其他功能，可在下图所示的位置上添加：

（4）易用性

cmd命令太长手机上打起来不方便或者记不住怎么办？你可以在word2cmd.json中设置快捷命令语：

（5）FAQ

① 电脑端发送邮件失败？

解决方案：

若电脑端发送的邮件被识别为垃圾邮件使得手机端无法查看电脑状况时，可用手机登陆电脑端使用的邮箱，查看被退回的邮件，这样就可以在手机上查看电脑运行状况了。

注3：

若为手机端邮箱拒收，可以设置一下白名单。

② 电脑端无法登陆邮箱？

解决方案：

你需要开启SMTP和POP3服务：

密码应为客户端授权密码，而非登陆密码。当然新浪邮箱的登录密码即为客户端授权密码。

That's All.

完整源代码请自行参考相关文件。

使用演示

Step1：修改配置文件

必须修改的配置文件为：

config.json。

作用：

设置电脑端和手机端邮箱的信息。手机端邮箱的信息用于验证发信人是否为合法控制电脑者，电脑端邮箱的信息用于电脑端接收和发送邮件。

若需要加密SMTP会话，请设置enable_ssl为true，并设置正确的端口号。

选择修改的配置文件为：

word2cmd.json。

作用：

设置快捷命令语。

Step2：运行Server.py文件

发送指令：

执行指令：

结果：

That's All.

代码截止2018-08-07测试无误。

相关文件中提供了打包好的EXE文件版本，无需配置环境即可使用。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

在跑程序，闲着也是闲着，于是做了这件似乎还算有趣的事情。拿出来分享一下。

参考了matthewearl开源的一个项目写的。

恶搞属性偏重。T_T有些效果还可以~

让我们愉快地开始吧~~~

开发工具

相关模块：python-opencv模块；dlib模块；numpy模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

dlib据说用Anaconda装比较方便。年代太久远有些忘记了，我一直用原生的Python，忘了怎么装好的，似乎也挺方便的。之前的文章分享过一些编译好的whl文件，可以直接pip安装。

比如：

Python美颜

原理简介

主要流程：

（1）利用dlib库检测并获取人脸特征点；

（2）通过一些简单的处理使得第二张人脸的眼睛、鼻子和嘴巴较好地“装”到第一张人脸上。

一些细节：

特征检测器：

用的dlib官方提供的预训练好的模型。

第二张图片的人脸特征需要对齐到第一张图片的人脸特征，其实现参考了：

https://en.wikipedia.org/wiki/Procrustes_analysis#Ordinary_Procrustes_analysis

具体实现方式详见相关文件中的源代码。

使用演示

修改SwapFace.py文件的图片路径为自己需要操作的图片路径：

然后在cmd窗口运行即可。

一些结果图：

（1）特朗普+奥巴马

（2）普及+安倍

（3）乔布斯+比尔盖茨

（4）莱布尼兹+牛顿

（5）爱因斯坦+薛定谔

That's All.

有些结果还是挺逗的。。。

中国名人的结果我没敢放T_T

有兴趣的朋友可以自己去试试~~~

代码截止2018-05-01测试无误。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

偶遇了一篇文章：

“Mapping Your Music Collection”

https://www.christianpeccei.com/musicmap/

感觉颇有缘分，似有命中注定之感，于是想着用一些简单的音频处理、机器学习和可视化技术，简单地分析一下自己的音乐收藏。当然我对乐理知识一无所知，所以分析将不涉及任何与乐理知识相关的内容，纯属“瞎玩”性质的分析。T_T

那么就让我们愉快地开始吧~~~

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块；

将相关文件中提供的mpg123.zip文件解压后添加到环境变量中，例如：

开始分拆

方便起见，所有的音乐文件均先转为.wav格式后再做分析。

从最简单的开始吧！让我们先来看看不同歌手的声音波形图：

周杰伦：

感觉波形图好混乱，似乎是数据量太大引起的，于是我打算换一个策略，只画出每首歌曲前10秒的波形图来作比较，毕竟良好的开端是成功的一半？

周杰伦：

许嵩：

陈奕迅：

Interesting...

好像还是挺有意思的，但并看不出什么端倪来的样子，同一个歌手唱的歌的波形结构之间的差异和不同歌手唱的歌的波形结构之间的差异仿佛都挺大的。虽然并没有规定说同一个歌手唱的歌的波形结构之间的差异一定很小，不同歌手唱的歌的波形结构之间的差异一定很大。

好吧，有些混乱，还是随意点的好。那么我们来尝试性地提取一下歌曲的特征吧。我们打算提取的歌曲特征有：

① 歌曲波形的统计矩，包括均值、标准差、偏态和峰态，同时，我们通过平滑窗(递增平滑，长度分别为1,10,100,1000)来获取这些特征在不同时间尺度上的表现；

② 为了体现信号的短时变化，我们可以计算一下波形一阶差分幅度的统计矩，同样也通过平滑窗来获取这些特征(均值、标准差、偏态和峰态)在不同时间尺度上的表现；

③ 最后，我们计算一下波形的频域特征，这里我们只计算歌曲在不同频段(将整个频段均分为10份)的能量占比，不过直接对歌曲的波形数据作快速傅里叶变换的话其计算量过于庞大了，因此先让波形数据通过长度为5的平滑窗再对其作快速傅里叶变换。

综上所述，我们已经获得了歌曲的42个特征值。下面我们尝试利用这些特征值对我这几天下载的43首歌曲进行k均值聚类。首先，为了便于结果的可视化，我们利用PCA对数据进行降维(42维特征到2维特征)，为了方便起见，我们直接调库(sklearn)实现，结果打印如下：

OK，接下来我们就可以对降维后的数据进行聚类了，这里我们将自己实现一下k均值聚类算法而不是简单地调库，最终的聚类结果如下图所示(k=4)：

接下来我们尝试先对歌曲的42个特征值进行归一化处理，然后再进行上面的PCA和聚类操作，同时令k=3，最终的聚类结果如下图所示：

Emmm，好像效果更差了。

不过我发现我喜欢了8年的歌“尾戒”竟然一枝独秀了！还是很棒的，哈哈~~~

当然，这里有一个问题，歌曲的42个特征值是人工选取的，也许并不很好的表现出歌曲特征，且这些特征之间的相关系数是不为0的，也就是存在冗余特征。

https://www.christianpeccei.com/musicmap/一文利用了遗传算法从42个特征值中筛选出了18个特征值作为歌曲最终的特征向量，其结果如下：

懒得复现了，直接用他的结论重新进行聚类，结果如下(k=3)：

Emmm，好像半斤八两。

那就这样吧，就当学点基础的音频处理、机器学习和可视化技术了。

所有源代码和素材均在相关文件中提供了，End。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

这又将是一个不定期更新的系列~~~

本系列主要将使用到python的pygame模块来教大家制作一些小游戏，每期制作一个。最后都会打包成.exe文件分享给大家~~~

So，对于只想玩小游戏的小伙伴来说，只需要下载相关文件就好啦~~~

至于pygame的开发文档，暂时没有归入整理计划，来日方长，英文不好的同学只能先看网上中文的资料将就下了~~~

本期参考文献

链接：

https://www.raywenderlich.com/24252/beginning-game-programming-for-teens-with-python

作者：

Julian Meyer

说明

python版本：3.5.4

pygame版本：1.9.3（pip安装即可）

开始

Step1：你好，兔子

效果：

Step2：添加背景

首先载入所需的图片；其次依次通过x和y进行循环，并且根据循环里x和y的值来画上草的效果；接下来的几行就是在屏幕上画出城堡。

效果：

Step3：让兔子能够移动

接下来你需要加上一些真正的游戏的元素了，比如让兔子能够随着按键移动。

效果（可以移动兔子）：

Step4：让兔子转向

好的，现在你的兔子在你按键的时候可以移动了，但是如果你能用鼠标让兔子朝向你选择的方向不是更酷吗?这样它就不会总是朝向一个方向了。

效果：

Step5：射击吧！兔子

让兔子用箭头射向它们的敌人，这一步会有一点复杂，因为你需要跟踪所有的箭头，更新它们，旋转它们，在它们跑出屏幕的时候删除它们。

效果：

Step6：獾，拿上武器!

好吧，现在有了城堡，并且你有一个英雄可以移动和射出箭头。还差什么呢？当然是攻击城堡的敌人啦~

在这一步，你将会随机创建出一些獾冲向城堡。在游戏的进程中会有越来越多的獾冒出来。

效果：

Step7：獾与箭头的碰撞

獾们冲向你的城堡，但是你的箭头对它们完全没有作用！这让兔子怎么防守它的家园呢？

是时候来让箭头能够杀死獾让兔子能保护自己的城堡并且赢得这场游戏了~~~

效果：

Step8：添加健康值和时间的显示

游戏运行起来相当不错了，有攻击者、防守者。现在，你需要的就是通过一个方法来显示兔子的得分。

最简单的方法就是添加一个HUD来显示当前城堡的生命值。你也可以加一个计时来记录城堡存活下来的时间。

效果：

Step9：赢或输

如果你玩的时间够长，即使你的生命值已经变成0了，游戏仍然是继续的！不仅如此，你仍然可以用箭头射向这些獾。这肯定不太对。你需要加上一些赢或者输的情况来让你的游戏值得玩。

那么我们来加上胜利或者失败的条件。你可以通过终止主循环，进入胜利/失败的循环来实现它。你需要指出玩家是否胜利，并将其显示在屏幕上。

效果：

Step10：免费的音乐和声音效果

这个游戏现在相当不错了，但是没有声音。有点太安静了。加上一点声音效果，能让你更好地感受这个游戏。

效果：

当然是会各种音效啦~~~图片大概是表达不了了emm。

OK，大功告成，你完美地制作了一款小游戏！

在这基础上，你可以根据你自己的创意来扩展游戏！比如，你可以试着重置里面的各种图片，加上不同的枪或者是不同的怪物！

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

T_T突然发现N久以前我还做过一个系列？？？

利用Python制作小游戏？？？

好吧，既然做了，就有头有尾吧~~~

本期我们将制作一个类似八音符的小游戏。

让我们愉快地开始吧~~~

参考文献

cocos2d文档：

http://python.cocos2d.org/doc/

开发工具

Python版本：3.6.4

相关模块：

cocos2d模块；

pyaudio模块；

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

原理介绍

相信很多人对八音符这款游戏并不陌生吧，其核心玩法是利用声音控制一个带辫子的小黑球不断前进，大概是长这样子的吧：

今天我们就来做一个低配版本的T_T，其功能为利用声音控制皮卡丘不断前进。

游戏主要使用了cocos2d模块和pyaudio模块，前者用于搭建游戏框架，后者用于获得麦克风的声音。

Step1 定义皮卡丘类：

既然游戏的主角是皮卡丘，那我们总得单独定义一个类来体现一下主角吧？

利用cocos2d模块来定义主角类是一件非常轻松的事情。你只需要继承sprites类，然后告诉sprites类需要执行什么操作即可。

根据八音符的游戏规则，我们赋予皮卡丘跳跃、下降和静止的能力，同时，我们规定皮卡丘在空中时无法进行跳跃。具体代码如下：

Step2 定义block类：

显然，主角需要有站的地方吧T_T，到处都是万丈深渊怕是一万只皮卡丘也拯救不了地球人吧T_T。

对于地面，刚开始的时候先得有一段长点的平地缓冲一下，让玩家先试试自己的嗓音，然后再随机生成跳跃块，让玩家展示自己的歌喉。具体代码如下：

Step3 实现游戏主循环：

有了上面的铺垫，就可以开始实现我们的小游戏了。

此时我们需要继承ColorLayer类来实现游戏主循环。首先，我们定义声控条类来“暗中观察”我们的嗓音，代码如下：

然后就是实例化皮卡丘类和block类，其中，block类将被放置进容器以方便整体处理。代码如下：

啊，千万别忘了只有输入了声音才能控制我们的皮卡丘不停地运动，代码如下：

最后，我们需要告诉程序游戏规则，那就是根据麦克风接收到的声音的音量来控制声控条的长短以及皮卡丘的动作。这里，我们通过block块的整体后移来实现皮卡丘的前进效果。

当然，我们也需要加入必要的碰撞检测程序，不然皮卡丘一登场就陷入沼泽一样的地面中了。并且我们规定当皮卡丘掉入“沟壑”后游戏重置。

代码如下：

OK，大功告成！！！

游戏效果

在cmd窗口运行Game2.py文件即可。

效果如下：

点击查看视频

关于cocos模块的教程，推荐阅读：

http://python.cocos2d.org/doc/

代码截止2018-06-14测试无误。

有兴趣的小伙伴可以在此基础上进行改进优化，例如加上音效和分值统计、开始和结束界面等等~~~

总之可改进的空间还是比较大的~

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

本期我们将制作一个拼图小游戏。

好吧也许有些幼稚。

不过无论如何，让我们愉快地开始吧~~~

开发工具

Python版本：3.6.4

相关模块：

pygame模块；

以及一些Python自带的模块

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

原理介绍

游戏简介：

将图像分为m×n个矩形块，并将图像右下角的矩形块替换为空白块后，将这些矩形块随机摆放成原图像的形状。游戏目标为通过移动非空白块将随机摆放获得的图像恢复成原图像的模样，且规定移动操作仅存在于非空白块移动到空白块。

例如下图所示：

逐步实现：

Step1：游戏初始界面

既然是游戏，总得有个初始界面吧？

OK，我们先写一个游戏初始界面：

效果是这样子的：

根据玩家自身水平，可以选择不同难度的拼图游戏。

Step2：定义移动操作

定义移动操作的目的是为了移动拼图(好像是废话T_T)，具体实现起来十分简单：

Step3：游戏主界面

OK，有了前面的铺垫，我们可以开始实现我们的游戏主界面了。

首先，我们需要打乱拼图，但是随机打乱很可能导致拼图无解，因此我们通过随机移动拼图来实现打乱拼图的效果，这也是我们先定义拼图的移动操作的主要原因：

游戏主界面初始化：

最后实现主界面的显示刷新以及事件响应等功能：

Step4：游戏结束界面

当玩家完成拼图后，需要显示游戏结束界面，和游戏初始界面类似，实现起来都比较简单：

OK，大功告成！！！

游戏效果

在cmd窗口运行Game3.py文件即可。

效果如下：

点击查看视频

代码截止2018-06-26测试无误。

同样，有兴趣的小伙伴可以在此基础上进行优化，比如增加计时功能，积分功能等等。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

本期我们将制作一个简单的滑雪游戏。

废话不多说，让我们愉快地开始吧~

开发工具

Python版本：3.6.4

相关模块：

pygame模块；

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

先睹为快

原理介绍

游戏规则：

玩家通过“AD”键或者“←→”操控前进中的滑雪者，努力避开路上的树，尽量捡到路上的小旗。

如果碰到树，则得分减50，如果捡到小旗子，则得分加10。

逐步实现：

Step1：定义精灵类

由于游戏涉及到碰撞检测(滑雪者与树和小旗之间的碰撞)，因此我们定义两个精灵类，分别用于代表滑雪者和障碍物(即树和小旗)：

其中，滑雪者在前进过程中应当拥有向左，向右偏移的能力，并且在偏移时滑雪者向前的速度应当减慢才更加合乎常理，这样才能供玩家操作。同时，滑雪者应当拥有不同的姿态来表现自己滑行时的状态：

直线：

左偏一点：

左偏很多：

右偏一点：

右偏很多：

另外，尽管滑雪者的左右移动通过移动滑雪者本身实现，但是滑雪者的向前移动是通过移动障碍物实现的。

Step2：随机创建障碍物

现在我们需要定义一个随机创建障碍物的函数，以便在游戏主循环中调用：

Step3：游戏主循环

首先我们初始化一些参数：

其中障碍物创建两次的目的是便于画面衔接。

然后我们就可以定义主循环了：

主循环的内容包括：

事件监听、障碍物的更新、碰撞检测以及分数的展示等内容，总之还是很容易实现的。

Step4：其他

开始、结束界面这些，就靠大家自己发挥了，我就写了一个简单的开始界面：

效果：

All Done！

代码截止2018-07-12测试无误。

欢迎到GitHub上Star：

https://github.com/CharlesPikachu/Games

VBScript RTrim 函数

VBScript RTrim 函数返回去掉尾部空格的字符串副本。

RTrim 函数删除字符串右边的空格。

提示：请参阅 LTrim 和 Trim 函数。

语法

RTrim(string)

参数	描述
string	必需。字符串表达式。

实例

以上实例输出结果：

Hello Jackand welcome.

VBScript StrReverse 函数

VBScript StrReverse 函数返回一字符串，其中字符的顺序与指定的字符串中的顺序相反。

StrReverse 函数反转一个字符串。

语法

StrReverse(string)

参数	描述
string	必需。需被反转的字符串。

实例 1

Dim txt
txt="This is a beautiful day!"
document.write(StrReverse(txt))
Output:
!yad lufituaeb a si sihT

https://github.com/RogerLZH/Browser.git

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python简单地实现AI版的贪吃蛇。。。

just for fun...

没有用深度学习。。。

算法是由一个叫Hawstein的人在好多好多年以前提出，感觉很有趣，就花了点时间复现了一下他的想法。。。

至于效果。。。

看脸。。。

真的只是觉得他的想法很有趣，仅此而已，因为如果你想让蛇机械地充满整个空间，只需要让蛇一直走S就好了，但是这就变得很无趣了。。。

主要思路

（1）蛇每走一步，就使用BFS计算游戏界面中每个位置（蛇身除外）到达食物的最短路径长；

（2）将蛇的安全定义为蛇是否可以跟着蛇尾运动，即蛇头和蛇尾间是否存在路径；

（3）蛇每次行动前先利用虚拟的蛇进行探路，若虚拟的蛇吃完食物后是安全的，真蛇才行动；

（4）若蛇和食物之间不存在路径或者吃完食物后并不安全，就跟着蛇尾走；

（5）若蛇和食物之间、蛇和蛇尾之间均不存在路径，就随便挑一步可行的来走；

（6）保证目标是食物时蛇走最短路径，目标是蛇尾时蛇走最长路径。

不足之处

由于食物是随机出现的，若虚拟的蛇跑一遍发现去吃食物是不安全的，真蛇就不会去吃食物，而是选择追着蛇尾跑，若一直如此，就陷入了死循环，蛇一直追着蛇尾跑跑跑。。。

直到你终止游戏为止。。。

开发工具

Python版本：3.5.4

相关模块：

pygame模块以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

运行方式

在cmd窗口运行AI_snake.py文件即可。

结果展示

动图一直上传失败。。。

所以随便截几个图吧~~~

（1）为了保证代码简单易懂，所提供的代码冗余度较高（比如进行了不必要的重复计算），有兴趣者可对代码进行优化；

（2）相关文件中也提供了普通版本的贪吃蛇游戏(Normal_snake.py)。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python简单地实现AI版的贪吃蛇。。。

just for fun...

没有用深度学习。。。

算法是由一个叫Hawstein的人在好多好多年以前提出，感觉很有趣，就花了点时间复现了一下他的想法。。。

至于效果。。。

看脸。。。

真的只是觉得他的想法很有趣，仅此而已，因为如果你想让蛇机械地充满整个空间，只需要让蛇一直走S就好了，但是这就变得很无趣了。。。

主要思路

（1）蛇每走一步，就使用BFS计算游戏界面中每个位置（蛇身除外）到达食物的最短路径长；

（2）将蛇的安全定义为蛇是否可以跟着蛇尾运动，即蛇头和蛇尾间是否存在路径；

（3）蛇每次行动前先利用虚拟的蛇进行探路，若虚拟的蛇吃完食物后是安全的，真蛇才行动；

（4）若蛇和食物之间不存在路径或者吃完食物后并不安全，就跟着蛇尾走；

（5）若蛇和食物之间、蛇和蛇尾之间均不存在路径，就随便挑一步可行的来走；

（6）保证目标是食物时蛇走最短路径，目标是蛇尾时蛇走最长路径。

不足之处

直到你终止游戏为止。。。

开发工具

Python版本：3.5.4

相关模块：

pygame模块以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

运行方式

在cmd窗口运行AI_snake.py文件即可。

结果展示

动图一直上传失败。。。

所以随便截几个图吧~~~

（1）为了保证代码简单易懂，所提供的代码冗余度较高（比如进行了不必要的重复计算），有兴趣者可对代码进行优化；

（2）相关文件中也提供了普通版本的贪吃蛇游戏(Normal_snake.py)。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

闲来无事写了个比较愚蠢的AI五子棋。

T_T当然你好好和它下，它还是比较机智的。

让我们愉快地开始吧~~~

开发工具

Python版本：3.6.4

相关模块：

graphics模块。

环境搭建

安装Python并添加到环境变量即可。

注：

graphics模块在相关文件中已经提供，就是一个py文件，直接放在当前路径或者放到python安装文件夹下的site-packages文件夹内均可。

原理简介

对于五子棋这样的博弈类AI，很自然的想法就是让计算机把当前所有可能的情况都尝试一遍，找到最优的落子点。这里有两个问题：

（1）如何把所有可能的情况都尝试一遍；

（2）如何定量判断某落子点的优劣。

对于第一个问题，其实就是所谓的博弈树搜索，对于第二个问题，其实就是所谓的选择评估函数。评估函数的选取直接决定了AI算法的优劣，其形式也千变万化。可以说，每个评估函数就是一个选手，对不同的棋型每个选手自然有不同的看法和应对措施，当然他们的棋力也就因此各不相同了。

但博弈树搜索就比较固定了，其核心思想无非是让计算机考虑当前局势下之后N步所有可能的情况，其中奇数步（因为现在轮到AI下）要让AI方的得分最大，偶数步要让AI方的得分最小（因为对手也就是人类，也可以选择最优策略）。

当然这样的搜索其计算量是极大的，这时候就需要剪枝来减少计算量。例如下图：

其中A代表AI方，P代表人类方。AI方搜索最大值，人类方搜索最小值。因此Layer3的A1向下搜索的最终结果为4，Layer3的A2向下搜索，先搜索Layer4的P3，获得的分值为6，考虑到Layer2的P1向下搜索时取Layer3的A1和A2中的较小值，而Layer3的A2搜索完Layer4的P3时，其值就已经必大于Layer3的A1了，就没有搜索下去的必要了，因此Layer3到Layer4的路径3就可以剪掉了。

上述搜索策略其实质就是：

minimax算法+alpha-beta剪枝算法。

了解了上述原理之后，就可以自己写代码实现了。当然实际实现过程中，我做了一些简化，但万变不离其宗，其核心思想都是一样的。

具体实现过程详见相关文件中的源代码。

使用演示

在cmd窗口运行GobangAI.py文件即可。

下面的视频是我和AI的一局对弈，我执黑先行，所以赢的比较轻松T_T。毕竟五子棋先手者优势巨大，或者说在某些情况/规则下是必胜的。至于原因，在相关文件中提供了两篇论文，感兴趣的可以看看。

点击查看视频

之后有时间的话会研究一下基于深度学习的AI五子棋算法，目前这个版本还是比较low的，当然你好好和它下的话，它还是可以走出一些精妙的步子的。

T_T没有仔细测试，如果有什么bug可以留言反馈给我，我会进行修复。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

好久以前看到有人做过。。

今天心血来潮。。

就想自己试试。。

仅此而已。。

用的PyQt版本是5.10.。。

网上关于PyQt5.10的中文教程=None。。

所以最后做出来的效果一般（毕竟短时间内啃不动官方那全英文的教程）。。

So，

don't get your hopes up...

源码地址：

主要思路

主要实现的功能：

（1）可以正常显示网页；

（2）设置导航栏，用以实现浏览器的前进、后退、停止加载和刷新功能；

（3）设置地址栏，可以实时更新当前网页的URL，同时支持输入地址回车访问功能；

（4）设置标签页，可通过双击导航栏打开新的标签页，从而支持同时访问多个页面。

底层传输协议等功能的实现方式：

借助PyQt5的QtWebEngine模块。

具体实现过程见源代码（有较为详细的注释）。

不足之处

初步测试无Bug，但有时会有卡顿。。。

感兴趣者可自行优化。。。

欢迎后台交流（T_T如果不嫌弃我是刚入坑半天的小白的话）。。。

欢迎在后台提出修改意见。。。

若有必要，我可以再水一篇类似“Python制作简易浏览器（后续优化）”的文章hhhhh。。。

开发工具

Python版本：3.5.4

相关模块：

PyQt5模块(5.10版本)以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

使用演示

在cmd窗口运行Create_Browser.py文件即可。

如下图所示：

PyQt5快速入门文档已分享在此公众号底部菜单栏中，供有需要者参考。

文档主要参考了CSDN上的一些博文整理的且亲测PyQt5.10版本可用。

日后有时间将整理PyQt5.10版本完整使用文档。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python实现手写笔记的压缩与增强。

至于起因大概是：

这个内容很有趣。。。

——>

说了等于没说。T_T

参考文献

链接：

https://mzucker.github.io/2016/09/20/noteshrink.html

作者：

Matt Zucker

主要思路

Step1：确定背景色

假定纸张颜色是扫描图像中最常出现的那一种颜色。

同时将8比特每通道消减至6比特每通道来增加背景色获取的可靠性。

Step2：分离前景色

将色彩从RGB空间映射到HSV空间来实现分离前景色的功能。

规则默认为：

（1）明亮度V比背景色大0.3以上；

（2）饱和度S比背景色大0.2以上。

满足其中一条即为前景色。

Step3：选择呈现色

相当于使用簇分析法解决一个色彩量化问题。

将原始24位每像素的图像转换成一个具有小数量代表色的图像。

主要使用K均值算法实现。

其他说明：

（1）默认情况下，程序会通过重新设置颜色的最大最小强度值为0到255，来增加最后调色板各色的艳丽度和对比度；

（2）程序默认情况下自动地根据输入文件名排序，关键字为数字。

开发工具

Python版本：3.5.4

相关模块：Scipy模块、numpy模块、PIL模块以及一些Python自带的模块。

环境搭建：安装Python并添加到环境变量，pip安装需要的相关模块即可。

使用演示

全部功能选项：

基本功能使用：

py -3.5 Note_Processor.py + 待处理的笔记图片名

例如下图：

结果展示

笔记1：

结果图：

笔记2：

结果图：

若对结果不满意，请自行在命令行窗口设置相应的参数，即不要使用默认值；

例如：

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

不要被上面的照片所迷惑。。。

Python做上面的照片？

不存在的。。。

只是最近看到好多jQuery+H5的表白代码。。。

想着用Python应该也可以？

Just have a try~~~

提前声明

T_T请不要信任我在这方面的审美水平；

T_T代码仅供参考，使用前请自行精心优化，否则被拒概率或许将高达99.99%。

开发工具

Python版本：3.5.4

相关模块：jieba模块、scipy模块、wordcloud模块、pygame模块、matplotlib模块以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

尝试一：画表白树

具体原理见源代码吧~~~

其实就是一个递归而已~~~

使用方式：

在cmd窗口运行Unburden.py文件即可：

效果：

尝试二：词云

原理也很简单就不多说了~~~

（T_T详见源代码）

使用方式：

在cmd窗口运行Confession.py文件即可：

效果图：

（1）英文情诗

（2）周董的歌

确实没有什么精力去优化这些东西。。。

So，

如果你真的用到的话。。。

用之前一定要自己再精致地优化一波呀！！！

T_T

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

做这个的起因大概是：

电脑里的Xshell不知道为啥突然显示“评估期已过”之类的提示。。。

记得之前认证学校邮箱后是可以免费使用的。。。

苍天绕过谁。。。

想起上次认证学校邮箱过了N个小时才收到那封认证的邮件。。。

我决定。。。

自己动手，丰衣足食。。。

反正好多天没更公众号了。。。正好水一波。。。

Just have a try!

开发工具

Python版本：3.5.4

相关模块：paramiko模块以及一些Python自带的模块。

操作系统：Windows系列。

环境搭建：安装Python并添加到环境变量，pip安装需要的相关模块即可。

主要思路

目的：

制作命令行版的SSH登录工具。

需要实现的功能：

（1）添加/删除连接服务器需要的IP、端口、密码；

（2）自动输入密码登录远程服务器。

具体思路详见源代码。

PS：

本着用了Python那就尽量不制造轮子的原则，SSH登录主要借助了paramiko模块。

使用演示

放个flash视频吧。。。

懒得截图了。。。

此代码仅适用于Windows系统。

有兴趣者可自行修改源代码制作Mac/Linux版本。

使用过程中若有任何优化意见：

欢迎后台交流！

以后若有时间将进一步优化和扩展该脚本。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

利用Python简单实现图片隐写术。。。

或者说是水印技术。。。

说实话，真的只是简单实现。。。

没什么技术含量。。。

可以说是入门级的隐写术/水印技术。。。

Let's Go?

开发工具

Python版本：3.5.4

相关模块：cv2模块；pillow模块；numpy模块；以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

原理简介

相关文件中的源代码主要实现了两种水印技术：

（1）空域数字水印

实现的是基于LSB的水印技术。。。

（2）频域数字水印

实现的是基于FFT的水印技术。。。

T_T确实没啥技术含量吧？

图片需为PNG或BMP格式。。。

若频域数字水印效果不佳，请修改alpha因子大小。

具体实现过程详见源代码。。。

使用演示

可直接运行或作为模块导入。

功能：

直接运行方式：

在cmd窗口运行Watermark.py即可。

演示一：基于FFT

载体图片：

水印图片：

嵌入效果：

解水印：

演示二：基于LSB

载体图片：

水印文字：

公众号：Charles的皮卡丘

嵌入效果：

解水印：

上述内容只是入门级的隐写术/水印技术。。。

这是一项非常有趣的技术。。。

以后有机会会复现一些进阶版的水印算法。。。

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

导语

Hi，好久不见~~~

两周没写东西了，从简单的开始，慢慢提高文章水准吧，下一个月开始时间就会比较充裕了~~~

利用Python实现简单的车牌检测算法~~~

让我们愉快地开始吧~~~

开发工具

Python版本：3.6.4

相关模块：cv2模块；numpy模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

原理简介

注意这不是车牌号识别，是车牌检测。

因为车牌形状比较单一，所以我参考了一些简单的传统算法实现的，没有使用深度学习。效果比较一般。不适用于复杂环境下的车牌检测。

直接调的OpenCV的函数接口，没有从0开始实现，所以总体技术含量较低。

其流程为：

Step1：

对图片进行一些预处理，包括灰度化、高斯平滑、中值滤波、Sobel算子边缘检测等等。

Step2：

利用OpenCV对预处理后的图像进行轮廓查找，然后根据一些参数判断该轮廓是否为车牌轮廓。

具体实现过程详见相关文件中的源代码。

使用演示

在cmd窗口运行detect.py文件即可。

使用前请先指定需要检测的图片路径：

效果如下：

原图1：

检测结果1：

原图2：

检测结果：

原图3：

检测结果3：

That's all~

车牌检测和车牌识别其实算是很成熟的技术了。

所以我做的仅代表菜鸟级水平。

随便看了一会试着写的代码。

之后会逐渐提高水准的T_T，好久不发文不太习惯了hhhh。

那就这样吧~~~

本文转载至知乎ID：Charles（白露未晞）知乎个人专栏

下载W3Cschool手机App，0基础随时随地学编程>>戳此了解

视频预览

点击链接查看视频

导语

利用简单的Python和VBA程序在Excel中生成小姐姐。

感觉很有趣，让我们愉快地开始吧~~~

开发工具

Python版本：3.6.4

相关模块：PIL模块；openpyxl模块；以及一些Python自带的模块。

Excel版本：Excel2016。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

实现过程

Step1：

利用Python将小姐姐照片上各像素的RGB信息(随机)输出到Excel文件的Sheet2中。

注意照片不宜过大，否则不利于后续操作。

实现方式：

在cmd窗口运行"Gen_Excel.py"文件(或者直接双击运行"Gen_Excel.exe"文件)，并根据提示输入小姐姐照片的路径即可：

Step2：

读取Sheet2中的像素值信息并填充到Sheet1中。

实现方式：

打开Step1中生成的Excel文件(默认文件名为"test.xlsx")，按下"Alt+F11"打开VB编辑器后新建一个模块：

将相关文件中提供的"VBA.txt"文件里的第一段代码复制进模块：

同时，为了使Excel文件打开后自动生成小姐姐的图片，设置一下Workbook_open事件，即将"VBA.txt"文件里的第二段代码复制到"ThisWorkbook"中：

最后，将该".xlsx"格式的excel文件(默认为"test.xlsx")另存为".xlsm"格式的excel文件以保证宏正常运行：

Step3：

打开".xlsm"格式的excel文件，可以发现最终的结果是这样子的：

而原图是这样子的：

因此我们需要调整一下图片所在单元格的列宽、行高和页面缩放级别使其长宽比与原图一致(网上淘的图，所以质量差了点)：

最后隐藏一下Sheet2以免露馅：

OK，大功告成！！！

关闭".xlsm"格式的excel文件后重新打开即可获得文章开头视频中的效果~

相关文件里有打包好的exe文件，所以环境搭建一步是可以略去的~~~

图片可以是任意的小姐姐、小哥哥以及一些萌萌的小动物等等~~~

VBScript CDate 函数

VBScript CDate 函数返回表达式，此表达式已被转换为 Date 子类型的 Variant。

CDate 函数把有效的日期和时间表达式转换为日期（Date）类型，并返回结果。p>

提示：请使用 IsDate 函数来判断 date 是否可被转换为日期或时间。

注意：IsDate 函数使用本地设置来检测字符串是否可被转换为日期（在所有的语言中，"January"不是一个月份）。

语法

CDate(date)

参数

参数	描述
date	必需。任何有效的日期表达式（比如 Date() 或者 Now()）。

实例

实例 1

如何把字符串转换为日期：

实例 2

如何把带分隔符的数字转换为日期：

实例 3

如何使用 CDATE 把字符串转换为一个时间对象：

VBScript IsDate 函数

云存储提供高可用、高稳定、强安全的云端存储服务，支持任意数量和形式的非结构化数据存储，如视频和图片，并在控制台进行可视化管理。云存储包含以下功能：

存储管理：支持文件夹，方便文件归类。支持文件的上传、删除、移动、下载、搜索等，并可以查看文件的详情信息
权限设置：可以灵活设置哪些用户是否可以读写该文件夹中的文件，以保证业务的数据安全
上传管理：在这里可以查看文件上传历史、进度及状态
文件搜索：支持文件前缀名称及子目录文件的搜索
组件支持：支持在 image、audio 等组件中传入云文件 ID

接下来，我们看看云文件管理提供了哪些 API、及如何在控制台中管理云文件：

存储 API
控制台中管理文件

API 指引

上传文件

在小程序端可调用 wx.cloud.uploadFile 方法进行上传：

wx.cloud.uploadFile({  cloudPath: 'example.png', // 上传至云端的路径  filePath: '', // 小程序临时文件路径  success: res => {    // 返回文件 ID    console.log(res.fileID)  },  fail: console.error})

上传成功后会获得文件唯一标识符，即文件 ID，后续操作都基于文件 ID 而不是 URL。

下载文件

可以根据文件 ID 下载文件，用户仅可下载其有访问权限的文件：

wx.cloud.downloadFile({  fileID: '', // 文件 ID  success: res => {    // 返回临时文件路径    console.log(res.tempFilePath)  },  fail: console.error})

删除文件

可以通过 wx.cloud.deleteFile 删除文件：

wx.cloud.deleteFile({  fileList: ['a7xzcb'],  success: res => {    // handle success    console.log(res.fileList)  },  fail: console.error})

更详细的 API 可参考小程序端及后端存储 API 文件。

组件支持

支持在 image、audio 等组件中传入云文件 ID，具体支持列表见文档

换取临时链接

可以根据文件 ID 换取临时文件网络链接，文件链接有有效期为两个小时：

wx.cloud.getTempFileURL({  fileList: ['cloud://xxx.png'],  success: res => {    // fileList 是一个有如下结构的对象数组    // [{    //    fileID: 'cloud://xxx.png', // 文件 ID    //    tempFileURL: '', // 临时文件网络链接    //    maxAge: 120 * 60 * 1000, // 有效期    // }]    console.log(res.fileList)  },  fail: console.error})

API 文档

可以在此参考详细的小程序端存储 API 文档和服务端 API 文档

管理文件

在控制台中，选择存储管理标签页，可以在此看到云存储空间中所有的文件，还可以查看文件的详细信息、控制存储空间的读写权限。

文件名命名限制

不能为空
不能以/开头
不能出现连续/
编码长度最大为850个字节
推荐使用大小写英文字母、数字，即[a-z，A-Z，0-9]和符号 -，!，_，.，* 及其组合
不支持 ASCII 控制字符中的字符上(↑)，字符下(↓)，字符右(→)，字符左(←)，分别对应 CAN(24)，EM(25)，SUB(26)，ESC(27)
如果用户上传的文件或文件夹的名字带有中文，在访问和请求这个文件或文件夹时，中文部分将按照 URL Encode 规则转化为百分号编码。
不建议使用的特殊字符: ` ^ " { } [ ] ~ % # > < 及 ASCII 128-255 十进制
可能需特殊处理后再使用的特殊字符: ， : ; = & $ @ + ?（空格）及ASCII 字符范围：00-1F 十六进制（0-31 十进制）以及7F（127 十进制）

组件支持

小程序组件支持传入云文件 ID，支持列表如下：

组件	属性
image	src
video	src、poster
cover-image	src

接口	参数
getBackgroundAudioManager	src
createInnerAudioContext	src
previewImage	urls、current

None

Python基础教程

在Python的备忘单是用于Python 3的编程语言中的单页参考表。

开始

介绍

Python (python.org)
在 Y 分钟内学习 X (learnxinyminute.com)
python中的正则表达式 （quickref.me）

Hello World

>>> print("Hello, World!")Hello, World!

Python 中著名的“Hello World”程序

变量

x = 4        # x is of type intx = "Sally"  # x is now of type strprint(x)

Python 没有用于声明变量的命令。

数据类型

`str`	文本
`int`, `float`,`complex`	数字
`list`, `tuple`,`range`	序列
`dict`	映射
`set`, `frozenset`	集合
`bool`	布尔值
`bytes`, `bytearray`,`memoryview`	二进制

请参阅：数据类型

切片字符串

>>> b = "Hello, World!">>> print(b[2:5])llo

请参阅：字符串

列表

mylist = []mylist.append(1)mylist.append(2)for x in mylist:    print(x) # prints out 1,2

请参阅：列表

if-else

a = 200if a > 0:    print("a is greater than 0")else:    print("a is not greater than 0")

请参阅：流量控制

循环

for x in range(6):    if x == 3: break    print(x)else:    print("Finally finished!")

请参阅：循环

函数

>>> def my_function():...     print("Hello from a function")...>>> my_function()Hello from a function

请参阅：函数

文件处理

with open("myfile.txt", "r", encoding='utf8') as file:    for x in file:        print(x)

请参阅：文件处理

算术运算符

result = 10 + 30  # =>  40result = 40 - 10  # =>  30result = 50 * 5   # =>  250result = 16 / 4   # =>  4result = 25 % 2   # =>  1result = 5 ** 3   # =>  125

加等于

counter = 0counter += 10           # => 10counter = 0counter = counter + 10  # => 10message = "Part 1."# => Part 1.Part 2.message += "Part 2."

Python 数据类型

字符串

s = "Hello World"s = 'Hello World'a = """Multiline StringsLorem ipsum dolor sit amet,consectetur adipiscing elit """

请参阅：字符串

数字

x = 1    # inty = 2.8  # floatz = 1j   # complex>>> print(type(x))<class 'int'>

布尔值

a = True b = Falsebool(0)     # => Falsebool(1)     # => True

列表

list1 = ["apple", "banana", "cherry"]list2 = [True, False, False]list3 = [1, 5, 7, 9, 3]list4 = list((1, 5, 7, 9, 3))

请参阅：列表

元组

a = (1, 2, 3)a = tuple((1, 2, 3))

类似于 List 但不可变

集合

set1 = {"a", "b", "c"}   set2 = set(("a", "b", "c"))

一组独特的项目/对象

字典

>>> empty_dict = {}>>> a = {"one": 1, "two": 2, "three": 3}>>> a["one"]1>>> a.keys()dict_keys(['one', 'two', 'three'])>>> a.values()dict_values([1, 2, 3])>>> a.update({"four": 4})>>> a.keys()dict_keys(['one', 'two', 'three', 'four'])>>> a['four']4

键：值对，类JSON对象

赋值

整数

x = int(1)   # x will be 1y = int(2.8) # y will be 2z = int("3") # z will be 3

浮动

x = float(1)     # x will be 1.0y = float(2.8)   # y will be 2.8z = float("3")   # z will be 3.0w = float("4.2") # w will be 4.2

字符串

x = str("s1") # x will be 's1'y = str(2)    # y will be '2'z = str(3.0)  # z will be '3.0'

Python 字符串

类似数组

>>> a = "Hello, World">>> print(a[1])e>>> print(a[len(a)-1])d

获取位置 1 处的字符

循环

>>> for x in "abc":...     print(x)abc

循环遍历单词“banana”中的字母

切片字符串

 ┌───┬───┬───┬───┬───┬───┬───┐ | m | y | b | a | c | o | n | └───┴───┴───┴───┴───┴───┴───┘ 0   1   2   3   4   5   6   7-7  -6  -5  -4  -3  -2  -1

>>> s = 'mybacon'>>> s[2:5]'bac'>>> s[0:2]'my'

>>> s = 'mybacon'>>> s[:2]'my'>>> s[2:]'bacon'>>> s[:2] + s[2:]'mybacon'>>> s[:]'mybacon'

>>> s = 'mybacon'>>> s[-5:-1]'baco'>>> s[2:6]'baco'

切片方式

>>> s = '12345' * 5>>> s'1234512345123451234512345'>>> s[::5]'11111'>>> s[4::5]'55555'>>> s[::-5]'55555'>>> s[::-1]'5432154321543215432154321'

字符串长度

>>> a = "Hello, World!">>> print(len(a))13

len() 函数返回字符串的长度

多次复制

>>> s = '===+'>>> n = 8>>> s * n'===+===+===+===+===+===+===+===+'

检查字符串

>>> s = 'spam'>>> s in 'I saw spamalot!'True>>> s not in 'I saw The Holy Grail!'True

连接

>>> s = 'spam'>>> t = 'egg'>>> s + t'spamegg'>>> 'spam' 'egg''spamegg'

格式化

name = "John"print("Hello, %s!" % name)

name = "John"age = 23print("%s is %d years old." % (name, age))

format() 方法

txt1 = "My name is {fname}, I'm {age}".format(fname = "John", age = 36)txt2 = "My name is {0}, I'm {1}".format("John",36)txt3 = "My name is {}, I'm {}".format("John",36)

input

>>> name = input("Enter your name: ")Enter your name: Tom>>> name'Tom'

从控制台获取输入数据

join

>>> "#".join(["John", "Peter", "Vicky"])'John#Peter#Vicky'

endswith

>>> "Hello, world!".endswith("!")True

Python 列表

定义

>>> li1 = []>>> li1[]>>> li2 = [4, 5, 6]>>> li2[4, 5, 6]>>> li3 = list((1, 2, 3))>>> li3[1, 2, 3]>>> li4 = list(range(1, 11))>>> li4[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

生成

>>> list(filter(lambda x : x % 2 == 1, range(1, 20)))[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]>>> [x ** 2 for x in range (1, 11) if  x % 2 == 1][1, 9, 25, 49, 81]>>> [x for x in [3, 4, 5, 6, 7] if x > 5][6, 7]>>> list(filter(lambda x: x > 5, [3, 4, 5, 6, 7]))[6, 7]

append

>>> li = []>>> li.append(1)>>> li[1]>>> li.append(2)>>> li[1, 2]>>> li.append(4)>>> li[1, 2, 4]>>> li.append(3)>>> li[1, 2, 4, 3]

列表切片

列表切片的语法：

a_list[start:end]a_list[start:end:step]

切片

>>> a = ['spam', 'egg', 'bacon', 'tomato', 'ham', 'lobster']>>> a[2:5]['bacon', 'tomato', 'ham']>>> a[-5:-2]['egg', 'bacon', 'tomato']>>> a[1:4]['egg', 'bacon', 'tomato']

省略索引

>>> a[:4]['spam', 'egg', 'bacon', 'tomato']>>> a[0:4]['spam', 'egg', 'bacon', 'tomato']>>> a[2:]['bacon', 'tomato', 'ham', 'lobster']>>> a[2:len(a)]['bacon', 'tomato', 'ham', 'lobster']>>> a['spam', 'egg', 'bacon', 'tomato', 'ham', 'lobster']>>> a[:]['spam', 'egg', 'bacon', 'tomato', 'ham', 'lobster']

切片方式

['spam', 'egg', 'bacon', 'tomato', 'ham', 'lobster']>>> a[0:6:2]['spam', 'bacon', 'ham']>>> a[1:6:2]['egg', 'tomato', 'lobster']>>> a[6:0:-2]['lobster', 'tomato', 'egg']>>> a['spam', 'egg', 'bacon', 'tomato', 'ham', 'lobster']>>> a[::-1]['lobster', 'ham', 'tomato', 'bacon', 'egg', 'spam']

pop

>>> li = ['bread', 'butter', 'milk']>>> li.pop()'milk'>>> li['bread', 'butter']>>> del li[0]>>> li['butter']

使用权

>>> li = ['a', 'b', 'c', 'd']>>> li[0]'a'>>> li[-1]'d'>>> li[4]Traceback (most recent call last):  File "<stdin>", line 1, in <module>IndexError: list index out of range

串联

>>> odd = [1, 3, 5]>>> odd.extend([9, 11, 13])>>> odd[1, 3, 5, 9, 11, 13]>>> odd = [1, 3, 5]>>> odd + [9, 11, 13][1, 3, 5, 9, 11, 13]

排序和反转

>>> li = [3, 1, 3, 2, 5]>>> li.sort()>>> li[1, 2, 3, 3, 5]>>> li.reverse()>>> li[5, 3, 3, 2, 1]

计数

>>> li = [3, 1, 3, 2, 5]>>> li.count(3)2

重复

>>> li = ["re"] * 3>>> li['re', 're', 're']

Python 流控制

基本的

a = 5if a > 10:    print("a is totally bigger than 10.")elif a < 10:    print("a is smaller than 10.")else:    print("a is indeed 10.")

一行代码

>>> a = 330>>> b = 200>>> r = "a" if a > b else "b">>> print(r)a

if-elif-else

value = Trueif not value:    print("Value is False")elif value is None:    print("Value is None")else:    print("Value is True")

Python 循环

基本的

primes = [2, 3, 5, 7]for prime in primes:    print(prime)

带索引

animals = ["dog", "cat", "mouse"]for i, value in enumerate(animals):    print(i, value)

while

x = 0while x < 4:    print(x)    x += 1  # Shorthand for x = x + 1

break

x = 0for index in range(10):    x = index * 10    if index == 5:    	break    print(x)

continue

for index in range(3, 8):     x = index * 10    if index == 5:    	continue    print(x)

range 范围

for i in range(4):    print(i) # Prints: 0 1 2 3for i in range(4, 8):    print(i) # Prints: 4 5 6 7for i in range(4, 10, 2):    print(i) # Prints: 4 6 8

zip()

name = ['Pete', 'John', 'Elizabeth']age = [6, 23, 44]for n, a in zip(name, age):    print('%s is %d years old' %(n, a))

列表理解

result = [x**2 for x in range(10) if x % 2 == 0] print(result)# [0, 4, 16, 36, 64]

Python 函数

基本的

def hello_world():      print('Hello, World!')

return

def add(x, y):    print("x is %s, y is %s" %(x, y))    return x + yadd(5, 6)    # => 11

位置参数

def varargs(*args):    return argsvarargs(1, 2, 3)  # => (1, 2, 3)

关键字参数

def keyword_args(**kwargs):    return kwargs# => {"big": "foot", "loch": "ness"}keyword_args(big="foot", loch="ness")

返回多个

def swap(x, y):    return y, xx = 1y = 2x, y = swap(x, y)  # => x = 2, y = 1

默认值

def add(x, y=10):    return x + yadd(5)      # => 15add(5, 20)  # => 25

匿名函数

# => True(lambda x: x > 2)(3)# => 5(lambda x, y: x ** 2 + y ** 2)(2, 1)

Python 模块

导入模块

import mathprint(math.sqrt(16))  # => 4.0

从一个模块

from math import ceil, floorprint(ceil(3.7))   # => 4.0print(floor(3.7))  # => 3.0

全部导入

from math import *

缩短模块

import math as m# => Truemath.sqrt(16) == m.sqrt(16)

功能和属性

import mathdir(math)

Python 文件处理

读取文件

逐行

with open("myfile.txt") as file:    for line in file:        print(line)

带行号

input = open('myfile.txt', 'r')for i,line in enumerate(input, start=1):    print("Number %s: %s" % (i, line))

String

写一个字符串

contents = {"aa": 12, "bb": 21}with open("myfile1.txt", "w+") as file:    file.write(str(contents))

读取字符串

with open('myfile1.txt', "r+") as file:    contents = file.read()print(contents)

目的

写一个对象

contents = {"aa": 12, "bb": 21}with open("myfile2.txt", "w+") as file:    file.write(json.dumps(contents))

读取对象

with open('myfile2.txt', "r+") as file:    contents = json.load(file)print(contents)

删除文件

import osos.remove("myfile.txt")

检查和删除

import osif os.path.exists("myfile.txt"):    os.remove("myfile.txt")else:    print("The file does not exist")

删除文件夹

import osos.rmdir("myfolder")

Python 类和继承

定义

class MyNewClass:    '''This is a docstring.'''    pass# Class Instantiationmy = MyNewClass()

构造函数

class Animal:    def __init__(self, voice):    self.voice = voice cat = Animal('Meow')print(cat.voice)    # => Meow dog = Animal('Woof') print(dog.voice)    # => Woof

方法

class Dog:    # Method of the class    def bark(self):    print("Ham-Ham") charlie = Dog()charlie.bark()   # => "Ham-Ham"

类变量

class my_class:    class_variable = "A class variable!"  x = my_class()y = my_class() # => A class variable!print(x.class_variable)# => A class variable!print(y.class_variable)

Super() 函数

class ParentClass:    def print_test(self):        print("Parent Method") class ChildClass(ParentClass):    def print_test(self):        print("Child Method")        # Calls the parent's print_test()        super().print_test()

>>> child_instance = ChildClass()>>> child_instance.print_test()Child MethodParent Method

repr() 方法

class Employee:    def __init__(self, name):        self.name = name     def __repr__(self):        return self.name john = Employee('John')print(john)  # => John

用户定义的异常

class CustomError(Exception):    pass

多态性

class ParentClass:    def print_self(self):        print('A') class ChildClass(ParentClass):    def print_self(self):        print('B') obj_A = ParentClass()obj_B = ChildClass() obj_A.print_self() # => Aobj_B.print_self() # => B

覆盖

class ParentClass:    def print_self(self):        print("Parent") class ChildClass(ParentClass):    def print_self(self):        print("Child") child_instance = ChildClass()child_instance.print_self() # => Child

继承

class Animal:     def __init__(self, name, legs):        self.name = name        self.legs = legs        class Dog(Animal):    def sound(self):        print("Woof!") Yoki = Dog("Yoki", 4)print(Yoki.name) # => YOKIprint(Yoki.legs) # => 4Yoki.sound()     # => Woof!

其他

注释

# This is a single line comments.

""" Multiline strings can be written    using three "s, and are often used    as documentation."""

''' Multiline strings can be written    using three 's, and are often used    as documentation.'''

生成器

def double_numbers(iterable):    for i in iterable:        yield i + i

生成器可以帮助您编写懒惰的代码。

要列出的生成器

values = (-x for x in [1,2,3,4,5])gen_to_list = list(values)# => [-1, -2, -3, -4, -5]print(gen_to_list)

处理异常

try:    # Use "raise" to raise an error    raise IndexError("This is an index error")except IndexError as e:    pass                 # Pass is just a no-op. Usually you would do recovery here.except (TypeError, NameError):    pass                 # Multiple exceptions can be handled together, if required.else:                    # Optional clause to the try/except block. Must follow all except blocks    print("All good!")   # Runs only if the code in try raises no exceptionsfinally:                 # Execute under all circumstances    print("We can clean up resources here")

字符串（string，简写为str）是 Python 中最常用的数据类型之一。我们可以使用引号( ' 或 " )来创建字符串。

创建字符串很简单，只要为变量分配一个值即可。例如：

var1 = 'Hello World!' var2 = "W3Cschool"

Python 访问字符串中的值

Python 不支持单字符类型，单字符在 Python 中也是作为一个字符串使用。

Python 访问子字符串，可以使用方括号 []来截取字符串（这种方式也被称为切片），字符串的截取的语法格式如下：

变量[头下标:尾下标]

python截取的特点是取头下标的值到尾下标的值（尾下标的值不取）

索引值以 0 为开始值，-1 为从末尾的开始位置。

从后面索引		-9		-8		-7		-6		-5		-4		-3		-2		-1
从前面索引		0		1		2		3		4		5		6		7		8
		W		3		C		s		c		h		o		o		l
从前面截取	：		1		2		3		4		5		6		7		8		：
从后面截取	：		-8		-7		-6		-5		-4		-3		-2		-1		：

以下代码都是取字符C：

str="W3cschool"print(str[2:3]) #使用截取方式，用正序进行截取print(str[2:-6])#使用截取方式，正序和倒序混合使用print(str[-7:-6])#使用截取方式，使用倒序进行截取print(str[-7])#使用负索引获取单个字符Cprint(str[2])#使用正索引获取单个字符C

切片的更多案例：

str="W3cschool"#取W3Cprint(str[:3]) print(str[:-6])#取schprint(str[3:6])print(str[-6:-3])#只有头下标/尾下标的情况print(str[:3])#只有尾下标的情况，默认头下标为0（正序的0，也就是字符串开始的地方）#也就是从字符串开头截取到3的位置（也就是W3C）print(str[3:])#只有头下标的情况，默认尾下标为0（逆序的0，也就是字符串结束的地方）#也就是从3的位置截取到字符串结尾（也就是school）#更多应用str2 ="https://www.51coolma.cn/"#截取协议名称print(str2[:5]) #也就是截取前五位#截取域名print(str2[8:-1]) #也就是截取第八位到倒数第一位

Python转义字符

有一些字符因为在python中已经被定义为一些操作（比如单引号和双引号被用来引用字符串），而这些符号我们可能在字符串中需要使用到。为了能够使用这些特殊字符，可以用反斜杠转义字符（同样地，反斜杠也可以用来转义反斜杠）。如下表：

转义字符	描述	实例
(在行尾时)	续行符	`>>> print("line1 ... line2 ... line3")line1 line2 line3>>>`
	反斜杠符号	`>>> print("")`
'	单引号	`>>> print(''')'`
"	双引号	`>>> print(""")"`
a	响铃	`>>> print("a")` 执行后电脑有响声。
	退格(Backspace)	`>>> print("Hello World!")Hello World!`
00	空	`>>> print("00")>>>`
	换行	`>>> print(" ")>>>`
v	纵向制表符	`>>> print("Hello v World!")Hello World!>>>`
	横向制表符	`>>> print("Hello World!")Hello World!>>>`
	回车，将后面的内容移到字符串开头，并逐一替换开头部分的字符，直至将后面的内容完全替换完成。	`>>> print("Hello World!")World!>>> print('google runoob taobao 123456')123456 runoob taobao`
f	换页	`>>> print("Hello f World!")Hello World!>>>`
yyy	八进制数，y 代表 0~7 的字符，例如：12 代表换行。	`>>> print("1101451541541574012715716215414441")Hello World!`
xyy	十六进制数，以 x 开头，y 代表的字符，例如：x0a 代表换行	`>>> print("x48x65x6cx6cx6fx20x57x6fx72x6cx64x21")Hello World!`
other	其它的字符以普通格式输出

Python字符串运算符

下表实例变量 a 值为字符串 "Hello"，b 变量值为 "W3Cschool"：

操作符	描述	实例
+	字符串连接	a + b 输出结果： HelloW3Cschool `>>> a ="hello">>> b = "W3Cschool">>> a+b'helloW3Cschool'`
*	重复输出字符串	a2 输出结果：HelloHello `>>> a ="hello">>> b = "W3Cschool">>> a2'hellohello'`
[]	通过索引获取字符串中字符	a[1] 输出结果 e `>>> a ="hello">>> b = "W3Cschool">>> a[1]'e'`
[ : ]	截取字符串中的一部分（切片），遵循左闭右开原则，str[0:2] 是不包含第 3 个字符的（详见上上节内容）。	a[1:4] 输出结果 ell `>>> a ="hello">>> b = "W3Cschool">>> a[1:4]'ell'`
in	成员运算符 - 如果字符串中包含给定的字符返回 True	'H' in a 输出结果 `True` `>>> a ="hello">>> b = "W3Cschool">>> 'h' in aTrue`
not in	成员运算符 - 如果字符串中不包含给定的字符返回 True	'M' not in a 输出结果 `True` `>>> a ="hello">>> b = "W3Cschool">>> 'M' not in aTrue`
r/R	原始字符串 - 原始字符串：所有的字符串都是直接按照字面的意思来使用，没有转义特殊或不能打印的字符。原始字符串除在字符串的第一个引号前加上字母 r（不区分大小写）以外，与普通字符串有着几乎完全相同的语法。	`>>> str="W3Cschool " >>> str2=r"W3Cschool " >>> print(str) W3Cschool >>> print(str2) W3Cschool`
%	格式字符串	请看下一节内容。

Python 字符串格式化

Python 支持格式化字符串的输出。尽管这样可能会用到非常复杂的表达式，但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。

在 Python 中，字符串的格式化使用与 C/C++中的printf函数有着一样的语法。

例如

#!/usr/bin/python3 name = "小明"age = 10print ("我叫 %s 今年 %d 岁!" % (name, age))

以上实例输出结果：

我叫 小明 今年 10 岁!

python字符串格式化符号:

符号	描述
`%c`	格式化字符及其ASCII码
`%s`	格式化字符串
`%d`	格式化整型
`%u`	格式化无符号整型
`%o`	格式化无符号八进制数
`%x`	格式化无符号十六进制数
`%X`	格式化无符号十六进制数（大写）
`%f`	格式化浮点数字，可指定小数点后的精度
`%e`	用科学计数法格式化浮点数
`%E`	作用同`%e`，用科学计数法格式化浮点数
`%g`	`%f`和`%e`的简写
`%G`	`%f` 和 `%E` 的简写
`%p`	用十六进制数格式化变量的地址

格式化操作符辅助指令:

符号	功能
*	定义宽度或者小数点精度
-	用做左对齐
+	在正数前面显示加号( + )
<sp>	在正数前面显示空格
#	在八进制数前面显示零('0')，在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X')
0	显示的数字前面填充'0'而不是默认的空格
%	'%%'输出一个单一的'%'
(var)	映射变量(字典参数)
m.n.	m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话)

Python2.6 开始，新增了一种格式化字符串的函数 str.format()，它增强了字符串格式化的功能。

Python三引号

python三引号允许一个字符串跨多行，字符串中可以包含换行符、制表符以及其他特殊字符。实例如下

#!/usr/bin/python3 para_str = """这是一个多行字符串的实例多行字符串可以使用制表符TAB ( 	 )。也可以使用换行符 [ 
 ]。"""print (para_str)

以上实例执行结果为：

这是一个多行字符串的实例多行字符串可以使用制表符TAB (    )。也可以使用换行符 [  ]。

三引号让程序员从引号和特殊字符串的泥潭里面解脱出来，自始至终保持一小块字符串的格式是所谓的WYSIWYG（所见即所得）格式的。

一个典型的用例是，当你需要一块HTML或者SQL时，这时用字符串组合，特殊字符串转义将会非常的繁琐。

errHTML = '''<HTML><HEAD><TITLE>Friends CGI Demo</TITLE></HEAD><BODY><H3>ERROR</H3><B>%s</B><P><FORM><INPUT TYPE=button VALUE=BackONCLICK="window.history.back()"></FORM></BODY></HTML>'''cursor.execute('''CREATE TABLE users (  login VARCHAR(8), uid INTEGER,prid INTEGER)''')

还记得我们在注释相关章节中介绍的多行注释嘛？三引号的另一种用途就是用来做为多行注释使用。

f-string

f-string 是 python3.6 之后版本添加的，称之为字面量格式化字符串，是新的格式化字符串的语法。

之前我们习惯用百分号 (%):

name = 'W3Cschool'print('Hello %s' % name)

运行结果：

Hello W3Cschool

f-string 格式化字符串以 f 开头，后面跟着字符串，字符串中的表达式用大括号 {} 包起来，它会将变量或表达式计算后的值替换进去，实例如下：

name = 'W3Cschool'print(f'Hello {name}')  # 替换变量print(f'{1+2}')         # 使用表达式w = {'name': 'W3Cschool', 'url': 'www.51coolma.cn'}print(f'{w["name"]}: {w["url"]}')

运行结果：

Hello W3Cschool3W3Cschool: www.51coolma.cn

用了这种方式明显更简单了，不用再去判断使用 %s，还是 %d。

在 Python 3.8 的版本中可以使用 = 符号来拼接运算表达式与结果：

x = 1print(f'{x+1}')   # Python 3.6x = 1print(f'{x+1=}')   # Python 3.8

运行结果（由于在线idepython版本不支持3.8，所以不提供在线运行案例）：

2x+1=2

Unicode 字符串

在Python2中，普通字符串是以8位ASCII码进行存储的，而Unicode字符串则存储为16位unicode字符串，这样能够表示更多的字符集。使用的语法是在字符串前面加上前缀 u。

在Python3中，所有的字符串都是Unicode字符串。

Python 的字符串内建函数

Python 的字符串常用内建函数如下：

序号	方法及描述
1	capitalize() 将字符串的第一个字符转换为大写
2	center(width, fillchar) 返回一个指定的宽度 width 居中的字符串，fillchar 为填充的字符，默认为空格。
3	count(str, beg= 0,end=len(string)) 返回 str 在 string 里面出现的次数，如果指定 beg 或者 end，则返回指定范围内 str 出现的次数
4	bytes.decode(encoding="utf-8", errors="strict") Python3 中没有 decode 方法，但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象，这个 bytes 对象可以由 str.encode() 来编码返回。
5	encode(encoding='UTF-8',errors='strict') 以 encoding 指定的编码格式编码字符串，如果出错默认报`ValueError`异常，除非 errors 指定的是'ignore'或者'replace'
6	endswith(suffix, beg=0, end=len(string)) 检查字符串是否以指定的字符串结束，如果指定了beg 或 end 则检查指定的范围内是否以指定的字符串结束，如果是，返回 True，否则返回 False.
7	expandtabs(tabsize=8) 把字符串 string 中的 tab 符号转为空格，tab 符号默认的空格数是 8 。
8	find(str, beg=0, end=len(string)) 检测 str 是否包含在字符串中，如果指定范围 beg 和 end ，则检查是否包含在指定范围内，如果包含，返回开始的索引值，否则返回-1
9	index(str, beg=0, end=len(string)) 跟find()方法一样，只不过如果str不在字符串中会报一个异常。
10	isalnum() 如果字符串至少有一个字符并且所有字符都是字母或数字则返回 True，否则返回 False
11	isalpha() 如果字符串至少有一个字符并且所有字符都是字母或中文字则返回 True, 否则返回 False
12	isdigit() 如果字符串只包含数字则返回 True 否则返回 False..
13	islower() 如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，则返回 True，否则返回 False
14	isnumeric() 如果字符串中只包含数字字符，则返回 True，否则返回 False
15	isspace() 如果字符串中只包含空白，则返回 True，否则返回 False.
16	istitle() 如果字符串是标题化的(见 title())则返回 True，否则返回 False
17	isupper() 如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回 True，否则返回 False
18	join(seq) 以指定字符串作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
19	len(string) 返回字符串长度
20	ljust(width[, fillchar]) 返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串，fillchar 默认为空格。
21	lower() 转换字符串中所有大写字符为小写.
22	lstrip() 截掉字符串左边的空格或指定字符。
23	maketrans() 创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。
24	max(str) 返回字符串 str 中最大的字母。
25	min(str) 返回字符串 str 中最小的字母。
26	replace(old, new [, max]) 把将字符串中的 old 替换成 new,如果 max 指定，则替换不超过 max 次。
27	rfind(str, beg=0,end=len(string)) 类似于 find()函数，不过是从右边开始查找.
28	rindex( str, beg=0, end=len(string)) 类似于 index()，不过是从右边开始.
29	rjust(width,[, fillchar]) 返回一个原字符串右对齐,并使用fillchar(默认空格）填充至长度 width 的新字符串
30	rstrip() 删除字符串末尾的空格或指定字符。
31	split(str="", num=string.count(str)) 以 str 为分隔符截取字符串，如果 num 有指定值，则仅截取 num+1 个子字符串
32	splitlines([keepends]) 按照行(' ', ' ', ')分隔，返回一个包含各行作为元素的列表，如果参数 keepends 为 False，不包含换行符，如果为 True，则保留换行符。
33	startswith(substr, beg=0,end=len(string)) 检查字符串是否是以指定子字符串 substr 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查。
34	strip([chars]) 在字符串上执行 lstrip()和 rstrip()
35	swapcase() 将字符串中大写转换为小写，小写转换为大写
36	title() 返回"标题化"的字符串,就是说所有单词都是以大写开始，其余字母均为小写(见 istitle())
37	translate(table, deletechars="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中
38	upper() 转换字符串中的小写字母为大写
39	zfill (width) 返回长度为 width 的字符串，原字符串右对齐，前面填充0
40	isdecimal() 检查字符串是否只包含十进制字符，如果是返回 true，否则返回 false。

字符串（string，简写为str）是 Python 中最常用的数据类型之一。我们可以使用引号( ' 或 " )来创建字符串。

创建字符串很简单，只要为变量分配一个值即可。例如：

var1 = 'Hello World!' var2 = "W3Cschool"

Python 访问字符串中的值

Python 不支持单字符类型，单字符在 Python 中也是作为一个字符串使用。

Python 访问子字符串，可以使用方括号 []来截取字符串（这种方式也被称为切片），字符串的截取的语法格式如下：

变量[头下标:尾下标]

python截取的特点是取头下标的值到尾下标的值（尾下标的值不取）

索引值以 0 为开始值，-1 为从末尾的开始位置。

从后面索引		-9		-8		-7		-6		-5		-4		-3		-2		-1
从前面索引		0		1		2		3		4		5		6		7		8
		W		3		C		s		c		h		o		o		l
从前面截取	：		1		2		3		4		5		6		7		8		：
从后面截取	：		-8		-7		-6		-5		-4		-3		-2		-1		：

以下代码都是取字符C：

str="W3cschool"print(str[2:3]) #使用截取方式，用正序进行截取print(str[2:-6])#使用截取方式，正序和倒序混合使用print(str[-7:-6])#使用截取方式，使用倒序进行截取print(str[-7])#使用负索引获取单个字符Cprint(str[2])#使用正索引获取单个字符C

切片的更多案例：

str="W3cschool"#取W3Cprint(str[:3]) print(str[:-6])#取schprint(str[3:6])print(str[-6:-3])#只有头下标/尾下标的情况print(str[:3])#只有尾下标的情况，默认头下标为0（正序的0，也就是字符串开始的地方）#也就是从字符串开头截取到3的位置（也就是W3C）print(str[3:])#只有头下标的情况，默认尾下标为0（逆序的0，也就是字符串结束的地方）#也就是从3的位置截取到字符串结尾（也就是school）#更多应用str2 ="https://www.51coolma.cn/"#截取协议名称print(str2[:5]) #也就是截取前五位#截取域名print(str2[8:-1]) #也就是截取第八位到倒数第一位

Python转义字符

转义字符	描述	实例
(在行尾时)	续行符	`>>> print("line1 ... line2 ... line3")line1 line2 line3>>>`
	反斜杠符号	`>>> print("")`
'	单引号	`>>> print(''')'`
"	双引号	`>>> print(""")"`
a	响铃	`>>> print("a")` 执行后电脑有响声。
	退格(Backspace)	`>>> print("Hello World!")Hello World!`
00	空	`>>> print("00")>>>`
	换行	`>>> print(" ")>>>`
v	纵向制表符	`>>> print("Hello v World!")Hello World!>>>`
	横向制表符	`>>> print("Hello World!")Hello World!>>>`
	回车，将后面的内容移到字符串开头，并逐一替换开头部分的字符，直至将后面的内容完全替换完成。	`>>> print("Hello World!")World!>>> print('google runoob taobao 123456')123456 runoob taobao`
f	换页	`>>> print("Hello f World!")Hello World!>>>`
yyy	八进制数，y 代表 0~7 的字符，例如：12 代表换行。	`>>> print("1101451541541574012715716215414441")Hello World!`
xyy	十六进制数，以 x 开头，y 代表的字符，例如：x0a 代表换行	`>>> print("x48x65x6cx6cx6fx20x57x6fx72x6cx64x21")Hello World!`
other	其它的字符以普通格式输出

Python字符串运算符

下表实例变量 a 值为字符串 "Hello"，b 变量值为 "W3Cschool"：

操作符	描述	实例
+	字符串连接	a + b 输出结果： HelloW3Cschool `>>> a ="hello">>> b = "W3Cschool">>> a+b'helloW3Cschool'`
*	重复输出字符串	a2 输出结果：HelloHello `>>> a ="hello">>> b = "W3Cschool">>> a2'hellohello'`
[]	通过索引获取字符串中字符	a[1] 输出结果 e `>>> a ="hello">>> b = "W3Cschool">>> a[1]'e'`
[ : ]	截取字符串中的一部分（切片），遵循左闭右开原则，str[0:2] 是不包含第 3 个字符的（详见上上节内容）。	a[1:4] 输出结果 ell `>>> a ="hello">>> b = "W3Cschool">>> a[1:4]'ell'`
in	成员运算符 - 如果字符串中包含给定的字符返回 True	'H' in a 输出结果 `True` `>>> a ="hello">>> b = "W3Cschool">>> 'h' in aTrue`
not in	成员运算符 - 如果字符串中不包含给定的字符返回 True	'M' not in a 输出结果 `True` `>>> a ="hello">>> b = "W3Cschool">>> 'M' not in aTrue`
r/R	原始字符串 - 原始字符串：所有的字符串都是直接按照字面的意思来使用，没有转义特殊或不能打印的字符。原始字符串除在字符串的第一个引号前加上字母 r（不区分大小写）以外，与普通字符串有着几乎完全相同的语法。	`>>> str="W3Cschool " >>> str2=r"W3Cschool " >>> print(str) W3Cschool >>> print(str2) W3Cschool`
%	格式字符串	请看下一节内容。

Python 字符串格式化

Python 支持格式化字符串的输出。尽管这样可能会用到非常复杂的表达式，但最基本的用法是将一个值插入到一个有字符串格式符 %s 的字符串中。

在 Python 中，字符串的格式化使用与 C/C++中的printf函数有着一样的语法。

例如

#!/usr/bin/python3 name = "小明"age = 10print ("我叫 %s 今年 %d 岁!" % (name, age))

以上实例输出结果：

我叫 小明 今年 10 岁!

python字符串格式化符号:

符号	描述
`%c`	格式化字符及其ASCII码
`%s`	格式化字符串
`%d`	格式化整型
`%u`	格式化无符号整型
`%o`	格式化无符号八进制数
`%x`	格式化无符号十六进制数
`%X`	格式化无符号十六进制数（大写）
`%f`	格式化浮点数字，可指定小数点后的精度
`%e`	用科学计数法格式化浮点数
`%E`	作用同`%e`，用科学计数法格式化浮点数
`%g`	`%f`和`%e`的简写
`%G`	`%f` 和 `%E` 的简写
`%p`	用十六进制数格式化变量的地址

格式化操作符辅助指令:

符号	功能
*	定义宽度或者小数点精度
-	用做左对齐
+	在正数前面显示加号( + )
<sp>	在正数前面显示空格
#	在八进制数前面显示零('0')，在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X')
0	显示的数字前面填充'0'而不是默认的空格
%	'%%'输出一个单一的'%'
(var)	映射变量(字典参数)
m.n.	m 是显示的最小总宽度,n 是小数点后的位数(如果可用的话)

Python2.6 开始，新增了一种格式化字符串的函数 str.format()，它增强了字符串格式化的功能。

Python三引号

python三引号允许一个字符串跨多行，字符串中可以包含换行符、制表符以及其他特殊字符。实例如下

#!/usr/bin/python3 para_str = """这是一个多行字符串的实例多行字符串可以使用制表符TAB ( 	 )。也可以使用换行符 [ 
 ]。"""print (para_str)

以上实例执行结果为：

这是一个多行字符串的实例多行字符串可以使用制表符TAB (    )。也可以使用换行符 [  ]。

三引号让程序员从引号和特殊字符串的泥潭里面解脱出来，自始至终保持一小块字符串的格式是所谓的WYSIWYG（所见即所得）格式的。

一个典型的用例是，当你需要一块HTML或者SQL时，这时用字符串组合，特殊字符串转义将会非常的繁琐。

errHTML = '''<HTML><HEAD><TITLE>Friends CGI Demo</TITLE></HEAD><BODY><H3>ERROR</H3><B>%s</B><P><FORM><INPUT TYPE=button VALUE=BackONCLICK="window.history.back()"></FORM></BODY></HTML>'''cursor.execute('''CREATE TABLE users (  login VARCHAR(8), uid INTEGER,prid INTEGER)''')

还记得我们在注释相关章节中介绍的多行注释嘛？三引号的另一种用途就是用来做为多行注释使用。

f-string

f-string 是 python3.6 之后版本添加的，称之为字面量格式化字符串，是新的格式化字符串的语法。

之前我们习惯用百分号 (%):

name = 'W3Cschool'print('Hello %s' % name)

运行结果：

Hello W3Cschool

f-string 格式化字符串以 f 开头，后面跟着字符串，字符串中的表达式用大括号 {} 包起来，它会将变量或表达式计算后的值替换进去，实例如下：

name = 'W3Cschool'print(f'Hello {name}')  # 替换变量print(f'{1+2}')         # 使用表达式w = {'name': 'W3Cschool', 'url': 'www.51coolma.cn'}print(f'{w["name"]}: {w["url"]}')

运行结果：

Hello W3Cschool3W3Cschool: www.51coolma.cn

用了这种方式明显更简单了，不用再去判断使用 %s，还是 %d。

在 Python 3.8 的版本中可以使用 = 符号来拼接运算表达式与结果：

x = 1print(f'{x+1}')   # Python 3.6x = 1print(f'{x+1=}')   # Python 3.8

运行结果（由于在线idepython版本不支持3.8，所以不提供在线运行案例）：

2x+1=2

Unicode 字符串

在Python3中，所有的字符串都是Unicode字符串。

Python 的字符串内建函数

Python 的字符串常用内建函数如下：

序号	方法及描述
1	capitalize() 将字符串的第一个字符转换为大写
2	center(width, fillchar) 返回一个指定的宽度 width 居中的字符串，fillchar 为填充的字符，默认为空格。
3	count(str, beg= 0,end=len(string)) 返回 str 在 string 里面出现的次数，如果指定 beg 或者 end，则返回指定范围内 str 出现的次数
4	bytes.decode(encoding="utf-8", errors="strict") Python3 中没有 decode 方法，但我们可以使用 bytes 对象的 decode() 方法来解码给定的 bytes 对象，这个 bytes 对象可以由 str.encode() 来编码返回。
5	encode(encoding='UTF-8',errors='strict') 以 encoding 指定的编码格式编码字符串，如果出错默认报`ValueError`异常，除非 errors 指定的是'ignore'或者'replace'
6	endswith(suffix, beg=0, end=len(string)) 检查字符串是否以指定的字符串结束，如果指定了beg 或 end 则检查指定的范围内是否以指定的字符串结束，如果是，返回 True，否则返回 False.
7	expandtabs(tabsize=8) 把字符串 string 中的 tab 符号转为空格，tab 符号默认的空格数是 8 。
8	find(str, beg=0, end=len(string)) 检测 str 是否包含在字符串中，如果指定范围 beg 和 end ，则检查是否包含在指定范围内，如果包含，返回开始的索引值，否则返回-1
9	index(str, beg=0, end=len(string)) 跟find()方法一样，只不过如果str不在字符串中会报一个异常。
10	isalnum() 如果字符串至少有一个字符并且所有字符都是字母或数字则返回 True，否则返回 False
11	isalpha() 如果字符串至少有一个字符并且所有字符都是字母或中文字则返回 True, 否则返回 False
12	isdigit() 如果字符串只包含数字则返回 True 否则返回 False..
13	islower() 如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是小写，则返回 True，否则返回 False
14	isnumeric() 如果字符串中只包含数字字符，则返回 True，否则返回 False
15	isspace() 如果字符串中只包含空白，则返回 True，否则返回 False.
16	istitle() 如果字符串是标题化的(见 title())则返回 True，否则返回 False
17	isupper() 如果字符串中包含至少一个区分大小写的字符，并且所有这些(区分大小写的)字符都是大写，则返回 True，否则返回 False
18	join(seq) 以指定字符串作为分隔符，将 seq 中所有的元素(的字符串表示)合并为一个新的字符串
19	len(string) 返回字符串长度
20	ljust(width[, fillchar]) 返回一个原字符串左对齐,并使用 fillchar 填充至长度 width 的新字符串，fillchar 默认为空格。
21	lower() 转换字符串中所有大写字符为小写.
22	lstrip() 截掉字符串左边的空格或指定字符。
23	maketrans() 创建字符映射的转换表，对于接受两个参数的最简单的调用方式，第一个参数是字符串，表示需要转换的字符，第二个参数也是字符串表示转换的目标。
24	max(str) 返回字符串 str 中最大的字母。
25	min(str) 返回字符串 str 中最小的字母。
26	replace(old, new [, max]) 把将字符串中的 old 替换成 new,如果 max 指定，则替换不超过 max 次。
27	rfind(str, beg=0,end=len(string)) 类似于 find()函数，不过是从右边开始查找.
28	rindex( str, beg=0, end=len(string)) 类似于 index()，不过是从右边开始.
29	rjust(width,[, fillchar]) 返回一个原字符串右对齐,并使用fillchar(默认空格）填充至长度 width 的新字符串
30	rstrip() 删除字符串末尾的空格或指定字符。
31	split(str="", num=string.count(str)) 以 str 为分隔符截取字符串，如果 num 有指定值，则仅截取 num+1 个子字符串
32	splitlines([keepends]) 按照行(' ', ' ', ')分隔，返回一个包含各行作为元素的列表，如果参数 keepends 为 False，不包含换行符，如果为 True，则保留换行符。
33	startswith(substr, beg=0,end=len(string)) 检查字符串是否是以指定子字符串 substr 开头，是则返回 True，否则返回 False。如果beg 和 end 指定值，则在指定范围内检查。
34	strip([chars]) 在字符串上执行 lstrip()和 rstrip()
35	swapcase() 将字符串中大写转换为小写，小写转换为大写
36	title() 返回"标题化"的字符串,就是说所有单词都是以大写开始，其余字母均为小写(见 istitle())
37	translate(table, deletechars="") 根据 str 给出的表(包含 256 个字符)转换 string 的字符, 要过滤掉的字符放到 deletechars 参数中
38	upper() 转换字符串中的小写字母为大写
39	zfill (width) 返回长度为 width 的字符串，原字符串右对齐，前面填充0
40	isdecimal() 检查字符串是否只包含十进制字符，如果是返回 true，否则返回 false。

什么是 CGI

CGI 目前由 NCSA 维护，NCSA 定义 CGI 如下：

CGI(Common Gateway Interface),通用网关接口,它是一段程序,运行在服务器上如：HTTP服务器，提供同客户端 HTML 页面的接口。

网页浏览

为了更好的了解 CGI 是如何工作的，我们可以从在网页上点击一个链接或 URL 的流程：

1、使用你的浏览器访问 URL 并连接到 HTTP web 服务器。
2、Web 服务器接收到请求信息后会解析 URL，并查找访问的文件在服务器上是否存在，如果存在返回文件的内容，否则返回错误信息。
3、浏览器从服务器上接收信息，并显示接收的文件或者错误信息。

CGI 程序可以是 Python 脚本，PERL 脚本，SHELL 脚本，C 或者 C++ 程序等。

CGI 架构图

cgiarch

Web 服务器支持及配置

在你进行 CGI 编程前，确保您的 Web 服务器支持 CGI 及已经配置了 CGI 的处理程序。

Apache 支持 CGI 配置（这里使用PHPstudy集成的Apache）：

打开Apache的配置文件httpd-conf，在文件中找到如下内容：

首先找到ScriptAlias（图片内容为已经修改过的值，默认值应该有所不同而且是被注释掉的）

修改为项目地址 ScriptAlias /cgi-bin/ "F:/phpstudy/phpstudy_pro/WWW/webpy" （之前的项目都放在F:/phpstudy/phpstudy_pro/WWW/下,这个文件夹是PHPstudy的apache默认项目文件夹，将路径改为这样可以方便localhost访问）。

然后找到Directory，将其修改为

<Directory "F:/phpstudy/phpstudy_pro/WWW/webpy">
    AllowOverride None
    Options +ExecCGI
    Order allow,deny
    Allow from all
 </Directory>

注意：这里的路径和上面设置的路径是一样的。

接着找到AddHandler

添加.py。使apache识别.py文件为cgi程序（图中已添加）。

接下来我们就可以在webpy文件夹下写pythonCGI程序了。

第一个CGI程序

我们使用 Python 创建第一个 CGI 程序，文件名为 hello.py，文件位于 /var/www/cgi-bin目录中，内容如下：

#!/usr/bin/python3# 请注意第一行代码，在linux中需要在py文件中正确指定python解释器的路径才能运行# 在Windows中使用Python CGI文件也需要正确指定python解释器的路径才能运行
#coding=utf-8
print("Content-type:text/html") # 指定返回的类型，没有这行代码会报错
print()              # 空行，告诉服务器结束头部
# 以下是要返回的HTML正文print ('<html>')
print ('<head>')
print ('<title>Hello Word - 我的第一个 CGI 程序！</title>')
print ('</head>')
print ('<body>')
print ('<h2>Hello Word! 我的第一CGI程序</h2>')
print ('</body>')
print ('</html>')

文件保存后修改 hello.py，修改文件权限为 755（linux和macos需要在webpy文件夹下使用下面的命令来修改文件读写权限，在Windows环境下需要修改文件的读写权限）：

chmod 755 hello.py

以上程序在浏览器访问显示结果如下：

这个的 hello.py 脚本是一个简单的 Python 脚本，脚本第一行的输出内容"Content-type:text/html"发送到浏览器并告知浏览器显示的内容类型为"text/html"。

用 print 输出一个空行用于告诉服务器结束头部信息。

注：如果此处出现乱码，可以在打印html的时候打印,在下文部分代码中有所体现（注意，这里不使用UTF-8的原因是小编在这里使用utf-8出现乱码，这是因为小编的系统是Windows系统，系统默认字符集是GBK，所以会出现乱码）。
另外：请注意第一行代码，在linux中需要在py文件中正确指定python解释器的路径才能运行。在Windows中使用Python CGI文件也需要正确指定python解释器的路径才能运行

HTTP头部

hello.py 文件内容中的" Content-type:text/html"即为 HTTP 头部的一部分，它会发送给浏览器告诉浏览器文件的内容类型。

HTTP 头部的格式如下：

HTTP 字段名: 字段内容

例如：

Content-type: text/html

以下表格介绍了 CGI 程序中 HTTP 头部经常使用的信息：

头	描述
Content-type:	请求的与实体对应的 MIME 信息。例如: Content-type:text/html
Expires: Date	响应过期的日期和时间
Location: URL	用来重定向接收方到非请求URL的位置来完成请求或标识新的资源
Last-modified: Date	请求资源的最后修改时间
Content-length: N	请求的内容长度
Set-Cookie: String	设置 Http Cookie

CGI 环境变量

所有的 CGI 程序都接收以下的环境变量，这些变量在 CGI 程序中发挥了重要的作用：

变量名	描述
CONTENT_TYPE	这个环境变量的值指示所传递来的信息的 MIME 类型。目前，环境变量 CONTENT_TYPE 一般都是：application/x-www-form-urlencoded,他表示数据来自于 HTML 表单。
CONTENT_LENGTH	如果服务器与 CGI 程序信息的传递方式是 POST，这个环境变量即使从标准输入 STDIN 中可以读到的有效数据的字节数。这个环境变量在读取所输入的数据时必须使用。
HTTP_COOKIE	客户机内的 COOKIE 内容。
HTTP_USER_AGENT	提供包含了版本数或其他专有数据的客户浏览器信息。
PATH_INFO	这个环境变量的值表示紧接在 CGI 程序名之后的其他路径信息。它常常作为 CGI 程序的参数出现。
QUERY_STRING	如果服务器与 CGI 程序信息的传递方式是 GET，这个环境变量的值即使所传递的信息。这个信息经跟在 CGI 程序名的后面，两者中间用一个问号'?'分隔。
REMOTE_ADDR	这个环境变量的值是发送请求的客户机的IP地址，例如上面的192.168.1.67。这个值总是存在的。而且它是 Web 客户机需要提供给Web服务器的唯一标识，可以在 CGI 程序中用它来区分不同的 Web 客户机。
REMOTE_HOST	这个环境变量的值包含发送 CGI 请求的客户机的主机名。如果不支持你想查询，则无需定义此环境变量。
REQUEST_METHOD	提供脚本被调用的方法。对于使用 HTTP/1.0 协议的脚本，仅 GET 和 POST 有意义。
SCRIPT_FILENAME	CGI 脚本的完整路径
SCRIPT_NAME	CGI 脚本的的名称
SERVER_NAME	这是你的 WEB 服务器的主机名、别名或IP地址。
SERVER_SOFTWARE	这个环境变量的值包含了调用 CGI 程序的 HTTP 服务器的名称和版本号。例如，上面的值为 Apache/2.2.14(Unix)

以下是一个简单的 CGI 脚本输出 CGI 的环境变量：

#!/usr/bin/python3#coding=utf-8import osprint ("Content-type: text/html")print ()print ("<b>环境变量</b><br>")print ("<ul>")for key in os.environ.keys():    print ("<li><span style='color:green'>%30s </span> : %s </li>" % (key,os.environ[key]))print ("</ul>")

将以上点保存为 test.py ,并修改文件权限为 755，执行结果如下：

GET 和 POST 方法

浏览器客户端通过两种方法向服务器传递信息，这两种方法就是 GET 方法和 POST 方法。

使用 GET 方法传输数据

GET 方法发送编码后的用户信息到服务端，数据信息包含在请求页面的 URL 上，以"?"号分割, 如下所示：

http://localhost/webpy/test.py?key1=value1&key2=value2

有关 GET 请求的其他一些注释：

GET 请求可被缓存
GET 请求保留在浏览器历史记录中
GET 请求可被收藏为书签
GET 请求不应在处理敏感数据时使用
GET 请求有长度限制
GET 请求只应当用于取回数据

简单的 url 实例：GET 方法

以下是一个简单的 URL，使用 GET 方法向 test_get.py 程序发送两个参数：

http://localhost/webpy/test_get.py?name=W3Cschool教程&url=http://www.51coolma.cn

以下为 test_get.py 文件的代码：

#!/usr/bin/python3#coding=utf-8# CGI处理模块import cgi, cgitb # 创建 FieldStorage 的实例化form = cgi.FieldStorage() # 获取数据site_name = form.getvalue('name')site_url  = form.getvalue('url')print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2>%s官网：%s</h2>" % (site_name, site_url))print ("</body>")print ("</html>")

文件保存后修改 hello_get.py，修改文件权限为 755：

chmod 755 hello_get.py

浏览器请求输出结果：

简单的表单实例：GET 方法

以下是一个通过 HTML 的表单使用 GET 方法向服务器发送两个数据，提交的服务器脚本同样是 test_get.py 文件，hello_get.html 代码如下：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/test_get.py" method="get">站点名称: <input type="text" name="name">  <br />站点 URL: <input type="text" name="url" /><input type="submit" value="提交" /></form></body></html>

默认情况下 webpy 目录只能存放脚本文件，我们将 hello_get.html 存储在 WWW 目录下，修改文件权限为 755：

chmod 755 hello_get.html

Gif 演示如下所示：

使用 POST 方法传递数据

使用 POST 方法向服务器传递数据是更安全可靠的，像一些敏感信息如用户密码等需要使用 POST 传输数据。

以下同样是 test_get.py ，它也可以处理浏览器提交的 POST 表单数据:

#!/usr/bin/python3#coding=utf-8# CGI处理模块import cgi, cgitb # 创建 FieldStorage 的实例化form = cgi.FieldStorage() # 获取数据site_name = form.getvalue('name')site_url  = form.getvalue('url')print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<meta charset="utf-8">")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2>%s官网：%s</h2>" % (site_name, site_url))print ("</body>")print ("</html>")

以下为表单通过 POST 方法（method="post"）向服务器脚本 test_get.py 提交数据:

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/hello_get.py" method="post">站点名称: <input type="text" name="name">  <br />站点 URL: <input type="text" name="url" /><input type="submit" value="提交" /></form></body></html></form>

Gif 演示如下所示：

通过 CGI 程序传递 checkbox 数据

checkbox 用于提交一个或者多个选项数据，HTML 代码如下：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/checkbox.py" method="POST" target="_blank"><input type="checkbox" name="youj" value="on" /> W3Cschool教程<input type="checkbox" name="google" value="on" /> Google<input type="submit" value="选择站点" /></form></body></html>

以下为 checkbox.py 文件的代码：

#!/usr/bin/python3#coding=utf-8# 引入 CGI 处理模块 import cgi, cgitb # 创建 FieldStorage的实例 form = cgi.FieldStorage() # 接收字段数据if form.getvalue('google'):    google_flag = "是"else:    google_flag = "否"if form.getvalue('youj'):    youj_flag = "是"else:    youj_flag = "否"print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2> W3Cschool教程是否选择了 : %s</h2>" % youj_flag)print ("<h2> Google 是否选择了 : %s</h2>" % google_flag)print ("</body>")print ("</html>")

修改 checkbox.py 权限：

chmod 755 checkbox.py

浏览器访问 Gif 演示图：

通过 CGI 程序传递 Radio 数据

Radio 只向服务器传递一个数据，HTML 代码如下：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/radiobutton.py" method="post" target="_blank"><input type="radio" name="site" value="W3Cschool教程" /> W3Cschool教程<input type="radio" name="site" value="google" /> Google<input type="submit" value="提交" /></form></body></html>

radiobutton.py 脚本代码如下：

#!/usr/bin/python3#coding=utf-8# 引入 CGI 处理模块 import cgi, cgitb # 创建 FieldStorage的实例 form = cgi.FieldStorage() # 接收字段数据if form.getvalue('site'):    site = form.getvalue('site')else:    site = "提交数据为空"print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2> 选中的网站是 %s</h2>" % site)print ("</body>")print ("</html>")

修改 radiobutton.py 权限：

chmod 755 radiobutton.py

浏览器访问 Gif 演示图：

通过 CGI 程序传递 Textarea 数据

Textarea 向服务器传递多行数据，HTML 代码如下：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/textarea.py" method="post" target="_blank"><textarea name="textcontent" cols="40" rows="4">在这里输入内容...</textarea><input type="submit" value="提交" /></form></body></html>

textarea.py 脚本代码如下：

#!/usr/bin/python3#coding=utf-8# 引入 CGI 处理模块 import cgi, cgitb # 创建 FieldStorage的实例 form = cgi.FieldStorage() # 接收字段数据if form.getvalue('textcontent'):    text_content = form.getvalue('textcontent')else:    text_content = "没有内容"print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2> 输入的内容是：%s</h2>" % text_content)print ("</body>")print ("</html>")

修改 textarea.py 权限：

chmod 755 textarea.py

浏览器访问 Gif 演示图：

通过 CGI 程序传递下拉数据。

HTML 下拉框代码如下：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/dropdown.py" method="post" target="_blank"><select name="dropdown"><option value="W3Cschool教程" selected>W3Cschool教程</option>
<option value="google">Google</option></select><input type="submit" value="提交"/></form></body></html>

dropdown.py 脚本代码如下所示：

#!/usr/bin/python3
#coding=utf-8# 引入 CGI 处理模块 import cgi, cgitb # 创建 FieldStorage的实例 form = cgi.FieldStorage() # 接收字段数据if form.getvalue('dropdown'):    dropdown_value = form.getvalue('dropdown')else:    dropdown_value = "没有内容"print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<meta charset="utf-8">")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2> 选中的选项是：%s</h2>" % dropdown_value)print ("</body>")print ("</html>")

修改 dropdown.py 权限：

chmod 755 dropdown.py

浏览器访问 Gif 演示图：

CGI 中使用 Cookie

在 http 协议一个很大的缺点就是不对用户身份的进行判断，这样给编程人员带来很大的不便，而 cookie 功能的出现弥补了这个不足。

cookie 就是在客户访问脚本的同时，通过客户的浏览器，在客户硬盘上写入纪录数据，当下次客户访问脚本时取回数据信息，从而达到身份判别的功能，cookie 常用在身份校验中。

cookie 的语法

http cookie 的发送是通过 http 头部来实现的，他早于文件的传递，头部set-cookie 的语法如下：

Set-cookie:name=name;expires=date;path=path;domain=domain;secure

name=name: 需要设置cookie的值(name不能使用";"和","号),有多个name值时用 ";" 分隔，例如：name1=name1;name2=name2;name3=name3。
expires=date: cookie的有效期限,格式： expires="Wdy,DD-Mon-YYYY HH:MM:SS"
path=path: 设置 cookie 支持的路径,如果path是一个路径，则 cookie 对这个目录下的所有文件及子目录生效，例如： path="/webpy/"，如果path是一个文件，则cookie指对这个文件生效，例如：path="/webpy/cookie.py"。
domain=domain: 对 cookie 生效的域名，例如：domain="www.51coolma.cn"
secure: 如果给出此标志，表示cookie只能通过SSL协议的https服务器来传递。
cookie的接收是通过设置环境变量 HTTP_COOKIE 来实现的，CGI 程序可以通过检索该变量获取 cookie 信息。

Cookie 设置

Cookie 的设置非常简单，cookie 会在 http 头部单独发送。以下实例在 cookie 中设置了name 和 expires：

#!/usr/bin/python3#coding=utf-8
print ('Content-Type: text/html')
print ('Set-Cookie: name="W3Cschool";expires=Thu 02 Dec 2021 18:30:00 GMT')//注意，这个cookie在这个时间前有效，之后使用cookie会过期
print ()
print ("""
<html>
  <head>
    <meta charset="gbk">
    <title>W3Cschool教程(51coolma.cn)</title>
  </head>
    <body>
        <h1>Cookie set OK!</h1>
    </body>
</html>
""")

将以上代码保存到 cookie_set.py，并修改 cookie_set.py 权限：

chmod 755 cookie_set.py

以上实例使用了 Set-Cookie 头信息来设置 Cookie 信息，可选项中设置了 Cookie 的其他属性，如过期时间 Expires，域名 Domain，路径 Path。这些信息设置在 "Content-type:text/html"之前。

注意：cookie不能存放中文，本文采用英文例子，如果要使用中文可以使用后端编码（可以采用utf-8等编码，python和JavaScript都有提供响应的编解码的功能）,传到前端后再将其解码即可。

检索Cookie信息

Cookie 信息检索页非常简单，Cookie 信息存储在 CGI 的环境变量 HTTP_COOKIE 中，存储格式如下：

key1=value1;key2=value2;key3=value3....

以下是一个简单的 CGI 检索 cookie 信息的程序：

#!/usr/bin/python3#coding=utf-8
# 导入模块
import os
import http.cookies
print ("Content-type: text/html")
print ()
print ("""
<html>
<head>
<meta charset="gbk">
<title>W3Cschool教程(51coolma.cn)</title>
</head>
<body>
<h1>读取cookie信息</h1>
""")
if 'HTTP_COOKIE' in os.environ:
    cookie_string=os.environ.get('HTTP_COOKIE')
    c=http.cookies.SimpleCookie()
    c.load(cookie_string)
    try:
        data=c['name'].value
        print ("cookie data: "+data+"<br>")
    except KeyError:
        print ("cookie 没有设置或者已过去<br>")
print ("""
</body>
</html>
""")

将以上代码保存到 cookie_get.py，并修改 cookie_get.py 权限：

chmod 755 cookie_get.py

以上 cookie 设置的Gif 如下所示：

文件上传实例

HTML 设置上传文件的表单需要设置 enctype 属性为 multipart/form-data，代码如下所示：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body> <form enctype="multipart/form-data"                      action="/webpy/save_file.py" method="post">   <p>选中文件: <input type="file" name="filename" /></p>   <p><input type="submit" value="上传" /></p>   </form></body></html>

save_file.py 脚本文件代码如下：

#!/usr/bin/python3#coding=utf-8
import cgi, os
import cgitb
cgitb.enable()
form = cgi.FieldStorage()
# 获取文件名
fileitem = form['filename']
# 检测文件是否上传
if fileitem.filename:
   # 设置文件路径 
   fn = os.path.basename(fileitem.filename)
   open(os.getcwd()+'/tmp/' + fn, 'wb').write(fileitem.file.read())
   message = '文件 "' + fn + '" 上传成功'
   
else:
   message = '文件没有上传'
print ("Content-type: text/html")
print () 
print ("""
<html>
<head>
<meta charset="gbk">
<title>W3Cschool教程(51coolma.cn)</title>
</head>
<body>
   <p>%s</p>
</body>
</html>
""" % (message,))

将以上代码保存到 save_file.py，并修改 save_file.py 权限：

chmod 755 save_file.py

以上文件上传代码 Gif 如下所示：

如果你使用的系统是 Unix/Linux，你必须替换文件分隔符，在 window 下只需要使用open() 语句即可：

fn = os.path.basename(fileitem.filename.replace("", "/" ))

另外，请注意在webpy下创建一个tmp文件夹，不然上传的时候会报错

文件下载对话框

我们先在当前目录下创建 foo.txt 文件，用于程序的下载。

文件下载通过设置 HTTP 头信息来实现，功能代码如下：

#!/usr/bin/python3# HTTP 头部print ("Content-Disposition: attachment; filename="foo.txt"")print ()# 打开文件fo = open("foo.txt", "rb")str = fo.read();print (str)# 关闭文件fo.close()

什么是 CGI

CGI 目前由 NCSA 维护，NCSA 定义 CGI 如下：

CGI(Common Gateway Interface),通用网关接口,它是一段程序,运行在服务器上如：HTTP服务器，提供同客户端 HTML 页面的接口。

网页浏览

为了更好的了解 CGI 是如何工作的，我们可以从在网页上点击一个链接或 URL 的流程：

1、使用你的浏览器访问 URL 并连接到 HTTP web 服务器。
2、Web 服务器接收到请求信息后会解析 URL，并查找访问的文件在服务器上是否存在，如果存在返回文件的内容，否则返回错误信息。
3、浏览器从服务器上接收信息，并显示接收的文件或者错误信息。

CGI 程序可以是 Python 脚本，PERL 脚本，SHELL 脚本，C 或者 C++ 程序等。

CGI 架构图

cgiarch

Web 服务器支持及配置

在你进行 CGI 编程前，确保您的 Web 服务器支持 CGI 及已经配置了 CGI 的处理程序。

Apache 支持 CGI 配置（这里使用PHPstudy集成的Apache）：

打开Apache的配置文件httpd-conf，在文件中找到如下内容：

首先找到ScriptAlias（图片内容为已经修改过的值，默认值应该有所不同而且是被注释掉的）

然后找到Directory，将其修改为

<Directory "F:/phpstudy/phpstudy_pro/WWW/webpy">
    AllowOverride None
    Options +ExecCGI
    Order allow,deny
    Allow from all
 </Directory>

注意：这里的路径和上面设置的路径是一样的。

接着找到AddHandler

添加.py。使apache识别.py文件为cgi程序（图中已添加）。

接下来我们就可以在webpy文件夹下写pythonCGI程序了。

第一个CGI程序

我们使用 Python 创建第一个 CGI 程序，文件名为 hello.py，文件位于 /var/www/cgi-bin目录中，内容如下：

#!/usr/bin/python3# 请注意第一行代码，在linux中需要在py文件中正确指定python解释器的路径才能运行# 在Windows中使用Python CGI文件也需要正确指定python解释器的路径才能运行
#coding=utf-8
print("Content-type:text/html") # 指定返回的类型，没有这行代码会报错
print()              # 空行，告诉服务器结束头部
# 以下是要返回的HTML正文print ('<html>')
print ('<head>')
print ('<title>Hello Word - 我的第一个 CGI 程序！</title>')
print ('</head>')
print ('<body>')
print ('<h2>Hello Word! 我的第一CGI程序</h2>')
print ('</body>')
print ('</html>')

chmod 755 hello.py

以上程序在浏览器访问显示结果如下：

这个的 hello.py 脚本是一个简单的 Python 脚本，脚本第一行的输出内容"Content-type:text/html"发送到浏览器并告知浏览器显示的内容类型为"text/html"。

用 print 输出一个空行用于告诉服务器结束头部信息。

注：如果此处出现乱码，可以在打印html的时候打印,在下文部分代码中有所体现（注意，这里不使用UTF-8的原因是小编在这里使用utf-8出现乱码，这是因为小编的系统是Windows系统，系统默认字符集是GBK，所以会出现乱码）。
另外：请注意第一行代码，在linux中需要在py文件中正确指定python解释器的路径才能运行。在Windows中使用Python CGI文件也需要正确指定python解释器的路径才能运行

HTTP头部

hello.py 文件内容中的" Content-type:text/html"即为 HTTP 头部的一部分，它会发送给浏览器告诉浏览器文件的内容类型。

HTTP 头部的格式如下：

HTTP 字段名: 字段内容

例如：

Content-type: text/html

以下表格介绍了 CGI 程序中 HTTP 头部经常使用的信息：

头	描述
Content-type:	请求的与实体对应的 MIME 信息。例如: Content-type:text/html
Expires: Date	响应过期的日期和时间
Location: URL	用来重定向接收方到非请求URL的位置来完成请求或标识新的资源
Last-modified: Date	请求资源的最后修改时间
Content-length: N	请求的内容长度
Set-Cookie: String	设置 Http Cookie

CGI 环境变量

所有的 CGI 程序都接收以下的环境变量，这些变量在 CGI 程序中发挥了重要的作用：

变量名	描述
CONTENT_TYPE	这个环境变量的值指示所传递来的信息的 MIME 类型。目前，环境变量 CONTENT_TYPE 一般都是：application/x-www-form-urlencoded,他表示数据来自于 HTML 表单。
CONTENT_LENGTH	如果服务器与 CGI 程序信息的传递方式是 POST，这个环境变量即使从标准输入 STDIN 中可以读到的有效数据的字节数。这个环境变量在读取所输入的数据时必须使用。
HTTP_COOKIE	客户机内的 COOKIE 内容。
HTTP_USER_AGENT	提供包含了版本数或其他专有数据的客户浏览器信息。
PATH_INFO	这个环境变量的值表示紧接在 CGI 程序名之后的其他路径信息。它常常作为 CGI 程序的参数出现。
QUERY_STRING	如果服务器与 CGI 程序信息的传递方式是 GET，这个环境变量的值即使所传递的信息。这个信息经跟在 CGI 程序名的后面，两者中间用一个问号'?'分隔。
REMOTE_ADDR	这个环境变量的值是发送请求的客户机的IP地址，例如上面的192.168.1.67。这个值总是存在的。而且它是 Web 客户机需要提供给Web服务器的唯一标识，可以在 CGI 程序中用它来区分不同的 Web 客户机。
REMOTE_HOST	这个环境变量的值包含发送 CGI 请求的客户机的主机名。如果不支持你想查询，则无需定义此环境变量。
REQUEST_METHOD	提供脚本被调用的方法。对于使用 HTTP/1.0 协议的脚本，仅 GET 和 POST 有意义。
SCRIPT_FILENAME	CGI 脚本的完整路径
SCRIPT_NAME	CGI 脚本的的名称
SERVER_NAME	这是你的 WEB 服务器的主机名、别名或IP地址。
SERVER_SOFTWARE	这个环境变量的值包含了调用 CGI 程序的 HTTP 服务器的名称和版本号。例如，上面的值为 Apache/2.2.14(Unix)

以下是一个简单的 CGI 脚本输出 CGI 的环境变量：

#!/usr/bin/python3#coding=utf-8import osprint ("Content-type: text/html")print ()print ("<b>环境变量</b><br>")print ("<ul>")for key in os.environ.keys():    print ("<li><span style='color:green'>%30s </span> : %s </li>" % (key,os.environ[key]))print ("</ul>")

将以上点保存为 test.py ,并修改文件权限为 755，执行结果如下：

GET 和 POST 方法

浏览器客户端通过两种方法向服务器传递信息，这两种方法就是 GET 方法和 POST 方法。

使用 GET 方法传输数据

GET 方法发送编码后的用户信息到服务端，数据信息包含在请求页面的 URL 上，以"?"号分割, 如下所示：

http://localhost/webpy/test.py?key1=value1&key2=value2

有关 GET 请求的其他一些注释：

GET 请求可被缓存
GET 请求保留在浏览器历史记录中
GET 请求可被收藏为书签
GET 请求不应在处理敏感数据时使用
GET 请求有长度限制
GET 请求只应当用于取回数据

简单的 url 实例：GET 方法

以下是一个简单的 URL，使用 GET 方法向 test_get.py 程序发送两个参数：

http://localhost/webpy/test_get.py?name=W3Cschool教程&url=http://www.51coolma.cn

以下为 test_get.py 文件的代码：

#!/usr/bin/python3#coding=utf-8# CGI处理模块import cgi, cgitb # 创建 FieldStorage 的实例化form = cgi.FieldStorage() # 获取数据site_name = form.getvalue('name')site_url  = form.getvalue('url')print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2>%s官网：%s</h2>" % (site_name, site_url))print ("</body>")print ("</html>")

文件保存后修改 hello_get.py，修改文件权限为 755：

chmod 755 hello_get.py

浏览器请求输出结果：

简单的表单实例：GET 方法

以下是一个通过 HTML 的表单使用 GET 方法向服务器发送两个数据，提交的服务器脚本同样是 test_get.py 文件，hello_get.html 代码如下：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/test_get.py" method="get">站点名称: <input type="text" name="name">  <br />站点 URL: <input type="text" name="url" /><input type="submit" value="提交" /></form></body></html>

默认情况下 webpy 目录只能存放脚本文件，我们将 hello_get.html 存储在 WWW 目录下，修改文件权限为 755：

chmod 755 hello_get.html

Gif 演示如下所示：

使用 POST 方法传递数据

使用 POST 方法向服务器传递数据是更安全可靠的，像一些敏感信息如用户密码等需要使用 POST 传输数据。

以下同样是 test_get.py ，它也可以处理浏览器提交的 POST 表单数据:

#!/usr/bin/python3#coding=utf-8# CGI处理模块import cgi, cgitb # 创建 FieldStorage 的实例化form = cgi.FieldStorage() # 获取数据site_name = form.getvalue('name')site_url  = form.getvalue('url')print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<meta charset="utf-8">")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2>%s官网：%s</h2>" % (site_name, site_url))print ("</body>")print ("</html>")

以下为表单通过 POST 方法（method="post"）向服务器脚本 test_get.py 提交数据:

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/hello_get.py" method="post">站点名称: <input type="text" name="name">  <br />站点 URL: <input type="text" name="url" /><input type="submit" value="提交" /></form></body></html></form>

Gif 演示如下所示：

通过 CGI 程序传递 checkbox 数据

checkbox 用于提交一个或者多个选项数据，HTML 代码如下：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/checkbox.py" method="POST" target="_blank"><input type="checkbox" name="youj" value="on" /> W3Cschool教程<input type="checkbox" name="google" value="on" /> Google<input type="submit" value="选择站点" /></form></body></html>

以下为 checkbox.py 文件的代码：

#!/usr/bin/python3#coding=utf-8# 引入 CGI 处理模块 import cgi, cgitb # 创建 FieldStorage的实例 form = cgi.FieldStorage() # 接收字段数据if form.getvalue('google'):    google_flag = "是"else:    google_flag = "否"if form.getvalue('youj'):    youj_flag = "是"else:    youj_flag = "否"print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2> W3Cschool教程是否选择了 : %s</h2>" % youj_flag)print ("<h2> Google 是否选择了 : %s</h2>" % google_flag)print ("</body>")print ("</html>")

修改 checkbox.py 权限：

chmod 755 checkbox.py

浏览器访问 Gif 演示图：

通过 CGI 程序传递 Radio 数据

Radio 只向服务器传递一个数据，HTML 代码如下：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/radiobutton.py" method="post" target="_blank"><input type="radio" name="site" value="W3Cschool教程" /> W3Cschool教程<input type="radio" name="site" value="google" /> Google<input type="submit" value="提交" /></form></body></html>

radiobutton.py 脚本代码如下：

#!/usr/bin/python3#coding=utf-8# 引入 CGI 处理模块 import cgi, cgitb # 创建 FieldStorage的实例 form = cgi.FieldStorage() # 接收字段数据if form.getvalue('site'):    site = form.getvalue('site')else:    site = "提交数据为空"print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2> 选中的网站是 %s</h2>" % site)print ("</body>")print ("</html>")

修改 radiobutton.py 权限：

chmod 755 radiobutton.py

浏览器访问 Gif 演示图：

通过 CGI 程序传递 Textarea 数据

Textarea 向服务器传递多行数据，HTML 代码如下：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/textarea.py" method="post" target="_blank"><textarea name="textcontent" cols="40" rows="4">在这里输入内容...</textarea><input type="submit" value="提交" /></form></body></html>

textarea.py 脚本代码如下：

#!/usr/bin/python3#coding=utf-8# 引入 CGI 处理模块 import cgi, cgitb # 创建 FieldStorage的实例 form = cgi.FieldStorage() # 接收字段数据if form.getvalue('textcontent'):    text_content = form.getvalue('textcontent')else:    text_content = "没有内容"print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2> 输入的内容是：%s</h2>" % text_content)print ("</body>")print ("</html>")

修改 textarea.py 权限：

chmod 755 textarea.py

浏览器访问 Gif 演示图：

通过 CGI 程序传递下拉数据。

HTML 下拉框代码如下：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body><form action="/webpy/dropdown.py" method="post" target="_blank"><select name="dropdown"><option value="W3Cschool教程" selected>W3Cschool教程</option>
<option value="google">Google</option></select><input type="submit" value="提交"/></form></body></html>

dropdown.py 脚本代码如下所示：

#!/usr/bin/python3
#coding=utf-8# 引入 CGI 处理模块 import cgi, cgitb # 创建 FieldStorage的实例 form = cgi.FieldStorage() # 接收字段数据if form.getvalue('dropdown'):    dropdown_value = form.getvalue('dropdown')else:    dropdown_value = "没有内容"print ("Content-type:text/html")print ()print ("<html>")print ("<head>")print ("<meta charset="utf-8">")print ("<title>W3Cschool教程 CGI 测试实例</title>")print ("</head>")print ("<body>")print ("<h2> 选中的选项是：%s</h2>" % dropdown_value)print ("</body>")print ("</html>")

修改 dropdown.py 权限：

chmod 755 dropdown.py

浏览器访问 Gif 演示图：

CGI 中使用 Cookie

在 http 协议一个很大的缺点就是不对用户身份的进行判断，这样给编程人员带来很大的不便，而 cookie 功能的出现弥补了这个不足。

cookie 的语法

http cookie 的发送是通过 http 头部来实现的，他早于文件的传递，头部set-cookie 的语法如下：

Set-cookie:name=name;expires=date;path=path;domain=domain;secure

name=name: 需要设置cookie的值(name不能使用";"和","号),有多个name值时用 ";" 分隔，例如：name1=name1;name2=name2;name3=name3。
expires=date: cookie的有效期限,格式： expires="Wdy,DD-Mon-YYYY HH:MM:SS"
path=path: 设置 cookie 支持的路径,如果path是一个路径，则 cookie 对这个目录下的所有文件及子目录生效，例如： path="/webpy/"，如果path是一个文件，则cookie指对这个文件生效，例如：path="/webpy/cookie.py"。
domain=domain: 对 cookie 生效的域名，例如：domain="www.51coolma.cn"
secure: 如果给出此标志，表示cookie只能通过SSL协议的https服务器来传递。
cookie的接收是通过设置环境变量 HTTP_COOKIE 来实现的，CGI 程序可以通过检索该变量获取 cookie 信息。

Cookie 设置

Cookie 的设置非常简单，cookie 会在 http 头部单独发送。以下实例在 cookie 中设置了name 和 expires：

#!/usr/bin/python3#coding=utf-8
print ('Content-Type: text/html')
print ('Set-Cookie: name="W3Cschool";expires=Thu 02 Dec 2021 18:30:00 GMT')//注意，这个cookie在这个时间前有效，之后使用cookie会过期
print ()
print ("""
<html>
  <head>
    <meta charset="gbk">
    <title>W3Cschool教程(51coolma.cn)</title>
  </head>
    <body>
        <h1>Cookie set OK!</h1>
    </body>
</html>
""")

将以上代码保存到 cookie_set.py，并修改 cookie_set.py 权限：

chmod 755 cookie_set.py

检索Cookie信息

Cookie 信息检索页非常简单，Cookie 信息存储在 CGI 的环境变量 HTTP_COOKIE 中，存储格式如下：

key1=value1;key2=value2;key3=value3....

以下是一个简单的 CGI 检索 cookie 信息的程序：

#!/usr/bin/python3#coding=utf-8
# 导入模块
import os
import http.cookies
print ("Content-type: text/html")
print ()
print ("""
<html>
<head>
<meta charset="gbk">
<title>W3Cschool教程(51coolma.cn)</title>
</head>
<body>
<h1>读取cookie信息</h1>
""")
if 'HTTP_COOKIE' in os.environ:
    cookie_string=os.environ.get('HTTP_COOKIE')
    c=http.cookies.SimpleCookie()
    c.load(cookie_string)
    try:
        data=c['name'].value
        print ("cookie data: "+data+"<br>")
    except KeyError:
        print ("cookie 没有设置或者已过去<br>")
print ("""
</body>
</html>
""")

将以上代码保存到 cookie_get.py，并修改 cookie_get.py 权限：

chmod 755 cookie_get.py

以上 cookie 设置的Gif 如下所示：

文件上传实例

HTML 设置上传文件的表单需要设置 enctype 属性为 multipart/form-data，代码如下所示：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>W3Cschool教程(51coolma.cn)</title></head><body> <form enctype="multipart/form-data"                      action="/webpy/save_file.py" method="post">   <p>选中文件: <input type="file" name="filename" /></p>   <p><input type="submit" value="上传" /></p>   </form></body></html>

save_file.py 脚本文件代码如下：

#!/usr/bin/python3#coding=utf-8
import cgi, os
import cgitb
cgitb.enable()
form = cgi.FieldStorage()
# 获取文件名
fileitem = form['filename']
# 检测文件是否上传
if fileitem.filename:
   # 设置文件路径 
   fn = os.path.basename(fileitem.filename)
   open(os.getcwd()+'/tmp/' + fn, 'wb').write(fileitem.file.read())
   message = '文件 "' + fn + '" 上传成功'
   
else:
   message = '文件没有上传'
print ("Content-type: text/html")
print () 
print ("""
<html>
<head>
<meta charset="gbk">
<title>W3Cschool教程(51coolma.cn)</title>
</head>
<body>
   <p>%s</p>
</body>
</html>
""" % (message,))

将以上代码保存到 save_file.py，并修改 save_file.py 权限：

chmod 755 save_file.py

以上文件上传代码 Gif 如下所示：

如果你使用的系统是 Unix/Linux，你必须替换文件分隔符，在 window 下只需要使用open() 语句即可：

fn = os.path.basename(fileitem.filename.replace("", "/" ))

另外，请注意在webpy下创建一个tmp文件夹，不然上传的时候会报错

文件下载对话框

我们先在当前目录下创建 foo.txt 文件，用于程序的下载。

文件下载通过设置 HTTP 头信息来实现，功能代码如下：

#!/usr/bin/python3# HTTP 头部print ("Content-Disposition: attachment; filename="foo.txt"")print ()# 打开文件fo = open("foo.txt", "rb")str = fo.read();print (str)# 关闭文件fo.close()

很多人抱怨pip安装库有些时候太慢了，那是pip源的问题。

前面说过pip从PyPi中下载库文件，但由于PyPi服务器在国外，访问起来很慢。

但国内提供了很多镜像源，用来替代PyPi，像清华源、豆瓣源、阿里云源等。

这些镜像源备份了PyPi里的数据，由于服务器在国内，速度会快很多。

但镜像源数据有滞后性，比如说清华源的pypi 镜像每 5 分钟同步一次。

使用镜像源有两种方式，以清华源为例：

(1) 临时使用

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package matplotlib

除了matplotlib是要安装的库名外，其他都是固定格式

(2) 设为默认

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

设为默认后，以后安装库都是从清华源下载，而且无需再加镜像源网址

附主流镜像源地址

清华：https://pypi.tuna.tsinghua.edu.cn/simple
阿里云：http://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
华中理工大学：http://pypi.hustunique.com/
山东理工大学：http://pypi.sdutlinux.org/
豆瓣：http://pypi.douban.com/simple/

包管理工具是用来对一些应用程序的包进行管理的工具，比如nodejs使用npm，yarn来进行包管理，linux使用apt来进行包管理。python包管理工具或许不如他们有名（实际上pip的大名比前几位更响亮），但绝对比他们好用易用。没错，小编这里要说的就是pip，接下来的这篇文章，我们将对pip使用进行一个详细的介绍。

认识pip

众所周知，pip可以对python的第三方库进行安装、更新、卸载等操作，十分方便。

pip的全称：package installer for python，也就是Python包管理工具。

可能有些人用了很久pip，但还不清楚包管理工具是个啥。

我们先从Python这门语言说起，Python之所以受欢迎不光是因为它简单易学，更重要的是它有成千上万的宝藏库。

这些库相当于是已经集成好的工具，只要安装就能在Python里使用。它们可以处理各式各样的问题，无需你再造轮子，而且随着社区的不断更新维护，有些库越来越强大，几乎能媲美企业级应用。

那么这些工具库怎么下载安装呢？它们被放在一个统一的“仓库”里，名叫PyPi（Python Package Index），所有的库安装都是从这里调度。

有了仓库之后，还需要有管理员，pip就是这样一个角色。pip把库从PyPi取出来，然后安装到Python里，还可以管理安装好的库，比如更新、查看、搜索、卸载等等。

总的来说，pip的Python第三方库的大管家，搞懂它，会让你省很多事。

下面总结了30个pip使用过程中的常识和技巧，供大家参考。

「注：因为pip是一个命令行程序，所以pip一般都在命令行中执行各种操作」

1、安装pip

从Python 3.4开始，pip已经内置在Python中，所以无需再次安装。

如果你的Python版本没有pip，那可以使用下面两种方法安装。

(1) 命令行中输入easy_install pip，非常快捷

(2) 在下面网址中下载pip安装文件，然后解压到python scripts目录中，执行python setup.py install安装即可

下载网址：https://pypi.org/project/pip/#files

下载文件：

安装pip

2、查看pip版本

pip --version

查看pip版本

3、升级pip

如果pip的版本太低，可以升级当前版本

pip install --upgrade pip

4、获取帮助

想了解如何使用pip，以及pip有哪些功能，执行下面语句可以获取详细教程:

pip help

5、安装库

使用pip安装第三方库，执行下面语句

pip install package_name

指定package版本：

pip install package_name==1.1.2

比如说，我要安装3.4.1版本的matplotlib

pip install matplotlib==3.4.1

6、批量安装库

如果一个项目需要安装很多库，那可以批量安装：

pip install -r e: equirements.txt

requirements.txt文件内容格式如下：

批量安装文件

7、使用wheel文件安装库

这种方法适合离线安装，wheel文件是库的源文件，可以下载后放到本地安装。

步骤如下：

(1) 在下面网站里找相应库的.whl文件

https://www.lfd.uci.edu/~gohlke/pythonlibs/

(2) 下载.whl文件，注意对应的版本

下载轮子

(3) 在.whl所在文件夹内，按Shift键+鼠标右键，打开CMD窗口或者PowerShell

(4) 输入命令：

pip install matplotlib‑3.4.1‑cp39‑cp39‑win_amd64.whl

即可完成安装

8、卸载库

安装好的库可以再卸载：

pip uninstall package_name

9、升级库

对当前库进行版本升级:

pip install --upgrade package_name

10、查看库信息

pip show -f package_name

查看库信息

11、查看已安装的库

列出所有已安装的第三方库和对应版本

pip list

查看已安装库列表

12、将库列表保存到指定文件中

把已经安装的库信息保存到到本地txt文件中：

pip freeze > requirements.txt

导出库文件列表

13、查看需要升级的库

目前已经安装的库中，看哪些需要版本升级

pip list -o

查看可升级的库

14、检查兼容问题

验证已安装的库是否有兼容依赖问题

pip check package-name

兼容性检查

15、下载库到本地

将库下载到本地指定文件，保存为whl格式

pip download package_name -d "要保存的文件路径"

下载库

xlrd库是一个python用于操作excel的第三方库。它的主要功能是用来读取excel。通常会与xlwt 、 xlutils组合进行使用。

注意！这里的操作excel，实际上与excel无关，不需要下载excel，xlrd库直接操作的是excel打开的xls文件！
注意！xlrd库只能读取excel，不能修改，编写excel！

一、xlrd的安装

可以使用pip进行安装，这是最简单也是最普遍的安装方式！

在cmd中输入pip install xlrd即可安装xlrd库。

安装成功后可以使用pip list来检查是否正确安装以及查看当前的xlrd版本。

注意：xlrd较高版本中不支持.xlsx文件，可以手动将版本降至更低的版本或者将.xlsx文件改为.xls文件
先卸载掉现有的 xlrd —> pip uninstall xlrd
重新安装指定版本的 xlrd —> pip install xlrd == 1.2.0
接下来的文章由于此原因使用1.2.0版本的xlrd进行介绍

二、xlrd模块的使用

下面以这个工作簿为例

1、导入模块

 import xlrd

2、打开工作薄

# filename是文件的路径名称workbook = xlrd.open_workbook(filename=r'C:UsersWindows10Desktopxlsx文件.xlsx')

3、获取需要操作的sheet表格（有三种方法）

①通过索引获取

# 获取第一个sheet表格table = workbook.sheets()[0]

②通过索引顺序获取

# 通过索引顺序获取table = workbook.sheet_by_index(0)

③通过sheet名称获取

# 通过sheet名称获取table = workbook.sheet_by_name(sheet_name='Sheet1')

补充：获取工作薄中所有sheet名称

# 获取工作薄中所有的sheet名称names = workbook.sheet_names()print(names)

运行结果：

三、行和列的操作

常用1：获取sheet中有多少行和多少列

# 获取sheet中有效行数# 需要先指定sheet工作表table = workbook.sheet_by_name(sheet_name='视频课列表')row = table.nrowsprint(row)

运行结果：

# 获取sheet中有效列数# 需要先指定sheet工作表table = workbook.sheet_by_name(sheet_name='视频课列表')col = table.ncolsprint(col)

运行结果

常用2：获取一行中有多少列数据

# 返回该行的有效单元格长度# 需要先指定sheet工作表table = workbook.sheet_by_name(sheet_name='视频课列表')num = table.row_len(0)print(num)

打印结果：

常用3：获取指定行或者列中所有的数据

# rowx表示是获取第几行的数据# start_col表示从索引为多少开始，end_colx表示从索引为多少结束，# end_colx为None表示结束没有限制# 获取指定行中的数据并以列表的形式返回# 需要先指定sheet工作表table = workbook.sheet_by_name(sheet_name='视频课列表')table_list = table.row_values(rowx=0, start_colx=0, end_colx=None)print(table_list)

运行结果为：

# colx表示是获取第几列的数据
# start_rowx表示从索引为多少开始，end_rowx表示从索引为多少结束，
# end_rowx为None表示结束没有限制
# 获取指定列中的数据并以列表的形式返回

# 需要先指定sheet工作表
table = workbook.sheet_by_name(sheet_name='视频课列表')
table_list = table.col_values(colx=0, start_rowx=0, end_rowx=None)
print(table_list)

运行结果为：

补充：了解即可

# 需要先指定sheet工作表table = workbook.sheet_by_name(sheet_name='视频课列表')#返回由该列中所有的单元格对象组成的列表print(table.row(0))#返回由该行中所有的单元格对象组成的列表print(table.row_slice(0))#返回由该行中所有单元格的数据类型组成的列表print(table.row_types(0, start_colx=0, end_colx=None))

运行结果为：

# 需要先指定sheet工作表
table = workbook.sheet_by_name(sheet_name='视频课列表')
#返回由该列中所有的单元格对象组成的列表
print(table.col(0, start_rowx=0, end_rowx=None))
#返回由该列中所有的单元格对象组成的列表
print(table.col_slice(0, start_rowx=0, end_rowx=None))
#返回由该列中所有单元格的数据类型组成的列表
print(table.col_types(0, start_rowx=0, end_rowx=None))

运行结果为：

四、单元格的操作

1、获取单元中的值

# 获取指定单元格内的值（第二行第一列，在python中从零开始计算序号）
# 需要先指定sheet工作表
table = workbook.sheet_by_name(sheet_name='视频课列表')
value = table.cell_value(rowx=1, colx=0)
print(value)

运行结果为：

2、获取单元格内的组成对象和数据

# 需要先指定sheet工作表
table = workbook.sheet_by_name(sheet_name='视频课列表')
value = table.cell(rowx=1, colx=0)
print(value)

运行结果

3、获取单元格的数据类型

python读取excel中单元格的内容返回的有5种类型。分别为：

0 empty
1 string
2 number
3 date
4 boolean
5 error

即date的ctype=3，这时需要使用xlrd的xldate_as_tuple来处理为date格式，先判断表格的ctype=3时xldate才能开始操作。

# 需要先指定sheet工作表table = workbook.sheet_by_name(sheet_name='视频课列表')value = table.cell_type(rowx=0, colx=1)print(value)

运行结果为：

五、案例

需求：获取上面表格中的数据并依次打印出来

import xlrdworkbook = xlrd.open_workbook(filename=r'C:UsersEeeDong-10DesktopW3Cschool课程内容.xlsx')# 需要先指定sheet工作表table = workbook.sheet_by_name(sheet_name='视频课列表')# 获取行数rows = table.nrows# 获取列数cols = table.ncols# 循环获取每行的数据for row in range(rows):    for col in range(cols):        value = table.cell_value(row, col)        print('第{}行{}列的数据为：{}'.format(row, col, value))

运行结果为：

有一部分小伙伴学习python的目的就是为了实现办公自动化的目的。通过使用更易学习的python替代excel中自带的vbs脚本，来实现excel的批量操作（例如表格调整，批量处理数据等）。

接下来这篇文章小编带你了解python中常用的几种可以操作excel的第三方库，并在文末附上相应教程的链接，小伙伴可以根据自己的需求挑选最合适自己的库进行学习！

首先让我们来整体把握下不同库的特点

xlrd 、 xlwt 、 xlutils 各自的功能都有局限性，但三者互为补充，覆盖了Excel文件尤其是 .xls 文件的操作。 xlwt 可以生成 .xls 文件， xlrd 可以读取已经存在的 .xls 文件， xlutils 连接 xlrd 和 xlwt 两个模块，使用户可以同时读写一个 .xls 文件。简单来说， xlrd 负责读、 xlwt 负责写、 xlutils 负责提供辅助和衔接。
xlwings 能够非常方便的读写 Excel 文件中的数据，并且能够进行单元格格式的修改。
XlsxWriter 是一个用来写 .xlsx 文件格式的模块。它可以用来写文本、数字、公式并支持单元格格式化、图片、图表、文档配置、自动过滤等特性。但不能用来读取和修改 Excel 文件。
openpyxl 通过工作簿 “workbook - 工作表 sheet - 单元格 cell” 的模式对 .xlsx 文件进行读、写、改，并且可以调整样式。
pandas 大家都不陌生，是进行数据处理和分析的强大模块，有时也可以用来自动化处理Excel。

pandas教程链接地址：https://www.51coolma.cn/pandas/

pandas教程关于excel教程操作的文章：https://www.51coolma.cn/pandas/pandas-excel.html

xlrd 教程：https://www.51coolma.cn/python3/python3-xlrd.html

xlwt库是一个python用于操作excel的第三方库。它的主要功能是用来写入excel。通常会与xlrd 、 xlutils组合进行使用。

注意！这里的操作excel，实际上与excel无关，不需要下载excel，xlwt库直接操作的是excel打开的xls文件！注意！xlrd库只能创建和修改excel，不能打开excel！

一、xlwt的安装

可以使用pip进行安装，这是最简单也是最普遍的安装方式！

在cmd中输入pip install xlrd即可安装xlrd库。

安装成功后可以使用pip list来检查是否正确安装以及查看当前的xlrd版本。

注意：xlrd较高版本中不支持.xlsx文件，可以手动将版本降至更低的版本或者将.xlsx文件改为.xls文件先卸载掉现有的 xlrd —> pip uninstall xlrd重新安装指定版本的 xlrd —> pip install xlrd == 1.2.0接下来的文章由于此原因使用1.2.0版本的xlrd进行介绍

二、创建表格并写入

创建表格，设置sheet名称
写入指定行列的数据，将表格进行保存

import xlwt # 创建一个workbook并设置编码workbook = xlwt.Workbook(encoding = 'utf-8')# 添加sheetworksheet = workbook.add_sheet('微课列表')# 写入excel, 参数对应 行, 列, 值worksheet.write(1,0, label = 'MySQL零基础入门课程')# 保存workbook.save('W3Cschool课程内容.xls')

三、设置单元格样式

给单元格设置样式，包括字体颜色、粗细、是否斜体等

import xlwt workbook = xlwt.Workbook(encoding = 'utf-8')worksheet = workbook.add_sheet('微课列表')  # 初始化样式style = xlwt.XFStyle() # 为样式创建字体font = xlwt.Font() # 黑体font.name = 'Times New Roman'font.bold = True # 下划线font.underline = True # 斜体字font.italic = True # 设定样式style.font = font # 带样式的写入worksheet.write(0, 0, '带样式的单元格', style) # 保存文件workbook.save('W3Cschool课程内容.xls')

四、设置单元格宽度

import xlwt workbook = xlwt.Workbook()worksheet = workbook.add_sheet('微课列表') worksheet.write(1, 1,'MySQL') # 设置单元格宽度worksheet.col(0).width = 3000 workbook.save('W3Cschool课程内容.xls')

五、设置单元格背景色

import xlwt workbook = xlwt.Workbook()worksheet = workbook.add_sheet('微课列表') # 创建模式对象Create the Patternpattern = xlwt.Pattern() # May be: NO_PATTERN, SOLID_PATTERN, or 0x00 through 0x12pattern.pattern = xlwt.Pattern.SOLID_PATTERN #设置模式颜色 May be: 8 through 63. 0 = Black, 1 = White, 2 = Red, 3 = Green, 4 = Blue, 5 = Yellow, 6 = Magenta, 7 = Cyan, 16 = Maroon, 17 = Dark Green, 18 = Dark Blue, 19 = Dark Yellow , almost brown), 20 = Dark Magenta, 21 = Teal, 22 = Light Gray, 23 = Dark Gray, the list goes on...pattern.pattern_fore_colour = 5 # 创建样式对象Create the Patternstyle = xlwt.XFStyle() # 将模式加入到样式对象Add Pattern to Stylestyle.pattern = pattern #向单元格写入内容时使用样式对象styleworksheet.write(0, 0, '单元格内容', style) workbook.save('W3Cschool课程内容.xls')

六、设置单元格内容对其方式

import xlwt workbook = xlwt.Workbook()worksheet = workbook.add_sheet('微课列表') # 创建对其格式的对象 Create Alignmentalignment = xlwt.Alignment() #水平居中 May be: HORZ_GENERAL, HORZ_LEFT, HORZ_CENTER, HORZ_RIGHT, HORZ_FILLED, HORZ_JUSTIFIED, HORZ_CENTER_ACROSS_SEL, HORZ_DISTRIBUTEDalignment.horz = xlwt.Alignment.HORZ_CENTER #我上下对齐 May be: VERT_TOP, VERT_CENTER, VERT_BOTTOM, VERT_JUSTIFIED, VERT_DISTRIBUTEDalignment.vert = xlwt.Alignment.VERT_CENTER  #创建样式对象 Create Stylestyle = xlwt.XFStyle() # 将格式Alignment对象加入到样式对象Add Alignment to Stylestyle.alignment = alignment #写入的时候调用样式styleworksheet.write(0, 0, '单元居中', style) workbook.save('W3Cschool课程内容.xls')

七、单元格添加超链接

import xlwt workbook = xlwt.Workbook()worksheet = workbook.add_sheet('') worksheet.write(2, 3, xlwt.Formula('HYPERLINK("https://www.51coolma.cn/minicourse/play/txymysql";"MySQL零基础入门课程")')) workbook.save('W3Cschool课程内容.xls')

八、单元格添加公式

import xlwt workbook = xlwt.Workbook()worksheet = workbook.add_sheet('微课列表') worksheet.write(0, 0, 5) # Outputs 5  #第一行第一列5worksheet.write(0, 1, 2) # Outputs 2  #第一行第二列2 #(A1[5] * A2[2])  第二行第一列，输出第一行数字乘积worksheet.write(1, 0, xlwt.Formula('A1*B1')) #(A1[5] + A2[2])  第二行第二列，输出第一行数字之和worksheet.write(1, 1, xlwt.Formula('SUM(A1,B1)')) workbook.save('W3Cschool课程内容.xls')

九、单元格中输入日期

import xlwtimport datetime workbook = xlwt.Workbook()worksheet = workbook.add_sheet('微课列表') style = xlwt.XFStyle() #其他格式包括: D-MMM-YY, D-MMM, MMM-YY, h:mm, h:mm:ss, h:mm, h:mm:ss, M/D/YY h:mm, mm:ss, [h]:mm:ss, mm:ss.0style.num_format_str = 'M/D/YY' worksheet.write(0, 0, datetime.datetime.now(), style) workbook.save('W3Cschool课程内容.xlsx')

十、合并行和列

import xlwt workbook = xlwt.Workbook()worksheet = workbook.add_sheet('微课列表') worksheet.write_merge(0, 1, 0, 3, '合并从第一行到第二行，第一列到第四列') #创建字体示例font = xlwt.Font() #bold设置为黑体字font.bold = True # Create Stylestyle = xlwt.XFStyle() # Add Bold Font to Stylestyle.font = fontworksheet.write_merge(2,3, 0, 3, '合并从第三行到第四行，第一列到第四列', style) workbook.save('W3Cschool课程内容.xls')

十一、单元格添加边框

import xlwt workbook = xlwt.Workbook()worksheet = workbook.add_sheet('微课列表') # 创建边框对象Create Bordersborders = xlwt.Borders() #对边框对象进行操作，指定边框上下左右的边框类型为虚线# DASHED虚线# NO_LINE没有# THIN实线# May be: NO_LINE, THIN, MEDIUM, DASHED, DOTTED, THICK, DOUBLE, HAIR, MEDIUM_DASHED, THIN_DASH_DOTTED, MEDIUM_DASH_DOTTED, THIN_DASH_DOT_DOTTED, MEDIUM_DASH_DOT_DOTTED, SLANTED_MEDIUM_DASH_DOTTED, or 0x00 through 0x0D.borders.left = xlwt.Borders.DASHEDborders.right = xlwt.Borders.DASHEDborders.top = xlwt.Borders.DASHEDborders.bottom = xlwt.Borders.DASHED #指定上下左右的边框颜色为0x40borders.left_colour = 0x40borders.right_colour = 0x40borders.top_colour = 0x40borders.bottom_colour = 0x40 # Create Style   #创建样式对象style = xlwt.XFStyle() # 将设置好的边框对象borders 加到样式对象style中。Add Borders to Stylestyle.borders = borders #向单元格第一行第一列写入“单元格内容”，并使用创建好的样式对象styleworksheet.write(0, 0, '单元格内容', style)workbook.save('W3Cschool课程内容.xls')

Python 3.9 已于2020 年 10 月 5 日发布，新版本的特性，你 get 到了吗？对于 Python 程序员来说，这又是一个令人兴奋的时刻。

相比于之前的版本，Python 3.9 有哪些值得讨论的功能呢？

简而言之，从字典更新 / 合并到添加新的字符串方法，再到 zoneinfo 库的引入，Python 3.9 添加了许多新特性。此外，该版本还引入了一种稳定、高性能的新型解析器。

标准库更新了许多新特性，并添加了新模块 zoneinfo 和 graphlib。此外该版本也对许多模块进行了改进，如 ast、asyncio、concurrent.futures、multiprocessing、xml 等。

现在让我们一起探索 Python 3.9 的新特性。

Python 3.9：10 个有趣的新特性

1. 字典更新和合并

合并 (|) 与更新 (|=) 运算符已被加入内置的 dict 类。它们为现有的 dict.update 和 {**d1, **d2} 字典合并方法提供了补充。

示例：

>>> x = {"key1": "value1 from x", "key2": "value2 from x"}>>> y = {"key2": "value2 from y", "key3": "value3 from y"}>>> x | y{'key1': 'value1 from x', 'key2': 'value2 from y', 'key3': 'value3 from y'}>>> y | x{'key2': 'value2 from x', 'key3': 'value3 from y', 'key1': 'value1 from x'}

2. 基于 PEG 的高性能解析器

Python 3.9 提出用高性能和稳定的基于 PEG 的解析器取代当前基于 LL(1) 的 Python 解析器。

当前的 CPython 解析器基于 LL(1)，LL(1) 解析器是一个自顶向下的解析器，它从左到右解析输入。

Python 3.9 提议将 LL(1) 替换为新的基于 PEG 的解析器，这意味着它将解除当前 LL(1) 语法对 Python 的限制。此外，当前的解析器修补了许多将要删除的 hack。因此，从长远来看，这会降低维护成本。

3. 新型字符串函数：删除前缀和后缀

Python 3.9 将两个新函数添加到 str 对象：

第一个函数用于删除前缀：str.removeprefix(prefix)

第二个函数用于删除后缀：str.removesuffix(suffix)

4. 对内置泛型类型提供类型提示

Python 3.9 通过删除并行类型层次结构，使注释程序变得更加简单。Python 3.9 支持 typing 模块所有标准集合中的泛型语法。

我们可以将 list 或 dict 直接作为列表和字典的类型注释，而不必依赖 typing.List 或者 typing.Dict。因此，代码现在看起来更加简洁，而且更容易理解和解释。

5. DateTime 支持 IANA 时区

zoneinfo 模块被创建出来支持 IANA 时区数据库。对 IANA 时区数据库的支持已经添加到标准库中。

示例：

>>> from zoneinfo import ZoneInfo>>> from datetime import datetime, timedelta>>> # Daylight saving time>>> dt = datetime(2020, 10, 31, 12, tzinfo=ZoneInfo("America/Los_Angeles"))>>> print(dt)2020-10-31 12:00:00-07:00>>> dt.tzname()'PDT'>>> # Standard time>>> dt += timedelta(days=7)>>> print(dt)2020-11-07 12:00:00-08:00>>> print(dt.tzname())PST

IANA 时区通常称为 tz 或 zone info。存在许多具备不同搜索路径的 IANA 时区，用于为 datetime 对象指定 IANA 时区。例如，我们可以将对 datetime 对象设置搜索路径Continent/City来设置 tzinfo。

如果传入一个无效的密钥，则会引发 zoneinfo.ZoneInfoNotFoundError 异常。

6. concurrent.futures 优化

concurrent.futures.Executor.shutdown() 中添加了一个新参数 cancel_futures。此参数可以取消尚未执行的并发任务。在 Python 3.9 之前主进程只有在所有并发任务完成后才能关闭 executor 对象。

新参数 cancel_futures 已被添加到 ThreadPoolExecutor 以及 ProcessPoolExecutor。它的工作方式是：当参数的值为 True 时，在调用 shutdown() 函数时取消所有待处理的任务。

7. 异步编程和多进程优化

Python 3.9 对异步编程（asyncio）和多进程库进行了优化。

2. 新增了 coroutines、shutdown_default_executor() 和 asyncio.to_thread() 。shutdown_default_executor 负责关闭默认 executor，asyncio.to_thread() 主要用于在一条单独的线程中运行 IO 密集型函数，以避免事件循环。

关于多进程库的改进，Python 3.9 向 multiprocessing.SimpleQueue 类添加了新方法 close()。

此方法可以显式地关闭队列。这将确保队列关闭并且停留时间不会比预期长。值得注意的是，一旦关闭队列，就不能调用 get()、put() 和 empty() 方法。

8. 统一的软件包导入错误

Python3.9 之前的版本在导入 Python 库时存在的主要问题是：当相对导入超出其顶级包时，Python 中的导入行为不一致。

builtins.__import__() 引发 ValueError，而 importlib.__import__() 引发 ImportError。Python3.9 版本进行了修复，它将统一引发 ImportError。

9. 生成随机字节

Python 3.9 版本中添加了新的函数 random.Random.randbytes()。该函数可用于生成随机字节。

Python 支持生成随机数，但如果需要生成随机字节呢？在 Python3.9 版本之前，开发人员必须想方设法生成随机字节。尽管他们可以使用 os.getrandom()、os.urandom() 或者 secrets.token_bytes() 来生成随机字节，但这些方法无法生成伪随机模式。

为了确保随机数的产生符合预期行为，并且过程可复现，开发人员通常将种子（seed）与 random.Random 模块一起使用。因此，Python 3.9 添加了 random.Random.randbytes() 方法，以可控的方式生成随机字节。

10. 修复字符串替换函数

在 Python 3.9 版本之前，对于所有非零的 n，"".replace("",s,n) 返回空字符串而不是 s。这个错误使用户困惑，并导致应用程序的不一致行为。

Python 3.9 修复了该问题，不管 n 是否为 0，其结果都与 "".replace("", s) 一致。

如果大家想深入了解更多细节，请查阅官方文档：https://docs.python.org/zh-cn/3.9/whatsnew/3.9.html

以下列出了Python常见的职业方向, 职业树可以直观帮助我们做定位和选择。

Python math.trunc(x) 方法返回 x 截断整数的部分，即返回整数部分，忽略小数部分。

math.trunc(x) 方法不会将数字向上/向下舍入到最接近的整数，而只是删除小数。

语法

math.trunc() 方法语法如下：

math.trunc(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。如果值为 0 或负数，则返回 ValueError。

返回值

返回一个整数 int，表示 x 的整数部分。

实例

以下实例返回数字的整数部分：

# 导入 math 包import math# 输出整数部分print(math.trunc(2.77))print(math.trunc(8.32))print(math.trunc(-99.29))

输出结果：

28-99

Python math.tanh(x) 返回 x 的双曲正切值。

Python 版本: 1.4

语法

math.tanh() 方法语法如下：

math.tanh(x)

参数说明：

x -- 必需，个正数或负数。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示一个数字的双曲正切值。

实例

以下实例返回不同数字的双曲正切值：

# 导入 math 包import math# 输出双曲正切值print(math.tanh(8))print(math.tanh(1))print(math.tanh(-6.2))

输出结果：

0.99999977492967580.7615941559557649-0.9999917628565104

Python math.tan(x) 返回 x 弧度的正切值。

Python 版本: 1.4

语法

math.tan() 方法语法如下：

math.tan(x)

参数说明：

x -- 必需，数字。如果 x 不是数字，则返回 TypeError。

返回值

返回一个浮点数，表示 x 的正切值。

实例

以下实例返回数字的正切值：

# 导入 math 包import math# 输出正切值print (math.tan(90))print (math.tan(-90))print (math.tan(45))print (math.tan(60))

输出结果：

-1.9952004122082421.9952004122082421.61977519054386150.3200403893795629

Python math 模块提供了许多对浮点数的数学运算函数。

math 模块下的函数，返回值均为浮点数，除非另有明确说明。

如果你需要计算复数，请使用 cmath 模块中的同名函数。

要使用 math 函数必须先导入：

import math

查看 math 模块中的内容:

>>> import math>>> dir(math)['__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', 'acos', 'acosh', 'asin', 'asinh', 'atan', 'atan2', 'atanh', 'ceil', 'comb', 'copysign', 'cos', 'cosh', 'degrees', 'dist', 'e', 'erf', 'erfc', 'exp', 'expm1', 'fabs', 'factorial', 'floor', 'fmod', 'frexp', 'fsum', 'gamma', 'gcd', 'hypot', 'inf', 'isclose', 'isfinite', 'isinf', 'isnan', 'isqrt', 'lcm', 'ldexp', 'lgamma', 'log', 'log10', 'log1p', 'log2', 'modf', 'nan', 'nextafter', 'perm', 'pi', 'pow', 'prod', 'radians', 'remainder', 'sin', 'sinh', 'sqrt', 'tan', 'tanh', 'tau', 'trunc', 'ulp']

math 模块常量

常量	描述
math.e	返回欧拉数 (2.7182...)
math.inf	返回正无穷大浮点数
math.nan	返回一个浮点值 NaN (not a number)
math.pi	π 一般指圆周率。圆周率 PI (3.1415...)
math.tau	数学常数 τ = 6.283185...，精确到可用精度。Tau 是一个圆周常数，等于 2π，圆的周长与半径之比。

math 模块方法

方法	描述
math.acos(x)	返回 x 的反余弦，结果范围在 0 到 pi 之间。
math.acosh(x)	返回 x 的反双曲余弦值。
math.asin(x)	返回 x 的反正弦值，结果范围在 -pi/2 到 pi/2 之间。
math.asinh(x)	返回 x 的反双曲正弦值。
math.atan(x)	返回 x 的反正切值，结果范围在 -pi/2 到 pi/2 之间。
math.atan2(y, x)	返回给定的 X 及 Y 坐标值的反正切值，结果是在 -pi 和 pi 之间。
math.atanh(x)	返回 x 的反双曲正切值。
math.ceil(x)	将 x 向上舍入到最接近的整数
math.comb(n, k)	返回不重复且无顺序地从 n 项中选择 k 项的方式总数。
math.copysign(x, y)	返回一个基于 x 的绝对值和 y 的符号的浮点数。
math.cos()	返回 x 弧度的余弦值。
math.cosh(x)	返回 x 的双曲余弦值。
math.degrees(x)	将角度 x 从弧度转换为度数。
math.dist(p, q)	返回 p 与 q 两点之间的欧几里得距离，以一个坐标序列（或可迭代对象）的形式给出。两个点必须具有相同的维度。
math.erf(x)	返回一个数的误差函数
math.erfc(x)	返回 x 处的互补误差函数
math.exp(x)	返回 e 的 x 次幂，E^x，其中 e = 2.718281... 是自然对数的基数。
math.expm1()	返回 E^x - 1， e 的 x 次幂，E^x，其中 e = 2.718281... 是自然对数的基数。这通常比 math.e ** x 或 pow(math.e, x) 更精确。
math.fabs(x)	返回 x 的绝对值。
math.factorial(x)	返回 x 的阶乘。如果 x 不是整数或为负数时则将引发 ValueError。
math.floor()	将数字向下舍入到最接近的整数
math.fmod(x, y)	返回 x/y 的余数
math.frexp(x)	以 (m, e) 对的形式返回 x 的尾数和指数。 m 是一个浮点数， e 是一个整数，正好是 x == m * 2**e 。如果 x 为零，则返回 (0.0, 0) ，否则返回 0.5 <= abs(m) < 1 。
math.fsum(iterable)	返回可迭代对象 (元组, 数组, 列表, 等)中的元素总和，是浮点值。
math.gamma(x)	返回 x 处的伽马函数值。
math.gcd()	返回给定的整数参数的最大公约数。
math.hypot()	返回欧几里得范数，sqrt(sum(x**2 for x in coordinates))。这是从原点到坐标给定点的向量长度。
math.isclose(a,b)	检查两个值是否彼此接近，若 a 和 b 的值比较接近则返回 True，否则返回 False。。
math.isfinite(x)	判断 x 是否有限，如果 x 既不是无穷大也不是 NaN，则返回 True ，否则返回 False 。
math.isinf(x)	判断 x 是否是无穷大，如果 x 是正或负无穷大，则返回 True ，否则返回 False 。
math.isnan()	判断数字是否为 NaN，如果 x 是 NaN（不是数字），则返回 True ，否则返回 False 。
math.isqrt()	将平方根数向下舍入到最接近的整数
math.ldexp(x, i)	返回 x * (2**i) 。这基本上是函数 math.frexp() 的反函数。
math.lgamma()	返回伽玛函数在 x 绝对值的自然对数。
math.log(x[, base])	使用一个参数，返回 x 的自然对数（底为 e ）。
math.log10(x)	返回 x 底为 10 的对数。
math.log1p(x)	返回 1+x 的自然对数（以 e 为底）。
math.log2(x)	返回 x 以 2 为底的对数
math.perm(n, k=None)	返回不重复且有顺序地从 n 项中选择 k 项的方式总数。
math.pow(x, y)	将返回 x 的 y 次幂。
math.prod(iterable)	计算可迭代对象中所有元素的积。
math.radians(x)	将角度 x 从度数转换为弧度。
math.remainder(x, y)	返回 IEEE 754 风格的 x 除于 y 的余数。
math.sin(x)	返回 x 弧度的正弦值。
math.sinh(x)	返回 x 的双曲正弦值。
math.sqrt(x)	返回 x 的平方根。
math.tan(x)	返回 x 弧度的正切值。
math.tanh(x)	返回 x 的双曲正切值。
math.trunc(x)	返回 x 截断整数的部分，即返回整数部分，删除小数部分

Python math.sqrt(x) 方法返回 x 的平方根。

数字必须大于等于 0。

语法

math.sqrt() 方法语法如下：

math.sqrt(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。如果数字小于 0，则返回 ValueError。

返回值

返回一个浮点数，表示一个数的平方根。

实例

以下实例返回数字的平方根：

# 导入 math 包import math# 输出平方根print (math.sqrt(9))print (math.sqrt(25))print (math.sqrt(16))

输出结果：

3.05.04.0

Python math.sin(x) 返回 x 弧度的正弦值。

要获取指定角度的正弦，必须首先使用 math.radians() 方法将其转换为弧度。

Python 版本: 1.4

语法

math.sin() 方法语法如下：

math.sin(x)

参数说明：

x -- 必需，数字。如果 x 不是数字，则返回 TypeError。

返回值

返回一个浮点数，表示 x 的正弦值，介于 -1 到 1 之间。

实例

以下实例返回数字的正弦值：

# 导入 math 包import math# 输出正弦值print (math.sin(0.00))print (math.sin(-1.23))print (math.sin(10))print (math.sin(math.pi))print (math.sin(math.pi/2))

输出结果：

0.0-0.9424888019316975-0.54402111088936991.2246467991473532e-161.0

要获取指定角度的正弦，必须首先使用 math.radians() 方法将其转换为弧度：

# 导入 math 包import math# 角度 30 先转换为弧度再计算正弦值print(math.sin(math.radians(30)))# 角度 90 先转换为弧度再计算正弦值print(math.sin(math.radians(90)))

输出结果：

0.499999999999999941.0

Python mathremainder(x, y) 方法返回 x/y 的余数。

Python 版本：3.7

语法

math.remainder() 方法语法如下：

math.remainder(x, y)

参数说明：

x -- 必需，被除数。
y -- 可选，除数。必须是非零数字，否则会发生 ValueError。

返回值

一个浮点值，返回余数。

实例

以下实例计算余数：

# 导入 math 包import math# x/y 的余数print (math.remainder(9, 2))print (math.remainder(9, 3))print (math.remainder(18, 4))print (math.remainder(23.5, 5))print (math.remainder(23, 5.5))print (math.remainder(12.5, 2.5))print (math.remainder(12, 2))

输出结果：

1.00.02.0-1.51.00.00.0

Python math.sinh(x) 返回 x 的双曲正弦值。

Python 版本: 1.4

语法

math.sinh() 方法语法如下：

math.sinh(x)

参数说明：

x -- 必需，个正数或负数。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示一个数字的双曲正弦值。

实例

以下实例返回不同数字的双曲正弦值：

# 导入 math 包import math# 输出双曲正弦值print(math.sinh(0.00))print(math.sinh(-23.45))print(math.sinh(23))print(math.sinh(1.00))print(math.sinh(math.pi))

输出结果：

0.0-7641446994.9793674872401723.1244521.175201193643801411.548739357257746

Python math.prod() 方法用于计算可迭代对象中所有元素的积。

Python 版本：3.8

语法

math.prod() 方法语法如下：

math.prod(iterable, start)

参数说明：

iterable -- 必需，可迭代对象。
start -- 可选，指起始值。默认值为 1。

返回值

一个浮点值或整数，可迭代元素的乘积，类型会根据元素判断，如果元素都是整数返回的是整数，如果元素有浮点数，返回的是浮点数。

实例

以下实例计算可迭代元素的乘积：

# 导入 math 包import math# 计算可迭代元素的乘积sequence = (2, 2, 2)print(math.prod(sequence))

输出结果：

Python math.perm(x, i) 方法返回不重复且有顺序地从 n 项中选择 k 项的方式总数。

注意：k 参数是可选的。如果我们没有设置 k，这个方法将返回 n! （例如，math.perm(7) 将返回 5040）。

Python 版本：3.8

语法

math.perm() 方法语法如下：

math.perm(n, k)

参数说明：

x -- 必需，一个正数。如果值不是数字，则返回 TypeError。
k -- 可选，一个正数。如果值不是数字，则返回 TypeError。

注意：如果 k 大于 n，则返回 0。

注意：如果 n 或 k 为负数，则会发生 ValueError。如果 n 或 k 不是整数，则会发生 TypeError。

返回值

一个整数 int，返回不重复且有顺序地从 n 项中选择 k 项的方式总数。

实例

以下实例计算从 n 个项中选择 k 项的方式总数：

# 导入 math 包import math# 初始化 nn = 7# 初始化 kk = 5# 输出从 n 个项中选择 k 项的方式总数print (math.perm(n, k))

输出结果：

Python math.pow(x, y) 方法返回返回 x 的 y 次幂（次方）。

如果 x 为负且 y 不是整数，则返回 ValueError。该方法会将两个参数转换为浮点数。 math.pow(1.0,x) 或 math.pow(x,0.0)，始终返回 1.0。

语法

math.pow() 方法语法如下：

math.pow(x, y)

参数说明：

x -- 必需，一个代表基数的数字。
y -- 必需，一个代表指数的数字。

返回值

返回一个浮点数，表示 x 的 y 次幂。

实例

以下实例返回 9 的 3 次方：

# 导入 math 包import math# 输出 9 的 3 次方print(math.pow(9, 3))

输出结果：

729.0

Python math.log2(x) 方法返回 x 以 2 为底的对数。

语法

math.log2() 方法语法如下：

math.log2(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。如果值为 0 或负数，则返回 ValueError。

返回值

返回一个整数浮点数 float，表示一个数字以 2 为底的自然对数。

实例

以下实例返回一个数字以 2 为底的自然对数：

# 导入 math 包import math# 输出一个数字以 2 为底的自然对数print(math.log2(2.7183))print(math.log2(2))print(math.log2(1))

输出结果：

1.44270468518122221.00.0

Python math.log1p(x) 方法返回 1+x 的自然对数（以 e 为底）。

语法

math.log1p() 方法语法如下：

math.log1p(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。如果值为 0 或负数，则返回 ValueError。

返回值

返回一个整数浮点数 float，表示 1+x 以 e 为底的自然对数。

实例

以下实例返回一个 1+x 以 e 为底的自然对数：

# 导入 math 包import math# 输出 1+x 以 e 为底的自然对数print(math.log1p(2.7183))print(math.log1p(2))print(math.log1p(1))

输出结果：

1.3132665745863341.09861228866810980.6931471805599453

Python math.log10(x) 方法返回 x 以 10 为底的对数。

语法

math.log10() 方法语法如下：

math.log10(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。如果值为 0 或负数，则返回 ValueError。

返回值

返回一个整数浮点数 float，表示一个数字以 10 为底的自然对数。

实例

以下实例返回一个数字以 10 为底的自然对数：

# 导入 math 包import math# 输出一个数字以 10 为底的自然对数print(math.log10(2.7183))print(math.log10(2))print(math.log10(1))

输出结果：

0.434297385124508660.30102999566398120.0

Python math.log(x) 方法使用一个参数，返回 x 的自然对数（底为 e ）。

语法

math.log() 方法语法如下：

math.log(x[, base])

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。如果值为 0 或负数，则返回 ValueError。
base -- 可选，底数，默认为 e。

返回值

返回一个整数浮点数 float，表示一个数字的自然对数。

实例

以下实例返回一个数字的自然对数：

# 导入 math 包import math# 输出一个数字的自然对数print(math.log(2.7183))print(math.log(2))print(math.log(1))

输出结果：

1.00000668491398770.69314718055994530.0

Python math.lgamma(x) 方法返回一个数字的自然对数伽玛值。

我们也可以通过使用 math.gamma() 方法找到伽玛值，然后使用 math.log() 方法计算该值的自然对数。

伽玛值等于 factorial(x-1)。

Python 版本： 3.2

语法

math.lgamma() 方法语法如下：

math.lgamma(x)

参数说明：

x -- 必需，数字。如果数字是负整数，则返回 ValueError。如果不是数字，则返回 TypeError。。

返回值

一个浮点值，表示一个数字的对数伽玛值。

实例

以下实例计算不同数的自然对数伽玛值：

# 导入 math 包import math# 计算不同数的自然对数伽玛值print (math.lgamma(7))print (math.lgamma(-4.2))

输出结果：

6.579251212010102-1.8075166614192908

Python math.ldexp(x, i) 方法返回 x * (2**i)，math.frexp() 的反函数。

Python 版本：2.6

语法

math.ldexp() 方法语法如下：

math.ldexp(x, i)

参数说明：

x -- 必需，一个正数或负数。如果值不是数字，则返回 TypeError。
i -- 必需，一个正数或负数。如果值不是数字，则返回 TypeError。

返回值

一个浮点值，返回 x * (2**i)

实例

以下实例计算 x * (2**i)：

# 导入 math 包import math# 返回 x * (2**i)print(math.ldexp(9, 3))print(math.ldexp(-5, 2))print(math.ldexp(15, 2))

输出结果：

72.0-20.060.0

Python math.isqrt(x) 方法返回 x 的平方根，并将平方根数向下舍入到最接近的整数。

数字必须大于等于 0。

Python 版本：3.8

语法

math.isqrt() 方法语法如下：

math.isqrt(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。如果数字小于 0，则返回 ValueError。

返回值

返回一个整数 int，表示一个数的平方根，并将平方根数向下舍入到最接近的整数。

实例

以下实例返回数字的平方根，并将平方根数向下舍入到最接近的整数：

# 导入 math 包import math# 输出平方根# Print the square root of different numbersprint (math.sqrt(10))print (math.sqrt (12))print (math.sqrt (68))print (math.sqrt (100))# 输出平方根，并将平方根数向下舍入到最接近的整数print (math.isqrt(10))print (math.isqrt (12))print (math.isqrt (68))print (math.isqrt (100))

输出结果：

3.16227766016837953.46410161513775448.24621125123532110.033810

Python math.isinf() 方法判断 x 是否是无穷大，如果 x 是正或负无穷大，则返回 True ，否则返回 False 。

Python 版本：2.6

语法

math.isinf() 方法语法如下：

math.isinf(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个布尔值，如果 x 是正或负无穷大，则返回 True ，否则返回 False 。

实例

以下实例检查数字是否是无穷大：

# 导入 math 包import math# 检查数字是否是无穷大print(math.isinf(56))print(math.isinf(-45.34))print(math.isinf(+45.34))print(math.isinf(math.inf))print(math.isinf(float("nan")))print(math.isinf(float("inf")))print(math.isinf(float("-inf")))print(math.isinf(-math.inf))

输出结果：

FalseFalseFalseTrueFalseTrueTrueTrue

Python math.isfinite() 方法判断 x 是否有限，如果 x 既不是无穷大也不是 NaN，则返回 True ，否则返回 False 。

Python 版本：3.2

语法

math.isfinite() 方法语法如下：

math.isfinite(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个布尔值，如果 x 既不是无穷大也不是 NaN，则返回 True ，否则返回 False 。

实例

以下实例检查数字是否有限：

# 导入 math 包import math# 检查数字是否有限print(math.isfinite(2000))print(math.isfinite(-45.34))print(math.isfinite(+45.34))print(math.isfinite(math.inf))print(math.isfinite(float("nan")))print(math.isfinite(float("inf")))print(math.isfinite(float("-inf")))print(math.isfinite(-math.inf))print(math.isfinite(0.0))

输出结果：

TrueTrueTrueFalseFalseFalseFalseFalseTrue

Python math.isnan() 方法判断数字是否为 NaN（非数字），如果数字是 NaN（不是数字），则返回 True ，否则返回 False 。

Python 版本： 3.5

语法

math.isnan() 方法语法如下：

math.isnan(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个布尔值，如果数字是 NaN（不是数字），则返回 True ，否则返回 False 。

实例

以下实例检查数字是否是 NaN（不是数字）：

# 导入 math 包import math# 检查数字是否为 NaNprint (math.isnan (56))print (math.isnan (-45.34))print (math.isnan (+45.34))print (math.isnan (math.inf))print (math.isnan (float("nan")))print (math.isnan (float("inf")))print (math.isnan (float("-inf")))print (math.isnan (math.nan))

输出结果：

FalseFalseFalseFalseTrueFalseFalseTrue

Python math.hypot() 方法返回欧几里得范数。

欧几里得范数是从原点到给定坐标的距离。

欧几里得度量又称为欧几里得距离，指的是欧几里得空间中两点间"普通"（即直线）距离。

在 Python 3.8 之前，此方法用于查找直角三角形的斜边：sqrt(x*x + y*y)。

从 Python 3.8 开始，此方法也用于计算欧几里得范数。对于 n 维情况，假定传递的坐标类似于 (x1, x2, x3, ..., xn)，从原点开始的欧几里得长度由 sqrt(x1*x1 + x2*x2 +x3*x3 .... xn*xn) 计算。

Python 版本： 3.8

语法

math.hypot() 方法语法如下：

math.hypot(x1, x2, x3, ..., xn)

参数说明：

x1, x2, x3, ..., xn -- 必需，表示多个坐标点。

返回值

一个浮点值，表示 n 个输入到原点的欧几里得距离，或两个输入的直角三角形的斜边

实例

以下实例计算直角三角形的斜边：

# 导入 math 包import math# 设置垂直线和底边parendicular = 10base = 5# 输出直角三角形的斜边print(math.hypot(parendicular, base))

输出结果：

11.180339887498949

以下实例计算给定坐标的欧几里得范数：

# 导入 math 包import math# 输出给定坐标的欧几里得范数print(math.hypot(10, 2, 4, 13))print(math.hypot(4, 7, 8))print(math.hypot(12, 14))

输出结果：

17.011.35781669160054718.439088914585774

Python math.gcd() 方法返回给定的整数参数的最大公约数。

gcd(0,0) 返回 0。

Python 版本：3.5

在 3.9 版更改: 添加了对任意数量的参数的支持，之前的版本只支持两个参数。

语法

math.gcd() 方法语法如下：

math.gcd(*integers)

参数说明：

*integers -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个整数 int，表示两个或多个整数的最大公约数 (GCD)。

实例

以下实例返回数字的最大公约数：

# 导入 math 包import math# 输出最大公约数print (math.gcd(3, 6))print (math.gcd(6, 12))print (math.gcd(12, 36))print (math.gcd(-12, -36))print (math.gcd(5, 12))print (math.gcd(10, 0))print (math.gcd(0, 34))print (math.gcd(0, 0))

输出结果：

361212110340

Python math.gamma(x) 方法返回 x 处的伽玛函数（Gamma 函数）。

伽玛函数，也叫欧拉第二积分，是阶乘函数在实数与复数上扩展的一类函数。

要查找数字的对数伽玛值，请使用 math.lgamma() 方法。

Python 版本： 3.2

语法

math.gamma() 方法语法如下：

math.gamma(x)

参数说明：

x -- 必需，数字。如果数字是负整数，则返回 ValueError。如果不是数字，则返回 TypeError。

返回值

一个浮点值，表示表示 x 处的伽玛函数。

实例

以下实例计算不同数的伽玛函数：

# 导入 math 包import math# 计算不同数的伽玛函数print(math.gamma(-0.1))print(math.gamma(8))print(math.gamma(1.2))print(math.gamma(80))print(math.gamma(-0.55))

输出结果：

-10.6862870211931935040.00.91816874239976048.946182130782976e+116-3.578429819277059

Python math.frexp(x) 方法以 (m, e) 对的形式返回 x 的尾数和指数。

该方法的数学公式为: number = m * 2**e。

Python 版本：2.6

语法

math.frexp() 方法语法如下：

math.frexp(x)

参数说明：

x -- 必需，正数或负数。如果 x 不是一个数字，返回 TypeError。

返回值

一个元组，以 (m, e) 对的形式返回 x 的尾数和指数。

实例

以下实例计算一个数的尾数和指数：

# 导入 math 包import math# 返回数字的尾数和指数print(math.frexp(4))print(math.frexp(-4))print(math.frexp(7))

输出结果：

(0.5, 3)(-0.5, 3)(0.875, 3)

Python math.isclose() 方法返回用于检查两个值是否彼此接近，如果值接近，则返回 True，否则返回 False。

math.isclose() 根据给定的绝对和相对容差确定两个值是否被认为是接近的。

Python 版本：3.5

计算公式为：

abs(a-b) <= max(rel_tol * max(abs(a), abs(b)), abs_tol)

语法

math.isclose() 方法语法如下：

math.isclose(a, b, *, rel_tol=1e-09, abs_tol=0.0)

参数说明：

a -- 必需，数字。如果 x 不是一个数字，返回 TypeError。如果值为 0 或负数，则返回 ValueError。
b -- 必需，数字。如果 x 不是一个数字，返回 TypeError。如果值为 0 或负数，则返回 ValueError。
rel_tol -- 是相对容差，它是 a 和 b 之间允许的最大差值，相对于 a 或 b 的较大绝对值。例如，要设置5％的容差，请传递 rel_tol=0.05 。默认容差为 1e-09，确保两个值在大约9位十进制数字内相同。 rel_tol 必须大于零。
abs_tol -- 是最小绝对容差，对于接近零的比较很有用。 abs_tol 必须至少为零。

返回值

返回一个布尔值，检查两个值是否彼此接近，如果值接近，则返回 True，否则返回 False。

实例

以下实例检查两个值是否彼此接近：

# 导入 math 包import math# 输出两个值是否接近print(math.isclose(8.005, 8.450, abs_tol = 0.4))print(math.isclose(8.005, 8.450, abs_tol = 0.5))

输出结果：

FalseTrue

以下实例检查两个浮点数是否接近：

# 导入 math 包import math# 可用于浮点数判断# 这样会输出 false，0.1+0.2 不会等于 0.3print(0.1+0.2 == 0.3)print(0.1+0.2 )# 这样会输出 trueprint(math.isclose(0.1+0.2, 0.3))

输出结果：

False0.30000000000000004True

Python math.fsum(iterable) 方法计算可迭代对象 (元组, 数组, 列表, 等)中的元素的总和。

Python 版本：2.6

语法

math.fsum() 方法语法如下：

math.fsum(iterable)

参数说明：

iterable -- 必需，可迭代对象，可以是列表、元组、数组。如果可迭代对象元素不是数字，返回 TypeError。

返回值

一个浮点值，表示可迭代对象中所有元素的总和。

实例

以下实例计算所有元素的总和：

# 导入 math 包import math# 计算所有元素的总和print(math.fsum([1, 2, 3, 4, 5]))print(math.fsum([100, 400, 340, 500]))print(math.fsum([1.7, 0.3, 1.5, 4.5]))

输出结果：

15.01340.08.0

Python math.fmod(x, y) 方法返回 x/y 的余数。

Python 版本：2.7

语法

math.fmod() 方法语法如下：

math.fmod(x, y)

参数说明：

x -- 必需，正数或负数。被除数。如果 x 不是一个数字，返回 TypeError。
y -- 必需，正数或负数。除数。如果 y 不是一个数字，返回 TypeError。

注意：如果 x 和 y = 0，则返回 ValueError。

注意：如果 y = 0，则返回 ValueError。

注意：如果 x 或 y 不是数字，则返回 TypeError。

返回值

一个浮点值，表示 x/y 的余数

实例

以下实例计算余数：

# 导入 math 包import math# 计算余数print(math.fmod(20, 4))print(math.fmod(20, 3))print(math.fmod(15, 6))print(math.fmod(-10, 3))# 报错，ValueError: math domain errorprint(math.fmod(0, 0))

输出结果：

0.02.03.0-1.0Traceback (most recent call last):    File "/Users/RUNOOB/runoob-test/test.py", line 9, in <module>    print(math.fmod(0, 0))ValueError: math domain error

Python math.fabs(x) 方法返回 x 的绝对值。

绝对值是非负数，有负号会删除。

与 Python 内置的 abs() 不同，此方法始终将值转换为浮点值。

语法

math.fabs() 方法语法如下：

math.fabs(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示 x 的绝对值。

实例

以下实例返回数字的绝对值：

# 导入 math 包import math# 输出绝对值print(math.fabs(2.77))print(math.fabs(8.32))print(math.fabs(-99.29))

输出结果：

2.778.3299.29

Python math.erfc(x) 方法返回 x 处的互补误差函数。

math.erfc(x) 方法接受 - inf 和 + inf 之间的值，并返回 - 1 到 + 1 之间的值。

Python 版本： 3.2

语法

math.erfc() 方法语法如下：

math.erfc(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

一个浮点值，代表一个数字互补的误差函数。

实例

以下实例数字的互补误差函数：

# 导入 math 包import math# 输出不同数字的互补误差函数print (math.erfc(0.67))print (math.erfc(1.34))print (math.erfc(-6))

输出结果：

0.343372297699694960.058086284741634662.0

Python math.erf(x) 方法返回一个数的误差函数

math.erf(x) 方法接受 - inf 和 + inf 之间的值，并返回 - 1 到 + 1 之间的值。

Python 版本：3.2

语法

math.erf() 方法语法如下：

math.erf(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

一个浮点值，代表一个数字的误差函数。

实例

以下实例计算相同正负数的误差函数：

# 导入 math 包import math# 输出误差函数print (math.erf(1.28))print (math.erf(-1.28))

输出结果：

0.9297341930135782-0.9297341930135782

Python math.dist(p, q) 方法返回 p 与 q 两点之间的欧几里得距离，以一个坐标序列（或可迭代对象）的形式给出。两个点必须具有相同的维度。

传入的参数必须是正整数。

Python 版本：3.8

语法

math.dist() 方法语法如下：

math.dist(p, q)

参数说明：

p -- 必需，指定第一个点。
q -- 必需，指定第二个点。

返回值

返回一个浮点值，表示 p 和 q 之间的欧几里得距离。

实例

以下实例返回两个点的欧几里得距离：

# 导入 math 包import mathp = [3]q = [1]# 计算欧几里得距离print (math.dist(p, q))p = [3, 3]q = [6, 12]# 计算欧几里得距离print (math.dist(p, q))

输出结果：

2.09.486832980505138

Python math.factorial(x) 方法返回 x 的阶乘。

参数只能是正整数。

一个数字的阶乘是所有整数的乘积之和，例如，6 的阶乘是： 6 x 5 x 4 x 3 x 2 x 1 = 720。

语法

math.factorial() 方法语法如下：

math.factorial(x)

参数说明：

x -- 必需，正整数。如果数字为负数或不是整数，则返回 ValueError。如果值不是数字，则返回 TypeError。

返回值

返回一个正整数，表示正整数的阶乘。

实例

以下实例返回正整数的阶乘：

# 导入 math 包import math# 输出正整数的阶乘print(math.factorial(9))print(math.factorial(6))print(math.factorial(12))

输出结果：

362880720479001600

Python math.expm1(x) 方法返回 e 的 x 次幂（次方）减 1，Ex - 1，其中 e = 2.718281... 是自然对数的基数。

math.expm1(x) 方法比调用 math.exp() 减去 1 更精确。

Python 版本：2.7

语法

math.expm1() 方法语法如下：

math.expm1(x)

参数说明：

x -- 必需，数字，指定指数。如果 x 不是一个数字，返回 TypeError。

返回值

一个浮点值，表示 Ex - 1。

实例

以下实例指定不同的指数：

# 导入 math 包import math# 指定不同的指数print(math.expm1(32))print(math.expm1(-10.89))

输出结果：

78962960182679.69-0.9999813562576685

Python math.exp(x) 方法返回 e 的 x 次幂（次方）Ex，其中 e = 2.718281... 是自然对数的基数。

Python 版本：1.6.1

语法

math.exp() 方法语法如下：

math.exp(x)

参数说明：

x -- 必需，数字，指定指数。如果 x 不是一个数字，返回 TypeError。

返回值

一个浮点值，表示 e 的 x 次幂。

实例

以下实例指定不同的指数：

# 导入 math 包import math# 指定不同的指数print(math.exp(65))print(math.exp(-6.89))

输出结果：

1.6948892444103338e+280.0010179138409954387

Python math.degrees(x) 方法将角度 x 从弧度转换为度数。

PI (3.14..) 弧度等于 180 度，也就是说 1 弧度等于 57.2957795 度。

math.radians() 方法将度数值转换为弧度。

Python 版本: 2.3

语法

math.degrees() 方法语法如下：

math.degrees(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示角度。

实例

以下实例返回不同弧度转换为度数：

# 导入 math 包import math# 输出弧度转换为度数print (math.degrees(8.90))print (math.degrees(-20))print (math.degrees(1))print (math.degrees(90))

输出结果：

509.9324376664327-1145.915590261646557.295779513082325156.620156177409

Python math.radians(x) 方法将角度 x 从度数转换为弧度。

math.degrees() 方法将弧度值转换为度数。

Python 版本: 2.0

语法

math.radians() 方法语法如下：

math.radians(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示弧度值。

实例

以下实例返回不同度数转换为弧度：

# 导入 math 包import math# 输出度数转换为弧度print(math.radians(180))print(math.radians(100.03))print(math.radians(-20))

输出结果：

3.1415926535897931.7458528507699278-0.3490658503988659

Python math.cosh(x) 返回 x 的双曲余弦值，相当于 (exp(number) + exp(-number)) / 2。

Python 版本: 1.4

语法

math.cosh() 方法语法如下：

math.cosh(x)

参数说明：

x -- 必需，个正数或负数。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示一个数字的双曲余弦值。

实例

以下实例返回不同数字的双曲余弦值：

# 导入 math 包import math# 输出双曲余弦值print (math.cosh(1))print (math.cosh(8.90))print (math.cosh(0))print (math.cosh(1.52))

输出结果：

1.54308063481524373665.9868377724611.02.395468541047187

Python math.cos(x) 返回 x 弧度的余弦值。

Python 版本: 1.4

语法

math.cos() 方法语法如下：

math.cos(x)

参数说明：

x -- 必需，数字。如果 x 不是数字，则返回 TypeError。

返回值

返回一个浮点数，表示 x 的余弦值，介于 -1 到 1 之间。

实例

以下实例返回数字的余弦值：

# 导入 math 包import math# 输出余弦值print (math.cos(0.00))print (math.cos(-1.23))print (math.cos(10))print (math.cos(3.14159265359))

输出结果：

1.00.3342377271245026-0.8390715290764524-1.0

Python math.copysign(x,y) 方法返回一个基于 x 的绝对值和 y 的符号 +/- 的浮点数。

Python 版本：2.6

语法

math.copysign() 方法语法如下：

math.copysign(x, y)

参数说明：

x -- 必需，数字。
y -- 必需，数字，返回将值具有该参数的符号 +/-。

返回值

返回一个浮点值，由第一个参数的值和第二个参数的符号组成。

实例

以下实例返回第一个参数的值和第二个参数的符号：

# 导入 math 包import math# 返回第一个参数的值和第二个参数的符号print(math.copysign(4, -1))print(math.copysign(-8, 97.21))print(math.copysign(-43, -76))

输出结果：

-4.08.0-43.0

Python math.comb(x) 方法返回不重复且无顺序地从 n 项中选择 k 项的方式总数。

传入的参数必须是正整数。

Python 版本：3.8

语法

math.comb() 方法语法如下：

math.comb(n, k)

参数说明：

n -- 必需，正整数数字。
k -- 必需，正整数数字。

返回值

返回一个整数，代表组合的总数。

实例

以下实例返回从 5 项中选择 7 项的方式总数：

# 导入 math 包import math# 初始化可供选择的项数n = 7# 始化可供选择的可能性数量k = 5# 打印可能组合的总数print (math.comb(n, k))

输出结果：

Python math.ceil(x) 方法将 x 向上舍入到最接近的整数。

math.floor() 方法将数字向下舍入到最接近的整数。

语法

math.ceil() 方法语法如下：

math.ceil(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个整数，表示舍入的数字。

实例

以下实例返回向上舍入到最接近的整数：

# 导入 math 包import math# 输出向上舍入到最接近的整数print(math.ceil(1.4))print(math.ceil(5.3))print(math.ceil(-5.3))print(math.ceil(22.6))print(math.ceil(10.0))

输出结果：

26-52310

Python math.floor(x) 方法将 x 向下舍入到最接近的整数。

math.ceil() 方法将数字向上舍入到最接近的整数。

语法

math.floor() 方法语法如下：

math.floor(x)

参数说明：

x -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个整数 int，表示向下舍入的数字。

实例

以下实例返回向下舍入到最接近的整数：

# 导入 math 包import math# 输出向下舍入到最接近的整数print(math.floor(0.6))print(math.floor(1.4))print(math.floor(5.3))print(math.floor(-5.3))print(math.floor(22.6))print(math.floor(10.0))

输出结果：

015-62210

Python math.atanh(x) 返回 x 的反双曲正切值。

math.atanh(x) 的参数介于 -0.99 到 0.99 之间。

Python 版本: 2.6

语法

math.atanh() 方法语法如下：

math.atanh(x)

参数说明：

x -- 必需，介于 -0.99 和 0.99 之间的正数或负数。如果 x 不是数字，则返回 TypeError.

返回值

返回一个浮点数，表示 x 的反双曲正切值。

实例

以下实例返回数字的双曲正切值：

# 导入 math 包import math# 输出双曲正切值print(math.atanh(0.59))print(math.atanh(-0.12))

输出结果：

0.6776660677579618-0.12058102840844402

Python math.atan2(y,x) 返回给定的 y 及 x 坐标值的反正切值 atan(y / x)，以弧度为单位，结果是在 -pi 和 pi 之间。

Python 版本:1.4

语法

math.atan2() 方法语法如下：

math.atan2(y, x)

参数说明：

x -- 必需，个正数或负数。
y -- 必需，个正数或负数。

返回值

返回一个浮点数，表示y 及 x 坐标值的反正切值，结果是在 -pi 和 pi 之间。

实例

以下实例返回 y/x 的反正切：

# 导入 math 包import math# 输出 y/x 反正切值print(math.atan2(8, 5))print(math.atan2(20, 10))print(math.atan2(34, -7))

输出结果：

1.01219701145133411.10714871779409041.7738415440483617

Python math.atan(x) 返回 x 的反正切值，以弧度为单位，结果范围在 -pi/2 到 pi/2 之间。

Python 版本: 1.6.1

语法

math.atan() 方法语法如下：

math.atan(x)

参数说明：

x -- 必需，个正数或负数。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示一个数字的反正切值，范围在 -pi/2 到 pi/2 之间。

实例

以下实例返回不同数字的反正切：

# 导入 math 包import math# 输出反正切值print (math.atan(0.39))print (math.atan(67))print (math.atan(-21))

输出结果：

0.371856073848581271.5558720618048116-1.5232132235179132

Python math.asinh(x) 返回 x 的反双曲正弦值。

Python 版本: 2.6

语法

math.asinh() 方法语法如下：

math.asinh(x)

参数说明：

x -- 必需，个正数或负数。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示一个数字的反双曲正弦值。

实例

以下实例返回不同数字的反双曲正弦：

# 导入 math 包import math# 输出反双曲正弦值print(math.asinh(7))print(math.asinh(56))print(math.asinh(2.45))print(math.asinh(1))

输出结果：

2.6441207610586294.7185785811517671.62849981928419090.881373587019543

Python math.acos(x) 返回 x 的反余弦，结果范围在 0 到 pi 之间。

math.acos() 接收的参数为 -1 到 1。

math.acos(-1) 返回 math.pi 常量。

Python 版本: 1.4

语法

math.acos() 方法语法如下：

math.acos(x)

参数说明：

x -- 必需，一个数字， -1 到 1 之间。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示一个数字的反余弦。

实例

以下实例返回指定数字的反余弦：

# 导入 math 包import math# 输出反余弦值print(math.acos(0.55))print(math.acos(-0.55))print(math.acos(0))print(math.acos(1))print(math.acos(-1))

输出结果：

0.98843208892615312.153160564663641.57079632679489660.03.141592653589793

Python math.acosh(x) 返回 x 的反双曲余弦值。

math.acosh() 接收的参数大于等于 1。

Python 版本: 2.6

语法

math.acosh() 方法语法如下：

math.acosh(x)

参数说明：

x -- 必需，一个数字，大于等于 1。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示一个数字的反双曲余弦值。

实例

以下实例返回不同数字的反双曲余弦：

# 导入 math 包import math# 输出反双曲余弦值print (math.acosh(7))print (math.acosh(56))print (math.acosh(2.45))print (math.acosh(1))

输出结果：

2.63391579384963364.7184191423728791.54471311787073940.0

Python math.asin(x) 返回 x 的反正弦值，结果范围在 -pi/2 到 pi/2 之间。。

math.asin() 接收的参数为 -1 到 1。

Python 版本: 1.4

语法

math.asin() 方法语法如下：

math.asin(x)

参数说明：

x -- 必需，一个数字， -1 到 1 之间。如果 x 不是一个数字，返回 TypeError。

返回值

返回一个浮点数，表示一个数字的反正弦值。

实例

以下实例返回不同数字的反正弦值：

# 导入 math 包import math# 输出反正弦值print(math.asin(0.55))print(math.asin(-0.55))print(math.asin(0))print(math.asin(1))print(math.asin(-1))

输出结果：

0.5823642378687435-0.58236423786874350.01.5707963267948966-1.5707963267948966

Python math.tau 返回数学常数 τ = 6.283185...， tau 是一个圆周常数，等于 2π，圆的周长与半径之比。

tau 值为 6.283185307179586。

语法

math.tau 常量语法如下：

math.tau

返回值

返回一个浮点数 6.283185307179586，表示圆的周长与半径之比。

实例

以下实例返回 tau：

# 导入 math 包import math# 输出 tauprint (math.tau)

输出结果：

6.283185307179586

Python math.pi 返回一个浮点值 π，一般指圆周率，圆周率 PI (3.1415...)。

PI: 3.141592653589793。

语法

math.pi 常量语法如下：

math.pi

返回值

返回一个浮点数 3.141592653589793，表示圆周率。

实例

以下实例返回 PI：

# 导入 math 包import math# 输出 PIprint (math.pi)

输出结果：

3.141592653589793

Python math.nan 返回一个浮点值 nan（not a number，不是一个数字），这个值不是一个合法数字。

math.nan 相当于 float('nan') 的输出。

语法

math.nan 常量语法如下：

math.nan

返回值

返回一个浮点数 nan。

实例

以下实例返回 nan：

# 导入 math 包import math# 输出 nanprint (math.nan)# 输出 nan 类型print (type(math.nan))

输出结果：

nan<class 'float'>

Python math.inf 正无穷大的浮点数，负无穷大，使用 -math.inf 。

math.inf 相当于 float('inf') 的输出。

语法

math.inf 常量语法如下：

math.inf

返回值

返回一个浮点数，表示正无穷大。

实例

以下实例返回正无穷大与负无穷大：

# 导入 math 包import math# 输出正无穷大print (math.inf)# 输出负无穷大print (-math.inf)

输出结果：

inf-inf

Python math.e 常量用于返回欧拉数 (2.7182...)。

语法

math.e 常量语法如下：

math.e

返回值

返回一个浮点数 2.718281828459045，表示数学常数 e。

实例

以下实例返回欧拉数 (2.7182...)：

# 导入 math 包import math# 输出 e 的值print (math.e)

输出结果：

2.718281828459045

Python2.x 版本中，使用 cmp() 函数来比较两个列表、数字或字符串等的大小关系。

Python 3.X 的版本中已经没有 cmp() 函数，如果你需要实现比较功能，需要引入 operator 模块，适合任何对象，包含的方法有：

operator.lt(a, b)operator.le(a, b)operator.eq(a, b)operator.ne(a, b)operator.ge(a, b)operator.gt(a, b)operator.__lt__(a, b)operator.__le__(a, b)operator.__eq__(a, b)operator.__ne__(a, b)operator.__ge__(a, b)operator.__gt__(a, b)

operator.lt(a, b) 与 a < b 相同， operator.le(a, b) 与 a <= b 相同，operator.eq(a, b) 与 a == b 相同，operator.ne(a, b) 与 a != b 相同，operator.gt(a, b) 与 a > b 相同，operator.ge(a, b) 与 a >= b 相同。

# 导入 operator 模块import operator # 数字x = 10y = 20print("x:",x, ", y:",y)print("operator.lt(x,y): ", operator.lt(x,y))print("operator.gt(y,x): ", operator.gt(y,x))print("operator.eq(x,x): ", operator.eq(x,x))print("operator.ne(y,y): ", operator.ne(y,y))print("operator.le(x,y): ", operator.le(x,y))print("operator.ge(y,x): ", operator.ge(y,x))print()# 字符串x = "Google"y = "w3cschool"print("x:",x, ", y:",y)print("operator.lt(x,y): ", operator.lt(x,y))print("operator.gt(y,x): ", operator.gt(y,x))print("operator.eq(x,x): ", operator.eq(x,x))print("operator.ne(y,y): ", operator.ne(y,y))print("operator.le(x,y): ", operator.le(x,y))print("operator.ge(y,x): ", operator.ge(y,x))print()# 查看返回值print("type((operator.lt(x,y)): ", type(operator.lt(x,y)))

以上代码输出结果为：

x: 10 , y: 20operator.lt(x,y):  Trueoperator.gt(y,x):  Trueoperator.eq(x,x):  Trueoperator.ne(y,y):  Falseoperator.le(x,y):  Trueoperator.ge(y,x):  Truex: Google , y: w3cschooloperator.lt(x,y):  Trueoperator.gt(y,x):  Trueoperator.eq(x,x):  Trueoperator.ne(y,y):  Falseoperator.le(x,y):  Trueoperator.ge(y,x):  True

比较两个列表：

# 导入 operator 模块import operatora = [1, 2]b = [2, 3]c = [2, 3]print("operator.eq(a,b): ", operator.eq(a,b))print("operator.eq(c,b): ", operator.eq(c,b))

以上代码输出结果为：

operator.eq(a,b):  Falseoperator.eq(c,b):  True

运算符函数

operator 模块提供了一套与 Python 的内置运算符对应的高效率函数。例如，operator.add(x, y) 与表达式 x+y 相同。

函数包含的种类有：对象的比较运算、逻辑运算、数学运算以及序列运算。

对象比较函数适用于所有的对象，函数名根据它们对应的比较运算符命名。

许多函数名与特殊方法名相同，只是没有双下划线。为了向后兼容性，也保留了许多包含双下划线的函数，为了表述清楚，建议使用没有双下划线的函数。

# Python 实例# add(), sub(), mul() # 导入  operator 模块import operator # 初始化变量a = 4 b = 3 # 使用 add() 让两个值相加print ("add() 运算结果 :",end="");print (operator.add(a, b)) # 使用 sub() 让两个值相减print ("sub() 运算结果 :",end="");print (operator.sub(a, b)) # 使用 mul() 让两个值相乘print ("mul() 运算结果 :",end="");print (operator.mul(a, b))

以上代码输出结果为：

add() 运算结果 :7sub() 运算结果 :1mul() 运算结果 :12

运算	语法	函数
加法	`a + b`	`add(a, b)`
字符串拼接	`seq1 + seq2`	`concat(seq1, seq2)`
包含测试	`obj in seq`	`contains(seq, obj)`
除法	`a / b`	`truediv(a, b)`
除法	`a // b`	`floordiv(a, b)`
按位与	`a & b`	`and_(a, b)`
按位异或	`a ^ b`	`xor(a, b)`
按位取反	`~ a`	`invert(a)`
按位或	`a \| b`	`or_(a, b)`
取幂	`a ** b`	`pow(a, b)`
标识	`a is b`	`is_(a, b)`
标识	`a is not b`	`is_not(a, b)`
索引赋值	`obj[k] = v`	`setitem(obj, k, v)`
索引删除	`del obj[k]`	`delitem(obj, k)`
索引取值	`obj[k]`	`getitem(obj, k)`
左移	`a << b`	`lshift(a, b)`
取模	`a % b`	`mod(a, b)`
乘法	`a * b`	`mul(a, b)`
矩阵乘法	`a @ b`	`matmul(a, b)`
取反（算术）	`- a`	`neg(a)`
取反（逻辑）	`not a`	`not_(a)`
正数	`+ a`	`pos(a)`
右移	`a >> b`	`rshift(a, b)`
切片赋值	`seq[i:j] = values`	`setitem(seq, slice(i, j), values)`
切片删除	`del seq[i:j]`	`delitem(seq, slice(i, j))`
切片取值	`seq[i:j]`	`getitem(seq, slice(i, j))`
字符串格式化	`s % obj`	`mod(s, obj)`
减法	`a - b`	`sub(a, b)`
真值测试	`obj`	`truth(obj)`
比较	`a < b`	`lt(a, b)`
比较	`a <= b`	`le(a, b)`
相等	`a == b`	`eq(a, b)`
不等	`a != b`	`ne(a, b)`
比较	`a >= b`	`ge(a, b)`
比较	`a > b`	`gt(a, b)`

pip 是 Python 包管理工具，该工具提供了对 Python 包的查找、下载、安装、卸载的功能。

软件包也可以在 https://pypi.org/ 中找到。

目前最新的 Python 版本已经预装了 pip。

查看是否已经安装 pip 可以使用以下命令：

pip --version

下载安装包使用以下命令：

pip install some-package-name

例如我们安装 numpy 包：

pip install numpy

我们也可以轻易地通过以下的命令来移除软件包：

pip uninstall some-package-name

例如我们移除 numpy 包：

pip uninstall numpy

如果要查看我们已经安装的软件包，可以使用以下命令：

pip list

MongoDB 是目前最流行的 NoSQL 数据库之一，使用的数据类型 BSON（类似 JSON）。

MongoDB 数据库安装与介绍可以查看我们的 MongoDB 教程。

PyMongo

Python 要连接 MongoDB 需要 MongoDB 驱动，这里我们使用 PyMongo 驱动来连接。

pip 安装

pip 是一个通用的 Python 包管理工具，提供了对 Python 包的查找、下载、安装、卸载的功能。

安装 pymongo:

$ python3 -m pip3 install pymongo

也可以指定安装的版本:

$ python3 -m pip3 install pymongo==3.5.1

更新 pymongo 命令：

$ python3 -m pip3 install --upgrade pymongo

easy_install 安装

旧版的 Python 可以使用 easy_install 来安装，easy_install 也是 Python 包管理工具。

$ python -m easy_install pymongo

更新 pymongo 命令：

$ python -m easy_install -U pymongo

测试 PyMongo

接下来我们可以创建一个测试文件 demo_test_mongodb.py，代码如下：

demo_test_mongodb.py 文件代码：

#!/usr/bin/python3 import pymongo

执行以上代码文件，如果没有出现错误，表示安装成功。

创建数据库

创建一个数据库

创建数据库需要使用 MongoClient 对象，并且指定连接的 URL 地址和要创建的数据库名。

如下实例中，我们创建的数据库 w3cschool :

实例

#!/usr/bin/python3 import pymongo myclient = pymongo.MongoClient("mongodb://localhost:27017/")mydb = myclient["w3cschool"]

注意: 在 MongoDB 中，数据库只有在内容插入后才会创建! 就是说，数据库创建后要创建集合(数据表)并插入一个文档(记录)，数据库才会真正创建。

判断数据库是否已存在

我们可以读取 MongoDB 中的所有数据库，并判断指定的数据库是否存在：

实例

#!/usr/bin/python3 import pymongo myclient = pymongo.MongoClient('mongodb://localhost:27017/') dblist = myclient.list_database_names()# dblist = myclient.database_names() if "w3cschool" in dblist:  print("数据库已存在！")

注意：database_names 在最新版本的 Python 中已废弃，Python3.7+ 之后的版本改为了 list_database_names()。

创建集合

MongoDB 中的集合类似 SQL 的表。

创建一个集合

MongoDB 使用数据库对象来创建集合，实例如下：

实例

#!/usr/bin/python3 import pymongo myclient = pymongo.MongoClient("mongodb://localhost:27017/")mydb = myclient["w3cschool"] mycol = mydb["sites"]

注意: 在 MongoDB 中，集合只有在内容插入后才会创建! 就是说，创建集合(数据表)后要再插入一个文档(记录)，集合才会真正创建。

判断集合是否已存在

我们可以读取 MongoDB 数据库中的所有集合，并判断指定的集合是否存在：

实例

#!/usr/bin/python3 import pymongo myclient = pymongo.MongoClient('mongodb://localhost:27017/') mydb = myclient['w3cschool'] collist = mydb. list_collection_names()# collist = mydb.collection_names()if "sites" in collist:   # 判断 sites 集合是否存在  print("集合已存在！")

注意：collection_names 在最新版本的 Python 中已废弃，Python3.7+ 之后的版本改为了 list_collection_names()。

增、删、改、查等操作

下表列出了 MongoDB 的更多操作，详情可点击具体链接：

序号	功能
1	添加数据
2	查询数据
3	修改数据
4	数据排序
5	删除数据

Python random 模块主要用于生成随机数。

random 模块实现了各种分布的伪随机数生成器。

要使用 random 函数必须先导入：

import random

查看 random 模块中的内容:

>>> import random>>> dir(random)['BPF', 'LOG4', 'NV_MAGICCONST', 'RECIP_BPF', 'Random', 'SG_MAGICCONST', 'SystemRandom', 'TWOPI', '_Sequence', '_Set', '__all__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__', '_accumulate', '_acos', '_bisect', '_ceil', '_cos', '_e', '_exp', '_floor', '_inst', '_log', '_os', '_pi', '_random', '_repeat', '_sha512', '_sin', '_sqrt', '_test', '_test_generator', '_urandom', '_warn', 'betavariate', 'choice', 'choices', 'expovariate', 'gammavariate', 'gauss', 'getrandbits', 'getstate', 'lognormvariate', 'normalvariate', 'paretovariate', 'randbytes', 'randint', 'random', 'randrange', 'sample', 'seed', 'setstate', 'shuffle', 'triangular', 'uniform', 'vonmisesvariate', 'weibullvariate']

接下来我们使用 random() 方法返回一个随机数，它在 [0,1) 范围内，包含 0 但不包含 1。

# 导入 random 包import random# 生成随机数print(random.random())

以上实例输出结果为：

0.4784904215869241

seed() 方法改变随机数生成器的种子，可以在调用其他随机模块函数之前调用此函数。

#!/usr/bin/python3import randomrandom.seed()print ("使用默认种子生成随机数：", random.random())print ("使用默认种子生成随机数：", random.random())random.seed(10)print ("使用整数 10 种子生成随机数：", random.random())random.seed(10)print ("使用整数 10 种子生成随机数：", random.random())random.seed("hello",2)print ("使用字符串种子生成随机数：", random.random())

以上实例运行后输出结果为：

使用默认种子生成随机数： 0.7908102856355441使用默认种子生成随机数： 0.81038961519195使用整数 10 种子生成随机数： 0.5714025946899135使用整数 10 种子生成随机数： 0.5714025946899135使用字符串种子生成随机数： 0.3537754404730722

random 模块方法

random 模块方法如下：

方法	描述
seed()	初始化随机数生成器
getstate()	返回捕获生成器当前内部状态的对象。
setstate()	state 应该是从之前调用 getstate() 获得的，并且 setstate() 将生成器的内部状态恢复到 getstate() 被调用时的状态。
getrandbits(k)	返回具有 k 个随机比特位的非负 Python 整数。此方法随 MersenneTwister 生成器一起提供，其他一些生成器也可能将其作为 API 的可选部分提供。在可能的情况下，getrandbits() 会启用 randrange() 来处理任意大的区间。
randrange()	从 range(start, stop, step) 返回一个随机选择的元素。
randint(a, b)	返回随机整数 N 满足 a <= N <= b。
choice(seq)	从非空序列 seq 返回一个随机元素。如果 seq 为空，则引发 IndexError。
choices(population, weights=None, *, cum_weights=None, k=1)	从 population 中选择替换，返回大小为 k 的元素列表。如果 population 为空，则引发 IndexError。
shuffle(x[, random])	将序列 x 随机打乱位置。
sample(population, k, *, counts=None)	返回从总体序列或集合中选择的唯一元素的 k 长度列表。用于无重复的随机抽样。
random()	返回 [0.0, 1.0) 范围内的下一个随机浮点数。
uniform()	返回一个随机浮点数 N ，当 a <= b 时 a <= N <= b ，当 b < a 时 b <= N <= a 。
triangular(low, high, mode)	返回一个随机浮点数 N ，使得 low <= N <= high 并在这些边界之间使用指定的 mode 。 low 和 high 边界默认为零和一。 mode 参数默认为边界之间的中点，给出对称分布。
betavariate(alpha, beta)	Beta 分布。参数的条件是 alpha > 0 和 beta > 0。返回值的范围介于 0 和 1 之间。
expovariate(lambd)	指数分布。 lambd 是 1.0 除以所需的平均值，它应该是非零的。
gammavariate()	Gamma 分布（不是伽马函数）参数的条件是 alpha > 0 和 beta > 0。
gauss(mu, sigma)	正态分布，也称高斯分布。 mu 为平均值，而 sigma 为标准差。此函数要稍快于下面所定义的 normalvariate() 函数。
lognormvariate(mu, sigma)	对数正态分布。如果你采用这个分布的自然对数，你将得到一个正态分布，平均值为 mu 和标准差为 sigma 。 mu 可以是任何值，sigma 必须大于零。
normalvariate(mu, sigma)	正态分布。 mu 是平均值，sigma 是标准差。
vonmisesvariate(mu, kappa)	冯·米塞斯分布。 mu 是平均角度，以弧度表示，介于0和 2pi 之间，kappa 是浓度参数，必须大于或等于零。如果 kappa 等于零，则该分布在 0 到 2pi 的范围内减小到均匀的随机角度。
paretovariate(alpha)	帕累托分布。 alpha 是形状参数。
weibullvariate(alpha, beta)	威布尔分布。 alpha 是比例参数，beta 是形状参数。

Python random 模块

Python random.randint() 方法返回指定范围内的整数。

randint(start, stop) 等价于 randrange(start, stop+1)。

语法

random.randint() 方法语法如下：

random.randint(start, stop)

参数说明：

start -- 必需，一个整数，指定开始值。
stop -- 必需，一个整数，指定结束值。

返回值

返回指定范围内的整数。

实例

以下实例返回一个 1 到 9 之间的数字（大于等于 1，小于等于 9 ）：

# 导入 random 包import random# 返回一个 1 到 9 之间的数字print(random.randint(1, 9))

输出结果：

Python 内置了 requests 模块，该模块主要用来发送 HTTP 请求，requests 模块比 urllib 模块更简洁。

# 导入 requests 包import requests# 发送请求x = requests.get('https://www.w3cschool.cn/')# 返回网页内容print(x.text)

每次调用 requests 请求之后，会返回一个 response 对象，该对象包含了具体的响应信息。

响应信息如下：

属性或方法	说明
apparent_encoding	编码方式
close()	关闭与服务器的连接
content	返回响应的内容，以字节为单位
cookies	返回一个 CookieJar 对象，包含了从服务器发回的 cookie
elapsed	返回一个 timedelta 对象，包含了从发送请求到响应到达之间经过的时间量，可以用于测试响应速度。比如 r.elapsed.microseconds 表示响应到达需要多少微秒。
encoding	解码 r.text 的编码方式
headers	返回响应头，字典格式
history	返回包含请求历史的响应对象列表（url）
is_permanent_redirect	如果响应是永久重定向的 url，则返回 True，否则返回 False
is_redirect	如果响应被重定向，则返回 True，否则返回 False
iter_content()	迭代响应
iter_lines()	迭代响应的行
json()	返回结果的 JSON 对象 (结果需要以 JSON 格式编写的，否则会引发错误)
links	返回响应的解析头链接
next	返回重定向链中下一个请求的 PreparedRequest 对象
ok	检查 "status_code" 的值，如果小于400，则返回 True，如果不小于 400，则返回 False
raise_for_status()	如果发生错误，方法返回一个 HTTPError 对象
reason	响应状态的描述，比如 "Not Found" 或 "OK"
request	返回请求此响应的请求对象
status_code	返回 http 的状态码，比如 404 和 200（200 是 OK，404 是 Not Found）
text	返回响应的内容，unicode 类型数据
url	返回响应的 URL

# 导入 requests 包import requests# 发送请求x = requests.get('https://www.w3cschool.cn/')# 返回 http 的状态码print(x.status_code)# 响应状态的描述print(x.reason)# 返回编码print(x.apparent_encoding)

输出结果如下：

200OKutf-8

请求 json 数据文件，返回 json 内容：

# 导入 requests 包import requests# 发送请求x = requests.get('https://www.w3cschool.cn/try/ajax/json_demo.json')# 返回 json 数据print(x.json())

输出结果如下：

{'name': '网站', 'num': 3, 'sites': [{'name': 'Google', 'info': ['Android', 'Google 搜索', 'Google 翻译']}, {'name': 'w3cschool', 'info': ['编程狮', '编程狮工具', '编程狮微信']}, {'name': 'Taobao', 'info': ['淘宝', '网购']}]}

requests 方法

requests 方法如下表：

方法	描述
delete(url, args)	发送 DELETE 请求到指定 url
get(url, params, args)	发送 GET 请求到指定 url
head(url, args)	发送 HEAD 请求到指定 url
patch(url, data, args)	发送 PATCH 请求到指定 url
post(url, data, json, args)	发送 POST 请求到指定 url
put(url, data, args)	发送 PUT 请求到指定 url
request(method, url, args)	向指定的 url 发送指定的请求方法

使用 requests.request() 发送 get 请求：

# 导入 requests 包import requests# 发送请求x = requests.request('get', 'https://www.w3cschool.cn/')# 返回网页内容print(x.status_code)

输出结果如下：

设置请求头：

# 导入 requests 包import requests kw = {'w':'python 教程'}# 设置请求头headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36"} # params 接收一个字典或者字符串的查询参数，字典类型自动转换为url编码，不需要urlencode()response = requests.get("https://www.w3cschool.cn/search/", params = kw, headers = headers)# 查看响应状态码print (response.status_code)# 查看响应头部字符编码print (response.encoding)# 查看完整url地址print (response.url)# 查看响应内容，response.text 返回的是Unicode格式的数据print(response.text)

输出结果如下：

200UTF-8https://www.w3cschool.cn/search/?w=python+%E6%95%99%E7%A8%8B... 其他内容...

post() 方法可以发送 POST 请求到指定 url，一般格式如下：

requests.post(url, data={key: value}, json={key: value}, args)

url 请求 url。
data 参数为要发送到指定 url 的字典、元组列表、字节或文件对象。
json 参数为要发送到指定 url 的 JSON 对象。
args 为其他参数，比如 cookies、headers、verify等。

# 导入 requests 包import requests# 发送请求x = requests.post('https://www.w3cschool.cn/try/ajax/demo_post.php')# 返回网页内容print(x.text)

输出结果如下：

<p style='color:red;'>本内容是使用 POST 方法请求的。</p><p style='color:red;'>请求时间：2022-05-26 17:30:47</p>

post 请求带参数：

# 导入 requests 包import requests# 表单参数，参数名为 fname 和 lnamemyobj = {'fname': 'w3cschool','lname': 'Boy'}# 发送请求x = requests.post('https://www.w3cschool.cn/try/ajax/demo_post2.php', data = myobj)# 返回网页内容print(x.text)

输出结果如下：

<p style='color:red;'>你好，w3cschool Boy，今天过得怎么样？</p>

描述

all() 函数用于判断一个列表中的所有元素是否为真（TRUE）。

给定的可迭代参数 iterable 中的所有元素是否都为 TRUE，如果是返回 True，否则返回 False。

元素除了是 0、空、None、False 外都算 True。

为了便于理解，上述文本中使用了列表作为可迭代对象的替换。实际上这是片面的，all()函数接受的参数为可迭代的对象，也就是说，以下这些类型都可以作为
1.list，tuple，dict、set、str
2.generator，带yield的generator function，统称为iterator。生成器可以使用for可以被next函数调用并返回下一个值。

函数等价于：

def all(iterable):    for element in iterable:        if not element:            return False    return True

语法

以下是 all() 方法的语法:

all(iterable)

参数

iterable -- 元组或列表。

返回值

如果iterable的所有元素不为0、''、False或者iterable为空，all(iterable)返回True，否则返回False；

注意：空元组、空列表返回值为True，这里要特别注意。

实例

以下展示了使用 all() 方法的实例：

>>> all(['a', 'b', 'c', 'd'])  # 列表list，元素都不为空或0True>>> all(['a', 'b', '', 'd'])   # 列表list，存在一个为空的元素False>>> all([0, 1，2, 3])          # 列表list，存在一个为0的元素False   >>> all(('a', 'b', 'c', 'd'))  # 元组tuple，元素都不为空或0True>>> all(('a', 'b', '', 'd'))   # 元组tuple，存在一个为空的元素False>>> all((0, 1, 2, 3))          # 元组tuple，存在一个为0的元素False   >>> all([])             # 空列表True>>> all(())             # 空元组True

描述

abs() 函数接受一个参数，并返回该参数的绝对值。

注：虽然abs()函数是数学运算相关的方法，但是abs()函数是python内置函数，不是math模块的函数。

math模块也有求绝对值的方法（math.fabs()）
二者有所区别：
abs()方法可以接受int，float和复数类型的参数。返回相对应的值（复数返回模）。
fabs()方法只能接受int和float类型的参数，返回值为float。

语法

以下是 abs() 方法的语法:

abs(x)

参数

x -- 可以是整数、浮点数、复数或任何实现了 __abs__() 的对象。

返回值

函数返回 x（数字）的绝对值，如果参数是一个复数，则返回它的模。

实例

以下展示了使用 abs() 方法的实例：

#!/usr/bin/python3x = -40 #定义一个int类型的变量print(type(x)) #查看x是不是int类型x =abs(x) # 求x的绝对值print(x) # x的绝对值print(type(x)) # 查看int类型的变量求完绝对值后是什么类型y =-12.5 #定义一个float类型的变量print(type(y)) # 查看y是不是float类型x =abs(y) # 求y的绝对值print(y) # y的绝对值print(type(y)) #查看float类型的变量求完绝对值后是什么类型z = -101 - 0.3j  # 定义一个complex（复数）类型的变量print(type(z)) # 查看z是不是complex类型x =abs(z) # 求z的绝对值print(z) #  z的绝对值print(type(z)) # 查看complex类型的变量求完绝对值后是什么类型

以上实例运行后输出结果为：

<class 'int'>
40
<class 'int'>
<class 'float'>
-12.5
<class 'float'>
<class 'complex'>
(-101-0.3j)
<class 'complex'>

描述

randrange() 方法返回指定递增基数集合中的一个随机数，基数缺省值为1。

语法

以下是 randrange() 方法的语法:

import randomrandom.randrange ([start,] stop [,step])

注意：randrange()是不能直接访问的，需要导入 random 模块，然后通过 random 静态对象调用该方法。

参数

start -- 指定范围内的开始值，包含在范围内。
stop -- 指定范围内的结束值，不包含在范围内。
step -- 指定递增基数。

返回值

从给定的范围返回随机项。

实例

以下展示了使用 randrange() 方法的实例：

#!/usr/bin/python3import random# 从 1-100 中选取一个奇数print ("randrange(1,100, 2) : ", random.randrange(1, 100, 2))# 从 0-99 选取一个随机数print ("randrange(100) : ", random.randrange(100))

以上实例运行后输出结果为：

randrange(1,100, 2) :  97randrange(100) :  42

描述

ceil(x) 函数返回一个大于或等于 x 的的最小整数。

语法

以下是 ceil() 方法的语法:

import mathmath.ceil( x )

注意：ceil()是不能直接访问的，需要导入 math 模块，通过静态对象调用该方法。

参数

x -- 数值表达式。

返回值

函数返回返回一个大于或等于 x 的的最小整数。

实例

以下展示了使用 ceil() 方法的实例：

#!/usr/bin/python3import math   # 导入 math 模块print ("math.ceil(-45.17) : ", math.ceil(-45.17))print ("math.ceil(100.12) : ", math.ceil(100.12))print ("math.ceil(100.72) : ", math.ceil(100.72))print ("math.ceil(math.pi) : ", math.ceil(math.pi))

以上实例运行后输出结果为：

math.ceil(-45.17) :  -45math.ceil(100.12) :  101math.ceil(100.72) :  101math.ceil(math.pi) :  4

描述

Python iter() 函数用来生成迭代器。

有些对象（尤其是自定义的对象）可以像数组一样读出数据，但本身不是可迭代对象，这个时候就可以使用iter()将其转换成可迭代对象。

在类中实现了如果只实现__getitem__()的对象可以通过iter()函数转化成迭代器但其本身不是可迭代对象。所以当一个对象能够在for循环中运行时，不能确定是Iterable对象。

语法

iter() 方法的语法有两种，分别是:

iter(object)

和

iter(object, sentinel)

sentinel参数用于指示迭代的停止条件。

参数

object：支持迭代的集合对象（在不传入sentinel参数时）或者可调用的对象（第二种情况）。
sentinel：如果传递了第二个参数，则参数 object 必须是一个可调用的对象（如，函数），此时，iter 创建了一个迭代器对象，每次调用这个迭代器对象的__next__()方法时，都会调用 object。

返回值

迭代器对象。

实例

from typing import Iterableclass LinearDataStructure:    # 一个自己实现的线性表，未传参时默认为1,2,3        def __init__(self, data=[1, 2, 3]):        self.data = data    def get_data(self):        return self.data        def __getitem__(self,idx):        return(self.data[idx])    # 第一种语法lds = LinearDataStructure()print(isinstance(lds,Iterable))  # 这个线性表不是可迭代对象print(isinstance(iter(lds),Iterable)) # 使用iter方法可以把这个线性表变成可迭代对象# 第二种语法def read_until(f, stop):    return iter(lambda: f.readline().strip(), stop)with open('file.txt') as f:    for line in read_until(f, ''):        print(line)

我们知道，type()函数是python的内置函数，可以用来查看变量的类型，它是小编最常用的一个函数。小编之所以如此中意他并不仅仅是因为它只有四个字母，在使用上比isinstance()输入更快，还因为使用type()可以直接看到变量的类型，而使用isinstance()需要先知道大概是什么类型，才能判断是不是这个类型，从直观程度上type()更加直观。它也成为小编手册示例代码的优选函数之一。但是type()函数的作用不止于此，今天这篇文章我们就来重温一下type()函数的功能吧。

简介

type()函数有两种语法，分别是：

type(object)#或者type(name, bases, dict, **kwds)

前一种用法接受一个对象（变量），返回 object 的类型。返回值是一个 type 对象，通常与 object.__class__ 所返回的对象相同。

说人话，就是返回这个对象的类型，举个例子：

class Animal():    name = ""    def __init__(self,name):        self.name = name    def get_name(self):        return self.name      def breathe():        print("我可以呼吸")a = Animal('大象')print(type(a))            # 返回类Animal的实例对象  (aka 'object') 或者 <class '__main__.Animal'>)print(dir(a))

他的返回值是：

<class '__main__.Animal'>
['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'breathe', 'get_name', 'name']

我们可以看出，这是一个Animal对象。它有一个name属性和两个方法（get_name()和breathe()）

所有的动物都会呼吸！！

动态创建类

让我们再来看看第二种语法：

type(name, bases, dict, **kwds)

这个时候type()函数可以传入三个参数，第一个参数name是我们要创建的类的类名，第二个参数bases为这个类继承于谁（也就是谁是他的父类），如果为空的话则继承于object类，第三个参数dict是一个字典，包含类的属性和方法定义。

注意，bases参数必须是一个元组，所以要使用元组的形式把参数传进去！

创建一个子类，增加新的属性

前面我们提到dict参数可以

当使用type()函数创建类时，可以在第三个参数attr中添加方法。attr是一个字典，key为方法名，value为方法。例如，下面的代码创建了一个名为MyClass的类，并添加了一个名为my_method的方法：

MyClass = type('MyClass', (object,), {'my_method': lambda x: x+1})

这里的第一个参数是类名，第二个参数是继承的父类，第三个参数是属性字典。在这个例子中，我们使用了lambda表达式来定义my_method方法。这个方法接受一个参数x，并返回x+1。

如果要添加多个方法，可以在属性字典中添加多个键值对。例如：

MyClass = type('MyClass', (object,), {'my_method': lambda x: x+1,                                       'my_other_method': lambda x: x-1})

这里我们定义了两个方法：my_method和my_other_method。

请注意，这里的方法都是类方法而不是实例方法。如果要添加实例方法，请使用types.MethodType()函数。例如：

import typesdef my_instance_method(self):    return self.x + 1MyClass = type('MyClass', (object,), {'my_instance_method': types.MethodType(my_instance_method, None)})

这里我们定义了一个名为my_instance_method的实例方法，并将其添加到了MyClass类中。

描述

Python dir() 函数不带参数时，返回当前作用域内的所有名称；

带参数时，返回参数的属性、方法列表。

如果对象实现了__dir__()方法，该方法将被调用。

如果对象没有实现__dir__()，该方法将最大限度地收集参数信息。

注意：因为 dir() 主要是为了便于在交互式shell中使用，所以它会试图返回人们感兴趣的名字集合，而不是试图保证结果的严格性或一致性，它具体的行为也可能在不同版本之间改变。
例如，当实参是一个类时，metaclass 的属性不包含在结果列表中。

语法

dir() 语法：

dir(object)

参数说明：

object：对象、变量、模块。

返回值

不带参数时，返回当前作用域中的所有名称。

返回模块的属性和方法列表。

实例

以下实例展示了 dir()在命令行中的使用方法：

>>>dir() # 获得当前模块的属性列表['__builtins__', '__doc__', '__name__', '__package__', 'arr', 'myslice']>>> dir([ ]) # 查看列表的方法['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__delslice__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getslice__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__setslice__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']>>>

dir()方法也可以使用在代码行内：

print(dir())print(dir([]))

运行结果如下：

['__annotations__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__']['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']

描述

type() 函数

如果你只有第一个参数则返回对象的类型，三个参数返回新的类型对象。

isinstance() 与 type() 区别：type() 不会认为子类是一种父类类型，不考虑继承关系。isinstance() 会认为子类是一种父类类型，考虑继承关系。如果要判断两个类型是否相同推荐使用 isinstance()。

语法

以下是 type() 方法的语法:

type(object)type(name, bases, dict)

参数

name：类的名称。
bases：基类的元组。
dict：字典，类内定义的命名空间变量。

返回值

一个参数返回对象类型, 三个参数，返回新的类型对象。

实例

以下展示了使用 type 函数的实例：

# 一个参数实例>>> type(1)<type 'int'>>>> type('school')<type 'str'>>>> type([2])<type 'list'>>>> type({0:'zero'})<type 'dict'>>>> x = 1>>> type( x ) == int # 判断类型是否相等True# 三个参数>>> class X(object):... a = 1...>>> X = type('X', (object,), dict(a=1)) # 产生一个新的类型 X>>> X<class '__main__.X'>

type() 与 isinstance()区别：

class A:passclass B(A):passisinstance(A(), A) # returns Truetype(A()) == A # returns Trueisinstance(B(), A) # returns Truetype(B()) == A # returns False

描述

pow() 方法返回 x^y（x的y次方）的值。

在python中，求x的y次方的方法有很多，例如内置函数pow()，math模块的math.pow()，以及**运算符，他们都需要接受两个参数，但他们各有区别：
**运算符可以用来计算幂次方，但只能计算整数次幂，如果需要计算浮点数次幂，请使用内置函数pow()或者math.pow()
内置函数pow()和math模块的math.pow()功能是一样的，但在返回值上，math.pow()总是返回浮点型

语法

以下是 pow() 方法的语法:

math.pow(x,y)

参数

x -- 数值表达式。
y -- 数值表达式。

返回值

返回 xy（x的y次方）的值。

实例

以下展示了使用 pow() 方法的实例：

#!/usr/bin/python3print ("pow(100, 2) : ", pow(100, 2))print ("pow(100, -2) : ", pow(100, -2))print ("pow(2, 4) : ", pow(2, 4))print ("pow(3, 0) : ", pow(3, 0))

以上实例运行后输出结果为：

pow(100, 2) :  10000
pow(100, -2) :  0.0001
pow(2, 4) :  16
pow(3, 0) :  1

描述

min() 方法返回给定参数的最小值，参数可以为序列。

语法

以下是 min() 方法的语法:

min( x, y, z, .... )

参数

x -- 数值表达式。
y -- 数值表达式。
z -- 数值表达式。

返回值

返回给定参数的最小值。

实例

以下展示了使用 min() 方法的实例：

#!/usr/bin/python3print ("min(80, 100, 1000) : ", min(80, 100, 1000))print ("min(-20, 100, 400) : ", min(-20, 100, 400))print ("min(-80, -20, -10) : ", min(-80, -20, -10))print ("min(0, 100, -400) : ", min(0, 100, -400))

以上实例运行后输出结果为：

min(80, 100, 1000) :  80min(-20, 100, 400) :  -20min(-80, -20, -10) :  -80min(0, 100, -400) :  -400

描述

max() 方法返回给定参数的最大值，参数可以为序列。

语法

以下是 max() 方法的语法:

max( x, y, z, .... )

参数

x -- 数值表达式。
y -- 数值表达式。
z -- 数值表达式。

返回值

返回给定参数的最大值。

实例

以下展示了使用 max() 方法的实例：

#!/usr/bin/python3print ("max(80, 100, 1000) : ", max(80, 100, 1000))print ("max(-20, 100, 400) : ", max(-20, 100, 400))print ("max(-80, -20, -10) : ", max(-80, -20, -10))print ("max(0, 100, -400) : ", max(0, 100, -400))

以上实例运行后输出结果为：

max(80, 100, 1000) :  1000max(-20, 100, 400) :  400max(-80, -20, -10) :  -10max(0, 100, -400) :  100

描述

any() 函数用于判断一个列表中的所有元素是否为假（False）。

如果列表中的所有元素都为假（True或者可以转换为True），则返回False，否则返回True

注：元素除了 0、空、None、False 外都算 True。

为了便于理解，上述文本中使用了列表作为可迭代对象的替换。实际上这是片面的，any()函数接受的参数为可迭代的对象（iterable ），也就是说，以下这些类型都可以作为any()的参数：
1.list，tuple，dict、set、str
2.generator，带yield的generator function，统称为iterator。生成器可以使用for可以被next函数调用并返回下一个值。

函数等价于：

def any(iterable):    for element in iterable:        if element:            return True    return False

它与all()函数是一对功能相反的函数，可以简单的记为：all()全真才真，any()全假才假（刚好与与运算和或运算类似）

语法

以下是 any() 方法的语法:

any(iterable)

参数

iterable -- 可迭代的参数，包括.list，tuple，dict、set、str以及生成器生成的iterable对象。

返回值

如果iterable的所有元素都为0、''、False或者iterable为空，all(iterable)返回False，否则返回True；

注意：空元组、空列表，空字符串返回值为False，这里要特别注意。

实例

以下展示了使用 any() 方法的实例：

print(any(['a', 'b', 'c', 'd']))  # 列表list，元素都不为空或0# 返回 Trueprint(any(['a', 'b', '', 'd']))   # 列表list，存在一个为空的元素# 返回Falseprint(any([0, "" , False,None]))         # 列表list，元素都为空或0或False或None# 返回Falseprint(any(('a', 'b', 'c', 'd')))  # 元组tuple，元素都不为空或0# 返回 Trueprint(any(('a', 'b', '', 'd')))   # 元组tuple，存在一个为空的元素#返回 Tureprint(any((0, "" , False,None)))  # 元组tuple，元素都为空或0或False或None# 返回 Falseprint(any("w3cschool001"))        # 字符串也是可迭代对象，可以作为any()的参数# 返回 Trueprint(any('0'))            #字符串的0不算False# 返回 Trueprint(any(''))                   # 空字符串会返回False     # 返回 Falseprint(any([]))             # 空列表# 返回 Falseprint(any(()))            # 空元组# 返回 False

运行结果如下：

TrueTrueFalseTrueTrueFalseTrueTrueFalseFalseFalse

描述

Python eval()函数用来执行一条字符串中的python表达式，并返回表达式的值。

简单的说，就是执行一行python代码。

语法

以下是 eval() 方法的语法:

eval(expression[, globals[, locals]])

参数

expression：表达式。
globals：变量作用域，全局命名空间，如果被提供，则必须是一个字典对象。
locals：变量作用域，局部命名空间，如果被提供，可以是任何映射对象。

返回值

返回表达式计算结果。

实例

以下展示了使用 eval() 方法的实例：

>>>x = 7>>> eval( '3 * x' )21>>> eval('pow(2,2)')4>>> eval('2 + 2')4>>> n=81>>> eval("n + 4")85

拓展

将字符串对应的名字的变量转换成该变量对应的值：

>>> x='8'>>> x'8'>>> a=eval(x)>>> a8>>> b='a'     # 等价于b='8'>>> c=eval(b)>>> c8>>>

Python3 字符串 | Python 内置函数

描述

len() 方法返回一个对象的长度（元素个数），这里的对象可以是序列（如 string、bytes、tuple、list 或 range 等），也可以是集合（如 dictionary、set 或 frozen set 等）。

语法

len()方法语法：

len(seq)#或者len(set)

参数

可以是序列（如 string、bytes、tuple、list 或 range 等）
也可以是集合（如 dictionary、set 或 frozen set 等）

实际上，只要自定义的类实现了__len__()方法，就可以使用len()来获取这个对象的长度！
__len__()是Python中的一个特殊方法，用于返回对象的长度或元素个数。
如果一个类表现得像一个list，要获取有多少个元素，就得用 len() 函数。要让 len() 函数工作正常，类必须提供一个特殊方法__len__()，它返回元素的个数。

返回值

返回序列或者集合的长度（元素的个数）。

实例

以下实例展示了len()的使用方法：

#!/usr/bin/pythonstr = "W3CSchool example....wow!!!"print("字符串长度: ", len(str))list = ["w3cschool","编程狮","python"]print("列表元素个数: ", len(str))dict = {"w3cschool":"编程平台","python":"Django"}print("字典元素个数: ", len(dict))

以上实例输出结果如下：

字符串长度:  27
列表元素个数:  27
字典元素个数:  2

Python3 字符串 | Python 内置函数

Python3 内置函数

描述

Python3 zip() 函数用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的对象，这样做的好处是节约了不少的内存。

我们可以使用 list() 转换来输出列表。

如果各个迭代器的元素个数不一致，则返回列表长度与最短的对象相同，利用 * 号操作符，可以将元组解压为列表。

zip 方法在 Python 2 和 Python 3 中的不同：在 Python 2.x zip() 返回的是一个列表。
如果需要了解 Pyhton2 的应用，可以参考 Python zip()。

语法

zip 语法：

zip([iterable, ...])

参数说明：

iterabl -- 一个或多个迭代器；

返回值

返回一个对象。

实例

以下实例展示了 zip 的使用方法：

>>> a = [1,2,3]>>> b = [4,5,6]>>> c = [4,5,6,7,8]>>> zipped = zip(a,b) # 返回一个对象>>> zipped<zip object at 0x103abc288>>>> list(zipped) # list() 转换为列表[(1, 4), (2, 5), (3, 6)]>>> list(zip(a,c)) # 元素个数与最短的列表一致[(1, 4), (2, 5), (3, 6)]>>> a1, a2 = zip(*zip(a,b)) # 与 zip 相反，zip(*) 可理解为解压，返回二维矩阵式>>> list(a1)[1, 2, 3]>>> list(a2)[4, 5, 6]>>>

Python3 内置函数

描述

Python id() 函数用于获取对象的内存地址。

语法

id 语法：

id([object])

参数说明：

object：对象。

返回值

返回对象的内存地址。

实例

以下实例展示了 id 的使用方法：

>>> a = 'w3cschool'>>> id(a)40599920>>> b = 8>>> id(b)8791028446256

描述

help()函数用于查看函数或模块用途的详细说明。

语法

help 语法：

help([object])

参数说明：

object：对象

返回值

返回对象帮助信息。

实例

以下实例展示了 help 的使用方法：

>>>help('sys') # 查看 sys 模块的帮助……显示帮助信息……>>>help('str') # 查看 str 数据类型的帮助……显示帮助信息……>>>a = [1,2,3]>>>help(a) # 查看列表 list 帮助信息……显示帮助信息……>>>help(a.append) # 显示list的append方法的帮助……显示帮助信息……

描述

print() 方法用于打印输出，最常见的一个函数。

语法

以下是 print() 方法的语法：

print(*objects, sep=' ', end='
', file=sys.stdout)

参数

objects：复数，表示可以一次输出多个对象。输出多个对象时，需要用 , 分隔。
sep：用来间隔多个对象，默认值是一个空格。
end：用来设定以什么结尾。默认值是换行符，我们可以换成其他字符串。
file：要写入的文件对象。

返回值

无

实例

以下展示了使用 print 函数的实例：

>>>print(1)1>>> print("Hello World")Hello World>>> a = 1>>> b = 'w3cschool'>>> print(a,b)1 w3cschool>>> print("aaa""bbb")aaabbb>>> print("aaa","bbb")aaa bbb>>>>>> print("www","w3cschool","cn",sep=".") # 设置间隔符www.w3cschool.cn

描述

isinstance() 函数来判断一个对象是否是一个已知的类型，类似 type()。

isinstance()函数在使用时需要有一个已知类型的对象作为比较，比如要判断一个对象是不是列表，你需要传入一个列表对象

isinstance() 与 type() 区别：type() 不会认为子类是一种父类类型，不考虑继承关系。isinstance() 会认为子类是一种父类类型，考虑继承关系。如果要判断两个类型是否相同推荐使用 isinstance()。

语法

以下是 isinstance() 方法的语法:

isinstance(object, classinfo)

参数

object：实例对象。
classinfo：可以是直接或间接类名、基本类型或者由它们组成的元组。

在python3.10中，可以classinfo使用联合类型（union类型）

返回值

如果对象的类型与参数二的类型（classinfo）相同则返回 True，否则返回 False。

实例

以下展示了使用 isinstance 函数的实例：

>>>a = 2>>> isinstance (a,int)True>>> isinstance (a,str)False>>> isinstance (a,(str,int,list)) # 是元组中的一个返回 TrueTrue

type() 与 isinstance() 的区别：

class A:passclass B(A):passisinstance(A(), A) # returns Truetype(A()) == A # returns Trueisinstance(B(), A) # returns Truetype(B()) == A # returns False

拓展

对于基本类型来说，classinfo 可以是：

int，float，bool，complex，str(字符串)，list，dict(字典)，set，tuple

要注意的是，classinfo 的字符串是 str 而不是 string，字典也是简写 dict。

实例：

arg=123isinstance(arg, int)    #输出Trueisinstance(arg, str)    #输出Falseisinstance(arg, string) #报错

描述

type() 函数通常被用来判断对象的类型，在传入三个参数的时候它可以用来动态创建类。

本文着重介绍传入一个参数的情况，动态创建类请移步：python type（）函数专题——动态创建类

另一个函数isinstance()方法也可以用来判断对象的类型。

isinstance() 与 type() 区别：
type() 不会认为子类是一种父类类型，不考虑继承关系。
isinstance() 会认为子类是一种父类类型，考虑继承关系。
如果要判断两个类型是否相同推荐使用 isinstance()。

语法

以下是 type() 方法的语法:

type(object)# 或者type(name, bases, dict)

参数

单参数情况：

object：一个对象

三参数情况：

name：要动态创建的类的名称。
bases：继承于哪个父类（这是一个元组！）。
dict：要添加的属性和方法（这是一个字典！）

返回值

单参数情况：返回这个对象的类型

三参数情况：返回一个新的类型对象（一个动态创建的类）。

实例

以下展示了使用 type() 函数判断对象类型的实例：

print("数值对象的变量类型：")print(type(1))print('字符串对象的变量类型：')print(type('W3Cschool'))print('列表对象的变量类型：')print(type([2]))print('元组对象的变量类型：')print(type((1,2)))print('字典对象的变量类型：')print(type({0:'zero'}))print('判断两个对象的类型是否相等')x = 1print(type(x) == int)

运行结果如下：

数值对象的变量类型：<class 'int'>字符串对象的变量类型：<class 'str'>列表对象的变量类型：<class 'list'>元组对象的变量类型：<class 'tuple'>字典对象的变量类型：<class 'dict'>判断两个对象的类型是否相等True

以下展示了使用type()函数动态创建一个类的代码：

class Animal():     #一个父类，用来被继承的类。通常我们使用都是直接继承object类，但这边为了直观所以自己弄了一个类    #这个父类有一个name属性，一个get_name方法，一个breathe方法    name = ""    def __init__(self,name):        self.name = name        def get_name(self):        return self.name             def breathe():        print("我可以呼吸")#使用动态创建类的方法创建一个people类，继承了animal类，需要多一个属性sex  People = type("People",(Animal,) , {'sex':'M'}) # 我们定义了一个新类叫People，他继承于animal类，多了一个新的属性sexhuman = People('男人') #实例化这个类，让我们来看看他有什么表现吧print(type(human))  # 返回类People的实例化对象human 的类型<class '__main__.People'>)print(dir(human))  #用来查看这个类有什么属性或方法#我们使用的是dir方法，虽然看着很复杂，不过我们可以看到乱七八糟的结果里确实有父类的两个方法一个属性，和我们添加进去的sex属性# 当然也可以自己使用以下这个类的方法和属性，这里我只想证明存在这些内容，不多做功能展示# 使用动态创建了的方法创建一个Bird类，继承于animal类，需要多一个fly的方法def fly(self):    print("我可以飞")Bird = type('Bird', (Animal,), {'fly': fly}) #我们定义了一个新类叫Bird，继承于Animal类，多了一个新的方法flybird =Bird('乌鸦')           # 实例化这个类，让我们看到他有什么表现吧print(type(bird))            # 返回类Bird的实例化对象bird的类型 <class '__main__.Bird'>)print(dir(bird))             # 用来查看这个类有什么属性或方法bird.fly()                   # 试用一下这个fly方法，看它是否实现了功能#使用动态创建类的方法创建一个Durk类，继承于animal类，需要多一个属性weight和一个方法fly()Durk = type("Durk",(Animal,),{"weight":0,"fly":fly}) #我们定义了一个新类叫Durk，继承于Animal类，多了一个新的方法fly()和一个新属性weightcallDuck =  Durk('柯尔鸭') #实例化这个类，让我们看到他有什么表现吧print(type(callDuck))            # 返回类Durk的实例化对象callDark的类型 <class '__main__.Dark'>) print(dir(callDuck))             # 用来查看这个类有什么属性或方法

运行结果如下：

<class '__main__.People'>['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'breathe', 'get_name', 'name', 'sex']<class '__main__.Bird'>['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'breathe', 'fly', 'get_name', 'name']我可以飞<class '__main__.Durk'>['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'breathe', 'fly', 'get_name', 'name', 'weight']

补充

type() 与 isinstance()区别：

class A:passclass B(A):passisinstance(A(), A) # returns Truetype(A()) == A # returns Trueisinstance(B(), A) # returns Truetype(B()) == A # returns False

描述

any() 函数用于判断一个列表中的所有元素是否为假（False）。

如果列表中的所有元素都为假（True或者可以转换为True），则返回False，否则返回True

注：元素除了 0、空、None、False 外都算 True。

为了便于理解，上述文本中使用了列表作为可迭代对象的替换。实际上这是片面的，any()函数接受的参数为可迭代的对象（iterable ），也就是说，以下这些类型都可以作为any()的参数：
1.list，tuple，dict、set、str
2.generator，带yield的generator function，统称为iterator。生成器可以使用for可以被next函数调用并返回下一个值。

函数等价于：

def any(iterable):    for element in iterable:        if element:            return True    return False

它与all()函数是一对功能相反的函数，可以简单的记为：all()全真才真，any()全假才假（刚好与与运算和或运算类似）

语法

以下是 any() 方法的语法:

any(iterable)

参数

iterable -- 可迭代的参数，包括.list，tuple，dict、set、str以及生成器生成的iterable对象。

返回值

如果iterable的所有元素都为0、''、False或者iterable为空，all(iterable)返回False，否则返回True；

注意：空元组、空列表，空字符串返回值为False，这里要特别注意。

实例

以下展示了使用 any() 方法的实例：

print(any(['a', 'b', 'c', 'd']))  # 列表list，元素都不为空或0# 返回 Trueprint(any(['a', 'b', '', 'd']))   # 列表list，存在一个为空的元素# 返回Falseprint(any([0, "" , False,None]))         # 列表list，元素都为空或0或False或None# 返回Falseprint(any(('a', 'b', 'c', 'd')))  # 元组tuple，元素都不为空或0# 返回 Trueprint(any(('a', 'b', '', 'd')))   # 元组tuple，存在一个为空的元素#返回 Tureprint(any((0, "" , False,None)))  # 元组tuple，元素都为空或0或False或None# 返回 Falseprint(any("w3cschool001"))        # 字符串也是可迭代对象，可以作为any()的参数# 返回 Trueprint(any('0'))            #字符串的0不算False# 返回 Trueprint(any(''))                   # 空字符串会返回False     # 返回 Falseprint(any([]))             # 空列表# 返回 Falseprint(any(()))            # 空元组# 返回 False

运行结果如下：

TrueTrueFalseTrueTrueFalseTrueTrueFalseFalseFalse

描述

Python dir() 函数不带参数时，返回当前作用域内的所有名称；

带参数时，返回参数的属性、方法列表。

如果对象实现了__dir__()方法，该方法将被调用。

如果对象没有实现__dir__()，该方法将最大限度地收集参数信息。

注意：因为 dir() 主要是为了便于在交互式shell中使用，所以它会试图返回人们感兴趣的名字集合，而不是试图保证结果的严格性或一致性，它具体的行为也可能在不同版本之间改变。
例如，当实参是一个类时，metaclass 的属性不包含在结果列表中。

语法

dir() 语法：

dir(object)

参数说明：

object：对象、变量、模块。

返回值

不带参数时，返回当前作用域中的所有名称。

返回模块的属性和方法列表。

实例

以下实例展示了 dir()在命令行中的使用方法：

>>>dir() # 获得当前模块的属性列表['__builtins__', '__doc__', '__name__', '__package__', 'arr', 'myslice']>>> dir([ ]) # 查看列表的方法['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__delslice__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__getslice__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__setslice__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']>>>

dir()方法也可以使用在代码行内：

print(dir())print(dir([]))

运行结果如下：

['__annotations__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__spec__']['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']

描述

all() 函数用于判断一个列表中的所有元素是否为真（True）。

如果列表中的所有元素都为真（True或者可以转换为True），则返回True，否则返回False

注：元素除了 0、空、None、False 外都算 True。

为了便于理解，上述文本中使用了列表作为可迭代对象的替换。实际上这是片面的，all()函数接受的参数为可迭代的对象（iterable ），也就是说，以下这些类型都可以作为all()的参数：
1.list，tuple，dict、set、str
2.generator，带yield的generator function，统称为iterator。生成器可以使用for可以被next函数调用并返回下一个值。

函数等价于：

def all(iterable):    for element in iterable:        if not element:            return False    return True

它与any()函数是一对功能相反的函数，可以简单的记为：all()全真才真，any()全假才假（刚好与与运算和或运算类似）

语法

以下是 all() 方法的语法:

all(iterable)

参数

iterable -- 可迭代的参数，包括.list，tuple，dict、set、str以及生成器生成的iterable对象。

返回值

如果iterable的所有元素不为0、''、False或者iterable为空，all(iterable)返回True，否则返回False；

注意：空元组、空列表返回值为True，这里要特别注意。

实例

以下展示了使用 all() 方法的实例：

print(all(['a', 'b', 'c', 'd']))  # 列表list，元素都不为空或0# 返回 Trueprint(all(['a', 'b', '', 'd']))   # 列表list，存在一个为空的元素# 返回Falseprint(all([0, 1 , 2, 3]))         # 列表list，存在一个为0的元素# 返回Falseprint(all(('a', 'b', 'c', 'd')))  # 元组tuple，元素都不为空或0# 返回 Trueprint(all(('a', 'b', '', 'd')))   # 元组tuple，存在一个为空的元素#返回 Falseprint(all((0, 1, 2, 3)))          # 元组tuple，存在一个为0的元素# 返回 Falseprint(all(''))                    # 字符串也是可迭代对象，可以作为all()的参数# 返回 Trueprint(all("w3cschool001"))        # 但是字符串中的数字0，空字符串并不算         # 返回 Trueprint(all([]))             # 空列表# 返回 Trueprint(all(()))            # 空元组# 返回 True

运行结果为：

True
False
False
True
False
False
True
True
True
True

描述

Python eval()函数用来执行一条字符串中的python表达式，并返回表达式的值。

简单的说，就是执行一行python代码。

语法

以下是 eval() 方法的语法:

eval(expression[, globals[, locals]])

参数

expression：表达式。
globals：变量作用域，全局命名空间，如果被提供，则必须是一个字典对象。
locals：变量作用域，局部命名空间，如果被提供，可以是任何映射对象。

返回值

返回表达式计算结果。

实例

以下展示了使用 eval() 方法的实例：

>>>x = 7>>> eval( '3 * x' )21>>> eval('pow(2,2)')4>>> eval('2 + 2')4>>> n=81>>> eval("n + 4")85

拓展

将字符串对应的名字的变量转换成该变量对应的值：

>>> x='8'>>> x'8'>>> a=eval(x)>>> a8>>> b='a'     # 等价于b='8'>>> c=eval(b)>>> c8>>>

描述

Python iter() 函数用来生成迭代器。

有些对象（尤其是自定义的对象）可以像数组一样读出数据，但本身不是可迭代对象，这个时候就可以使用iter()将其转换成可迭代对象。

在类中实现了如果只实现__getitem__()的对象可以通过iter()函数转化成迭代器但其本身不是可迭代对象。所以当一个对象能够在for循环中运行时，不能确定是Iterable对象。

语法

iter() 方法的语法有两种，分别是:

iter(object)

和

iter(object, sentinel)

sentinel参数用于指示迭代的停止条件。

参数

object：支持迭代的集合对象（在不传入sentinel参数时）或者可调用的对象（第二种情况）。
sentinel：如果传递了第二个参数，则参数 object 必须是一个可调用的对象（如，函数），此时，iter 创建了一个迭代器对象，每次调用这个迭代器对象的__next__()方法时，都会调用 object。

返回值

迭代器对象。

实例

from typing import Iterableclass LinearDataStructure:    # 一个自己实现的线性表，未传参时默认为1,2,3        def __init__(self, data=[1, 2, 3]):        self.data = data    def get_data(self):        return self.data        def __getitem__(self,idx):        return(self.data[idx])    # 第一种语法lds = LinearDataStructure()print(isinstance(lds,Iterable))  # 这个线性表不是可迭代对象print(isinstance(iter(lds),Iterable)) # 使用iter方法可以把这个线性表变成可迭代对象# 第二种语法def read_until(f, stop):    return iter(lambda: f.readline().strip(), stop)with open('file.txt') as f:    for line in read_until(f, ''):        print(line)

描述

sqrt() 方法返回数字x的平方根。

语法

以下是 sqrt() 方法的语法:

import mathmath.sqrt( x )

注意：sqrt()是不能直接访问的，需要导入 math 模块，通过静态对象调用该方法。

参数

x -- 数值表达式。

返回值

返回数字x的平方根。

实例

以下展示了使用 sqrt() 方法的实例：

#!/usr/bin/python3import math   # 导入 math 模块print ("math.sqrt(100) : ", math.sqrt(100))print ("math.sqrt(7) : ", math.sqrt(7))print ("math.sqrt(math.pi) : ", math.sqrt(math.pi))

以上实例运行后输出结果为：

math.sqrt(100) :  10.0math.sqrt(7) :  2.6457513110645907math.sqrt(math.pi) :  1.7724538509055159

Python urllib 库用于操作网页 URL，并对网页的内容进行抓取处理。

本文主要介绍 Python3 的 urllib。

urllib 包包含以下几个模块：

urllib.request - 打开和读取 URL。
urllib.error - 包含 urllib.request 抛出的异常。
urllib.parse - 解析 URL。
urllib.robotparser - 解析 robots.txt 文件。

urllib.request

urllib.request 定义了一些打开 URL 的函数和类，包含授权验证、重定向、浏览器 cookies等。

urllib.request 可以模拟浏览器的一个请求发起过程。

我们可以使用 urllib.request 的 urlopen 方法来打开一个 URL，语法格式如下：

urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None)

url：url 地址。
data：发送到服务器的其他数据对象，默认为 None。
timeout：设置访问超时时间。
cafile 和 capath：cafile 为 CA 证书， capath 为 CA 证书的路径，使用 HTTPS 需要用到。
cadefault：已经被弃用。
context：ssl.SSLContext类型，用来指定 SSL 设置。

实例如下：

from urllib.request import urlopenmyURL = urlopen("https://www.w3cschool.cn/")print(myURL.read())

以上代码使用 urlopen 打开一个 URL，然后使用 read() 函数获取网页的 HTML 实体代码。

read() 是读取整个网页内容，我们可以指定读取的长度：

from urllib.request import urlopenmyURL = urlopen("https://www.w3cschool.cn/")print(myURL.read(300))

除了 read() 函数外，还包含以下两个读取网页内容的函数：

readline() - 读取文件的一行内容

from urllib.request import urlopenmyURL = urlopen("https://www.w3cschool.cn/")print(myURL.readline()) #读取一行内容

readlines() - 读取文件的全部内容，它会把读取的内容赋值给一个列表变量。

from urllib.request import urlopenmyURL = urlopen("https://www.w3cschool.cn/")lines = myURL.readlines()for line in lines:    print(line)

我们在对网页进行抓取时，经常需要判断网页是否可以正常访问，这里我们就可以使用 getcode() 函数获取网页状态码，返回 200 说明网页正常，返回 404 说明网页不存在:

import urllib.requestmyURL1 = urllib.request.urlopen("https://www.w3cschool.cn/")print(myURL1.getcode())   # 200try:    myURL2 = urllib.request.urlopen("https://www.w3cschool.cn/no.html")except urllib.error.HTTPError as e:    if e.code == 404:        print(404)   # 404

更多网页状态码可以查阅：https://www.w3cschool.cn/http/http-status-codes.html

如果要将抓取的网页保存到本地，可以使用 Python3 File write() 方法函数：

from urllib.request import urlopenmyURL = urlopen("https://www.w3cschool.cn/")f = open("w3cschool_urllib_test.html", "wb")content = myURL.read()  # 读取网页内容f.write(content)f.close()

执行以上代码，在本地就会生成一个 w3cschool_urllib_test.html 文件，里面包含了 https://www.w3cschool.cn/ 网页的内容。

更多Python File 处理，可以参阅：https://www.w3cschool.cn/python3/python3-file-methods.html

URL 的编码与解码可以使用 urllib.request.quote() 与 urllib.request.unquote() 方法：

import urllib.requestencode_url = urllib.request.quote("https://www.w3cschool.cn/")  # 编码print(encode_url)unencode_url = urllib.request.unquote(encode_url)    # 解码print(unencode_url)

输出结果为：

https%3A//www.w3cschool.cn/https://www.w3cschool.cn/

模拟头部信息

我们抓取网页一般需要对 headers（网页头信息）进行模拟，这时候需要使用到 urllib.request.Request 类：

class urllib.request.Request(url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None)

url：url 地址。
data：发送到服务器的其他数据对象，默认为 None。
headers：HTTP 请求的头部信息，字典格式。
origin_req_host：请求的主机地址，IP 或域名。
unverifiable：很少用整个参数，用于设置网页是否需要验证，默认是False。。
method：请求方法，如 GET、POST、DELETE、PUT等。

import urllib.requestimport urllib.parseurl = 'https://www.w3cschool.cn/search?w='  # 编程狮搜索页面keyword = 'Python 教程'key_code = urllib.request.quote(keyword)  # 对请求进行编码url_all = url+key_codeheader = {    'User-Agent':'Mozilla/5.0 (X11; Fedora; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}   #头部信息request = urllib.request.Request(url_all,headers=header)reponse = urllib.request.urlopen(request).read()fh = open("./urllib_test_w3cschool_search.html","wb")    # 将文件写入到当前目录中fh.write(reponse)fh.close()

执行以上 Python 代码，会在当前目录生成 urllib_test_w3cschool_search.html 文件，打开 urllib_test_w3cschool_search.html 文件（可以使用浏览器打开），内容如下：

表单 POST 传递数据，我们先创建一个表单，代码如下，我这里使用了 PHP 代码来获取表单的数据：

<!DOCTYPE html><html><head><meta charset="utf-8"><title>编程狮(w3cschool.cn) urllib POST  测试</title></head><body><form action="" method="post" name="myForm">    Name: <input type="text" name="name"><br>    Tag: <input type="text" name="tag"><br>    <input type="submit" value="提交"></form><hr><?php// 使用 PHP 来获取表单提交的数据，你可以换成其他的if(isset($_POST['name']) && $_POST['tag'] ) {   echo $_POST["name"] . ', ' . $_POST['tag'];}?></body></html>

import urllib.requestimport urllib.parseurl = 'https://www.w3cschool.cn/try/py3/py3_urllib_test.php'  # 提交到表单页面data = {'name':'w3cschool', 'tag' : '编程狮'}   # 提交数据header = {    'User-Agent':'Mozilla/5.0 (X11; Fedora; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'}   #头部信息data = urllib.parse.urlencode(data).encode('utf8')  # 对参数进行编码，解码使用 urllib.parse.urldecoderequest=urllib.request.Request(url, data, header)   # 请求处理reponse=urllib.request.urlopen(request).read()      # 读取结果fh = open("./urllib_test_post_w3cschool.html","wb")    # 将文件写入到当前目录中fh.write(reponse)fh.close()

执行以上代码，会提交表单数据到 py3_urllib_test.php 文件，输出结果写入到 urllib_test_post_w3cschool.html 文件。

打开 urllib_test_post_w3cschool.html 文件（可以使用浏览器打开），显示结果如下：

CFE5A0A5-6E9C-4CBF-B866-0C559F239DF8

urllib.error

urllib.error 模块为 urllib.request 所引发的异常定义了异常类，基础异常类是 URLError。

urllib.error 包含了两个方法，URLError 和 HTTPError。

URLError 是 OSError 的一个子类，用于处理程序在遇到问题时会引发此异常（或其派生的异常），包含的属性 reason 为引发异常的原因。

HTTPError 是 URLError 的一个子类，用于处理特殊 HTTP 错误例如作为认证请求的时候，包含的属性 code 为 HTTP 的状态码， reason 为引发异常的原因，headers 为导致 HTTPError 的特定 HTTP 请求的 HTTP 响应头。

对不存在的网页抓取并处理异常:

import urllib.requestimport urllib.errormyURL1 = urllib.request.urlopen("https://www.w3cschool.cn/")print(myURL1.getcode())   # 200try:    myURL2 = urllib.request.urlopen("https://www.w3cschool.cn/no.html")except urllib.error.HTTPError as e:    if e.code == 404:        print(404)   # 404

urllib.parse

urllib.parse 用于解析 URL，格式如下：

urllib.parse.urlparse(urlstring, scheme='', allow_fragments=True)

urlstring 为字符串的 url 地址，scheme 为协议类型，

allow_fragments 参数为 false，则无法识别片段标识符。相反，它们被解析为路径，参数或查询组件的一部分，并 fragment 在返回值中设置为空字符串。

from urllib.parse import urlparseo = urlparse("https://www.w3cschool.cn/?s=python+%E6%95%99%E7%A8%8B")print(o)

以上实例输出结果为：

ParseResult(scheme='https', netloc='www.w3cschool.cn', path='/', params='', query='s=python+%E6%95%99%E7%A8%8B', fragment='')

从结果可以看出，内容是一个元组，包含 6 个字符串：协议，位置，路径，参数，查询，判断。

我们可以直接读取协议内容：

from urllib.parse import urlparseo = urlparse("https://www.w3cschool.cn/?s=python+%E6%95%99%E7%A8%8B")print(o.scheme)

以上实例输出结果为：

https

完整内容如下：

属性	索引	值	值（如果不存在）
`scheme`	0	URL协议	scheme 参数
`netloc`	1	网络位置部分	空字符串
`path`	2	分层路径	空字符串
`params`	3	最后路径元素的参数	空字符串
`query`	4	查询组件	空字符串
`fragment`	5	片段识别	空字符串
`username`		用户名	`None`
`password`		密码	`None`
`hostname`		主机名（小写）	`None`
`port`		端口号为整数（如果存在）	`None`

urllib.robotparser

urllib.robotparser 用于解析 robots.txt 文件。

robots.txt（统一小写）是一种存放于网站根目录下的 robots 协议，它通常用于告诉搜索引擎对网站的抓取规则。

urllib.robotparser 提供了 RobotFileParser 类，语法如下：

class urllib.robotparser.RobotFileParser(url='')

这个类提供了一些可以读取、解析 robots.txt 文件的方法：

set_url(url) - 设置 robots.txt 文件的 URL。
read() - 读取 robots.txt URL 并将其输入解析器。
parse(lines) - 解析行参数。
can_fetch(useragent, url) - 如果允许 useragent 按照被解析 robots.txt 文件中的规则来获取 url 则返回 True。
mtime() -返回最近一次获取 robots.txt 文件的时间。这适用于需要定期检查 robots.txt 文件更新情况的长时间运行的网页爬虫。
modified() - 将最近一次获取 robots.txt 文件的时间设置为当前时间。
crawl_delay(useragent) -为指定的 useragent 从 robots.txt 返回 Crawl-delay 形参。如果此形参不存在或不适用于指定的 useragent 或者此形参的 robots.txt 条目存在语法错误，则返回 None。
request_rate(useragent) -以 named tuple RequestRate(requests, seconds) 的形式从 robots.txt 返回 Request-rate 形参的内容。如果此形参不存在或不适用于指定的 useragent 或者此形参的 robots.txt 条目存在语法错误，则返回 None。
site_maps() - 以 list() 的形式从 robots.txt 返回 Sitemap 形参的内容。如果此形参不存在或者此形参的 robots.txt 条目存在语法错误，则返回 None。

>>> import urllib.robotparser>>> rp = urllib.robotparser.RobotFileParser()>>> rp.set_url("http://www.musi-cal.com/robots.txt")>>> rp.read()>>> rrate = rp.request_rate("*")>>> rrate.requests3>>> rrate.seconds20>>> rp.crawl_delay("*")6>>> rp.can_fetch("*", "http://www.musi-cal.com/cgi-bin/search?city=San+Francisco")False>>> rp.can_fetch("*", "http://www.musi-cal.com/")True

Python3 log10() 函数

描述

log10() 方法返回以10为基数的x对数，x>0。

语法

以下是 log10() 方法的语法:

import mathmath.log10( x )

注意：log10()是不能直接访问的，需要导入 math 模块，通过静态对象调用该方法。

参数

x -- 数值表达式。

返回值

返回以10为基数的x对数，x>0。

实例

以下展示了使用 log10() 方法的实例：

#!/usr/bin/python3import math   # 导入 math 模块print ("math.log10(100.12) : ", math.log10(100.12))print ("math.log10(100.72) : ", math.log10(100.72))print ("math.log10(119) : ", math.log10(119))print ("math.log10(math.pi) : ", math.log10(math.pi))

以上实例运行后输出结果为：

math.log10(100.12) :  2.0005208409361854math.log10(100.72) :  2.003115717099806math.log10(119) :  2.075546961392531math.log10(math.pi) :  0.4971498726941338

描述

round() 方法返回浮点数x的四舍五入值。

语法

以下是 round() 方法的语法:

round( x [, n]  )

参数

x -- 数值表达式。
n -- 表示从小数点位数，其中 x 需要四舍五入，默认值为 0。

返回值

返回浮点数x的四舍五入值。

实例

以下展示了使用 round() 方法的实例：

#!/usr/bin/python3print ("round(70.23456) : ", round(70.23456))print ("round(56.659,1) : ", round(56.659,1))print ("round(80.264, 2) : ", round(80.264, 2))print ("round(100.000056, 3) : ", round(100.000056, 3))print ("round(-100.000056, 3) : ", round(-100.000056, 3))

以上实例运行后输出结果为：

round(70.23456) :  70round(56.659,1) :  56.7round(80.264, 2) :  80.26round(100.000056, 3) :  100.0round(-100.000056, 3) :  -100.0

描述

math.ulp(x)方法返回给定浮点数的最小单位。

这个单位是指在给定浮点数的范围内，两个相邻的浮点数之间的差值。

例如，对于输入值3.1415926，math.ulp(x)将返回2.220446049250313e-16。

这意味着在3.1415926的范围内，相邻的两个浮点数之间的差值为2.220446049250313e-16。

ULP（Unit in the last place）是计算机科学中的一个误差单位。
我们知道，计算机使用IEEE754的标准来表示浮点数，这个方法与我们现实中使用的小数是有所不同的

语法

math.ulp()方法语法如下：

math.ulp(x)

参数说明：

x -- 必需，一个数字

返回值

如果 x 是 NaN (非数字)，则返回 x。
如果 x 为负数，则返回 ulp(-x)。
如果 x 为正数，则返回 x。
如果 x 等于零，则返回去正规化的可表示最小正浮点数 (小于正规化的最小正浮点数 sys.float_info.min)。
如果 x 等于可表示最大正浮点数，则返回 x 的最低有效比特位的值，使得小于 x 的第一个浮点数为 x - ulp(x)。
在其他情况下 (x 是一个有限的正数)，则返回 x 的最低有效比特位的值，使得大于 x 的第一个浮点数为 x + ulp(x)。

实例

以下实例返回指定数字的：

输出结果：

描述

返回给定的整数参数的最小公倍数。

如果所有参数均非零，则返回值将是为所有参数的整数倍的最小正整数。

如果参数之一为零，则返回值为 0。

不带参数的 lcm() 返回 1。

本函数要求最低版本为Python 3.9

语法

math.lcm() 方法语法如下：

math.lcm(*integers)

参数说明：

integers -- 必需，数字。如果 x 不是一个数字，返回 TypeError。

*表示可以传递多个integers参数

返回值

返回一个整数 int，表示两个或多个整数的最小公倍数(LCM)。

实例

以下实例返回数字的最小公倍数：

#导入math模块import math#输出最小公倍数print (math.lcm(3, 6))print (math.lcm(11, 12))print (math.lcm(0, 36))print (math.lcm(-12, -36))print (math.lcm(5, 12,60))print (math.lcm(12,13,14,15))

输出结果：

6132036605460

描述

modf() 方法返回x的整数部分与小数部分，两部分的数值符号与x相同，整数部分以浮点型表示。

语法

以下是 modf() 方法的语法:

import mathmath.modf( x )

注意：modf()是不能直接访问的，需要导入 math 模块，通过静态对象调用该方法。

参数

x -- 数值表达式。

返回值

返回x的整数部分与小数部分，

实例

以下展示了使用 modf() 方法的实例：

#!/usr/bin/python3import math   # 导入 math 模块print ("math.modf(100.12) : ", math.modf(100.12))print ("math.modf(100.72) : ", math.modf(100.72))print ("math.modf(119) : ", math.modf(119))print ("math.modf(math.pi) : ", math.modf(math.pi))

以上实例运行后输出结果为：

math.modf(100.12) :  (0.12000000000000455, 100.0)math.modf(100.72) :  (0.7199999999999989, 100.0)math.modf(119) :  (0.0, 119.0)math.modf(math.pi) :  (0.14159265358979312, 3.0)