Python数据分析与应用-Python数据分析与应用PDF内部全数据版

我给大家带来了一本与Python数据相关的电子书资源,里面介绍了关于Python的内容。本书由人民邮电出版社出版,格式为PDF,资源大小为281 MB,张编译。目前豆瓣、亚马逊、当当、JD.COM等电子书的综合评分为7.8分。

内容介绍

目录

第1章Python数据分析概述1

任务1.1了解数据分析1

1.1.1掌握数据分析的概念2

1.1.2掌握数据分析的流程2

1.1.3了解数据分析应用场景4

任务1.2熟悉Python数据分析工具5

1.2.1了解数据分析常用工具6

1.2.2了解Python数据分析的优势7

1.2.3了解Python数据分析常用类库7

任务1.3安装Python的Anaconda版本9

1.3.1了解Python的Anaconda第9版

1.3.2在Windows系统中安装Anaconda 9

1.3.3在Linux系统中安装Anaconda 12。

任务1.4掌握Jupyter笔记本14的常用功能

掌握木星笔记本的基本功能14

1.4.2掌握Jupiter记事本的高级功能16

汇总19

课后练习19

第二章NumPy数值计算基础21

任务2.1控制NumPy数组对象ndarray 21

创建一个数组对象21

2.1.2生成随机数27

2.1.3按索引访问数组29

2.1.4转换数组的形式31

任务2.2掌握NumPy矩阵和一般函数34

2.2.1创建NumPy矩阵34

2.2.2掌握ufunc功能37

任务2.3使用NumPy 41进行统计分析

2.3.1读/写文件41

2.3.2使用函数的简单统计分析44

任务实现48

概要50

培训50

练习1创建一个数组并执行操作50

练习2创建棋盘50

课后练习51

第3章Matplotlib数据可视化基础52

任务3.1掌握基本语法和制图52的常用参数

3.1.1掌握pyplot 53的基本语法

3.1.2设置pyplot 56的动态rc参数

任务3.2分析特征之间的关系59

绘制散点图59

3.2.2绘制折线图62

任务实现65

任务3.3分析内部数据分布和特征分散68

3.3.1绘制直方图68

3.3.2绘制饼图70

3.3.3画出方框图71

任务实现73

概要77

培训78

训练1分析1996 2015人口数据特征78

练习2分析1996到2015人口数据的各种特征的分布和离散。

课后练习79

第4章熊猫统计分析基础80页

任务4.1从不同数据源读取/写入数据80

4.1.1读/写数据库数据80

4.1.2读/写文本文件83

4.1.3读/写Excel文件87

4.1.4任务实现88

任务4.2掌握数据帧89的常见操作

查看数据帧89的共同属性

4.2.2检查、修改、添加和删除数据帧数据91。

4.2.3描述和分析数据帧101。

4.2.4任务实现104

任务4.3转换和处理时间序列数据107

4.3.1转换字符串的时间是107。

4.3.2提取时间序列数据信息109

4.3.3加减时间数据110

4.3.4任务实现111

任务4.4使用组聚合进行组内计算113

4.4.1使用groupby方法拆分数据114。

4.4.2使用聚集方法聚集数据116。

4.4.3通过应用方法聚合数据119。

4.4.4使用转换方法121聚合数据。

4.4.5任务实现121

任务4.5创建数据透视表和交叉表123

4.5.1使用pivot_table函数创建透视表123。

4.5.2使用交叉表函数创建交叉表127。

4.5.3任务实现128

汇总130

培训130

培训1阅读查看P2P网贷数据主表基本信息130

在练习2中,提取用户信息更新表和登录信息表的时间信息130。

在练习3中,通过分组聚集方法进一步分析用户信息更新表和登录信息表131。

在练习4中,用户信息更新表和登录信息表被转换为长表和短表131。

课后锻炼131

第5章使用pandas进行数据预处理133

任务5.1合并数据133

5.1.1堆叠合并数据133

5.1.2主键合并数据136

5.1.3合并数据重叠139

5.1.4任务实现140

任务5.2清理数据141

5.2.1重复值的检测和处理

5.2.2缺失值的检测和处理146

5.2.3异常值的检测和处理149

5.2.4任务实现152

任务5.3标准化数据154

5.3.1偏差标准化数据154

5.3.2标准偏差标准化数据155

5.3.3十进制校准标准化数据156

5.3.4任务实现157

任务5.4转换数据158

5.4.1虚拟变量处理类别数据158

5.4.2离散连续数据160

5.4.3任务实现162

汇总163

培训164

训练1内插用户用电数据缺失值164

练习2合并线损、用电趋势和线路告警数据164

训练3标准化建模专家样本数据164

课后练习165

第6章使用scikit-learn构建模型167。

任务6.1用sklearn转换器处理数据167。

6.1.1在数据集模块中加载数据集167。

6.1.2将数据集分为训练集和测试集170。

6.1.3使用sklearn converter65438进行数据预处理和降维172

6.1.4任务实现174

任务6.2构建和评估聚类模型176

6.2.1使用sklearn估计器建立聚类模型176。

6.2.2评估集群模型179

6.2.3任务实现182

任务6.3建立和评估分类模型183

6.3.1使用sklearn估计器建立分类模型183。

6.3.2评价分类模型186

6.3.3任务实现188

任务6.4建立并评估回归模型190

6.4.1使用sklearn估计量建立线性回归模型190。

6.4.2评估回归模型193

6.4.3任务实现194

汇总196

培训196

训练1使用sklearn处理葡萄酒和葡萄酒_质量数据集196。

练习2:基于葡萄酒数据集196构建K-Means聚类模型。

练习3:基于葡萄酒数据集197构建SVM分类模型。

练习4:基于wine_quality数据集197建立回归模型。

课后练习198

第七章航空公司客户价值分析199

任务7.1了解航空公司现状和客户价值分析199

7.1.1了解航空公司现状200

7.1.2了解客户价值分析201

7.1.3熟悉航空客户价值分析的步骤和流程201

任务7.2预处理航空公司客户数据202

7.2.1处理缺失数据和异常数据202

7.2.2建立航空客户价值分析的关键特征202

7.2.3标准化LRFMC模型206的五个特征

任务实现207

任务7.3使用K均值算法进行客户分组209

7.3.1了解K均值聚类算法209

7.3.2聚类结果分析210

7.3.3模型应用213

7.3.4任务实现214

汇总215

培训215

培训1处理信用卡数据异常值215

练习2构建信用卡客户风险评估的关键特征217

练习3构建K均值聚类模型218

课后练习218

第八章财政收入预测与分析220页

任务8.1了解财政收入预测的背景和方法220

8.1.1财政收入预测背景分析220

8.1.2理解财政收入预测的方法222

8.1.3熟悉财政收入预测的步骤和流程223

任务8.2分析财政收入数据特征的相关性223

8.2.1理解相关性分析223

计算结果的分析224

任务实现225

任务8.3使用Lasso回归选择财政收入预测的关键特征225

8.3.1理解拉索回归法226

8 . 3 . 2 Lasso回归结果分析227

8.3.3任务实现

任务8.4使用灰色预测和支持向量回归构建财政收入预测模型228

理解灰色预测算法228

8.4.2理解SVR算法229

8.4.3分析和预测结果232

任务实现234

概要236

培训236

练习1求企业所得税特征之间的相关系数236

练习2选择企业所得税预测的关键特性237

练习3:构建企业所得税预测模型237

课后练习237

第九章家用热水器用户行为分析和事件识别239

任务9.1了解家用热水器用户行为分析的背景和步骤239

9.1.1国内热水器行业现状分析240

9.1.2了解热水器240采集数据的基本情况

9.1.3熟悉家用热水器用户行为分析的步骤和流程241

任务9.2预处理热水器用户的用水量数据242

删除多余的特征242

9.2.2划分用水事件243

9.2.3确定单次用水事件的持续时间阈值244

任务实现246

任务9.3构建用水行为特征和筛选用水事件247

9.3.1施工用水持续时间和频率特征248

9.3.2施工用水量及波动特征249

9.3.3筛选候选游泳项目250

9.3.4任务实现251

任务9.4为行为事件分析建立BP神经网络模型255

9.4.1了解BP神经网络算法的原理255

9.4.2建筑模型259

9.4.3评估模型260

任务实现260

概要263

培训263

培训1清洁操作员客户数据263

练习2筛选客户操作员数据264

练习3建立神经网络预测模型265

课后练习265

附录A 267

附录B 270

参考文件295

学习笔记

Jupyter Notebook(原名IPython notebook)是一款交互式笔记本,支持运行40多种编程语言。Jupyter Notebook的本质是一个Web应用,方便创作和* * *享受文学程序文档,支持实时代码、数学方程、可视化和markdown。用途包括:数据清洗和转换、数值模拟、统计建模、机器学习等。定义(推荐学习:Python视频教程)用户可以通过电子邮件、Dropbox、GitHub、Jupyter笔记本查看器与他人分享Jupiter笔记本。在Jupyter Notebook中,代码可以实时生成图像、视频、LaTeX和JavaScript。数据挖掘领域最火的竞赛Kaggle中的数据是Jupyter格式的。架构Jupiter组件Jupiter包含以下组件:Jupyter笔记本和...

本文给出了一个用Python实现的微信好友数据分析功能的例子。分享给大家,供大家参考,如下:这里主要用python对个人微信好友进行分析,并将结果输出到一个html文档中。主要使用的python包有itchat,pandas,pyecharts等1,安装itchat微信的python sdk,获取个人友情。得到的代码如下:import itchat import panda as PD from pye charts import geo,barit chat . log in()friends = it chat . get _ friends(update = True)[0:]def User 2 dict(User):User _ dict = { } User _ dict[" NickName "]= User[" NickName "]if User[" NickName "]else " NaN " User _ dict[" City "]= User[" City "]if User[" City "]else " NaN " User _ dict[" Sex "]= User[" Sex "]if

基于微信开放个人号接口的python库Itchat,实现了微信好友的获取,并对省份、性别、微信签名进行数据分析。效果:直接编码,构建三个空文本文件:stopwords.txt、newdit.txt、unionWords.txt,下载字体simhei.ttf或者删除字体所需的代码,就可以直接运行了。# wx friends . py 2065 438+08-07-09 import itchat import sys import pandas as PD import matplotlib . py plot as PLT PLT . rcparams[' font . sans-serif ']=[' sim hei ']# Chinese PLT . rcparams[' axes . unicode _ MINUS ']= false #绘制时可以显示。中国进口。可能是来自scipy的赝品。误导入imread from word cloud导入wordcloud from osimport路径#画图时会显示。解决编码问题non _ BMP _ map = dict . from keys(range(0x 10000,sys.maxunicode+1),0xfffd) # Get friends信息def get friends():...

一个双色球的例子,用于Python数据分析,基于线性回归算法预测下次中奖结果

本文以Python数据分析为例,基于线性回归算法预测下一次中奖结果。我分享给你,供你参考。具体如下:我已经描述了关于双色球的各种算法。在这里,我来预测下一期双色球的号码。想想都有点激动。代码中使用了线性回归算法。这个场景用的就是这个算法,预测效果一般。可以考虑用其他算法试试结果。我发现以前很多代码都是重复性的工作。为了让代码看起来更优雅,我定义了一个函数,调用它,突然就高大上了#!/usr/bin/python# -*-编码:UTF-8 -*-#导入所需的包导入熊猫as PD导入numpy as NP导入mapplotlib.py plot as PLT导入运算符从sklearn导入数据集,从sklearn.linear _ model导入逻辑回归#读取文件d...

以上就是这次介绍的Python数据电子书的所有相关内容。希望我们整理的资源可以帮助到大家,感谢大家对鬼鬼的支持。

注意:访问方法:私人消息(666)