python学习第十三天(自用)

发布时间:2026/6/3 0:34:04

python学习第十三天(自用) 数据清洗查看缺失值若有缺失就是True,isnull()删除缺失值索引为4的结果消失了删除缺失值所在行,dropna删除缺失值所在列所在城市这一列直接消失了,dropna填充缺失值指定填充值,fillna用前一行数据填充,ffill用后一行数据填充‘,bfill查看重复值,duplicated指定列查看重复值duplicated,subset用来指定列根据目标列删除重复值,drop_duplicates,默认保留第一个重复值Keep表示保留哪一个值first/last/false第一个/最后一个/全都删了异常值处理可以看到单价有-29的属于异常数据查看异常值就是过滤删除异常值传入索引以删除目标值可以看到索引为6的值消失了,drop(.index)修复异常值这里取绝对值来修改结果数据格式处理看到这里的订单日期与正常格式不同需要处理格式这里的replace是整体替换没办法这样局部替换因此可以利用series的str方法将这列转为字符串然后利用字符串的replace方法来替换,会统一的进行替换发现替换成功数据排序与分组排序sort_values,ascending表示升序多列排序列表与列表之间一一对应只有前一个值完全相同才会按照后面的进行排序数据分组操作将数据按照不同的特征进行分组其中想要一次性进行分组操作可以使用agg来进行统一操作groupby就是将目标内容分组统计行数即按目标列统计个数count指定目标列选择没有缺失值的列才能统计正确随便选哪列都可以因为是统计数量只要没有缺失值那么都是一样的统计内容和sum将相同的内容的目标值进行累加计算综合运用统计金额数先添加新的列然后再统计累加统计最小值min统计最大值max统计平均值mean综合agg将要统计的目标填入agg里以列表的形式填入返回的表格将会按照你填的内容进行排版统计多列的内容以字典的形式传入Matplotlib介绍将我们统计好的数据进行可视化的转化的工具就是画图工具绘制折线图x要和y一一对应Matplotlib图标详情上述的名词介绍也就对应了方法设置画布figure一定要在plot之前设置画布因为plot会默认给你生成画布你在后面生成则会生成一个新的画布标题设置title也可以设置字体大小其中要设置中文题目还要配置好项目否则就是乱码设置x轴标签y轴标签X轴刻度较为稀疏没办法详细看具体数据因此可以设置刻度xtick也可以隔一个刻度展示一下因为x是列表所以可以进行切片操作设置y的刻度绘制网格线grid也可以自定义表格样式绘制双折线就是再创建一个y轴数据然后再绘制即可显示图例就是给线标上名字让人知道哪条是哪条线但这样是一一对应显示的就是第一个创建的对应第一个修改起来很麻烦推荐方法为曲线加上标签label以便于区分并且legend也无需指定内容图例可以指定位置legend具有loc方法可以改变位置柱状图创建子图就是创建两个图nrows代表行1就是1行如果为2那么就是相当于在中间砍一刀然后均分。ncols代表列这里2表示2列就是竖着切一刀然后axes接收到的是返回的数组因此访问不同的图可以利用列表的访问形式来访问其中bar就是柱状图pie就是饼状图Dpi是像素值子图的设置添加数据设置图表属性

相关新闻