轻松实现颜色与数字的映射:Python 数据处理实战

发布时间:2026/5/22 19:44:09

轻松实现颜色与数字的映射:Python 数据处理实战 在数据分析与日常数据处理中我们经常需要将文本信息转换为数值型数据尤其在颜色编码、分类标签等场景中尤为常见。今天我将分享一个简单实用的 Python 示例演示如何利用pandas库将颜色名称映射为对应的数字并将结果保存为 Excel 文件。1. 定义颜色到数字的映射关系首先我们需要建立一个字典明确每种颜色对应的数字编号。以下是一个示例映射可根据实际需求扩展color_to_num{经典黑:1,气质蓝:2,橙:6,# 其他颜色映射...}2. 读取 Excel 文件接着使用pandas读取包含颜色数据的 Excel 文件。请确保文件路径正确且文件中包含名为“源数据”的列importpandasaspd excel_pathsource_data.xlsx# 可根据实际路径修改dfpd.read_excel(excel_path)3. 将颜色字符串转换为数字串我们定义一个函数colors_to_numbers用于处理“源数据”列中的颜色字符串以中文逗号分隔将其逐一映射为数字并拼接成逗号分隔的数字串defcolors_to_numbers(color_str):colors[c.strip()forcincolor_str.split()]# 按中文逗号分割numbers[str(color_to_num.get(c,?))forcincolors]# 未知颜色标记为 ?return,.join(numbers)df[模拟结果]df[源数据].apply(colors_to_numbers)4. 输出处理结果处理完成后可以在控制台直接查看转换后的数据便于快速验证print(处理后的结果)print(df)5. 保存为新的 Excel 文件最后将包含原始数据与转换结果的 DataFrame 保存为新的 Excel 文件以便后续分析或分享output_pathresult_with_mapping.xlsxdf.to_excel(output_path,indexFalse)print(f\n已保存结果至{output_path})总结通过这个简单的示例我们学会了如何借助 Python 和pandas库将颜色名称字符串映射为对应的数字串并输出为 Excel 文件。这种方法在实际数据处理中非常实用尤其适用于需要将分类文本如颜色、标签等转换为数值以便进一步分析的场景。如果你有任何疑问或者希望了解其他数据处理主题欢迎在评论区留言。让我们一起在数据学习的道路上不断进步全部实现源代码importpandasaspd# 1. 定义颜色到数字的映射字典color_to_num{经典黑:1,气质蓝:2,橙:6,浪漫红:3,贵族金:4,蓝色:2,黑色:1,金色:4,米白色:5,酒红色:3,洋红:3,白:5,黑:1,蓝:2,红:3,雪白:5,玫瑰金:4,天际蓝:2,活力橙:6,黄金:4,金黄色:4,鱼肚白:5,白花花:5,红色的:3,大红色的:3,纯白色:5,灰白:5}# 2. 读取Excel文件请确保文件路径正确且包含“源数据”列excel_pathsource_data.xlsx# 可以修改为实际文件路径dfpd.read_excel(excel_path)# 3. 将“源数据”列中的颜色字符串转换为数字串defcolors_to_numbers(color_str):colors[c.strip()forcincolor_str.split()]# 中文逗号分割numbers[str(color_to_num.get(c,?))forcincolors]return,.join(numbers)df[模拟结果]df[源数据].apply(colors_to_numbers)# 4. 输出最终结果print(处理后的结果)print(df)# 5. 可选保存为新Excel文件output_pathresult_with_mapping.xlsxdf.to_excel(output_path,indexFalse)print(f\n已保存结果至{output_path})

相关新闻