2025 年数据科学家需要掌握的前 12 项技能

发布时间:2026/5/31 23:17:29

2025 年数据科学家需要掌握的前 12 项技能 原文towardsdatascience.com/top-12-skills-data-scientists-need-to-succeed-in-2025-c80f54cf227ahttps://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/84ee1217703fe5315e9043ada935300c.png来源作者制作由 Claude 协助。2025 年 AI 领域的进展速度比火箭还要快而且保持领先变得越来越困难你会保持当前职位被雇佣晋升还是被解雇这取决于你以及你适应变化的速度有多快。这并不是说如果你不适应你就会灭亡。许多事情在变化但其他事情并没有。理解哪些变化需要你关注是成功的关键。是的新的 AI 革命正在经济的大规模领域迅速传播带来了大量新工具来提高生产力和自动化许多任务。如果你去年感到不知所措那么就准备好再次系好安全带享受另一场刺激的旅程吧。那么你应该如何应对这股不断加速的 AI 炒作和工具的浪潮通过关注重要的事情。尽管 AI 工具非常闪亮且强大但真正能帮助你事业成功的许多技能在过去几十年甚至几千年里变化并不大我将引导你了解作为数据科学家、机器学习工程师或应用科学家在 2025 年成功所需的 12 项关键技能。从永恒的能力到新兴技术我将提供实用的例子和资源帮助你开始并发展每一项技能。换句话说这篇文章将成为你在 2025 年提升自己的一站式商店。在我们开始之前2025 年数据科学家会做什么嗯这取决于。首先我将对处理数据、机器学习、深度学习和生成 AI 模型的角色松散地使用“数据科学家”这个术语。然而此类角色的其他名称还包括机器学习工程师、应用科学家、算法开发人员等等。那么在这些角色中你应该期待什么嗯我已经审查了 500 多个职位描述中列出的职责以下是我的发现数据科学家前五项职责**数据与建模**处理和工程大规模数据集。利用统计学和数据分析。构建、训练和评估机器学习模型包括 LLMs、计算机视觉、表格数据、时间序列、音频和推荐系统。开发生成 AI 应用程序和工作流程。**研究与开发**构建内部工具。进行文献综述。紧跟最新发展。从 POC 到部署拥有项目。**基础设施设计与开发**设计基于云的模型服务基础设施。构建数据、训练和推理管道。性能与监控定义并跟踪成功指标。构建仪表板和监控工具。确保模型在大规模下的可靠性。协作与沟通向利益相关者和客户展示。与团队成员分享知识。跨不同团队工作。那么有多少人工智能炒作的内容被包含在这些职位描述中没有你想象的那么多。利用这一点选择你想要成长的特定领域但永远不要忘记你的根基。那么2025 年最重要的技能是什么https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/e928936e2badb949e6234dae77050f7f.png来源作者使用 Dall E 3 创建的图片1. 沟通技巧没有人知道你在做什么你在想什么。你有什么想要的东西吗你有任何问题吗你卡住了吗你有什么问题吗不要保留说出来。如果你没有要求你为什么要得到你想要的东西有效地沟通你的问题、问题、想法、结果和结论对于在数据科学领域取得成功以及一般性地提高生产力至关重要。我知道有时提出愚蠢的、“笨拙”的或天真的问题可能会让人感到尴尬。然而根据我的经验那些经常提出“愚蠢”问题的人会更快地取得进步。这是因为他们学得更快创造价值更快并且能够获得宝贵的联系和信任。我个人喜欢问“愚蠢”和“琐碎”的问题比如“什么是错误”。这几乎总是会让人们停下来质疑他们最基本的前提通常会导致对项目和问题的更好理解同时改善团队成员之间的沟通。掌控你的职业生涯打断你的朋友提出你的问题。他们会因此更加尊重你。你越练习沟通你的需求、想法和观点你在这一方面的能力就会越强——不仅是在你的职业生涯中而且在生活中也是如此。你应该练习什么解释技术内容尝试将你所做或刚刚学到的东西解释给你的非技术朋友或家人。使用 [ELI5 技术](https://blog.groovehq.com/the-eli5-technique#:~:textThe%20ELI5%20(explain%20it%20like,treat%20your%20customers%20like%20children)(解释得像五岁孩子一样)并先从业务影响开始然后再深入细节。讲故事为你想要讲述的故事创建一个叙述。创建引人入胜的可视化或演示来支持你的故事。你可以使用 渐进式披露原则 或 金字塔原理后者则是反向操作。与利益相关者沟通利益相关者没有空闲时间。他们想要快速、简洁的信息。练习底线前置BLUF和红/黄/绿RAG技术来传达你的信息。书面沟通使用BLUF和RAG然后总结已经完成的工作、接下来要做什么以及阻碍进展的因素。在记录你的工作时关注问题、方法、可重复性和可访问性。避免陷阱在说话之前先思考不要无结构地闲聊避免用技术细节或行话压倒人最后不要拖延等待太久才沟通有比什么都不做更好的沟通方式。你在哪里可以练习有很多机会可以寻找尝试向同事、朋友或家人解释你的工作。通过电子邮件或你的消息应用发送频繁的状态更新。自愿在团队会议或会议上进行演示。加入或创建一个期刊俱乐部来练习讨论技术论文。你也可以对你的离线沟通和演示寻求反馈。创建一个博客或为技术文档做出贡献以改善你的离线沟通。机会无限你只需要去寻找它们2. 编程技能Python没错Python 排名第二。在沟通之后我不需要告诉你核心编程技能对于数据科学家来说非常重要。作为数据科学家你需要一种像Python这样的脚本语言来完成你需要做的事情从数据抓取、提取、操作和分析到开发自定义模型及其训练、评估、推理流程部署服务以及构建交互式应用程序。你需要的不仅仅是机器学习相关的库。这是列表中的第 6 项。熟悉你在 Python 中能做的全部范围。尽量熟悉Python 标准库中的所有内置模块。它提供了大量的超级有用的工具这将扩展你对 Python 能做什么的视野。例如dataclasses是管理通过对象传递的数据的非常有用的工具。这个例子展示了某个模型目标检测器的输出被传递到第二个模型姿态估计器。

相关新闻