
用Python预测员工流失
本文概述 员工流失分析 探索性分析 聚类分析 建立预测模型 评估模型性能 总结 过去, 大多数人关注”费率”, 例如损耗率和保留率。人力资源经理计算以前的费率, 尝试使用数据仓库工具预测未来的费率。这些比率代表了客户...

本文概述 员工流失分析 探索性分析 聚类分析 建立预测模型 评估模型性能 总结 过去, 大多数人关注”费率”, 例如损耗率和保留率。人力资源经理计算以前的费率, 尝试使用数据仓库工具预测未来的费率。这些比率代表了客户...
本文概述 渐近分析 渐近符号 大O记法, Ο 大Ω符号, Ω 大θ表示法, θ 表示法用于确定各种算法的复杂度 例子 恭喜! 算法的复杂度是算法对于给定大小(n)的输入所需要的时间和/或空间量的度量。虽然算法的复杂度确实取决于特定因素, 例...
本文概述 当苏格兰足球遇上tidyverse 整理时间 在本教程中,我们将使用tidyr、dplyr和ggplot2来可视化一个赛季的足球比分,并研究进球和失球时间的趋势。 当苏格兰足球遇上tidyverse 我整理了当地足球队的一些数据,...

本文概述 Python:核心部分 通过pip管理项目依赖项 虚拟环境:隔离你的项目设置 项目脚手架:使用Cookiecutter很容易! 将它们放在一起:项目开发生命周期 对于开发人员而言, 正确配置其工作站可以简化开发体验。其中包括最佳工...
就像数学中一样, Python之类的编程语言也具有运算符。你可以将它们视为基于计算机科学的极其简单的功能。这些是可以简化计算机程序的最简单的操作。对于任何有抱负的数据科学家或软件工程师来说, 它们都是必不可少的知识。 在本教程中, 你将学习...
本文概述 介绍 基本设定 $ L ^ 2 $平方的平方的导数 $ L ^ 2 $范数的导数 其他注意事项 介绍 线性代数是我们在数据科学中需要的基本数学工具之一。对这些概念有所了解可以增加你对各种算法的理解。这确实是数据科学/机器学习道路的...
本文概述 数据机制缺失 数据清理 聚合图 自旋图和自旋图 马赛克图 平行箱线图 平行坐标图 矩阵图 结论 最后的想法 数据丢失在每个数据科学家的日常工作中都会造成问题。我们应该归咎于他们吗?如果可以, 哪种方法合适?还是可以简单地删除缺少数...
本文概述 什么是集成学习? 使用集成进行模型错误并减少此错误 不同类型的集成学习方法 Python案例研究 集成学习的陷阱 更进一步 大家都知道, 机器学习领域会随着时间的流逝越来越好。预测模型构成了机器学习的核心。模型的精度越高, 模型越...
在本教程中,您将使用列表并学习一种将任意大小的列表划分为给定大小的块的有效方法。 列表是Python中的内置数据结构, 用于存储异构项目并允许对这些项目的有效访问。当程序在单个请求中可以处理的项目数量受到限制时, 将列表分成N个大小的块是一...
本文概述 张量介绍 介绍PyTorch 安装PyTorch 使用PyTorch进行张量算术 使用PyTorch实施简单的神经网络 在深度学习中, 通常会围绕张量作为基石数据结构进行大量讨论。 Tensor甚至以Google旗舰机器学习库的名...