pandas教程:使用read_csv()导入数据
pandas教程:使用read_csv()导入数据 任何数据科学项目的第一步都是导入数据。通常, 你将使用逗号分隔值(CSV)文件中的数据, 并在工作流程的开始就遇到问题。在本教程中, 你将看到如何使用pandas的read_csv()函数...
pandas教程:使用read_csv()导入数据 任何数据科学项目的第一步都是导入数据。通常, 你将使用逗号分隔值(CSV)文件中的数据, 并在工作流程的开始就遇到问题。在本教程中, 你将看到如何使用pandas的read_csv()函数...

本文概述 随机森林算法 该算法如何工作? 优点 缺点 寻找重要特征 随机森林与决策树 使用Scikit学习构建分类器 在Scikit学习中发现重要功能 在选定特征上生成模型 总结 随机森林是一种监督学习算法。它可以用于分类和回归。它也是最灵...
本文概述 什么是模板? 神社简介 了解带有模板的基本渲染 模板继承 使用nbconvert导出Jupyter Notebook 总结 在数据科学中, 你通常需要创建工作报告以显示给决策者或其他非技术人员。将Jupyter Notebook转...

本文概述 启动TensorBoard TensorBoard的不同观点 了解标量可视化的好处 超越标量:直观显示直方图/分布 直方图的分布图 总结 本教程将指导你如何使用TensorBoard, 这是一个了不起的实用程序, 可让你可视化数据...

本文概述 什么是线性回归? 在R中创建线性回归。 系数。 残差 如何测试你的线性模型是否合适? 别忘了看一下残差! 检测影响点。 总结 什么是线性回归? 在R中创建线性回归。 了解系数和残差的概念。 如何测试你的线性模型是否合适? 检测影响...
本文概述 总览 安装 工作区板 连接到数据源 创建一个视图 完善视图 向视图添加过滤器 向视图添加颜色 主要发现 创建地图视图 深入细节 主要发现 创建仪表板 增加互动性 建立故事 结论 Tableau和R Tableau和Python T...
使用日期和时间来分析数据集通常很麻烦。你可以根据自己的情况考虑不同长度的月份, 工作日和周末的不同分布, leap年和可怕的时区。因此, Python具有专门为日期和时间设计的数据类型, 称为datetime。 但是, 在许多数据集中, 你...
本文概述 Excel, 我的老朋友。 认识我的新朋友Python和Pandas 没有更多的无聊图 通过计划和任务自动化节省时间 我最喜欢的工具:Jupyter笔记本 最后的想法 Excel, 我的老朋友。 我是那种只因为我能就可以操作电子表...

本文概述 介绍 决策树的类型 基于树的方法 R中的决策树 总结 假设你正在玩二十个问题游戏。你的对手秘密选择了一个主题, 你必须弄清楚他/她选择了什么。在每个回合中, 你可能会问是或否的问题, 而你的对手必须如实回答。如何从最少的问题中找出...
机器学习是数据科学和人工智能的一种应用, 它使系统无需进行明确编程即可自动从经验中学习和改进。它使用一组可以访问数据并自己学习的算法。在本教程中, 你将使用Python和XGBoost来预测签证申请的最终案件状态。 本教程将向你介绍: 探索...