个性化阅读
专注于IT技术分析

标签:数据科学

第14页
Python

使用Python进行网页爬取

半瓶木阅读(1104)评论(0)赞(0)

Web抓取是一个术语, 用于描述使用程序或算法从Web提取和处理大量数据的过程。无论你是数据科学家, 工程师, 还是任何分析大量数据集的人员, 从网络中抓取数据的能力都是一项有用的技能。假设你是从网络上找到数据的, 没有直接下载的方法, 使...

Python

Python列表index()用法

半瓶木阅读(3257)评论(0)赞(0)

本文概述 列表 索引 结束! 数据结构是一种组织和存储数据的方法, 可实现高效的访问和修改。列表是一种数据结构, 用于存储异构项目的集合。列表是内置的数据结构。 Python还提供了许多可用于处理列表的函数或方法。在本教程中, 你将专门学习...

R中的层次聚类-srcmini
R编程

R中的层次聚类

半瓶木阅读(1354)评论(0)赞(0)

本文概述 集群的预处理操作 树状图 衡量集群的优势 在本教程中, 你将学习在R中的数据集上执行分层聚类。更具体地说, 你将了解: 什么是群集, 何时使用群集及其类型。 如何预处理你的数据。 层次聚类算法的工作详细。 如何执行聚类分析。 与k...

Python

在Python中使用模块

半瓶木阅读(1070)评论(0)赞(0)

本文概述 from..import语句 from.. import *语句 重命名导入的模块 作为一个初学者, 你开始在解释器上使用Python, 稍后在需要编写更长的程序时, 就开始编写脚本。随着程序大小的增加, 你可能需要将其拆分为多个...

如何在SQL中执行Python/R-srcmini
Python

如何在SQL中执行Python/R

半瓶木阅读(1010)评论(0)赞(0)

你是否知道可以在T-SQL语句中编写R和Python代码? SQL Server中的机器学习服务消除了数据移动的需要。你可以在数据库中执行R/Python代码, 而不必通过网络传输大型敏感数据或丢失示例csv文件的准确性。使用SQL存储过程...

Python

图像超分辨率使用多解码器框架

半瓶木阅读(1216)评论(0)赞(0)

本文概述 导入模块 了解脑MRI 3T和7T数据集 定义初始化器 加载数据 数据预处理 合并连接 多解码器 损失函数 模型定义与编译 训练模型 测试验证数据 保存输入, 地面真相和解码:定量结果 导入模块 了解脑MRI 3T和7T数据集 定...

Python

使用Python和BeautifulSoup 4抓取Reddit

半瓶木阅读(2934)评论(0)赞(0)

本文概述 什么是网络爬虫? 先决条件 第一步 获取页面 寻找我们的标签 查找我们的信息 提取我们的信息 将结果写入CSV 移至下一页 负责任地刮 接下来是什么? 相关课程 你可以找到我们将在此处编写的脚本的完整示例。 什么是网络爬虫? 对,...

R编程

R中的双变量分布热图

半瓶木阅读(2175)评论(0)赞(0)

本文概述 教程目标 自行车共享数据集 功能选择 直方图 将双变量分布拟合到你的数据 热图 总结 作为数据科学家, 你将必须分析数据集中要素的分布。通常, 这是通过使用直方图完成的, 这对于显示值的可变范围, 其偏差以及值集中的位置非常有用。...

使用Scikit学习进行KNN分类-srcmini
Python

使用Scikit学习进行KNN分类

半瓶木阅读(1509)评论(0)赞(0)

本文概述 K最近邻 KNN算法如何工作? 渴望与懒惰的学习者 维度诅咒 你如何确定KNN中的邻数量? Scikit-learn中的分类器构建 优点 缺点 如何改善KNN? 总结 K最近邻(K Nearest Neighbor, KNN)是一...