昇腾数据探险家:挖掘数据的隐藏宝藏

举报
空间案例小助手 发表于 2025/08/22 14:20:07 2025/08/22
【摘要】 本案例选择PyThon随机生成杂乱数据及清洗作为示例,通过实际操作,让大家深入了解如何利用PyThon中预装的库来进行数据清洗。在这个过程中,开发者将学会从数据生成到数据清洗全流程。

案例概述

背景与简介

华为开发者空间是为全球开发者打造的专属云上成长空间,深度整合昇腾AI、鸿蒙、鲲鹏等华为根技术。开发者空间在HDC2025上迎来全面升级,新增AI原生引擎、AI Notebook、鸿蒙云手机、FunctionGraph云函数、Astro低代码等核心能力,并在算力、模型、平台、应用层面实现全方位优化,助力开发者高效完成从编码到调测的全过程,打造智能AI应用开发新体验。

数据清洗(Data Cleansing)是指对数据进行处理和纠错,以去除或修复数据集中存在的错误、不一致、不完整和冗余的数据,从而使数据更加准确、可靠和可用。数据清洗是数据处理和数据分析中一个非常重要的步骤,它可以帮助我们提高数据的质量,从而提高数据分析和机器学习的准确性和可靠性。

案例优势

本案例选择PyThon随机生成杂乱数据及清洗作为示例,通过实际操作,让大家深入了解如何利用PyThon中预装的库来进行数据清洗。在这个过程中,开发者将学会从数据生成到数据清洗全流程。

案例流程

01.png


流程介绍

1. 开发者进入开发者空间配置Notebook环境;

2. 进入Notebook进行数据清洗功能实现。

案例实操:昇腾数据探险家:挖掘数据的隐藏宝藏👈👈👈体验完整版案例,请点击这里。

1. 用户进入开发者空间进行Notebook配置;

2. 编写代码生成随机单词、随机句子,并为文本添加噪音;

3. 编写数据清洗代码,进行杂乱数据清洗及去噪音。

案例最终效果

清洗前:

02.png


清洗后:

03.png


【声明】本内容来自华为云开发者社区博主,不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息,否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。