EasyDataEasyData

清洗任务管理

在这里对数据集中的图片进行去模糊、去近似、旋转、镜像等多种清洗,以及过滤无人脸图片、过滤无人体图片等高级清洗服务,提升数据质量,方便进行下一步的数据标注等操作。

新建清洗任务

  1. 选择数据集版本

选择清洗前后数据集名称及版本时,该数据集版本如果正被用于导入、智能标注、训练、清洗本身、label集图片的删除与更新则不可被选定。

为保证清洗任务顺利进行: 当您的清洗前后数据集版本为两个数据集时,两个数据集版本均会为您保留; 请确保清洗前数据版本中图片个数少于50000张,如您有大规模数据清洗需求,建议通过拆分数据集完成。

image.png

  1. 选择清洗方式

选择清洗方式时,您选择通用清洗方案,同一数据集版本最多可添加三种通用清洗方式;

  1. 具体清洗方式介绍如下:
  • 去近似

根据示例中参考图片,通过拖拽圆点选取对应相似度取值,只会保存相似度高于此值的图片 image.png

  • 去模糊

根据示例中参考图片,通过拖拽圆点选取对应清晰度取值,只会保存清晰度高于此值的图片 image.png

  • 裁剪

在随机图片中通过拖拽裁剪框边缘各点调节框大小,最终针对所有图片只保留框选出区域 image.png

  • 旋转

根据示例中参考图片,通过下拉框选择不同的顺时针旋转角度,最终针对所有图片做旋转操作 image.png

  • 镜像

水平镜像是指将图像的左右部分以图像垂直中轴线为中心进行镜像对换;垂直镜像是指将图像的上下两部分以图像水平中轴线为中心进行镜像对换;中心镜像是指将图像以图像水平中轴线和垂直中轴线的交点为中心进行镜像对换,相当于将图像先后进行水平镜像、垂直镜像。

根据示例中参考图片,通过下拉框选择不同的镜像方式,最终针对所有图片做对应镜像操作 image.png

管理清洗任务

  1. 任务概览

通过列表页展示任务如下字段:任务序号、清洗方式、清洗前后数据集版本、清洗状态、操作 image.png

  1. 查看详情

点击查看任务详情可看到任务开始与完成时间、提交数据量、清洗方式、清洗结果(点击可跳转至清洗后数据集版本详情页) image.png

上一篇
数据管理
下一篇
数据标注