数据标注员基本工作是对、视频、语音、文本、人物、头像、场景、环境等数据内容进行简单地标注并结合需求对相应数据进行快速的整理、分类。
1、语音标注:
语音标注也称为语音转写,顾名思义就是根据要求将所听到的话转写出来。项目分为长语音、短语音、中英混转语音、小语种、方言等等。通常需要根据要求将文字填写出来,这其中需要先根据要求进行截取,截取的时长叫做有效时长。
2、2d拉框:
通常2d拉框做的最多的都是2d障碍物的项目,需要框选的有车辆、行人、锥桶等障碍物。这里面主要注意的是可见性的问题,要分清遮挡和截断的区别,同样的遮挡1/3:,2/3还是完全遮挡这要看具体的项目要求里面的解释。
3、3d点云:
点云成像数据通常是有激光镭射雷达、红外线成像方式在空间中打点成像,这里面包含三维立体数据、肉眼颜色的感官变化等复杂的数据处理。可以理解为通过点的造型透视出所要标注的三维立体物。
数据标注注意事项:
1、图像标注:
在被遮挡的情况下,遮挡部分需要脑补,但是不要脑补到图像外。不遗漏框/打点数,不误标框/打点数,不多标框/打点数。若出现图像较模糊无法标注的则不标。
2、文本标注:
同类标注属性,标注方式要保持一致。在文字标注过程中,由于部分文字间隔近,若同页中有相同的元素,可以考虑隔行标注,避免标注都挤到一起。标注标签的定义要细化到集体场景。
3、语音标注:
确定是否包含有效语音;确定语音的噪声情况;确定说话人数量;确定说话人性别、确定是否有口音、有效语音内容转写。整句话无法分辨出内容的,标为无效;背景噪音过大的,标为无效。
4、3D点云标注:
目标本身须全部被3D框包围,不漏点且不包含噪点。若目标物体边界清晰,则3D框边界距离目标主体真实边界最多不能大于10cm。
本文来自作者[虎钺]投稿,不代表蟒龙号立场,如若转载,请注明出处:https://manglong.com.cn/mangl/601.html
评论列表(4条)
我是蟒龙号的签约作者“虎钺”!
希望本篇文章《数据标注员基本工作是什么》能对你有所帮助!
本站[蟒龙号]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览:数据标注员基本工作是对、视频、语音、文本、人物、头像、场景、环境等数据内容进行简单地标注并结合需求对相应数据进行快速的整理、分类。1、语音标注:语音标注也称为语音转写,顾名思义...