格物钛:数据管理的黑魔法,从孤岛到金矿
如果要问企业中最多的东西是什么,那答案毫无疑问是数据,数据,数据!在一个企业内部,数据往往随着团队和组织不同,分散在各个角落,很多数据都以数据孤岛的形式存在,在组织内部流动困难。同时,由于每个工程师的使用习惯不同,对于同一种标注的数据也缺乏统一的标准,不同的数据都以不同的组织方式和文件格式存储,导致在团队协作拉取数据时,对于数据的筛选与合并都需要大量的格式理解、编码与转换的时间。
在此背景下,很多企业花费了很大精力和成本采集并存储下来的数据,在使用过一次之后,逐渐变成难以再被挖掘和用于其他场景的“暗数据(Dark Data)。根据IBM的一项研究表明,在2020年,已经有93%的数据都是暗数据和非结构化数据。如何在庞大的数据海洋中找到那些高价值的数据,成为了大多数企业在当下需要面临的一个新挑战。
为了解决此问题,格物钛创新提出了“发现高价值数据”的行业解决方案,通过统一管理原始数据、元数据、标注数据和预测结果数据等,并可以自由组合筛选维度、可视化筛选结果,帮助AI开发者快速找到最符合场景的数据。
使用格物钛数据管理平台,开发者可以自由组合添加筛选条件,其中包含数据的基本信息,如名称、大小等;数据标注信息,如“下雨天气”、“被遮挡住的汽车”;还能添加数据评估信息如“IoU<0.7”。通过自由的条件组合,帮助AI开发者快速定位到所需的数据。
不仅如此,格物钛还提供了一套高扩展性的多维度筛选表格,可以自动记录数据处理过程中的信息,如预标注、评估结果等,助力用户获取更多的筛选条件。
此外,格物钛还提供了一套在线可用的交互性数据可视化工具-Pharos,兼容图片、3D点云、语音、文本和视频的主流数据格式,并且包含2D矩形框、语义分割、多边形、折线、关键点以及3D点云框等多种标注格式,支持多种方式查看数据标签与属性等信息的分布情况,帮助您快速掌握数据集的细节。
通过自由组合筛选条件,高扩展性的多维度筛选表格,在线可视化交互性数据工具,格物钛助力企业将数据孤岛转变成数据金矿,挖掘企业数据的更多可能性。