丝袜 龟责
你的位置:av收藏家 > 丝袜 龟责 > 人妖 AI时间的“富士康”,数据标注行业也能滋长千亿独角兽?【AI众人课3.2】
人妖 AI时间的“富士康”,数据标注行业也能滋长千亿独角兽?【AI众人课3.2】

发布日期:2025-03-24 04:44    点击次数:127

人妖 AI时间的“富士康”,数据标注行业也能滋长千亿独角兽?【AI众人课3.2】

人体艺术本期内容

数据对AI的用功性正在发生变化。除了文本数据,跟着多模态大模子的兴起,所需的数据种类变得愈加种种化。现时不仅包括网页和APP数据,还有来自麦克风、扬声器、屏幕、手写笔、录像头和传感器等的数据——这些多模态数据的惩办难度加大,需要将它们鼎新成妥洽对皆的阵势以供考验使用,同期还要向上不同的时域,妥洽不同技巧的数据,条目越来越严格。是以,这个行业内容上才刚刚初始。

在数据方面,除了界说和多模态惩办,大模子的标注使命也相等用功。这包括大模子的领导标注和泛化,需要有东谈主去再行表述问题,进行标注。这等于所谓的“有若干东谈主工,就有若干智能”,触及多话语文本标注和图像视频标注。

跟着大模子的发展人妖,标注的难度大幅提高,图像和语音识别都集聚在大模子中,不再像曩昔那么容易。因此,高质料的数据变得尤为用功,大公司也初始减少外包,转而我方进行数据标注。

数据标注的顺次也在不断立异,终点是在智能汽车行业,现时更多的是惩办三维激光雷达扫描来的数据,然后进行标注。有些情况下,还会自动生成这些三维数据,因为不行能有那么多车辆去内容跑路。在某些专科限制,标注使命需要专科常识,比如医疗影像数据的标注,不是应对一个东谈主就能作念到的,而是需要三甲病院10年以上教会的大夫来进行。

以科大讯飞的讯飞医疗为例,它很早与协和病院等顶级医疗机构配合,共同进行数据标注使命。别的公司再牛,OpenAI再是非,算法模子再是非,也弄不到这些数据。比及考验好了后,它就终点于一个十年以上的大夫作念医疗会诊。

因此,专科限制的数据标注成为了垂直大模子的门槛,因为这些数据经常唯一特定机构概况得到,从而造成了行业的完全旁边,成为信得过的护城河。

以上内容为「寻找下一个“英伟达”」课程第3章第2节的部天职容,吕伟老诚将在本节课程的后续内容中,联接更多公司实例教师AI数据阛阓的布局与发展长进。对本专辑感趣味的一又友,接待点击此处加入,学习本课程的好意思满内容。