【资料图】
中国青年报客户端讯(李争艳 中青报·中青网记者 任明超)日前,位于海南省海口市的大模型数据标注基地正式启动运营,数百名大模型标注师来自全国各高校,都是本科学历。 大模型数据标注基地是百度智能云(海口)人工智能基础数据产业基地的一部分,海口市秀英区委常委、常务副区长石晟屹表示,人工智能技术数据产业基地落成不到一年,已经带动近千名大学生就业,对培育本地的数字经济人才做出了贡献。 据介绍,当前,大模型正处在产业落地前期,高质量的数据是大模型实现产业化的关键要素。对于以ChatGPT、文心一言为代表的生成式AI,海量的数据训练、人工标注、指令微调、基于人类反馈的强化学习,可以让大模型与人类价值观、思维方式不断对齐,使大模型更加可用。 百度智能云有关负责人表示,公司目前已经在全国与多地政府合作,共建十多个数据标注基地,累计提供超过1.1万个稳定就业岗位,间接带动5万人就业。 “和传统的数据标注师要求不同,大模型标注师都需要本科以上学历,我觉得主要是因为大模型数据涉及的知识面很广,评判标准复杂,非常考验标注师的语言理解能力和逻辑推理能力。在入职的前两个月,公司会对我们进行集体培训和考核,通过考核后才能正式上岗。”百度智能云大模型数据标注师王洁玉说。