手机版

高质量数据供给,让行业大模型应用落地更“有料”

时间:2024-07-24 09:44:10作者:马慧思来源:互联网

《数字中国发展报告(2023年)》显示,我国数据生产总量达到32.85ZB,为国产大模型的爆发提供了丰富的“底层原料”。算力、数据、算法、场景,是决定大模型能力的核心要素,随着大模型发展逐渐由“通用”走向“垂直”,数据的质量和规模越发重要。业内专家认为,未来一个模型的好坏,20%由算法决定,80%由数据质量决定。高质量数据是提升模型性能和专业性的关键。

建设高水平行业数据集、加速行业数据流通交易,增强高质量数据供给的必由之路。浪潮卓数大数据董事长张帆指出,当前高质量中文语料资源短缺问题初现端倪,且随着时间推移,优质数据的获取难度将进一步加大。《数据要素×三年行动计划(2024-2026年)》实施后,国家鼓励科研机构、龙头企业开展行业共性数据资源库建设,打造高质量大模型训练数据集,提升数据供给水平。

“我们一直强调以数据治理为突破提升数据质量”张帆表示,工欲善其事必先利其器,浪潮卓数大数据基于完善的数据资源体系,通过自主研发的标注工厂系统,结合自有的数据治理模型工具,智能化提升数据治理的质量和效率,形成高质量语料训练数据集,支撑多模态融合的数字化场景。

行业大模型术业有专攻”,在面向行业的“封闭场景”中,大模型所需的多场景优质数据集不容易获得。解决了高质量数据“供得出”后,还要确保“流得通”,引导企业开放数据,鼓励市场力量挖掘商业数据价值,为行业大模型成长提供充足养料

尽管我国拥有海量数据资源,但是数据孤岛烟囱问题依然严峻。像浪潮卓数大数据这样本身拥有丰富数据资源又通过平台开放的企业,在打破数据壁垒中起到的作用日益明显。依托天元数据网和各地签约的数据交易所,浪潮卓数大数据可提供电商、生活服务、企业、农业、资源能化等10大类数据API数据集数据报告数据应用等的购买和个性化定制服务,旨在解决供需不匹配、数据难获得等制约大模型进一步发挥赋能效用的痛点

随着底座能力的提升,浪潮卓数大数据还依托自主研发的公共数据授权运营平台、数据资产服务平台,在确保全流程数据安全可靠、可信、可控的前提下,构建上下游合作的数据流通产业链,为数据要素市场建设积极贡献力量。

例如此前助力德州财金集团打造的“玻璃温室番茄生产数据集”数据产品,不只完成数据资产入表、盘活了企业数据资源,还利用数商身份进行供需撮合,实现首笔数据交易。越来越多沉淀在企业内、产业端的高质量数据,逐渐“浮出水面”,推动大模型迭代升级。

知易行难,加速破局尚需多方合力。据张帆介绍,让更多企业拥有高质量的数据,打造行业或特定领域、任务的专用大模型,实现生产力革新和产业升级,已成为目前浪潮卓数大数据聚焦的重要方向。

推荐阅读

  • “陪跑创业季 赋能她未来” “妈咪当佳”创业陪跑计划在京启动

    6月28日,由中国妇女杂志社、北京科创企业投融资联盟共同发起的“妈咪当佳”创业陪跑计划在京启动。该计划旨在提升女性就业创业技能,通过“妈咪当佳”创业商城,打造“培训+创业平台”模式,开展互联网营销师、营养师……

    时间:2023-06-29 17:58:47
  • 长宁县领导调研民营企业

    8月29日,县委常委、县纪委书记、县监委主任罗晓平带队调研民营企业—四川长宁融顺生物质新材料公司。 罗晓平来到四川长宁融顺生物质新材料公司,实地了解企业发展情况,与企业负责人深入交流,详细了解企……

    时间:2023-09-05 14:10:40
  • 长宁县政协主席李宏斌考察调研中山市长宁商会

    7月20日,长宁县政协党组书记、主席李宏斌带队考察调研中山市长宁商会。长宁县政协副主席黎星科、县政协党组成员周海涛、中山市长宁商会会长李华等参加调研。 考察组一行参观了商会活动阵地,党支部公告……

    时间:2023-07-24 14:59:18
  • 开放数据,蔚然成林丨浪潮云聚力济南数字先锋城市建设

    11月1日,复旦大学数字与移动治理实验室联合国家信息中心数字中国研究院正式发布“2023中国开放数林指数”和《中国地方公共数据开放利用报告——省域》、《中国地方公共数据开放利用报告——城市》。其中,浪潮云助力……

    时间:2023-11-06 11:13:13
  • 云数领航 智慧监管,国资国企监管数字化转型白皮书正式发布

    近日,由浪潮通软、德勤中国联合编撰的《基于国资云的国资国企监管数字化转型》白皮书在济南发布,为国资国企监管数字化转型提供路径和实践参考。 当前,国资监管工作进入数字化、网络化、智能化发展新阶段,……

    时间:2023-02-27 15:47:57
  • 绘就产业振兴蓝图!数智联盟为石景山区通用人工智能大模型产业集聚区注入强劲动能

    11月7日,石景山区通用人工智能大模型产业集聚区(以下简称集聚区)在京顺利揭牌。中关村数智人工智能产业联盟(以下简称联盟)副理事长、秘书长贾昊参加“石景山区通用人工智能大模型产业聚集区”共建方、“通用人……

    时间:2023-11-08 15:16:32
  • 参观朱德旧居 提升党性教育质效

    为为弘扬伟人革命精神,进一步加强党员干部的党性教育,11月17日,区信访局机关党支部组织全体党员干部参观南溪朱德旧居。 参观过程中,大家通过珍贵的历史遗物和图片、影像等资料,详细了解了朱德在川南……

    时间:2023-11-27 15:44:51
  • 宜宾市南溪区信访局组织开展 《信访工作条例》知识竞赛

    5月23日下午,为深入学习宣传贯彻《信访工作条例》(以下简称《条例》),切实提升信访工作质效,提高信访干部信访知识水平,宜宾市南溪区信访局在《条例》实施一周年之际组织全体机关干部开展《信访工作条例》……

    时间:2023-05-29 17:16:04
  • 成都长宁商会新春联谊会成功举行

    近日,中共长宁县在蓉流动党员委员会、成都市成华区长宁商会成功举办“携手新时代、奋进新征程”新春联谊会。长宁县政协党组书记、主席李宏斌,副主席周小雨,县委统战部副部长、县工商联党组书记、常务副主席李茂……

    时间:2023-01-18 10:55:25
  • 海若技能大揭秘|“更懂项目”的海若大模型

    “十四五”时期,信息化进入加快数字化发展、建设数字中国的新阶段。数字政府作为数字中国的重要组成部分,是实现政府治理体系和治理能力现代化的有力抓手。 伴随新一代信息技术的飞速发展,信息化项目成为推动……

    时间:2024-06-25 18:10:47
随机推荐