拓尔思林松涛:发挥高质量数据积淀优势 打通大模型落地关键路径 焦点
6月6日,由21世纪经济报道、北京人工智能产业联盟元宇宙专业委员会、中
21世纪经济报道记者雷晨 北京报道
(相关资料图)
6月6日,由21世纪经济报道、北京人工智能产业联盟元宇宙专业委员会、中国文化产业协会文化元宇宙专业委员会主办的“21世纪卓越董事会人工智能闭门会”召开,主题为“AI领域上市公司创新涌现、技术难题与发展路径”。
会上,拓尔思(300229.SZ)副总裁林松涛介绍了“拓天”大模型及行业应用。他表示,大模型技术场景落地中的挑战,主要是质量、可控、时效和成本。
质量方面,他认为,个人服务用ChatGPT,提示词不准可以换一个,如果图片生成不好也可以再换一个,可以说个人对AIGC的容忍度是很高的。但是企业不一样,给政府写顾问报告,数据来源必须是准确的。
可控层面,一是内容安全,数据是有价值观的,模型没有价值观。二是私域数据安全,中国大模型要数据化落地,如何在保证用户私有数据安全的同时将大数据较好地运用也是一个问题。
时效方面,在大数据训练上,灾难性的遗忘一直都是训练的问题,所以需要大模型解决这个问题。另外,怎样输入即时数据,类似Chat GPT,数据最新只到2021年9月,因此在To B服务的时候用不好。
成本方面,千亿模型私有化落地的时候需要训练好,在企业端落地还需要让企业用得起。拓尔思做To B服务,垂直场景落地成为“百模大战”的核心要点。
据林松涛介绍,大模型出来以后颠覆了拓尔思此前积累的NLP技术,公司发现,在大模型的基础上再去结合知识图谱、自然语言处理技术效果更好。与此同时,公司拥有长期数据采集和高质量数据资产积累优势,可将数据迅速投入到大模型当中。
“现在拓尔思拥有全网数据1500亿,有人工整理、专家整理的数据库达30多个,主题数据110亿个,这是拓尔思能够做大模型很重要的优势。”林松涛称。
据了解,拓尔思在大模型应用方面首先选择政府、媒体和金融三个优势赛道。
在林松涛看来,做垂直领域首先要选好大模型基座,国内头部厂商自己做基座,也有一些厂商选择开源,同时还需要有数据以及在专业领域的积累,最后在大模型落地时,不仅要有技术、数据、还需要让用户知道如何应用,包括真实场景的闭环、基于用户反馈的学习等等。
“我们现在要解决的三个问题,一是实现大模型与专业知识库的融合。二是如何提升AIGC的内容质量和数据安全,特别是在内容事实核查方面。三是如何降低百亿级大模型落地的成本。”林松涛表示。
关键词:
[ 相关文章 ]
6月6日,由21世纪经济报道、北京人工智能产业联盟元宇宙专业委员会、中
6月8日,小鹏汽车放出了一组林志颖和小鹏G6的宣传漫画。很多网友发现,
如今,各大新势力品牌都在推出MPV车型。这不,一组理想全新MPV车型W01
1、耐用性 从摄影包使用的面料来讲,主要分为高密度防水防撕尼龙布和
鞭牛士6月8日消息,天眼查App显示,近日,宜春时代新能源资源有限公司
华阳集团接待中财招商投资集团等多家机构调研
“未来汽车行业发展还有空间,市场竞争会越来越激烈,但销量两位数的增
据了解,2020年以来,各地区、各有关部门密切配合、标本兼治,深入开展
新增PCM32kHz 64kHz 128kHz 256kHz 512kHz采样率支持,支持全采样率山
此次战略合作,双方将充分发挥各自资源优势,以出行、物流服务、商旅服
1、社会语言学,其基本涵义是:从语言的社会属性出发,用社会学的方法
2018年9月17日,杭州,浙江理工大学服装学院5名美女大学生用3120元开始
电力设备行业市场前景投资怎么样?中央财经委员会第九次会议提出:构建
五洋停车:2022年年度权益分派实施公告
远程星享F1E、远程星享V6EPlus两款新品正式上市。新车以用户思维打造,
电商行业市场到底多大?一年一度的618大型促销活动拉开序幕。5月23日,
农学专业要学习的课程主要包括:农业微生物学、农业气象学、植物生物技
顺丰控股(002352)06月08日在投资者关系平台上答复了投资者关心的问题。
近日,一位自称在加油站打工的日本网友,在推特贴出了一张刷卡单,上头
小S大女儿韩国舞蹈大赛跳舞视频
[ 相关新闻 ]
Copyright 2015-2022 海峡医院网 版权所有 备案号:皖ICP备2022009963号-10 联系邮箱:396 029 142 @qq.com