导语
近日,广州数据交易所联合鹏城实验室、广东联通、数据堂及广东省人工智能产业协会,隆重发布了针对大模型应用的首批人工智能技术基准评测榜单。在此次高规格评测中,京华信息依托京华AI知识引擎核心技术以及在领域大模型方向的积累与创新,在公文生成、政务回答等多个重要应用场景测评中脱颖而出,位居榜首。
首批人工智能技术基准评测
此前,京华信息受邀参与首批人工智能技术基准评测,与10余家国内领域大模型公司同台竞技,参与场景应用评测。本次评测面向政务、教育和法律三个重点应用场景,以客观题+主观题为测评形式:
1.客观题:通过程序对比大模型的回答结果与标准答案,统计和分析两者一致的比例,获得大模型在不同领域回答的准确性并给出评测结果。2.主观题:采用triple-check人工评测的方式,评测人员分为独立三组,比对问题和模型回答,同时参考人工标注的标准答案进行评分,最终评测结果取三组的平均分。评分细则如下:
评测榜单发布
基于小京GPT大模型的智能辅助写作产品
政务公文生成能力及政务智能回答能力,正是京华信息自研的小京GPT中最核心的能力之一。通过对该两种能力的深化与泛化,京华信息已打造基于小京GPT大模型的智能辅助写作产品(简称京华慧写,一款面向党政机关、企事业单位、学校的辅助文书编写的应用软件)。它基于小京GPT大模型的语义理解、内容生成和知识问答等能力,结合京华专业领域小模型,实现了内容生成、素材推荐、文段优化、摘要生成等功能,为文书工作者提供素材搜索、资料研读、内容编写、文书校对等服务。
结语
随着国内大模型纷纷进入到领域的训练、服务和应用,针对大模型对场景应用的能力评测变得越来越有指导意义。未来,京华信息将继续深化人工智能×数据要素的探索,持续打磨基于大模型的数据产品,并深度优化数据产品在场景应用的能力,将更多优质的数据产品与服务推向市场,进一步提升交易机制的效率和安全性,助力未来市场规模化、产品标准化、服务专业化,为数据交易市场带来更多的价值,打造行业标杆。