京华信息

导语

近日，广州数据交易所联合鹏城实验室、广东联通、数据堂及广东省人工智能产业协会，隆重发布了针对大模型应用的首批人工智能技术基准评测榜单。在此次高规格评测中，京华信息依托京华AI知识引擎核心技术以及在领域大模型方向的积累与创新，在公文生成、政务回答等多个重要应用场景测评中脱颖而出，位居榜首。

首批人工智能技术基准评测

此前，京华信息受邀参与首批人工智能技术基准评测，与10余家国内领域大模型公司同台竞技，参与场景应用评测。本次评测面向政务、教育和法律三个重点应用场景，以客观题+主观题为测评形式：

1.客观题：通过程序对比大模型的回答结果与标准答案，统计和分析两者一致的比例，获得大模型在不同领域回答的准确性并给出评测结果。2.主观题：采用triple-check人工评测的方式，评测人员分为独立三组，比对问题和模型回答，同时参考人工标注的标准答案进行评分，最终评测结果取三组的平均分。评分细则如下：

评测榜单发布

基于小京GPT大模型的智能辅助写作产品

政务公文生成能力及政务智能回答能力，正是京华信息自研的小京GPT中最核心的能力之一。通过对该两种能力的深化与泛化，京华信息已打造基于小京GPT大模型的智能辅助写作产品（简称京华慧写，一款面向党政机关、企事业单位、学校的辅助文书编写的应用软件）。它基于小京GPT大模型的语义理解、内容生成和知识问答等能力，结合京华专业领域小模型，实现了内容生成、素材推荐、文段优化、摘要生成等功能，为文书工作者提供素材搜索、资料研读、内容编写、文书校对等服务。

结语

随着国内大模型纷纷进入到领域的训练、服务和应用，针对大模型对场景应用的能力评测变得越来越有指导意义。未来，京华信息将继续深化人工智能×数据要素的探索，持续打磨基于大模型的数据产品，并深度优化数据产品在场景应用的能力，将更多优质的数据产品与服务推向市场，进一步提升交易机制的效率和安全性，助力未来市场规模化、产品标准化、服务专业化，为数据交易市场带来更多的价值，打造行业标杆。

分享到:

榜单发布 | 小京GPT大模型亮剑人工智能技术基准评测

400-138-3836