亚洲精品视频免费_黄色在线网站视频_人人九九精_国产成人精品一区_99热精品免费_91.com在线

首页 > 互联网 > 正文

世界观察:大模型在工业领域探索仍处于初级阶段

2023-07-06 08:53:31来源:人民邮电报  


【资料图】

图片来源:中国工业互联网研究院

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的应用性能、技术架构、标准体系进行系统性评测,并发布系列报告。评测对象涵盖GPT-4、GPT-3.5、文心一言、ChatGLM等国内外具有代表性的头部大模型。

本次工业知识问答测试主要分为客观题与主观题两大类,总计超过1100个问题。主观题主要考察四大维度:基础能力、语句能力、概括能力和逻辑能力。评测结果显示,GPT-4表现最佳。国内头部大模型表现亮眼,整体与GPT-3.5相当。其中百度文心一言在国内大模型中排名第一。

在客观题方面,GPT-4与文心一言表现优于其他大模型。但评测结果也同时指出,大模型在准确率方面有较大的提升空间。在主观题方面,国内大模型的基础能力、语句能力与GPT-4接近,概括能力、逻辑能力与GPT-4存在一定差距。

评测数据集由工业领域八大行业的相关数据构成。包括电子设备制造业、装备制造业、钢铁行业、采矿行业、电力行业、石化化工行业、建材行业和纺织行业。工联院根据工业经验,结合外部数据源,按行业构建行业知识测试集。

从行业维度看,大模型在八个行业知识问答能力上差异明显,个别行业需进一步优化提升。其中,电子、装备行业评价指数较高,纺织、采矿行业综合评价指数相对较低。

分析大模型落地垂直行业痛点,丰富特定行业专业知识。虽然国内大模型在本次评测中表现较好,甚至在部分行业评分优于GPT-3.5,但工联院评测报告指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,国内大模型与GPT-4有差距,行业间的泛化能力有待加强。对此,工联院评测报告给出的建议是进一步丰富相关专业领域的数据训练集,进行专业化的微调。 

标签:

相关阅读

相关词

推荐阅读

主站蜘蛛池模板: 国产精品外围在线观看 | 国产伦精品一区二区三区视频小说 | 视频一本大道香蕉久在线播放 | 黄色视屏在线看 | 国产在线19禁免费观看国产 | 日韩精品久久久肉伦网站 | 中文字幕一精品亚洲无线一区 | 天堂资源www天堂在线 | 一级做人爱在线短视频 | 国产精品2020 | 国自产精品手机在线视频香蕉 | 国产精品在线播放 | 成人免费视频一区二区 | 亚洲欧美日韩国产手机在线 | 亚洲爆乳精品无码一区二区三区 | 天天爽天天爽夜夜爽毛片 | 七次郎在线观看视频国产 | 久久精品成人一区二区三区 | 久综合| 在线麻豆精东9制片厂av影现网 | 国产高清国产专区国产精品 | 欧美日韩高清不卡免费观看 | 亚洲av电影一区二区在线秋霞网 | 四虎成人精品国产永久免费 | 亚洲va在线va天堂va偷拍 | 99视频在线看 | 亚洲天堂一区二区三区 | 国产成人免费无庶挡视频 | 国产丝袜免费视频网址 | 亚洲精品久久久久影 | 男女啪啪永久免费观看网站 | 亚欧精品在线观看 | 在线精品亚洲 | 亚洲乱码中文字幕小综合 | 精品国产第一国产综合精品 | 国产成人精品一区二区免费视频 | 精品一区二区三区波多野结衣 | 亚洲av无码一区二区三区天堂 | 福利免费观看 | 天天在线欧美精品免费看 | 91欧美亚洲|