亚洲精品视频免费_黄色在线网站视频_人人九九精_国产成人精品一区_99热精品免费_91.com在线

首页 > 互联网 > 正文

世界观察:大模型在工业领域探索仍处于初级阶段

2023-07-06 08:53:31来源:人民邮电报  


【资料图】

图片来源:中国工业互联网研究院

近日,中国工业互联网研究院(以下简称“工联院”)针对人工智能大模型在中文工业领域的应用性能、技术架构、标准体系进行系统性评测,并发布系列报告。评测对象涵盖GPT-4、GPT-3.5、文心一言、ChatGLM等国内外具有代表性的头部大模型。

本次工业知识问答测试主要分为客观题与主观题两大类,总计超过1100个问题。主观题主要考察四大维度:基础能力、语句能力、概括能力和逻辑能力。评测结果显示,GPT-4表现最佳。国内头部大模型表现亮眼,整体与GPT-3.5相当。其中百度文心一言在国内大模型中排名第一。

在客观题方面,GPT-4与文心一言表现优于其他大模型。但评测结果也同时指出,大模型在准确率方面有较大的提升空间。在主观题方面,国内大模型的基础能力、语句能力与GPT-4接近,概括能力、逻辑能力与GPT-4存在一定差距。

评测数据集由工业领域八大行业的相关数据构成。包括电子设备制造业、装备制造业、钢铁行业、采矿行业、电力行业、石化化工行业、建材行业和纺织行业。工联院根据工业经验,结合外部数据源,按行业构建行业知识测试集。

从行业维度看,大模型在八个行业知识问答能力上差异明显,个别行业需进一步优化提升。其中,电子、装备行业评价指数较高,纺织、采矿行业综合评价指数相对较低。

分析大模型落地垂直行业痛点,丰富特定行业专业知识。虽然国内大模型在本次评测中表现较好,甚至在部分行业评分优于GPT-3.5,但工联院评测报告指出,国内外通用大模型在工业知识问答领域探索仍处于初级阶段,国内大模型与GPT-4有差距,行业间的泛化能力有待加强。对此,工联院评测报告给出的建议是进一步丰富相关专业领域的数据训练集,进行专业化的微调。 

标签:

相关阅读

相关词

推荐阅读

主站蜘蛛池模板: 激情欧美成人久久综合 | 亚洲第一色图 | 999插插插 | 成人午夜免费视频毛片 | 五月激激激综合网亚洲 | 高清在线亚洲精品国产二区 | 青青青国产免费一夜七次郎 | 无限好资源第一片免费韩国 | 免费无码又爽又刺激高潮 | 波多野结衣av手机在线观看 | 伊人久久综合成人网小说 | 深夜免费福利视频在线播放 | 久久精品国产亚洲av麻豆蜜芽 | 四虎影视在线看免费观看 | 伊人啪啪 | 一本久久知道综合久久 | 久久99亚洲精品久久 | 逼逼好嫩视频 | 日本免费毛片在线高清看 | 一区二区不卡视频在线观看 | 天天躁日日躁狠狠躁人妻 | 色偷偷色噜噜狠狠网站30根 | 无码囯产精品一区二区免费 | 欧洲熟妇牲交 | 亚洲国产免费 | 亚洲乱色熟女一区二区三区麻豆 | 青青久操 | 欧美综合区自拍亚洲综合天堂 | 一区二区 在线 | 中国 | 在线一区二区三区 | 国产三级手机在线 | 91亚洲精品一区二区自 | 亚洲成年| 成人福利视频在线观看网址 | 成人欧美在线观看免费视频 | 国产69精品久久久久999三级 | 国产亚洲欧美在线播放网站 | 自拍视频网站 | 一久久| 国产精品二区三区免费播放心 | 国产视频久久久久 |