adtop
首页 商业 查看内容

度小满发布“轩辕70B”金融大模型C-Eval、CMMLU双榜排名第一

2023-09-22 16:33| 发布者: 山歌| 查看: 87151| 评论: 0|来自: 中国网  阅读量:17540   

摘要:9月22日,度小满宣布“轩辕70B”金融大模型开源,所有用户均可自由下载和试用,并公布了“轩辕70B”在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。数据显示,在C-Eval榜单上,XuanYuan-70B的...

9月22日,度小满宣布“轩辕70B”金融大模型开源,所有用户均可自由下载和试用,并公布了“轩辕70B”在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。数据显示, 在C-Eval榜单上,XuanYuan-70B的总成绩达到71.9分;在CMMLU榜单中,以71.05分的高分位居榜首,在两大权威榜单上的所有开源模型中排名第一,也是国内首个同时在两大权威榜单排名第一的金融大模型。

C-Eval榜单是由清华大学、上海交通大学和爱丁堡大学合作构建的综合性考试评测集,几乎囊括了所有国内外的主流模型,覆盖人文、社科、理工、其他专业四个大方向的52个学科,共有13948个多项选择题和中学、本科、研究生、职业等四个难度级别,是目前对模型潜力判断最具权威性的大模型榜单之一。

CMMLU 数据集是一个综合性的中文评估基准,由MBZUAI、上海交通大学、微软亚洲研究院共同推出,专门用于评估语言模型在中文语境下的知识和推理能力,共涵盖了67个主题,涉及自然科学、社会科学、工程、人文以及常识等。

金融行业场景丰富,数字化程度高,是大模型落地应用的最佳场景之一。但金融又是一个高合规要求的行业,业务决策复杂,大模型真正在金融业务中做到实际应用还面临不少挑战。

度小满CTO许冬亮表示,“相比通用大模型,‘轩辕70B’金融大模型经过度小满业务场景中沉淀的海量金融数据训练,对金融知识理解更专业、更精准,可控性、安全性更高。我们把大模型开源,希望能够降低大模型在金融行业的部署和应用门槛,促进金融行业服务效率和服务体验的突破性革新”。

今年5月份,度小满开源了国内首个千亿参数的金融大模型,已经有上百家金融机构申请试用。本次发布的新版大模型相较于上一个版本能力全面提升:在增量预训练和指令微调阶段,加入了度小满业务场景中的海量金融数据,对金融问题回复更专业,金融知识理解能力提升明显;同时在预训练阶段,"轩辕70B”的模型上下文长度扩充到8k,能够处理更长的金融报告、研究和分析。

郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。

分享至:
| 收藏

相关

  • 美妆消费满1500元返200元宁波天一银泰百货迎来20周年庆
  • 9月22日至9月24日,宁波天一·和义商圈的重要一员,宁波天一银泰百货迎来了开业20周年庆。周年庆期间,美妆、黄金珠宝、服饰等品类多重惊喜活动准备就绪,化妆品消费每满1500元返200元美妆服饰券;计价类黄金每克至高减8...
  • 企业家在线 发布于  2023-09-22 16:26  
  • 做好网络安全守护者 桔子数科打出安全战术“组合拳”
  • 近年来,随着“互联网+”概念的持续升级与深入,现代数字技术创新加速,互联网已经融入经济社会发展的方方面面,给人们生活带来了极大的便利。同时,互联网应用过程中所存在的挑战也不容忽视,数据泄露、电信网络诈骗等问题时有发生。9...
  • 企业家在线 发布于  2023-09-22 14:22  
  • Win11学院:在Windows11build23545开始菜单推荐区域
  • ,微软于上周面向Dev频道用户,发布了Win11Build23545预览版更新,其中变化之一就是开始菜单推荐区域支持文件夹。 微软目前仅邀请部分Dev频道用户参与测试,不过用户可以使用ViveTool工具,在Build...
  • 企业家在线 发布于  2023-09-22 12:15  

企业家在线© 2012-   X3.4