赢马学堂免费课程
雷递网 乐天 9月7日
百川智能昨日宣布正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用。
百川智能此次还开源了模型训练的Check Point,并宣布将发布 Baichuan 2技术报告,介绍Baichuan 2的训练细节,帮助大模型学术机构、开发者和企业用户更深入的了解其训练过程,更好地推动大模型学术研究和社区的技术发展。
百川智能称,Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于 2.6万亿高质量多语言数据进行训练,在保留了上一代开源模型良好的生成与创作能力,流畅的多轮对话能力以及部署门槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有提升。其中Baichuan2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。
13代酷睿i5-13600kf和12600kf
7B参数模型的Benchmark成绩
13B参数模型的Benchmark成绩
百川智能还称,在MMLU、CMMLU、GSM8K等几大权威评估基准中,以优势领先LLaMA2,性能优于LLaMA2等同尺寸模型竞品。根据MMLU等多个权威英文评估基准评分 Baichuan2-7B以70亿的参数在英文主流任务上与130亿参数量的LLaMA2持平。
据悉,百川智能成立不到四个月,便相继发布Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型,以及一款搜索增强大模型Baichuan-53B,目前下载量超过500万次。
在今年创立的大模型公司中,百川智能还通过《生成式人工智能服务管理暂行办法》备案,可以正式面向公众提供服务的企业。
雷递由媒体人雷建平创办,若转载请写明来源。