科技魔方

深耕大模型技术 度小满开源国内首个千亿参数金融大模型“轩辕”

大模型

2023年07月06日

  当前,迅速发展的大模型正在成为AI新型基础设施,并被广泛运用于金融等多个行业。尤其是金融领域,大模型在风险管理、欺诈检测、客户服务等场景中有着重要作用,多家金融科技企业争相涌入大模型赛道。近日,在大模型领域布局已久的度小满,正式开源国内首个千亿级中文金融大模型—“轩辕”。

  度小满以高质量数据集训练模型,“轩辕”处理金融领域问题优势明显

  据了解,轩辕大模型是在1760亿参数的Bloom大模型基础上训练而来,在金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务上,效果相较于通用大模型大幅提升,表现出明显的金融领域优势。

  在金融场景中的任务评测中,轩辕全面超越了市场上的主流开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。在通用能力评测中,轩辕有10.2%的任务表现超越ChatGPT 3.5,61.22%的任务表现与之持平,涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度。

  为了提升轩辕大模型对金融领域问题的理解能力,度小满将自身业务中积累的金融领域的千亿tokens的中文预训练数据集用来训练模型。该数据集涵盖了金融研报、股票、基金、银行、保险等各个方向的专业知识。度小满表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且显著提升了模型在金融垂直领域的性能。

+1

来源:DoNews

延展资讯