三、金融大模型应用评测总结
本次金融大模型应用评测全面评估了参评模型在金融方向的基础能力及应用潜力,为行业发展提供了重要参考和方向指引。总结如下:
(一)金融评测五大能力维度中,各模型整体表现基本满足当下场景需求,其中金融安全与价值对齐表现优异,但金融专业认知和多模态处理能力仍存在较大提升空间。
评测结果表明,在本次金融评测的五大能力维度中,参评模型在金融安全与价值对齐方面表现优异,体现了行业对关键合规性和伦理问题的普遍重视。然而,随着大模型在金融业务场景中更深、更广的应用,金融安全问题可能会以更加隐蔽和多变的形式显现。因此,持续迭代更新安全评测方法和评测数据集,将是未来的重点任务。在模型基础能力、金融专业认知能力,特别是多模态处理能力等方面,参评模型表现欠佳。值得关注的是,在金融业务辅助拓展能力维度,特别是智能投顾表现较好,这一结果反映了大模型在投顾业务中的应用潜力,同时也揭示了在投研、投教等其他业务方向的不足。
(二)加强高质量金融语料建设事关模型能力的提升与行业应用表现,尤其是多模态数据集的构建与加强,将成为提升模型实际业务解决能力、深化应用和创新场景落地的关键。
评测过程中反映出,高质量金融语料数据集的建设与可持续供给对提升模型能力具有重要意义。特别是在多模态金融数据集方面,当前的供给不足已成为业界共同面临的瓶颈。未来,融合金融业务视角与行业实践,是金融领域大模型应用成效评测的重要抓手。评测数据集需要比照最高水平、最好标准,具有规模大、结构优、价值对齐等特点,且符合金融领域对知识鲜活度、多样性和高密度的整体要求。
(三)拓展以金融业务为核心的评测框架、保持其动态更新并与实践紧密结合,将成为行业引导与规范发展的重要工具,并助力行业持续高质量发展。
本文来自知之小站
PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告
(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)
