DeepSeek完全实用手册-从技术原理到使用技巧.pdf

从模型训练看,DeepSeekV3在2048块H800 GPU训练3.7天,换算成单块GPU共278.8万小时,以H800每小时2美元成本计算,最后一轮训练硬件成本仅约558万美元;Meta同规格的Lama3.1模型约花费9240万美元,相比高出16倍。
从模型推理看,以官方AP接入价格为例,对话模型DeepSeek V3价格约为OpenAI GPF40价格的十分之一;推理模型DeepSeek R1价格约为OpenAl o1价格的二十分之一。

开源和闭源的区别
·开源模型是将模型技术细节和模型权重免费公开,供全球研究人员研究模型技术和技术人员部署使用。比如DeepSeek系列模型、Llama系列模型。
·闭源模型则是部分公开或不公开技术细节,模型大小和模型权重保密。比如OpenA和百度等。
开源的优劣
与闭源模型的策略相比,将模型开源的策略可以获得更多开发者关注使用和共同开发,利于构建影响力和实现普惠。但难以获得商业利润。
闭源的优劣
将最先进的技术保密,有利于持续保有市场竞争力,实现商业化获利。但吸引开发者较少,且不利于社会整体技术进步。

本文来自知之小站

 

PDF报告已分享至知识星球,微信扫码加入立享3万+精选资料,年更新1万+精选报告

(星球内含更多专属精选报告.其它事宜可联系zzxz_88@163.com)