DeepSeek完全实用手册-从技术原理到使用技巧.pdf

从模型训练看，DeepSeekV3在2048块H800 GPU训练3.7天，换算成单块GPU共278.8万小时，以H800每小时2美元成本计算，最后一轮训练硬件成本仅约558万美元；Meta同规格的Lama3.1模型约花费9240万美元，相比高出16倍。
从模型推理看，以官方AP接入价格为例，对话模型DeepSeek V3价格约为OpenAI GPF40价格的十分之一；推理模型DeepSeek R1价格约为OpenAl o1价格的二十分之一。

开源和闭源的区别
·开源模型是将模型技术细节和模型权重免费公开，供全球研究人员研究模型技术和技术人员部署使用。比如DeepSeek系列模型、Llama系列模型。
·闭源模型则是部分公开或不公开技术细节，模型大小和模型权重保密。比如OpenA和百度等。
开源的优劣
与闭源模型的策略相比，将模型开源的策略可以获得更多开发者关注使用和共同开发，利于构建影响力和实现普惠。但难以获得商业利润。
闭源的优劣
将最先进的技术保密，有利于持续保有市场竞争力，实现商业化获利。但吸引开发者较少，且不利于社会整体技术进步。

本文来自知之小站

报告已上传百度网盘群，限时15元即可入群及获得1年期更新

（如无法加入或其他事宜可联系zzxz_88@163.com）

相关文章

围绕产品碳足迹的金融领域研究.pdf

投资于人：激活经济高质量发展的内生动力.pdf

通信行业2026年中期策略：Agent驱动的通信新时代.pdf