首页 新闻 DeepSeek AI:不便宜,开发费用为16亿美元

DeepSeek AI:不便宜,开发费用为16亿美元

作者 : Nova 更新日期:Apr 13,2025

来自DeepSeek的新聊天机器人对AI行业产生了重大影响,并承诺对任何问题都有令人惊讶的答案。这种大胆进入市场的进入甚至导致了NVIDIA最大的股票价格下跌之一,这表明DeepSeek的影响力不断增长。

DeepSeek测试图片:ensigame.com

DeepSeek模型的区别是其创新的建筑和培训方法,其中包括:

多语预测(MTP):此技术允许模型通过分析不同的句子段一次预测多个单词,从而提高了准确性和效率。

专家(MOE)的混合物:利用256个神经网络,每个令牌激活了8个,此方法可以加快AI训练并提高性能。

多头潜在注意力(MLA):这种机制着重于关键句子部分,反复提取关键细节,以确保不会错过重要的细微差别。

DeepSeek是一家著名的中国初创公司,声称已经开发了其竞争性的AI模型DeepSeek V3,仅使用2048个图形处理器,成本最小为600万美元。

DeepSeek V3图片:ensigame.com

然而,半分析的更深入的外观表明,DeepSeek运营着庞大的计算基础设施,利用大约50,000个Nvidia Hopper GPU,包括H800,H100和H20等各种模型。这些资源分布在多个数据中心,不仅用于AI培训,还用于研究和财务建模。该公司对服务器的总投资约为16亿美元,运营成本约为9.44亿美元。

DeepSeek是中国对冲基金高飞行员的子公司,该基金在2023年被建立为以AI为中心的单独的部门。与许多依靠云计算的初创公司不同,DeepSeek拥有其数据中心,从而完全控制了AI模型优化并实现快速创新。该公司保持自筹资金,提高其敏捷性和决策速度。

DeepSeek图片:ensigame.com

此外,DeepSeek吸引了领先的中国大学的顶尖人才,每年提供超过130万美元的薪水,尽管它不雇用外国专家。

尽管DeepSeek声称培训DeepSeek V3仅需600万美元,但该数字仅在培训期间说明了GPU的使用情况,并且不包括研究,改进,数据处理或基础架构成本。自开始以来,DeepSeek已在AI开发方面投资了超过5亿美元,利用其紧凑的结构来迅速实施创新。

DeepSeek图片:ensigame.com

DeepSeek的案子表明,一家资金充足的独立AI公司可以挑战行业领导者。但是,专家强调,该公司的成功源于大量投资,技术突破和强大的团队,而不是为AI开发的“革命性预算”。然而,DeepSeek的成本仍然低于其竞争对手的成本,而培训的成本为500万美元,而Chatgpt4o的1亿美元。

最新游戏 更多 +
休闲 | 201.3 MB
世界手工制作和建筑2022Master Craft 2022-新的手工制作游戏免费新版本,您喜欢建造游戏吗? Master Craft 2022 Multicraft是您不想错过的2022年最新免费建筑游戏。通过这种迷人的手工制作,进入一个无尽创造力和建筑的世界
休闲 | 103.1 MB
踏上您成为大型农场的农民的旅程:移动收获,这是一个迷人的农场模拟器游戏,您可以在线与朋友,家人和农民在线联系。建立一个繁荣的社区,生活**您梦想中的农场生活**。**与朋友的农场:**大农场:移动收获
休闲 | 8.9 MB
想要用SEGA Genesis和Sega Master System的最爱重温黄金时期? GenPlusdroid是一种由GenPlus提供动力的特殊开源模拟器GenPlusdroid。此模拟器将您的Sega Mega Drive和Sega Master System Games带入您的移动设备Boasti
休闲 | 46.5 MB
使用我们可爱的角色自定义功能释放您的创造力!潜入一个可爱的世界中,您可以用一系列令人愉悦的物品来甲板上自己的赤壁角色。触手可及的1000多种装饰选项,可能性是无尽的。来自迷人的睫毛
休闲 | 15.6 MB
使用VoiceFX(一种强大的语音更改器和语音录音机应用程序)进行变换,记录,流式传输和共享您的声音,旨在彻底改变您与音频的互动。无论您是想增强声音还是为音乐增添天赋,VoiceFX都会提供一套音频效率
休闲 | 17.6 MB
TIC-TAC TOE是一款永恒的两人游戏,在3x3网格上,其简单性提供了无尽的乐趣。玩家轮流放置X或O的X,努力将他们的三个符号连续对齐,列或对角线以声称胜利。具有跟踪分数并轻松重置新回合的功能,游戏'