设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

玉渊谭天丨热解读:为何DeepSeek引发美国恐慌

2025-02-05 15:38:54 来源: 中国科技网

这几天,中国人工智能初创公司DeepSeek火了,不仅在美区下载榜上超越了ChatGPT,还引发多个美国科技股的股价暴跌。美国总统特朗普称DeepSeek的出现“给美国相关产业敲响了警钟”。为何DeepSeek的出现会让美国如此关注,甚至有些紧张?谭主联合中国工业互联网研究院独家揭秘背后的原因↓↓↓ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

原因一:ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

高性价比冲击美国大模型垄断地位ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

DeepSeek可谓是用最少的钱,干最多的事。其推出的模型,在性能上和世界目前顶尖的GPT-4o等大模型不相上下。但在成本上,OpenAI训练ChatGPT-4花费的成本高达7800万美元,还可能达到1亿美元。而DeepSeek大模型训练成本不到600万美元,仅为同性能模型的5%到10%。新模型训练方法大幅度降低了大模型行业的入局门槛,大规模预训练不再是科技巨头的专利。在模型推理层面,DeepSeek新推出的DeepSeek-R1,价格为2.2美元/百万词元,而同性能OpenAI-o1的价格为60美元/百万词元,DeepSeek大概是OpenAI的三十分之一。这种“低成本”标志着推理大模型调用进入平价时代,显著改善了大模型的应用成本,对大模型在科研、企业等智力密集型产业中的应用具有重大的价值。因此,无论是从基础研究角度还是从商业层面上看,在训练和推理方面,对此前美国一些大模型公司的既有模式冲击比较大。ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

原因二:ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

模式创新,带来美国高新技术人员恐慌ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

DeepSeek开发成本与美国大模型相比大幅降低,在于应用了不同的模型训练模式,打破了美国堆砌算力的“豪气”方式。在喂养学习数据这一大模型重要环节上,OpenAI选择了“人海战术”,堆砌算卡、将资源集中在算力,用海量数据投喂实现能力的提升。而DeepSeek相比于“砸资源”选择了另外一种方式。利用算法把数据进行总结和分类,经过选择性处理之后再输送给大模型,最大优化算力实现了成本的降低和模型性能提升。目前看Meta耗费了大量资金训练Llama,但是效果上却没有成本极低的DeepSeek效果好,Meta高层已经在思考其员工是否在浪费公司资金,而这也引发了不少企业技术人员的恐慌,他们担心自己被质疑技术能力和创新性从而失去工作。根据海外互联网平台对DeepSeek的讨论分析,社交媒体帖子的数量远高于新闻报道,数量约是新闻报道的十倍。时间上来看,社交媒体帖子的讨论早于新闻报道,发酵起点比新闻媒体早了五天,这是由从事科技工作的自媒体人以及员工圈层传播“破圈”造成。ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

原因三:ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

国产大模型正在厚积薄发ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

根据中国工业互联网研究院推出的《人工智能大模型年度发展趋势报告》,与国际顶尖大模型能力相比,2024年国内大模型的能力进步非常显著。从2023年第四季度到2025年第一季度的测评显示,国内外大模型能力差距缩小了将近75%。可以看出,DeepSeek的出现并不是所谓的“异军突起”,而是中国国内大模型整体发展的阶段性成果体现。此外,在报告统计的世界AI领域的投资上,中国55亿美元的投资额排在第二位,仅是第一位美国641亿投资额的不到十一分之一,中国未来在AI领域的发展上还有很大的空间。ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

如今,在DeepSeek对全球AI圈带来的震动下,很多业内人士都喊出了“DeepSeek接班OpenAI”的口号。事实上,DeepSeek的出现,并不是要取代别人,而是提出了更多样化的方案,打破了国际主流大模型的市场垄断,在大模型的发展道路上提出了不同于美西方的中国解法,让世界看到了在大模型领域不是只有拼算力这一条路,再一次向世界证明,什么是中国智慧。ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这几天,中国人工智能初创公司DeepSeek火了,不仅在美区下载榜上超越了ChatGPT,还引发多个美国科技股的股价暴跌。美国总统特朗普称DeepSeek的出现“给美国相关产业敲响了警钟”。为何DeepSeek的出现会让美国如此关注,甚至有些紧张?谭主联合中国工业互联网研究院独家揭秘背后的原因↓↓↓ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

原因一:ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

高性价比冲击美国大模型垄断地位ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

DeepSeek可谓是用最少的钱,干最多的事。其推出的模型,在性能上和世界目前顶尖的GPT-4o等大模型不相上下。但在成本上,OpenAI训练ChatGPT-4花费的成本高达7800万美元,还可能达到1亿美元。而DeepSeek大模型训练成本不到600万美元,仅为同性能模型的5%到10%。新模型训练方法大幅度降低了大模型行业的入局门槛,大规模预训练不再是科技巨头的专利。在模型推理层面,DeepSeek新推出的DeepSeek-R1,价格为2.2美元/百万词元,而同性能OpenAI-o1的价格为60美元/百万词元,DeepSeek大概是OpenAI的三十分之一。这种“低成本”标志着推理大模型调用进入平价时代,显著改善了大模型的应用成本,对大模型在科研、企业等智力密集型产业中的应用具有重大的价值。因此,无论是从基础研究角度还是从商业层面上看,在训练和推理方面,对此前美国一些大模型公司的既有模式冲击比较大。ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

原因二:ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

模式创新,带来美国高新技术人员恐慌ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

DeepSeek开发成本与美国大模型相比大幅降低,在于应用了不同的模型训练模式,打破了美国堆砌算力的“豪气”方式。在喂养学习数据这一大模型重要环节上,OpenAI选择了“人海战术”,堆砌算卡、将资源集中在算力,用海量数据投喂实现能力的提升。而DeepSeek相比于“砸资源”选择了另外一种方式。利用算法把数据进行总结和分类,经过选择性处理之后再输送给大模型,最大优化算力实现了成本的降低和模型性能提升。目前看Meta耗费了大量资金训练Llama,但是效果上却没有成本极低的DeepSeek效果好,Meta高层已经在思考其员工是否在浪费公司资金,而这也引发了不少企业技术人员的恐慌,他们担心自己被质疑技术能力和创新性从而失去工作。根据海外互联网平台对DeepSeek的讨论分析,社交媒体帖子的数量远高于新闻报道,数量约是新闻报道的十倍。时间上来看,社交媒体帖子的讨论早于新闻报道,发酵起点比新闻媒体早了五天,这是由从事科技工作的自媒体人以及员工圈层传播“破圈”造成。ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

原因三:ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

国产大模型正在厚积薄发ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

根据中国工业互联网研究院推出的《人工智能大模型年度发展趋势报告》,与国际顶尖大模型能力相比,2024年国内大模型的能力进步非常显著。从2023年第四季度到2025年第一季度的测评显示,国内外大模型能力差距缩小了将近75%。可以看出,DeepSeek的出现并不是所谓的“异军突起”,而是中国国内大模型整体发展的阶段性成果体现。此外,在报告统计的世界AI领域的投资上,中国55亿美元的投资额排在第二位,仅是第一位美国641亿投资额的不到十一分之一,中国未来在AI领域的发展上还有很大的空间。ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

如今,在DeepSeek对全球AI圈带来的震动下,很多业内人士都喊出了“DeepSeek接班OpenAI”的口号。事实上,DeepSeek的出现,并不是要取代别人,而是提出了更多样化的方案,打破了国际主流大模型的市场垄断,在大模型的发展道路上提出了不同于美西方的中国解法,让世界看到了在大模型领域不是只有拼算力这一条路,再一次向世界证明,什么是中国智慧。ay1流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:玉渊谭天丨热解读:为何DeepSeek引发美国恐慌http://www.llsum.com/show-2-10434-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 新电池让可穿戴设备比棉花还透气

下一篇: 这种“泥藻小蛇”,竟是开启中国蛇研究的“钥匙”

热门资讯

  • 239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远

      239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远  239万元/架的无人驾驶载人航空器也看上了电商渠道。  3月18日,亿航智能设备(广州)有限公司(下称“亿航

  • 人工智能医疗或将破解人体秘密

    美国《新闻周刊》网站2月4日刊登题为《人工智能可能会在数十年内解开人体的秘密》的文章,作者是亚历克斯·菲利普斯,内容编译如下:一位医生(同

  • 人类祖先200万年前开始捕鱼

    美国《发现》杂志网站2月7日刊登题为《200万年前,我们的人类祖先开始从水里捞鱼》的文章,作者是科迪·科蒂尔,内容编译如下:捕鱼可能是一种占许

  • “95后”的无人机“造像师”

    “当时是怎样选中低空经济这个领域,并且来深圳发展的?”面对这个关乎事业发展的问题,“95后”台青张晏纶坦言,“这是一场面试带来的惊喜。”张晏纶来自

  • “量子龙卷风”吹开黑洞研究之门

    英国科学家首次创造了一个新颖的实验平台,即“量子龙卷风”。它能模拟超流体氦中的黑洞,使研究人员能更详细地观察类似黑洞的行为以及与周围环境的相

  • 我科学家实现最小资源消耗的量子态分辨

    记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展。研究组在最小资源消耗的量子态分辨问题中首次提出了全局

  • 太空培育类器官或带来疾病新疗法

    自2019年以来,科学家已经在国际空间站上培育出了包括人类大脑、心脏和乳房在内的多个类器官模型。这些类器官通常利用人类干细胞培育而成,在一系列化

  • 国家工程师丨锻造能“听”清眼疾的高精设备

    眼眸深邃似海、璨如星河,中国医学科学院生物医学工程研究所眼科诊疗技术研发团队(以下简称“团队”)正是眼眸“侦探”。该团队不久前被授予“国家卓越

  • 企业联合遥感数据平台 加速遥感应用迈向普惠时代

    记者3月21日获悉,商汤科技与遥感数据平台吉林一号网、四维地球、星图地球等展开合作,此举标志着“SenseEarth智能遥感云”平台数据源全面升级,将为行

  • 30台发动机助进阶版“鹊桥”升空

      30台发动机助进阶版“鹊桥”升空  中新社西安3月20日电 (记者 张一辰)3月20日8时31分,长征八号遥三运载火箭在中国文昌航天发射场顺利升空,成功将“鹊桥二号”卫星送入

  • 中国气象局发布下一代大气数值模式

    中国气象局下一代大气数值模式日前发布。该模式采用完全自主的动力框架算法——多矩约束有限体积方法为基础算法,进一步提升全球公里级和

  • 首发天玑9300+联发科最强芯片!vivo X100s Pro入网

    3月23日消息,据最新爆料,vivo X100s Pro已经获得3C认证,估计 会在5月份前后发布。该机可以看做是vivo X100 Pro的小迭代机型,属于半代升级款,与去年X90s类似

推荐资讯

  • 日榜
  • 周榜
  • 月榜