凯发APP·(中国区)官方网站

上海凯发APP贸易有限公司

Shanghai Signking Trading Co.,

CASE

home

应用案例

application

凯发K8首页|人族无敌3|梁文锋“反对”张一鸣

发布时间: 2025-02-21 06:33:31

　　1月28日★★◈★，DeepSeek发布新一代多模态大模型Janus-Pro★★◈★，分为7B（70亿）和1.5B（15亿）两个参数量版本★★◈★，且均为开源★★◈★。

　　新模型一经发布★★◈★，就登上了知名AI开源社区Hugging Face的模型热门榜★★◈★。目前★★◈★，在Hugging Face收录的40多万个模型中★★◈★，热门榜前五中★★◈★，DeepSeek独占其四★★◈★。

　　据DeepSeek介绍★★◈★，相比去年11月发布的JanusFlow★★◈★，Janus-Pro优化了训练策略★★◈★、扩展了训练数据★★◈★，模型也更大★★◈★，在多模态理解和文本到图像的指令跟踪功能方面★★◈★，均取得重大进步★★◈★，同时还增强了文本到图像生成的稳定性凯发APP官网入口★★◈★。

　　与先前引发全球AI圈轰动的R1大模型类似★★◈★，Janus-Pro同样是“小力出奇迹”的成果凯发K8首页★★◈★。

　　根据DeepSeek发布的测试结果★★◈★，这款文生图大模型在多项基准测试中表现出色★★◈★，甚至强于OpenAI旗下的DALL-E 3★★◈★，以及Stable Diffusion★★◈★。

　　亦有用户指出★★◈★，Janus-Pro谈不上全面超越DALL-E 3★★◈★，后者在许多测试中依然更强★★◈★，输出图像分辨率也明显优于Janus-Pro的384x384像素★★◈★。尽管如此★★◈★，Janus-Pro以70亿的最大参数量★★◈★，与120亿参数的DALL-E 3打得有来有回★★◈★，依然展现了不俗潜力★★◈★。

　　本月早些时候★★◈★，DeepSeek发布R1大模型★★◈★。作为一款开源模型★★◈★，R1在数学★★◈★、代码★★◈★、自然语言推理等任务上的性能★★◈★，号称可以比肩OpenAI当前最强的o1模型正式版★★◈★。o1发布于2024年9月★★◈★，此前从未被国内AI公司迫近★★◈★，直到R1横空出世★★◈★。

　　更重要的是★★◈★，DeepSeek只花费了相当于OpenAI零头的资金★★◈★、资源★★◈★，就拿出了堪与o1比肩的产品★★◈★。

　　DeepSeek并未公布R1的训练成本★★◈★。可供参考的是★★◈★，去年12月底★★◈★，DeepSeek发布V3模型人族无敌3★★◈★，与OpenAI的GPT-4o性能接近★★◈★，使用2048块英伟达H800芯片★★◈★，耗费约560万美元★★◈★。相比之下★★◈★，GPT-4o使用上万块英伟达H100芯片（性能优于H800）★★◈★，训练成本约1亿美元★★◈★。

　　V3★★◈★、R1不到一个月接连降生★★◈★，除了震动业界★★◈★，也让AI时代的卖卡王者闪了腰★★◈★。

　　1月27日美股交易中★★◈★，英伟达股价暴跌17%★★◈★。一天之内★★◈★，英伟达市值蒸发5940亿美元（约合4.3万亿人民币）★★◈★，相当于跌掉了一个腾讯加一个美团★★◈★。

　　但长期来看★★◈★，芯片依然是AI大模型的发展基石★★◈★，英伟达作为这一领域技术壁垒最坚固的公司★★◈★，“卖铲者”的长期价值依然坚挺★★◈★。

　　面对DeepSeek 冲击波和其“小力出奇迹”的方法论★★◈★，笃信并践行“大力出奇迹”的字节跳动难免有点尴尬★★◈★。

　　自从2023年大举进军AI大模型以来★★◈★，字节一边挥舞着支票簿★★◈★，全球大手笔求购芯片★★◈★；一边快速扩充AI业务矩阵★★◈★，先后发布十几款大模型★★◈★，外加十几个AI应用★★◈★。无论是资金★★◈★、资源★★◈★、人才投入★★◈★，还是AI产品矩阵和业务条线的数量★★◈★，字节均遥遥领先其他国内大厂★★◈★。

　　时至今日★★◈★，字节在AI大模型领域的“大力出奇迹”收到了一些效果★★◈★。根据量子位智库的数据★★◈★，截至2024年11月底★★◈★，字节旗下豆包APP的累计用户超1.6亿★★◈★，日活跃用户接近900万★★◈★，全球范围内仅次于ChatGPT★★◈★。

　　但“小力出奇迹”的DeepSeek★★◈★，让字节看似无可置疑的“大力”打法遭遇“破壁人”★★◈★。

　　字节此前依靠“大力出奇迹”★★◈★，在短视频★★◈★、电商★★◈★、本地生活★★◈★、游戏★★◈★、AI等领域开疆拓土★★◈★。但DeepSeek证明★★◈★，在技术创新的加持下★★◈★，“小力”同样可以创造“奇迹”★★◈★，这不仅揭示了一条新的技术路线凯发K8首页★★◈★，也蕴含着新的商业哲学★★◈★。

　　在这一层意义上★★◈★，梁文锋隔空“反对”张一鸣★★◈★。DeepSeek不仅在AI技术和产品上打破了旧思维★★◈★，也在不经意间点破了“大力出奇迹”并非放诸四海皆准的商业真理★★◈★。

　　在Janus-Pro发布前★★◈★，“小力出奇迹”的R1追平了o1★★◈★，已经让一众科技大佬惊叹不已★★◈★。同样“小力”的Janus-Pro★★◈★，有多厉害？

　　根据DeepSeek披露的信息★★◈★，新模型使用一种轻量级的分布式训练框架★★◈★，1.5B参数模型大约需要使用128张英伟达A100芯片训练7天★★◈★，体量更大的7B参数模型则需要256张A100芯片★★◈★，以及14天训练时间★★◈★。

　　以此推算★★◈★，依靠大幅压缩芯片使用量和训练时间★★◈★，Janus-Pro的模型训练成本（不含购买芯片等费用）可低至数万美元★★◈★，相当于一辆新能源车的价格★★◈★。

　　据介绍★★◈★，Janus-Pro是一种自回归框架★★◈★，它将多模态理解和生成统一起来★★◈★，将视觉编码解耦★★◈★，以实现多模态理解和生成★★◈★。它通过将视觉编码解耦为单独的路径来解决以前方法的局限性★★◈★，同时仍然使用单一★★◈★、统一的转换器架构进行处理★★◈★。这种解耦不仅缓解了视觉编码器在理解和生成中的角色冲突★★◈★，还增强了框架的灵活性★★◈★。

　　倘若看不懂上面这些拗口的技术名词★★◈★，不妨参考DeepSeek提供的几个实例★★◈★。

　　文生图方面★★◈★，输入“一条金色的寻回犬安静地躺在木质门廊★★◈★，周围洒满秋天落叶”★★◈★，或是“一个有雀斑的年轻女人戴着草帽★★◈★，站在金色麦田中”凯发K8国际登录★★◈★，★★◈★，Janus-Pro生成的图片都像模像样★★◈★。

　　至于图生文★★◈★，扔给Janus-Pro一张黄昏湖景照片★★◈★，提问“猜猜这是哪里”★★◈★，Janus-Pro能够判断出这是杭州西湖★★◈★，甚至点出了图中著名景点三潭印月岛★★◈★。

　　Janus-Pro继承了DeepSeek的优良传统★★◈★：开源★★◈★。它使用MIT协议（限制最少的开源协议之一）★★◈★，个人★★◈★、中小企业可以省不少钱★★◈★。另有AI开发者认为★★◈★，由于模型体量小凯发国际官网★★◈★，Janus-Pro可以在PC端安装★★◈★、本地运行★★◈★，有望进一步降低使用成本★★◈★。

　　DeepSeek再度证明★★◈★，“小力”做出来的东西★★◈★，并不意味着技术落后★★◈★、产品拉胯★★◈★，更不一定抠抠搜搜★★◈★，三步一个付费提示★★◈★，五步一个月卡优惠★★◈★。

　　根据公开信息★★◈★，DeepSeek于2024年前后推出Janus★★◈★，同年11月迭代至JanusFlow★★◈★。两个月后★★◈★，Janus-Pro上线★★◈★，在部分指标上已经具备与DALL-E 3扳手腕的能力★★◈★。

　　Janus-Pro横空出世★★◈★，揭示了大模型的各项成本——尤其是芯片成本——是可以被大幅压缩的★★◈★。或者说★★◈★，OpenAI★★◈★、谷歌★★◈★、字节们打惯了富裕仗★★◈★，过于“奢侈”和依赖“大力出奇迹”了★★◈★。

　　有趣的是★★◈★，在创下美国上市公司有史以来最大的市值蒸发幅度后★★◈★，英伟达回应称凯发K8首页★★◈★，“DeepSeek是一项卓越的人工智能进展”★★◈★，同时不忘给自己做广告★★◈★，称“推理过程需要大量英伟达GPU和高性能网络”★★◈★。

　　Janus-Pro再度展示DeepSeek“小力出奇迹”的威力★★◈★。相比之下★★◈★，国外秉持“大力出奇迹”的OpenAI★★◈★，近期却多少有点儿翻车★★◈★。

　　比如文生视频大模型★★◈★，去年2月OpenAI掏出Sora震惊全场★★◈★，随后却是长达10个月的“闭门造车”★★◈★。中美两国的AI公司纷纷趁机追赶★★◈★。

　　到了12月★★◈★，Sora总算正式上菜人族无敌3★★◈★，价格昂贵★★◈★，效果却一言难尽★★◈★，被不少用户吐槽甚至不如开源模型★★◈★。谷歌抓住机会★★◈★，掏出自家的Veo 2与Sora对比★★◈★，贴脸嘲讽★★◈★。

　　尽管丢掉了先发优势★★◈★，OpenAI仍然没有放弃堆芯片★★◈★、堆算力的“大力”路线★★◈★。

　　前几天★★◈★，OpenAI拉着软银★★◈★、甲骨文等公司★★◈★，宣布要成立AI公司“星际之门”★★◈★，未来四年投资5000亿美元★★◈★，用于AI基础设施★★◈★。OpenAI“一生黑”马斯克第一时间泼冷水★★◈★，声称“他们实际上没有钱”★★◈★，并言之凿凿称软银能够确保的资金远低于100亿美元★★◈★。

　　与OpenAI相比★★◈★，字节对于“大力出奇迹”的玩法更加精通★★◈★，效果也好得多★★◈★。

　　比如字节AI的核心产品——豆包大模型★★◈★，在知识★★◈★、代码★★◈★、推理等多项公开测评基准上★★◈★，最新的1.5 Pro版本得分优于GPT-4o★★◈★，以及DeepSeek-V3★★◈★。换言之★★◈★，豆包1.5 Pro的性能同样位列全球大模型第一阵营★★◈★。

　　就在DeepSeek成为焦点的这几天★★◈★，字节被曝出今年将投入超120亿美元用于AI基础设施★★◈★。其中★★◈★，55亿美元将被用于购买芯片★★◈★，68亿美元将被用于海外投资★★◈★。

　　字节随后回应称★★◈★，相关消息并不准确★★◈★。字节非常重视AI领域的发展与投入★★◈★，但相关预算与规划传闻并不正确★★◈★。

　　AI大模型技术仍处于快速迭代阶段★★◈★，公司投入巨资研发★★◈★、训练的新模型凯发K8首页★★◈★，可能几个月甚至几个星期后就不再领先★★◈★。这意味着★★◈★，如果字节沿着“大力出奇迹”的思路做AI★★◈★，每年都需要砸下巨资★★◈★。

　　这或许也从侧面解释了★★◈★，字节发展AI大模型★★◈★，为何从一开始就格外注重商业化★★◈★。

　　背靠抖音★★◈★、今日头条★★◈★、飞书等业务板块★★◈★，字节AI大模型不愁找客户★★◈★，豆包使用量节节攀升★★◈★。字节火山引擎总裁谭待曾透露★★◈★，去年5月豆包大模型日均tokens为1200亿★★◈★，12月15日突破4万亿★★◈★，7个月里增长超过33倍★★◈★。

　　另据界面援引知情人士言论称★★◈★，豆包大模型经过多次降价后★★◈★，毛利润率依然为正★★◈★；豆包1.5 Pro的毛利润率高达50%★★◈★。

　　但上述知情人士透露★★◈★，由于研发投入巨大★★◈★，字节AI大模型业务仍处于亏损★★◈★。只有持续扩大应用侧的模型调用规模★★◈★，才能长期摊销掉研发成本★★◈★。也就是说★★◈★，字节仍然需要继续推动“降价-拉来更多客户-获得更高收入-提高利润空间-降价”的飞轮★★◈★。

　　相比之下★★◈★，DeepSeek背靠的幻方量化是国内顶级私募之一★★◈★，并不缺少资金★★◈★。但DeepSeek不仅不烧钱★★◈★，还想办法改进技术来省钱★★◈★，最终实现“小力出奇迹”★★◈★。

　　DeepSeek去年初露峥嵘后★★◈★，OpenAI的奥特曼在社交媒体上发帖★★◈★，暗中吐槽V3大模型缺少真正的创新★★◈★，只是在复制有效的东西★★◈★。

　　从技术角度来看★★◈★，奥特曼这番话未必毫无道理★★◈★；但从技术理念和企业哲学来看★★◈★，DeepSeek无疑给AI大模型领域注入了新鲜空气★★◈★。它不仅“小力出奇迹”★★◈★，更“节省出奇迹”“开源出奇迹”★★◈★。这套不讲“传统武德”的组合拳★★◈★，已经让买芯片★★◈★、堆算力的外国同行闪了腰★★◈★，也让字节的“大力出奇迹”路线值得再度审视★★◈★。

　　字节是“大力出奇迹”打法的受益者★★◈★。如今★★◈★，DeepSeek却成了它的“破壁人”★★◈★。

　　“大力出奇迹”打法的基本逻辑是★★◈★，找到最热的赛道★★◈★，快速推出产品★★◈★，然后注入远超对手的资金和流量★★◈★，将其“催熟”★★◈★，从而占据优势市场地位★★◈★、获得超额回报★★◈★。字节的主要业务——今日头条★★◈★、抖音★★◈★、TikTok等业务★★◈★，都在“大力”的推动下★★◈★，成为各自领域的领头羊★★◈★。

　　比如红果短剧★★◈★，据QuestMobile测算★★◈★，2024年3月★★◈★，红果短剧的MAU约为5400万★★◈★；当年11月★★◈★，已经突破1.4亿★★◈★，净增约9000万★★◈★。一年增长近亿MAU★★◈★，红果短剧显然离不开抖音乃至整个字节的托举★★◈★。

　　在海外★★◈★，号称“海外版小红书”的Lemon8★★◈★，也在TikTok面临危局时大规模投流★★◈★，下载量暴增★★◈★，一度被视为字节的海外B计划★★◈★。

　　而在AI领域★★◈★，浙商证券在去年底的一份报告中估算★★◈★，2024年字节在AI上的资本开支高达800亿元★★◈★，接近百度★★◈★、阿里和腾讯的总和（约 1000 亿元）★★◈★。预计2025年★★◈★，这一数字将翻倍至1600亿元★★◈★，其中AI算力采购900亿元★★◈★，数据中心基建和网络设备则占700亿元★★◈★。

　　字节“大力出奇迹”吃过不少败仗★★◈★，比如游戏凯发K8首页★★◈★、教育★★◈★、PICO等★★◈★。但作为字节的底层方法论之一★★◈★，“大力出奇迹”并没有被舍弃★★◈★。同时★★◈★，红果短剧等新产品的成功★★◈★，也证明这套方法论仍然有效★★◈★。

　　但“大力出奇迹”要想充分发挥威力★★◈★，需要外部环境存在这样的特征★★◈★：技术创新的重要性★★◈★，远不如资金资源★★◈★。

　　在技术发展平稳期★★◈★，企业往往会发现自己身处这样的环境★★◈★。近些年★★◈★，移动互联网技术基本没有大突破★★◈★，哪家公司钱更多★★◈★、资源更丰富★★◈★，就更有能力抢占更多市场和利润凯发K8旗舰厅★★◈★。“大力出奇迹”不仅有效★★◈★，几乎成为不得不选的答案凯发K8国际娱乐官网入口★★◈★。★★◈★。

　　但一旦技术有了飞跃式突破★★◈★，资金资源就会退居次席★★◈★。这样的故事★★◈★，已经在新能源车★★◈★、商业航天领域发生过★★◈★，如今正在AI大模型赛道重演★★◈★。

　　在这一层意义上来说★★◈★，“小力出奇迹”的DeepSeek★★◈★，打破了字节乃至中国互联网的执念和迷思★★◈★。R1等新模型的强力表现★★◈★，让技术再度压倒流量人族无敌3★★◈★、资金★★◈★、人力等★★◈★，成为企业和行业发展的主要驱动力★★◈★。

　　家底丰厚的DeepSeek并非被迫省钱★★◈★，而是有意控制投入凯发K8首页★★◈★，将“小力出奇迹”视为一种更高层次的商业哲学★★◈★，而非应对资金紧张的举措★★◈★。这也意味着★★◈★，大模型并非只是“大厂游戏”★★◈★。中小厂完全可以用更少的芯片和费用★★◈★，做出更好的产品★★◈★，进而得到市场和投资者的认可★★◈★。

　　相对应的是★★◈★，AI大模型公司的发展潜力和投资价值★★◈★，也不应与所持有的芯片数量强绑定★★◈★。“小力出奇迹”的价值不仅在于技术★★◈★，也让大厂主导的“大力”商业逻辑和价值体系发生动摇★★◈★。

　　在科幻小说《三体》中★★◈★，人类为了应对外星威胁★★◈★，炮制各类耗费巨大的战略计划★★◈★，却被小小的“破壁人”一语点破★★◈★。而在商业世界中★★◈★，忙于“大力出奇迹”的字节★★◈★、OpenAI们★★◈★，正在与DeepSeek扮演的“破壁人”正面相遇★★◈★。

　　人人都是产品经理★★◈★，《霸榜全球 AI 产品 Top100★★◈★、重启 App 工厂★★◈★，熟悉的字节跳动又回来了》

　　钛媒体★★◈★，《DeepSeek除夕炸场★★◈★！开源多模态模型发布凯发K8首页★★◈★，仅128颗A100训练★★◈★，英伟达市值减4.3万亿》返回搜狐★★◈★，查看更多

上一篇 : 凯发K8官网首页揭|km_v1.0.2.apk破解版5.7|秘今日头条新玩法！A

下一篇 : 凯发K8旗舰厅AG|俄罗斯victory day小孩|太原多家报纸取消双休日节假

电话：021-6658 3939 / 6658 1319 /13801750646

传真：021-6658 1315 邮编：200070

邮箱：ygh@anyustar.com

公司名称：上海凯发APP贸易有限公司备案号：沪ICP备19028935号-1

公司地址：中国上海市中山北路814弄17号协和大厦302座

如果您在浏览上海凯发APP贸易有限公司网站的过程中，如有任何疑问请及时联系我们，我们将以真诚的态度对待您的每一次访问、电话、每一封邮件、每一个留言、真诚期待您的光临！真诚期待与您合作！

联系我们

ABOUT US

上海凯发APP贸易有限公司

Shanghai Signking Trading Co.,

CASE

MESSAGE

Online Shop

PRODUCT

home