
DeepSeek和《哪吒2》,中国打出两个王炸?
近期,国产AI大模型DeepSeek与动画电影《哪吒之魔童闹海》(简称《哪吒2》)成为全球科技与文化领域的两大焦点。前者以低成本、高质量、开源等特点引发技术圈震荡,后者则以全球票房成绩和口碑争议掀起讨论热潮。公众情绪在赞誉与质疑间摇摆,但喧嚣背后更需要理性视角,我们相信答案不在营销神话中,而在持续验证与开放对话里。
本期,我们结合多方信源,看一看技术神话与票房奇迹背后的多元图景。
万物皆可接DeepSeek?
- 国内已部署DeepSeek模型第三方列表
- 全球1,000多万用户对各大AI大模型的打分排行
- 大模型幻觉率排行榜,DeepSeek靠后
《哪吒2》票房争议?
- 全球影史票房与中国电影出海票房
- 20部票房最高的外语电影
- 哪些城市更爱看《哪吒2》
万物皆可接DeepSeek?
近期,腾讯紧追DeepSeek热潮,不仅在“国民应用”微信中引入DeepSeek作为AI搜索工具,还宣布旗下数十余款产品接入DeepSeek;更不用提这股热潮倒逼百度开源文心一言、马斯克提前发布Grok 3。这些动态被解读为国产大模型技术突围,领先世界。那么是否有不同的声音呢?
1. 国内已部署DeepSeek模型第三方列表
信源:公众号“数字生命卡兹克”

科技自媒体“数字生命卡兹克”近日用飞书文档整理了一份已经接入DeepSeek- R1并向大众提供服务的平台(不含企业内部接入使用的平台)。这份《国内已部署DeepSeek模型第三方列表》于2月10日上线,并持续更新。
表格显示,自1月20日DeepSeek-R1模型发布至2月23日,国内已有119个第三方公司部署了DeepSeek。这些公司可被分为三类—— ——应用、云服务、硬件。
- 硬件:如东风汽车、宝骏汽车、长城汽车等。
- 应用:如腾讯元宝、QQ浏览器、蓝心小V(Vivo)、华安证劵、中国移动云盘等;
- 云服务:如阿里云、腾讯云、讯飞开放平台、中国电信研究院研发云、火山引擎(字节)等;
“数字生命卡兹克”在文中称,这种景象“可以说,DeepSeek已经不算是模型了,而是类似安卓的,一个全新的生态。”
信源链接:https://datakhazix.feishu.cn/wiki/TUWtwM8jIib6MGk63wQcGj7RnBh
参考信源:https://mp.weixin.qq.com/s/w96jab4RYP_XIZJG1c94lQ
2. 全球1,000多万用户对各大模型的打分排行
信源:lMArena AI

Chatbot Arena LLM (大语言模型机器人竞技场)排行榜是一个众筹形式的、由社区驱动的项目,由加州大学伯克利分校两个实验室SkyLab和LMArena的研究员们开发。这个项目对大模型的和它的排名并非是传统的测试题跑分,而是基于用户的真实对话体验,目前全球已有超过1,000万用户参与了投票。

榜单的核心机制是“竞技场”(Arena),用户打出一个问题,与两个匿名的大模型同时对话,然后根据自己的主观感受,投票选出哪个模型表现更优秀。用户在对话时,并不知道自己正在与哪两个模型对话,这有效地避免了品牌效应和先入为主的印象,使得评价更加客观。通过大量用户的投票数据,网站会使用“埃洛等级分系统”(Elo rating system)(这是一个由匈牙利裔美国物理学家阿帕德·埃洛创建的衡量各类对弈活动水平的评价方法,被广泛用于国际象棋、中国象棋、围棋、足球、篮球、电子竞技等运动),对参与竞技的LLM进行排名。
截至2月20日,项目共有206个大模型被测评,有超过260万用户投票。排行榜上共有170个模型,目前综合排名第一的是Grok-3(马斯克旗下xAI公司);Gemini-2.0-Flash-Thinking(谷歌)、Gemini-2.0-Pro(谷歌)、ChatGPT-4o-latest(OpenAI)这三款并列第二;DeepSeek-R1位列第5,表现优异。
信源链接:https://lmarena.ai/?leaderboard
相关信源:
https://paperswithcode.com/sota
https://www.datalearner.com/ai-models/llm-benchmark-tests
3. 大模型幻觉率排行榜
信源:Vectara Hallucination Leaderboard

幻觉(Hallucination)是评价AI大模型可靠性的重要指标,指的是模型在生成文本时,输出与事实相悖、或者缺乏根据的内容。幻觉率越低,说明模型生成的内容越可靠、越可信。
Vectara Hallucination Leaderboard 是一个开源的排行榜,旨在评估不同大模型的幻觉率,该排行榜的最后更新时间为2025年2月11日。AI公司Vetara通过搜集整理了831 份文档,让大模型根据文档中的事实生成摘要,然后评估摘要是否与源文档“事实一致”,最后使用Vetara 的商业幻觉评估模型 HHEM-2.1 来计算大模型幻觉排名。
在榜单上,DeepSeek-R1幻觉率高达14.3%,排名靠后。值得注意的是,DeepSeek的前两个版本DeepSeek-V2.5(2.4%)、DeepSeek-V3(3.9%)均比DeepSeek-R1的幻觉率要低。
幻觉率最低的前5名分别是:Gemini-2.0-Flash(0.7 %)、Gemini-2.0-Pro(0.8 %)、o3-mini-high-reasoning(0.8 %)、Gemini-2.0-Flash-Lite-Preview(1.2 %)、智谱AI 9B版本(1.3 %)
信源链接:https://github.com/vectara/hallucination-leaderboard
《哪吒2》票房争议
《哪吒2》的票房奇迹连日来引起众多争议,主要集中在:单一市场的高票房是惊艳全球还是圈地自嗨?我们找到一些不那么“狂欢”的信源。
1. 全球影史票房与出海榜
信源:猫眼专业版

据猫眼专业版“全球影史票房榜”显示,截至2025年2月23日18时,《哪吒2》全球票房已突破135亿元,位列全球影史第8高票房;海外票房仅1.15亿元,不到总票房的1%。
猫眼的“国产影片出海榜”显示,《哪吒2》目前以1,589.6万美元的海外票房位列第25。排名前5名的影片及海外票房成绩分别是:
- 《卧虎藏龙》(2000-李安),2.13亿美元
- 《英雄》(2002-张艺谋),1.49亿美元
- 《十面埋伏》(2004-张艺谋),8,002.0万美元
- 《赤壁(下)》(2009-吴宇森),7,481.7万美元
- 《赤壁(上)》(2008-吴宇森),7,437.9万美元
信源链接:猫眼专业版
https://piaofang.maoyan.com/i/globalBox/historyRank
其他信源:
Box Office Mojo 票房排行榜(数据更新不及时)
https://www.boxofficemojo.com/year/world/?ref_=bo_nb_in_tab
2. 20部票房最高的外语电影
信源:MovieWeb

美国影视资讯网站MovieWeb 于2024年1月22日发布了一份“20部票房最高的外语电影”榜单,聚焦于在美国市场上获得票房成功的非英语电影。
榜单上的电影来自不同的国家和地区,包括韩语、日语、法语、西班牙语、意大利语的电影。其中,三部中文电影榜上有名,包括《卧虎藏龙》《英雄》《霍元甲》。
信源链接:https://movieweb.com/non-english-movies-us-box-office-successes
3. 哪些城市更爱看《哪吒2》?
信源:城市数据团

2月6日,在《哪吒2》票房达到60亿元时,城市数据团发表了一篇数据分析文章,探讨哪些城市更爱看《哪吒2》。城市数据团获取了2017年1月1日到2025年2月5日晚24:00,每天、每个电影院、每部电影的人次、票房数据。将每一个电影院精确到区县,进行了计算。
城市数据团发现,截至2月6日,城市化率越高、平均受教育年限越高的城市,对《哪吒2》的偏爱程度相对更低一些。《哪吒2》最受欢迎的城市并不是一线城市,而是占中国人口大多数的四、五、六线城市。从近年来其他电影的数据来看,这些城市也是最能带动票房的城市。