DeepSeek和《哪吒2》，中国打出两个王炸？

近期，国产AI大模型DeepSeek与动画电影《哪吒之魔童闹海》（简称《哪吒2》）成为全球科技与文化领域的两大焦点。前者以低成本、高质量、开源等特点引发技术圈震荡，后者则以全球票房成绩和口碑争议掀起讨论热潮。公众情绪在赞誉与质疑间摇摆，但喧嚣背后更需要理性视角，我们相信答案不在营销神话中，而在持续验证与开放对话里。

本期，我们结合多方信源，看一看技术神话与票房奇迹背后的多元图景。

万物皆可接DeepSeek？

国内已部署DeepSeek模型第三方列表
全球1,000多万用户对各大AI大模型的打分排行
大模型幻觉率排行榜，DeepSeek靠后

《哪吒2》票房争议?

全球影史票房与中国电影出海票房
20部票房最高的外语电影
哪些城市更爱看《哪吒2》

万物皆可接DeepSeek?

近期，腾讯紧追DeepSeek热潮，不仅在“国民应用”微信中引入DeepSeek作为AI搜索工具，还宣布旗下数十余款产品接入DeepSeek；更不用提这股热潮倒逼百度开源文心一言、马斯克提前发布Grok 3。这些动态被解读为国产大模型技术突围，领先世界。那么是否有不同的声音呢？

1. 国内已部署DeepSeek模型第三方列表

信源：公众号“数字生命卡兹克”

科技自媒体“数字生命卡兹克”近日用飞书文档整理了一份已经接入DeepSeek- R1并向大众提供服务的平台（不含企业内部接入使用的平台）。这份《国内已部署DeepSeek模型第三方列表》于2月10日上线，并持续更新。

表格显示，自1月20日DeepSeek-R1模型发布至2月23日，国内已有119个第三方公司部署了DeepSeek。这些公司可被分为三类—— ——应用、云服务、硬件。

硬件：如东风汽车、宝骏汽车、长城汽车等。
应用：如腾讯元宝、QQ浏览器、蓝心小V（Vivo）、华安证劵、中国移动云盘等；
云服务：如阿里云、腾讯云、讯飞开放平台、中国电信研究院研发云、火山引擎（字节）等；

“数字生命卡兹克”在文中称，这种景象“可以说，DeepSeek已经不算是模型了，而是类似安卓的，一个全新的生态。”

信源链接：https://datakhazix.feishu.cn/wiki/TUWtwM8jIib6MGk63wQcGj7RnBh

参考信源：https://mp.weixin.qq.com/s/w96jab4RYP_XIZJG1c94lQ

2. 全球1,000多万用户对各大模型的打分排行

信源：lMArena AI

Chatbot Arena LLM （大语言模型机器人竞技场）排行榜是一个众筹形式的、由社区驱动的项目，由加州大学伯克利分校两个实验室SkyLab和LMArena的研究员们开发。这个项目对大模型的和它的排名并非是传统的测试题跑分，而是基于用户的真实对话体验，目前全球已有超过1,000万用户参与了投票。

榜单的核心机制是“竞技场”（Arena），用户打出一个问题，与两个匿名的大模型同时对话，然后根据自己的主观感受，投票选出哪个模型表现更优秀。用户在对话时，并不知道自己正在与哪两个模型对话，这有效地避免了品牌效应和先入为主的印象，使得评价更加客观。通过大量用户的投票数据，网站会使用“埃洛等级分系统”（Elo rating system）（这是一个由匈牙利裔美国物理学家阿帕德·埃洛创建的衡量各类对弈活动水平的评价方法，被广泛用于国际象棋、中国象棋、围棋、足球、篮球、电子竞技等运动），对参与竞技的LLM进行排名。

截至2月20日，项目共有206个大模型被测评，有超过260万用户投票。排行榜上共有170个模型，目前综合排名第一的是Grok-3（马斯克旗下xAI公司）；Gemini-2.0-Flash-Thinking（谷歌）、Gemini-2.0-Pro（谷歌）、ChatGPT-4o-latest（OpenAI）这三款并列第二；DeepSeek-R1位列第5，表现优异。

信源链接：https://lmarena.ai/?leaderboard

3. 大模型幻觉率排行榜

信源：Vectara Hallucination Leaderboard

幻觉（Hallucination）是评价AI大模型可靠性的重要指标，指的是模型在生成文本时，输出与事实相悖、或者缺乏根据的内容。幻觉率越低，说明模型生成的内容越可靠、越可信。

Vectara Hallucination Leaderboard 是一个开源的排行榜，旨在评估不同大模型的幻觉率，该排行榜的最后更新时间为2025年2月11日。AI公司Vetara通过搜集整理了831 份文档，让大模型根据文档中的事实生成摘要，然后评估摘要是否与源文档“事实一致”，最后使用Vetara 的商业幻觉评估模型 HHEM-2.1 来计算大模型幻觉排名。

在榜单上，DeepSeek-R1幻觉率高达14.3％，排名靠后。值得注意的是，DeepSeek的前两个版本DeepSeek-V2.5（2.4％）、DeepSeek-V3（3.9％）均比DeepSeek-R1的幻觉率要低。

幻觉率最低的前5名分别是：Gemini-2.0-Flash（0.7 %）、Gemini-2.0-Pro（0.8 %）、o3-mini-high-reasoning（0.8 %）、Gemini-2.0-Flash-Lite-Preview（1.2 %）、智谱AI 9B版本（1.3 %）

信源链接：https://github.com/vectara/hallucination-leaderboard