人工智能

火爆的DeepSeek究竟是什么?

2025-02-11 16:50:00 | 来源:企业IT培训

DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023 年 7 月 17 日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。

在硅谷,DeepSeek 很早就被称作“来自东方的神秘力量”,也是网上热议的“杭州六小龙”之一。

2024年底,DeepSeek 发布了新一代大语言模型 V3 ,同时宣布开源。测试结果显示,它的多项评测成绩超越了一些主流开源模型,并且还具有成本优势。

随后,在世界经济论坛 2025 年年会开幕当天,中国深度求索公司发布其最新开源模型 R1 ,再次引发全球人工智能领域关注。据该公司介绍,R1 模型在技术上实现了重要突破——用纯深度学习的方法让 AI 自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩美国开放人工智能研究中心(OpenAI)的 o1 模型正式版,该模型同时延续了该公司高性价比的优势。据了解,深度求索公司 R1 模型训练成本仅为 560 万美元,远远低于美国开放人工智能研究中心、谷歌、“元”公司等美国科技巨头在人工智能技术上投入的数亿美元乃至数十亿美元。

在海外出圈之后,DeepSeek 的服务需求激增。此前据媒体报道,DeepSeek旗下 AI(人工智能)服务经历了多次宕机,可能与新模型发布后的访问量激增有关。

标签: DeepSeek