服务热线:

13928851055

KAIYUN科技 | 大数据与人工智能 基础软件领导者

赋能数据未来,引领AI与大数据创新

KAIYUN(中国大陆)官方网站-创造最伟大的开云

行业脉动
热门资讯
联系我们

联系人:王经理

手机:13928851055

电话:13928851055

邮箱:sgbwre@163.com

地址:广州市天河南一街14-16号华信大夏四楼

行业新闻

对话亚马逊云科技:海外云为何会如此迅速接入一家中国大模型?企服国际观察

作者:小编 点击:835 发布时间:2025-02-25 12:13

  

对话亚马逊云科技:海外云为何会如此迅速接入一家中国大模型?企服国际观察(图1)

  2023年10月,全托管生成式AI服务Amazon Bedrock正式可用时,一家中国媒体曾提出疑问:未来亚马逊云科技会不会接入基于中文语料库的大模型?彼时,问题尚无定论。

  2024年5月,亚马逊云科技的另一款早先入华的机器学习平台Amazon SageMaker Jumpstart上线了两款中文大模型:零一万物、百川智能。其后亚马逊云科技又陆续上线了智谱等更多中文模型。

  “很多中国企业在调用海外区域的模型支持其出海业务。从尝试性的角度来看,中国区域客户的需求也是非常高涨的,他们希望通过尝试各种大小的DeepSeek模型实现快速部署。”就在DeepSeek-R1接入亚马逊云科技平台之际,亚马逊云科技大中华区产品技术总监王晓野向钛媒体透露了这场变局中的客户洞察。

  目前DeepSeek-R1已经获得中美科技公司包括英伟达、亚马逊、微软、谷歌、阿里、百度等的支持。有的厂商推出了一键部署方案,有的厂商在此基础上还推出了低价方案及免费服务,有的芯片厂商为了适配DeepSeek还在进行大量工程化调优工作。王晓野所在中国区团队春节期间也加班加点,与海外团队协作,很快将DeepSeek上线。

  在王晓野看来,这离不开此前与DeepSeek社区从去年开始就已经有之的技术交流与合作,“我们在帮助客户应用DeepSeek模型的工程化实践一直没有间断过。”

  监测网站SimilarWeb数据显示,1月31日,尽管与ChatGPT相比有8倍之差,DeepSeek网站在美国的日访问量为240万次,在全球(不包括中国)的访问量为2920万次。而在DeepSeek服务器繁忙和频繁受到网络攻击的背后,是资源稳定性与网络安全性的略有不足。

  “按目前亚马逊云科技平台上的客户访问情况看,如果将DeepSeek横向对比来看,有点类似于同样开源的Llama。”王晓野指出。他强调,“开源开放这件事情,其实挺重要的。相对于闭源模型,开源模型会有更为广泛的客户,且增长速度也比较快。”

  2月24日,钛媒体获悉,DeepSeek R1和V3模型正式上线由西云数据运营的亚马逊云科技Marketplace(中国区),亚马逊云科技中国区域企业用户可以通过订阅硅基流动推出的SiliconCloud服务以调用模型API的方式直接使用模型,并且无Kaiyun官网中国需自己管理模型或算力。

  以DeepSeek对整个市场的搅动力度来看,2025年的人工智能竞赛只会更加激烈。

  首先是大模型的深度推理能力,继GPT-o1、DeepSeek-R1之后,各家大模型厂商也快速面世了不少推理模型,如阿里通义的QwQ,月之暗面的Kimi-k1,智谱的GLM-Zero,昆仑万维的Skywork-o1,以及最近xAI的Grok3 Reasoning。

  其次是训练成本问题,由于R1在达到o1大模型能力的情况下,描述了一个相对成本更低的训练过程,让外界理解到:通过技术优化实现低成本高性能的大模型并非不可能。

  此外还有模型开源。闭源和开源并不矛盾,商业公司为了维持商业模式和技术壁垒,会选择闭源,但同时又希望通过开源影响力快速触达客户。但OpenAI和百度的开源“变脸”也映射出:当开源与闭源模型质量相当,且差距不大的情况下,客户并不会为受限制的模型而付费,这件事情放在全球皆是如此。

  对于客户会关心的收费问题,目前DeepSeek面向企业客户,主要采取的是本地部署,按百万tokens输入价格进行收费,而借助亚马逊云、阿里云等云厂商开放的模型调用,则因各家云厂商的现阶段计费逻辑不同而略有差异。

  钛媒体注意到,亚马逊云科技、微软、谷歌尚未向云客户收取使用DeepSeek的费用。使用DeepSeek的客户只需为使用的云计算资源付费,有按计算资源付费和按Kaiyun官网中国算力资源转换过的token计费等多种方式。

  而这场抢滩DeepSeek商业化与工程落地背后,依然需要回答的是云厂商如何维护好云计算的护城河。

  近日,钛媒体就相关话题独家对话亚马逊云科技,以下是此次对线展现出的推理能力,会推动Agent落地,以及企业流程自动化的热潮;关注点也不应该只是推理,还有多模态。

  现在,R1相对来说是大家更关注的,同时全球范围内客户对R1模型都有了需求的激增。

  总结来讲,主要有几方面原因:一是技术报告写的非常扎实,思维链也比较清晰,R1达到了类似于o1的推理能力,我们也看到了比较好的效果;二是成本,在达到第一梯队大模型能力的情况下,描述了一个相对成本更低的训练过程;三是作为开源模型的影响力;四是客户需求迅速提升。这在都是摸着石头过河探索的当下是令人赞叹的。

  钛媒体:亚马逊云科技对于接入哪些中国模型,考量有哪些?为什么此次反应这么迅速?

  此前在V3发布前,我们业务团队就与DeepSeek背后社区进行交流。2024年4月Amazon Bedrock推出过一个功能叫做“自定义模型导入”,当时功能还在预览阶段时,最先上线的就是DeepSeek Coder模型,专门用于代码生成。

  钛媒体:部署一套满血版的话对客户而言成本非常高,那么从云厂商上线DeepSeek后,各家云厂商之间会有比较明显的差异化吗?

  但是未来看的话,以亚马逊云科技自身的实践为例,比如同样对开源模型Llama的支出,去年re:Invent发布了延迟优化的推理功能,其底层就是结合了我们的自研芯片Amazon Trainium2,将Llama的推理性能优化到了现阶段整个云厂商中的性能最优。

  钛媒体:去年亚马逊云科技也推出了自己的大模型Amazon Nova,像DeepSeek出现后会不会对亚马逊云科技自研大模型的思路产生一定影响或变化?

  Amazon Nova系列模型,比如Nova Micro适用于文本校验、简单翻译等场景,Nova Lite低成本多模态,适用于图像、视频、文本生成,提供的极致性价比到今天为止还是最好的。Nova还没有推出逻辑推理能力的模型,我目前对于接下来Nova会不会做这方面工作,还没有更多的Insight。

  第二个层面就是成本相对高的问题。尽管大家会模糊一些概念,就是模型的参数量越大,模型能力越强,所需的算力越多,这个逻辑下,企业针对场景选择智能还是性能,在性价比的问题上始终要做妥协和折衷。

  所以今天再去看DeepSeek的应用端,出现服务器响应问题的频率还是比较高的。虽然它在部署时对整个吞吐进行了优化,但底层算力或整个资源还是相对固定的。

  对于今天真正走到企业应用的客户而言,去体验的话,最好的方式肯定还是在云上。能够利用云上资源,以弹性的方式,不以拒绝客户的请求去实现一个比较好的服务可用性和连续性。这也是亚马逊云科技最近推出在Amazon Bedrock Marketplace、Amazon SageMaker Jumpstart上部署模型的原因。

  当然,企业关注的是选好模型,针对具体的场景选择正确的模型;定制私有数据;然后通过一系列工程手段去降低成本;再通过工具层面的能力去控制好模型的输出。比如尽管今天DeepSeek表现特别好,但它依然存在有害内容,以及幻觉问题,也需要一个成熟的工具Guardrail来保证应用层面的输出是正确的。此外还有端到端的加密安全。这些话题我们认为在未来随着企业兴趣的高涨会变成其非常关注的话题。

  同时,V3没有那么惊艳的原因,也是在于全球范围内还有不少的可选项,针对具体场景,大家可能都会有长有短。

  钛媒体:那么这个客户增量与之前亚马逊云科技上线的三方大模型相比,在速度层面会有明显的差异吗?

  因为相对于闭源模型,开源模型会有更为广泛的客户,比如一些典型的大企业,客户群广泛,且增长速度也比较快。

  钛媒体:基于亚马逊云科技使用DeepSeek的客户只需为计算资源和工具付费吗?计费模式是怎样的。这跟使用Llama大模型是否相同?在调用价格的竞争上有优势吗?

  钛媒体:跟token计费模式相比,对于客户、云厂商而言是否都会有一些利弊?

  钛媒体:预计今年整体的中美AI竞争会处于什么态势?这个阶段对云供应商/算力供应商会带来哪些影响?

  另外,我们会看到海外对负责任的AI和模型生成有害内容这一方面的使用,其担心会更大一些。以云厂商为首,大家都会加强这一方面的投入。

  如果预测DeepSeek下一步带来的影响,首先会给中国企业尤其是偏传统的企业,会有两个信号释放出来:一是成本,二是推理能力。模型推理,特别适合企业提效,比如代码生成、Agent自动化完成任务的场景,像现在Agent很多企业在尝试但还没有走到特别成熟的阶段。那么,R1所展现出的推理能力,会再次推动Agent的落地,以及企业流程自动化的应用热潮。

相关新闻
最新产品
在线客服
联系方式

热线电话

13928851055

上班时间

周一到周五

公司电话

13928851055

二维码
线