服务热线:

13928851055

KAIYUN科技 | 大数据与人工智能 基础软件领导者

赋能数据未来,引领AI与大数据创新

KAIYUN(中国大陆)官方网站-创造最伟大的开云

行业新闻

DeepSeek开源MoE训练、推理EP通信库DpEP;微软发布量子计算新突破推出Majorana 1芯片

作者:小编 点击:638 发布时间:2025-02-28 22:07

  

DeepSeek开源MoE训练、推理EP通信库DpEP;微软发布量子计算新突破推出Majorana 1芯片(图1)

  6、大数据AI一体化开发再加速:阿里云DataWorks 支持GPU类型资源

  8、华为推出AI训推超融合(DeepSeek一体机),推进AI行业化落地

  近日,由灾备联盟信创工委会与安东工作室联合举办的“2024年度十大信创平台软件品牌”评选活动落下帷幕。星环科技以1824分的绝对优势登顶榜首,以全栈自研的技术实力和深度适配的生态体系,摘得国产大数据基础软件领域桂冠。

  星环科技专注于数据全生命周期管理,提供公司已形成大数据与云基础平台(TDH & TDC)分布式数据库(ArgoDB)、数据开发与智能分析工具(TDS & Sophon)、知识平台与领域大模型(TKH & 无涯)的软件产品矩阵等核心产品。

  在信创领域,星环科技通过深度适配国产操作系统(如银河麒麟、统信UOS)、芯片架构(鲲鹏、飞腾等)及软硬件生态,形成了自主可控的技术体系。星环科技的产品已覆盖金融、政府、交通、能源、制造、医疗等十余个行业,累计服务超1500家终端用户。

  DeepSeek 继续开源底层架构的创新——首个用于MoE模型训练和推理的 EP 通信库DeepEP。在分布式系统中(如多 GPU 训练环境),所有处理单元之间需要高效地传递数据。在MoE中,这点尤为重要,因为不同「专家」需要频繁交换信息。并且 MoE 模型容易在「专家并行」中出现负载不均衡,导致每个「专家」分到的算力不均,不重要的「专家」难以发挥应有的性能。

  高效通信减少了数据传输的瓶颈,计算核心的优化提升了处理速度,灵活的资源调度让计算和通信不互相等待。

  马斯克旗下的 xAI 正式发布了Grok 3模型。在LMSYS盲测中,Grok 3在代码、指令响应等各个方面排名第一,超过了Gemini-2 Pro、DeepSeek-V3、GPT-4o等模型。同时,Grok-3 mini也一同公布,它牺牲部分性能以换取更快的响应能力。推理版本的Grok 3 Reasoning Beta 支持深度思考,在最新的AIME竞赛中表现断层领先。对比模型中还包括了近期火爆的DeepSeek R1模型。不过,Grok-3 Reasoning 目前仍处于测试阶段。

  Grok 3 的训练累积使用了20万张 H100 显卡。xAI 表示,最大的挑战是让整个模型在海量的 H100 上进行训练,并保持一致性。xAI还带来了由Grok 3加持的DeepSearch,号称是下一代搜索引擎。该模型将自主像agent一样运作,理解用户提问背后的意图,并在互联网以及X中进行全面检索。

  备受关注的语音模式也有了进一步的公布。马斯克在直播中透露,语音模式将是 Grok 最好的体验之一。在发布直播尾声,xAI 还放出了一段语音模式的预览视频,其效果十分接近人类声音。语音模式预计在一周内发布早期版本。

  此外,Grok API 还将在未来几周内推出,包含推理模型和深度研究功能。xAI 还宣布,当 Grok 3 成熟稳定之后,大概几个月将会开源 Grok 2。

  近日,企业微信正式接入了 DeepSeek 满血版大模型,并支持腾讯混元大模型。同时,企业微信一次性发布了多项AI能力,包括「智能机器人」、「智能表格-客户跟进总结」等,旨在大幅提升企业内部协作和客户服务效率。

  企业微信的「智能机器人」功能全量上线,无需单独开发。管理员仅需设定好机器人角色、选定应用的AI大模型,如DeepSeek(陆续灰度开放)、混元模型等,即可一键创建专属「智能机器人」。每一位员工都可以从通讯录中添加这一内部工具,实现高效协作。

  此外,企业微信的「智能表格」客户跟进模板也迎来了 DeepSeek 的加持。在灰度范围中的企业可以在智能表格中调用 DeepSeek,自动生成「客户跟进总结」,进一步提升客户服务效率。

  这些新功能不仅提升了企业的运营效率,还为企业提供了更智能的管理工具。通过「智能机器人」,企业可以快速部署AI驱动的自动化工具,减少人工操作。而「智能表格」功能借助 DeepSeek 的强大能力,能够自动生成详细的客户跟进总结,帮助企业管理层更好地掌握客户动态,优化服务策略。

  随着 DeepSeek 和混元模型的不断优化,企业微信的AI能力将为更多企业提供更强大的支持。

  大数据AI一体化开发再加速:阿里云DataWorks 支持GPU类型资源

  在人工智能技术飞速发展的今天,“数据+算力”的有效结合已成为释放数据价值的关键途径。企业不仅需要处理海量数据,更需将数据转化为智能洞察,而传统方式自行部署和使用 GPU 资源高成本投入、运维复杂性和弹性不足的特点,让开发者从“大数据”迈向“Data+AI” 的关键跃迁陷入瓶颈。

  基于此,作为一站式智能数据开发治理平台,DataWorks 在积累和沉淀了阿里巴巴十余年大数据建设方法论和最佳实践的基础上,宣布其 Serverless 资源组支持 GPU 资源类型,以免运维、按需付费、弹性伸缩的 Serverless 架构,将大数据处理与 AI 开发能力无缝融合。

  这意味着开发者在创建个人开发环境时,可以选择GPU 类型的资源作为 Notebook 运行环境,以支持进行高性能的计算工作。在此基础上:开发者可在DataWorks 一个平台即可完成数据清洗、特征工程到模型训练/推理的全流程,无需跨平台迁移数据,真正实现 “Data+ AI” 一站式数据开发,让数据驱动的未来加速降临。

  DataWorks 作为阿里云上的一站式智能数据开发治理平台,面向大数据&AI协同开发场景,提供了交互式开发和分析工具Notebook。DataWorks Notebook具备灵活且可复用的数据处理和分析环境,增强了数据开发和分析体验的直观性、模块化和交互性,能够帮助用户轻松高效地进行数据处理、数据探索、数据可视化和模型构建。

  腾讯云数据库 PostgreSQL 近期推出新功能,允许开发者在 SQL 中直接调用大模型 API,无需复杂编码即可将智能问答、语义分析等功能无缝融入业务系统。凭借强大的扩展能力和灵活的生态集成,云数据库 PostgreSQL 正在成为快速部署 AI 应用的首选数据库之一。在大模型支持方面,除了 DeepSeek-V3 DeepSeek-R1,涵盖了混元、lke-text-embedding-v1、lke-reranker-base等多种AI能力,为企业提供了丰富的选择。主要优势包括:

  · 无缝集成AI能力:云数据库 PostgreSQL 通过插件 tencentdb_ai 直接对接混元、DeepSeek 等主流大模型,无需额外的中间件或复杂的配置。支持文本生成、向量检索、RAG 等场景,开发者仅需标准 SQL 即可完成集成。这种无缝集成使得用户能够更加便捷地利用大模型的强大功能,提升数据处理和分析的效率。

  · 自主管理私有数据:企业可将知识库存储在云数据库 PostgreSQL 中,结合向量插件实现高效检索,确保数据隐私与合规性。

  · 强大的智能化能力:大模型API的引入为应用使用 PostgreSQL 带来了强大的智能化能力。无论是自然语言处理还是复杂的数据分析,大模型都能提供卓越的性能和准确性,帮助用户从数据中挖掘更多有价值的信息。

  · 提高生产力:通过在云数据库 PostgreSQL 中直接调用大模型API,开发者可以大幅减少数据传输和处理的时间。这不仅提高了工作效率,还降低了系统的复杂性和维护成本。

  · 灵活的扩展性:tencentdb_ai插件支持多种大模型 API,用户可以根据具体需求选择最适合的模型进行调用。同时,插件的设计也考虑到了未来的扩展性,用户可以方便地集成新的大模Kaiyun型 API,保持技术的前沿性。

  华为DCS AI 解决方案针对 DeepSeek 本地部署推出FusionCube A3000 训推超融合一体机,以“数据-模型-应用”全流程创新,破解大模型落地难题,助力企业低成本、高质量推进AI行业化落地。主要优势包括:

  · 数据工程工具化:10倍效率释放数据价值。DCS AI方案组件 ModelEngine 实现数据清洗、标注、知识抽取全流程自动化,内置行业模板与智能标注助手,知识库构建效率提升10倍,让“海量数据”快速转化为高质量行业语料,为模型训练夯实根基。

  · 模型对接与应用对接标准化:小时级发布,敏捷响应业务。AI 训推超融合通过可视化编排平台与标准化 API 接口,打通模型与应用间的“最后一公里”。模型训练高效,从通用模型到行业专家模型,训练和精调过程高效,成本更优;应用对接标准化,可视化应用编排,开放生态,应用小时级发布。

  · 行业大模型精调:低成本炼出“高精度”。AI 训推超融合支持高效蒸馏与精调,基于 DeepSeek V3&R1等通用大模型,通过 CoT QA 数据自动生成、垂域知识定向注入等技术,仅需少量行业数据即可快速“蒸馏”出高精度行业模型,训练效率提升30%,成本降低50%,让“通才”变身“领域专家”。

  新一代核心交易系统是该证券企业实现关键核心技术自主、可控的重要工程。新系统需要数据库可以支持大量内存数据的持久化、复杂查询,以及外部系统数据导入、导出、归档等操作,且十分注重提升数据库服务的高可用性及数据高可靠性,并对应用层的响应时间提出严格要求,新系统要求应用层响应时间在100ms以下,上线ms以下,因此对数据库的功能、性能、安全性提出极大的挑战。

  为充分满足项目建设需求,达梦数据携手金仕达,为用户构建新一代证券分布式交易系统。新系统采用与交易所技术同源的分布式容错总线所构建,结合内存交易技术,使系统具备松耦合、低延时、高可用、易扩展、易接入、全信创等特点。同时,使用达梦数据主备集群 DMDataWatch、单机版数据库管理系统 DM8 以及达梦数据复制软件 DMDRS,实现对业务系统的升级改造。项目亮点包括:

  · 高并发高可用:基于达梦数据库和金仕达相关产品构建的新一代核心交易系统,容错总线万笔/秒,单节点委托并发处理能力可达18000笔/秒。由达梦数据主备集群作为基础支撑,实现数据实时同步和故障秒级切换,对应用无感知,保证了系统服务的连续性。

  · 多功能多保障:新一代证券核心交易系统对外支持上交所、深交所、北交所现货两融、期权等全系列业务,对内则通过达梦数据库的多权分立、强制访问控制、白名单等机制防止未经授权的访问和恶意操作,确保数据安全得到有效保障。

  · 易迁移易拓展:达梦数据复制软件 DMDRS 基于多种高性能数据处理技术,使数据同步更高效。系统应用层面上,金仕达总线万客户,并支持平行按需拓展。

  相比其他工具,Chat2Query能够对用户上传的大规模数据集进行理解和分析,摒弃繁杂的专业术语和查询语句,Chat2Query使得用户能够通过自然语言直接向数据库提问,并即时获得答案。

  Chat2Query 使用关系型数据库和向量数据库来分析用户的数据库,理解数据库的结构以及表、列和实体之间的关系。其中,向量数据库尤其重要,它存储了更复杂的高维数据,帮助 Chat2Query 更好地理解数据点之间的关系。Chat2Query 对数据了解得越多,提供的回答就越准确和深入。

  在数据上下文得到充分丰富后,用户即可开始提问。Chat2Query 会将你的问题转换为 SQL 查询,提取相关数据,并生成答案,通常还会附带直观的图表或图形,让信息更加清晰易懂。

  目前 Chat2Query 可以在销售业绩分析、客户洞Kaiyun察、供应链优化、财务报表分析等应用场景帮助企业做出更明智的决策。

  DeepSeek-R1 模型自发布以来,凭借开源特性与深度推理效果引发金融行业关注。目前,火山引擎已为包括国信证券、平安证券、易方达基金、华泰柏瑞基金、拉卡拉等60余家金融机构、支付公司及金融科技企业提供 DeepSeek 模型接入服务,加速大模型应用创新落地。从应用场景上看,券商、基金主要将 DeepSeek 模型用于投研投顾、产品销售、风控合规、客户服务与投教等业务场景。

  火山引擎针对不同诉求的金融客户匹配多样化的落地方案。针对期望通过API快速集成预训练模型的企业,火山方舟不仅提供有竞争力的价格,还在系统承载力、推理速度和部署安全三方面上强度——全网最高限流500万初始 TPM、平均30msTPOT 超低延迟,以及推理整个生命周期在安全沙箱中完成,确保用户Prompt会话数据无痕。

  针对想快速上线但面临算力不足、运维困难、数据合规限制等挑战的企业,火山引擎DeepSeek软硬一体方案,从算力、模型到应用开发平台全链路覆盖,开箱即用,采用私有化部署模式,数据全程本地处理,助力企业高效、安全实现数字化升级,降本增效。

  MongoDB, Inc.今天宣布已收购Voyage AI,该公司是支持下一代AI应用程序的先进嵌入和重新排序模型的先驱。将Voyage AI的技术与MongoDB集成,将使组织能够通过提供与运营数据深度集成的高精度和相关信息检索,轻松构建值得信赖的AI驱动的应用程序。

  Voyage AI的高级嵌入和重新排序模型使应用程序能够从高度专业化和特定领域的文本和非结构化数据中提取含义——从法律和财务文档到图像、代码和企业知识库。他们的模型受到 Anthropic、LangChain、Harvey和Replit等领先AI创新者的信任。值得注意的是,Voyage AI 的嵌入模型是 Hugging Face 社区中评价最高的零样本模型。

  MongoDB 首席执行官 Dev Ittycheria 表示:“人工智能有望改变每项业务,但其应用却因幻觉风险而受到阻碍。通过将先进的人工智能搜索和检索功能引入我们高度灵活的数据库,MongoDB 和 Voyage AI 的结合使企业能够轻松构建值得信赖的人工智能应用程序,从而产生有意义的业务影响。通过此次收购,MongoDB 正在重新定义人工智能时代对数据库的要求。”

  英特尔推出适用于数据中心和 AI 工作负载的带有 P 核的 Xeon 6 处理器

  富随着企业对基础设施进行现代化改造以满足人工智能等下一代工作负载的需求,高性能和高效的计算对于整个领域都至关重要——从数据中心到网络、边缘甚至PC。为了应对这些挑战,英特尔推出了配备性能核心 (P 核心) 的Xeon 6处理器,为最广泛的数据中心和网络基础设施工作负载提供业界领先的性能和一流的效率,从而创造无与伦比的服务器整合机会。

  英特尔最新的Xeon 6处理器在数据中心和网络产品组合方面都取得了重大进步。

  配备 P 核的英特尔 至强6700/6500系列处理器在各种企业工作负载中的平均性能比上一代高1.4倍,至强 6 也是 AI 系统的基础中央处理器 (CPU),与 GPU搭配使用时效果极佳,可作为主机节点 CPU。与第五代 AMD EPYC 处理器相比,至强 6 使用减少了三分之一的内核,在片上AI推理中性能提升高达1.5 倍。至强 6 处理器还可实现显著的每瓦性能效率,平均可对 5 年服务器进行5:1整合,在某些用例中可高达10:1,从而节省高达68%的总拥有成本 (TCO)。

  面向网络和边缘的英特尔至强 6 是一款专为高性能和高能效而设计的片上系统 (SoC)。它利用英特尔内置的虚拟化无线接入网络 (vRAN)、媒体、人工智能和网络安全加速器,满足人工智能驱动的世界中对网络和边缘解决方案日益增长的需求。借助英特尔 vRAN Boost,与前几代产品相比,至强 6 SoC 可提供高达2.4倍的 RAN 容量和 70% 的每瓦性能提升。此外,至强 6 是业界首款配备内置媒体加速器(英特尔媒体转码加速器)的服务器 SoC,与英特尔至强 6538N 相比,每瓦性能提升高达14倍。

  从工业自动化和物联网监控到人工智能分析,开发人员依靠时间序列数据来支持关键系统并做出瞬间决策。但随着工作负载的增长,挑战也随之增加:保持查询速度快、确保高可用性以及高效扩展而不增加运营复杂性。无需担心运营开销,公司就可以专注于从数据中获取价值。

  然而,要大规模实现这种性能水平,传统上需要复杂的多节点集群、手动性能调整和昂贵的基础设施投资。开发人员需要一种更简单、更高效的方法来保持高可用性和性能,而无需管理分布式系统的负担。

  对于运行 InfluxDB 2.7 OSS 的开发人员,读取副本提供了一种处理扩展工作负载的简单方法,即在不同的可用区创建主数据库实例的副本。这可以提高查询性能、可扩展性和可靠性,而无需管理多节点集群的复杂性。

  Read Replicas 的推出建立在 InfluxData 和 AWS 之间的合作伙伴关系之上。去年,两家公司推出了适用于 InfluxDB的Amazon Timestream,允许开发人员在AWS上本地运行开源 InfluxDB — 完全托管,没有自托管开销,并且能够在几分钟内开始使用。

  现在,借助读取副本,InfluxData 和 AWS 可以更进一步,让关键任务工作负载轻松实现可扩展性。

  这次合作让数据能够顺利从内部系统流入 Databricks,并转换成 Delta 表,以便通过 Mosaic AI 访问AI模型。Mosaic AI是Databricks通过一次重要收购获得的机器学习工具包。Gencore AI能够处理多种数据源,自动去除重复数据并过滤敏感信息,为 Databricks中的AI训练准备好数据集。此外,这种集成还让AI代理能够自主执行业务任务,同时保留原有的访问控制,并减轻如提示注入攻击等AI特有的威胁。

  简而言之,这次合作结合了 Securiti 的数据保护能力和 Databricks 的数据处理能力,为 AI 应用的安全高效开发提供了便利。

  在全球数字化浪潮之下,银行的服务模式快速变革、业务数字化转型加速,打造一个敏捷响应市场、快速扩容、稳定可靠的银行核心系统迫在眉睫。富融银行在腾讯云的支持下,依托微众银行自主开发的数字银行底座技术体系,成功上线了新一代银行核心系统。新核心系统的切换仅用时10个月,为香港银行核心系统升级树立了新标杆。

  一个成熟的银行切换核心就像“飞机在空中换引擎”,难度和风险极大。一方面,富融银行需要在符合监管要求和市场标准的前提下,完成涵盖零售存款、零售贷款、公司存款、公司贷款和外汇服务等五个核心银行业务领域的共150多个子系统的整合和改造。另一方面,从底层的数据中心选址到上层的应用程序,涉及大量的数据迁移和系统切换,并且需要尽可能地减少对用户的影响,确保原有的数据顺利转移至新的平台,以无缝集成用户数据。

  为确保银行核心系统的顺利切换,腾讯云为富融银行构建了全新的云计算环境,并通过腾讯云数据库TDSQL和腾讯云 TCE 等产品,提供强大的性能保障。其中,腾讯云数据库TDSQL提供稳固的底层支撑,其具备100%兼容数据库管理 MySQL 的特性,可与富融银行基于MySQL的业务系统无缝整合;强大的批量迁移能力也助力富融实现了无感迁移,极大程度上减少系统切换对用户的影响,确保业务的连续性和稳定性。面对平台部署、管理和兼容等挑战,腾讯云 TCE 展现出卓越的云平台能力,通过容器化部署大幅提升资源使用效率,可使资源成本降低40%, 业务恢复时间 RTO缩短至30分钟内,为业务连续性提供了可靠保障。腾讯云 TCE 亦支持多种非x86架构CPU,以满足富融银行多样化的硬件需求。

  在富融银行和腾讯云不懈努力下,富融银行在10个月间完成了新一代银行核心系统的升级,并且新系统上线小时窗口期内顺利将来自不同厂商的系统和数据迁移至新一代核心中,成功实现无缝升级。

  国家公共数据资源登记平台将于3月1日正式上线试运行。这一平台不仅是公共数据资源的管理系统,也是信息披露和资源发现窗口,全社会都可以来这里找数据、找产品。

  全国所有的公共数据资源都在国家平台登记?陈荣辉介绍,登记管理办法明确提出,登记机构执行全国统一的登记管理要求,按照行政层级和属地原则,提供规范化、标准化、便利化登记服务。直接持有或管理公共数据资源的党政机关和事业单位,应对纳入授权运营的公共数据资源进行登记。对未纳入授权运营范围的数据资源,以及利用被授权数据资源加工形成的数据产品和服务,都是鼓励进行登记。陈荣辉强调,登记主体也要按照属地原则,到相应登记平台进行资源登记,并不是所有登记都来国家平台进行。但需要说明的是,不少地方登记平台还正在建设,暂时无法提供属地登记服务,可以先行使用国家平台进行登记。

  各省级平台建设须遵循数据局制订的统一标准。在登记平台建设方面,陈荣辉表示,全国登记平台体系建设按照“一个标准,两级平台”的思路开展。国家数据局制订统一的登记技术和业务标准,负责建设国家登记平台,确保与各省级平台对接,实现登记信息互联互通和统一赋码。各省级数据管理部门牵头建设省级登记平台。目前,国家平台已经开发完成,正在进行部署和测试,3月1日正式上线运行。浙江等省级平台也开发完成,将与国家平台同步上线,其他省级平台将根据建设情况陆续上线。今年的目标是构建起职责明确、分工负责、运转有序的全国公共数据资源登记体系。

  登记平台将为公共数据开发利用提供两大助力。陈荣辉称,登记平台上线运行后,将发挥两个方面的作用:一个是服务性功能,供数单位可以通过登记平台发布数据资源和产品信息,用数单位可以来这里查找数据资源,未来还可以发布数据需求,从而更好地实现供需对接,为降低全社会用数成本、促进数据资源价值释放创造条件。另一个是管理功能,通过登记工作,掌握全国公共数据资源底帐,加强授权运营信息披露,促进授权运营规范化、透明化。

  2月21日,国家数据局综合司与公安部办公厅正式发布了关于印发《全国数据资源统计调查制度》的通知,自2025年1月开始实施,有效期3年。调查目的:贯彻落实《数字中国建设整体布局规划》工作部署,摸清全国数据资源底数,准确、及时、全面反映我国数据资源全貌,为国家分析数据发展趋势,制定促进导向政策和实施行业管理提供依据。

  近日,在2025海淀区经济社会高质量发展大会上,国家医疗保障局大数据中心举行了揭牌仪式,将于2025年第一季度落地北京市海淀区。据介绍,国家医保局大数据中心承担着医疗保障大数据的应用、管理、服务以及网络安全和信息化建设的重要任务,同时推动医疗保障领域的数字化转型,全国医保信息平台覆盖全国13.3亿参保群众、5000万家用人单位、93万家医院药店、1.79万家药耗企业、37.6万个药品耗材和每年600亿盒医保药品的终端追溯信息维护管理及应用。返回搜狐,查看更多

相关新闻
最新产品
在线客服
联系方式

热线电话

13928851055

上班时间

周一到周五

公司电话

13928851055

二维码
线