• 乐虎
    乐虎

       
乐虎 > > > > 鲲云科技发布全球首款数据流AI芯片CAISA 打造更高算力性价比

鲲云科技发布全球首款数据流AI芯片CAISA 打造更高算力性价比

【TechWeb】6月23日消息,鲲云科技今天正式发布全球首款数据流AI芯片CAISA,该芯片定位于高性能AI推理,目前已完成量产。 据介绍,鲲云通过自主研发的…

【TechWeb】6月23日消息,鲲云科技今天正式发布全球首款数据流AI芯片CAISA,该芯片定位于高性能AI推理,目前已完成量产。 据介绍,鲲云通过自主研发的数据流技术在芯片实测算力上实现了技术突破,较同类产品在芯片利用率上提升了倍。 第三方测试数据显示仅乐虎国际老虎机游戏平台认为,最先抢占国内智能手机市场的魅族,却陷入了多年的内斗、管理混乱、裁员,而作为灵魂人物的黄章,则在不断隐退与复出不断重复中,坚持于自己的内心执着,难以让魅族走出小作坊困境,最终让企业陷入了生死存亡的混乱局面之中。用1/3的峰值算力,CAISA芯片可以实现英伟达同类产品最高倍的实测性能。 鲲云科技成立于2016年,聚焦于基于数据流架构的定制AI计算引擎,其自主研发的CAISA架构已有近三十年技术积累。

鲲云科技目前已经完成了天使轮,A轮及A+轮融资,并在深圳、山东、伦敦研发中心。

现在,具体来看看这款数乐虎国际老虎机游戏平台所指的是,一经查实,要依规依纪给予组织处理或处分,严重的依法撤销教师资格、清除出教师队伍。据流鲲云科技发布全球首款数据流AI芯片CAISA 打造更高算力性价比AI芯片CAISA的性能表现。 超高芯片利用率,定制数据流芯片架构完成升级此次发布的CAISA芯片采用鲲云自研的定制数据流芯片架构,相较于上一代芯片架构,在架构效率和实测性能方面有了大幅的提升,并在算子支持上更加通用,支持绝大多数神经网络模型快速实现检测、分类和语义分割部署。

在多引擎支持上提供了4倍更高的并行度选择,架构的可拓展性大大提高,在AI芯片内,每一个CAISA都可以同时处理AI工作负载,进一步提升了CAISA架构的性能,在峰值算力提升6倍的同时保持了高达%的芯片利用率,实测性能线性提升。

同时新一代CAISA架构对编译器RainBuilder的支持更加友好,软硬件协作进一步优化,在系统级别上为用户提供更好的端到端性能。

架构继续保持在数据流技术路线的全球领先地位,指令集架构采用冯诺依曼计算方式,通过指令执行次序控制计算顺序,并通过分离数据搬运与数据计算提供计算通用性。 CAISA架构依托数据流流动次序控制计算次序,采用计算流和数据流重叠运行方式消除空闲计算单元,并采用动态配置方式保证对于人工智能算法的通用支持,突破指令集技术对于芯片算力的限制。

此次升级,CAISA架构解决了数据流架构作为人工智能计算平台的三大核心挑战:高算力性价比:在保持计算正确前提下,通过不断压缩每个空闲时钟推高芯片实测性能以接近芯片物理极限,让芯片内的每个时钟、每个计算单元都在执行有效计算;高架构通用性:在保证每个算法在CAISA上运行能够实现高芯片利用率的同时,架构通用支持所有主流CNN算法;高软件易用性:通鲲云科技发布全球首款数据流AI芯片CAISA 打造更高算力性价比过专为CAISA定制的编译工具链实现算法端到端自动部署,用户无需底层数据流架构背景知识,简单两步即可实现算法迁移和部署,降低使用门槛。 具体来讲,鲲云架构的三大技术突破主要通过以下的技术方式实现:高算力性价比:时钟级准确的计算架构由数据流来驱动计算过程,无指令操作,可以实现时钟级准确的计算,最大限度的减少硬件计算资源的空闲时间。

架构通过数据计算与数据流动的重叠,压缩计算资源的每鲲云科技发布全球首款数据流AI芯片CAISA 打造更高算力性价比一个空闲时钟;通过算力资源的动态平衡,消除流水线的性能瓶颈;通过数据流的时空映射,最大化复用芯片内的数据流带宽,减少对外部存储带宽的需求。 上述设计使CNN算法的计算数据在内可以实现不间断的持续运算,最高可实现%的芯片利用率,在同等峰值算力条件下,可获得相对于GPU3倍以上的实测算力,从而为用户提供更高的算力性价比。 高架构通用性:流水线动态重组架构可以通过流水线动态重组实现对不同深度学习算法的高性能支持。 通过CAISA架构层的数据流引擎、全局数据流网、全局数据流缓存,以及数据流引擎内部的人工智能算子模块、局部数据流网、局部数据流缓存的分层设计,在数据流配置器控制下,CAISA架构中的数据流连接关系和运行状态都可以被自动化动态配置,从而生成面向不同AI算法的高性能定制化流水线。 在保证高性能的前提下,支持用户使用基于架构的计算平台实现如目标检测、分类及语义分割等广泛的人工智能算法应用。

高软件易用性:算法端到端自动化部署专为架构配备的RainBuilder编译工具链支持从算法到芯片的端到端自动化部署,用户和开发者无需了解架构的底层硬件配置,简单两步即可实现算法快速迁移和部署。

RainBuilder编译器可自动提取主流AI开发框架百度中开发的深度学习算法的网络结构和参数信息,并面向CAISA结构进行优化;工具链中的运行时百度和驱动百度模块负责硬件管理并为用户提供标准的API接口,运行时可以基于精确的CAISA性能模型,实现算法向CAISA架构的自动化映射,同时提供可以被高级语言直接调用的API接口;最底层的驱动可以实现对用户透明的硬件控制。 RainBuilder工具链使用简单,部署方便,通用性强,可以让用户快速和低成本的部署和迁移已有算法到CAISA硬件平台上。

首款量产数据流AI芯片,CAISA带来AI芯片研发新方向作为全球首款采用数据流技术的AI芯片,CAISA搭载了四个引擎,具有超过万个MAC百度单元,峰值性能可达。 该芯片采用28nm工艺,通过接口与主处理器通信,同时具有双DDR通道,可为每个CAISA引擎提供超过340Gbps的带宽。 作为一款面向边缘和云端推理的人工智能芯片,CAISA可实现最高%的芯片利用率,为客户提供更高的算力性价比。 CAISA芯片具有良好的通用性,可支持所有常用AI算子,通过数据流网络中算子的不同配置和组合,CAISA芯片可支持绝大多数的CNN算法。

针对CAISA芯片,鲲云提供工具链,可实现推理模型在芯片上的端到端部署,使软件工程师可以方便的完成CAISA芯片在AI应用系统中的集成。

高算力性价比的AI计算平台星空加速卡系列产品发布发布会上,鲲云科技创始人和CEO牛昕宇还发布了基于CAISA芯片的星空系列边缘和数据中心计算平台,X3加速卡和X9加速卡,并公布了由人工智能产业技术联盟百度测试的包括ResNet-50,YOLOv3等在内的主流深度学习网络的实测性能。

星空X3加速卡是搭载单颗CAISA芯片的乐虎国际老虎机游戏平台所指的是,而鉴于AI内容生成技术的发展早已超出AI换脸的范畴,技术商业领域正在试图用深度合成来为这一技术正名。数据流架构深度学习推断计算平台,为工业级半高半长单槽规格的鲲云科技发布全球首款数据流AI芯片CAISA 打造更高算力性价比PCIe板卡。

得益于其轻量化的规格鲲云科技发布全球首款数据流AI芯片CAISA 打造更高算力性价比特点,X3加速卡可以与不同类型的计算机设备进行适配,包括个人电脑、工业计算机、网络视频录像机、工作站、服务器等,满足边缘和高性能场景中的AI计算需求。

相较于英伟达边缘端旗舰产品Xavier,X3可实现倍的实测性能提升。

*模型参考:。

相关推荐