热点:

    英特尔Gaudi 2D AI加速器深度优化,高效运行DeepSeek Janus Pro模型

      [  中关村在线 原创  ]   作者:肖医
    返回分页阅读本文导航

    01英特尔Gaudi 2D AI加速器

    产品:酷睿 Ultra 9 285K Intel CPU

    近日,DeepSeek发布Janus Pro模型,其超强性能和高精度引起业界关注。英特尔® Gaudi 2D AI加速器现已针对该模型进行优化这使得AI开发者能够以更低成本更高效率实现复杂任务的部署与优化,有效满足行业应用对于推理算力的需求,为AI应用的落地和规模化发展提供强有力的支持。

    英特尔Gaudi 2D AI加速器深度优化,高效运行DeepSeek Janus Pro模型

    作为一款创新性的 AIGC模型DeepSeek Janus模型集成了多模态理解和生成功能。该模型首次采用统一Transformer架构突破了传统AIGC模型依赖多路径视觉编码的限制实现了理解与生成任务的一体化支持。在此基础上,Janus Pro通过优化训练策略和扩展模型规模,显著提升了文生图等功能的性能与稳定性,并提供了10亿参数和70亿参数两个版本,在性能与精度上展现了较强的竞争力。

    英特尔Gaudi 2D AI加速器深度优化,高效运行DeepSeek Janus Pro模型
    图片来源:https://github.com/deepseek-ai/Janus/blob/main/images/teaser_januspro.png

    Janus Pro统一的Transformer架构下,文生图模型的吞吐量高低已经从依赖加速器的高算力向充分利用HBM内存高带宽和大容量转换。英特尔® Gaudi 2D凭借 2.45TB/秒的高带宽和 96GB HBM 大容量内存,为 Janus Pro 模型提供了强大的计算支持,使其在生图批处理任务中,随着批量大小(Batch Size)的增加,吞吐性能得到显著提升,大幅缩短任务处理时间。

    与此同时,结英特尔Optimum-Habana 框架的优化,英特尔® Gaudi 2D显著提升了文生图任务的吞吐性能和推理效率,仅需约 10 秒即可生成16张高质量的图片,性能表现卓越而且,开发者仅需调整数行代码,即可实现这一结果,极大降低了开发门槛和迁移成本为 AI 应用的高效部署提供便利。

    英特尔Gaudi 2D AI加速器深度优化,高效运行DeepSeek Janus Pro模型
    图片来源:利用英特尔Gaudi 2D AI加速器运行DeepSeek Janus-Pro-7B模型生成

    此外,DeepSeek的蒸馏模型在至强和Gaudi平台上得到了支持,能够为客户创造更好总体拥有成本(TCO),推动AI的普惠。 

    一直以来,英特尔始终秉承开放的态度,并通过软硬件相结合的方式推动AI应用落地。目前,英特尔丰富的AI产品组合,包括英特尔®至强®处理器、英特尔®Gaudi AI加速器、英特尔®酷睿™ Ultra处理器和英特尔锐炫™显卡已经针对业界超过500个开源AI模型提供支持,广泛涵盖DeepSeek、Llama 3.1和通义千问等。同时,英特尔深耕开放生态,不仅以开放生态系统软件实现针对性优化,也通过打造企业AI开放平台(OPEA)为这些模型提供支持

    02Intel 酷睿 Ultra 9 285K详细参数

    返回分页阅读本文导航
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐经销商
    投诉欺诈商家: 010-83417888-9185
    • 北京
    • 上海
    周关注排行榜
    • 产品
    • 品牌
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错