F5搭载NVIDIA BlueField-3 DPU赋能加速 AI 应用交付
F5全新智能代理F5 BIG-IP Next for Kubernetes,搭载NVIDIA BlueField-3 DPU,变革AI工作负载的应用交付
西雅图,2024年10月28日 – F5(NASDAQ: FFIV)日前宣布推出BIG-IP Next for Kubernetes,一项全新的创新AI应用交付和应用安全解决方案,旨在为服务提供商和大型企业提供集中控制点,以加速、保护和简化流入和流出大型人工智能(AI)基础设施的数据流量。
该解决方案利用高性能NVIDIA BlueField-3 DPU提升对大型AI部署至关重要的数据中心流量效率。通过对网络、流量管理和安全性的集成视图,客户将能够最大化数据中心资源的利用率,同时实现最佳的AI应用性能。这不仅提高了基础设施的效率,且实现了更快、更敏捷的AI推理,并可最终提供增强AI驱动的客户体验。
F5 BIG-IP Next for Kubernetes是专门为Kubernetes环境设计的解决方案,并已在大型电信云和5G基础设施中得到验证。通过BIG-IP Next for Kubernetes,该技术现可提供针对领先AI用例的定制化服务,例如推理、检索增强生成(RAG)以及无缝的数据管理和存储。与NVIDIA BlueField-3 DPU的集成最小化了硬件占用空间,实现了细粒度的多租户,同时实现能源消耗优化,并提供高性能的网络、安全和流量管理。
F5与NVIDIA技术的集成将允许移动和固定线路电信服务提供商能够轻松过渡至云原生Kubernetes基础设施,以满足供应商日益增长的将服务功能适应至云原生网络功能(CNFs)模型的需求。F5 BIG-IP Next for Kubernetes通过将数据密集型任务卸载至BlueField-3 DPU,以释放CPU资源用于创收应用。该解决方案对于虚拟化RAN(vRAN)或MSO的DAA以及核心网络中的5G尤为有益,并为未来释放6G通信潜力奠定基础。
专为高需求服务提供商和大型基础设施设计的F5 BIG-IP Next for Kubernetes可带来以下价值。
●简化云规模AI服务的交付:BIG-IP Next for Kubernetes可与客户的前端网络无缝集成,显著降低延迟,同时提供高性能的负载均衡,以处理上亿参数AI模型及高达万亿次运维操作的海量数据需求。
●加强对AI部署的控制:该解决方案为现代AI网络提供了集中集成点,具有丰富的可观测性和细粒度信息。BIG-IP Next for Kubernetes支持HTTP之外的多项L7协议,确保在极高性能下实现增强的入站和出站控制。
●保护全新AI环境:客户可完全自动化AI训练和推理端点发现和安全功能。BIG-IP Next for Kubernetes还可将AI应用与针对性的威胁进行隔离,加强数据完整性和主权,同时解决现代AI环境中至关重要的加密能力。
F5首席技术官和人工智能官Kunal Anand表示,“AI的普及催生了对先进半导体和技术的空前需求。目前各大企业正在构建AI工厂,即为大规模训练AI模型及提供推理所需的强大处理能力而设计的高度优化环境,其速度惊人且具备最低延迟。而F5强大的应用交付和安全服务与NVIDIA的全栈加速计算形成了强大的生态系统。该集成解决方案覆盖从硬件加速层到应用界面的整个AI工作负载堆栈,为客户提供了增强的可观察性、精细化控制和性能优化。”
NVIDIA人工智能网络和安全合作伙伴高级总监Ash Bhalgat表示,“服务提供商和企业需要加速计算,以安全高效地在大规模云上交付高性能的AI应用。NVIDIA正在与F5合作加速AI应用交付,得以更好地确保由BlueField-3 DPU支持的峰值效率和无缝用户体验。”
IDC计算系统研究实践部研究副总裁Kuba Stolarski表示, “实现AI的潜力需要比行业以往准备更多的数据处理能力。对于许多公司而言,部署尖端的AI需要大量的基础设施建设,然而这些建设往往十分复杂且昂贵,使得高效和安全的操作比以往任何时候都更加重要。F5 BIG-IP Next for Kubernetes解决了大型AI基础设施的性能和安全问题。通过提供优化的流量管理,企业可在AI模型推理过程中获得更大的数据摄取性能和服务器利用率,这为AI应用用户带来了极大的客户体验提升。”
WWT人工智能、应用及API安全解决方案全球实践经理Todd Hathaway表示,“随着AI工作负载的爆炸式增长,企业对可扩展、优化以及增强控制的Kubernetes流量管理需求激增。随着F5将BIG-IP Next for Kubernetes直接部署在NVIDIA BlueField-3 DPU上,这使得该项已得到验证的技术现可允许大规模AI部署在理想接入点。WWT客户将能够得益于更大的数据摄取性能和GPU利用率,同时在推理过程中获得更好的用户体验,并获得战略控制点用于安全服务。借助WTT两家最具战略性的合作伙伴F5和NVIDIA的先进技术,我们得以进一步加强我们的全球网络安全使命,以提供卓越的数字安全。”
搭载NVIDIA BlueField-3 DPU的F5 BIG-IP Next for Kubernetes将于2024年11月上市。更多相关信息,请阅读F5的配套博客。
更多资源:
●F5博客文章
●技术合作专页
●NVIDIA博客文章
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。