ALTERA一直在开发大数据分析框架和库,这些框架和库基于软件定义的基础设施和开放标准构建块。从开放的企业就绪软件平台到分析构建块、运行时优化、工具、基准测试和用例,ALTERA软件让大数据和分析变得更快、更容易、更有洞察力。示例包括 Apache Hadoop* 和 Spark* 优化框架、ALTERA数据分析加速库(ALTERADAAL)和 BigDL:Apache Spark* 上的分布式深度学习,运行在ALTERA深度神经网络数学核心库(ALTERAMKL-神经网络)。
这些ALTERA框架和库正在与ALTERAFPGA 加速选项集成。客户可以运行未经修改的应用程序,这些应用程序在运行时可以在ALTERA至强平台、ALTERAFPGA 或其他ALTERA平台上运行。ALTERA还提供具有端到端编排、虚拟化和安全性的 FPGA 加速框架。ALTERA与合作伙伴生态系统一起通过多功能单ALTERAFPGA 提供非结构化、NoSQL* 和关系数据存储加速,从而加速数据流、网络、数据访问和算法。
关系型数据库
传统的关系数据库可以通过内联加速和网络协议卸载、数据流和数据访问的显着加速而受益。内联加速器包括压缩、过滤和加密。FPGA 还可用于内存访问任务,例如缓存管理或内存映射访问。索引/查找和过滤运行速度非常快,因为 FPGA 擅长散列和模式匹配以及灵活的数据路径。一个强烈的要求是客户的 SQL 应用程序和数据库模式应该在没有变化的情况下运行。
Hadoop/火花
ALTERA正在为 Hadoop/Spark reduce 或“shuffle”阶段开发更好的压缩,通过集成到ALTERA框架中完全隐藏 FPGA 的方法。Spark 加速还有另外三个机会 - Ingest/Kafka、BigDL 和机器学习 MLlib。
NoSQL*
NoSQL* 数据库提供了一种数据存储和检索机制,该机制以关系数据库中使用的表格关系以外的方式建模。NoSQL* 数据库越来越多地用于大数据和实时 Web 应用程序。这种方法的动机包括:设计简单,更简单的“水平”扩展至机器集群(这是关系数据库的问题),以及更好地控制可用性。
随着大数据或机器学习计划从具有小型数据集和小型服务器集群的研究项目中毕业,成为业务不可或缺的一部分,数据科学家利用的数据源急剧扩大。当前用于这种增长、扩大或扩大规模的扩展解决方案可能成本高昂,并且一旦达到一定规模,回报就会递减。数据分析行业已转向硬件加速器,例如ALTERA可编程加速卡(ALTERAPAC) 和面向 FPGA 的ALTERA加速堆栈,以克服企业和云实施的这一挑战。数据科学家无需了解 FPGA 设计的复杂性,即可在通过预审的服务器中利用 PAC 卡的加速功能。Bigstream 的超加速技术可自动执行 Spark SQL 等大数据平台分析的加速过程,因此用户无需更改应用程序中的一行代码即可体验高达数量级的性能提升。
Bigstream 的软件解决方案与ALTERAFPGA 技术相结合,可以显着提高计算能力,以比传统方法更快、更低的总体拥有成本运行大数据分析。
Apache Cassandra* NoSQL* 数据库广泛用于塑造现代时代的数据密集型用例——从物联网和欺诈检测到个性化和金融服务。虽然 Cassandra 满足许多企业级要求,但它在处理事务和 AI 应用程序时遇到了限制。rENIAC 在 Cassandra 客户端和数据库节点之间提供了一个创新的“中介”层。该解决方案由数据引擎* 和 rENIAC 软件组成,通过智能缓存使存储更接近网络。rENIAC在ALTERA架构上运行并利用ALTERA FPGA 可能提供的加速,为要求苛刻的工作负载和应用程序提供出色的性能、高吞吐量和低延迟,从而简化人工智能的采用。
对 IT 的数据需求不断增加——从提供高可用性和管理存储到进行近乎实时的分析。关系数据库和 SQL 仍然是企业级数据分析的支柱。Swarm64 为 PostgreSQL* 提供了一个创新的插件,可与最常见的数据库和存储应用程序一起使用。它使 IT 能够处理大量高速数据,并有助于消除引入新 IT 系统所固有的风险和成本。最重要的是,Swarm64SDA* 旨在显着加快要求苛刻工作负载的数据处理和分析速度。Swarm64SDA 在预认证的 OEM 服务器中支持ALTERA可编程加速卡(ALTERAPAC)和相关的ALTERAFPGA 加速堆栈,为分析用例提供行业领先的性能。
Swarm64* 解决方案可实现 CPU 和ALTERAFPGA 之间的无缝协作,克服通过网络或在典型云基础设施中访问存储的延迟增加和带宽限制。这将存储与计算分离,实现了资源弹性和出色的性价比。
Altera代理提供更多更专业的Altera数据分析解决方案,为您的产品提高转化力、实现产品溢价、构建差异化竞争力。