解锁FPGA的故障免疫密码

ops/2025/2/1 17:06:33/
aidu_pl">

图片

我们身处“碳基智能”大步迈向“硅基智能”序曲中,前者更像是后者的引导程序,AI平民化时代,万物皆摩尔定律。

越快越好,几乎适用绝大多数场景。

在通往人工智能的征程中,算力无处不在,芯片作用无可替代。

十六年前,就已宣称自己是一家软件公司的英伟达,现已登顶全球第一大市值公司的王位,3600000000000元,还是美刀。

具备软件编程灵活性,又拥有硬件高性能的FPGA,是软件同类,还是属于硬件一派?

有别于专用集成电路(ASIC)需要昂贵的掩膜生产费用,FPGA作为芯片家族成员中的重要成员,无需流片就可定制设计,快速部署使用。

也被称为“平民版”的ASIC。

尤其擅长小批量应用场景。

欧洲巨头空客公司,FPGA作为其数字设计的关键组件,广泛用于空间产品(Space products)、测试单元(Test units)、原型样机(Prototyping)等。

两大厂商、三种类型、十余款芯片型号。

在欧空局的哨兵2号卫星中,共使用249个ICs,其中FPGA的数量是149片,占比近六成之多。

图片

除了通信行业的头部大厂外,像单个客户一次采购金额在近十亿元量级、八万多片FPGAs,已经是行业较为少见的重磅事件。

一架先进F-35战斗机,大约使用3500个各类芯片,其中就包括208片FPGAs。

图片

Source:www.militaryaerospace.com

在航天航空、防务等关键且重要的领域,对先进工艺和技术趋势的影响力和掌控力,与上世纪70年代的巅峰期相比,不可同日而语。

现在所能做的,就大多是对商用芯片买买买。

出于成本考虑,FPGA被广泛用于卫星载荷平台、通信系统、无人机、雷达系统、导弹控制、船用装备、飞行器控制系统等。

Need for Assured FPGA Functionality

图片

Source:Systems Engineering- Critical to Defense Acquisition,2017

速度快慢,距离远近、大小和多少的衡量尺度,通常只是相对概念。

第一个古人类露西(Lucy),距今约320万年;比智人更早出现、脑容量更大的尼安德特人,大约是在数万年前,而人类创造高度文明,用时数千年。

太阳距离人类家园约15亿公里,阳光到达地球的时间大约8分20秒,与我们在手机刷个短视频的用时差不多,也就是随手分分钟的事。

地球在宇宙中的位置

图片

来源:科普中国,sina

数字芯片为代表的硅基智能,以2022年底ChatGPT的横空出世为标志,进入到全面爆发期,进展迅猛。

即便把时间拉长到从上世纪40年代开启的电子管时代开始,极速推进到被马斯克称之为强大得可怕的现阶段,也只是几十年而已。

AI平民化时代的极简进化史(1946-2024)

图片

来源:“无限空间:大音希声,大象无形”,复及科技

数字电路的语义和行为,在技术本质上,都是由0/1二进制实现的时域计算、或者空域计算模式,FPGA芯片更为特殊,两者兼有。

碳基生物离不开太阳,没有不行,太多不好。

硅基智能的芯片,则相反,越靠近,越要命。

太空恶劣运行环境

图片

Source:FPGA development in Defence and Space, Airbus 

借用月之暗面AI工具(Kimi)比较脑洞的话来描述,“FPGA内部的存储器就像是一个复杂的世界,密集的居民区(CRAM),高速主干道(BRAM),繁忙的市场(DRAM),用户的百宝箱(Flip-Flop)等”。

各类存储单元各自扮演重要角色,不仅是数据的“栖息地”,也是系统可靠性的基石。

相对而言,也更容易受外部运行环境影响,被动发生0->1或1->0数据改变,由位翻转(bit flip)诱发的“软错误”或“软失效”现象。

图片

处于出厂状态的FPGA,内部只是空白的门海阵列,位流(bitstream)是芯片物理结构的体现,承载硬件电路的若干创新。

这种创新首先属于FPGA厂商。

图片

既然是半定制的硬件可编程逻辑器件,可设计为类ASIC使用,最终体现在硬件电路层级的个性化应用设计,当然也是终端用户自己的。

相同的应用设计,载入到同一厂商不同器件后,实际的芯片物理结构也完全不同。

用户将FPGA定制为“自己芯片”的示意图


http://www.ppmy.cn/ops/154801.html

相关文章

Elasticsearch:如何搜索含有复合词的语言

作者:来自 Elastic Peter Straer 复合词在文本分析和标记过程中给搜索引擎带来挑战,因为它们会掩盖词语成分之间的有意义的联系。连字分解器标记过滤器等工具可以通过解构复合词来帮助解决这些问题。 德语以其长复合词而闻名:Rindfleischetik…

集合的奇妙世界:Python集合的经典、避坑与实战

集合的奇妙世界:Python集合的经典、避坑与实战 内容简介 本系列文章是为 Python3 学习者精心设计的一套全面、实用的学习指南,旨在帮助读者从基础入门到项目实战,全面提升编程能力。文章结构由 5 个版块组成,内容层层递进&#x…

Fort Firewall:全方位守护网络安全

Fort Firewall是一款专为 Windows 操作系统设计的开源防火墙工具,旨在为用户提供全面的网络安全保护。它基于 Windows 过滤平台(WFP),能够与系统无缝集成,确保高效的网络流量管理和安全防护。该软件支持实时监控网络流…

【深度学习】常见模型-Transformer模型

Transformer 是一种深度学习模型,首次由 Vaswani 等人在 2017 年提出(论文《Attention is All You Need》),在自然语言处理(NLP)领域取得了革命性成果。它的核心思想是通过 自注意力机制(Self-A…

事务01之事务机制

事务机制 文章目录 事务机制一:ACID1:什么是ACID2:MySQL是如何实现ACID的 二:MySQL事务机制综述1:手动管理事务2:事务回滚点3:事务问题和隔离机制(面试)3.1:事…

消息队列篇--通信协议篇--WebSocket(WebSocket特点,HTTP升级到WebSocket,STOMP协议使用,通信类型分类,全双工通信等)

WebSocket通信是使用WebSocket的通信协议,它在2011年被IETF标准化为RFC 6455。WebSocket协议提供了一个在单个TCP连接上进行全双工通信的渠道,允许客户端和服务器之间保持持久连接,支持双向数据传输,使得服务器和客户端之间可以发…

Ubuntu 系统,如何使用双Titan V跑AI

要在Ubuntu系统中使用双NVIDIA Titan V GPU来运行人工智能任务,你需要确保几个关键组件正确安装和配置。以下是基本步骤: 安装Ubuntu操作系统: 下载最新版本的Ubuntu服务器或桌面版ISO文件。使用工具如Rufus(Windows)或…

如何实现网页不用刷新也能更新

要实现用户在网页上不用刷新也能到下一题,可以使用 前端和后端交互的技术,比如 AJAX(Asynchronous JavaScript and XML)、Fetch API 或 WebSocket 来实现局部页面更新。以下是一个实现思路: 1. 使用前端 AJAX 或 Fetch…