1024程序员节- AI智能时代，码出未来

在 1024 程序员节这个特殊的日子里，探讨了 AI 技术在不同领域的应用与发展。上海和深圳作为科技创新的前沿阵地，相关活动中的演讲内容更是聚焦了 AI 技术的核心要点，为我们展示了 AI 时代的新趋势和新机遇。

一、AI 技术的发展历程与背景

AI 的发展历史悠久，从早期的语言模型以规则和统计方法为主，到神经网络的突破推动深度学习技术的快速发展，再到如今大型语言模型（LLM）的兴起，如 GPT 系列的不断演进，AI 技术已经取得了令人瞩目的成就。随着计算需求的增长，传统的计算架构面临着诸多挑战，例如冯诺依曼架构存在的 “功耗墙” 和 “存储墙” 问题，以及摩尔定律的放缓，都促使人们寻求新的计算技术和架构。

二、新型计算架构 —— 存内计算

（一）原理与优势

存内计算架构打破了存储单元与计算单元的物理隔离，基于不同存储器件的工作原理，在存储器内部实现计算功能。这种架构避免了数据搬运造成的高昂代价，有效解决了内存墙问题，更适合大数据量、大规模并行的 AI 计算场景。例如，知存科技的存内计算芯片在能效方面表现出色，相比传统的 CPU/GPU，可使带宽提升 20 倍，密度提升 30 倍，成本降低 10 倍。

（二）产品应用

知存科技的产品系列
- WTM - 2 系列：2022 年率先国际量产商用，是第一代存内计算 SoC，主要应用于端侧，算力小于 1Tops@Int8，参数小于 4M。基于该系列芯片的平台提供了智能语音和健康类的智能算法。
- WTM - 8 系列：新一代 3D 存内计算架构的视觉 AI 芯片，即将量产，主要应用于端侧和边缘侧。算力大于 24Tops@Int8，参数大于 64M，可赋能图像处理及空间计算，实现如分辨率提升、帧率提升等功能。
应用领域拓展
存内计算不仅在语音和图像处理领域有应用，还在其他多个领域展现出潜力。例如在神经网络系统中，可用于实现 ANN、CNN、RNN 等的高效运算，提升神经网络的速度和能量效率；在机器学习系统中，可应用于无监督学习和随机权重表示；在科学计算系统中，可高效实现离散微分方程、离散余弦变换等求解过程。

（三）实训案例 ——denoise demo

以知存科技的 denoise demo 为例，其开发过程展示了存内计算技术的实际应用。

硬件环境：使用 WTMDK2101 - X3 评估板，包含 WTM2101 核心板（存算芯片）和 I/O 板。
开发流程
- 模型训练：在 python 环境下训练降噪模型，经过一系列操作生成用于转换的模型文件。
- 模型转换：连接特定环境，准备输入文件并执行转换脚本生成 map 文件。
- 权重烧写：可选择使用 NPU 烧写板或 jlink ota 进行模型权重烧写。
- 工程编译与测试：安装知存 IDE 进行工程编译，下载到开发板后使用串口工具查看准确率输出，并进行灌数据测试。