Appearance
计算机硬件和指令
计算机硬件组成
计算机基本硬件系统由运算器、控制器、存储器、输入设备、输出设备5大部件组成。
运算器 + 控制器 = CPU(中央处理单元),是硬件系统核心。存储器分为内部(速度快容量小)和外部(容量大速度慢)。输入输出设备合称外设。
冯·诺依曼结构:将计算机硬件划分为上述 5 部分。DSP 常采用哈佛体系结构(程序和数据分开存储)。
专用处理器: GPU(数百/数千核并行计算)、DSP(实时数字信号处理)、FPGA(现场可编程门阵列)。
CPU 组成与功能
运算器
| 组件 | 功能 |
|---|---|
| ALU(算术逻辑单元) | 执行所有算术运算和逻辑运算 |
| AC(累加寄存器) | 存放运算结果或源操作数 |
| DR(数据缓冲寄存器) | 暂存来自内存的指令或数据 |
| PSW(状态条件寄存器) | 保存指令执行后的条件码(进位/溢出/零标志等) |
控制器
| 组件 | 功能 |
|---|---|
| IR(指令寄存器) | 暂存 CPU 正在执行的指令 |
| PC(程序计数器) | 存放下一条要执行指令的地址 |
| AR(地址寄存器) | 保存 CPU 当前访问的内存地址 |
| ID(指令译码器) | 分析指令操作码,识别操作类型 |
CPU 五大功能:程序控制、操作控制、时间控制、数据处理(最根本)、中断响应。
CPU 频率:主频 = 外频 × 倍频。外频是系统总线频率,倍频是主频与外频的比值。
速度排名:寄存器组 > Cache > 内存 > Flash。
处理器分类
🎯 一句话结论:ARM CPU 属于通用处理器,GPU/DSP/FPGA 均属于专用处理器,GPU 擅并行计算,DSP 擅实时数字信号处理,FPGA 可硬件重编程。
| 处理器 | 分类 | 核心特点 | 典型用途 |
|---|---|---|---|
| CPU(x86/ARM) | 通用 | 标量串行处理,适合复杂控制逻辑 | 桌面/服务器/手机 |
| GPU | 专用 | 数百~数千核,并行计算 | 图形渲染/AI训练推理 |
| DSP | 专用 | 哈佛结构,低功耗实时信号处理 | 音视频编解码/通信 |
| FPGA | 专用 | 硬件可重构,逻辑门可编程 | 原型验证/定制加速 |
🎯 一句话结论:DSP 采用哈佛结构(程序与数据分开存储,独立总线并行访问),区别于 CPU 的冯·诺依曼结构。
AI 芯片三种技术架构
🎯 一句话结论:AI 芯片主流架构 = GPU + FPGA + ASIC,分别对应通用可编程、半定制可重构、全定制高效能。
| 架构 | 灵活性 | 能效 | AI 应用特点 |
|---|---|---|---|
| GPU | 高(通用编程) | 中 | 训练+推理,生态最成熟(CUDA) |
| FPGA | 中(硬件可重构) | 高 | 推理加速,低延迟,可动态切换算法 |
| ASIC | 低(固定功能) | 最高 | 专用推理芯片(如 TPU、NPU),量产成本低 |
⚠️ 常见干扰项:SOC(System on Chip)是集成方式而非 AI 芯片架构;CPU 不是 AI 芯片的主流架构。
指令集授权模式
🎯 一句话结论:RISC-V 是开源免费指令集,无需授权;x86(Intel/AMD)和 ARM 均需商业授权。
| 指令集 | 授权模式 | 代表厂商 |
|---|---|---|
| x86 | 商业授权(封闭) | Intel、AMD |
| ARM | 商业授权(授权费+版税) | ARM 公司授权给苹果/高通/华为等 |
| RISC-V | 开源免费(BSD协议) | 任何人都可自由使用和扩展 |
| PowerPC | 商业授权 | IBM(历史,现较少见) |
| MIPS | 商业授权(现已开源部分) | 历史用于嵌入式/路由器 |
⚠️ 常见坑
| 易错点 | 正解 |
|---|---|
| ARM CPU 不是通用处理器 | ARM CPU 是通用处理器,GPU/DSP/FPGA 才是专用处理器 |
| AI 芯片架构选 SOC | SOC 是系统级芯片的集成方式,GPU/FPGA/ASIC 才是 AI 芯片三种技术架构 |
| RISC-V 需要授权 | RISC-V 是开源指令集,区别于 x86 和 ARM |