研究

我愿向孩童一样感受这个世界，并分享自己的好奇心

109 个标签

2026-06-10

被美国制裁会有哪些影响？

三部分讲清美国制裁：一、九级强度阶梯，每一级会发生什么、有哪些案例；二、伊朗/朝鲜/俄罗斯三个典型被制裁国，普通人、官员、商人各自的处境；三、11 个中国相关案例——中兴、华为、晋华、昆仑银行、林郑月娥、三大运营商、山东茶壶炼厂、腾讯/宁德、上海黑英周帅。
- 美国制裁
- OFAC
- SDN 清单
- 实体清单
2026-06-08

算力指标全景：从 FLOPs 到 MFU，用近三代旗舰 GPU 把每个数字讲清

小写 FLOPs 是次数、大写 FLOPS 是速度；1 MAC ≈ 2 FLOPs；绝大多数 LLM 负载卡的是带宽不是算力。这篇按计算量/算力/访存/效率/部署五类，逐个指标给多个真实算例，全程用 A100→H100→B200→Rubin 的真实规格对照，并手画三代 GPU 的 Roofline。
- GPU
- Roofline
- FLOPS
- MFU
2026-06-03

苹果 AI 推理技术架构调研

2026 WWDC 在即，梳理苹果本地 AI 推理的两条路线(Neural Engine vs GPU + Neural Accelerator)、近几代硬件的算力与带宽演化，以及与英伟达在算力、显存、带宽、精度四个维度的对比。结论：苹果的优势在「本地、省电、跑得下大模型（尤其 MoE）」，而非密集大模型的极致吞吐。
- 苹果
- Apple Silicon
- 本地推理
- Neural Engine
2026-06-01

数据中心供电：供给侧与消费侧

AI 让电力一夜之间成了数据中心最贵的瓶颈。一边是「电从哪里来」——从公用电网到表后自建的燃料电池、燃气轮机、核电；另一边是「电花在哪里」——GPU、其他服务器组件、冷却、网络的占比分布。这篇是我对这个赛道供给侧与消费侧的一次梳理。
- 数据中心
- 电力
- 燃料电池
- 燃气轮机
2026-06-01

23 座旗舰 AI 数据中心概览

Epoch AI 的 Frontier Data Centers 数据库用卫星图 + 公开许可文件追踪了全球最大的 AI 数据中心。把已运营的 13 个 + 在建/规划的 10 个全部摊开：每一座的所有者、用户、容量、电力来源、资本结构、施工节奏。一份阶段性的「谁在搬山」名单。
- 数据中心
- AI 基建
- Epoch AI
- 超大规模
2026-05-21

NVIDIA GPU 编程生态全景 — 从 PTX 到 CuTe DSL 的抽象阶梯

PTX、CUDA C++、CUTLASS、CuTe、Triton、CuTe DSL — NVIDIA GPU 编程的全部入口都汇到 PTX → SASS 这同一条出口。把它们排成一条从「省事」到「极限」的连续阶梯，默认现成库、Python 写 Triton、C++ 上 CUTLASS、底层补 PTX，就把整个生态装进一个心智模型。
- GPU
- CUDA
- Triton
- CUTLASS
2026-05-21

CPU 与 GPU 里的存储 — 类型、工艺、为什么这样设计

从寄存器到机械硬盘把存储层次铺开 — SRAM / DRAM / HBM / Flash / HDD 各自的电路原理、制造工艺、归属哪块硬件，以及"为什么有的快、有的贵、有的断电就丢、有的容量大"这四个问题背后的同一条物理因果链。
- 存储
- 内存
- SRAM
- DRAM
2026-05-18

大语言模型中的低精度数据格式

一篇文章把 LLM 训练与推理用到的浮点 / 整数格式从位级别讲清楚 — 定义、动态范围、在 Transformer 中的实际位置、V100 到 Rubin 的硬件支持、Llama 4 与 DeepSeek-V3 的精度选择。
- LLM
- 数据格式
- 量化
- FP8
2026-05-16

英伟达的裂缝 — 一份看空 NVDA 的备忘录

四条结构性理由解释为什么看空英伟达 — 目标太明确的护城河、被 AI 编码侵蚀的 CUDA、专用化路线下的兼容性税、地缘漩涡中心的位置。叠加一条时间限制（HBM / CoWoS / ODM 整柜锁死给的 12–24 个月缓冲带），以及最终的市值倒挂回归 — 苹果与谷歌的生态价值上限本质上高于一颗芯片。
- 英伟达
- AI
- GPU
- 半导体
2026-05-12

AI 推理芯片光谱 — 通用 GPU 到模型刻片的七档专用化

从 NVIDIA GPU 到 Taalas 模型刻片，2026 年 AI 推理芯片在「通用 ↔ 专用」光谱上形成七档梯度。每往右一档速度涨 3-10×，灵活性切掉一块。光子的计算路线被衍射极限卡住，互联路线已规模化。
- AI 推理
- 芯片架构
- NVIDIA
- TPU
2026-05-11

CPU vs GPU 分布式计算 — 同一套 BSP 理论的两套工程实现

MapReduce 的 Reduce 与 NCCL 的 AllReduce 同源于 MPI;Spark stage 与 PyTorch DDP step 同源于 BSP。术语统一，工程约束发散 — 把容错、通信粒度、同步频率、编程模型逐列对照。
- 分布式
- GPU
- NCCL
- MPI
2026-05-11

GPU 架构十年演化与 CUDA 编程模型的同步膨胀

Pascal→Rubin 十年算力涨 2380×、CUDA Core 仅涨 10×；硬件复杂度全部被 Tensor Core 吸收，编程模型从 Thread 扩到五层，而 torch.matmul 一行没变。
- GPU
- CUDA
- NVIDIA
- Tensor Core
2026-05-11

现代数据工程生态的层级地图

按数据源 / 集成 / 处理 / 存储 / 查询 / 应用六层，把当前主流数据栈里的 16 个开源与商业项目逐个拆开，讲清发展、设计、用户与典型用法。
- 数据工程
- 数据栈
- Kafka
- dbt
2026-05-09

CoreWeave 与 Nebius — 两条 GPU 云的不同路径

两家 Neocloud 上市公司全景对比 — 矿工出身的 CoreWeave Q1 2026 收入 $2.1B / 积压 $99.4B,Yandex 重组而来的 Nebius ARR $1.2B / 微软 $17.4B 大单；创始故事、团队、业务、资本结构、与 Hyperscaler 的本质区别。
- GPU
- 云计算
- CoreWeave
- Nebius
2026-04-25

苹果的入口分发权

Apple 用入口分发权做 AI 多供应商采购，反向净流入 +\$18B / yr;Mac 成家庭算力中枢，智能眼镜 2027 上市押下一入口。
- 苹果
- AI
- 谷歌
- LLM
2026-04-22

八大量化交易流派

量化交易八大流派图鉴 — HFT、StatArb、CTA、宏观、因子、ML、事件驱动、加密，11 章 40+ 头部机构系统对照。
- 量化
- 对冲基金
- 投资策略
- 加密货币
2026-02-27

中国工业硬件的客厅化

从 DJI 到 Bambu 到 Hypershell — 工业级设备 2-3 个数量级价格压缩，把军工/实验室硬件搬进客厅的中国系统性打法。
- 大疆
- 消费电子
- 中国
- 机器人
2025-10-15

LLM 推理全过程的维度变化与核心公式

以 Llama 3 8B 为底，把 token ID → embedding → Transformer → 采样整条推理路径的维度流转与核心公式默写一遍。
- LLM
- Transformer
- 推理
- KV Cache