我愿向孩童一样感受这个世界,并分享自己的好奇心
三部分讲清美国制裁:一、九级强度阶梯,每一级会发生什么、有哪些案例;二、伊朗/朝鲜/俄罗斯三个典型被制裁国,普通人、官员、商人各自的处境;三、11 个中国相关案例——中兴、华为、晋华、昆仑银行、林郑月娥、三大运营商、山东茶壶炼厂、腾讯/宁德、上海黑英周帅。
小写 FLOPs 是次数、大写 FLOPS 是速度;1 MAC ≈ 2 FLOPs;绝大多数 LLM 负载卡的是带宽不是算力。这篇按计算量/算力/访存/效率/部署五类,逐个指标给多个真实算例,全程用 A100→H100→B200→Rubin 的真实规格对照,并手画三代 GPU 的 Roofline。
2026 WWDC 在即,梳理苹果本地 AI 推理的两条路线(Neural Engine vs GPU + Neural Accelerator)、近几代硬件的算力与带宽演化,以及与英伟达在算力、显存、带宽、精度四个维度的对比。结论:苹果的优势在「本地、省电、跑得下大模型(尤其 MoE)」,而非密集大模型的极致吞吐。
AI 让电力一夜之间成了数据中心最贵的瓶颈。一边是「电从哪里来」——从公用电网到表后自建的燃料电池、燃气轮机、核电;另一边是「电花在哪里」——GPU、其他服务器组件、冷却、网络的占比分布。这篇是我对这个赛道供给侧与消费侧的一次梳理。
Epoch AI 的 Frontier Data Centers 数据库用卫星图 + 公开许可文件追踪了全球最大的 AI 数据中心。把已运营的 13 个 + 在建/规划的 10 个全部摊开:每一座的所有者、用户、容量、电力来源、资本结构、施工节奏。一份阶段性的「谁在搬山」名单。
PTX、CUDA C++、CUTLASS、CuTe、Triton、CuTe DSL — NVIDIA GPU 编程的全部入口都汇到 PTX → SASS 这同一条出口。把它们排成一条从「省事」到「极限」的连续阶梯,默认现成库、Python 写 Triton、C++ 上 CUTLASS、底层补 PTX,就把整个生态装进一个心智模型。
从寄存器到机械硬盘把存储层次铺开 — SRAM / DRAM / HBM / Flash / HDD 各自的电路原理、制造工艺、归属哪块硬件,以及"为什么有的快、有的贵、有的断电就丢、有的容量大"这四个问题背后的同一条物理因果链。
一篇文章把 LLM 训练与推理用到的浮点 / 整数格式从位级别讲清楚 — 定义、动态范围、在 Transformer 中的实际位置、V100 到 Rubin 的硬件支持、Llama 4 与 DeepSeek-V3 的精度选择。
四条结构性理由解释为什么看空英伟达 — 目标太明确的护城河、被 AI 编码侵蚀的 CUDA、专用化路线下的兼容性税、地缘漩涡中心的位置。叠加一条时间限制(HBM / CoWoS / ODM 整柜锁死给的 12–24 个月缓冲带),以及最终的市值倒挂回归 — 苹果与谷歌的生态价值上限本质上高于一颗芯片。
从 NVIDIA GPU 到 Taalas 模型刻片,2026 年 AI 推理芯片在「通用 ↔ 专用」光谱上形成七档梯度。每往右一档速度涨 3-10×,灵活性切掉一块。光子的计算路线被衍射极限卡住,互联路线已规模化。
MapReduce 的 Reduce 与 NCCL 的 AllReduce 同源于 MPI;Spark stage 与 PyTorch DDP step 同源于 BSP。术语统一,工程约束发散 — 把容错、通信粒度、同步频率、编程模型逐列对照。
Pascal→Rubin 十年算力涨 2380×、CUDA Core 仅涨 10×;硬件复杂度全部被 Tensor Core 吸收,编程模型从 Thread 扩到五层,而 torch.matmul 一行没变。
按数据源 / 集成 / 处理 / 存储 / 查询 / 应用六层,把当前主流数据栈里的 16 个开源与商业项目逐个拆开,讲清发展、设计、用户与典型用法。
两家 Neocloud 上市公司全景对比 — 矿工出身的 CoreWeave Q1 2026 收入 $2.1B / 积压 $99.4B,Yandex 重组而来的 Nebius ARR $1.2B / 微软 $17.4B 大单;创始故事、团队、业务、资本结构、与 Hyperscaler 的本质区别。
Apple 用入口分发权做 AI 多供应商采购,反向净流入 +\$18B / yr;Mac 成家庭算力中枢,智能眼镜 2027 上市押下一入口。
量化交易八大流派图鉴 — HFT、StatArb、CTA、宏观、因子、ML、事件驱动、加密,11 章 40+ 头部机构系统对照。
从 DJI 到 Bambu 到 Hypershell — 工业级设备 2-3 个数量级价格压缩,把军工/实验室硬件搬进客厅的中国系统性打法。
以 Llama 3 8B 为底,把 token ID → embedding → Transformer → 采样整条推理路径的维度流转与核心公式默写一遍。
没有匹配的文章