
1. 零内存占位符struct{}{}原理struct{}是空结构体Go 编译器对其做了特殊处理它在内存中不占任何空间大小为 0 字节。场景 A实现集合 (Set)map[string]struct{}。比起map[string]bool每个键值对能省下 1 字节。在千万级数据下这就是 10MB 的纯内存节省。场景 B信号通知done : make(chan struct{})。在协程同步时只通知“到了”不需要传具体值用它最省。2. 切片预分配make([]T, len, cap)原理如果不指定cap容量切片在append过程中会频繁触发动态扩容申请新数组 - 拷贝旧数据 - 销毁旧数组。骚操作如果你知道数据量比如你的 300 个内容永远使用make([]string, 0, 300)。效果全程只申请一次内存速度提升数倍且减少了产生内存碎片的几率。3. 结构体字段对齐Struct Alignment原理CPU 访问内存是按“字长”64位系统是 8 字节对齐的。如果字段顺序乱放编译器会为了对齐而填充空白字节Padding。对比// ❌ 糟糕占 24 字节 type Bad struct { A bool // 1 字节 // (填充 7 字节) B int64 // 8 字节 C bool // 1 字节 // (填充 7 字节) } // ✅ 骚操作只占 16 字节 type Good struct { B int64 // 8 字节 A bool // 1 字节 C bool // 1 字节 // (最后填充 6 字节) }口诀从大到小依次排列int64 - int32 - bool。4. 引用类型“传值”Map / Slice / Channel原理这三种类型底层都是 Header 结构包含指针。骚操作传参时直接传变量名不要加*号。效果避免了语法上的复杂性同时保持了纳秒级的传参速度只复制了几十个字节的 Header。5. 避免 Map 的 Value 中包含指针针对千万级大 Map原理Go 的垃圾回收器GC扫描 Map 时如果发现 Key 或 Value 里有指针就会进去扫描。千万级的 Map 如果存的是指针比如map[string]*UserGC 会压力山大导致程序卡顿STW。骚操作尽量存非指针类型比如map[int]int或map[string]MyStruct。如果数据很大可以把对象存入切片Map 只存切片的下标int。GC 发现 Map 里没指针就会直接跳过扫描性能起飞。6. 字符串与字节切片的“零拷贝”转换原理通常string([]byte)会发生内存拷贝。骚操作Go 1.20 标准库已优化使用unsafe包可以直接让string共享[]byte的底层数组。虽然现在unsafe用得少了但在处理超大数据流时这是省掉内存翻倍的关键。7. 这种 Map 其实能更小int代替string原理string在 Go 里占 16 字节一个指针加一个长度。如果你的千万级 Map Key 是可以转成数字的比如 ID用int做 Key。性能map[int]any比map[string]any查找速度快 30%~50%且内存占用更小。计算数字的 Hash 比计算字符串的 Hash 快得多。8. 内存池化sync.Pool原理如果你需要频繁创建和销毁临时对象比如每次请求都要创建一个 300 长度的切片或临时结构体频繁的堆内存分配会消耗 CPU 并增加 GC 压力。骚操作var slicePool sync.Pool{ New: func() any { return make([]string, 0, 300) }, } // 拿来用 tmp : slicePool.Get().([]string) // 用完还回去 slicePool.Put(tmp[:0])效果对象循环利用几乎实现“零内存分配”运行。9. 指针压缩用切片下标代替指针原理在 64 位系统上一个指针占 8 字节。如果你有千万个对象互相引用光指针就占掉 80MB。骚操作把所有对象存在一个大的[]User切片里引用时记录int32类型的索引下标。效果int32只占 4 字节内存直接省一半而且对 CPU 缓存Cache非常友好。10. 位运算标记Bitmask原理如果你有几十个布尔状态Switch不要开几十个bool字段。骚操作用一个uint64变量每一位bit代表一个开关。效果1 个字节能存 8 个状态。在千万级数据里这种对齐后的节省非常惊人。11. 数组访问的“边界检查消除”BCE原理Go 每次访问a[i]都会检查i是否越界。骚操作// 骚写法 _ a[2] // 先访问最大的下标 // 后面的访问编译器就知道肯定不会越界了不再检查 val1 : a[0] val2 : a[1]效果在超大规模循环中减少判断逻辑。12. 字符串拼接strings.Builder原理用拼接字符串每次都会产生新字符串并拷贝旧数据。骚操作永远用strings.Builder并配合Grow(len)提前分配内存。效果在大循环里拼接字符串效率比高出几个数量级。优化工具pprof和GODEBUG看内存长在哪了在代码里加一句import _ net/http/pprof。运行后访问http://localhost:6060/debug/pprof/heap你可以清晰地看到是哪一行代码占了那几百 MB 内存。看 GC 忙不忙运行程序时加上环境变量GODEBUGgctrace1 ./your_program。它会实时打印出 GC 的频率和耗时。如果看到gc 10 ... wall time 100ms说明你的 Map 已经让 GC 跑得很累了这时候就需要考虑上面的第 5 条避免指针优化了。