看到论坛里 LLVM 和 ML 的研讨，感觉非常有趣，本文简单概括整理一下相关内容。MLGO 和一些 LLM 相关的优化之前写过了，这里就不再重复。 由于数量比较多，所以写得会很简单，感兴趣可以点链接细看。

1、LLVM Pass Phase-Ordering

目标：通过调整 pass 的顺序，来优化程序性能。
背景：一般 llvm pass 的顺序是由开发者手写的，它对程序性能影响较大，是可优化项。
方式：使用强化学习来设置 pass 的顺序(不需要依赖运行时信息)。
训练集：LLVM test suite，按 4:1 划分为训练集和验证集。直接从 LLVM IR 的抽象特征中学习，使用 NCC embeddings 编码。
操作：从 pass 及其参数列表中选择一个来应用。操作历史会采用 one-hot 编码。
奖励：使用了新的顺序后，程序执行时间缩短。
结果：比 -O3 级别还优化了 32% 左右的性能。
缺点：泛化能力有限(基于 llvm test-suite 训练集)、训练成本高(需要编译和运行去对比，耗时夸张)、搜索空间大(pass 数量多，排列组合也多)、难以集成到编译流程里(会增加编译耗时)。

2、Autotuning Loop Transformation

目标：优化程序性能，这里是对循环优化来进行操作。
背景：传统的编译器依赖于固定的启发式算法(heuristics)，这些算法通常是通用性的，无法适应现代复杂硬件(如多核 CPU、GPU)的特定需求，导致生成的代码性能往往不如手动优化的版本。且不同的循环转换在组合起来后的效果难以预测。
操作：树形搜索，树根是没有优化的原始循环，每个树枝代表优化转换，而且树枝还能继续生长叠加。最后挑选一个优化组合路径，通过编译指示 pragma 插入代码中。
结果：性能提升 5 倍。
缺点：容易陷入局部最优，搜索成本高。