Dataflow Analysis

DFA Scheme

描述“数据流事实”在一个程序中的传递过程，程序通常包含无限数量的执行路径。
数据流事实（或值）是所有可能的具体程序行为的抽象，例如：
- 一个变量 v 可能具有具体值集合 {1, 2, 4, 5, 6, …} 中的一个值。
- 在数据流分析中不可能枚举所有情况。
抽象：v=NAC；
- NAC 是具体值集合 {1, 2, 4, 5, 6, …} 的一个抽象值。

The Worklist Algorithm

可达定义分析

例子如下

Available Expression

一个表达式x+y 在一个节点是可用表达式如果
- 从程序入口到节点的所有路径都计算了x+y
- 在到达点 p 之前的最后一次计算 x+y 之后，没有对变量 x 或 y 的后续赋值操作

活性变量分析

第一个是公用的表达式

第二个是循环里冗余的语句（这里面b + c值一直没变）

第三个部分冗余，循环的某些路径里有冗余

减少冗余

左侧是在另一个路径里也做一个相同的计算

右边是通过加一个新的块

但其实两者都是让t = b + c这个计算在其他路径也算了一次，这样每个path都做了这个计算，就可以进行消除冗余了

这个是另一个方法，把计算了b + c和没计算的路径彻底分开来，从而优化计算了b + c的那条，从而保证每一条路径的正确性

The Lazy Code Motion Problem

任何可消除的冗余表达式计算都将被消除，无需代码复制。
优化后的程序不会执行原始程序中未包含的任何计算。
表达式将在最晚可能的时间点进行计算。
- 步骤1：预期表达式（向后）
- 步骤2：可用表达式（向前）
- 步骤3：可推迟表达式（向前）
- 步骤4：已用表达式（向后）
预期表达式的定义：表达式 b+c 在程序点 p 处是预期的，如果从点 p 出发的所有路径最终都会计算该表达式，并且计算该表达式时使用的 b 和 c 的值在该点是可用的。