《树莓派开发实战（第2版）》——2.2创建模型和运行推理：重回HelloWorld

本节书摘来异步社区《概率编程实战》一书中的第2章&＃xff0c;第2.2节&＃xff0c;作者&＃xff1a;【美】Avi Pfeffer&＃xff08;艾维·费弗&＃xff09;&＃xff0c;更多章节内容可以访问云栖社区“异步社区”公众号查看。

2.2　创建模型和运行推理&＃xff1a;重回Hello World

您已经概要了解了Figaro概念&＃xff0c;接下来看看它们是如何融合在一起的。您将回顾第1章的Hello World示例&＃xff0c;特别注意图2-2中的所有概念是如何出现在这个例子中的。您将关注如何从原子和复合元素中构建模型&＃xff0c;观测证据&＃xff0c;提出查询&＃xff0c;运行推理算法&＃xff0c;得到答案。

本章的代码可以两种方式运行。一种是使用Scala控制台&＃xff0c;逐行输入语句并获得即时响应。为此&＃xff0c;进入本书项目根目录PracticalProbProg/examples并输入sbt console&＃xff0c;将会看到Scala提示符。然后输入每行代码&＃xff0c;查看响应。

第二种方式是通常的方法&＃xff1a;编写一个包含main方法的程序&＃xff0c;该方法包含想要执行的代码。在本章中&＃xff0c;我不提供将代码转换为可运行程序的模板&＃xff0c;只提供与Figaro相关的代码。我将确保指出您需要导入的内容及将其导入的位置。

2.2.1　构建第一个模型

首先&＃xff0c;您将构建最简单的Figaro模型。这个模型包含一个原子元素。构建模型之前&＃xff0c;必须导入必要的Figaro结构&＃xff1a;

import com.cra.figaro.language._&＃96;&＃96;&＃96; 上述语句导入com.cra.figaro.language包中的所有类&＃xff0c;该包包含最基本的Figaro结构。这些类中有一个称为Flip。可以用Flip构建一个简单模型&＃xff1a;

val sunnyToday &＃61; Flip(0.2)&＃96;
图2-3解释了这一行代码。搞清楚哪一部分是Scala&＃xff0c;哪一部分是Figaro&＃xff0c;是很重要的。在这行代码中&＃xff0c;创建了一个名为sunnyToday的变量&＃xff0c;并赋值Flip(0.2)。Scala值Flip(0.2)是一个Figaro元素&＃xff0c;表示true值概率为0.2、false值概率为0.8的一个随机过程。元素是表示随机产生一个值的过程的数据结构。随机过程可能产生任意数量的结果。每个可能结果被称为过程的一个值。因此&＃xff0c;Flip(0.2)是可能取值为布尔值true及false的元素。总结起来就是&＃xff0c;您有了一个包含Scala值的Scala变量。该Scala值是Figaro元素&＃xff0c;它包含表示过程不同结果的任意个可能取值。

62a88a5ad8b541c188bb2dd250e4b193d301d622

在Scala中&＃xff0c;类型可以由另外一种描述其内容的类型参数化。您可能从Java泛型中已经熟悉了这个概念&＃xff0c;例如&＃xff0c;在Java中可以得到一个整数或者字符串的列表。所有Figaro元素都是Element类的实例。Element类由元素可能取值的类型参数化。这种类型称作元素的值类型。因为Flip(0.2)可以取布尔值&＃xff0c;Flip(0.2)的值类型为Boolean。这一事实的标记方法是&＃xff1a;Flip(0.2)是Element[Boolean]的一个实例。

关键定义
元素——代表一个随机过程的Figaro数据结构。

值——随机过程的一个可能结果。

值类型——代表元素可能取值的Scala类型。

关于这个简单模型有许多值得说明的地方。幸运的是&＃xff0c;您已经学到的知识适用于所有Figaro模型。Figaro模型通过取得和组合简单的Figaro元素&＃xff08;构件&＃xff09;创建更复杂的元素和相关元素集合而创建。您刚刚学到的元素、值和值类型的定义是Figaro中最为重要的定义。

在继续构建更复杂的模型之前&＃xff0c;我们先来看看如何用这个简单模型进行推理。

2.2.2　运行推理和回答查询

您已经构建了一个简单模型。我们运行推理&＃xff0c;查询sunnyToday为true的概率。首先&＃xff0c;需要导入将要使用的推理算法&＃xff1a;

import com.cra.figaro.algorithm.factored.VariableElimination&＃96;&＃96;&＃96; 上述语句导入所谓的“变量消除”&＃xff08;variable elimination&＃xff09;算法&＃xff0c;这是一种精确的推理算法&＃xff0c;也就是说&＃xff0c;它可以准确地计算您的模型和证据隐含的概率。概率推理很复杂&＃xff0c;所以精确的算法有时候需要花费很长时间&＃xff0c;或者耗尽内存。Figaro提供近似算法&＃xff0c;这种算法通常提供与准确答案大致相同的答案。本章使用简单的模型&＃xff0c;所以变量消除算法在大部分情况下可行。现在&＃xff0c;Figaro提供一个简单命令以指定查询、运行算法并获得答案。可以编写如下的代码&＃xff1a;

println(VariableElimination.probability(sunnyToday, true))&＃96;
上述命令打印输出0.2。您的模型只包含元素Flip(0.2)&＃xff0c;结果为true的概率为0.2。变量消除算法正确计算出sunnyToday为true的概率是0.2。

详细说来&＃xff0c;您刚刚看到的命令完成好几件工作&＃xff1a;首先创建变量消除算法的一个实例&＃xff0c;告诉实例查询目标是sunnyToday。然后运行算法并返回sunnyToday值为true的概率。这条命令还负责执行完毕的清理&＃xff0c;释放算法所用的任何资源。

2.2.3　构建模型和生成观测值

现在&＃xff0c;我们开始构建一个更有趣的模型。您需要一个Figaro结构——If&＃xff0c;因此要导入它。还需要一个名为Select的结构&＃xff0c;但是这已经随着com.cra.figaro.language导入&＃xff1a;

import com.cra.figaro.library.compound.If&＃96;&＃96;&＃96; 我们使用If和Select构建更复杂的元素&＃xff1a;

val greetingToday &＃61; If(sunnyToday,

Select(0.6 -> "Hello, world!", 0.4 -> "Howdy, universe!"),Select(0.2 -> "Hello, world!", 0.8 -> "Oh no, not again"))&＃96;&＃96;&＃96;

对此的思维方式是元素代表一个随机过程。在本例中&＃xff0c;名为greetingToday的元素代表着这样的过程&＃xff1a;首先检查sunnyToday的值&＃xff0c;如果为true&＃xff0c;选择“Hello&＃xff0c;world!”的概率为0.6,“Howdy, universe!”的概率为0.4。如果sunnyToday的值为false&＃xff0c;选择“Hello, world!”的概率为0.2&＃xff0c;“Oh no, not again”的概率为0.8。greetingToday是一个复合元素&＃xff0c;因为它由3个元素构建而成。由于greetingToday的可能取值为字符串&＃xff0c;所以它是Element[String]。

现在&＃xff0c;假定您已经看到今天的问候语是“Hello, world!”&＃xff0c;您可以使用一个观测值说明这一证据&＃xff1a;

greetingToday.observe("Hello, world!")&＃96;&＃96;&＃96; 接下来&＃xff0c;您可以根据问候语是“Hello, world!”算出今天是晴天的概率&＃xff1a;

println(VariableElimination.probability(sunnyToday, true))&＃96;
这条命令打印输出0.4285714285714285。注意&＃xff0c;结果明显高于前一个答案&＃xff08;0.2&＃xff09;。这是因为问候语是“Hello, world!”时&＃xff0c;今天是晴天的可能性高于其他情况&＃xff0c;所以证据支持今天是晴天。这一推理是贝叶斯法则的简单实例&＃xff0c;第9章将介绍这一法则。

您打算扩展该模型&＃xff0c;用不同证据运行更多查询&＃xff0c;所以应该移除变量greetingToday的观测值。用如下命令可以完成&＃xff1a;

greetingToday.unobserve()&＃96;&＃96;&＃96; 现在&＃xff0c;如果发出如下查询&＃xff1a;

println(VariableElimination.probability(sunnyToday, true))&＃96;
您将得到和指定证据之前一样的答案0.2。

在本节的最后&＃xff0c;我们进一步细化模型&＃xff1a;

val sunnyTomorrow &＃61; If(sunnyToday, Flip(0.8), Flip(0.05)) val greetingTomorrow &＃61; If(sunnyTomorrow,Select(0.6 -> "Hello, world!", 0.4 -> "Howdy, universe!"),Select(0.2 -> "Hello, world!", 0.8 -> "Oh no, not again"))&＃96;&＃96;&＃96; 您可以计算在有无关于今天问候语的证据情况下&＃xff0c;明天的问候语为“Hello, world!”的概率&＃xff1a;

println(VariableElimination.probability(greetingTomorrow, "Hello, world!"))
// prints 0.27999999999999997

greetingToday.observe("Hello, world!")
println(VariableElimination.probability(greetingTomorrow, "Hello, world!"))
// prints 0.3485714285714286&＃96;
可以看到&＃xff0c;在观察到今天的问候语是“Hello, world!”时&＃xff0c;明天的问候语是“Hello, world!”的概率增大&＃xff0c;为什么&＃xff1f;因为今天的问候语是“Hello, world!”&＃xff0c;今天就更有可能是晴天&＃xff0c;明天是晴天的可能性也就更大&＃xff0c;最终使明天的问候语更可能是“Hello, world!”。正如在第1章中所看到的&＃xff0c;这是推断过去更好预测未来的一个例子&＃xff0c;Figaro负责所有的计算。

2.2.4　理解模型的构建方法

现在&＃xff0c;您已经看到了创建模型、指定证据和查询、运行推理得到答案的所有步骤&＃xff0c;接下来我们更仔细地观察Hello World模型&＃xff0c;理解如何从构件&＃xff08;原子元素&＃xff09;和连接器&＃xff08;复合元素&＃xff09;构建它。

图2-4是模型的图形描述。该图首先重现了模型定义&＃xff0c;每个Scala变量在一个单独的方框中。在下半部分中&＃xff0c;每个节点表示模型中的对应元素&＃xff0c;同样在单独的方框中显示。有些元素本身就是Scala变量值。例如&＃xff0c;Scala变量sunnyToday的值是Flip(0.2)元素。如果元素是Scala变量值&＃xff0c;图上显示变量名称和元素。该模型还包含了一些不是特定Scala变量值&＃xff0c;但仍出现在模型中的元素。例如&＃xff0c;因为sunnyTomorrow的定义是If(sunnyToday, Flip(0.8), Flip(0.05))&＃xff0c;Flip(0.8) 和Flip(0.05)也是模型的一部分&＃xff0c;所以它们显示为图中的节点。

da4254636e0f251e7b522805d60ef7919c607d3d

该图包含了元素之间的边。例如&＃xff0c;从Flip(0.8)到取sunnyTomorrow值的If元素之间有一条边&＃xff0c;表明If元素使用Flip(0.8)元素。一般来说&＃xff0c;如果第二个元素的定义中使用了第一个元素&＃xff0c;则两者之间存在一条边。因为只有复合元素是由其他元素构建而成的&＃xff0c;所以只有复合元素可能成为边的终点。

2.2.5　理解重复的元素&＃xff1a;何时相同&＃xff0c;何时不同

需要注意的一点是&＃xff0c;Select(0.6 -> "Hello, world!", 0.4 -> "Howdy, universe!")在图中出现了两次&＃xff0c;Select(0.2 -> "Hello, world!", 0.8 -> "Oh no, not again")也是如此。这是因为代码中定义出现了两次&＃xff0c;一次用于greetingToday&＃xff0c;另一次用于greetingTomorrow。尽管定义相同&＃xff0c;但是这是两个不同的元素。它们在Figaro模型定义的随机过程的同一次执行中可能取不同的值。例如&＃xff0c;该元素的第一个实例可能取值“Hello, world!”&＃xff0c;而第二个实例可能取值“Howdy, universe!”。这是有意义的&＃xff0c;因为第一个元素实例用于定义greetingToday&＃xff0c;第二个则用于定义greetingTomorrow。今天和明天的问候语很可能不一样。

这和常规编程类似&＃xff0c;想象一下您有一个Greeting类和如下代码&＃xff1a;

class Greeting {var string &＃61; "Hello, world!" } val greetingToday &＃61; new Greeting val greetingTomorrow &＃61; new Greeting greetingTomorrow.string &＃61; "Howdy, universe!"&＃96;&＃96;&＃96; 尽管定义完全相同&＃xff0c;greetingToday 和 greetingTomorrow是Greeting类的两个不同实例。因此&＃xff0c;greetingTomorrow.string和greetingToday.string可能取不同值&＃xff0c;后者仍然等于“Hello, world!”。同样&＃xff0c;Figaro构造函数&＃xff08;如Select&＃xff09;创建对应元素类的新实例。所以greetingToday和greetingTomorrow是Select元素的两个不同实例&＃xff0c;因此在一次运行中可能取不同的值。另一方面&＃xff0c;注意Scala变量sunnyToday也出现了两次&＃xff0c;一次在greetingToday的定义中&＃xff0c;另一次在sunnyTomorrow中。但是本身是sunnyToday值的元素在图中仅出现一次。为什么&＃xff1f;因为sunnyToday是一个Scala变量&＃xff0c;而不是Figaro元素定义。当Scala变量在一段代码中出现超过一次时&＃xff0c;它是相同的变量&＃xff0c;所以使用相同的值。在我们的模型中&＃xff0c;这是有意义的&＃xff1b;它表示同一天的天气&＃xff0c;用于greetingToday和sunnyTomorrow的定义中&＃xff0c;所以在模型的任何随机执行中都取相同的值。常规代码中也会发生相同的事情。如果编写如下代码&＃xff1a;

val greetingToday &＃61; new Greeting
val anotherGreetingToday &＃61; greetingToday
anotherGreetingToday.string &＃61; "Howdy, universe!"&＃96;
anotherGreetingToday和greetingToday是相同的Scala变量&＃xff0c;所以运行上述代码之后&＃xff0c;greetingToday的值也是“Howdy, universe!”&＃xff0c;同样&＃xff0c;如果同一个Scala变量代表程序中出现多次的一个元素&＃xff0c;它在每次运行中也取相同的值。

理解这一点对于了解Figaro模型的构建方式是必不可少的&＃xff0c;所以我建议反复阅读本节以确保理解。此时&＃xff0c;您应该已经概要了解所有的Figaro主要概念以及它们的组合方式。在下面几节中&＃xff0c;您将更详细地研究其中一些概念&＃xff0c;下一节首先介绍原子元素。