2、人工智能的定义:有四种,像人一想思考、合理地思考、像人一样行动、合理地行动
3、合理的行动(当前的定义),有统一的标准,易于实现
a、正确的推理可能是合理的推理
b、正确的推理不是合理性的全部
c、有些合理的行动不涉及推理
合理的行动比思维法则更一般,因为正确的推理只是实现合理性的其中可能机制之一;比人类的行为更经得起科学的检验,合理性的标准在数学上定义明确。
4、像人一样行动:图灵测试:为智能提供一个令人满意的可操作性的定义,是一个试验的测试而不是一个文字的表述。若人类询问者在提出书面问题后不能区分书面回答来自人还是计算机,那么这台计算机就通过了图灵测试
5、图灵模仿游戏:图灵测试的一个手段,用来判断是否具有智能行为的测试
a、询问者+男回答者+女回答者
b、询问者目的:通过问问题判断谁是男人谁是女人
c、第一阶段:男欺骗询问者让询问者相信自己为女,女说服询问者相信自己为女
d、第二阶段:计算机替代男回答者,计算机模拟男人的角色向询问者进行欺骗(30%)
e、如果计算机能够成功地欺骗询问者,那么我们说这台计算机能通过智能行为测试
f、图灵测试的不可重复性:被欺骗一次后询问者也会有学习过程
6、像人一样思考:认知建模。
7、对人类精神过程的可测试性推理,着重于思维的过程
8、要使程序像人一样思考,首先要知道人如何思考:内省(自己问自己怎么做),心理实验(别人问我怎么做),脑成像(机器问我怎么做)是获得人思考的三种方式
9、通用问题求解器(向人一样思考的机器):只能处理比较小的某一类的问题,难以准确了解人脑的内部认知活动。不满足于正确解决问题,而是探求求解步骤是否相同于人类思维。
10、合理的思考:逻辑表达的方式,能够带来最高效率的思考方式就是合理的,把程序的求解表示为用逻辑法来解决任何问题,即逻辑推理。
11、局限性:并不是所有问题都可以用逻辑来表达,另外当问题过大时逻辑方法可能会耗尽计算机资源
12、合理的行动:agent就是能够行动的某种东西。合理agent(当存在不确定性时,能够实现最佳期望结果而行动的agent)
13、agent可以抽象地表示成方程:搜集信息,处理信息,行动
14、人工智能的学科基础
15、人工智能历史
16、最新发展水平:机器人汽车、语音识别
17、agent相当于与环境相互感知的对象,通过感知器感知环境序列并转化为行为,再通过执行器产生对环境的影响(感知器+执行器+之间的映射函数)
18、人类agent:感知器为眼睛、鼻子、嘴巴等等,执行器为手、脚、声道等,转化是人脑
19、机器人agent:感知器为摄像头、探测仪,执行器为马达、音响等
20、感知器(sensors)感知环境信息给agent,通过faction处理信息转化为行为给执行器(actuartors)反馈信息给环境
21、agent函数将任何感知历史数据映射为行为,agent程序通过物理系统上运行来实现agent函数,agent=体系结构(sensor+actor)+程序,即软件和硬件
agent程序:
a、以传感器得到的当前感知信息为输入
b、以执行器的行为为输出
c、仅仅以当前感知为输入而不是整个历史感知为输入
22、查表:简单、速度快,但不具有通用性,不便于扩张
23、理性agent:对于每一个可能的感知数据序列,一个理性的agent应该采取一个行为已达到最大的性能,即必须是agent+产生最大性能
a、一个agent应该根据他感知的信息产生一个行为
b、给行为是正确的,也就是说能产生最大的性能
24、理性判断的四个因素:先验知识,可以完成的行动,截止到此刻的感知序列,性能度量
a、训练集数据是提供先验知识的东西
b、训练出来的模型是agent程序
25、性能度量:用客观标准评价agent行为的成功性。以行为来度量性能不如以结果来度量 性能
26、三个基本概念:全知(什么都知道,包含理性和完美)、理性、完美
27、理性不等于完美
a、理性使期望的性能最大化
b、完美使实际的性能最大化
28、理性agent:
a、信息收集
b、自主性,能够进行学习
29、任务环境四要素:性能、环境、执行器、传感器
30、环境的性质(分类方式)
a、完全可观察,部分可观察(当前状态):在某个是简单上获取环境的完整程度vs获取环境的部分状态(如真空吸尘器和自动驾驶汽车)国际象棋是完全可观察的,因为所有的当前信息都给出来了。
b、单agent,多agent:独自运行vs同时运行(字谜游戏和国际象棋)
c、确定的,随机的:确定的环境下一个状态完全取决于当前状态和agent执行的行为,否则为随机的(真空吸尘器和自动驾驶汽车)
d、片段式,延续式:agent的经历被分成一个个院子片段,在每个片段中agent感知信息并完成单个行为,下一个片段不依赖于以前的片段,而延续式的环境当前决策影响未来(如检查次品和国际象棋)
e、静态的,动态的:环境在agent计算时会不会变化(填字游戏与自动驾驶,国际象棋应该是半动态)
f、离散的,连续的:环境的状态、时间的处理方式以及agent的感知信息和行为都有离散和连续之分(填字游戏和自动驾驶)
31、agent的表驱动方法:缺点:表太大,创建时间长,需要人工更新
32、agent四种类型:简单反射,基于模型,基于目标,基于效用,依次递进,环境越来越复杂。
33、简单反射agent:基于当前的感知选择行动,不关注历史信息;当前状态+当前感知(仅考虑前车刹车灯的刹车问题)
34、基于模型的反射agent:agent根据感知历史维持内部状态,agent随时更新内部状态信息;当前状态=当前感知+上一时刻状态(+上一时刻行动)(在上问题的基础上考虑了距离前车距离的刹车问题)
35、基于目标的agent:除了根据感知信息以外还有根据目标采取行动;当前行动=当前状态+当前目标。效率低,需要推理(在上问题的基础上考虑了路况<十字路口>和行驶计划的刹车问题)