机器学习（李宏毅）—

本文章作为学习2023年《李宏毅机器学习课程》的笔记，感谢台湾大学李宏毅教授的课程，respect！！！

一直以来，我们都在学机器学习，最简单的就是图像分类，但是机器（模型）为什么能够work？大家都说它是个黑箱子，它是不是欠我们一个理由呢？

会不会是一种巧合，模型只是巧合地猜对了答案，而不是真的智能呢？如果是在无人车驾驶、医学诊断等领域应用上，那更应该得给出人们可以接受的理由！

所以，这次课就来讨论讨论AI可解释性问题。

1、简单的模型好解释，但不够powerful。举例而言：线性模型我们可以清楚知道哪些权重是重要的，但不够powerful。

2、复杂的模型powerful，但不好解释。举例而言，深度学习神经网络很难解释，但确实会比线性模型更加powerful。

今天而言，我们人类只是“神识”还没那么强大到能够看透神经网络，但也更不应该说看不透就不用它！

那有没有模型，兼具可解释性和强大能力呢？比如decision tree？
确实决策树很强大，但使用过程，往往也不是只用一棵，而是一片森林（随机森林），也不见得好解释。

在这里插入图片描述

那对于深度学习神经网络可解释这件事，我们的目标就一定要完完全全搞到它的详细原理吗？人脑这么多神经元错综复杂做出决策，我们不也是相信大脑的决策吗，所以其实我们就是想得到在关注的case上一个有说服力的理由而已！

为了得到上述的理由，我们从对象层面进行划分：

1、Local Explanation
所谓的外物是相对于模型本身而言，即从输入层面来看。

2、Global Explanation
本身即指模型本身。

如下图所示：
在这里插入图片描述

1、Local Explanation
接下来就仔细研究下Local Explanation。
对于分类器而言，从输入的图片来看，模型真的知道输入的图片是什么类别吗？

有一种做法是：把输入的图片每次遮住一点，看模型输出的变化情况，如下图：
在这里插入图片描述
说明：把输入是猫的图片，一个pixel一个pixel地遮住，看分类器分类结果变化，输出哪些是重要的像素，就能推断模型是否知道哪些特征是重要的。

Saliency Map
另外一种做法是在梯度上做文章，基本思想就是把每个pixel加上一点杂讯，看对loss的影响如何，说白了就是敏不敏感（有没有捅到模型的胳肢窝），越敏感反应就越强烈，图上表现就越白，如下图：

基于这种方法，大家觉得有点毛毛躁噪的，于是多做几次加杂讯的动作，并把结果平均起来，这就是SmoothGrad。

但还有一个局限性，意思就是说你要是一直捅胳肢窝，捅多了也就不敏感了呀，举了个大象鼻子长度和是大象的关系：
在这里插入图片描述
所以这里有人提出了另一种方法，叫IG（Integrated gradient）。

How a network processes the input data
这种方法就是直接把输入数据在模型里面是啥样，可视化看看。
1、Visualization
可以是纯纯的把每一层的特征可视化出来瞅瞅：

2、Probing
也可以是像探针一样把某一层的特征丢进去诊断器中看看输出结果。前提是你有一个好的诊断器。诊断器根据具体任务设定，可以是分类器啥的…