可解释机器学习-Task03-CAM类激活热力图
0x00 Abstract
- CAM 类激活热力图:深度学习可解释性分析、显著性分析的经典之作
- 论文:Learning Deep Features for Discriminative Localization, CVPR 2016,作者:周博磊
- 主要贡献:奠定了可解释性分析、显著性分析的基石,在此基础上衍生出了一系列的 CAM 方法。帮助我们打开了深度学习的黑箱子。
CAM 是一篇让人拍案叫绝的论文。
CAM 是一篇让人拍案叫绝的论文。
中文分词的目的:对中文句子中的词与词之间加上边界标记,本质就是对中文句子做划分词的边界。
TF-IDF 是 NLP 入门的基础知识。通过对这种编码方式的学习,可以使我们更加容易理解 NLP 工作的本质。这篇笔记重点在实践 TF-IDF。想了解更多相关理论可以参考 矢量语义与嵌入之 TF-IDF 检索 。
漏斗思维,是一个非常高效的思维方式,是一种线性的思考逻辑,一般按照任务的完成路径,识别出几个关键的行为转化节点;然后分析行为点间的转化与流失情况,进而定位问题,指导决策。
这种思维其实已经渗透在各行各业中,虽然平时并没有很好的觉察,但是,把他单独抽象出来,会让你更加容易洞悉到问题本质
上篇笔记中,我们学习了关于文本表征基于词袋模型得到稀疏向量化文本的内容,比如 One-Hot 编码,比如 TF-IDF 编码。本质上来说,词袋模型其实是一种通过统计学方法,将文档中出现的所有词语根据词频等统计指标,转为稀疏向量,从而表达一篇文章的方法。但是,这种稀疏向量的表达会存在一些缺点,比如不考虑语序等等。那么有没有办法得到文本向量化的稠密表达呢?这就是本篇笔记要讲的,Word Embedding 词嵌入。