Canary Blog

生活就像海洋
只有会游泳的人才能到达彼岸!

对抗攻击(Adversarial Attacks)

机器学习算法阅读笔记系列——对抗攻击

前言 好记性不如烂笔头,写下来的才是自己的。本篇博客将记录对抗攻击的原理。 动机 我们不仅希望在实验室中部署机器学习分类器,也希望在现实世界中部署机器学习分类器。 分类器对噪声有很强的鲁棒性,并且“大多数时间”都能工作,但这是不够的。 我们希望模型不仅强,还要能够能够对抗人类特意的恶意攻击。 特别适用于垃圾邮件分类、恶意软件检测、网络入侵检测等。 这就是为...

序列模型和注意力机制

"deeplearning.ai-Class5-Week3"

GitHub项目传送门 欢迎Star 本篇博客有大量公式演示,不推荐使用手机查看 基础模型 Seq2Seq(Sequence-to-Sequence)模型能够应用于机器翻译、语音识别等各种序列到序列的转换问题。一个 Seq2Seq 模型包含编码器(Encoder)和解码器(Decoder) 两部分,它们通常是两个不同的 RNN。如下图所示,将编码器的输出作为解码器的输入,由解...

自然语言处理与词嵌入

"deeplearning.ai-Class5-Week2"

GitHub项目传送门 欢迎Star 本篇博客有大量公式演示,不推荐使用手机查看 词汇表征(Word Representation) 自然语言处理(Natural Language Processing,NLP)是人工智能和语言学领域的学科分支,它研究实现人与计算机之间使用自然语言进行有效通信的各种理论和方法。在前面学习的内容中,我们表征词汇是直接使用英文单词来进行表征的,但...

主成分分析(PCA)及应用机器学习

"Principal Component Analysis"

PCA 的数学原理 PCA(Principal Component Analysis)是一种常用的数据分析方法。PCA通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量,常用于高维数据的降维。这篇文章的目的是回顾PCA的基本数学原理和在机器学习中的应用过程。 数据的向量表示及降维问题 一般情况下,在数据挖掘和机器学习中,数据被表示为向量。例如某个淘宝店2...

《机器学习要领》根据组件执行误差分析(中文翻译版)

Machine Learning Yearning Chapter10 Error analysis by parts (Chinese ver)

前言 本篇博客是 Andrew NG 《Machine Learning Yearning》 的「第十章:根据组件执行误差分析」翻译。本章学习到如何进行机器学习管道的误差分析,如何利用复杂系统的组件来为误差分析提供帮助。开启本章内容,出发! 👉官网传送门 👉GitHub 项目传送门,欢迎 Star 53. 根据组件执行误差分析 假设你的系统是使用复杂的机器学习管道构建的,并且...

《机器学习要领》 端到端的深度学习(中文翻译版)

Machine Learning Yearning Chapter9 End-to-end deep learning(Chinese ver)

前言 本篇博客是 Andrew NG 《Machine Learning Yearning》 的「第九章:端到端的深度学习」翻译。Andrew NG 提到他曾经负责开发过一个大型端到端语音识别系统,并取得的很好的效果,但是他同时表示盲目使用该技术并不是好事。本章内容将探讨什么是端到端的深度学习? 什么时候应该使用它,什么时候应该避免它?同时给出了当不适合使用端到端学习技术之时,如何将...

《机器学习要领》 调试推理算法(中文翻译版)

Machine Learning Yearning Chapter8 Debugging inference algorithms(Chinese ver)

前言 本篇博客是 Andrew NG 《Machine Learning Yearning》 的「第八章:调试推理算法」翻译。本章内容将探讨用于调试语音识别系统、机器翻译系统和增强学习系统的共享 AI 设计模式是什么?。开启本章内容,出发! 👉官网传送门 👉GitHub 项目传送门,欢迎 Star 44. 优化验证测试 假设你正在构建语言识别系统,你的系统通过输入音频片段 A...

《机器学习要领》 不同分布下的训练和测试(中文翻译版)

Machine Learning Yearning Chapter7 Training and testing on different distributions(Chinese ver)

前言 本篇博客是 Andrew NG 《Machine Learning Yearning》 的「第七章:不同分布下的训练和测试」翻译。本章内容将探讨当训练集的数据分布和开发/测试集的分布不一致的时候可能出现的情况。有时候不得不将与测试集不同分布的训练集用在构建模型上,那什么时候这种做法合适呢?如何确保你的算法表现总能在目标分布中表现良好呢?此外,本章同时将教会你如何诊断出数据不匹配...

《机器学习要领》 比较人类水平表现(中文翻译版)

Machine Learning Yearning Chapter6 Comparing to human-level performance(Chinese ver)

前言 本篇博客是 Andrew NG 《Machine Learning Yearning》 的「第六章:比较人类水平表现」翻译。本章内容将提出通过和人类表现水平的比较来加快机器学习发展的策略。学习算法的性能表现在越来越多的领域超越了人类水平表现,从语音识别到图像识别(狭义领域)。在深度学习领域,与人类水平表现竞争已然成为一项新兴的运动,当你的算法表现超越人类的时候会发生什么呢?开启...