人工数据合成

OCR:解决字符识别的样本问题,各种字体库,加噪音来做样本。

语音:加某种杂音背景

注意随机的噪音并没有多大帮助.

pipeline

在真正的机器学习(如分类器)之前的流水线动作人工设定都是完美的,看最终能提高整体系统多少准确率。可以评估 pipeline 之前的工作是否值得继续投入,又叫上限分析

2018-05-13-18-28-29

Summary

2018-05-13-22-03-36