Machine learning Phote ocr By anribras 发表于 2018-05-13 人工数据合成 pipeline Summary 人工数据合成 OCR:解决字符识别的样本问题,各种字体库,加噪音来做样本。 语音:加某种杂音背景 注意随机的噪音并没有多大帮助. pipeline 在真正的机器学习(如分类器)之前的流水线动作人工设定都是完美的,看最终能提高整体系统多少准确率。可以评估 pipeline 之前的工作是否值得继续投入,又叫上限分析 Summary