20180829
参考:https://www.nowcoder.com/courses/190
indico
Indico是一个基于云的深度学习服务,使用了迁移学习 Transfer learning的概念做了一个服装匹配的demo。
目标
通过强大和开发者友好的机器学习来改革软件。从大量的无结构数据抽取到有用的信息。
迁移学习 transfer learning
机器学习模型擅长在一个窄的领域发现模式。
迁移学习能让你把解决某个问题训练得到的模型,稍微修改下就可以用来解决其他问题。
每次从头开始训练一个模型,可以基于处理相似问题,并且提前训练好的模型来开始构建你的模型,然后用给你的数据来精调你的特征来解决你的特定任务。
不需要为每个不同的任务创建模型,使用其他任务的共同特征,再基于数据精调模型。
对于传统的机器学习,这些学到的特征都是手工写的。因此,迁移学习无法使用传统的机器学习特征。
Custom Collection接口
它是上亿样本训练得到的丰富特征。通过迁移学习,模型能够处理散乱的无结构化数据,把数据变得非常有效。
API是基于大量文本数据训练的,可以对特定的自然语言处理任务精调这个接口。相比从头开始训练模型,有了迁移学习后,你只需要小很多的训练集,并且能够获得不错的准确度。
clothing matching demo
产品推荐是基于分析过去的购买记录和在线的搜索行为的。
使用Custom Collection的丰富的特征embedding,把类似颜色模式和衣服的可见部分编码,这使得模型非常容易做原型,当结果不满意时也非常容易重新训练。
相比从头开始训练,不需要搜集太多数据并打标签,极大的减少了训练和测试的时间,不需要构建模型架构。