电热膜厂家
免费服务热线

Free service

hotline

010-00000000
电热膜厂家
热门搜索:
行业资讯
当前位置:首页 > 行业资讯

优惠券应用SnipSnap的打造历程

发布时间:2020-03-12 12:58:31 阅读: 来源:电热膜厂家

导语:M-turk(即亚马逊土耳其机器人Amazon Mechanical Turk)是一个Web服务应用程序接口(API),开发商通过它可以将人的智能整合到远程过程调用(RPC),利用人的网络来执行不适合计算机执行的任务。

两年前,我的应用SnipSnap被DreamIt Ventures看上时,基本上就是一款构架于Keynote模板之上的高清晰原始模型加桌面视频讲解。那会它的名字叫Vaporwear。在对技术几乎一窍不通的情况下,我们计划着打造一款智能优雅的OCR(光学字符识别)优惠券应用。不过我们意识到,如果玩转了亚马逊的Mechanical Turk service,结果完全可能超越预期。

M-turk(即亚马逊土耳其机器人Amazon Mechanical Turk)是一个Web服务应用程序接口(API),开发商通过它可以将人的智能整合到远程过程调用(RPC),利用人的网络来执行不适合计算机执行的任务。它可以让你把零碎工作外包给真正的人。你可以通过它们的API(应用编程接口)设置工作项,这样你的应用就可以直接向远程的工人们布置工作,然后收回成果。

第一步:验证概念

我们应用的目标是分析所有优惠券细节,然后反馈出可以直接在店内使用的电子券。我们将这款应用视为DIY手机优惠券。

我早知这个概念在实体店里可以应用,只要想想六个月前的我对着各种优惠券-如Babies "R" Us Macy's Bed Bath & Beyond Target-大拍特拍的情形,而后成功的兑现了这些躺在我手机相册里的优惠券。就是这么轻松。而我也意识到这样的体验若制作为一款应用,必将更有价值,应用里会包含井然有序的优惠券数据,还可以附带过期提醒,附近优惠券可用地点,以及可扫描的条形码这样的功能。

见识到了光学字符识别(OCR)在一系列名片扫描应用,如WordCard Mobile和CardSnap上的威力,我认为我们也可以将OCR应用在优惠券上。由此而生了我的完美原型构想以及对DreamIt夸下的海口。向Gannett辞掉了工作,并且信誓旦旦向我身怀六甲的妻子保证了美好前景之后,我雄赳赳气昂昂地来到了西费城,试图在三个月或更短的时间里构架起这看似简单的机能体系。不到一周,我就被残酷的现实打回了原形。

见鬼,OCR软件难如登天

用OCR做优惠券,基本上,不靠谱。我们几乎测试了每一个选项:从免费开源的Tesseract OCR library,到Abbyy巨贵无比的应用内置SDK(软件开发工具包),以及各种服务器端OCR产品。我们的应用可以提取出一些文本,但是还差得很远。

问题出在:优惠券的排列方式看起来松散,不规范并且七零八落。而最大的问题在于,即使我们已经提取了文本,依然要规整繁多的自然语言模式,才能将合乎规范的文本安置到合适的区域,比如优惠券使用期限。

我们的导师直接表示:我们就用DOA(direction of arrival信号波达方向)估算法。那时,我又听闻了另一款名片扫描应用,被LinkedIn所采用。第一次用CardMunch时,我非常失望;它无法马上给出结果。但是,几分钟后所出来的结果是:名片识别效果基本上达到完美。他们到底是怎么做成这样的?而且扫描的还是一张半清晰的照片!对于这个问题我苦思了几周,直到一位聪明的企业家朋友点拨了我:拜托,他们用的是Turk机器人服务啊。

M-turk有什么用

众包劳动力用来做一些简单、程序化却不能自动化的工作再适合不过了。需要分析一下名片?社交网络上的照片需要过滤掉三级信息?有语音文件需要录写下来?试试M-turk。

通过和企业家们的多次交流,我越发意识到这个方法不仅可行,而且可取。M-turk最擅长帮助像SnipSnap这样的初创公司用众包的方式解决问题,尤其是在还没有任何易行的科技解决方案的情况下。在关注Lean Startup时,我发现基本上Aardvark(被谷歌收购)的问/答MVP也少不了M-turk的一臂之力。DreamIt的工作人员告诉我,Adaptly,前DreamtIt的明星产品,也在开端选择了这个方法解决问题。

不过,M-turk使用上也不简单哦。那时我们在打造的本地iOS应用,马上就到样品展示的日子了,而我们的M-turk还未到达直接上阵的程度。我们倒是有一个可用的原型,是之前用来展示给投资人的。即使如此,那也不过是依靠三位朋友登入管理界面,线下手动分析优惠券。有人管这招叫隐居幕后的奥兹魔法师。这次演练完美的支持了最多10个用户。不用想也知道,这种3人团在我们进驻应用商店时是应付不来大规模的用户的。

在时间紧迫,被M-turk构架几近逼疯的状态下,我们找到了一个更容易的插入方式。进入Houdini,一个超简单的可以创造任务的API(也叫人工智能任务HIT)。SnipSnap会发送一张优惠券图像,Houdini会产生HIT,而后它会将所有优惠券细节以我们要求的格式发送回来。不到一周,我们脸都笑开了花。结果几乎100%精确。

之后,大约在应用发布的两周后,我们的应用入选了苹果应用商店的最新热门精选应用。我们的服务器挺住了,但是突然间M-turk出了状况。而一周内出现的10万新用户以及翻了一倍的优惠券提交量,使得要做的任务推积如山。但是有一个很简单的解决办法:提高HITS的出价。刚发布时,每一个优惠券分析我们付价0.05美金。而就在我们将薪酬提升到每件0.12美金时,供求法则大显神威,我们眼看着堆积下来的任务在一天内全部解决。基本上,这笔薪酬中有0.02美金是亚马逊的,一小部分进了Houdini的腰包,其余的都归工人或者Turker即外包人员(Houdini自那以后改变了价格模型)所有。

Houdini还为我们提供了一种极简单的方式向众多Turker发送任务,比较结果,而后剔除异常数据,整齐划一的工作流自动化,或者,用俗话说就是质量管理。在过去这一年,SnipSnap成为发展最快的优惠券应用。我们的用户已经接近100万,而过手的优惠券也达到了1600万之多,同时我们开始与一些大型国家零售商合作,如Bed Bath & Beyond,Aeropostale和Sears。

在我们达到如此规模的同时,也意识到是同Houdini方案说再见的时候了,因为它虽然容易设置,但是却不能让我们创造实用功能口令(比如,让Turker在分析之前旋转或者剪切一张优惠券图片)。所以,我们打造了自己的一套体系,卯足了劲去做一套完备的M-turk整合。

尤其是在我们发现对于我们的HIT来说,一种在优惠券图像旁放置空白区,并且配备上自动输入完成功能的形式,让任务地完成变得无限简单(也更快)。我们意识到这一点对于M-TURK来说至关重要:不管你打造的是何种形式,设身处地地为工人们想一想,他们要完成几百个任务。如果你的HIT很沉闷或者让人厌烦(更有甚者:耗费时间)的话,基本上工人们也会这么想,由此导致对完成任务的抵触。我们对形式进行了改进,让一些Turker甚至觉得做这个是一项乐趣。

我们逐步开发出了图像识别方法,以及条形码扫描,甚至还有OCR。我们一直同研究员合作,找出纠正角度不正的图片和文本的方法,并且一些技术已经申请了专利。而机器人服务一直都是我们的终极武器,尤其在所有自动化度量都不给力时。甚至在我们的优惠券经手量达到20万张一天时,它也不愧为最具扩展性和节约成本的好方法。

M-turk新手入门

1. 检索在M-turk基础上的简化、整合服务,如CrowdFlower, Houdini,ScalableWorkforce。点击以下链接查看更多。

2. 考虑使用整合一致工作流来保持质量,但是也要注意保持质量同其它因素间的平衡:比如时间和金钱。这些任务总会耗费更长的时间才能反馈结果,你需要多个Turker来完成任务。另外,若你用3名工人来审核每件任务,你将要付出3倍以上的价钱。

3. 创建金级任务是用来评估工人质量的好办法。这些任务已有参考答案,而工人的评估结果则依据他们的工作成果与参考答案的近似度来判断。用这个方法可以有效剔除低水平的工人和垃圾邮件传播者。

4. 谨慎的为你的HIT定价。一旦工人们开始对你布置的任务感到轻车熟路了,价格的改变(尤其是降价)会让你即刻出现工人流失。

5. 提高任务的流水线化程度。在空间内加入自动完成功能,确保格式的简明,要考虑到很多外包人员面对的都是不大的屏幕。你的任务越简单,让人完成的越快速越好。

6. 花一个小时来做你自己的这些任务。总结一下你的完成量,然后乘以你的HIT单价。这就是你应付给M-turk员工的时薪,切记!

(via FC)

BANGCAMP创业邦成长营,创业邦旗下孵化计划。第四期全新升级,60个名额正式开启招募!现在报名,将有机会获得资机构对接、创业导师面对面指导、2016创新中国春季峰会展示、创业邦媒体矩阵深度传播!创新原力,伴你前行!

即刻报名第四期!

富士通空调售后服务富士通空调售后400电话

空调有风却不凉的原因?

广州空调维修网