硅谷AI创业者谢映莲:5G对AI反欺诈行业提出更高要求
谢映莲于1999年从北京大学计算机科学系毕业,后赴美国卡耐基梅隆大学深造,先后获得计算机科学硕士和博士学位。2006年8月,在担任博士后研究员一年之后,谢映莲加入了微软硅谷研究院。在微软的七年,谢映莲参与开发了一系列基于微软Hotmail社交图以对用户进行认证的系统架构,以及降低信用卡实时交易风险算法等产品。
2013年底,谢映莲离职创业。她和同事俞舫创立了一家运用人工智能无监督机器学习技术捕捉欺诈和洗钱攻击的人工智能公司DataVisor维择科技,主要从事金融、社交、电商、移动应用的反欺诈和反洗钱等业务。该公司于2013年底初创于美国硅谷,2016年进入中国,在加州山景城和北京朝阳区设立双总部。据谢映莲介绍,目前,DataVisor的中国团队和硅谷团队各有70余人。除了中国和美国,公司客户还分布在东南亚、德国、英国、法国、西班牙等地。该公司在中国的主要客户包括阿里巴巴、京东、平安银行、财付通、猎豹移动、饿了么、微店、陌陌和大众点评等。
2018年6月,DataVisor被《华尔街日报》评选为 “2018年最值得关注科技公司Top25”。
出走微软,我没准备好
在微软的7年时间里,谢映莲观察到,随着各行各业的数字化和移动互联网的普及,欺诈产业链逐渐形成。在这条产业链上,有提供IP地址的供应商,出售手机插件的小贩,专业“养号”和提供“薅羊毛”攻略的人士,还有人提供可供随时修改的邮箱地址……欺诈产业链上的人们就像一支建筑施工队,以电商“薅羊毛”行为为例,这些人四处寻找首单优惠或是高额优惠券,哪里有需要就往哪钻。
数据科学家的敏锐观察力让谢映莲发现了社会对反欺诈的需求,而她刚好有这样的技术。身处工业界的研究院,谢映莲希望自己能把创新快速落地转化成生产力。但现实中的各种限制让她看到了学术和工业的鸿沟,也使她产生了离职创业,把技术转化成产品的念头。
在决定离职创业之前,与部门领导的两次对话让如今的谢映莲记忆犹新。
“你们俩知道创业是怎么回事吗?是不是应该先搞清楚创业是什么,然后再看看自己准备好了没有?”听罢谢映莲和同事俞舫的创业想法,部门领导问出的一连串问题考住了这两位博士。在部门领导的牵线下,两人拜访了一些创业人士。两周后,她们回到部门领导的办公室,向领导汇报说:“根据了解的情况,我们没有准备好,但万事总有个开头,我们还是决定去创业”。
五年后再次回想起当时的心境,谢映莲对澎湃新闻记者说,“虽然当时没能做到最好的准备,但我们都觉得做这件事情的第一要素是全身心投入到事情本身。”
面对两人的离职,微软的同事们给出了截然不同的反应。有人觉得她们不可思议甚至有点鲁莽,也有人鼓励说,我一点都不惊讶,你们就该创业。
2013年感恩节前夕,带着不解和鼓励,谢映莲和俞舫在微软研究院合影留念,与同事告别,从此开始了两位女性AI科学家的创业之路。
数据贴标人与无监督学习
近几年,人工智能产业的快速发展催生出一个新的职业——“数据贴标人”。这些人的工作是坐在电脑前,点击几十、上百张图片,为图中的特定物品打上标签。这项简单的重复性劳动为不少人工智能公司的算法提供训练数据集。
在机器学习领域,其中一种常见的学习方式是监督学习(supervised learning),即为每个样本提供预测量的真实值,这在有些应用场合是有困难的。比如医疗,如果要通过监督学习来获得诊断模型,则需要请专业的医生对大量的病例及它们的医疗影像资料进行精确标注。这需要耗费大量的人力,代价高昂且难以保证质量。职业数据贴标人的工作就是如此。
谢映莲希望采用一种更为智能的方式,她想到了无监督学习。在反欺诈领域,所谓“无监督学习”指的是在没有训练标签和历史欺诈样本的情况下自动检测各类新型攻击,发掘未知的系统性和规模性风险,并在攻击者发起破坏前阻止他们。
除了减少对标签的需求,无监督学习还可以抓取到人们想象不到的欺诈行为。通过多年的观察,谢映莲发现,欺诈者的行为总是不断地变化,事先设计好的检测规则总有一天会被攻破。她认为,面对处于变化中的欺诈行为,只有运用无监督学习,“以不变应万变”,把欺诈行为的变换特征抓出来,才能起到智能的防范作用,而不至于总是追着欺诈者跑。
谢映莲最终选择了无监督学习作为公司的技术路径。最近,她和团队推出了一款平台型反欺诈产品“DCube”。结合无监督学习和传统机器学习方法,该平台允许用户主动实时监测和阻止欺诈行为。谢映莲称,这款产品不仅让客户先于恶意攻击者一步,同时也赋予他们更多掌控权。
不再是少数群体
麦肯锡全球研究院2018年4月发布的《平等的力量:亚太地区》报告显示,在东亚的一些国家中,对应于每100名男性,女性领导者的人数仅为12至20名。
同样的情况也发生在美国。2017年,一位谷歌工程师在内部论坛发文称,由于生理差异,女性不如男性适合编程和领导,并表示既然女性不如男性,谷歌就不应该推行员工性别均衡,否则对男性不公。这番言论鲜活地诠释了人们对女性的偏见——不善领导、不善编程等理工科职业。
对于这些偏见,谢映莲表示,两性在科学和工程领域的表现差异正在缩小,而且,女性具有细致钻研的精神,在数据科学领域具有一定的优势。
谢映莲介绍,在她曾经就读的卡耐基梅隆大学计算机系,出现过一届毕业生中没有一位女性的情况。但目前,卡耐基梅隆大学计算机系的本科入学比例已经达到男女比1:1,学校为此做了许多努力。
作为一位女性人工智能企业CEO,谢映莲希望能够推进女性在计算机科学领域的发展。她在母校卡耐基梅隆大学设立奖学金,鼓励女博士去参加各类学术会议,还去高中演讲,鼓励女中学生学习计算机科学。谢映莲所在的公司就是由她和另一位女性计算机科学家俞舫共同创立的。
2019年3月4日,谢映莲在斯坦福大学举办的全球女性数据科学会议上发表演讲。她对澎湃新闻记者说,面对在场的数百位女性数据科学家,她感到十分鼓舞,“我们女性数据科学家不再是少数群体了,会逐渐壮大起来”。在结束斯坦福演讲后不久,谢映莲被评选为网络安全北美“年度女性”金奖,这是该奖项设立以来首次由一位人工智能公司的华裔女性CEO获此荣誉。