Growing with Data and AI 2010-2019

完善预测中与数据科学、人工智能一起成长 2010 ~

 

刘永川博士 Dr. Alex Liu

 

 

Drawing Alex Liu2009年开始,因为家里的需要及其它因素而不便太多国际旅行,我就退出了所参与的各种国际项目,全力转向来专注美国国内的项目了。借此机会,我当时也期望更多为特定的一些公司与机构服务,资源与精力集中而开始着眼从组织机构的系统角度来综合使用、并完善我的一些社会预测模型和方法,而提高预测准确率和项目成功率。记得当时一些朋友和合作伙伴不太理解我的调整,但当我告知他们我的专业虽然说是关于数据分析的方法、流程和技术,但重点是关于如何以此来提高项目成功率,当然也可以提高研究项目的成功率,不过重点是在项目上、而且是以组织为对象的项目,慢慢才让朋友们明白了一些。其实,提高预测准确率和项目成功率也是各种文明下方法改进的目标,可以是超越现代科学范式的,是很有特别意义的钻研课题。

Alex Liu IBM Robot 2016因为可以在预测系统中加入组织运作的逻辑、加入一些潜变量包括精神信仰因素的全面考虑来克服常有社会方法的一些缺陷,我的社会预测模型常常可以做得比其他人的更准确一些,而运用 4E 为基础的机器学习(统计学习)框架也会使得建模过程更为快捷,从而提高项目成效。2007-2008年曾有个机会为一家大型美国银行尝试了几个风险模型,获得了一定成功,也让我信心满满。从此出发,我专心寻求公司业务的机会了,也就一并辞去了大学里的兼职教学相关的工作以便集中精力。不过后来随着数据科学和人工智能业务的展开,与斯坦福、南加州大学等机构的研究开发相关业务的合作反而多起来了。在这段时期里,我还指导了几个难于推辞的精神资本的博士研究。

LA AI Trend 2017 ALAlex with Robot in 2016 IBM出乎预料,我的这段转向公司服务的技术冲锋正好与数据科学及机器学习的起飞相重合,从而给了我意想不到的机会和收获,也给了我倡导正面社会效益之数据科学及人工智能的机会,并产生不错的反响。当时,我找到的第一个机会是一家排名一百强 FORTUNE 100 的大公司,叫 INGRAM MICRO,当时有一位迪斯尼 DISNEY 的高管CIO出来领头,帮助 INGRAM MICRO 使用数据做业务转型,需要数据分析 ANALYTICS 专家,就把我请去了。我带了一个小团队花了三个月帮他们做了一个“策略性使用数据来指导企业商务转型”的计划,给这家亿万级大公司的转型提供了基础,让我有旗开得胜的感觉。而我另一个特别的收获是了解到了他们的企业高管对一本名为“用分析竞争 COMPETING ON ANALYTICS” 的书非常喜爱,他们对该书作者、后来被一些媒体称为大数据之父的托马斯·戴文波特 Thomas H. Davenport 也非常推崇。从此,我也开始跟踪 Thomas H. Davenport 的文章和书籍,并与他合作交流。

Alex Liu Speaking Smart CityBest Predictive Accuracy with 4Es ML离开 INGRAM MICRO 后,我被介绍去了一个产品搜寻公司 SHOPZILLA 给一位付总 VP 咨询,他们让我使用数据模型帮助提高搜寻相关度,让搜寻者可以获得他们真正想要的产品信息。我在这里呆的时间很短,但在这里我是第一次被人称为“数据科学家”,因为他们从硅谷请来的管理咨询专家坚持要我使用“数据科学家”的头衔,尽管当时使用“数据科学家”头衔的机构还很少,而且他们也给了我机会去努力提供比原来技术团队更精确的分析预测模型。从此,我对“数据科学家”开始特别关注,并参与了后来一些关于如何定义“数据科学家”及相关业务的讨论。

RiskScoringLoansWithLatentVar离开 SHOPZILLA,我去了一家由几位谷歌 Google 高管和第一资本金融公司 Capital One 高官创立的金融公司,我被聘为“机器学习专家”,得到机会为他们创建了该公司的第一个金融信用打分的运作模型,而且确实比他们以前请咨询公司创建的模型好很多。之后,我去帮了一家资金转账服务公司做数据转型,也帮了TOYOTA汽车公司做客户全景模型,再帮了一家初创公司做了一个客户留存的系统模型。这个期间,USAID 还请我使用数据分析协助评估美国在伊拉克补助误伤家庭所产生的效益,很特别的应用,让我学到许多,但因避免风险而没有去伊拉克当地做实地调查,也就未能继续。

HBR - Data ScientistAlex Liu Miami Talk以上工作给了我极大机会来学习及提高,并且使用实际数据来验证我各种预测模型的准确性,而最重要的是赶上了与数据科学的一起成长。我在2010年被聘为数据科学家时还没有几个人知道数据科学家。在我专注为企业提供数据服务的同时,我联系协作的 Thomas H. Davenport 正在通过他的文章和书籍,大大推动着数据科学的发展和推广,他2012年发表在哈佛商业评论上的关于数据科学家为最时髦的工作的文章几乎成了数据科学家最权威的定义,也把数据科学家推上了高峰。记得有一次我到哈佛大学演讲后与他交流,他说他是哈佛的社会学博士,我是斯坦福的社会学博士,而社会学毕业生如此深入进入数据科学的恐怕只有我们两个人了。

RMDS community on LinkedInIBM ID Alex Liu 2013-2019根据自己的兴趣,在一些朋友和同行的协助下,我还在2009年建立了一个研究方法和数据科学的社区 (Research Methods and Data Science community, 简称RMDS),一些知名专家和公司高管也加入支持,结果在没有任何宣传和组织支持之下而快速成长为数据科学的一个全球性知名社区,拥有数万会员,为数据科学的快速发展做出了一些特别的贡献,尤其是南加州的分社区还与洛杉矶市府、DISNEY狄士尼公司、南加州大学等合办过许多精彩活动,来特别推动智慧城市及智慧治理和智慧教育等等的发展,至今还常常被人提起,称其大大推动了南加州地区数据科学的发展。我在2013年进入IBM公司做大数据分析的数据科学家之后则更加速了这个社区的发展,也给我带来许多著作和协作的机会。

Wen Tian Xiang 2016 Alex LiuJesus Status in Salt Lake City 2016在2014年,法国学者Thomas Piketty的书“二十一世纪资本论”成为了当时最畅销的非小说书籍,因为与我过去四资本的研究工作的相关又把我带入了一些特别的探讨。2016年我恰好因IBM工作到伦敦工作了数周而被带入了更深入的讨论,并由此扩展至有关使用数据科学与人工智能来产生社会正面效益的讨论。可能是因为我参与了不少相关的讨论、加上我也积极倡议了许多,并曾和几个城市如洛杉矶和芝加哥的数据智能城市发展项目合作,就有了一些组织将我的名字与“数据科学要始终以正面社会效益为中心”的观念紧密连接起来了。在2016年,我还得到了一个特别的机会到中国访问、为IBM中国做数据智能培训、并到家乡(江西吉安和井冈山)看望父母,2016年我也到了犹他州盐湖城认真参观了摩门教的总部,继续有关信仰的探讨研究。

Saudi Aramco Square 2018Saudi Aramco ID Alex Liu在IBM公司,我得到许多机会而参与了不少精彩的项目,包括R、SPSS与WATSON的整合、APACHE SPARK系统上的数据分析和机器学习流程管理、天气数据的商业应用、数据科学与人工智能高级培训与证书、以及风险预测建模的流程管理、物联网数据智能等等,并有机会把数据科学和人工智能技术、特别是 WATSON STUDIO 系统及相关的机器学习技术、带给了一些大公司与大机构包括沙特阿美(Saudi Aramco)、FARMERS保险集团和美国航空总署 NASA JPL等等,同时与多所大学如哈佛大学、加州大学、加州理工学院等开展机器学习的合作研究,也数次到伦敦、瑞典等地协助一些欧洲银行和公司的数据智能发展,继续了我不断用实际数据来丰富和提高预测模型的特别旅程,其中一个与美国航空总署 NASA JPL合作的使用机器学习方法预测龙卷风密度的研究后来还获得了美国气象协会的Banner I. Miller奖等多项科技创新奖励。

IBM Book Signing by Alex LiuHarvard Talk 2019 November Alex Liu在IBM公司,我还被给予了很多头衔,如:首席数据科学家、杰出数据科学家、数据科学思想领袖等等,因此被邀请去作了许多会议演讲。为此,我为提高数据科学项目成功率而提出的一个特别解决方案、即把专家社区与系统流程结合起来的生态系统方法 ECOSYSTEM APPROACH 也得到机会在IBM从2016至2019的年度大会上发表、并逐渐得到了同行的认同,特别其中“有专家反馈的强化学习”的部分更是获得广泛应用和发扬光大。而从此以后,数据科学的有关头衔也就与我完全离不开了。2019年11月开始,我应邀担任了哈佛大学数据科学评论杂志 Harvard Data Science Review 等机构的顾问,也担任泰勒弗朗西斯(Taylor & Francis)出版社的影响力数据科学丛书主编,继续推进数据科学发展,并在以前“企业孵化成功的支持环境系统”、“四资本理论”、“数据科学生态方法”等等的基础上发展了一些新的生态系统方法体系及在有关提高项目成功率等方面的应用,包括了 4E 为基础的社区反馈的强化学习嵌入的流程优化,和物质、智能、社会、精神四纬度的主体知识模型等。这些工作也逐步让我发展出“整体(全观)计算方法 Holistic Computation”的一些框架和体系。


参考文献 - 1) 数据科学的演变:从不为人知成为主流学科

                  2) 整体计算(全观分析)综述