前 AppDynamics 数据科学负责人, 一直致力于人工智能在企业级服务特别是 DevOps、APM 领域的研究、应用和创新。
任数据科学会议 KDD、ICDM、IJCAI 的委员会程序委员,曾任 General Assembly 的首席数据科学讲师,同时在 Sumo Logic、Linkedin、eBay、IBM Watson Research 有相关经历,并在应用性能 APM 和 Log 领域拥有十多项美国和国际专利。
目前主导和负责下一代大规模数据挖掘、机器学习、异常检测和分析的 APM 产品构架和研发工作,包括一键式多维度相关性事故因果分析,智能正则表达式自动生成器,多项时间序列的预测和异常检测等等。
随着机器学习技术的日新月异,人工智能已逐渐走入各个领域和被应用到不同的商业场景中,很多企业也将机器学习作为下一个发展的重点。
同时机器学习的应用也有不同的侧重点:比如降低人力成本、提供更高效且实时的 insights、商业流程优化和自动化、个性化推荐等等。
所有的这些智能应用都给企业商业带来间接或直接的优势,随着大数据时代的到来,如何打造一个稳定且可扩展的机器学习架构带来了很多新的挑战,因为机器学习的应用不仅仅是算法,而是一个复杂的系统工程。
在本专题里,我们邀请了国内外机器学习和商业智能的专家,和大家一起分享大数据场景下的机器学习实战经验。
凤巢作为国内最大的搜索广告平台,机器学习在其中扮演什么样的角色呢?百度从09年开始就将机器学习应用到广告CTR模型中来,到目前为止,商业广告的触发、点击预估、内容生态建设等几乎每个环节都深度使用机器学习算法。
对于凤巢来讲,作为业界前沿的广告CTR预估模型,深度学习是如何首次全面作用于预估全流程?传统触发如何从基于语义的相关性到生成式触发模型?内容生态中标题、描述的智能撰写,图像算法覆盖图片素材生成、甄选各环节如何实现?本次演讲将带来机器学习在凤巢全方位的使用情况介绍,分享百度如何聚焦AI打造顶尖的商业智能系统。
业务场景介绍
a.凤巢CTR模型算法演进历程
b.排序全流程实现深度学习
c.自有大规模机器学习平台的建设
d.模型的规模与时效性(增量模型与实时学习)
a.凤巢传统触发演进历程
b.深度学习带来生成式触发
c.基于机器学习的意图触发
a.标题创意的AI撰写
b.凤巢图片-图像机器学习全覆盖
c.机器学习打造智能落地页
a.图片、视频富媒体广告的机器合成技术探索
b.视频AR、VR场景广告技术的探索
在电商和大数据的时代,随着电商平台(如 eBay、淘宝等)的出现和成熟,海量、实时、跨行业和零售商的市场数据比以前更容易获得,传统的零售运营也转向更为科学和系统的数据化运营,通过市场数据和信息帮助商家优化零售运营是电商平台必须为商家提供的服务之一。
本次分享将着重介绍如何通过数据挖掘和机器学习帮助商家和运营团队来组织和优化促销活动。
首先运用时间序列 Auto Regression 模型对历年的交易数据进行挖掘,推荐季节性促销的最佳时间段,并通过进一步的对用户搜索关键字基于 NLP 的挖掘,推荐最优化的时间段进行促销的商品类别。
当运营团队选择了促销商品之后,我们通过对商品以往的成交行为特征,对促销活动的表现进行预测并推荐优化策略。在促销进行期间,利用大数据平台对促销活动的效果进行实时的监控和分析,帮助运营团队做出及时的调整。依托于数据的精细化运营贯穿促销活动的整个生命周期,形成闭环。
a. 挖掘季节性促销的最佳时间;
b. 通过用户需求选择促销商品;
c. 预测促销的表现;
d. 实时监控和优化
QQ空间是中国最大的社交网络,超过6亿用户在空间上分享动态。在海量的社交网络中,信息纷繁芜杂,流转多变,如何在海量的社交网络中快速找到用户最真切关心、热烈讨论的时下话题,是极具挑战的工作。通过热点话题,我们的产品、运营能够恰时地推出针对性的活动和服务,从而更好地满足用户的需求。
本次演讲将介绍我们在海量社交网络中快速发现热点话题的技术方案和实践情况,分享我们对于海量社交文本的处理心得。
a.海量社交短文本预处理
b.社交新词发现
c.深度学习话题提取
d.热度综合打分重排序
a.多模态内容融合
b.实时流式话题发现