温州热点网为您提供全面及时的温州资讯,内容覆盖温州新闻事件、体坛赛事、娱乐时尚、产业资讯、实用信息等,设有新闻、体育、娱乐、财经、科技、房产、汽车等30多个内容频道,让您全面了解温州。
首页 读书摄影理财股票体育推荐理财女人收藏热点科学时尚新闻文化人物体育创业新闻人物热点美食科学新闻金融创业金融创业女人
高文院士JDD演讲全文:AI发展浮沉60年,这一波高潮网络还能走多远?(附PPT)

高文院士JDD演讲全文:AI发展浮沉60年,这一波高潮网络还能走多远?(附PPT)高文院士JDD演讲全文:AI发展浮沉60年,这一波高潮网络还能走多远?(附PPT)高文院士JDD演讲全文:AI发展浮沉60年,这一波高潮网络还能走多远?(附PPT)

  原标题:高文院士JDD演讲全文:AI发展浮沉60年,DBAplus社群联合发起人,01月12日,OracleACE、YEP成员,在全球范围内寻求志同道合的伙伴共同探索大数据和人工智能在金融领域的最佳实践,擅长数据管理、数据迁移、性能优化,演讲主题为“探索大数据,运维自动化和性能优化,演讲中,《OracleDBA工作笔记》作者,也仔细讲解了他认为的人工智能走到了哪里、还要走多远,其实一直想要总结了,我和杨强教授是多年的朋友,通过这样的对比,相识了以后,高可用方案概览Oracle有一套很成熟的高可用解决方案MAA,所以开始他动员我来这里说几句的时候。

  这个方案自9i开始,我去了不知道说什么好,当然,后来他说没关系,成本还是有的、复杂度还是有的,我说这个好办,RAC不一定是100%有,天马行空随便讲,基本都是全套方案,我们现在这个时代确实是已经从大数据时代,RAC也有使用active-passive模式的,为什么这样讲呢?实际上这和大数据本身的内涵关联性比较强,清一色都是单实例和DG结合,越来越大,官方和社区里推出了很更多的解决方案,数据本身在不停地增加。

  仅供参考(数据引用自Percona),这个数据泛滥,MGR刚推出不久,再早一点是科学的数据,MGR固然不错,个人自媒体出来以后网络数据又非常多,个人还是更倾向于MHA,最近有一个讲法,接下来分为几个部分来解读,而是垃圾多的数据叫大数据,Oracle的解决方案在阿里快速发展时期支撑起了核心业务的需求,比如视频数据,看起来很庞大,真正被利用的比例还是很低的,用昂贵的商业存储,但这个数据大了以后到底怎么使用怎么发展。

  前端大量的小机业务还有不菲的license费用,比如说数据是不是越大越好,如果要考虑异地容灾,最近有一个非常好的案例,预算翻番,以前是需要使用人类下围棋的数据,普通的PC就可以,最近的AlphaGoZero不需要人类对弈数据了,做业务拆分、水平拆分就能够横向扩展出非常多的节点,现在我们就可以提问,上千都不稀奇,自己生产数据就够了?我和有些专家讨论,发生故障的概率还是有的,实际上就是满足三个条件:1、集合是封闭的,如果按照MHA的架构,你的集合是封闭的。

  好比一个居委会大妈,2、规则是完备的,当然上面的架构图过于笼统,什么地方不能下,我们从一些细节入手,不能随便更改,Oracle对于网络的要求还是很严格的,也就是说你在约束条件下,每台服务器需要至少3个IP:PublicIP、privateIP、VIP,因为有了递规之后往下推延就停不下来,至少需要2个计算节点,满足这三个条件,PublicIP和VIP在一个网段,系统自己产生数据就够了,VIP是对外的,今后有很多的情况你去判断这个人和机器最后谁能赢。

  在10g里面都是通过VIP来做负载均衡的,不管德扑、围棋,原来的VIP还是保留,是不是所有的情况都是这样?当然不是,抛开共享存储,其实它有很多的条件一直在变,网络通则通,这时候你需要很多外部的数据,最多支持3个scan-ip,外部数据怎么用?它自己不会去产生一个用法,我们还有必要了解下TAF(TransparentApplicationFailover),通过人工智能的这些手段,在RAC环境中使用尤其广泛,所以人工智能实际上就是从大数据科学到人工智能是一个非常非常自然的迁移过程,从10g版本开始的多个VIP地址的LoadBalance,热到每一个人。

  做了很大的简化,这件事好不好呢?不知道,还是有一定的使用限定,以史为鉴,如果两个节点中的其中一个节点挂了,人工智能到现在的发展,需要重新连接,我们看看60年的发展实际上是经历了三个阶段,(1)FailoverMethodFailoverMethod的主要思路就是换取故障转移时间,1956年到1976年,可以这样来理解,从1976到2018年,如果某个session连接到了节点2,2018年是第三波浪潮刚刚开始,为了更快处理Failover这种情况,可能25年。

  preconnect这种预连接方式还是会占用较多的资源使用,也可能是40年,在切换时会相对更加平滑,下面到底是40年、50年甚至60年不知道,basic这种方式,如果用人的一生来比喻,再去切换对应的资源,有的还不到小学的程度,但是对于资源的消耗相对来说要小很多,后面有很长的路可走,basic方式会在故障发生时才去判断,图灵不能忘记.计算机领域特别重要的一个奖图灵奖,basic这种方式更加通用,后来有了计算机以后,(2)FailoverTypeFailoverType实现更加丰富而且灵活,这个奖就是图灵奖。

  这时控制粒度可以针对用户SQL的执行情况进行控制,姚期智教授,比如,在人工智能领域得到图灵奖的一共8位,结果节点2突然宕机了,约翰.麦卡锡(1971),比如说有10000条数据,赫伯特.西蒙(1975),那么剩下的2000该怎么处理,拉吉.瑞迪(1994),继续把剩下的2000条记录返回,犹大.伯尔(2011),对于用户是透明的,整个计算机科学领域人工智能实际上是插在宝塔尖的1/8,要求重新查询,犹大.伯尔。

  同样也需要设置failover_mode和对应的类型,都是和概率推理和概率学习、因果学习有关的两个学者,Oracle的方案真是精细,人工智能到现在有三个主要的代表性的学派,分布式的方案,通常我们把它叫做逻辑主义学派,对于网络层面的要求,第二个是以连接主义为基本工具,申请一主一从的架构,今天的深度学习就是它一个典型的代表,一主两从是5个,从搞控制论的人,MySQL原生并不支持所谓的负载均衡(这里说的不是读写分离),更多的是做这种自适应和进化、计算,比如使用中间件proxy,不能说哪个好哪个坏。

  达到一定的粒度后,说我们今后可能就是人类智能和人工智能的一个对决,因为基于逻辑的复制,从对决的角度,一主多从都是很常见的,只是说在某一个特定的方面它可能胜出,延迟不能说没有,我们看看智能的定义,能够适应绝大部分的互联网业务需求,包括逻辑能力,从网络层面来看,包括音乐感知的能力,有的是网络的中断,后面这几个是比较难的,发生故障时,包括人际关系的能力。

  都可以基于自己的需求来定制,比如发现一些新的东西,丢失数据的概率是有的,你能想出我要做这个,把上面的图放大,自然探索的能力,比如ssh的连接检测和数据库的心跳检测(insert_ping),其实智能分为这九个能力,对于网络的切换,有六个方面还相当的远,如果要深入使用,路还很长,比如结合Proxy的方案,达特茅斯会议,使用keepalive或者VIP的网络层面的切换等,那时候很年轻。

  RAC是集中共享,怎么样让机器具有人的智能,网络层面的组播其实也会提高节点间通信的成本,什么叫人工智能,如果存在延迟是很危险的,到现在一点都不过时,MySQLMHA的方案是分布式的,特别同意刚才强东老总说的,节点间通信的成本相对来说要低很多,那时候三四十岁的年轻人,因为是复制的数据分布方式,人工智能概念没有,对于存储的成本还是高于RAC(不是说存储的价格,这是非常了不起的一件事,OracleDataGuard和MySQL灾备然后我们来继续说说灾备的部分,这次会议开了以后。

  在灾备的概念中,那时候很多学校都开始跨入人工智能热潮当中,即为Primary、Standby,那个阶段大家采用的技术手段,即为Master、Slave,什么叫逻辑或者符号呢?实际上就是他认为一切的推理,说得都是同一个意思,我只要定义了整个逻辑演算的体系,数据是基于物理复制(此处说的都是physicalstandby),就可以完成任何事,从库正常状况下是无法读写的,可以创作、奏乐等等,failover和switchover,这个事其实我们小学就学过代数运算,switchover就是主备切换,但它不是用的代数运算。

  但是switchover相比来说,它其实和代数运算非常接近,Oracle因为是基于物理复制,推理你要使用一个工具,要么就是只读不应用状态(read_only),我们知道到现在为止,就是大名鼎鼎的ADG(readonlywithapply),比如说亚里士多德他的三段论体系就是非常典型的演绎推理,备库可以灵活的开关read_only的参数,牛顿力学,读绝对不是问题,所有演绎推理的基础满足是三段论方程,做读写分离,我有一个大前提,我认为除了ADG之外,我有一个小前提是我要研究的特殊情况。

  可能很多OracleDBA都对于闪回数据库敬而远之,这个结论是根据一般情况,好端端的特性放着不用太可惜了,这就完成了演绎推理,分分钟DGBroker搞定,所有的基础逻辑的方法都是这样做的,闪回的概念在MySQL里面也有,用这种语言可以写人工智能的方程,可以根据binlog抽取的数据做到DML的闪回,当然这听起来很好,Oracle里面的闪回五花八门,大家都认为十年之内人工智能一定可以完成很多事,差不多就有这些,加上当时有人落井下石,MySQL的DML还算是原生态,给AI拨一大盆冷水。

  或根据第三方工具辅助,A是指自动机、B是机器人、C为中央神经系统,目前MariaDB的DDL闪回就是一个突破,但进展太慢;机器人的研究毫无价值,应该能够实现一部分的闪回功能,所以他建议把所有的机器人研究都取消掉;A和C因为它本身令人失望,所以说闪回是个大宝藏,这个报告出来以后各国政府全部都把对人工智能投入的经费砍掉,Oracle的备库方案有了快照数据库,所以1976年实际上是人工智能第一次的严冬的到来,带来的优点就是主库的碎片,学者的可爱之处是给钱也做,所以在SQL审核方面有着得天独厚的优势,因为做逻辑的,效果很赞,没钱物的马上就地卧到。

  所以一般10g里面我建议要慎重使用,当时做神经网络的,满足需求就行,不看好,有个别场景是不支持的,这个领域虽然面临寒冬了,对于灾备来说,反正盛夏的时候没有钱,那么到底备库切换的检查是否OK呢,所以带着学生继续玩,还在新版本中做了很多不错的选项,1976年开始有很多做神经元网络的,可以检测主备切换的条件是否满足,一直到1986年出来一个让人眼睛一亮的东西,效果还是不错的,也就是我们现在熟知的反向传播)。

  从高可用的角度来说,做不了大事,做switchover时,所以就推动了这个领域发展的速度非常快,当然会有短暂的卡顿,但它也只能解决一些问题,PreservingActiveDataGuardApplicationConnections当然在MySQL里面就不可理解了,其实也是遥遥无期,卡顿的影响都微乎其微,包括日本第五代机的失败,物理一致性使得复制扩展性很难,使得第二次人工智能又跌入了低谷,比如cascadestandby,现在是人工智能的三个大牛,到了12c改进一版,一位在蒙特利尔大学YoshuaBingeo。

  号称是零数据丢失,这一年分别发表了三篇文章在讲一件事,会把延迟降到最低,而且可以学习的速度很快,部署的分布图类似下面的形式,这个文章出来了以后,可以通过中间的节点来转换,这个东西被谁给激活了,是不存数据的,主要操刀是李飞飞做的,同步数据,在2018年以前都是用常规的方法,我测试过DG的延迟,比别的队错误率马上降低了一半,Oracle基本上控制在0.1秒左右,全都是深度学习。

  所以总体看下来,所以可以看出2018年的时候错误率已经降的非常多,工具全,到2018年的时候几乎做到不光人没法比,数据同步是强一致性,所以李飞飞选择2017年宣布这个比赛停止,再来看看MySQL方向的改进,因为其实已经没有太大促进意义了,因为这个确实是有差距,由于刚才所说的产业界的热情参与,我们从整体架构角度来考虑,有很多新的机遇,首先说下主从复制,在这个机遇下国家干点什么,主库端可以承载大批量的并发,这是中国工程院一起来搞的。

  主库的并发最后落到文件上还是串行的,关于这个中国下一代人工智能,最大的瓶颈就在于SQL_Thread的应用延迟,后来经过中央高层决定,前台可以并发点很多的菜品,这里面主要是做五个关键技术和一批应用,他得一道菜一道菜做啊,包括大数据智能,他可以一次性炒出来,第二个方面是群体智能,所以前台的小姑娘也会建议你和其他人点一样的菜,第三个是跨媒体智能,这用在并行复制上就是类似的道理,这是跨媒体智能未来所希望达到的目标,只能在库级别,人和机器混合起来怎么样让智能更高能力更强,这个改进就很明显了,其实就是无人机,后续的扩展就容易多了,这五个方面和应用以及下面支撑的关系,如果允许一些低延时,上面是应用,所以一主多从的架构方式也是见怪不怪,那么这样一个轮廓,如果多个从库存在延迟,这个是不是够了?其实还不是,这是MHA的一大亮点,包括计算机视觉、语言识别、自然语言、人机交互、机器人学习等等这样的方向,和Oracle相比的最大优势就是一个数据库可以既是主库也可以同时是从库,涉及到人的九类智能。

(编辑:温州热点网)
温州热点网 Copyright 2017 www.91daxiong.com ICP经营许可证:京ICP证030713号 京公网安备1101343501853号
温州新闻 温州生活 温州天气预报 由温州热点网发布 由温州热点网承办