阿拉善右旗| 黔西| 西固| 舞钢| 垦利| 青川| 泰安| 东港| 宜宾县| 邓州| 额敏| 阿克陶| 城口| 额济纳旗| 德化| 五通桥| 营口| 綦江| 梁山| 同安| 弓长岭| 荥阳| 高青| 清流| 小金| 防城区| 星子| 镇坪| 烈山| 聊城| 兰坪| 涟源| 凯里| 上饶市| 大龙山镇| 晋宁| 穆棱| 南城| 澄江| 四会| 双牌| 铁山| 凤城| 台湾| 八达岭| 石家庄| 井研| 平陆| 大田| 彭阳| 遂昌| 象州| 乡宁| 乌拉特中旗| 南华| 清水| 万州| 卓尼| 肃南| 南部| 大埔| 孝感| 宿豫| 木里| 东营| 盐田| 开江| 灯塔| 桑植| 克什克腾旗| 潞城| 西充| 镇赉| 海阳| 库伦旗| 台东| 黑山| 合肥| 嘉善| 商南| 灵宝| 沛县| 涟源| 平度| 浦城| 江油| 都兰| 巴林右旗| 右玉| 民和| 曹县| 通化市| 托里| 金昌| 乌达| 获嘉| 南宁| 松江| 永清| 华山| 静乐| 永修| 襄汾| 永定| 左云| 海阳| 临泽| 南木林| 宁晋| 德化| 成武| 辛集| 临清| 都匀| 息烽| 马尾| 蒙自| 湘东| 广东| 凭祥| 定边| 江源| 喀喇沁旗| 禹州| 广宗| 高阳| 洪泽| 临泽| 隆子| 金湾| 建宁| 凤凰| 肇源| 绥滨| 防城区| 镇平| 宁波| 镇赉| 鲅鱼圈| 汝阳| 宝山| 望都| 韩城| 上蔡| 沽源| 临沧| 岑溪| 鄂伦春自治旗| 相城| 吴堡| 香港| 五台| 若羌| 林芝县| 益阳| 谢通门| 峡江| 南山| 长治县| 峰峰矿| 东营| 吴江| 连江| 铜陵县| 科尔沁左翼中旗| 正阳| 滦平| 西峰| 道真| 洛南| 天津| 大安| 大方| 汉口| 马鞍山| 夏河| 遂溪| 勐腊| 宁晋| 京山| 博爱| 石嘴山| 茂县| 惠水| 白水| 射阳| 白朗| 兰西| 五原| 碌曲| 札达| 东方| 丽江| 乡宁| 海兴| 台山| 万盛| 台中县| 原阳| 玉门| 厦门| 神池| 麦盖提| 寿宁| 施秉| 铜川| 西平| 龙口| 昌都| 平湖| 达坂城| 蚌埠| 南和| 玉门| 凤县| 融水| 赞皇| 高县| 汝南| 泽州| 东台| 贵州| 茂港| 马龙| 太白| 牟定| 民勤| 富顺| 宜黄| 南雄| 头屯河| 勐腊| 保定| 宣城| 津市| 大田| 双柏| 安福| 美溪| 友好| 东丽| 花都| 普宁| 十堰| 云林| 共和| 喀什| 睢县| 前郭尔罗斯| 鱼台| 新宾| 苏州| 浦北| 金门| 苍南| 石台| 麟游| 余庆| 酒泉| 云浮| 莱山| 嵩县| 大兴| 陆川| 千赢网站-千赢登录

广交会首日,三门参展企业获得550万美元意向订单~

2019-07-19 23:25 来源:药都在线

  广交会首日,三门参展企业获得550万美元意向订单~

  韦德国际_韦德体育|欢迎您(1)文化产业(CultureIndustries)。一些党员干部群众观念淡漠,未能抵御权力的腐蚀和利益的诱惑,脱离群众问题突出;四是消极腐败的危险。

因此,《中国地方志佛道教文献汇纂》具有重要的史料价值。《中华思想文化术语》(第1-5辑)系北京外国语大学韩震教授承担的重大项目“中华思想文化术语的整理、传播与数据库建设”(批准号:15ZDB003)的阶段性成果,由外语教学与研究出版社相继出版。

  仅内河船运即产生了数十万以船为业的艄公、水手、纤夫等群体。智库联络处:负责国家高端智库建设规划和实施,组织高端智库申报、评估和日常管理,开展国内外智库发展动态的调查研究,为中央决策提供咨询服务;组织评审国家社科基金后期资助项目和中华学术外译项目。

  二、聚焦重大现实问题,推出一批对策性研究成果武汉大学李纲领衔的“智慧城市应急决策情报体系建设研究”课题组,将应急决策、情报体系、智慧城市三个方面有机结合,选取各类突发事件中40个典型案例进行数据搜集和研究,开发出《基于网民的口碑分析系统》《网络信息采集与结构化抽取系统》《突发公共卫生事件语料库系统》等3项应用软件,对各级政府部门监测和控制公共突发事件发挥重要支持作用;华中师范大学何婷婷领衔的“互联网环境下的语言生活方式与建设和谐的网络语言生活研究”课题组通过计算机爬虫技术建立可持续更新的网络语言生活监测数据库,涵盖新闻1700万篇、博客1000万篇、论坛3400万篇、微博8700万篇,基于该数据库完成的多项研究成果被国家语委采纳,并参与人民网和央视新闻等主办的年度十大网络用语活动,产生广泛社会影响;南京工业大学王冀宁领衔的“我国食品安全指数和食品安全透明指数研究:基于‘政产学研用’协同创新视角”课题组,针对当前食品安全问题频发的现状,采集来自超过700家食品安全相关单位及2400多位消费者的样本数据150多万个,首创“中国食品安全监管信息透明度指数”和“中国食品安全监管绩效指数”,为食品安全政府监管部门提供理论参考;中国石油大学(北京)罗东坤领衔的“基于中国石油安全视角的海外油气资源接替战略研究”课题组,建立中国石油安全评估体系和综合评价方法,构建中国石油安全分级预警的方法和预警级别,对未来中国石油安全形势进行分析,为评估国内石油安全形势和海外石油投资决策提供了理论指导和方法工具。全国社科规划办2012年6月12日发布的《国家社会科学基金学术期刊资助管理办法(暂行)》,以及2012年7月9日发布的《国家社会科学基金学术期刊资助经费管理办法(暂行)》同时废止。

佛经汉译是中印文化交流的媒介比较文学的基础是影响研究,主要研究各国文学之间的相互联系。

  解决文化发展新问题矛盾是普遍存在的,不同时代有不同的矛盾出现,矛盾在社会发展中不断变化,新时代中国特色社会主义文化创新需要解决新的文化矛盾问题。

  认清中国的国情是认清一切问题的关键,我国社会主要矛盾的变化是关系全局的历史性变化,不充分不平衡的发展是制约人民美好生活实现的主要障碍。在这里,笔者试图通过波特在《竞争优势》一书中提出的价值链方法对其进行分析。

  三、服务地方经济社会发展,推出一批应用性研究成果南京大学盛昭瀚领衔的“社会科学计算实验基本理论、关键技术及应用研究”课题组,建立太湖流域自然—社会复合系统计算实验平台,为政府治理太湖水环境政策的制定提供决策支持,对港珠澳大桥工程招标过程进行情景模拟,为招标策略的制定提供理论依据;吉林大学张屹山领衔的“中国潜在经济增长率计算及结构转换路径研究”课题组撰写的关于如何让地区经济企稳回升的报告获多位省部级领导重视,核心建议均被采纳;中南大学肖序领衔的“基于工业的循环经济价值流分析研究”课题组的研究成果广泛应用于指导中国铝业、株洲冶炼等大型企业的循环化改造,以及宁乡经开区、长沙经开区等生态工业园的信息资源共享平台建设;河海大学王慧敏领衔的“保障经济、生态和国家安全的最严格水资源管理制度体系研究”课题组,以问题为导向,选择多个不同特征水资源问题流域为研究背景,从“制度需求”与“制度供给”角度出发,提出基于互联网+的最严格水资源管理技术支持体系,为其他流域的科学管理提供借鉴和参考;中山大学梁琦课题组,在空间经济学框架下,考察我国城市层级体系的基本事实,探寻城市层级体系内劳动力流动的内在机理,并分析户籍制度对劳动力流动进而对我国城市层级体系的影响;华南理工大学王世福领衔的“中国城市社会来临与智慧城市设计及发展战略研究”课题组,有多名博士和硕士研究生参与研究,课题组依托该项目指导学生参加各类竞赛,获省部级以上奖励50余项,获得相关行业及部门的关注。

  此书的问世,将为人类的防震减灾事业提供许多可供参考的对策、建议和模式。应该说,这属于典型的民众话语权实现,是一种民主政治实践;但在整体上缺少偏好转换的过程,因而不属于严格意义上的协商民主实践。

  第二,在思想比较视域中阐明马克思恩格斯探索自由问题的科学路径,是呈现历史唯物主义本真精神的关键之所在。

  伟德国际-1946一个偶然事件使设想付诸实践。

  全面从严治党就是要通过合理的制度设计和制度供给将党的权力全面纳入规则约束之中,为依规治党提供蓝图和指南,推进党的自身治理与现代化转型,全面增强党的执政本领,从根本上消解党面临的执政危险。在文学史上,每隔一段较长的时间,就会形成一个新的大成文体。

  博猫平台_博猫彩票 亚博游戏官网_亚博游戏娱乐 千赢娱乐-欢迎您

  广交会首日,三门参展企业获得550万美元意向订单~

 
责编:

广交会首日,三门参展企业获得550万美元意向订单~

2019-07-19 09:52:33 来源: 网易智能
0
分享到:
T + -

本文来自 第四范式,网易智能已获转载授权。

「范式大学」由第四范式发起,致力于成为“数据科学家”的黄埔军校,校长为第四范式首席科学家,华人界首个国际人工智能协会AAAI Fellow、唯一的AAAI 华人执委杨强教授。

[范式大学]在探索AI工业化的同时,也关注最新学术研究成果。近日,杨强教授在[范式大学]内部课程中,与大家分享了他在 “生成式对抗网络模型“ 和迁移学习等领域的独特见解和最新思考。在此特别感谢杨教授的博士生张颖华同学的帮助。

以下内容根据杨强教授演讲编写,略微有所删减。

有些人看过电视剧《西部世界》—在《西部世界》里,你可能问的一个关键问题是什么?就是当剧中的人们,其中任何一个人走到你面前,你能否区分出他/她是个真人? 你会问:咦,这不是图灵测试要解决的问题吗? 是的。 问题是,如果《西部世界》里的这些机器人已经通过了图灵测试,你又如何区分他/她们呢?

要解决这个问题,除了用“一枪把对方打死,然后看对方是否真的死了”这个极端的检测方法以外,还有什么更好的方法呢?这里有些剧透,答案是:拍苍蝇。当一个苍蝇飞到一个“人”的脸上,如果这个人没有感觉,不会去拨开或拍打苍蝇,他/她很可能就是机器人。结果因此还引发了一件趣事,去年美国大选的时候,希拉里在讲台上面,一个苍蝇飞到她脸上,她没有搭理,后来有人就说:糟了,我们要选一个机器人当总统了!那时《西部世界》恰好正在热播。

言归正传,从人工智能的角度,“拍苍蝇”这个例子,说明什么呢?它告诉我们有一些关键特征可供识别真人亦或机器人,但要找到这些关键特征并不容易。对《西部世界》而言,你得把整个剧看完才能知道。也就是说,你不但要有大量数据的训练,而且得知道剧里的机器人的制造原理,这样才能找到这个重要特征。那么问题来了:如果作为“游客”,我们对这个机器人的构造知道甚少怎么办?

要回答这一点,我首先要给大家讲一下概率模型的不同类型。概率模型是贯穿整个机器学习的主线。下面PPT上的这两张图是对一个女孩的素描,我们在素描里面可以看到很多的特征,比方说比较飘逸的笔画、或者是适合女性颜色等。我们把上面的问题简化一下:如何能够通过辨别这些体征、从而认出来画上的是男是女?

杨强漫谈西部世界、生成式对抗网络及迁移学习

这里我要介绍一个“生成”模型的概念。 在某个关于“人”的样本集里面找到某一个高概率的样本,我们认为这个样本很可能对应我们对“人” 这个概念的认识。然后我们根据这个样本来做完形填空或着彩。在小学中学我们经常做的一种题就是填空。其实,生成样本的过程和填空很相似:当我们看到这张画要给它着色时要选择颜色和图案,是因为这些选择符合“人”的概率分布。

再具体一些:如果数据是(X,Y),这里我们用X这个变量来代表笔画和颜色,Y这个变量来区分男女,那么这个概率数据是遵循一定分布规律的。但问题是,如何才能得到这个数据的分布?在现实中,做到这一点是非常难的,因为这需要我们获得概率的“联合分布”,就是所有显式和隐式的特征和它们所有可能取值的概率。知道了这个概率,生成某个样本就很容易了。 在机器学习的历史上, 关于要不要首先获得“联合分布”这个问题,有着很多的争论。比方说,有贝叶斯流派,就说:“是的,我们需要这样一个联合分布”。而深度学习流派,或者是SVM等算法对应的这些流派,就说:既然我们的目的是分类,那用简单的算法就可以了,所以”不需要”。 得到一个联合概率分布是非常非常难的事情,因为需要因果关系的知识,还需要很多先验概率。

生成模型是很有用的。比如说,我们在一幅画上如何确定这样着色是有意义的,但那样做是没有意义的?除了在画作上,在音乐作曲的问题上也是如此:如何做一首动听的曲子?为什么有的曲子就很好听,有的就很难听?这些任务,其实都是在做“生成”的工作。我们为什么很尊敬某些作曲家、电影导演、作家?  作为观众,我们去看电影很容易,但是让自己去做导演,做编剧往往就觉得很难。 这是为什么呢? “联合概率模型”的学习过程就帮助我们回答了这样一个问题。问题是:学习如何产生一个联合概率模型,需要大量的高质量数据来训练。真正能了解真实概率生成机制的只有少数人,即那些机器人的设计者。这也和我们的常识是一致的: 只有少数人能够成为好的作家,只有少数人能够成为好的诗人,而要做到这一点需要遵循所谓的“一万个小时定律”。

杨强漫谈西部世界、生成式对抗网络及迁移学习

因为生成式模型很难估计,所以,我们在机器学习中更多的是使用“判别式机器学习模型”的。这种模型和“生成式概率模型”是有一个本质的区别的。 我们过去熟悉的模型如逻辑回归,SVM和深度学习等,多是判别式模型。就是:给你一个样本,模型不关注样本是怎么“真正”生成的,也不关心样本构造的真实因果关系和概率值, 而是直接判别样本属于哪一类。 我们可以管这种判别的方式叫做“懒人主义”。 相反,生成式模型可以被认为是一个“完美主义。”  什么是完美主义呢?我们要去判别一个事,从它最原始的那个点开始分析,产生先验概率分布,然后根据因果关系一直推到可观察的样本分布,最后再得到样本。这样,一旦得到整个联合概率分布,就可以对缺失数据和未来的事件做出准确的预测。 所以,到了完成了这个联合分布的学习时,我们机器学习的工作就做的差不多了。

生成式模型和判别式模型的区别很像人和机器的区别:机器采取的是完美主义,因为它可以不断优化,追求极致。而人不会如此,人是够好了就满足了。从这一点上来说,人完全没有必要和阿尔法狗去比赛,因为这是不明智的。我们人类的构造不是干这个的,我们的构造是能把一件事给做完了。比方说,人应该去比的是你有多快能学会下围棋,并从中得到多少乐趣。而把围棋下的极致这件事是机器擅长的。

有没有办法,利用有限的数据,通过不断提高的方式,建立一个生成式模型呢?Ian Goodfellow提出了一种新的方法,很值得我们思考: 他的设想是用一个生成式模型(Generator)来生成模拟样本,再用一个判别式模型来区分这个生成的样本是否真实,这样的一对系统,可以互相对弈,共同提高。 以作画为例。 假设我们的目的是设计一台机器人来模拟大师们的画作。 最开始,机器人先通过生成式模型完成某个画作。 这幅画可能很差,离大师的水平差的很远。如果这个时候有一个评论员(判别式模型)来告诉机器人这幅画的缺点,那机器人就可以在下一幅画中加以提高。如果评论员自己犯了错误,没认对,那机器人就可以告诉评论员如何提高鉴赏能力。 评论员总是在问这样一个问题:这幅画是大师画的还是机器人画的?如果判别式模型可以准确地辨认出来是机器画的,那说明这个生成式模型还不够好,如果判别不出来,就说明画作已经能够以假乱真了,而判别式模型就有待提高。这里,生成式模型和判别式模型,利用不断反馈,实现相互提高。

杨强漫谈西部世界、生成式对抗网络及迁移学习

这让我们想起了图灵测试——计算机和裁判聊天,他们互相看不到彼此,如果在沟通的时候,裁判无法辨别哪个是计算机,“人工智能”在它身上就实现了。这个双机结构和图灵测试不同的地方就是,机器和判官都可以学习,不断提高,最后两者都可以达到最好。

这样,就把我们带到“生成式对抗网络” (GenerativeAdverserial Network, 或者GAN)这个概念。如下图所示, 我们有两个系统,在互相对抗, 两个系统都试图优化自己的目标函数。第一个系统对应判别式模型D: 判别式模型D在试图识别到来的样本是否是自然真实的;它在尽量增大对真实样本的识别率,同时减少对模拟生成的样本的误判率。另一个系统则对应着生成式模型G:G希望它生成的模拟样本可以在D那里鱼目混珠。 所以G试图最大可能地模拟真实的样本。 判别器D从判别角度来说,判别的越好,D的目标实现的就越优 。但对于生成器G来说,它要最小化(minimize)对方的优化函数,这就相当于最大化(maximize)它自己的优化函数。这个过程就像G和D在下棋一样(如下图的博弈树)。在这个树里有两个棋手,一个在不断更新判别器,一个是在不断更新生成器。把这两个合并起来,叫做Minimax算法,这是利用AI下棋的一个基本算法。在这里,就是G和D两个系统在竞争中不断成长,最后两个都达到最优。

杨强漫谈西部世界、生成式对抗网络及迁移学习

这个交互过程到底能不能同时优化两个目标?GAN的发明人Goodfellow有以下的解释。训练过程如下图所示,假设黑色的点是真实样本的分布,绿色的线是根据生成模型产生的生成的样本的分布,那么GAN网络就是在把生成的样本的概率空间映射到真实样本空间里,再去加以对比。这样得到的结果与真实情况会存在偏差,而根据这样的反馈,生成的样本的数据分布不断得到调整,直到和真实分布重合为止。这时,判别式模型G就分不出来真假数据,而学习任务就完成了。

杨强漫谈西部世界、生成式对抗网络及迁移学习

那么,有没有理论来证明以上这个博弈学习交互过程会最终得到令人满意的结果呢?我们看看下面这个定理:

杨强漫谈西部世界、生成式对抗网络及迁移学习

这里给大家翻译一下这个公式:

如果G是丈夫,D是妻子,妻子训练丈夫做家务。妻子不断指出丈夫的不足之处,以此希望丈夫提高自己。丈夫呢,有时他提高的办法是试图猜出妻子满意的家务到底是什么,就不断的试验。但一开始结果可能和妻子的需求不一样,然后得到一顿狠K。所以在提高如果夫妻两人同样好学,妻子能不断指出丈夫的错误,而丈夫也不放弃,一直很努力,那么这对夫妻就会一起进步,一直达到一个共同的最优值,这个家庭也就美满了。

那么这个定理到底是不是靠谱呢?因为它有很多的限制条件,这些条件在现实中都很难成立,所以我们只能通过实验来验证。比方说,我们可以使用手写识别的数据集MNIST和图像识别的数据集TFD来验证,最后发现GAN在集种不同的算法里面的得分是最高的!

杨强漫谈西部世界、生成式对抗网络及迁移学习

利用GAN也可以让电脑学写字。在训练好的时候,这些GAN写的文字几乎可以以假乱真。但它也有做不好的地方,比如说在一些复杂的图像中做出来的就是相当模糊的。我们后面会讨论,这是因为GAN在数据集之间的“距离”的概念还没有学好。

杨强漫谈西部世界、生成式对抗网络及迁移学习

我们接下来要问:样本到底是怎么产生的?一个简单的办法是“猜测”: 我们首先可以假设一个真实的概率分布是按照某种形式来分布的, 然后按照这种形式随机地产生一个样本。这样的结果如果不好,那就回来修改这个分布假设。但是,这种猜的办法质量低,速度慢,结果不靠谱。

那要怎么办呢?假设我们有一张很大的画,我们要把它压缩一张小画,一般是怎么做的呢?我们大家可能用过双筒望远镜。这个望远镜可以反着看,就会看到小版的画面,这个就相当于把一大块数字压缩成一个数字,这个过程叫做convolution(卷积),卷积神经网络就是在做这件事情。那如果我们正着看望远镜,会把一张画放大,我们会看到画作当中的某一个部分,这个过程就相当于从一个或几个数字产生了整个矩阵,这也就是“生成”的过程,即生成式模型在做的事情。理解了这个原理后,基于深度学习和卷积,我们把整个网络反过来,相当于正着用望远镜,把压缩的图形一步一步放大,最后形成了一个复原的样本,它叫“转置卷积(Transposed-Convolution)”, 这个产生样本的方法叫做DCGAN。比方说,可以通过几个例子的训练之后,用来产生新的中文字。还有一些漫画的社区也开始用这个网络,来自动生成漫画的图像。

杨强漫谈西部世界、生成式对抗网络及迁移学习

当然,还可以用DCGAN网络来分类,用它的判别式模型部分来做分类这件事。这就好像用大炮打蚊子是没有必要的,但用大炮里某个部件(即判别式模型)打蚊子,确实要比用大炮拍打蚊子要打的好。所以,我们取出一块深度网络中的一部分来分析,发现它确实可以帮助找到非常关键的一些数据特征,而且用它来做分类的效果就比其他的办法要好很多。再回到西部世界的那个例子,看“苍蝇趴在脸上,人的反应”这个特征,就可以被找出来了。

有了GAN这个方法,我们可以对任意样本做向量化,从而加以比较。比方说,我们可以比较“苹果”和“橘子”,看它们的距离到底是不是比“苹果”和“香蕉”近一些? 我们知道在自然语言界有一个技术叫Word2vec,从文字到向量表示(Embedding),是一个连续实数向量。它可以做什么呢?比方说它认为,v(“woman”)-v(“man”)+v(“king”) =v(“queen”),即女人减去男人,再加上一个国王,相当于把女人的特性赋予国王,这个国王对应的就应该是女王,这个过程做类比。类比是怎么产生的呢?在高维空间,大数据会表明,这两个字的用法差不多,它们的距离很近。而GAN网络也可以做这件事情,比方说这个男的戴墨镜,减去一个男的再加一个女的,就变成了一个女的戴墨镜,这个是可以用GAN可以做的,很神奇。

杨强漫谈西部世界、生成式对抗网络及迁移学习

但是这样设计的系统还是有一些缺点。 比如,如果我们稍微换一换模型的参数,模型效果就会急剧变差。这说明,直接用DCGAN建立的模型不大可靠。

怎么解决这个问题呢?我们在开始讲过,GAN的思想就是不断修改生成式模型使得模拟的概率模型尽量接近实际的概率模型。所以,可靠性问题的实质就在于:如何可靠准确地测量两个概率分布之间的距离。 这里有一个新的技术叫Wasserstein GAN。 因为传统的生成式模型的目标函数通常都是优化KLdivergence, GAN的目标函数在优化JS divergence.  但这两个距离都有缺点:就是不能准确表达所有分布之间的距离。所以有人提出一个更靠谱距离表达,叫做Wasserstein距离,外号叫“土地挖掘机” (Earth-mover),就是给你一个土山,那么如果你用挖掘机在这一座山,去复制另一座山,问你需要花多大的力气 — 这个移动土地的费用就是Wasserstein 距离,简称W距离。如果两座山的形状完全一样,那么就不需要任何费用。 如果两者完全不同,那么就需要很多的费用。

杨强漫谈西部世界、生成式对抗网络及迁移学习

如果换成这个W距离来测量概率分布就好得多。比如说,给定两个数据集的分布,其中一个是真实的新闻分布,一个是假新闻的分布。如果用KL或JS距离来表达,结果都不够好,会得到一个是无穷大,一个是一个常数。用这样的距离就没有办法识别真、假新闻了。 但如果我们用了W距离,得到的会是一个连续可导的距离。所以,用W距离来设计GAN (WGAN) 就靠谱多了。

生成式对抗模型(GAN)可以做哪些事呢?它可以做模型的解释,做图像分析和自然语言分析。还可以再加上一些新的边界条件,用来做迁移学习。

杨强漫谈西部世界、生成式对抗网络及迁移学习

上面这个例子,是把一个模糊影像变到清晰影像的任务,模糊影像的模型是有很多的不确定的地方。把一幅画变为清晰的过程,就是在一个矩阵里面找到丢失的值,并且把它用真实值填满;这个事和我们第四范式做推荐系统的概念是一样的。

再者,就是可以用GAN来很自然地实现迁移学习。比如说, 如果我们又一个很好的生成式模型,在某个数据集上已经训练好了,如果有一些新的数据,和前一个数据集有明显的区别, 那么我们可以利用“GAN+边界条件”,把生成式模型“迁移到” 新的数据分布上。比方说,我们写字的时候,每个人签名都是不同的,我们不会用印刷体来签名,因为我们每个人都有自己的写字的特点。那么,如果用大量的印刷体字作为第一部分的训练样本,来训练一个不错的通用模型,而用某个人手写的斜体字做第二部分的训练样本,就可以利用WGAN把印刷体的模型迁移到个人的签名。也就是说,这样的签名也就更具个性化特点。

所以说,即使源数据和目标数据在写法上、颜色上有一些区别,GAN的模型可以实现迁移学习的目标。

这里还有一个迁移学习的例子:在领域适应(Domain Adaptation)的问题中,在目标领域没有任何的标注,所有的标注都在源领域。 GANIN等人设计了一个类似于GAN的模型,在源领域用标注数据来做标注数据的分类,同时连接到一个“领域判别器”来区分输入的数据,看数据是来源还是目标领域。 这个过程进行到最后,当领域判别器不可以很好地区分数据来自哪个领域,就说明神经网络的中间层学会两个不同领域的相同特征部分了。这个时候,迁移学习的目的就达到了。

杨强漫谈西部世界、生成式对抗网络及迁移学习

总结起来我们看到,生成式对抗网络是一个新的机器学习的思想。它是由两个模型共同产生的——就像是两个学生同时成长,一个学生专注于生成样本,一个学生专注于判别真假,他们来互相促进。同时,生成式对抗网络也存在一定缺陷,首先它需要的数据量还是很大的;此外,理论的指导还是比较缺乏。

杨强漫谈西部世界、生成式对抗网络及迁移学习

最后我们还回到《西部世界》的场景。这个电视剧的一条主线是对机器人(或人类)的智能成长的路径,电视剧的后面几集提出了一个重要的思想:“二分心智”(Bicameral Mind)。这是个关于人类智能的发展的假说:提出大脑中的智能和意识的发展,是通过两个独立的智能体的不断对话和学习来实现的。也就是我们常说的 “脑袋里的两个小人在打架”。这个二份心智理论曾经在心理学界大行其道。

我们看到,生成式对抗网络GAN的模型,和这个“二分心智”的理论有些不谋而合:它们都是认为智能应该是能够不断学习提高的,都提出:智能成长的机制是由两个互动的系统来相互刺激。在GAN这个模型中,这两个机制分别是生成式模型和判别式模型。 在《西部世界》里,这个刺激来自很多的苦难和创痛,让机器人Dolores 和她的同伴们经历了很多痛苦艰难的事情,最后刺激让她/他们产生了“二分心智”,也就产生了意识。 就像这幅图中的两个Dolores在对话所表现的那样, 最终导致机器人们产生了意识 。

杨强漫谈西部世界、生成式对抗网络及迁移学习

当然,在生成式对抗网络GAN的学术方向上,并没有涉及到“意识的生成”这个问题, 实际上,整个人工智能的发展都还没有涉及到“意识”的概念。 但是,通过GAN来理解的“二分心智”, 以及“我们可以借两个对抗系统提高智能”这件事,还是非常有趣的!

扩展阅读:

[1] Goodfellow, Ian, et al. "Generative adversarial nets." Advances in neural information processing systems. 2014.

[2] Ganin, Yaroslav, et al. "Domain-adversarial training of neural networks." Journal of Machine Learning Research 17.59 (2016): 1-35.

杨强漫谈西部世界、生成式对抗网络及迁移学习 

小羿 本文来源:网易智能 责任编辑:王超_NT4133
分享到:
跟贴0
参与0
发贴
为您推荐
  • 推荐
  • 娱乐
  • 体育
  • 财经
  • 时尚
  • 科技
  • 军事
  • 汽车
+ 加载更多新闻
×

从山村到北大,刘媛媛用4步逆袭人生

热点新闻

态度原创

阅读下一篇

返回网易首页返回科技首页
用微信扫描二维码
分享至好友和朋友圈
x