原标题:《人工智能半月刊》第五十九期(2018.8.29)

事项:

上一篇文章介绍AI产品经理能力模型,人工智能的发展历史,人工智能常见概念的结构梳理,也简要做了BAT人工智能的优势分析,感兴趣的朋友可以点击链接查看上文。转型AI产品经理需要掌握的硬知识一:AI产品能力框架和看待AI的几个视角
本文将继续介绍Ai产品经理需要理解的一些概念,常见AI算法,机器学习的工作方式和三大流派,使用Tensorflow实现手写数字识别,帮助大家理解技术实现流程和一些AI技术名词,更有助于同AI科学家或AI工程师的沟通。

8月22日,在第四届中国智慧城市国际博览会上,科大讯飞发布了“城市超脑计划”。科大讯飞轮值总裁陈涛表示,在迈向“数字孪生城市”的目标上,科大讯飞刚刚走出第一步。数字孪生城市指的是在物理城市的基础上,形成精准对应的数字化模拟城市。在数字模拟城市里,系统可以自动运转,辅助人类进行城市的精细化管理。还可以基于现在对未来进行模拟和预测,进而为城市的规划者提供决策参考意见。陈涛认为,当“城市超脑”对城市的运行发展规律有比较准确的认识后,才能真正实现带有科幻色彩的“对城市进行模拟仿真,并推演未来”。他预测,数字孪生城市在5年后才会真正出现。

   
12月27日,国家发展改革委员公布,“2018年“互联网+”、人工智能创新发展和数字经济试点重大工程拟支持项目名单公示(进行中)”。根据《国家发展改革委办公厅关于组织实施2018年“互联网+”、人工智能创新发展和数字经济试点重大工程的通知》(发改办高技[2017]1668号),近期,国家发展改革委高技术产业司委托中国国际工程咨询公司对有关单位申报的项目进行了评估。结合评估建议,经研究,提出了拟支持项目名单。

一、常用AI技术概念

提到人工智能,大家应该都听说过这样几个概念:人工智能,机器学习,深度学习,模式识别,知识图谱,卷积神经网络,递归神经网络,以及与人工智能直接相关的概念,如云计算,数据挖掘等,这些概念之间是什么关系呢?笔者找到了一张这些概念的关系图,可以将上述概念串在一起,更易理解,如下图所示:

科学 1

    评论:

1、人工智能>机器学习>深度学习

人工智能(Artificial
Intelligence):英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。

机器学习(Machine
Learning):机器学习是人工智能领域的一部分,并且和知识发现与数据挖掘有所交集。机器学习还有下面几种定义:
“机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能”。
“机器学习的应用已遍及人工智能的各个分支,如专家系统、自动推理、自然语言理解、模式识别、计算机视觉、智能机器人等领域。机器学习的研究是根据生理学、认知科学等对人类学习机理的了解,建立人类学习过程的计算模型或认识模型,发展各种学习理论和学习方法,研究通用的学习算法并进行理论上的分析,建立面向任务的具有特定应用的学习系统。

深度学习(Deep
Learning):深度学习的概念源于人工神经网络的研究,是一种含多隐层的多层感知器。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度机器学习方法也有监督学习与无监督学习之分.不同的学习框架下建立的学习模型很是不同.例如,卷积神经网络(Convolutional
neural
networks,简称CNNs)就是一种深度的监督学习下的机器学习模型,而深度置信网(Deep
Belief Nets,简称DBNs)就是一种无监督学习下的机器学习模型。

科学 2

    “面向深度学习应用的开源平台”重大工程申报要求很高。

2、神经计算>人工神经网络>深度学习>卷积神经网络/递归神经网络

神经计算科学是使用数学分析和计算机模拟的方法在不同水平上对神经系统进行模拟和研究:
从神经元的真实生物物理模型,它们的动态交互关系以及神经网络的学习,
到脑的组织和神经类型计算的量化理论等,从计算角度理解脑,研究非程序的、
适应性的、大脑风格的信息处理的本质和能力,探索新型的信息处理机理和途径。

延伸阅读
计算神经科学

人工神经网络(Artificial Neural Network,即ANN ),是20世纪80
年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象,
建立某种简单模型,按不同的连接方式组成不同的网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation
function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重,这相当于人工神经网络的记忆。网络的输出则依网络的连接方式,权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近,也可能是对一种逻辑策略的表达。

延伸阅读
神经网络的简化理解

深度学习的概念见上文。

卷积神经网络和递归神经网络下文算法中详细介绍。

1、建筑超脑下半年可以审图

   
本次中科曙光(曙光信息产业股份有限公司)进入重大项目支持名单的是“面向深度学习应用的开源平台建设及应用项目”。在发改委申报要求中明确指出要:

3、模式识别、知识图谱和专家系统

模式识别(Pattern
Recognition)是指对表征事物或现象的各种形式的(数值的、文字的和逻辑关系的)信息进行处理和分析,以对事物或现象进行描述、辨认、分类和解释的过程,是信息科学和人工智能的重要组成部分。模式识别又常称作模式分类,从处理问题的性质和解决问题的方法等角度,模式识别分为有监督的分类(Supervised
Classification)和无监督的分类(Unsupervised
Classification)两种。我们所指的模式识别主要是对语音波形、地震波、心电图、脑电图、图片、照片、文字、符号、生物传感器等对象的具体模式进行辨识和分类。模式识别研究主要集中在两方面,一是研究生物体(包括人)是如何感知对象的,属于认识科学的范畴,二是在给定的任务下,如何用计算机实现模式识别的理论和方法。应用计算机对一组事件或过程进行辨识和分类,所识别的事件或过程可以是文字、声音、图像等具体对象,也可以是状态、程度等抽象对象。这些对象与数字形式的信息相区别,称为模式信息。它与人工智能、图像处理的研究有交叉关系。

知识图谱本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息连接在一起而得到的一个关系网络。构建知识图谱的重点在于语义理解、知识表示、QA、智能对话和用户建模。知识图谱是一系列结构化数据的处理方法,它涉及知识的提取、
表示、存储、检索等诸多技术。
从渊源上讲,它是知识表示与推理、数据库、信息检索、自然语言处理等多种技术发展的融合。

延伸阅读 知识图谱技术解剖

专家系统是一个具有大量的专门知识与经验的程序系统,它应用人工智能技术和计算机技术,根据某领域一个或多个专家提供的知识和经验,进行推理和判断,模拟人类专家的决策过程,以便解决那些需要人类专家处理的复杂问题。专家系统就是人去学一个东西,然后把学到的知识理论化,再把这些理论模型化,最后把这个模型程序化,形成一个系统,就叫专家系统。知识图谱可以作为专家系统的一部分存在,提供半自动构建知识库的方法。

科大讯飞在2014年提了“讯飞超脑计划”,集成人工智能核心技术,让机器像人一样能听会说、能理解会思考。现在,“超脑”的能力不只应用于教育考试,还可以用在安全、交通,乃至城市建设。科大讯飞的“城市超脑”将从“建筑超脑”开始切入,先“理解”目前的建筑规范和行业标准,然后做下一步工作。科大讯飞“建筑超脑”在下半年内就可以开始“审图”。AI审图软件主要面向建筑工程领域,利用机器辅助人类专家对建筑设计成果进行审核,这可以将原有1到2周的审核时间缩短为几分钟,同时大大提高审核的全面性与准确性。

    基于 CPU、GPU、FPGA
等多类型深度学习硬件,建立人工智能软件开发平台支持图像识别、语音识别、自然语言理解等典型人工智能技术,建立
CNN、RNN
等多种神经网络及深度学习算法的训练库,具备直观灵活的数据接口和模型配置接口。建立软件编译过程中大规模数据的自动采集分类、海量数据智能分析处理、跨媒体数据关联与挖掘等环境,突破人工智能应用的云网端计算智能调度。

二、常见算法概述

前文中我们提到了深度学习,既然有深度学习就一定有浅度学习,其区别体现在隐藏层的数量上,一般来说,浅层学习没有隐藏层或者只有一层隐藏层,常见算法包括线性回归、逻辑回归、随机森林、SVM、K-means、RBM、AutoEncoder、PCA、SOM等。深度学习通常会有较多隐藏层,可以表达复杂函数,识别更多复杂特征。常见算法有CNN卷积神经网络和RNN递归神经网络,而基于RNN衍生出了LSTM和GRU等一系列算法。

下面将介绍学习过程中一些常见的算法分类,AI产品未必掌握具体算法实现细节,但是需要掌握一些常见算法概念,它们可以处理什么类型的问题,有什么优点,一般应用在哪些领域。

2、城市超脑计划分五步走

    指标要求:1.支持 100PB 以上级别的数据规模和数据处理能力;2.支持
TensorFlow、Spark、xgboost
等主流机器学习算法工具的混合部署和统一管理,并提供在线服务能力;3.跨媒体管理数据类型至少包括图像、视频、音频、文本等多模态数据;4.开展不少于10类以上的人工智能应用验证,应涵盖图像识别、语音识别、自然语言理解等领域。

1、决策树

决策树根据数据的属性采用树状结构建立决策模型,
用树形结构对数据进行分类,在进行逐步应答过程中,典型的决策树分析会使用分层变量或决策节点,决策树模型常常用来解决分类和回归问题。以服装购买为例,首先判定是否喜欢,不喜欢则不买,喜欢则看价格,价格不合适则不买,合适则看是否有合适的尺码,没有合适的尺码则不买,有则购买,基于以上选择,可以画出一个简单的树桩结构。

场景举例:基于规则的信用评估、赛马结果预测

优点:擅长对人、地点、事物的一系列不同特征、品质、特性进行评估

常见相关算法:分类及回归树(Classification And Regression Tree,
CART)、ID3(Iterative Dichotomiser 3)、GBDT、C4.5、Chi-squared Automatic
Interaction Detection(CHAID)、Decision Stump、随机森林(Random
Forest)、多元自适应回归样条(MARS)、梯度推进机(Gradient Boosting
Machine, GBM)

随机森林(Random
forest):
随机森林算法通过使用多个带有随机选取的数据子集的树(tree)改善了决策树的精确性。

优点:随机森林方法被证明对大规模数据集和存在大量且有时不相关特征的项(item)来说很有用

场景举例:用户流失分析、风险评估

科大讯飞“城市超脑计划”,对数字孪生城市建设过程中遇到问题所给出的思路可以归纳为五个步骤:时空记忆,数据贯穿,发现问题,更新知识和持续成长。其中,建立时空记忆,就是把规划模型与实际的城市数据打通,比如针对城市内涝问题,一座城市是否要重建地下排污水管道,除了根据建筑规范去建立模型,得出理论数据之外,还要结合实际数据,找到两者之间的差距以及差距背后的原因。数据贯穿,即各个领域的数据打通,如交通、安防、小区的摄像头统一管理,保存车、人、物流动的信息。发现问题,即识别问题所在,比如有的马路有调头空间,有的没有,这与交通无关,与市政有关。更新知识,指很多决策往往由权威部门、主政者敲定,“城市超脑”将来可以用数据模型提醒某些规划决策可能会带来的问题。

    深度学习应用的开源平台申报指标关键点:开源平台要支持CPU、GPU、FPGA
等各种人工智能芯片、还要有典型人工智能技术、算法训练库、数据接口、模型配置接口。

2、回归算法

回归算法是试图采用对误差的衡量来探索变量之间的关系的一类算法,可以勾画出因变量与一个或多个因变量之间的状态关系。可以利用回归算法将垃圾邮件和非垃圾邮件进行了区分。常见算法有最小二乘法(Ordinary
Least Square)、线性回归、逻辑回归(Logistic
Regression)、逐步式回归(Stepwise
Regression)、多元自适应回归样条(Multivariate Adaptive Regression
Splines)、本地散点平滑估计(Locally Estimated Scatterplot Smoothing)

场景举例:路面交通流量分析、邮件过滤

优点:回归可用于识别变量之间的连续关系,即便这个关系不是非常明显

3、未来“城市超脑”和各“行业超脑”将协同运作

    只有中科曙光和京东两家获得“面向深度学习应用的开源平台”项目支持。

3、基于核函数的学习算法

基于核的算法中最著名的莫过于支持向量机(SVM)了。
基于核的算法把输入数据映射到一个高阶的向量空间, 在这些高阶向量空间里,
有些分类或者回归问题能够更容易的解决。常见算法有支持向量机(Support
Vector Machine, SVM)、径向基函数(Radial Basis Function
,RBF)、线性判别分析(Linear Discriminate Analysis ,LDA)。

延伸阅读
基于核函数的学习算法

科大讯飞将选择事关国计民生的人工智能应用场景做“加法”,把80%资源用于这20%的场景中;在与人工智能关系不大的项目上,则做“减法”。陈涛透露,医疗、教育、交通、建筑等,是科大讯飞
“做加法”的重点领域,构成各种“行业超脑”。未来,“城市超脑”和各“行业超脑”将协同运作,“城市超脑”综合性地理解城市知识和关联,并用系统性的方式来展示城市发展的目标和路径。

   
中科曙光和京东旗下的全资子公司北京京东尚科信息技术有限公司两家公司同事获得面向深度学习应用的开源平台,京东东尚信息科技公司是京东旗下复杂技术开发的公司。从中国电力招标网获公布消息看,2016年8月份,京东东尚就开始建设“多核深度学习处理器芯片及应用系统”。

4、基于实例的算法

常常用来对决策问题建立模型,这样的模型常常先选取一批样本数据,然后根据某些近似性把新数据与样本数据进行比较。通过这种方式来寻找最佳的匹配。常见算法有k-Nearest
Neighbor(KNN),、学习矢量量化(Learning Vector Quantization,
LVQ)、自组织映射算法(Self-Organizing Map , SOM)。

延伸阅读
基于实例的学习

陈涛认为,在与现实城市辉映的虚拟城市,其重点不在于展示,而在于跨学科的知识大融通,以及它解决现实问题的价值。

   
中科曙光的深度学习应用平台能够在发改委的重大支持项目中胜出,证明了公司的产品实力,从发改委筛选标准看是在国内领先的。

5、神经网络

神经网络也是一种分类器。它是由很多个虚拟的神经元组成的一个网络,我们可以把一个神经元看做是一个分类器,那很多个神经元组成的网络就能对样本进行很多次分类。

CNN(Convolutional Neural
Networks)卷积神经网络
,是一种前馈神经网络,它的人工神经元可以响应一部分覆盖范围内的周围单元,对于大型图像处理有出色表现。

优点:当存在非常大型的数据集、大量特征和复杂的分类任务时,卷积神经网络是非常有用的

场景举例:图像识别、文本转语音、药物发现、照片滤镜、人脸识别,无人汽车等。

RNN(Recurrent Neural
NetWorks
递归神经网络,在任意神经网络中,每个神经元都通过 1
个或多个隐藏层来将很多输入转换成单个输出。递归神经网络(RNN)会将值进一步逐层传递,让逐层学习成为可能。换句话说,RNN
存在某种形式的记忆,允许先前的输出去影响后面的输入。

递归神经网络其实是两种人工神经网络的总称,一种是时间递归神经网络(recurrent
neural network),另一种是结构递归神经网络(recursive neural
network)。时间递归神经网络的神经元间连接构成有向图,而结构递归神经网络利用相似的神经网络结构递归构造更为复杂的深度网络。两者训练的算法不同,但属于同一算法变体。基于RNN还衍生出了LSTM(Long-Short-Term-Memerory)和GRU(Gated
Recurrent
Unit)等一系列算法,这些算法拥有记住过去的能力,所以可以用来处理一些有时间序列属性的数据,在处理语言、文字等方面有独到的优势,LSTM和GRU的优点是具备与其它递归神经网络一样的优点,但因为它们有更好的记忆能力,所以更常被使用。

优点:递归神经网络在存在大量有序信息时具有预测能力

场景举例:图像分类与字幕添加、政治情感分析、对话机器人,机器翻译,科大讯飞的自然语言识别,文章编辑等。

科学 3

   
深度学习应用的开源平台是建设人工智能生态的关键,重要性和安卓系统媲美。

6、叶贝斯算法

贝叶斯是一个定理,它的意思是:当你不能准确知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。当我们找到若干个这样的特征,然后用这些特征进行组合后,可以进行判断,常见算法有朴素贝叶斯算法、平均单依赖估计(Averaged
One-Dependence Estimators, AODE)、Bayesian Belief Network(BBN)。

举例来看,要识别一封邮件是不是垃圾邮件。可以随机挑选出100封垃圾邮件,分析它的特征,我们发现“便宜”这个词出现的频率很高,100封垃圾邮件里,有40封出现了这个词。那我们就以这个认知为依据,得出结论:如果出现了“便宜”,那这封邮件有40%的概率是垃圾邮件。

优点:对于在小数据集上有显著特征的相关对象,朴素贝叶斯方法可对其进行快速分类

场景举例:情感分析、消费者分类

远方信息:收到《行政判决书》,驳回公司上诉,维持公司“分布光度计”发明专利无效的原判

   
在人工智能芯片领域一直独领风骚的英伟达,在性能超群的GPU芯片产品背后,更是CUDA在起决定性作用。没有CUDA系统开发平台,就没有英伟达的生态系统,也就没有英伟达的GPU领域建立的垄断局面。CUDA
是一种由NVIDIA
推出的通用并行计算架构系统平台,该架构使GPU能够解决复杂的计算问题。包含CUDA
指令集架构(ISA)以及GPU 内部的并行计算引擎。 开发人员现在可以使用C
语言来为CUDA 架构编写程序。

科学,7、聚类

聚类是一种非监督学习的方式。简单的说,就是通过不断的迭代计算,把数据分成若干个组,使得这个组里的都是类似的数据,而不同组之间的数据是不相似的。聚类算法通常按照中心点或者分层的方式对输入数据进行归并。所以的聚类算法都试图找到数据的内在结构,以便按照最大的共同点将数据进行归类。可以用于图像分类识别,用户行为识别,用户画像等领域。常见算法有k-Means算法、期望最大化算法(Expectation
Maximization, EM)。

远方信息8月20日发布公告,收到北京市高级人民法院送达的《行政判决书》,北京市高级人民法院作出终审判决,驳回公司上诉,维持“分布光度计”发明专利无效的原判。

   
今年11月寒武纪推出的人工智能芯片同时,也推出了一款专门为开发者打造的寒武纪人工智能软件平台CambriconNeuWare,该平台支持
TensorFlow、Caffe、MXNet
等多种主流机器学习框架。寒武纪此举是为了和英伟达一样,为自己的人工智能芯片创造生态,更早地吸引开发者,为后来者树立更高壁垒。

8、强化学习模型

在没有给出任何答案的情况下,先进行一些尝试,通过尝试所得到的回报,来确定这个尝试是否正确,由这一系列的尝试来不断调整和优化算法,最后算法知道在某种情况下,采取何种动作可以得到最好的结果。他的本质是解决“决策问题”,就是通过不断做出决策并获得结果反馈后,学会自动进行决策,得到最优结果。比如上面说过的猴子“学会”做算术题的过程。

科大讯飞:调整非公开发行股票方案,募集资金总额由不超过360,000万元调整为不超过347,350万元。

   
无论是英伟达、寒武纪芯片级的开发平台,还是中科曙光的系统级的深度学习应用开源平台,目的都是建设人工智能生态,像智能手机的安卓系统一样。

9、集成学习模型

用一些相对较弱的学习模型独立地就同样的样本进行训练,然后把结果整合起来进行整体预测。集成算法的主要难点在于究竟集成哪些独立的较弱的学习模型以及如何把学习结果整合起来。

我们在做机器学习的时候,希望能做出各个方面表现都比较好的模型。但常常现实是我们的模型是有偏好的,可能只对某一些情况效果比较好,这个时候我们就希望把若干个这样的模型组合起来,得到一个更好更全面的模型,这种方法,就叫做集成学习。常见算法有Boosting、Bootstrapped
Aggregation(Bagging)、AdaBoost、堆叠泛化(Stacked Generalization,
Blending)、梯度推进机(Gradient Boosting Machine,
GBM)、随机森林(Random Forest)。

科大讯飞8月20日发布公告,调整非公开发行股票方案,募集资金总额由不超过360,000万元调整为不超过347,350万元。

    SothisAI 和XMachine、XSharp 是深度学习应用的开源平台的基础。

三、三大流派

经过几十年的发展,人工智能演化出了多个分支流派,这些分支一直都在彼此争夺主导权,此次人工智能的爆发,主要源于联结主义的神经网络有了突破性发展,将语音识别和视觉识别的准确度分别达到了99%和95%。未来的发展很可能是这三大流派彼此合作,因为算法融合是实现真正通用人工智能(AGI)的唯一方式。

①符号主义(Symbolism):是一种基于逻辑推理的智能模拟方法,又称为逻辑主义(Logicism)、心理学派(Psychlogism)或计算机学派(Computerism),其原理主要为物理符号系统(即符号操作系统)假设和有限合理性原理,长期以来,一直在人工智能中处于主导地位。

②联结主义(connectionism):认为人工智能源于仿生学,特别是对人脑模型的研究。它从神经元开始进而研究神经网络模型和脑模型,开辟了人工智能的又一发展道路。1986年,鲁梅尔哈特(Rumelhart)等人提出多层网络中的反向传播算法(BP)算法。此后,连接主义势头大振,从模型到算法,从理论分析到工程实现,
为神经网络计算机走向市场打下基础。

③行为主义:控制论思想早在20世纪40~50年代就成为时代思潮的重要部分,影响了早期的人工智能工作者。实际上是从行为上模拟和体现智能,也就是说,模拟人在控制过程中的智能活动和行为特性来研究和实现人工智能,行为主义思想在智能控制、机器人领域获得了很多成就。

还有一种说法,将人工只分为五大流派,分别是符号主义,贝叶斯主义,联结主义,进化主义和Analogizer,扩展阅读三张图读懂机器学习:基本概念、五大流派与九种常见算法
文中包含大量延伸阅读链接。

中科曙光:总额112,000万元公开发行A股可转换公司债券8月23日上市

   
2017年9月份推出的曙光深度学习一体化应用服务平台SothisAI首次亮相,SothisAI增加了对GPU计算资源的调度和管理,结合目前最流行的Docker
技术,可以简化深度学习框架的部署、解决版本更新以及不同用户之间版本不一致等问题,让用户以更加便捷、灵活、易用的方式使用AI硬件的计算力。

四、机器学习的工作流程

①选择数据:将你的数据分成三组:训练数据、验证数据和测试数据

②模型数据:使用训练数据来构建使用相关特征的模型

③验证模型:使用你的验证数据接入你的模型

④测试模型:使用你的测试数据检查被验证的模型的表现

⑤使用模型:使用完全训练好的模型在新数据上做预测

⑥调优模型:使用更多数据、不同的特征或调整过的参数来提升算法的性能表现

中科曙光8月20日发布公告,公司于2018年8月6日公开发行了1,120万张可转换公司债券,每张面值100元,发行总额112,000万元,8月23日上市。

    “软硬”兼具,为用户降低成本提升开发速度。硬件方面XMachine
深度学习一体机提供多种GPU 服务器的硬件平台,原生态地支持NVIDIA DIGITS
开发环境,XMachine 全系产品均可搭载当前最先进的GPU
计算卡,可大大降低用户进入深度学习领域的软件投入成本。软件方面XSharp
从分布式并行系统优化、分布式并行机器学习执行模式优化,按照用户应用进行裁剪,满足用户不同需求,提升整个平台开发进度的效率。

五、手写数字识别流程概述

本文下面内容源于gitchat上刘颖老师的人人都能看懂的 AI
入门课,对代码感兴趣的朋友可以点击查看。本文不讨论代码实现,仅讨论实现流程和实现过程中的一些概念。

中科曙光:子公司牵头承担中科院战略性先导科技专项,专项经费16.60
亿元人民币,其中预计需向公司实控人中科院计算所拨付4,000万元

    HPC是中科曙光发展人工智能的天然优势。

1、TensorFlow基础

TensorFlow 是 Google
开源的一款人工智能学习系统。使用很方便,几行代码就能开始跑模型,这让神经网络的入门变得非常简单。Google
开源了 TensorFlow,希望占领 AI 端。Google
也为入门者提供了一个这样的例子,也就是 TensorFlow 里的“ hello world
”,这个例子的名字叫“ MNIST
”,MNIST机器学习入门可点击查看。下文将简述实现过程,重在理解流程和一些模型设计概念。

中科曙光8月22日发布公告,公司子公司与中科院计算所等单位联合承担中科院C类战略性先导科技专项“国产安全可控先进计算系统研制”,公司子公司为项目牵头单位,8月22日中科院重大科技任务局同意专项立项建议、实施方案报告及经费概算。预计专项经费16.60
亿元人民币,公司子公司收到中科院专项经费后,根据课题任务书和项目进度向中科院计算所拨付专项经费预计为
4,000 万元。

   
“算法、算力、数据”是发展人工智能的必要条件,只有将三者结合,人工智能才能充分发挥效力。计算和数据均离不开HPC技术,掌握了面向人工智能的高性能计算技术,就掌握了人工智能发展的核心。中科曙光在HPC
领域是国内绝对的龙头,相应的中科曙光也是国内发展人工智能的最具天然优势的公司。

2、 手写图片识别实现步骤概述

刘颖老师对项目做了三次优化,使手写数字的准确率从92%->98%->99.25%,1.0版使用一个最简单的单层的神经网络进行学习,2.0版使用了卷积神经网络,3.0版使用
Keras 框架,增加20层网络的深度。

手写图片识别的实现,分为三步:(1)数据的准备;(2)模型的设计;(3)代码实现

中科曙光:主承销商中信建投证券减持公司公开发行可转换公司债券1,120,000张,占发行总量的10%

    中科曙光发挥自身优势,基于“ABC2创新计算”的理念(AI+ Big Data+ Cloud+
HPC)深耕人工智能。中科曙光已在基于高性能计算与GPU的协同下开发出多项深度学习应用:

3、数据准备

在写代码的过程中,数据的预处理是最大的一块工作,60%以上的代码在做数据预处理。
这个项目的预处理,分为5步:

把输入和结果分开

对输入进行处理:把一维的输入变成28*28的矩阵

对结果进行处理:把结果进行 One-Hot 编码

把训练数据划分训练集和验证集

对训练集进行分批

那么准备的数据是什么样的呢?刘颖老师使用Kaggle
里包含了42000份训练数据和28000份测试数据,这些数字是28*28像素的手写数字图片,可以将一张图理解为一个二维数组结构,如下图所示:

Kaggle
的数据将二维数组转化为了一维数组,也就是28*28=784列,包括图片代表的数字一共785列,所以上文中的测试和训练数据被转为[42000,785]和[28000,784]的数组,这就是图片的预处理。

人类可以快速识别图像并对应到记忆中的事物,而图像在计算机看来是这样的:

中科曙光8月23日发布公告,公司于2018年8月6日公开发行可转换公司债券11,200,000张,总额11.20亿元,其中主承销商中信建投证券共计包销曙光转债3,606,150张,占发行总量的32.20%。2018年8月23日中信建投证券通过上海证券交易所交易系统累计减持曙光转债1,120,000张,占发行总量的10%。

    1) 基于高性能计算的生物数据智能处理助力基因测序;

4、单层的神经网络学习流程及相关概念

使用一个最简单的单层的神经网络进行学习的模型设计如下所示:

用 SoftMax 来做为激活函数

用交叉熵来做损失函数

用梯度下降来做优化方式

激活函数:每个神经元,在通过一系列计算后,得到了一个数值,怎么来判断应该输出什么?激活函数就是解决这个问题,你把值给我,我来判断怎么输出。所以一个神经网络,激活函数是非常重要的。目前主流的几个激活函数是:softMax,sigmoid,tanh,ReLU。

SoftMax:我们知道 max(A,B)是指 A 和 B
里哪个大就取哪个值,但我们有时候希望比较小的那个也有一定概率取到,怎么办呢?我们就按照两个值的大小,计算出概率,按照这个概率来取
A 或者 B。比如A=9,B=1,那取 A
的概率是90%,取B的概率是10%,这就是SoftMax。

损失函数:损失函数是模型对数据拟合程度的反映,拟合得越好损失应该越小,拟合越差损失则越大,然后我们根据损失函数的结果对模型进行调整。

交叉熵:交叉熵通俗的讲就是现在的训练程度和圆满之间的距离,我们希望距离越小越好,所以交叉熵可以作为一个损失函数,来衡量和目标之间的距离。

梯度下降:我们将要解决的问题比作是一座山,答案在山底,我们从山顶到山底的过程就是解决问题的过程。在山顶,想找到最快的下山的路。这个时候,我们的做法是什么呢?在每次选择道路的时候,选最陡的那条路。梯度是改变率或者斜度的另一个称呼,用数学的语言解释是导数。对于求损失函数最小值这样的问题,朝着梯度下降的方向走,就能找到最优值了。

浙大网新:发布2018年半年度报告,营业收入151,694.75万元,同比增长19.94%;归母净利润9,280.20万元,同比下降44.97%

    2)
利用GPU提供的图像处理能力进行深度学习,开发海量生物图像数据的深度挖掘能力;

5、卷积神经网络学习流程及相关概念

卷积神经网络(CNN)由输入层、卷积层、激活函数、池化层、全连接层组成,即INPUT(输入层)-CONV(卷积层)-RELU(激活函数)-POOL(池化层)-FC(全连接层)

卷积层1+激活函数+池化层1+卷积层2+激活函数+池化层2+全连接1+Dropout
层+输出层

卷积层的作用是指对图片的矩阵进行卷积运算,得到一些数值,作为图片的某些特征。

池化层的作用是对上层的数据进行采样,也就是只留下一部分,这样的作用是可以缩小数据量和模糊特征。

全连接层就是连在最后的分类器。前面卷积层和池化层进行处理后,得到了很多的特征,全连接层使用这些特征进行分类。比如识别数字,那就是对0~9的十个类别进行分类。

Dropout层是为了防止 CNN
对训练样本过拟合,而导致处理新样本的时候效果不好,采取的丢弃部分激活参数的处理方式。

这里对这些概念的解释都是比较简单的,如果希望详细了解,可以看知乎的这个链接:CNN卷积神经网络是什么?
卷积神经网络

科大讯飞:公司非公开发行股票获得中国证监会发审委审核通过

    3) 利用深度学习处理爆炸性增长的数据量,实现智慧城市的管理和运行;

6、使用 Keras 框架实现多层神经网络学习

使用 Keras 框架提升准确率

增加网络的深度,这里增加到了20层

每次卷积完之后,加入规范层

使用最新的 SELU 激活函数,这是 Sepp Hochreiter 最新发表在 arXiv
上的激活函数

概括来看,图片识别中需要完成数据的准备,模型设计,代码实现三部分,浅层学习需要选择激活函数,损失函数和优化方式,应用卷积神经网络在模型设计时需要考虑输入层、卷积层、激活函数、池化层、全连接层等。

笔者暂时可以理解的只有这些,希望AI大神或前辈可以多多指正,如果AI产品经理的岗位求内推,

下一篇文章尝试总结我们身边的一些2B和2C的AI产品,并且尝试着对于未来AI产品的应用场景开开脑洞。

科大讯飞8月27日发布公告,中国证监会发行审核委员会对公司申请的非公开发行股票事宜进行了审核。根据发行审核委员会的审核结果,公司本次非公开发行股票申请获得通过。

    4) 运用人脸识别的深度学习分析为互联网产品注入新活力。

GQY视讯:发布2018年半年度报告,营业收入12,803.71万元,同比增长109.09%;归母净利润3,598.11万元,上年同期亏损1,868.23万元

   
合作伙伴有:北京大学医学院、科大讯飞、京东、搜狗、海康威视、滴滴等企业和研究机构。

中科曙光:发布2018年半年度报告,营业收入340,521.62万元,同比增长57.69%;归母净利润14,625.26万元,同比增长115.90%

    把握中长期产业发展中的中科曙光投资机会。

中科创达:发布2018年半年度报告,营业收入57,813.25万元,同比增长23.61%;归母净利润6,106.23万元,同比增长5.64%

    我们假设:

行业新闻

    (1)云计算业务进展顺利,通过城市云中心的运营收入为公司带来可观业绩;

巨头新动向

    (2)与AMD 合作进展顺利,能够快速实现服务器芯片国产化;

谷歌推出新型强化学习框架Dopamine

    (3)基于公司高性能计算实力,借势发展需要超强计算资源的人工智能。

8月28日,谷歌发布博客介绍其最新推出的强化学习新框架 Dopamine,该框架基于
TensorFlow,可提供灵活性、稳定性、复现性,以及快速的基准测试。Dopamine框架旨在为强化学习研究者及相关人员提供具备灵活性、稳定性及复现性的工具。该框架的灵感来自于大脑中奖励–激励行为的主要组成部分「多巴胺」(Dopamine),这反映了神经科学和强化学习研究之间的密切联系,该框架旨在支持能够推动重大发现的推测性研究。谷歌还发布了一组相关的
Colab,以说明该框架的使用方法。谷歌已经在研究中使用了该框架,发现它可使很多想法快速迭代,具备很强的灵活性。

   
(4)中科曙光能够承担起实现国家服务器完全国产化重任,从芯片层面解决我国信息产业受制于人的困境。

英特尔与今日头条创建技术创新联合实验室,携手推动大数据与人工智能发展

    从四个角度看中科曙光:

8 月 22 日,以「数据赋能 AI
正当时」为主题的英特尔与今日头条战略合作联合发布会暨技术创新联合实验室发布会在北京举办。英特尔与今日头条在发布会上展现了双方在数据中心底层架构、软件优化与落地应用的全方位合作,并联合发布了技术创新实验室,以驱动大数据分析和人工智能创新,提升终端用户体验,引领行业技术发展。合作内容具体包括通过英特尔至强可扩展处理器的计算、基于英特尔
3D XPoint
技术的存储产品和网络,为今日头条构建和优化数据中心基础设施;并通过
AVX2/AVX-512
等指令集与软件层的优化,为今日头条的数据分析及人工智能应用赋能,打造全方位的解决方案。联合创新实验室将从技术、产品、应用、生态建设等多个层面发力,共同验证前沿科技的硬件及软件技术,研究行业技术发展趋势。

    第一, 延续高性能计算龙头的绝对优势地位;

科学 4

    第二, 基于特殊股东背景发展全国性的云数据网络;

Salesforce开源TransmogrifAI:用于结构化数据的端到端AutoML库

    第三, 以市场换技术与AMD 合作,从芯片层面实现服务器完全国产化;

8月28日,软件行业巨头 Salesforce 开源了其 AutoML 库
TransmogrifAI,Salesforce Einstein 数据科学高级总监 Shubha Nabar
撰文介绍了该 AutoML 库的工作流程和设计原则等。目前,大多数 auto-ML
解决方案要么狭隘地关注整个机器学习工作流的一个小部分,要么专门为图像、语音和语言这样的非结构化、同质数据构建的。人们需要的解决方案应该能够大规模地为异质结构化数据快速生成数据效率高的模型。在词典中,「Transmogrification」意为「变换的过程」,这种变换通常以一种令人惊讶或者神奇的方式进行,这也正是
TransmogrifAI 为 Salesforce
所做的——使数据科学团队将客户数据转化为有意义的、可操作的预测。如今,成千成万的用户定制化机器学习模型已经部署在了这个平台上,为每天超过
30 亿个预测赋能。TransmogrifAI基于 Scala 语言和 SparkML
框架构建,实现了自动化迭代数据准备、特征工程和模型训练的工作。其封装了 5
个主要的机器学习组件见下图:

    第四,
国内云端人工智能龙头。为人工智能的深度学习算法提供“训练”场所——云端服务器。在实现了芯片层面服务器国产化后,中科曙光非常有希望为人工智能产业提供国产化的高性能云端服务器。

科学 5

   
综合以上,我们认为现在看中科曙光不能完全按照收入、利润的角度分析;更多的要从中长期考虑公司独家承担的服务器国产化的重任和人工智能领域的机会看公司的未来。维持买入评级。

UBC&腾讯AI Lab提出首个模块化GAN架构,搞定任意图像PS组合

   
维持业绩预测:2017~2019年公司营收分别为61.39/85.73/119.45亿元,增速分别为40.8%/39.6%/39.3%。净利润为3.05/4.97/8.74亿元,增速分别为36%/62.9%/76%。每股收益0.47/0.77/1.36元。对应2017~2019市盈率分别为82.4/50.6/28.8倍。维持买入评级。

通常的图像转换模型(如
StarGAN、CycleGAN、IcGAN)无法实现同时训练,不同的转换配对也不能组合。英属哥伦比亚大学(UBC)与腾讯
AI Lab
共同提出了一种新型的模块化多域生成对抗网络架构——ModularGAN,生成的结果优于以上三种基线结果。ModularGAN
由几个可重复利用和可组合的分别实现不同功能(例如编码、解码、转换)的模块构成,这些模块可以被同时训练,利用来自所有领域的数据,然后在测试阶段根据特定的图像转换任务,将模块组合起来构建特定的
GAN。这给 ModularGAN
带来了优越的灵活性,可以生成任何所需领域的图像。实验结果表明这一模型不仅有引人入胜的感知结果,还超越了当前最佳的多领域脸部属性迁移方法。研究者称,这是首个模块化的
GAN 架构。

科学 6

清华大学团队与腾讯AI Lab专项合作夺冠FPS游戏AI竞赛VizDoom

在荷兰刚刚结束的 IEEE CIG
计算智能与游戏大会上,清华大学张钹院士领导的人工智能创新团队 TSAIL
在第一人称射击类游戏《毁灭战士》(Doom)AI 竞赛上荣获竞赛 Track 1
的预赛和决赛冠军,及 Track 2
预赛冠军、决赛亚军,成为赛事历史上首个中国区冠军。《毁灭战士》是 ID
Software 公司于 1993 年推出的
FPS类游戏,作为该类型游戏开拓者,模式延续到《使命召唤》和《光环》等多个射击游戏。AI
在游戏中能有画面而无声音信息,因此基于强化学习的 Bot
获得的信息比人类还少,使该游戏成为了 AI 研究热门试验场。参与 VizDoom
竞赛的意义,首先是探索输入像素级视觉信息,直接输出 AI
控制策略的强化学习算法。在研究上,这能带动同类任务研究,如无人驾驶、机器人导航和物体追踪等;应用上,可助力同类射击游戏开发,如虚幻竞技场、雷声之锤和刺激战场等,从而拓展人工智能技术的研究和应用领域。

科学 7

Oracle开源GraphPipe:几行代码即可在TensorFlow部署PyTorch模型

甲骨文公司(Oracle)在人工智能领域非常低调,但最近其开源的通用深度学习模型部署框架
GraphPipe 让人眼前一亮,它可以让你的模型在各种框架之间轻松转换。Oracle
称,这一新工具可提供跨深度学习框架的模型通用
API、开箱即用的部署方案以及强大的性能。目前 GraphPine 已支持
TensorFlow、PyTorch、MXNet、CNTK 和 Caffe2 等框架。GraphPipe
是一个用于简化机器学习模型部署,并将其从特定框架的模型实现中解放出来的协议和软件集合。GraphPipe
为在网络上传递张量数据提供了一个标准、高性能的协议,以及提供了客户端和服务器的简单实现,因而使得从任何框架部署和查询机器学习模型变得轻而易举。

高精地图平台Mapbox与墨迹天气共同打造首个高清可视化气象云图

近日,中国最大的社交天气应用墨迹天气与全球地理位置数据平台Mapbox达成合作,在墨迹天气App集成了Mapbox中文街景图,已经在iOS和Android平台全面上线,为5亿用户带来实时而准确的可视化天气预报。Mapbox拥有120万注册开发者,超过4.2亿的月活终端用户,为用户提供地图、搜索、导航等功能,已为孤独星球、IBM、Uber、特斯拉、Snapchat、Tableau等海外品牌,以及阿里飞猪、Keep、咕咚、DJI大疆创新、票牛等国内品牌提供地图服务。2016年,Mapbox曾与全球最受欢迎的天气App「The
Weather
Channel」达成合作,实现准确、漂亮的可视化天气效果。此次与墨迹的合作,则进一步实现了国内首个高清可视化气象云图。集成Mapbox的墨迹天气,将能为用户带来更详细的空气质量指数(AQI)和赏心悦目、同步降雨信息的雷达地图。同时,墨迹天气采用的Mapbox服务在中国境内和境外的服务器上同时运行,保证用户在任何地方都能极速地加载地图数据。下图为使用Mapbox的The
Weather Channel气象可视化效果:

科学 8

Neuromation新研究:利用卷积神经网络进行儿童骨龄评估

近日,Neuromation 团队在 Medium
上撰文介绍其最新研究成果:利用卷积神经网络(CNN)评估儿童骨龄,这一自动骨龄评估系统可以得到与放射科专家相似或更好的结果。几十年来,评估骨骼成熟度通常是根据对手骨和手腕的骨骼发育情况的X光图进行可视化评估来进行的。该团队利用卷积神经网络识别图像,评估了手骨不同区域,发现仅对掌骨和近端指骨进行评估,得到的结果与对整个手骨进行评估的结果相差无几。为了克服放射图像的质量和多样性问题,该团队引入了严格的清理和标准化过程,以增强模型的鲁棒性和准确率,提升骨龄评估的准确率、提高结果的可复现性以及临床医生的效率。这一论文已经发表在第
4 届 Deep Learning in Medical Image Analysis(DLMIA 2018)Workshop
上,近期,一些基于深度学习的方法已经证明在解决生物医学领域的多个问题时性能优于传统的机器学习方法。

科学 9

科学 10

光学CNN层替换传统CNN层有助于省电

CNN 计算效率的研究一直备受关注,但由于功率和带宽的严格限制,CNN
仍难以应用在嵌入式系统如移动视觉、自动驾驶中。在斯坦福大学发表在 Nature
旗下 Scientific Reports 的一篇论文中,研究者提出在 CNN
网络前端替换一个光学卷积层(opt-conv)的方案,可以在保持网络性能的同时显著降低能耗,并在
CIFAR-10
数据集的分类任务上验证了其结论,证明了包含初始光学计算层的混合光电卷积神经网络如何在性能上得到提升,同时将系统的延迟或功耗降到最低。光学卷积层,也就是用光学器件实现的卷积层,其光学运算具备高带宽、高互联和并行处理特性,并能光速执行运算,功耗接近于零。该技术有望在低功耗机器学习领域得到进一步发掘。

科学 11

MIT提出精细到头发丝的图像分割技术,打造效果惊艳的特效电影

来自 MIT CSAIL
的研究人员开发了一种精细程度远超传统语义分割方法的「图像软分割」技术,连头发都能清晰地在分割掩码中呈现。在对比实验中,他们的结果远远优于
PSPNet、Mask R-CNN、spectral matting 等基准。这项技术对于电影行业的 CGI
技术具有重大意义,精细的分割掩码能很好地分离图像中的前景和背景,只要鼠标一点,就能轻易地改变前景、背景的种类。也就是说,像《变形金刚》《复仇者联盟》《奇幻森林》中的大部分电影特效将可以完全自动化地生成。在传统处理中,处理图像的棘手之处在于,并非每个像素都只属于一个物体。很多情况下,很难确定哪些像素属于背景,哪些属于特定的人。该技术使用机器学习来自动化照片编辑过程中的多个步骤,并且称这种方法也可用于运动图像。该方法允许他们自动将输入图像分解成一组不同的层,这些层被层之间的一系列「软过渡」分隔开。该系统被称为「图像软分割」,它分析原始图像的纹理和颜色,并将其与神经网络收集的图像中物体的实际信息相结合。

科学 12

免责声明

本订阅号为安信证券股份有限公司(下称“安信证券”)研究中心胡又文团队的官方订阅号。本订阅号推送内容仅供安信证券客户中的专业投资者参考。为避免订阅号推送内容的风险等级与您的风险承受能力不匹配,若您并非安信证券的客户中的专业投资者,请勿使用本信息。安信证券不会因为任何机构或个人订阅本订阅号或者收到、阅读本订阅号推送内容而视为本公司的当然客户。

本订阅号推送内容版权归安信证券所有,未经安信证券事先书面许可,任何机构或个人不得以任何形式删节、修改、复制、引用和转载,否则应承担相应责任。返回搜狐,查看更多

责任编辑:

相关文章