何积丰(中科院院士、Im体育官方版app下载软件学院院长):原本概念炒得过热的云计算、大数据,应该摆脱以往象牙塔式的樊笼,广泛开展国际协同,走“
顶天”
、“
立地”
之路,让云计算不再飘忽不定,让“
数据”
更好地为企业服务,为国民经济发展“
保驾护航”
。
单名谦(SAP全球研究总部副总裁 云计算与大数据研究中心主任):“未来的计算系统将由云计算、大数据计算、内存计算和智能计算组成”。我们不是把云计算和大数据两个热门问题凑起来,其核心是“商业价值”,优化了的数据才彰显其价值,否则仅仅是一堆“数据”而已,并且要有一批懂得该行业运算规则的内行,而不是纯粹的IT人。
周傲英(Im体育官方版app下载海量计算研究所所长 云计算与大数据研究中心主任):大数据概念本身就是一把“
伞”
(umbrella
),
现在就是把以前的很多概念放在一个概念之下;大数据研究需要多方协同创新,就像多个伞骨一起作用才能撑起一把大伞,同时大家在“
大伞”
呵护之下又可以“
蔽日挡雨”
,得到更好的保护。
成立仪式:多方协同撑大“伞”
他们有的不远万里,有的戏称甘冒“禽流感”风险,是什么理由和动力驱使一批天南海北的IT精英汇聚Im体育官网app?一个以建设国际性的大数据协同创新平台和研发中心、基于典型的中国式应用、开展国际前沿的研究和开发为使命的Im体育官方版app下载云计算与大数据研究中心强大气场吸引了各位。该中心指导委员会组成成员来自亚、欧、美著名研究机构,“头衔”各领风骚,中心主任由单名谦、周傲英共同担纲也属少见。
而从另一份学术委员会委员的名单上,不难看出,华师大云计算与大数据研究中心将以产业链为纽带,实现伙伴大学和伙伴企业的资源共享,通过需求调研、项目合作和成果转化,让“浮”在天上的“云”计算,“藏”在硬盘里的大数据,能够还原其“精彩”。
副校长朱自强教授在该中心成立庆典之际表示,由东北大学、西北工业大学、中国人民大学、中山大学、清华大学、武汉大学、云南大学为伙伴大学的Im体育官方版app下载云计算与大数据研究中心,联合微软、SAP、华为、上海宝信、聚胜万合、高德软件等IT界著名企业,在全国范围的协同计算中迈出了实质性一步。
无处不在的“计算”:观点/成果/数据/案例的交汇
在4月15日-16日的两天里,8所伙伴大学和6家伙伴企业的学术带头人、国内外学术界IT业界的60多位专家学者共同见证了研究中心的成立,并一起探讨学术和技术发展。
《大数据中的终生学习》是华为诺亚方舟实验室资深研究员张弓议题,他从终身学习中的人的影响,人类行为理解中的迁移学习两方面展开。张弓表示,终身学习源于教育界,由于移动互联网的发展再度急剧地加速了大数据的挑战,那么数据挖掘系统就需要有一个连续的模式来应对持续发展的和日益增长的数据流量。区别于传统的一次学习能力,我们称之为终生机器学习,张弓表示,我们希望它能够对付不同的学习任务并具备持续的学习能力。终身学习的重要基础之一就是迁移学习,我们希望在一个领域学习的知识能够使在另一个领域中的学习受益。为了有效的学习,维持一个持续的数据标注能力将是一个重要的挑战。
加州大学伯克利分校教授、AMPLab主任Michael J. Franklin首先登台介绍了《伯克利实验室模式:计算机科学研究的协作方法》,通过整合机器学习和大规模数据分析(算法),云计算和集群计算(机器)和众包(人)三个方面的技术来开发新的大数据分析软件体系,经过两年实验应用,AMPLab就通过开发Mesos,Spark和Shark等流行系统以及Carat智能手机协同能耗调试等应用程序,在工业界获得了极大的影响力。基于这种研究工作模式,一些早期项目都取得了很有影响的成果,例如RISC和RAID项目、SPICE CAD软件项目、云计算领域的RADLab项目以及并行计算领域的PARLab项目。该模式在大数据分析等大规模、多方位计算领域也表现出非常好的效果。“希望能在研究中心的创立中提供一些灵感和经验”。Michael风趣地表示。
阿里巴巴高级研究员阳振坤在《OceanBase:一个分布式无共享关系数据库》报告提出,3年前,100GB数据很大了,现在TB级也不稀奇了,尽管PB级大数据正在吸引越来越多的眼球,关系数据库依然是当今社会的基础。然而,传统的关系数据库系统的扩展性唯一地依赖于复杂、专有并且过于昂贵的大型计算机,那就容易出现无限升级的弊端。阳振坤向大家介绍OceanBase支持数据库事务(ACID),实现了关系模型和SQL语言的许多特征,并可以很容易地扩展到万亿条记录和数百TB数据,还在数百台廉价服务器上提供了持续可用性。通过消除随机写磁盘,OceanBase非常好地契合了当今的固态盘(SSD)技术。据介绍,OceanBase已经在阿里巴巴的数十个生产系统中得到应用,阳振坤强调,尽管数据量大,但每天的修改量有限,在透明化的应用层面是,当某个SQL出现问题,可以由另一个机群来重新获取,以保障数据的完整和准确。
IBM中国研究院资深研究员曹锋讲述的《医疗大数据》引用在加拿大安大略理工学院的研究成果,通过对有先天性心脏缺陷新生儿全天候监护的海量数据分析、挖掘,让预警提前了24小时,也明显降低了心脏早衰新生儿的死亡率;三幅纽约附近工人居住区少吃蔬菜和患肥胖症、糖尿病人群的地图数据分析,从中挖掘出并非他们不愿吃蔬菜,而是蔬菜超市缺乏且布局不合理,从而影响到政府出面干预,提高了市民的生活质量和健康水平。
Im体育官方版app下载教授钱卫宁基于新浪微博近200万用户3年的数据和近4000万用户的关注网络,在玉树地震、日本海啸、11.15大火的热点事件演化规律与影响因素分析、僵尸用户和营销帐号检测等社交媒体数据分析问题,并设计了一个基于真实数据的社交媒体数据分析基准测试工具,他们还发现,情绪和感知有时竟然还会影响到股票指数的升降。钱卫宁认为,高效的社交媒体数据管理与分析对网上集群行为感知与分析、个性化推荐、公共舆情和情感感知与分析具有重要作用。
高德软件首席技术官崔海在《地图和LBS位置服务与大数据畅谈》中,从1570年问世的第一张有意义的世界地图说起,400多年后的今天,地图的基本形态未变,但赋予GIS、CS技术内涵的数字地图正在悄悄地“改变”了世界。高德对中国公路320万公里的地形地貌数据采集,以每台采集车每天行驶150-200公里计,近200台车在途,每车配备6-8个360度旋转的拍摄头,外加一个红外摄影,海量的数据传输、处理、分析,其旨在“用户需求第一”,让更多的驴友放飞心情去周游、使更多的车安全放心奔驰。