每日赏阅
新浪微博
微信
当前位置:每日赏阅网 » 手机

我国当前大数据的发展现状——阿里巴巴、百度和腾讯为例


我国当前大数据的发展现状——阿里巴巴、百度和腾讯为例

大数据时代,催生了各种各样的数据分析和数据挖掘岗位,让使得越来越多人投身到大数据分析和大数据挖掘的行列。对于大数据的未来发展,大家都是秉持着乐观的心态的,而且当前的互联网金融和各个公司都开始重视和运用大数据来给自己的集团增添利益和名誉,其中最为出名的就当属阿里巴巴、百度和腾讯了。无论未来大数据的发展会如何,我们都是走在当下的人,走好当下的每一步,未来的大数据分析和大数据挖掘之路才会有我们的身影和脚印。了解当前中国大数据的发展现状,既是对自己的警醒,也是对未来的把握。今天,小编就来好好和大家说说当前中国大数据的现状——以阿里巴巴、百度和腾讯为例。

Zara主打的是中高层次的服饰品,LV主要面对高端人群,但是为什么Zara毛利率比LV高呢?也许以前很少人可以用比较科学客观准确的说法来给出了结论。不过大数据的作用就开始凸显了。正是因为大数据的客观科学,才使得Zara的市场目标定位和客户人群更加准确到位,自然利润也会高人一筹。对于我国当前的大数据现状,最为走在前头的当然还是百度、腾讯和阿里三大巨头。当百度“大数据引擎”等互联网巨头向社会开放大数据基础设施,敢用、会用就能创造更多商业奇迹和民生福利,当然这本身给自己带来的收益也是非常巨大的。

大数据,是不是“大忽悠”?

当Zara这家零售企业将大数据运用于创新经营时,它创造了比奢侈品巨头LV税前毛利率更高的奇迹!要知道,Zara平均服饰价格只有LV的四分之一。

随着百度开放“大数据引擎”,超级互联网公司们正在向全社会提供大数据的基础设施服务。敢用、会用,就可以创造更多类似的商业突破和民生福利。

我国当前大数据的发展现状——阿里巴巴、百度和腾讯为例

为什么Zara毛利率比LV高?

据悉, Zara坚信在网络上搜寻时尚资讯的人,对服饰的喜好、对资讯的掌握、催生潮流的能力,比一般大众更前卫。而且,在网上抢先得知Zara资讯的人,进实体店消费的比率也很高。所以Zara会将网上海量资料看作实体店面的“前测”指标。以此帮助找到迎合网民喜欢的产品或趋势,从而在实体店增加销售。

事实上,越来越多像Zara这样精明的企业,已经开始利用大数据驱动商业和管理创新。然而最大的问题是,面对看似高深的“大数据”,大部分传统企业一“缺”数据,既缺乏行业基本数据;二不会“用”,缺乏大数据处理能力,即数据存储与管理的规模、数据分析挖掘技术与能力、数据智能技术与相关能力。

怎么办?商业发展的本质在于社会专业分工。大数据的基础服务,可以由拥有海量数据及数据处理能力的大型互联网公司。它们做大数据,企业“用”大数据。

在中国互联网,有百度Baidu、阿里巴巴Alibaba、腾讯Tencent“三座大山”。李彦宏圈流量,马云圈产业链,马化腾圈用户,三巨头势力最强、市值最高,被行业称之为BAT。

以百度为例,随着最近其“大数据引擎”的开放,号称为传统产业升级装上了数字动力引擎,降低企业应用大数据的门槛,帮助拓展新的商业机会。

市场这么大,大家要么不懂,要么没实力,这给了BAT在国内大数据应用领先的机会。以BAT为代表的互联网阵营帮助传统企业将数据“资产化”,已经成为不争的事实。

BAT三家大数据比较

百度、阿里巴巴、腾讯,三家都把大数据升级为集团级战略。但是,如果略作比较,还是存有很大差异。它不仅与其拥有的数据性质有关,也与技术基因、战略优先级和生态系统能力有关。

马云曾公开说,“阿里管理好,腾讯产品好,百度技术好”。确实高,切中要害。在BAT中,以搜索引擎为核心的百度技术积累最深厚。作为大数据领域的“技术派”,这让它帮助企业实现“数据资产化”有了相对优势。

“我们有一整套在世界上都不逊色的大数据技术,包括数据存储、数据管理、人工智能等方面。这十几年,也有了全网数据、用户查询数据的积累。相对来说,更容易打造大数据引擎,并将能力开放出来。”百度内部人士表示。

从三大巨头的数据源看,百度是基于用户搜索行为的需求数据,阿里掌握着交易及信用数据,腾讯则掌握着社交关系数据。“其实深入分析就会发现,搜索已经成为网民最普遍的行为,它包含的数据层面是非常广、非常深的。阿里的数据相对只聚焦于交易数据,腾讯只聚焦社交关系数据,其实缺乏立体维度,实用面不如我们。”上述人士表示。

当然,也不是谁拥有最多的用户、流量或数据,谁就在大数据领域最牛。所有关于大数据的论断都认为,大数据并不在于大,质量、性质以及谁拥有它,将决定大数据能被挖掘出来的价值和难度。

我国当前大数据的发展现状——阿里巴巴、百度和腾讯为例

大数据必成“终极技术之争”

再大的数据没分析技术也不行,利用大数据的难点归根结底在于技术。

简单说,从数据的收集到存储到清洗,再到脱敏,归类,标签化、结构化,以及最后的建模分析、挖掘利用,均是技术活儿。需要服务器集群、数据利用模型和数据处理算法来保障,然后才是挖掘出来的结果的包装、变现。

来看一个例子,最近让业界印象深刻的是“百度迁徙”这样的公益项目,将其应用在民生、新闻等领域。在去年4月24日的百度技术开放日上,李彦宏宣布百度首次开放核心数据能力。计划通过大数据引擎的“开放云”、“数据工厂”、“百度大脑”三大组件,为传统产业提供大数据存储、分析及处理的能力。

阿里巴巴则对外宣称已经拥有100PB数据,并“以令人欣喜的速度”增长。在技术层面阿里也有飞天计划、Apsara分布式计算系统,还有数据委员会这样的架构。马云最新内部邮件将阿里战略阐述为“云端+大数据”,要整体进入大数据时代。但在深度学习、智能语言和图像识别方面还要加速突破。

而在三大互联网巨头中,消息人士认为,“腾讯这块进展相对慢,大数据云能力刚起步,大数据计算能力尚未完全形成,深度学习等高级机制仍是空白,甚至自有数据在各产品都还没有打通。”但以企鹅的体量和资源,一旦发力决不容小视。只是去年战略性放弃搜索,或多或少让人们有一些疑虑。

巨头们在大数据领域的竞争,一定会演变成一场技术的终极较量。相对而言,百度在大数据技术方面的积累和投入决心最大。但在商言商,大数据商业化成功需要一个过程,面对腾讯、阿里在其他领域的攻伐,百度得耐得住寂寞。

未来一切皆有可能

来畅想一下,医院可以将新生婴儿的哭声在云端存储下来,并与互联网的语音库进行比对,理解婴儿每一次啼哭声的不同涵义,从而协助医院及年轻的父母对新生儿进行更好的看护。公安系统追捕逃犯,可以在海量监控视频中通过图像识别技术找出犯罪嫌疑人,提升破案率。

这些不是故事,而是百度“大数据引擎”在传统行业中的创新应用场景。

以医疗机构为例,它可以利用百度大数据引擎实现这样的应用图景——通过“开放云”存储个人电子病历,通过“数据工厂”进行数据挖掘和分析,最终通过百度大脑得出对个人健康的分析预测,从而为每个人提供“数字化医生”的服务。

其实,物联网传感器、视频监控设备时时刻刻都在收集海量数据,但价值没有微博大,因为数据难以变现。运营商拥有用户通信相关数据,从语音到短信再到位置,量大过任何一个互联网巨头。因为运营商不被允许也无能力去利用这些数据,只能白白浪费。

数字时代,用户越来越多的日常行为从线下转移到线上,并产生了大量非结构化的数据。这让互联网公司在大数据领域有了机会,因为它能够对这些沉淀数据进行深度分析和解读,挖掘其中蕴含的社会、经济和民生价值。

我国当前大数据的发展现状——阿里巴巴、百度和腾讯为例

结束语:

互联网诞生时,号称“在网上,没人知道你是一条狗。”大数据时代,我们不但知道你是一条狗,而且知道公母、你爱吃什么、什么时候睡。

任何技术趋势,一旦开始就是不可逆转的。你所要做的,就是顺应潮流。利用巨头们开放出来的基础设施,找到属于你的机会。