在信息科技轉(zhuǎn)向物聯(lián)網(wǎng)之際,一個(gè)全新的萬物互聯(lián)時(shí)代即將到來,到2020年將有高達(dá)幾百億的智能設(shè)備連接互聯(lián)網(wǎng)。
我們希望通過大數(shù)據(jù)交易行業(yè)現(xiàn)狀的分析與梳理,探索我國未來大數(shù)據(jù)交易產(chǎn)業(yè)健康良性的發(fā)展之路,為國家大數(shù)據(jù)應(yīng)用和產(chǎn)業(yè)發(fā)展做出積極貢獻(xiàn)。
從可穿戴設(shè)備到智能家居,再到智慧城市、互聯(lián)工廠等等,這些智能設(shè)備產(chǎn)生的海量數(shù)據(jù)在更為先進(jìn)的算法及運(yùn)算能力推動(dòng)下將為社會(huì)創(chuàng)造出更多新的價(jià)值。
大數(shù)據(jù)產(chǎn)業(yè)已形成龐大的產(chǎn)業(yè)生態(tài),我國大數(shù)據(jù)產(chǎn)品和服務(wù)業(yè)務(wù)收入規(guī)模已超萬億元。
數(shù)據(jù)集作為大數(shù)據(jù)產(chǎn)業(yè)的基礎(chǔ)資料,已經(jīng)成為企業(yè)核心競(jìng)爭(zhēng)力的一個(gè)重要方面。
數(shù)據(jù)集的構(gòu)成一方面是縱向同類數(shù)據(jù)大量的聚集,以生成更為精準(zhǔn)的模型,比如醫(yī)學(xué)影像領(lǐng)域的智能輔助閱片軟件,當(dāng)有越多同一病種大量患者的醫(yī)學(xué)影像作為訓(xùn)練集時(shí),模型輸出的結(jié)果也將更為準(zhǔn)確;
另一方面是橫向跨領(lǐng)域的數(shù)據(jù)集合,以塑造出多維度的立體模型,如同時(shí)分析同一用戶的個(gè)人基礎(chǔ)數(shù)據(jù)、銀行數(shù)據(jù)、運(yùn)營商數(shù)據(jù)、社交數(shù)據(jù)等等,可以建立更為立體豐富的用戶畫像。
但數(shù)據(jù)體系是多樣化的,不同維度的數(shù)據(jù)留存在各行各業(yè),如電信、交通、消費(fèi)、金融、制造等等。
數(shù)據(jù)的存儲(chǔ)及管理形式也是分散的,如人口、自然資源等相關(guān)基礎(chǔ)數(shù)據(jù)由政府各部門統(tǒng)籌管理使用;
行業(yè)領(lǐng)域數(shù)據(jù)由企業(yè)和政府分別管理使用,如銀行存儲(chǔ)和管理賬戶數(shù)據(jù)、流水情況;
運(yùn)營商存儲(chǔ)和管理用戶的通訊數(shù)據(jù)和位移數(shù)據(jù),社交網(wǎng)絡(luò)存儲(chǔ)和管理的是用戶的社交數(shù)據(jù)等等。
不同行業(yè)之間,同行業(yè)內(nèi)不同企業(yè)之間,甚至同一企業(yè)不同業(yè)務(wù)部門之間的數(shù)據(jù)孤島現(xiàn)象普遍存在。
大型企業(yè)擁有大量資源來整合數(shù)據(jù):
亞馬遜已抓取50億網(wǎng)頁的數(shù)據(jù),其物流中心有超過50萬張產(chǎn)品的JPEG圖像和相應(yīng)的JSON元數(shù)據(jù)文件,每日監(jiān)測(cè)全球廣播、印刷物、網(wǎng)絡(luò)新聞的記錄超過40億份。
谷歌擁有最大存儲(chǔ)庫的數(shù)據(jù)集之一,數(shù)據(jù)達(dá)10-15Exabyte;
阿里巴巴的數(shù)據(jù)存儲(chǔ)已經(jīng)逼近EB(大數(shù)據(jù)存儲(chǔ)單位)級(jí)別,部分單張表每天的數(shù)據(jù)記錄數(shù)高達(dá)幾千億條。
巨頭仍在不惜重金通過投資并購以獲得數(shù)據(jù)。
亞馬遜2017年6月宣布以130億美元并購知名有機(jī)超市Whole Foods,可說是一項(xiàng)著眼于大數(shù)據(jù)的交易;
IBM 2016年2月以26億美元的價(jià)格收購醫(yī)療保健和分析提供商Truven Health Analytics,此舉為2年內(nèi)IBM進(jìn)行的第四筆與健康數(shù)據(jù)有關(guān)的收購,總投入超過40億美元;
阿里巴巴早已把自己定位為數(shù)據(jù)公司,阿里資本在文化娛樂、金融領(lǐng)域、電子商務(wù)三個(gè)方向投資重金,分別高達(dá)300億、269億、223億,連同其他業(yè)務(wù),早已成為國內(nèi)最大的數(shù)據(jù)運(yùn)營者之一。
對(duì)于無力通過自建/投資并購方式獲取數(shù)據(jù)的廣大中小企業(yè),數(shù)據(jù)購買及交易是其備選渠道,但應(yīng)注意相關(guān)法律風(fēng)險(xiǎn)。
目前針對(duì)用戶信息的非法收集、竊取、販賣和利用行為猖獗,中國互聯(lián)網(wǎng)協(xié)會(huì)發(fā)布的《中國網(wǎng)民權(quán)益保護(hù)調(diào)查報(bào)告(2016)》顯示,我國6.88億網(wǎng)民因垃圾短信、詐騙信息、個(gè)人信息泄露等造成的經(jīng)濟(jì)損失達(dá)915億元,人均為133元。
初創(chuàng)公司為更加合理的獲取數(shù)據(jù),除主營業(yè)務(wù)外,會(huì)開展一部分業(yè)務(wù)用于獲取數(shù)據(jù)、留存數(shù)據(jù),如醫(yī)療行業(yè)內(nèi),開展輔助診斷業(yè)務(wù)的公司也會(huì)同步發(fā)展一些協(xié)同的科研項(xiàng)目或相關(guān)的醫(yī)療資源管理項(xiàng)目。
除數(shù)據(jù)獲取挑戰(zhàn)外,因各企業(yè)各部門對(duì)數(shù)據(jù)的留存、處理方式存在差異,企業(yè)也將面臨較高的數(shù)據(jù)獲取后的整合成本。
自2015年,大數(shù)據(jù)上升為國家發(fā)展戰(zhàn)略開始,國家政策不斷引導(dǎo)、鼓勵(lì)和推動(dòng)發(fā)展大數(shù)據(jù)交易機(jī)制。
以在合法、合規(guī),保障數(shù)據(jù)安全的前提下,建設(shè)完善基礎(chǔ)設(shè)施,解決數(shù)據(jù)交易過程中公允定價(jià)、交易標(biāo)準(zhǔn)、數(shù)據(jù)傳輸?shù)汝P(guān)鍵問題。
全國各地相繼成立大數(shù)據(jù)交易所,包括貴陽大數(shù)據(jù)交易所、上海數(shù)據(jù)交易中心、武漢東湖大數(shù)據(jù)交易中心等等,以數(shù)據(jù)堂、美林?jǐn)?shù)據(jù)、愛數(shù)據(jù)等為代表的數(shù)據(jù)資源企業(yè)也取得快速發(fā)展。
陽光的數(shù)據(jù)交易逐步落地,隨著數(shù)據(jù)交易類型的日益豐富、交易環(huán)境的不斷優(yōu)化、交易規(guī)模持續(xù)擴(kuò)大,我國數(shù)據(jù)互聯(lián)、變現(xiàn)能力顯著提高。
《2016年中國大數(shù)據(jù)產(chǎn)業(yè)白皮書》中預(yù)計(jì)2020年國內(nèi)大數(shù)據(jù)交易市場(chǎng)規(guī)模將達(dá)到545億元,相對(duì)集中分布在政府、金融、教育、電信、醫(yī)療等行業(yè)。
數(shù)據(jù)交易業(yè)務(wù)目前主要有兩種業(yè)務(wù)模式,一種是以貴陽大數(shù)據(jù)交易所、上海數(shù)據(jù)交易中心等為代表的平臺(tái)模式,另一種是以數(shù)據(jù)堂等為代表的自營模式。
在平臺(tái)模式下,平臺(tái)本身不擁有數(shù)據(jù),而是通過讓供需雙方加入平臺(tái)。
供方發(fā)布數(shù)據(jù)、需求方提交數(shù)據(jù)需求,平臺(tái)發(fā)揮數(shù)據(jù)質(zhì)量認(rèn)證、數(shù)據(jù)格式標(biāo)準(zhǔn)化、數(shù)據(jù)金融工具的作用,提供數(shù)據(jù)脫敏、質(zhì)量控制、安全控制等基礎(chǔ)服務(wù),數(shù)據(jù)清洗、建模、分析、可視化技術(shù)等增值服務(wù),協(xié)助數(shù)據(jù)供方將數(shù)據(jù)變成可以交易的資產(chǎn)。
交易平臺(tái)同時(shí)提供交易定價(jià)、支付結(jié)算、數(shù)據(jù)傳輸?shù)确?wù),保障數(shù)據(jù)供需雙方交易完成并獲得交易傭金。
在自營模式下,企業(yè)通過眾包、外購、公共機(jī)構(gòu)共享、網(wǎng)絡(luò)采集等方式獲得數(shù)據(jù),利用自身技術(shù)對(duì)數(shù)據(jù)進(jìn)行清洗、建模、可視化等,建立數(shù)據(jù)產(chǎn)品,提供予數(shù)據(jù)需求方。
自營模式下,企業(yè)可以通過擴(kuò)大數(shù)據(jù)獲取、深度挖掘數(shù)據(jù)價(jià)值以豐富數(shù)據(jù)產(chǎn)品及提升單數(shù)據(jù)價(jià)值而提升數(shù)據(jù)服務(wù)能力;但由于在自營模式下數(shù)據(jù)將經(jīng)企業(yè)流轉(zhuǎn),企業(yè)應(yīng)注意防范數(shù)據(jù)泄漏及隱私保護(hù)相關(guān)法律風(fēng)險(xiǎn)。
數(shù)據(jù)交易仍處起步階段,面臨基礎(chǔ)配套不完善、市場(chǎng)及產(chǎn)品分散等挑戰(zhàn)。
1配套措施不夠完善
目前國家層面數(shù)據(jù)交易相關(guān)明確的法律法規(guī)尚未推出,也缺少專門的監(jiān)管部門,這導(dǎo)致地方各類型的數(shù)據(jù)交易平臺(tái)在建設(shè)過程中自行摸索標(biāo)準(zhǔn)體系,在發(fā)展進(jìn)程上有所顧忌,謹(jǐn)慎前行,發(fā)展速度受到一定程度的影響。
2市場(chǎng)碎片化程度比較高
根據(jù)《中國大數(shù)據(jù)產(chǎn)業(yè)生態(tài)白皮書》的統(tǒng)計(jì),51.61%的數(shù)據(jù)交易平臺(tái)收入在500萬以下,收入1億元以上的數(shù)據(jù)交易平臺(tái)僅占6.45%。
多個(gè)分割的市場(chǎng)不利于數(shù)據(jù)大量的匯聚,不同交易平臺(tái)之間數(shù)據(jù)缺乏流動(dòng)性,難以真正實(shí)現(xiàn)平臺(tái)化、規(guī)模化、產(chǎn)業(yè)化的發(fā)展,難以實(shí)現(xiàn)數(shù)據(jù)交易平臺(tái)的優(yōu)勢(shì)。
3數(shù)據(jù)產(chǎn)品碎片化程度比較高
以發(fā)展階段相對(duì)領(lǐng)先的貴陽大數(shù)據(jù)交易所為例,截至2017年10月,交易所交易額累積突破1.2億元,可交易數(shù)據(jù)產(chǎn)品4000個(gè),可交易的數(shù)據(jù)總量超過150PB,即平均交易單品交易金額2萬/年,每PB產(chǎn)生交易額不足80萬元。
“粗放式”的原始數(shù)據(jù)產(chǎn)品難以滿足數(shù)據(jù)需求方個(gè)性化需求,數(shù)據(jù)需方面臨較大的數(shù)據(jù)整合成本,是導(dǎo)致該現(xiàn)象的主要原因。數(shù)據(jù)產(chǎn)品過低的交易規(guī)模和頻次也不利于數(shù)據(jù)平臺(tái)組織交易。
數(shù)據(jù)交易平臺(tái)正在探索靈活的產(chǎn)品形式,如華中大數(shù)據(jù)2016年7月上線了以“活數(shù)據(jù)”交易為主的大數(shù)據(jù)交易平臺(tái)。
“活數(shù)據(jù)”即實(shí)時(shí)數(shù)據(jù),API是實(shí)時(shí)數(shù)據(jù)接口,數(shù)據(jù)提供方通過接口調(diào)用的方式向需要方提供,同時(shí)華中大數(shù)據(jù)交易平臺(tái)上提供了API調(diào)試工具、接口地址和統(tǒng)一格式的請(qǐng)求參數(shù)等信息,方便數(shù)據(jù)需求方快速理解和使用。
上海數(shù)據(jù)交易中心于2017年發(fā)布數(shù)據(jù)金融產(chǎn)品——CRP(中國企業(yè)信用風(fēng)險(xiǎn)畫像庫),CRP使用方可以在平臺(tái)上選擇高質(zhì)量數(shù)據(jù),并通過一點(diǎn)實(shí)時(shí)數(shù)據(jù)接口,從多源供方獲得自身業(yè)務(wù)運(yùn)行所需的數(shù)據(jù),用于訓(xùn)練調(diào)校業(yè)務(wù)算法模型,多維度刻畫企業(yè)信用風(fēng)險(xiǎn),為金融業(yè)務(wù)持續(xù)發(fā)展提供基礎(chǔ)數(shù)據(jù)服務(wù)。
隨著數(shù)據(jù)交易需求不斷激增,相關(guān)政策的逐漸落地,市場(chǎng)必將出現(xiàn)引領(lǐng)行業(yè)發(fā)展及整合市場(chǎng)的數(shù)據(jù)交易平臺(tái)。
在保障數(shù)據(jù)安全的前提下,真正實(shí)現(xiàn)數(shù)據(jù)的采集、處理、定價(jià)、傳輸?shù)龋浞职l(fā)揮數(shù)據(jù)交易平臺(tái)的實(shí)質(zhì)優(yōu)勢(shì)。
數(shù)據(jù)交易平臺(tái)將通過結(jié)合自身資源情況探索個(gè)性化的發(fā)展道路,一方面可拓寬數(shù)據(jù)來源渠道,激活“長尾數(shù)據(jù)”,豐富數(shù)據(jù)產(chǎn)品提供方式,增加供方數(shù)據(jù)特色,另一方面可能圍繞數(shù)據(jù)需方需求劃分層級(jí),通過“深加工”的產(chǎn)品形式,向相對(duì)集中的產(chǎn)品需求提供個(gè)性化定制服務(wù)等,降低數(shù)據(jù)需方整合數(shù)據(jù)成本的同時(shí)提高單位數(shù)據(jù)的交易頻次、交易規(guī)模,提升數(shù)據(jù)交易平臺(tái)的競(jìng)爭(zhēng)優(yōu)勢(shì)。
國務(wù)院總理李克強(qiáng)在中國大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)上曾表示,中國超過80%的數(shù)據(jù)在政府手中。因此各地?cái)?shù)據(jù)交易平臺(tái)建設(shè)也離不開政府的支持。
聯(lián)新資本于2016年參與發(fā)起成立了上海數(shù)據(jù)交易中心。
上海數(shù)據(jù)交易中心是經(jīng)上海市人民政府批準(zhǔn),上海市經(jīng)濟(jì)和信息化委、上海市商務(wù)委聯(lián)合批復(fù)成立的國有控股混合所有制企業(yè)。
作為上海市大數(shù)據(jù)發(fā)展“交易機(jī)構(gòu)+創(chuàng)新基地+產(chǎn)業(yè)基金+發(fā)展聯(lián)盟+研究中心”五位一體規(guī)劃布局內(nèi)的重要功能性機(jī)構(gòu),承擔(dān)著促進(jìn)商業(yè)數(shù)據(jù)流通、跨區(qū)域的機(jī)構(gòu)合作和數(shù)據(jù)互聯(lián)、政府?dāng)?shù)據(jù)與商業(yè)數(shù)據(jù)融合應(yīng)用等工作職能。
聯(lián)新資本將同上海數(shù)據(jù)交易中心一起推動(dòng)泛長三角地區(qū)乃至全國數(shù)據(jù)交易機(jī)構(gòu)的互聯(lián)互通和深度合作,形成健全規(guī)范的商業(yè)數(shù)據(jù)流通、交換機(jī)制,共同促進(jìn)商業(yè)數(shù)據(jù)資產(chǎn)流通、充分釋放數(shù)據(jù)資源衍生產(chǎn)品紅利,為國家大數(shù)據(jù)應(yīng)用和產(chǎn)業(yè)發(fā)展做出積極貢獻(xiàn)。