資訊
  • 視頻
  • 焦點(diǎn)
  • 娛樂(lè)
  • 文化
  • 財(cái)經(jīng)
  • 大數(shù)據(jù)能夠帶來(lái)顛覆性?xún)r(jià)值的領(lǐng)域在,大數(shù)據(jù)能夠帶來(lái)顛覆性?xún)r(jià)值的領(lǐng)域在什么

    “AI+”改變世界!不同領(lǐng)域的5大人工智能趨勢(shì)

    全文共2356字,預(yù)計(jì)學(xué)習(xí)時(shí)長(zhǎng)6分鐘

    大數(shù)據(jù)能夠帶來(lái)顛覆性?xún)r(jià)值的領(lǐng)域在,大數(shù)據(jù)能夠帶來(lái)顛覆性?xún)r(jià)值的領(lǐng)域在什么

    圖源:Pixabay

    人工智能是當(dāng)代最熱門(mén)和關(guān)注度最高的話題,它將改變?nèi)藗儗?duì)20年后世界的看法。

    AI相關(guān)工作的需求頻繁增加,尤其是在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)職位方面,人們相信,正如約100年前電力改變世界一樣,人工智能也將改變世界。吳恩達(dá)教授(美國(guó)斯坦福大學(xué)計(jì)算機(jī)科學(xué)系和電子工程系副教授)曾反復(fù)強(qiáng)調(diào)一句名言:“人工智能是新電力。”

    人工智能領(lǐng)域進(jìn)步飛快:由于有圖形處理器(也稱(chēng)顯卡,GPUs)和大量數(shù)據(jù),人工智能的處理能力和計(jì)算能力提高,我們才能在深度學(xué)習(xí)和現(xiàn)代算法方面占據(jù)領(lǐng)先地位。

    最初的電腦占據(jù)整個(gè)房間,發(fā)展到如今巴掌大小的智能手機(jī)和人工智能,它們現(xiàn)在能執(zhí)行人臉識(shí)別、異物檢測(cè)等曾經(jīng)被視為不可能完成的任務(wù)。

    還有其他一些引人關(guān)注的領(lǐng)域,如機(jī)器人技術(shù)、電子技術(shù)等,也在與時(shí)俱進(jìn),向更高領(lǐng)域進(jìn)階。本文將研究五大人工智能或AI組合技術(shù)和趨勢(shì),這些技術(shù)和趨勢(shì)將超越想象,傳遍整個(gè)世界。

    1.自動(dòng)化與人工智能

    未來(lái)幾十年,機(jī)器人技術(shù)將大有前景,在現(xiàn)實(shí)世界中,它實(shí)施的領(lǐng)域選擇將非常廣泛。

    機(jī)器人技術(shù)應(yīng)用范圍很廣,包括工廠和工業(yè)中的工業(yè)機(jī)器人和機(jī)械臂、探索火星或月球等外行星的太空漫游車(chē)、軍事應(yīng)用、醫(yī)療用途等。然而,未來(lái)人工智能與機(jī)器人結(jié)合將成為一種創(chuàng)新方法,改變未來(lái)幾年格局。具有人工智能集成的機(jī)器人將能夠處理、計(jì)算、評(píng)估和執(zhí)行所需的人類(lèi)行為。

    機(jī)器人技術(shù)和人工智能在未來(lái)發(fā)展空間很大。數(shù)據(jù)科學(xué)項(xiàng)目與機(jī)器人的集成潛力巨大,可以用很少的人力物力在工業(yè)中實(shí)現(xiàn)一流的產(chǎn)品制造。機(jī)器人和AI能力無(wú)限,在處理手頭任務(wù)方面具有巨大的潛力。人工智能和機(jī)器人是工業(yè)應(yīng)用自動(dòng)化任務(wù)的強(qiáng)大組合,在各種現(xiàn)實(shí)用例中潛力無(wú)限。

    至于大家所擔(dān)憂的科幻影片中基于AI的機(jī)器人將奪走人類(lèi)工作或征服世界,完全是庸人自擾。對(duì)于前者,機(jī)器人總是需要某種人類(lèi)行為的干預(yù),而對(duì)于后者,距離實(shí)現(xiàn)真正的人工智能還有很長(zhǎng)的路要走。因此,至少在未來(lái)20年內(nèi),上述兩種擔(dān)憂完全沒(méi)必要。

    2. GPT-3和其他振奮人心的發(fā)展

    深度學(xué)習(xí)和人工智能在自然語(yǔ)言處理方面已經(jīng)取得了長(zhǎng)足的進(jìn)步,從簡(jiǎn)單的LSTMs,已經(jīng)發(fā)展到使用BERT、transformers、序列到關(guān)注序列模型等。

    生成式預(yù)訓(xùn)練的Transformer 3是一種自動(dòng)回歸語(yǔ)言模型,它運(yùn)用深度學(xué)習(xí)來(lái)生成人能理解的文本,是由位于舊金山的人工智能研究實(shí)驗(yàn)室OpenAI創(chuàng)建的GPT-n系列中的第三代語(yǔ)言預(yù)測(cè)模型。

    開(kāi)發(fā)的GPT-3模型是自然語(yǔ)言處理領(lǐng)域的一次進(jìn)展。OpenAI在將近1,750億個(gè)訓(xùn)練參數(shù)上訓(xùn)練了該模型的權(quán)重,該模型無(wú)需任何人為干預(yù)即可撰寫(xiě)完整的新聞文章和雜志。

    不斷投入資金和加大支持力度使得這些領(lǐng)域發(fā)展和進(jìn)步不斷,從工業(yè)領(lǐng)域的人工智能一直到游戲領(lǐng)域的人工智能的研究呈指數(shù)級(jí)增長(zhǎng),將獲得巨大的生產(chǎn)力和廣泛的成功。

    3.云端AI

    圖源:unsplash

    云計(jì)算是計(jì)算機(jī)系統(tǒng)資源(尤其是數(shù)據(jù)存儲(chǔ)和計(jì)算能力)的按需可用性,而無(wú)需用戶直接進(jìn)行主動(dòng)管理,該術(shù)語(yǔ)通常用于描述互聯(lián)網(wǎng)上可供許多用戶使用的數(shù)據(jù)中心。

    云計(jì)算和人工智能的結(jié)合真正顛覆了該領(lǐng)域,當(dāng)這兩種出色的應(yīng)用實(shí)踐相結(jié)合,成就讓人矚目。與人工智能集成的云計(jì)算的主要優(yōu)勢(shì)是具備廣泛的可用資源。

    GPUs可用于執(zhí)行復(fù)雜的深度學(xué)習(xí)計(jì)算,并將這些人工智能模型部署到云端,增加受眾,這是一項(xiàng)巨大的成就。谷歌合作實(shí)驗(yàn)室是一個(gè)很好的平臺(tái),可以建立Jupyter筆記本,用于評(píng)估、計(jì)算并分享AI項(xiàng)目。

    4. AI和IoT(物聯(lián)網(wǎng)):(AIOT)

    物聯(lián)網(wǎng)(IoT)描述了嵌入傳感器、軟件和其他技術(shù)的物理對(duì)象(“物”)網(wǎng)絡(luò),目的是通過(guò)互聯(lián)網(wǎng)與其他設(shè)備和系統(tǒng)進(jìn)行數(shù)據(jù)連接和交換。

    人工智能與物聯(lián)網(wǎng)的結(jié)合形成了一個(gè)全新有趣又獨(dú)特的研究分支,簡(jiǎn)稱(chēng)為“人工物聯(lián)網(wǎng)”或“ AIOT”。啟用了AI的物聯(lián)網(wǎng)(IoT)能夠創(chuàng)建智能機(jī)器,該機(jī)器可以模擬智能行為,同時(shí)支持幾乎沒(méi)有人為干擾的決策能力。

    隨著人工智能在嵌入式物聯(lián)網(wǎng)設(shè)備上的融合,如樹(shù)莓派、英偉達(dá)Jetson Nano等,可以開(kāi)發(fā)出一些利潤(rùn)豐厚、對(duì)全社會(huì)有益的杰作。虛擬助手(例如Alexa,Siri或Google AI)的一些示例顯示了高級(jí)智能和未來(lái)的可能性。

    5. GANs(生成式對(duì)抗網(wǎng)絡(luò))

    圖源:Unsplash

    GANs在2014年由Ian Goodfellow開(kāi)發(fā)并首創(chuàng),被認(rèn)為是深度學(xué)習(xí)的未來(lái),因?yàn)槠渚哂袆?chuàng)造從未存在過(guò)的視覺(jué)和圖像的驚人能力。生成式對(duì)抗性網(wǎng)絡(luò)是當(dāng)前深度學(xué)習(xí)的高峰,其曲線正在不斷改進(jìn)。

    不可否認(rèn),GANs是未來(lái)趨勢(shì),它將永遠(yuǎn)變革人工智能。筆者必須指出兩個(gè)網(wǎng)絡(luò)——生成器和鑒別器,二者相互對(duì)抗,并存在小小的爭(zhēng)議。

    生成器試圖創(chuàng)建真實(shí)的假圖像,以繞過(guò)鑒別器的基本檢查,而鑒別器的作用是捕獲假副本。這種貓和老鼠式的追逐導(dǎo)致了從未出現(xiàn)過(guò)的獨(dú)特樣品發(fā)展,它真實(shí)存在,遠(yuǎn)超人類(lèi)想象。

    人工智能領(lǐng)域可以實(shí)現(xiàn)無(wú)限的優(yōu)化和發(fā)展,這些主要的新興趨勢(shì)只是人工智能及其同代人未來(lái)的一個(gè)跡象。人工智能就在我們身邊,這個(gè)領(lǐng)域的快速發(fā)展著實(shí)讓人著迷,新技術(shù)及人工智能的崛起令人興奮不已。未來(lái)?yè)碛袩o(wú)窮想象!

    留言點(diǎn)贊關(guān)注

    我們一起分享AI學(xué)習(xí)與發(fā)展的干貨

    如轉(zhuǎn)載,請(qǐng)后臺(tái)留言,遵守轉(zhuǎn)載規(guī)范

    大數(shù)據(jù)帶來(lái)的10個(gè)重大變化

    文章來(lái)源:加米谷大數(shù)據(jù)

    大數(shù)據(jù)時(shí)代的到來(lái),大數(shù)據(jù)改變了人們的生活方式、思維模式和研究范式,我們可以總結(jié)出 10 個(gè)重大變化,如圖 1 所示。

    大數(shù)據(jù)能夠帶來(lái)顛覆性?xún)r(jià)值的領(lǐng)域在,大數(shù)據(jù)能夠帶來(lái)顛覆性?xún)r(jià)值的領(lǐng)域在什么

    圖 1 大數(shù)據(jù)時(shí)代的 10 個(gè)重大變化

    2007 年 1 月,圖靈獎(jiǎng)得主、關(guān)系型數(shù)據(jù)庫(kù)鼻祖 JimGray 發(fā)表演講,他憑著自己對(duì)于人類(lèi)科學(xué)發(fā)展特征的深刻洞察,敏銳地指出科學(xué)的發(fā)展正在進(jìn)入“數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)范式”——科學(xué)史上的“第四范式”。在他看來(lái),人類(lèi)科學(xué)研究活動(dòng)已經(jīng)歷過(guò)三種不同范式的演變過(guò)程。“第一范式”是指原始社會(huì)的“實(shí)驗(yàn)科學(xué)范式”。18 世紀(jì)以前的科學(xué)進(jìn)步均屬于此列,其核心特征是對(duì)有限的客觀對(duì)象進(jìn)行觀察、總結(jié)、提煉,用歸納法找出其中的科學(xué)規(guī)律,如伽利略提出的物理學(xué)定律。“第二范式”是指 19 世紀(jì)以來(lái)的理論科學(xué)階段,以模型和歸納為特征的“理論科學(xué)范式”。其核心特征是以演繹法為主,憑借科學(xué)家的智慧構(gòu)建理論大廈,如愛(ài)因斯坦提出的相對(duì)論、麥克斯方程組、量子理論和概率論等。“第三范式”是指 20 世紀(jì)中期以來(lái)的計(jì)算科學(xué)階段的“計(jì)算科學(xué)范式”。面對(duì)大量過(guò)于復(fù)雜的現(xiàn)象,歸納法和演繹法都難以滿足科學(xué)研究的需求,人類(lèi)開(kāi)始借助計(jì)算機(jī)的高級(jí)運(yùn)算能力對(duì)復(fù)雜現(xiàn)象進(jìn)行建模和預(yù)測(cè),如天氣、地震、核試驗(yàn)、原子的運(yùn)動(dòng)等。然而,隨著近年來(lái)人類(lèi)采集數(shù)據(jù)量的爆炸性增長(zhǎng),傳統(tǒng)的計(jì)算科學(xué)范式已經(jīng)越來(lái)越無(wú)力駕馭海量的科研數(shù)據(jù)了。例如,歐洲的大型粒子對(duì)撞機(jī)、天文領(lǐng)域的 Pan-STARRS 望遠(yuǎn)鏡每天產(chǎn)生的數(shù)據(jù)多達(dá)幾千萬(wàn)億字節(jié)(PB)。很明顯,這些數(shù)據(jù)已經(jīng)突破了“第三范式”的處理極限,無(wú)法被科學(xué)家有效利用。正因?yàn)槿绱耍壳罢趶摹坝?jì)算科學(xué)范式”轉(zhuǎn)向“數(shù)據(jù)密集型科學(xué)發(fā)現(xiàn)范式”。“第四范式”的主要特點(diǎn)是科學(xué)研究人員只需要從大數(shù)據(jù)中查找和挖掘所需要的信息和知識(shí),無(wú)須直接面對(duì)所研究的物理對(duì)象。例如,在大數(shù)據(jù)時(shí)代,天文學(xué)家的研究方式發(fā)生了新的變化,其主要研究任務(wù)變?yōu)閺暮A繑?shù)據(jù)庫(kù)中發(fā)現(xiàn)所需的物體或現(xiàn)象的照片,而不再需要親自進(jìn)行太空拍照。

    在大數(shù)據(jù)時(shí)代,數(shù)據(jù)不僅是一種“資源”,更是一種重要的“資產(chǎn)”。因此,數(shù)據(jù)科學(xué)應(yīng)把數(shù)據(jù)當(dāng)作一種“資產(chǎn)”來(lái)管理,而不能僅僅當(dāng)作“資源”來(lái)對(duì)待。也就是說(shuō),與其他類(lèi)型的資產(chǎn)相似,數(shù)據(jù)也具有財(cái)務(wù)價(jià)值,且需要作為獨(dú)立實(shí)體進(jìn)行組織與管理。大數(shù)據(jù)時(shí)代的到來(lái),讓“數(shù)據(jù)即資產(chǎn)”成為最核心的產(chǎn)業(yè)趨勢(shì)。在這個(gè)“數(shù)據(jù)為王”的時(shí)代,回首信息產(chǎn)業(yè)發(fā)展的起起伏伏,我們發(fā)現(xiàn)產(chǎn)業(yè)興衰的決定性因素,已不是土地、人力、技術(shù)、資本這些傳統(tǒng)意義上的生產(chǎn)要素,而是曾經(jīng)被一度忽視的“數(shù)據(jù)資產(chǎn)”。世界經(jīng)濟(jì)論壇報(bào)告曾經(jīng)預(yù)測(cè)稱(chēng),“未來(lái)的大數(shù)據(jù)將成為新的財(cái)富高地,其價(jià)值可能會(huì)堪比石油”,而大數(shù)據(jù)之父維克托也樂(lè)觀地表示,“數(shù)據(jù)列入企業(yè)資產(chǎn)負(fù)債表只是時(shí)間問(wèn)題”。“數(shù)據(jù)成為資產(chǎn)”是互聯(lián)網(wǎng)泛在化的一種資本體現(xiàn),它讓互聯(lián)網(wǎng)不僅具有應(yīng)用和服務(wù)本身的價(jià)值,而且具有了內(nèi)在的“金融”價(jià)值。數(shù)據(jù)不再只是體現(xiàn)于“使用價(jià)值”方面的產(chǎn)品,而成為實(shí)實(shí)在在的“價(jià)值”。目前,作為數(shù)據(jù)資產(chǎn)先行者的 IT 企業(yè),如蘋(píng)果、谷歌、IBM、阿里、騰訊、百度等,無(wú)不想盡各種方式,挖掘多種形態(tài)的設(shè)備及軟件功能,收集各種類(lèi)型的數(shù)據(jù),發(fā)揮大數(shù)據(jù)的商業(yè)價(jià)值,將傳統(tǒng)意義上的 IT 企業(yè),打造成為“終端+應(yīng)用+平臺(tái)+數(shù)據(jù)”四位一體的泛互聯(lián)網(wǎng)化企業(yè),以期在大數(shù)據(jù)時(shí)代獲取更大的收益。大數(shù)據(jù)資產(chǎn)的價(jià)值的衡量尺度主要有以下 3 個(gè)方面的標(biāo)準(zhǔn)。

    目前,數(shù)據(jù)的所有權(quán)問(wèn)題在業(yè)界還比較模糊。從擁有和控制的角度來(lái)看,數(shù)據(jù)可以分為 Ⅰ 型數(shù)據(jù)、Ⅱ 型數(shù)據(jù)和 Ⅲ 型數(shù)據(jù)。Ⅰ 型數(shù)據(jù)主要是指數(shù)據(jù)的生產(chǎn)者自己生產(chǎn)出來(lái)的各種數(shù)據(jù),例如,百度對(duì)使用其搜索引擎的用戶的各種行為進(jìn)行收集、整理和分析,這類(lèi)數(shù)據(jù)雖然由用戶產(chǎn)生,但產(chǎn)權(quán)卻屬于生產(chǎn)者,并最大限度地發(fā)揮其商業(yè)價(jià)值。Ⅱ 型數(shù)據(jù)又稱(chēng)為入口數(shù)據(jù),例如,各種電子商務(wù)營(yíng)銷(xiāo)公司通過(guò)將自身的工具或插件植入電商平臺(tái),來(lái)為其提供統(tǒng)計(jì)分析服務(wù),并從中獲取各類(lèi)經(jīng)營(yíng)數(shù)據(jù)。雖然這些數(shù)據(jù)的所有權(quán)并不屬于這些公司,在使用時(shí)也有一些規(guī)則限制,但是它們卻有著對(duì)數(shù)據(jù)實(shí)際的控制權(quán)。相比于前兩類(lèi)數(shù)據(jù),Ⅲ 型數(shù)據(jù)的產(chǎn)權(quán)情況比較復(fù)雜,它們主要依靠網(wǎng)絡(luò)爬蟲(chóng),甚至是黑客手段獲取數(shù)據(jù)。與 Ⅰ 型和 Ⅱ 型數(shù)據(jù)不同的是,這些公司流出的內(nèi)部數(shù)據(jù)放在網(wǎng)上供人付費(fèi)下載。這種數(shù)據(jù)在當(dāng)前階段,還不能和資產(chǎn)完全畫(huà)等號(hào)。

    大數(shù)據(jù)要實(shí)現(xiàn)真正的資產(chǎn)化,用貨幣對(duì)海量數(shù)據(jù)進(jìn)行計(jì)量是一個(gè)大問(wèn)題。盡管很多企業(yè)都意識(shí)到數(shù)據(jù)作為資產(chǎn)的可能性,但除了極少數(shù)專(zhuān)門(mén)以數(shù)據(jù)交易為主營(yíng)業(yè)務(wù)的公司外,大多數(shù)公司都沒(méi)有為數(shù)據(jù)的貨幣計(jì)量做出適當(dāng)?shù)馁~務(wù)處理。雖然數(shù)據(jù)作為資產(chǎn)尚未在企業(yè)財(cái)務(wù)中得到真正的引用,但將數(shù)據(jù)列入無(wú)形資產(chǎn)比較有利。考慮到研發(fā)因素,很多高科技企業(yè)都具有較長(zhǎng)的投入產(chǎn)出期,可以讓那些存儲(chǔ)在硬盤(pán)上的數(shù)據(jù)直接進(jìn)入資產(chǎn)負(fù)債表。對(duì)于通過(guò)交易手段獲得的數(shù)據(jù),可以按實(shí)際支付價(jià)款作為入賬價(jià)值計(jì)入無(wú)形資產(chǎn),從而為企業(yè)形成有效稅盾,降低企業(yè)實(shí)際稅負(fù)。

    資本區(qū)別于一般產(chǎn)品的特征在于,它具有不斷增值的可能性。只有能夠利用數(shù)據(jù)、組合數(shù)據(jù)、轉(zhuǎn)化數(shù)據(jù)的企業(yè),他們手中的大數(shù)據(jù)資源才能成為數(shù)據(jù)資產(chǎn)。目前,直接利用數(shù)據(jù)為企業(yè)帶來(lái)經(jīng)濟(jì)利益的方法主要有數(shù)據(jù)租售、信息租售、數(shù)據(jù)使能三種模式。

    • 數(shù)據(jù)租售主要通過(guò)對(duì)業(yè)務(wù)數(shù)據(jù)進(jìn)行收集、整理、過(guò)濾、校對(duì)、打包、發(fā)布等一系列操作,實(shí)現(xiàn)數(shù)據(jù)內(nèi)在的價(jià)值。
    • 信息租售則通過(guò)聚焦行業(yè)焦點(diǎn),收集相關(guān)數(shù)據(jù),深度整合、萃取及分析,形成完整數(shù)據(jù)鏈條,實(shí)現(xiàn)數(shù)據(jù)的資產(chǎn)轉(zhuǎn)化。
    • 數(shù)據(jù)使能是指類(lèi)似于阿里這樣的互聯(lián)網(wǎng)公司通過(guò)提供大量的金融數(shù)據(jù)挖掘及分析服務(wù),為傳統(tǒng)金融行業(yè)難以下手的小額貸款業(yè)務(wù)開(kāi)創(chuàng)新的行業(yè)增長(zhǎng)點(diǎn)。

    總而言之,作為信息時(shí)代核心的價(jià)值載體,大數(shù)據(jù)必然具有朝向價(jià)值本體轉(zhuǎn)化的趨勢(shì),而它的“資產(chǎn)化”,或者未來(lái)更進(jìn)一步的“資本化”蛻變,將為未來(lái)完全信息化、泛互聯(lián)網(wǎng)化的商業(yè)模式打下基礎(chǔ)。

    傳統(tǒng)的方法論往往是“基于知識(shí)”的,即從“大量實(shí)踐(數(shù)據(jù))”中總結(jié)和提煉出一般性知識(shí)(定理、模式、模型、函數(shù)等)之后,用知識(shí)去解決(或解釋?zhuān)﹩?wèn)題。因此,傳統(tǒng)的問(wèn)題解決思路是“問(wèn)題→知識(shí)→問(wèn)題”,即根據(jù)問(wèn)題找“知識(shí)”,并用“知識(shí)”解決“問(wèn)題”。然而,數(shù)據(jù)科學(xué)中興起了另一種方法論——“問(wèn)題→數(shù)據(jù)→問(wèn)題”,即根據(jù)“問(wèn)題”找“數(shù)據(jù)”,并直接用“數(shù)據(jù)”(在不需要把“數(shù)據(jù)”轉(zhuǎn)換成“知識(shí)”的前提下)解決“問(wèn)題”,如圖 2 所示。

    圖 2 傳統(tǒng)思維與大數(shù)據(jù)思維的比較

    在傳統(tǒng)科學(xué)中,數(shù)據(jù)分析主要以數(shù)學(xué)和統(tǒng)計(jì)學(xué)為直接理論工具。但是,云計(jì)算等計(jì)算模式的出現(xiàn)及大數(shù)據(jù)時(shí)代的到來(lái),提升了我們對(duì)數(shù)據(jù)的獲取、存儲(chǔ)、計(jì)算與管理能力,進(jìn)而對(duì)統(tǒng)計(jì)學(xué)理論與方法產(chǎn)生了深遠(yuǎn)影響。大數(shù)據(jù)帶給我們 4 個(gè)顛覆性的觀念轉(zhuǎn)變。

    在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴(lài)于隨機(jī)采樣。以前我們通常把隨機(jī)采樣看成是理所應(yīng)當(dāng)?shù)南拗疲钦嬲拇髷?shù)據(jù)時(shí)代是指不用隨機(jī)分析法這樣的捷徑,而采用對(duì)所有數(shù)據(jù)進(jìn)行分析的方法,通過(guò)觀察所有數(shù)據(jù),來(lái)尋找異常值進(jìn)行分析。例如,信用卡詐騙是通過(guò)異常情況來(lái)識(shí)別的,只有掌握了所有數(shù)據(jù)才能做到這一點(diǎn)。在這種情況下,異常值是最有用的信息,可以把它與正常交易情況作對(duì)比從而發(fā)現(xiàn)問(wèn)題。

    數(shù)據(jù)量的大幅增加會(huì)造成一些錯(cuò)誤的數(shù)據(jù)混進(jìn)數(shù)據(jù)集。但是,正因?yàn)槲覀冋莆樟藥缀跛械臄?shù)據(jù),所以我們不再擔(dān)心某個(gè)數(shù)據(jù)點(diǎn)對(duì)整套分析的不利影響。我們要做的就是要接受這些紛繁的數(shù)據(jù)并從中受益,而不是以高昂的代價(jià)消除所有的不確定性。這就是由“小數(shù)據(jù)”到“大數(shù)據(jù)”的改變。

    研究數(shù)據(jù)如此之多,以至于我們不再熱衷于追求精確度。之前需要分析的數(shù)據(jù)很少,所以我們必須盡可能精確地量化我們的記錄,但隨著規(guī)模的擴(kuò)大,對(duì)精確度的癡迷將減弱。擁有了大數(shù)據(jù),我們不再需要對(duì)一個(gè)現(xiàn)象刨根問(wèn)底,只要掌握了大體的發(fā)展方向即可,適當(dāng)忽略微觀層面上的精確度,會(huì)讓我們?cè)诤暧^層面擁有更好的洞察力。例如,微信朋友圈中朋友發(fā)動(dòng)態(tài)的時(shí)間,在一小時(shí)以?xún)?nèi)的會(huì)顯示多少分鐘之前,在一小時(shí)以外的就只顯示幾小時(shí)前;微信公眾號(hào)中顯示的閱讀量,超過(guò)十萬(wàn)以后顯示的就是 100000+,而不是具體數(shù)據(jù),因?yàn)槌^(guò)十萬(wàn)的閱讀量已經(jīng)讓我們覺(jué)得這篇文章很優(yōu)秀了,沒(méi)必要精確。

    在數(shù)據(jù)科學(xué)中,廣泛應(yīng)用“基于數(shù)據(jù)”的思維模式,重視對(duì)“相關(guān)性”的分析,而不是等到發(fā)現(xiàn)“真正的因果關(guān)系”之后才解決問(wèn)題。在大數(shù)據(jù)時(shí)代,人們開(kāi)始重視相關(guān)分析,而不僅僅是因果分析。我們無(wú)須再緊盯事物之間的因果關(guān)系,而應(yīng)該尋找事物之間的相關(guān)關(guān)系。相關(guān)關(guān)系也許不能準(zhǔn)確地告訴我們某件事情為何會(huì)發(fā)生,但是它會(huì)告訴我們某件事情已經(jīng)發(fā)生了。在大數(shù)據(jù)時(shí)代,我們不必非得知道現(xiàn)象背后的原因,而是要讓數(shù)據(jù)自己發(fā)聲。知道是什么就夠了,沒(méi)必要知道為什么。例如,知道用戶對(duì)什么感興趣即可,沒(méi)必要去研究用戶為什么感興趣。相關(guān)關(guān)系的核心是量化兩個(gè)數(shù)據(jù)值之間的數(shù)據(jù)關(guān)系。相關(guān)關(guān)系強(qiáng)是指當(dāng)一個(gè)數(shù)據(jù)值增加時(shí),其他數(shù)據(jù)值很有可能也會(huì)隨之增加。相關(guān)關(guān)系是通過(guò)識(shí)別關(guān)聯(lián)物來(lái)幫助我們分析某一現(xiàn)象的,而不是揭示其內(nèi)部的運(yùn)作。通過(guò)找到一個(gè)現(xiàn)象良好的關(guān)聯(lián)物,相關(guān)關(guān)系可以幫助我們捕捉現(xiàn)在和預(yù)測(cè)未來(lái)。例如,如果川和萬(wàn)經(jīng)常一起發(fā)生,我們只需要注意方是否發(fā)生,就可以預(yù)測(cè)力是否也發(fā)生了。

    “只要擁有足夠多的數(shù)據(jù),我們可以變得更聰明”是大數(shù)據(jù)時(shí)代的一個(gè)新認(rèn)識(shí)。因此,在大數(shù)據(jù)時(shí)代,原本復(fù)雜的“智能問(wèn)題”變成簡(jiǎn)單的“數(shù)據(jù)問(wèn)題”。只要對(duì)大數(shù)據(jù)進(jìn)行簡(jiǎn)單查詢(xún)就可以達(dá)到“基于復(fù)雜算法的智能計(jì)算的效果”。為此,很多學(xué)者曾討論過(guò)一個(gè)重要話題——“大數(shù)據(jù)時(shí)代需要的是更多的數(shù)據(jù)還是更好的模型?”機(jī)器翻譯是傳統(tǒng)自然語(yǔ)言技術(shù)領(lǐng)域的難點(diǎn),雖曾提出過(guò)很多種算法,但應(yīng)用效果并不理想。IBM 有能力將《》歷年的文本輸入電腦,試圖破譯中文的語(yǔ)言結(jié)構(gòu)。例如,實(shí)現(xiàn)中文的語(yǔ)音輸入或者中英互譯,這項(xiàng)技術(shù)在 20 世紀(jì) 90 年代就取得突破,但進(jìn)展緩慢,在應(yīng)用中還是有很多問(wèn)題。近年來(lái),Google 翻譯等工具改變了“實(shí)現(xiàn)策略”,不再依靠復(fù)雜算法進(jìn)行翻譯,而是通過(guò)對(duì)他們之前收集的跨語(yǔ)言語(yǔ)料庫(kù)進(jìn)行簡(jiǎn)單查詢(xún)的方式,提升了機(jī)器翻譯的效果和效率。他們并不教給電腦所有的語(yǔ)言規(guī)則,而是讓電腦自己去發(fā)現(xiàn)這些規(guī)則。電腦通過(guò)分析經(jīng)過(guò)人工翻譯的數(shù)以千萬(wàn)計(jì)的文件來(lái)發(fā)現(xiàn)其中的規(guī)則。這些翻譯結(jié)果源自圖書(shū)、各種機(jī)構(gòu)(如聯(lián)合國(guó))及世界各地的網(wǎng)站。他們的電腦會(huì)掃描這些語(yǔ)篇,從中尋找在統(tǒng)計(jì)學(xué)上非常重要的模式,即翻譯結(jié)果和原文之間并非偶然產(chǎn)生的模式。一旦電腦找到了這些模式,今后它就能使用這些模式來(lái)翻譯其他類(lèi)似的語(yǔ)篇。通過(guò)數(shù)十億次重復(fù)使用,就會(huì)得出數(shù)十億種模式及一個(gè)異常聰明的電腦程序。但是對(duì)于某些語(yǔ)言來(lái)說(shuō),他們能夠使用到的已翻譯完成的語(yǔ)篇非常少,因此 Google 的軟件所探測(cè)到的模式就相對(duì)很少。這就是為什么 Google 的翻譯質(zhì)量會(huì)因語(yǔ)言對(duì)的不同而不同。通過(guò)不斷向電腦提供新的翻譯語(yǔ)篇,Google 就能讓電腦更加聰明,翻譯結(jié)果更加準(zhǔn)確。

    在傳統(tǒng)數(shù)據(jù)管理中,企業(yè)更加關(guān)注的是業(yè)務(wù)的數(shù)據(jù)化問(wèn)題,即如何將業(yè)務(wù)活動(dòng)以數(shù)據(jù)方式記錄下來(lái),以便進(jìn)行業(yè)務(wù)審計(jì)、分析與挖掘。在大數(shù)據(jù)時(shí)代,企業(yè)需要重視一個(gè)新的課題——數(shù)據(jù)業(yè)務(wù)化,即如何“基于數(shù)據(jù)”動(dòng)態(tài)地定義、優(yōu)化和重組業(yè)務(wù)及其流程,進(jìn)而提升業(yè)務(wù)的敏捷性,降低風(fēng)險(xiǎn)和成本。業(yè)務(wù)數(shù)據(jù)化是前提,而數(shù)據(jù)業(yè)務(wù)化是目標(biāo)。電商的經(jīng)營(yíng)模式與實(shí)體店最本質(zhì)的區(qū)別是,電商每賣(mài)出一件產(chǎn)品,都會(huì)留存一條詳盡的數(shù)據(jù)記錄。也正是因?yàn)榭梢杂脭?shù)字化的形式保留每一筆銷(xiāo)售的明細(xì),電商可以清楚地掌握每一件商品到底賣(mài)給了誰(shuí)。此外,依托互聯(lián)網(wǎng)這個(gè)平臺(tái),電商還可以記錄每一個(gè)消費(fèi)者的鼠標(biāo)單擊記錄、網(wǎng)上搜索記錄。所有這些記錄形成了一個(gè)關(guān)于消費(fèi)者行為的實(shí)時(shí)數(shù)據(jù)閉環(huán),通過(guò)這個(gè)閉環(huán)中源源不斷產(chǎn)生的新鮮數(shù)據(jù),電商可以更好地洞察消費(fèi)者,更及時(shí)地預(yù)測(cè)其需求的變化,經(jīng)營(yíng)者和消費(fèi)者之間因此產(chǎn)生了很強(qiáng)的黏性。線下實(shí)體商店很難做到這一點(diǎn),他們可能只知道一個(gè)省、一個(gè)市或者一個(gè)地區(qū)賣(mài)了多少商品,但是,他們很難了解到所生產(chǎn)、經(jīng)營(yíng)的每一件商品究竟賣(mài)到了哪一個(gè)具體的地方、哪一個(gè)具體的人,這個(gè)人還買(mǎi)了其他什么東西、查看了哪些商品、可能會(huì)喜歡什么樣的商品。也就是說(shuō),線下實(shí)體店即使收集了一些數(shù)據(jù),但其數(shù)據(jù)的粒度、寬度、廣度和深度都非常有限。由于缺乏足夠的數(shù)據(jù),實(shí)體店對(duì)自己的經(jīng)營(yíng)行為,對(duì)消費(fèi)者的洞察力,以及和消費(fèi)者之間的黏性都十分有限。就此而言,一家電商和一家線下實(shí)體店最本質(zhì)的區(qū)別就是是否保存了足夠的數(shù)據(jù)。其實(shí),這正是互聯(lián)網(wǎng)化的核心和本質(zhì),即“數(shù)據(jù)化”。這并不是一個(gè)簡(jiǎn)單的數(shù)據(jù)化,而是所有業(yè)務(wù)的過(guò)程都要數(shù)據(jù)化,即把所有的業(yè)務(wù)過(guò)程記錄下來(lái),形成一個(gè)數(shù)據(jù)的閉環(huán),這個(gè)閉環(huán)的實(shí)時(shí)性和效率是關(guān)鍵的指標(biāo)。這個(gè)思想就是一切業(yè)務(wù)都要數(shù)據(jù)化。在大數(shù)據(jù)時(shí)代,企業(yè)不僅僅是把業(yè)務(wù)數(shù)據(jù)化,更重要的是把數(shù)據(jù)業(yè)務(wù)化,也就是把數(shù)據(jù)作為直接生產(chǎn)力,將數(shù)據(jù)價(jià)值直接通過(guò)前臺(tái)產(chǎn)品作用于消費(fèi)者。數(shù)據(jù)可以反映用戶過(guò)去的行為軌跡,也可以預(yù)測(cè)用戶將來(lái)的行為傾向。比較好理解的一個(gè)實(shí)例就是關(guān)聯(lián)推薦,當(dāng)用戶買(mǎi)了一個(gè)商品之后,可以給用戶推薦一個(gè)最有可能再買(mǎi)的商品。個(gè)性化是數(shù)據(jù)作為直接生產(chǎn)力的一個(gè)具體體現(xiàn)。隨著數(shù)據(jù)分析工具與數(shù)據(jù)挖掘渠道的日益豐富與多樣化,數(shù)據(jù)存量越來(lái)越大,數(shù)據(jù)對(duì)企業(yè)也越來(lái)越重要。數(shù)據(jù)業(yè)務(wù)化能夠給企業(yè)帶來(lái)的業(yè)務(wù)價(jià)值主要包括以下幾點(diǎn):提高生產(chǎn)過(guò)程的資源利用率,降低生產(chǎn)成本;根據(jù)商業(yè)分析提高商業(yè)智能的準(zhǔn)確率,降低傳統(tǒng)“憑感覺(jué)”做決策的業(yè)務(wù)風(fēng)險(xiǎn);動(dòng)態(tài)價(jià)格優(yōu)化利潤(rùn)和增長(zhǎng);獲取優(yōu)質(zhì)客戶。目前,越來(lái)越多的企業(yè)級(jí)用戶已經(jīng)考慮從批量分析向近實(shí)時(shí)分析發(fā)展,從而提高 IT 創(chuàng)造價(jià)值的能力。同時(shí),數(shù)據(jù)分析在快速?gòu)纳虡I(yè)智能向用戶智能發(fā)展。數(shù)據(jù)業(yè)務(wù)化可以讓數(shù)據(jù)給企業(yè)創(chuàng)造額外收益和價(jià)值。

    傳統(tǒng)科學(xué)思維中,決策制定往往是“目標(biāo)”或“模型”驅(qū)動(dòng)的,也就是根據(jù)目標(biāo)(或模型)進(jìn)行決策。然而,大數(shù)據(jù)時(shí)代出現(xiàn)了另一種思維模式,即數(shù)據(jù)驅(qū)動(dòng)型決策,數(shù)據(jù)成為決策制定的主要“觸發(fā)條件”和“重要依據(jù)”。小數(shù)據(jù)時(shí)代,企業(yè)討論什么事情該做不該做,許多時(shí)候是憑感覺(jué)來(lái)決策的,流程如圖 3 所示,由兩個(gè)環(huán)節(jié)組成:一個(gè)是拍腦袋,另一個(gè)是研發(fā)功能。

    圖 3 產(chǎn)品迭代的錯(cuò)誤流程

    基本上就是產(chǎn)品經(jīng)理通過(guò)一些調(diào)研,想了一個(gè)功能,做了設(shè)計(jì)。下一步就是把這個(gè)功能研發(fā)出來(lái),然后看一下效果如何,再做下一步。整個(gè)過(guò)程都是憑一些感覺(jué)來(lái)決策。這種方式總是會(huì)出現(xiàn)問(wèn)題,很容易走一些彎路,很有可能做出錯(cuò)誤的決定。數(shù)據(jù)驅(qū)動(dòng)型決策加入了數(shù)據(jù)分析環(huán)節(jié),如圖 4 所示。

    圖 4 數(shù)據(jù)驅(qū)動(dòng)的產(chǎn)品迭代流程

    基本流程就是企業(yè)有一些點(diǎn)子,通過(guò)點(diǎn)子去研發(fā)這些功能,之后要進(jìn)行數(shù)據(jù)收集,然后進(jìn)行數(shù)據(jù)分析。基于數(shù)據(jù)分析得到一些結(jié)論,然后基于這些結(jié)論,再去進(jìn)行下一步的研發(fā)。整個(gè)過(guò)程就形成了一個(gè)循環(huán)。在這種決策流程中,人為的因素影響越來(lái)越少,而主要是用一種科學(xué)的方法來(lái)進(jìn)行產(chǎn)品的迭代。

    例如,一個(gè)產(chǎn)品的界面到底是綠色背景好還是藍(lán)色背景好,從設(shè)計(jì)的層面考慮,兩者是都有可能的。那么就可以做一下 A/B 測(cè)試。可以讓 50% 的人顯示綠色背景,50% 的人顯示藍(lán)色背景,然后看用戶點(diǎn)擊量。哪個(gè)點(diǎn)擊比較多,就選擇哪個(gè)。這就是數(shù)據(jù)驅(qū)動(dòng),這樣就轉(zhuǎn)變成不是憑感覺(jué),而是通過(guò)數(shù)據(jù)去決策。相比于基于本能、假設(shè)或認(rèn)知偏見(jiàn)而做出的決策,基于證據(jù)的決策更可靠。通過(guò)數(shù)據(jù)驅(qū)動(dòng)的方法,企業(yè)能夠判斷趨勢(shì),從而展開(kāi)有效行動(dòng),幫助自己發(fā)現(xiàn)問(wèn)題,推動(dòng)創(chuàng)新或解決方案的出現(xiàn)。

    在大數(shù)據(jù)時(shí)代,企業(yè)之間的競(jìng)合關(guān)系發(fā)生了變化,原本相互競(jìng)爭(zhēng),甚至不愿合作的企業(yè),不得不開(kāi)始合作,形成新的業(yè)態(tài)和產(chǎn)業(yè)鏈。所謂競(jìng)合關(guān)系,即在競(jìng)爭(zhēng)中合作,在合作中競(jìng)爭(zhēng)。它的核心思想主要體現(xiàn)在兩個(gè)方面:創(chuàng)造價(jià)值與爭(zhēng)奪價(jià)值。創(chuàng)造價(jià)值是個(gè)體之間相互合作、共創(chuàng)價(jià)值的過(guò)程;爭(zhēng)奪價(jià)值則是個(gè)體之間相互競(jìng)爭(zhēng)、分享價(jià)值的過(guò)程。競(jìng)合的思想就是要求所有參與者共同把蛋糕做大,每個(gè)參與者最終分得的部分都會(huì)相應(yīng)增加。傳統(tǒng)的競(jìng)合關(guān)系以戰(zhàn)略為中心,德國(guó)寶馬汽車(chē)公司和戴姆勒公司旗下的奔馳品牌在整車(chē)制造領(lǐng)域存在著品牌競(jìng)爭(zhēng),但雙方不僅共同開(kāi)發(fā)、生產(chǎn)及采購(gòu)汽車(chē)零部件,而且在混合動(dòng)力技術(shù)——領(lǐng)域進(jìn)行研究合作。為了能夠在激烈的市場(chǎng)競(jìng)爭(zhēng)中獲取優(yōu)勢(shì),兩家公司通過(guò)競(jìng)合戰(zhàn)略,互通有無(wú)、共享資源,從而在汽車(chē)業(yè)整體利潤(rùn)下滑的趨勢(shì)下獲得相對(duì)較好的收益,最終取得雙贏。在大數(shù)據(jù)時(shí)代,競(jìng)合關(guān)系是以數(shù)據(jù)為中心的。數(shù)據(jù)產(chǎn)業(yè)就是從信息化過(guò)程累積的數(shù)據(jù)資源中提取有用信息進(jìn)行創(chuàng)新,并將這些數(shù)據(jù)創(chuàng)新賦予商業(yè)模式。這種由大數(shù)據(jù)創(chuàng)新所驅(qū)動(dòng)的產(chǎn)業(yè)化過(guò)程具有“提升其他產(chǎn)業(yè)利潤(rùn)”的特征,除了能探索新的價(jià)值發(fā)現(xiàn)、創(chuàng)造與獲取方式以謀求本身發(fā)展外,還能幫助傳統(tǒng)產(chǎn)業(yè)突破瓶頸、升級(jí)轉(zhuǎn)型,是一種新的競(jìng)合關(guān)系,而非一般觀點(diǎn)的“新興科技催生的經(jīng)濟(jì)業(yè)態(tài)與原有經(jīng)濟(jì)業(yè)態(tài)存在競(jìng)爭(zhēng)關(guān)系”。所以,數(shù)據(jù)產(chǎn)業(yè)培育圍繞傳統(tǒng)經(jīng)濟(jì)升級(jí)轉(zhuǎn)型,依附傳統(tǒng)行業(yè)企業(yè)共生發(fā)展,是最好的發(fā)展策略。例如,近年來(lái)發(fā)展火熱的團(tuán)購(gòu),就是數(shù)據(jù)產(chǎn)業(yè)幫助傳統(tǒng)餐飲業(yè)、旅游業(yè)和交通行業(yè)的升級(jí)轉(zhuǎn)型。提供團(tuán)購(gòu)業(yè)務(wù)的企業(yè)在獲得收益的同時(shí),也提高了其他傳統(tǒng)行業(yè)的效益。但是,傳統(tǒng)企業(yè)與團(tuán)購(gòu)企業(yè)也存在著一定的競(jìng)爭(zhēng)關(guān)系。傳統(tǒng)企業(yè)在與團(tuán)購(gòu)企業(yè)合作的過(guò)程中,也盡力防止自己的線下業(yè)務(wù)全部轉(zhuǎn)為自己不能掌控的團(tuán)購(gòu)企業(yè)。團(tuán)購(gòu)網(wǎng)站為了能獲得更廣的用戶群、更大的流量來(lái)提升自己的市場(chǎng)地位,除了自身擴(kuò)展商戶和培養(yǎng)網(wǎng)民習(xí)慣之外,還紛紛采取了合縱連橫的發(fā)展戰(zhàn)略。聚劃算、京東團(tuán)購(gòu)、當(dāng)當(dāng)團(tuán)購(gòu)、58 團(tuán)購(gòu)等紛紛開(kāi)放平臺(tái),吸引了千品網(wǎng)、高朋、滿座、窩窩等團(tuán)購(gòu)網(wǎng)站的入駐,投奔平臺(tái)正在成為行業(yè)共識(shí)。對(duì)于獨(dú)立團(tuán)購(gòu)網(wǎng)站來(lái)說(shuō),入駐電商平臺(tái)不僅能帶來(lái)流量,電商平臺(tái)在實(shí)物銷(xiāo)售上的積累對(duì)其實(shí)物團(tuán)購(gòu)也有一定的促進(jìn)作用。

    在傳統(tǒng)科學(xué)看來(lái),數(shù)據(jù)需要徹底“凈化”和“集成”,計(jì)算目的是需要找出“精確答案”,而其背后的哲學(xué)是“不接受數(shù)據(jù)的復(fù)雜性”。然而,大數(shù)據(jù)中更加強(qiáng)調(diào)的是數(shù)據(jù)的動(dòng)態(tài)性、異構(gòu)性和跨域等復(fù)雜性,開(kāi)始把“復(fù)雜性”當(dāng)作數(shù)據(jù)的一個(gè)固有特征來(lái)對(duì)待,組織數(shù)據(jù)生態(tài)系統(tǒng)的管理目標(biāo)開(kāi)始轉(zhuǎn)向?qū)⒔M織處于混沌邊緣狀態(tài)。在小數(shù)據(jù)時(shí)代,對(duì)于數(shù)據(jù)的存儲(chǔ)與檢索一直依賴(lài)于分類(lèi)法和索引法的機(jī)制,這種機(jī)制是以預(yù)設(shè)場(chǎng)域?yàn)榍疤岬摹_@種結(jié)構(gòu)化數(shù)據(jù)庫(kù)的預(yù)設(shè)場(chǎng)域能夠卓越地展示數(shù)據(jù)的整齊排列與準(zhǔn)確存儲(chǔ),與追求數(shù)據(jù)的精確性目標(biāo)是完全一致的。在數(shù)據(jù)稀缺與問(wèn)題清晰的年代,這種基于預(yù)設(shè)的結(jié)構(gòu)化數(shù)據(jù)庫(kù)能夠有效地回答人們的問(wèn)題,并且這種數(shù)據(jù)庫(kù)在不同的時(shí)間能夠提供一致的結(jié)果。面對(duì)大數(shù)據(jù),數(shù)據(jù)的海量、混雜等特征會(huì)使預(yù)設(shè)的數(shù)據(jù)庫(kù)系統(tǒng)崩潰。其實(shí),數(shù)據(jù)的紛繁雜亂才真正呈現(xiàn)出世界的復(fù)雜性和不確定性特征,想要獲得大數(shù)據(jù)的價(jià)值,承認(rèn)混亂而不是避免混亂才是一種可行的路徑。為此,伴隨著大數(shù)據(jù)的涌現(xiàn),出現(xiàn)了非關(guān)系型數(shù)據(jù)庫(kù),它不需要預(yù)先設(shè)定記錄結(jié)構(gòu),而且允許處理各種各樣形形參差不齊的數(shù)據(jù)。因?yàn)榘萘私Y(jié)構(gòu)的多樣性,這些無(wú)須預(yù)設(shè)的非關(guān)系型數(shù)據(jù)庫(kù)設(shè)計(jì)能夠處理和存儲(chǔ)更多的數(shù)據(jù),成為大數(shù)據(jù)時(shí)代的重要應(yīng)對(duì)手段。在大數(shù)據(jù)時(shí)代,海量數(shù)據(jù)的涌現(xiàn)一定會(huì)增加數(shù)據(jù)的混亂性且會(huì)造成結(jié)果的不準(zhǔn)確性,如果仍然依循準(zhǔn)確性,那么將無(wú)法應(yīng)對(duì)這個(gè)新的時(shí)代。大數(shù)據(jù)通常都用概率說(shuō)話,與數(shù)據(jù)的混雜性可能帶來(lái)的結(jié)果錯(cuò)誤性相比,數(shù)據(jù)量的擴(kuò)張帶給我們的新洞察、新趨勢(shì)和新價(jià)值更有意義。因此,與致力于避免錯(cuò)誤相比,對(duì)錯(cuò)誤的包容將會(huì)帶給我們更多信息。其實(shí),允許數(shù)據(jù)的混雜性和容許結(jié)果的不精確性才是我們擁抱大數(shù)據(jù)的正確態(tài)度,未來(lái)我們應(yīng)當(dāng)習(xí)慣這種思維。

    在傳統(tǒng)科學(xué)中,數(shù)據(jù)的分析和挖掘都是具有很高專(zhuān)業(yè)素養(yǎng)的“企業(yè)核心員工”的事情,企業(yè)管理的重要目的是如何激勵(lì)和考核這些“核心員工”。但是,在大數(shù)據(jù)時(shí)代,基于“核心員工”的創(chuàng)新工作成本和風(fēng)險(xiǎn)越來(lái)越大,而基于“專(zhuān)家余(Pro-AmT 的大規(guī)模協(xié)作日益受到重視,正成為解決數(shù)據(jù)規(guī)模與形式化之間矛盾的重要手段。大規(guī)模生產(chǎn)讓數(shù)以百計(jì)的人買(mǎi)得起商品,但商品本身卻是一模一樣的。企業(yè)面臨這樣一個(gè)矛盾:定制化的產(chǎn)品更能滿足用戶的需求,但卻非常昂貴;與此同時(shí),量產(chǎn)化的商品價(jià)格低廉,但無(wú)法完全滿足用戶的需求。如果能夠做到大規(guī)模定制,為大量用戶定制產(chǎn)品和服務(wù),則能使產(chǎn)品成本低,又兼具個(gè)性化,從而使企業(yè)有能力滿足要求,但價(jià)格又不至于像手工制作那般讓人無(wú)法承擔(dān)。因此,在企業(yè)可以負(fù)擔(dān)得起大規(guī)模定制帶來(lái)的高成本的前提下,要真正做到個(gè)性化產(chǎn)品和服務(wù),就必須對(duì)用戶需求有很好的了解,這就需要用戶提前參與到產(chǎn)品設(shè)計(jì)中。在大數(shù)據(jù)時(shí)代,用戶不再僅僅熱衷于消費(fèi),他們更樂(lè)于參與到產(chǎn)品的創(chuàng)造過(guò)程中,大數(shù)據(jù)技術(shù)讓用戶參與創(chuàng)造與分享成果的需求得到實(shí)現(xiàn)。市場(chǎng)上傳統(tǒng)的著名品牌越來(lái)越重視從用戶的反饋中改進(jìn)產(chǎn)品的后續(xù)設(shè)計(jì)和提高用戶體驗(yàn),例如,“小米”這樣的新興品牌建立了互聯(lián)網(wǎng)用戶粉絲論壇,讓用戶直接參與到新產(chǎn)品的設(shè)計(jì)過(guò)程之中,充分發(fā)揮用戶豐富的想象力,企業(yè)也能直接了解他們的需求。大眾協(xié)同的另一個(gè)方面就是企業(yè)可以利用用戶完成數(shù)據(jù)的采集,如實(shí)時(shí)車(chē)輛交通數(shù)據(jù)采集商 Inrix。該公司目前有一億個(gè)手機(jī)端用戶,Inrix 的軟件可以幫助用戶避開(kāi)堵車(chē),為用戶呈現(xiàn)路的熱量圖。提供數(shù)據(jù)并不是這個(gè)產(chǎn)品的特色,但值得一提的是,Inrix 并沒(méi)有用的數(shù)據(jù),這個(gè)軟件的每位用戶在使用過(guò)程中會(huì)給服務(wù)器發(fā)送實(shí)時(shí)數(shù)據(jù),如速度和位置,這樣每個(gè)用戶都是探測(cè)器。使用該服務(wù)的用戶越多,Inrix 獲得的數(shù)據(jù)就越多,從而可以提供更好的服務(wù)。

    大模型能給大數(shù)據(jù)開(kāi)發(fā)領(lǐng)域帶來(lái)什么?

    站在巨人的肩膀上,我們看得更遠(yuǎn)。這或許是對(duì)大模型與大數(shù)據(jù)關(guān)系的最佳詮釋。回望過(guò)去的數(shù)據(jù)時(shí)代,我們?nèi)缤硖幒棋闹R(shí)海洋,卻苦于沒(méi)有高效的工具去擷取其中的珍寶。如今,AI大模型的出現(xiàn),宛如一艘先進(jìn)的艦艇,載著我們駛向數(shù)據(jù)價(jià)值的彼岸。它不僅提升了數(shù)據(jù)開(kāi)發(fā)的效率,更賦予了數(shù)據(jù)新的生命力,讓數(shù)據(jù)真正成為驅(qū)動(dòng)未來(lái)發(fā)展的引擎。

    大模型的到來(lái)并非偶然,而是數(shù)據(jù)發(fā)展到一定階段的必然產(chǎn)物。傳統(tǒng)的大數(shù)據(jù)平臺(tái),在面對(duì)海量數(shù)據(jù)時(shí),常常顯得力不從心。京東的案例就是一個(gè)縮影:數(shù)百?gòu)垟?shù)據(jù)表,成千上萬(wàn)的開(kāi)發(fā)任務(wù),復(fù)雜的業(yè)務(wù)邏輯,讓數(shù)據(jù)開(kāi)發(fā)人員疲于奔命;超過(guò)90萬(wàn)個(gè)運(yùn)維實(shí)例,每天上千個(gè)報(bào)錯(cuò)信息,更是讓運(yùn)維人員焦頭爛額;還有那超過(guò)20萬(wàn)個(gè)數(shù)據(jù)集市和數(shù)據(jù)產(chǎn)品,如同迷宮一般,讓使用者望而卻步。這些難題,都迫切需要一種新的解決方案。

    大模型的出現(xiàn),恰逢其時(shí)。它以強(qiáng)大的算力和智能算法為基礎(chǔ),為大數(shù)據(jù)開(kāi)發(fā)領(lǐng)域帶來(lái)了前所未有的變革。它不僅能夠理解自然語(yǔ)言,還能進(jìn)行語(yǔ)義搜索、智能推薦、代碼生成、異常診斷等,極大地提升了數(shù)據(jù)開(kāi)發(fā)的效率和智能化水平。

    ?大模型:數(shù)據(jù)開(kāi)發(fā)的智能助手

    試想一下,如果數(shù)據(jù)開(kāi)發(fā)人員只需用自然語(yǔ)言描述需求,大模型就能自動(dòng)生成代碼、進(jìn)行和優(yōu)化,那將是怎樣一種高效的開(kāi)發(fā)體驗(yàn)?如果運(yùn)維人員能夠通過(guò)大模型實(shí)時(shí)監(jiān)控系統(tǒng),快速定位和解決異常,那將是怎樣一種輕松的運(yùn)維方式?如果用戶能夠用自然語(yǔ)言查詢(xún)數(shù)據(jù),輕松獲取所需信息,那將是怎樣一種便捷的數(shù)據(jù)使用體驗(yàn)?大模型的出現(xiàn),讓這一切都成為了可能。

    ?從開(kāi)發(fā)到應(yīng)用:大模型的全面賦能

    大數(shù)據(jù)能夠帶來(lái)顛覆性?xún)r(jià)值的領(lǐng)域在,大數(shù)據(jù)能夠帶來(lái)顛覆性?xún)r(jià)值的領(lǐng)域在什么

    從阿里云的DataWorks Copilot到京東的智能應(yīng)用助手,從騰訊云的ChatBI到華為的DataArts Insight,國(guó)內(nèi)外各大科技公司都在積極探索大模型在大數(shù)據(jù)領(lǐng)域的應(yīng)用。這些智能助手,就像一位位經(jīng)驗(yàn)豐富的專(zhuān)家,為數(shù)據(jù)開(kāi)發(fā)人員、運(yùn)維人員和用戶提供全方位的支持。它們不僅能夠提高效率,還能降低門(mén)檻,讓更多的人能夠享受到數(shù)據(jù)帶來(lái)的價(jià)值。

    ?未來(lái)展望:大模型與大數(shù)據(jù)的深度融合

    大模型的應(yīng)用也并非一帆風(fēng)順。目前,大模型的應(yīng)用主要集中在數(shù)據(jù)開(kāi)發(fā)和數(shù)據(jù)分析領(lǐng)域,而在數(shù)據(jù)治理、數(shù)據(jù)安全等方面還有很大的發(fā)展空間。大模型的訓(xùn)練成本高昂,也限制了其在中小企業(yè)的應(yīng)用。

    隨著技術(shù)的不斷進(jìn)步,大模型的訓(xùn)練成本將會(huì)逐漸降低,其應(yīng)用場(chǎng)景也將更加廣泛。我們可以預(yù)見(jiàn),大模型與大數(shù)據(jù)的深度融合,將為我們帶來(lái)一個(gè)更加智能、高效、便捷的數(shù)據(jù)時(shí)代。

    大模型的出現(xiàn),為大數(shù)據(jù)領(lǐng)域帶來(lái)了新的希望。它就像一顆冉冉升起的新星,照亮了數(shù)據(jù)價(jià)值的未來(lái)。我們有理由相信,在不久的將來(lái),大模型將成為大數(shù)據(jù)領(lǐng)域不可或缺的一部分,推動(dòng)數(shù)據(jù)時(shí)代的蓬勃發(fā)展。

    您認(rèn)為大模型的出現(xiàn),會(huì)給大數(shù)據(jù)領(lǐng)域帶來(lái)哪些顛覆性的變革?歡迎在評(píng)論區(qū)分享您的觀點(diǎn)。

    熱點(diǎn)圖片

    備案號(hào):贛ICP備2022005379號(hào)
    華網(wǎng)(http://www.cdxdyzl.com) 版權(quán)所有未經(jīng)同意不得復(fù)制或鏡像

    QQ:51985809郵箱:51985809@qq.com

    主站蜘蛛池模板: 西安网站建设,西安网站设计制作,西安短视频拍摄_短视频运营就选动力无限网络推广公司 | 亿企商贸-亿万企业的商务贸易平台-B2B企业产品发布供求信息平台,一带一路中国企业及产品展示平台,免费企业智能自助建站网络营销推广平台,打造B2B企业黄页产品信息发布推广专业综合电子商务平台! | 济南德固机械|膨化食品生产线|早餐谷物玉米片生产线|拉丝蛋白生产线|速食米饭生产线 | 无铅锡膏,无铅锡膏厂家,有铅锡膏厂家,高温锡膏厂家,环保锡丝,贴片红胶-东莞市科舜电子科技有限公司 | 湖南长沙手术室、实验室、无尘室、洁净室、无尘车间的净化工程装修公司-福临建设 | 金诺国际拍卖集团有限公司--金诺国际拍卖集团有限公司 | 全自动圆木多片锯_立式圆木多片锯价格_大型圆木多片锯厂家-邢台友创机械制造有限公司 | 湖南长沙手术室、实验室、无尘室、洁净室、无尘车间的净化工程装修公司-福临建设 | 食品油炸机_葱酥油炸机_蒜酥油炸机-山东世联机械厂家 | 双单面研磨机_陶瓷平面研磨机_机械密封件研磨机-百诚研磨机械 | 英格索兰隔膜泵_ARO气动隔膜泵_英格索兰隔膜泵配件【原厂正品】连续五年无投诉_英格索兰隔膜泵代理-苏州瑞晟茂环保设备有限公司 印刷公司,北京印刷厂,宣传画册手册印刷厂-和智印彩页设计 | 净化塔_喷淋塔_脱硫塔_河北宝飞华创玻璃钢制造有限公司-河北宝飞华创玻璃钢制造有限公司 | 离子交换树脂_阴离子交换树脂_阳离子交换树脂-中国树脂网 | 山东宇帆航空科技有限公司官网| 兰州环氧地坪,兰州防火涂料-甘肃皓天环氧地坪工程 | 饮料瓶-白酒瓶-绿色玻璃瓶-山东玻璃瓶厂家-枣庄市金泰玻璃有限公司 | 消字号牙膏代加工|面膜代加工|凝胶贴牌|漱口水贴牌-南京三盾药业有限公司-消字号牙膏代加工|面膜代加工|凝胶贴牌|漱口水贴牌-南京三盾药业有限公司 | 九江宇凯新材料有限公司| 中证金服投资控股(深圳)有限公司 | 南通出国劳务公司-如东海外经济技术合作有限公司-启东,海门,如皋,海安出国劳务 | 硬度计-布氏硬度计-维氏硬度计-莱洛特试验仪器有限公司 | 青州东威机械有限公司,洗沙机,脱水筛、细沙回收机,淘金设备,洗石机,砂石分离机,筛沙机,采沙船,清淤船,破碎制砂机,海沙淡化设备 | 猪粪烘干机|小型鸡粪烘干机|猪粪烘干机价格|小型鸡粪烘干机价格 - 河南宏科重工干燥机设备生产厂家 | 连续式回转炉_间歇式回转炉_燃气式回转炉_电加热回转炉-长兴博达机械配件有限公司 | 青岛大倾角输送带厂家_橡胶挡边输送带_波纹状挡边输送带_大倾角输送带型号-青岛朗森橡胶有限公司 | 深圳市佳顺优印印刷有限公司,佳顺优印,画册印刷,海报印刷,封套印刷,手提袋印刷,包装盒印刷,彩盒印刷,无碳纸印刷,不干胶印刷,信封印刷,便笺印刷,笔记本印刷,台历印刷,挂历印刷,国际会展中心附近印刷厂,宝安印刷厂,宝安教材印刷厂 | 气体检测仪,多功能气体检测仪,四合一检测仪,氯气检测仪,有机挥发气体检测仪,气体报警器-南京诺邦电子科技有限公司 | 射频导纳物位开关|雷达液位计|安全光栅光幕传感器|音叉料位开关|两级跑偏开关|双向拉绳开关|纵向撕裂保护装置-山东卓信机械有限公司 | 中婴网,推动母婴产业健康·可持续发展,婴童网络专业传媒,母婴网,360孕婴童网,婴童品牌,婴儿用品品牌,婴儿用品加盟店,母婴用品加盟店 | 微型电磁阀_隔膜泵_活塞泵_微型水泵_微型真空泵_微型气泵【东莞市宗旨电子科技有限公司】 | 神魔录官网 - 收藏网址的地方,也是防骗小知识分享的地方 | 湖南净声源环保科技有限公司是一家专业从事噪声治理和建筑声学设计生态环境综合治理服务的企业,专业从事株洲电梯隔音治理,湘潭中央空调降噪处理,衡阳邵阳冷却塔噪音治理,岳阳常德大型风机噪声隔音降噪,张家界空压机噪声治理,益阳配电房变压器噪声治理,专业郴州永州工厂企业车间噪声治理,怀化娄底专业机械设备减振降治理,武汉噪音治理隔音降噪公司,孝感噪音治理,立式球磨机的噪声控制,专业隔音降噪公司,、以及各类机械动力设备减振降噪噪声治理的公司,同时为客户提供咨询与解决方案 | 疲劳试验机|电子万能试验机|摩擦磨损试验机|冲击试验机|济南全力测试技术有限公司 | 全自动清洗过滤器_网式盘式过滤器_石英砂过滤器_叠片过滤器-湖南多灵过滤系统科技有限公司 | 苏州ERP定制|苏州CRM|苏州OA|苏州BPM|进销存管理系统-苏州中尚信息科技有限公司 | 钠长石-硅铁-硅钙-孕育剂-球化剂-安阳李氏实业有限公司 | 吉林人才网_吉林招聘网_求职找工作平台 | 生物安全柜检测,GMP设备确认,仪器性能确认,洁净厂房检测,仓储温湿度检测-上海熙迈 | 水阻柜-液阻柜-高压开关柜-高压固态软启动柜-磁控软启动柜-电解粉-无功补偿柜-配电柜-襄阳源创电气 | 智能档案柜,回转柜,密集架,密集柜厂家-北京及尚智能家具 | 无塔供水设备_无负压供水设备_变频供水设备_净化过滤设备_加油站油罐_S/F双层油罐_开封市东方供水设备有限公司 |