有人認為將人工智能與大數(shù)據(jù)結(jié)合在一起是一個很自然的錯誤,部分原因是兩者實際上是一致的。但它們是完成相同任務(wù)的不同工具。首先要做的事是先弄清二者的定義。
人工智能與大數(shù)據(jù)一個主要的區(qū)別是大數(shù)據(jù)是需要在數(shù)據(jù)變得有用之前進行清理、結(jié)構(gòu)化和集成的原始輸入,而人工智能則是輸出,即處理數(shù)據(jù)產(chǎn)生的智能。這使得兩者有著本質(zhì)上的不同。
人工智能是一種計算形式,它允許機器執(zhí)行認知功能,例如對輸入起作用或作出反應(yīng),類似于人類的做法。傳統(tǒng)的計算應(yīng)用程序也會對數(shù)據(jù)做出反應(yīng),但反應(yīng)和響應(yīng)都必須采用人工編碼。如果出現(xiàn)任何類型的差錯,就像意外的結(jié)果一樣,應(yīng)用程序無法做出反應(yīng)。而人工智能系統(tǒng)不斷改變它們的行為,以適應(yīng)調(diào)查結(jié)果的變化并修改它們的反應(yīng)。
支持人工智能的機器旨在分析和解釋數(shù)據(jù),然后根據(jù)這些解釋解決問題。通過機器學習,計算機會學習一次如何對某個結(jié)果采取行動或做出反應(yīng),并在未來知道采取相同的行動。
大數(shù)據(jù)是一種傳統(tǒng)計算。它不會根據(jù)結(jié)果采取行動,而只是尋找結(jié)果。它定義了非常大的數(shù)據(jù)集,但也可以是極其多樣的數(shù)據(jù)。在大數(shù)據(jù)集中,可以存在結(jié)構(gòu)化數(shù)據(jù),如關(guān)系數(shù)據(jù)庫中的事務(wù)數(shù)據(jù),以及結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),例如圖像、電子郵件數(shù)據(jù)、傳感器數(shù)據(jù)等。
它們在使用上也有差異。大數(shù)據(jù)主要是為了獲得洞察力,例如Netflix網(wǎng)站可以根據(jù)人們觀看的內(nèi)容了解電影或電視節(jié)目,并向觀眾推薦哪些內(nèi)容。因為它考慮了客戶的習慣以及他們喜歡的內(nèi)容,推斷出客戶可能會有同樣的感覺。
人工智能是關(guān)于決策和學習做出更好的決定。無論是自我調(diào)整軟件、自動駕駛汽車還是檢查醫(yī)學樣本,人工智能都會在人類之前完成相同的任務(wù),但速度更快,錯誤更少。
雖然它們有很大的區(qū)別,但人工智能和大數(shù)據(jù)仍然能夠很好地協(xié)同工作。這是因為人工智能需要數(shù)據(jù)來建立其智能,特別是機器學習。例如,機器學習圖像識別應(yīng)用程序可以查看數(shù)以萬計的飛機圖像,以了解飛機的構(gòu)成,以便將來能夠識別出它們。
人工智能實現(xiàn)最大的飛躍是大規(guī)模并行處理器的出現(xiàn),特別是GPU,它是具有數(shù)千個內(nèi)核的大規(guī)模并行處理單元,而不是CPU中的幾十個并行處理單元。這大大加快了現(xiàn)有的人工智能算法的速度,現(xiàn)在已經(jīng)使它們可行。
大數(shù)據(jù)可以采用這些處理器,機器學習算法可以學習如何重現(xiàn)某種行為,包括收集數(shù)據(jù)以加速機器。人工智能不會像人類那樣推斷出結(jié)論。它通過試驗和錯誤學習,這需要大量的數(shù)據(jù)來教授和培訓人工智能。
人工智能應(yīng)用的數(shù)據(jù)越多,其獲得的結(jié)果就越準確。在過去,人工智能由于處理器速度慢、數(shù)據(jù)量小而不能很好地工作。也沒有像當今先進的傳感器,并且當時互聯(lián)網(wǎng)還沒有廣泛使用,所以很難提供實時數(shù)據(jù)。人們擁有所需要的一切:快速的處理器、輸入設(shè)備、網(wǎng)絡(luò)和大量的數(shù)據(jù)集。毫無疑問,沒有大數(shù)據(jù)就沒有人工智能。