科技改變生活 · 科技引領未來
目前在人工智能領域有種提法,認為“機器學習”是人工智能領域最能體現(xiàn)“智能”的專業(yè)分支。從發(fā)展歷史上看,機器學習也是人工智能發(fā)展最快的分支,近年來人工智能技術的突破大都源自于此。機器學習致力于研究如何通過計算的手段,利用既有經(jīng)驗改善系統(tǒng)自身的性能。在計算機系統(tǒng)中,“經(jīng)驗”經(jīng)常以“數(shù)據(jù)”的形式存在。因此,機器學習研究的主要內(nèi)容,就是關于在計算機上從數(shù)據(jù)產(chǎn)生“模型”的算法,即“學習算法”。我們只要把經(jīng)驗數(shù)據(jù)提供給學習算法,就能基于這些數(shù)據(jù)產(chǎn)生一系列的模型,以指導如何面對新情況時提供準確的判斷。
從早期的“符號機器學習”到如今一統(tǒng)天下的“統(tǒng)計機器學習”,機器學習逐漸完成了從偏重理論模型研究到實際應用研究為主的轉(zhuǎn)變。其根本原因是由于計算能力的大幅提高,使得通過統(tǒng)計學和大數(shù)據(jù)研究得到的成果顯著,并常常遠超人類通過其他現(xiàn)有技術積累可以達到的水平。未來的人工智能基礎理論創(chuàng)新,很可能來自于更加基本的認知科學研究。從人類應用的角度出發(fā),有必要把統(tǒng)計技術和對科學背景的深刻理解結(jié)合起來。
上述觀點的一個論據(jù)支撐是統(tǒng)計機器學習算法的前提是假設樣本數(shù)據(jù)“獨立同分布”。被認為代表機器學習未來的“遷移學習”,研究如何把一個預訓練的模型用在相關的其他任務中,更是要求與遷移關聯(lián)的雙方的數(shù)據(jù)具備獨立同分布的條件,這在很多科學和工程領域(尤其是力學領域)看起來是苛刻和不盡合理的。如何對數(shù)據(jù)的有效性進行驗證,或是研究出能夠用于“非獨立”或“不同分布”的學習算法,是應用背景學科(如力學)專業(yè)人士應該深入探索的命題。
近年來機器學習里面最火熱的分支是“深度學習”,由于硬件性能的大幅提升,深度學習采用了復雜度更高的算法,得到了精細程度和質(zhì)量更佳的結(jié)果,但同時也加重了對數(shù)據(jù)量、數(shù)據(jù)源的準確性以及運算資源的依賴,而這種依賴性嚴重限制了機器學習應用的場景和潛力。如何用更少的計算資源和數(shù)據(jù)樣本,解決更多工程和科學中的待解謎題?這也是大家所關心和期待的人工智能基礎理論創(chuàng)新的核心命題。
馬同
版權(quán)所有 未經(jīng)許可不得轉(zhuǎn)載
增值電信業(yè)務經(jīng)營許可證備案號:遼ICP備14006349號
網(wǎng)站介紹 商務合作 免責聲明 - html - txt - xml