泛化能力
在計算機系統中,“經(jīng)驗”通常以數據的形式存在,因此機器學(xué)習所研究的主要內容是通過(guò)這些數據產(chǎn)生“模型”(model)。從數據產(chǎn)生模型的過(guò)程我們稱(chēng)之為“訓練”(training),訓練過(guò)程中使用的數據稱(chēng)為“訓練數據”。我們訓練得到模型后需要對模型進(jìn)行評估。我們通常把分類(lèi)錯誤的樣本數占總數的比例稱(chēng)為“錯誤率”(error rate)。更一般的,我們把模型實(shí)際預測的輸出與真實(shí)的輸出之間的差異稱(chēng)之為“誤差”(error)。機器學(xué)習的目標是使得訓練出的模型很好的適用于未見(jiàn)樣本。訓練出的模型適用于新樣本的能力,稱(chēng)為“泛化能力”(generalization ability)。具有較強泛化能力的模型不僅在訓練數據上有好的表現,還能夠很好的適用于整個(gè)樣本空間。通常我們假設所有的樣本都服從一個(gè)未知的分布,我們的訓練數據中每個(gè)樣本都是從這個(gè)分布上獨立的采集的,即“獨立同分布”(independent and identically distributed)。一般來(lái)說(shuō),訓練數據越多,我們可以得到的關(guān)于這個(gè)分布的信息越多,也就越有可能通過(guò)訓練得到具有較強泛化能力的模型。
免責聲明:本站詞條系由網(wǎng)友創(chuàng )建、編輯和維護,內容僅供參考。
以上內容均為商業(yè)內容展示,僅供參考,不具備專(zhuān)業(yè)問(wèn)題解決服務(wù),
如果您需要解決具體問(wèn)題(尤其在法律、醫學(xué)等領(lǐng)域),建議您咨詢(xún)相關(guān)領(lǐng)域的專(zhuān)業(yè)人士。
如您發(fā)現詞條內容涉嫌侵權,請通過(guò) 948026894@qq.com 與我們聯(lián)系進(jìn)行刪除處理!