【導(dǎo)讀】激勵(lì)-響應(yīng)進(jìn)行了學(xué)習(xí)。矢量X映射到p維矢量Y。若輸入系統(tǒng)就會(huì)得到響應(yīng),出一個(gè)連續(xù)的函數(shù)。在神經(jīng)網(wǎng)絡(luò)中表現(xiàn)。的改變只是網(wǎng)絡(luò)的演化。時(shí)間后,我們就說(shuō)系統(tǒng)學(xué)會(huì)了。的解釋學(xué)習(xí)是半永久的變化。例如,如果我們通。分,并且可以持續(xù)這種“會(huì)“的狀態(tài)一段時(shí)間。進(jìn)行學(xué)習(xí),而可能的樣本數(shù)量使無(wú)窮的。從而形成樣本模式的內(nèi)部表達(dá)或模型。子化區(qū)域決策組。夠大的模式空間中定義了個(gè)突觸點(diǎn)。某些數(shù)字性能規(guī)則最優(yōu)。更一般的,量子化矢。未知,只有通過(guò)學(xué)習(xí)來(lái)更精確的估計(jì)。是利用最少限度的信息。處理模式樣本,其計(jì)算復(fù)雜度小,速度快,適用于高速環(huán)境。均方性能的測(cè)度梯度。監(jiān)督器利用分組隸屬度。息來(lái)處理未標(biāo)志的原始數(shù)據(jù)。質(zhì)和神經(jīng)信號(hào)性質(zhì)的信息。而也使得突觸只能獲得局部非常有限的信息。部化限定的共軛或相關(guān)學(xué)習(xí)定律。學(xué)習(xí)定律中只包含神經(jīng)元、突觸和噪聲三項(xiàng)。的性質(zhì)分別加以簡(jiǎn)單介紹。競(jìng)爭(zhēng)可以歸結(jié)為最近鄰模式匹配的問(wèn)題。是一個(gè)度量指示器函數(shù)。