【導讀】激勵-響應進行了學習。矢量X映射到p維矢量Y。若輸入系統(tǒng)就會得到響應,出一個連續(xù)的函數。在神經網絡中表現(xiàn)。的改變只是網絡的演化。時間后,我們就說系統(tǒng)學會了。的解釋學習是半永久的變化。例如,如果我們通。分,并且可以持續(xù)這種“會“的狀態(tài)一段時間。進行學習,而可能的樣本數量使無窮的。從而形成樣本模式的內部表達或模型。子化區(qū)域決策組。夠大的模式空間中定義了個突觸點。某些數字性能規(guī)則最優(yōu)。更一般的,量子化矢。未知,只有通過學習來更精確的估計。是利用最少限度的信息。處理模式樣本,其計算復雜度小,速度快,適用于高速環(huán)境。均方性能的測度梯度。監(jiān)督器利用分組隸屬度。息來處理未標志的原始數據。質和神經信號性質的信息。而也使得突觸只能獲得局部非常有限的信息。部化限定的共軛或相關學習定律。學習定律中只包含神經元、突觸和噪聲三項。的性質分別加以簡單介紹。競爭可以歸結為最近鄰模式匹配的問題。是一個度量指示器函數。