首頁人工智能技術資訊正文

什么是SOM?SOM聚類的應用

更新時間:2022-07-15 來源:黑馬程序員 瀏覽量:

SOM 即自組織映射,是一種用于特征檢測的無監(jiān)督學習神經(jīng)網(wǎng)絡。它模擬人腦中處于不同區(qū)域的神經(jīng)細胞 分工不同的特點,即不同區(qū)域具有不同的響應特征,而且這一過程是自動完成的。SOM 用于生成訓練樣本的低維 空間,可以將高維數(shù)據(jù)間復雜的非線性統(tǒng)計關系轉化為簡單的幾何關系,且以低維的方式展現(xiàn),因此通常在降維問題中會使用它。

SOM聚類

SOM 的訓練過程:

紫色區(qū)域表示訓練數(shù)據(jù)的分布狀況,白色網(wǎng)格表示從該分布中提取的當前訓練數(shù)據(jù)。

(1) SOM 節(jié)點位于數(shù)據(jù)空間的任意位置,最接近訓練數(shù)據(jù)的節(jié)點(黃色高亮部分)會被選中。它和網(wǎng)格中的鄰近節(jié)點一樣,朝訓練數(shù)據(jù)移動。

(2)在多次迭代之后,網(wǎng)格傾向于近似該種數(shù)據(jù)分布(下圖最右)。

所有的神經(jīng)元組織成一個網(wǎng)格,網(wǎng)格可以是六邊形、四邊形……,甚至是鏈狀、圓圈……

網(wǎng)絡的結構通常取決于輸入的數(shù)據(jù)在空間中的分布。 SOM的作用是將這個網(wǎng)格鋪滿數(shù)據(jù)存在的空間

網(wǎng)絡結構

每個神經(jīng)元由正方形表示,正方形內的粉紅色區(qū)域表示神經(jīng)元最接近的數(shù)據(jù)點的相對數(shù)量 - 粉紅色區(qū)域越大,該神經(jīng)元表示的數(shù)據(jù)點越多。

當我們將訓練數(shù)據(jù)輸入到網(wǎng)絡中時,會計算出所有權重向量的歐幾里德距離。權重向量與輸入最相似的神經(jīng)元 稱為最佳匹配單元(BMU)。BMU 的權重和 SOM 網(wǎng)格中靠近它的神經(jīng)元會朝著輸入矢量的方向調整。一旦確定 了 BMU,下一步就是計算其它哪些節(jié)點在 BMU 的鄰域內。

som網(wǎng)格

(1)將網(wǎng)格的神經(jīng)元隨機定位在數(shù)據(jù)空間中。

(2)選擇一個數(shù)據(jù)點,按順序隨機或系統(tǒng)地循環(huán)遍歷數(shù)據(jù)集。

(3)找到最接近所選數(shù)據(jù)點的神經(jīng)元。這種神經(jīng)元被稱為最佳匹配單元(BMU)。

(4)將BMU移近該數(shù)據(jù)點。 BMU移動的距離由學習速率確定,學習速率在每次迭代后減小。

(5)將BMU的鄰居移動到更靠近該數(shù)據(jù)點的位置,遠處的鄰居移動得更少。使用BMU周圍的半徑來識別鄰居,并且在每次迭代之后該半徑的值減小。

(6)在重復步驟1到4之前,更新學習速率和BMU半徑。迭代這些步驟,直到神經(jīng)元的位置穩(wěn)定。

SOM 通常用在可視化中。比如右圖,世界各國貧困數(shù)據(jù)的可視化。生活質量較高的國家聚集在左上方,而貧 困最嚴重的國家聚集在右下方。

SOM 的其它一些應用還包括:

數(shù)據(jù)壓縮

語音識別

分離音源

欺詐檢測





猜你喜歡:

怎樣計算一個算法的復雜度?

fast算法原理和實現(xiàn)方法【Open CV教程】

OpenCV圖像處理:基礎模塊和高層次模塊

黑馬程序員人工智能開發(fā)培訓

分享到:
在線咨詢 我要報名
和我們在線交談!