包自由
各種分析功能圖。
- 字母
- 通過繼承
- 自由
- AnyRef
- 任何
- 隱藏所有
- 顯示所有
- 公共
- 所有
值的成員
- 對象ConnectedComponents
連接組件的算法。
- 對象LabelPropagation
標簽傳播算法。
- 對象網頁排名擴展日誌記錄
網頁排名算法的實現。
網頁排名算法的實現。有兩種實現的網頁級別執行。
第一個實現使用獨立的
圖
界麵和運行網頁級別為固定數量的迭代:var公關=數組.fill (n) (1.0)瓦爾oldPR =數組.fill (n) (1.0)為(iter< -0直到numIter){交換(oldPR PR)為(我< -0直到n){公關[我]=α+ (1-α)* inNbrs[我]. map (j= >oldPR [j] / outDeg [j])。總和}}
第二個實現使用
Pregel
界麵和運行PageRank直到收斂。var公關=數組.fill (n) (1.0)瓦爾oldPR =數組.fill (n) (0.0)而(max (abs (PR - oldPr)) > tol){交換(oldPr,公關)為(我< -0直到n如果abs(公關[我]- oldPR[我])> tol){公關[我]=α+ (1- \α)* inNbrs[我]. map (j= >oldPR [j] / outDeg [j])。總和}}
α
概率是隨機重置(通常為0.15),inNbrs[我]
是鄰居的設置哪個鏈接我
和outDeg [j]
頂點的度j
。- 請注意
-
這不是“規範化”PageRank和結果頁麵沒有inlinks PageRankα。
- 對象SVDPlusPlus
聖言會+ +算法的實現。
- 對象ShortestPaths擴展可序列化的
計算最短路徑組給定的具有裏程碑意義的頂點,返回一個圖中每個頂點屬性包含最短路徑距離映射到每一個可到達的地標。
- 對象StronglyConnectedComponents
強連通分量算法實現。
- 對象TriangleCount
計算通過每個頂點的三角形數量。
計算通過每個頂點的三角形數量。
該算法相對簡單,可以計算三個步驟:
- 計算每個頂點的的鄰居
- 對於每個邊緣計算的交點集和發送這兩個頂點的計算。
- 計算每個頂點和總和除以兩個因為每個三角形都是計算兩次。
有兩種實現。默認的
TriangleCount.run
實現第一個刪除自我循環和規範化圖確保持有下列條件:- 沒有自我的邊緣
- 麵向所有的邊緣(src大於dst)
- 沒有重複的邊緣
然而,規範化過程是昂貴的,因為它需要重新分區圖。如果輸入數據已經在“範式”和自我循環然後刪除
TriangleCount.runPreCanonicalized
應該使用。瓦爾canonicalGraph = graph.mapEdges (e= >1.canonicalizeEdges) .removeSelfEdges () ()瓦爾數量= TriangleCount.runPreCanonicalized .vertices (canonicalGraph)