首頁最新資訊

全部 常見問題 新聞動態(tài) 技術文章 技術問答

    • 如何利用Spark過濾品類的行為類型?

      使用filter()算子過濾aggregationRDD每一行數據中行為類型為加入購物車和購買的數據,只保留行為類型為查看的數據,然后使用mapToPair()算子對過濾結果進行轉換,獲取每一行數據中品類被查看次數和品類ID數據,最終將轉換結果加載到getViewCategoryRDD.具體代碼如下。查看全文>>

      技術文章2023-07-12 |黑馬程序員 |Spark過濾品類行為類型
    • Spark3.0的新特性有哪些?【大數據開發(fā)】

      對比2.4版本, 3.0在TPC-DS基準測試中,性能超過2.4版本, 達到了2倍的提升。關于Spark 3.0,有以下的新特性:查看全文>>

      技術文章2023-07-11 |黑馬程序員 |Spark 3.0新特性,大數據Spark技術
    • FineBI是什么?怎樣為FineBI配置數據源?

      FineBI 是帆軟軟件有限公司推出的一款商業(yè)智能(Business Intelligence)產品。FineBI 是定位于自助大數據分析的 BI 工具,能夠幫助企業(yè)的業(yè)務人員和數據分析師,開展以問題導向的探索式分析。查看全文>>

      技術文章2023-07-04 |黑馬程序員 |FineBI,FineBI配置數據源
    • 鍵值對存儲數據庫的應用場景有哪些?

      鍵值對存儲數據庫是NoSQL數據庫中的一種類型,也是最簡單的NoSQL數據庫。鍵值對存儲數據庫中的數據是以鍵值對的形式來存儲的。鍵值對存儲數據庫的結構示意圖,如圖所示。查看全文>>

      技術文章2023-06-30 |黑馬程序員 |NoSQL,鍵值對
    • 什么是代理池?Python爬蟲代理池的設計

      代理池就是有代理IP組成的池子, 它可以提供多個穩(wěn)定可用的代理IP。Python實現代理池是為了從一堆不穩(wěn)定代理IP中,抽取高可用代理IP, 給爬蟲使用。代理池實現思路是先實現不依賴其他模塊的基礎模塊, 然后再實現具體功能模塊。查看全文>>

      技術文章2023-06-23 |黑馬程序員 |代理池,Python爬蟲
    • SortShuffleManager的bypass機制觸發(fā)條件是什么?

      SortShuffleManager的運行機制主要分成兩種,一種是普通運行機制,另一種是bypass運行機制。當shuffle write。查看全文>>

      技術文章2023-06-23 |黑馬程序員 |Spark Shuffle的運行機制,bypass運行機制
和我們在線交談!