共計 333 個字符,預(yù)計需要花費 1 分鐘才能閱讀完成。
這篇文章將為大家詳細(xì)講解有關(guān)如何進(jìn)行 Spark API 編程中 join 操作深入實戰(zhàn),文章內(nèi)容質(zhì)量較高,因此丸趣 TV 小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關(guān)知識有一定的了解。
我們在 hdfs 的 /data/join 創(chuàng)建兩個文件:
上傳第一個文件名稱為 1.txt
內(nèi)容第一列是日期,第二列 uid(普通用戶 id)
執(zhí)行上傳到 hdfs:
web 控制臺管理查詢:
然后聲明兩個 case class:Register、Login
take 操作:
take 操作:
取出 join 操作的結(jié)果:
或者把執(zhí)行結(jié)果保存到 HDFS:
關(guān)于如何進(jìn)行 Spark API 編程中 join 操作深入實戰(zhàn)就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
正文完