電商站內搜尋筆記,以 elasticsearch 實踐

今年因為營運的目標,對搜尋的準確度要求越來越高,實際上要面對的商品數指數增加,所以在越來越多雜訊的情況下,搜尋的挑戰就變得更大了,一路下來認知到搜尋能努力的方向越來越多,所以就想寫一篇文來紀錄一下做了哪些改進,大致上能努力的方向就是中文斷詞、自訂排序、tag、Learning2rank..

Continue reading…

MongoDB 透過 lookup pipeline 實踐 Left Join

很久以前寫過一篇基本的 mongodb group 語法的基本介紹,在這些年間也持續跟 mongodb 持續纏鬥無法自拔…,對他又愛又恨,雖然超想拔掉他,但是從用途/功能性上卻無法找到他的取代品。

如今已經面臨要開始用他來 JOIN 了,感覺這毒是越吸越重了..XD 讓我們繼續看下去..

我們今天試著從 3.2 開始 aggregate 新支援的語法 $lookup 搭配 3.6 開始的 lookup pipeline 來解決我們需要 LEFT JOIN 的問題。

Continue reading…

Data Pipeline 從零開始建置

如同前文所述,我在電商產業工作,近年來隨著公司的發展,開始將研發的重點強調在數據與 AI 的應用上,因此資料的蒐集儲存的彈性就需要不段的擴增,來滿足斷續分析與應用的需求。

近一年的工作有一半是在做資料的處理/整合,記錄一下工作上 data pipeline 的需求與演進,概念上就是如何從基本的 rds 進化成可以擴展到適合大數據分析的資料庫架構。

Continue reading…

電商的營收關鍵

在電商工作一段時間了,最近的工作內容的一部分包含了系統流程的調效,其實就是在探尋銷售的過程中,有什麼做得對或錯,在這些工作細節的中,會不斷的在遇到一個問題,究竟是什麼關鍵因素影響了營收?

只要找到這些關鍵,就能循著這些軌跡,找到辦法讓營收大幅增長。

Continue reading…