Re: [請益] rds replication & cache 多問

看板Soft_Job作者 (黑人)時間7年前 (2018/08/03 14:38), 7年前編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/4 (看更多)
就問題一的部分 從文章中的描述看起來是需要 strong data consistency 面對這種狀況有種可行的做法是採用 distributed lock (可參考 https://redis.io/topics/distlock) 但負面效益是會降低 throughput 流程大概是 1. user1 搶 write lock (放把 key 在 cache 內做 distributed write lock,表明該值正在異動) 2. user1 清除 cache & 更新 db 3. user2 發現 write lock 存在,用 watch 或 polling 方式 等待該 lock 消失 (設定 timeout),若消失就 r/w cache & db 4. user1 步驟 2 成功: db, cache 更新後,撤銷 write lock 失敗: 撤銷 write lock 或 retry 由於無法假定步驟 4 一定會成功,因此要看錯誤狀況來決定處理方式 目前想到兩種可能作法 1. 撤銷 write lock,讓 user2 拿到舊資料。user1 返回錯誤看 application 怎麼處理。這種狀況以搶票例子來說,就是 user2 買到票而 user1 哭哭 2. 持續 retry 但設定 timeout,至少其他使用者不必持續等待 3. 若非 db 或 schema 異常,retry 直到成功為止。 但通常這種做法蠻糟糕的,會讓多數使用者一直等待導致不耐 這邊要看 business 選哪種做法對公司影響較小,沒有絕對優劣 但通常在微服務架構(分散式系統)通常會採用 2 以上是個人經驗,相信版上有其他更資深的大大有更好的觀點可以討論 ※ 引述《sean72 (.)》之銘言: : 問題一 : 如果使用memcache : 寫db的時候 : 1. 先invalidate cache 再寫db : 2. 先寫db 再invaludate cache : 3. update cache 然後 update db : 4. update db 然後 update cache : 我以為這個動作有標準做法,但是問了在亞馬和snapchat的朋友 : 也看了幾個tech talk 竟然答案不同,請問大家怎麼分析? : 我上了一個網路課程的課,他說2是最佳解 : case3 & 4 如果某一個update fail都會造成cache裡面髒數據的情況 : case1: : user1 invalidate cache, while updating db(未完成) : user2 此時讀資料,cache miss,去讀資料庫,得到舊數據, : 並用舊數據update cache : user1 完成db更新 : 此時cache存著舊數據,db新數據,cache髒數據 : case2: : user1 update db (未完成) : user2 此時讀資料,在cache讀了舊資料,離開 : user1 finish db and update cache : 以後的user都可以讀到最新數據,只有user2讀了舊數據,但僅只一次,無傷大雅 : 問題二 : 還有一個問題,關於db consistency : 如果用relational db, such as MySQL , Master Slave : write to master, : read from slave : 寫到master之後(假設user update一個url link),並且invalid cache : 這時候replication還沒完成,假設有5秒的延遲 : 這個時候如果來了一個read,cache miss : 按照邏輯,這時候應該slave read , 但這時候slave data是舊的 : 那我的client要怎麼處理? : reddit founder 他說當初他們碰到這情況 : 很多slave裡面的link都是404 very bad user experience : 所以他寫db的時候,同時寫到cache : https://youtu.be/cDL7ny_hvio?t=50s
: 但如果同時寫DB & cache 如果其中一個操作失敗了,那就造成髒數據了,不是嗎? : 又如果 : 我採用問題一的方式 先寫db 然後invalidate cache, : write to master db , 5 sec replication time : 這時候一個read進來, cache miss, read from slave取得舊數據 : 順便update cache : 五秒後slave完成replica,但這時候也造成了數據不一致。 : replication latency的問題該怎麼解決呢? : 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.224.42.232 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1533278318.A.B95.html ※ 編輯: life1347 (223.141.46.163), 08/04/2018 04:00:49
文章代碼(AID): #1RO_XkkL (Soft_Job)
討論串 (同標題文章)
文章代碼(AID): #1RO_XkkL (Soft_Job)