Re: [請益] rds replication & cache 多問

看板Soft_Job作者life1347 (黑人)時間7年前 (2018/08/03 14:38)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串2/4 (看更多)

就問題一的部分從文章中的描述看起來是需要 strong data consistency 面對這種狀況有種可行的做法是採用 distributed lock (可參考 https://redis.io/topics/distlock) 但負面效益是會降低 throughput 流程大概是 1. user1 搶 write lock (放把 key 在 cache 內做 distributed write lock，表明該值正在異動) 2. user1 清除 cache & 更新 db 3. user2 發現 write lock 存在，用 watch 或 polling 方式等待該 lock 消失 (設定 timeout)，若消失就 r/w cache & db 4. user1 步驟 2 成功: db, cache 更新後，撤銷 write lock 失敗: 撤銷 write lock 或 retry 由於無法假定步驟 4 一定會成功，因此要看錯誤狀況來決定處理方式目前想到兩種可能作法 1. 撤銷 write lock，讓 user2 拿到舊資料。user1 返回錯誤看 application 怎麼處理。這種狀況以搶票例子來說，就是 user2 買到票而 user1 哭哭 2. 持續 retry 但設定 timeout，至少其他使用者不必持續等待 3. 若非 db 或 schema 異常，retry 直到成功為止。但通常這種做法蠻糟糕的，會讓多數使用者一直等待導致不耐這邊要看 business 選哪種做法對公司影響較小，沒有絕對優劣但通常在微服務架構(分散式系統)通常會採用 2 以上是個人經驗，相信版上有其他更資深的大大有更好的觀點可以討論 ※ 引述《sean72 (.)》之銘言： : 問題一 : 如果使用memcache : 寫db的時候 : 1. 先invalidate cache 再寫db : 2. 先寫db 再invaludate cache : 3. update cache 然後 update db : 4. update db 然後 update cache : 我以為這個動作有標準做法，但是問了在亞馬和snapchat的朋友 : 也看了幾個tech talk 竟然答案不同，請問大家怎麼分析? : 我上了一個網路課程的課，他說2是最佳解 : case3 & 4 如果某一個update fail都會造成cache裡面髒數據的情況 : case1: : user1 invalidate cache, while updating db(未完成) : user2 此時讀資料，cache miss，去讀資料庫，得到舊數據， : 並用舊數據update cache : user1 完成db更新 : 此時cache存著舊數據，db新數據，cache髒數據 : case2: : user1 update db (未完成) : user2 此時讀資料，在cache讀了舊資料，離開 : user1 finish db and update cache : 以後的user都可以讀到最新數據，只有user2讀了舊數據，但僅只一次，無傷大雅 : 問題二 : 還有一個問題，關於db consistency : 如果用relational db, such as MySQL , Master Slave : write to master, : read from slave : 寫到master之後(假設user update一個url link)，並且invalid cache : 這時候replication還沒完成，假設有5秒的延遲 : 這個時候如果來了一個read，cache miss : 按照邏輯，這時候應該slave read , 但這時候slave data是舊的 : 那我的client要怎麼處理? : reddit founder 他說當初他們碰到這情況 : 很多slave裡面的link都是404 very bad user experience : 所以他寫db的時候，同時寫到cache : https://youtu.be/cDL7ny_hvio?t=50s

: 但如果同時寫DB & cache 如果其中一個操作失敗了，那就造成髒數據了，不是嗎? : 又如果 : 我採用問題一的方式先寫db 然後invalidate cache, : write to master db , 5 sec replication time : 這時候一個read進來, cache miss, read from slave取得舊數據 : 順便update cache : 五秒後slave完成replica，但這時候也造成了數據不一致。 : replication latency的問題該怎麼解決呢? : 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.224.42.232 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1533278318.A.B95.html ※ 編輯: life1347 (223.141.46.163), 08/04/2018 04:00:49

‣ 返回看板[ Soft_Job ] 工作

‣ 更多 life1347 的文章

文章代碼(AID): #1RO_XkkL (Soft_Job)