[討論] 手機跑小型ChatGPT ~ LLaMA大型語言模型

看板MobileComm作者ivon852 (內容農場殺手)時間2年前 (2023/04/07 12:57)推噓17(17推 0噓 6→)

留言23則, 16人參與討論串1/1

祖克伯的Meta公司今年2月公開的「LLaMA」是體積比較小的大型語言模型(LLM)。 LLaMA依照訓練參數數量分為7B、13B、30B、65B。訓練數量雖比不上OpenAI的ChatGPT，但是硬體需求大大降低，是個人電腦甚至旗艦手機都跑得動的程度。根據他們paper的說法，LLaMA 13B的模型性能比GPT-3模型要好，可以作到基本對答。一些LLaMA可以達成的任務這邊的截圖是來自Dalai LLaMA，它只是一個LLaMA的網頁前端。目前LLaMA只支援英文，未來應該會有中文模型。 1. 幫我把這句話翻譯成中文：Taiwan is a country. https://i.imgur.com/G4o7TYs.png

2. 解釋Skinner行為主義心理學理論的優缺點，並舉出五個例子 https://i.imgur.com/MtYgomt.png

3. 寫個Python程式，尋找一個字串中出現最多次的字元 https://i.imgur.com/3OKMDun.png

4. 幫我想五個新文章標題候選：使用Linux當主力系統的好處 https://i.imgur.com/jjx5prE.png

5. 段落抓重點：請抓出以下有關普遍文法 (Universal Grammar) 段落的重點，並用十句話解釋何為普遍文法。 https://i.imgur.com/6DccCwW.png

在Android手機跑LLaMA 除了LLaMA以外，還有Alpaca模型，這是史丹佛大學微調後的版本。同樣的資源耗用較小，且有人製作了純CPU運算的版本llama.cpp，不用依賴顯示卡。因此除了在個人電腦跑，也可以跑在Android手機上。最小的LLaMA 7B至少需要4GB RAM，保險起見手機最好有8GB RAM才不會跑到一半手機自動重開。簡單的辦法就是裝Termux，解開signal9的錯誤然後設定Proot Debian，把模型下載下來，alpaca.cpp編譯一下就可以開始聊天了。 https://i.imgur.com/M24wDqr.png

詳細安裝方法：https://reurl.cc/OVDRVg 手機RAM低於8GB的也不用灰心，你可以root後，設定chroot Ubuntu，掛載SWAP強行增大虛擬記憶體。手機與電腦速度比較問一個10個字的問句純CPU運算下，LLaMA在Intel Core i5-7400的CPU約10秒就會開始作答，寫完回答約1分鐘。高通s845處理器要等30秒才會開始回答，並且寫完整個回答2分鐘。如果使用GPU加速，速度應該會快許多，要用GPU加速可嘗試Text Generation WebUI。 LLaMA的回答品質不可能像ChatGPT那麼神，胡言亂語機率更高但好處是沒有任何道德限制～想聊什麼就聊什麼～隨著這類模型的開源，大型語言模型可能會走向Stable Diffusion那樣的發展路徑。 (雖說LLaMA一開始是提前外洩才為人所知的) -- 想辦法在開源系統跑閉源遊戲 https://i.imgur.com/FUrYLxA.png

Arch是真愛 https://i.imgur.com/0ja0Tx8.png

論使用Gentoo的好處 https://i.imgur.com/QjvfLfR.png

是言論自由，不是免費啤酒 https://i.imgur.com/sNmNm9x.png

流量密碼 https://i.imgur.com/rXERMcM.png

刪除user? 我不記得有這功能 https://i.imgur.com/xcml0xN.png

-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.27.87.182 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/MobileComm/M.1680843424.A.E35.html

推

04/07 13:19,

04/07 13:19

→

04/07 13:19,

04/07 13:19

我覺得未來還是值得試試模型小型化...如果SoC都夠強的話啦

推

04/07 13:24,

04/07 13:24

推

04/07 13:42,

04/07 13:42

→

04/07 13:42,

04/07 13:42

推

04/07 13:42,

04/07 13:42

→

04/07 13:42,

04/07 13:42

隨著這類模型的開源，大型語言模型可能會走向Stable Diffusion那樣的發展路徑。 (雖說LLaMA一開始是提前外洩才為人所知的) -- 想辦法在開源系統跑閉源遊戲 https://i.imgur.com/FUrYLxA.png

Arch是真愛 https://i.imgur.com/0ja0Tx8.png

論使用Gentoo的好處 https://i.imgur.com/QjvfLfR.png

是言論自由，不是免費啤酒 https://i.imgur.com/sNmNm9x.png

流量密碼 https://i.imgur.com/rXERMcM.png

刪除user? 我不記得有這功能 https://i.imgur.com/xcml0xN.png

-- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.27.87.182 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/MobileComm/M.1680843424.A.E35.html

推

04/07 13:19, 2年前 , 1^F

04/07 13:19, 1^F

→

04/07 13:19, 2年前 , 2^F

04/07 13:19, 2^F

我覺得未來還是值得試試模型小型化...如果SoC都夠強的話啦

推

04/07 13:24, 2年前 , 3^F

04/07 13:24, 3^F

推

04/07 13:42, 2年前 , 4^F

04/07 13:42, 4^F

→

04/07 13:42, 2年前 , 5^F

04/07 13:42, 5^F

推

04/07 13:42, 2年前 , 6^F

04/07 13:42, 6^F

→

04/07 13:42, 2年前 , 7^F

04/07 13:42, 7^F

Google的先見之明(咦

推

04/07 14:14, 2年前 , 8^F

04/07 14:14, 8^F

推

04/07 15:16, 2年前 , 9^F

04/07 15:16, 9^F

推

04/07 15:57, 2年前 , 10^F

04/07 15:57, 10^F

推

04/07 16:08, 2年前 , 11^F

04/07 16:08, 11^F

推

04/07 18:32, 2年前 , 12^F

04/07 18:32, 12^F

有，llama.cpp作者就有示範用NDK編譯，應會比proot快

推

04/07 18:41, 2年前 , 13^F

04/07 18:41, 13^F

推

04/07 19:23, 2年前 , 14^F

04/07 19:23, 14^F

推

04/07 20:05, 2年前 , 15^F

04/07 20:05, 15^F

※ 編輯: ivon852 (114.27.87.182 臺灣), 04/07/2023 21:15:31

推

04/07 21:59, 2年前 , 16^F

04/07 21:59, 16^F

→

04/07 21:59, 2年前 , 17^F

04/07 21:59, 17^F

推

04/07 22:16, 2年前 , 18^F

04/07 22:16, 18^F

→

04/07 22:16, 2年前 , 19^F

04/07 22:16, 19^F

確實算力不如人的情況下雲端較有優勢，不過開源自架的價值就在於可以自己掌控。

推

04/07 22:40, 2年前 , 20^F

04/07 22:40, 20^F

推

04/07 22:43, 2年前 , 21^F

04/07 22:43, 21^F

→

04/07 23:20, 2年前 , 22^F

04/07 23:20, 22^F

※ 編輯: ivon852 (114.27.87.182 臺灣), 04/08/2023 00:23:09

推

04/08 03:41, 2年前 , 23^F

04/08 03:41, 23^F

推 JKGOOD: 如果chatGPT可以離線不知道模型庫會多大？我猜跟Stable Di 04/08 08:25 目前有quantized處理過的LLaMA模型，最小的4GB，最大的40GB。 ※ 編輯: ivon852 (111.71.221.44 臺灣), 04/09/2023 00:43:16

‣ 返回看板[ MobileComm ] 資訊

‣ 更多 ivon852 的文章

文章代碼(AID): #1aBwAWur (MobileComm)