[問題] Read from docx

看板C_and_CPP作者 (奇怪 還沒收到??)時間15年前 (2010/07/20 21:10), 編輯推噓4(4011)
留言15則, 7人參與, 最新討論串1/1
請問一下: 這是一個超級簡單的程式 就是算文章中每一行平均字數 在.txt中 可以正常得到答案. 但是我把文章 改成用word (.docx)後 不管怎麼改 都是一行 然後總共15個字 = = || 為什麼會變這樣? Thanks. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.115.155.186

07/20 21:19, , 1F
.......你知道 docx 的格式嗎?怎麼讀的?
07/20 21:19, 1F

07/20 21:35, , 2F
你把.docx用notepad看看XDDD
07/20 21:35, 2F

07/20 21:59, , 3F
你可以試著用 7zip 或 winrar 開 doc 或 docx 看看 (無誤
07/20 21:59, 3F

07/20 22:01, , 4F
docx 才是 zip 格式吧。
07/20 22:01, 4F

07/21 03:51, , 5F
有些檔案會有它自己的header 來說明該檔案格式
07/21 03:51, 5F

07/21 21:34, , 6F
好神奇 當我用winrar開才知道裡面東西那麼多@@
07/21 21:34, 6F

07/21 21:34, , 7F
有人可以做詳盡一點的解釋嗎? >(_ _)<
07/21 21:34, 7F

07/21 23:56, , 8F
他不是純文字檔 他是一個經過軟體包裝過的東西 如此而已
07/21 23:56, 8F

07/21 23:56, , 9F
所以你直接當成文字檔讀當然讀不到它的內容
07/21 23:56, 9F

07/21 23:58, , 10F
至於 tinlans 大所說的格式我就不清楚了
07/21 23:58, 10F

07/22 00:57, , 11F
喔~ 不過還是好奇word的包裝
07/22 00:57, 11F

07/22 01:06, , 12F
建議別浪費時間去了解 word 的格式了...
07/22 01:06, 12F

07/22 01:07, , 13F
google "Office file format" M$的那個鏈結有你想要看的
07/22 01:07, 13F

07/22 01:08, , 14F
google "為什麼微軟 Office 的檔案格式如此複雜" 這篇有趣
07/22 01:08, 14F

07/22 08:56, , 15F
啊原來樓上這篇是 joel 寫的XD 他寫的東西都很有趣
07/22 08:56, 15F
文章代碼(AID): #1CHQ1IBH (C_and_CPP)