Re: [請益] 如何讀取PDF檔的內容 輸出到網頁上
※ 引述《phpasp (就是要噓 大XD)》之銘言:
: 我不是問開PDF(PDF未加密)時 會是PDF reader軟體開~~
: 而是想問問 有PHP函式 可以直接讀取PDF檔的文字
: 然後存到一個變數裡輸出嗎??
: 像讀文字檔一樣............
: 我查網路上的PDF函式 好像都會間接開PDF軟體.....
: 所以想問大大有沒有知到的...感謝
基本上大多數的PDF檔裡的文字是經過編碼的...
而且就算如此 PDF裡還有不少東西是以文字型式保存
你得要整個PDF檔掃過一遍才會知道哪些是文字哪些只是圖片的stream
--
當然要搞還是有辦法 (不然搜尋引擎還玩什麼XD)
只是光PHP就不夠了 (因為還得解碼)
也許要後端程式的幫助 (而且幾乎是等同於寫一個PDF Reader的難度
只差沒真的排版顯示而已)
--
更@#$%的是 PDF雖然基本上是文字模式
但其中可能會插入許多binary的東西
這就很令人頭痛...
--
以上是K了一星期PDF的spec之後的結論
--
実琴:「河野!你真的就這樣被物質慾望給吸引過去了嗎?!」
亨:「只要穿著女裝擺出親切的樣子,所有必要花費就能全免,似乎一點都不壞啊。」
実琴:「難道你沒有男人的尊嚴了嗎?!」
亨:(斷然道)「沒有。在節衣縮食且生活吃緊的學生面前,沒有那種東西。」
--プリンセス・プリンセス 第二話
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.250.80
※ 編輯: LPH66 來自: 140.112.250.80 (11/19 10:00)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):