Board logo

標題: 清除*.pdf的背景字 [打印本頁]

作者: lkkman     時間: 2008-5-27 03:21 PM    標題: 清除*.pdf的背景字

  我有一個問題想請教各位前輩大大:
從網站下載的國中基測題本(*.pdf),每頁都有「新聞紙專用」的粉紅色背景字,
請問如何將背景字去除呢?
感謝大大們。
作者: Smiler     時間: 2008-5-28 12:30 AM    標題: 參考看看!!

如果您手邊有 Adobe Acrobat,打開 pdf 檔以後,<編輯>選項裡會有一個<復原新增水印>或<復原新增背景>的選項!
像這類的檔案通常會有設定防止編輯的密碼保護,這可能是您要先考慮的喔!
作者: pcc0921     時間: 2008-5-28 11:05 PM
論壇有pdf殺手解開密碼,再把它給去浮水印或轉成WORD檔再處理!!
用想的!!沒用過!!!純參考!!希望對你有幫助!!
作者: Smiler     時間: 2008-5-29 12:18 AM    標題: 參考看看!!

不建議您使用論壇裡的 PDF 殺手,裡面很多程式都是很舊的版本,而且無法從控制台移除!
記得網路上有一套叫 Advanced PDF Password Recovery,算是蠻好用!!
網路上的 RS 載點,是5月27日看到,現在應該還有效:
http://rapidshare.com/files/4117 ... d_Recovery_2.21.rar
作者: lkkman     時間: 2008-5-29 07:00 AM    標題: 感謝大大們的指導,及操作失敗的過程

首先謝謝Smiler及pcc0921兩位大大的熱心指導。國中基測題本並無密碼鎖,不必解碼就可以任意轉存其他類型檔案。底下是我使用Adobe Acrobat 和Word2003編輯,可是失敗的過程。
1.我是使用Adobe Acrobat v8.0版本,在文件/背景|水印的選項下,有「新增|更新|移除」選項,以移除選項操作時出現警示視窗,大意為「文件非 Acrobat  或adobe PDFMaker所編輯,無法看到 水印|背景。」
2.轉存為*.doc後,每頁均以圖片型態存在,使用OCR程式辨識卻出現大量的錯別字(可能有背景字的關係吧),使用Word編輯時又因找不到圖層,無法使用圖片工具列編輯。
作者: pcc0921     時間: 2008-5-29 09:17 AM
猜想可能在過程中有加密,有沒有試過列印出來再掃描回去?
作者: Smiler     時間: 2008-5-30 12:17 AM    標題: 參考看看!!

我剛才上網下載了一個看過,這個基測題本的 PDF 是圖形而非文字,根據內容來看是用 PhotoShop 產生的,所以不是使用水印形態!
要去除背景只能用繪圖軟體如 PhotoShop 或 Corel PhotoPaint 來做!
因為圖形檔只有兩色,文字是黑色,而背景字體為粉紅色,所以只要將內文一頁一頁圖檔分出來,以繪圖軟體的替換顏色(Replace Color) 將背景的粉紅色替換為白色就可以囉!
這樣再用 OCR 軟體來辨識,應該成功率也會高很多吧!




歡迎光臨 網際論壇 (http://centurys.net/) Powered by Discuz! 2.5