lkkman
進階會員
積分 2402
發文 184
註冊 2005-9-7
狀態 離線
|
#1 清除*.pdf的背景字
我有一個問題想請教各位前輩大大:
從網站下載的國中基測題本(*.pdf),每頁都有「新聞紙專用」的粉紅色背景字,
請問如何將背景字去除呢?
感謝大大們。
|
|
2008-5-27 03:21 PM |
|
Smiler
高級會員
積分 6347
發文 994
註冊 2005-9-7
狀態 離線
|
#2 參考看看!!
如果您手邊有 Adobe Acrobat,打開 pdf 檔以後,<編輯>選項裡會有一個<復原新增水印>或<復原新增背景>的選項!
像這類的檔案通常會有設定防止編輯的密碼保護,這可能是您要先考慮的喔!
|
|
2008-5-28 12:30 AM |
|
pcc0921
高級會員
積分 6181
發文 1088
註冊 2006-12-26
狀態 離線
|
#3
論壇有pdf殺手解開密碼,再把它給去浮水印或轉成WORD檔再處理!!
用想的!!沒用過!!!純參考!!希望對你有幫助!!
|
|
2008-5-28 11:05 PM |
|
Smiler
高級會員
積分 6347
發文 994
註冊 2005-9-7
狀態 離線
|
|
2008-5-29 12:18 AM |
|
lkkman
進階會員
積分 2402
發文 184
註冊 2005-9-7
狀態 離線
|
#5 感謝大大們的指導,及操作失敗的過程
首先謝謝Smiler及pcc0921兩位大大的熱心指導。國中基測題本並無密碼鎖,不必解碼就可以任意轉存其他類型檔案。底下是我使用Adobe Acrobat 和Word2003編輯,可是失敗的過程。
1.我是使用Adobe Acrobat v8.0版本,在文件/背景|水印的選項下,有「新增|更新|移除」選項,以移除選項操作時出現警示視窗,大意為「文件非 Acrobat 或adobe PDFMaker所編輯,無法看到 水印|背景。」
2.轉存為*.doc後,每頁均以圖片型態存在,使用OCR程式辨識卻出現大量的錯別字(可能有背景字的關係吧),使用Word編輯時又因找不到圖層,無法使用圖片工具列編輯。
|
|
2008-5-29 07:00 AM |
|
pcc0921
高級會員
積分 6181
發文 1088
註冊 2006-12-26
狀態 離線
|
#6
猜想可能在過程中有加密,有沒有試過列印出來再掃描回去?
|
|
2008-5-29 09:17 AM |
|
Smiler
高級會員
積分 6347
發文 994
註冊 2005-9-7
狀態 離線
|
#7 參考看看!!
我剛才上網下載了一個看過,這個基測題本的 PDF 是圖形而非文字,根據內容來看是用 PhotoShop 產生的,所以不是使用水印形態!
要去除背景只能用繪圖軟體如 PhotoShop 或 Corel PhotoPaint 來做!
因為圖形檔只有兩色,文字是黑色,而背景字體為粉紅色,所以只要將內文一頁一頁圖檔分出來,以繪圖軟體的替換顏色(Replace Color) 將背景的粉紅色替換為白色就可以囉!
這樣再用 OCR 軟體來辨識,應該成功率也會高很多吧!
|
|
2008-5-30 12:17 AM |
|