跳到主要內容

Apache POI - Word - Export Images

Problem

在做圖片取代前,總是要先把現有的都給倒出來。其實這不容易的,因為在Word中,有可能對原始圖檔做了特殊的調整,像是浮水印又或者圖片剪裁。在這我們先不管這些,只要純粹有什麼就匯出什麼即可。目前的做法是針對Word 2007。

How to?

有兩個做法,一個是直接透過document物件去取得所有圖片,另一個是依照paragraph結構去取得,我偏好依照結構順序去取得所有圖片。因為假如圖片有什麼特殊處理,可以根據Word上顯示多少張就輸出多少張處理過的圖片。此外,如果Word上顯示的圖片,是同一張來源但複製貼上在不同位置,當使用document物件去取得的列表並無法區別出來,會把它當成“一張”,這意味著如果要做取代可能會發生問題。

做法只要去取得各個XWPFParagraph與其中的XWPFRun後,再去取得XWPFPicture內的data,最後做寫入檔案動作就完成了。

	private static void dumpImages(CustomXWPFDocument doc) throws Exception {
		FileUtil.delete("pics");
		FileUtil.createFolder("pics");
 
		int count = 1;
		for( XWPFParagraph para : doc.getParagraphs()){
 
			List<XWPFRun> runs = para.getRuns();
 
			for( XWPFRun run : runs ){
				for( XWPFPicture picture :  run.getEmbeddedPictures()){
					String fileName = "pics/" + PIC_FILE_PREFIX + String.format("%05d", count++) + "." + 
						picture.getPictureData().suggestFileExtension();
					byte[] data = picture.getPictureData().getData();
					dumpImage(data, fileName);
				}
			}
		}
	}

接著是把圖片內容給儲存到檔案中。其實就只是產生一個FileOutputStream做寫入的動作就完成了。

	private static void dumpImage(byte[] data, String filePath){
		FileOutputStream fos = null;
		try {
			fos = new FileOutputStream(filePath);
			fos.write(data);
			fos.flush();
		} catch( Exception e ){
			System.out.println("Dump image " + filePath + " failed: " + e.getMessage());
		} finally {
			Cleaner.close(fos);
		}
	}

如果是透過特殊設定的情況就沒那麼容易了。像是下面這張圖的範例,左邊兩張是將大小做調整,右邊則是做剪裁的動作。最後的輸出結果,左上會與右上輸出相同,而左下則會輸出一張大小較小的圖片。

針對這種問題就要去CTPcture中的BlipFill取得SrcRect的描述,接著在輸出圖片時做調整。其他阿貓阿狗的問題,應該也是要透過這裡描述去做調整吧!

XWPFPicture pic = pictures.get(0);
pic.getCTPicture().getBlipFill().getSrcRect();

友藏內心獨白: Word實在是很複雜滴東西!

留言

這個網誌中的熱門文章

PostgreSQL - Unattended installation on windows

Introduction 要將別人軟體包裝到自己軟體中,不可或缺的東西就是Unattended installation。以Unattended installation來說,我們可以選擇透過Installer的silent mode安裝,也可以透過把目標軟體做成portable的版本。本篇文章分享這兩種方法,教導大家如何將PostgreSQL透過Unattended installation方式安裝到目標系統成為service。 Note. 本篇以PostgreSQL 10.7為例。 Install with installer Tips 安裝程式或反安裝程式的參數,除了可以直接上官網搜尋Installation User Guide以外,也可以直接使用help參數查詢: postgresql- 10.7 - 2 -windows-x64.exe --help Windows安裝程式主要有EnterpriseDB與BigSQL兩種。BigSQL版本安裝元件是透過網路下載且支援參數不如EnterpriseDB版本多,以我們需求來說,我們傾向於使用EnterpriseDB版本。接下來分享給大家安裝與反安裝方法。 Installation @ echo off set INSTALL_DIR =C:\postgres10 set INSTALLER =postgresql- 10.7 - 2 -windows-x64.exe   rem options for installation set SSMDB_SERVICE =postgresql- 10 set MODE =--unattendedmodeui none --mode unattended   set DB_PASSWD =--superpassword postgres set DB_PORT =--serverport 5432   set SERVICE_NAME =--servicename % SSMDB_SERVICE %   set PREFIX =--prefix "%INSTALL_DIR%" set DATA_DIR =--datadir "%INSTALL_DIR%\data"   set OPTIONS =

How to install RIDE on Windows?

Introduction 多年沒在Windows上開發RobotFramework,趁著這次整理一下RIDE安裝方法。 目前RIDE最新版本與Python對應版本如下: (3.6 < python <= 3.11) Install current released version (2.0.8.1) with: pip install -U robotframework-ride 安裝Python 直接到Python官網找尋最新的3.11版本,我使用3.11.9: link 。安裝就是一直下一步而已。 安裝wxPython 每次安裝RIDE最困難的都是wxPython。看了一下 官網 描述,我就姑且相信一下: 接著進入下 載頁面 就有安裝教學。基本上就是到Python目錄下的Scripts直接執行以下command: pip install -U wxPython 安裝RIDE 接著就如RIDE官網所說,執行以下command: pip install -U robotframework-ride 啟動RIDE 直接在相同目錄下執行ride就可以啟動了,你也可以直接在桌面建ride連結,加快下次啟動時間。 沒想到這次這麼順利就安裝完成了。因為我是使用java去啟動robot framework,就不特別講要怎麼使用pip安裝robot framework了。

Hello World!

即將要搬家,因此舊網頁內容將慢慢轉移至Blogger。 如果要存取舊網頁,可以使用以下連結: https://wiki.tonylin.idv.tw/dokuwiki/doku.php