Relative Content

Tag Archive for pythonimagepdf

Извлечь изображение из pdf

Есть pdf документ, содержащий несколько страниц, на каждой из которых есть текст и изображение. Мне необходимо извлечь изображение. Использую python и библиотеку fitz. При попытках извлечь изображение из ‘/XObject’ извлекается изображение, содержащие 1 пиксель, используемое, видимо, как маска, а само изображение извлечь не получается. Содержание страницы следующее:
1 0 obj
<</Tabs/S/Group<</S/Transparency/Type/Group/CS/DeviceRGB>>/Contents 6 0 R/Type/Page/Resources<</ColorSpace<</CS/DeviceRGB>>/ProcSet [/PDF /Text /ImageB /ImageC /ImageI]/Font<</F1 2 0 R/F2 5 0 R>>/XObject<</Xf1 3 0 R/img0 4 0 R>>>>/Parent 7 0 R/MediaBox[0 0 99 173]>>