画像処理はじめました。

AI/AR/VRという近未来的な言葉に惹かれ、その技術分野に参戦するために立ち上げたブログです。日々の格闘結果を記録に残してゆこうと思います。

0-1 「Python 画像の表示と保存」

PILとNumpyを使用して画像の表示と保存を行います。
画像ファイルは、「実践 コンピュータビジョン」の著者のページからダウンロードしたものを使用しています。

#!/usr/bin/python
# -*- coding: utf-8 -*-

# 画像の表示と保存

from PIL import Image 
import numpy as np
from matplotlib import pylab as plt

# 画像の読み込み
im = np.array(Image.open('alcatraz1.jpg'))

# 画像の情報を表示
print(im.dtype) #データ型 uint8
print(im.ndim)  #次元数 3
print(im.shape) #サイズ(高さx幅x色数) (1296L, 1936L, 3L)

# 画像の表示
plt.imshow(im)
plt.show()

#保存
Image.fromarray(im).save('alcatraz1_save.jpg')

実行結果
f:id:genetaka1810:20191021163717p:plain

print文で表示される値(文字列)には、以下の意味があります。
 im.dtype:データ型 uint8は、画素データが8ビットの整数型であることを意味しています。
 im.ndim:画像ファイルの次元数を確認でき、3とはRGBのカラーデータであることを示しています。
 im.shape:画像ファイルのサイズが確認できます。(1296L, 1936L, 3L)とは、高さ1296ピクセル、幅1936ピクセル、色数3のカラー画像であることがわかります。