前言
NumPy是Python用于處理大型矩陣的一個速度極快的數學庫。它允許你在Python中做向量和矩陣的運算,而且很多底層的函數都是用C寫的,你將獲得在普通Python中無法達到的運行速度。這是由于矩陣中每個元素的數據類型都是一樣的,這也就減少了運算過程中的類型檢測。
矩陣基礎
在 numpy 包中我們用數組來表示向量,矩陣和高階數據結構。他們就由數組構成,一維就用一個數組表示,二維就是數組中包含數組表示。
創建
1
2
3
4
5
6
7
8
9
|
# coding: utf-8 import numpy as np a = np.array([ [ 1.73 , 1.68 , 1.71 , 4 ], [ 1 , 2 , 3 , 4 ], [ 1 , 2 , 3 , 4 ] ]) print type (a) # <type 'numpy.ndarray'> |
ndarray (N-dimensional array object) 意思就是n維數組。例子中就表示一個3行4列的二維數組。
形狀
數組的大小可以通過其 shape 屬性獲得:
1
|
print a.shape # (3L,4L) |
數組的元素數量可以通過 ndarray.size 得到:
1
|
print a.size # 12 |
使用 ndarray 的 dtype 屬性我們能獲得數組元素的類型:
1
|
print a.dtype # float64 |
可以用過 shape 重新設置矩陣的形狀或者通過 reshape 方法創建一個改變了尺寸的新數組,原數組的shape保持不變:
1
2
3
|
a.shape = 4 , 3 b = a.reshape(( 2 , 6 )) # 盡管b的形狀是新的,但是a和b是共享數據存儲內存區域的,如果b[0][1] = 8 那么a[0][1] 也會是8 |
數組生成
可以用過 np.arange
來創建數組,參數與range類似:
1
|
x = np.arange( 0 , 10 , 1 ) # arguments: start, stop, step |
也可以用 np.linspace 創建等差數列:
1
2
3
4
|
x = np.linspace( 1 , 10 , 5 ) # arguments: start, stop, num元素個數 # [ 1. 3.25 5.5 7.75 10. ] # np.logspace 是創建等比數列 |
矩陣運算
計算將變量直接參與運算符,操作符優先級不變:
1
2
3
4
5
6
7
8
9
10
|
a = np.random.rand( 5 , 5 ) b = np.random.rand( 5 , 5 ) print a + b print a - b print a * b print a / b print a * * 2 print a < b print a > b |
一個數組中除了 dot()
函數,其他這些操作都是單元操作。
1
2
3
4
5
|
np_arr = np.array([ 2 , 3 , 34 , 5 , 5 ]) print np.mean(np_arr) # 平均數 print np.median(np_arr) # 中位數 print np.corrcoef(a[ 0 ], a[ 1 ]) # 判斷兩個軸的數據是否有相關性 print np.std(np_arr) # 標準差 |
數據提取
切片索引語法:M[lower:upper:step]
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
a = np.array([ 1 , 2 , 3 , 4 , 5 ]) a[ 1 : 3 ] # array([2, 3]) # 進行切片賦值時,原數組會被修改 a[ 1 : 3 ] = [ - 2 , - 3 ] # array([ 1, -2, -3, 4, 5]) b = np.random.rand( 5 , 5 ) b[ 1 : 4 , 1 : 4 ] # 提取 1~4 行,1~4列 b > 0.1 #array([False, False, False, ...]) # 因此要提取可以用, 這是利用了布爾屏蔽這個特性 b[ b > 0.1 ] # where()函數是另一個有用的方式,當需要以特定條件來檢索數組元素的時候。只需要傳遞給它一個條件,它將返回符合條件的元素列表。 c = np.where(b > 0.1 ) |
矩陣運算
NumPy和Matlab不一樣,對于多維數組的運算,缺省情況下并不使用矩陣運算,如果你希望對數組進行矩陣運算的話,可以調用相應的函數。
matrix對象
numpy庫提供了matrix類,使用matrix類創建的是矩陣對象,它們的加減乘除運算缺省采用矩陣方式計算,因此用法和matlab十分類似。但是由于NumPy中同時存在ndarray和matrix對象,因此用戶很容易將兩者弄混。這有違Python的“顯式優于隱式”的原則,因此并不推薦在較復雜的程序中使用matrix。
1
2
3
4
5
|
>>> a = np.matrix([[ 1 , 2 , 3 ],[ 5 , 5 , 6 ],[ 7 , 9 , 9 ]]) >>> a * a * * - 1 matrix([[ 1.00000000e + 00 , 1.66533454e - 16 , - 8.32667268e - 17 ], [ - 2.77555756e - 16 , 1.00000000e + 00 , - 2.77555756e - 17 ], [ 1.66533454e - 16 , 5.55111512e - 17 , 1.00000000e + 00 ]]) |
從數組轉換為矩陣可以用m = np.matrix(a)
進行轉換, 使用 m.T 可以得到m的轉置矩陣。
矩陣求逆
1
2
3
|
m.I * m = > matrix([[ 1.00000000e + 00 + 0.j , 4.44089210e - 16 + 0.j ], [ 0.00000000e + 00 + 0.j , 1.00000000e + 00 + 0.j ]]) |
淺拷貝與深拷貝
為了獲得高性能,Python 中的賦值常常不拷貝底層對象,這被稱作淺拷貝。使用 copy 進行深拷貝:
1
|
b = copy(a) |
遍歷數組元素
通常情況下,我們是希望盡可能避免遍歷數組元素的。因為迭代相比向量運算要慢的多。但是有些時候迭代又是不可避免的,這種情況下用 Python 的 for 是最方便的:
1
2
3
4
5
6
7
8
9
10
11
|
v = np.array([ 1 , 2 , 3 , 4 ]) for element in v: print (element) M = np.array([[ 1 , 2 ], [ 3 , 4 ]]) for row in M: print ( "row" , row) for element in row: print (element) |
總結
以上就是關于Python科學計算之NumPy的全部內容了,希望本文的內容對大家的學習或者工作能帶來一定的幫助,如果有疑問大家可以留言交流。
原文鏈接:https://www.hongweipeng.com/index.php/archives/1089/