# Opérations

Il est possible d'effectuer des opérations sur les tableaux `numpy` soit termes à termes, soit des opérations vectorielles ou matricielles.
En général, ces opérations sont à privilégier car beaucoup plus efficace (elles sont programmées dans un langage bas niveau, ce qui améliore les performances).

In [9]:
import numpy as np

x_4 = np.random.rand(4)
x_5 = np.random.rand(5)
A = np.random.rand(5, 4)
Aint = np.random.randint(10, size=(5, 4))
xint = np.random.randint(10, size=(4,))

## Opérations termes à termes

Toutes les opérations classiques sur les nombres sont possibles en utilisant les mêmes opérateurs (`+`, `-`, `*`, `/`, `**`, `<`, `<=`, `>`, `>=`, `//`, `%`...)

In [10]:
print(A)
print(A + A)
print(A * A)

[[0.83942773 0.61179367 0.79896546 0.2486489 ]
 [0.9265295  0.33137746 0.30152449 0.6402735 ]
 [0.53903744 0.38429437 0.28853166 0.61653103]
 [0.06792349 0.32039811 0.36387911 0.93421431]
 [0.2484653  0.62447161 0.19474002 0.01455906]]
[[1.67885545 1.22358734 1.59793092 0.49729779]
 [1.85305901 0.66275492 0.60304898 1.280547  ]
 [1.07807489 0.76858874 0.57706333 1.23306205]
 [0.13584698 0.64079623 0.72775821 1.86842863]
 [0.49693059 1.24894323 0.38948004 0.02911812]]
[[7.04638908e-01 3.74291493e-01 6.38345805e-01 6.18262734e-02]
 [8.58456921e-01 1.09811020e-01 9.09170179e-02 4.09950156e-01]
 [2.90561367e-01 1.47682162e-01 8.32505212e-02 3.80110505e-01]
 [4.61360046e-03 1.02654951e-01 1.32408003e-01 8.72756386e-01]
 [6.17350037e-02 3.89964796e-01 3.79236763e-02 2.11966204e-04]]


In [11]:
print(A)
print(2.1*A)
print(A**2)
print(A[0, 0]**2, (A**2)[0, 0])
print(A+1)

[[0.83942773 0.61179367 0.79896546 0.2486489 ]
 [0.9265295  0.33137746 0.30152449 0.6402735 ]
 [0.53903744 0.38429437 0.28853166 0.61653103]
 [0.06792349 0.32039811 0.36387911 0.93421431]
 [0.2484653  0.62447161 0.19474002 0.01455906]]
[[1.76279823 1.2847667  1.67782746 0.52216268]
 [1.94571196 0.69589266 0.63320143 1.34457435]
 [1.13197863 0.80701817 0.60591649 1.29471515]
 [0.14263933 0.67283604 0.76414612 1.96185006]
 [0.52177712 1.31139039 0.40895405 0.03057402]]
[[7.04638908e-01 3.74291493e-01 6.38345805e-01 6.18262734e-02]
 [8.58456921e-01 1.09811020e-01 9.09170179e-02 4.09950156e-01]
 [2.90561367e-01 1.47682162e-01 8.32505212e-02 3.80110505e-01]
 [4.61360046e-03 1.02654951e-01 1.32408003e-01 8.72756386e-01]
 [6.17350037e-02 3.89964796e-01 3.79236763e-02 2.11966204e-04]]
0.7046389080586984 0.7046389080586984
[[1.83942773 1.61179367 1.79896546 1.2486489 ]
 [1.9265295  1.33137746 1.30152449 1.6402735 ]
 [1.53903744 1.38429437 1.28853166 1.61653103]
 [1.06792349 1.32039811 1.3638791

In [12]:
print(A)
print(A+A - 2*A)
print(x_4)
print(A+x_4)  # Attention, dans ce cas, `x_4` est augmenté pour avoir 2 dimensions
print(A+x_5)  # ne fonctionne pas : problème de dimension

[[0.83942773 0.61179367 0.79896546 0.2486489 ]
 [0.9265295  0.33137746 0.30152449 0.6402735 ]
 [0.53903744 0.38429437 0.28853166 0.61653103]
 [0.06792349 0.32039811 0.36387911 0.93421431]
 [0.2484653  0.62447161 0.19474002 0.01455906]]
[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]
[0.96894645 0.43913453 0.04630671 0.90492057]
[[1.80837417 1.0509282  0.84527217 1.15356947]
 [1.89547595 0.77051199 0.3478312  1.54519407]
 [1.50798389 0.8234289  0.33483837 1.5214516 ]
 [1.03686994 0.75953265 0.41018581 1.83913489]
 [1.21741174 1.06360615 0.24104673 0.91947963]]


ValueError: operands could not be broadcast together with shapes (5,4) (5,) 

Il est possible de **répéter** un tableau selon un certain axe. Les commandes `repeat` et `tile` font sensiblement la même chose mais en ne répétant pas de la même manière. Par exemple

In [40]:
####################### repeat #######################
print(x_4)
print(x_4.repeat(2))           # répétition de chaque élément deux fois
x_41 = x_4[:, None]            # augmentation d'une dimension (vecteur->matrice(4,1))
print(x_41)
print(x_41.repeat(3, axis=1))  # duplication de la colonne trois fois
x_14 = x_4[None, :]            # augmentation d'une dimension (vecteur->matrice(1,4))
print(x_14)
print(x_14.repeat(3, axis=0))  # duplication de la ligne trois fois

[0.96894645 0.43913453 0.04630671 0.90492057]
[0.96894645 0.96894645 0.43913453 0.43913453 0.04630671 0.04630671
 0.90492057 0.90492057]
[[0.96894645]
 [0.43913453]
 [0.04630671]
 [0.90492057]]
[[0.96894645 0.96894645 0.96894645]
 [0.43913453 0.43913453 0.43913453]
 [0.04630671 0.04630671 0.04630671]
 [0.90492057 0.90492057 0.90492057]]
[[0.96894645 0.43913453 0.04630671 0.90492057]]
[[0.96894645 0.43913453 0.04630671 0.90492057]
 [0.96894645 0.43913453 0.04630671 0.90492057]
 [0.96894645 0.43913453 0.04630671 0.90492057]]


In [41]:
####################### tile #######################
print(x_4)
print(np.tile(x_4, 2))           # répétition de chaque élément deux fois
print(np.tile(x_4, (3, 1)))      # duplication de la ligne trois fois
x_41 = x_4[:, None]              # augmentation d'une dimension (vecteur->matrice(4,1))
print(x_41)
print(np.tile(x_41, (1, 3)))     # duplication de la colonne quatre fois

[0.96894645 0.43913453 0.04630671 0.90492057]
[0.96894645 0.43913453 0.04630671 0.90492057 0.96894645 0.43913453
 0.04630671 0.90492057]
[[0.96894645 0.43913453 0.04630671 0.90492057]
 [0.96894645 0.43913453 0.04630671 0.90492057]
 [0.96894645 0.43913453 0.04630671 0.90492057]]
[[0.96894645]
 [0.43913453]
 [0.04630671]
 [0.90492057]]
[[0.96894645 0.96894645 0.96894645]
 [0.43913453 0.43913453 0.43913453]
 [0.04630671 0.04630671 0.04630671]
 [0.90492057 0.90492057 0.90492057]]


In [43]:
print(A)
print(A < 0.5)
B = A * (A < 0.5) - A * (A > 0.5)
print(B)

[[0.83942773 0.61179367 0.79896546 0.2486489 ]
 [0.9265295  0.33137746 0.30152449 0.6402735 ]
 [0.53903744 0.38429437 0.28853166 0.61653103]
 [0.06792349 0.32039811 0.36387911 0.93421431]
 [0.2484653  0.62447161 0.19474002 0.01455906]]
[[False False False  True]
 [False  True  True False]
 [False  True  True False]
 [ True  True  True False]
 [ True False  True  True]]
[[-0.83942773 -0.61179367 -0.79896546  0.2486489 ]
 [-0.9265295   0.33137746  0.30152449 -0.6402735 ]
 [-0.53903744  0.38429437  0.28853166 -0.61653103]
 [ 0.06792349  0.32039811  0.36387911 -0.93421431]
 [ 0.2484653  -0.62447161  0.19474002  0.01455906]]


In [48]:
print(Aint)
print((2*Aint+1) % (Aint+1))   # cela donne bien le même résultat que Aint !

[[6 4 8 3]
 [7 2 1 0]
 [8 5 9 7]
 [5 1 4 7]
 [8 4 6 7]]
[[6 4 8 3]
 [7 2 1 0]
 [8 5 9 7]
 [5 1 4 7]
 [8 4 6 7]]


**Test de vitesse**

Un petit test de vitesse qui n'est pas une mesure précise mais plutôt qui donne un ordre de grandeur.

:::{admonition} Nota Bene
:class: admonition-bonasavoir
Il est presque toujours plus intéressant de faire les calculs directements sur les tableaux `numpy` plutôt que de le faire avec des boucles !
:::

In [49]:
%timeit B = 2*A

627 ns ± 0.908 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


In [50]:
%%timeit
B = np.zeros(A.shape)
for i in range(A.shape[0]):
    for j in range(B.shape[1]):
        B[i, j] = 2*A[i, j]

5.18 µs ± 40.4 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)


## Opérations vectorielles

Il est assez facile d'identifier les tableaux `numpy` à des objets algébriques comme les vecteurs ou les matrices. Attention toutefois aux vecteurs qui sont des éléments d'espaces vectoriels de dimension 1. Il est également possible d'identifier ces vecteurs à des matrices lignes ou colonnes.

:::{admonition} Petit rappel d'algèbre linéaire
:class: toggle admonition-indication
Si l'on considère un espace vectoriel $E$ muni d'une base $(e_1,\ldots, e_n)$ et un espace vectoriel $F$ muni d'une base $(f_1,\ldots, f_n)$ (donc $E$ est de dimension $n$ et $F$ de dimension $m$), une application linéaire $\phi:E\to F$ est caractérisée par l'image de la base $(e_i)$ qui s'écrit dans la base des $(f_j)$ :

$$\phi(e_i) = \sum_{j=1}^m A_{i, j} f_j, \qquad 1\leq i\leq n.$$

On appelle matrice de $\phi$ le tableau des nombres $A_{i,j}$.

Un vecteur $x$ de $E$ (*resp.* $y$ de $F$) s'écrit dans la base des $(e_i)$ (*resp.* $(f_j)$)

$$
x = \sum_{i=1}^n x_i e_i, \qquad y = \sum_{j=1}^m y_j f_j.
$$

On assimile donc le vecteur $x$ (*resp.* $y$) au tableau monodimensionnel $(x_1,\ldots, x_n)$ (*resp.* $(y_1,\ldots, y_m)$).

Cependant, étant donné un vecteur $x$ de $E$, il est possible de considérer la forme linéaire $\phi_x : E\to \mathbb{R}$ définie par

$$
\phi_x(a) = \sum_{i=1}^n x_i a_i, \qquad a\in E.
$$

Le vecteur $x$ est alors assimilé à une matrice ligne avec $x_{1, i}=x_i$, $1\leq i\leq n$. 
Il est également possible de plonger $\mathbb{R}$ dans $E$ en utilisant l'application linéaire $\psi_x : \mathbb{R}\to E$ définie par

$$
\psi_x(a) = (ax_1, ax_2,\ldots ax_n), \qquad a\in\mathbb{R}.
$$

Le vecteur $x$ est alors assimilé à une matrice colonne avec $x_{i, 1} = x_i$, $1\leq i\leq n$.

**Produit matrice vecteur**

Soit $A=(A_{i, j})_{1\leq i,j \leq N}$ et $x=(x_i)_{1\leq i\leq N}$, le produit $Ax$ est le vecteur défini par

$$ (Ax)_i = \sum_{j=1}^N A_{i, j} x_j, \qquad 1\leq i\leq N.$$

:::

:::{admonition} Attention
:class: admonition-attention
En python, des tableaux de forme `(n, )`, `(n, 1)` et `(1, n)` peuvent être utilisés pour représenter des vecteurs mathématiques (et l'on peut facilement les transformer pour passer d'une version à l'autre). Mais il fait faire attention à ce que l'on fait car les opérations dessus ne sont pas les mêmes...
:::

**Sommes et produits**

La somme de deux tableaux (lorsque les tailles sont compatibles) a déjà été vue : c'est la même opération que termes à termes. On utilise le `+`.

Pour le produit, il faut utiliser la fonction `np.matmul()` ou de manière équivalente le `@`. Tant que l'on n'utilise pas de tableaux avec plus de 3 dimensions, on peut aussi utiliser de manière équivalente la fonction `np.dot`.

Pour les vecteurs, on a aussi `np.inner` pour le produit scalaire, `np.outer` pour le produit extérieur :

$$
x\cdot y = \sum_{i=1}^N x_i y_i,
\qquad 
(x\otimes y)_{i, j} = x_i y_j, \quad 1\leq i,j\leq N.
$$

In [51]:
print(Aint)
print(xint)
print(Aint @ xint)          # produit matrice-vecteur
print(np.dot(Aint, xint))   # produit matrice-vecteur
print(xint @ xint)          # produit scalaire de deux vecteurs
print(np.dot(xint, xint))   # produit scalaire de deux vecteurs
print(np.inner(xint, xint)) # produit scalaire de deux vecteurs
print(np.outer(xint, xint)) # produit tensoriel de deux vecteurs

[[6 4 8 3]
 [7 2 1 0]
 [8 5 9 7]
 [5 1 4 7]
 [8 4 6 7]]
[7 6 5 4]
[118  66 159  89 138]
[118  66 159  89 138]
126
126
126
[[49 42 35 28]
 [42 36 30 24]
 [35 30 25 20]
 [28 24 20 16]]


**Transposition**

On calcule la transposée d'une matrice à l'aide de la fonction `np.transpose`. Lorsque c'est possible (lorsque `python` estime que c'est possible), une vue est renvoyée sans faire de copie...

In [52]:
print(A)
print(A.T)
print(A.shape)
print(A.transpose().shape)    # transposition d'une matrice
print(x_4, x_4.T)
x_4bis = x_4[None, :]
print(x_4bis)
print(x_4bis.T)
print(x_4bis.shape)
print(x_4bis.T.shape)
print(x_4.shape)
print(x_4.transpose().shape)  # ne fait rien sur les tableaux avec une seule dimension

[[0.83942773 0.61179367 0.79896546 0.2486489 ]
 [0.9265295  0.33137746 0.30152449 0.6402735 ]
 [0.53903744 0.38429437 0.28853166 0.61653103]
 [0.06792349 0.32039811 0.36387911 0.93421431]
 [0.2484653  0.62447161 0.19474002 0.01455906]]
[[0.83942773 0.9265295  0.53903744 0.06792349 0.2484653 ]
 [0.61179367 0.33137746 0.38429437 0.32039811 0.62447161]
 [0.79896546 0.30152449 0.28853166 0.36387911 0.19474002]
 [0.2486489  0.6402735  0.61653103 0.93421431 0.01455906]]
(5, 4)
(4, 5)
[0.96894645 0.43913453 0.04630671 0.90492057] [0.96894645 0.43913453 0.04630671 0.90492057]
[[0.96894645 0.43913453 0.04630671 0.90492057]]
[[0.96894645]
 [0.43913453]
 [0.04630671]
 [0.90492057]]
(1, 4)
(4, 1)
(4,)
(4,)


**Le module `linalg`**

Le module `linalg` est un sous-module de `numpy` qui apporte un grand nombre de méthodes numériques adaptées à l'algèbre linéaire. Citons par exemple :
- `np.linalg.det` pour calculer le déterminant d'une matrice ;
- `np.linalg.solve` pour résoudre un système linéaire ;
- `np.linalg.inv` pour calculer l'inverse d'une matrice...

## Sommation d'Einstein

Le module `numpy` permet d'utiliser la convention d'Einstein (version _implicite_ ou _explicite_) sur les tableaux. Cette convention consiste à sommer les indices répétés. Voici quelques exemples mathématiques : nous noterons $x$, $y$ des vecteurs et $A$, $B$ des matrices (les objets à plus de dimensions se traitent pareil)

$$
\begin{aligned}
x_i y_i &\leftrightarrow \sum_{i=0}^{n} x_i y_i, &&\text{produit scalaire}\\
A_{i,j} x_j &\leftrightarrow \sum_{j=0}^{n} A_{i,j} x_j, &&\text{produit matrice-vecteur}\\
A_{i,j} y_i &\leftrightarrow \sum_{i=0}^{n} x_i A_{i,j}, &&\text{produit vecteur-matrice}\\
A_{i,j} B_{j,k} &\leftrightarrow \sum_{j=0}^{n} A_{i,j}B_{j,k}, &&\text{produit matrice-matrice}\\
A_{i,j} A_{j,i} &\leftrightarrow \sum_{i,j=0}^{n} A_{i,j}A_{j,i}, &&\text{trace de $AA^T$}
\end{aligned}
$$

La commande `np.einsum()` permet de faire ce genre d'opérations d'une manière très agréable et lisible.

In [53]:
help(np.einsum)

Help on function einsum in module numpy:

einsum(*operands, out=None, optimize=False, **kwargs)
    einsum(subscripts, *operands, out=None, dtype=None, order='K',
           casting='safe', optimize=False)
    
    Evaluates the Einstein summation convention on the operands.
    
    Using the Einstein summation convention, many common multi-dimensional,
    linear algebraic array operations can be represented in a simple fashion.
    In *implicit* mode `einsum` computes these values.
    
    In *explicit* mode, `einsum` provides further flexibility to compute
    other array operations that might not be considered classical Einstein
    summation operations, by disabling, or forcing summation over specified
    subscript labels.
    
    See the notes and examples for clarification.
    
    Parameters
    ----------
    subscripts : str
        Specifies the subscripts for summation as comma separated list of
        subscript labels. An implicit (classical Einstein summation)
     

In [70]:
n = 5
x = np.random.randint(10, size=(n,))
A = np.random.randint(10, size=(n, n))
print(x)
print(A)

[1 5 5 4 8]
[[0 6 7 7 2]
 [6 6 3 2 4]
 [8 4 6 3 4]
 [1 7 5 8 2]
 [8 7 3 8 7]]


In [71]:
# somme des coefficients
print(np.einsum('i -> ', x))
print(np.sum(x))
# produit scalaire
print(np.einsum('i, i', x, x))
print(np.inner(x, x))
# produit tensoriel
print(np.einsum('i, j', x, x))
print(np.outer(x, x))

23
23
131
131
[[ 1  5  5  4  8]
 [ 5 25 25 20 40]
 [ 5 25 25 20 40]
 [ 4 20 20 16 32]
 [ 8 40 40 32 64]]
[[ 1  5  5  4  8]
 [ 5 25 25 20 40]
 [ 5 25 25 20 40]
 [ 4 20 20 16 32]
 [ 8 40 40 32 64]]


In [84]:
# produit matrice-vecteur à droite
print(np.einsum('ij, j', A, x))
print(A@x)
# produit matrice-vecteur à gauche
print(np.einsum('ji, j', A, x))
print(x@A)
# produit matrice-matrice
print(np.einsum('ij, jk', A, A))
print(A@A)
print(np.einsum('ij, kj', A, A))
print(A@A.T)
print(np.einsum('ij, ij', A, A))
print(np.trace(A@A.T))
print(np.linalg.norm(A, 'fro')**2)

[109  61  72  77  90]
[109  61  72  77  90]
[138 110  66  96  50]
[138 110  66  96  50]
[[115  91  59  49  66]
 [ 58  90  64  83  28]
 [ 59  97  95  96  38]
 [ 98  40  34  52  50]
 [ 74 116 117  79  72]]
[[115  91  59  49  66]
 [ 58  90  64  83  28]
 [ 59  97  95  96  38]
 [ 98  40  34  52  50]
 [ 74 116 117  79  72]]
[[138  43  53  81 119]
 [ 43  65  70  29  73]
 [ 53  70 105  44 116]
 [ 81  29  44  79  72]
 [119  73 116  72 186]]
[[138  43  53  81 119]
 [ 43  65  70  29  73]
 [ 53  70 105  44 116]
 [ 81  29  44  79  72]
 [119  73 116  72 186]]
573
573
573.0000000000001


In [73]:
# trace de la matrice
print(np.einsum('ii', A))
# diagonale de la matrice
diagA = np.einsum('ii->i', A)
print(diagA)                    # vue de la diagonale
diagA[:] = 0                    # on modifie la diagonale
print(A)

27
[0 6 6 8 7]
[[0 6 7 7 2]
 [6 0 3 2 4]
 [8 4 0 3 4]
 [1 7 5 0 2]
 [8 7 3 8 0]]


In [85]:
# transposition
print(np.einsum('ij->ji', A))
print(A.T)

[[0 6 8 1 8]
 [6 0 4 7 7]
 [7 3 0 5 3]
 [7 2 3 0 8]
 [2 4 4 2 0]]
[[0 6 8 1 8]
 [6 0 4 7 7]
 [7 3 0 5 3]
 [7 2 3 0 8]
 [2 4 4 2 0]]
