Mouvement brownien II 📈📈: représentation de Karhunen-Loève

Octobre 2023

Un mouvement brownien est une fonction réelle BB sur [0,1][0,1], aléatoire, gaussienne (au sens où toutes les marginales sont conjointement gaussiennes), centrée, et de covariance

E[BsBt]=min(s,t).\mathbb{E}[B_s B_t] = \min(s,t).

Dans cette précédente note j'ai expliqué comment on pouvait construire un mouvement brownien en s'aidant d'une base orthonormale ; pour résumer, si (φn)(\varphi_n) est une base orthonormale de L2L^2 bien choisie et si (ξn)(\xi_n) est une suite iid de gaussiennes, alors la série

Bt=n=0ξn0tφn(u)du B_t = \sum_{n=0}^\infty \xi_n \int_0^t \varphi_n(u)\mathrm{d}u

converge uniformément et c'est un mouvement brownien.

Le problème de cette construction, c'est qu'elle ne donne pas la décomposition de BB dans cette base ! En effet, même si les fonctions (φn)(\varphi_n) forment une base, les fonctions

t0tφn(u)du t\mapsto \int_0^t \varphi_n(u)\mathrm{d}u

n'en forment pas une en général. Pourtant, comme BB est une fonction continue et a fortiori L2L^2, on peut décomposer

Bt=n=0Ynφn(t) B_t = \sum_{n=0}^\infty Y_n \varphi_n(t)

Yn=B,φnY_n = \langle B, \varphi_n\rangle. Le problème est que les (Yn)(Y_n) ne sont pas iid et que leur calcul nécessite de déterminer les produits scalaires entre φn\varphi_n et 0tφn(s)ds\int_0^t \varphi_n(s)\mathrm{d}s, ce qui n'est pas évident.

On aimerait donc spécifier n'importe quel processus gaussien directement par ses coefficients dans une base orthonormale. C'est ce que fait la décomposition de Karhunen-Loève : étant donnée une fonction de covariance (par exemple (1)), on trouve une base orthonormale adaptée à cette covariance et qui répond au problème. Dans le cas du mouvement brownien cela donne la représentation suivante: 

Soit (ξn)(\xi_n) une suite de gaussiennes standard iid. La série suivante converge au sens L2L^2 vers un mouvement brownien: 

Bt=n=0ξn2(n+12)πsin((n+12)πt).B_t = \sum_{n=0}^\infty \xi_n \frac{\sqrt{2}}{\left(n+\frac{1}{2}\right)\pi}\sin\left(\left(n+\frac{1}{2}\right)\pi t\right) .

La construction est en fait valable pour n'importe quelle fonction de covariance K(s,t)K(s,t); la base en question et les nombres qui apparaissent dans la somme vont dépendre de KK. Ceux ci-dessus sont adaptés à la covariance du brownien, K(s,t)=stK(s,t) = s\wedge t. Par rapport à la construction de Lévy, on a gagné la vraie décomposition de BB dans une base orthonormale ; mais on a perdu la continuité automatique.

Michel Loève (1907 - 1979), d'origine palestitienne, a eu pour directeur de thèse Paul Lévy. Kari Karhunen (1915 - 1992) était finlandais et avait eu Nevanlinna comme directeur de thèse.

Décomposition de Karhunen-Loève

Théorème de Mercer

La clé est le résultat suivant, un pur produit d'analyse fonctionnelle dû à James Mercer en 1909.

On dit qu'une fonction K: [0,1]2RK : [0,1]^2 \to \mathbb{R} est un noyau positif si elle est symétrique, continue, et si pour tous x1,,xn[0,1]x_1, \dotsc, x_n \in [0,1] la matrice (K(xi,xj))(K(x_i, x_j)) est définie positive.

Si KK est un noyau positif, il existe une base orthonormale (en)(e_n) de L2L^2 et des nombres positifs λn\lambda_n tels que λn<\sum \lambda_n <\infty et K(s,t)=n=0λnen(x)en(y)K(s,t) = \sum_{n=0}^\infty \lambda_n e_n(x)e_n(y) où cette série converge uniformément sur [0,1]2[0,1]^2.

Les (λn),(en)(\lambda_n), (e_n) sont les valeurs propres et fonctions propres associées à l'opérateur à noyau fKff\mapsto K \star f

Kf(s)=01K(s,t)f(t)dt.K \star f(s) = \int_0^1 K(s,t)f(t){\rm d}t.

Autrement dit, les fonctions propres et valeurs propres se trouvent en résolvant les équations

λnen(t)=01K(s,t)en(t)dt. \lambda_n e_n(t) = \int_0^1 K(s,t)e_n(t){\rm d}t.

J'ai écrit une démonstration dans cette note. L'idée générale simple si l'on connaît un peu de théorie spectrale : l'égalité (6) est vraie au sens L2L^2 et il suffit de lui donner un sens pour tout x,yx,y, ce qui est une conséquence de la continuité de KK.

Représentation des processus gaussiens

Soit KK un noyau comme dans le théorème ci-dessus. On cherche un processus gaussien centré de covariance KK; on pose

Xt=n=0ξnλnen(t) X_t = \sum_{n=0}^\infty \xi_n \sqrt{\lambda_n} e_n(t)

où les en,λne_n, \lambda_n sont les fonctions propres et valeurs propres de l'opérateur de noyau KK comme dans le théorème de Mercer. Cette construction répond au problème; elle s'appelle construction de Karhunen-Loève.

Démonstration. On remarque déjà que Eξn2λn=λn<\mathbb{E}\sum \xi_n^2 \lambda_n = \sum \lambda_n < \infty, donc la somme est finie presque sûrement et BB est bien défini (série absolument convergente dans L2L^2). Le fait que XX soit centré est évident. Pour la covariance, on a

EXtXs=n,mλnλmE[ξnξm]en(s)em(t)=λnen(s)en(t)=K(s,t). \mathbb{E}X_t X_s = \sum_{n,m}\sqrt{\lambda_n \lambda_m}\mathbb{E}[\xi_n \xi_m] e_n(s)e_m(t) = \sum \lambda_n e_n(s)e_n(t) = K(s,t).

Cela répond donc au problème.

Évidemment, toute la difficulté consiste à calculer la base qui diagonalise l'opérateur à noyau fKff \mapsto K \star f.

Calcul dans le cas du brownien

On veut diagonaliser l'opérateur intégral fL2Kff\in L^2 \mapsto K \star f

(Kf)(s)=K(s,t)f(t)dt=01(st)f(t)dt=0stf(t)dt+ss1f(t)dt. (K\star f)(s)= \int K(s,t)f(t)\mathrm{d}t = \int_0^1 (s\wedge t) f(t){\rm d}t = \int_0^s t f(t){\rm d}t + s\int_s^1 f(t){\rm d}t.

On cherche donc un couple λR\lambda \in \mathbb{R},ϕL2\phi \in L^2 tel que λϕ=Kϕ\lambda \phi = K\star \phi, c'est-à-dire

λϕ(s)=0stϕ(t)dt+ss1ϕ(t)dt.\lambda \phi(s) = \int_0^s t \phi(t)dt + s\int_s^1 \phi(t)dt.

Si cette identité est vraie et alors on voit vite que ϕ\phi est deux fois dérivable, et en dérivant on obtient

λϕ(s)=sϕ(s)+s1ϕ(t)dtsϕ(s)=s1ϕ(t)dt \lambda \phi'(s) = s \phi(s) + \int_s^1 \phi(t)dt - s \phi(s) = \int_s^1 \phi(t)dt

puis en re-dérivant

λϕ(s)=ϕ(s). \lambda \phi''(s) = -\phi(s).

Les solutions ϕ\phi sont donc des combinaisons linéaires de sin\sin et cos\cos avec fréquence 1/λ1/\sqrt{\lambda}. On voit aussi que λ\lambda ne peut pas être nul. Comme manifestement (12) implique que ϕ(0)=0\phi(0) = 0, il n'y a pas de cosinus: ϕ(s)=csin(s/λ)\phi(s) = c \sin(s/\sqrt{\lambda}) pour une constante cc. D'autre part on voit que ϕ(1)=0\phi'(1) = 0 soit cos(1/λ)=0\cos(1/\sqrt{\lambda})=0 et donc 1/λ=1/2π+nπ1/\sqrt{\lambda} = 1/2\pi + n\pi pour un certain entier nn, que l'on peut prendre positif ou nul car le sinus est symétrique. On en déduit que

ϕ(s)=csin(sπ(12+n)) \phi(s) = c \sin\left(s \pi \left(\frac{1}{2} + n\right)\right)

et on vérifie facilement que 01sin(sπ(1/2+n))2ds=1/2\int_0^1 \sin(s\pi(1/2 + n))^2 {\rm d}s = 1/2 donc c=2c = \sqrt{2} pour que ϕ\phi soit normalisée. On se convaincra facilement que la famille

(2sin(sπ(12+n)))nN \left( \sqrt{2}\sin\left(s \pi \left(\frac{1}{2} + n\right)\right)\right)_{n \in \mathbb{N}}

forme une base orthonormale de L2L^2 qui diagonalise l'opérateur de noyau KK, avec les valeurs propres associées

λn=1((n+12)π)2(nN). \lambda_n = \frac{1}{\left(\left(n + \frac{1}{2}\right)\pi\right)^2} \qquad (n\in \mathbb{N}).

La représentation de Karhunen-Loève nous donne donc

Bt=n=0ξn2(n+12)πsin((n+12)πt)B_t = \sum_{n=0}^\infty \xi_n \frac{\sqrt{2}}{\left(n+\frac{1}{2}\right)\pi}\sin\left(\left(n+\frac{1}{2}\right)\pi t\right)

où les (ξn)(\xi_n) sont des gaussiennes standard iid. Cette série converge au sens L2L^2 mais on pourrait vérifier qu'elle converge aussi presque sûrement.

Remarque générale

Le théorème de Sturm-Liouville dit que pour toute fonction continue QQ, il existe une base de L2L^2 composée de fonctions C2\mathscr{C}^2, disons unu_n, et des nombres positifs distincts λn\lambda_n qui tendent vers l'infini, tels que un(0)=un(1)=0u_n(0)=u_n(1)=0 et

un+Qun=λnun.-u''_n + Qu_n = \lambda_n u_n.

Ces fonctions sont en fait les fonctions propres de l'opérateur de noyau K(x,y)=Ca(xy)b(xy)K(x,y) = C a(x \wedge y)b(x \vee y)a,ba,b sont deux solutions de u+Qu=0u'' + Qu = 0 avec des conditions initiales bien choisies pour qu'elles soient orthogonales, et CC est une constante. Dans le cas ci-dessus on a Q=0Q=0 et les conditions initiales donnent a(x)=xa(x)=x et b(x)=xb(x)=-x; la constante CC est en fait égale à 1-1 et donc on trouve bien K(x,y)=xyK(x,y) = x \wedge y .