Lição 117 — Decomposição em valores singulares (SVD)
A = U Σ Vᵀ funciona para qualquer matriz real. Valores singulares revelam a estrutura geométrica. Base de compressão de imagens, recomendação, PCA e pseudoinversa.
Used in: 3.º ano do EM (17-18 anos) · Equiv. Lineare Algebra LK alemão · Equiv. H2 Math singapurense · Equiv. Math III japonês avançado
A SVD é a decomposição mais geral da álgebra linear: toda matriz se escreve com e ortogonais e diagonal com valores singulares . A decomposição existe para qualquer matriz real (ou complexa) — mesmo retangular. É a base de PCA, compressão de imagem, recomendação e regressão estável.
Rigorous notation, full derivation, hypotheses
Definição e teorema
Teorema da SVD
"Any matrix A with rank r can be written as a product where U is orthogonal (), is diagonal (, nonnegative entries decreasing), and V is orthogonal (). The diagonal entries are the singular values of A." — Understanding Linear Algebra, §6.3
"Theorem (Existence of SVD). Every real matrix A has a singular value decomposition. The singular values are the positive square roots of the nonzero eigenvalues of ." — A First Course in Linear Algebra, §SVD
Conexão com autovalores
Os 4 subespaços fundamentais via SVD
Teorema de Eckart-Young
Pseudoinversa de Moore-Penrose
Exemplos resolvidos
Exercise list
30 exercises · 7 with worked solution (25%)
- Ex. 117.1UnderstandingAnswer key
Explique a diferença entre autovalores e valores singulares de uma matriz . Para que tipo de matriz eles coincidem?
Show solution
Os valores singulares são as raízes quadradas dos autovalores de . São sempre reais e não-negativos, ao contrário dos autovalores de que podem ser complexos. Para matrizes simétricas positivas semi-definidas, autovalores e valores singulares coincidem. - Ex. 117.2Application
Calcule a SVD de .
Show solution
. Autovalores: 9 e 16. Valores singulares: , . (pois já é diagonal). : colunas — como tem colunas ortonormais escaladas, , .Show step-by-step (with the why)
- Calcule : multiplique transposta por original.
- Ache autovalores de (diagonal, são as entradas ao quadrado, reordenados).
- Valores singulares: em ordem decrescente.
- Vetores : autovetores de .
- Vetores .
- Macete: para diagonal, a SVD é trivial — só reorganize por decrescente.
- Ex. 117.3Application
Calcule a SVD compacta de . Qual o posto de ?
Show solution
. Autovalores: 4 e 0. Valor singular: . . . Posto = 1. - Ex. 117.4ApplicationAnswer key
Se a SVD de tem valores singulares , qual o posto de ? Qual a dimensão de ?
Show solution
Posto = número de valores singulares estritamente positivos. Para com SVD dada, o posto é 2, pois e são ambos positivos. - Ex. 117.5Application
A SVD de tem valores singulares . Calcule o erro de Frobenius e o erro espectral da melhor aproximação de posto 1.
Show solution
Melhor aproximação de posto 1: . Erro de Frobenius: . Erro espectral: . - Ex. 117.6Application
Descreva como calcular a pseudoinversa de com valores singulares e posto 2. Qual a dimensão de ?
Show solution
Usando SVD : . . Solução de mínimos quadrados: . - Ex. 117.7Understanding
Uma matriz tem valores singulares e . Calcule e interprete o que isso significa para resolver numericamente.
Show solution
O número de condicionamento . Um sistema muito mal-condicionado: erros relativos em são amplificados por até em . Dados com 4 algarismos significativos podem perder toda precisão. - Ex. 117.8Application
Uma matriz tem valores singulares . Qual o menor tal que a aproximação de posto explica pelo menos 95% da variância de Frobenius?
Show solution
Variância explicada cumulativa: . Com : . Top-1: . Top-2: . Escolha para 95%.Show step-by-step (with the why)
- Calcule .
- Calcule variância explicada cumulativa até cada .
- Encontre o menor tal que a proporção cumulativa .
- Macete: o scree plot mostra vs ; o "joelho" geralmente corresponde a ~95%.
- Ex. 117.9Application
Mostre que, para uma matriz simétrica positiva semi-definida , a SVD tem e . O que os valores singulares são, nesse caso?
Show solution
Para simétrica PSD, (decomposição espectral) já é uma SVD com e . Os valores singulares são os autovalores (não-negativos por PSD). A SVD coincide com a diagonalização. - Ex. 117.10Modeling
Uma imagem em tons de cinza é uma matriz . Se você guardar a SVD truncada com componentes, quantos floats armazena em comparação com a imagem original? Qual o fator de compressão?
Show solution
Custo de armazenamento SVD truncada: reais. Original: . Taxa de compressão: . Para , : . Fator de compressão 10x. Erro Frobenius relativo: . - Ex. 117.11Understanding
Qual afirmação sobre a interpretação de e na SVD é correta?
Show solution
As primeiras colunas de formam base ortonormal de ; as últimas de . As primeiras colunas de formam base de ; as últimas de . - Ex. 117.12Application
A SVD de tem valores singulares . Calcule a norma espectral e a norma de Frobenius .
Show solution
(norma espectral = maior valor singular). (norma de Frobenius). Para com : , . - Ex. 117.13ApplicationAnswer key
Uma imagem tem posto numérico . Qual a taxa de compressão ao guardar a SVD completa de posto em vez da matriz original?
Show solution
Custo de armazenar todos os componentes: vs . Ainda há compressão mesmo guardando tudo. Percentagem da variância explicada pelos 10 primeiros: depende da distribuição de . - Ex. 117.14Application
Explique geometricamente o que a SVD diz sobre como a matriz transforma a esfera unitária de . Quais são os semi-eixos do elipsoide resultante?
Show solution
e . A matrix faz o máximo stretch por (na direção ) e mínimo por (na direção ). A esfera unitária é mapeada num elipsoide com semi-eixos . - Ex. 117.15Application
Mostre que na SVD se tem para todo . Use isso para verificar que .
Show solution
Pela expansão SVD: para e para . Portanto são base do espaço linha e tem norma . - Ex. 117.16Modeling
Em latent semantic analysis (LSA), a SVD de uma matriz termo-documento é truncada nos maiores valores singulares. Explique conceitualmente por que isso captura "tópicos latentes" nos documentos.
Show solution
LSA: represente documentos como vetores TF-IDF em um espaço de termos. A matrix termo-documento tem SVD. Os primeiros vetores singulares à direita representam "tópicos latentes". Documentos novos são projetados: . Documentos similares ficam próximos nesse espaço. - Ex. 117.17Proof
Enuncie o Teorema de Eckart-Young e esboce a ideia da demonstração de que é de fato a melhor aproximação de posto em norma espectral.
Show solution
Por Eckart-Young, minimiza entre todas as matrizes de posto . Prova: qualquer de posto tem nulidade , logo existe unitário no nulidade de e no espaço de . Então . O mínimo é atingido em . - Ex. 117.18Application
Se tem valores singulares , quais são os valores singulares de ? Calcule e .
Show solution
(pois autovalores de são ). . Para com : , . - Ex. 117.19Application
Uma matrix tem valores singulares . Usando threshold relativo ao maior singular, qual o posto numérico?
Show solution
Posto numérico: número de valores singulares acima de onde é a precisão de máquina (~ para float64). Para com : threshold = , portanto posto numérico = 4 (os 4 primeiros estão acima). - Ex. 117.20Application
Prove que uma matriz ortogonal tem todos os valores singulares iguais a 1. Qual o número de condicionamento de uma matriz ortogonal?
Show solution
Para ortogonal: , logo todos autovalores de são 1, portanto todos valores singulares de são 1. SVD: com . Número de condicionamento: — perfeitamente condicionada. - Ex. 117.21Modeling
Explique como a SVD da matriz de retornos de ações identifica "fatores de risco" num portfólio. O que os primeiros vetores singulares representam economicamente?
Show solution
Modelo fator linear: retornos de ações ao longo de dias formam matriz . SVD de (centralizada): as primeiras colunas de são portfólios-fator. Valores singulares ao quadrado divididos por são autovalores da covariância — variâncias dos fatores. Risco sistemático é capturado pelos primeiros fatores. - Ex. 117.22ApplicationAnswer key
Prove que e têm os mesmos valores singulares não-nulos.
Show solution
Valores singulares de são os mesmos de . Pois , que tem os mesmos autovalores não-nulos que (pelo teorema do traço de produto circular). Assim . - Ex. 117.23ApplicationAnswer key
Derive a solução de ridge regression em termos da SVD de .
Show solution
Solução de mínimos quadrados com regularização Tikhonov: . Para , recupera pseudoinversa. Para grande, encolhe para zero.Show step-by-step (with the why)
- Substitua na fórmula de ridge.
- Simplifique .
- A diagonal de é .
- Macete: ridge = pseudoinversa suavizada — encolhe componentes com .
- Ex. 117.24ApplicationAnswer key
A curva de juros (yield curve) brasileira tem dados diários de yields em 10 maturidades diferentes. SVD dessa matriz identifica 3 fatores principais. Quais são esses fatores, economicamente?
Show solution
Três eixos de deformação: level (todos yields sobem juntos), slope (curta vs longa maturidade), curvature (meio vs extremos). Litterman-Scheinkman (1991) mostraram que esses 3 PCs explicam ~99% da variância da yield curve do Tesouro americano. SVD da matriz de yields diários (tempo × maturidade) extrai esses fatores automaticamente. - Ex. 117.25Application
Para quais valores de a SVD truncada de uma imagem ocupa menos memória que a imagem original? Derive a condição geral.
Show solution
Taxa de compressão para imagem com singulares: . Para ser vantajoso: , ou seja . Para : . Para qualquer há compressão. Para : taxa de aproximadamente 5x. - Ex. 117.26Understanding
A norma de Frobenius é igual a:
Show solution
. Esta é a identidade central que conecta norma de Frobenius com SVD e justifica a fórmula de erro de Eckart-Young. - Ex. 117.27Application
Se tem valores singulares , quais são os valores singulares de ?
Show solution
Valores singulares de : . Pois SVD de ; valores singulares são entradas de . Valores singulares de não têm fórmula simples em geral, mas . - Ex. 117.28Proof
Demonstre que as colunas de e na SVD de formam bases ortonormais dos 4 subespaços fundamentais de . Enuncie cada subespaço e sua base explicitamente.
Show solution
Quatro subespaços pela SVD: (1) (dimensão ); (2) (dimensão ); (3) (dimensão ); (4) (dimensão ). Demonstração: para e para . - Ex. 117.29ModelingAnswer key
Descreva o algoritmo de recomendação por SVD colaborativo: dado uma matriz usuário-item esparsa, como a SVD truncada pode prever ratings ausentes e recomendar itens?
Show solution
Passos: (1) montar matrix de ratings (usuários × itens, esparsa); (2) preencher ausências com média; (3) centralizar por usuário; (4) SVD truncada de rank ; (5) aproximação preenche os ratings faltantes; (6) recomendar os itens com maior valor predito. A ideia é que "gostos latentes" são capturados pelos primeiros fatores. - Ex. 117.30Challenge
Descreva o algoritmo de SVD randomizada de Halko-Martinsson-Tropp (2011) em 5 passos. Por que ele é vantajoso para matrizes grandes de baixo posto numérico? Qual a complexidade comparada com SVD exata?
Show solution
SVD randomizada (Halko-Martinsson-Tropp 2011): (1) Gere aleatória; (2) (sketch da imagem); (3) ; (4) (pequena); (5) SVD de ; (6) . Complexidade: vs para SVD exata. Com oversampling , o erro esperado é próximo ao ótimo de Eckart-Young.
Fontes
- Understanding Linear Algebra — David Austin · Grand Valley State University · CC-BY-SA · Principal referência para geometria, exemplos e exercícios de SVD (§6.3–6.4).
- A First Course in Linear Algebra — Rob Beezer · University of Puget Sound · GNU FDL · Demonstrações rigorosas de existência de SVD, pseudoinversa e subespaços (§SVD).
- Álgebra Linear (REAMAT UFRGS) — Reamat Colaborativo · UFRGS · CC-BY-SA · Exercícios em PT-BR de compressão, posto numérico e regularização.
- Introduction to Applied Linear Algebra (VMLS) — Boyd, Vandenberghe · Stanford · CC-BY-NC-ND · Contexto de aplicações em ML e engenharia.