버츄얼 유튜버로 현대대수학을 배워보자 - 3


Play

버튜버 연떠 님의 현대 대수학 강의

행렬식의 치환 표현

n×nn \times n 행렬 A=(aij)A = (a_{ij}) 의 행렬식 det(A)\det(A) 는 치환을 이용해 다음과 같이 정의할 수 있다.

det(A)=σSnsgn(σ)a1,σ(1)a2,σ(2)an,σ(n).\det(A) = \sum_{\sigma \in S_n} \operatorname{sgn}(\sigma)\, a_{1,\sigma(1)} a_{2,\sigma(2)} \cdots a_{n,\sigma(n)}.
  • 각 항 a1,σ(1)an,σ(n)a_{1,\sigma(1)} \cdots a_{n,\sigma(n)} 는 각 행과 각 열에서 정확히 하나씩 원소를 골라 곱한 것.

이 정의로부터 행을 서로 바꾸면 전치(홀치환)가 추가되므로 행렬식의 부호가 바뀌고, 두 행이 같으면 대응하는 치환합이 상쇄되어 행렬식이 0 이 되는 등, 선형대수에서 잘 알려진 성질들이 자연스럽게 발생한다.


여인수와 여인수 전개(Cofactor expansion, Laplace expansion)

n×nn \times n 행렬 AA 에서 (i,j)(i,j) 원소 aija_{ij} 의 소행렬식 MijM_{ij}AA 에서 ii번째 행과 jj번째 열을 제거해 얻은 (n1)×(n1)(n-1)\times(n-1) 행렬의 행렬식이다.

Mij=det(A(i,j)),M_{ij} = \det(A_{(i,j)}),

여기서 A(i,j)A_{(i,j)}ii행, jj열을 삭제한 부분행렬이다. 이때 여인수(cofactor) CijC_{ij}

Cij=(1)i+jMijC_{ij} = (-1)^{i+j} M_{ij}

로 정의한다.

행렬식은 한 행(또는 한 열)에 대해 여인수를 이용해 전개할 수 있다. ii번째 행에 대한 여인수 전개는 다음과 같다.

det(A)=j=1naijCij.\det(A) = \sum_{j=1}^n a_{ij} C_{ij}.

마찬가지로, jj번째 열에 대해

det(A)=i=1naijCij\det(A) = \sum_{i=1}^n a_{ij} C_{ij}

로 전개할 수 있다.

이때 (1)i+j(-1)^{i+j} 라는 부호 패턴은, 치환 표현에서 해당 원소를 고정하고 나머지 인덱스를 치환하는 과정에서 나오는 부호와 일관되게 맞춰져 있다.


수반행렬(adjoint)과 역행렬

행렬 AA 의 수반행렬(또는 딸림행렬) adj(A)\operatorname{adj}(A) 는 여인수들을 전치해서 만든 행렬이다.

  • 먼저 여인수 행렬 C=(Cij)C = (C_{ij}) 를 만든다.
  • 그런 다음 adj(A)=CT\operatorname{adj}(A) = C^T 로 정의한다.

행렬 A와 수반행렬의 곱에서 대각성분은 여인수 전개를 통해 모두 행렬식 det(A)가 되는 것을 알 수 있고, 그 외의 성분은 상쇄되어 0이 됨을 알 수 있다. 이로부터 다음과 같은 관계를 이끌어 낼 수 있다. (매우 중요)

Aadj(A)=adj(A)A=det(A)In.A \cdot \operatorname{adj}(A) = \operatorname{adj}(A) \cdot A = \det(A)\, I_n.

이로부터 det(A)0\det(A) \ne 0 인 경우 AA 는 가역이고, 역행렬은

A1=1det(A)adj(A)A^{-1} = \frac{1}{\det(A)}\, \operatorname{adj}(A)

로 주어진다.

  • 행렬식은 치환들의 부호(짝치환/홀치환)에 의해 정의된다.
  • 여인수는 특정 행·열을 고정한 상태에서 나머지 부분행렬의 행렬식(치환합)을 부호와 함께 모아 둔 것이다.
  • 흔히 선형대수에서 사용하는 수반행렬 및 역행렬 공식은 이 구조를 행렬 형태로 정리한 결과라고 볼 수 있다.

반데르몽드 행렬과 행렬식

nn개의 수 x1,,xnx_1,\dots,x_n 에 대해 반데르몽드 행렬(Vandermonde matrix) 는

V(x1,,xn)=(1x1x12x1n11x2x22x2n11xnxn2xnn1)V(x_1,\dots,x_n) = \begin{pmatrix} 1 & x_1 & x_1^2 & \cdots & x_1^{n-1} \\ 1 & x_2 & x_2^2 & \cdots & x_2^{n-1} \\ \vdots & \vdots & \vdots & & \vdots \\ 1 & x_n & x_n^2 & \cdots & x_n^{n-1} \end{pmatrix}

로 정의한다.

이 행렬의 행렬식(반데르몽드 행렬식)은 방정식을 구성하는 근의 차이의 곱인

detV(x1,,xn)=1i<jn(xjxi)\det V(x_1,\dots,x_n) = \prod_{1 \le i < j \le n} (x_j - x_i)

로 주어진다.

  • 모든 xix_i가 서로 다르면 (xjxi)0(x_j - x_i) \ne 0 이므로 detV0\det V \ne 0 이고, 따라서 VV 는 가역이다. 당연하게 중근이 존재하면 detV=0\det V = 0 이다.
  • 이는 근들의 서로 다른 정도를 측정하는 양으로, 다항식의 판별식(discriminant)과 밀접하게 연결된다.

반데르몽드 행렬식 제곱값의 의미

아래와 같이 표현되는 반데르몽드 행렬식의 제곱값은 중요한 의미를 가지는 대칭다항식이 된다.

Δ(x1,,xn)2=(i<j(xjxi))2=i<j(xjxi)2\Delta(x_1,\dots,x_n)^2 = \left(\prod_{i<j}(x_j - x_i)\right)^2 = \prod_{i<j}(x_j - x_i)^2

반데르몽드 행렬식 자체는 Δ(x1,,xn)\Delta(x_1,\dots,x_n) 은 변수들에 대해 반대칭이다.

  • 두 변수 xi,xjx_i, x_j 를 서로 바꾸면 각 차이 (xjxi)(x_j - x_i) 의 부호가 하나 바뀌므로, 전체 곱의 부호가 1-1 이 된다.
  • 따라서 Δ\Delta 는 치환의 부호 sgn(σ)\operatorname{sgn}(\sigma) 만큼 바뀌는 교대적(antisymmetric) 다항식이다.

하지만 Δ2\Delta^2

Δ2=i<j(xjxi)2\Delta^2 = \prod_{i<j}(x_j - x_i)^2

변수들을 어떻게 치환하던지 각 차이의 제곱은 그대로이다.

  • 두 변수 xi,xjx_i, x_j 를 바꿔도 (xjxi)2=(xixj)2(x_j - x_i)^2 = (x_i - x_j)^2 이므로 부호가 사라진다.
  • 따라서 Δ2\Delta^2 는 대칭다항식이다.

이 때문에 대칭다항식과 비에트 정리에 의해 Δ2\Delta^2 는 기본대칭다항식 e1,,ene_1,\dots,e_n 에 대한 조합으로 표현할 수 있다. 이로부터 다음과 같은 인사이트를 얻을 수 있다.

  • Δ2\Delta^2αi\alpha_i 들에 대한 대칭다항식이므로, 기본대칭다항식 eke_k (즉, 계수들의 다항식)으로 표현된다.
  • 따라서 판별식 D(f)D(f)a0,,ana_0,\dots,a_n 의 다항식으로 정리된다 (일반적인 판별식 공식들이 도출됨).
  • 이러한 성질로부터 판별식처럼 계수만으로 표현되는 불변량을 만들 때 자연스럽게 Δ2\Delta^2 가 등장한다.

2차 방정식을 거듭제곱근으로 풀 수 있는 이유

반데르몽드 행렬식을 통해 2차 방정식을 거듭제곱근으로 풀 수 있는 이유를 살펴보자.

2차 방정식

ax2+bx+c=0ax^2 + bx + c = 0

의 근을 α,β\alpha,\beta 라고 하면, 계수와의 관계는

α+β=ba,αβ=ca\alpha + \beta = -\frac{b}{a}, \qquad \alpha\beta = \frac{c}{a}

이고, 판별식은 다음과 같다.

D=b24acD = b^2 - 4ac

반데르몽드 판별식의 제곱값으로부터

D=a2Δ2=a2(αβ)2D = a^2\Delta^2 = a^2(\alpha - \beta)^2

이므로

αβ=±Da\alpha - \beta = \pm \frac{\sqrt{D}}{a}

가 된다.

  • α+β\alpha + \beta 와 곱 αβ\alpha\beta 는 근들의 대칭다항식이므로, 계수 a,b,ca,b,c 만으로 바로 표현된다.
  • 나머지 비대칭 정보인 αβ\alpha - \beta 는 판별식의 제곱근 D\sqrt{D} 로 회복된다.
  • 이렇게 해서 두 근은 α=(α+β)+(αβ)2,β=(α+β)(αβ)2\alpha = \frac{(\alpha + \beta) + (\alpha - \beta)}{2}, \quad \beta = \frac{(\alpha + \beta) - (\alpha - \beta)}{2} 로 써서, 결국 x=b±b24ac2ax = \frac{-b \pm \sqrt{b^2 - 4ac}}{2a} 라는 거듭제곱근(제곱근)을 포함한 공식이 나온다.

2차 다항식에 대해 근들의 대칭다항식(합, 곱)은 이미 계수에 포함되어 있어서 새로운 연산이 필요 없다. 남은 정보는 (αβ)(\alpha - \beta) 하나이고, 이는 (αβ)2(\alpha - \beta)^2 가 판별식과 비례하므로 제곱근 하나만 추가하면 된다.

행렬식과 역행렬 개념 자체는 고등학생때 부터 많이 사용해서 무난하게 들었는데 치환을 통해 행렬식을 정의하는 내용을 처음 들어서 흥미로웠다.