데이터를 벡터와 행렬로 표기하는 법

February 28, 2026

딥러닝에서 행렬과 벡터는 어떤 식으로 쓰일까?

딥러닝에서 모든 데이터는 숫자들의 묶음인 스칼라, 벡터, 행렬, 텐서로 표현된다.

딥러닝에서 행렬과 벡터는 어떤 식으로 쓰일까?

딥러닝에서 모든 데이터는 숫자들의 묶음인 스칼라, 벡터, 행렬, 텐서로 표현된다.

신경망의 기본 연산: 행렬 곱 (Matrix Multiplication)

신경망의 각 층이 하는 일은 입력 데이터에 가중치를 곱하고 편향을 더하는 것이다.

$y = f(Wx + b)$

$W$는 가중치 행렬이고, $b$ 는 편향, $x$는 입력 벡터이다.
$f$는 신경망의 기본 연산($y = Wx + b$)에 비선형성을 추가하여 복잡한 데이터를 학습할 수 있도록 해야 한다.(만약 3x3 행렬일 경우, 3x3 행렬 안의 9개의 스칼라 좌표에 동시다발적으로 활성화함수($f$)를Projection한다고 생각을 하면 된다.)
수만 개의 파라미터를 일일이 계산하는 대신, 행렬 곱을 사용하면 수만 개의 연산을 한 번에 병렬로 처리가 가능하다.

표기

데이터 1: $x_1 = \begin{bmatrix} 1 \ 2 \end{bmatrix}$

데이터 2: $x_2 = \begin{bmatrix} 3 \ 4 \end{bmatrix}$

행렬 $X$: $[x_1, x_2] = \begin{bmatrix} 1 & 3 \ 2 & 4 \end{bmatrix}$

데이터 1$:x_1 =$ $[1, 2]$

데이터 2: $x_2 =$ $[3, 4]$

행렬 $X$: $\begin{bmatrix} x_1 \ x_2 \end{bmatrix}$ $=$ $\begin{bmatrix} 1 & 2 \ 3 & 4 \end{bmatrix}$

아래로 쌓는 이유

딥러닝에서 행렬과 벡터는 어떤 식으로 쓰일까?