07. 일곱 번째 수업: 코드로 그리는 인공지능 속 확률의 넓이 (CS & Probabilities)

앞 장에서 이상 적분(무한대 적분)을 통해 끝도 없이 나아가는 구역의 통 면적이 유한한 숫자($1$)로 떨어지는 충격을 겪었습니다. 이 무한 적분은 단순히 신비한 수학 마술이 아니라, 현대 컴퓨터 공학과 인공지능(AI)을 굴러가게 하는 가장 중추적인 통계 ‘확률 분포 면적 데이터’ 와 직결됩니다.


1. 정규 분포 곡선, 그 아래의 넓이는 무조건 $1$ ($100\%$)

인공지능 딥러닝이나 빅데이터 프로그래밍을 할 때 필수적으로 튀어나오는 종 모양의 산맥 곡선, ‘정규분포(Normal Distribution, Gaussian)’ 곡선을 떠올려 봅시다. 가운데 인간 평균키 구간이 산처럼 가장 높이 불룩 튀어나와 있고, 좌우 코끼리 코처럼 무한대($-\infty$, $+\infty$) 양쪽으로 끝없이 낮게 넓어지는 곡선이죠.

데이터 사이언스의 핵심 법칙 중 하나는 “이 종 모양 곡선 아래 전체의 무한한 영토 넓이를 전부 적분 $\int$ 해서 더해보면 무조건 완벽하게 1(즉, 전체 확률 100%) 이 나온다!” 입니다.

  • 즉, $\int_{-\infty}^{\infty} \text{정규분포곡선방정식} dx = \mathbf{1}$ 입니다.

만약 인공지능이 “키 큰 상위 $10\%$ 그룹에 들어갈 확률 구하기” 같은 미션을 받으면, 이 정규분포 적분공식을 메모리에 얹고 $x$ 구간을 우측 곡선(예: $180\text{cm}$부터 우측 무한대 꼬리축 끝까지)으로 쪼개서 잘라낸 면적 부분 넓이를 구함으로써 (예: 적분하니까 두둥 $0.1$ 면적이 나옴 $\rightarrow$ 아 확률이 $10\%$ 구나!) 예측 시스템을 굴립니다. 즉 인공지능이 계산하는 연속된 ‘확률(Probability)’ 의 진짜 정체가, 바로 우리가 죽어라 배우던 미적분 곡선 아래의 공간 ‘넓이(Area)’ 그 자체입니다!

2. 파이썬을 활용한 확률 밀도 면적 계산

파이썬의 세계에서 데이터를 다루는 표준 물리 라이브러리인 Scipy 에는 적분 모듈이 아예 통째로 장착되어 있습니다. 이 지긋지긋한 뉴턴의 $\int$ 기호(수학적 기교인 치환적분이나 극한 한계값 무한 루틴 등 파서)들을 컴퓨터가 단 한 줄의 quad 함수로 박살 내버립니다.

정규분포 확률 밀도 곡선의 오른쪽 절반 (0부터 무한대 $\infty$ 까지의 면적)이 정말로 $1$의 절반, 즉 $0.5$ ($50\%$ 의 확률 면적) 로 누적 합산되는지 적분 코드로 시뮬레이션 해보겠습니다. 정규분포 수식에는 무려 스파게티 지수함수인 자연상수 $e$가 들어갑니다!

# [Python Code] 파이썬을 이용한 무한대(이상 적분) 확률 면적 넓이 구하기
import math
from scipy.integrate import quad
import numpy as np

# 1. 딥러닝에서 사랑하는 표준 정규 분포(Gaussian) 확률 밀도 함수 수식
def normal_pdf(x):
    # 루트(2*파이) 분의 1 에 지수 e 의 -0.5*x^2 을 곱한 극악무도한 수식입니다.
    coeff = 1.0 / math.sqrt(2 * math.pi)
    return coeff * math.exp(-0.5 * (x ** 2))

# 2. 적분의 구간 설정 (0 부터 오른쪽 끝 무한대까지)
start = 0
end = np.inf   # 파이썬의 무한대(Infinity) 선언

# 3. Scipy 의 적분(quadrature) 공격 무기를 장착합니다.
# quad는 적분값(area)과 수학적 오차범위(error) 2가지를 함께 반환합니다.
area, error = quad(normal_pdf, start, end)

print(f"👉 0부터 무한대(∞)까지 종 모양 곡선 우측 절반의 적분 누적 넓이: {area:.5f}")
print(f"(오류 오차 허용치: {error:.1e} 로 매우 정확함)")

실행하면 눈을 의심하게 됩니다. 진짜로 넓이: 0.50000 이라는 극도로 소름 돋게 깔끔한 수치가 튀어나오니까요! $\int_0^\infty$ 라는 어마어마한 우주 끝까지 뻗친 이상 적분을 컴퓨터는 quad() 메서드 한 줄로 $0.001$ 초 만에 연산해버립니다.

3. 요약: 적분, 미래와 차원을 가르는 칼날

아르키메데스가 모래밭에서 나뭇가지로 직사각형을 쪼개던 유치한 장난(“구분구적법”)에서 시작된 적분은, 인류의 손에서 무한히 진화했습니다. 원뿔 1차원 부피로, 뉴턴의 역도함수로, 공중에 뜬 함수의 2차원 교차로, 엔진 3차원 피스톤 물리 에너지(Joule) 일의 양으로, 마침내 무한한 우주의 끝($\infty$)까지 커팅하며 인공지능이 뱉어내는 통계학 곡선 확률(%) 값마저도 통째로 재단해 버렸습니다.

변화무쌍한 우주의 모든 단면을 극한으로 잘게 슬라이스(미분)하여 포개어 합치고($\int$), 이 무한히 쌓이는 면적 빅데이터가 현실 차원에 어떤 의미를 갖는지 예측하는 궁극의 학문, 이것이 적분 파트 1과 파트 2를 관통하는 진정한 미적분학의 아름다움입니다.

서브목차