top of page

"AI"에서 통계의 중요성

1. AI 가 무엇인가?

대량의 데이터에서 특징을 분석하고 경험치 및 정확도를 높인 예측· 분류 프로그램 기능


2. 머신러닝? 딥러닝?

AI, 머신러닝, 딥러닝의 관계를 그림으로 나타내면 다음과 같습니다.


◾ 머신러닝

AI를 "대량의 데이터에서 특징을 분석하고 경험치 및 정확도를 높인 예측 · 분류 프로그램 기능"이라고 했을 때, 머신러닝은 AI를 구현하는 방법의 하나로 대량 데이터에서 연관성을 찾아내어 판단과 예측을 하는 시스템 입니다. 예를 들어, 이미지 인식 기능, 바둑 AI 등은 머신러닝 시스템을 이용하여 만들어졌다고 할 수 있습니다.


◾︎ 딥러닝

머신러닝은 대량의 데이터에서 규칙성이나 연관성을 찾아내어 판단과 예측을 하는 시스템입니다. 그러기 위해서는 "색"이나 "모양" 같이 주목할만한 특징(매개 변수)을 인간이 지정해줘야 합니다.


딥러닝은 머신러닝의 많은 방법 중 인간의 뇌세포 구조와 유사한 방법인 뉴럴 네트워크 구조(ANN, Artificial Neural Network)를 이용하는 방법이며, 빅데이터를 기반으로 스스로 학습하며 판단하는 기술입니다. 머신러닝에 새로운 메커니즘을 추가한 머신러닝의 한 분야라고 하면 알기 쉽습니다.



3. 통계학의 중요성

위에서 AI와 관련된 정의에서 공통점은 대량의 데이터를 다룬다는 점이며, 많은 데이터의 연관성과 규칙을 찾기 위해서는 통계학 기법이 필요합니다. 데이터가 많다는 것 자체는 아무 쓸모가 없으며, 필요한 목적에 따라 데이터를 활용하여 인사이트를 도출할 때 비로소 데이터에 의미가 부여됩니다. 여기서 통계학은 데이터에 '의미'를 부여하는 역할을 합니다.

특히 통계학은 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 분야인 만큼, 데이터 가공 및 활용에 큰 도움이 됩니다. 통계학을 통해 수많은 데이터 속에서 특정한 패턴을 찾으면 각각의 패턴은 특정한 분포와 확률을 지니고, 이러한 패턴은 풀고 싶은 문제에 대한 단서를 제공할 수 있습니다.

통계학은 단순히 숫자를 계산하는 방법만 배우는 학문이 아닙니다. 세상에 존재하는 다양한 패턴과 순서를 찾고, 자연과 사회 현상의 본질에 관해 설명하는 학문입니다. 정보의 양이 많아지면서 사회는 점점 더 복잡해졌으며, 생각과 정보를 논리적으로 정리하는 역량이 꼭 필요합니다.



4. "AI" 와 "통계"의 관계


"데이터 기반으로 사실을 예측한다"


그렇다면, AI의 목적은 크게 "입력 데이터를 바탕으로 통계학적 계산을 하여 '예측'을 하고, 정해진 기준을 바탕으로 확률을 계산하여 '분류'를 한다." 고 할 수 있습니다. 기능에 대한 이론을 수학적으로 세울 수 있으며, 그 구성의 가장 큰 부분을 차지하는 것이 통계 라고 할 수 있습니다.

bottom of page