머신러닝이란 무엇인가요?
머신러닝은 인공지능의 하위 분야로, 명시적인 프로그래밍 없이 시스템이 학습하고 결과를 예측할 수 있도록 합니다. 이는 종종 AI라는 용어와 혼용되는데, 이는 현재까지 실세계에서 가장 큰 영향을 미친 AI 기술이며 비즈니스에서 가장 많이 사용하게 될 기술이기 때문입니다. 챗봇, 제품 추천, 스팸 필터, 자율 주행차 등 수많은 시스템이 머신러닝을 활용하며, Siri나 Cortana 같은 “지능형 에이전트”들도 마찬가지입니다.
이 포춘 기사 “What is the Difference Between Artificial Intelligence and Machine Learning”에서 저자는 AI와 머신러닝의 차이점을 명확하게 설명합니다. 그는 “AI는 우리가 똑똑하다고 간주하는 방식으로 작업을 수행할 수 있는 기계의 더 광범위한 개념”이라고 정의하는 한편, 머신러닝은 “우리가 기계에 데이터에 대한 접근 권한을 주고 스스로 학습하게 할 수 있다는 아이디어에 기반한 AI의 현재 응용 분야”라고 설명합니다.
머신러닝은 어떻게 작동하나요?
결정을 내리는 알고리즘과 규칙을 직접 작성하거나, 규칙 세트, 예외, 필터를 사용하여 컴퓨터를 “지능적으로” 프로그래밍하려고 시도하는 대신, 머신러닝은 컴퓨터 시스템이 대규모 데이터 세트로부터 학습하여 결정을 내리도록 가르칩니다. 규칙 기반 시스템은 현실 세계의 복잡성을 고려해야 할 때 빠르게 취약해지지만, 머신러닝은 학습에 사용되는 데이터의 패턴을 표현하고 일반화하는 모델을 생성할 수 있으며, 이 모델을 사용하여 새로운 정보를 해석하고 분석할 수 있습니다.
머신러닝은 텍스트와 이미지 및 비디오 속 객체를 인식하고, 데이터 내의 연관 관계를 찾거나 데이터를 클러스터로 분할하는 능력을 포함하는 분류(classification)에 적합합니다. 머신러닝은 또한 이벤트의 가능성을 계산하거나 결과를 예측하는 것과 같은 예측(prediction)에도 능숙합니다. 머신러닝은 누락된 데이터를 생성하는 데 사용될 수도 있습니다. 예를 들어, CorelDRAW의 최신 버전은 펜 도구로 만든 여러 개의 거친 선으로부터 사용자가 그리려고 하는 부드러운 선을 보간(interpolate)하기 위해 머신러닝을 사용합니다.
두 가지 머신러닝 모드: 지도 학습과 비지도 학습
소프트웨어가 알고리즘에게 우리가 발견하고자 하는 것을 구체적으로 알려주는 방식으로 사용될 때, 이를 지도 학습(supervised ML)이라고 합니다. 머신러닝 알고리즘은 ‘타겟’ 변수 또는 속성을 사용하여 해당 변수의 데이터에 기반하여 모델을 ‘훈련’합니다.
비지도 학습(Unsupervised ML)은 인간이 옆에서 안내를 제공하지 않아도 기계가 복잡한 프로세스와 패턴을 식별하는 방법을 배울 때입니다. 이는 클러스터링을 응용 분야로 사용하며, 데이터 세트의 레코드가 자동으로 그룹으로 분할됩니다. 이 그룹들은 자체 그룹의 레코드와는 유사하지만 다른 그룹의 레코드와는 유사하지 않습니다.
