Statistics Toolbox

기계 학습

기계 학습 알고리즘은 연산 메서드를 사용하여 미리 결정된 방정식을 모델로 가정하지 않고 데이터로부터 직접 정보를 “학습”합니다. 학습에 사용 가능한 샘플 수를 늘리면 그에 따라 성능을 향상시킬 수 있습니다.

MATLAB을 활용한 기계 학습 3:02
MATLAB®으로 데이터를 준비하고 기계 학습을 훈련합니다

분류화

분류화 알고리즘을 사용하면 하나 이상의 예측자를 가진 함수로서 범주형 응답 변수를 모델링할 수 있습니다. Statistics Toolbox는 다음을 포함한 다양한 모수적 및 비모수적 분류화 알고리즘을 제공합니다.

분류화 소개 9:00
데이터를 분류하기 위한 예측 모델을 개발합니다.

다음과 같은 기술을 사용하여 생성된 분류화 모델의 적합도를 평가할 수 있습니다.

클러스터 분석

Statistics Toolbox는 k-평균, hierarchical clustering, Gaussian 혼합 모델 또는 hidden Markov 모델을 사용하여 데이터를 분석하는 여러 알고리즘을 제공합니다. 클러스터 수를 알 수 없을 때 클러스터 평가 기법을 통해 지정된 메트릭을 기준으로 데이터에 존재하는 클러스터의 수를 파악할 수 있습니다.

Graphique montrant des modèles naturels dans les profils d’expression génique obtenus à partir de levure de boulanger. La procédure d’analyse en composantes principales et les algorithmes de classement par k-means sont utilisés pour trouver des clusters dans les données de profils.
제빵에 쓰이는 이스트에서 얻은 유전자 발현 프로파일의 자연 패턴을 보여주는 플롯. PCA(Principal component analysis)와 k-평균 클러스터링 알고리즘은 프로파일 데이터에서 클러스터를 찾는 데 사용됩니다.
K-평균을 사용한 유전자 클러스터링(예)
유전자 발현 데이터를 조사함으로써 유전자 발현 프로파일에서 패턴을 감지하는 방법을 배우십시오.
Modèle de mélange gaussien à deux composants qui s’adapte à un mélange de gaussiennes bivariées.
이변(bivariate) Gaussian의 혼합에 맞는 2개 요소(two-component) Gaussian 혼합 모델
Sortie à partir de l’application d’un algorithme de classement sur le même exemple.
동일한 예에 클러스터링 알고리즘을 적용한 결과
Dendrogramme qui affiche un modèle avec 4 clusters.
4개의 클러스터를 가진 모델을 보여주는 Dendrogram 플롯
클러스터 분석(예)
k-평균 및 계층 클러스터링을 사용하여 데이터의 자연적 그룹화를 찾습니다.

회귀

회귀 알고리즘을 사용하면 하나 이상의 예측자를 가진 함수로서 연속 응답 변수를 모델링할 수 있습니다. Statistics Toolbox는 다음을 포함한 다양한 모수적 및 비모수적 분류화 알고리즘을 제공합니다.

계산 통계학: MATLAB을 사용한 특징 선택(feature selection), 정규화(regularization) 및 축소 36:51
상호 연관된 데이터가 있을 때 정확한 모델을 개발하는 방법을 알아봅니다.

다음: 다변량 통계

평가판 사용 Statistics Toolbox

평가판 신청

Machine Learning with MATLAB

온라인 세미나 보기