Statistics Toolbox

다변량 통계

다변량 통계는 여러 변수를 분석할 수 있는 알고리즘과 함수를 제공합니다. 일반적인 응용 프로그램에는 기능 변형 및 기능 선택을 통한 차원 축소, 산점도 행렬과 일반적인 다차원 확장과 같은 시각화 기술을 통한 변수 간 관계 탐구가 포함됩니다.

주 성분 분석(PCA)을 사용한 직교 회귀 피팅(예)
데밍(Deming) 회귀(총 최소 제곱)를 구현합니다.

기능 변환

기능 변환(기능 추출이라고도 함)은 기존 기능을 설명 기능이 덜 손실되는 새로운 기능(예측자 변수)으로 바꾸는 차원 축소 기술입니다. 이 툴박스는 기능 변환을 위해 다음 접근 방법을 제공합니다.

부분 최소 제곱 회귀 및 주 구성 요소 회귀(예)
상호 연관성이 높은 예측자가 존재하는 응답 변수를 모델링합니다.

기능 선택

특징 선택은 데이터 모델링에 있어서 최적의 예측력을 제공하는 측정된 기능(예측자 변수)의 하위 집합만 선택하는 차원 축소 기법입니다. 고차원 데이터를 처리하거나 비용 문제로 모든 기능에 대한 데이터 수집이 어려울 때 유용합니다.

특징 선택 메서드에는 다음이 포함됩니다.

  • 단계적 회귀는 예측 정확도가 더 이상 향상될 수 없을 때까지 기능을 순차적으로 추가하거나 제거합니다. 선형 회귀 또는 일반화된 선형 회귀 알고리즘과 함께 사용할 수 있습니다.
  • 순차적 기능 선택은 단계적 회귀와 유사하며 모든 관리식 학습 알고리즘 및 사용자 지정 성능 측정과 함께 사용할 수 있습니다.
  • 정규화(lasso 및 elastic nets)는 축소 추정을 사용하여 무게(계수)를 0으로 줄임으로써 중복 기능을 제거합니다.

특징 선택의 용도:

  • 기계 학습 알고리즘의 정확도 향상
  • 매우 고차원적인 데이터의 성능 향상
  • 모델 해석 가능성을 향상
  • 오버피팅 방지
고차원적 데이터 분류를 위한 기능 선택(예)
암 감지를 위한 중요 기능 선택.

다변량 시각화

Statistics Toolbox는 다음을 포함하여 다변량 데이터를 시각적으로 탐색할 수 있는 그래프와 차트를 제공합니다.

  • 산점도 행렬
  • Dendogram
  • 행렬도 분석
  • 평행 좌표계
  • Andrews 플롯
  • 그림문자 플롯
Matrice de nuage de points groupée montrant comment l’année du modèle a un impact sur les différentes variables.
모델 연식의 서로 다른 변수에 대한 영향을 보여주는 그룹 산점도 행렬
Diagramme de double projection montrant les trois premiers chargements à partir de l’analyse en composantes principales.
주 성분 분석(PCA)에서 불러온 첫 3개 결과를 보여주는 행렬도 분석
Diagramme d’Andrews montrant comment le pays d’origine a un impact sur les variables.
원산지의 변수에 대한 영향을 보여주는 Andrews 플롯
다음: 확률 분포

평가판 사용 Statistics Toolbox

평가판 신청

Machine Learning with MATLAB

온라인 세미나 보기