r lda 예제

August 2, 2019 at 10:00 am

위의 확률 함수는 아래와 같이 LOG(로그 배당률이 더 구체적으로)의 함수로 파생될 수 있습니다. 방정식에서 로그 홀수는 입력 X와 선형적으로 관련이 있음이 분명합니다. 로그 홀수 방정식은 입력(X1, X2…, Xp) 값의 단위 변경에 대해 어떤 일이 발생할지 더 잘 알 수 있습니다. 예를 들어, 예측 X1의 한 단위의 변화와 다른 모든 예측 변수를 일정하게 유지하면 β1(X1의 관련 공동 효율)에 의한 확률로 로그 배당률의 변화가 발생하므로 선형 판별 분석은 사례 데이터 세트(관찰이라고도 함)를 사용합니다. 입력. 각 경우에 대해 클래스와 여러 예측 변수(숫자)를 정의하는 범주형 변수가 있어야 합니다. 이 입력 데이터를 아래와 같이 행렬로 시각화하는 경우가 많으며 각 사례는 행이고 각 변수는 열입니다. 이 예제에서는 범주형 변수를 “클래스”라고 하며 예측 변수(숫자)는 다른 열입니다. 우리는 이것이 작업하기 쉬운 데이터 세트임을 알 수 있지만, 아래쪽 패널에서 여전히 일부 겹치는 동안 versicolor specie가 위쪽 패널의 virginica 에서 잘 분리되어 있음을 명확하게 볼 수 있습니다. LDA가 데이터의 클래스 간 분산의 대부분을 유지하려고 시도하는 동안 PCA는 데이터의 가변성의 대부분을 유지하려고 하기 때문에 이러한 종류의 차이는 예상됩니다.

또한 이 예제에서 첫 번째 LD는 시력이 완벽하지 는 않지만 일반적으로 자동차, 밴 및 버스의 차이를 알 수 있습니다. 나는 사브 9000하지만 오펠 만타에서 구별하지 않을 수 있습니다. 그들은 약 30 년 전에 만든 자동차입니다 (나는 기억할 수 없다!). 내 낯선에도 불구하고, 나는 둘 다의 몇 가지 예를 주면 괜찮은 일을 할 수 있기를 바랍니다. MDA는 LDA를 능가할 수 있으며 QDA는 아래와 같이 몇 가지 상황입니다. 이 예제 데이터에서는 3개의 기본 개인 그룹이 있으며 각 그룹은 인접한 하위 그룹이 3개 없습니다. 플롯의 검은색 실선은 LDA, QDA 및 MDA의 결정 경계를 나타냅니다. MDA 분류기가 LDA 및 QDA에 비해 하위 클래스를 올바르게 식별한 것을 알 수 있는데, 이는 이 데이터를 모델링하는 데 전혀 좋지 않았습니다.