메뉴 건너뛰기

[일반적인 분석 테스트 | 이상치(Outliers)]

원문 출처: https://www.arbutussoftware.com/en/popular-tests-/outliers

 

Outliers(이상치)는 중요성이 과거의 기대치를 훨씬 뛰어넘는 처리방식(transactions)입니다. 크기(Size) 때문에 처리 과정에서 오류(error)로 인해 왜곡/오기(misstatements)된 결과가 나올 수 있습니다. 매우 큰 outlier(이상치)는 또한 모집단(population)에 대해 "normal(정상)"으로 간주되는 것을 왜곡할 수도 있습니다.

 

이상치(Outliers)

 

모집단 레벨 테스트(Population-Level Testing)

Outliers(이상치)에 대한 일반적인 기준은 value(값)가 주어진 population(모집단)의 average(평균)보다 2배 이상 높은 standard deviation(표준 편차)이라는 것입니다.
 
Statistics command(명령)는 다음과 같은 평균(mean)과 standard deviation(표준 편차)를 빠르게 생성할 수 있습니다.
 
Population-Level Testing.png1.jpg

Outliers(이상치)를 식별하려면, filter 를 생성하십시오.

 

Total_Cost > 1491 + (2 * 3155.49)

 

싱글 카테고리 레벨 테스트(Single-Category-Level Testing)

향상된 Summarize command(명령)를 사용하여 vendor(공급업체)와 같은 카테고리 레벨에서 outliers(이상치)를 식별할 수도 있습니다.
  1. Summarize command 에서 Vendor field 를 key field 로 선택
     
  2. "Fields to process(처리할 필드)" 대화상자(dialog)를 열고
     
  3. "Amount(금액)"를 두 번 선택
     
  4. TypeAVG 및 STDEV 로 변경
    Single category - level testing 1.jpg

    Output file(출력 파일)에는 각 vendor(공급업체)의 mean(평균) 및 standard deviation(표준 편차)가 포함됩니다.
     

  5. SD threshold(표준편차 임계치)를 2로 하는 computed field (계산된 필드)를 생성합니다.
    AVG_Amount + (2 * STDDEV_Amount)


    Single category - level testing 2.jpg
     
  6. 트랜잭션 파일을 열고
     
  7. Vendor threshold(공급업체 임계치) 파일에 Join 하고, threshold field(임계치 필드)를 output(출력)에 추가
     
  8. Amount > Vendor_Threshold filter(필터) 적용

    Single category - level testing 3.jpg

멀티 카테고리 레벨 테스트(Multiple-Category-Level Testing)

카테고리 테스트에 멀티 레벨를 추가할 수도 있습니다.
 
예를 들어, Vendor-Product(공급업체-제품) 조합으로 테스트하여, 가격 일관성(pricing consistency)을 테스트할 수 있습니다.
 
Vendor 및 Product ID(공급업체 및 제품 ID)를 key field 로 사용하여, 이전 예제와 동일한 단계를 수행합니다.