메뉴 건너뛰기

[Profile command(명령) 살펴보기 - V8 릴리즈]

 

1. Profile command(명령) 개요

 

메뉴 위치: Analyzer > ANALYZE 메뉴에서 찾을 수 있습니다.

 

확장된 Profile command(명령)는 Analyzer Plus v8 에서만 사용할 수 있는 기능입니다.

Tip: Analyzer 에서 테이블의 세부 처리를 시작하기 전에 Statistics command(통계 명령)를 사용하여 해당 테이블의 개요(overview)를 얻습니다.

 

Profile command 를 사용하여 테이블에서 선택한 하나 이상의 필드에 요약 개요(summary overview)와 주요 메트릭(key metrics)을 제공합니다.

 

Profile command 는 테이블의 세부 처리를 시작하기 전에 데이터를 이해하고 데이터 내에서 발생 가능한 이상 징후(anomalies)를 식별하는데 도움이 됩니다. 

 

 

2. 확장된 Results Output(결과 출력)

 

Profile command 의 results(결과)는 View(보기) 영역에 나타나는 Extended Results(확장 결과) 탭에 표 형식 포맷(tabular format)으로 제공됩니다. 처리된 각 필드는 Extended Results(확장 결과) 탭에 열로 나타납니다.

 

표 형식 결과(Tabular result)의 주요 지표(key metric) 설명 위에 마우스를 놓으면 메트릭(metric)의 목적을 설명하는 도구 팁이 제공됩니다.

 

많은 필드가 프로파일링 되면 Extended Results(확장 결과) 탭의 Category(카테고리) 열 상단에 있는 ◀ 및 ▶ 를 사용하여 필드 목록을 스크롤합니다. Extended Results(확장 결과) 탭의 필드 목록을 확장하고 확인란 열을 제거/복원하려면 Category(카테고리) 열 상단의 ◀▶ 를 클릭합니다.

 

 

3. 드릴다운 및 시각화(Drill Down & Visualization)

 

Extended Profile(확장 프로파일) 표 형식 결과(tabular results)의 세부 필드 메트릭(metrics) 중 일부를 클릭하면 레코드별로 지원 데이터를 드릴다운(drill down)할 수 있습니다. 그러면 클릭한 세부 필드 메트릭(metric) 값(value)에 대해 필터링된(filtered) View(보기)가 생성됩니다. 

 

기타 자세한 필드 메트릭(metrics)을 클릭하면 Extended Results(확장 결과) 탭의 오른쪽 상단에 표시되는 메트릭(metric)의 시각화(visualization)가 시작됩니다. 시각화(Visualization)는 다음과 같습니다.

  • 시각화(Visualization) 오른쪽 상단의 풀다운을 사용하여 막대(bar), 열(column) 또는 파이(pie) 시각화로 변경합니다.
  • 시각화(Visualization)에서 요소(element)를 클릭하여 레코드별로 지원 데이터를 드릴다운(drilled down)합니다.

 

4. 특정 열(Column) 선택하기

 

단일 열(Single column)에 초점을 맞추려면 열 제목(column heading)을 클릭합니다. Extended Results(확장 결과) 테이블에는 키 필드 개요 메트릭((key field overview metrics))에서 선택한 필드에 대한 시각화(visualization)가 표시됩니다.

 

• 문자(Character) 및 날짜(date) 필드의 경우:

  • Most Common Values (가장 공통적인 값)
  • Most Common Formats (가장 공통적인 포맷)
  • Highest (최고)
  • Lowest (최저)

 

• 숫자(Numeric) 필드의 경우:

  • Most Common Values (가장 공통적인 값)
  • Highest (최고)
  • Lowest (최저)
  • Stratify (계층화)

 

• 논리(Logical) 필드의 경우:

  • Most Common Values (가장 공통적인 값)
  • Blanks (공백)
  • Types (타입)

 

각 키 메트릭(key metric) 시각화(visualization)의 경우 각 시각화(visualization)의 오른쪽 상단에 있는 일반 시각화 타입 풀다운 목록(pull down)에서 시각화 타입을 변경할 수 있습니다.

 

시각화(Visualization)를 클릭하면 필터링된(filtered) 보기(view) 탭으로 드릴다운(drill down)됩니다.

 

기본(Default) Extended Results(확장 결과) 탭을 복원하려면 오른쪽 상단에 있는 X 를 클릭합니다.

 

 

5. Results(결과) 필터링(Filtering)

 

프로파일링(Profiled)할 필드를 두 개 이상 선택하면, Enhanced(향상된) 표 형식(tabular) result(결과)에 프로파일링된 각 필드에 대한 열(column)이 표시됩니다. 특정 필드 또는 특정 필드 카테고리(numeric(숫자)/character(문자)/date(날짜)/logical(논리)만 표시하도록 표 형식(tabular) result(결과)를 제한할 수 있습니다.

 

표시된 results(결과)를 변경하려면, 표 형식(tabular) result(결과)의 왼쪽 상단에 프로파일링된(profiled) 각 필드 카테고리(category)와 프로파일링된 각 필드에 대한 체크박스의 세로 목록이 표시됩니다. 표 형식(Tabular) result(결과)에 표시되는 필드 카테고리 또는 필드 results(결과)를 간소화하려면 체크박스를 선택(check)하거나 선택 취소하기(de-select)만 하면 됩니다.

 

 

6. 카테고리(Categories)

 

표 형식(Tabular)의 results(결과)에 있는 메트릭(metrics)은 Category(카테고리) 열(column)에 표시되는 카테고리(Category)로 그룹화(grouped)됩니다.

  • Verification (검증)
  • Statistics (통계)
  • Distribution (분포)
  • Date/Time (날짜/시간)
  • Outliers (이상치)
  • Formats (포맷)

이러한 각 카테고리(categories)를 확장(expanded)하거나 축소(contracted)하여 각 카테고리(category)의 메트릭(metrics)을 표시하거나 숨길 수 있습니다.

 

 

7. Parameters(파라미터)

 

Profile command(명령)에는 아래에 설명된 파라미터 외에도 First, If, Next 및 While command parameter(명령 파라미터)가 있습니다. 이러한 파라이터에 대한 설명은 도움말 Command Parameters(명령 파라미터)를 참조하십시오.

 

 

8. Fields to Profile(Profile 할 필드)

 

Profile 할 필드를 지정합니다. 목록 상자(List box)에서 필드를 선택하거나, [Choose(선택)]을 클릭하여 Selected Fields(선택한 필드) 대화 상자(dialog)를 표시합니다. 자세한 내용은 도움말 Dialog Boxes(대화 상자)를 참조하십시오.

 

9. Command Mode Syntax(명령 모드 구문)

 

PROFILE field-list <EXTENDED>

<IF test> <WHILE test> <FIRST|NEXT range>

 

※ 도움말(Help) 메뉴 위치: Analyzer 상단 메뉴 > Help > Contents 클릭

 


 

[Profile command(명령) 사용 예시]

 

상단 메뉴 Analyzer > Profile 클릭

 

Fields to Profile: Choose 버튼 클릭 > Profile 할 필드를 선택(지정)합니다.

 

테스트 목적으로 모두 선택 Add All 을 클릭(선택)해 봅니다.

OK 클릭.

 

OK 클릭.

 

 

"주소2" 필드만 기본 값(default length) 40을 초과했기 때문에 나오는 정상적인 팝업 메시지입니다.

 

※ 대부분의 필드는 기본 값(default length) 40 만으로 위 팝업 메시지 없이 진행되며, 필요 시 아래와 같이 해당 필드 길이(length) 옵션 수정 후 진행하시면 됩니다

 

이런 경우, 아래와 같이 기본 값(default length)을 해당 필드 길이(length)에 맞게 수정한 후 재실행하면 되겠습니다.

  • Analyzer 상단 메뉴 > Edit > Table Layout 선택
  • "주소2" 필드 클릭

 

해당 필드(주소2) Len(Length/길이) 값이 50 인 것을 확인합니다.

  • Analyzer 상단 메뉴 > Tools > Options 선택

  • Profile max string length 란 기본 값(default)을 40에서 50으로 수정
  • 확인 클릭

 

View(보기) 화면에서 해당 테이블을 닫기 후 다시 열기한 후, 앞서 진행했던 Fields to Profile: Choose 버튼 클릭 > Profile 할 필드를 선택(지정)을 반복해봅니다.

 

위와 같이 Profile command(명령)가 실행되었습니다.

(※ 위 이미지를 클릭하면, 더 큰 화면으로 볼 수 있습니다.)

 

(※ 위 이미지를 클릭하면, 더 큰 화면으로 볼 수 있습니다.)

 

① 원하는 필드만 선택(체크박스)할 수 있습니다.

② ◀ 와 ▶ 그리고 ◀▶ 를 클릭하여 펼치고, 닫고 할 수 있습니다.

③ 열 제목(Column heading)을 클릭하면 아래와 같이 선택한 필드에 대한 시각화(visualization)가 표시됩니다.

 

(※ 위 이미지를 클릭하면, 더 큰 화면으로 볼 수 있습니다.)

  • 막대(Bar), 열(Column), 파이(Pie), 도넛(Donut) 및 반원파이(Semi) 시각화로 변경할 수 있습니다.
  • 우측 상단 X 를 클릭하여 화면을 닫을 수 있습니다.
  • 위 파이(Pie)에서 나뉜 영역에 마우스를 올려 놓으면, 레코드 개수(예: 547)를 확인 할 수 있고, 마우스 클릭을 하면, 필터(예: 한식)된 results(결과)를 아래와 같이 확인할 수 있습니다.

(※ 위 이미지를 클릭하면, 더 큰 화면으로 볼 수 있습니다.)

 

(※ 위 이미지를 클릭하면, 더 큰 화면으로 볼 수 있습니다.)

 

목적한 필드 데이터 특성에 따라 Verification(검증), Statistics(통계), Distribution(분포), Date/Time (날짜/시간), Outliers(이상치), Formats(포맷) 카테고리를 중 선택해서 집중 검토해 볼 수 있습니다.

 

또한 위 예시(Standard deviation/표준편차: 63,851.30)와 같이 해당 색상의 값을 클릭하면 아래와 같은 화면을 통해 검토해 볼 수 있습니다.

 
(※ 위 이미지를 클릭하면, 더 큰 화면으로 볼 수 있습니다.)
 
[Profile command(명령) 예시 화면 동영상]