Suqence of Pattern Recognition
Rwa Data | Data Collection | Data Cleaning | Data Processing | Data Visualization |
Raw Data란?
Raw Data란 가공하지 않은것 이라는 의미로 실세계에 존재하는 수 많은 데이터들을 말합니다. 오늘 온도, 습도, 미세먼지 농도 같은 날씨 데이터, 교통량 데이터 등 대부분의 측정 가능한 값들이 될 수 있습니다.
Data Collection 이란?
센서(Sensor)와 같은 측정장치를 통해 데이터를 수집하는 단계입니다. 외부환경으로부터 Data를 감지하는(sense) 다양한 장치들을 사용할 수 있습니다. 대표적인 예로 카메라, 마이크, 레이다, 체온계 등이 있을수 있겠죠.
Data Cleaning 이란?
전처리(pre-processing)이라고도 불리는 단계로, NN(Nueral-Network)에 데이터를 넣기전 가공하는 단계입니다. 흔히 신경망의 설계와 구현에서만 최적화를 하고, 이 단계는 대충 넘어가는 경향이 있습니다. 이렇게 시스템을 구현한다면 성능 향상을 기대하긴 어렵습니다.
- 잡음제거
- 특징 추출
- 정규화
- 레이블링
- 차원축소
위와 같이 시스템의 성능 향상을 위해 Data Cleaning 단계에서 많은일들을 할 수 있습니다. 이 단계의 중요성을 간과하지 맙시다.
Data Processing란?
이 단계에서 드디어 신경망을 설계 및 구현하게 됩니다. 현재 대부분의 AI System의 목적은 분류, 회귀, 클러스터링, 서술입니다.
신경망을 제대로 이해하고 활용하기 위해선 퍼셉트론에 대해 알아야 합니다. 그래야만 MLP(Multi Layer Perceptrone)을 기반으로한 CNN, RNN, RCNN의 구조를 이해하고 활용할 수 있습니다. 이 내용들은 이후 포스팅에서 다루도록 하겠습니다.
Data Visualization 란?
AI 시스템이 도출한 결과를 사용자에게 대시보드 형태로 시각화하는 단계입니다.