반응형 log1p1 피처엔지니어의 정형 데이터 뽀개기 [ 정형 데이터 ] 정형(Structured)이란? 사전적 의미로 몸을 가지런히 한다. 라는 의미이다. 데이터 베이스에 존재하는 데이터를 정형 데이터라고 한다. 각 컬럼별로 나뉘어져 존재하는 데이터로 값을 확인하기에 불편하지 않다. 즉 데이터가 가지런이 존재한다. 비정형(Unstructured)이란? 일정한 형식이 정해지지 않을 것을 말한다. 대표적으로 이미지, 음파, 자연어 라고 볼 수 있다. [ 카테고리 데이터 다루기 ] 내가 이 글에서 다루는 데이터는 정형 데이터이다. 정형 데이터는 필연적으로 카테고리 데이터(Categorical Data)와 만나게 된다. 카테고리 데이터를 다루는 인코딩 방법은 4가지 정도로 볼 수 있다.. 그 중 One Hot Embedding과 Entity Embedding이 .. 2020. 6. 9. 이전 1 다음 반응형