Data Engineer
- 개발자 성향
- 하는 일
- 데이터 수집
- 데이터 레이크 및 파이프라인 관리
- 각종 소스의 데이터를 분석하기 위한 데이터를 모으는 파이프 라인을 개발
- 데이터 분석가에 제공할 대시보드 개발
- 데이터 마트 및 통계 개발
- 기술
- Hadoop MR, Hive, Spark 등 분산 처리 기술
- 대용량/실시간 데이터 분산 처리 시스템 설계 및 운영
- AWS, GCP등 클라우드 환경에서의 데이터 파이프라인 구축 및 운영
- GA, Tableau 등 외부 분석/시각화 도구에 대한 지식
- Python, Java, Scala 중 하나 이상을 이용한 개발 경험
Machine Learning Engineer
- 개발자 성향이되 ML,DL을 기반으로 함
- 하는 일
- ML 모델 개발, 학습, 배포를 수행
- Product 팀과의 협업을 통한 ML 모델 API 서버 개발
- ML 모델 학습 및 배포 자동화 파이프라인 구축
- 최신 기술 동향 파악 (딥러닝 논문 / ML Systems)
- 기술
- 관련 전공 석박사 학위
- 최신 딥러닝 논문을 이해하고 구현
- Kubeflow, MLflow 등을 활용하여 머신러닝 파이프라인 설계 경험
- ML 관련 상용 서비스를 배포하신 경험
- Python & PyTorch
- TensorFlow
Data Analyst
- 기획자 성향
- 하는 일
- EDA
- 의사결정자가 data-informed decision을 할 수 있도록 적절한 시기에 정보를 제공
- 회사 내 Key business metrics의 모니터링 및 보고
- ad-hoc 데이터 분석 요청 대응
- 주요 이슈에 대한 분석
- 현상 해석 혹은 예측 모델을 수립
- 로그 수집을 위한 설계
- 기술
- 문제 정의 능력
- 결과 전달 능력
- 데이터의 이해와 이를 위한 SQL 등 DB 지식
- 분석 툴 이해(R, Python 등)
- 비즈니스 커뮤니케이션
- 통계 및 분석 방법에 대한 지식과 이해
Data Scientist
- 연구자 성향
- 하는 일
- 조직 전반의 활동
- 조직의 데이터를 경영 의사결정에 적용
- 조직의 데이터를 분석
- 제품을 개발하고, 마케팅에 적용
- 데이터 소스와 수집 방식을 설계하고 평가
- 데이터 모델을 커스터마이징하고 알고리즘 개발
- 예측 모델링(회귀분석 등) 기법을 이용해 사용자 경험, 수익 창출, 광고의 타겟팅 등을 최적화
- A/B 테스팅(실험군-대조군 비교실험) 및 테스트 모델의 품질을 개선
- 기술
- 통계용 언어(R, Python, SQL 등)을 다룬 경험
- 대규모 데이터에서 유의미한 결과를 도출한 경험
- 데이터 구조에 대한 이해
- 머신러닝 지식
- 문서작성 능력 및 언어능력
- 통계학, 수학, 컴퓨터학 또는 계량분야 학문에서 석사 또는 박사 이상의 학력 보유자