본문 바로가기

기타

데이터 관련 직군

Data Engineer

  • 개발자 성향
  • 하는 일
    • 데이터 수집
    • 데이터 레이크 및 파이프라인 관리
    • 각종 소스의 데이터를 분석하기 위한 데이터를 모으는 파이프 라인을 개발
    • 데이터 분석가에 제공할 대시보드 개발
    • 데이터 마트 및 통계 개발
  • 기술
    • Hadoop MR, Hive, Spark 등 분산 처리 기술
    • 대용량/실시간 데이터 분산 처리 시스템 설계 및 운영
    • AWS, GCP등 클라우드 환경에서의 데이터 파이프라인 구축 및 운영
    • GA, Tableau 등 외부 분석/시각화 도구에 대한 지식
    • Python, Java, Scala 중 하나 이상을 이용한 개발 경험

Machine Learning Engineer

  • 개발자 성향이되 ML,DL을 기반으로 함
  • 하는 일
    • ML 모델 개발, 학습, 배포를 수행
    • Product 팀과의 협업을 통한 ML 모델 API 서버 개발
    • ML 모델 학습 및 배포 자동화 파이프라인 구축
    • 최신 기술 동향 파악 (딥러닝 논문 / ML Systems)
  • 기술
    • 관련 전공 석박사 학위
    • 최신 딥러닝 논문을 이해하고 구현
    • Kubeflow, MLflow 등을 활용하여 머신러닝 파이프라인 설계 경험
    • ML 관련 상용 서비스를 배포하신 경험
    • Python & PyTorch
    • TensorFlow

Data Analyst

  • 기획자 성향
  • 하는 일
    • EDA
    • 의사결정자가 data-informed decision을 할 수 있도록 적절한 시기에 정보를 제공
    • 회사 내 Key business metrics의 모니터링 및 보고
    • ad-hoc 데이터 분석 요청 대응
    • 주요 이슈에 대한 분석
    • 현상 해석 혹은 예측 모델을 수립
    • 로그 수집을 위한 설계
  • 기술
    • 문제 정의 능력
    • 결과 전달 능력
    • 데이터의 이해와 이를 위한 SQL 등 DB 지식
    • 분석 툴 이해(R, Python 등)
    • 비즈니스 커뮤니케이션
    • 통계 및 분석 방법에 대한 지식과 이해

Data Scientist

  • 연구자 성향
  • 하는 일
    • 조직 전반의 활동
    • 조직의 데이터를 경영 의사결정에 적용
    • 조직의 데이터를 분석
    • 제품을 개발하고, 마케팅에 적용
    • 데이터 소스와 수집 방식을 설계하고 평가
    • 데이터 모델을 커스터마이징하고 알고리즘 개발
    • 예측 모델링(회귀분석 등) 기법을 이용해 사용자 경험, 수익 창출, 광고의 타겟팅 등을 최적화
    • A/B 테스팅(실험군-대조군 비교실험) 및 테스트 모델의 품질을 개선
  • 기술
    • 통계용 언어(R, Python, SQL 등)을 다룬 경험
    • 대규모 데이터에서 유의미한 결과를 도출한 경험
    • 데이터 구조에 대한 이해
    • 머신러닝 지식
    • 문서작성 능력 및 언어능력
    • 통계학, 수학, 컴퓨터학 또는 계량분야 학문에서 석사 또는 박사 이상의 학력 보유자