Data Engineer Should Know Save

DE직무에 필요한 모든 것

Project README

banner

데이터 엔지니어 직무와 관련된 지식, 기술질문 등을 정리합니다.

Table of Contents


1. Data Engineering

1-1. Hadoop

1-2. Spark

1-3. Kafka

1-4. ELK Stack

1-5. Airflow

1-6. Hive

  • HiveServer2 (link)
  • Hive Design and Architecture (link)
  • Hive ACID (link)
  • Hive Replication (link)
  • Hive Query Planner and Optimizer (link)
  • Partition, Bucket, Index
  • Which is faster, SORT BY or ORDER BY in HiveQL?
  • What is HCatalog?
  • Hive UDF란?
  • Hive의 View와 Table
  • HiveQL Merge Into
  • STORED AS의 INPUTFORMAT, OUTPUTFORMAT, SERDE (link1, link2)

1-7. Trino

1-8. DataHub

  • 데이터 거버넌스란 무엇이고 왜 필요한가? (link)

1-9. others


2. Cloud Computing

2-1. Docker and k8s

2-2. AWS


3. Computer Science

3-1. Operation System

3-2. Database

3-3. Network

3-4. Data Structure and Algorithm

3-5. Programming Language

3-6. common

객체지향프로그래밍, 디자인패턴, 아키텍처패턴, 개발방법론, 소프트웨어공학 등

  • OOP
    • 캡슐화
    • 상속
      • 메소드 오버라이딩
    • 다형성
      • 메소드 오버로딩
    • 객체지향 5원칙: SOLID
    • 객체-관계 매핑 (Object Relational Mapping, ORM) (link)
  • Idempotence(멱등성)
  • 테스트 도구와 절차
  • 트래픽/트랜잭션량 측정
  • Lambda architecture (link)
  • ETL과 ELT

4. Back-end


5. Fields of study

기타 읽을거리 및 관심있는 연구주제, 토이 프로젝트 등


Reference

Open Source Agenda is not affiliated with "Data Engineer Should Know" Project. README Source: dhkdn9192/data_engineer_career

Open Source Agenda Badge

Open Source Agenda Rating