IT/Data Engineering & SQL 4

[DataCamp] Intermediate Docker

이 글에서는 데이터캠프의 Intermediate Docker 강의를 듣고 중급 도커 명령어의 핵심 개념과 활용 방법에 대해 설명한다. 도커에 대한 기초가 부족하다면, DataCamp의 초급 Docker 강좌를 먼저 학습해보길 추천한다.[1] Commands and FilesystemsCH1. Intermediate Docker Commands도커는 컨테이너 기반 애플리케이션을 실행하고 관리하기 위한 런타임 도구다.🧐❓ 컨테이너란 ❓컨테이너는 특정 애플리케이션과 그 애플리케이션이 실행되는 데 필요한 모든 의존성을 묶어놓은 독립 실행 환경이다.컨테이너는 이미지를 기반으로 만들어지며, 이미지는 도커 파일이라는 텍스트 파일로 정의된다.컨테이너의 특징독립적인 실행 환경 제공운영체제(OS)에 관계없이 동일하게 작..

[DataCamp] 9. Understanding Data Visualization

[1] Visualizing distributionsCH1. A plot tells a thousand words1-1. 데이터 인사이트를 얻는 방법요약 통계값(;중앙값, 평균, 최빈값 등) 사용통계 모델(;회귀 분석 등) 실행데이터 시각화1-2. 연속형 변수 & 범주형 변수연속형 변수 : 수치로 표현할 수 있는 데이터 (키, 몸무게 등)범주형 변수 : 텍스트로 분류할 수 있는 데이터 (색상, 국가 등)👉 일부 항목은 연속형과 범주형 모두 가능하여 자유롭게 처리할 수 있습니다. (나이-나이대, 시간-년도/월 등) CH2. Histograms히스토그램히스토그램은 연속적인 변수를 시각화하는 도구로, 데이터 분포의 형태를 보여줍니다.구간 너비 선택 : 구간 너비가 너무 좁거나 넓으면 데이터를 잘 파악할 수 ..

[DataCamp] 8. Introduction to Snowflake

[1] Introduction to Snowflake: Architecture, Competitors, and SnowflakeSQLCH1. What is Snowflake?1-1. Snowflake 란?Snowflake는 클라우드 기반 데이터 웨어하우스로, 데이터를 열(column) 단위로 저장하는 모델을 사용합니다.🧐❓ 클라우드 데이터 웨어하우스 ❓기존 온프레미스(On-premise) 기반 데이터 웨어하우스는 데이터가 많아질수록 더 많은 공간과 자원이 필요하게 되는데, 이를 클라우드 플랫폼으로 옮김으로써 문제를 해결할 수 있습니다.1-2. Snowflake 특징 및 장점1) 🗄️ Scalability (확장성) : 하드웨어 요구 사항이 적어 즉 클라우드 환경에 최적화 되어 있어 대용량 데이터를 처..

[SQL] SQL 문제 사이트 모음

프로그래머스문제가 많지는 않지만 질문 게시판에서 다른 사람들의 풀이를 볼 수 있어서 좋다.UI가 편리하다.가볍게 풀만한 문제들이 많고 정답 풀이를 쉽게 구할 수 있어서 sql 초보가 풀기에 좋은 것 같다.solvesqlmysql기반이 아니라 SQLite 기반이라 간혹 안 되는 함수가 있어 당황할 수 있다.데이터리안 분석 캠프를 수강하면 모든 문제를 풀 수 있지만 무료로도 실무와 유사해 보이는 문제들을 풀어볼 수 있다.자동 포맷팅 기능이 있어서 편리하다.HackerRank문제가 영어라서 문제 이해에도 조금 시간이 걸린다.단순히 데이터 추출/집계 뿐만 아니라 프로그래밍적 접근 문제도 제공한다. (문제 다양성 높음)