- 수강 이유
제 직업이 무엇이냐고 물어보면 데이터 분석가라고 말하긴 어렵습니다.
중소기업을 다니면 이것저것 여러 일을 해야하거든요.
직장인들의 이야기를 듣다보니 이것저것 업무를 하는 것보다 하나의 커리어를 만들고 싶다는 생각이 들더군요.
적성과 흥미에 맞는 업무는 데이터 분석이었고 데이터 분석가 채용공고, 유투브 컨텐츠를 확인했습니다.
제가 하는 데이터 분석 업무는 csv 파일이나 위도, 경도의 지리공간 데이터인 nc 확장자 파일로 저장된 데이터를 분석하는 것입니다.
데이터베이스 형태로 query를 요청해서 데이터를 다루는 것이 아니라 그냥 파일을 파이썬의 pandas, netcdf, xarray 라이브러리로 바로 읽은 다음 데이터 분석을 합니다.
채용공고를 보니 데이터 분석가는 아래와 같은 업무를 하더군요.
1. 데이터 분석
1-1. 데이터 전처리
1-2. 데이터 분석 방법 적용
2. 데이터 시각화
데이터 분석 업무에서 파이썬을 주로 쓰는 회사도 있지만 SQL을 가장 많이 쓰기 때문에 SQL을 배우고자 했습니다.
그리고 데이터리안 유투브 영상 내용이 마음에 들어 데이터리안 SQL 데이터 분석 캠프 입문반(2025년 4월)과 실전반(2025년 5월)강의를 수강했습니다(전 돈을 내고 들어야 강제성이 생겨 공부가 잘되더라구요).
- 장점
1. 직장인이 듣기 좋을 정도의 볼륨
일주일마다 3~4시간 정도의 개념 강의를 들어야 합니다.
직장을 다니면서 듣기에 적절한 강의 시간과 내용이었습니다.
강의의 내용에 따라 solvesql(sql 문제 푸는 사이트), 해커스랭크나 리트코드의 연습 문제를 푸는데요.
개념마다 적절한 연습 문제를 강의를 듣고 바로 푸니까 실력이 차근차근 늘어납니다.
그리고 전 코딩테스트를 준비해본 적이 없어 위와 같은 사이트에서 문제 푸는 것에 익숙해지는 것이 좋았습니다.
2. 데이터리안의 커뮤니티
수강신청을 하면 데이터리안 슬랙에 들어갈 수 있습니다.
슬랙은 디스코드와 유사한 프로그램으로 강사님에게 질문을 물어보는 곳, 과제를 제출하는 곳 등 데이터리안의 커뮤니티 공간입니다.
다른 사람도 과제를 제출하기 때문에 나도 과제를 빨리해야겠다는 동기부여를 받기 좋았고, 디스코드 같아서 그런지 질문을 하기쉬운 분위기였습니다.
3. 실제 현업에서 사용하는 데이터 분석 방법
전 데이터 분석을 많이 했지만 실제로 데이터 분석가가 무엇을 하는지는 잘 모릅니다.
채용공고를 보면 AARRR 분석, A/B 테스트, 코호트 분석을 하는 인재를 원하는데 이 분석방법이 무엇인가라는 의문을 가졌습니다.
실전반 강의에서는 SQL로 AARRR 분석을 할 수 있어서 좋았습니다.
참고로 A/B 테스트, 코호트 분석이 무엇인지는 알려주지만 실제 SQL로 분석을 하진 않습니다.
4. 코딩테스트 실력 증진
SQL을 공부하는 이유는 현업에서 사용하기 때문이기도 하지만 SQL 코딩테스트를 보는 회사가 있기 때문이기도 합니다.
SQL 모의 코딩테스트를 해보고 싶어서 인터넷 검색을 해보니 프로그래머스라는 사이트의 SQL kit 문제를 풀어보라고 하더군요.
전체 문제 중 2문제를 빼고 다 풀었습니다.
어렵지 않은 SQL 코딩테스트는 통과할 정도로 실력이 늘었다고 말해도 되겠죠.
못 푼 문제는 Recursive라고 재귀적 문법을 쓰는데 이건 실전반에서 다루는 내용이 아닙니다.
다음으로 데이터리안 강의의 추가 과제로 HackerRank <SQL Skills Certification Test>가 있는데요.
어렵지 않게 통과 했습니다.
- 단점
1. 가격
길게 설명할 건 없는데 좀 비싸긴 합니다.
2. 좋게 말하면 실용적, 나쁘게 말하면 디테일하지 않음
파이썬이라는 프로그래밍 언어는 코드를 컴파일하지 않고, 인터프리트합니다.
무슨 말이냐구요?
코드를 한 번에 읽어서 컴퓨터가 처리하는 것을 컴파일, 코드를 작성한 순서대로 한 줄씩 컴퓨터가 처리하는 것을 인터프리트라고 보시면 됩니다.
전 파이썬으로 데이터 분석을 했으니 코드를 이해할 때 위에서부터 아래로, 작성한 순서대로 무슨 작업을 하는지 확인하면 됩니다.
제가 파이썬에 익숙해서 그런지 저는 파일을 읽는 부분이 먼저 나오고 groupby를 한 다음 값을 확인할 수 있는 것이 자연스럽다고 느낍니다.
하지만 mySQL로 동일한 작업을 하는 코드를 짜보면 파이썬과 순서가 다르죠.
파이썬에서는 줄 순서대로 코드가 동작하니 작업 순서대로 코딩한다는 느낌이 강하고, 파이썬 특성상 그 줄의 코드에서 무슨 일이 벌어지고 있는지 확인하기 쉽습니다.
데이터리안 강의에서 mySQL의 문법마다 동작하는 순서를 알려주긴 합니다만 순서가 왜 이렇게 되어있는지, 실제로 무슨 일이 벌어지고 있는지 궁금하더군요.
물론 단순히 실용적으로 쓸 분들은 이런 코드를 작성하면 저런 결과가 나온다만 알면 되니까 이게 문제는 아닙니다.
하지만 저는 이런 디테일한 것을 알면 이해가 더 잘되어서 조금 아쉬웠습니다.
"""
파이썬 예시
import pandas as pd
df = pd.read_csv('파일이름.csv') # 1. 파일 읽기
df = df.groupby('칼럼이름').size() # 2. 그룹별로 분류하고 갯수를 셈
print(df) # 3. 갯수 확인
"""
"""
mySQL 예시
SELECT '칼럼이름', COUNT(*) # 갯수를 세고, 확인함
FROM '테이블 명' # 데이터를 읽은 테이블 지정
GROUP BY '칼럼이름' # 그룹별로 분류
"""
3. 실제로 업무에서는 쓰는 것은?
이 강의에서는 solvesql이라는 플랫폼을 주로 사용하는데 웹페이지에 SQL 코드를 작성하는 구역, 테이블 정보 구역, SQL 코드 동작 결과 구역으로 나누어져 있어 사용하기 편리합니다.
파이썬도 유사한 플랫폼을 이용해서 공부 및 코딩테스트를 할 수 있습니다.
하지만 파이썬을 이용하는 실제 업무에서는 당연히 이런 플랫폼을 쓰는 것이 아니라 vscode라는 프로그램으로 anaconda 혹은 uv 기반 가상환경 세팅을 사용하여 파이썬 코드를 실행합니다.
그럼 실제 업무에서 SQL은 어떻게 사용해야 되는 걸까요...?
물론 회사마다 방식이 다를테고, SQL 배우는 것이 핵심이니까 이런 내용을 강의 주제로 삼을 순 없습니다.
그래도 대체로 이렇게 한다는 간단한 설명이라도 있었으면 좋지 않을까합니다.
- 결론
SQL이란 걸 배워본 적이 없는 사람에게 추천합니다.
데이터 분석에 대한 경험이 별로 없으면 입문반부터 듣는 것을 권장합니다.
전 데이터 분석 경험 자체는 많아서 ChatGPT나 유투브 영상 등으로 강의없이 기초 공부할 수 있었을 것 같네요.
AARRR 분석을 실제로 경험해보고 싶은 사람에게 추천합니다.
'데이터리안 SQL 공부' 카테고리의 다른 글
[데이터리안 SQL 실전반] 리텐션 글 후기: 데이터 분석가는 리텐션을 알아야 한다. (0) | 2025.05.11 |
---|---|
파이썬 pandas 라이브러리로 계산을 빠르게 하는 법: SQL을 배워라 (0) | 2025.04.23 |
[데이터리안 40기 입문 2주차 과제] 독후감: RFM 고객 세분화 분석이란 무엇일까요 (0) | 2025.04.20 |