[데이터리안 SQL 실전반] 리텐션 글 후기: 데이터 분석가는 리텐션을 알아야 한다.
·
데이터리안 SQL 공부
- 개요리텐션 (1) Classic Retention위의 링크에 들어가면 첫 번째 글인 Classic Retention부터 다른 링크에서Rolling Retention, Range Retention, Stickiness, 리텐셜 차트, 리텐션 커브를 주제의 글을 읽을 수 있습니다.데이터 분석을 하는 분이라면 한 번 읽어볼만한 포스트입니다. - 대표적인 분석 프레임워크회사의 목표는 서비스나 상품을 사용자에게 팔아 매출을 발생시키는 것입니다.그럼 이 과정을 데이터 기반으로 분석하고자 하면 어떤 방법을 써야할까요?그로스 해킹에서는 AVRRR이라는 분석 프레임워크를 제시합니다.Acquisition(사용자 획득): 서비스나 상품에 접근Activation(사용자 활성): 서비스나 상품을 실제로 사용Retention..
[특정 지역에 버스 한 번 타고 갈 수 있는 지역 찾기] 2. 버스 정류장, 버스 정류장에 정거하는 버스 및 이 버스의 정류장 찾기
·
프로젝트/버스 한 번으로 특정 지역에 갈 수 있는 지역 찾기
- 개요영등포 타임스퀘어 3번 게이트에 버스 한 번으로 갈 수 있다라함은 3번 게이트 근처의 버스 정류장에서 내려서 짧은 거리를 걸어간다는 뜻입니다. 이번 포스트에서는 3가지 작업을 합니다.1. 영등포 타임스퀘어 3번 게이트 근처 버스 정류장을 찾기2. 근처 버스 정류장에 정거하는 모든 버스 찾기3. 위에서 찾은 모든 버스가 정거하는 정류장 찾기 - 버스 정류소, 버스 데이터 필터링이번 포스트의 코드와 설명은 짧은 편입니다.설명할 것은 haversine 함수와 pandas에서 제공하는 isin() 메서드입니다. 1. haversine 함수저는 영등포 타임스퀘어 3번 게이트에서 300 m 이내에 있다면 근처라고 정의했습니다.300 m 이내를 계산하려면 두 지점의 거리를 구해야하는데요.버스 정류소 데이터의 ..
[특정 지역에 버스 한 번 타고 갈 수 있는 지역 찾기] 1. 버스, 버스 정류장 데이터 수집과 확인
·
프로젝트/버스 한 번으로 특정 지역에 갈 수 있는 지역 찾기
- 개요프로젝트 목표를 세웠으면 보통 가장 먼저 해야 할 일은 데이터 수집 계획을 세우는 것입니다.이번 포스트에서는 데이터를 수집하고 확인을 해보겠습니다.데이터를 읽고 정제하는 과정에는 python의 pandas 라이브러리를 주로 사용하고,folium 라이브러리로 데이터를 시각화하겠습니다. - 데이터 수집제 목표는 영등포 타임스퀘어 3번 게이트까지 한 번에 버스를 타고 갈 수 있는 지역이 어디인가?입니다.이 목표를 어떻게 이룰지 고민하면 필요한 자료를 알 수 있습니다. 목표를 달성하기 위해서는 아래의 질문의 답을 고민하면 됩니다.Q1. 영등포 타임스퀘어 3번 게이트 근처의 버스 정류장은? - 버스 정류소의 위치 자료가 필요Q2. 근처 버스 정류장에 멈추는 버스 번호는? - 버스 정류장에 멈추는 버스 ..
[특정 지역에 버스 한 번 타고 갈 수 있는 지역 찾기] 0. 목표 설정
·
프로젝트/버스 한 번으로 특정 지역에 갈 수 있는 지역 찾기
- 개요요즘 메이플스토리에서는 캠퍼스 투어 이벤트라고 오프라인 이벤트를 진행하고 있습니다.캠퍼스 투어라고 해서 무조건 대학교에서만 이벤트를 하는 것은 아닙니다.2025년 5월 15일에는 영등포 타임스퀘어 3번 게이트에서도 하거든요. 그럼 영등포 타임스퀘어까지 어떻게 가야할까요?개인적인 입장에선 지도 길찾기를 보고 오면 그만이죠. 그럼 좀 더 거시적인 관점에서 생각해봅시다.서울/수도권의 주요 지역 교통은 지하철 담당하고, 지하철이 커버할 수 없는 지역의 교통은 버스가 담당합니다.정확히는 버스가 지하철역 근처과 지하철이 닿지 못하는 지역을 연결해주는 역할을 합니다.지하철은 먼거리를 빠르게, 버스는 좁은 거리를 느리게 가는 느낌이죠. - 지하철보다 빠른 버스?서울에서 어디를 갈 때 웬만해서는 지하철이 버스보다..
[python][사과게임 매크로 만들기] 4. GUI 기반 사과게임 매크로
·
프로젝트/사과게임 매크로 만들기
- 개요명령 프롬프트창(CLI)에서 동작하는 사과게임 매크로를 만들어보았으니이제 GUI(그래픽 유저 인터페이스)로 사과게임 매크로를 만들어봅시다.파이썬에서 GUI를 만들어주는 다양한 라이브러리 중 PyQt5를 사용했습니다.이전 포스트에서 CLI 기반 사과게임 매크로를 만들 때 클래스를 활용해서 만든 것처럼 이번에도 클래스를 활용합니다.전체 코드는 github에 올려두었고, GUI를 만들 때 중요한 내용만 포스트에서 설명합니다.전체 코드 github 링크파이썬 코드를 실행하면 프로그램이 켜집니다. - PyQt5로 GUI 만들기pip install PyQt5 PyQt5으로 GUI를 만들 때 실제 코드에서는 아래와 같은 작업을 해주어야 합니다. 1. 윈도우 창 만들기말그대로 윈도우 창을 만들며 height와 ..
파이썬 pandas 라이브러리로 계산을 빠르게 하는 법: SQL을 배워라
·
데이터리안 SQL 공부
- 개요저는 다양한 데이터를 분석, 시각화할 때 파이썬을 사용합니다.정확히는 데이터 분석, 시각화의 과정에서 pandas, numpy, matplotlib 등 다양한 파이썬 라이브러리를 쓰는거죠. 이 중 pandas는 정형 데이터를 읽고, 전처리, 후처리 작업에 쓰입니다.요즘 데이터리안에서 SQL을 배워보니 SQL에서 쓰는 명령어를 알게 되었고 대체로 이 기능은 pandas에 구현되어 있고 빠릅니다. -속도 비교 1: 기상 자료1. 자료 설명 및 목표 설정첫번째 속도 비교로 기상관측 일평균 자료를 다운로드 받았습니다.일별로 다양한 기상 변수가 저장되어 있고, 기간은 2007년부터 2025년까지입니다.자료의 행은 7000~8000줄 정도 됩니다.이 자료로 연평균 평균기온을 구해봅시다.참고로 가장 오른쪽을 ..
[데이터리안 40기 입문 2주차 과제] 독후감: RFM 고객 세분화 분석이란 무엇일까요
·
데이터리안 SQL 공부
데이터리안 SQL 40기 입문 강의 2주차 과제아래 링크의 글을 읽고 독후감 쓰기라 생각해도 무방RFM 고객 세분화 분석이란 무엇일까요? - 나만의 요약회사는 상품을 만들고, 사용자가 이 상품을 쓰면 이익(반드시 돈이 아닐 수도 있음)이 발생함이 과정에서 회사는 상품을 구매한 사용자의 주문 기록을 데이터베이스에 저장할 수 있음그러면 주문 기록을 이용해서 다음 구매를 유도하기 위한 사용자별 맞춤 전략을 짤 수 있음예를 들어 가끔 오는 사람에겐 오랜만에 왔으니 할인 쿠폰을, 자주 구매를 하는 사람에겐 특별 혜택을 주는 등 사용자의 특성에 따라 다른 전략을 쓸 수 있음결국 이는 사용자를 분류하는 문제인데 이러한 사용자 분류를 마케팅 쪽에선 customer segmentation이라고 부르는 것 같음(이공계생이..
[python][사과게임 매크로 만들기] 3. CLI 기반 사과게임 매크로 코드 작성
·
프로젝트/사과게임 매크로 만들기
- 개요지금까지 사과게임 매크로 코드의 확장자는 ipynb였습니다.ipynb 확장자에서는 코드 cell이 여러 개이므로 이를 한 번에 실행하기 위해 vscode의 [run all] 버튼을 눌렀습니다.기능 구현만 할거면 이런 식으로 코드를 작성해도 상관없지만 하나의 프로그램으로 만들기 힘듭니다. 예를 들어 프롬프트창에서 매크로 프로그램을 실행하고, 조작이 가능하게 만들려면, 즉 Command Line Interface(CLI)로 코드를 실행 및 조작하게 만들려면 python [코드이름.py]를 쳐서 코드를 실행한 뒤 특정 버튼을 눌렀을 때 사과게임 매크로가 동작해야합니다. 이번 포스트에서는 CLI 기반으로 프로그램이 돌아가도록 사과게임 매크로 코드를 리팩토링해보겠습니다. - 클래스 기반 코드 작성 이유저번..
[python][사과게임 매크로 만들기] 2. 사과게임 매크로 코드 작성, 실행
·
프로젝트/사과게임 매크로 만들기
- 개요사과게임 시작화면의 숫자를 인식해서 numpy 배열로 저장했으니 이제 사과게임 매크로를 만듭시다. - 숫자 합 10 확인 및 제거사과게임에서는 마우스로 드래그한 영역의 사과들의 숫자합이 10일 때 그 사과들이 지워집니다.우린 숫자를 numpy 배열에 저장했으니 numpy 배열에서 특정 범위의 합이 10인 경우를 찾으면 됩니다.그 다음 이 특정 범위의 위치를 내 모니터의 좌표로 변환하여 마우스를 드래그하면 됩니다. 합이 10이되는 영역을 찾는 알고리즘은 여러가지가 있지만저는 왼쪽 위부터 오른쪽으로 한 줄씩 합이 10인 영역을 찾겠습니다."""합이 10인 위치를 제거하는 기능을 10번 시행하기 위해 _로 열번 돌립니다.특정 영역이 0이 되면서 없어지면 합이 0이 될 수 있는 영역이 새로 생길 수 있으..