본문 바로가기

데이터 분석

(29)
[Python] 7570. 줄세우기(골3) / 그리디 목차 1. 문제 2. 핵심 아이디어 3. 코드 4. 배운 점 1. 문제 https://www.acmicpc.net/problem/7570 7570번: 줄 세우기 입력은 2 개의 줄로 이루어져 있다. 첫 줄에는 어린이 수를 나타내는 정수가 주어진다. 둘째 줄에는 처음에 줄서있는 어린이들의 번호가 차례대로 주어진다. 주어진 번호들 사이에는 공백이 하 www.acmicpc.net 2. 핵심 아이디어 처음에는 가장 긴 증가하는 수열만큼 아이들을 남기고 규칙에서 어긋나는 아이들만 재배치를 해주면 된다고 생각했다. 그래서 O(nlogn)으로 LIS 알고리즘을 구현해주었는데 틀렸다는 것을 보고 멘붕이 왔다. >>틀렸던 코드 import sys from bisect import bisect_left input = la..
비전공생 SQLD 일주일 합격 후기 feat) 요약자료 및 준비방법 연말이라 올해 활동도 점검할 겸 10월 쯤 합격한 SQLD 후기를 풀어놓고자 한다. 사실 SQLD나 ADSP는 다른 데이터 분석 자격증보다 난이도가 그리 높지 않고, 그렇기에 희소성도 떨어지기 때문에 이 자격증을 취득하는 필요성 자체에 조금 의문이 들었다. 그러나, 내가 SQLD를 따기로 마음먹었던 이유는 이렇게 정리할 수 있다. 1. SQL 문풀을 이미하고 있었기 때문에 공부 input량이 많지 않으리라 생각 2. 자소서 및 면접에서 데이터분석 역량을 어필할 때 포문을 터줄 공인된 무언가가 필요하다고 생각 3. 문풀이 아닌 데이터베이스 설계에 원론적인 공부를 해보고 싶었음 즉, 이 후기는 SQLD 자격증만을 필요로 하는, 자격증 취득 자체에 의의를 두는 사람들에게는 옳지 않다. 그러나, SQLD를 계기..
A/B test란? - 기초부터 간단한 예제까지 목차 1. 기초통계지식 2. z-test란 3. A/B test 예제 4. 아티클정리(A/B test 유의할 점) A/B test에 대해 여러 자료를 찾아보다가 기초 통계지식부터 간단한 실습까지 설명해둔 문서가 없어서 그냥 내가 만들기로 했다. A/B test는 Z-test(통계적 가설 검정)개념이 들어가 있는 만큼 통계학적 지식을 활용해 의사결정을 하는데 유용한 프레임워크이다. 그럼 차근차근 A/B test의 조각을 완성해나가보자 1. 기초 통계지식 [나부랭이 님 블로그 참고] 1-1) 통계적 가설 검정 우리는 많은 이론을 향유하며 살아간다. 그러나 그 이론은 새로운 가설에 의해 이의를 제기받게 되고 검증을 통해 새로운 가설이 패러다임을 대체하거나, 혹은 기존 이론은 그 자리를 굳건히 지키게 된다. 예..
[파이썬 실무 테크닉 100] ch3. 고객의 전체 모습을 파악하는 테크닉 10 >>문제 상황 : 스포츠 센터의 고객 수가 늘었으나 1년간 정체 중 회원구분 - 종일회원 : 언제나 사용가능 - 주간회원 : 낮에만 사용가능 - 야간회원 : 밤에만 사용가능 - 비정기적으로 입회비 무료행사/반액할인 - 월말까지 신청하면 다음달 탈퇴가 가능 >>테이블 명세 No. 파일이름 개요 1 use_log.csv 센터의 이용 이력 데이터, 기간은 2018.04 -2019.03 2 customer_master.csv 2019.03월 말 시점의 회원 데이터 3 class_master.csv 회원 구분 데이터(종일, 주간, 야간) 4 campaign_master.csv 행사 구분 데이터(입회비 유무 등) >>테크닉1. 데이터를 읽어 들이고 확인하자 uselog 데이터 import pandas as pd u..
[DB분석 실무 테크닉 100] ch2. 대리점 데이터를 가공하는 테크닉10 대리점 데이터의 특징 - 사람의 손을 타므로, 실수나 누락 등 오류가 많이 포함됨 - > 지저분한 뎅터를 처리하는 경험을 쌓자! 고객의 소리 : 고객정보를 엑셀로 관리 : 대리점 매출은 안정적인 상황 전제조건 : 상품 A-Z까지 26개의 상품을 취급 : 매출이력과 고객 정보는 시스템에 직접 입력 : 상품 단가 변동은 없으며 매출 이력은 csv파일로 저장됨 : 고객정보는 대리점 관리가 주별로 집계하여 관리 no 파일 이름 개요 1 uriage.csv 매출이력 기간 : 2019.01~2019.07 2 kokyaku_daicho.xlsx 대리점에서 관리하는 정보 테크닉 11. 데이터를 읽어들이자 import pandas as pd uriage_data= pd.read_csv("/content/drive/MyD..
[미니 프로젝트] Yammer case 분석2. 검색기능 문제 1. 서론 1-1. 문제상황 정의 더보기 1-1) 기존 검색 기능 -모든 페이지에 다음의 search box가 존재 -검색어를 타이핑하면 관련 결과가 보여짐 - 만약 "view all results"를 클릭한다면 -> result page로 이동 - result page 안에는 group, contersations 등 카테고리 tab별 결과 게시 - advanced search => 상세 필터를 통해 검색물 필터 기능 제공 문제 - 1. search 기능을 더 추가로 개발해야하는지에 대한 여부 - 2. 어떤 식으로 기존 기능을 수정해야 가장 효율적인지 => 어떠한 방법을 통해 정량적으로 기존 검색기능의 만족도를 평가하고 개선점을 파악할 수 있는가? 1-2. 테이블 명세서 둘러보기 더보기 테이블1. use..
[미니 프로젝트] Yammer case 분석1. WAU 감소원인 파악 0-1. Yammer 회사란? - 회사 소개 및 서비스 설명 더보기 0-1) what is Yammer? - 비즈니스 소셜네트워크 기능 제공(like facebook) - 조직간 소통 플랫폼 제공 - 채팅 포럼, 비즈니스를 위한 인트라넷 - 소셜 피드, 투표, 파일저장, 발표 등 - 가능한 기기 : desktop / mobile 둘다 가능 >>Yammer 예시화면 사내 비즈니스 소통 및 SNS 플랫폼 사내 인트라넷 및 투표 0-2) Yammer의 이점 - 팀내 협동심 강화 - 직관적이고 친숙한 ui - 클라우드 공유를 통한 일 처리속도 향상 - 쉬운 사용방법 - yammer 이외의 플랫폼과의 높은 연계성 참고 영상: https://www.youtube.com/watch?v=Fz5yi4Cyj5o 0-2. ..
[MYSQL] 1907. Count Salary Categories/ Union으로 원하는 행 추가하기 >> 문제 salary 수준에 따른 구분 Low Salary : Average Salary에 해당되는 값이 없어도 0으로 출력됨 처음엔 조건을 잘못이해해서 굉장히 쉽다고 생각함 응? 이게 미디엄이라고? 이건 웰던 아닌가? 너무 잘 익혀줬는데?? => 그러나, 여러 복병들이 드러남 먼저 income수준에 따라 각 category를 구분하고 category를 기준으로 그룹화하여 count값을 출력해주었다. 그런데 그렇게 하면 Average Salary가 출력이 안됨 => 행 내에 average salary가 없기 때문 즉, 억지로 3가지 category열을 만들고 이 category와 조인해야 함. 억지로 만든 카테고리 열 >>결과 이제 category를 기준으로 join해주자