본문 바로가기

데이터 분석

(29)
[MY SQL] Symmetric Pairs / 조건분기+union >> 문제 => (x,y)의 좌표들이 행으로 주어짐 => (x.y) 를 뒤집은 (y.x)가 행에 존재하면 그 행을 출력하라는 문제 >>입력 예시 >> (20, 20) 은 (20, 20)과 대응 >> (20, 21) 은 (21, 20)과 대응 >> (22, 23) 은 (23, 22)와 대응 => 여기서 20, 20이 서로 같아도 행이 두 개여야 인정됨 => 즉, x,y가 같은 x,x가 한 행만 존재한다면 출력하면 안된다. >> 내가 푼 풀이 먼저 경우를 2가지로 구분하였다. case1 ) x==y 일 때 => 만약 같은 행이 하나 더 존재하면 출력해야 함 ex) (20,20) 이 하나만 있다면 -> 대응되는 행이 없으므로 출력x (20,20) 이 하나 이상 있다면 -> 대응되는 행이 있으므로 출력o cas..
[MYSQL] Draw the Triangle / 프로시저로 for문 구현 >> 문제 = Draw the Triangle 1 => Draw the Triangle 2 >>생각했던 점 - 그동안 반복문 구현은 총 2가지로 학습 : 1. 변수로 값 증가시키기 : 2. 재귀문 => 프로시저로 구현하는 게 더 쉽지 않을까? 라는 생각이 듦 => 문제가 비슷하기 떄문에 몇가지 경계만 수정하면 코드 재활용이 가능하기 때문 => 다만, 이 프로시저는 단순 '반복 출력'에 한정되어 있기에 join 등의 응용에는 한계가 있으리라 생각됨 >> 결과 => Draw the Triangle 1 => Draw the Triangle 2 => 초기값, 조건, 증감연산만 다르게 하여 구현 => 코드 재활용 => 결과
[MYSQL] New Companies / 계층구조의 외래키 설정 > 문제 회사의 계층구조 Given the table schemas below, write a query to print the company_code, founder name, total number of lead managers, / total number of senior managers, total number of managers, and total number of employees Order your output by ascending company_code ------------------------------ 출력형식 : 회사코드 , founder 이름 , lead manager 수, senior manager 수, manager 수, employees 수 Note: - The table..
[나도코딩] 데이터 분석 및 시각화 - matplotlib 요약 https://youtu.be/PjhlUzp_cU0 > matplotlib 가져오기 import matplotlib.pyplot as plt >plot x=[1,2,3] y=[2,4,8] plt.plot(x,y) #라인 출력 안하려면 plt.show() >title 설정 : plt.title('그래프 제목') > 축 설정(xlabel / ylabel) plt.xlabel('X축', color='red', loc='right')#left, center, right plt.ylabel('Y축', color='#00aa00', loc= 'top') # top, center, bottom >축 표시값 설정 (xticks / yticks) plt.xticks([1,2,3]) #x축의 범위를 1, 2, 3순으로 표..
[나도코딩] 데이터 분석 및 시각화 - Pandas 요약 https://youtu.be/PjhlUzp_cU0 >> pandas 불러오기 import pandas as pd 1. series : 1차원 데이터(정수, 실수, 문자열 등) > series 만들기 temp=pd.Series([-20,-10,10,20]) > series index 지정 temp=pd.Series([-20,-10,10,20], index=['Jan','Feb','Mar','Apr']) # 색인 temp['Jan'] #index Jan{1월}에 해당하는 데이터 출력 2. DataFrme : 2차원 데이터(정수, 실수, 문자열 등) #2차원 데이터 초기화 data={ '이름' : ['채치수','정대만',"송태섭","서태웅","강백호","변덕규","황태산","윤대협"] ,'학교' : ["북산..
[MYSQL] 자동차 대여 기록별 대여 금액 구하기 문제 분석 테이블 1. CAR_RENTAL_COMPANY_CAR : 대여가능한 자동차들의 정보 2. CAR_RENTAL_COMPANY_RENTL_HISTORY : 렌탈 시작/종료 일 등의 정보 3. CAR_RENTAL_COMPANY_DISCOUNT_PLAN : 대여기간에 따른 할인률 정보 >>문제 요건1 : 자동차 종류는 트럭 요건2. 대여기록별로 대여금액을 출력 요건3. 대여금액 -> 기록ID 순 내림 차순 >>예시 1단계: 트럭 들의 대여기간 구하기 => datediff 함수를 사용하여 각 대여 기간의 이름을 LEFT JOIN하기 위해 => CAR_RENTAL_COMPANY_DISCOUNT_PLAN 테이블의 기간 이름과 일치시킴 결과 : 트럭이고 DURATION이 계산됨 2단계: 트럭 들의 대여기간 ..
[MYSQL] 입양시각 구하기(2) / 변수로 반복값 만들기 >> 문제 >>예시 >>막혔던 부분 : HOUR을 기준으로 GROUP BY 하면 데이터가 없는 열은 행으로 잡히지 않음 -> 인위적으로 0부터 23까지 만들어줘야 함 > 내가 한 풀이 : 그런데 이렇게 하고 찝찝함이 남음 : 진짜 ROW_NUMBER로 강제적으로 0-23까지 만드는게 맞나?? >>다른 사람들의 풀이 출처 : https://jaaamj.tistory.com/155 [프로그래머스 SQL] 입양 시각 구하기(2) 문제 설명 ANIMAL_OUTS 테이블은 동물 보호소에서 입양 보낸 동물의 정보를 담은 테이블입니다. ANIMAL_OUTS 테이블 구조는 다음과 같으며, ANIMAL_ID, ANIMAL_TYPE, DATETIME, NAME, SEX_UPON_OUTCOME는 각각 동물의 아 jaaamj..
5-4) 범주형 변수 분석 #0. 준비단계 : 데이터셋 로드 및 라이브러리 import - 라이브러리 불러오기 -seaborn에 내장된 데이터셋 'mpg' 로드 #1. Count : 각 범주별 빈도수 세기 -1개 변수의 빈도수 => series : 변수. value_counts() -2개 변수 빈도수 => table : 데이터셋. crosstab( 변수1, 변수2) df['origin'].value_counts() pd.crosstab(df['origin'], df['cylinders'] ) - 빈도수 그래프=> countplot : 데이터셋. countplot( data=데이터셋, x= 변수1) #옵션 - hue : 범주별로 다른 색상 표현 #countplot ->origin 빈도수 시각화 하기 sns.countplot(data..