데이터베이스 윈도우 함수, 데이터 모델링 개요 및 정규화, Selenium 크롤링
윈도우 함수ROW_NUMBER(), RANK(), DENSE_RANK(), LEAD(), LAG() 등 sum()selecte.emp_no, e.name, e.dept_no, e.salary,sum(e.salary) over (partition by e.dept_no) as total_dept_sal,sum(e.salary) over (partition by e.dept_no order by e.emp_no) as emp_salfrom employee e; dense_rank()select e.emp_no, e.name, e.salary,dense_rank() over (order by e.salary desc) as dense_ranksfrom employee e; 데이터 모델링 개요 및 정규화 ..
데이터베이스 DDL, 뷰, 인덱스
DDL : 데이터베이스 내에 테이블이나 인덱스, 뷰 등의 객체를 만들거나 수정, 삭제할 때 사용CREATE, ALTER, DROP CREATE: 데이터베이스나 테이블, 뷰, 인덱스 등 객체를 만들 때 사용CREATE TABLE 테이블명 (컬럼1 (데이터타입), 컬럼2 (데이터타입)) 문제 1. 다음 요구사항을 만족하는 MySQL 데이터베이스를 생성하고, 테이블을 만드세요.데이터베이스 이름: company_db테이블: test컬럼:id (INT, PRIMARY KEY, AUTO_INCREMENT)first_name (VARCHAR(50))last_name (VARCHAR(50))email (VARCHAR(100), UNIQUE)date_of_birth (DATE)date_of_joining (DATE)d..
통계의 종류, 히트맵, 람다함수, 이항분포, 베르누이분포, 기하분포
샘플링 방법 복원추출 (replacement): 샘플을 추출한 후, 다시 원래 집합에 돌려놓고 다음 샘플을 추출하는 방법 (같은 요소가 여러 번 선택 가능)비복원추출 (non-replacement): replace=False 추가, 샘플을 추출한 후, 다시 원래 집합에 돌려놓지 않고 다음 샘플을 추출하는 방법( 같은 요소가 한 번만 선택됨 ) 랜덤 시드값 세팅시드 값 0을 사용한 경우, np.random.choice가 난수를 생성하는 순서가 항상 동일하게 됨 import numpy as npprint(np.random.choice([1,2,3], 3))# 비복원추출print(np.random.choice([1,2,3], 3, replace=False))# 랜덤 시드값 세팅np.random.seed(0)p..