영화 추천 시스템, 동적 크롤링
영화 추천 시스템의 기본 원리 구현행렬 분해(Matrix Factorization) 기법을 사용하여 유저와 영화 간의 평점을 예측하는 방식 1. 행렬 A 정의 및 누락값 포함 A = np.array([[4,1,5,np.nan,1], [2,3,np.nan,2,3], [1,np.nan,4,1,3], [np.nan,2,4,np.nan,2], [1,np.nan,4,1,3]])A는 영화 추천 시스템에서 유저와 영화 간의 평점을 나타내는 행렬np.nan은 누락된 값(즉, 유저가 특정 영화에 대한 평점을 제공하지 않은 경우)을 나타냄. 2. 마스크 생성 mask = ~np.isnan(A)mask는 A의 각 요소가 누락값이..
시계열, RNN, Seq2Seq, 어텐션, ARIMA, CNN
RNN : 만약 1일차, 2일차, 3일차 주가를 넣으면 2일차, 3일차 종가를 출력한다고 가정, 그러면 2일차 종가 정답값, 3일차 종가 정답값과의 각각 Loss 값을 계산할 수 있있지 않는가? 그러면 2일차 loss, 3일차 loss를 합쳐서 loss를 구해내어서 W값을 없데이트 한다. Seq2Seq: seq2seq는 인코더와 디코더 두가지 모듈로 구성컨텍스트 벡터 : 인코더는 입력 문장의 모든 단어들을 순차적으로 입력받은 뒤에마지막에 이 모든 단어 정보들을 압축해서 하나의 벡터로 만듦디코더는 컨텍스트 벡터(인코더에서 생성된 상태)를 받아서 번역된 단어를 하나씩 순차적으로 출력 1. Seq2Seq 모델 개념Seq2Seq는 두 개의 RNN으로 구성된다:인코더(Encoder): 입력 시퀀스를 읽어 정보를 ..
AutoML, 퍼셉트론, 다층 퍼셉트론(MLP)
AutoML (Auto Machine Learning)AutoML은 머신러닝 모델의 설계, 개발, 훈련, 평가, 배포 등 일련의 과정을 자동화하는 기술머신러닝 프로젝트는 데이터 전처리, 모델 선택, 하이퍼파라미터 튜닝, 모델 평가 등 다양한 단계가 필요하며,각 단계에서 많은 시간과 노력이 요구된다.AutoML은 이러한 과정에서 사람이 개입할 필요를 최소화하여, 머신러닝 모델을 더 빠르고 쉽게 개발할 수 있도록 도와줌 PyCaretPyCaret은 파이썬 기반의 오픈소스 AutoML 라이브러리로,데이터 사이언스와 머신러닝을 더 쉽게 접근할 수 있도록 설계되었다.PyCaret은 간단한 코드를 통해 데이터 전처리, 모델링, 평가, 하이퍼파라미터 튜닝, 모델 배포 등 다양한 작업을 수행 가능 PyCaret의 주요..