본문 바로가기
반응형

AI28

[혼공머신] 04-2 | 확률적 경사 하강법 키워드확률적 경사 하강법훈련 세트에서 샘플을 하나씩 꺼내서 손실 함수의 경사를 따라 최적의 모델을 찾는 알고리즘이다. 샘플을 하나씩 사용하지 않고 여러 개를 사용하면 미니 배치 경사 하강법이 된다. 한 번에 전체 샘플을 사용하면 배치 경사 하강법이 된다.​손실 함수손실함수는 확률적 경사 하강법이 최적화할 대상이다. 대부분의 문제에 잘 맞는 손실 함수는 이미 정의되어 있다. 이진 분류에는 로지스틱 회귀(또는 이진 크로스 엔트로피) 손실 함수를 사용한다. 다중 분류에는 크로스 엔트로피 손실 함수를 사용한다. 회귀 문제에는 평균 제곱 오차 손실 함수를 사용한다.​에포크확률적 경사 하강법에서 전체 샘플을 모두 사용한 횟수를 의미한다. 일반적으로 경사 하강법 알고리즘은 수십번에서 수백 번 에포크를 반복한다.​​0.. 2024. 10. 24.
[혼공머신] 04-1 | 로지스틱 회귀 키워드로지스틱 회귀선형 방정식을 사용한 분류 알고리즘이다. 선형 회귀와 달리 시그모이드 함수나 소프트맥스 함수를 사용하여 클래스 확률을 출력할 수 있다.다중 분류타깃 클래스가 2개 이상인 분류 문제이다. 로지스틱 회귀는 다중 분류를 위해 소프트맥스 함수를 사용하여 클래스를 예측한다.시그모이드 함수선형 방정식의 출력을 따라 0과 1사이의 값으로 압축하여 이진 분류를 위해 사용한다.소프트맥스 함수다중 분류에서 여러 선형 방정식의 출력 결과를 정규화하여 합이 1이 되도록 만든다. 04-1 단원 내용럭키백의 확률04-1 단원에서 럭키백에 들어간 생선의 크기, 무게 등이 주어졌을 때 생선 7개에 대한 확률 출력하기 데이터 준비하기pandas의 unique()함수로 열의 고유한 값 추출하기타깃 데이터와 입력 데이터.. 2024. 10. 17.
[혼공머신] 03-3 | 특성 공학과 규제 03-3 단원 내용다중 회귀다중 회귀는 여러 개의 특성을 사용하는 회귀 모델이다. 특성이 많으면 선형 모델은 강력한 성능을 발휘한다.특성 공학은 기존의 특성을 사용해 새로운 특성을 뽑아내는 작업이다.데이터 준비사이킷런의 변환기사이킷런은 특성을 만들거나 전처리하기 위한 다양한 클래스를 제공한다. 사이킷런에서는 이런 클래스를 변환기라고 부른다.다중 회귀 모델 훈련하기규제릿지 회귀릿지는 규제가 있는 선형 회귀 모델 중 하나이며 선형 모델의 계수를 작게 만들어 과대적합을 완화시킨다. 릿지는 비교적 효과가 좋아 널리 사용하는 규제 방법이다.라쏘 회귀또 다른 규제가 있는 선형 회귀 모델이다. 릿지와 달리 계수 값을 아예 0으로 만들 수 있다.모델의 과대적합 제어하기  https://youtu.be/PLECEclz0.. 2024. 10. 14.
[Youtube] What is LSTM (Long Short Term Memory) LSTM 관련 기초 개념을 갖기에 좋은 영상을 발견해서 공유합니다.영상 길이가 8분 정도로 짧고, 영어 자막도 제공되니 도움 되실 거라 생각합니다.요약본을 보고싶다면 LylisAI를 이용하시기를 추천드립니다. 영상 목차LSTM의 기능과 중요성LSTM의 기본 원리RNN의 장기 의존성 문제LSTM의 구조와 기능RNN셀에서 상태 정보 활용 방법에 관한 설명LSTM의 활용 사례 https://www.youtube.com/watch?v=b61DPVFX03I 2024. 10. 7.
[머신러닝/사이킷런] K-최근접 이웃 회귀, kneighborsregressior의 score 메소드 사용법 오늘은 사이킷런에서 제공하는 kneighborsregressior 클래스의 score 메소드에 대해 설명하겠습니다. 우선 k-최근접 이웃 알고리즘의 회귀 버전 kneighborsregressior은, 입력 데이터에 대한 예측값을 만들기 위해서 가장 가까운 이웃 샘플을 찾고 이 샘플들의 타깃값의 평균을 계산하는 알고리즘입니다. kneighborsregressior 클래스의 score 메소드는 예측한 값의 품질을 평가하는 데 사용됩니다. 0과 1사이의 값을 가지는 결정 계수 R2 값을 반환하는데요. R2 값이 1에 가까울수록 모델의 예측이 실제 데이터를 잘 설명한다는 의미이고, 0에 가까울수록 모델의 예측 성능이 좋지 않음을 의미합니다. R2 계산 방법은 다음과 같습니다. 여기서 yi는 타깃값, y^i는 예.. 2024. 2. 16.
반응형