본문 바로가기
반응형

전체 글367

[머신러닝] 차원 축소와 주성분 분석 비지도 학습의 차원 축소비지도 학습에서의 차원 축소는 레이블이 없는 데이터의 특성(feature) 수를 줄이는 과정입니다. 이 방법은 주로 데이터의 가장 중요한 정보는 유지하면서 계산 복잡성을 줄이고, 과적합을 방지하며, 데이터의 시각화를 용이하게 하는 데 도움을 줍니다. 차원 축소는 데이터의 내재된 구조를 파악하는 데 유용하며, 여러 기법이 있지만 가장 널리 사용되는 기법은 주성분 분석(PCA), t-SNE, 그리고 LDA(Linear Discriminant Analysis) 등입니다. 비지도 학습의 차원 축소 예시: 고객 데이터 시각화고객 데이터에는 다양한 속성(예: 연령, 소득, 구매 횟수 등)이 포함되어 있을 수 있습니다. 이러한 데이터는 차원이 많아 직접적인 시각화가 어렵습니다. 차원 축소 기법.. 2024. 11. 11.
[Python/Numpy] 배열에서 고유한 요소 찾을땐 unique() 함수 넘파이(Numpy)의 unique 함수는 배열에서 모든 고유한 요소를 찾고, 이들을 정렬된 형태로 반환합니다. 이 함수는 중복된 값을 제거하고 각 고유한 값이 배열에서 최초로 등장하는 위치, 빈도 등 추가적인 정보도 제공할 수 있습니다. 1. 기본 사용법import numpy as nparray = np.array([1, 2, 2, 3, 3, 3, 4])unique_values = np.unique(array)print(unique_values) # [1, 2, 3, 4] 2. 추가적인 반환 값return_index=True: 고유 값이 처음 등장하는 인덱스를 반환합니다.return_inverse=True: 원래 배열을 재구성할 때 사용할 수 있는 인덱스 배열을 반환합니다.return_counts=Tr.. 2024. 11. 11.
[혼공머신] 06-2 | k-평균 이번 단원에서는 k-평균 알고리즘의 작동 방식을 이해하고, 과일 사진을 자동으로 모으는 비지도 학습 모델을 만들어본다.​https://youtu.be/SBdy0nSctRM?si=LJ1qOffRbHGHUKmf  키워드​k-평균k-평균 알고리즘은 처음에 랜덤하게 클러스터 중심을 정하고 클러스터를 생성합니다. 그다음 클러스터의 중심을 이동하고 다시 클러스터를 생성하는 것을 반복하여 최적의 클러스터를 만드는 알고리즘입니다.​클러스터 중심k-평균 알고리즘이 만든 클러스터에 속한 샘플의 특성 평균값입니다. 센트로이드centriod라고도 불립니다. 가장 가까운 클러스터 중심을 샘플의 또 다른 특성으로 사용하거나, 새로운 샘플에 대한 예측으로 활용할 수 있습니다.​엘보우 방법최적의 클러스터 개수를 정하는 방법 중 하나.. 2024. 11. 9.
[Python] 파이썬 올림, 반올림, 내림, 버림 / ceil, round, floor, trunc 파이썬에서의 올림, 반올림, 내림 기능은 math 모듈과 내장함수를 통해 사용할 수 있습니다.바로 예시와 함께 설명하겠습니다. 1. 올림math.ceil() 함수는 주어진 숫자보다 크거나 같은, 가장 작은 정수를 반환합니다. 즉 숫자를 올림합니다.import mathprint(math.ceil(3.2)) # 결과는 4print(math.ceil(-3.2)) # 결과는 -3 2.  반올림파이썬 내장함수인 round()는 주어진 숫자를 가장 가까운 정수로 반올림하며, .5의 경우 가장 가까운 짝수로 반올림합니다.print(round(3.5)) # 결과는 4print(round(2.5)) # 결과는 2print(round(3.672, 1)) # 결과는 3.7, 소수점 첫째 자리에서 반올림 3. 내림ma.. 2024. 11. 8.
[머신러닝] 비지도 학습 k-평균 / K-means K-평균(K-means) 알고리즘은 비지도 학습의 가장 널리 사용되는 클러스터링 방법 중 하나입니다. 이 방법은 데이터를 K개의 클러스터로 그룹화하는 것을 목표로 하며, 각 클러스터는 클러스터의 중심(centroid)을 기반으로 형성됩니다. K-평균 알고리즘K-평균 알고리즘의 작동 원리K-평균 알고리즘의 기본 단계는 다음과 같습니다:초기 중심 설정: 먼저 데이터 포인트 중에서 무작위로 K개를 선택하여 각 클러스터의 초기 중심(centroid)으로 설정합니다.할당 단계: 각 데이터 포인트를 가장 가까운 클러스터 중심에 할당합니다. 클러스터 중심과의 거리는 보통 유클리드 거리를 사용하여 측정합니다.업데이트 단계: 각 클러스터의 중심을 새롭게 계산합니다. 이는 클러스터에 속한 모든 데이터 포인트의 평균 위치로.. 2024. 11. 8.
반응형