본문 바로가기

CS(Computer Science)/인공지능9

9. 과대적합, 과소적합, 규제, 교차 검증 과대적합(Overfitting) : 학습 데이터에 대해서는 높은 성능을 보이지만, 새로운 데이터에 대해서는 낮은 성능을 보이는 문제 모델이 학습 데이터에만 너무 적합해져서 일반화하지 못하는 문제 과소적합(Underfitting) : 모델이 데이터에 대한 패턴을 제대로 파악하지 못해 학습 데이터와 테스트 데이터 모두 성능이 낮은 상태, 모델이 너무 간단하거나 학습 데이터가 적어서 발생 규제(Regulation) : 과대적합 문제를 해결하기 위한 방법, 모델의 복잡도를 제한하여 과대 적합을 방지한다. L1, L2 규제가 있다. 교차 검증(Cross Validation) : 모델의 일반화 성능을 평가하기 위한 방법 중 하나, 데이터를 여러 개의 폴드(fold)로 나누어 각각을 테스트 데이터로 사용하고 나머지 .. 2023. 3. 19.
8. 사이킷런 경사하강법 사이킷런 (sklearn.linear_model)에서 제공하는 경사하강법 모듈 from sklearn.linear_model import SGDClassifier from sklearn.datasets import load_breast_cancer from sklearn.model_selection import train_test_split import numpy as np import matplotlib.pyplot as plt cancer = load_breast_cancer() x = cancer.data y = cancer.target x_train, x_test, y_train, y_test = train_test_split(x,y,stratify=y, test_size=0.2, random_s.. 2023. 3. 19.
7. 단일층 신경망 단일층 신경망(Single-layer neural network) : 하나의 입력층과 하나의 출력층으로 구성된 인공신경망 모델 : 입력 데이터가 입력층으로 들어가면 출력층에서 결과가 출력된다. : 연결층에는 여러 개의 뉴런이 존재한다. 각 뉴런은 입력 데이터와 연결된 가중치(Weight)와 편형(Bias) 값을 가지고 있습니다. 입력 데이터는 이 가중치와 편향 값에 따라 출력층으로 전달된다. 한계점 - XOR 문제와 같은 비선형 분류 문제는 해결할 수 없다 => 다층 신경망, 딥러닝 from sklearn.datasets import load_breast_cancer from sklearn.model_selection import train_test_split import numpy as np impor.. 2023. 3. 19.
6. 로지스틱 회귀 로지스틱 회귀 (Logistic Regression) - 입력변수 x와 출력변수 y 간의 관계를 확률로 모델링 - 출력변수는 0 또는 1의 값을 가질 수 있으며, 0 또는 1의 값이 나오도록 확률을 조정하는 함수로는 로지스틱 함수가 사용된다. - 로지스틱 함수는 S자 모양의 곡선으로 표현되며, 입력 값에 따라 출력 값을 0과 1 사이 값으로 변환합니다. - 입력 변수의 가중치(weight)와 편향(bias)을 조정하여 최적의 모델을 학습한다. from sklearn.datasets import load_breast_cancer from sklearn.model_selection import train_test_split import numpy as np import matplotlib.pyplot as .. 2023. 3. 19.
728x90