모두를 위한 딥러닝 강좌 시즌1을 통해 공부한 내용을 정리해봤습니다

Lec 00 - Machine/Deep learning 수업의 개요와 일정

 

 

나는 A나라의 대학생이다

(A나라에서는 공부한만큼 비례하여 성적이 나온다)

그래서 궁금해졌다 '이만큼 공부하면 성적이 얼마나 나올까?'

이럴때 사용할 수 있는 것이 Linear Regression이다

 

더보기

AI의 발전으로 우리는 이러한 문제에 쉽게 답할 수 있게 되었다

 

기존의 방식대로 하면 모든 조건에 대해 설계하고 통제해야 한다

하지만 AI를 사용하면 그럴 필요가 없어진다

AI가 학습하고, 답변을 내놓는다

 

이 문제를 풀어내기 위해선

공학도의 접근 방식이 필요하다

 

=> 문제를 새롭게 정의하기

 

예상 성적을 구하기 위해서는..

해당 조건에 가장 어울리는 직선을 찾으면 되지 않을까? 라는 가설을 세웠다

 

기존의 문제 정의 : 이 정도 공부했을때 성적이 얼마나 나올까?

새로운 문제 정의 : 조건을 만족하는 직선을 찾자!

 

A나라에서는

공부한 시간에 비례하여 성적이 나오기 때문에

해당 조건을 만족하는 직선의 방정식을 찾으면 된다

ax+b

 

가설을 h(x)라고 표현한다면

h(x) = ax + b 라고 쓸 수 있다

 

직선의 방정식에다가

공부한 시간을 넣어주면

예상 성적을 구할 수 있다

 

찾은 직선의 방정식이 3x+2일때,

x에 공부한 시간을 넣어준다

30시간이라고 하면..

3*30 + 2 = 90+2 = 92

92점을 받는다는 것을 알 수 있다

 

그럼 이런 직선은 어떻게 찾을 수 있을까

 

정답은..

데이터를 이용하면 된다

 

A나라의 학생들 3명에게 물어본 결과

공부시간     성적
10        28
15              40
20              65

 

이러한 데이터를 얻었다

 

좌표에 찍어보면 다음 그림과 같다

주어진 데이터를 가장 잘 표현하는 선 하나를 찾으면 된다!

무작위로 선을 하나 긋고

점과 선 사이의 거리들을 살펴본다 (여기서의 거리는 y좌표의 차이를 의미함)

 

선을 긋고 거리를 살피는 과정을 반복하면서

이 거리들이 가장 최소가 되는 선을 찾는다

그럼 아래와 같은 직선을 찾을 수 있다

이 선이 바로 우리가 찾던 직선이다

 

직선의 방정식을 수학적으로 표현하면 ax + b

즉 우리가 방금 한 과정을 수학적인 관점에서 본다면,

주어진 데이터를 가장 잘 표현하는 선을 찾는다 = 직선의 방정식에서 a와 b를 찾는다

라고 볼 수 있다

 

점과 선 사이의 거리 차이를 보는 과정으로 돌아가보자

이러한 거리 차이를 비용이라고 보겠다

우리는 비용이 최소인 직선을 찾으면 된다

 

비용을 cost(a,b) 라고 한다면

cost(a,b) = (실제 데이터값 - 우리가 예측한 값)^2  의 평균값

이고, 아래처럼 표현할 수도 있다

cost(x) = (Y - h(x))^2 의 평균값

 

제곱을 하는 이유는 접은글에서 확인

더보기

점 A와 점 B는 +2만큼 떨어져 있고

점 A와 점 C는 -2만큼 떨어져 있을때,

B랑 C는 같은 거리만큼 떨어져있다

하지만 제곱을 하기 전에는 다른 값을 가지고 있다

부호가 양수일때나 음수일때나

같은 값을 가지도록 하기 위해

제곱을 해준다 

 

절대값을 씌울수도 있겠지만

더욱 극명한 효과를 위해 제곱을 사용한다

 

cost(a,b)는 엄밀하게 살펴보면 무언가의 제곱 형태이다

그 안을 살펴보면 h(x) 즉 ax+b가 제곱되어있는 형태이므로

그래프로 그려보면 이차함수 모양을 확인할 수 있다

아래로 볼록한 이차함수가 된다

우리는 이 cost가 최소가 되도록 하는 a,b를 찾고 싶다

딱 봤을때 아래로 볼록한 저 부분이 최소값을 가지는 부분이다

 

그 부분에 특징은 바로 기울기가 0 이라는 것!

 

무작위로 시작하므로 기울기가 0인곳의 왼쪽 혹은 오른쪽에서 시작할 수 있다

어디에서 시작하든 우리는 기울기가 0인 곳으로 가면 되기 때문에

값을 수정해 나가면 기울기가 0이 되는 곳을 찾을 수 있다

 

비용이 최소가 되는 곳이다

즉 가장 알맞은 직선 ax+b를 찾은 것이다

 

드디어 예상 성적을 구할 수 있게 되었다

 

A나라에서 예상 성적 구하기 마침.

 

질문 환영합니다

+ Recent posts