인공지능과 딥러닝 모델

예를 들어 집필전 우리는 아마도 커피중독자가 되어야 할거다 우리는 바로 차로 타서 휴대폰을 째려보면서 "헤이 시리" 라는 단어로 음성인식 기능을 사용할꺼다. 그리고 근처 스타벅스를 안내해줘라는 명령을 할꺼고 우리의 휴대폰은 우리 명령을 실행할것이다. 지도 앱이 방향과 여러 경로를 보여 줄 것이다. 그리고 각 소요시간을 알려주고 안내를 준비할것이다 이런 상황을 각 시간단위로 열거했지만 이런 상황은 순식간에 일어나고 매일 우리가 머신 러닝기계인 스마트폰과 함께 하는 일상이다. 이런 편의함을 만들기 위해서 스마트폰 실행 단어인 시리 안녕 구글 그리고 알렉사 단어를 코딩한다고 가정해보자. 아마도 코딩 준비를 할 수 있는 공간과 컴퓨터와 그리고 코딩 편집기를 마련 할 것이다 추가로 마이크도 있다. 하드웨어는 준비했다 그러면 소프트웨어적인 법위에서 처음 원칙을 어떻게 결정할것인가? 우선 50,000 이상의 샘플을 채집해야할것이다 그중에서 실행 명령어 소리를 분류 해야한다 헉 코딩준비부터 샘플처리까지... 미친다... 이 순간 필요한건 머신러닝이다. 우리가 컴퓨터에 입력과 출력 기준을 셋팅하지 못하는 상황에서 좋은 해결방법이다. 다시 말하면 실행어인 시리를 인식하는 프로그램을 만들지 못해도 또는 만들 수 있더라도 머신러닝을 이용하면 엄청난 데이텅를 샘플링하고 명령어를 라벨링하는 것이 효과적으로 해결이 된다. 머신러닝 관점으로 접근하면 우리는 프로그램을 이용한 명령어 인식을 시도할 필요가 없고 유연한 몇 가지 기준을 세팅만 하면 명령어 추출준비는 끝이다 그리고 데이터셋을 가능할 수 있는 만큼 기준을 사용하고 발생하는 결과를 확인하면서 더 좋은 기준을 적용하면서 더 좋은 결과를 만들어내면 되는것이다. 기준은 우리가 문을 여는 손잡이와 같은 것을 생각하면 된다. 이 기준으로 프로그램의 결과를 만들 수 있다. 기준을 설정하면 이것을 프로그램 모델이라고 한다. 프로그랭을 이용해서 입력과 출력 과정을 모델 패밍리하고 한다. 그리고 데이터를 기준에 적용하는 것을 러닝 알고리즘이라고 정의한다. 이 러닝 알고리즘을 적용하기전에 문제를 적확히 인식하고 입력값과 출력값의 속성를 확인 후에 적절한 모델 패밀리를 선택한다 예시 상황으로 음성을 인식하고 명령어 유무를 확인하면서 출력값을 만든다. 그래서 만약 적적한 모델 패밀리를 선택하면 시리를 확인되면 에스라는 확인을 한다. 당연히 정확한 실행어를 완벽하게 인식이 되기 때문이다. 그러면 우리는 더 많은 모델 패밀리를 원하는데 다른 명령어를 예를 들면 시소라는 것이다. 그래서 같은 종류 모델 패밀리를 적용해서 시리나 시소를 확인 할것이다.두 단어는 거의 비슷하기에 모델패밀리에 적용하기가 용이하기 때문이다. 하지만 완전히 다른 자료, 예를 들면 중국어나 그리스어 등등 상관성이 없는 자료에서 모델 패밀리를 적용하는것은 완전히 다른 종류에 모델 패밀리가 필요하다. 이렇듯 기준을 명확히 하지 않는다면 시리나 시소를 인식하지 못할것이다 딥러닝에선 선행적으로 우리는 정확한 모델를 구축하는것이 정확한 결과를 만들수 있다. 진행 과정을 다시한번 설명한다. 시작은 셋팅 없는 모델로 시작하기.다음엔 데이타에 라벨링 작업을 한다. 기준을 조정하면서 데이타를 망치지 말고 좋아질때까지 반복하는 단계로 과정이 요약된다. 과정을 보면 실행어 인식코딩하는것보다 실행어를 인식하는 프로그램을 만든는것이 더 많은 데이터를 처리한다. 아마도 라베링된 데이터를 만들 수 있다면 예를 들면 고양이 인식기 머신러닝을 프로그램 할 수 있을거라 생각할 것이다 이렇게 하면 탐지기는 고양이라면 아주 큰 양의 숫자를, 개라면 아주 큰 음의 숫자를, 확실하지 않으면 0에 가까운 무언가를 방출하는 것을 배우게 될 것이고, 이것은 ML이 할 수 있는 일의 일부분밖에 나타내지 못한것이다. 그중 딥러닝은 기계학습 문제를 해결하는 많은 인기 있는 방법들 중 하나이다. 지금까지 우리는 기계학습에 대해 폭넓게 이야기했을 뿐 심층학습에 대해서는 이야기하지 않았다. 왜 딥러닝이 중요한지는 두어 가지 결정적인 점을 부각시켜야 한다. 하나는 이제껏 애기한 가공안된 소리나 이미지 언어에 대해서는 딥러닝이 굉징히 효과적인 부분이 점점 되어간다 전통적인 머신러닝의 계를 보여주는 부분이기도 하다 딥러닝의 특징으로 여러 연산 층으로 진행을 한다. 이런 방식은 하위 연산층에서 해결이 안된 부분이 상위 연산층으로 갈수록 처리할 수 확률이 높아진다. 이런 부분은 예전엔 수작업으로 처리가능한 상태로 했다. 가장 딥러닝의 좋은 점은 전통적인 러닝 파이프라닝을 대체하고 노동집약적인 부분까지 대체 할 수 있기 때문이다. 두번째는 분석전 준비과정을 대신하므로 인해 컴퓨터 영역 목소리 인식 언어처리속성 의료정보및 다른 영역까지 경계가 무의미하게 하는 역활 또한 한다. 이전 예시로 우리는 실행어 인식에서, 우리는 오디오 스니펫과 이진 라벨로 구성된 데이터셋을 설명했고, 우리는 어떻게 우리가 스니펫에서 분류에 이르는 매핑에 대한 대략적인 모델을 훈련시킬 수 있는지에 대해 잠시나마 확인을 해보았다. 이러한 종류의 문제는, 우리가 알려진 입력에 따라, 예를 들어, 데이터 집합이 구성되고, 라벨이 알려진 것을 감독 학습이라고 하며, 그것은 많은 종류의 기계 학습 문제들 중 하나일 뿐이다. 다음 내용에서는 다양한 머신러닝 문제에 대해 자세히 살펴보기로 한다. 처음으로는 첫째, 어떤 머신러닝 문제를 안고 있든, 우리를 따라올 핵심 부품에 대해 좀 더 조명해 보고자 한다.

'인공지능' 카테고리의 다른 글

인공지능과 객관적 기능 (0)	2020.06.28
인공지능 구성요소 (0)	2020.06.26
인공지능과 딥러닝 (0)	2020.06.23
인공지능 설명 및 역사 (0)	2020.06.20
인공지능 활용 및 역사 (0)	2020.06.19