|
|

|
|
인공지능시대(55): 인공지능의 의존구조 학습
|
|
2022년 02월 11일 [주간문경] 
|
|
|

| 
| | | ↑↑ 지홍기
영남대학교 명예교수
문경대학교 특임교수
문경시지역발전협의회 의장 | ⓒ (주)문경사랑 | | 의존구조 학습이란?
의존구조(Dependency Structure) 학습은 데이터 객체가 종속성 구조로서 구조의 형상을 역할이라 부르는 유한 형상 트리(Tree)를 학습하는 과정이다. 종속 구조의 각 노드는 문장의 단어로 표시하며, 단어 순서는 종속 구조에서 지정되지 않은 채로 남는다. 학습과정은 노드에 순서를 지정하여 표현할 수 있으며, 의존구조 학습을 할 때는 문장의 문법적 구조를 파악하여 각 단어별로 관계성을 찾아야 한다.
의존구조 학습을 하는 이유는 문장의 구조적 모호성을 해결하기 위한 목적이며, 사용되지 않은 코드와 변수를 찾아 속도의 최적화를 통해서 코드의 정적 분석을 위한 정보를 얻기 때문이다. 의존구조 학습의 알고리즘으로는 비결정적 의존구문 분석과 결정적 의존구문 분석이 있다. 비결정적 의존구문 분석은 문장이 가질 수 있는 모든 의존 트리 중에서 가장 높은 점수의 의존 트리를 선택하는 방법이다.
그러나 결정적 의존구문 분석은 일종의 탐욕적 알고리즘에 기반한 방법으로 지역적 학습 모델을 사용하는 전이 기반 의존구문 분석이다. 결정적 의존구문 분석은 비결정적 의존구문 분석보다 더 많은 문맥의 자질을 사용할 수 있고, 근거리 의존관계를 찾는데 강하며, 속도가 빠르다는 장점을 가지고 있다. 그러나 분석 방법을 잘못 결정할 경우 오류의 전파가 발생할 수 있다는 단점이 있다.
벡터 양자화
벡터 양자화(Vector Quantization)는 샘플링한 영상의 타입을 코드북에 저장된 많은 영상 패턴들과 비교하여 유사한 패턴의 부호 번호인 벡터 인덱스(Index)로 표현하는 손실 영상압축 기법이다. 벡터의 차수가 클수록 양자화 오차가 줄어들지만 부호화 복잡도는 기하 급수적으로 증가하며, 압축률을 높일수록 구획 효과 또는 에지 훼손 등의 화질 열화가 생길 수 있다.
벡터 양자화 방법은 패턴을 대체하는 경우이며, 벡터 양자화 과정은 다음과 같다. 먼저 비트의 시계열(Bit Stream)을 벡터들로 나누며, 비트 시계열의 실제값을 전송하는 대신에 코드표에서 일치하는 패턴의 인덱스 값을 전송한다. 따라서 이 기법은 특히 음성 부호화에 적합하며, 자기 유사성(Fractal) 변환 방법이 적용되고 있다.
| 
| | ⓒ (주)문경사랑 | | 데이터 차원 축소
데이터 차원 축소는 고차원의 특징 벡터를 저차원으로 감소시키는 것이다. 대부분 실무에서 분석하는 데이터는 매우 많은 특성들을 지니고 있다. 그러므로 데이터 차원 축소는 잡음 특성을 제거하여 분류를 용이하게 하고 모델링에 필요한 학습 집합의 크기를 줄여 패턴 분류기에 의한 학습과 인식 속도를 증진시키기 위한 방법이다.
따라서 데이터를 가지고 기계학습 알고리즘을 적용해 문제를 해결하려고 한다면, 데이터의 차원이 크기 때문에 학습 속도가 느릴 뿐만 아니라 성능 또한 좋지 않을 가능성이 크다. 기계학습에서 데이터 셋의 특성이 많아지면, 각 특성인 데이터의 차원이 증가하게 된다. 이렇게 데이터의 차원이 증가할 수록 데이터 공간의 부피가 기하 급수적으로 증가하게 되며, 이 때문에 데이터의 밀도는 차원이 증가할 수록 희소해진다. 이러한 현상을 바로 “차원의 저주”라 한다.
차원의 저주를 넘어
이러한 차원의 저주를 해결하기 위한 방법 중 하나는 데이터의 밀도가 높아질 때까지 학습 데이터셋의 크기를 늘리는 것이며, 이를 해결하기 위한 방법으로는 증명사진에서 불필요한 특성을 삭제하는 것을 예로 들 수 있다. 즉, 이미지(사진)에서 인물 이외의 정보를 제거하여 입력 데이터의 차원을 낮추는 것이다. 증명사진의 배경 부분을 제거하여 모델을 학습해도 성능에는 큰 차이가 없을 것이다.
따라서 미래의 인공지능은 차원의 저주를 넘어, 데이터에서 불필요한 특징을 제거하는 “데이터의 차원 축소”가 대세가 될 것이다.
|
|
|
|
|
|
|
|
|
|
|
|
!! 타인의 명예를 훼손하거나 개인정보를
유출하는등 법률 및 신문사 약관에 위반되는
글을 삼가하여 주시기 바랍니다. 게시물에
대한 민형사상의 법적인 책임은 게시자에게
있으며 운영자에 의해 삭제되거나 관련 법률에
따라 처벌 받을 수 있습니다.
|
|
|
홈페이지관리자 기자 . “주간문경을 읽으면 문경이 보인다.” - Copyrights ⓒ주간문경.
무단 전재 및 재배포 금지 -
|
|
|
|
주간문경
기사목록 | 기사제공 : 주간문경
|
|
|
|
|
|

|
|
실시간
많이본
뉴스
|
|
|
|
|