최종편집 : 2026-04-17 오후 06:02:50

종합행정정치출향인사회/복지/여성산업문경대학·교육문화/체육/관광사람들길 따라 맛 따라다문화

전체기사

커뮤니티

공지사항

독자투고

직거래장터

자유게시판

결혼

부음

뉴스 > 사설/칼럼

+크기 | -작게 | 이메일 | 프린트

인공지능시대(55): 인공지능의 의존구조 학습

2022년 02월 11일(금) 16:55 [주간문경]

 

 

↑↑ 지홍기
영남대학교 명예교수
문경대학교 특임교수
문경시지역발전협의회 의장

ⓒ (주)문경사랑

 

의존구조 학습이란?

의존구조(Dependency Structure) 학습은 데이터 객체가 종속성 구조로서 구조의 형상을 역할이라 부르는 유한 형상 트리(Tree)를 학습하는 과정이다. 종속 구조의 각 노드는 문장의 단어로 표시하며, 단어 순서는 종속 구조에서 지정되지 않은 채로 남는다. 학습과정은 노드에 순서를 지정하여 표현할 수 있으며, 의존구조 학습을 할 때는 문장의 문법적 구조를 파악하여 각 단어별로 관계성을 찾아야 한다.

의존구조 학습을 하는 이유는 문장의 구조적 모호성을 해결하기 위한 목적이며, 사용되지 않은 코드와 변수를 찾아 속도의 최적화를 통해서 코드의 정적 분석을 위한 정보를 얻기 때문이다. 의존구조 학습의 알고리즘으로는 비결정적 의존구문 분석과 결정적 의존구문 분석이 있다. 비결정적 의존구문 분석은 문장이 가질 수 있는 모든 의존 트리 중에서 가장 높은 점수의 의존 트리를 선택하는 방법이다.

그러나 결정적 의존구문 분석은 일종의 탐욕적 알고리즘에 기반한 방법으로 지역적 학습 모델을 사용하는 전이 기반 의존구문 분석이다. 결정적 의존구문 분석은 비결정적 의존구문 분석보다 더 많은 문맥의 자질을 사용할 수 있고, 근거리 의존관계를 찾는데 강하며, 속도가 빠르다는 장점을 가지고 있다. 그러나 분석 방법을 잘못 결정할 경우 오류의 전파가 발생할 수 있다는 단점이 있다.

벡터 양자화

벡터 양자화(Vector Quantization)는 샘플링한 영상의 타입을 코드북에 저장된 많은 영상 패턴들과 비교하여 유사한 패턴의 부호 번호인 벡터 인덱스(Index)로 표현하는 손실 영상압축 기법이다. 벡터의 차수가 클수록 양자화 오차가 줄어들지만 부호화 복잡도는 기하 급수적으로 증가하며, 압축률을 높일수록 구획 효과 또는 에지 훼손 등의 화질 열화가 생길 수 있다.

벡터 양자화 방법은 패턴을 대체하는 경우이며, 벡터 양자화 과정은 다음과 같다. 먼저 비트의 시계열(Bit Stream)을 벡터들로 나누며, 비트 시계열의 실제값을 전송하는 대신에 코드표에서 일치하는 패턴의 인덱스 값을 전송한다. 따라서 이 기법은 특히 음성 부호화에 적합하며, 자기 유사성(Fractal) 변환 방법이 적용되고 있다.

ⓒ (주)문경사랑

데이터 차원 축소

데이터 차원 축소는 고차원의 특징 벡터를 저차원으로 감소시키는 것이다. 대부분 실무에서 분석하는 데이터는 매우 많은 특성들을 지니고 있다. 그러므로 데이터 차원 축소는 잡음 특성을 제거하여 분류를 용이하게 하고 모델링에 필요한 학습 집합의 크기를 줄여 패턴 분류기에 의한 학습과 인식 속도를 증진시키기 위한 방법이다.

따라서 데이터를 가지고 기계학습 알고리즘을 적용해 문제를 해결하려고 한다면, 데이터의 차원이 크기 때문에 학습 속도가 느릴 뿐만 아니라 성능 또한 좋지 않을 가능성이 크다. 기계학습에서 데이터 셋의 특성이 많아지면, 각 특성인 데이터의 차원이 증가하게 된다. 이렇게 데이터의 차원이 증가할 수록 데이터 공간의 부피가 기하 급수적으로 증가하게 되며, 이 때문에 데이터의 밀도는 차원이 증가할 수록 희소해진다. 이러한 현상을 바로 “차원의 저주”라 한다.

차원의 저주를 넘어

이러한 차원의 저주를 해결하기 위한 방법 중 하나는 데이터의 밀도가 높아질 때까지 학습 데이터셋의 크기를 늘리는 것이며, 이를 해결하기 위한 방법으로는 증명사진에서 불필요한 특성을 삭제하는 것을 예로 들 수 있다. 즉, 이미지(사진)에서 인물 이외의 정보를 제거하여 입력 데이터의 차원을 낮추는 것이다. 증명사진의 배경 부분을 제거하여 모델을 학습해도 성능에는 큰 차이가 없을 것이다.

따라서 미래의 인공지능은 차원의 저주를 넘어, 데이터에서 불필요한 특징을 제거하는 “데이터의 차원 축소”가 대세가 될 것이다.

홈페이지관리자 기자  .
“주간문경을 읽으면 문경이 보인다.”
- Copyrights ⓒ주간문경. 무단 전재 및 재배포 금지 -

주간문경 기사목록  |  기사제공 : 주간문경

 

이전 페이지로

실시간 많이본 뉴스

 

더 새롭게 아름답게 찾아온 ‘2

문경시 베트남 까마우성 계절근로

문경시 점촌점빵길 빵 축제 특별

점촌 원도심에서 제2회 점촌점빵

문경시장애인주간이용시설 장애인

영순면 지역사회보장협의체 정기회

문경시보건소 찾아가는 감염병 예

문경교육지원청 중등 신규 및 저

문경시보건소 심뇌혈관질환 예방

국립농산물품질관리원 문경사무소

창간사 - 연혁 - 조직도 - 광고문의 - 제휴문의 - 개인정보취급방침 - 청소년보호정책 - 구독신청 - 원격

 상호: 주간문경 / 사업자등록번호: 511-81-13552 / 주소: 경상북도 문경시 점촌2길 38(점촌동) / 대표이사: 남정현 / 발행인 : 남정현/ 편집인: 남정현 / 청소년보호책임자 : 남정현
제호: 인터넷주간문경 / 등록번호: 경북 아00151 / 종별: 인터넷신문 / 등록일 2010.10.28 / mail: imgnews@naver.com / Tel: 054-556-7700 / Fax : 054-556-9500
Copyright ⓒ (주)문경사랑. All Rights Reserved. 본지는 신문 윤리강령 및 그 실천요강을 준함