최종편집 : 2026-04-17 오후 06:02:50

종합행정정치출향인사회/복지/여성산업문경대학·교육문화/체육/관광사람들길 따라 맛 따라다문화

전체기사

커뮤니티

공지사항

독자투고

직거래장터

자유게시판

결혼

부음

뉴스 > 사설/칼럼

+크기 | -작게 | 이메일 | 프린트

Gen AI 시대(39): 챗 GPT의 이미지 이해

2024년 06월 11일(화) 09:17 [주간문경]

 

 

↑↑ 지홍기
영남대학교 명예교수
전(前) 국가녹색성장위원회 위원

ⓒ (주)문경사랑

 

챗 GPT의 이미지 인식 기능

챗 GPT는 텍스트나 이미지도 입력할 수 있는 인공지능 모델이다. 챗 GPT는 이미지의 형태, 색, 질감 등을 인식하고 이미지 속의 맥락을 이해할 수 있다. 예를 들어, 다람쥐가 카메라를 들고 호두를 찍는 그림의 이미지가 어떤 불합리함을 담고 있는지 설명할 수 있다.

챗 GPT의 이미지 인식 기능은 시각장애인이나 저시력자를 돕는 서비스에서 빛을 발휘한다. 이 서비스는 자원봉사자와 연결해주는 방식으로 시각장애인을 도왔는데, GPT가 적용되면서 인공지능이 인간 봉사자와 동일한 수준으로 맥락을 이해하고 시각장애인을 빠르고 정확하게 도울 수 있게 됐다. 예를 들어, 음식에 이상한 재료가 들어가지 않았는지, 땅 위에 있는 물체가 걸려 넘어질 위험이 있는지 이해하고 토론할 수 있다.

챗 GPT의 이미지 이해와 생성

챗 GPT는 텍스트를 이해하고 생성하는 데 뛰어난 인공지능이지만, 이미지를 직접 생성하는 능력은 없다. 이미지 생성을 위해 챗 GPT는 DALL-E라는 별도의 인공지능 모델과 통합되어 작동하며, 이 모델은 텍스트 프롬프트((Prompt: 생성형 AI를 작동시키기 위한 입력치)로부터 시각적 요소를 생성하는 전문성을 가지고 있다.

사용자가 텍스트 프롬프트를 제공하면, 챗 GPT는 이 프롬프트를 처리하여 사용자의 요청을 이해하게 되며, 프롬프트가 너무 모호하거나 개방적인 경우에는 챗 GPT가 더 많은 세부 정보를 얻기 위해 명확한 질문을 할 수 있다. 프롬프트가 충분히 상세하고 명확해지면, 챗 GPT는 그것을 DALL-E에 제출하고 이 시점에서 텍스트 처리에서 이미지 생성으로의 전환이 발생하게 된다.

DALL-E는 이미지를 픽셀 단위로 렌더링하게 되며, 이 과정에서 프롬프트의 구성 요소를 이해하고 시각화하는 데 고급 알고리즘이 사용된다. 이는 구성, 색상, 조명, 질감 등의 측면을 결정하는 것을 포함하며, 이미지가 생성되면 DALL-E에서 출력이 된다.

따라서 이때에 생성된 이미지는 챗 GPT가 작동하는 인터페이스를 통해 사용자에게 표시되고, 사용자는 이미지에 대한 피드백을 제공할 수 있다. 또한 이미지가 기대에 부합하지 않는 경우, 사용자는 프롬프트를 세밀하게 조정하고 프로세스를 반복할 수 있다.

이렇게 챗 GPT는 텍스트를 이해하고 생성하는 능력을 활용하여 이미지를 이해하고 생성하는 능력을 확장하게 되며, 이는 인공지능이 우리의 일상생활에 더욱 밀접하게 연결되는 데 기여하고 있음을 알 수 있다.

ⓒ (주)문경사랑

DALL-E의 이미지 생성방법

DALL-E 모델은 텍스트와 이미지 간의 관계를 학습하여 텍스트 설명을 기반으로 다음과 같이 이미지를 생성하게 된다.

텍스트 인코딩: 먼저 텍스트 프롬프트가 텍스트 인코더(Encode: 부호화)에 입력되며, 이 인코더는 텍스트를 표현 공간으로 매핑(도식화)하는 역할을 한다.

이미지 인코딩: 다음으로, ‘prior’라는 모델이 텍스트 인코딩을 해당하는 이미지 인코딩으로 매핑하며, 이 이미지 인코딩에 포함된 프롬프트의 의미 정보를 포착하게 된다.

이미지 디코딩: 마지막으로, 이미지 디코더(Decoder: 해석기)가 이 의미 정보의 시각적 표현인 이미지를 확률적으로 생성하게 된다.

따라서 이 과정을 통해서 DALL-E는 텍스트 프롬프트를 기반으로 새로운 이미지를 생성하거나, 기존 이미지의 특정 부분을 재생성할 수 있다. 이러한 기능은 DALL-E가 텍스트 프롬프트와 일관성 있는 방식으로 이미지를 생성하게 한다.

DALL-E의 이미지 생성 능력은 인공지능이 우리의 일상생활에 더욱 밀접하게 연결되는 데 기여하고 있으며, 우리는 텍스트뿐만 아니라 이미지와 같은 다양한 형태의 정보를 이용하여 인공지능과 소통할 수 있게 되었다.

홈페이지관리자 기자  .
“주간문경을 읽으면 문경이 보인다.”
- Copyrights ⓒ주간문경. 무단 전재 및 재배포 금지 -

주간문경 기사목록  |  기사제공 : 주간문경

 

이전 페이지로

실시간 많이본 뉴스

 

더 새롭게 아름답게 찾아온 ‘2

문경시 점촌점빵길 빵 축제 특별

문경시 베트남 까마우성 계절근로

문경시장애인주간이용시설 장애인

점촌 원도심에서 제2회 점촌점빵

영순면 지역사회보장협의체 정기회

문경시보건소 찾아가는 감염병 예

문경교육지원청 중등 신규 및 저

문경시보건소 심뇌혈관질환 예방

국립농산물품질관리원 문경사무소

창간사 - 연혁 - 조직도 - 광고문의 - 제휴문의 - 개인정보취급방침 - 청소년보호정책 - 구독신청 - 원격

 상호: 주간문경 / 사업자등록번호: 511-81-13552 / 주소: 경상북도 문경시 점촌2길 38(점촌동) / 대표이사: 남정현 / 발행인 : 남정현/ 편집인: 남정현 / 청소년보호책임자 : 남정현
제호: 인터넷주간문경 / 등록번호: 경북 아00151 / 종별: 인터넷신문 / 등록일 2010.10.28 / mail: imgnews@naver.com / Tel: 054-556-7700 / Fax : 054-556-9500
Copyright ⓒ (주)문경사랑. All Rights Reserved. 본지는 신문 윤리강령 및 그 실천요강을 준함