|
|

|
|
데이터 시대: 2) 데이터의 종류 - 정형 데이터와 비정형 데이터
|
|
2026년 04월 07일(화) 17:23 [주간문경] 
|
|
|

| 
| | | ↑↑ 지홍기
영남대학교 명예교수
전)국가녹색성장위원회 위원
전)한국물학술단체연합회 회장 | ⓒ 주간문경 | | 데이터는 왜 중요할까?
오늘날은 "데이터(Data)의 시대"라 부른다. 스마트폰을 사용하거나, 인터넷 검색을 하거나, 신용카드로 결제를 할 때마다 수많은 정형 또는 비정형 데이터가 생성된다. 기업은 이 데이터를 분석해 소비자들의 취향을 파악하고, 정부는 시민들의 생활 패턴을 연구해 정책을 만든다. 데이터는 더 이상 단순한 기록이 아니다. 데이터를 어떻게 모으고, 해석하고, 활용하는가에 따라 개인과 조직, 그리고 사회 전체의 미래가 달라질 수 있다.
정형 데이터란 무엇인가?
정형 데이터(Structured Data)는 쉽게 말해 표나 표준화된 틀 안에 정리된 데이터다. 엑셀(Excel) 파일을 떠올려보면 이해가 쉽다. 이름, 나이, 주소처럼 정해진 칸에 정확히 입력된 데이터가 정형 데이터다. 숫자나 글자가 정해진 규칙에 따라 나열되어 있어 컴퓨터가 쉽게 이해하고 처리할 수 있다.
예를 들어, 은행 고객 정보, 쇼핑몰의 판매 기록, 병원의 진료 기록 등이 모두 정형 데이터다. 이 데이터들은 관계형 데이터베이스(Relational DB)라는 시스템에 저장되어 필요할 때 빠르게 찾아 쓸 수 있다. 정형 데이터는 구조가 명확하고 검색이나 분석이 용이하다는 장점이 있다.
비정형 데이터란 무엇인가?
비정형 데이터(Unstructured Data)는 정해진 틀이 없는 데이터다. 일상생활에서 사용하는 사진, 동영상, 음성 파일, 소셜미디어(Social Media) 글, 이메일(E-mail) 등이 대표적이다. 자유로운 형식으로 존재하기 때문에 컴퓨터가 자동으로 이해하고 처리하기 어렵다.
예를 들어 누군가 찍은 여행 사진에는 위치나 시간 정보가 있을 수도 있지만, 사진 자체에는 어떤 풍경인지, 무슨 이야기가 담겼는지는 알 수 없다. 또 SNS(Social Networking Service) 글에서도 사용자가 어떤 감정을 담았는지는 컴퓨터가 쉽게 알 수 없다. 비정형 데이터는 사람에게는 자연스럽지만, 컴퓨터에게는 해석이 복잡한 데이터라고 할 수 있다.
반정형 데이터란 무엇인가?
정형 데이터와 비정형 데이터의 중간쯤에 있는 것이 반정형 데이터(Semi-structured Data)다. 어느 정도 구조는 갖고 있지만 완전히 틀에 갇혀 있지는 않은 데이터다. 대표적인 예로는 JSON(JavaScript Object Notation) 파일이나 XML(eXtensible Markup Language) 문서를 들 수 있다. 반정형 데이터는 데이터 안에 일정한 규칙이나 태그(Tag)가 있어서 필요한 정보만 골라내기가 비교적 수월하다.
| 
| | ⓒ 주간문경 | | 정형 데이터와 비정형 데이터, 어디에 활용될까?
정형 데이터는 주로 빠른 조회와 통계 분석에 강하다. 금융회사에서 고객 거래 기록을 분석하거나, 병원에서 환자 진료 데이터를 관리하는 데 쓰인다. 또 인공지능(AI, Artificial Intelligence)이나 기계학습 (Machine Learning) 모델을 학습시킬 때도 정형 데이터가 큰 역할을 한다.
반면에 비정형 데이터는 사람들의 감정, 생각, 경험을 이해하는 데 강력한 힘을 발휘한다. 기업들은 SNS 글이나 소비자 리뷰를 분석해 새로운 트렌드를 찾거나, 영화 추천 시스템이 사용자의 취향을 파악하는 데 비정형 데이터를 활용한다. 또한 의료 분야에서는 MRI(Magnetic Resonance Imaging)나 CT(Computed Tomography) 같은 영상 데이터를 분석해 질병을 진단하는 데 쓰이기도 한다.
데이터 시대, 우리는 무엇을 준비해야 할까?
앞으로는 정형 데이터와 비정형 데이터를 모두 자유롭게 다룰 수 있는 능력이 중요해지고 있다. 과거에는 숫자나 표만 잘 다루면 됐지만, 이제는 사진, 영상, 글까지 이해하고 분석하는 기술이 필요하다. 이를 위해 데이터 분석, 인공지능, 빅데이터(Big Data) 같은 새로운 지식을 배우는 노력이 중요하다.
따라서 우리는 “데이터 시대”를 살아가고 있다. 데이터를 읽고, 해석하고, 활용하는 능력은 개인의 경쟁력을 높이고, 사회를 더 나은 방향으로 이끄는 데 꼭 필요한 기본 소양이 되고 있다. 이제는 "데이터가 필요한 것"을 넘어, "데이터를 어떻게 다루느냐?"가 핵심이 되는 “데이터 시대”의 중심에 서 있다.
#지홍기칼럼 #데이터시대 #데이터종류 #정형데이터 #비정형데이터
|
|
|
|
주간문경 기자 “주간문경을 읽으면 문경이 보인다.” - Copyrights ⓒ주간문경.
무단 전재 및 재배포 금지 -
|
|
|
|
주간문경
기사목록 | 기사제공 : 주간문경
|
|
|
|
|
|

|
|
|
|
실시간
많이본
뉴스
|
|
|
|
|
|