오피니언칼럼
[스마트안전 칼럼] 텍스트 마이닝 I안전의 숲과 나무 동시 보기
안전정보  |  safetyin@safetyin.co.kr
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
승인 2021.04.28  12:33:52
트위터 페이스북 미투데이 요즘 네이버 구글 msn
   
▲ 신동일 교수명지대학교 재난안전학과/ 스마트엔지니어링 전공dongil@mju.ac.kr

필자가 인공지능과 안전을 주제로 수학했던 퍼듀대는 유인 달탐사 아폴로 계획과 많은 인연을 맺고 있는데, 인류역사상 달에 처음 발을 디딘 닐 암스토롱, 공식적으로 마지막 유인탐사선이었던 아폴로 17호가 달을 떠나며 마지막 발을 떼었던 유진 서넌, 그리고 아폴로 1호 화재사고 희생자인 거스 그리섬의 모교로도 유명하다. 필자도 그리섬 빌딩에서 들었던, 인간공학 핸드북의 저자로도 유명한, 샐번디 교수의 인간공학 수업의 기억이 아직도 생생하다. 하지만 이와 더불어 퍼듀가 자랑하는 행사중의 하나가 매년 캠퍼스에서 열리는 전세계 루브 골드버그 기계장치 대회이다.

루브 골드버그 장치는 20세기 미국의 만화가 루브 골드버그가 고안한 기계장치들에서 연유하는데, 생김새나 작동원리는 아주 복잡하고 거창해 보이지만, 하는 일은 아주 단순한데다 재미만을 추구하는 매우 비효율적인 기계를 뜻한다. 얼핏 보면 진짜로 작동할 것처럼 생겼고, 작동 원리에 대해서는 다양한 상상을 요구하기도 한다(그림 2 참고). 특히 장치의 작동을 시작하기 위한 최초의 동력을 제외하면, 그 이후에 이어지는 장치 작동 동력들은 모조리 장치 내부에서 공급되어야 할 것을 골드버그 장치는 요구한다. 일상에서 간단하게 할 수 있는 일을 얼마나 복잡하게 만들면서 우리가 살아가는지 골드버그의 만화가 빗대어 보여 주었다면, 골드버그 기계장치 대회는, 만화가 골드버그의 스타일로, 간단한 작업을 완료하기 위해 최소 20 단계에서 최대 75 단계를 수행하는 장치를 만들 것을 요구한다 (참고: www.rubegoldberg.com/contests/). 

   
▲ 그림 1. 안전정보 발행인 칼럼(2017.10)에 대한 워드 클라우드 시각화 결과

2020년을 기준으로 초당 쌓이는 전세계 데이터의 양은 28.9 테라바이트(TB)였다 (참고로 인터넷에서 41만원에 쉽게 구입할 수 있는 하드디스크의 용량이 16 TB). 빅데이터가 넘쳐나는 요즘 세상에 존재하는 데이터의 80% 이상이 비정형 데이터로 추산되는데, 그 중에서도 텍스트는 가장 기본적이고 광범위한 비중을 차지하는 비정형 데이터이다. 

텍스트는 다루기 어려운 데이터중 하나이다. 모호하고 추상적인 단어로 가득차 있고, 같은 단어도 문맥에 따라 개념이 변하며, 유사한 개념도 표현하는 다양한 방법이 존재한다 (물론 필자의 연구실도 온톨로지와 지식그래프를 이의 해결을 위해 활용중이다). 일찍이 필자의 동료교수인 유홍준교수는 그의 명저 “나의 문화유산 답사기”에서 “아는 만큼 보임”을 주장했거니와, 다양한 안전관련 문서들을 파악함에 있어 우리는 적은 노력으로 나무와 숲을 동시에 볼 수 있기를 희망하는 때가 있는데, 인공지능에 기반한 텍스트 마이닝 기술은 이 측면에서 유용성이 크다.

그림 1은 기초적인 텍스트 마이닝 기술중 하나인 워드 클라우드를 활용해 본 안전정보에 고정적으로 게시되는 발행인 칼럼중 하나를 분석해본 예이다. 단어의 상대적 중요도와 더불어 연결관계까지 표현해주는 키워드 네트워크에 비해 기능은 떨어질 수 있어도, 사용이 쉽다는 장점이 있다. 안전의 숲과 나무를 동시에(즉 멀티스케일 분석) 볼 수 있기를 희망하는 안전인들을 위해, 방대한 문서 처리를 지원하는 스마트안전 도구중 하나로 텍스트 마이닝을 다음 편에서 깊이 다루고자 한다.

   
 
< 저작권자 © 안전정보 무단전재 및 재배포금지 >
폰트키우기 폰트줄이기 프린트하기 메일보내기 신고하기
트위터 페이스북 미투데이 요즘 네이버 구글 msn 뒤로가기 위로가기
이 기사에 대한 댓글 이야기 (0)
자동등록방지용 코드를 입력하세요!   
확인
- 200자까지 쓰실 수 있습니다. (현재 0 byte / 최대 400byte)
- 욕설등 인신공격성 글은 삭제 합니다. [운영원칙]
이 기사에 대한 댓글 이야기 (0)
인기기사
1
㈜대우건설,본사 및 전국현장 감독실시(`21.4.28.~)
2
[재난안전칼럼] 방재(防災)의 날
3
[이달의 보건관리자] 송시희 전임/ GS건설 개포프레지던스자이현장
4
[피플] 조정호 안전보건최고경영자과정 총동문회장
5
’20년 산재 사망 882명, 전년 대비 27명 증가
6
연구실 안전 환경 조성을 위한 과학기술단체 대토론회
7
고용노동부, ㈜태영건설 본사 특별감독 결과 발표
8
1분기 사망사고 발생 건설사·발주청·지자체 명단 공개
9
[스마트안전 칼럼] 텍스트 마이닝 I
10
[파워인터뷰] 최형철 한국건설가설협회 상근부회장
11
[특별인터뷰] 노영희 국가연구안전관리본부장
12
봄철 지붕공사 본격화로 추락사고 급증 우려!
13
[문화칼럼] 경음악이 좋은 이유
14
정부 출연 연구기관 연구실안전환경 로드맵 마련
15
[초대석] 박종원 한국소방산업협회 회장
16
[발행인 칼럼] 산재 사망사고의 획기적 감소를 기대하며
17
대형 조선사 사고사망 예방에 역량을 결집한다
18
경기지역본부,4월 안전점검의 날,“패트롤-데이”실시
19
‘소규모 건설현장 사망사고 근절 방안 모색 토론회’개최
20
“고용노동부-10대 건설사 안전임원”간담회 실시
회사소개개인정보취급방침청소년보호정책이메일무단수집거부
서울특별시 구로구 구일로 10길 27 (구로1동650-4) SK허브수오피스텔 B동 901호  |  대표전화 : 02)866-3301  |  팩스 : 02)866-3382
정기간행물ㆍ등록번호 : 서울특별시 아 01844  |  등록년월일 : 2011년 11월 22일  |  발행인·편집인 : 이선자  |   청소년보호책임자 : 오세용
Copyright © 2011 안전정보. All rights reserved. mail to safetyin@safetyin.co.kr