읽는 재미의 발견

새로워진 한국일보로그인/회원가입

  • 관심과 취향에 맞게 내맘대로 메인 뉴스 설정
  • 구독한 콘텐츠는 마이페이지에서 한번에 모아보기
  • 속보, 단독은 물론 관심기사와 활동내역까지 알림
자세히보기
알림
알림
  • 알림이 없습니다

인공지능이 알려주는 내 첫인상은

입력
2021.05.22 06:00
13면
0 0

AI가??판단한 ‘천사 같은 훈녀’, 근거는?
‘워드클라우드’로 유사 사진 찾아 태그 확인

편집자주

현실로 성큼 다가온 인공지능(AI) 시대. 생활 속에 깊숙이 스며든 AI 이야기가 격주 토요일 <한국일보> 에 찾아옵니다. 컴퓨터비전을 연구하는 정소영 서울여대 기초교육원 초빙교수가 쉽게 풀어드립니다.


소개팅에서든, 면접에서든 좋은 첫인상을 남기고 싶다. 그래서 남이 보는 나의 첫인상은 어떨지 매우 궁금하지만 아이러니하게도 나의 첫인상은 스스로 알 수 없다. 게티이미지뱅크

소개팅에서든, 면접에서든 좋은 첫인상을 남기고 싶다. 그래서 남이 보는 나의 첫인상은 어떨지 매우 궁금하지만 아이러니하게도 나의 첫인상은 스스로 알 수 없다. 게티이미지뱅크

“안녕하세요?” 첫 만남에서 인사를 건네는 찰나의 시간에도 우리는 자연스럽게 상대방이 어떤 사람인지 파악하려 한다. '서글서글한 눈매에 웃으며 인사를 하는 것을 보니 착한 사람일 것 같다', '목소리가 작은 것을 보니 소극적인 사람일 것 같다'처럼 말이다.

첫인상은 생각보다 강렬하고 오랜 기간 영향을 미친다. 흔히 ‘3초 만에 첫인상이 결정된다’는데, 이렇게 속전속결로 결정된 첫인상은 억울하게도 쉽게 바뀌지 않는다고 한다. 첫인상이 좋다는 이유만으로 쉽게 친해지는 경우도 있고, 반대로 첫인상이 좋지 않았다는 이유만으로 상대와 교류 없이 지내기도 한다. 상황이 이렇다 보니 소개팅에서든, 면접에서든 좋은 첫인상을 남기고 싶다. 그래서 남이 보는 나의 첫인상은 어떨지 매우 궁금하다. 하지만 아이러니하게도 나는 나의 첫인상을 스스로 알 수 없다.

최근 사회관계망서비스(SNS)를 통해 성격유형테스트나 심리테스트를 공유하는 것이 유행하고 있다. 그중 ‘인공지능(AI) 첫인상 테스트’가 있었다. 이 ‘첫인상 테스트’도 정확도가 높다기보다는 재미를 위한 가벼운 놀이지만, 실제 학습된 AI모델을 통해 예측한 첫인상 테스트 결과를 보여준다고 하니 어떤 방식으로 내 첫인상을 판단해 줄지 궁금해진다. 인공지능이라면 내 첫인상을 좀 더 명확히 알려주지 않을까?

‘AI 첫인상 테스트’ 방법은 이렇다. 얼굴 사진을 하나 업로드하면 해당 사진에서 느껴지는 첫인상을 특정 카테고리로 분류해준다. 카테고리는 ‘천사 같은 훈녀’, ‘호감형 허당’ 등 사람의 인상을 표현하는 문장으로 구성돼 있다. 인상적인 부분은 바로 ‘AI가 판단한 내 첫인상’을 ‘예쁜 눈’, ‘성격이 밝다’ 등 첫인상과 관련된 단어들로 ‘워드클라우드(word cloud)’를 만들어 보여주는 것이다.

워드클라우드란 메타데이터에서 얻어진 단어들을 분석해 중요도나 인기도 등을 고려하여 시각적으로 늘어 놓아 표시하는 것으로 데이터 분석 결과를 시각화할 때 사용되는 기법이다. 쉽게 말하자면 단어를 한데 모아 시각화하는데, 많이 언급되거나 중요한 핵심 단어일수록 크고 진하게 표시하여 돋보이게 하는 것이다.

그렇다면 이 워드클라우드를 구성하는 단어는 어떻게 결정되고, 결정된 단어가 사진의 첫인상에 얼마나 가까운지 어떻게 알 수 있는 것일까? 첫인상 테스트에서 워드클라우드를 제공하는 것으로 보아 아마도 인물사진을 모으고 그 인물사진에 태그나 댓글 등 관련된 글들을 모아 그 글 속에서 주제를 발견하기 위한 통계적 모델인 토픽 모델링 기법을 사용했을 것으로 유추해 볼 수 있다. 토픽 모델링은 텍스트에 숨겨진 의미구조를 발견하기 위해 사용되는 텍스트 마이닝 기법 중 하나이다. 특정 주제에 관한 문서에서는 그 주제와 관련된 단어들이 다른 단어에 비해 더 자주 언급될 것이다. 예를 들어 사진에서 수수하고 청순한 분위기가 더 많이 느껴진다면 ‘청순’, ‘청초’, ‘순수’ 등의 단어가 ‘카리스마’, ‘화려함’ 등 그와 관련 없는 단어보다 훨씬 자주 언급될 것이다.

반면 패션과 메이크업 등이 트렌디하고 세련됐다면 ‘메이크업’, ‘세련됨’, ‘화려하다’ 등의 단어가 ‘촌스럽다’ 등 그와 관련 없는 단어보다 더 빈도 높게 언급될 것이다. 이런 원리를 이용하여 토픽 모델은 사진과 관련된 문헌 내에 단어가 얼마나 빈도 높게 언급되는지 통계적 분석을 하여 잠재된 주제를 찾아낼 수 있다. 이렇게 통계적 분석에 따라 사진마다 주제, 즉 첫인상에 가까운 단어를 찾아 놓는다면, 새로운 사진이 올라왔을 때 그와 유사한 사진을 찾아 첫인상 단어를 워드클라우드로 보여줄 수 있게 된다.

재미로 보는 첫인상 테스트이지만 실제로 해당 사진에 어떤 단어가 많이 언급되게 될지 예측해볼 수 있는 테스트임은 분명하다. 밝은 표정의 사진일수록 워드클라우드에 더 긍정적인 단어가 크게 표기되던데, 이게 기분 탓은 아닐 것이다. 웃는 얼굴. 인공지능이 보기에도 사람이 보기에도 좋은 첫인상임이 분명하다.

정소영 서울여대 기초교육원 초빙교수

기사 URL이 복사되었습니다.

세상을 보는 균형, 한국일보Copyright ⓒ Hankookilbo 신문 구독신청

LIVE ISSUE

기사 URL이 복사되었습니다.

댓글0

0 / 250
중복 선택 불가 안내

이미 공감 표현을 선택하신
기사입니다. 변경을 원하시면 취소
후 다시 선택해주세요.