본문 바로가기

Repositorium/IT

트위터를 연구하는 학문, 트위터롤로지

 

트위터를 연구하는 학문, 트위터롤로지

 

 

출근길 전철 안에서 우리에게 익숙한 모습이 있다.

귀에는 이어폰이 손에는 스마트폰이 들려있는 광경이다.

 

이러한 모습은 스마트폰이 대중화되면서 전철 안 뿐 아니라 거의 모든 곳에서 볼 수 있는 익숙한 광경이 되었다.

 

그러면 스마트폰을 들여다 보며 대부분 뭘 하고 있을까?

 

물론 다양한 재미에 빠져들 있겠지만 그 중에 상당수는 SNS에 열중해 있을 것이다.

아마도 트위터 아니면 페이스북일 것이다.

 

                                 

 

오늘은 대표적인 SNS인 트위터에 관련된 이야기를 해 보겠다.

 

 

 

트위터롤로지란?

 

트위터는 140자라는 짧은 문자로 자신의 생각을 표현한다.

 

그 문자 속에는 관심사, 기분, 현재의 행동 등이 솔직하게 기록되어 있다. 전 세계의 1억 명의 사람이 하루에 쏟아내는 메시지의 양은 2 5000만 건이라고 한다.

 

이처럼 어머 어마한 데이터 양을 이용하여 사회 경제 언어학적으로 분석하는 연구분야가 새로운 학문으로 떠오르고 있다. 바로 트위터롤로지(twitterology)라는 학문이다.

 

엄청난 양의 트위터 메시지를 분석하는 새로운 연구 방식에 트위터롤로지(트위터학)란 이름을 붙인 사람은 벤 지머라는 언어학자이다. 트위터롤로지는 '트위터'와 고대 그리스어인 '학문'을 뜻하는 접미어 '로지(-logy)'를 합성한 단어이다.

 

 

트위터의 방대한 자료를 연구하는 분야가 매력적인 학문으로 떠오르는 이유가 무엇일까?

 

그 이유는 언어별 지역별로 원하는 정보만 선별하여 분석할 수 있으며, 트위터 메시지의 연결망을 활용하면 인터넷상에서의 인간관계까지도 확인할 수 있기 때문이다.

 

그리고 트위터롤로지의 또 다른 장점은 다양한 활용 분야에 있다.

트위터를 연구하는 학자들은 제한된 실험군이나 현장의 설문조사 요원들에게 의존해야 했던 기존의 방식에 비해, 트위터를 활용한 연구가 훨씬 효율적이고 정확하다고 말한다.

 

과학 저널지로 유명한 '사이언스' 2011 9월호에 '사회학자들이 트위터 속으로 나아가다'란 분석 기사를 통해, 트위터는 인간의 교류와 사회적 네트워크를 연구하고자 하는 학자들에게 전례 없는 기회를 제공할 것이라고 했다.

 

 

 

위터롤로지의 활용분야

 

마이클 메이시 코넬대 사회학과 교수는 트위터의 자료를 통하여 인간의 시간대별 행복도를 조사하였다. 메이시 교수가 사용한 자료는 2008 2~2010 1월 올라온 트위터 메시지 약 5억 개에 쓰인 단어들이다.

 

사이언스 지에 발표된 메이시 교수의 논문에 따르면 인간의 행복도는 잠에서 깨어나는 아침 시간대에 가장 높으며 오후로 갈수록 점점 낮아지다가, 잠들기 직전 약간 반등한다는 분석 결과를 발표하였다.

 

여러분은 트위터의 분석자료와 일치하나요?

 

또 다른 흥미로운 활용 분야는 언어를 분석한 사례이다.

텍사스대학교 언어학과 교수인 데이비드 비버는 리비아의 독재자 무아마르 카다피가 사망하던 날, 아랍권에서 올라오는 트위터 메시지를 수집하였다.

 

사망 직후 수시간 동안 모은 수 만개의 아랍어 메시지를 분석한 결과, '좋다' '훌륭하다' 등 긍정적 단어가 많았으며, '알라' '희생' '복음' 같은 종교적 의미를 담은 말들도 급증해 아랍 현지인들은 카다피의 죽음을 긍정적으로 받아들임을 짐작할 수 있다.

 

다음은 경제 분야에 활용한 연구 사례이다. 미 대통령 선거와 경제 상황에 대한 비교 분석을 선거기간 동안(2008.2 ~12, 10개월) 985만 건의 자료를 통하여 분석하였다.

 

연구는 해당 기간 동안 트위터 메시지에 표현된 감정을 고요함, 경계, 확실함, 활발함, 친절함, 행복함 등 7개 감정으로 나누어 다우존스 산업지수와 각각 비교하였는데 분석된 자료는 재미있는 결과를 보여준다.

 

사람들의 고요함 지수가 올라가면 2~6일 후 다우존스 산업지수도 올라가는 것으로 나타났다. 선거 기간에 주가지수의 상승을 이끄는 요인들을 간접적으로 유추해 볼 수 있으며, 일반적으로 알고 있는 선거기간의 주가상승과는 다른 결과를 보여주는 것이다.

 

트위터 연구 분야는 사회 언어 경제 분야에서만 활용되는 건 아니다.

 

이번에는 트위터 연구가 질병의 감염 경로 등을 파악하는 역학 분야에 활용된 사례이다.

2009년 전 세계를 공포로 떨게 했던 신종 인플루엔자에 대한 이야기가 트위터에서 퍼지는 경로를 분석한 결과 실제 감염경로와 거의 일치한다는 사실을 밝혀 냈다.

 

이 실험은 미 아이오와대 연구팀에 의하여 진행되었는데, 실시간으로 트위터의 메시지를 분석하면 사람들의 생각을 데이터화할 수 있음을 보여주는 연구 결과이다.

 

 

                             

 

 

 

지금까지 살펴본 사례들은 트위터 메시지를 활용한 분야의 일부이다.

 

아마도 트위터롤로지는 언어 사회 경제 그리고 다양한 산업 전반에 걸쳐 응용될 수 있을 것이다. 그러려면 다양한 종류의 대규모 데이터를 효과적으로 수집, 발굴, 분석하려면 새로운 기술과 아키텍처가 필요하다.

 

이는 빅데이터가 점점 중요하게 자리잡아 가는 이유이기도 하다.