Project/생활데이터 분석

카카오톡 대화 내보내기로 대화주기 분석해보기

하나719 2020. 9. 16. 15:26
반응형

주기적으로 연락하고 지내는 친구들과 대화주기가 어떻게 되는지 궁금해서 카카오톡 대화 데이터를 뽑아보았습니다.

단톡방은 여러명이 대화를 하고 있어서 제외했고, 개인톡하는 친구 4명을 뽑아보았습니다.

 

1. 데이터 준비

- 카카오톡 채팅방 > 우측상단 버거메뉴 > 설정 > 채팅방 관리 > 대화 내용 내보내기 > 텍스트 메시지만 내보내기 > 이메일 전송

위 이미지처럼 메시지를 주고받은 일자, 상대방 이름, 내용이 TXT 파일로 출력됩니다.

 

2. 구글 스프레드 시트로 데이터 옮기고 가공하기

A열 추가

데이터를 복사해서 구글 스프레드 시트에 붙여넣어줍니다.

데이터를 관찰해보니, 이런 형식을 가지고 있었습니다.

 

[YYYY년 MM월 DD일 요일 ]

    [ YYYY. MM. DD Time , 상대방 이름 : 대화내용] 

    [ YYYY. MM. DD Time , 상대방 이름 : 대화내용] 

 

[YYYY년 MM월 DD일 요일 ]

    [ YYYY. MM. DD Time , 상대방 이름 : 대화내용] 

    [ YYYY. MM. DD Time , 상대방 이름 : 대화내용] 

 

저는 월별 메시지를 주고받은 일자가 얼마나 되는지가 궁금했기 때문에 메시지 갯수는 무시합니다.

따라서  A열을 추가해서  월까지의 정보만 추출했습니다.

A열 수식: =left(B,9)

 

> 나머지 친구들과의 대화도 같은 방식으로 옮겨줍니다.

3. 월 별 데이터 집계

  • countifs 함수 사용

2019년 1월부터 2020년 8월까지 월 별로 메시지를 주고받은 일 수를 집계했습니다.

예를들어 친구1과는 2019년 1월에 6일, 2020년 8월에는 9일 메시지를 주고받았습니다.

한달이 최대 31일이기 때문에  31이 넘는 데이터가 없는것을 확인할 수 있습니다.

 

4. 시각화

2019년 12월을 기점으로 메시지를 자주 주고받던 친구2, 친구4 의 리텐션이 감소했습니다 😭

한명씩 뜯어보았습니다.

 

1) 친구1

2019년 상반기에 지속적으로 연락하다가 2019년 8월부터 2019년 12월까지 연락이 뜸해짐 . 그러다가 2020년부터 다시 꾸준하게 연락을 하고 있음

특이사항 👉🏻올해부터 같이 스터디하게 되었음

 

2) 친구2

2019년 8월에는 단 3일을 제외한 28일동안 메시지를 주고받을만큼 거의 매일 연락했지만, 2019년 12월 한달에 2번밖에 메시지를 주고받지 않았음. 그러다가 2020년 3월부터 점차 다시 메시지를 주고받는 양이 증가하고 있지만, 작년에 비하면 적음.

특이사항 👉🏻친구가 2019년 12월에 남자친구 생김 😊(싸웠다 화해한거 아님)

 

3) 친구3

너무 높지도 낮지도 않게 월 평균 10일 정도 메시지를 주고받지만, 가장 꾸준하게 연락을 하고 있음

특이사항 👉🏻같이살고 있는 호적메이트 

 

주로 이런내용이다

3) 친구4

2019년에 친구2와 투톱으로 연락을 자주했지만, 마찬가지고 2019년 12월 기점으로 연락횟수가 급감. 2020년 6월에 특이하게 튀었음

특이사항 👉🏻2019년12월 이직했는데, 이직 전 회사에서 친했던 동료임 

 

느낀점

데이터는 현실에 일어난 것을 반영한다는 점을 다시 한 번 느꼈다.

데이터만 바라봐서는 오해의 여지가 있고 현실의 맥락이 중요하다!

 

추가로 해보고 싶은 분석

- 대화 지분율 분석 (누가누가 더 많이 말하나)

- 단어 사용 분석

- 단톡방 분석

반응형