카카오톡 대화 내보내기로 대화주기 분석해보기
주기적으로 연락하고 지내는 친구들과 대화주기가 어떻게 되는지 궁금해서 카카오톡 대화 데이터를 뽑아보았습니다.
단톡방은 여러명이 대화를 하고 있어서 제외했고, 개인톡하는 친구 4명을 뽑아보았습니다.
1. 데이터 준비
- 카카오톡 채팅방 > 우측상단 버거메뉴 > 설정 > 채팅방 관리 > 대화 내용 내보내기 > 텍스트 메시지만 내보내기 > 이메일 전송
위 이미지처럼 메시지를 주고받은 일자, 상대방 이름, 내용이 TXT 파일로 출력됩니다.
2. 구글 스프레드 시트로 데이터 옮기고 가공하기
데이터를 복사해서 구글 스프레드 시트에 붙여넣어줍니다.
데이터를 관찰해보니, 이런 형식을 가지고 있었습니다.
[YYYY년 MM월 DD일 요일 ]
[ YYYY. MM. DD Time , 상대방 이름 : 대화내용]
[ YYYY. MM. DD Time , 상대방 이름 : 대화내용]
[YYYY년 MM월 DD일 요일 ]
[ YYYY. MM. DD Time , 상대방 이름 : 대화내용]
[ YYYY. MM. DD Time , 상대방 이름 : 대화내용]
저는 월별 메시지를 주고받은 일자가 얼마나 되는지가 궁금했기 때문에 메시지 갯수는 무시합니다.
따라서 A열을 추가해서 월까지의 정보만 추출했습니다.
A열 수식: =left(B,9)
> 나머지 친구들과의 대화도 같은 방식으로 옮겨줍니다.
3. 월 별 데이터 집계
- countifs 함수 사용
2019년 1월부터 2020년 8월까지 월 별로 메시지를 주고받은 일 수를 집계했습니다.
예를들어 친구1과는 2019년 1월에 6일, 2020년 8월에는 9일 메시지를 주고받았습니다.
한달이 최대 31일이기 때문에 31이 넘는 데이터가 없는것을 확인할 수 있습니다.
4. 시각화
2019년 12월을 기점으로 메시지를 자주 주고받던 친구2, 친구4 의 리텐션이 감소했습니다 😭
한명씩 뜯어보았습니다.
1) 친구1
2019년 상반기에 지속적으로 연락하다가 2019년 8월부터 2019년 12월까지 연락이 뜸해짐 . 그러다가 2020년부터 다시 꾸준하게 연락을 하고 있음
특이사항 👉🏻올해부터 같이 스터디하게 되었음
2) 친구2
2019년 8월에는 단 3일을 제외한 28일동안 메시지를 주고받을만큼 거의 매일 연락했지만, 2019년 12월 한달에 2번밖에 메시지를 주고받지 않았음. 그러다가 2020년 3월부터 점차 다시 메시지를 주고받는 양이 증가하고 있지만, 작년에 비하면 적음.
특이사항 👉🏻친구가 2019년 12월에 남자친구 생김 😊(싸웠다 화해한거 아님)
3) 친구3
너무 높지도 낮지도 않게 월 평균 10일 정도 메시지를 주고받지만, 가장 꾸준하게 연락을 하고 있음
특이사항 👉🏻같이살고 있는 호적메이트
주로 이런내용이다
3) 친구4
2019년에 친구2와 투톱으로 연락을 자주했지만, 마찬가지고 2019년 12월 기점으로 연락횟수가 급감. 2020년 6월에 특이하게 튀었음
특이사항 👉🏻2019년12월 이직했는데, 이직 전 회사에서 친했던 동료임
느낀점
데이터는 현실에 일어난 것을 반영한다는 점을 다시 한 번 느꼈다.
데이터만 바라봐서는 오해의 여지가 있고 현실의 맥락이 중요하다!
추가로 해보고 싶은 분석
- 대화 지분율 분석 (누가누가 더 많이 말하나)
- 단어 사용 분석
- 단톡방 분석