반응형

전체 글 136

[Python] Sort dict values in list

Checkio 문제 출처: https://py.checkio.org/mission/bigger-price/solve/ 문제 설명 dict타입을 가진 list에서 price가 높은 순서대로 limit 개수만큼 출력해라 예시) input: data, limit data = [ {"name": "bread", "price": 100}, {"name": "wine", "price": 138}, {"name": "meat", "price": 15}, {"name": "water", "price": 1} ] limit = 2 output [ {"name": "wine", "price": 138}, {"name": "bread", "price": 100} ] 내 풀이 dict를 dataframe으로 변경해서 풀어주기..

통계적 가설 검정 - 1종 오류가 더 위험한 이유

귀무가설을 검정하는 과정에서, 오류를 발생시킬 수 있는 경우가 2가지가 있다. 예를들어보자, 상황: 추천시스템 새로 개발 대립가설: 새로 개발한 추천시스템을 통한 클릭율이 기존보다 더 높을 것이다. 귀무가설: 새로 개발한 추천시스템을 통한 클릭율이 기존보다 더 높지 않을 것이다. 1) 귀무가설이 참인데, 기각하고 대립가설 채택: 1종오류 > 새로 개발한 시스템이 더 좋지 않음에도 좋다고 판단해서 업데이트를 해버리는 상황 2) 귀무가설이 거짓인데, 기각하지 않음: 2종오류 > 새로 개발한 시스템이 더 좋은데, 좋지 않다고 판단하고 업데이트 하지 않는 상황 이 때, 새로 개발한 추천시스템이 클릭율이 사실은 1% 더 낮다고 해보자. 1종오류를 범하면 현재보다 더 안좋은 결과를 초래할 수 있고, 2종오류를 범하..

[Python] Strip()은 공백만 제거해주지 않는다.

checkio 문제 참고: https://py.checkio.org/mission/beginning-zeros/solve/ 문제 설명: 숫자로만 구성된 string에서 앞에 연속된 '0'이 몇개인가? EX. '0012' -> 2개 / '1000' -> 0개 / '0300' -> 1개 내 풀이 재귀호출 사용 (재귀호출 공부한 뒤로, 이런문제는 재귀호출로 풀게된다) 참고: 2020/09/18 - 파이썬 재귀호출로 반복문 줄이기 def beginning_zeros(number: str) -> int: # your code here if len(number) == 0 or number[0] != '0': return 0 if number[0] == '0': return 1 + beginning_zeros(num..

[Pandas] any(),all() 사용법과 예시

any(), all() 둘다 boolean(True or False) 값을 return 해주는 pandas의 내장함수이다. 데이터분석을 하다보면, 특정 값을 가진 행이 있는지 판별해야하는 경우가 있다. 그 특정값이 몇개가 있는지가 아니라 단순히 1개라도 있는지, 아니면 전체 행이 그 값을 가졌는지 여부를 판단해줄 때 any() 혹은 all()을 써줄 수 있다. 예시를 통해 확인해보자 1. Student Table 에 'hana'라는 이름을 가진 학생이 있는가? 2. Student Table 에 'zero'라는 이름을 가진 학생이 있는가? 3. Student Table 의 학생들중 남학생이 있는가? 4. Student Table 의 학생들은 전부다 여자인가? 이 함수는 조건문이랑 함께 사용하면 매우 편할 ..

P-value 로 두 집단에 차이가 있는지 검증하기

귀무가설, P-value 등 이게 대체 무슨 소리인가 싶었고, 그냥 P-value가 0.05 이하면 된다 이정도로만 이해하고 있었는데 오늘 한 단계 더 이해해보았다. 구체적 상황 설정 상황: 이번에 우리 서비스의 추천 알고리즘을 개선했다. 콘텐츠를 추천했을 때 기존의 알고리즘보다 클릭율이 높은지 검증하려고 한다. 새로 개발한 추천 시스템 -> A, 기존 추천 시스템 -> B 대립가설: A 클릭율이 B 클릭율보다 높다. 귀무가설: A 클릭율이 B 클릭율보다 작거나 같다. 여기서 우리의 목표는 귀무가설을 기각하고, 대립가설을 채택하는 것이다. 이렇게 귀무가설을 세우는 이유는, 대립가설을 증명하는 것보다 귀무가설이 틀렸음을 증명해서 대립가설을 선택하는 것이 더 쉬운 방법이라고 한다. P-value 등장 귀무가..

커리어 방향, 어떻게 정하는게 좋을까? (1) 가치관 우선순위 정하기

일을 했던 지난 2년~3년간을 돌아보면 배우고 싶었던 실무를 경험하고, 답답함 속에서 배우려고 이리저리 다니면서 천천히 꾸준히 성장해왔던 것 같다. 하지만, 더 성장하고자 하는 갈증이 계속되었고 점점 어떤 부분을 채우고 싶은지 구체화되어 데잇걸즈를 다니게 되었다. 지금 나는 A 과정에 있다고 생각한다! 데잇걸즈 과정에서 성취하고자 하는 것 중 하나는 앞으로의 커리어 방향이라서, 나이님의 커리어 세션을 듣고 커리어에 대해 고민한 것을 남겨두려고 한다. 나의 일에 대한 우선순위 생각해보기 아래 이미지를 참고해서 '성장', '의미', '재미', '인간관계', '연봉', '워라벨' 중 일을 선택할 때 중요하게 생각하는 가치관을 골라보고 구체적으로 설명해보자 1. 성장 짧은 회사생활을 돌이켜보았을 때, 나는 일과..

내가 열심히 보고하는 지표가 허무지표 일 수 있다.

지표는 사업하는데에 꼭 필요한 도구이다. 일주일에 몇명의 신규회원이 발생하고 있는지, 하루에 발생하는 매출은 얼마인지 등을 숫자로 나타내서 알고 있어야한다. 그런데, 모~~든 것을 매일 숫자로 보고를 하려고하면 문제가 발생한다. 예를들어 로그인 수, 가입자 수, 다운로드 수 등을 매일매일 보고한다고 해보자. "어제는 다운로드 수가 100건 이었군, 10건이 늘었네" "어제는 매출이 10만원 감소했군" 하지만 이 지표만 보고 무엇을 해야할지 알 수 없다. 지표의 목표없이 단순히 측정하기 쉬운 지표, 기분좋은 지표들만 수집하고 보고하는 것은 의미없다. 이렇게 일했다는 기분을 주고, 나아지는 지표를 보고 순간순간 기분은 좋게만들지만 추가 액션을 발생시키지 못하는 지표들을 허무지표라고 한다. 허무지표 특징 쉽게..

파이썬 재귀호출로 반복문 줄이기

알고리즘은 효율적인 패턴을 찾아내어 문제를 해결하는데 도움을 준다. 앞으로 그 알고리즘을 하나하나 배우면서 문제를 풀어나가려고 한다. 첫번째로 재귀호출에 대해서 공부해보았다. 알고리즘 문제를 풀 때, 복잡한 수식을 생각하기전에 단순하게 모든 경우의 수를 계산해보는 방법이 있다. 이를 완전탐색이라고하는데, 이 때 재귀함수를 사용하면 간단하게 해결할 수 있다. 재귀호출이란? 자신이 수행할 작업을 유사한 형태의 여러 조각으로 쪼갠 뒤 그 중 한 조각을 수행하고, 나머지를 자기 자신을 호출해 실행하는 함수 반복문을 재귀호출 이용하도록 바꿔보자! 문제) 1~N까지의 수를 더해주는 함수 ex) numbers=5 -> 1+2+3+4+5 1) 반복문 사용 def is_sum(N): sum_num = 0 for i in..

3가지 리텐션(Retention) 계산 방법 특징

인프런 양승화님의 그로스해킹 수업을 듣고 작성합니다. 잘못된 내용이 있으면 댓글로 알려주세요 🙌🏻 AARRR 에서 3R중 하나인 Retention 에 대해 알아보자. * 나중에 개인적으로 참고하는 용도로 작성해서 설명없이 최대한 간단하게 작성했습니다. Retention 3가지 계산 방법 개념 수식 장점 단점 보완 및 활용 Classic Retention 특정일 (N)에 컴백한 유저 비율 Day N 이용자 / Day 0 에 처음 이용자 쉬움 - 일단위 데이터 모두 쌓아놔야함 - 특정일 노이즈에 취약 ex) user 5 - daily 사용이 중요한 서비스에서 사용하기 적합 - 기준일 N을 6일,7일,8일등 다양하게 두고 평균치 구해서 노이즈 줄이기 Range Retention 특정기간에 컴백한 유저 비율 R..

카카오톡 대화 내보내기로 대화주기 분석해보기

주기적으로 연락하고 지내는 친구들과 대화주기가 어떻게 되는지 궁금해서 카카오톡 대화 데이터를 뽑아보았습니다. 단톡방은 여러명이 대화를 하고 있어서 제외했고, 개인톡하는 친구 4명을 뽑아보았습니다. 1. 데이터 준비 - 카카오톡 채팅방 > 우측상단 버거메뉴 > 설정 > 채팅방 관리 > 대화 내용 내보내기 > 텍스트 메시지만 내보내기 > 이메일 전송 위 이미지처럼 메시지를 주고받은 일자, 상대방 이름, 내용이 TXT 파일로 출력됩니다. 2. 구글 스프레드 시트로 데이터 옮기고 가공하기 데이터를 복사해서 구글 스프레드 시트에 붙여넣어줍니다. 데이터를 관찰해보니, 이런 형식을 가지고 있었습니다. [YYYY년 MM월 DD일 요일 ] [ YYYY. MM. DD Time , 상대방 이름 : 대화내용] [ YYYY. ..

반응형