반응형

데잇걸즈 33

[Pandas] any(),all() 사용법과 예시

any(), all() 둘다 boolean(True or False) 값을 return 해주는 pandas의 내장함수이다. 데이터분석을 하다보면, 특정 값을 가진 행이 있는지 판별해야하는 경우가 있다. 그 특정값이 몇개가 있는지가 아니라 단순히 1개라도 있는지, 아니면 전체 행이 그 값을 가졌는지 여부를 판단해줄 때 any() 혹은 all()을 써줄 수 있다. 예시를 통해 확인해보자 1. Student Table 에 'hana'라는 이름을 가진 학생이 있는가? 2. Student Table 에 'zero'라는 이름을 가진 학생이 있는가? 3. Student Table 의 학생들중 남학생이 있는가? 4. Student Table 의 학생들은 전부다 여자인가? 이 함수는 조건문이랑 함께 사용하면 매우 편할 ..

커리어 방향, 어떻게 정하는게 좋을까? (1) 가치관 우선순위 정하기

일을 했던 지난 2년~3년간을 돌아보면 배우고 싶었던 실무를 경험하고, 답답함 속에서 배우려고 이리저리 다니면서 천천히 꾸준히 성장해왔던 것 같다. 하지만, 더 성장하고자 하는 갈증이 계속되었고 점점 어떤 부분을 채우고 싶은지 구체화되어 데잇걸즈를 다니게 되었다. 지금 나는 A 과정에 있다고 생각한다! 데잇걸즈 과정에서 성취하고자 하는 것 중 하나는 앞으로의 커리어 방향이라서, 나이님의 커리어 세션을 듣고 커리어에 대해 고민한 것을 남겨두려고 한다. 나의 일에 대한 우선순위 생각해보기 아래 이미지를 참고해서 '성장', '의미', '재미', '인간관계', '연봉', '워라벨' 중 일을 선택할 때 중요하게 생각하는 가치관을 골라보고 구체적으로 설명해보자 1. 성장 짧은 회사생활을 돌이켜보았을 때, 나는 일과..

[Pandas] column 순서 재배치하는 2가지 방법

데이터 프레임의 컬럼을 요리조리 다뤄보면서 알게 된 컬럼 순서 바꾸는 방법을 TIL로 남기려고 한다. 이렇게 컬럼이 많을 때 한눈에 들어오지 않는다. 위 이미지에서 3번째 컬럼에 있는 Salary Estimate 컬럼을 보면 연봉이 string 타입으로 작성되어 있어 연산이 어렵다. 그래서 salary_min, salary_max 컬럼을 생성하여 앞에 숫자와 뒤에 숫자를 각각 넣어주었다. 컬럼의 맨 오른쪽에 생성되어 있어서 스크롤을 해야 볼 수 있다. 그래서 이 새로만든 컬럼을 앞으로 재배치해주고 싶다. 방법1. 컬럼명 직접 써주기 df=df[['Job Title','salary_min', 'salary_max', 'Salary Estimate', 'Job Description', 'Rating', 'C..

Tensorflow 딥러닝으로 집 값 예측하기

이전에 Orange3로 해보았던 실습을 직접 Code로 작성해보는 과정입니다. 머신러닝 야학을 듣고 이해한 내용을 바탕으로 작성했습니다. 잘못된 부분이 있으면 댓글로 알려주세요. 머신러닝 야학 들으러가기 👉🏻 딥러닝이란? 이미지 출처 "인공 신경망에 기반하여 많은 양의 데이터를 학습해 뛰어난 성능을 이끌어내는 연구 분야" 이다. 사람의 뇌처럼 컴퓨터가 학습할 수 있도록 만들려고 하는 개념이다. 이미지 출처 위의 이미지처럼 사람 뇌속의 뉴런이 신호전달을 해서 학습하는 과정에서 착안하여 만들어진것이 딥러닝이다. Input(X) 와 Output(y) 사이에 Hidden layer를 두고 모델을 학습시켜서 예측 모델을 만드는 것이다. 여기서 Hidden layer 가 포인트이다. 이 부분은 사람이 계산하거나 알..

그로스해킹, 뭐라고 정의할까?

그로스해킹을 처음 접했던건 2017년도 였다. 창업을 해보았다가, 마케팅에서 좌절하고 학교로 돌아가 '스타트업 마케팅' 이라는 수업을 수강했다. 그 때 처음 그로스해킹을 만났다. 그 후로 3년 정도 흘렀지만, 계속 내가 이해하고 있는 그로스해킹이 미묘하게 달라지는 것 같다. 그리고 그로스해킹에 대해 다양한 의견들이 있어서, 어떤게 정답이라고 하기 어려운 것 같다. 스스로 지금 생각하고있는 그로스해킹에 대해 정리해보려고 한다. 위키피디아 에서 말하는 그로스해킹 그로스 해킹(Growth hacking)은 창의성, 분석적인 사고, 소셜 망을 이용하여 제품을 팔고, 노출시키는 마케팅 방법으로 스타트업회사들에 의해 개발되었다.[1][2] 온라인 마케팅의 한 종류라고 볼 수 있는데, 그로스 해커(growth hac..

Orange3로 코딩없이 머신러닝 지도학습 실습해보기

이고잉님의 머신러닝 야학을 듣고 이해한 내용을 바탕으로 작성했습니다. 잘못된 부분은 댓글로 알려주세요. 머신러닝 야학 들으러가기 👉🏻 Orange3는 데이터분석을 쉽게 해볼 수 있도록 도와주는 GUI 툴 입니다. 처음 머신러닝을 학습할 때, 코드부터 짜지 않아도 된다는 점에서 개념을 잡는데 도움이 되었습니다. 선형 회귀 분석 X(Feature, 원인, 독립변수) 에 따라서 달라지는 y (Target , 결과, 종속변수) 를 알아내고 그 관계에 수식을 찾아내어 원인에 따른 결과를 예측하는 것 입니다. 예를들어 온도의 2배 만큼 레몬에이드가 팔리는걸 발견했다고 하면 이렇게 수식으로 표현할 수 있습니다. 온도와 레몬에이드 판매량 관계 : y (레몬에이드 판매량) = 2 * X (온도) 이런 수식을 발견하면 우..

VScode로 Git & Github 로 코드 버전 관리 시작하기

Git을 설치하고, Github에 파일을 올리기 시작한지는 5개월 정도 되었지만 그 엄청난 기능들을 몰라서 구글드라이브 수준으로 사용하고 있었다. 흑흑 오늘은 깃을 깃답게 처음 써본 기념일이다. Visual Studio Code에서 작업한 파일을 어떻게 버전관리할 수 있는지 순서를 보자. 1. 코드 수정 2. Source control 영역에서 change 일어난 파일 + 눌러서 커밋 대기열에 추가 * git graph 볼 때, 순서 1) 헤드 (동그라미): 현재 작업 위치 2) 마스터: 최신 버전 3) origin: remote 저장소에 푸시한 버전 3. 커밋 대기열에 있는 파일 커밋하기 4. Github에 Push 하기 * 에러 발생 및 해결 에러 코드: can't push refs to remote..

Today I Learned/웹 2020.09.07

웹 클라이언트, 서버, 호스트 차이 쉽게 이해하기

수업을 듣고 이해한 내용을 바탕으로 작성되었습니다. 최대한 제가 이해한 언어로 풀어서 쉽게 작성했습니다. 잘못된 부분이 있으면 댓글로 알려주세요 🙌🏻 호스트 (Host) 인터넷에 연결 된 디바이스들을 호스트 라고 한다. (IP 주소를 가진 기기) 컴퓨터뿐 아니라 스마트 폰, 스마트 TV 등 인터넷에 연결되어 있는 기기들은 모두 호스트라고 할 수 있다. 웹 서버와 클라이언트 (Server & Client) 웹 정보들을 저장하고 있는 물리적인 공간 웹 서버가 있다. 클라이언트는 이 서버에 정보를 요청합니다. 그러면 서버에서 그 정보를 클라이언트의 컴퓨터에 뿅 띄워준다. 우리가 구글에 "강아지" 라고 검색하면, 강아지 관련된 정보가 쭈르륵 뜨는 것이 그런 과정! 현재의 우리에게는 너무나 자연스러운 일이지만, ..

Today I Learned/웹 2020.09.05

HTML / CSS 유용한 사이트 모음

포트폴리오 홈페이지 제작에 위해 필요할 것 같은 사이트 링크 모음 CSS 템플릿 활용 TEMPLATED A collection of 867 Creative Commons-licensed CSS, HTML5 and Responsive site templates created by Cherry, Doni, AJ, and co. templated.co 무료 폰트 Google Fonts Making the web more beautiful, fast, and open through great typography fonts.google.com 무료 랜덤 이미지 Unsplash Source A simple API for embedding free high-resolution photos from Unsplash. ..

Today I Learned/웹 2020.09.04

Excel 로 표본 데이터의 신뢰 구간 구하기

강의를 듣고 이해한걸 바탕으로 작성되었습니다. 잘못된 부분이 있으면 댓글로 알려주세요! 표본, 신뢰 구간 등의 관계 스토리 수식을 보기에 앞서 이 친구들의 관계를 보자. 표본은 모집단에서 추출한 샘플이라고 보면되는데, 모집단 전수조사가 어려운 경우가 많기 때문에 표본의 통계량으로 모집단을 추정한다. [과정 요약] 표본 통계량 (표본 평균, 표본 분산, 표본 표준편차 등 ) ----> 추정 -----> 모집단은 이런 특성을 가진 집단이래 이 때 오차범위를 함께 제공하는데 그 범위안에 모수가 들어갈 수 도있고, 아닐수도 있음 (신뢰 수준 0%~100%) 오차범위가 크면 신뢰수준이 커지고, 오차범위가 작으면 신뢰 수준도 낮아지는 관계이므로 신뢰 수준을 95% or 99%로 고정하고 오차범위를 구한다. * 오차..

반응형