반응형

전체 글 136

[leetcode] Department Highest Salary (윈도우함수)

문제 출처: leetcode.com/problems/department-highest-salary/ Department Highest Salary - LeetCode Level up your coding skills and quickly land a job. This is the best place to expand your knowledge and get prepared for your next interview. leetcode.com 문제. 각 부서에서 salary 가장 높은 사람 뽑기 출력 형태 Solution1. FROM 절에서 Subquery + MAX() 윈도우함수 1) subquery에서 max() 윈도우함수를 써서 부서 별 가장 높은 salary를 구해준다 (M_Salary) subque..

[자연어처리] konlpy 설치하고 불러오기

konlpy란? konlpy는 한글 자연어 처리를 도와주는 java기반의 형태소 분석기들을 python에서 쓸 수 있게 도와주는 라이브러리들이다. github link 참고 twitter/twitter-korean-text Korean tokenizer. Contribute to twitter/twitter-korean-text development by creating an account on GitHub. github.com 세팅하기 1. java 설치 konlpy는 자바기반으로 만들어졌기때문에 java를 설치해줍니다. (각자 os에 맞는 것으로 설치 필요) java 설치하기 Java | Oracle www.java.com 2. jdk 설치 www.oracle.com/java/technologies/..

[프로그래머스] lv2. 프린터

문제링크: programmers.co.kr/learn/courses/30/lessons/42587 코딩테스트 연습 - 프린터 일반적인 프린터는 인쇄 요청이 들어온 순서대로 인쇄합니다. 그렇기 때문에 중요한 문서가 나중에 인쇄될 수 있습니다. 이런 문제를 보완하기 위해 중요도가 높은 문서를 먼저 인쇄하는 프린 programmers.co.kr 아이디어 처음 주어진 우선순위 리스트를 index 정보와 함께 저장한다. (처음의 location 정보로 답변해야하므로) : (index,value) value 기준으로 max 값을 찾아서 슬라이싱을 활용해 리스트 정렬을 다시해준다. 해당 max값은 기존 리스트에서 pop해주고, 새로운 리스트에 쌓아준다. 기존 리스트가 0이 될때까지 반복한다. Solution1. (틀..

글또 5기를 시작하며 ✍🏼

글또를 알게 된 건 4기쯤 부터였는데, 당시에는 글을 쓰고 있지 않았고 2주에 한번 씩 글을 쓰는것에 대해 자신이 없었다. 그래서 지켜만보았다. 그러다가 이번에 데잇걸즈 활동을 하면서 매일 학습하는 것을 흘리기에 아까운 마음이 들어 TIL 블로그를 시작하게 되었다. 이렇게 블로그를 꾸준하게 써본건 이번이 처음인데, 그럴 수 있었던 이유는 TIL을 썼다고 공유할 수 있는 Slack 채널이 있어서 인 것 같다. 서로 TIL을 쓴걸보고, 학습했던거에 대해서 더 깊게 이해할수있고 또 자극제가 되기도 했다. 그리고 작성한 블로그에 반응도 바로바로 얻을 수 있다보니 지치지않고 계속 작성할 수 있었다. 이번 기회를 통해서 글을 쓰는 것에 대한 마음의 허들이 조금 낮아져서 용기내어 글또 5기에 지원했다. 콘텐츠 계획 ..

Cross Validation (교차검증) 이란?

Cross Validation (교차검증) 모델을 train 시킬 때 데이터셋을 train, test 로 나누게된다. 이때, train: test = 8:2로 나누었다고 하면 하나의 고정된 train data로 학습시키고, 하나의 고정된 test data로 검증하다 보니 이 데이터셋에만 잘맞는 학습결과, 과적합(overfitting)이 일어날 수 있다. 이를 해결하고자 교차검증(cross valication)을 활용한다. 교차검증의 컨셉은, 전체 데이터를 fold로 나누어서 각각이 모두 중복없이 test set, train set 에 한번씩 들어가게 하는 것이다. 그리고 마지막으로 평균을 내어서 (다른 방법도 있다) 최종적 모델의 성능을 평가한다. 모델 하나를 평가하는데 fold5개일 때 기준으로 tra..

K-means Clustering with Python

2020/08/31 - 머신러닝 야학 입문 - 머신러닝 분류하기 머신러닝 야학 입문 - 머신러닝 분류하기 이 블로그는 생활코딩 이고잉님의 머신러닝 야학을 듣고 스스로 이해한 내용을 바탕으로 작성합니다. 잘못된 내용이 있으면 댓글로 알려주세요 :) 머신러닝 야학 신청하러 가기 👉🏻 머신러닝 hanawithdata.tistory.com 우선 들어가기전에 K-means cluster는 머신러닝 종류에서 어디에 해당하는지 확인해보자 분류(classification) vs 군집(clustering)의 차이는? 분류와 군집의 차이를 알아야 한다. 분류는 Y(라벨) 이 정해져 있는 지도학습 중 하나이고, 군집은 Y(라벨) 없이 최대한 가까운 데이터끼리 묶어주는 것이다. K-means cluster는 y 라벨값이 없으..

[프로그래머스] Lv1. 완주하지 못한 선수

문제 링크: programmers.co.kr/learn/courses/30/lessons/42576 코딩테스트 연습 - 완주하지 못한 선수 수많은 마라톤 선수들이 마라톤에 참여하였습니다. 단 한 명의 선수를 제외하고는 모든 선수가 마라톤을 완주하였습니다. 마라톤에 참여한 선수들의 이름이 담긴 배열 participant와 완주한 선수 programmers.co.kr Solution1. for + remove 1) participant 차례로 검사해서 completion에 있는지 확인 2) 있으면 completion에서 해당 선수 지워주기 3) 없으면 해당 선수 return 여기서 굳이 remove 해주었던 이유는, 3번째 입출력을 보면 mislav 라는 선수가 2명이 있다. completion에는 misl..

Git 시작하기 (7) - pull

Pull은 왜 필요한가? 같은 파일 작업을 각각 다른 로컬저장소에서 작업을 할 때, 최신 버전을 가져와서 작업을 해야 하기 때문이다. 예를들어 아래처럼 회사에서 데이터전처리 작업을 하고 같은 파일로 집에와서 연결해서 EDA를 하고 싶다면, 데이터 전처리까지 끝난 최신버전을 원격저장소에 push 하고, 집에와서 Pull로 땡겨와서 작업을 해주면 된다!! Pull 사용해보기 다음에..

Git 시작하기 (6) - clone 원격 저장소 복제하기

앞서 원격저장소를 연결하고, 파일을 올리는 것까지 해보았습니다. 다른 사용자가 올린 프로젝트를 받거나, 회사에서 작업하던 내용을 다른 장소에서 이어나가고 싶을 때 등 물리적인 제한 없이 자유롭게 작업할 수 있도록 도와주는것이 clone 입니다. Clone 이란? 원격 저장소에 있는 프로젝트를 복제해서 로컬 저장소에 넣어줌 Clone 사용하기 1) 로컬저장소에 프로젝트를 넣을 폴더 만들기 2) github에서 복제할 저장소 clone 주소 가져오기 3) 폴더에 복제하기: git clone 레파지토리주소 복제할폴더명 - 뒤에 폴더명 안넣어주면 github의 레파지토리 이름으로 자동 생성된다.

Git 시작하기 (5) - backup 원격 저장소 연결하기

원격저장소가 필요한 이유 우리의 컴퓨터는 언제든 망가질 수 있기 때문에, 작업한것을 안전하게 저장해둘 수 있는 원격 저장소가 필요합니다. 그리고 원격 저장소가 있으면 여러명이서 작업을 하거나, 여러대의 컴퓨터로 작업을 할 경우 다같이 동일하게 접근하여 앞에서 배운 git을 활용하여 버전 관리를 하고 협업을 할 수 있습니다 !! 아래 그림처럼 원격 저장소에 집, 회사 컴퓨터가 각각 접근하면서 파일을 업로드하고 (Push), 복제해오고 (Clone), 다운로드 받으면서 (Pull) 프로젝트를 진행할 수 있습니다. Github 란? 원격저장소를 직접 구축하기는 어렵기때문에, 원격저장소 임대 서비스를 제공하는 것을 이용합니다. github는 원격저장소를 임대해주는 서비스 입니다! Github 사용하기 1) 사이..

반응형