전체 글

프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 의식의 흐름 도시 이름을 넣고 빼고 해야할 것 같으니까 덱을 쓰면 되지 않으려나.. 일단 cacheSize만큼 넣고 채운 이후에 포함하는지 안하는지에 따라서 나누면 될 것 같은데 => 실행 결과 : 틀렸습니다. 왜..?하면서 다시 생각해보니 "일단 cachesize만큼 넣고 채운 이후에"가 잘못된 생각이었다. cacheSize만큼 채우기 전에도 도시 이름을 포함하고 있는지 아닌지에 따라 넣고 빼야했다. 해당 부분을 수정하고 나니 통과 풀이 1. cacheSize가 0인 경우, 무조건 cachemiss가 나기 ..
프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 의식의 흐름 크기가 제일 많은 것부터 k개될 때까지 담으면 될 것 같은데 풀이 1. HashMap을 이용해 key로는 크기를, value로는 개수를 갖는 map 생성한다. 2. 생성한 map을 이용해 size(크기)와 cnt(개수)를 갖는 Tangerine 클래스를 담는 ArrayList 생성한다. 3. 생성한 ArrayList를 정렬한다. => cnt를 기준으로 내림차순 정렬됨 4. 정렬한 ArrayList를 이용해 cnt가 가장 높은 것부터 차례대로 담는다. 이때, 담은 총 개수가 k보다 크거나 같으면 b..
1072번: 게임 김형택은 지금 몰래 Spider Solitaire(스파이더 카드놀이)를 하고 있다. 형택이는 이 게임을 이길 때도 있었지만, 질 때도 있었다. 누군가의 시선이 느껴진 형택이는 게임을 중단하고 코딩을 하기 시 www.acmicpc.net 의식의 흐름 (게임을 더하면 이긴 게임(Y)만 늘어나는게 아니라 게임 횟수(X)도 늘어나는걸 생각 못하고,,,) 1~X-Y번 이분 탐색 돌리면 되겠네 라고 했다가 7번의 "틀렸습니다"를 보고 정신차림. 혹시나 하고 end = X로 고쳤더니 바로 통과해버렸당. 근데 아직까지 왜 end = X인지 이유를 명확히 모르겠다👻 풀이 1. Z가 99%인 경우, 게임을 아무리 해도 승률이 100%가 되지 못하므로 해당 경우는 바로 처리 2. 99% 아래인 경우, 이분..
16953번: A → B 첫째 줄에 A, B (1 ≤ A < B ≤ 109)가 주어진다. www.acmicpc.net 의식의 흐름 A에서 B로 가면 경우의 수가 너무 많을 것 같으니까 B에서 A로 가볼까..? 일의 자리가 1이거나 짝수일 때만 연산 가능하니까 그 경우만 처리해주고 나머지는 -1이겠지! 풀이 B를 A로 만들기 도전 1. B의 일의 자리가 1인 경우 1을 없애주고, B가 짝수인 경우 2로 나누어준다. 만약, 2가지 경우 중 하나에 포함되지 않는 경우(ex. 일의 자리가 3인 경우)는 A로 만들지 못하는 경우이므로 -1 출력 2. 1번 연산을 B
· 딥러닝
# 순환 신경망(Recurrent Neural Network, RNN) 입력과 출력을 시퀀스 단위로 처리하는 시퀀스 모델 다양한 길이의 입력 시퀀스를 처리할 수 있는 인공 신경망 시퀀스 모델 시퀀스 모델 = 시퀀스를 처리하기 위해 고안된 모델 은닉층의 노드에서 활성화 함수를 통해 나온 결과값을 출력층 방향으로도 보내면서 다시 은닉층 노드의 다음 계산의 입력으로 보내는 특징을 가짐 은닉층에서 활성화 함수를 통해 결과를 내보내는 역할을 하는 노드 = 셀(cell) 이전의 값을 기억하려고 하는 일종의 메모리 역할을 수행 메모리 셀, RNN 셀이라고도 함 각각의 시점(time step)에서 바로 이전 시점에서의 은닉층의 메모리 셀에서 나온 값을 자신의 입력으로 사용하는 재귀적 활동을 하고 있음 => 현재 시점 ..
· 딥러닝
# Word Embedding 각 단어를 좌표공간에 최적의 벡터로 표현(embedding)하는 기법 각 단어들을 특정한 차원으로 이루어진 공간 상의 한 점, 혹은 그 점의 좌표를 나타내는 벡터로 변환해주는 기법 워드 임베딩은 그 자체가 머신러닝 혹은 딥러닝 기술 text 데이터셋을 학습 데이터로 주고 좌표 공간의 차원 수를 사전에 정의한 후 입력으로 워드 임베딩 알고리즘을 주면 워드 임베딩 학습이 완료된 이후 해당하는 좌표 공간 상에서 학습 데이터에서 나타난 각각의 단어에 대한 최적의 좌표값 혹은 그에 해당하는 벡터 표현형을 출력함 비슷한 의미를 가지는 단어가 좌표 공간 상에 비슷한 위치의 점으로 매핑되도록 함으로써 단어들의 의미상 유사도를 잘 반영한 벡터 표현을 다양한 자연어 처리 알고리즘에게 제공 #..
· 딥러닝
# Bag-of-Words 딥러닝 기술이 적용되기 이전에 많이 활용되던 단어 및 문서를 숫자 형태로 나타내는 가장 간단한 기법 단어들의 순서는 고려하지 않고 단어들의 출현 빈도에만 집중하는 텍스트 데이터의 수치화 표현 방법 Step1. Constructing the vocabulary containing unique words 사전(vocabulary) 형태로 저장할 때 단어들의 중복 허용X "John really really loves this movie", " Jane really likes this song" => {"John", "really", "loves", "this", "movie", "Jane", "likes", "song"} Step2. Encoding unique words to on..
· 딥러닝
# 선형 회귀(Linear Regression) 알려진 다른 관련 데이터 값을 사용하여 알 수 없는 데이터의 값을 예측하는 데이터 분석 기법 단순 선형 회귀 분석 다중 선형 회귀 분석 실제값과 예측값에 대한 오차에 대한 식 목적 함수(Objective function) = 함수의 값을 최소화/최대화하는 목적을 가진 함수 비용 함수(Cost function) = 값을 최소화하려는 함수 = 손실 함수(Loss function) => 비용 함수는 단순히 실제값과 예측값에 대한 오차를 표현하면 되는 것이 아닌 예측값의 오차를 줄이는 일에 최적화된 식이어야 함 # 로지스틱 회귀(Logistic Regression) 둘 중 하나를 결정하는 문제인 이진 분류(Binary Classification)과 같은 문제를 풀..
· 딥러닝
# PyKoSpacing 띄어쓰기가 되어있지 않은 문장을 띄어쓰기를 ㅎ나 문장으로 변호나해주는 패키지 성능 괜찮음 # Py-Hanspell 네이버 한글 맞춤법 검사기를 바탕으로 만들어진 패키지 띄어쓰기 또한 보장 # SOYNLP 품사 태깅, 단어 토큰화 등을 지원하는 단어 토크나이저 비지도 학습으로 단어 토큰화 데이터에 자주 등장하는 단어들을 단어로 분석 텍스트 데이터에서 특정 문자 시퀀스가 함께 자주 등장하는 빈도가 높고 앞뒤로 조사 또는 완전히 다른 단어가 등장하는 것을 고려해서 해당 문자 시퀀스를 형태소라고 판단하는 단어 토크나이저 내부적으로 응집 확률과 브랜칭 엔트로피를 활용한 단어 점수 표로 동작 응집 확률(cohesion probability) 내부 문자열이 얼마나 응집하여 자주 등장하는지 판..
하얀 돌덩이
돌덩이