일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- orderby
- groupby
- DATE_FORMAT
- map
- programmers
- 파이썬
- mysql
- 코세라머신러닝강의
- 경제공부
- POP
- sql
- sql오답노트
- 코세라
- 머신러닝강의
- Algorithm
- coursera
- 알고리즘
- 머신러닝
- 코세라강의
- Machine Learning
- 안드류응
- 프로그래머스SQL
- sorted
- PYTHON
- 코세라머신러닝
- 인프런sql강의
- SQL공부
- 프로그래머스
- Andrew NG
- WHERE
- Today
- Total
목록카테고리 (93)
미래를 예측하는 데이터분석가
정보이론: 엔트로피, KL 발산, 크로스엔트로피1. 정보량과 엔트로피: 불확실성의 총합정보량: 어떤 사건이 발생할 확률이 낮을수록 정보량이 큽니다.예:"내일 해가 뜹니다"는 너무 당연해서 정보량이 낮음."내일 외계인이 방문합니다"는 매우 희박하니 정보량이 큼.수식: 정보량 ( I(x) = -\log P(x) )( P(x) ): 사건이 일어날 확률 (0~1).( P(x) )가 1에 가까울수록 ( I(x) )는 작아지고, 0에 가까울수록 ( I(x) )는 커짐.엔트로피엔트로피는 전체 사건에 대한 평균 정보량입니다.확률이 골고루 분포되어 있을수록(불확실성이 클수록) 엔트로피가 커집니다.예:동전을 던질 때 앞/뒤가 나올 확률이 같으면 엔트로피가 최대.항상 "앞"만 나오면 엔트로피는 0.수식: ( H(X) = -..
SQL 쿼리SELECT FLOOR(PRICE / 10000) * 10000 AS PRICE_GROUP, COUNT(*) AS PRODUCTSFROM PRODUCTGROUP BY FLOOR(PRICE / 10000)ORDER BY PRICE_GROUP ASC;풀이 과정가격 구간 생성:PRICE를 10,000으로 나눈 후 내림(floor) 처리하여 가격대를 구합니다.FLOOR(PRICE / 10000) * 10000을 통해 구간의 최소 금액을 생성합니다.상품 개수 세기:COUNT(*)를 사용하여 각 가격대에 해당하는 상품의 개수를 집계합니다.그룹화:GROUP BY FLOOR(PRICE / 10000)을 통해 가격대별로 데이터를 그룹화합니다.결과 정렬:ORDER BY PRICE_GROUP ASC로 ..
SQL 문제 풀이: 3월 생일 여성 회원 조회하기문제 설명다음은 MEMBER_PROFILE 테이블 구조입니다. 회원 정보를 바탕으로 문제 조건에 맞는 데이터를 조회해야 합니다.Column nameTypeNullableDescriptionMEMBER_IDVARCHAR(100)FALSE회원 IDMEMBER_NAMEVARCHAR(50)FALSE회원 이름TLNOVARCHAR(50)TRUE회원 연락처GENDERVARCHAR(1)TRUE회원 성별DATE_OF_BIRTHDATETRUE회원 생년월일문제 조건:성별이 여성(W)인 회원만 조회합니다.생일이 3월인 회원만 조회합니다.전화번호(TLNO)가 NULL이 아닌 회원만 출력합니다.결과는 회원 ID 기준 오름차순 정렬합니다.문제 풀이내가 작성한 SQL 쿼리는 다음과 같..
문제 정리: 서울 지하철 2호선 역 간 거리 조회1. 테이블 구조컬럼명데이터 타입NULL 허용설명LINEVARCHAR(10)FALSE호선 (예: "2호선")NONUMBERFALSE역 순번ROUTEVARCHAR(50)FALSE노선명 (예: "성수지선")STATION_NAMEVARCHAR(100)FALSE역 이름D_BETWEEN_DISTNUMBERFALSE역 사이 거리D_CUMULATIVENUMBERFALSE누적 거리2. 요구사항각 노선(ROUTE) 별로 총 누계 거리와 평균 역 사이 거리를 계산.출력 컬럼명:TOTAL_DISTANCE: 노선의 총 누계 거리 (소수점 둘째 자리 반올림 후 "km" 추가).AVERAGE_DISTANCE: 노선의 평균 역 사이 거리 (소수점 셋째 자리 반올림 후 "km" 추가)..