분류 전체보기84 SQL 레벨업 - 6장 18강 기능적 관점으로 구분하는 결합의 종류 1. 크로스 결합 - 모든 결합의 모체 - 크로스 결합의 작동 SELECT *FROM Employees CROSS JOIN Departments; 2개의 테이블의 레코드에서 가능한 모든 조합을 구하는 연산 (사원 테이블 레코드) * (부서 테이블 레코드) 만큼의 레코드 결과 생성 - 크로스 결합이 실무에서 사용되지 않는 이유 1. 이러한 결과가 필요한 경우가 없다 2. 비용이 매우 많이 드는 연산이다 -결합 조건이 없으면 DBMS 는 어쩔 수 없이 두 개의 테이블에서 나올 수 있는 모든 조합을 만들어 버린다. 2. 내부 결합 - '데카르트 곱의 부분 집합' 이라는 의미 - 내부 결합의 작동 SELECT E.emp_id, E.emp_name, E.dept_id,.. 2023. 11. 12. 혼자공부하는 머신러닝 + 딥러닝 5장 5-3 트리의 앙상블 정형 데이터 - 데이터 베이스, 엑셀, CSV 로 저장하기 쉬운 데이터 비정형 데이터 - 데이터 베이스, 엑셀로 표현하기 어려운 데이터 (ex. 텍스트 데이터, 사진, 디지털 음악) 앙상블 학습 ensemble learning : 정형데이터를 다루는 데 가장 좋은 알고리즘 랜덤 포레스트 Random forest 여러 개의 결정 트리(Decision Tree)를 사용하여 데이터를 학습하고 예측하는 모델 여러 개의 결정 트리를 만들고, 각 트리의 예측을 종합하여 높은 정확도의 예측을 수행 부트스트랩 샘플링 (Bootstrap sampling) 랜덤 포레스트는 원본 데이터에서 랜덤하게 중복을 허용(뽑은 데이터를 다시 넣어서 랜덤하게 뽑음)하여 샘플을 선택하고 이렇게 만들어진 부트스트랩 샘.. 2023. 10. 28. SQL 레벨업 - 5장 14강 반복문 의존증 반복문 의존증 - 문제를 작게 나우어 레코드라는 단위에 이를 때까지 자르고 그러한 레코느에 반복문을 적용해서 문제를 해결하려는 태도 SQL 은 반복문이 없음. 내부적으로는 반복문 사용 하나의 레코드마다 작은 SQL을 사용해 접근함. 비즈니스 로직은 호스트 언어(절차형 언어)에서 반복 처리를 구현하는 것이 일반적임. 나머지는 c#이나 자바에서 구현하면 됨. 15강 반복계의 공포 1. 반복계의 단점 같은 기능을 구현한다고 가정하면, 반복계로 구현한 코드는 포장계로 구현한 코드에 성능적으로 이길 수가 없음. 처리하는 레코드 수가 적을 때는 반복계와 포장계에 큰 차이가 없음.하지만 처리하는 레코드 수가 많아지면 차이가 점점 벌어짐. 반복계의 처리기간= * - SQL 실행의 오버 헤드 SQL.. 2023. 10. 8. 혼자 공부하는 머신러닝+딥러닝 4장 4장 다양한 분류 알고리즘 4-1 로지스틱 회귀 로지스틱 회귀 ( logistic regression ) 회귀로 연속적인 결과를 시그모이드 함수로 표준화시켜서 특정값을 기준으로 나누어서 “분류"하는 것 선형 회귀와 동일하게 선형 방정식을 학습 z = a x ( weight ) + b x ( length ) + c x ( diagonal ) + d x ( height ) + e x ( width ) + f a, b, c, d, e 는 가중치/계수 z 는 0~ 1( 0% ~ 100%) 결과값 z를 그대로 사용하면 회귀가 되기 때문에 0~1 범위의 값으로 압축해 확률을 표현 z 값 압축에 사용되는 함수를 시그모이드 함수(=로지스틱 함수) import numpy as np import matlotlib.pypl.. 2023. 10. 4. SQL 레벨업 - 4장 4장 집약과 자르기 12강 집약 집약함수(aggregate function) : 여러 개의 레코드를 한 개의 레코드로 집약하는 기능 ex) COUNT , SUM, AVG, MAX, MIN 1. 여러 개의 레코드를 한 개의 레코드로 집약 한 사람과 관련된 정보가 여러 개의 레코드에 분산되어 있는 테이블은, 한 사람의 정보에 접근할 때 'WHERE id = 'jim''과 같은 SELECT 구문을 사용할 때 당연히 3개의 레코드가 선택. 하지만 한 개의 레코드로 얻는 것이 편함 SELECT ID, DATA_1, DATA_2 FROM NonAggTbl WHERE ID = 'JIM' AND DATA_TYPE = 'A'; SELECT ID, DATA_3, DATA_4 FROM NonAggTbl WHERE ID = .. 2023. 9. 25. SQL 레벨업 - 3장 SQL의 조건 분기 8강 UNION을 사용한 쓸데없이 긴 표현 조건 분기 :where구만 조금씩 다른 여러 개의 SELECT 구문을 합쳐서, 복수의 조건에 일치하는 하나의 결과 집합을 얻고싶을 때 -> 여러 개의 SELECT 구문을 실행하는 실행 계획으로 해석되어 테이블에 접근 횟수가 많아져 I/O 비용이 늘어남 union 예제 - 2001년 이전과 2002년 이후를 구분해서 가격을 선택해야함 SELECT item, year,price_ex as price FROM ITEMS WHERE year = 2002; ->거의 같은 두 개의 쿼리를 두 번이나 실행하여 길고, 오래걸림 SELECT item,year, CASE WHEN year = 2002 THEN price_in END AS price FROM I.. 2023. 9. 19. 이전 1 ··· 5 6 7 8 9 10 11 ··· 14 다음