검색 본문
서비스 안내 Kakao가 운영하는 책 서비스 입니다. 다른 사이트 더보기 SAS판별 및 분류분석(고려대통계연구소통계분석강의총서 8) 저자 김기영 외 출간 1997.8.1. SPSS Statistics 분류분석 저자 허명회 출간 2015.3.24. R을 활용한 데이터 마이닝: 회귀분석과 분류 알고리즘 (컬러판) 저자 김현태 한영수외 5명 출간 2022.1.12. 도서 20,700원 쏙쏙 통계 VI-1 계층적 분류분석 저자 김지형 출간 2015.5.18. 계정과목 분류 및 경리장부, 계정과목별...회계원리, 결산, 재무제표, 경영분석 저자 이진규 출간 2024.2.20. 도서 24,300원 폐기물관리법상 폐기물 분류체계 분석 저자 손현 출간 2012.10.31. 도서 4,950원 행정적 규제의 유형 분류 및 실태 분석에 관한 연구 저자 최유성 출간 2014.12.31. 도서 20,000원 지방예산분류체계 및 재정분석 전산화연구 저자 한국지방행정연구원 편집부 출간 1988.2.1. 우리나라 행정규제의 특성분석을 위한 규제분류방식에 관한 연구(KIPA 연구... 저자 최유성 출간 2011.12.31. 도서 16,000원 연안경관 유형분류와 관리제도 분석 연구(수사연구 2011-03) 저자 최지연 외 출간 2011.12.31. 도서 15,000원 더보기 (주)카카오는 상품판매의 당사자가 아닙니다.법적고지 안내 (주)카카오는 통신판매중개자로서 통신판매의 당사자가 아니며 상품의 주문 배송 및 환불 등과 관련한 의무와 책임은 각 판매자에게 있습니다.
jyols.tistory.com DogFootRuler 분류 분석(분류 모델) 1. 분류의 개요 머신러닝은 인공지능 분야 중 하나로, 데이터를 이용하여 패턴을 학습하고 예측하는 기술이다. 이 중에서 분류모델은 데이터를 특정 카테고리나 그룹으로 분류하는 모델이다. 2. 분류모델의 개념 분류모델은 데이터를 분류하는 모델로, 입력 데이터에 대해 사전에 정해진 카테고리에 속하는지 여부를 판단한다. 지도학습에서는 미리 정해진 레이블(label) 정보를 이용하여 모델을 학습시키고, 새로운 데이터가 들어오면 해당 데이터를 분류한다. 반면, 비지도학습에서는 레이블 정보 없이 데이터의 패턴을 파악하여 그룹을 형성하거나 이상치를 찾아낸다. 3. 분류모델의 종류 3-1. 의사결정나무(Decision Tree) 1) 데이터를 분할하여 트리 구조로 표현하는 모델 2) 각 노드에서는 데이터를 가장 잘 분류할 수 있는 특성을 선택한다. 3) 각 분기점에서 가장 정보량이 많은 특성을 선택한다. - 지니계수(Gini Index) 의사결정나무에서 분기점을 구성할 때 사용되는 지니계수(Gini Index)는 해당 분기점에서 데이터가 얼마나 잘 분류되는지를 나타내는 지표이다. 지니계수가 낮을수록 해당 분기점에서 데이터가 잘 분류된다. 3-2. k-최근접 이웃(k-Nearest Neighbor) k-최근접 4. 분류모델의 학습 방법 4-1. 배치 학습(Batch Learning) 1) 전체 데이터셋을 한 번에 모델에 입력하여 학습하는 방식 2) 대용량 데이터에 적합하지 않을 수 있음 3) 학습된 모델은 새로운 데이터가 들어올 때마다 모델 전체를 재학습해야 함 4-2. 온라인 학습(Online Learning) 1) 새로운 데이터가 들어올 때마다 모델을 조금씩 업데이트하는 방식 2) 대용량 데이터에 적합하며, 실시간 예측이 필요한 경우 사용될 수 있음 3) 예측 오류가 발생하면 이를 학습에 반영해 모델을 개선할 수 있음 5. 분류모델 평가 분류모델의 성능을 평가하기 위해서는 다양한 지표를 사용할 수 있다. 5-1. 혼동행렬(Confusion Matrix) 분류 분석에서 평가 지표란 구축된 모델이 데이터를 얼마나 잘 분류하는지에 관한 평가이다. 즉, 예측값과 실제값을 비교하여 맞는 경우(Correct)와 틀린 경우(Incorrect)로 구분된다. 이러한 결과를 교차표 형태로 정리한 것을 오분류표라고 하며, Confusion Matrix(혼동 행렬)이라고도 한다. - 정확도(Accuracy) 1) 전체 예측 중 실제값과 일치한 비율 2) 이진 분류(binary class 21 분류모델의 성능을 평가하기 위해서는 다양한 지표를 사용할 수 있다. 5-1. 혼동행렬(Confusion Matrix) 분류 분석에서 평가 지표란 구축된 모델이 데이터를 얼마나 잘 분류하는지에 관한 평가이다. 즉, 예측값과 실제값을 비교하여 맞는 경우(Correct)와 틀린 경우(Incorrect)로 구분된다. 이러한 결과를 교차표 형태로 정리한 것을 오분류표라고 하며, Confusion Matrix(혼동 행렬)이라고도 한다. - 정확도(Accuracy) 1) 전체 예측 중 실제값과 일치한 비율 2) 이진 분류(binary class 시그모이드 분류모델의 종류 의사결정나무(Decision Tree) 지니계수(Gini Index) k-최근접 이웃(k-Nearest Neighbor) 로지스틱 회귀(Logistic Regression) Odds(오즈) 로짓변환 분류모델의 학습 방법 분류모델 평가 2024.03.12 블로그 검색 더보기 분류 분석 2 (1과목) 빅데이터 분석 기획 ② iammat.tistory.com Mat [ADsP] 과목3: 3-2 분류분석 14 종속변수(y)는 범주형 변수 로지스틱 회귀분석의 변수 🍋🍋🍋 일반적인 로지스틱 회귀분석 이진분류: 종속변수가 속할 수 있는 집단 두 개가 보통 다중 로지스틱 회귀분석 세 개 이상의 집단 분류 독립변수 연속형 + 종속변수 범주형 독립변수가 범주형일 경우 그 범주형 독립변수 더미변수로 변환 왜? 더미는 뭐여? 종속... 2024.02.21 [ADsP] 과목3: 3-3 군집분석 rudolpia.tistory.com RudolpiA ADsP 분류 분석 4 새로운 자료에 대한 예측 및 분류를 수행하는 것이 목적입니다. 분류분석, 예측분석 공통점 - 레코드의 특정 속성의 값을 미리 알아맞히는 점 분류 분석, 예측분석 차이점 분류 : 레코드의 범주형 속성의 값을 알아 맞히는 것 - 예시 : 이메일의 내용, 제목으로 스팸여부 알아맞히는 것 예측 : 레코드의 연속형 속성의... 2024.02.23 ADsP 분류분석 (나이브 베이즈,K-NN알고리즘, 서포트벡터머신) blog.naver.com 이레널스 딥러닝 텍스트 감성분석 분류 모델 : HuggingFace BERT 다국어, 한국어 토크나이저로 구현 및 비교 55 딥러닝 텍스트 감성분석 분류 모델 : HuggingFace BERT 다국어, 한국어 토크나이저로 구현 및 비교에 대한 실습입니다. BERT 다국어 토크나이저로 텍스트 분류 모델 만들기 1. 학습용 데이터 생성 1) 데이터 전처리 2) BERT 다국어 토크나이저 : 토큰화 3) 한 개 리뷰 길이를 맞추기 위해, max_length 확인 4) encode... 2024.05.08 blazetechnote.tistory.com Blaze’s Tech Note 머신러닝 실습: 분류분석 연습2 12 이전 이론 포스팅을 참고해주세요. 로지스틱 회귀, 선형 판별 분석, K-최근접 이웃 분석 등 다양한 분류 모델에 대해 자세히 다루었습니다. 2024.03.01 - [분류 전체보기] - 머신러닝 이론 분류모델: 로지스틱 회귀, 선형 판별 분석, k-최근접 이웃 분석 이번 포스팅에서는 본격적으로 모델 학습과 평가를 진행해보도록... 인공지능 데이터분석 데이터과학 로지스틱회귀 선형판별분석 분류모델 하이퍼파라미터최적화 머신러닝실습 k최근접이웃 학습모델평가 2024.03.03 머신러닝 실습: 분류분석 연습1 머신러닝 이론 분류모델: 로지스틱 회귀, 선형 판별 분석, k-최근접 이웃 분석 doodlie.tistory.com 태어난김에 데이터일주 [ADsP] 데이터마이닝 - 분류분석 (로지스틱회귀, 의사결정나무) + R코드 실습 로지스틱 회귀분석 (Logistic Regression) 종속변수가 범주형인 경우 사용 이항변수(0,1)로 되어 있는 이항분류 (e.g. 사망/생존, 실패/성공) 확률 (0~1) → odds (0~∞) → log odds (-∞~+∞) → sigmoid (연속형 0~1) 일반 선형회귀 -> x값의 변화에 따른 y 값의 변화 로지스틱 회귀 -> y가 성공일 확률에 대한 것을 선형 모델로 알아내는 것 구분 일반 선형회귀 (Linear Regression) 로지스틱 회귀 종속변수 (DV) 연속형 0,1 (범주형) 모형탐색방법 최소제곱법 (LSM) 최대우도법(MLE), 가중최소제곱법 R코드로 알아보는 로지스틱 회귀 *사용함수: glm(종속변수 ~ 독리변수1+...+독립변수k, family=binomial, data=데이터셋명) data(iris) a<-iris[iris$Species=="setosa"|iris$Species=="versicolor",] b<-glm(Species ~ Sepal.Length, data=a, family=binomial) #종속변수 species, 독립변수 sepal.length summary(b) coef(b) exp(coef(b))['Sepal.Length'] 프로그램 결과 분석_ Sepal.Length가 1 의사결정나무의 결정규칙 분리 규칙 (splitting rule)- 데이터 나누기 분리기준 (Splitting Criterion) - 새로운 가지를 만들 때 기준을 어떻게 정할까? 정보 이득 (Information Gain)은 분할 후 불확실성의 감소를 나타냄 지니지수, 엔트로피 지수는 분할 후 클래스의 불순도를 측정 불확실성 down, 불순도 down, 순수도 up 하는 방향으로 분리 정지 규칙 (Stopping rule) - 트리 생성 중지하기 (분할 끝) 과대적합을 방지함 e.g. tree의 최대 깊이가 일정 수준 이상되면 stop e.g 불순도 측정 지표 1) 지니지수 (Gini index) - 값이 작을수록 순수도가 높음 (=분류 잘 됨) 지니지수 = 1 - ((각 범주별 데이터 수 / 전체 데이터 수)의 제곱의 합) e.g. 원본데이터 ●■■■인 경우, 지니지수 = 1-((1/4)^2 + (3/4)^2) = 0.375 *그림을 보고 지니 지수 구하는 방법 알아야함 2) 엔트로피지수 (Entropy measure) - 가장 작은 값을 갖는 방법 선택 (= 순수도 높음) 확률이 1/2인 경우, entropy = 1이며 불순도가 가장 높은 상태 엔트로피지수 = - (각범주별 확률값 의사결정나무의 알고리즘 *하향식 접근 방법을 이용 알고리즘 종속변수 (분류나무) 종속변수 (회귀나무) CART (Classification and Regression Tree) 지니지수 분산 감소량 C5.0 엔트로피 지수 CHAID (Chi-squared Automatic Interaction Detection) 카이제곱 통계량 (또는 p-val) ANOVA F-통계량 (또는 p-val) 작을수록 순수도 up: 지니지수, 엔트로피지수, 카이제곱통계량의 p-val, ANOVA F-통계량의 p-val 클수록 순수도 up: 분산 감소량, 카이제곱 R코드로 알아보는 의사결정나무 *시험에서 이 R코드실습은 중요하지 않음 library(party) idx <- sample(2, nrow(iris), replace = TRUE, prob = c(0.7, 0.3)) train.data <- iris[idx==1,] #70%는 학습용 데이터 test.data <- iris[idx==2,] #30%는 테스트데이터 iris.tree <- ctree(Species~., data=train.data) plot(iris.tree, type = "simple") #모형생성 10 종속변수가 범주형인 경우 사용 이항변수(0,1)로 되어 있는 이항분류 (e.g. 사망/생존, 실패/성공) 확률 (0~1) → odds (0~∞) → log odds (-∞~+∞) → sigmoid (연속형 0~1) 일반 선형회귀 -> x값의 변화에 따른 y 값의 변화 로지스틱 회귀 -> y가 성공일 확률에 대한 것을 선형 모델로 알아내는 것 구분 일반 선형회귀 (Linear Regression) 로지스틱 회귀 종속변수 (DV) 연속형 0,1 (범주형) 모형탐색방법 최소제곱법 (LSM) 최대우도법(MLE), 가중최소제곱법 decision tree ADsP 로지스틱회귀 분류분석 지니지수 의사결정나무 ADsP 기출 ADsP 3과목 엔트로피지수 ADsP 분류분석 2024.02.18 통합웹 더보기
서비스 안내 스토리의 글을 대상으로 검색결과를 제공합니다. 자세히보기 경민 커리어 분야 크리에이터 분류 분석, 무엇을 선택할까 또는 특정 고객이 우리에게 가치있는 고객인지 아니면 체리피커인지 구분하는 것 등이 대표적입니다. 비즈니스 분석 및 머신러닝에서 이것을 분류 Classification 문제라고 말한다. 혹 데이터 분석 경진대회인 캐글 튜토리얼을 경험한 사람이라면, '타이타닉의 생존자 구별' 문제를 봤을 것이다. 이런 구별 문제가 바로... 브런치북 오늘도 비즈니스 분석가 분석 분류 비즈니스 2023.10.11 브런치스토리 검색 더보기 story.kakao.com 번객 번객 - 카카오스토리 이 책은 AI의 학습과 인지 방법에 의한 문제를 다루고 있지만, 실상 AI의 학습은 인간이 수집, 분석, 추출, 분류한 데이터에 의해 이루어지므로 AI의 사고방식(?)은, 곧 AI를 가르친 인간의 사고방식으로 간주... 2024.06.01 카카오스토리 검색 더보기 커리어 크리에이터 보기
NCBI www.ncbi.nlm.nih.gov 미국 국립생물공학정보센터. 소개, 자원, 화학, 데이터, 소프트웨어, DNA, RNA, 구조물, 유전자, 게놈, 단백질, 서열 분석, 분류, 교육, 자습서, 변화, 검색 제공. 중앙관세분석소 www.customs.go.kr/cclss/ 경상남도 진주시 동진로 위치. 관세분석, 품목분류, 마약류, 건강위해물품 정보, 검색서비스 제공. 전화고객센터: 055-792-7312 장소 선박매매 전세계 선박거래 빅 데이터 보유 ebinc1004.tistory.com/ 신청자 작성 티스토리 선박매매의 빅 데이타를 수집 분류 분석의 과정을 거쳐서 48시간안에 선박구매를 하려는 전 사이트 더보기
이미지
쇼핑
사이트
같이가치
- 어르신께 시원한 바람(hope)을 선물해드릴게요!
의미하는 것입니다. 실제로 뉴스타파가 1997년부터 2018년 통계청 사망원인 통계를 분석한 결과 매년 7월~8월 사망한 국민 중 사망원인이 온열 질환으로 분류된 인원은 모두 627명으로 나타났습니다. 이 중에서도 60%에 해당하는 385명
강남구립논현노인종합복지관 달성률 모금완료 총 모금액 1,230,700원 - 희망의 날개를 달아줄 '계절 영양 특식'
으로 분류한다고 합니다. 고령층은 코로나19 기저질환인 고혈압, 당뇨, 심혈관질환, 호흡기질환 등을 앓고 있는 경우가 많아 사망 위험률이 증가하기 때문이라고 하는데요. [기사]"코로나19 사망자 99% 기저 질환자…. 보건당국 고혈압, 당뇨
성민재가노인복지센터 달성률 모금완료 총 모금액 3,547,900원