검색 본문
서비스 안내 Kakao가 운영하는 책 서비스 입니다. 다른 사이트 더보기 가장 인간적인 인간 저자 브라이언 크리스찬 출간 2012.6.18. 도서 14,400원 Teacher Talk : What It Really Means 저자 칙 무어만, Moor... 출간 1989.11.1. 도서 15,880원 She Means Business 저자 Green Carrie 출간 2017.3.7. 도서 21,690원 No Means No! 저자 Sanders 출간 2015.3.28. 도서 11,180원 War by Other Means 저자 Blackwill R... 출간 2017.10.23. 도서 22,370원 Reality by Other Means 저자 제임스 모로 출간 2015.11.3. 도서 34,230원 War by Other Means 저자 Blackwill R... 도서 33,590원 War by Other Means 저자 Blackwill R... 출간 2016.3.14. 도서 33,590원 By All Means Necessary 저자 Elizabeth C... 출간 2016.3.15. 도서 19,600원 Soft Power: The Means to Success in World Politics 저자 Nye Joseph 출간 2005.5.1. 도서 17,700원 더보기 (주)카카오는 상품판매의 당사자가 아닙니다.법적고지 안내 (주)카카오는 통신판매중개자로서 통신판매의 당사자가 아니며 상품의 주문 배송 및 환불 등과 관련한 의무와 책임은 각 판매자에게 있습니다.
ideadummy.tistory.com ideaDummy [Clustering] K-means++ clustering 구현해보기 서론 K-means clustering 포스트에서 말했지만, k-means clustering은 초기 중심점을 랜덤으로 잡았었다. [Clustering] K-means clustering 구현해보기 서론Clustering은 묶음으로 만들어버린다는 뜻이다.이때 뭘 묶어버리냐 하면, 관련있는 데이터들끼리 하나로 묶는다. 이름에 대해 이야기 해보자면 1. 몇개의 묶음으로 만들지에 대한 ideadummy.tistory.com K-means는 초기 중심점이 어디에 잡히는지에 따라 clustering 결과 차이가 많이 난다. 물론 최적의 결과가 K-means++의 아이디어 아이디어는 이렇다. 중심점들을 최대한 퍼뜨려 놓으면.. 잘된다! 왜 잘될까? 위키피디아의 suboptimal clustering 부분을 보면, 어느정도 이해가 된다. k-means++ - Wikipedia From Wikipedia, the free encyclopedia Algorithm in data mining In data mining, k-means++[1][2] is an algorithm for choosing the initial values (or "seeds") for the k-means clustering al 진행 과정 데이터들중에서 무작위로 하나 뽑는 것으로 시작한다. 그게 맨 처음 중심점이 되고, K개의 중심점을 찾을 때까지 다음 과정을 따른다. N($N < K$)개의 중심점을 찾았다고 가정하자. 1. 모든 데이터들과 N개의 중심점들간의 거리를 모두 구한다. 2. 각 데이터에 대해 가장 가까운 중심점과의 거리를 찾는다. 3. 2번 과정에서 찾은 거리들중에 가장 큰 값을 갖는 데이터가 새로운 중심점이 된다. 4. 1~3번 과정을 $N==K$ 가 될때까지 진행한다. 이를 시각화 한 유튜브 영상이 있어 소개한다. 위 과정을 시각화한 영상 이제 이걸 생각보다 퍼져있지는 않은데요? 중심값 생성 시, 맨 처음 랜덤으로 뽑은 데이터가 어디에 위치하는 지가 최종적인 결과에 영향을 많이 주기 때문이다. 이는 연속적으로 다음 중심점, 그 다음 중심점의 위치까지 결정하기 때문에 영향이 클 수 밖에 없다. 그러나 이것을 고려해도, 최종적으로 골라진 중심점들은 최대한 멀리 떨어져있음을 알 수 있다. 9 아이디어는 이렇다. 중심점들을 최대한 퍼뜨려 놓으면.. 잘된다! 왜 잘될까? 위키피디아의 suboptimal clustering 부분을 보면, 어느정도 이해가 된다. k-means++ - Wikipedia From Wikipedia, the free encyclopedia Algorithm in data mining In data mining, k-means++[1][2] is an algorithm for choosing the initial values (or "seeds") for the k-means clustering al 2024.05.12 블로그 검색 더보기 [Clustering] K-means clustering 구현해보기 hani08.tistory.com han's story K-Means Clustering - 개념 + WCSS 17 supervised는 y가 있었지만 unsupervised는 y가 없다 Clustering은 그룹화가 목적에 있다 왼쪽같은 데이터들이 있을때 K-Means를 통해 3개의 그룹으로 나눌 수 있다 그리고 새로운 데이터가 들어왔을때 근접한 곳의 데이터로 들어가는것도 당연히 가능하겠다 그렇다면 어떻게 그룹이 나누어질까 우선 K-Means의 뜻부터... 2024.04.15 datananalysis.tistory.com 데이터 분석 공부하려고 만든 블로그 [240404] 클러스터링 분석 - ④ K-means 군집화 1. K-means 군집화 (K-means Clustering) 1) 정의 - Centroid라는 중심점과의 평균 거리를 활용해 K개 군집을 만드는 방법 - 대표적인 분리형 군집화 방법 중 하나 └ 계층적 군집화와 달리, 전체 데이터의 구간을 나누어 클러스터를 만드는 방법 └ 모든 데이터 포인트는 하나의 클러스터에만 속할 수 있음 - Python Scikit-Learn에 구현된 K-means 알고리즘은 유클리디언 거리 기반 출처 - https://towardsdatascience.com/the-5-clustering-algorithms-data-scientists-need-to-know-a36 2. 클러스터링 결과 평가 1) 실루엣 계수 (Silhouette coefficient) - 클러스터링 결과의 타당성을 평가하는 데 자주 사용되는 지표 - 클러스터 내 거리(compactness)는 가깝고, 클러스터 간 거리(separation)는 멀수록 높은 점수 - 클러스터 개수로 설정한 K값이 적절한지를 알아보는 데 도움을 줌 출처 - https://www.researchgate.net/figure/Silhouette-coefficient-example_fig2_272017073 2) 실루엣 계수 계산 방법 출처 - https://dashee87.gi 3. K-means 응용 1) K-means ++ ① K-means 초기 Centroid의 중요성 출처 - https://www.geeksforgeeks.org/ml-k-means-algorithm/ - 문제: 초기 Centroid가 데이터 분포를 무시한 채 할당되면 좋지 않은 클러스터링 결과가 나올 수 있음 └ K-means 알고리즘의 수렴 조건은 Centroid가 변하지 않을 때이므로 초기 Centroid에 영향을 많이 받는 것 - 해결책 1: 최대한 여러 번 K-means를 실행해보는 것 └ Centroid가 적당한 곳에 위치하면 수렴되는 Centr 8 1) 정의 - Centroid라는 중심점과의 평균 거리를 활용해 K개 군집을 만드는 방법 - 대표적인 분리형 군집화 방법 중 하나 └ 계층적 군집화와 달리, 전체 데이터의 구간을 나누어 클러스터를 만드는 방법 └ 모든 데이터 포인트는 하나의 클러스터에만 속할 수 있음 - Python Scikit-Learn에 구현된 K-means 알고리즘은 유클리디언 거리 기반 출처 - https://towardsdatascience.com/the-5-clustering-algorithms-data-scientists-need-to-know-a36 2024.04.04 [240405] 클러스터링 분석 - ④ K-means 군집화 (실습) datapilots.tistory.com DataPilots K-Means Clustering 알고리즘 핵심 아이디어 할당 단계(cluster assignment step) : K 개의 클러스터를 할당 업데이트 단계(move centroid step) : 각 클러스터의 중심을 이동 작동 단계 1. 클러스터(k)의 개수에 따라 무작위로 중심점을 정한다. 2. 데이터 포인트 마다 가장 가까운 중심점을 찾아 해당 클러스터로 분류한다. 3. 데이터가 클러스터로 분류될 때마다, 클러스터의 중심을 업데이트 한다. 4. 2,3 번 과정을 반복한 후, 중심점이 변화가 없고 수렴할 경우 알고리즘을 종료한다 알고리즘 설계 1. 입력값 def k_means_clustering(data, k, max_iterations=100): - data : 데이터 - k : 클러스터 개수 - max_iterations : 최대 반복 횟수 2. 반복문 - 할당 단계(Assignment) - 각 데이터 포인트를 가장 가까운 중심에 할당 - clusters: 클러스터 할당을 저장할 리스트 초기화 - 각 데이터 포인트에 대해 모든 중심까지의 거리를 계산(유클리드 거리 기반)하고, 가장 가까운 중심의 인덱스를 찾아 해당 클러스터에 데이터 포인트를 추가- 업 전체 코드 import numpy as np def k_means_clustering(data, k, max_iterations=100): # 초기 중심 설정 centroids = data[np.random.choice(data.shape[0], k, replace=False)] # 임의의 k개 데이터 포인트를 중심으로 선택 for _ in range(max_iterations): # 할당 단계: 각 데이터 포인트를 가장 가까운 중심에 할당 clusters = [[] for _ i 적용 %matplotlib inline from sklearn.datasets import make_moons import matplotlib.pyplot as plt import numpy as np import random sklearn 에서 제공하는 데이터셋 생성 함수를 이용해서 k-means 클러스터링을 수행하고 시각화해본다. # make_moons 데이터셋 생성 X, _ = make_moons(n_samples=200, noise=0.1, random_state=19) # k 개수 설정 k = 2 # 클러스터링 수행 centr 2 1. 입력값 def k_means_clustering(data, k, max_iterations=100): - data : 데이터 - k : 클러스터 개수 - max_iterations : 최대 반복 횟수 2. 반복문 - 할당 단계(Assignment) - 각 데이터 포인트를 가장 가까운 중심에 할당 - clusters: 클러스터 할당을 저장할 리스트 초기화 - 각 데이터 포인트에 대해 모든 중심까지의 거리를 계산(유클리드 거리 기반)하고, 가장 가까운 중심의 인덱스를 찾아 해당 클러스터에 데이터 포인트를 추가- 업 kmeans kmeans++ 2024.05.11 v.daum.net Muezli Muezli 매주 화요일 목요일, 팝송 속 다양한 영어 표현을 뮤즐리와 함께 씹어 먹어보아요! 2023.11.23 By All Means 와 By Any Means 의 차이 - 콘텐츠뷰 2024.04.09 On the down low 는 무슨 뜻? - 콘텐츠뷰 ben8169.tistory.com 일단 테크블로그😊 [AI/ML] Clustering과 K-means 알고리즘(+Elbow Method, Silhouette Analysis) 정리! 1. Clustering 개념 A. 거리 함수 Clustering(군집화)란, 주어진 데이터를 특성에 따라 일정 군집(Cluster)으로 나누는, 정답값(label)이 주어지지 않는 대표적인 비지도학습 방식이다. 이때, 비슷하거나 가까운 데이터는 같은 군집에 속하게 하기 위해서, Clustering 간에는 "비슷하거나", "가까운" 것에 대한 정량적 정의가 '거리 함수(Distance Function)'에 의해 정의된다. 쉽게 말해서, 데이터 간에 어떻게 가까운 것을 가깝다고 할 지에 대해 정의해 주어야 한다는 것이다. 이를 위해, 주어진 데이터를 Data Po 1. K-means Clustering 이제 대표적인 (Flat) Clustering 알고리즘인 K-means 알고리즘에 대해 알아보자. K-means 알고리즘은 오직 Numeric Data에서만 작동하며, K-means의 최종 목표는 'Cluster Center(Cluster 내 데이터의 평균값)와 각 데이터 간의 Average Squared Euclidean distance(데이터의 위치를 벡터라고 했을 때 종점 간 거리)를 최소화'하는 것이다. (이를 minimizing Inertia라고도 한다.) Average Squared Euclidean distance. 두 2. 정리 이렇게 Clustering의 종류를 구별하는 중요한 개념들을 학습하였고, K-means 알고리즘과 최적의 K값을 찾는 방법까지 알아보았다. 다음 포스팅에서는 실제 코드로 K-means 알고리즘을 구현해보고, Elbow Method와 Silhouette Analysis plot을 그려보며 K값을 찾아보는 실습을 해 보도록 하겠다! 🌼N줄 요약🌼1. Clustering이란, 라벨링 되지 않은 데이터셋을 통해, 비슷한 특징의 데이터끼리 군집화하는 비지도학습의 대표적 예시2. 거리 함수를 통해 수치 데이터간 유사도를 파악 3. Soft C 11 이제 대표적인 (Flat) Clustering 알고리즘인 K-means 알고리즘에 대해 알아보자. K-means 알고리즘은 오직 Numeric Data에서만 작동하며, K-means의 최종 목표는 'Cluster Center(Cluster 내 데이터의 평균값)와 각 데이터 간의 Average Squared Euclidean distance(데이터의 위치를 벡터라고 했을 때 종점 간 거리)를 최소화'하는 것이다. (이를 minimizing Inertia라고도 한다.) Average Squared Euclidean distance. 두 2024.04.27 통합웹 더보기
서비스 안내 스토리의 글을 대상으로 검색결과를 제공합니다. 자세히보기 SE HO 창작 분야 크리에이터 살짝 행복한 Prologue 17 ⓒ 양세호 All rights reserved. Used under authorization.No portion of this contents may be reproduced or transmitted in any form or by any means, without the express written permission of animal story, names, characters, places, andincidents featured in this public ation either are the product of... 브런치북 살짝 행복한 동물이야기2 그림 에세이 행복 2024.05.17 브런치스토리 검색 더보기 story.kakao.com EvT EvT - 카카오스토리 one of my nicknames to these truly remarkable people. It so happens that my surname literally means of the flowers (seriously, it does). And my first name actually originates from the Ancient Greek... 2024.05.18 카카오스토리 검색 더보기 창작 크리에이터 보기
No Means No Worldwide www.nomeansnoworldwide.org/ 세계 성폭력 예방 단체. 단체 소개, 성교육 프로그램, 연구자료, 문의. no means no blog.naver.com/mnene 신청자 작성 네이버 블로그 애견미용실. 돌봄, 호텔, 미용. 전화고객센터: 010-6834-8090 장소 No Means No Worldwide 페이스북 www.facebook.com/NOmeansNOworldwide/ 세계 성폭력 예방 단체 No Means No Worldwide 페이스북. 글, 사진, 동영상 제공. 사이트 더보기
서비스 안내 Melon Company가 운영하는 음악 서비스입니다. 다른 사이트 더보기 The Back Way Home Mean's 앨범 The Means 2017.08.26. Do Not Worry About The Sky The Means 앨범 Black Dabli... 2008.09.05. Grey Skies Above A Beautiful Garden The Means 앨범 The Rain Is... 2008.09.05. Heartbeat (Feat. Hone Be Good) Esther Stephens 외 2명 앨범 Heartbeat 2014.11.25. Can't Be Done Mean's 앨범 The Means 2017.08.26. Undercover Sends Flyer The Means 앨범 The Rain Is... 2008.09.05. Bang, You're Dead The Means 앨범 Black Dabli... 2008.09.05. I'm Not Your Saviour The Means 앨범 Black Dabli... 2008.09.05. Dreams About The Dead The Means 앨범 Black Dabli... 2008.09.05. Finally R'n'R The Means 앨범 Black Dabli... 2008.09.05. That Same Old Story (Bonus Live) Mean's 앨범 The Means 2017.08.26. Ascent of the Multi-Ball (The Means) Mean's 앨범 Hot Pinball... 2004.01.01. Bang, You're Dead The Means 앨범 The Rain Is... 2008.09.05. Insects Dancing In The Desert The Means 앨범 Black Dabli... 2008.09.05. Oval Flying Lamb The Means 앨범 Black Dabli... 2008.09.05. Cubicult Mean's 앨범 The Means 2017.08.26. Love And Hate The Means 앨범 The Rain Is... 2008.09.05. Dancing Hunter The Means 앨범 Black Dabli... 2008.09.05. The Situation Mean's 앨범 The Means 2017.08.26. We Are Left Right The Means 앨범 Black Dabli... 2008.09.05. 더보기