검색 본문
서비스 안내 Kakao가 운영하는 책 서비스 입니다. 다른 사이트 더보기 Mining 저자 Australian ... 출간 2021.1.1. Introduction to Data Mining 저자 Pang-Ning T... 출간 2016.9.13. 도서 30,000원 Mining the Social Web 저자 Matthew Rus... 출간 2013.10.29. 도서 23,120원 Text Mining with R 저자 Silge Julia 출간 2017.6.30. 도서 20,000원 Data Mining 저자 Witten Ian ... 출간 2011.2.18. 도서 15,000원 Tech Mining 저자 Porter Alan... 출간 2004.11.4. 도서 148,890원 Mining in Africa 저자 Chuhan-pole... 출간 2017.2.14. Data Mining 저자 차루 아가르왈 출간 2016.10.9. 도서 111,760원 Temporal Data Mining 저자 Theophano M... 출간 2010.12.1. 도서 116,020원 Data Mining 2/E: Concepts and Techniques 저자 Han Jiawei 출간 2021.1.1. 도서 35,000원 더보기 (주)카카오는 상품판매의 당사자가 아닙니다.법적고지 안내 (주)카카오는 통신판매중개자로서 통신판매의 당사자가 아니며 상품의 주문 배송 및 환불 등과 관련한 의무와 책임은 각 판매자에게 있습니다.
jyols.tistory.com DogFootRuler 자연어 처리(Text Mining) 1. 자연어 처리 자연어 처리는 인간이 사용하는 언어를 컴퓨터가 이해하고 처리할 수 있도록 하는 기술이다. 이를 위해서는 컴퓨터가 자연어를 이해하고 분석하는 기술이 필요하다. 이러한 기술은 기계학습과 딥러닝과 같은 인공지능 기술의 발전과 함께 지속적으로 발전해왔다. 자연어 처리 기술은 자연어 이해, 자연어 생성, 자연어 분석 등으로 구성된다. 자연어 처리 기술은 다양한 분야에서 활용된다. 예를 들어, 검색 엔진에서 검색어와 검색 대상 문서를 자연어 처리하여 가장 적합한 검색 결과를 제공하거나, 기계 번역에서는 다른 언어의... 2. 형태소 분석(Stemming) 2-1. 형태소 분석 한국어는 명사 뒤에 조사, 동사 뒤에 어미(예: -다)가 붙는다. 명사나 동사와 같은 단어로 분석을 하려면 이러한 조사나 어미를 떼어내야 한다. 이를 위한 과정을 형태소 분석이라고 하며, 형태소(morpheme)란 언어에서 의미가 있는 가장 작은 단위를 의미한다. 형태소 분석을 해주는 소프트웨어를 형태소 분석기라고 하는데, 공개된 형태소 분석기에는 한나눔, 꼬꼬마, 코모란, 트위터 4가지가 있다. 이들은 모두 한국어 문법 규칙을 바탕으로 형태소 분석을 한다. 일본에서 만든 mecab은 기계학습을 통한 형태소 분 3. 카운트 기반 단어 표현 3-1. Bag of Words(BoW) Bag of Words는 단어들의 순서를 고려하지 않고, 단어들의 출현 빈도에만 집중하여 텍스트 데이터를 수치화하는 방법이다. 직역하면, 단어들의 가방이라는 의미를 가지고 있다. 가방 안에는 특정 텍스트 문서 내에서 등장한 모든 단어들이 들어간다. 가방을 흔들어 단어들을 섞으면, 해당 문서 내에서 특정 단어가 N번 등장했다면, 가방 안에는 그 단어가 N개 있게 된다. 이렇게 되면 단어의 순서는 더 이상 중요하지 않다. 3-2. 문서 단어 행렬(Document-Term Matrix, DTM) 4. 유사도 분석 4-1. 코사인 유사도(Cosine Similarity) 코사인 유사도는 두 벡터 간의 코사인 각도를 이용하여 구할 수 있는 두 벡터의 유사도를 의미한다. 두 벡터의 방향이 완전히 동일한 경우에는 1의 값을 가지며, 90°의 각을 이루면 0, 180°로 반대의 방향을 가지면 -1의 값을 갖게 된다. 즉, 결국 코사인 유사도는 -1 이상 1 이하의 값을 가지며 값이 1에 가까울수록 유사도가 높다고 판단할 수 있다. 이를 직관적으로 이해하면 두 벡터가 가리키는 방향이 얼마나 유사한가를 의미한다. 4-2. Word2Vec Word2Vec 35 자연어 처리는 인간이 사용하는 언어를 컴퓨터가 이해하고 처리할 수 있도록 하는 기술이다. 이를 위해서는 컴퓨터가 자연어를 이해하고 분석하는 기술이 필요하다. 이러한 기술은 기계학습과 딥러닝과 같은 인공지능 기술의 발전과 함께 지속적으로 발전해왔다. 자연어 처리 기술은 자연어 이해, 자연어 생성, 자연어 분석 등으로 구성된다. 자연어 처리 기술은 다양한 분야에서 활용된다. 예를 들어, 검색 엔진에서 검색어와 검색 대상 문서를 자연어 처리하여 가장 적합한 검색 결과를 제공하거나, 기계 번역에서는 다른 언어의... hannanum Kkma word2vec komoran 자연어 처리(Text Mining) 형태소 분석(Stemming) Bag of Words(BoW) 문서 단어 행렬(Document-Term Matrix DTM) TF-IDF(단어 빈도-역 문서 빈도 Term Frequency-Inverse Document Frequency) 코사인 유사도(Cosine Similarity) 2024.04.16 블로그 검색 더보기 namu.wiki Mining Simulator 2 - 나무위키 Rumble Studios에서 전작 Mining Simulator의 후속작으로 2022년 5월 5일 제작하였다. 전작 Bubble Gum Tower Defense가 흥행에 실패하였지만 이 작품은 꽤나 흥행하는듯 하다. 제작자 Rumble Studios 제작날짜 2022년 5월 6일 최근업데이트날짜 2023년 7월 22일 장르 전체 장르 개요 특징 오버 월드 사이버 갤럭시 상점 팁 코드 시즌패스 2023.08.16 웹문서 검색 더보기 Space Mining Tycoon - 나무위키 Mining simulator - 나무위키 blog.naver.com MVL_JJOA (the SPECTRUM world's story) mining SOLBUNNY & VISOL 24 Alerts Date Type Price(USD) Price(SOL) SOLBUNNY... SOL Total(USD) Txn SOLBUNNY Community SOLBUNNY/SOL DEX Pair P... coinmarketcap.com Step 1 ; mining SOLBUNNY ▶ Sign up(Register) → Enter email verification code → Input user profile ▶ Follow MVL official X and capture it ← Mandatory mission... 2024.04.16 solve-my-curiosity.tistory.com solve-my-curiosity Frequent Pattern Mining 6 12 MaxPattern 복습 - 맥스패턴은 어떤 패턴이 FP이면서 그것보다 큰 Frequent SuperSet이 없는 경우 그 패턴을 MaxPattern이라고한다. Frequent인 패턴에 관해서기 때문에 무조건 min_sup을 넘어야 하고 subset과 비교해서 support가 작아도 상관없다. min_sup만 넘으면 된다. MaxMiner : max pattern을 생성하는 알고리즘... Ai ML Datamining dadtascience 2024.04.20 Frequent Pattern Mining 3 Frequent Pattern Mining 5 beige00.tistory.com Beige Color 데이터 과학 - 10. Association Rule Mining 14 set U가 있다고 가정하자. 이 U의 subset들을 itemset I라고 정의하고, |I| = k일 시, k-Itemset이라고 부를 수 있다고 하자. 이 때 Association Rule Mining에서 관심이 있는 ItemSet들의 집합을 S라고 하자. S의 각 itemset들을 Transaction T라고 정의하면 결론적으로 itemset I의 Support는 다음과 같이 정의된다... 데이터 과학 2024.04.24 데이터 과학 - 4. Data Mining/Science Algorithms 통합웹 더보기
서비스 안내 스토리의 글을 대상으로 검색결과를 제공합니다. 자세히보기 coding-saving-012.tistory.com 갱스터의 블로그 [데과/DS] Data Mining/Science Algorithms Modeling Process regression 모델링을 하기 위한 과정은 아래와 같다. 1. Choose a model (모델 정하기) 2. Choose a loss function (loss 함수 정의하기) 3. Fit the modle (모델을 학습시켜 최적의 파라미터를 구하기) 4. Evaluate model performance (모델의 성능 평가하기) 이제 각 과정에 대해 자세히 알아보자. 1. Choose a mode Simple Linear Regression(SLR)은 parametric model이다. 즉, 데이터를 기반으로 하여 입력과 출력 사이의 관계를 가장 잘 표현할 수 있는 θ를 찾는 모델이다. 보통 이러한 입력과 출력 사이의 관계는 non-linear한 경우가 더 많다. 하지만 실질적으로 우리가 가장 이해하기 쉬운 형태는 결국 linear한 형태이고, linear한 모델도 충분히 입력과 출력 사이의 관계를 잘 표현할 수 있기 때문에 자주 사용된다고 한다. 2. Choose a loss function 다음으로는 loss function을 정의해야 한다. 이때, Loss function이란 우리가 예측한 값이 실제 값과 얼마나 떨어져 있는지를 나타내는 metric으로 예측값이 실제값과 가까울 수록 그 값이 작아진다. 일종의 penalty를 준다고도 표현하는데, 이러한 penalty 값을 minimize하는 방향으로 우리는 모델의 최적화를 진행할 수 있다. 이러한 loss function에는 다양한 종류가 존재하는데, loss function을 어떤 task에 적용을 하는지에 따라 영향을 끼치고 loss function에 대한 계산 3. Fit the modle - Minimizing MSE 그렇다면 우리는 MSE를 최소화하기 위해 어떤 방법을 사용할 수 있을까? 바로 도함수를 사용하는 것이다. 위 사진과 같이 best 값을 찾기 위해 도함수를 0으로 세팅할 수 있다. 우리는 θ0와 θ1에 대해 위와 같이 값을 구할 수 있다. 그런데, 이 경우와 달리 한 번에 결과값이 나오지 않는 경우도 있는데, 이러한 경우 gradient descent(경사하강법)을 사용하여 최적의 θ를 찾을 수 있다. 4. Evaluate model performance 주어진 트레이닝 데이터를 통해 θ값을 계산하여 최소값일 때의 θ0과 θ1을 찾았다는 것은 loss function을 최소화했다는 의미로 우리가 원하는 모델을 얻은 것이다. 그러면 우리는 모델을 최종적으로 평가해야 한다. 모델을 평가하는 방법은 아래와 같다. Visualize data and compute statistics(데이터 시각화 및 통계 계산) 첫 번째 방법은 데이터를 그려보는 것이다. plot을 그려서 decision boundary 같은 것을 표현할 수 있는지, 확인할 수 있다. 또는 mean(평균)이나 standard 18 regression 모델링을 하기 위한 과정은 아래와 같다. 1. Choose a model (모델 정하기) 2. Choose a loss function (loss 함수 정의하기) 3. Fit the modle (모델을 학습시켜 최적의 파라미터를 구하기) 4. Evaluate model performance (모델의 성능 평가하기) 이제 각 과정에 대해 자세히 알아보자. 2024.04.28 티스토리 검색 더보기 brunch.co.kr 적호 #27. 다시 도제식 교육? 11 그 대상과 비교 분석을 통해 장점을 따라 하고 배우는 행위를 말합니다. 미국 사람들은 단어를 참 잘 만듭니다. 빅데이터 분야에는 예전에 데이터마이닝(datamining)이라는 용어가 있었습니다. 데이터를 광산에서 석탄을 캐듯이 데이터 서버에서 필요한 데이터를 발굴한다는 의미였다고 합니다. 자고로 역사에서... 브런치북 교육 잡설 교육 2024.05.06 브런치스토리 검색 더보기 story.kakao.com Giant Giant - 카카오스토리 on the 15th [Seoul Economic Daily] A businesswoman who became a billionaire in Australia's mining industry has demanded that the National Gallery of Australia remove a portrait of herself, but she... 22시간전 카카오스토리 검색 더보기
서비스 안내 Melon Company가 운영하는 음악 서비스입니다. 다른 사이트 더보기 Mining 5gawa (오가와) 앨범 AIY 2024.02.21. Mining Dan Landrum & Stephen Humphries 앨범 Landrum Hum... 2006.01.01. Mining Mika Vainio 앨범 Life (...It... 2011.08.15. Mining Marx 앨범 Been Writing 2013.03.09. Mining Positive Merge 앨범 Armageddon ... 2015.09.09. Mining Gleaming Spires 앨범 Walk on Wel... 2021.09.17. Mining Bedtime Beats 앨범 Beats to mi... 2023.07.19. Mining Quovis 앨범 Industrial ... 2012.02.10. Mining Octopus Star 앨범 It's Shady 2018.05.02. Mining OLO Worms 앨범 Escapes 2013.05.01. Mining Gedevaan 앨범 Undone, Unm... 2016.10.10. Mining Ching Chong Song 앨범 We Sing Son... 2011.04.01. MINING 무브 (MOOB) 앨범 크립토 월드 (CRY... 2023.01.10. Mining Hannah Barnett 앨범 Mining 2019.10.25. Mining Ekvsiani 앨범 Stress 2019.05.19. Mining (BTC) Fogh Depot 앨범 Fogh Depot 2015.02.27. Mining Sleepy Disco 앨범 Sleepy Disco 2017.08.24. Mining Ole Ole 앨범 Twilight Ep 2014.03.21. Mining (Original Mix) Ole Ole 앨범 Darkbeatz, ... 2017.03.17. Mining Ole Ole 앨범 Darkside Tr... 2014.09.01. 더보기
MINING www.mining.com/ 캐나다 광산 신문, 뉴스, 시장 자료, 업체, 광물, 장비 정보 제공. Mining Pool Hub miningpoolhub.com/ 마이닝 풀 허브, 가상화폐 채굴방법 안내. BI Mining bi-mining.org 신청자 작성 작업, 엑셀 그래프 편환, 무료 PPT, 마케팅 데이터 분석, 무료 차트 변환, 보고서 착성, 업무 지원 보조 시스템. 사이트 더보기