검색 본문
blog.joonas.io Joonas' Note 한국 노래 가사(1964~2023년) 데이터 분석해보기 배경 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노래 가사의 트렌드가 궁금해져서 한번 데이터를 분석해보기로 했다. 데이터는 멜론 연대별 TOP 100 차트로부터 제목/가수/가사 정도만 수집했고, 기억이 맞다면 약 8시간정도 걸렸다. 정말 영어가 많아졌는가? 마침 1964년부터 2023년까지 60년의 데이터가 쌓였고, 결론부터 말하자면 영어 비중은 많아졌다. 1964~2023년 연도별 한글/영어 가사 비율 2023년에 들어서는 영어 가사의 비중이 25% 를 넘을 정도로 많아졌고, 최근에 사람들이 이런 사실을 체감하는 이유는 2011년 이후로 10년만에 영어 비율이 더 커지고 있기 때문으로 보인다. 영어 비중은 2008~2012년 사이에 잠시 상승하고 그 뒤로는 오히려 줄어들더니, 2018년부터 다시 상승한다.2018년에는 BTS가 FAKE LOVE로 빌보드 TOP 10에 처음으로 진입 한국어 가사 분석 형태소 분석기 선택 한국어 형태소 분석에는 여러 라이브러리가 있는데, 처음에 KoNLPy 로 해봤다가 자바 경로 설정 문제가 있어서 다른 걸 알아보던 중, Kiwi가 형용사나 보조 용언 쪽에서 품사 태그를 더 자세히 분류하고 API도 간단해보여서 중간에 Kiwi로 변경했다. (좌) KoNLPy 동사 추출, (우) Kiwi 동사 추출 여담으로 KIWI 개발자 블로그가 있길래 형태소 분석기가 어떤 원리로 개발되었는지 글이 있어서 읽어봤는데 무척 흥미로웠다.관심 있는 사람은 https://bab2min.tistory.com/560 글 국내 가요 내 영단어들 단수/복수형은 어느정도 처리된 것 같은데, 아무래도 apostrophe(')를 쓰는 단어들(don't/can't/I'm/You're/I'll/something's 등)은 아예 두 형태소로 분리되어 버려서 빈도 수로 봤을 때 의미를 해석하기 어려워졌다. 그리고 시제도 원형(going -> go)으로 확인해보려 했으나, 영어의 경우에는 의미를 유지하기 위해서 going 과 같은 변형들(동명사, 현재분사 등)은 그대로 두었다. 마찬가지로 wanna/gonna 도 그대로 두었다. 영어 단어별 빈도수 아래는 2020년도 Billboard 감정 분석 긍정/부정과 같은 감정 분석도 한번 해보고 싶은데, 글이 길어져서 별도의 글로 작성할 예정이다. 주제 분류 한국 가요(1964~2023)를 주제별로 모아보기 한국 노래 가사(1964~2023년) 데이터 분석해보기 배경 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노 blog.joonas.io 코드 GitHub - joonas-yoon/kpop-lyrics-analytics: 국내 가요 노랫말 분석 (1964~2023) 국내 가요 노랫말 분석 (1964~2023). Contribute to joonas-yoon/kpop-lyrics-analytics development by creating an account on GitHub. github.com 참고 From the dataisbeautiful community on Reddit: [OC] Word cloud made from the lyrics of every song that has hit the Billboard Hot Explore this post and more from the dataisbeautiful community www.reddit.com kiwipiepy API documentation (v0.16.2) Package kiwipiepy Kiwipiepy란? Kiwipiepy는 한국어 형태소 분석기인 Kiw 20 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노래 가사의 트렌드가 궁금해져서 한번 데이터를 분석해보기로 했다. 데이터는 멜론 연대별 TOP 100 차트로부터 제목/가수/가사 정도만 수집했고, 기억이 맞다면 약 8시간정도 걸렸다. 통계 NLP 한국노래 자연어 데이터분석 tf-idf 워드클라우드 pandas 가사분석 2024.01.26 블로그 검색 더보기 namu.wiki 駆け抜けるメドレーコラボレーションⅣ - 나무위키 중에서 가장 많이 등장한 곡은 총 12회 등장한 シオカラ節(시오카라부시)과 U.N.オーエンは彼女なのか...2월 19일 기준 이 문서가 제목이 일본어로 된 문서 중에서 두번째로 긴 문서이자 10만자를 넘은 문서이다... 개요 영상 설명 제작자 명단 카테고리 기타 순서 2024.06.05 웹문서 검색 더보기 사랑하기 때문에(노래) - 나무위키 기호(P1Harmony) - 나무위키 v.daum.net 롱블랙 유튜브 누적 950억 뷰 '더핑크퐁컴퍼니', 대박은 운이 아닌 이 전략 덕분. - 콘텐츠뷰 만든다고 해볼까요? 아이들이 좋아하는 동물 순위부터 조사했어요. 키워드 검색량이 높은 순대로 노래를 만들었죠. 그렇게 만든 20곡짜리 동물 동요 중 하나가 아기상어였어요.” 전 세계를 휩쓴 베이비... 2024.04.13 fmkorea.com "노래 언제끝나냐?" 러닝타임이 긴 노래들 - 힙합 - 에펨코리아 긴 노래들을 몇곡 소개해볼까 합니다. 러닝타임이 20분 언저리 이상 되는 곡들 중에서 개인적으로 인상깊게 들었던 곡들을 추려봤습니다. 말 그대로 개인적으로 인상깊게 들었던 곡들을 몇개만 추린거라 여러분들... 2024.05.17 전체보기 [추억]중2병과 에미넴 그리고 힙합 - 힙합 - 에펨코리아 주시긴 했다. Eminem - Insane I was born with a dick in my brain 난 뇌에 거시기가 박힌 채로 태어났지 Yea fucked in the head 그래, 말그대로 "머리에 강간당한" 채로 My step-father said that I sucked in... 몇 곡까지 알고 계신가요? Playlist 음악 추천 12편!! - 포텐 터짐 최신순 - 에펨코리아 ㅎ 제목에 몇 곡이나 알고 있냐고 해놓고는 치졸하게도 '헤헤 사람들이 많이 알았으면 좋겠다' 하는 곡을 항상 끼워팔고 있어요 곡 분위기도 Ph-1 스럽게 듣기 편하고 랩핑도 넋업샨 느낌으로 나름 쫀득해서 자주... 독서목욕 도서 분야 크리에이터 가곡 보리밭은 박화목 동시 옛 생각 날의 꿈을 키우며 살자는 애틋한 생각들이 있었다··· 나는 '보리밭'의 노래를 들을 적마다 피란살이 어려움 속에서라도 낭만을 잃지 않고 아름다운 이상의...수필집 「보리밭, 그 추억의 길목에서」(선경도서출판, 1972년) 중에서 한국전쟁의 폐허 속에서 탄생한 노랫말이네요. 절망과 고통 속에 허우적거리는 사람... 박화목 보리밭 옛생각 보리밭-사잇길로-걸어가면 2024.05.29 gall.dcinside.com mgallery nendoroid 간단나눔) 노래 한소절 추천 나눔내용 아주 간단함 자신이 좋아하는 한국노래 중에서 가장마음에 드는 가사 한두소절 적고 제목 그리고 링크 같이 댓글달면 끝 추첨이 아니고 내가 맘에들면 당첨임 중복일시엔 먼저 단사람 우선순위고 이상한... 2024.06.01 전체보기 사케에 노래중에 양민역사상 가장 긴 제목 그 노래 좃나 좋던디 제목은 당근 몰 겄다만 (긴글주의) 10화 리뷰 - 소실점 (2) 네 노래로 우리 붙었다!!'라고 기뻐서 외치며 선재를 향해 절을 하고 있어. 이 장면이 과연 솔이의 슬픔에 찬물을 끼얹는 장면인 걸까? 난 그렇지 않다고 생각했어. 이클립스가 오디션의 전 단계에 합격하고 지역... 통합웹 더보기