검색 본문
blog.joonas.io Joonas' Note 한국 노래 가사(1964~2023년) 데이터 분석해보기 배경 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노래 가사의 트렌드가 궁금해져서 한번 데이터를 분석해보기로 했다. 데이터는 멜론 연대별 TOP 100 차트로부터 제목/가수/가사 정도만 수집했고, 기억이 맞다면 약 8시간정도 걸렸다. 정말 영어가 많아졌는가? 마침 1964년부터 2023년까지 60년의 데이터가 쌓였고, 결론부터 말하자면 영어 비중은 많아졌다. 1964~2023년 연도별 한글/영어 가사 비율 2023년에 들어서는 영어 가사의 비중이 25% 를 넘을 정도로 많아졌고, 최근에 사람들이 이런 사실을 체감하는 이유는 2011년 이후로 10년만에 영어 비율이 더 커지고 있기 때문으로 보인다. 영어 비중은 2008~2012년 사이에 잠시 상승하고 그 뒤로는 오히려 줄어들더니, 2018년부터 다시 상승한다.2018년에는 BTS가 FAKE LOVE로 빌보드 TOP 10에 처음으로 진입 한국어 가사 분석 형태소 분석기 선택 한국어 형태소 분석에는 여러 라이브러리가 있는데, 처음에 KoNLPy 로 해봤다가 자바 경로 설정 문제가 있어서 다른 걸 알아보던 중, Kiwi가 형용사나 보조 용언 쪽에서 품사 태그를 더 자세히 분류하고 API도 간단해보여서 중간에 Kiwi로 변경했다. (좌) KoNLPy 동사 추출, (우) Kiwi 동사 추출 여담으로 KIWI 개발자 블로그가 있길래 형태소 분석기가 어떤 원리로 개발되었는지 글이 있어서 읽어봤는데 무척 흥미로웠다.관심 있는 사람은 https://bab2min.tistory.com/560 글 국내 가요 내 영단어들 단수/복수형은 어느정도 처리된 것 같은데, 아무래도 apostrophe(')를 쓰는 단어들(don't/can't/I'm/You're/I'll/something's 등)은 아예 두 형태소로 분리되어 버려서 빈도 수로 봤을 때 의미를 해석하기 어려워졌다. 그리고 시제도 원형(going -> go)으로 확인해보려 했으나, 영어의 경우에는 의미를 유지하기 위해서 going 과 같은 변형들(동명사, 현재분사 등)은 그대로 두었다. 마찬가지로 wanna/gonna 도 그대로 두었다. 영어 단어별 빈도수 아래는 2020년도 Billboard 감정 분석 긍정/부정과 같은 감정 분석도 한번 해보고 싶은데, 글이 길어져서 별도의 글로 작성할 예정이다. 주제 분류 한국 가요(1964~2023)를 주제별로 모아보기 한국 노래 가사(1964~2023년) 데이터 분석해보기 배경 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노 blog.joonas.io 코드 GitHub - joonas-yoon/kpop-lyrics-analytics: 국내 가요 노랫말 분석 (1964~2023) 국내 가요 노랫말 분석 (1964~2023). Contribute to joonas-yoon/kpop-lyrics-analytics development by creating an account on GitHub. github.com 참고 From the dataisbeautiful community on Reddit: [OC] Word cloud made from the lyrics of every song that has hit the Billboard Hot Explore this post and more from the dataisbeautiful community www.reddit.com kiwipiepy API documentation (v0.16.2) Package kiwipiepy Kiwipiepy란? Kiwipiepy는 한국어 형태소 분석기인 Kiw 20 노래를 꽤 다양하게 듣는 편인데 최근 한국 노래들에 이지리스닝류가 많아지기도 했고, 한국어 가사의 비중이 점점 줄어들고 있는 등 한국 노래 가사의 트렌드가 궁금해져서 한번 데이터를 분석해보기로 했다. 데이터는 멜론 연대별 TOP 100 차트로부터 제목/가수/가사 정도만 수집했고, 기억이 맞다면 약 8시간정도 걸렸다. 통계 NLP 한국노래 자연어 데이터분석 tf-idf 워드클라우드 pandas 가사분석 2024.01.26 블로그 검색 더보기 namu.wiki 사랑하기 때문에(노래) - 나무위키 1985년 4월 10일 발매된 조용필의 음반 《조용필 7집》의 수록곡. 작사 / 작곡 / 편곡 유재하. 가수 조용필 발매일 1985년 4월 10일(대한민국) 재생시간 4분 15초 장르 발라드 작사 유재하 개요 상세 가사 여담 커버(정식 리메이크 포함) 2024.05.25 웹문서 검색 더보기 저스트 댄스 시리즈 - 나무위키 강남스타일/특징 - 나무위키 gall.dcinside.com mgallery nendoroid 간단나눔) 노래 한소절 추천 나눔내용 아주 간단함 자신이 좋아하는 한국노래 중에서 가장마음에 드는 가사 한두소절 적고 제목 그리고 링크 같이 댓글달면 끝 추첨이 아니고 내가 맘에들면 당첨임 중복일시엔 먼저 단사람 우선순위고 이상한... 2024.06.01 전체보기 사케에 노래중에 양민역사상 가장 긴 제목 그 노래 좃나 좋던디 제목은 당근 몰 겄다만 의식의 흐름에 따른 긴 글과 사진 극단적으로 긴 예로는 ‘바다’가 ‘바다’가 되기 위해서는 담수가 모여 큰 물을 이루고, 화산폭발과 빙하가 녹아 소금물을 만들고 생명이 깃드는 아주 오랜 과정과 기간이 걸립니다. 모든 성취에는 시간과 과정... fmkorea.com best "노래 언제끝나냐?" 러닝타임이 긴 노래들 - 포텐 터짐 최신순 - 에펨코리아 긴 노래들을 몇곡 소개해볼까 합니다. 러닝타임이 20분 언저리 이상 되는 곡들 중에서 개인적으로 인상깊게 들었던 곡들을 추려봤습니다. 말 그대로 개인적으로 인상깊게 들었던 곡들을 몇개만 추린거라 여러분들... 2024.05.17 전체보기 [Pitchfork 번역] 뱀파이어 위켄드: Only God Was Above Us - 힙합 - 에펨코리아 우리중 가장 잔인한 사람) 계급 상승에 대해 결정하는 사람들 (펜트하우스 열쇠를 가져가자마자 문을...무슨 일이 일어날지 (여전히 비어있고.)에 대해 노래한다. Only God Was Above Us에서 전례 없었던 유일한... 스압) M.C The Max의 히트곡과 숨겨진 명곡에 대해 알아보자 - 포텐 터짐 최신순 - 에펨코리아 항상 긴 텀을 주고 쉰다. 쉬는 이유는 멋있는 척을 하기 위함이라고 콘서트에서 밝혔다. 콘서트에서 해당 텀에는 관객들의 온갖 애드립이 난무한다. 시트콤 달려라 울엄마의 OST로 쓰였고, 제이윤이 특별 출연... v.daum.net 뉴스에이드 한국 노래 중 가장 긴 제목으로 컴백한 걸그룹 - 콘텐츠뷰 54자다. 현재까지 발표된 국내 가요 중 가장 긴 제목이라고. 섞이기 힘든 음이 만나 유니크하면서...한다. 참고로 '7도'여서인지 지난 7일에 노래가 나왔다. KBS 2TV: 더블V (송은이X김숙... 2020.07.10 멜론 파워DJ/ 뮤직에디터 손익분기점. 음악 분야 크리에이터 “목표를 향한 과정에서 느끼는 진정한 행복“ 전자음악 프로듀서 ‘UZA’ 8 비버의 노래는 마치 전설적인 배우가 연기를 하는 것 같다고 생각해요. Q : 음악을 제작하실 때 가장 우선시로 두는 음악적 가치는 어떻게 되시나요? A : 요즘...만든다고 생각해요. Q : 지금까지 음악 작업을 한 아티스트분들 중 가장 호흡이 좋았거나 즐거웠던 아티스트 한 분을 뽑는다면 누구인가요? A : 너무 당연... 음악 인터뷰 프로듀서 전자음악 뮤직 음악추천 아티스트 뮤지션 UZA 2024.05.01 통합웹 더보기